Применение временных рядов в задаче фоновой идентификации пользователей на основе анализа их работы с текстовыми данными

14 сентября 2018
168
Предметная область
Выходные данные
Ключевые слова
Вид публикации Статья
Контактные данные автора публикации В.Ю. Королёв, А.Ю. Корчагин, И.В. Машечкин, М.И. Петровский, Д.В. Царёв
Ссылка на публикацию в интернете www.ispras.ru/proceedings/docs/2015/27/1/isp_27_2015_1_151.pdf

Аннотация

В статье представлен подход идентификации пользователя на основе отклонений его тематической направленности при работе с текстовой информацией. Для решения указанной задачи был предложен подход, состоящий в тематическом анализе сложившихся в прошлом тенденций работы (поведения) пользователя с текстовым контентом различных (в том числе конфиденциальных) категорий и прогнозировании его дальнейшего поведения. Тематический анализ работы пользователя предполагает определение основных тематик его текстового контента и расчёт соответствующих им весов в заданные интервалы времени. На основе отклонений поведения в работе пользователя с контентом от прогноза осуществляется идентификация данного пользователя. В рамках данного подхода был предложен собственный оригинальный метод прогнозирования временных рядов, основанный на ортонормированной неотрицательной матричной факторизации (ОНМФ). Важно отметить, что ранее метод ОНМФ не использовался для решения задачи прогнозирования временных рядов. Проведённое экспериментальное исследование на примере реальной корпоративной переписки пользователей, сформированной из набора данных Enron, показало применимость предложенного подхода идентификации пользователя.
Подробнее
Для того чтобы оставить комментарий необходимо авторизоваться.