Доклады Российской академии наук. Математика, информатика, процессы управления
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Докл. РАН. Матем., информ., проц. упр.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Доклады Российской академии наук. Математика, информатика, процессы управления, 2023, том 514, номер 2, страницы 395–416
DOI: https://doi.org/10.31857/S2686954323601859
(Mi danma483)
 

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

Не бывает двух одинаковых пользователей: нейросетевая кластеризация на основе последовательностей событий для генерации аудиторий

В. Жужельa, В. Грабарьa, Н. Каплоухаяa, Р. Ривера-Кастроbca, Л. Мироноваa, А. Зайцевa, Е. Бурнаевa

a Сколковский институт науки и технологий, 121205 Москва, Россия
b Центр цифровых технологий и управления, 80333 Мюнхен, Arcisstr. 21, Германия
c Choco Communications, 10967 Берлин, Hasenheide 54, Германия
Список литературы:
Аннотация: Определение нужного пользователя для таргетинга является общей задачей для различных интернет-платформ. Хотя многие системы решают ее, они в значительной степени адаптированы к конкретным особенностям. Из-за этого на практике становится непросто применить данные задачи. Причина в том, что большинство систем предназначены для работы с миллионами активных пользователей и с личной информацией, как в случае с социальными сетями или другими сервисами с высокой виральностью. В литературе мало представлены решения, которые предназначены для обработки данных среднего размера, где единственными доступными данными являются последовательности событий пользователя. Это мотивирует нас представить Look-A-Liker (LAL) как систему глубокой кластеризации. Он использует временные точечные процессы для идентификации похожих пользователей для решения задач таргетинга. Для экспериментов мы используем данные ведущего интернет-маркетплейса гастрономического сектора. LAL обобщает не только закрытые данные. Используя последовательности событий пользователей, можно получить результаты мирового уровня, сравнимые с результатами, получаемыми с использованием новых методов, таких как трансформеры и мультимодальное обучение. Наш подход позволяет повысить оценку по метрике ROC AUC до 20% на реальных наборах данных с 0.803 до 0.959. Хотя LAL фокусируется на сотнях тысяч последовательностей, мы показываем, что его можно применить и в задачах с миллионами пользовательских последовательностей. Мы предоставляем полностью воспроизводимую реализацию с кодом и наборами данных в https://github.com/adasegroup/sequence-clusterers.
Ключевые слова: приложения, кластеризация, неконтролируемое обучение, временные точечные процессы.
Финансовая поддержка Номер гранта
Сколковский институт науки и технологий 70-2021-00145
Работа Всеволода Грабаря, Алексея Зайцева, и Евгения Бурнаева была поддержана Аналитическим центром Сколтеха (соглашение о субсидировании 000000D730321P5Q0002, грант № 70-2021-00145 от 02.11.2021).
Статья представлена к публикации: А. И. Аветисян
Поступило: 01.09.2023
После доработки: 15.09.2023
Принято к публикации: 18.10.2023
Англоязычная версия:
Doklady Mathematics, 2023, Volume 108, Issue suppl. 2, Pages S511–S528
DOI: https://doi.org/10.1134/S1064562423701661
Реферативные базы данных:
Тип публикации: Статья
Образец цитирования: В. Жужель, В. Грабарь, Н. Каплоухая, Р. Ривера-Кастро, Л. Миронова, А. Зайцев, Е. Бурнаев, “Не бывает двух одинаковых пользователей: нейросетевая кластеризация на основе последовательностей событий для генерации аудиторий”, Докл. РАН. Матем., информ., проц. упр., 514:2 (2023), 395–416; Dokl. Math., 108:suppl. 2 (2023), S511–S528
Цитирование в формате AMSBIB
\RBibitem{ZhuGraKap23}
\by В.~Жужель, В.~Грабарь, Н.~Каплоухая, Р.~Ривера-Кастро, Л.~Миронова, А.~Зайцев, Е.~Бурнаев
\paper Не бывает двух одинаковых пользователей: нейросетевая кластеризация на основе последовательностей событий для генерации аудиторий
\jour Докл. РАН. Матем., информ., проц. упр.
\yr 2023
\vol 514
\issue 2
\pages 395--416
\mathnet{http://mi.mathnet.ru/danma483}
\crossref{https://doi.org/10.31857/S2686954323601859}
\elib{https://elibrary.ru/item.asp?id=56717870}
\transl
\jour Dokl. Math.
\yr 2023
\vol 108
\issue suppl. 2
\pages S511--S528
\crossref{https://doi.org/10.1134/S1064562423701661}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/danma483
  • https://www.mathnet.ru/rus/danma/v514/i2/p395
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Доклады Российской академии наук. Математика, информатика, процессы управления Доклады Российской академии наук. Математика, информатика, процессы управления
    Статистика просмотров:
    Страница аннотации:65
    Список литературы:14
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024