Компьютерная оптика
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Компьютерная оптика:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Компьютерная оптика, 2020, том 44, выпуск 4, страницы 618–626
DOI: https://doi.org/10.18287/2412-6179-CO-678
(Mi co828)
 

Эта публикация цитируется в 3 научных статьях (всего в 3 статьях)

ОБРАБОТКА ИЗОБРАЖЕНИЙ, РАСПОЗНАВАНИЕ ОБРАЗОВ

Извлечение предпочтений пользователя на основе методов автоматического порождения текстовых описаний изображений фотоальбома

А. С. Харчевникова, А. В. Савченко

Национальный исследовательский университет «Высшая школа экономики», 603155, Россия, г. Нижний Новгород, ул. Большая Печерская, д.25/12
Список литературы:
Аннотация: В работе рассматривается задача извлечения предпочтений пользователя по его фотоальбому. Предложен новый подход на основе автоматического порождения текстовых описаний фотографий и последующей классификации таких описаний. Проведен анализ известных методов создания аннотаций по изображению на основе свёрточных и рекуррентных (Long short-term memory) нейронных сетей. С использованием набора данных Google's Conceptual Captions обучены новые модели, в которых объединяются характерные признаки фотографии и выходы блока рекуррентной нейронной сети. Исследовано применение алгоритмов обработки текстов для преобразования полученных аннотаций в пользовательские предпочтения. Проведены экспериментальные исследования с помощью наборов данных Microsoft COCO Captions, Flickr8k и специально собранного набора данных, отражающего интересы пользователя. Показано, что наилучшее качество определения предпочтений достигается с помощью методов поиска ключевых слов и суммаризации текстов из Watson API, которые оказываются на 8% точнее по сравнению с традиционным латентным размещением Дирихле. При этом описания, порожденные с помощью обученных моделей, классифицируются на 1–7% точнее известных аналогов.
Ключевые слова: анализ предпочтений пользователя, обработка изображений, текстовое описание изображений, сверточные нейронные сети.
Финансовая поддержка Номер гранта
Национальный исследовательский университет "Высшая школа экономики" 19-04-004
Статья подготовлена в результате проведения исследования (№ 19-04-004) в рамках Программы «Научный фонд Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ)» в 2019 г. и в рамках государственной поддержки ведущих университетов Российской Федерации "5-100".
Поступила в редакцию: 13.12.2019
Принята в печать: 06.03.2020
Тип публикации: Статья
Образец цитирования: А. С. Харчевникова, А. В. Савченко, “Извлечение предпочтений пользователя на основе методов автоматического порождения текстовых описаний изображений фотоальбома”, Компьютерная оптика, 44:4 (2020), 618–626
Цитирование в формате AMSBIB
\RBibitem{KhaSav20}
\by А.~С.~Харчевникова, А.~В.~Савченко
\paper Извлечение предпочтений пользователя на основе методов автоматического порождения текстовых описаний изображений фотоальбома
\jour Компьютерная оптика
\yr 2020
\vol 44
\issue 4
\pages 618--626
\mathnet{http://mi.mathnet.ru/co828}
\crossref{https://doi.org/10.18287/2412-6179-CO-678}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/co828
  • https://www.mathnet.ru/rus/co/v44/i4/p618
  • Эта публикация цитируется в следующих 3 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Компьютерная оптика
    Статистика просмотров:
    Страница аннотации:129
    PDF полного текста:79
    Список литературы:11
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024