Труды института системного программирования РАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Труды ИСП РАН:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды института системного программирования РАН, 2017, том 29, выпуск 4, страницы 325–336
DOI: https://doi.org/10.15514/ISPRAS-2017-29(4)-23
(Mi tisp254)
 

Narrabat — a prototype service for stylish news retelling
[Narrabat — прототип сервиса для пересказа новостей в формате стихотворений]

I. I. Dolgaleva, I. A. Gorshkov, R. E. Yavorskiy

Faculty of Computer Science, Higher School of Economics
Список литературы:
Аннотация: В интернете все большую популярность приобретают СМИ, отказывающиеся от общепринятого формального способа изложения новостей и делающие акцент на креативности предоставляемого контента. Яркими примерами могут послужить паблик "Лентач" из социальной сети "ВКонтакте", сопровождающий каждую новость мемами, и ресурс "КАКТАМ?", оборачивающий заголовки в намеренно сверхэмоциональную форму. Мы решили реализовать инструмент Narrabat, пересказывающий новости в еще одном необычном стиле. Его задача — преобразовывать новостные ленты, взятые из сторонних источников, в небольшие стихотворения, отражающие ключевые события новостных сюжетов. В качестве основы для генерации стихов используется большая коллекция русской классики (состоящая из, к примеру, произведений Блока и Некрасова). Одним из главных достоинств выбранной нами формы пересказа и созданного инструмента в частности является то, что, при всей оригинальности вывода, процесс его генерации полностью автоматизирован, в отличие от сервисов, описанных выше. Инструмент работает в несколько этапов: сначала происходит выделение фактов из заголовков выгруженных новостей при помощи Tomita Parser, после чего факты передаются в модуль, отвечающий за генерацию стихотворения. По ходу работы мы использовали несколько подходов для генерации стихотворений, такие, как алгоритмы, построенные на правилах, и машинное обучение, включая нейронные сети. На данном этапе наилучший результат дал первый метод, однако работа по обучению нейронной сети ведется до сих пор. В данной статье мы опишем текущие результаты работы, приведем примеры сгенерированных стихотворений, а также перечислим направления для дальнейшего улучшения инструмента.
Ключевые слова: обработка естественного языка, извлечение информации, генерация текста, томита парсер, нейронные сети.
Реферативные базы данных:
Тип публикации: Статья
Язык публикации: английский
Образец цитирования: I. I. Dolgaleva, I. A. Gorshkov, R. E. Yavorskiy, “Narrabat — a prototype service for stylish news retelling”, Труды ИСП РАН, 29:4 (2017), 325–336
Цитирование в формате AMSBIB
\RBibitem{DolGorYav17}
\by I.~I.~Dolgaleva, I.~A.~Gorshkov, R.~E.~Yavorskiy
\paper Narrabat — a prototype service for stylish news retelling
\jour Труды ИСП РАН
\yr 2017
\vol 29
\issue 4
\pages 325--336
\mathnet{http://mi.mathnet.ru/tisp254}
\crossref{https://doi.org/10.15514/ISPRAS-2017-29(4)-23}
\elib{https://elibrary.ru/item.asp?id=29968663}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/tisp254
  • https://www.mathnet.ru/rus/tisp/v29/i4/p325
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Труды института системного программирования РАН
    Статистика просмотров:
    Страница аннотации:121
    PDF полного текста:176
    Список литературы:24
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024