Искусственный интеллект и принятие решений
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Искусственный интеллект и принятие решений:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Искусственный интеллект и принятие решений, 2018, выпуск 3, страницы 69–77
DOI: https://doi.org/10.14357/20718594180317
(Mi iipr217)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Обработка естественного языка

Классификация текстовых документов с использованием вероятностной тематической модели

С. Н. Карповичa, А. В. Смирновb, Н. Н. Тесляb

a АО "Олимп", г. Москва, Россия
b Санкт-Петербургский институт информатики и автоматизации РАН, Санкт-Петербург, Россия
Аннотация: Предложен подход к классификации текстовых документов с использованием вероятностной тематической модели, отличающейся тем, что обучающее множество документов представлено экземплярами одного класса. Этот подход позволяет отбирать положительные экземпляры, похожие на заданный класс, из коллекций и потоков текстовых документов. Рассмотрены модели, обучаемые на экземплярах одного класса, решающие задачи классификации в применении к текстовым документам, обозначены их ключевые особенности. Представлена модель классификации Positive Example Based Learning-TM и разработан программный прототип, реализующий классификацию текстовых документов на ее основе. Не имея представления об отрицательных экземплярах документов, она демонстрирует высокую точность классификации, превышающую альтернативные подходы. Экспериментально доказано превосходство Positive Example Based Learning-TM по критерию точности классификации при малом объеме обучающей выборки.
Ключевые слова: классификация, бинарная классификация, тематическое моделирование, обработка текста на естественном языке.
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 17-07-00327
17-07-00328
Работа выполнена при частичной финансовой поддержке РФФИ гранты № 17-07-00327, 17-07-00328.
Англоязычная версия:
Scientific and Technical Information Processing, 2019, Volume 46, Issue 5, Pages 314–320
DOI: https://doi.org/10.3103/S0147688219050034
Реферативные базы данных:
Тип публикации: Статья
Образец цитирования: С. Н. Карпович, А. В. Смирнов, Н. Н. Тесля, “Классификация текстовых документов с использованием вероятностной тематической модели”, Искусственный интеллект и принятие решений, 2018, № 3, 69–77; Scientific and Technical Information Processing, 46:5 (2019), 314–320
Цитирование в формате AMSBIB
\RBibitem{KarSmiTes18}
\by С.~Н.~Карпович, А.~В.~Смирнов, Н.~Н.~Тесля
\paper Классификация текстовых документов с использованием вероятностной тематической модели
\jour Искусственный интеллект и принятие решений
\yr 2018
\issue 3
\pages 69--77
\mathnet{http://mi.mathnet.ru/iipr217}
\crossref{https://doi.org/10.14357/20718594180317}
\elib{https://elibrary.ru/item.asp?id=36263257}
\transl
\jour Scientific and Technical Information Processing
\yr 2019
\vol 46
\issue 5
\pages 314--320
\crossref{https://doi.org/10.3103/S0147688219050034}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/iipr217
  • https://www.mathnet.ru/rus/iipr/y2018/i3/p69
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Искусственный интеллект и принятие решений
    Статистика просмотров:
    Страница аннотации:42
    PDF полного текста:13
    Список литературы:1
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024