Искусственный интеллект и принятие решений
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Искусственный интеллект и принятие решений:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Искусственный интеллект и принятие решений, 2019, выпуск 3, страницы 52–59
DOI: https://doi.org/10.14357/20718594190306
(Mi iipr180)
 

Обработка естественного языка

Оценка информативности признаков на основе характеристики тематической значимости при классификации потока новостных сообщений

В. В. Жебельa, С-Н. А. Жариковаb, И. В. Соченковa

a Федеральный исследовательский центр «Информатика и управление» Российской академии наук, Москва, Россия
b Российский университет дружбы народов, Москва, Россия
Аннотация: Статья посвящена оценке качества нескольких методов тематической классификации новостных сообщений. Реализовано несколько известных алгоритмов тематической рубрикации с использованием в качестве признаков различных численных оценок информационной значимости. Рассмотрены классический и предложенный авторами метод определения весов признаков на примере набора данных “20 новостных групп”. Представлены полученные результаты экспериментальной апробации системы тематической классификации новостных сообщений, задача которой классифицировать данные на заданные тематические группы. Применение предложенного метода позволяет существенно повысить качество классификации даже с применением базовых методов (мультиномиального наивного байесовского классификатора) до уровня лучших методов в этой области (метод опорных векторов) на эталонном наборе данных.
Ключевые слова: тематический анализ текстов, машинное обучение, характеристика тематической значимости, “20 новостных групп”.
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 15-29-06082
18-29-16172
Исследование выполнено при финансовой поддержке РФФИ в рамках научных проектов № 15-29-06082 и № 18-29-16172.
Реферативные базы данных:
Тип публикации: Статья
Образец цитирования: В. В. Жебель, С-Н. А. Жарикова, И. В. Соченков, “Оценка информативности признаков на основе характеристики тематической значимости при классификации потока новостных сообщений”, Искусственный интеллект и принятие решений, 2019, № 3, 52–59
Цитирование в формате AMSBIB
\RBibitem{ZheZhaSoc19}
\by В.~В.~Жебель, С-Н.~А.~Жарикова, И.~В.~Соченков
\paper Оценка информативности признаков на основе характеристики тематической значимости при классификации потока новостных сообщений
\jour Искусственный интеллект и принятие решений
\yr 2019
\issue 3
\pages 52--59
\mathnet{http://mi.mathnet.ru/iipr180}
\crossref{https://doi.org/10.14357/20718594190306}
\elib{https://elibrary.ru/item.asp?id=41216283}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/iipr180
  • https://www.mathnet.ru/rus/iipr/y2019/i3/p52
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Искусственный интеллект и принятие решений
    Статистика просмотров:
    Страница аннотации:20
    PDF полного текста:13
    Список литературы:1
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024