Аннотация:
На примере корпуса отзывов о банковских продуктах и услугах проводится анализ и составление моделей классификации текстов. В работе исследуются разные подходы к обработке неструктурированной текстовой информации. На основе выбранных подходов анализируется корпус отзывов о банковских продуктах и услугах, полученных в период пандемии COVID-19. Разработан автоматический парсер интернет-ресурсов для получения требуемой обучающей выборки. Разработано программное обеспечение, реализующее основные методы для построения моделей классификации. Данная модель может быть использована для создания систем мониторинга отношения населения к процессам в банковской сфере.
Ключевые слова:классификация, анализ данных, контекст документа,
важность слов, лингвистика, машинное обучение.
Исследование выполнено при финансовой поддержке РФФИ и CNPq (Бразилия), Фонда содействия инновациям (Россия), DBT, DST (Индия), MOST, NSFC (Китай), SAMRC (ЮАР) в рамках научного проекта № 20-51-80002.
Тип публикации:
Препринт
Образец цитирования:
Н. Д. Баданина, В. А. Судаков, “Модели машинного обучения для классификации отзывов о банках”, Препринты ИПМ им. М. В. Келдыша, 2021, 050, 14 с.
\RBibitem{BadSud21}
\by Н.~Д.~Баданина, В.~А.~Судаков
\paper Модели машинного обучения для классификации отзывов о банках
\jour Препринты ИПМ им.~М.~В.~Келдыша
\yr 2021
\papernumber 050
\totalpages 14
\mathnet{http://mi.mathnet.ru/ipmp2967}
\crossref{https://doi.org/10.20948/prepr-2021-50}
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ipmp2967
https://www.mathnet.ru/rus/ipmp/y2021/p50
Эта публикация цитируется в следующих 3 статьяx:
И. А. Белозеров, В. А. Судаков, “Исследование моделей машинного обучения для сегментации медицинских изображений”, Препринты ИПМ им. М. В. Келдыша, 2022, 037, 15 с.
Н. Д. Баданина, А. А. Зинченко, В. А. Судаков, “Ранжирование объектов на основе нечеткой кластеризации”, Препринты ИПМ им. М. В. Келдыша, 2022, 068, 12 с.
Э. С. Клышинский, В. А. Бунтякова, О. В. Карпик, “Исследование грамматической неоднозначности наиболее частотных слов русского языка”, Препринты ИПМ им. М. В. Келдыша, 2021, 58–22 [E. S. Klyshinsky, V. A. Buntyakova, O. V. Karpik, “Investigation of grammatical ambiguity of most frequent words of the Russian language”, Keldysh Institute preprints, 2021, 58–22]