С. В. Моржов, “Современные методы детектирования и классификации токсичных комментариев с использованием нейронных сетей”, Модел. и анализ информ. систем, 27:1 (2020), 48

Моделирование и анализ информационных систем

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив
	Импакт-фактор

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Модел. и анализ информ. систем:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Моделирование и анализ информационных систем, 2020, том 27, номер 1, страницы 48–61
DOI: https://doi.org/10.18255/1818-1015-2020-1-48-61 (Mi mais702)

Эта публикация цитируется в 4 научных статьях (всего в 4 статьях)

Computing methodologies and applications

Современные методы детектирования и классификации токсичных комментариев с использованием нейронных сетей

С. В. Моржов

Ярославский государственный университет им. П. Г. Демидова, ул. Советская, 14, г. Ярославль, 150003 Россия

PDF полного текста (1011 kB) Список цитирования (4)

Список литературы:

PDF

HTML

DOI: https://doi.org/10.18255/1818-1015-2020-1-48-61

Аннотация: Рост популярности онлайн-платформ, позволяющих пользователям общаться друг с другом, делиться мнениями о различных событиях, оставлять комментарии, подтолкнул к развитию алгоритмов обработки естественного языка. Десятки миллионов сообщений в день, которые публикуют пользователи отдельно взятой социальной сети, необходимо анализировать в режиме реального времени или близко к тому с целью модерации, чтобы не допустить распространение различной противозаконной или оскорбительной информации, угроз и других видов токсичных комментариев. Разумеется такой большой объем информации может быть обработан достаточно быстро только автоматически. Возникает необходимость научить компьютер «понимать» текст, написанный человеком, что является нетривиальной задачей, пусть даже под «пониманием» текста подразумевается лишь его классификация. Бурное развитие технологий машинного обучения обусловило повсеместное внедрение новых алгоритмов. Многие задачи, в том числе и задачи обработки естественного языка, которые долгие годы считалось практически невозможно решить, сейчас вполне успешно решаются с использованием технологий глубокого обучения. В данной статье будут рассмотрены алгоритмы, построенные с использованием технологий глубокого обучения и нейронных сетей, позволяющие успешно решать задачу распознавания и классификации токсичных комментариев. Помимо этого, в статье будут приведены результаты тестирования как разработанных алгоритмов, так и ансамбля данных алгоритмов на большой обучающей выборке, собранной и размеченной специалистами компаний Google и Jigsaw.

Ключевые слова: токчисность, обработка естественного языка, NLP, глубокое обучение, векторное представление слов, GloVe, FastText, реккурентные нейронные сети, сверточные нейронные сети, CNN, LSTM, GRU.

Поступила в редакцию: 17.01.2020
Исправленный вариант: 25.02.2020
Принята в печать: 28.02.2020

Тип публикации: Статья

УДК: 004.8

MSC: 68T50

Образец цитирования: С. В. Моржов, “Современные методы детектирования и классификации токсичных комментариев с использованием нейронных сетей”, Модел. и анализ информ. систем, 27:1 (2020), 48–61

Цитирование в формате AMSBIB

\RBibitem{Mor20}

\by С.~В.~Моржов

\paper Современные методы детектирования и классификации токсичных комментариев с использованием нейронных сетей

\jour Модел. и анализ информ. систем

\yr 2020

\vol 27

\issue 1

\pages 48--61

\mathnet{http://mi.mathnet.ru/mais702}

\crossref{https://doi.org/10.18255/1818-1015-2020-1-48-61}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/mais702

https://www.mathnet.ru/rus/mais/v27/i1/p48

Эта публикация цитируется в следующих 4 статьяx:

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Моделирование и анализ информационных систем

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы