Р. В. Кузнецова, О. Ю. Бахтеев, Ю. В. Чехович, “Методы обнаружения переводных заимствований в больших текстовых коллекциях”, Информ. и её примен., 15:1 (2021), 30

Информатика и её применения

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив
	Импакт-фактор

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Информ. и её примен.:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Информатика и её применения, 2021, том 15, выпуск 1, страницы 30–41
DOI: https://doi.org/10.14357/19922264210105 (Mi ia709)

Эта публикация цитируется в 3 научных статьях (всего в 3 статьях)

Методы обнаружения переводных заимствований в больших текстовых коллекциях

Р. В. Кузнецова^a, О. Ю. Бахтеев^ba, Ю. В. Чехович^c

^a Московский физико-технический институт
^b Компания Антиплагиат
^c Вычислительный центр им. А. А. Дородницына Федерального исследовательского центра «Информатика и управление» Российской академии наук

PDF полного текста (411 kB) Список цитирования (3)

Список литературы:

PDF

HTML

DOI: https://doi.org/10.14357/19922264210105

Аннотация: Рассматривается задача обнаружения переводных заимствований. Для решения предлагается использовать моноязыковой подход — свести задачу обнаружения заимствований к одному языку, используя машинный перевод. В связи со спецификой рассматриваемой задачи предлагаемый алгоритм обнаружения должен быть устойчив к неоднозначностям перевода. Предлагается декомпозировать задачу на несколько этапов. Сначала отбираются документы-кандидаты, устойчивость к неоднозначности перевода достигается за счет замены слов на метки кластеров, полученных с помощью дистрибутивной модели. Затем происходит сравнение найденных кандидатов и рассматриваемого документа, для этого используется отображение текстовых фрагментов документов в векторное пространство высокой размерности. Вычислительный эксперимент проводится для языковой пары «русский–английский» на двух выборках — синтетическом корпусе и на статьях из журналов, входящих в Российский индекс научного цитирования (РИНЦ).

Ключевые слова: автоматическая обработка текстов, машинный перевод, глубокое обучение, переводные заимствования, обнаружение переводных заимствований, дистрибутивная семантика.

Финансовая поддержка	Номер гранта
Российский фонд фундаментальных исследований	18-07-01441_а
Фонд содействия развитию малых форм предприятий в научно-технической сфере	44116
Работа выполнена при поддержке РФФИ (проект 18-07-01441) и Фонда содействия развитию малых форм предприятий в научно-технической сфере (проект 44116).

Поступила в редакцию: 19.03.2020

Тип публикации: Статья

Образец цитирования: Р. В. Кузнецова, О. Ю. Бахтеев, Ю. В. Чехович, “Методы обнаружения переводных заимствований в больших текстовых коллекциях”, Информ. и её примен., 15:1 (2021), 30–41

Цитирование в формате AMSBIB

\RBibitem{KuzBakChe21}

\by Р.~В.~Кузнецова, О.~Ю.~Бахтеев, Ю.~В.~Чехович

\paper Методы обнаружения переводных заимствований в~больших текстовых коллекциях

\jour Информ. и её примен.

\yr 2021

\vol 15

\issue 1

\pages 30--41

\mathnet{http://mi.mathnet.ru/ia709}

\crossref{https://doi.org/10.14357/19922264210105}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/ia709

https://www.mathnet.ru/rus/ia/v15/i1/p30

Эта публикация цитируется в следующих 3 статьяx:

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Статистика просмотров:
Страница аннотации:	218
PDF полного текста:	118
Список литературы:	35

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы