|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Методика извлечения пословных переводных соответствий из параллельных текстов с применением моделей дистрибутивной семантики
Ю. И. Морозова, Е. Б. Козеренко, М. М. Шарнин Институт проблем информатики Российской академии наук
Аннотация:
Данная работа посвящена актуальным проблемам исследования лингвистических единиц с использованием корпусных методов. В работе дается определение задачи извлечения переводных соответствий из параллельных текстов, рассматриваются существующие подходы к решению данной задачи и предлагается подход, основанный на применении моделей дистрибутивной семантики. Приводится описание разработанной авторами теоретической модели извлечения переводных соответствий, а также ее компьютерной реализации. Для целей исследования был создан тестовый параллельный корпус, содержащий тексты патентов на русском и французском языках. Приводятся результаты применения дистрибутивно-семантической методики, полученные в рамках эксперимента по извлечению переводных соответствий из тестового корпуса.
Ключевые слова:
выравнивание параллельных текстов; параллельный корпус; дистрибутивная семантика; модель векторных пространств.
Поступила в редакцию: 27.03.2014
Образец цитирования:
Ю. И. Морозова, Е. Б. Козеренко, М. М. Шарнин, “Методика извлечения пословных переводных соответствий из параллельных текстов с применением моделей дистрибутивной семантики”, Системы и средства информ., 24:2 (2014), 131–142
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ssi349 https://www.mathnet.ru/rus/ssi/v24/i2/p131
|
|