|
Эта публикация цитируется в 9 научных статьях (всего в 9 статьях)
Информационные технологии корпусных исследований: принципы построения кросслингвистических баз данных
Н. В. Бунтманa, Анна А. Зализнякbc, И. М. Зацманb, М. Г. Кружковb, Е. Ю. Лощиловаb, Д. В. Сичинаваd a Московский государственный университет им. М. В. Ломоносова, факультет иностранных языков и регионоведения
b Институт проблем информатики Российской академии наук
c Институт языкознания Российской академии наук
d Институт русского языка Российской академии наук
Аннотация:
Рассматривается информационная технология создания кросслингвистических баз данных текстов на русском языке и их переводов на французский язык, называемых параллельными текстами. Разработанные принципы построения этой базы данных обеспечивают реализацию уникального сочетания трех видов двуязычного поиска: лексического, грамматического и лексико-грамматического. Отличительной чертой рассматриваемой технологии является одновременное формирование русско-французского параллельного подкорпуса Национального корпуса русского языка (НКРЯ) и кросслингвистической базы данных глагольных лексико-грамматических форм русского языка и их функциональных эквивалентов во французских переводах. Подкорпус и база данных обладают разной глубиной выравнивания: в первом случае оно выполняется на уровне предложений, а во втором — на уровне конструкций. Теоретическое значение создания этой базы данных заключается в обеспечении исследований как в области двуязычной контрастивной грамматики, так и в направлении создания грамматики русского языка, опирающейся на современную эмпирическую базу и информационные технологии корпусной лингвистики. Ее основное прикладное назначение заключается в повышении качества машинного перевода.
Ключевые слова:
параллельный корпус; информационная технология; кросслингвистические базы данных; двуязычный лексико-грамматический поиск; корпусная лингвистика; контрастивная грамматика.
Поступила в редакцию: 29.03.2014
Образец цитирования:
Н. В. Бунтман, Анна А. Зализняк, И. М. Зацман, М. Г. Кружков, Е. Ю. Лощилова, Д. В. Сичинава, “Информационные технологии корпусных исследований: принципы построения кросслингвистических баз данных”, Информ. и её примен., 8:2 (2014), 98–110
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ia315 https://www.mathnet.ru/rus/ia/v8/i2/p98
|
|