|
Экспертная оценка машинного перевода: классификация ошибок
А. Ю. Егорова, И. М. Зацман, В. А. Нуриев Федеральный исследовательский центр «Информатика и управление» Российской академии наук
Аннотация:
Рассматривается оценка качества машинного перевода (МП) с применением классификации его ошибок. Классификация включает рубрики общеязыковых ошибок на уровне грамматики, лексики, пунктуации и др., а также категорийно обусловленных ошибок, которые связаны с конкретным типом языковых единиц, выбранным для оценки качества перевода в исследуемой системе МП. Оценка качества выполняется в процессе лингвистического аннотирования МП. Если при аннотировании эксперт обнаруживает ошибки в переводе, то в аннотацию включаются рубрики для типологизации обнаруженных ошибок. Простановка рубрик дает возможность вычислить относительные частотности ошибок МП в рамках всего массива тестовых предложений, отобранных для перевода и оценки его качества. Основная цель статьи состоит в описании предлагаемой классификации общеязыковых и категорийно обусловленных ошибок. Ее главное отличие от существующих классификаций (типологий) ошибок заключается в том, что она нацелена на обеспечение интервальной оценки для систем МП, качество работы которых изменяется во времени. Рубрики предлагаемой классификации дают возможность экспертам фиксировать в МП как улучшение, так и снижение качества на заданном интервале времени.
Ключевые слова:
машинный перевод, оценка качества, классификация ошибок, общеязыковые ошибки, категорийно обусловленные ошибки, лингвистическое аннотирование, интервальная оценка.
Поступила в редакцию: 12.08.2021
Образец цитирования:
А. Ю. Егорова, И. М. Зацман, В. А. Нуриев, “Экспертная оценка машинного перевода: классификация ошибок”, Системы и средства информ., 31:3 (2021), 144–157
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ssi789 https://www.mathnet.ru/rus/ssi/v31/i3/p144
|
Статистика просмотров: |
Страница аннотации: | 137 | PDF полного текста: | 92 | Список литературы: | 17 |
|