|
Записки научных семинаров ПОМИ, 2024, том 540, страницы 214–232
(Mi znsl7552)
|
|
|
|
MMA: a fight for multilingual models acceleration
[MMA: борьба за ускорение многоязыковых моделей]
N. Sukhanovskii, M. Ryndin Ivannikov Institute for System Programming of the Russian Academy of Sciences, Moscow, Russia
Аннотация:
В работе мы рассматриваем стандартный способ проектирования моделей для обработки естественного языка: дообучение многоязыковой языковой модели, в котором данные для целевой задачи на одном языке используются для последующего решения этой задачи на другом целевом языке. Цель работы – определить, как популярные методы ускорения моделей машинного обучения влияют на многоязыковые возможности моделей на основе трансформеров, а также исследуем использование этих методов в различных комбинациях. В результате мы получаем модель NERC, которая может эффективно работать на CPU и сохраняет многоязыковые свойства для нескольких тестовых языков после настройки и ускорения только с использованием данных на английском языке. Библ. – 24 назв.
Ключевые слова:
BERT, обрезание моделей, квантизация, NERC.
Поступило: 15.11.2024
Образец цитирования:
N. Sukhanovskii, M. Ryndin, “MMA: a fight for multilingual models acceleration”, Исследования по прикладной математике и информатике. IV, Зап. научн. сем. ПОМИ, 540, ПОМИ, СПб., 2024, 214–232
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/znsl7552 https://www.mathnet.ru/rus/znsl/v540/p214
|
Статистика просмотров: |
Страница аннотации: | 24 | PDF полного текста: | 5 | Список литературы: | 9 |
|