|
СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ
Получаем ли мы пользу от категоризации потока новостей в задаче прогнозирования цен акций?
Т. Д. Куликоваa, Е. Ю. Ковтунb, С. А. Буденныйc a Национальный исследовательский университет "Высшая школа экономики", факультет компьютерных наук, Москва, Россия
b Лаборатория искусственного интеллекта Sber AI Lab, Москва, Россия
c Институт искусственного интеллекта AIRI, Москва, Россия
Аннотация:
Машинное обучение широко применяется в задаче прогнозирования цен на акции публичных компаний. Для построения более точной прогностической модели необходимо учитывать не только исторические данные о ценах на акции, но и относящиеся к ним знания из внешнего мира. Такую ценную информацию может дать эмоциональная окраска финансовых новостей, связанных с компанией. Однако финансовые новости могут быть разделены на различные тематические группы, например, Macro (новости, относящиеся к теме “макроэкономика”), Market (новости о ситуации на различных рынках) или Product news (новости о продукте, который производит та или иная компания). В задачах исследования рынка обычно не принимается во внимание такая категоризация. В данной работе мы стремимся восполнить этот пробел и изучить эффект от учета разделения новостей на группы по тематическому признаку в задаче прогнозирования цен на акции публичных компаний. Сначала мы получаем индикаторы настроения финансовых новостей, затем классифицируем их поток на 20 заранее определенных тем с помощью предварительно обученной модели. Кроме того, мы проводим эксперименты с несколькими хорошо зарекомендовавшими себя моделями для прогнозирования временных рядов, включая темпоральную конволюционную сеть (Temporal Convolutional Network), D-линейную модель (D-Linear), трансформатор (Transformer) и темпоральный синтезирующий трансформатор (Temporal Fusion Transformer). Результаты нашего исследования показывают, что использование информации об эмоциональной окраске новостей из отдельных тематических групп способствует улучшению метрик работы моделей глубокого обучения по сравнению с подходом, когда рассматриваются все новости без какого-либо разделения.
Ключевые слова:
финансовые новости, фондовый рынок, BERT, тематическая классификация, анализ эмоциональной окрашенности текста, прогнозирование временных рядов, глубокое обучение, внешние данные.
Образец цитирования:
Т. Д. Куликова, Е. Ю. Ковтун, С. А. Буденный, “Получаем ли мы пользу от категоризации потока новостей в задаче прогнозирования цен акций?”, Докл. РАН. Матем., информ., проц. упр., 514:2 (2023), 385–394; Dokl. Math., 108:suppl. 2 (2023), S503–S510
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/danma482 https://www.mathnet.ru/rus/danma/v514/i2/p385
|
Статистика просмотров: |
Страница аннотации: | 77 | Список литературы: | 13 |
|