Программные системы: теория и приложения
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов
Загрузить рукопись

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Программные системы: теория и приложения:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Программные системы: теория и приложения, 2023, том 14, выпуск 1, страницы 95–123
DOI: https://doi.org/10.25209/2079-3316-2023-14-1-95-123
(Mi ps418)
 

Информационные системы в медицине

Система извлечения упоминаний симптомов из текстов на естественном языке с помощью нейронных сетей

Ю. П. Сердюк, Н. А. Власова, С. Р. Момот

Институт программных систем им. А. К. Айламазяна РАН, Веськово, Россия
Список литературы:
Аннотация: В статье представлена система для извлечения упоминаний симптомов из медицинских текстов на естественном (русском) языке. Система осуществляет нахождение симптомов в тексте, их нормализацию (приведение к стандартной форме) и отождествление — отнесение найденного симптома к группе однотипных симптомов. Каждый этап обработки реализуется с помощью отдельной нейронной сети. Состав извлекаемых симптомов ограничен тремя видами заболеваний — аллергические и пульмонологические заболевания, а также коронавирусная инфекция (COVID-19). Представлен и описан аннотированный корпус предложений, использованный для обучения нейросети нахождению упоминаний симптомов, относящихся к этим трем заболеваниям. При разметке корпуса был использован простой XML-подобный язык. Для представления предложений, непосредственно поступающих на вход нейросети, предложен расширенный BIO-формат разметки. Для каждого этапа приведены оценки точности (для первого этапа точность оценивалась при строгом и гибком тестировании). Описаны подходы и реализация приведения к стандартной форме и отождествления упоминаний симптомов. Даны сравнения с аналогичными работами по извлечению симптомов из медицинских текстов на разных языках, а также показано место данной системы в системах поддержки принятия клинических решений.
Ключевые слова и фразы: автоматическая обработка языка, нейронные сети, автоматическое извлечение информации, аннотированный корпус, упоминания симптомов, BERT-модели, Covid-19.
Поступила в редакцию: 26.12.2022
29.01.2023
Подписана в печать : 29.01.2023
Тип публикации: Статья
УДК: 81’322+61
MSC: Primary 68T07; Secondary 68T50
Образец цитирования: Ю. П. Сердюк, Н. А. Власова, С. Р. Момот, “Система извлечения упоминаний симптомов из текстов на естественном языке с помощью нейронных сетей”, Программные системы: теория и приложения, 14:1 (2023), 95–123
Цитирование в формате AMSBIB
\RBibitem{SerVlaMom23}
\by Ю.~П.~Сердюк, Н.~А.~Власова, С.~Р.~Момот
\paper Система извлечения упоминаний симптомов из текстов
на естественном языке с помощью нейронных сетей
\jour Программные системы: теория и приложения
\yr 2023
\vol 14
\issue 1
\pages 95--123
\mathnet{http://mi.mathnet.ru/ps418}
\crossref{https://doi.org/10.25209/2079-3316-2023-14-1-95-123}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/ps418
  • https://www.mathnet.ru/rus/ps/v14/i1/p95
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Программные системы: теория и приложения
    Статистика просмотров:
    Страница аннотации:45
    PDF полного текста:19
    Список литературы:17
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024