Чебышевский сборник
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Чебышевский сб.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Чебышевский сборник, 2018, том 19, выпуск 1, страницы 187–199
DOI: https://doi.org/10.22405/2226-8383-2018-19-1-187-199
(Mi cheb631)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Классификация последовательностей на основе коротких мотивов

Е. П. Офицеров

Тульский государственный университет
Список литературы:
Аннотация: Задачи, связанные с классификацией последовательностей символов некоторого алфавита, часто возникают в таких областях, как биоинформатика и обработка естественного языка. Методы глубокого обучения, в особенности модели на основе рекуррентных нейронных сетей, в последние несколько лет зарекомендовали себя как наиболее эффективный способ решения подобных задач. Однако существующие подходы имеют серьезный недостаток — низкую интерпретируемость получаемых результатов. Крайне сложно установить какие именно свойства входной последовательности ответственны за её принадлежность к тому или иному классу. Упрощение же таких моделей с целью повышения их интерпретируемости, в свою очередь, приводит к снижению качества классификации. Такие недостатки ограничивают применение современных методов машинного обучения во многих предметных областях. В настоящей работе мы представляем принципиально новую, интерпретируемую архитектуру нейронных сетей, основанную на поиске набора коротких подпоследовательностей — мотивов, наличие которых влияет на принадлежность последовательности к определенному классу. Ключевой составляющей предлагаемого решения является разработанный нами алгоритм дифференцируемого выравнивания, являющийся дифференцируемым аналогом таких классических способов сравнения строк, как редакционное расстояние Левенштейна и алгоритм Смита–Ватермана. В отличие от предыдущих работ, посвященных классификации последовательностей на основе мотивов, новый метод позволяет не только выполнять поиск в произвольной части строки, но и учитывать возможные вставки.
Ключевые слова: классификация последовательностей, машинное обучение, нейронные сети, поиск мотивов.
Реферативные базы данных:
Тип публикации: Статья
УДК: 004.032.26, 004.424.62
Образец цитирования: Е. П. Офицеров, “Классификация последовательностей на основе коротких мотивов”, Чебышевский сб., 19:1 (2018), 187–199
Цитирование в формате AMSBIB
\RBibitem{Ofi18}
\by Е.~П.~Офицеров
\paper Классификация последовательностей на~основе коротких мотивов
\jour Чебышевский сб.
\yr 2018
\vol 19
\issue 1
\pages 187--199
\mathnet{http://mi.mathnet.ru/cheb631}
\crossref{https://doi.org/10.22405/2226-8383-2018-19-1-187-199}
\elib{https://elibrary.ru/item.asp?id=36312686}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/cheb631
  • https://www.mathnet.ru/rus/cheb/v19/i1/p187
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024