Семинары
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Календарь
Поиск
Регистрация семинара

RSS
Ближайшие семинары




Общемосковский постоянный научный семинар «Теория автоматического управления и оптимизации»
12 марта 2019 г. 11:30–13:00, г. Москва, ИПУ РАН, комн. 433.
 


Статистические свойства текстов на европейских языках и анализ Манускрипта Войнича

Ю. Н. Орлов

Институт прикладной математики им. М.В. Келдыша Российской академии наук, г. Москва

Количество просмотров:
Эта страница:167

Аннотация: В докладе будут представлены результаты исследования инвариантных свойств европейских языков методом анализа близости распределений буквосочетаний в литературных текстах. Для нахождения языковых инвариантов используются следующие статистики: расстояние между распределениями упорядоченных эмпирических частот буквосочетаний; уровень детерминации специальной аппроксимации однобуквенных распределений для текстов без огласовки; показатель Херста для ряда из количества букв, заключенных между двумя наиболее часто встречающимися одинаковыми буквами; спектральный портрет матрицы двухбуквенных сочетаний. Перечисленные индикаторы позволили провести формальную кластеризацию языков индоевропейской семьи по языковым группам, большей частью совпавшим с группами, которые были сформированы на основе историко-лингвистических исследований. Также в работе анализируется возможный язык рукописи Войнича – некоего зашифрованного документа XVI века. Определено, что это, скорее всего, осмысленный двуязычный текст без огласовки.
 
  Обратная связь:
 Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024