|
Ученые записки Казанского государственного университета. Серия Физико-математические науки, 2009, том 151, книга 3, страницы 229–239
(Mi uzku801)
|
|
|
|
Преобразование метрик, используемых в методах кластеризации для построения филогенетических деревьев языков
В. Д. Соловьевa, Р. Ф. Фасхутдиновb a Кафедра теоретической кибернетики Казанского государственного университета
b Институт проблем информатики АН Республики Татарстан, г. Казань
Аннотация:
С появлением несколько лет назад больших типологических баз данных возникла проблема выбора математических средств извлечения из них знаний (в форме кластеризации языков). Обычно для этих целей используются филогенетические алгоритмы, основанные на метрике Хемминга. Однако в кластерном анализе было показано, что некоторые другие метрики дают лучшие результаты. В статье введены две новые метрики и на большом числе реальных лингвистических примерах продемонстрировано, что филогенетические алгоритмы, основанные на этих метриках, дают лучшие результаты.
Ключевые слова:
лингвистические базы данных, метрики, филогенетические алгоритмы.
Поступила в редакцию: 12.05.2009
Образец цитирования:
В. Д. Соловьев, Р. Ф. Фасхутдинов, “Преобразование метрик, используемых в методах кластеризации для построения филогенетических деревьев языков”, Учён. зап. Казан. гос. ун-та. Сер. Физ.-матем. науки, 151, № 3, Изд-во Казанского ун-та, Казань, 2009, 229–239
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/uzku801 https://www.mathnet.ru/rus/uzku/v151/i3/p229
|
|