Вестник Удмуртского университета. Математика. Механика. Компьютерные науки
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Вестник Удмуртского университета. Математика. Механика. Компьютерные науки, 2019, том 29, выпуск 1, страницы 117–132
DOI: https://doi.org/10.20537/vm190111
(Mi vuu671)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

КОМПЬЮТЕРНЫЕ НАУКИ

Эффективный алгоритм для создания полнотекстовых индексов с трехкомпонентными ключами

А. Б. Веретенников

Уральский федеральный университет, 620083, Россия, г. Екатеринбург, пр. Ленина, 51
Список литературы:
Аннотация: Рассматривается задача полнотекстового поиска с учетом близости в больших текстовых массивах. Пользователь вводит несколько слов в качестве поискового запроса. В результате поиска формируется список документов, содержащих заданные слова. В современных поисковых системах, документы, в которых слова поискового запроса встречаются вблизи, считаются более релевантными. Рассматриваемая задача требует сохранения в индексе информации о каждом вхождении каждого слова в индексируемых текстах. Скорость выполнения поискового запроса зависит от числа вхождений слов запроса в текстах. Следовательно, запросы, включающие часто встречающиеся слова, выполняются существенно медленнее, чем запросы, состоящие из обычных слов. Для каждого слова текста сохраняем в индексах информацию о часто встречающихся словах, которые располагаются в тексте рядом с ним, на расстоянии не более $MaxDistance$. Данный параметр может принимать значения 5, 7 и даже больше. Применение индексов с трехкомпонентными ключами позволяет добиться быстрого выполнения поисковых запросов. Результаты экспериментов поиска, представленные автором ранее, показывают, что среднее время поискового запроса, состоящего из очень часто встречающихся слов, при применении индексов с трехкомпонентными ключами, меньше в 94.7 раза, чем среднее время поиска с использованием обычных инвертированных индексов. В текущей работе рассмотрен новый алгоритм создания индекса с трехкомпонентными ключами. Доказана корректность алгоритма. Представлены результаты экспериментов построения индексов для разных значений параметра $MaxDistance$.
Ключевые слова: полнотекстовый поиск, поисковые системы, инвертированные файлы, дополнительные индексы, поиск с учетом близости слов, индексы с трехкомпонентными ключами.
Финансовая поддержка Номер гранта
Министерство образования и науки Российской Федерации 02.A03.21.0006
Работа выполнена при финансовой поддержке постановления № 211 Правительства Российской Федерации, контракт № 02.A03.21.0006.
Поступила в редакцию: 01.07.2018
Реферативные базы данных:
Тип публикации: Статья
УДК: 519.683.5
MSC: 68P20, 68P10
Образец цитирования: А. Б. Веретенников, “Эффективный алгоритм для создания полнотекстовых индексов с трехкомпонентными ключами”, Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 29:1 (2019), 117–132
Цитирование в формате AMSBIB
\RBibitem{Ver19}
\by А.~Б.~Веретенников
\paper Эффективный алгоритм для создания полнотекстовых индексов с~трехкомпонентными ключами
\jour Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки
\yr 2019
\vol 29
\issue 1
\pages 117--132
\mathnet{http://mi.mathnet.ru/vuu671}
\crossref{https://doi.org/10.20537/vm190111}
\elib{https://elibrary.ru/item.asp?id=37416689}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/vuu671
  • https://www.mathnet.ru/rus/vuu/v29/i1/p117
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Вестник Удмуртского университета. Математика. Механика. Компьютерные науки
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024