Информатика и автоматизация
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информатика и автоматизация:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Информатика и автоматизация, 2021, выпуск 20, том 3, страницы 623–653
DOI: https://doi.org/10.15622/ia.2021.3.5
(Mi trspy1155)
 

Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)

Искусственный интеллект, инженерия данных и знаний

Efficient natural language classification algorithm for detecting duplicate unsupervised features
[Эффективный алгоритм классификации естественного языка обнаружения повторяющихся контролируемых признаков]

S. Altafa, S. Iqbalb, M. Soomroc

a Pir Mehr Ali Shah Arid Agriculture University
b Pakistan Space and Upper Atmosphere Research Commission (SUPARCO), Pakistan
c Manukau Institute of Technology
Аннотация: Эта статья фокусируется на том, чтобы уловить смысл значения текстовых функций понимания естественного языка (NLU) для обнаружения дубликатов неконтролируемых признаков. Особенности NLU сравниваются с лексическими подходами для доказательства подходящей методики классификации. Подход трансфертного обучения используется для обучения извлечению признаков в задаче семантического текстового сходства (STS). Все функции оцениваются с помощью двух типов наборов данных, которые принадлежат отчетам об ошибках Bosch и статьям Википедии. Цель данного исследованияструктурировать последние исследовательские усилия путем сравнения концепций NLU для описания семантики текста и применения их к IR. Основным вкладом данной работы является сравнительное исследование измерений семантического сходства. Экспериментальные результаты демонстрируют результаты функции Term Frequency–Inverse Document Frequency (TF-IDF) для обоих наборов данных с разумным объемом словаря. Это указывает на то, что двунаправленная долговременная кратковременная память (BiLSTM) может изучать структуру предложения для улучшения классификации
Ключевые слова: кластеризация, информационный поиск, функция TF-IDF, Par2Vec, тексты на естественном языке, лексические подходы.
Тип публикации: Статья
УДК: 006.72
Язык публикации: английский
Образец цитирования: S. Altaf, S. Iqbal, M. Soomro, “Efficient natural language classification algorithm for detecting duplicate unsupervised features”, Информатика и автоматизация, 20:3 (2021), 623–653
Цитирование в формате AMSBIB
\RBibitem{AltIqbSoo21}
\by S.~Altaf, S.~Iqbal, M.~Soomro
\paper Efficient natural language classification algorithm for detecting duplicate unsupervised features
\jour Информатика и автоматизация
\yr 2021
\vol 20
\issue 3
\pages 623--653
\mathnet{http://mi.mathnet.ru/trspy1155}
\crossref{https://doi.org/10.15622/ia.2021.3.5}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/trspy1155
  • https://www.mathnet.ru/rus/trspy/v20/i3/p623
  • Эта публикация цитируется в следующих 2 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика и автоматизация
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024