S. Altaf, S. Iqbal, M. Soomro, “Efficient natural language classification algorithm for detecting duplicate unsupervised features”, Информатика и автоматизация, 20:3 (2021), 623

Информатика и автоматизация

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Информатика и автоматизация:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Информатика и автоматизация, 2021, выпуск 20, том 3, страницы 623–653
DOI: https://doi.org/10.15622/ia.2021.3.5 (Mi trspy1155)

Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)

Искусственный интеллект, инженерия данных и знаний

Efficient natural language classification algorithm for detecting duplicate unsupervised features

[Эффективный алгоритм классификации естественного языка обнаружения повторяющихся контролируемых признаков]

S. Altaf^a, S. Iqbal^b, M. Soomro^c

^a Pir Mehr Ali Shah Arid Agriculture University
^b Pakistan Space and Upper Atmosphere Research Commission (SUPARCO), Pakistan
^c Manukau Institute of Technology

PDF полного текста (1974 kB) Список цитирования (2)

DOI: https://doi.org/10.15622/ia.2021.3.5

Аннотация: Эта статья фокусируется на том, чтобы уловить смысл значения текстовых функций понимания естественного языка (NLU) для обнаружения дубликатов неконтролируемых признаков. Особенности NLU сравниваются с лексическими подходами для доказательства подходящей методики классификации. Подход трансфертного обучения используется для обучения извлечению признаков в задаче семантического текстового сходства (STS). Все функции оцениваются с помощью двух типов наборов данных, которые принадлежат отчетам об ошибках Bosch и статьям Википедии. Цель данного исследованияструктурировать последние исследовательские усилия путем сравнения концепций NLU для описания семантики текста и применения их к IR. Основным вкладом данной работы является сравнительное исследование измерений семантического сходства. Экспериментальные результаты демонстрируют результаты функции Term Frequency–Inverse Document Frequency (TF-IDF) для обоих наборов данных с разумным объемом словаря. Это указывает на то, что двунаправленная долговременная кратковременная память (BiLSTM) может изучать структуру предложения для улучшения классификации

Ключевые слова: кластеризация, информационный поиск, функция TF-IDF, Par2Vec, тексты на естественном языке, лексические подходы.

Тип публикации: Статья

УДК: 006.72

Язык публикации: английский

Образец цитирования: S. Altaf, S. Iqbal, M. Soomro, “Efficient natural language classification algorithm for detecting duplicate unsupervised features”, Информатика и автоматизация, 20:3 (2021), 623–653

Цитирование в формате AMSBIB

\RBibitem{AltIqbSoo21}

\by S.~Altaf, S.~Iqbal, M.~Soomro

\paper Efficient natural language classification algorithm for detecting duplicate unsupervised features

\jour Информатика и автоматизация

\yr 2021

\vol 20

\issue 3

\pages 623--653

\mathnet{http://mi.mathnet.ru/trspy1155}

\crossref{https://doi.org/10.15622/ia.2021.3.5}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/trspy1155

https://www.mathnet.ru/rus/trspy/v20/i3/p623

Эта публикация цитируется в следующих 2 статьяx:

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы