В. А. Ефремов, А. В. Леус, Д. А. Гаврилов, Д. И. Мангазеев, И. В. Холодняк, А. С. Радыш, В. А. Зуев, Н. А. Водичев, “Метод обработки фото- и видеоданных с фотоловушек с использованием двухстадийного нейросетевого подхода”, Искусственный интеллект и принятие решений, 2023, № 3, 98

Искусственный интеллект и принятие решений

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив
	Правила для авторов

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Искусственный интеллект и принятие решений:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Искусственный интеллект и принятие решений, 2023, выпуск 3, страницы 98–108
DOI: https://doi.org/10.14357/20718594230310 (Mi iipr41)

Анализ сигналов, аудио и видео информации

Метод обработки фото- и видеоданных с фотоловушек с использованием двухстадийного нейросетевого подхода

В. А. Ефремов, А. В. Леус, Д. А. Гаврилов, Д. И. Мангазеев, И. В. Холодняк, А. С. Радыш, В. А. Зуев, Н. А. Водичев

Московский физико-технический институт (национальный исследовательский университет), Долгопрудный, Московская область, Россия

PDF полного текста (922 kB)

DOI: https://doi.org/10.14357/20718594230310

Аннотация: В работе предложена технология анализа данных с фотоловушек с помощью двухстадийной нейросетевой обработки. Задача первого этапа состоит в отделении пустых изображений от непустых. Для решения задачи проведен сравнительный анализ архитектур YOLOv5, YOLOR, YOLOX и выявлена наиболее оптимальная модель детектора. Задача второго этапа заключается в классификации объектов, найденных детектором. Сравнивались модели EfficientNetV2, SeResNet, ResNeSt, ReXNet, ResNet. Для обучения модели детектора и классификатора разработан подход подготовки данных, заключающийся в удалении изображений-дубликатов из выборки. Метод был модифицирован с помощью агломеративной кластеризации для разделения выборки на обучение, валидацию и тест. В задаче обнаружения объектов лучшим на наборе данных оказался алгоритм YOLOv5-L6 с точностью нахождения 98,5%. В задаче классификации найденных объектов, лучше всех себя показала архитектура ResNeSt-101 с качеством распознавания 98,339% на тестовых данных.

Ключевые слова: изображения с фотоловушек, агломеративная кластеризация, глубокие сверточные нейронные сети, детекция, классификация, двухстадийный подход.

Реферативные базы данных:

Тип публикации: Статья

Образец цитирования: В. А. Ефремов, А. В. Леус, Д. А. Гаврилов, Д. И. Мангазеев, И. В. Холодняк, А. С. Радыш, В. А. Зуев, Н. А. Водичев, “Метод обработки фото- и видеоданных с фотоловушек с использованием двухстадийного нейросетевого подхода”, Искусственный интеллект и принятие решений, 2023, № 3, 98–108

Цитирование в формате AMSBIB

\RBibitem{EfrLeuGav23}

\by В.~А.~Ефремов, А.~В.~Леус, Д.~А.~Гаврилов, Д.~И.~Мангазеев, И.~В.~Холодняк, А.~С.~Радыш, В.~А.~Зуев, Н.~А.~Водичев

\paper Метод обработки фото- и видеоданных с фотоловушек с использованием двухстадийного нейросетевого подхода

\jour Искусственный интеллект и принятие решений

\yr 2023

\issue 3

\pages 98--108

\mathnet{http://mi.mathnet.ru/iipr41}

\crossref{https://doi.org/10.14357/20718594230310}

\elib{https://elibrary.ru/item.asp?id=54684783}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/iipr41

https://www.mathnet.ru/rus/iipr/y2023/i3/p98

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Искусственный интеллект и принятие решений

Статистика просмотров:
Страница аннотации:	5

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы