Искусственный интеллект и принятие решений
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Искусственный интеллект и принятие решений:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Искусственный интеллект и принятие решений, 2023, выпуск 3, страницы 98–108
DOI: https://doi.org/10.14357/20718594230310
(Mi iipr41)
 

Анализ сигналов, аудио и видео информации

Метод обработки фото- и видеоданных с фотоловушек с использованием двухстадийного нейросетевого подхода

В. А. Ефремов, А. В. Леус, Д. А. Гаврилов, Д. И. Мангазеев, И. В. Холодняк, А. С. Радыш, В. А. Зуев, Н. А. Водичев

Московский физико-технический институт (национальный исследовательский университет), Долгопрудный, Московская область, Россия
Аннотация: В работе предложена технология анализа данных с фотоловушек с помощью двухстадийной нейросетевой обработки. Задача первого этапа состоит в отделении пустых изображений от непустых. Для решения задачи проведен сравнительный анализ архитектур YOLOv5, YOLOR, YOLOX и выявлена наиболее оптимальная модель детектора. Задача второго этапа заключается в классификации объектов, найденных детектором. Сравнивались модели EfficientNetV2, SeResNet, ResNeSt, ReXNet, ResNet. Для обучения модели детектора и классификатора разработан подход подготовки данных, заключающийся в удалении изображений-дубликатов из выборки. Метод был модифицирован с помощью агломеративной кластеризации для разделения выборки на обучение, валидацию и тест. В задаче обнаружения объектов лучшим на наборе данных оказался алгоритм YOLOv5-L6 с точностью нахождения 98,5%. В задаче классификации найденных объектов, лучше всех себя показала архитектура ResNeSt-101 с качеством распознавания 98,339% на тестовых данных.
Ключевые слова: изображения с фотоловушек, агломеративная кластеризация, глубокие сверточные нейронные сети, детекция, классификация, двухстадийный подход.
Реферативные базы данных:
Тип публикации: Статья
Образец цитирования: В. А. Ефремов, А. В. Леус, Д. А. Гаврилов, Д. И. Мангазеев, И. В. Холодняк, А. С. Радыш, В. А. Зуев, Н. А. Водичев, “Метод обработки фото- и видеоданных с фотоловушек с использованием двухстадийного нейросетевого подхода”, Искусственный интеллект и принятие решений, 2023, № 3, 98–108
Цитирование в формате AMSBIB
\RBibitem{EfrLeuGav23}
\by В.~А.~Ефремов, А.~В.~Леус, Д.~А.~Гаврилов, Д.~И.~Мангазеев, И.~В.~Холодняк, А.~С.~Радыш, В.~А.~Зуев, Н.~А.~Водичев
\paper Метод обработки фото- и видеоданных с фотоловушек с использованием двухстадийного нейросетевого подхода
\jour Искусственный интеллект и принятие решений
\yr 2023
\issue 3
\pages 98--108
\mathnet{http://mi.mathnet.ru/iipr41}
\crossref{https://doi.org/10.14357/20718594230310}
\elib{https://elibrary.ru/item.asp?id=54684783}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/iipr41
  • https://www.mathnet.ru/rus/iipr/y2023/i3/p98
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Искусственный интеллект и принятие решений
    Статистика просмотров:
    Страница аннотации:5
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024