|
Анализ сигналов, аудио и видео информации
Основные подходы к подготовке визуальных данных для обучения нейросетевых алгоритмов
А. Г. Лапушкинa, Д. А. Гавриловab, Н. Н. Щелкуновa, Р. Н. Бакеевc a Московский физико-технический институт (государственный университет), г. Долгопрудный, Россия
b Институт точной механики и вычислительной техники имени С. А. Лебедева РАН, г. Москва, Россия
c Фонд перспективных исследований, г. Москва, Россия
Аннотация:
Проведен анализ основных подходов, которые используют разработчики нейросетевых алгоритмов для подготовки обучающих данных и формирования обучающих выборок. Рассмотрены возможные способы получения размеченных изображений. В качестве примеров открытых библиотек размеченных изображений показаны ImageNet или Coco, предлагающие размеченные и аннотированные фотоизображения, а также библиотеки наборов трехмерных данных. Исследованы специализированные редакторы разметки изображений для работы с нестандартными и неполно представленными в общедоступных библиотеках объектами, позволяющие размечать данные как вручную, так и в полуавтоматическом режиме. Рассмотрены генераторы синтетических данных и симуляторы, позволяющие имитировать трудновоспроизводимые события, а также комбинированный подход с использованием сетей типа GAN. Выполнен анализ основных сложностей, возникающих у разработчиков при подготовке обучающих данных, в том числе проанализированы недостатки готовых наборов данных, синтетических генераторов и подхода, использующего сети типа GAN.
Ключевые слова:
нейронные сети, обучающие выборки, визуальные данные, разметка, симулятор.
Образец цитирования:
А. Г. Лапушкин, Д. А. Гаврилов, Н. Н. Щелкунов, Р. Н. Бакеев, “Основные подходы к подготовке визуальных данных для обучения нейросетевых алгоритмов”, Искусственный интеллект и принятие решений, 2021, № 4, 62–74; Scientific and Technical Information Processing, 49:6 (2022), 463–471
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/iipr119 https://www.mathnet.ru/rus/iipr/y2021/i4/p62
|
|