Научно-технические ведомости Санкт-Петербургского политехнического университета. Информатика. Телекоммуникации. Управление
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информатика, телекоммуникации и управление:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Научно-технические ведомости Санкт-Петербургского политехнического университета. Информатика. Телекоммуникации. Управление, 2015, выпуск 2-3(217-222), страницы 105–114
DOI: https://doi.org/10.5862/JCSTCS.217-222.9
(Mi ntitu107)
 

Системный анализ и управление

Представление трехмерных объектов с помощью ансамбля трансформирующих автоассоциаторов

А. А. Хуршудов

Кубанский государственный технологический университет
Аннотация: Одна из ключевых задач машинного обучения в области компьютерного зрения – получение качественных представлений визуальных данных, остающихся устойчивыми к изменениям угла обзора, позиции в сцене, эффектов освещения или текстуры изображенного объекта. Существующие современные модели сверточных сетей, такие как GoogLeNet или AlexNet успешно решают эту задачу в некоторых условиях, формируя инвариантные представления, достаточные для эффективной классификации множества объектов. Некоторые исследователи (Хинтон, Крижевский и др.), однако предполагают, что используемый этими моделями подход, несмотря на впечатляющие результаты в задачах классификации, является фундаментально ошибочным по отношению к тому, что должна представлять собой эффективная зрительная система: инвариантные представления не способны реагировать на изменения положения объекта в пространстве. Упомянутые авторы предполагают,что целью любой качественной модели зрительной системы должна быть не инвариантность, а эквивариантность – способность изменять представление объекта предсказуемым образом в ответ на наблюдаемые пространственные преобразования.
В данной статье использована предложенная Хинтоном архитектура подобной эквивариантной модели трансформирующего автоассоциатора, модифицированная таким образом, чтобы обнаруживать низкоуровневые композиционные признаки в изображениях трехмерных объектов. С применением SVM-классификатора и использованием свойств трансформирующего автоассоциатора продемонстрирована возможность представления сложных трехмерных форм в виде ансамбля ограниченного количества автоассоциаторов, каждый из которых соответствует локальному признаку объекта. Благодаря способности трансформирующего автоассоциатора определять не только присутствие выученного признака, но и его пространственные параметры, становится также возможным соотносить вместе изображения одних и тех же объектов в условиях, существенно различных на уровне пикселей.
Ключевые слова: трансформирующий автоассоциатор, одноразовое обучение, эквивариантное представление, капсулы.
Тип публикации: Статья
УДК: 004.923
Образец цитирования: А. А. Хуршудов, “Представление трехмерных объектов с помощью ансамбля трансформирующих автоассоциаторов”, Научно-технические ведомости СПбГПУ. Информатика. Телекоммуникации. Управление, 2015, № 2-3(217-222), 105–114
Цитирование в формате AMSBIB
\RBibitem{Khu15}
\by А.~А.~Хуршудов
\paper Представление трехмерных объектов с помощью ансамбля трансформирующих автоассоциаторов
\jour Научно-технические ведомости СПбГПУ. Информатика. Телекоммуникации. Управление
\yr 2015
\issue 2-3(217-222)
\pages 105--114
\mathnet{http://mi.mathnet.ru/ntitu107}
\crossref{https://doi.org/10.5862/JCSTCS.217-222.9}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/ntitu107
  • https://www.mathnet.ru/rus/ntitu/y2015/i2/p105
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика, телекоммуникации и управление
    Статистика просмотров:
    Страница аннотации:193
    PDF полного текста:64
    Первая страница:14
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024