|
МАТЕМАТИЧЕСКИЕ ОСНОВЫ И ЧИСЛЕННЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ
О разложении матриц при помощи метода стохастического градиентного спуска в приложении к задаче направляемой классификации микрочипов
В. Н. Никулин Вятский государственный университет, ф-т экономики и менеджмента, кафедра ММЭ, Россия, 610000, г. Киров, ул. Московская, д. 36, Тел.: (8332) 64–48–16
Аннотация:
Многомерные данные, при использовании значительно большего количества признаков относительно меньшего числа наблюдений, порождают хорошо известную проблему переопределённой задачи. В связи с этим, представляется целесообразным описание данных в терминах меньшего числа мета-признаков, которые вычисляются при помощи так называемых матричных факторизаций. Такие факторизации способствуют уменьшению случайного шума при сохранении наиболее существенной информации. Три новых и взаимосвязанных метода предложены в этой статье: 1) факторизационный механизм градиентного спуска с двумя (согласно размерности микрочипа) гибкими и адаптируемыми параметрами обучения, включая явные формулы их автоматического пересчета, 2) непараметрический критерий для отбора количества факторов, и 3) неотрицательная модификация градиентной факторизации, которая не требует дополнительных вычислительных затрат в сравнении с базовой моделью. Мы иллюстрируем эффективность предложенных методов в приложении к задаче направляемой классификации данных в области биоинформатики.
Ключевые слова:
матричная факторизация, ненаправляемое обучение, количество факторов, непараметрический критерий, неотрицательность, оставить одного извне, классификация.
Поступила в редакцию: 18.03.2013 Исправленный вариант: 05.04.2013
Образец цитирования:
В. Н. Никулин, “О разложении матриц при помощи метода стохастического градиентного спуска в приложении к задаче направляемой классификации микрочипов”, Компьютерные исследования и моделирование, 5:2 (2013), 131–140
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/crm386 https://www.mathnet.ru/rus/crm/v5/i2/p131
|
|