Семинары
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Календарь
Поиск
Регистрация семинара

RSS
Ближайшие семинары




Ежемесячный семинар Московской cекции ACM SIGMOD
19 декабря 2013 г., г. Москва, ВМиК МГУ
 


MapReduce: от грёз к реальности

С. Д. Кузнецов

Институт системного программирования РАН
Дополнительные материалы:
Adobe PDF 826.6 Kb

Количество просмотров:
Эта страница:363
Материалы:1125
Youtube:



Аннотация: Девять лет назад была опубликована статья [1], которая внесла сумятицу в головы многих не слишком стойких молодых специалистов. Возникло впечатление, что эпоха аналитических СУБД закончилась, что теперь любая аналитическая задача дешево и эффективно решается с помощью простого ручного программирования. Как не странно, этого испугались даже матерые и всемирно известные исследователи [2], которые потратили много сил и нервов на обоснование того, что MapReduce заменить СУБД все-таки не может. Однако вскоре страсти в мире баз данных улеглись. Стало понятно, что массивно-параллельным СУБД в действительности нужен MapReduce, а MapReduce относительно бесполезен без СУБД. Первое, на что следует обратить внимание, это близость парадигмы MapReduce традиционной технологии ROLAP. В мире аналитических SQL-ориентированных баз данных привыкли к тому, что многомерные кубы строятся на основе оператора Group By [3], а действия функции map можно считать обобщением группировки. Второй фактор, сыгравший огромную роль в жизни MapReduce, – это открытая реализация технологии сообществом Apache [4]. Если отвлечься от навязчивого маркетинга, то на сегодняшний день можно выделить две ниши, в которых технология MapReduce приносит реальную помощь в тесной взаимосвязи с технологией аналитических СУБД. Во-первых, MapReduce позволяет создавать серверные горизонтально масштабируемые аналитические приложения (Greeplum, Asterdata, Vertica). Во-вторых, MapReduce может успешно использоваться для обеспечения инфраструктуры новых аналитических массивно-параллельных СУБД (HadoopDB, после коммерциализации Hadаpt).

Дополнительные материалы: kuznetsov20131219.pdf (826.6 Kb)

Website: https://synthesis.ipi.ac.ru/sigmod/seminar/s20131219

Список литературы
  1. Jeffrey Dean, Sanjay Ghemawat, “MapReduce: simplified data processing on large clusters”, OSDI, 2004, 137–150  crossref
  2. David J. DeWitt and Michael Stonebraker, MapReduce: A major step backwards, http://homes.cs.washington.edu/~billhowe/mapreduce_a_major_step_backwards.html, 2008
  3. Jim Gray, Adam Bosworth, Andrew Layman, Hamid Pirahesh, Data Cube: A Relational Aggregation Operator Generalizing Group-By, Cross-Tab, and Sub-Totals, Technical report MSR-TR-95-22, http://research.microsoft.com/pubs/69578/tr-95-22.pdf, 1995
  4. Hadoop, http://hadoop.apache.org, 2003
 
  Обратная связь:
 Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024