«Основы больших данных» обеспечивают прагматичное и серьезное введение в область больших данных. Популярный ИТ-автор Томас Эрл и его команда четко объясняют ключевые концепции, теорию и терминологию Big Data, а также фундаментальные технологии и методы. Весь охват материала книги поддерживается примерами из практики и многочисленными простыми диаграммами.
Эта книга представляет:
- открытие фундаментальных концепций Big Data и того, что отличает эту технологию от предыдущих форм анализа данных и науки о данных;
- понимание бизнес-мотиваций и стимулов, связанных с адаптацией к большим данным для оперативных улучшений за счет инноваций;
- планирование стратегических, бизнес-мотивированных инициатив на основе больших данных;
- рассмотрение таких вопросов, как менеджмент данными, руководство и безопасность;
- распознавание 5 "V" характеристик наборов данных в средах больших данных: объем, скорость, разнообразие, достоверность и ценность;
- объяснение отношений больших данных с OLTP, OLAP, ETL, хранилищами данных и витринами данных;
- работа с большими данными в структурированных, неструктурированных, полуструктурированных форматах и форматах метаданных;
- увеличение ценности за счет интеграции ресурсов больших данных с мониторингом эффективности бизнеса;
- понимание того, как большие данные используют распределенную и параллельную обработку;
- использование NoSQL и других технологий для удовлетворения различных требований к обработке больших данных;
- использование статистических подходов для количественного и качественного анализа;
- Применение методов вычислительного анализа, включая машинное обучение.
Первые 20 страниц книги