Зміст Бизнес-аналитика: от данных к знаниям (+CD). Учебное пособие. 2-е издание, исправленное
Предисловие авторов
Об авторах
От издательства
Вступительное слово
Введение
Современная бизнес-аналитика
Часть I. теория бизнес-анализа
Глава 1. технологии анализа данных
1 .1 . Введение в анализ данных
1 .2 . Принципы анализа данных
1 .3 . Структурированные данные
1 .4 . Подготовка данных к анализу
1 .5 . Технологии KDD и Data Mining
1 .6 . Аналитические платформы
1 .7 . Введение в алгоритмы Data Mining
Глава 2. Консолидация данных
2 .1 . Задача консолидации
2 .2 . Введение в хранилища данных
2 .3 . Основные концепции хранилищ данных
2 .4 . Многомерные хранилища данных
2 .5 . Реляционные хранилища данных
2 .6 . Гибридные хранилища данных
2 .7 . Виртуальные хранилища данных
2 .8 . Нечеткие срезы
2 .9 . Введение в ETL
2 .10 . Извлечение данных в ETL
2 .11 . Очистка данных в ETL
2 .12 . Преобразование данных в ETL
2 .13 . Загрузка данных в хранилище
2 .14 . Загрузка данных из локальных источников
2 .15 . Обогащение данных
Глава 3. трансформация данных
3 .1 . Введение в трансформацию данных
3 .2 . Трансформация упорядоченных данных
3 .3 . Группировка данных
3 .4 . Слияние данных
3 .5 . Квантование
3 .6 . Нормализация и кодирование данных
Глава 4. Визуализация данных
4 .1 . Введение в визуализацию
4 .2 . Визуализаторы общего назначения
4 .3 . OLAP-анализ
4 .4 . Визуализаторы для оценки качества моделей
4 .5 . Визуализаторы, применяемые для интерпретации результатов анализа
Глава 5. очистка и предобработка данных
5 .1 . Оценка качества данных
5 .2 . Технологии и методы оценки качества данных
5 .3 . Очистка и предобработка
5 .4 . Фильтрация данных
5 .5 . Обработка дубликатов и противоречий
5 .6 . Выявление аномальных значений
5 .7 . Восстановление пропущенных значений
5 .8 . Введение в сокращение размерности
5 .9 . Сокращение числа признаков
5 .10 . Сокращение числа значений признаков и записей
5 .11 . Сэмплинг
Глава 6. Data Mining: задача ассоциации
6 .1 . Ассоциативные правила
6 .2 . Алгоритм Apriori
6 .3 . Иерархические ассоциативные правила
6 .4 . Последовательные шаблоны
Глава 7. Data Mining: кластеризация
7 .1 . Введение в кластеризацию
7 .2 . Алгоритм кластеризации k-means
7 .3 . Сети Кохонена
7 .4 . Карты Кохонена
7 .5 . Проблемы алгоритмов кластеризации
Глава 8. Data Mining: классификация и регрессия.
статистические методы
8 .1 . Введение в классификацию и регрессию
8 .2 . Простая линейная регрессия
8 .3 . Оценка соответствия простой линейной регрессии реальным данным
8 .4 . Простая регрессионная модель
8 .5 . Множественная линейная регрессия
8 .6 . Модель множественной линейной регрессии
8 .7 . Регрессия с категориальными входными переменными
8 .8 . Методы отбора переменных в регрессионные модели
8 .9 . Ограничения применимости регрессионных моделей
8 .10 . Основы логистической регрессии
8 .11 . Интерпретация модели логистической регрессии
8 .12 . Множественная логистическая регрессия
8 .13 . Простой байесовский классификатор
Глава 9. Data Mining: классификация и регрессия.
Машинное обучение
9 .1 . Введение в деревья решений
9 .2 . Алгоритмы построения деревьев решений
9 .3 . Алгоритмы ID3 и С4 .
9 .4 . Алгоритм CART
9 .5 . Упрощение деревьев решений
9 .6 . Введение в нейронные сети
9 .7 . Искусственный нейрон
9 .8 . Принципы построения нейронных сетей
9 .9 . Процесс обучения нейронной сети
9 .10 . Алгоритмы обучения нейронных сетей
9 .11 . Алгоритм обратного распространения ошибки
Глава 10. анализ и прогнозирование временных рядов
10 .1 . Введение в прогнозирование
10 .2 . Временной ряд и его компоненты
10 .3 . Модели прогнозирования
10 .4 . Прогнозирование в торговле и логистике
Глава 11. ансамбли моделей
11 .1 . Введение в ансамбли моделей
11 .2 . Бэггинг
11 .3 . Бустинг
11 .4 . Альтернативные методы построения ансамблей
Глава 12. сравнение моделей
12 .1 . Оценка эффективности и сравнение моделей
12 .2 . Оценка ошибки модели
12 .3 . Издержки ошибочной классификации
12 .4 . Lift- и Profit-кривые
12 .5 . ROC-анализ
12 .6 . Обучение в условиях несбалансированности классов
Часть II. бизнес-анализ В DeDuctor
Глава 13. аналитическая платформа Deductor
Глава 14. Консолидация данных и аналитическая отчетность
аптечной сети
Глава 15. ассоциативные правила в стимулировании
розничных продаж
Глава 16. сегментация клиентов телекоммуникационной компании
Глава 17. скоринговые модели для оценки кредитоспособности
заемщиков
Глава 18. Прогнозирование продаж товаров в оптовой компании
Глава 19. Повышение эффективности массовой рассылки клиентам
Заключение
Литература
Aлфавитный указатель