8 (905) 200-03-37 Владивосток
с 09:00 до 19:00
CHN - 1.14 руб. Сайт - 21.13 руб.

Dangdang.com База данных компьютерной сети, работающая в автономном режиме и в режиме реального времени, подлинные книги Machinery Industry Press

Цена: 1 005руб.    (¥47.53)
Артикул: 579095826395
Доставка по Китаю (НЕ включена в цену):
127 руб. (¥6)

Вес товара: ~0.7 кг. Указан усредненный вес, который может отличаться от фактического. Не включен в цену, оплачивается при получении.

Этот товар на Таобао Описание товара
Продавец:当当网官方旗舰店
Рейтинг:
Всего отзывов:0
Положительных:0
Добавить в корзину
Другие товары этого продавца
¥32.4685руб.
¥92.51 955руб.
¥137.642 909руб.
¥21444руб.
......
Основная информация
наименование товара:Офлайн и реальное время разработки больших данных фактическое борьбуформат:16
Автор:Чжу СонглингЦены:59.00
Номер ISBN:9787111596783Опубликованная дата:2018-05-05
Издательство:Машиностроительная промышленность ПрессаВремя печати:2018-05-01
Версия:1Индийский:1
Catuels? Содержание
Предисловие
*Статья: «Общая картина данных» и «Общая картина платформы данных».
Данные главы. Общая картина 2.
1.1 Поток данных 2
1.1.1 Генерация данных 3
1.1.2 Сбор и передача данных 5
1.1.3 Хранение и обработка данных 6
1.1.4 Приложение данных 7
1.2 Технологии обработки данных 8
1.2.1 Основные технологии сбора и передачи данных 9
1.2.2 Основные технологии обработки данных 10
1.2.3 Основные технологии хранения данных 12
1.2.4 Основные технологии применения данных 13
1.3 Специалисты и роли, связанные с данными 14
1.3.1 Инженер по разработке, эксплуатации и техническому обслуживанию платформы данных 14
1.3.2 Инженер по разработке данных, эксплуатации и техническому обслуживанию 15
1.3.3 Инженер по анализу данных 15
1.3.4 Инженер по алгоритмам 16
1.3.5 Деловой персонал 16
1.4 Краткое содержание этой главы 17
Глава 2. Общая картина платформы данных 18
2.1 Архитектура, технология и дизайн автономной платформы данных 19
2.1.1 Общая архитектура автономной платформы данных 19
2.1.2 Технология хранилища данных 20
2.1.3 Технология моделирования хранилища данных 23
2.1.4 Проектирование логической архитектуры хранилища данных 26
2.2 Архитектура, технология и дизайн платформы данных реального времени 27
2.2.1 Общая архитектура платформы данных в реальном времени 28
2.2.2 Технология потоковых вычислений 29
2.2.3 Основные платформы с открытым исходным кодом для потоковых вычислений 29
2.3 Управление данными 32
2.3.1 Исследование данных 32
2.3.2 Интеграция данных 33
2.3.3 Качество данных 33
2.3.4 Маскирование данных 34
2.4 Краткое содержание этой главы 35
Часть вторая. Разработка офлайн-данных: главное поле битвы при разработке больших данных
Глава 3. Принципы и практика Hadoop 38
3.1 Hadoop 38 открывает эру больших данных
3.2 Анализ преимуществ и недостатков HDFS и MapReduce 40
3.2.1 HDFS 41
3.2.2 MapReduce 42
3.3 Базовая архитектура HDFS и MapReduce 43
3.4 Практика внутренних принципов MapReduce 46
3.4.1 Разработка логики MapReduce 46
3.4.2 Подробное объяснение отправки задачи MapReduce 47
3.4.3 Подробное объяснение принципа внутреннего выполнения MapReduce 48
3.5 Краткое содержание этой главы 52
Глава 4. Принципы и практика улья 53
4.1 Основные технологии автономной обработки больших данных: Hive 53
4.1.1 Предыстория появления улья 53
4.1.2 Базовая архитектура Hive 55
4.2 Улей SQL 56
4.2.1 Ключевые понятия улья 57
4.2.2 База данных улья 59
4.2.3 Стол-улей DDL 60
4.2.4 Стол-улей DML 63
4.3 Иллюстрация принципа выполнения Hive SQL 65
4.3.1 Схема выполнения оператора выбора 66
4.3.2 Диаграмма выполнения группировок по операторам 67
4.3.3 Схема выполнения оператора соединения 69
4.4 Функции улья 73
4.5 Другие SQL в технологиях Hadoop 74
4.6 Краткое содержание этой главы 76
Глава 5. Практика оптимизации улья 77
5.1 Основная проблема офлайн-обработки данных: неравномерность данных 77
5.2 Оптимизация улья 79
5.3 Оптимизация, независимая от соединения 79
5.3.1 Оптимизация наклона, вызванная группой 79
5.3.2 Подсчет различных оптимизаций 80
5.4 Оптимизация объединения больших таблиц в маленькие таблицы 80
5.5 Оптимизация объединения больших таблиц в большие таблицы 82
5.5.1 Проблемный сценарий 82
5.5.2 Решение 1. Преобразование в Mapjoin 83
5.5.3 Вариант 2: Вариант использования, когда оператор при присоединении к 84
5.5.4 Вариант 3: несколько таблиц B, затем объединение по модулю 84
5.5.5 Схема 4: Динамическое разделение на две части 87
5.6 Краткое содержание этой главы 89
Глава 6. Технологическая практика размерного моделирования 90
6.1 Основная технология моделирования больших данных: многомерное моделирование 90
6.1.1 Ключевые понятия размерного моделирования 91
6.1.2 Общий процесс размерного моделирования 95
6.2 Конструкция таблицы размеров 96
6.2.1 Изменения размеров 96
6.2.2 Иерархия измерений 99
6.2.3 Согласованность размеров 100
6.2.4 Интегрирование и разделение измерений 101
6.2.5 Другие размеры 102
6.3 Анализ таблицы фактов 104
6.3.1 Таблица фактов транзакций 104
6.3.2 Таблица фактов моментального снимка 106
6.3.3 Таблица фактов совокупного моментального снимка 107
6.3.4 Таблица фактов без фактов 108
6.3.5 Сводная таблица фактов 108
6.4 Практика размерного моделирования больших данных 109
6.4.1 Таблица фактов 109
6.4.2 Таблица размеров 110
6.5 Краткое содержание этой главы 110
Глава 7. Практика разработки хранилища данных Hadoop 111
7.1 Бизнес-требования 112
7.2 Проектирование архитектуры хранилища данных Hadoop 113
7.3 Разработка спецификации хранилища данных Hadoop 114
7.3.1 Соглашение об именах 115
7.3.2 Спецификации разработки 115
7.3.3 Технические характеристики процесса 116
7.4 Практика построения хранилищ данных FutureRetailer 118
7.4.1 Таблица размеров изделия 118
7.4.2 Таблица фактов продаж 120
7.5 Новая архитектура платформы данных——Озеро данных 121
7.6 Краткое содержание этой главы 123
Часть третья: Разработка данных в реальном времени: будущее разработки больших данных
Глава 8. Разработка вычислительных систем Storm Stream 127
8.1 Создатель технологии потоковых вычислений: технология Storm 128
8.1.1 Базовая архитектура Storm 129
8.1.2 Ключевые понятия шторма 130
8.1.3 Параллелизм Storm 132
8.1.4 Базовые классы и интерфейсы Storm 133
8.2 Пример разработки Storm в реальном времени 133
8.2.1 Окно генерации операторов 134
8.2.2 Разъемный болт заявления 135
8.2.3 Болт подсчета слов 136
8.2.4 Отчет о болте 136
8.2.5 Топология подсчета слов 137
8.2.6 Параллельная настройка количества слов 139
8.3 Штормовой примитив Трайдент 142
8.3.1 Трайдент представляет предысторию 142
8.3.2 Основные идеи Trident 142
8.3.3 Операции с потоком Trident 143
8.3.4 Пример разработки Trident в реальном времени 145
8.4 Ключевые технологии шторма 147
8.4.1 Надежность излива 147
8.4.2 Надежность болта 148
8.4.3 Механизм противодавления шторма 149
8.5 Краткое содержание данной главы 150
Глава 9. Разработка потоковых вычислений Spark Streaming 151
9.1 Экология искры и основные концепции 151
9.1.1 Обзор искры 151
9.1.2 Основные понятия Spark 153
9.1.3 Искровая экосистема 157
9.2 Технология вычислений экологического потока Spark: Spark Streaming 158
9.2.1 Основные принципы потоковой передачи Spark 159
9.2.2 Основной API потоковой передачи Spark 159
9.3 Примеры разработки Spark Streaming в реальном времени 161
9.4 Практика настройки Spark Streaming 162
9.5 Ключевые технологии Spark Streaming 164
9.5.1 Семантика надежности Spark Streaming 164
9.5.2 Механизм противодавления искрового потока 165
9.6 Краткое содержание этой главы 166
Глава 0. Разработка потоковых вычислений Flink 167
10.1 Новичок в технологии потоковых вычислений: Flink 167
10.1.1 Стек технологий Flink 168
10.1.2 Ключевые понятия и основные принципы Flink 169
10.2 Флинк API 172
10.2.1 Обзор API 172
10.2.2 API потока данных 173
10.3 Пример разработки Flink в реальном времени 180
10.4 Подробное объяснение ключевых технологий Flink 182
10.4.1 Механизм отказоустойчивости 182
10.4.2 Уровень воды 184
10.4.3 Оконный механизм 185
10.4.4 Снятие 187
10.4.5 Механизм противодавления 187
10.5 Краткое содержание этой главы 188
Глава 1. Лучевая технология 189
11.1 Балка 190 для единого расчета расхода
11.1.1 Предыстория Луча 190
11.1.2 Лучевая технология 191
11.2 Ядро лучевой технологии: модель Beam 193
11.3 Beam SDK 196
11.3.1 Ключевые понятия 196
11.3.2 Лучевой SDK 197
11.4 Подробное объяснение окна 202 «Луч»
11.4.1 Основы работы с окнами 202
11.4.2 Данные об уровне воды и задержке 203
11.4.3 Триггер 204
11.5 Краткое содержание данной главы 205
Глава 2. Практика разработки Stream SQL в реальном времени 206
12.1 Принципы SQL и архитектура потоковых вычислений 207
12.2 Потоковые вычисления SQL: основная технология разработки в реальном времени в будущем 208
12.3 Поток SQL 209
12.3.1 Исходная таблица потока SQL 209
12.3.2 Таблица результатов потока SQL 209
12.3.3 Таблица измерений потока SQL 210
12.3.4 Временная таблица Stream SQL 211
12.3.5 Потоковый SQL DML 211
12.4 Практическая разработка Stream SQL 212 в режиме реального времени
12.4.1 выбор операции 212
12.4.2 Операция присоединения 214
12.4.3 Операции агрегирования 218
12.5 Механизм вывода 221
12.6 Краткое содержание данной главы 222
Рекомендации 224......Эта книга разделена на три статьи.Одна из первых частей: дайте большую карту картины и платформу данных с целого. Ключевые концепции данных и технологии и т. Д.; , в том числе шторм, SparkSteaming, Flink, Beam и т. Д.............