8 (905) 200-03-37 Владивосток
с 09:00 до 19:00
CHN - 1.14 руб. Сайт - 17.98 руб.

[Xinda подлинный] Большой анализ данных и моделирование данных на основе Spark и R Sparklyr моделирования моделирования данных об расширении неспособности кластера пряжи для исключения науки о данных и сообществе машинного обучения

Цена: 1 180руб.    (¥65.6)
Артикул: 624520227291

Вес товара: ~0.7 кг. Указан усредненный вес, который может отличаться от фактического. Не включен в цену, оплачивается при получении.

Этот товар на Таобао Описание товара
Продавец:鑫达图书专营店
Рейтинг:
Всего отзывов:0
Положительных:0
Добавить в корзину
Другие товары этого продавца
¥35.8644руб.
¥33594руб.
¥ 78 54.6982руб.
¥ 69.8 46.8842руб.

  Основная информация

наименование товара:

  

делать   

   [красота] harveil&Миддот;

город  поле  цена:

   89,00 Юань

ISBN  номер:

  9787111661016

Дата публикации:

  2020-07

Страница  &Nbsp; номер:

  259

Характер  &Nbsp; номер:

  

вне   Общество:

   Machinery Industry Press


 

 

  Оглавление

  Предисловие 1
Предисловие 3
Глава 1 Введение 9
1.1 Обзор 10
1.2 Hadoop 10
1.3 Spark 12
1.4 R 16
1.5 sparklyr 19
1.6 Резюме 20
Глава 2 начало 21
2.1 Обзор 21
2.2 Операция подготовки 22
2.2.1 Установите Sparklyr 23
2.2.2 Установите Spark 23
2.3 соединение 24
2.4 Используйте Spark 25
2.4.1 сетевой интерфейс 25
2.4.2 Анализ 28
2.4.3 Моделирование 28
2.4.4 Данные 30
2.4.5 Расширение 30
2.4.6 Распределено R 31
2.4.7 потоковые данные 31
2.4.8 log 32
2.5 Discovery Connection 33
2.6 Используйте RSTUDIO 33
2.7 Ресурсы 35
2.8 Резюме 36
Глава 3 Анализ 37
3.1 Обзор 37
3.2 Импорт данных 40
3.3 Организация данных 41
3.3.1 -Встроенная функция 42
3.3.2 Условие 43
3.4 Визуализация 45
3.4.1 Используйте GGPLOT2 46
3.4.2 Используйте DBPLOT 47
3.5 Моделирование 49
3.6 Связь 51
3.7 Резюме 54
Глава 4 Моделирование 56
4.1 Обзор 56
4.2 Исследовательский анализ данных 58
4.3 Инженерная инженерия 65
4.4 Обучение надзору 68
4.4.1 В целом линейная регрессия 72
4.4.2 Другая модель 73
4.5 НЕ -СУПЕРВАЛИЧЕСКОЕ ОБУЧЕНИЕ 73
4.5.1 Подготовка данных 74
4.5.2 Моделирование темы 75
4.6 Резюме 77
Глава 5 Работа трубы 78
5.1 Обзор 78
5.2 Торжжение работы 80
5.3 Использование 81
5.4 Режим работы 83
5.5 Интерактивный 84
5.6 Развертывание 86
5.6.1 Партия счета 87
5.6.2 Реальная оценка 88
5.7 Резюме 90
Глава 6 кластер 92
6. Обзор 92
6.2 Локализация 94
6.2.1 Менеджер 94
6.2.2 Выпуск версии 98
6,3 Облако 100
6.3.1 Amazon 101
6.3.2 Databricks 102
6.3.3 Google 103
6.3.4 IBM 105
6.3.5 Microsoft 106
6.3.6 Qubole 107
6.4 Kubernetes 107
6,5 Инструменты 108
6.5.1 RStudio 108
6.5.2 Jupyter 109
6.5.3 Livy 110
6.6 Резюме 111
Глава 7 Соединение 112
7.1 Обзор 112
7.1.1 Крайный узел 114
7.1.2 Spark Main Directory 114
7.2 локальный режим 115
7.3 Одиночный режим 116
7.4 YARN 116
7.4.1 Клиент пряжи 117
7.4.2 Кластер пряжи 117
7.5 Livy 118
7.6 Mesos 120
7.7 Kubernetes 121
7.8 Облачный режим 121
7.9 партийный режим 122
7.10 Инструмент 123
7.11 Многочисленные соединения 123 раза
7.12 Исключение сбоя 124
7.12.1 Журнал записи 124
7.12.2 Spark Submit 124
7.12.3 Windows 126
7.13 Маленькая Очерка 126
Глава 8 Данные 127
8.1 Обзор 127
8.2 Читать данные 129
8.2.1 Путь 129
8.2.2 Режим 130
8.2.3 Память 131
8.2.4 столбец 132
8.3 Напишите данные 133
8.4 Копировать данные 134
8.5 Формат файла 135
8.5.1 CSV 136
8.5.2 JSON 137
8.5.3 Parquet 138
8.5.4 Другие 139
8.6 Файловая система 140
8.7 Система хранения 140
8.7.1 Hive 141
8.7.2 Cassandra 142
8.7.3 JDBC 142
8.8 Резюме 143
Глава 9 отладка 144
9.1 Обзор 144
9.1.1 Расчет Рисунок 146
9.1.2 График 148
9.2 Конфигурация 148
9.2.1 Настройки соединения 150
9.2.2 Отправить настройку 151
9.2.3 Установлен на 152
9.2.4 Настройки Sparklyr 153
9.3 Отдел 156
9.3.1 Скрытый раздел 156
9.3.2 Различный раздел 157
9.4 Кэш 158
9.4.1 Проверка 159
9.4.2 Память 159
9,5 тяжелая стирка 160
9.6 Сериализация 161
9.7 Файл конфигурации 161
9.8 Резюме 162
Глава 10 Расширение 163
10.1 Обзор 163
10.2 H2O 165
10.3 Рисунок модель 169
10.4 XGBoost 173
10.5 глубокое обучение 176
10.6 Геномика 179
10.7 Космические данные 181
10.8 Устранение неисправностей 183
10.9 Резюме 183
Глава 11 Распределенная R 185
11.1 Обзор 185
11.2 вариант использования 187
11.2.1 Индивидуальный анализатор 188
11.2.2 Моделирование раздела 189
11.2.3 Поиск сетки 191
11.2.4 Web API 192
11.2.5 Симуляция 193
11.3 Отдел 194
11.4 Группа 195
11,5 Колонка 196
11.6 Параметр контекста 197
11,7 Функция 198
11.8 Программный пакет 199
11.9 Требования к кластеру 200
11.9.1 Установить r 200
11.9.2 Apache Arrow 201
11.10 Исключение сбоя 203
11.10.1 Журнал рабочих узлов 204
11.10.2 Решение тайм -аута 205
11.10.3 Проверьте раздел 206
11.10.4 Рабочий узел отладки 206
11.11 Резюме 207
Глава 12 Поток данных 208
12.1 Обзор 208
12.2 Преобразование 211
12.2.1 Анализ 212
12.2.2 Моделирование 213
12.2.3 Трубопровод 214
12.2.4 Распределен R 215
12.3 Kafka 216
12.4 Shiny 218
12.5 Резюме 220
Глава 13 Вклад сообщества 221
13.1 Обзор 221
13.2 Spark API 223
13.3 Extension 224
13.4 Используйте код Scala 226
13.5 Резюме 228
Приложение A Дополнительный справочный код 229


 

 

  краткое введение

Цель этой книги - помочь всем использовать Apache Spark через R.Глава 1 ~ Глава 5, которая кратко представляет, как реализовывать проекты науки о данных и машинного обучения в больших масштабах.Глава 6-9 представляет основную концепцию захватывающей в расчете кластера.Глава 10 ~ Глава 13 охватывает некоторые продвинутые темы, в том числе распределенные R, потоковые и общественные вклады.


 

624507759177