8 (905) 200-03-37 Владивосток
с 09:00 до 19:00
CHN - 1.14 руб. Сайт - 21.13 руб.

Подлинная бесплатная доставка Spark Machine Learning Rachel Deep Dewar Книжный магазин Технологии автоматизации и оборудование Книги Воображение Бестселлеры

Цена: 1 342руб.    (¥63.48)
Артикул: 599534757263

Вес товара: ~0.7 кг. Указан усредненный вес, который может отличаться от фактического. Не включен в цену, оплачивается при получении.

Этот товар на Таобао Описание товара
Продавец:畅想之星图书专营店
Рейтинг:
Всего отзывов:0
Положительных:0
Выберите вариацию / цвет
  • Одиночный полный том
Добавить в корзину
Другие товары этого продавца
¥19.5413руб.
¥30.03635руб.
¥46972руб.
¥55.61 175руб.
Регулирование: Одиночный полный том

  Основная информация

Заголовок: Искра машинного обучения
Автор: (Индия) Рэйчел Дипу·Дьюар, (Индия) Манприт·Петь Ge·Гутра, (Южная Африка) Ник·Пентрит
Издательство: Люди после прессы
Дата публикации: 2018-11-01
Версия: 2
ISBN: 9787115497833
Рыночная цена: 99.0
Оглавление
Глава 1. Настройка и работа среды Spark 1
1.1 Локальная установка и настройка Spark 2
1.2 Искровой кластер 3
1.3 Модель программирования Spark 4
1.3.1 Класс SparkContext и класс SparkConf 4
1.3.2 Искровая сессия 5
1.3.3 Искровой корпус 6
1.3.4 Эластичный распределенный набор данных 8
1.3.5 Широковещательные переменные и аккумуляторы 12
1.4 СхемаRDD 13
1.5 Искровой кадр данных 13
1.6 Введение в программирование Spark Scala 14
1.7 Введение в программирование Spark на Java 17
1.8 Введение в программирование на Spark Python 19
1.9 Введение в программирование Spark R 21
1.10 Запуск Spark на Amazon EC2 23
1.11 Настройка и запуск Spark на Amazon Elastic Map уменьшает 28
1.12 Пользовательский интерфейс Spark 31
1.13 Алгоритмы машинного обучения, поддерживаемые Spark 32
1.14 Преимущества Spark ML 36
1.15 Использование Dataproc для создания кластера Spark на Google Compute Engine 38
1.15.1 Hadoop и Spark версии 38
1.15.2 Создание кластера 38
1.15.3 Отправка задач 41
1.16 Резюме 43
Глава 2. Математические основы машинного обучения 44
2.1 Линейная алгебра 45
2.1.1 Настройка среды IntelliJ Scala 45
2.1.2 Настройка среды командной строки Scala 47
2.1.3 Домен 48
2.1.4 Матрица 54
2.1.5 Функции 64
2.2 Градиентный спуск 68
2.3 Априорная вероятность, правдоподобие и апостериорная вероятность 69
2.4 Исчисление 69
2.4.1 Дифференцируемый 69
2.4.2 Баллы 70
2.4.3 Множитель Лагранжа 70
2.5 Визуализация 71
2.6 Резюме 72
Глава 3. Проектирование системы машинного обучения 73
3.1 Что такое машинное обучение 73
3.2 Знакомство с MovieStream 74
3.3 Варианты коммерческого использования систем машинного обучения 75
3.3.1 Персонализация 75
3.3.2 Целевой маркетинг и сегментация клиентов 76
3.3.3 Прогнозное моделирование и анализ 76
3.4 Типы моделей машинного обучения 76
3.5 Компоненты системы машинного обучения, управляемой данными 77
3.5.1 Сбор и хранение данных 77
3.5.2 Очистка и преобразование данных 78
3.5.3 Цикл обучения и тестирования модели 79
3.5.4 Развертывание и интеграция модели 79
3.5.5 Мониторинг модели и обратная связь 80
3.5.6 Выбор пакетного решения или решения в реальном времени 80
3.5.7 Конвейер данных Spark 81
3.6 Архитектура системы машинного обучения 82
3.7 Искра MLlib 83
3.8 Улучшение производительности Spark ML 83
3.9 Сравнение алгоритмов, поддерживаемых MLlib 85
3.9.1 Классификация 85
3.9.2 Кластеризация 85
3.9.3 Возврат 85
3.10 Функции и API разработчика, поддерживаемые MLlib 86
3.11 Видение MLlib 87
3.12 Изменения в версиях MLlib 87
3.13 Резюме 88
Глава 4 Получение, обработка и подготовка данных на Spark 89
4.1 Получение общедоступных наборов данных 90
4.2 Исследование и визуализация данных 92
4.2.1 Исследование пользовательских данных 94
4.2.2 Исследование данных фильма 102
4.2.3 Изучение рейтинговых данных 104
4.3 Обработка и преобразование данных 109
4.4 Извлечение полезных функций из данных 112
4.4.1 Числовые характеристики 112
4.4.2 Характеристики категорий 113
4.4.3 Производные функции 114
4.4.4 Текстовые функции 116
4.4.5 Особенности регуляризации 121
4.4.6 Извлечение признаков с помощью пакетов программного обеспечения 123
4.5 Резюме 126
Глава 5. Механизм сборки Spark 127
5.1 Классификация моделей 128
5.1.1 Контентная фильтрация 128
5.1.2 Совместная фильтрация 128
5.1.3 Матричная факторизация 130
5.2 Извлечение эффективных функций 139
5.3 Модель обучения 140
5.3.1 Использование набора данных MovieLens 100k для обучения модели 141
5.3.2 Использование данных неявной обратной связи для обучения моделей 143
5.4 Использование моделей 143
5.4.1 Модель АЛС 144
5.4.2 Пользователи 145
5.4.3 Пункты 148
5.5 Оценка эффективности модели
Введение
В этой книге собраны тематические исследования, объясняющие применение Spark в машинном обучении, а также рассказывается, как получать данные для систем машинного обучения из различных общедоступных каналов. Содержание охватывает классические алгоритмы машинного обучения и их практические применения, такие как системы, регрессия, кластеризация и уменьшение размерности.Во второе издание добавлены новые главы, посвященные математическим основам машинного обучения и API-интерфейсу Spark ML Pipeline, что делает содержание более систематическим, полным и актуальным.
Чтение в Интернете
СМИ обзор

Apache Spark — это платформа распределенных вычислений, оптимизированная для задач с малой задержкой и хранения данных в памяти.Лишь немногие из существующих платформ параллельных вычислений могут учитывать скорость, масштабируемость, обработку памяти и отказоустойчивость, а также предоставляют гибкие и выразительные API.Apache Spark — такая редкая среда.В этой книге кратко представлены базовые знания Spark с упором на объяснение распространенных моделей машинного обучения с помощью подробных примеров и реальных приложений, а также обработка крупномасштабных текстовых данных, онлайн-методы машинного обучения и оценки моделей в рамках Spark Streaming, а также использование Spark ML Pipeline API для создания и отладки процессов машинного обучения.Второе издание было полностью переработано и содержит новые главы, посвященные математическим основам машинного обучения и API-интерфейсу Spark ML Pipeline. Содержимое является более систематичным, полным и актуальным и подходит для всех разработчиков, которые хотят использовать Spark для реализации распространенных приложений машинного обучения.·Введение в Spark и основы машинного обучения.·Получите общедоступные наборы данных машинного обучения и используйте Spark для загрузки, обработки, очистки и преобразования данных.·Используйте библиотеку машинного обучения Spark для написания программ с использованием общих моделей машинного обучения, таких как совместная фильтрация, классификация, регрессия, кластеризация и уменьшение размерности.·Понимать методы обработки крупномасштабных текстовых данных, включая извлечение признаков и использование текстовых данных в качестве входных данных для моделей машинного обучения.·Изучите методы онлайн-обучения и используйте Spark Streaming для онлайн-обучения и оценки моделей.·Создавайте и отлаживайте конвейеры машинного обучения с помощью API Spark ML Pipeline.