8 (905) 200-03-37 Владивосток
с 09:00 до 19:00
CHN - 1.14 руб. Сайт - 21.13 руб.

Анализ данных Python и обработка больших данных от входа в мастерство

Цена: 1 411руб.    (¥66.75)
Артикул: 607883814041

Вес товара: ~0.7 кг. Указан усредненный вес, который может отличаться от фактического. Не включен в цену, оплачивается при получении.

Этот товар на Таобао Описание товара
Продавец:凤凰新华书店旗舰店
Адрес:Цзянсу
Рейтинг:
Всего отзывов:0
Положительных:0
Добавить в корзину
Другие товары этого продавца
¥12254руб.
¥18.8398руб.
¥26.8567руб.
¥6800141 644руб.


Введение

«Анализ данных Python и обработка больших данных от ввода до владения» в основном объясняют технологию, инфраструктуру, основные концепции и процессы реализации, необходимые для анализа данных и обработки больших данных.От подготовки языка программирования, сбора и очистки данных, анализа данных и визуализации до распределенного хранилища и распределенных вычислений крупных данных, он проходит через процесс разработки всего проекта больших данных.Теория и практика этой книги, цель состоит в том, чтобы позволить читателям начать быстро.1 Статья впервые представляет основную грамматику питона, разработку объектно -ориентированного и модульного дизайна и т. Д., А также освоить метод программирования Python.Затем введите многочисленные многократные процедуры и интерфейс, чтобы читатели имели базовое понимание распределенных программ.D2 представляет такие технологии, как сбор сетевых данных, очистка данных и хранение данных.D3 представляет инструменты анализа данных, обычно используемые Python, которые расширяют больше методов очистки и интерполяции данных, закладывая основу для визуализации*конечных данных.D4 - в центре внимания анализа больших данных.1 Сначала представьте принципы и принципы планирования Hadoop, принцип моделей MapReduce и программирования, построение окружающей среды, а затем представьте принцип структуры Spark, метода построения окружающей среды и того, как взаимодействовать с D Три -простыми инструментами, такими как Hive Технология обработки потока.Через три проекта D5, D5, всесторонне представляет, как анализировать веб -страницы, как создавать распределенные рептилий, как справиться с общими антирептилиями, как проектировать модели данных, как проектировать модели архитектуры, как всесторонне использовать технологии, связанные с Первые четыре в практике на практике сущностьЭта книга подходит для программирования некомпьютеров.“ xiaobai&Rdquo;, также подходит для выпускников, которые только что закончили обучение или собираются закончить работу, а также профессионалов, которые уже имели опыт программирования, но хотят переключиться на основной анализ данных.В то же время его также можно использовать в качестве учебника для большинства профессиональных колледжей и курсов по компьютерной подготовке.
Оглавление


D1 Python Program Design
Глава D1 Python Начало работы 3
1.1 Обзор Python 4
1.2 Строительная среда разработки Python 6
1.3 Инструмент разработки Python Введение 11
1.4 Управление Python Software Pack 13
1.5 Обучение: письмо“Hello World” 15
Резюме этой главы 16
Глава D2 Python Basic 17
2.1 Переменная 18
2.2 Символ идентичности 24
2.3 Организация кода 26
2.4 Вход и вывод 28
2.5 Расчет символ и приоритет 30
2.6 Новичок Q & A 30
2.7 Обучение: разработка простого калькулятора 31
Резюме этой главы 31
Глава D3 Тип данных и управление процессом 32
3.1 цифровой тип 33
3.2 Тип строки 37
3.3 эпизоды 40
3.4 Оператор управления процессом 45
3,5 Новички Q & A 47
3.6 Обучение: алгоритм дизайна, размножение вывода Таблица 49
Резюме этой главы 50
D4 Функция главы, модуль, пакет 51
4.1 Пользовательская функция 52
4.2 Параметры функции 55
4.3 Функциональное программирование 58
4.4 Модуль и упаковка 63
4.5 новичок Q & A 65
4.6 Обучение: алгоритм дизайна, сортируйте список 67
Резюме этой главы 68
D5 объект -ориентированный дизайн программы 69
5.1 Объект -Ориентирован 70
5.2 Пользовательский класс 71
5.3 Свойства 73
5.4 Метод 79
5.5 Классовое наследство 83
5.6 Callable Object 86
5.7 Unkened Object 87
5.8 новичок Q & A 88
5.9 Обучение: алгоритм дизайна, построение бинарного дерева 90
Резюме этой главы 92
D6 Глава GJ Тема 93
6.1 Генератор 94
6.2 Итератор 96
6.3 Асинхронное лечение 97
6.4 Ошибка, отладка 103
6.5 новичок Q & A 108
6.6.
Сомотинг этой главы 110
Сбор данных D2 и очистка данных
ГЛАВА D7 СБОР СЕВЕТИХ ДАННЫХ 113
7.1 Обзор запроса http 114
7.2 Анализ веб -страницы XPath 114
7.3 Сбор данных скрещивания 119
7.4 Scrapy реагирует на антирептильные процедуры 126
7.5 Clawrspider Class 131
7.6 Распределенный гусеницы 132
7.7 новичок Q & A 136
7.8 Обучение: строительство Baidu Cloud Music Caple 136
Резюме этой главы 139
D8 Data Clean 140
8.1 Очистка данных Значение 141
8.2 Содержание очистки данных 141
8.3 Формат данных и тип хранения 142
8.4 Шаг очистки данных 145
8.5 Инструмент очистки данных 147
8.6 Новичок Q & A 151
8.7 ОБУЧЕНИЕ: Очистите данные облачной музыки Baidu и храните их в CSV 151
Резюме этой главы 152
D3 Анализ данных и визуализация
Глава D9 Numpy Numeral Расчет 155
9.1 Numpy Basic 156
9.2 Операция формы 164
9.3 Копия, мелкая копия и глубокая копия 166
9,4 GJ Index 168
9.5 Статистика сортировки 171
9,6 Новички Q & A 173
9.7 Обучение: статистика продаж 174
Эта глава резюме 175
D10 Matplotlib Визуализация 176
10.1 Основные элементы графика 177
10.2. Основная база 177
10.3 Стиль Стиль 186
10.4 Графический образец 189
10.5 новичок Q & A 198
10.6 Обучение: визуализация бизнес -данных 199
Резюме этой главы 201
Глава D11 Пандас Статистический анализ 202
11.1 Структура данных Pandas 203
11.2 Основная функция 210
11.3 Статистический анализ 217
11.4 Data 229
11.5 Организация данных 231
11,6 Функция GJ 234
11.7 Читать и написать базу данных MySQL 236
11,8 Новички Q & A 237
11,9 Обучение: анализ оценки 237
Эта глава - саммит 239
Глава D12 Seaborn Visualization 240
12.1 Обзор Seaborn 241
12.2 Отношения визуальных данных 242
12.3 Рисунок в соответствии с классификацией данных 246
12.4 Одно переменная и двойная переменная 251
12.5 Линейная связь 256
12,6 Новички Q & A 258
12.7 Обучение: анализ результатов может быть визуализирован 258
Эта глава - саммит 260
D4 Статьи о хранении больших данных и быстрого анализа
Глава D13 Hadoop Storage и базовая операция 263
13.1 Hadoop Обзор 264
13.2 Принцип хранения данных Hadoop и принцип планирования задач 268
13.3 Hadoop Basic Envustic
13.4 Режим развертывания Hadoop 294
13.5 Hadoop Обычно используемая операция команда 298
13,6 Новички Q & A 300
13.7 Обучение: Создание среды Hadoop Cluster 301
Резюме этой главы 309
Глава D14 Spark Начало работы 310
14.1 Обзор Spark 311
14.2 Принципы Spark Core 312
14.3 Spark Basic Envustrent Construction 315
14.4 РЕЖИМ РАБОТА 317 Spark 317
14,5 Новички Q & A 321
14.6 Обучение: строительство Spark Cluster 322
Эта глава - саммит 323
Глава D15 Spark RDD Программирование 324
15.1 Принцип дизайна RDD 325
15.2 Программирование RDD 328
15.3 Значение ключа для RDD 335
15.4 Читать и записать файл 340
15.5 Программирование Advanced 342
15,6 Новички Q & A 347
15.7 Обучение: статистические продажи морепродуктов 348
Эта глава - саммит 350
Глава D16 Spark SQL Программирование 351
16.1 Spark SQL Обзор 352
16.2 Создание объекта DataFrame 360
16.3 DataFrame Common API 364
16.4 Сохранить DataFrame 370
16,5 Новички Q & A 372
16.6 Обучение: статистика продажи мобильных телефонов 373
Эта глава резюме 375
Глава D17 Spark Streaming Computing Programming 376
17.1 Введение в расчет потока 377
17.2 Дискретизировать поток 379
17.3 Структурированная потоковая передача 385
17,4 Новички Q & A 397
17.5 Обучение: реальная статистическая сумма кредита 397
Эта глава резюме 398
D5 Project Project Faction Combat Gate
Глава D18 Анализ E -Commerce WZ Data 401
18.1 Целевой анализ 402
18.2 Сбор данных 405
18.3 Анализ данных 411
Эта глава резюме 416
Глава D19 Анализ Travel WZ Data 417
19.1 Целевой анализ 418
19.2 Сбор данных 420
19.3 Анализ данных 425
Резюме этой главы 429
Анализ главы D20 в продажах второго жилья 430
20.1 Целевой анализ 431
20.2 Сбор данных 434
20.3 Анализ данных 440
Эта глава резюме 446
Приложение: Python Common Test Вопросы выбраны 447
Основные ссылки 450

Отображать всю информацию


Рекомендуемая рекомендация

(1) Комплексный: все технологии, необходимые для анализа данных и обработки больших данных, включая основную теорию, основные концепции, процессы реализации, от подготовки языка программирования, сбора данных и очистки, анализа данных и визуализации, до распределенного хранения и визуализации крупного Данные о распределенном хранении больших данных для распределенного хранения и визуализации крупных распределенных данных и т. Д.
(2) В -Depth: одна книга говорит 1 язык программирования и 14 данных анализа данных и больших инструментов обработки, а также технологии анализа больших данных и методы разработки проектов.
(3) Богатый: включать 45“” 17 главы&Ldquo; обучение&Rdquo; 3 Проекты Комплексный фактический бой, 50 вопросов интервью Python.

 
Чтение в Интернете

Основателем Python является Гвидо Ван Россум.В 1991 году родился компилятор Python, разработанный на языке C.В 1996 году Python выпустил публичную версию 1.4.Из -за его простых, легких -к использованию и характеристикам трансплантации Python быстро развивался.При написании этой книги основной версией ** уже является версия 3.7.Процесс выпуска версии Python выглядит следующим образом.С 1996 по 2000 год выпущенная версия Python была 1,4-1,6.С 2000 по 2008 год выпущенная версия Python составляет 2,0-2,7.С 2008 по 2018 год выпущенная версия Python была 3,0-3,7.Обратите внимание, что после 2008 года Python начал поддерживать две версии 2.x и 3.x одновременно.Это связано с тем, что многие системы не могут быть обновлены до версии 3.0 обычно во время D, поэтому он был позже разработан версии 2.7 в качестве перехода.Python имеет основные типы данных, такие как класс, функция, аномальная обработка, таблица, словарь и другие основные типы данных от рождения.“”В процессе разработки Python разработчики непрерывно соединяют функции высокого порядка, такие как Lambda, Map, F ilter и уменьшение.В то же время, функции GJ, такие как мусорные перерывы, вводятся, чтобы упростить процессы управления программистами для памяти.В версии перед D у Python есть следующие важные языковые характеристики.(1) Существует несколько основных типов данных на выбор: числа (точка с плавающей точкой, множественное число и бесконечная длина), строка (ASCII и Unicode), списки и словари.(2) Поддержка объекта -ориентированного программирования классов использования и множественного наследования.(3) Код может быть разделен на модули и пакеты.(4) Поддержка и захват аномалий, тем самым достигая более четкой обработки ошибок.(5) Тип данных - это сильный тип и динамический тип.Смешанные типы (такие как попытка добавить строки и числа) могут вызвать аномалии, которые могут быстрее захватывать ошибки.(6) Содержит функции программирования GJ, такие как генератор и вывод списка.(7) Его автоматическая функция управления памятью позволяет пользователям не выделять и выпускать память вручную и выпускать память.