8 (905) 200-03-37 Владивосток
с 09:00 до 19:00
CHN - 1.14 руб. Сайт - 17.98 руб.

Анализ данных Python и применение Numpy Numeric Computing Basic Учебные учебники Matplotlib Данные Основа

Цена: 896руб.    (¥49.8)
Артикул: 608091155332

Вес товара: ~0.7 кг. Указан усредненный вес, который может отличаться от фактического. Не включен в цену, оплачивается при получении.

Этот товар на Таобао Описание товара
Продавец:阅轩图书专营店
Адрес:Цзянсу
Рейтинг:
Всего отзывов:0
Положительных:0
Добавить в корзину
Другие товары этого продавца
¥1412 536руб.
¥ 98 54.4979руб.
¥54.8986руб.
¥69.91 257руб.


Введение

Эта книга руководствуется задачей, всесторонне вводит процесс анализа данных и применение библиотеки анализа данных Python и подробно объясняет метод использования Python для решения фактических задач предприятия.В книге есть 9 глав:* 1 Глава представляет базовые знания основных понятий анализа данных;* 2 ~ 6 представляет широко используемую библиотеку и ее применение анализа данных Python, охватывающего численное расчет Numpy, визуализацию данных Matplotlib, панды Статистический анализ, использование, использование Pandas проводит предварительную обработку данных и использует Scikit-Learn для создания модели для более подробного объяснения метода анализа данных Python; Данные предприятия.За исключением* 1 главы, главы этой книги включают в себя упражнения по обучению и класс.Эта книга может использоваться в качестве учебника для специалистов по технологиям больших данных в колледжах и университетах, или ее также можно использовать в качестве книги «Самостоятельно» для энтузиастов технологий больших данных.

Глава 1 Анализ данных Python 1 Миссия 1.1 Анализ когнитивных данных 1 1.1.1. Понимание анализа данных Обычно используемые инструменты 6 * 1 Глава Python Анализ данных Обзор 1

Миссия 1.1 Анализ когнитивных данных 1

1.1.1 Осветите концепцию анализа данных 2

1.1.2 Освоить процесс анализа данных 2

1.1.3 Понимание анализа данных сцена приложения 4

Инструменты Mission 1.2, знакомые с анализом данных Python 5

1.2.1 Понимание анализа данных Обычно используемые инструменты 6

1.2.2 Понимание преимуществ анализа данных Python 7

1.2.3 Понимание анализа данных Python Common Library 7

Миссия 1.3 Распределительная версия Anaconda Python 9

1.3.1 Изучите Anaconda выпуск Python версии 9 версии 9

1.3.2 Установите Anaconda 9 в системе Windows

1.3.3 Установите Anaconda 12 в системе Linux

Задача 1.4 Осветите общую функцию Notebook Jupyter 14

1.4.1 Основные особенности ноутбука Jupyter 14

1.4.2 Осветите функцию высокого уровня в ноутбуке Jupyter 16

Резюме 19

После -школы 19

* 2 главы Numpy Численные Основы расчета 21

Задача 2.1 Master Numpy Array объект Ndarray 21

2.1.1 Создание объекта массива 21

2.1.2 Сгенерировать случайное число 27

2.1.3 Доступ с индексированным массивом 29

2.1.4 Измените форму массива 31

Задача 2.2 Master Numpy Matrix и Universal Function 34

2.2.1 Создать Numpy Matrix 34

2.2.2 Осветите функцию UFUNC 37

Задача 2.3 Используйте Numpy для статистического анализа 41

2.3.1 Чтение/написание файла 41

2.3.2 Используйте функции для выполнения простого статистического анализа 44

2.3.3 Реализация задачи 48

Резюме 50

Обучение 50

Обучение 1 Создайте массив и выполните вычисления 50

Обучение 2 Создать шахматную доску 50

После -Упражнения 51

Глава 3 Матплотлиб Основная основа 52

Миссия 3.1 освоить основную грамматику и общие параметры рисования 52

3.1.1 Master Pyplot Basic Grammar 53

3.1.2 Установите динамический параметр RC Pyplot 56

Миссия 3.2 Отношения между анализом 59

3.2.1 Нарисуйте разбросанную точку Рисунок 59

3.2.2 Нарисуйте линию складывания Рисунок 62

3.2.3 Реализация задачи 65

Задача 3.3 Характеристики анализа Внутреннее распределение и децентрализация данных 68

3.3.1 Нарисуйте гистограмму 68

3.3.2 Нарисуйте графику торта 70

3.3.3 Нарисуйте диаграмму линии коробки 71

3.3.4 Реализация задачи 73

Резюме 77

Обучение 78

Обучение 1 Анализ 1996 года ~ 2015 г. Популяционные данные включают 78

Обучение 2 Анализ характеристик характеристик каждой характеристики данных о популяции с 1996 по 2015 год 78

После -упражнения 79

Глава 4 Статистический анализ Панды 80

Миссия 4.1 Чтение/запись данных различных источников данных 80

4.1.1 Чтение/запись данных базы данных 80

4.1.2 Читать/записать текстовый файл 83

4.1.3 Читать/записать файл Excel 87

4.1.4 Реализация задачи 88

Миссия 4.2 Освоение общей работы DataFrame 89

4.2.1 Просмотреть общие атрибуты DataFrame 89

4.2.2 DataFrame Data 91

4.2.3.

4.2.4 Реализация задачи 104

Миссия 4.3 Преобразование и обработка данных временных рядов 107

4.3.1 Конвертированное время строки является стандартным временем 107

4.3.2 Извлечение информации о последовательности времени 109

4.3.3 Добавить или вычесть данные времени 110

4.3.4 Реализация задачи 111

Задача 4.4 Используйте агрегацию пакетов для расчета в группе 113

4.4.1 Используйте метод Groupby для разделения данных 114

4.4.2 Используйте метод AGG для агрегирования данных 116

4.4.3 Используйте метод применения для агрегирования данных 119

4.4.4 Используйте метод преобразования для агрегирования данных 121

4.4.5 Реализация задачи 121

Миссия 4.5 Создание перспективной таблицы и перекрестной таблицы 123

4.5.1 Используйте функцию pivot_table для создания перспективной таблицы 123

4.5.2 Используйте функцию CrosShab для создания перекрестной таблицы 127

4.5.3 Реализация задачи 128

Резюме 130

Обучение 130

Обучение 1 Прочитайте и просмотрите основную информацию основной таблицы данных сетевого кредита P2P 130

Обучение 2 ТАБЛИЦА ИНФОРМАЦИИ ИНФОРМАЦИИ ИНФОРМАЦИЯ И ИНФОРМАЦИЯ ВЕЛИКА ТАБЛИЦА ИНФОРМАЦИЯ Таблица 130

Обучение 3 Используйте метод агрегации пакетов для дальнейшего анализа таблицы обновления информации пользователя и информации о входе в систему Таблица 131

Обучение 4 Преобразование длинных и ширины для таблицы обновления информации и информации о входе в систему Таблица 131

После -класс упражнения 131

Глава 5 Используйте панды для предварительной обработки данных 133

Задача 5.1 слияние данных 133

5.1.1 Данные слияния стека 133

5.1.2 Первичный ключ комбинированный

5.1.3 Перекрытие и слияние данных 139

5.1.4 Реализация задачи 140

Задача 5.2 Данные очистки 141

5.2.1 Обнаружение и обработка повторения 141

5.2.2 Обнаружение и обработка пропущенных значений 146

5.2.3 Обнаружение и обработка аномального значения 149

5.2.4 Реализация задачи 152

Задача 5.3 Стандартизированные данные 154

5.3.1 Данные стандартизации отъезда 154

5.3.2 Данные стандартизации стандартизации 155

5.3.3 Стандартизированные данные десятичного фиксированного стандарта 156

5.3.4 Реализация задачи 157

Миссия 5.4 Данные о конверсии 158

5.4.1 Данные категории обработки тупых переменных 158

5.4.2 Дискретные непрерывные данные 160

5.4.3 Реализация задачи 162

Резюме 163

Практика 164

Обучение 1 Вставьте пользовательские данные об электроэнергетике. Отсутствие потерянной стоимости 164

Обучение 2 Потеря линии слияния, тенденция использования электроэнергии и данные тревоги 164.

Обучение 3 Стандартизированное моделирование.

После -класс упражнения 165

Глава 6 Используйте Scikit-Learn, чтобы построить модель 167

Миссия 6.1 Используйте конвертер Sklearn для обработки данных 167

6.1.1 Набор данных в наборах данных модуль 167

6.1.2 Разделите набор данных на учебный набор и набор тестов 170

6.1.3 Используйте конвертер Sklearn для предварительной обработки данных и уменьшения размеров 172

6.1.4 Реализация задачи 174

Миссия 6.2 Строительство и оценка кластерной модели 176

6.2.1 Используйте оценку Sklearn для создания кластерной модели 176

6.2.2 Модель кластера оценки 179

6.2.3 Реализация задачи 182

Миссия 6.3 Строительство и оценка классификационной модели 183

6.3.1 Используйте оценку Sklearn для создания классификационной модели 183

6.3.2 Модель классификации оценки 186

6.3.3 Реализация задачи 188

Задача 6.4 Строительство и оценить модель регрессии 190

6.4.1 Используйте оценку Sklearn для создания модели линейной регрессии 190

6.4.2 Оценка возврата модели 193

6.4.3 Реализация миссии 194

Резюме 196

Практика 196

Обучение 1 Используйте Sklearn для обработки набора данных Wine and Wine_quality 196

Обучение 2 Строительство модели кластера K-Means на основе набора данных вина 196

Обучение 3 Строительная модель классификации SVM на основе набора данных Wine Data 197

Обучение 4 Создайте регрессионную модель на основе набора данных Wine_quality 197

После -класс упражнение 198

Глава 7 Анализ ценности клиентов авиакомпаний 199

Задача 7.1 Понимает текущий статус и анализ ценных значений клиентов авиакомпаний 199

7.1.1 Изучите текущую ситуацию авиакомпании 200

7.1.2 Понимание анализа ценности клиента 201 201

7.1.3 Шаги и процессы, знакомые с анализом значений авиационной стоимости клиента 201

Задача 7.2 Предварительная обработка данных клиента авиации 202

7.2.

7.2.2.

7.2.3 5 Особенности стандартизированной модели LRFMC 206

7.2.4 Реализация задачи 207

Задача 7.3 Используйте алгоритм K-средних для группы клиентов 209 209

7.3.1 Изучить алгоритм кластера K-средних 209

7.3.2 Анализ результатов кластера 210

7.3.3 Приложение 213 модели 213

7.3.4 Реализация задачи 214

Резюме 215

Обучение 215

Обучение 1 Обработка данных кредитных карт ненормальное значение 215

Обучение 2 Строительная кредитная карта Кредитная оценка клиентов Оценка Оценки 217

Обучение 3 Construct K-Means Cluster Model 218

После -класс упражнения 218

Глава 8 Анализ финансовых доходов 220

Задача 8.1 Фон и метод прогноза фискального дохода 220

8.1.1 Анализ прогноза фискальных доходов 220

8.1.2 Как понять прогноз фискального дохода 222

8.1.3 Шаги и процессы знакомства с прогнозом финансового дохода 223

Задача 8.2 Анализ корреляции характеристик данных финансового дохода 223

8.2.1 Понимание корреляционного анализа 223

8.2.2 Результат расчета анализа 224

8.2.3 Реализация задачи 225

Задача 8.3 Ключевые функции Lasso return для выбора прогноза фискальных доходов 225

8.3.1 Учите Lasso return 226

8.3.2 АНАЛИЗ ЛАССО Результат возврата 227

8.3.3 Реализация задачи 227

Задача 8.4 Используйте серый прогноз и SVR для создания прогноза фискальных доходов 228

8.4.1 Ученится алгоритм прогноза серого 228

8.4.2 Понимание алгоритма SVR 229

8.4.3 Результаты анализа и прогнозирования 232

8.4.4 Реализация задачи 234

Резюме 236

Обучение 236

Обучение 1 Найдите коэффициент корреляции между характеристиками корпоративного подоходного налога 236

Обучение 2 Выберите ключевую особенность прогноза корпоративного подоходного налога 237

Обучение 3 Строительство прогноза корпоративного подоходного налога Модель 237

После -класс упражнения 237

Глава 9 Анализ поведения пользователей водонагревателя домохозяйства и распознавание событий 239

Задача 9.1 Изучите фон и шаги анализа поведения пользователя домашнего водонагревателя 239

9.1.1 Проанализируйте текущее состояние индустрии водонагревателя 240

9.1.2 Понимание основной ситуации данных сбора данных водонагревателя 240

9.1.3 Знакомые шаги и процессы анализа поведения пользователя домашнего водонагревателя 241

Миссия 9.2 Предварительная обработка водонагревателя Пользовательские данные о воде 242

9.2.1 Удалить избыточные функции 242

9.2.2 Divident of Water Event 243

9.2.3 Определите длинный порог одного водного события 244

9.2.4 Реализация задачи 246

Задача 9.3 Создание характеристик использования воды и скрининга инцидента использования воды 247

9.3.1 Строительство длины и частоты воды 248

9.3.2.

9.3.3 Скрининг -кандидат в купальный инцидент 250

9.3.4 Реализация задачи 251

Задача 9.4 Анализ поведенческих событий BP BP Модель 255

9.4.1. Принцип Алгоритма Алгоритма нейронной сети BP 255

9.4.2 Строительная модель 259

9.4.3 Модель оценки 260

9.4.4 Реализация задачи 260

Резюме 263

Обучение 263

Обучение 1 Данные клиента оператора стирки 263

Обучение 2 фильтровать данные оператора клиента 264

Обучение 3 Создание модели прогнозирования нейронной сети 265

После -класс упражнения 265

Приложение A 267

Приложение B 270

Список литературы 295 Отображение всей информации
Рекомендуемая рекомендация

Zhang Liangjun, эксперт по глубоким данным, руководил командой лучших книг. и инженерия Университета Южно -Китайского технологического университета, рекомендуется.Эта книга принимает режим обучения, ориентированного на задачу.Большинство глав в книге тщательно расширяются по потребностям задач и не накапливают знания, сосредотачиваясь на вдохновении и реализации плана при решении проблем.Приходя от требований к задачам к опыту достижения этого полного рабочего процесса, он помогает читателям по -настоящему понять и переваривать анализ и применение данных Python.Случаи в книге все происходят из реальных проектов предприятия, которые могут работать, направлять читателей для интеграции и предоставлять соответствующие учебные ресурсы, такие как исходный код, чтобы помочь читателям быстро освоить навыки, связанные с большими данными.