8 (905) 200-03-37 Владивосток
с 09:00 до 19:00
CHN - 1.14 руб. Сайт - 17.98 руб.

OpenACC High -исполнительное параллельное программирование концепция и стратегия [US] Sida & Middot;

Цена: 1 421руб.    (¥79)
Артикул: 594818562444

Вес товара: ~0.7 кг. Указан усредненный вес, который может отличаться от фактического. Не включен в цену, оплачивается при получении.

Этот товар на Таобао Описание товара
Продавец:大亨图书专营店
Адрес:Синьцзян
Рейтинг:
Всего отзывов:0
Положительных:0
Добавить в корзину
Другие товары этого продавца
¥ 38 19342руб.
¥ 260 19342руб.
¥ 100 9.9179руб.
¥ 38 19342руб.

O1cn011psiofbnuiymlu _ !! 1721181839.jpg (790 × 50)

Название: OpenACC High -Propectiance Parallel Concept и стратегия

Номер ISBN: 9787111623236

Название издательского дома: издательство машинной индустрии

Цена: 79,00 Юань

O1cn011psioou4o8rsnv4 _ !! 1721181839.jpg (790 × 50)

Хвалить
Рекомендация
Переводчик
Предисловие
Спасибо
Введение в участника
Введение в переводчик
Глава 1 OpenACC Обзор 1
1.1 OpenAcc Syntax 2
1.1.1 Введение 3
1.1.2 Zi Language 3
1.1.3 API -рутина и переменная среды 4
1.2 Расчет компонента 4
1.2.1 Ядра 5
1.2.2 Параллель 6
1.2.3 Петля 7
1.2.4 Рутина 7
1.3 среда данных 9
1.3.1 Введение данных 9
1.3.2 Данные Zi Language 10
1.3.3 Введение в кеш 11
1.3.4 Часть передачи данных 11
1.4 Резюме 12
1.5 Практика 12
Глава 2 Циркулярное вставка 14
2.1 Сравнение цикла ядра и параллельной петли 15
2.2 Три уровня параллелизма 18
2.2.1 Банда, работник и вектор Zi Yu 18
2.2.2 Сопоставьте параллельность с оборудованием 19
2.3 Другие компоненты петли 20
2.3.1 Складывание петли 20 20
2.3.2 Независимый ZI Language 21
2.3.3 SEQ и AUTO ZIYU 22
2.3.4 Уменьшение ZI Language 23
2.4 Резюме 25
2.5 Упражнение 26
Глава 3 Инструмент программирования OpenACC 27
3,1 Гм Особенности архитектуры 27
3.2 Compile OpenACC Code 28
3.3 Анализ производительности приложений OpenACC 30
3.3.1 Уровень анализа эффективности и термин 30
3.3.2 Собственность данных 31
3.3.3 Записи данных о производительности и отображение 32
3.3.4 Интерфейс анализа производительности OpenACC 32
3.3.5 Инструменты производительности поддерживают OpenACC 33
3.3.6 Инструмент анализа производительности NVIDIA 34
3.3.7 Инфраструктура инструмента Scord-P для гибридных приложений 35
3.3.8 Tau Performance System 40
3.4 ошибка 42 в программе OpenACC
3.5 Резюме 44
3.6 Упражнение 45
Глава 4 Используйте OpenACC, чтобы написать первую программу 48
4.1 Тематическое исследование 48
4.1.1 Серийный код 49
4.1.2 Код компиляции 55
4.2 Создайте нативную параллельную версию 56
4.2.1 Найти горячую точку 56
4.2.2 Безопасно ли использовать ядра 56?
4.2.3 Реализация OpenACC 56
4.3 Производительность программы OpenACC 59
4.4 Оптимизированная параллельная версия 60
4.4.1 Уменьшите данные 61
4.4.2 Особенно умные небольшие изменения 62
4.4.3 Окончательный результат 63
4.5 Резюме 65
4.6 Упражнение 66
Глава 5 Compile OpenACC 67
5.1 Параллельная вызов 68
5.1.1 Параллельное оборудование 68
5.1.2 Цикл карты 69
5.1.3 Структура уровня памяти 71
5.1.4 Вернитесь примерно 72
5.1.5 OpenACC 72 справиться с параллелизмом
5.2 Компилятор реконструкции 73
5.2.1 Что может сделать компилятор 74
5.2.2 Что я могу сделать, если компилятор не может сделать 75
5.3 Compile OpenACC 76
5.3.1 Подготовка кода 77
5.3.2 График 77
5.3.3 Серийный код 78
5.3.4 Ошибка пользователя 79
5.4 Сводка 80
5.5 Упражнение 81
Глава 6 Лучшая практика программирования 83
6.1 Общий стандарт 84
6.1.1 Максимизируйте расчет оборудования 84
6.1.2 Оптимизировать местонахождение данных 85
6.2 Максимизировать расчет оборудования 86
6.2.1 Атомная операция 86
6.2.2 Компоненты ядра и параллельные компоненты 87
6.2.3 Настройка времени выполнения и если Ziyu 88
6.3 Оптимизированная местность данных 89
6.3.1 Минимальная передача данных 89
6.3.2 Повторное использование данных и настоящее ZI Language 90
6.3.3 Не -структурный жизненный цикл данных 91
6.3.4 Укажите форму массива 92
6.4 Типичный пример 92
6.4.1 Фоновые знания: тепловой отчет 92
6.4.2 Реализация версии CPU базовой линии 93
6.4.3 Анализ производительности 93
6.4.4 Используйте OpenACC для ускорения 94
6.4.5 Оптимизированная местность данных 96
6.4.6 Исследование эффективности 97
6.5 Резюме 98
6.6 Упражнение 98
Глава 7 OpenACC и трансплантация производительности 99
7.1 Задача 99
7.2 Целевая архитектура 100
7.2.1 Компиляция конкретных платформ 101
7.2.2 x86_64 Multi -core и Nvidia 101
7.3 Трансплантация производительности OpenACC 101
7.3.1 Модель 102 памяти OpenACC
7.3.2 Архитектура памяти 102
7.3.3 Генерация кода 102
7.3.4.
7.4 Реконструкция кода для достижения транспозиции 103
7.4.1 HACCMK 103
7.4.2. Столкнувшись с разнообразием архитектуры 105
7.3 Применение OpenACC на NVIDIA K20X GPU 106
7.4.4 Применить к приложению 107 AMD Bulldozer.
7.5 Резюме 108
7.6 Упражнение 109
Глава 8 Другие методы параллельного программирования 111
8.1 Модель программирования 111
8.1.1 OpenACC 113
8.1.2 OpenMP 113
8.1.3 CUDA 114
8.1.4 OpenCl 114
8.1,5 C ++ Amp 115
8.1.6 Kokkos 115
8.1.7 Раджа 116
8.1.8 Модуль строительства потока 116
8.1,9 C ++ 17 116
8.1.10 Fortran 2008 117
8.2 Компонент модели программирования 117
8.2.1 Параллельный цикл 118
8.2.2 Параллельное возвращение к 119
8.2.3 Тяжелая вложенная петля 121
8.2.4 Слоистый параллельный (не -гнездовой цикл) 122
8.2.5 Задача параллель 124
8.2.6 Распределение данных 125
8.2.7 Передача данных 126
8.3 тематическое исследование 127
8.3.1 Серийная реализация 128
8.3.2 Реализация OpenACC 129
8.3.3 Реализация OpenMP 130
8.3.4 Реализация CUDA 131
8.3.5 Реализация Kokkos 134
8.3.6 Реализация TBB 136
8.3.7 Некоторые номера производительности 138
8.4 Резюме 140
8.5 Упражнение 140
Глава 9 OpenACC и совместимость 142
9.1 Вызов кода нативного устройства в OpenACC 142
9.1.1 Пример: используйте DFT для фильтра изображения 143
9.1.2 host_data Введение и use_device Ziyu 145
9.1.3 Связанные храмы API 147
9.2 Call OpenACC 149 в коде собственного устройства
9.3 OpenACC Intectiancemosical High Topic 149
9.3.1 ACC_MAP_DATA 149
9.3.2 Cap Device Device 151 в ядре OpenAcc 151
9.4 Резюме 152
9,5 Упражнение 152
Глава 10 OpenACC Advanced Pellacts 153
10.1 Асинхронная операция 153
10.1.1 OpenAcc Asynchronous Programming 155
10.1.2 Программное программное обеспечение Линия воды 160
10.2 Multi -Equipment Programming 168
10.2.1 Multi -Equipment Assembly Line 169
10.2.2 OpenACC и MPI 172
10.3 Резюме 176
10.4 Упражнение 176
Глава 11 Использование Содержимое инновационных исследований OpenACC, часть 1 177
11.1 Shenwei Openacc 177
11.1.1 SW26010 Ядерный процессор 178
11.1.2 Модель памяти в свете Shenwei Taihu 178
11.1.3 Модель исполнения 180
11.1.4 Управление данными 181
11.1.5 Резюме 183
11.2 Преобразование вложенных компиляторов петли для акселераторов 184
11.2.1 Openuh Compiler Infrastructure 185
11.2.2 Конверсия расписания циркуляции 187
11.2.3 Оценка эффективности циркулирующего планирования 190
11.2.4 Другие темы исследования Openuh 193
Глава 12 Используйте проблемы с инновационными исследованиями OpenACC, часть 2 194
12.1. Структура расчета реконструкции с высоким уровнем реконструкции на основе введения 194
12.1.1 Введение 195
12.1.2 OpenAcc на FPGA Базовый перевод 196
12.1.3 Расширение и оптимизация OpenACC для программирования FPGA с высокой эффективностью 198
12.1.4 Оценка 203
12.1.5 Резюме 207
12.2 Используйте xcalableacc программирования кластера 207.
12.2.1 xcablemp Введение 208
12.2.2 xcalableacc: когда xcalablemp встречался OpenAcc 211
12.2.3 Реализация Omni Compiler 213
12.2.4 Оценка эффективности на HA-PACS 215
12.2.5 Резюме 220

O1cn011psionef7mtexrm _ !! 1721181839.jpg (790 × 50)

Эта книга является одной из всеобъемлющих практических книг крупной параллельной программы OpenAcc.Первая глава книги представляет концепцию OpenACC и инструменты разработки OpenACC; 10 охватывают темы высокого уровня, такие как альтернативы OpenAcc, базовое взаимодействие оборудования, многооборотное программирование и параллелизм задач;