Руководство по обработке обработки в реальном времени Руководство по обработке голоса Интернет Интерактивная обработка голоса
Вес товара: ~0.7 кг. Указан усредненный вес, который может отличаться от фактического. Не включен в цену, оплачивается при получении.
- Информация о товаре
- Фотографии
Руководство по обработке реальной обработки голоса
Ценообразование99.00
ИздательЭлектронная промышленная пресса
Версия1
Опубликованная датаАпрель 2020 года
формат16
авторGE Shi et al.
УкраситьПлоский пластик
Количество страниц352
Число слов560000
Кодирование ISBN9787121387593
Эта книга в основном представляет интерактивный процесс обработки голоса реального времени, основанный на интернет -сцене. В контенте участвуют интеллектуальные голосовые помощники, интеллектуальные динамики, аудио/видеоконференции и т. Д., Включая обработку голосового сигнала реального времени, цифровые звуковые эффекты, трансмиссия сети, передача сети, передачи сети. Редактирование/декодирование и распознавание голоса.При объяснении содержания каждой части эта книга начинается с основных концепций и принципов, объединяет теорию и практику, а также тщательно анализирует пример коммерческой ценности J, чтобы помочь читателям понять, как связаны алгоритмы в инженерии.Кроме того, для того, чтобы облегчить читателям интереса быстро проверять алгоритмы, улучшить и применять их к фактическим проектам, автор также открывает исходный код алгоритма в книге.
Введение .1
Глава D1 Обработка сигнала.7
1.1 Цифровая и частота моделирования .7
1.2 Дискретное преобразование Фурье·8
1.2.1 Реальное число DFT·.9
1.2.2 Множество DFT·.10
1.2.3 отрицательная частотная компонент. 10
1.2.4 Nature Transformation Nature·.10
1.3 FFT·.11
1.3.1 Результаты FFT, например .12
1.3.2 Реальный сигнал FFT.13
1.3.3 Краткое преобразование Фурье .14
1.3.4 Выбор функции голосового окна STFT .14
1.4 Метод перекрывающегося добавления и метод перекрывающегося удержания·.16
1.4.1 OLA.17
1.4.2 OLS .19
1,5 Взвешенное перекрытие и дополнительный метод .21
1.5.1 Процесс расчета WOLA·.22
1.5.2 Выбор функции WOLA·.22
1.6 Группа фильтров·.23
1.7 Голос до -ор. 27
1.8 Гаусс распределение·.27
1.8.1 Shan Gaos распределен .27
1.8.2 Dorvegos распределен .29
1,9 чмм модель .31
1.10 Карман Фильтр·.32
краткое содержание главы·.33
Рекомендации·.33
D2 Механизм произношения и устройство·.34
2.1 Генерация голоса и получение .34
2.1.1 Механизм генерации голоса .34
2.1.2 Говорящая модель.36
2.1.3 Блок произношения .36
2.1.4 Классификация произношения .37
2.1.5 Получение звука .37
2.1.6.
2.2 Спикер·.38
2.2.1 Электрическая производительность .38
2.2.2 Acoustics Performance .39
2.2.3 Нижний шум .40
2.2.4 Характеристики частотной характеристики .41
2.2.5 THD+N POUT·.41
2.2.6 напряжение (мощность) и искажение .42
2.3 Микрофон·.42
2.3.1 Индикатор производительности микрофона .42
2.3.2 Выбор микрофона .43
2.4 Структивный дизайн 45
2.4.1.
2.4.2 Микрофон и динамики.45
2.5 Аудио оборудование·.46
2.5.1 Оборудование для прослушивания .46
2.5.2 Звуковое выражение поля .47
2.5.3 Выступление оборудования .48
2.5.4 Тест звуковой комнаты .48
2.6 Тест на акустику·.49
2.6.1 Объем акустики .50
2.6.2 искажение THD·.50
2.6.3 Частотное кольцо .51
2.6.4 Консистенция массива микрофона .53
2.6.5 Справочный канал AEC·.54
2.6.6.
2.6.7 THD динамика Z·.57
краткое содержание главы·.58
Рекомендации·.58
D3 Глава голоса обнаружение конечной точки.59
3.1 Выбор функций·.59
3.2 Кодекс для суждения·.61
3.2.1 Жилье .61
3.2.2 Метод статистической модели .61
3.2.3 Метод машинного обучения .62
3.3 VAD экземпляр·.63
3.3.1 Gauss Distribution .63
3.3.2 Процесс алгоритма .63
3.3.3 Расчет процесса .68
3.4 Начальные параметры голоса/не -перемещения кадра .75
3.4.1 Расчет параметров модели .75
3.4.2 Гаусс Гибридная модель.76
3.4.3 EM -алгоритм·.76
краткое содержание главы·.78
Рекомендации·.78
D4 Одноканальный снижение шума.79.79
4.1 Метод сокращения спектра·.79
4.1.1 Принципы метода сокращения спектра .79
4.1.2 Реализация метода сокращения спектра .81
4.1.3 Музыкальный контроль шума .83
4.1.4 Метод фильтра .83
4.2 Венне фильтр·.84
4.3 Снижение шумоподобного пространства·.86
4.4. Реализация по снижению шумоподавления с одним каналом Webrtc .87
4.4.1 Принцип алгоритма .87
4.4.2 Инициализация алгоритма.88
4.4.3 Расчет соотношения сигнала к шуму: Computesnr·.90
4.4.4 Расчет вероятности голосового шума .91
4.4.5 Выбранные .94
4.4.6 Расчет платформы .96
4.4.7 Функция обновления оценки шума:
UpdateNoiseEstimate·.97
4.4.8 Устранение шума .98
4.4.9 Синтез сигнала .99
4.4.10 Результат моделирования. 99
4.5 Снижение шума глубокого обучения .101
краткое содержание главы·.104
Рекомендации·.105
ГЛАВА D5 Акустическое эхо -эхо·.106
5.1 Принципы устранения эха·.106
5.2 Адаптивный фильтр·.108
5.2.1 Virgin Filter .108
5.2.2 Алгоритм LMS .109
5.2.3 Алгоритм NLMS .110
5.2.4 Алгоритм PBFDAF .111
5.3 Алгоритм устранения эхоизоля ECHO WEBRTC·.113
5.3.1 Оценка отсроченной. 113
5.3.2 Адаптивный фильтр. 114
5.3.3 Нелинейная обработка (NLP) .117
5.3.4 Интерпретация кода Matlab .118
5.3.5 Эксперимент по моделированию .127
5.4 Алгоритм устранения эхо -эхо·.128
5.4.1 Изменить длинный расчет .129
5.4.2 Двойной фильтр и предварительная обработка .130
5.4.3 Интерпретация кода Matlab .132
5.4.4 Диаграмма активности процесса алгоритма .141
5.4.5 Эксперимент по моделированию. 144
краткое содержание главы·.146
Рекомендации·.146
D6 Источник источника звука .147
6.1 Алгоритм GCC·.147
6.2 Алгоритм SRP-PHAT .149
6.3 Музыкальный алгоритм·.150
6.4 Tops Algorithm·.152
6.5 Алгоритм Фриды .154
6.6.·.155
6.6.1 Статистический метод .155
6.6.2 Метод Кармана .156
6.6.3 Моделирование позиционирования источника звука .158
6.6.4 Метод фильтрации частиц .160
краткое содержание главы·.160
Рекомендации·.161
D7 Технология формирования луча Глава .162
7.1 Микрофон массив·.163
7.1.1 Количество микрофона и расстояние .163
7.1.2 Смешивание воздушного пространства .165
7.1.3 Индекс формирования луча .165
7.1.4 Шумовое поле .166
7.1.5 Звуковое излучение .167
7.2 Метод формирования общего луча .168
7.2.1 Метод формирования задержки и формирования луча .168
7.2.2 Метод формирования фильтра и луча .169
7.2.3 Метод формирования луча постоянной ширины .169
7.2.4 Метод образования дифференциального волнового луча .170
7.2.5 Метод формирования метода луча стороны стороны более широкой стороны. 171
7.2.6 Z Метод образования луча отклика.
7.3 Пример формирования луча WEBRTC·.174
7.3.1 Файл теста компиляции.174
7.3.2 Процесс обработки файлов тестирования .175
7.3.3 Тестовая команда .176
7.3.4 Основные идеи алгоритма .176
7.3.5 Тестируемый исходный код.178
7.3.6 Процесс обработки алгоритма .181
7.3.7 Функция расчета веса .185
7.3.8.
7.4 после фильтрации·.187
7,4,1 млн. ММС -заднего фильтра·.189
7.4.2 Задний фильтр Zelinski .190
7.4.3 Задний фильтр McCowan·.191
7.4.4 Задний фильтр STSA·.192
краткое содержание главы·.193
Рекомендации·.194
D8 Глава слепое разделение .196
8.1 Основные понятия и знание математики .196
8.1.1 ICA Базовая концепция .196
8.1.2 Метод оптимизации градиента и z .197
8.2 Разделение слепого голоса предварительная обработка -pca.199
8.3 Анализ частотной домены D Ингредиенты -fdica.200
8.3.1 Частотная домен ICA.200
8.3.2 Соответствующий метод оценки. 200
8.3.3 Проблема неопределенности .201
8.4 Задняя фильтрация .205
8.4.1 Оценка шума .205
8.4.2 Расчет коэффициента затухания .206
8,5 GSC и совместная оценка ICA·.209
8.5.1 Стекс -степень .209
8.5.2 Классический GSC·.210
8.5.3 Оценка тяжелой вектора динамических прав .210
краткое содержание главы·.212
Рекомендации·.213
Глава D9 Обработка звука .214
9.1 Классификация каналов·.214
9.1.1 одиночная дорога .214
9.1.2 Двойной канал .215
9.1.3 стерео .215
9.1.4 Multi -Channel .215
9.1.5 Панорама .216
9.2 Задняя обработка звука .217
краткое содержание главы·.226
Рекомендации·.226
D10 Голосовой сборник/декодирование.227
10.1 Кодирование LPC·.230
10.2 шелковая компиляция/декодирование .231
10.2.1 Параметры кода .232
10.2.2 Кодер.234
10.2.3 Декодер .239
10.3 Опус Редактировать/Обзор декодирования .239
10.3.1 декодирование опуса·.242
10.3.2 Кодирование Opus·.243
10.3.3 Opus Voice/Music Test·.244
10.4 Оценка качества голоса·.247
10.4.1 Тест Supick. 248
10.4.2 Объективный тест .248
10.4.3 Без оценки качества эталона .249
краткое содержание главы·.249
Рекомендации·.249
Глава D11 передача голосовой сети·.251
11.1 КОНТРОЛЬ БЕЗОПАСНОСТИ·.252
11.1.1 Контроль заторов GOOGLECC .255
11.1.2 PCC контроль перегрузки .260
11.1.3 BBR на основе перегрузки .264
11.2 NetEQ·.266
11.2.1 Принцип Neteq .266
11.2.2 Хит и упаковка .268
11.2.3 Neteq Code Framework .269
11.2.4 Расчет задержки .272
11.2.5 обработка DSP·.274
11.2.6 Изменение изменений неизменно .275
краткое содержание главы·.277
Рекомендации·.277
ГЛАВА D12 Голос просыпается·.278
12.1 Введение технологии профиля. 278
12.2 Извлечение элементов·.279
12.2.1 FBank·.279
12.2.2 MFCC·.283
12.2.3 PCEN·.284
12.3 Структура модели·.284
12.3.1 DNN·.284
12.3.2 CNN·.286
12.3.3 CRNN·.287
12.3.4 DSCNN .288
12.3.5 Zi с CNN.289
12.3.6 Attention·.290
12.4 Расчет Ускорения·.292
12.4.1 Оценка аппаратных ресурсов .292
12.4.2 Направление ускорения .294
краткое содержание главы·.299
Рекомендации·.299
Глава D13 распознавание голоса·.301
13.1 Извлечение голосовой функции·.303
13.1.1 функция MFCC.304
13.1.2 функции PLP .305
13.1.3 Нормализация .306
13.2 Модель акустики·.306
13.2.1 Гибридная модель Гаусса.307
13.2.2 Оценка параметров .307
13.2.3 Скрытая модель Маркоу.308
13.2.4 Метод Baum-Welch .309
13.2.5 Устройство распознавания·.309
13.3 Языковая модель·.310
13.3.1 N-граммовая модель .311
13.3.2 Взвешенная машина с ограниченным состоянием конверсии .312
13.4 Да и D Примеры идентификации·312
13.4.1 Подготовка данных .312
13.4.2 Предварительная обработка данных .313
13.4.3 Словарь и произношение. 314
13.4.4 Модель лингвистики .315
13.4.5. Показано .319
13.4.6 Обучение модели акустики .320
13.4.7 Декодирование и тест .321
13.5 Калди китайское распознавание голоса 321
13.5.1 Подготовка набора данных .321
13.5.2 Обучение акустической модели .322
13.5.3 Установить Portaudio·.322
13.5.4 Онлайн -признание .323
13.6 Deepspeeche распознавание голоса .324
13.6.1 Идентификационное моделирование .325
13.6.2 Сетевой состав .325
13.6.3 Обучение и развертывание модели .326
краткое содержание главы·.330
Рекомендации·.330
Приложение A Эта книга включает в себя профессиональные термины.331