8 (905) 200-03-37 Владивосток
с 09:00 до 19:00
CHN - 1.14 руб. Сайт - 17.98 руб.

Руководство по обработке обработки в реальном времени Руководство по обработке голоса Интернет Интерактивная обработка голоса

Цена: 980руб.    (¥54.45)
Артикул: 623505674055

Вес товара: ~0.7 кг. Указан усредненный вес, который может отличаться от фактического. Не включен в цену, оплачивается при получении.

Этот товар на Таобао Описание товара
Продавец:安徽新华书店旗舰店
Рейтинг:
Всего отзывов:0
Положительных:0
Добавить в корзину
Другие товары этого продавца
¥ 19.8 19.7355руб.
¥3.971руб.
¥ 38 15.8285руб.
¥35.75643руб.


Руководство по обработке реальной обработки голоса

Ценообразование99.00

ИздательЭлектронная промышленная пресса

Версия1

Опубликованная датаАпрель 2020 года

формат16

авторGE Shi et al.

УкраситьПлоский пластик

Количество страниц352

Число слов560000

Кодирование ISBN9787121387593

 



Эта книга в основном представляет интерактивный процесс обработки голоса реального времени, основанный на интернет -сцене. В контенте участвуют интеллектуальные голосовые помощники, интеллектуальные динамики, аудио/видеоконференции и т. Д., Включая обработку голосового сигнала реального времени, цифровые звуковые эффекты, трансмиссия сети, передача сети, передачи сети. Редактирование/декодирование и распознавание голоса.При объяснении содержания каждой части эта книга начинается с основных концепций и принципов, объединяет теорию и практику, а также тщательно анализирует пример коммерческой ценности J, чтобы помочь читателям понять, как связаны алгоритмы в инженерии.Кроме того, для того, чтобы облегчить читателям интереса быстро проверять алгоритмы, улучшить и применять их к фактическим проектам, автор также открывает исходный код алгоритма в книге.



Введение .1  

Глава D1 Обработка сигнала.7  

1.1 Цифровая и частота моделирования .7  

1.2 Дискретное преобразование Фурье·8  

1.2.1 Реальное число DFT·.9  

1.2.2 Множество DFT·.10  

1.2.3 отрицательная частотная компонент. 10  

1.2.4 Nature Transformation Nature·.10  

1.3 FFT·.11  

1.3.1 Результаты FFT, например .12  

1.3.2 Реальный сигнал FFT.13  

1.3.3 Краткое преобразование Фурье .14  

1.3.4 Выбор функции голосового окна STFT .14  

1.4 Метод перекрывающегося добавления и метод перекрывающегося удержания·.16  

1.4.1 OLA.17  

1.4.2 OLS .19  

1,5 Взвешенное перекрытие и дополнительный метод .21  

1.5.1 Процесс расчета WOLA·.22  

1.5.2 Выбор функции WOLA·.22  

1.6 Группа фильтров·.23  

1.7 Голос до -ор. 27  

1.8 Гаусс распределение·.27  

1.8.1 Shan Gaos распределен .27  

1.8.2 Dorvegos распределен .29  

1,9 чмм модель .31  

1.10 Карман Фильтр·.32  

краткое содержание главы·.33  

Рекомендации·.33  

D2 Механизм произношения и устройство·.34  

2.1 Генерация голоса и получение .34  

2.1.1 Механизм генерации голоса .34  

2.1.2 Говорящая модель.36  

2.1.3 Блок произношения .36  

2.1.4 Классификация произношения .37  

2.1.5 Получение звука .37  

2.1.6.  

2.2 Спикер·.38  

2.2.1 Электрическая производительность .38  

2.2.2 Acoustics Performance .39  

2.2.3 Нижний шум .40  

2.2.4 Характеристики частотной характеристики .41  

2.2.5 THD+N POUT·.41  

2.2.6 напряжение (мощность) и искажение .42  

2.3 Микрофон·.42  

2.3.1 Индикатор производительности микрофона .42  

2.3.2 Выбор микрофона .43  

2.4 Структивный дизайн 45  

2.4.1.  

2.4.2 Микрофон и динамики.45  

2.5 Аудио оборудование·.46  

2.5.1 Оборудование для прослушивания .46  

2.5.2 Звуковое выражение поля .47  

2.5.3 Выступление оборудования .48  

2.5.4 Тест звуковой комнаты .48  

2.6 Тест на акустику·.49  

2.6.1 Объем акустики .50  

2.6.2 искажение THD·.50  

2.6.3 Частотное кольцо .51  

2.6.4 Консистенция массива микрофона .53  

2.6.5 Справочный канал AEC·.54  

2.6.6.  

2.6.7 THD динамика Z·.57  

краткое содержание главы·.58  

Рекомендации·.58  

D3 Глава голоса обнаружение конечной точки.59  

3.1 Выбор функций·.59  

3.2 Кодекс для суждения·.61  

3.2.1 Жилье .61  

3.2.2 Метод статистической модели .61  

3.2.3 Метод машинного обучения .62  

3.3 VAD экземпляр·.63  

3.3.1 Gauss Distribution .63  

3.3.2 Процесс алгоритма .63  

3.3.3 Расчет процесса .68  

3.4 Начальные параметры голоса/не -перемещения кадра .75  

3.4.1 Расчет параметров модели .75  

3.4.2 Гаусс Гибридная модель.76  

3.4.3 EM -алгоритм·.76  

краткое содержание главы·.78  

Рекомендации·.78  

D4 Одноканальный снижение шума.79.79  

4.1 Метод сокращения спектра·.79  

4.1.1 Принципы метода сокращения спектра .79  

4.1.2 Реализация метода сокращения спектра .81  

4.1.3 Музыкальный контроль шума .83  

4.1.4 Метод фильтра .83  

4.2 Венне фильтр·.84  

4.3 Снижение шумоподобного пространства·.86  

4.4. Реализация по снижению шумоподавления с одним каналом Webrtc .87  

4.4.1 Принцип алгоритма .87  

4.4.2 Инициализация алгоритма.88  

4.4.3 Расчет соотношения сигнала к шуму: Computesnr·.90  

4.4.4 Расчет вероятности голосового шума .91  

4.4.5 Выбранные .94  

4.4.6 Расчет платформы .96  

4.4.7 Функция обновления оценки шума:  

UpdateNoiseEstimate·.97  

4.4.8 Устранение шума .98  

4.4.9 Синтез сигнала .99  

4.4.10 Результат моделирования. 99  

4.5 Снижение шума глубокого обучения .101  

краткое содержание главы·.104  

Рекомендации·.105  

ГЛАВА D5 Акустическое эхо -эхо·.106  

5.1 Принципы устранения эха·.106  

5.2 Адаптивный фильтр·.108  

5.2.1 Virgin Filter .108  

5.2.2 Алгоритм LMS .109  

5.2.3 Алгоритм NLMS .110  

5.2.4 Алгоритм PBFDAF .111  

5.3 Алгоритм устранения эхоизоля ECHO WEBRTC·.113  

5.3.1 Оценка отсроченной. 113  

5.3.2 Адаптивный фильтр. 114  

5.3.3 Нелинейная обработка (NLP) .117  

5.3.4 Интерпретация кода Matlab .118  

5.3.5 Эксперимент по моделированию .127  

5.4 Алгоритм устранения эхо -эхо·.128  

5.4.1 Изменить длинный расчет .129  

5.4.2 Двойной фильтр и предварительная обработка .130  

5.4.3 Интерпретация кода Matlab .132  

5.4.4 Диаграмма активности процесса алгоритма .141  

5.4.5 Эксперимент по моделированию. 144  

краткое содержание главы·.146  

Рекомендации·.146  

D6 Источник источника звука .147  

6.1 Алгоритм GCC·.147  

6.2 Алгоритм SRP-PHAT .149  

6.3 Музыкальный алгоритм·.150  

6.4 Tops Algorithm·.152  

6.5 Алгоритм Фриды .154  

6.6.·.155  

6.6.1 Статистический метод .155  

6.6.2 Метод Кармана .156  

6.6.3 Моделирование позиционирования источника звука .158  

6.6.4 Метод фильтрации частиц .160  

краткое содержание главы·.160  

Рекомендации·.161  

D7 Технология формирования луча Глава .162  

7.1 Микрофон массив·.163  

7.1.1 Количество микрофона и расстояние .163  

7.1.2 Смешивание воздушного пространства .165  

7.1.3 Индекс формирования луча .165  

7.1.4 Шумовое поле .166  

7.1.5 Звуковое излучение .167  

7.2 Метод формирования общего луча .168  

7.2.1 Метод формирования задержки и формирования луча .168  

7.2.2 Метод формирования фильтра и луча .169  

7.2.3 Метод формирования луча постоянной ширины .169  

7.2.4 Метод образования дифференциального волнового луча .170  

7.2.5 Метод формирования метода луча стороны стороны более широкой стороны. 171  

7.2.6 Z Метод образования луча отклика.  

7.3 Пример формирования луча WEBRTC·.174  

7.3.1 Файл теста компиляции.174  

7.3.2 Процесс обработки файлов тестирования .175  

7.3.3 Тестовая команда .176  

7.3.4 Основные идеи алгоритма .176  

7.3.5 Тестируемый исходный код.178  

7.3.6 Процесс обработки алгоритма .181  

7.3.7 Функция расчета веса .185  

7.3.8.  

7.4 после фильтрации·.187  

7,4,1 млн. ММС -заднего фильтра·.189  

7.4.2 Задний фильтр Zelinski .190  

7.4.3 Задний фильтр McCowan·.191  

7.4.4 Задний фильтр STSA·.192  

краткое содержание главы·.193  

Рекомендации·.194  

D8 Глава слепое разделение .196  

8.1 Основные понятия и знание математики .196  

8.1.1 ICA Базовая концепция .196  

8.1.2 Метод оптимизации градиента и z .197  

8.2 Разделение слепого голоса предварительная обработка -pca.199  

8.3 Анализ частотной домены D Ингредиенты -fdica.200  

8.3.1 Частотная домен ICA.200  

8.3.2 Соответствующий метод оценки. 200  

8.3.3 Проблема неопределенности .201  

8.4 Задняя фильтрация .205  

8.4.1 Оценка шума .205  

8.4.2 Расчет коэффициента затухания .206  

8,5 GSC и совместная оценка ICA·.209  

8.5.1 Стекс -степень .209  

8.5.2 Классический GSC·.210  

8.5.3 Оценка тяжелой вектора динамических прав .210  

краткое содержание главы·.212  

Рекомендации·.213  

Глава D9 Обработка звука .214  

9.1 Классификация каналов·.214  

9.1.1 одиночная дорога .214  

9.1.2 Двойной канал .215  

9.1.3 стерео .215  

9.1.4 Multi -Channel .215  

9.1.5 Панорама .216  

9.2 Задняя обработка звука .217  

краткое содержание главы·.226  

Рекомендации·.226  

D10 Голосовой сборник/декодирование.227  

10.1 Кодирование LPC·.230  

10.2 шелковая компиляция/декодирование .231  

10.2.1 Параметры кода .232  

10.2.2 Кодер.234  

10.2.3 Декодер .239  

10.3 Опус Редактировать/Обзор декодирования .239  

10.3.1 декодирование опуса·.242  

10.3.2 Кодирование Opus·.243  

10.3.3 Opus Voice/Music Test·.244  

10.4 Оценка качества голоса·.247  

10.4.1 Тест Supick. 248  

10.4.2 Объективный тест .248  

10.4.3 Без оценки качества эталона .249  

краткое содержание главы·.249  

Рекомендации·.249  

Глава D11 передача голосовой сети·.251  

11.1 КОНТРОЛЬ БЕЗОПАСНОСТИ·.252  

11.1.1 Контроль заторов GOOGLECC .255  

11.1.2 PCC контроль перегрузки .260  

11.1.3 BBR на основе перегрузки .264  

11.2 NetEQ·.266  

11.2.1 Принцип Neteq .266  

11.2.2 Хит и упаковка .268  

11.2.3 Neteq Code Framework .269  

11.2.4 Расчет задержки .272  

11.2.5 обработка DSP·.274  

11.2.6 Изменение изменений неизменно .275  

краткое содержание главы·.277  

Рекомендации·.277  

ГЛАВА D12 Голос просыпается·.278  

12.1 Введение технологии профиля. 278  

12.2 Извлечение элементов·.279  

12.2.1 FBank·.279  

12.2.2 MFCC·.283  

12.2.3 PCEN·.284  

12.3 Структура модели·.284  

12.3.1 DNN·.284  

12.3.2 CNN·.286  

12.3.3 CRNN·.287  

12.3.4 DSCNN .288  

12.3.5 Zi с CNN.289  

12.3.6 Attention·.290  

12.4 Расчет Ускорения·.292  

12.4.1 Оценка аппаратных ресурсов .292  

12.4.2 Направление ускорения .294  

краткое содержание главы·.299  

Рекомендации·.299  

Глава D13 распознавание голоса·.301  

13.1 Извлечение голосовой функции·.303  

13.1.1 функция MFCC.304  

13.1.2 функции PLP .305  

13.1.3 Нормализация .306  

13.2 Модель акустики·.306  

13.2.1 Гибридная модель Гаусса.307  

13.2.2 Оценка параметров .307  

13.2.3 Скрытая модель Маркоу.308  

13.2.4 Метод Baum-Welch .309  

13.2.5 Устройство распознавания·.309  

13.3 Языковая модель·.310  

13.3.1 N-граммовая модель .311  

13.3.2 Взвешенная машина с ограниченным состоянием конверсии .312  

13.4 Да и D Примеры идентификации·312  

13.4.1 Подготовка данных .312  

13.4.2 Предварительная обработка данных .313  

13.4.3 Словарь и произношение. 314  

13.4.4 Модель лингвистики .315  

13.4.5. Показано .319  

13.4.6 Обучение модели акустики .320  

13.4.7 Декодирование и тест .321  

13.5 Калди китайское распознавание голоса 321  

13.5.1 Подготовка набора данных .321  

13.5.2 Обучение акустической модели .322  

13.5.3 Установить Portaudio·.322  

13.5.4 Онлайн -признание .323  

13.6 Deepspeeche распознавание голоса .324  

13.6.1 Идентификационное моделирование .325  

13.6.2 Сетевой состав .325  

13.6.3 Обучение и развертывание модели .326  

краткое содержание главы·.330  

Рекомендации·.330  

Приложение A Эта книга включает в себя профессиональные термины.331