Подлинное пятно: распознавание голоса Калди Фактическое бой 9787121378744

Вес товара: ~0.7 кг. Указан усредненный вес, который может отличаться от фактического. Не включен в цену, оплачивается при получении.
Описание товара
- Информация о товаре
- Фотографии

|
|
|
Добрые советы:
Ограниченные продажи, пока он не будет продан.
Наш магазин и издатель совместно запустили книгу.
Небольшая дыра в задней обложке - логотип моей книги.
Небольшое количество книг может быть немного носит, не влияя на ваше чтение!Компакт -диск отдельных книг повторно.
Заказ до 15:30 ежедневно может быть отправлен в тот же день, а на следующий день будет отправлен заказ после 15:30.
В этом магазине подлинное место все книги напрямую поставляются издательными домами, качеством целостности, десять.
Если книга обнаруживает, что есть серьезный урон и клей, пожалуйста, свяжитесь с нами вовремя.
Основная информация
Название: Распознавание голоса Калди Фактическое бой
Цена: 89 юаней
Автор: Чен Гугуо ждет
Пресса: электронная промышленная пресса
Дата публикации: 2020-04-01
ISBN: 9787121378744
Слова: 338000
Номер страницы: 336
Издание: 336
Переплет: мягкая обложка
Открыто: 16
Товарный вес:

Оглавление
1 технология распознавания голоса 1
1.1 Минималистская история распознавания голоса 1
1.2 Архитектура системы распознавания голоса 6
1.3 Некоторые другие детали 11
2 Краткое изложение Кальди. Введение 15
2.1 История развития 15
2.2 Мысли о дизайне 18
2.3 Установите 20
2.4 Простой пример 26
2.5 Пример Введение 34
3 Организация данных 44
3.1 Разнообразие данных 44
3.2 Предварительная обработка данных 49
3.3 Входной и выходной механизм 56
3.4 Общая форма данных и сценарий обработки 69
3.5 Файл, связанный с моделью языка 79
4 Классическая технология моделирования акустики 94
4.1 Выдержка 95
4.2 ОБУЧЕНИЯ ОДНА модели 107
4.3 Sanyin Model Training 128
4.4 Технология изменения функции 139
4.5 дифференциальная тренировка 143
5 композиция и декодирование 147
5.1 N Yuan Grammar Language Model 148
5.2 Взвешенная машина с ограниченным состоянием 151
5.3 Используйте WFST для представления языковой модели 156
5.4 Строительная график статуса 158
5.5 Оптимизация структуры на рисунке 170
5.6 Генезис окончательной диаграммы состояния 174
5.7 Witby Search 176 на основе токена
5.8 Анализ исходного кода SimpleDecoder 178
5.9 Семья декодеров Калди 187
5.10 Декодирование сгенерированной сеткой 189
5.11 Re -Scoring с языковой моделью для повышения уровня распознавания 192
6 Технология акустического моделирования глубокого обучения 195
6.1 модель акустики на основе нейронной сети 195
6.2 Реализация нейронных сетей в Калди 200
6.3 Обучение модели нейронной сети 214
6.4 Отдел нейронных сетей 228
6.5 Комбинация с другими рамками глубокого обучения 242
7 Поиск ключевых слов и голосовой пробуждение 245
7.1 Технология поиска ключевых слов Введение 245
7.2 Голосовой поиск 247
7.3 голосовой пробуждение 263
……

Краткое содержание
Десять лет только что было золотым десятилетием голосовой технологии.Примерно в 2010 году, начиная с выпуска Google личных приложений для голосового поиска, и выпуска Apple отдельного голосового помощника Siri, разработка голосовой технологии вошла в быстрый трек.
Основной алгоритм голосовой технологии постоянно новый, а эталон голосовой миссии обновляется;
Голосовая индустрия быстро развивается, и традиционные учебники по голосовой технологии больше не могут удовлетворить неотложные потребности практикующих в этой области.В этой книге используется текущий популярный инструмент распознавания голоса с открытым исходным кодом в качестве отправной точки, объясняя технологию границы распознавания голоса и их практического применения простым способом.Авторы этой книги имеют глубокое академическое накопление богатого опыта в промышленных боях.
Эта книга подходит для изучения ссылки для исследователей, связанных с голосовыми технологиями и практиков в Интернете.

об авторе
Чен Гугуо
Степень бакалавра в Университете Цинхуа, докторская степень в Университете Джона Хопкинса.Во время доктора философии, прототип Ok Google разработал слово «пробуждение» для Google.Во время доктора философии он также участвовал в разработке инструмента распознавания голоса с открытым исходным кодом Kaldi и инструмента Neural Network с открытым исходным кодом CNTK.После окончания доктора философии он соучредил Kitt.ai и сосредоточился на распознавании голоса и обработке естественного языка. Полем
Dujiayu
Окончил бакалавриат Далонского технологического университета и учился в Школе электронного информационного инженера в Университете Нового Южного Уэльса, Австралия, чтобы получить степень магистра в области обработки сигналов.Во время аспирантуры под руководством инструктора Джулиепс изучение обработки голоса и эмоционального признания.После окончания университета он работал в лаборатории голосовых технологий Университета Цинхуа, факультете голосовой технологии Baidu, а также Alibaba Idst и Dharma Academy Good Group.Участие в работе, связанной с Калди, включают в себя: автор LSTM в рамках нейронной сети Kaldi Nnet1; науки и техники, научные исследовательские проекты из почти 200 университетов, включая Колумбийский университет.
Най Синью
Как студенты, так и докторантуру окончили Пекинский университет науки и технологии.Он работал в Институте акустики Китайской академии наук и роботов Alibaba, чтобы принять участие в разработке системы обучения модели распознавания голоса и системы голосового взаимодействия.В настоящее время он работает в Microsoft и служит прикладными учеными, занимаясь разработкой и поддержкой бизнеса алгоритмов распознавания голоса и технической архитектуры.В 2015 году он начал вносить код в проекте с открытым исходным кодом Kaldi, участвовал в разработке моделей NNET3 и цепей и сохранил несколько примеров и китайских моделей распознавания голоса OpenSlr.
Чжан Джунбо
Докторская степень окончила Академию наук Китайской академии наук и училась у исследователя Ян Йонгун.Полный набор фондовых рамках исследования фонетического алгоритма был построен из нуля, включая распознавание голоса, пробуждение голоса интеллектуального оборудования, распознавание звука, улучшение голоса и развертывание нейронной сети для голосовых приложений, все достигли уровня времени, и главная встреча была Опубликовано.Недавно был запущен механизм оценки качества произношения для изучения иностранных языков, и код для хорошего показателя произношения для Кальди способствовал Кальди.

Выбор редактора
Чтение толпы: сотрудники в области искусственного интеллекта.
Появление Калди было значительно сокращено отраслью, чтобы значительно снизить порог для обучения и использования технологии распознавания голоса и стало популярным инструментом.
Эта книга написана хорошо известным участником Кальди и основой технологии сообщества в сочетании с фактическими сценариями, она систематически объясняет основную теорию Калди.
Эта книга имеет четкий контекст, объясняющий, что люди и люди подходят для читателей и читателей в области распознавания голоса из других областей искусственного интеллекта и читателей в области распознавания голоса.
Особенности этой книги:
1 Принимая экземпляр сценария Кальди в качестве подсказки, в сочетании с большим количеством примеров, уменьшите порог для обучения
2 Подробно со всеми видами практических навыков, а другой путь
3 Анализ и решение реальных проблем сцены
4 Readmarking Voice Technology и другие ключевые приложения: голосовое пробуждение (распознавание ключевых слов), распознавание ораторов, распознавание языка