RU2016135447A

RU2016135447A - Способ, устройство и система для пробуждения голосом

Info

Publication number: RU2016135447A
Application number: RU2016135447A
Authority: RU
Inventors: Юцзюнь ВАН
Original assignee: Ли Холдингз(Бейджинг)Ко., Лтд.; Ли Ши Чжи Синь Электроник Текнолоджи (Тянь Цзинь) Лимитед
Priority date: 2015-10-26
Filing date: 2016-05-17
Publication date: 2018-03-02
Also published as: RU2016135447A3; CN105654943A; EP3179475A4; EP3179475A1; WO2017071182A1

Claims

1. Способ пробуждения голосом, содержащий:

выделяют свойство голоса из полученного текущего входного голоса;

определяют, содержит ли текущий входной голос фразу-инструкцию, в соответствии с выделенным свойством голоса, используя заранее сформированную модель детектирования ключевого слова, в которой ключевые слова содержат, по меньшей мере, заданные фразы-инструкции; и

когда текущий входной голос содержит фразу-инструкцию, пробуждают распознаватель голоса для выполнения соответствующей операции, обозначенной фразой-инструкцией, в соответствии с фразой-инструкцией.

2. Способ по п. 1, в котором перед тем, как будет выполнена соответствующая операция, обозначенная фразой-инструкцией, в соответствии с фразой-инструкцией, способ дополнительно содержит:

получают соответствующее сообщение об успешном сопоставлении семантического входа текущего входного голоса с семантическим входом инструкции, в котором распознаватель голоса передает сообщение об успешном сопоставлении после семантического анализа распознавателем голоса входного голоса для семантического входа текущего входного голоса, и успешного сопоставления семантического входа текущего входного голоса с заданным семантическим входом инструкции.

3. Способ по п. 1, в котором формирование модели детектирования ключевого слова содержит:

для каждой фонемы в голосе выделяют выборки акустического параметра, соответствующие фонеме из совокупности, в котором содержатся голосовые тексты и голос, соответствующий этим голосовым текстам;

обучают выборкам акустического параметра, соответствующим каждой фонеме, в соответствии с заданным обучающим алгоритмом, для получения акустической модели, представляющей соответствующую взаимосвязь между фонемой и соответствующими акустическими параметрами; и

выполняют поиск в словаре произношений фонем ключевого слова, соответствующих соответствующим ключевым словам, и формируют модель детектирования ключевого слова из фонем ключевого слова и соответствующих акустических параметров в акустической модели, в котором словарь произношения выполнен с возможностью сохранения фонем в фразах.

4. Способ по п. 1, в котором формирование модели детектирования ключевого слова содержит:

выполняют поиск в словаре произношения фонем ключевого слова, соответствующих ключевым словам, в котором словарь произношения выполнен с возможностью сохранения фонем в фразах;

выделяют выборки акустического параметра, соответствующие фонемам ключевого слова из совокупности, в которой содержатся голосовые тексты и голос, соответствующий голосовым текстам; и

выполняют обучение выборкам акустического параметра, соответствующим фонемам ключевого слова в заданном обучающем алгоритме для формирования модели детектирования ключевого слова.

5. Способ по п. 1, в котором модель детектирования ключевого слова представляет собой скрытую модель соединения Маркова; и

определение, содержит ли текущий входной голос фразу-инструкцию, в соответствии с выделенным свойством голоса, используя предварительно сформированную модель детектирования ключевого слова, содержит:

подтверждают фразу-инструкцию для каждого скрытого соединения Маркова в скрытой модели Маркова, в соответствии с выделенным свойством голоса, используя акустическую модель для оценки, чтобы, таким образом, выполнить оценку скрытого соединения Маркова, по которому подтвердили фразу-инструкцию; и

определяют, является ли группа знаков, соответствующая скрытому соединению Маркова с наивысшей оценкой, по которой подтвердили фразу-инструкцию, заданной фразой-инструкцией.

6. Способ по п. 1, в котором ключевые слова в модели детектирования ключевого слова дополнительно содержат заданные пробуждающие фразы; и

способ дополнительно содержит:

активируют распознаватель голоса после определения, что присутствует пробуждающая фраза по входном голосе, в соответствии с выделенным голосовым свойством, используя предварительно сформированную модель детектирования ключевого слова.

7. Устройство пробуждения голосом, содержащее:

модуль выделения, выполненный с возможностью выделения голосового свойства из полученного текущего входного голоса;

модуль определения фразы-инструкции, выполненный с возможностью определения, содержит ли текущий входной голос фразу-инструкцию, в соответствии с выделенным голосовым свойством, используя заранее сформированную модель детектирования ключевого слова, в которой ключевые слова содержат, по меньшей мере, заданные фразы-инструкции; и

первый модуль пробуждения, выполненный с возможностью, когда текущий входной голос содержит фразу-инструкцию, активировать распознаватель голоса для выполнения соответствующей операции, обозначенной фразой-инструкцией, в соответствии с фразой-инструкцией.

8. Устройство по п. 7, дополнительно содержащее:

модуль получения, выполненный с возможностью получения сообщения об успешном сопоставлении при сопоставлении семантического входа текущего входного голоса с семантическим входом инструкции, в котором сообщение об успешном сопоставлении передает распознаватель голоса после семантического анализа распознавателем голоса во входном голосе семантического входа текущего входного голоса, и успешного сопоставления семантического входа текущего входного голоса с заданным семантическим входом инструкцией.

9. Устройство по п. 7, в котором модуль определения фразы-инструкции выполнен с возможностью, для каждой фонемы в голосе, выделять выборки акустического параметра, соответствующие фонеме, из совокупности, в которой содержатся голосовые тексты и голос, соответствующий голосовым текстам; для обучения выборкам акустического параметра, соответствующим каждой фонеме в заданном обучающем алгоритме для получения акустической модели, представляющей соответствующую взаимосвязь между фонемой и соответствующими акустическими параметрами; и для выполнения поиска в словаре произношения фонем ключевого слова, соответствующих соответствующим ключевым словам, и для формирования модели детектирования ключевого слова из фонем ключевого слова и соответствующих акустических параметров в акустической модели, в котором словарь произношения выполнен с возможностью сохранения фонем в фразах.

10. Устройство по п. 7, в котором модуль определения фразы-инструкции выполнен с возможностью поиска в словаре произношения фонем ключевого слова, соответствующих ключевым словам, в котором словарь произношения выполнен с возможностью сохранения фонем в фразах для выделения выборок акустического параметра, соответствующих фонемам ключевого слова, из совокупности, в которой содержатся голосовые тексты и голос, соответствующий голосовым текстам; и для обучения выборкам акустического параметра, соответствующим фонемам ключевого слова в заданном обучающем алгоритме, для формирования модели детектирования ключевого слова.

11. Устройство по п. 7, в котором модель детектирования ключевого слова представляет собой скрытую модель соединения Маркова; и

модуль определения фразы-инструкции выполнен с возможностью подтверждения фразы-инструкции для каждого скрытого соединения Маркова в скрытой модели Маркова, в соответствии с выделенным голосовым свойством, используя акустическую модель для оценки, чтобы, таким образом, выполнить оценку скрытого соединения Маркова, по которому подтверждают фразу-инструкцию; и для определения, является ли группа знаков, соответствующая самому скрытому соединению Маркова с наивысшей оценкой, по которой подтверждают фразу-инструкцию, заданной фразой-инструкцией.

12. Устройство по п. 7, в котором ключевые слова в модели детектирования ключевого слова дополнительно содержат заданные пробуждающие фразы; и

устройство дополнительно содержит:

второй модуль пробуждения, выполненный с возможностью активации распознавателя голоса после определения, что присутствует пробуждающая фраза во входном голосе, в соответствии с выделенным голосовым свойством, используя заранее сформированную модель детектирования ключевого слова.

13. Система пробуждения голосом, содержащая модуль детектирования ключевого слова и распознаватель голоса, в котором:

модуль детектирования ключевого слова выполнен с возможностью выделения голосового свойства из полученного текущего входного голоса; определения, содержит ли текущий входной голос фразу-инструкцию, в соответствии с выделенным свойством голоса, используя заранее сформированную модель детектирования ключевого слова, содержащую, по меньшей мере, фразы-инструкции; и когда текущий входной голос содержит фразу-инструкцию, активирования распознавателя голоса, и передачи текущего входного голоса в распознаватель голоса; и

распознаватель голоса, выполнен с возможностью семантического анализа текущего входного голоса для семантического ввода текущего входного голоса; для определения, что семантический ввод текущего входного голоса соответствует заданному семантическому вводу инструкции; и для передачи инструкции для выполнения соответствующей операции, обозначенной фразой-инструкцией.