RU2016135447A - Способ, устройство и система для пробуждения голосом - Google Patents
Способ, устройство и система для пробуждения голосом Download PDFInfo
- Publication number
- RU2016135447A RU2016135447A RU2016135447A RU2016135447A RU2016135447A RU 2016135447 A RU2016135447 A RU 2016135447A RU 2016135447 A RU2016135447 A RU 2016135447A RU 2016135447 A RU2016135447 A RU 2016135447A RU 2016135447 A RU2016135447 A RU 2016135447A
- Authority
- RU
- Russia
- Prior art keywords
- voice
- instruction
- phrase
- keyword
- model
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 9
- 238000001514 detection method Methods 0.000 claims 9
- 150000001875 compounds Chemical class 0.000 claims 5
- 230000015572 biosynthetic process Effects 0.000 claims 2
- 238000011156 evaluation Methods 0.000 claims 2
- 230000003213 activating effect Effects 0.000 claims 1
- 239000000284 extract Substances 0.000 claims 1
- 230000002618 waking effect Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
- G10L15/142—Hidden Markov Models [HMMs]
- G10L15/144—Training of HMMs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Machine Translation (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Claims (37)
1. Способ пробуждения голосом, содержащий:
выделяют свойство голоса из полученного текущего входного голоса;
определяют, содержит ли текущий входной голос фразу-инструкцию, в соответствии с выделенным свойством голоса, используя заранее сформированную модель детектирования ключевого слова, в которой ключевые слова содержат, по меньшей мере, заданные фразы-инструкции; и
когда текущий входной голос содержит фразу-инструкцию, пробуждают распознаватель голоса для выполнения соответствующей операции, обозначенной фразой-инструкцией, в соответствии с фразой-инструкцией.
2. Способ по п. 1, в котором перед тем, как будет выполнена соответствующая операция, обозначенная фразой-инструкцией, в соответствии с фразой-инструкцией, способ дополнительно содержит:
получают соответствующее сообщение об успешном сопоставлении семантического входа текущего входного голоса с семантическим входом инструкции, в котором распознаватель голоса передает сообщение об успешном сопоставлении после семантического анализа распознавателем голоса входного голоса для семантического входа текущего входного голоса, и успешного сопоставления семантического входа текущего входного голоса с заданным семантическим входом инструкции.
3. Способ по п. 1, в котором формирование модели детектирования ключевого слова содержит:
для каждой фонемы в голосе выделяют выборки акустического параметра, соответствующие фонеме из совокупности, в котором содержатся голосовые тексты и голос, соответствующий этим голосовым текстам;
обучают выборкам акустического параметра, соответствующим каждой фонеме, в соответствии с заданным обучающим алгоритмом, для получения акустической модели, представляющей соответствующую взаимосвязь между фонемой и соответствующими акустическими параметрами; и
выполняют поиск в словаре произношений фонем ключевого слова, соответствующих соответствующим ключевым словам, и формируют модель детектирования ключевого слова из фонем ключевого слова и соответствующих акустических параметров в акустической модели, в котором словарь произношения выполнен с возможностью сохранения фонем в фразах.
4. Способ по п. 1, в котором формирование модели детектирования ключевого слова содержит:
выполняют поиск в словаре произношения фонем ключевого слова, соответствующих ключевым словам, в котором словарь произношения выполнен с возможностью сохранения фонем в фразах;
выделяют выборки акустического параметра, соответствующие фонемам ключевого слова из совокупности, в которой содержатся голосовые тексты и голос, соответствующий голосовым текстам; и
выполняют обучение выборкам акустического параметра, соответствующим фонемам ключевого слова в заданном обучающем алгоритме для формирования модели детектирования ключевого слова.
5. Способ по п. 1, в котором модель детектирования ключевого слова представляет собой скрытую модель соединения Маркова; и
определение, содержит ли текущий входной голос фразу-инструкцию, в соответствии с выделенным свойством голоса, используя предварительно сформированную модель детектирования ключевого слова, содержит:
подтверждают фразу-инструкцию для каждого скрытого соединения Маркова в скрытой модели Маркова, в соответствии с выделенным свойством голоса, используя акустическую модель для оценки, чтобы, таким образом, выполнить оценку скрытого соединения Маркова, по которому подтвердили фразу-инструкцию; и
определяют, является ли группа знаков, соответствующая скрытому соединению Маркова с наивысшей оценкой, по которой подтвердили фразу-инструкцию, заданной фразой-инструкцией.
6. Способ по п. 1, в котором ключевые слова в модели детектирования ключевого слова дополнительно содержат заданные пробуждающие фразы; и
способ дополнительно содержит:
активируют распознаватель голоса после определения, что присутствует пробуждающая фраза по входном голосе, в соответствии с выделенным голосовым свойством, используя предварительно сформированную модель детектирования ключевого слова.
7. Устройство пробуждения голосом, содержащее:
модуль выделения, выполненный с возможностью выделения голосового свойства из полученного текущего входного голоса;
модуль определения фразы-инструкции, выполненный с возможностью определения, содержит ли текущий входной голос фразу-инструкцию, в соответствии с выделенным голосовым свойством, используя заранее сформированную модель детектирования ключевого слова, в которой ключевые слова содержат, по меньшей мере, заданные фразы-инструкции; и
первый модуль пробуждения, выполненный с возможностью, когда текущий входной голос содержит фразу-инструкцию, активировать распознаватель голоса для выполнения соответствующей операции, обозначенной фразой-инструкцией, в соответствии с фразой-инструкцией.
8. Устройство по п. 7, дополнительно содержащее:
модуль получения, выполненный с возможностью получения сообщения об успешном сопоставлении при сопоставлении семантического входа текущего входного голоса с семантическим входом инструкции, в котором сообщение об успешном сопоставлении передает распознаватель голоса после семантического анализа распознавателем голоса во входном голосе семантического входа текущего входного голоса, и успешного сопоставления семантического входа текущего входного голоса с заданным семантическим входом инструкцией.
9. Устройство по п. 7, в котором модуль определения фразы-инструкции выполнен с возможностью, для каждой фонемы в голосе, выделять выборки акустического параметра, соответствующие фонеме, из совокупности, в которой содержатся голосовые тексты и голос, соответствующий голосовым текстам; для обучения выборкам акустического параметра, соответствующим каждой фонеме в заданном обучающем алгоритме для получения акустической модели, представляющей соответствующую взаимосвязь между фонемой и соответствующими акустическими параметрами; и для выполнения поиска в словаре произношения фонем ключевого слова, соответствующих соответствующим ключевым словам, и для формирования модели детектирования ключевого слова из фонем ключевого слова и соответствующих акустических параметров в акустической модели, в котором словарь произношения выполнен с возможностью сохранения фонем в фразах.
10. Устройство по п. 7, в котором модуль определения фразы-инструкции выполнен с возможностью поиска в словаре произношения фонем ключевого слова, соответствующих ключевым словам, в котором словарь произношения выполнен с возможностью сохранения фонем в фразах для выделения выборок акустического параметра, соответствующих фонемам ключевого слова, из совокупности, в которой содержатся голосовые тексты и голос, соответствующий голосовым текстам; и для обучения выборкам акустического параметра, соответствующим фонемам ключевого слова в заданном обучающем алгоритме, для формирования модели детектирования ключевого слова.
11. Устройство по п. 7, в котором модель детектирования ключевого слова представляет собой скрытую модель соединения Маркова; и
модуль определения фразы-инструкции выполнен с возможностью подтверждения фразы-инструкции для каждого скрытого соединения Маркова в скрытой модели Маркова, в соответствии с выделенным голосовым свойством, используя акустическую модель для оценки, чтобы, таким образом, выполнить оценку скрытого соединения Маркова, по которому подтверждают фразу-инструкцию; и для определения, является ли группа знаков, соответствующая самому скрытому соединению Маркова с наивысшей оценкой, по которой подтверждают фразу-инструкцию, заданной фразой-инструкцией.
12. Устройство по п. 7, в котором ключевые слова в модели детектирования ключевого слова дополнительно содержат заданные пробуждающие фразы; и
устройство дополнительно содержит:
второй модуль пробуждения, выполненный с возможностью активации распознавателя голоса после определения, что присутствует пробуждающая фраза во входном голосе, в соответствии с выделенным голосовым свойством, используя заранее сформированную модель детектирования ключевого слова.
13. Система пробуждения голосом, содержащая модуль детектирования ключевого слова и распознаватель голоса, в котором:
модуль детектирования ключевого слова выполнен с возможностью выделения голосового свойства из полученного текущего входного голоса; определения, содержит ли текущий входной голос фразу-инструкцию, в соответствии с выделенным свойством голоса, используя заранее сформированную модель детектирования ключевого слова, содержащую, по меньшей мере, фразы-инструкции; и когда текущий входной голос содержит фразу-инструкцию, активирования распознавателя голоса, и передачи текущего входного голоса в распознаватель голоса; и
распознаватель голоса, выполнен с возможностью семантического анализа текущего входного голоса для семантического ввода текущего входного голоса; для определения, что семантический ввод текущего входного голоса соответствует заданному семантическому вводу инструкции; и для передачи инструкции для выполнения соответствующей операции, обозначенной фразой-инструкцией.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510702094.1A CN105654943A (zh) | 2015-10-26 | 2015-10-26 | 一种语音唤醒方法、装置及系统 |
CN201510702094.1 | 2015-10-26 | ||
PCT/CN2016/082401 WO2017071182A1 (zh) | 2015-10-26 | 2016-05-17 | 一种语音唤醒方法、装置及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2016135447A3 RU2016135447A3 (ru) | 2018-03-02 |
RU2016135447A true RU2016135447A (ru) | 2018-03-02 |
Family
ID=56482004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2016135447A RU2016135447A (ru) | 2015-10-26 | 2016-05-17 | Способ, устройство и система для пробуждения голосом |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP3179475A4 (ru) |
CN (1) | CN105654943A (ru) |
RU (1) | RU2016135447A (ru) |
WO (1) | WO2017071182A1 (ru) |
Families Citing this family (69)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106328137A (zh) * | 2016-08-19 | 2017-01-11 | 镇江惠通电子有限公司 | 语音控制方法、装置及系统 |
CN107767861B (zh) * | 2016-08-22 | 2021-07-02 | 科大讯飞股份有限公司 | 语音唤醒方法、系统及智能终端 |
CN106157950A (zh) * | 2016-09-29 | 2016-11-23 | 合肥华凌股份有限公司 | 语音控制系统及其唤醒方法、唤醒装置和家电、协处理器 |
CN108074563A (zh) * | 2016-11-09 | 2018-05-25 | 珠海格力电器股份有限公司 | 时钟应用的控制方法及装置 |
CN106847273B (zh) * | 2016-12-23 | 2020-05-05 | 北京云知声信息技术有限公司 | 语音识别的唤醒词选择方法及装置 |
CN106653022B (zh) * | 2016-12-29 | 2020-06-23 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
CN107610695B (zh) * | 2017-08-08 | 2021-07-06 | 大众问问(北京)信息科技有限公司 | 驾驶人语音唤醒指令词权重的动态调整方法 |
CN107704275B (zh) * | 2017-09-04 | 2021-07-23 | 百度在线网络技术(北京)有限公司 | 智能设备唤醒方法、装置、服务器及智能设备 |
CN107610702B (zh) * | 2017-09-22 | 2021-01-29 | 百度在线网络技术(北京)有限公司 | 终端设备待机唤醒方法、装置及计算机设备 |
CN107578776B (zh) * | 2017-09-25 | 2021-08-06 | 咪咕文化科技有限公司 | 一种语音交互的唤醒方法、装置及计算机可读存储介质 |
CN109584860B (zh) * | 2017-09-27 | 2021-08-03 | 九阳股份有限公司 | 一种语音唤醒词定义方法和系统 |
CN109741735B (zh) * | 2017-10-30 | 2023-09-01 | 阿里巴巴集团控股有限公司 | 一种建模方法、声学模型的获取方法和装置 |
CN109817220A (zh) * | 2017-11-17 | 2019-05-28 | 阿里巴巴集团控股有限公司 | 语音识别方法、装置及系统 |
CN109903751B (zh) * | 2017-12-08 | 2023-07-07 | 阿里巴巴集团控股有限公司 | 关键词确认方法和装置 |
CN108198552B (zh) * | 2018-01-18 | 2021-02-02 | 深圳市大疆创新科技有限公司 | 一种语音控制方法及视频眼镜 |
CN108039175B (zh) | 2018-01-29 | 2021-03-26 | 北京百度网讯科技有限公司 | 语音识别方法、装置及服务器 |
CN110097870B (zh) * | 2018-01-30 | 2023-05-30 | 阿里巴巴集团控股有限公司 | 语音处理方法、装置、设备和存储介质 |
CN110096249A (zh) * | 2018-01-31 | 2019-08-06 | 阿里巴巴集团控股有限公司 | 用于提示快捷唤醒词的方法、装置和系统 |
CN108520743B (zh) * | 2018-02-02 | 2021-01-22 | 百度在线网络技术(北京)有限公司 | 智能设备的语音控制方法、智能设备及计算机可读介质 |
CN108536668B (zh) * | 2018-02-26 | 2022-06-07 | 科大讯飞股份有限公司 | 唤醒词评估方法及装置、存储介质、电子设备 |
CN111819626A (zh) * | 2018-03-07 | 2020-10-23 | 华为技术有限公司 | 一种语音交互的方法及装置 |
CN108538298B (zh) * | 2018-04-04 | 2021-05-04 | 科大讯飞股份有限公司 | 语音唤醒方法及装置 |
EP3561806B1 (en) * | 2018-04-23 | 2020-04-22 | Spotify AB | Activation trigger processing |
CN110415691A (zh) * | 2018-04-28 | 2019-11-05 | 青岛海尔多媒体有限公司 | 基于语音识别的控制方法、装置及计算机可读存储介质 |
CN108735210A (zh) * | 2018-05-08 | 2018-11-02 | 宇龙计算机通信科技(深圳)有限公司 | 一种语音控制方法及终端 |
JP2019211599A (ja) * | 2018-06-04 | 2019-12-12 | 本田技研工業株式会社 | 音声認識装置、音声認識方法およびプログラム |
CN108877780B (zh) * | 2018-06-06 | 2021-06-01 | 广东小天才科技有限公司 | 一种语音搜题方法及家教设备 |
CN108899028A (zh) * | 2018-06-08 | 2018-11-27 | 广州视源电子科技股份有限公司 | 语音唤醒方法、搜索方法、装置和终端 |
CN108735216B (zh) * | 2018-06-12 | 2020-10-16 | 广东小天才科技有限公司 | 一种基于语义识别的语音搜题方法及家教设备 |
CN110600023A (zh) * | 2018-06-12 | 2019-12-20 | Tcl集团股份有限公司 | 一种终端设备交互方法、装置和终端设备 |
CN109065045A (zh) * | 2018-08-30 | 2018-12-21 | 出门问问信息科技有限公司 | 语音识别方法、装置、电子设备及计算机可读存储介质 |
CN109253728A (zh) * | 2018-08-31 | 2019-01-22 | 平安科技(深圳)有限公司 | 语音导航方法、装置、计算机设备及存储介质 |
CN109346070A (zh) * | 2018-09-17 | 2019-02-15 | 佛吉亚好帮手电子科技有限公司 | 一种基于车机安卓系统的语音免唤醒方法 |
CN109147764A (zh) * | 2018-09-20 | 2019-01-04 | 百度在线网络技术(北京)有限公司 | 语音交互方法、装置、设备及计算机可读介质 |
CN109003611B (zh) * | 2018-09-29 | 2022-05-27 | 阿波罗智联(北京)科技有限公司 | 用于车辆语音控制的方法、装置、设备和介质 |
CN111128134B (zh) * | 2018-10-11 | 2023-06-06 | 阿里巴巴集团控股有限公司 | 声学模型训练方法和语音唤醒方法、装置及电子设备 |
CN109215634A (zh) * | 2018-10-22 | 2019-01-15 | 上海声瀚信息科技有限公司 | 一种多词语音控制通断装置的方法及其系统 |
CN111199732B (zh) * | 2018-11-16 | 2022-11-15 | 深圳Tcl新技术有限公司 | 一种基于情感的语音交互方法、存储介质及终端设备 |
CN109545207A (zh) * | 2018-11-16 | 2019-03-29 | 广东小天才科技有限公司 | 一种语音唤醒方法及装置 |
CN109243462A (zh) * | 2018-11-20 | 2019-01-18 | 广东小天才科技有限公司 | 一种语音唤醒方法及装置 |
CN109360567B (zh) * | 2018-12-12 | 2021-07-20 | 思必驰科技股份有限公司 | 可定制唤醒的方法和装置 |
CN109364477A (zh) * | 2018-12-24 | 2019-02-22 | 苏州思必驰信息科技有限公司 | 基于语音控制进行打麻将游戏的方法及装置 |
CN109584878A (zh) * | 2019-01-14 | 2019-04-05 | 广东小天才科技有限公司 | 一种语音唤醒方法及系统 |
CN111462756B (zh) * | 2019-01-18 | 2023-06-27 | 北京猎户星空科技有限公司 | 声纹识别方法、装置、电子设备及存储介质 |
CN109753665B (zh) * | 2019-01-30 | 2020-10-16 | 北京声智科技有限公司 | 唤醒模型的更新方法及装置 |
CN109754788B (zh) * | 2019-01-31 | 2020-08-28 | 百度在线网络技术(北京)有限公司 | 一种语音控制方法、装置、设备及存储介质 |
CN109741746A (zh) * | 2019-01-31 | 2019-05-10 | 上海元趣信息技术有限公司 | 机器人高度拟人化语音交互算法、情感交流算法及机器人 |
CN110070863A (zh) * | 2019-03-11 | 2019-07-30 | 华为技术有限公司 | 一种语音控制方法及装置 |
CN109979440B (zh) * | 2019-03-13 | 2021-05-11 | 广州市网星信息技术有限公司 | 关键词样本确定方法、语音识别方法、装置、设备和介质 |
CN110032316A (zh) * | 2019-03-29 | 2019-07-19 | 五邑大学 | 一种智能挂钟的交互方法、装置和存储介质 |
CN111862963B (zh) * | 2019-04-12 | 2024-05-10 | 阿里巴巴集团控股有限公司 | 语音唤醒方法、装置和设备 |
CN110225386B (zh) * | 2019-05-09 | 2021-09-14 | 海信视像科技股份有限公司 | 一种显示控制方法、显示设备 |
CN110232916A (zh) * | 2019-05-10 | 2019-09-13 | 平安科技(深圳)有限公司 | 语音处理方法、装置、计算机设备及存储介质 |
CN110444207A (zh) * | 2019-08-06 | 2019-11-12 | 广州豫本草电子科技有限公司 | 基于衡通仪的智能响应控制方法、装置、介质及终端设备 |
CN111756935A (zh) * | 2019-12-12 | 2020-10-09 | 北京沃东天骏信息技术有限公司 | 智能系统的信息处理方法和智能系统 |
CN111081254B (zh) * | 2019-12-26 | 2022-09-23 | 思必驰科技股份有限公司 | 一种语音识别方法和装置 |
CN111462777B (zh) * | 2020-03-30 | 2023-02-14 | 厦门快商通科技股份有限公司 | 关键词检索方法、系统、移动终端及存储介质 |
CN111429915A (zh) * | 2020-03-31 | 2020-07-17 | 国家电网有限公司华东分部 | 一种基于语音识别的调度系统及调度方法 |
CN111554284A (zh) * | 2020-04-24 | 2020-08-18 | 广东电网有限责任公司东莞供电局 | 一种倒闸操作监控方法、装置、设备及存储介质 |
CN111555247A (zh) * | 2020-04-24 | 2020-08-18 | 广东电网有限责任公司东莞供电局 | 一种电力设备的倒闸操作控制方法、装置、设备及介质 |
CN111739521B (zh) * | 2020-06-19 | 2021-06-22 | 腾讯科技(深圳)有限公司 | 电子设备唤醒方法、装置、电子设备及存储介质 |
CN112037772B (zh) * | 2020-09-04 | 2024-04-02 | 平安科技(深圳)有限公司 | 基于多模态的响应义务检测方法、系统及装置 |
CN112233656A (zh) * | 2020-10-09 | 2021-01-15 | 安徽讯呼信息科技有限公司 | 一种人工智能语音唤醒方法 |
CN112331229B (zh) * | 2020-10-23 | 2024-03-12 | 网易有道信息技术(北京)有限公司 | 语音检测方法、装置、介质和计算设备 |
CN112420044A (zh) * | 2020-12-03 | 2021-02-26 | 深圳市欧瑞博科技股份有限公司 | 语音识别方法、语音识别装置及电子设备 |
CN112735441A (zh) * | 2020-12-07 | 2021-04-30 | 浙江合众新能源汽车有限公司 | 智能生态语音识别系统 |
CN113643700B (zh) * | 2021-07-27 | 2024-02-27 | 广州市威士丹利智能科技有限公司 | 一种智能语音开关的控制方法及系统 |
CN115331670B (zh) * | 2022-08-09 | 2023-06-23 | 深圳市麦驰信息技术有限公司 | 一种家用电器用离线语音遥控器 |
CN115472156A (zh) * | 2022-09-05 | 2022-12-13 | Oppo广东移动通信有限公司 | 语音控制方法、装置、存储介质及电子设备 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101383150B (zh) * | 2008-08-19 | 2010-11-10 | 南京师范大学 | 语音软开关的控制方法及其在地理信息系统中的应用 |
CN102929390A (zh) * | 2012-10-16 | 2013-02-13 | 广东欧珀移动通信有限公司 | 一种在待机状态下应用程序的启动方法及装置 |
CN103871408B (zh) * | 2012-12-14 | 2017-05-24 | 联想(北京)有限公司 | 一种语音识别方法及装置、电子设备 |
US11393461B2 (en) * | 2013-03-12 | 2022-07-19 | Cerence Operating Company | Methods and apparatus for detecting a voice command |
US20140365225A1 (en) * | 2013-06-05 | 2014-12-11 | DSP Group | Ultra-low-power adaptive, user independent, voice triggering schemes |
CN103943105A (zh) * | 2014-04-18 | 2014-07-23 | 安徽科大讯飞信息科技股份有限公司 | 一种语音交互方法及系统 |
CN104866274B (zh) * | 2014-12-01 | 2018-06-01 | 联想(北京)有限公司 | 信息处理方法及电子设备 |
CN104538030A (zh) * | 2014-12-11 | 2015-04-22 | 科大讯飞股份有限公司 | 一种可以通过语音控制家电的控制系统与方法 |
-
2015
- 2015-10-26 CN CN201510702094.1A patent/CN105654943A/zh active Pending
-
2016
- 2016-05-17 EP EP16739388.3A patent/EP3179475A4/en not_active Withdrawn
- 2016-05-17 WO PCT/CN2016/082401 patent/WO2017071182A1/zh active Application Filing
- 2016-05-17 RU RU2016135447A patent/RU2016135447A/ru unknown
Also Published As
Publication number | Publication date |
---|---|
RU2016135447A3 (ru) | 2018-03-02 |
EP3179475A4 (en) | 2017-06-28 |
WO2017071182A1 (zh) | 2017-05-04 |
EP3179475A1 (en) | 2017-06-14 |
CN105654943A (zh) | 2016-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2016135447A (ru) | Способ, устройство и система для пробуждения голосом | |
US10319250B2 (en) | Pronunciation guided by automatic speech recognition | |
US9972318B1 (en) | Interpreting voice commands | |
US11830485B2 (en) | Multiple speech processing system with synthesized speech styles | |
US10522134B1 (en) | Speech based user recognition | |
US10170116B1 (en) | Maintaining context for voice processes | |
CN110431626B (zh) | 使用成对比较进行重复语音查询中的超发音检测以改进语音识别 | |
Guo et al. | Study of semi-supervised approaches to improving english-mandarin code-switching speech recognition | |
CN104978963A (zh) | 语音识别装置、方法以及电子设备 | |
WO2016067418A1 (ja) | 対話制御装置および対話制御方法 | |
TW200638337A (en) | Using a spoken utterance for disambiguation of spelling inputs into a speech recognition system | |
CN106710592A (zh) | 一种智能硬件设备中的语音识别纠错方法和装置 | |
CN111415656B (zh) | 语音语义识别方法、装置及车辆 | |
Chen et al. | Applying rhythm features to automatically assess non-native speech | |
WO2009025356A1 (ja) | 音声認識装置および音声認識方法 | |
CN102982811A (zh) | 一种基于实时解码的语音端点检测方法 | |
US20120078622A1 (en) | Spoken dialogue apparatus, spoken dialogue method and computer program product for spoken dialogue | |
US20240071385A1 (en) | Speech-processing system | |
CN105244024B (zh) | 一种语音识别方法及装置 | |
CN107123419A (zh) | Sphinx语速识别中背景降噪的优化方法 | |
CN109697975B (zh) | 一种语音评价方法及装置 | |
Zhang et al. | A computer-assist algorithm to detect repetitive stuttering automatically | |
US11817090B1 (en) | Entity resolution using acoustic data | |
KR20130067854A (ko) | 코퍼스 기반 언어모델 변별학습 방법 및 그 장치 | |
Li et al. | English sentence pronunciation evaluation using rhythm and intonation |