CN103943105A - 一种语音交互方法及系统 - Google Patents
一种语音交互方法及系统 Download PDFInfo
- Publication number
- CN103943105A CN103943105A CN201410158639.2A CN201410158639A CN103943105A CN 103943105 A CN103943105 A CN 103943105A CN 201410158639 A CN201410158639 A CN 201410158639A CN 103943105 A CN103943105 A CN 103943105A
- Authority
- CN
- China
- Prior art keywords
- voice
- setting
- time
- successfully
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种语音交互方法及系统,前者包括:录制用户输入的音频信息;获取音频信息进行唤醒检测,直至唤醒成功;获取音频信息中于唤醒成功起的语音段作为语音指令,直至检测到设定的任一指令获取终止事件;对语音指令进行语音识别,得到语音识别结果;判断语音识别结果是否有效,如果有效则执行所述语音识别结果。本发明的语音交互方法及系统既可通过唤醒检测过滤不包含唤醒词的语音或者背景噪音,又可在唤醒成功后直接处理用户在说出唤醒词后连续说出的语句指令,从而提升了语音交互方式的便捷性。
Description
技术领域
本发明涉及语音交互领域,尤其涉及一种语音交互方法及系统。
背景技术
为了避免手机等移动设备在待机时将周边的说话噪音误识别为语音指令,用户在每次启动移动设备的语音交互功能时,移动设备均需要完成以下操作:1、录制用户输入的音频信息;2、获取音频信息进行唤醒检测,直至唤醒成功;3、于唤醒成功后提示用户输入语音指令;4、于提示用户输入语音指令后,再次录制用户输入的音频信息;5、获取再次录制的音频信息中的语音段作为语音指令;6、对语音指令进行语音识别,得到语音识别结果;7、确定语音识别结果是否有效,如果有效则执行语音识别结果。对应地,用户在每次启动移动设备的语音交互功能时,均需要完成以下操作:1、说出唤醒词,以唤醒移动设备;2、在移动设备提示用户输入语音指令时,说出语音指令,例如说出“打电话给张三”时。由此可见,该种语音交互方法具有使用便捷性较差的缺陷。
发明内容
本发明的一个目的在于克服现有技术中的不足,提供了一种提升用户使用便捷性的语音交互方法。
为实现上述目的,本发明采用的技术方案为:一种语音交互方法,包括:
录制用户输入的音频信息;
获取所述音频信息进行唤醒检测,直至唤醒成功;
获取所述音频信息中于唤醒成功起的语音段作为语音指令,直至检测到设定的任一指令获取终止事件;
对所述语音指令进行语音识别,得到语音识别结果;
判断所述语音识别结果是否有效,如果有效则执行所述语音识别结果。
优选的是,所述指令获取终止事件包括:所述语音段结束,所述语音段已持续至于唤醒成功起的第一设定时间,及于唤醒成功起的第二设定时间内未检测到所述语音段。
优选的是,所述方法还包括:
在检测到任一交互失败事件时提示用户重新输入语音指令,其中,所述交互失败事件包括于唤醒成功起的第二设定时间内未检测到所述语音段,及确定所述语音识别结果无效。
优选的是,所述第二设定时间小于所述第一设定时间。
优选的是,所述方法还包括:
发生任一所述指令获取终止事件后,停止录制用户输入的音频信息。
本发明的另一个目在于克服现有技术中的不足,提供了一种提升用户使用便捷性的语音交互系统。
为了实现上述目的,本发明采用的技术方案为:一种语音交互系统,包括:
录音模块,用于录制用户输入的音频信息;
唤醒模块,用于获取所述音频信息进行唤醒检测,直至唤醒成功;
语音活动检测模块,用于获取所述音频信息中于唤醒成功起的语音段作为语音指令,直至检测到设定的任一指令获取终止事件;
语音识别模块,用于对所述语音指令进行语音识别,得到语音识别结果;
判断模块,用于判断所述语音识别结果是否有效;以及,
执行模块,用于执行有效的语音识别结果。
优选的是,所述指令获取终止事件包括:所述语音段结束,所述语音段已持续至于唤醒成功起的第一设定时间,及于唤醒成功起的第二设定时间内未检测到所述语音段。
优选的是,所述系统还包括语音输出模块,用于在检测到任一交互失败事件时提示用户重新输入语音指令,其中,所述交互失败事件包括于唤醒成功起的第二设定时间内未检测到所述语音段,及确定所述语音识别结果无效。
优选的是,所述第二设定时间小于所述第一设定时间。
优选的是,所述录音模块还用于在发生任一所述指令获取终止事件后,停止录制用户输入的音频信息。
本发明的有益效果在于,本发明的语音交互方法及系统既可通过唤醒检测过滤不包含唤醒词的语音或者背景噪音,又可在唤醒成功后直接处理用户在说出唤醒词后连续说出的语句指令,从而提升了语音交互方式的便捷性。
附图说明
图1示出了根据本发明所述语音交互方法的一种实施方式的流程图;
图2示出了根据本发明所述语音交互系统的一种实施结构的方框原理图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
如图1所示,本发明的语音交互方法包括如下步骤:
步骤S1,录制用户输入的音频信息。
步骤S2,获取音频信息进行唤醒检测,直至唤醒成功;本领域技术人员应当理解的是,该步骤通常是从录制音频信息开始即进行唤醒检测操作。
步骤S3,获取音频信息中于唤醒成功起的语音段作为语音指令,直至检测到设定的任一指令获取终止事件;即步骤S1的操作在唤醒成功后无中断地继续进行,而获取语音指令的动作由唤醒成功触发,该步骤即是在唤醒成功后直接获取音频信息中的语音段。
步骤S4,如果在步骤S3中获取到了语音指令,则对语音指令进行语音识别,得到语音识别结果。
步骤S5,判断语音识别结果是否有效,如果有效则执行步骤S6。
步骤S6,执行语音识别结果。
针对本发明的语音交互方法,用户只需在触发语音交互后,连续说出唤醒词和语音指令即可。
在步骤S2中的唤醒检测可采用申请公布号为CN102999161A或者申请公布号为CN103021409A中公开的唤醒检测方法,该唤醒检测方法具体为:
步骤S21,声学特征提取:提取音频信息(通常以语音段为单位进行唤醒检测)中具有区分性的、并且是基于人耳听觉特性提取的特征,通常选取语音识别中用到的MFCC(Mel-Frequency Cepstrum Coefficient,美尔频率倒谱系数)特征作为声学特征。
步骤S22,唤醒词检测:将提取得到的声学特征,采用训练的声学模型在唤醒词检测网络上计算声学得分,如果声学得分最优的路径中包含要检测的唤醒词,则确定已检出唤醒词,进入步骤S23操作,否则回到步骤S21继续进行提取声学特征。
步骤S23,唤醒词确认:将提取得到的声学特征,采用训练的声学模型在唤醒词确认网络上进行唤醒词确认,得到最终确认得分;判断该检出的唤醒词是否为真实的唤醒词,即将该唤醒词的最终确认得分和预先设定的门限进行比较,如果最终确认得分大于等于门限,则认为该唤醒词是真实的唤醒词,语音唤醒成功;如果最终确认得分小于门限,则认为该唤醒词为虚假的唤醒词,重新回到步骤S21继续进行声学特征提取。
上述声学模型的训练分为两部分,分别为音素声学模型和废料模型(即Garbage模型);音素声学模型采用传统的语音识别中的声学模型训练方法,选取数据库,利用基于MLE(Maximum Likelihood Estimation,最大似然估计)和MPE(Minimum Phone Error,最小音素错误)区分性训练准则下得到;Garbage模型用于吸收除唤醒词之外的无关语音,使用和训练音素模型同样的数据库,通过计算各音素模型之间的相似性,将各音素分为20类,使用每类音素对应的所有训练数据融合起来,采用MLE准则训练对应的Garbage模型,便得到20类Garbage模型。
上述唤醒词检测网络的实现方法是采用最优得分路径计算得出,最优得分路径的计算公式是:
现用X代表从音频信息中提取的声学特征向量,W代表得分最大的最优词序列;条件概率P(X|W)为声学模型得分,通过训练好的声学模型计算得到;先验概率P(W)为语言模型得分,即为对不同的声学模型所加的PenaltyP(X)为全概率,当声学模型和唤醒词检测网络确定下来后即是定值。在此基础上,唤醒词确认网络的实现方法是:
a)将检出的唤醒词解码到音素一级,并记录所有的得分:
(Scorephone1,Scorephone2,…,ScorephoneN),其中N为唤醒词中总的音素个数,Scorephone1,Scorephone2,…,ScorephoneN分别表示该唤醒词中各音素的解码得分。
b)计算得到唤醒词每个音素的确认得分,计算方式如下:
其中Kistart和Kiend分别为第i个音素的起始时间和结束时间;
CMphonei表示第i个音素的确认得分,下标phonei表示第i个音素,Scorephonei如上面所示第i个音素的解码得分,Scoreframek表示使用唤醒词确认网络解码得到的第k帧的得分;
c)计算得到该唤醒词的最终确认得分CMword,计算方式如下所示:
在此,本发明也可以采用语音交互领域中惯常采用的其他唤醒检测方法。
上述指令获取终止事件可根据需要设定,例如包括:语音段结束,语音段已持续至于唤醒成功起的第一设定时间,及于唤醒成功起的第二设定时间内未检测到语音段。本领域技术人员可以根据实际应用场合将该第一设定时间设置为固定值,或者将该第一设定时间设置为可由用户输入确定,通常情况下,该第一设定时间在800ms至2000ms的范围内选择,例如选择为1000ms。在此,为了加快唤醒检测的效率,该第二设定时间通常小于第一设定时间,例如使第二设定时间小于等于第一设定时间的三分之二,为了避免误判断,该第一设定时间也不宜过小,通常大于等于第一设定时间的三分之一,在本实施例中,该第二设定时间等于第一设定时间的一半。
上述语音段结束表示检测到语音段的后端点,于唤醒成功起的第二设定时间内未检测到语音段表示于唤醒成功起的第二设定时间内未检测到语音段的前端点。在进行语音指令的获取操作时,具体为如果于唤醒成功起的第二设定时间内未检测到语音段的前端点,则认为用户仅执行了唤醒,如果检测到语音段的前端点,则开始检测语音段的后端点,如果检测到语音段的后端点,则语音段结束,如果检测到语音段已持续至于唤醒成功起的第一设定时间,则认为语音段于唤醒成功起的第一设定时间时结束。在此,每个语音段的开始和结束分别对应语音段的前端点和后端点,前端点就是非语音段到语音段的边界帧,后端点就是语音段到非语音段的边界帧,对音频信号处理时,首先对音频进行分帧,然后对音频的每帧数据计算能量特征,能量特征超过设定的数值就认为该帧数据是语音,否则是非语音,因此,语音段是连续一定长度的帧数据都满足语音的要求得到的。
为了使用户可在输入语音指令失败后继续进行语音交互,与现有语音交互方法相同,本发明的方法还包括:在检测到任一交互失败事件时执行图1所示的步骤S7,即提示用户重新输入语音指令,其中,该交互失败事件包括于唤醒成功起的第二设定时间内未检测到语音段,及确定语音识别结果无效。
本发明的语音交互方法还包括:发生任一上述指令获取终止事件后,停止录制用户输入的音频信息。与现有技术相同,该录制操作将于提示用户进行下一次交互时开启,如于上述的提示用户重新输入语音指令时开启。
对应上述的语音交互方法,本发明还提供了一种语音交互系统,如图2所示,该语音交互系统包括录音模块1、唤醒模块2、语音活动检测模块3、语音识别模块4、判断模块5和执行模块6,该录音模块1用于录制用户输入的音频信息;唤醒模块2用于获取音频信息进行唤醒检测,直至唤醒成功;语音活动检测模块3用于获取音频信息中于唤醒成功起的语音段作为语音指令,直至检测到设定的任一指令获取终止事件(请参见上述说明理解指令获取终止事件);语音识别模块4用于对语音指令进行语音识别,得到语音识别结果;判断模块5用于判断语音识别结果是否有效;执行模块6用于执行有效的语音识别结果。
本发明的语音交互系统还可包括如图2所示的语音输出模块7,用于在检测到任一交互失败事件(请参见上述说明理解交互失败事件)时提示用户重新输入语音指令。
上述录音模块1可在发生任一所述指令获取终止事件后,停止录制用户输入的音频信息。
以上依据图式所示的实施例详细说明了本发明的构造、特征及作用效果,以上所述仅为本发明的较佳实施例,但本发明不以图面所示限定实施范围,凡是依照本发明的构想所作的改变,或修改为等同变化的等效实施例,仍未超出说明书与图示所涵盖的精神时,均应在本发明的保护范围内。
Claims (10)
1.一种语音交互方法,其特征在于,包括:
录制用户输入的音频信息;
获取所述音频信息进行唤醒检测,直至唤醒成功;
获取所述音频信息中于唤醒成功起的语音段作为语音指令,直至检测到设定的任一指令获取终止事件;
对所述语音指令进行语音识别,得到语音识别结果;
判断所述语音识别结果是否有效,如果有效则执行所述语音识别结果。
2.根据权利要求1所述的语音交互方法,其特征在于,所述指令获取终止事件包括:所述语音段结束,所述语音段已持续至于唤醒成功起的第一设定时间,及于唤醒成功起的第二设定时间内未检测到所述语音段。
3.根据权利要求1所述的语音交互方法,其特征在于,所述方法还包括:
在检测到任一交互失败事件时提示用户重新输入语音指令,其中,所述交互失败事件包括于唤醒成功起的第二设定时间内未检测到所述语音段,及确定所述语音识别结果无效。
4.根据权利要求2或3所述的语音交互方法,其特征在于,所述第二设定时间小于所述第一设定时间。
5.根据权利要求1、2或3所述的语音交互方法,其特征在于,所述方法还包括:
发生任一所述指令获取终止事件后,停止录制用户输入的音频信息。
6.一种语音交互系统,其特征在于,包括:
录音模块,用于录制用户输入的音频信息;
唤醒模块,用于获取所述音频信息进行唤醒检测,直至唤醒成功;
语音活动检测模块,用于获取所述音频信息中于唤醒成功起的语音段作为语音指令,直至检测到设定的任一指令获取终止事件;
语音识别模块,用于对所述语音指令进行语音识别,得到语音识别结果;
判断模块,用于判断所述语音识别结果是否有效;以及,
执行模块,用于执行有效的语音识别结果。
7.根据权利要求6所述的系统,其特征在于,所述指令获取终止事件包括:所述语音段结束,所述语音段已持续至于唤醒成功起的第一设定时间,及于唤醒成功起的第二设定时间内未检测到所述语音段。
8.根据权利要求6所述的系统,其特征在于,所述系统还包括语音输出模块,用于在检测到任一交互失败事件时提示用户重新输入语音指令,其中,所述交互失败事件包括于唤醒成功起的第二设定时间内未检测到所述语音段,及确定所述语音识别结果无效。
9.根据权利要求7或8所述的系统,其特征在于,所述第二设定时间小于所述第一设定时间。
10.根据权利要求6、7或8所述的系统,其特征在于,所述录音模块还用于在发生任一所述指令获取终止事件后,停止录制用户输入的音频信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410158639.2A CN103943105A (zh) | 2014-04-18 | 2014-04-18 | 一种语音交互方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410158639.2A CN103943105A (zh) | 2014-04-18 | 2014-04-18 | 一种语音交互方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103943105A true CN103943105A (zh) | 2014-07-23 |
Family
ID=51190738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410158639.2A Pending CN103943105A (zh) | 2014-04-18 | 2014-04-18 | 一种语音交互方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103943105A (zh) |
Cited By (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105529025A (zh) * | 2014-09-28 | 2016-04-27 | 联想(北京)有限公司 | 一种语音操作输入方法及电子设备 |
CN105575392A (zh) * | 2014-10-28 | 2016-05-11 | 福特全球技术公司 | 用于用户交互的系统和方法 |
CN105654943A (zh) * | 2015-10-26 | 2016-06-08 | 乐视致新电子科技(天津)有限公司 | 一种语音唤醒方法、装置及系统 |
CN105912111A (zh) * | 2016-04-06 | 2016-08-31 | 北京地平线机器人技术研发有限公司 | 人机交互中的结束语音对话的方法及语音识别装置 |
CN106601245A (zh) * | 2016-12-15 | 2017-04-26 | 北京塞宾科技有限公司 | 一种车载智能音频装置及音频处理方法 |
CN106653021A (zh) * | 2016-12-27 | 2017-05-10 | 上海智臻智能网络科技股份有限公司 | 语音唤醒的控制方法、装置及终端 |
CN106782554A (zh) * | 2016-12-19 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
CN106887227A (zh) * | 2015-12-16 | 2017-06-23 | 芋头科技(杭州)有限公司 | 一种语音唤醒方法及系统 |
CN107230142A (zh) * | 2017-07-12 | 2017-10-03 | 陈维龙 | 基于语音生成订单的方法及装置、交易方法及系统 |
CN107527614A (zh) * | 2016-06-21 | 2017-12-29 | 瑞昱半导体股份有限公司 | 语音控制系统及其方法 |
CN107678465A (zh) * | 2017-11-07 | 2018-02-09 | 厦门盈趣科技股份有限公司 | 温度控制系统及方法 |
CN107886944A (zh) * | 2017-11-16 | 2018-04-06 | 出门问问信息科技有限公司 | 一种语音识别方法、装置、设备及存储介质 |
CN108320733A (zh) * | 2017-12-18 | 2018-07-24 | 上海科大讯飞信息科技有限公司 | 语音数据处理方法及装置、存储介质、电子设备 |
CN108711427A (zh) * | 2018-05-18 | 2018-10-26 | 出门问问信息科技有限公司 | 语音信息的采集方法及装置 |
CN108848011A (zh) * | 2018-06-19 | 2018-11-20 | 广东美的制冷设备有限公司 | 家电设备及其语音交互方法和装置 |
CN109102806A (zh) * | 2018-09-29 | 2018-12-28 | 百度在线网络技术(北京)有限公司 | 用于语音交互的方法、装置、设备和计算机可读存储介质 |
CN109147779A (zh) * | 2018-08-14 | 2019-01-04 | 苏州思必驰信息科技有限公司 | 语音数据处理方法和装置 |
CN109360551A (zh) * | 2018-10-25 | 2019-02-19 | 珠海格力电器股份有限公司 | 一种语音识别方法及装置 |
WO2019037267A1 (zh) * | 2017-08-25 | 2019-02-28 | 深圳市沃特沃德股份有限公司 | 语音唤醒装置及方法 |
CN109616111A (zh) * | 2018-12-24 | 2019-04-12 | 北京恒泰实达科技股份有限公司 | 一种基于语音识别的场景交互控制方法 |
CN109859773A (zh) * | 2019-02-14 | 2019-06-07 | 北京儒博科技有限公司 | 一种声音的录制方法、装置、存储介质及电子设备 |
CN110634468A (zh) * | 2019-09-11 | 2019-12-31 | 中国联合网络通信集团有限公司 | 语音唤醒方法、装置、设备及计算机可读存储介质 |
CN111431782A (zh) * | 2020-03-23 | 2020-07-17 | 深圳市雪锐科技有限公司 | 车辆交互控制方法、装置及计算机可读存储介质 |
CN111524528A (zh) * | 2020-05-28 | 2020-08-11 | Oppo广东移动通信有限公司 | 防录音检测的语音唤醒方法及装置 |
WO2020228270A1 (zh) * | 2019-05-10 | 2020-11-19 | 平安科技(深圳)有限公司 | 语音处理方法、装置、计算机设备及存储介质 |
CN112189230A (zh) * | 2018-03-13 | 2021-01-05 | 海信视像科技股份有限公司 | 电子设备及电子设备控制方法 |
CN112673422A (zh) * | 2018-09-11 | 2021-04-16 | 日本电信电话株式会社 | 连续发言估计装置、连续发言估计方法以及程序 |
US11398228B2 (en) | 2018-01-29 | 2022-07-26 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Voice recognition method, device and server |
CN115985323A (zh) * | 2023-03-21 | 2023-04-18 | 北京探境科技有限公司 | 语音唤醒方法、装置、电子设备及可读存储介质 |
CN117153166A (zh) * | 2022-07-18 | 2023-12-01 | 荣耀终端有限公司 | 语音唤醒方法、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102118886A (zh) * | 2010-01-04 | 2011-07-06 | 中国移动通信集团公司 | 一种语音信息的识别方法和设备 |
US20120162540A1 (en) * | 2010-12-22 | 2012-06-28 | Kabushiki Kaisha Toshiba | Apparatus and method for speech recognition, and television equipped with apparatus for speech recognition |
CN102999161A (zh) * | 2012-11-13 | 2013-03-27 | 安徽科大讯飞信息科技股份有限公司 | 一种语音唤醒模块的实现方法及应用 |
CN103095911A (zh) * | 2012-12-18 | 2013-05-08 | 苏州思必驰信息科技有限公司 | 一种通过语音唤醒寻找手机的方法及系统 |
CN103700382A (zh) * | 2013-12-18 | 2014-04-02 | 安徽科大讯飞信息科技股份有限公司 | 一种可以自由定制对话的语音点播装置 |
-
2014
- 2014-04-18 CN CN201410158639.2A patent/CN103943105A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102118886A (zh) * | 2010-01-04 | 2011-07-06 | 中国移动通信集团公司 | 一种语音信息的识别方法和设备 |
US20120162540A1 (en) * | 2010-12-22 | 2012-06-28 | Kabushiki Kaisha Toshiba | Apparatus and method for speech recognition, and television equipped with apparatus for speech recognition |
CN102999161A (zh) * | 2012-11-13 | 2013-03-27 | 安徽科大讯飞信息科技股份有限公司 | 一种语音唤醒模块的实现方法及应用 |
CN103095911A (zh) * | 2012-12-18 | 2013-05-08 | 苏州思必驰信息科技有限公司 | 一种通过语音唤醒寻找手机的方法及系统 |
CN103700382A (zh) * | 2013-12-18 | 2014-04-02 | 安徽科大讯飞信息科技股份有限公司 | 一种可以自由定制对话的语音点播装置 |
Cited By (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105529025A (zh) * | 2014-09-28 | 2016-04-27 | 联想(北京)有限公司 | 一种语音操作输入方法及电子设备 |
CN105575392A (zh) * | 2014-10-28 | 2016-05-11 | 福特全球技术公司 | 用于用户交互的系统和方法 |
CN105654943A (zh) * | 2015-10-26 | 2016-06-08 | 乐视致新电子科技(天津)有限公司 | 一种语音唤醒方法、装置及系统 |
WO2017071182A1 (zh) * | 2015-10-26 | 2017-05-04 | 乐视控股(北京)有限公司 | 一种语音唤醒方法、装置及系统 |
CN106887227A (zh) * | 2015-12-16 | 2017-06-23 | 芋头科技(杭州)有限公司 | 一种语音唤醒方法及系统 |
CN105912111A (zh) * | 2016-04-06 | 2016-08-31 | 北京地平线机器人技术研发有限公司 | 人机交互中的结束语音对话的方法及语音识别装置 |
CN105912111B (zh) * | 2016-04-06 | 2018-11-09 | 北京地平线机器人技术研发有限公司 | 人机交互中的结束语音对话的方法及语音识别装置 |
CN107527614A (zh) * | 2016-06-21 | 2017-12-29 | 瑞昱半导体股份有限公司 | 语音控制系统及其方法 |
CN107527614B (zh) * | 2016-06-21 | 2021-11-26 | 瑞昱半导体股份有限公司 | 语音控制系统及其方法 |
CN106601245A (zh) * | 2016-12-15 | 2017-04-26 | 北京塞宾科技有限公司 | 一种车载智能音频装置及音频处理方法 |
CN106782554A (zh) * | 2016-12-19 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
CN106653021A (zh) * | 2016-12-27 | 2017-05-10 | 上海智臻智能网络科技股份有限公司 | 语音唤醒的控制方法、装置及终端 |
CN107230142A (zh) * | 2017-07-12 | 2017-10-03 | 陈维龙 | 基于语音生成订单的方法及装置、交易方法及系统 |
WO2019037267A1 (zh) * | 2017-08-25 | 2019-02-28 | 深圳市沃特沃德股份有限公司 | 语音唤醒装置及方法 |
CN107678465A (zh) * | 2017-11-07 | 2018-02-09 | 厦门盈趣科技股份有限公司 | 温度控制系统及方法 |
CN107886944A (zh) * | 2017-11-16 | 2018-04-06 | 出门问问信息科技有限公司 | 一种语音识别方法、装置、设备及存储介质 |
CN107886944B (zh) * | 2017-11-16 | 2021-12-31 | 出门问问创新科技有限公司 | 一种语音识别方法、装置、设备及存储介质 |
CN108320733A (zh) * | 2017-12-18 | 2018-07-24 | 上海科大讯飞信息科技有限公司 | 语音数据处理方法及装置、存储介质、电子设备 |
US11398228B2 (en) | 2018-01-29 | 2022-07-26 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Voice recognition method, device and server |
CN112189230A (zh) * | 2018-03-13 | 2021-01-05 | 海信视像科技股份有限公司 | 电子设备及电子设备控制方法 |
CN108711427A (zh) * | 2018-05-18 | 2018-10-26 | 出门问问信息科技有限公司 | 语音信息的采集方法及装置 |
CN108848011A (zh) * | 2018-06-19 | 2018-11-20 | 广东美的制冷设备有限公司 | 家电设备及其语音交互方法和装置 |
CN109147779A (zh) * | 2018-08-14 | 2019-01-04 | 苏州思必驰信息科技有限公司 | 语音数据处理方法和装置 |
CN112673422A (zh) * | 2018-09-11 | 2021-04-16 | 日本电信电话株式会社 | 连续发言估计装置、连续发言估计方法以及程序 |
CN109102806A (zh) * | 2018-09-29 | 2018-12-28 | 百度在线网络技术(北京)有限公司 | 用于语音交互的方法、装置、设备和计算机可读存储介质 |
CN109360551A (zh) * | 2018-10-25 | 2019-02-19 | 珠海格力电器股份有限公司 | 一种语音识别方法及装置 |
CN109616111A (zh) * | 2018-12-24 | 2019-04-12 | 北京恒泰实达科技股份有限公司 | 一种基于语音识别的场景交互控制方法 |
CN109616111B (zh) * | 2018-12-24 | 2023-03-14 | 北京恒泰实达科技股份有限公司 | 一种基于语音识别的场景交互控制方法 |
CN109859773A (zh) * | 2019-02-14 | 2019-06-07 | 北京儒博科技有限公司 | 一种声音的录制方法、装置、存储介质及电子设备 |
WO2020228270A1 (zh) * | 2019-05-10 | 2020-11-19 | 平安科技(深圳)有限公司 | 语音处理方法、装置、计算机设备及存储介质 |
CN110634468A (zh) * | 2019-09-11 | 2019-12-31 | 中国联合网络通信集团有限公司 | 语音唤醒方法、装置、设备及计算机可读存储介质 |
CN110634468B (zh) * | 2019-09-11 | 2022-04-15 | 中国联合网络通信集团有限公司 | 语音唤醒方法、装置、设备及计算机可读存储介质 |
CN111431782A (zh) * | 2020-03-23 | 2020-07-17 | 深圳市雪锐科技有限公司 | 车辆交互控制方法、装置及计算机可读存储介质 |
CN111524528A (zh) * | 2020-05-28 | 2020-08-11 | Oppo广东移动通信有限公司 | 防录音检测的语音唤醒方法及装置 |
CN117153166A (zh) * | 2022-07-18 | 2023-12-01 | 荣耀终端有限公司 | 语音唤醒方法、设备及存储介质 |
CN115985323A (zh) * | 2023-03-21 | 2023-04-18 | 北京探境科技有限公司 | 语音唤醒方法、装置、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103943105A (zh) | 一种语音交互方法及系统 | |
CN104464723B (zh) | 一种语音交互方法及系统 | |
US11217252B2 (en) | System and method of text zoning | |
CN103021409B (zh) | 一种语音启动拍照系统 | |
CN106448663B (zh) | 语音唤醒方法及语音交互装置 | |
CN103426428B (zh) | 语音识别方法及系统 | |
CN110706690A (zh) | 语音识别方法及其装置 | |
CN110047481B (zh) | 用于语音识别的方法和装置 | |
CN108962227B (zh) | 语音起点和终点检测方法、装置、计算机设备及存储介质 | |
CN109686383B (zh) | 一种语音分析方法、装置及存储介质 | |
CN107767861B (zh) | 语音唤醒方法、系统及智能终端 | |
CN103971685B (zh) | 语音命令识别方法和系统 | |
US20160077574A1 (en) | Methods and Apparatus for Unsupervised Wakeup with Time-Correlated Acoustic Events | |
CN111462756B (zh) | 声纹识别方法、装置、电子设备及存储介质 | |
TW201830377A (zh) | 一種語音端點檢測方法及語音辨識方法 | |
US20140337024A1 (en) | Method and system for speech command detection, and information processing system | |
CN109979474B (zh) | 语音设备及其用户语速修正方法、装置和存储介质 | |
CN106940998A (zh) | 一种设定操作的执行方法及装置 | |
CN109272991B (zh) | 语音交互的方法、装置、设备和计算机可读存储介质 | |
CN110767231A (zh) | 一种基于时延神经网络的声控设备唤醒词识别方法及装置 | |
CN112102850A (zh) | 情绪识别的处理方法、装置、介质及电子设备 | |
CN105210147B (zh) | 用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质 | |
US11308946B2 (en) | Methods and apparatus for ASR with embedded noise reduction | |
CN106782508A (zh) | 语音音频的切分方法和语音音频的切分装置 | |
CN109243427A (zh) | 一种车辆故障诊断方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Wangjiang Road high tech Development Zone Hefei city Anhui province 230088 No. 666 Applicant after: Iflytek Co., Ltd. Applicant after: China Mobile Communication Group Guangdong Co., Ltd. Address before: Wangjiang Road high tech Development Zone Hefei city Anhui province 230088 No. 666 Applicant before: Anhui USTC iFLYTEK Co., Ltd. Applicant before: China Mobile Communication Group Guangdong Co., Ltd. |
|
COR | Change of bibliographic data | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140723 |