CN109887507A - 一种降低相似语音命令词误识别率的方法 - Google Patents
一种降低相似语音命令词误识别率的方法 Download PDFInfo
- Publication number
- CN109887507A CN109887507A CN201910321370.8A CN201910321370A CN109887507A CN 109887507 A CN109887507 A CN 109887507A CN 201910321370 A CN201910321370 A CN 201910321370A CN 109887507 A CN109887507 A CN 109887507A
- Authority
- CN
- China
- Prior art keywords
- frequency
- misrecognition
- order word
- threshold value
- recognition rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
一种降低相似语音命令词误识别率的方法,包括如下步骤:S1.在设备的命令词中筛选出彼此容易误识别的命令词并分组;S2.统计客户使用设备时,对单个命令词的使用频率及误识别频率;S3.设置置信度分数调整触发条件;当使用频率及误识别频率达到触发条件时,对置信度分数进行调整;S4.反复进行步骤S2至S3,直至使用频率及误识别频率不能满足触发条件。采用本发明所述的降低相似语音命令词误识别率的方法,可以针对用户使用习惯和发音习惯调整命令词置信度分数,使设备对用户识别更具有针对性,可以显著降低误识别率;这种个性化调整措施还可以提高个体用户使用依赖性,增强用户使用语音控制的体验度。
Description
技术领域
本发明属于人工智能技术领域,涉及语音识别技术,具体涉及一种降低相似语音命令词误识别率的方法。
背景技术
目前语音识别作为一种常用的人机交互技术,已广泛应用于各类电子产品中,以其自然方便的交互方式收到了消费者的喜爱,逐渐成为了智能产品时代的主流交互控制方式。
语音识别目前有两类方式,一类是在线的自由对讲方式,用户使用时可以随意讲话,由产品设备采集到用户讲话内容,通过网络上传到云端服务器进行语义分析理解,解析出用户的用意,再通过网络传到产品设备中进行相应的操作控制,这种方式优点在于用户可自由讲话,比较接近人们的日常生活习惯,但缺点在于需要网络才能使用,且因涉及到需要上传语音数据,安全性较差,另外网络具有延时,网络识别的产品需要等待网络识别的结果需要花费的时间就较多。
考虑到上述方式的缺点,目前很多功能性的产品设备如空调、抽油烟机等设备都采用了另一类语音识别的方式,即通过离线的语音控制命令词的识别,进行产品设备的功能控制,该类方式无需使用网络,具有响应速度快,控制简单等优点,但需要事先设定好语音控制命令词,产品设备需识别到完整的语音控制命令词后才会响应,而在实际的产品设备应用环境中经常有语音相似的命令词或用户个别字发音不准等情况,比方生活中经常用到的四和十发音相似,可能会造成语音控制命令词识别错误,造成语音误识别率下降。影响用户体验。现有的语音模型和声学模型难以解决这种误识别问题。
发明内容
为克服现有技术存在的技术缺陷,本发明公开了一种降低相似语音命令词误识别率的方法。
本发明所述降低相似语音命令词误识别率的方法,包括如下步骤:
S1.在设备的命令词中筛选出彼此容易误识别的命令词并分组;
S2.统计客户使用设备时,对单个命令词的使用频率及误识别频率;
S3.设置置信度分数调整触发条件;当使用频率及误识别频率达到触发条件时,对置信度分数进行调整;
S4.反复进行步骤S2至S3,直至使用频率及误识别频率不能满足触发条件。
优选的,所述步骤S3中,设置使用频率阈值,误识别频率上调阈值;所述触发条件具体为:在使用频率高于使用频率阈值的条件下,误识别频率高于误识别频率上调阈值;
所述调整为:误识别频率高于误识别频率上调阈值的命令词,置信度分数调高。
优选的,所述步骤S3中,设置使用频率上调阈值和下调阈值,设置误识别频率阈值;所述触发条件具体为:使用频率高于使用频率上调阈值或低于使用频率下调阈值;且同组中存在至少一个命令词的误识别频率高于误识别频率阈值;
所述调整为:调高使用频率高于使用频率阈值的命令词置信度分数,或降低低于使用频率下调阈值的命令词置信度分数。
优选的,所述误识别的判断标准:命令词发出后时间T内被取消;该时间T为自定义的时间长度。
采用本发明所述的降低相似语音命令词误识别率的方法,可以针对用户使用习惯和发音习惯调整命令词置信度分数,使设备对用户识别更具有针对性,可以显著降低误识别率;这种个性化调整措施还可以提高个体用户使用依赖性,增强用户使用语音控制的体验度。
附图说明
图1为本发明所述降低相似语音命令词误识别率的方法的一种具体实施方式流程示意图。
具体实施方式
下面结合附图,对本发明的具体实施方式作进一步的详细说明。
本发明所述本发明所述降低相似语音命令词误识别率的方法,包括如下步骤:
S1.在设备的命令词中筛选出彼此容易误识别的命令词并分组;
S2.统计客户使用设备时,对单个命令词的使用频率及误识别频率;
S3.设置置信度分数调整触发条件;当使用频率及误识别频率达到触发条件时,对置信度分数进行调整;
S4.反复进行步骤S2至S3,直至使用频率及误识别频率不能满足触发条件。
优选的,所述步骤S3中,设置使用频率阈值,误识别频率上调阈值;所述触发条件具体为:在使用频率高于使用频率阈值的条件下,误识别频率高于误识别频率上调阈值;
所述调整为:误识别频率高于误识别频率上调阈值的命令词,置信度分数调高。
例如:对于语音控制的微波炉,存在容易混淆的命令词A1:加热四分钟和命令词A2:加热十分钟,及命令词A3:加热十四分钟。
用户使用时,统计发现对于命令词A1和A2,经常使用,而命令词A3加热十四分钟几乎不使用。
则可能命令词A1和A2的使用频率高于使用频率阈值,而命令词A3的调整不再考虑。
统计进一步发现命令词A1加热四分钟经常被误识别为命令词A2加热十分钟,而命令词A2几乎不发生误识别。
则命令词A1的误识别频率高于误识别频率上调阈值,系统自动上调命令词A1的置信识别度分数,使命令词A1更容易被识别,降低命令词A1的误识别率,直至命令词A1的误识别率低于误识别频率上调阈值。
上述方式可以降低用户经常容易发错音的命令词的误识别率。
对于经常被使用或几乎不被使用的命令词,也可以对置信度分数进行调整以进行区别,降低误识别率。
仍然以命令词A1:加热四分钟和命令词A2:加热十分钟为例,现实中发现命令词A1经常使用,命令词A2几乎没人使用,则可能出现命令词A1的使用频率高于使用频率上调阈值,命令词A2的使用频率低于使用频率下调阈值;
此时调高命令词A1置信度分数,使A1降低误识别率,直至误识别率低于误识别率阈值;提高命令词A2置信度分数,实际也可以降低A1被误识别为A2的几率。
该优选实施方式中,误识别率阈值通常相对第一种方式更低,例如可以是连续100次都无误识别;这种方式可以提高对用户常用词的识别准确度。
所述误识别现象一般是用户发出指令后,发现设备的反馈语音或反馈动作与用户预想不同,此时用户会迅速发出命令取消之前指令的执行,可以设定误识别的判断标准为,命令词发出后时间T内被取消;该时间T为自定义的时间长度,例如3秒或其它时间。
采用本发明所述的降低相似语音命令词误识别率的方法,可以针对用户使用习惯和发音习惯调整命令词置信度分数,使设备对用户识别更具有针对性,可以显著降低误识别率;这种个性化调整措施还可以提高个体用户使用依赖性,增强用户使用语音控制的体验度。
前文所述的为本发明的各个优选实施例,各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提,各个优选实施方式都可以任意叠加组合使用,所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。
Claims (4)
1.一种降低相似语音命令词误识别率的方法,其特征在于,包括如下步骤:
S1.在设备的命令词中筛选出彼此容易误识别的命令词并分组;
S2.统计客户使用设备时,对单个命令词的使用频率及误识别频率;
S3.设置置信度分数调整触发条件;当使用频率及误识别频率达到触发条件时,对置信度分数进行调整;
S4.反复进行步骤S2至S3,直至使用频率及误识别频率不能满足触发条件。
2.如权利要求1所述的降低相似语音命令词误识别率的方法,其特征在于,所述步骤S3中,设置使用频率阈值,误识别频率上调阈值;所述触发条件具体为:在使用频率高于使用频率阈值的条件下,误识别频率高于误识别频率上调阈值;
所述调整为:误识别频率高于误识别频率上调阈值的命令词,置信度分数调高。
3.如权利要求1所述的降低相似语音命令词误识别率的方法,其特征在于,所述步骤S3中,设置使用频率上调阈值和下调阈值,设置误识别频率阈值;所述触发条件具体为:使用频率高于使用频率上调阈值或低于使用频率下调阈值;且同组中存在至少一个命令词的误识别频率高于误识别频率阈值;
所述调整为:调高使用频率高于使用频率阈值的命令词置信度分数,或降低低于使用频率下调阈值的命令词置信度分数。
4.如权利要求1所述的降低相似语音命令词误识别率的方法,其特征在于,所述误识别的判断标准:命令词发出后时间T内被取消;该时间T为自定义的时间长度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910321370.8A CN109887507B (zh) | 2019-04-22 | 2019-04-22 | 一种降低相似语音命令词误识别率的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910321370.8A CN109887507B (zh) | 2019-04-22 | 2019-04-22 | 一种降低相似语音命令词误识别率的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109887507A true CN109887507A (zh) | 2019-06-14 |
CN109887507B CN109887507B (zh) | 2021-03-12 |
Family
ID=66937945
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910321370.8A Active CN109887507B (zh) | 2019-04-22 | 2019-04-22 | 一种降低相似语音命令词误识别率的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109887507B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110265018A (zh) * | 2019-07-01 | 2019-09-20 | 成都启英泰伦科技有限公司 | 一种连续发出的重复命令词识别方法 |
CN110827792A (zh) * | 2019-11-15 | 2020-02-21 | 广州视源电子科技股份有限公司 | 语音播报方法及装置 |
CN110989963A (zh) * | 2019-11-22 | 2020-04-10 | 北京梧桐车联科技有限责任公司 | 唤醒词推荐方法及装置、存储介质 |
CN111326149A (zh) * | 2020-02-25 | 2020-06-23 | 青岛海尔空调器有限总公司 | 一种提高语音辨识率的优化方法及系统 |
CN113823276A (zh) * | 2021-09-29 | 2021-12-21 | 成都启英泰伦科技有限公司 | 一种语音识别阈值设置方法 |
CN115206299A (zh) * | 2022-09-15 | 2022-10-18 | 成都启英泰伦科技有限公司 | 一种基于命令词语音识别的易混淆词防误识别方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3605682B2 (ja) * | 1996-05-16 | 2004-12-22 | 本田技研工業株式会社 | 音声入力制御装置 |
CN101075434A (zh) * | 2006-05-18 | 2007-11-21 | 富士通株式会社 | 语音识别装置及存储语音识别程序的记录介质 |
CN102243871A (zh) * | 2010-05-14 | 2011-11-16 | 索尼计算机娱乐公司 | 作为语音识别错误预测器的用于语法适合度评估的方法和系统 |
CN103531197A (zh) * | 2013-10-11 | 2014-01-22 | 安徽科大讯飞信息科技股份有限公司 | 一种对用户语音识别结果反馈的命令词识别自适应优化方法 |
CN104584119A (zh) * | 2012-07-03 | 2015-04-29 | 谷歌公司 | 确定热词适合度 |
CN104731548A (zh) * | 2013-12-24 | 2015-06-24 | 财团法人工业技术研究院 | 辨识网络产生装置及其方法 |
KR20160044859A (ko) * | 2014-10-16 | 2016-04-26 | 현대자동차주식회사 | 음성 인식 장치, 이를 포함하는 차량, 및 음성 인식 방법 |
CN107452376A (zh) * | 2016-05-31 | 2017-12-08 | 九阳股份有限公司 | 一种通过语音控制烹饪的方法 |
CN108399914A (zh) * | 2017-02-06 | 2018-08-14 | 北京搜狗科技发展有限公司 | 一种语音识别的方法和装置 |
CN108564951A (zh) * | 2018-03-02 | 2018-09-21 | 北京云知声信息技术有限公司 | 智能降低语音控制设备误唤醒概率的方法 |
CN108733650A (zh) * | 2018-05-14 | 2018-11-02 | 科大讯飞股份有限公司 | 个性化词获取方法及装置 |
CN108847219A (zh) * | 2018-05-25 | 2018-11-20 | 四川斐讯全智信息技术有限公司 | 一种唤醒词预设置信度阈值调节方法及系统 |
CN108877774A (zh) * | 2018-07-12 | 2018-11-23 | 四川虹美智能科技有限公司 | 一种数据采集装置、数据分析平台、系统及方法 |
-
2019
- 2019-04-22 CN CN201910321370.8A patent/CN109887507B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3605682B2 (ja) * | 1996-05-16 | 2004-12-22 | 本田技研工業株式会社 | 音声入力制御装置 |
CN101075434A (zh) * | 2006-05-18 | 2007-11-21 | 富士通株式会社 | 语音识别装置及存储语音识别程序的记录介质 |
CN102243871A (zh) * | 2010-05-14 | 2011-11-16 | 索尼计算机娱乐公司 | 作为语音识别错误预测器的用于语法适合度评估的方法和系统 |
CN104584119A (zh) * | 2012-07-03 | 2015-04-29 | 谷歌公司 | 确定热词适合度 |
CN103531197A (zh) * | 2013-10-11 | 2014-01-22 | 安徽科大讯飞信息科技股份有限公司 | 一种对用户语音识别结果反馈的命令词识别自适应优化方法 |
CN104731548A (zh) * | 2013-12-24 | 2015-06-24 | 财团法人工业技术研究院 | 辨识网络产生装置及其方法 |
KR20160044859A (ko) * | 2014-10-16 | 2016-04-26 | 현대자동차주식회사 | 음성 인식 장치, 이를 포함하는 차량, 및 음성 인식 방법 |
CN107452376A (zh) * | 2016-05-31 | 2017-12-08 | 九阳股份有限公司 | 一种通过语音控制烹饪的方法 |
CN108399914A (zh) * | 2017-02-06 | 2018-08-14 | 北京搜狗科技发展有限公司 | 一种语音识别的方法和装置 |
CN108564951A (zh) * | 2018-03-02 | 2018-09-21 | 北京云知声信息技术有限公司 | 智能降低语音控制设备误唤醒概率的方法 |
CN108733650A (zh) * | 2018-05-14 | 2018-11-02 | 科大讯飞股份有限公司 | 个性化词获取方法及装置 |
CN108847219A (zh) * | 2018-05-25 | 2018-11-20 | 四川斐讯全智信息技术有限公司 | 一种唤醒词预设置信度阈值调节方法及系统 |
CN108877774A (zh) * | 2018-07-12 | 2018-11-23 | 四川虹美智能科技有限公司 | 一种数据采集装置、数据分析平台、系统及方法 |
Non-Patent Citations (2)
Title |
---|
FEIPENG LI ET AL.: "《Manipulation of Consonants in Natural Speech》", 《IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING ( VOLUME: 19, ISSUE: 3, MARCH 2011)》 * |
武玉峰等: "《易混淆语音特征提取方法的研究》", 《南京邮电大学学报(自然科学版)》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110265018A (zh) * | 2019-07-01 | 2019-09-20 | 成都启英泰伦科技有限公司 | 一种连续发出的重复命令词识别方法 |
CN110265018B (zh) * | 2019-07-01 | 2022-03-04 | 成都启英泰伦科技有限公司 | 一种连续发出的重复命令词识别方法 |
CN110827792A (zh) * | 2019-11-15 | 2020-02-21 | 广州视源电子科技股份有限公司 | 语音播报方法及装置 |
CN110827792B (zh) * | 2019-11-15 | 2022-06-03 | 广州视源电子科技股份有限公司 | 语音播报方法及装置 |
CN110989963A (zh) * | 2019-11-22 | 2020-04-10 | 北京梧桐车联科技有限责任公司 | 唤醒词推荐方法及装置、存储介质 |
CN111326149A (zh) * | 2020-02-25 | 2020-06-23 | 青岛海尔空调器有限总公司 | 一种提高语音辨识率的优化方法及系统 |
CN113823276A (zh) * | 2021-09-29 | 2021-12-21 | 成都启英泰伦科技有限公司 | 一种语音识别阈值设置方法 |
CN113823276B (zh) * | 2021-09-29 | 2023-06-02 | 成都启英泰伦科技有限公司 | 一种语音识别阈值设置方法 |
CN115206299A (zh) * | 2022-09-15 | 2022-10-18 | 成都启英泰伦科技有限公司 | 一种基于命令词语音识别的易混淆词防误识别方法 |
CN115206299B (zh) * | 2022-09-15 | 2022-11-11 | 成都启英泰伦科技有限公司 | 一种基于命令词语音识别的易混淆词防误识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109887507B (zh) | 2021-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109887507A (zh) | 一种降低相似语音命令词误识别率的方法 | |
CN106653021B (zh) | 语音唤醒的控制方法、装置及终端 | |
CN107818798B (zh) | 客服服务质量评价方法、装置、设备及存储介质 | |
US20170270922A1 (en) | Smart home control method based on emotion recognition and the system thereof | |
CN108766441B (zh) | 一种基于离线声纹识别和语音识别的语音控制方法及装置 | |
WO2020228270A1 (zh) | 语音处理方法、装置、计算机设备及存储介质 | |
CN108520743A (zh) | 智能设备的语音控制方法、智能设备及计算机可读介质 | |
NZ725145A (en) | Methods and systems for managing dialogs of a robot | |
KR20200012928A (ko) | 사용자 정의 가능한 웨이크업 음성 명령 | |
CN108172242B (zh) | 一种改进的蓝牙智能云音箱语音交互端点检测方法 | |
JP2018507434A (ja) | ロボットシステムの音声識別システム及び方法 | |
EP3422344B1 (en) | Electronic device for performing operation corresponding to voice input | |
CN112820291A (zh) | 智能家居控制方法、系统和存储介质 | |
CN108897517B (zh) | 一种信息处理方法及电子设备 | |
CN112634897B (zh) | 设备唤醒方法、装置和存储介质及电子装置 | |
JP6915637B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2016020963A (ja) | 対話評価装置、対話評価システム、対話評価方法および対話評価プログラム | |
KR20190096308A (ko) | 전자기기 | |
CN109979434A (zh) | 本地语音模组产品声学性能的测试方法 | |
CN109920427A (zh) | 基于语音控制的音量调节方法 | |
CN107742516B (zh) | 智能识别方法、机器人及计算机可读存储介质 | |
WO2022166340A1 (zh) | 空调器室内机的控制方法及控制设备 | |
CN108766443A (zh) | 匹配阈值的调整方法、装置、存储介质及电子设备 | |
CN207458576U (zh) | 一种实时更换唤醒词的设备 | |
CN115719592A (zh) | 一种语音信息处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |