CN111192573A - 基于语音识别的设备智能化控制方法 - Google Patents
基于语音识别的设备智能化控制方法 Download PDFInfo
- Publication number
- CN111192573A CN111192573A CN201811264418.8A CN201811264418A CN111192573A CN 111192573 A CN111192573 A CN 111192573A CN 201811264418 A CN201811264418 A CN 201811264418A CN 111192573 A CN111192573 A CN 111192573A
- Authority
- CN
- China
- Prior art keywords
- voice
- signal
- user
- external
- equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000009471 action Effects 0.000 claims abstract description 15
- 230000000875 corresponding effect Effects 0.000 claims description 30
- 230000008030 elimination Effects 0.000 claims description 21
- 238000003379 elimination reaction Methods 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 9
- 230000001276 controlling effect Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000001228 spectrum Methods 0.000 claims description 7
- 230000008439 repair process Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 abstract description 3
- 230000000694 effects Effects 0.000 description 4
- 241001672694 Citrus reticulata Species 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Selective Calling Equipment (AREA)
- Manipulator (AREA)
Abstract
本发明涉及一种基于语音识别的设备智能化控制方法,通过构建预设标准语音控制指令数据库及预设包括三种模式的工作模式组,设备在接收到切换至识别模式的指令后,就启动针对外部语音信号的识别工作,一旦采集的外部语音信号与任一预设标准语音控制指令匹配一致,设备执行该任一预设标准语音控制指令所对应的动作,设备在转入学习模式后启动针对用户语音的自学习,得到符合用户语音特点的语音特征参数集,避免设备难以将用户语音与预设标准语音控制指令做准确识别的情况发生,从而使该设备后续一旦再次采集到同样具有该语音特征参数集的语音时,就可准确识别出用户的个性化语音,提高设备对用户语音的识别准确率及设备对用户语音控制的响应效率。
Description
技术领域
本发明涉及设备控制领域,尤其涉及一种基于语音识别的设备智能化控制方法。
背景技术
随着设备智能化的不断发展,市场上不断涌现出具备各式各样操控功能的智能化设备。例如,相对设备的传统按键操控方式,现有智能设备具备了触摸式操控功能以及基于用户动作的手势操控功能。
然而,现有智能设备的操控方式存在一些缺陷:在用户操控诸如抽油烟机、蒸箱或者烤箱等设备过程中,现有设备的按键操控方式、触摸式操作以及手势操控仍然需要占用用户的单手或者双手,导致该用户将难以再腾出空闲的手去做其他事务,如此一来,势必降低用户对设备的操控体验效果。
发明内容
本发明所要解决的技术问题是针对上述现有技术提供一种基于语音识别的设备智能化控制方法。
本发明解决上述技术问题所采用的技术方案为:基于语音识别的设备智能化控制方法,其特征在于,包括如下步骤1至步骤6:
步骤1,构建控制设备执行动作的预设标准语音控制指令数据库;其中,所述预设标准语音控制指令数据库内存储有与设备所执行动作相对应的预设标准语音;
步骤2,预先设置针对所述设备启动语音识别工作的工作模式组;其中,所述设备的工作模式组包括空闲模式、学习模式和识别模式;
步骤3,所述设备在接收到外界选取的工作模式切换指令后,设备转入到该工作模式切换指令所对应的工作模式;
步骤4,所述设备在转入到识别模式后,该设备检测、获取设备外的外部语音信号,并对该外部语音信号做预处理;
步骤5,将所述预处理后的外部语音信号与所述预设标准语音控制指令数据库做匹配判断处理:
当所述预处理后的外部语音信号与所述预设标准语音控制指令数据库内的任一预设标准语音匹配一致时,将该预设标准语音作为外部语音控制指令,转入步骤6;否则,转入步骤2;
步骤6,命令设备执行与所述外部语音控制指令相对应的动作。
进一步地,在所述基于语音识别的设备智能化控制方法中,在步骤4中,针对所述外部语音信号的预处理过程包括如下步骤4-1至步骤4-4:
步骤4-1,针对所述外部语音信号做端点检测,获取所述外部语音信号中的用户语音信号和外部噪声信号;
步骤4-2,消除所述外部语音信号中的外部噪声信号,得到消噪处理后的用户语音信号;
步骤4-3,按照预设的语音特征参数,提取所述用户语音信号中的语音特征参数集合;
步骤4-4,将提取的所述语音特征参数集合作为针对所述外部语音信号的预处理结果。
再进一步地,在步骤4-1中,所述外部语音信号中的用户语音信号和外部噪声信号获取过程如下步骤a1至步骤a3:
步骤a1,构建融合有用户语音信号和外部噪声信号的语音模型;其中,所述语音模型如下:
其中,xk是所选取信号的子带能量;z=0时,代表所选取信号为外部噪声信号;z=1时,代表所选取信号为用户语音信号;rk是包括参数μz和参数σ2的参数集合;μz表示信号z振幅的均值,σ2表示信号z的能量;p(xk|z,rk)表示所选取信号为z的概率;
步骤a2,根据构建的所述语音模型,计算所述外部语音信号内的信号分别为用户语音信号的概率和外部噪声信号的概率;
步骤a3,根据步骤a2所得概率结果,利用假设检验方法确定所述外部语音信号的信号类型;其中所述信号类型为用户语音信号或者外部噪声信号。
再进一步地,在步骤a3中,所述外部语音信号中的用户语音信号和外部噪声信号的信号类型确定过程包括如下步骤b1至步骤b7:
步骤b1,利用启动步骤5前的第一预设帧数的信号特征数据构建噪声模型;
步骤b2,利用启动步骤5前的第二预设帧数的信号强度计算归一化频谱差值;
步骤b3,根据构建的所述噪声模型以及所得归一化频谱差值,采用概率密度函数计算出每帧信号内的信噪比以及区分出用户语音信号和外部噪声信号;
步骤b4,根据所得每帧信号内的信噪比,使用维纳滤波器在频域内消除所述外部语音信号中的外部噪声信号;
步骤b5,计算所述外部语音信号在消噪前后所对应的消噪前后能量比以及所述外部语音信号在消噪前后所对应的消噪前后信噪似然比;
步骤b6,利用所述消噪前后能量比和所述消噪前后信噪似然比,对消除噪声后的所述外部语音信号做修复调整;
步骤b7,将修复调整后的所述外部语音信号作为用户语音信号输出。
改进地,在所述基于语音识别的设备智能化控制方法中,在步骤6成功执行完毕后还包括:步骤7,所述设备在接收到外界选取的切换至学习模式的指令后,所述设备转入到学习模式,由该设备针对用户语音执行自学习以及根据自学习结果再次执行相应动作。
进一步地,所述设备针对用户语音执行自学习以及根据自学习结果再次执行相应动作的过程包括如下步骤c1至步骤c5:
步骤c1,将与所述任一预设标准语音数据匹配一致的所述外部语音信号作为设备的待学习语音指令;
步骤c2,获取用户再次发出的与该待学习语音指令内容相同的多次用户语音控制指令;
步骤c3,按照同样的语音特征参数提取方法,分别提取所述待学习语音指令的待学习语音特征参数集以及所述各次用户语音控制指令的用户语音特征参数集;
步骤c4,根据提取的所述待学习语音特征参数集和各次用户语音特征参数集做匹配判断:
当所述用户语音特征参数集与所述待学习语音特征参数集的匹配次数达到预设次数时,则将所述待学习语音特征参数集作为表征所述用户控制该设备的用户控制语音特征参数集;转入步骤c5;否则,反馈学习语音指令失败的提示信息给所述用户;
步骤c5,再次获取到包含有与所述用户控制语音特征参数集匹配一致的用户控制语音时,则由所述设备执行与该待学习语音指令相对应的动作。
可选择地,在所述基于语音识别的设备智能化控制方法中,所述设备在执行完毕学习模式或者学习执行时间超过预设时限或者接收到退出学习模式的指令后,该设备将当前的学习模式切换至识别模式。
可选择地,在所述基于语音识别的设备智能化控制方法中,所述预设标准语音控制指令数据库内的预设标准语音为设备系统自带的语音控制指令或者为由用户录入的语音指令。
改进地,在所述基于语音识别的设备智能化控制方法中,所述设备按照预设采集间隔检测、获取设备外的外部语音信号。
再改进地,所述基于语音识别的设备智能化控制方法还包括:
所述设备向外界播放语音提示;
所述设备在检测到自身播放语音提示后,停止针对外部语音信号的检测获取,且不处理当前已经获取到的外部语音信号;
所述设备在检测到自身播放语音提示停止后,重新启动针对外部语音信号的检测获取工作,转入步骤4。
进一步地,在所述基于语音识别的设备智能化控制方法中,所述设备为家用电器设备。
与现有技术相比,本发明的优点在于:
首先,本发明中的设备智能化控制方法通过将采集到的外部语音信号与先前已经存储到设备内的预设标准语音控制指令数据库做匹配,一旦采集的外部语音信号与任一预设标准语音控制指令匹配一致,则设备执行该任一预设标准语音控制指令所对应的动作,从而使得用户通过语音就可以对设备进行控制,避免了手动操控设备,有力地解放了用户的双手,提高了用户对设备的控制体验效果;
其次,本发明中的设备智能化控制方法通过针对设备设置不同的工作模式组(空闲模式、学习模式和识别模式),使得用户在向设备发出工作模式切换指令后,设备就可以及时切换到对应的工作模式,有效地提高了用户与设备之间的交互效果;
再次,不仅如此,本发明还通过令设备切换到学习模式后,由设备针对用户语音执行自学习,从而得到符合用户个性化特点的语音特征参数集,避免了设备难以将用户发音时的方言与预设标准语音控制指令匹配准确度不高的问题,尤其是更加符号普通话不标准或者不会普通话的人群,由此使得该设备后续一旦再次采集到同样具有该语音特征参数集的语音时,设备就可以准确地识别出用户的个性化语音,提高了设备对用户语音的识别准确率以及设备对用户语音控制的交互响应效率。
附图说明
图1为本发明实施例中基于语音识别的设备智能化控制方法流程示意图。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
本实施例以厨电设备(或称厨房电器设备)作为例子,对本发明中的设备智能化控制方法做出说明。参见图1所示,该实施例中基于语音识别的设备智能化控制方法包括如下步骤1至步骤4:
步骤1,构建控制厨电设备执行动作的预设标准语音控制指令数据库;其中,在该预设标准语音控制指令数据库内存储有与该厨电设备所执行动作相对应的预设标准语音;
例如,针对厨电设备,该预设标准语音控制指令数据库内存储有使用标准普通话录入的“启动”语音控制指令S1、“结束”语音控制指令S2、“增大档位”语音控制指令S3以及“降低档位”语音控制指令S4等符合该厨电设备各种功能的标准语音;也就是说,只要用户发出的语音与这里存储的标准语音匹配程度达到所设置的程度,就可以认为用户发出了该标准语音;
当然,这里的预设标准语音控制指令数据库内的预设标准语音不仅可以是厨电设备在出厂时系统自带的语音控制指令,也可以是在用户购买该厨电设备后,由用户录入的语音控制指令;
步骤2,预先设置针对厨电设备启动语音识别工作的工作模式组;其中,该厨电设备的工作模式组包括空闲模式、学习模式和识别模式;也就是说,厨电设备根据外部的指令,可以在空闲模式、学习模式和识别模式这三种模式之间进行切换;
需要说明的是,在本实施例中,厨电设备在启动后默认进入到空闲模式,该厨电设备在接收到外界的模式切换指令后,才会从当前的空闲模式切换至学习模式或者识别模式;厨电设备的工作模式只能从一个工作模式切换到另一个工作模式,而不允许从一个工作模式同时切换到多个工作模式;
步骤3,厨电设备在接收到外界选取的工作模式切换指令后,厨电设备转入到该工作模式切换指令所对应的工作模式;
例如,厨电设备接收到了外界选取的关于从空闲模式变为识别模式的工作模式切换指令后,该厨电设备就将自身工作模式从当前的空闲模式切换到识别模式,进而执行针对外部的语音指令识别程序;
步骤4,设备在转入到识别模式后,该设备检测、获取设备外的外部语音信号,并对该外部语音信号做预处理;其中,在本实施例中,厨电设备按照预设采集间隔检测、获取设备外的外部语音信号;例如,厨电设备每隔6秒就去检测获取外部语音信号,以便于及时获取并识别出用户发出的语音控制指令;
具体地,在本实施例的步骤4中,针对此处外部语音信号的预处理过程包括如下步骤4-1至步骤4-4:
步骤4-1,针对外部语音信号做端点检测,获取该外部语音信号中的用户语音信号和外部噪声信号;
假设设备采集到的外部语音信号标记为X,通过执行端点检测后,该外部语音信号X中的用户语音信号为Sound,该外部语音信号X中的外部噪声信号为Noise;本实施例中的端点检测属于现有技术,此处不再赘述;
需要说明的是,本实施例所说外部语音信号中的用户语音信号和外部噪声信号获取过程如下步骤a1至步骤a3:
步骤a1,构建融合有用户语音信号和外部噪声信号的语音模型;其中,该语音模型如下:
其中,xk是所选取信号的子带能量;z=0时,代表所选取信号为外部噪声信号;z=1时,代表所选取信号为用户语音信号;rk是包括参数μz和参数σ2的参数集合;μz表示信号z振幅的均值,σ2表示信号z的能量;p(xk|z,rk)表示所选取信号为z的概率;
步骤a2,根据构建的语音模型,计算外部语音信号内的信号分别为用户语音信号的概率和外部噪声信号的概率;
步骤a3,根据步骤a2所得概率结果,利用作为现有技术的假设检验方法确定外部语音信号的信号类型;其中,信号类型为用户语音信号或者外部噪声信号;
具体地,在步骤a3中,外部语音信号中的用户语音信号和外部噪声信号的信号类型确定过程包括如下步骤b1至步骤b7:
步骤b1,利用启动步骤5前的第一预设帧数的信号特征数据构建噪声模型;
步骤b2,利用启动步骤5前的第二预设帧数的信号强度计算归一化频谱差值;
步骤b3,根据构建的噪声模型以及所得归一化频谱差值,采用概率密度函数计算出每帧信号内的信噪比,并且区分出用户语音信号和外部噪声信号;
步骤b4,根据所得每帧信号内的信噪比,使用维纳滤波器在频域内消除外部语音信号中的外部噪声信号;
步骤b5,计算外部语音信号在消噪前后所对应的消噪前后能量比以及外部语音信号在消噪前后所对应的消噪前后信噪似然比;
步骤b6,利用消噪前后能量比和消噪前后信噪似然比,对消除噪声后的外部语音信号做修复调整;
步骤b7,将修复调整后的外部语音信号作为用户语音信号输出。也就是说,经过步骤b6的修复调整处理,消除噪声后的外部语音信号就只剩下用户语音信号,从而达到了确定外部语音信号中的用户语音信号和外部噪声信号的目的;
在本实施例中,通过采用步骤b1~步骤b7的方式,可以将厨电设备所采集外部语音信号中的噪声消除,进而只剩下用户发出的语音指令,由此避免噪声对识别用户语音指令过程中的不利影响,提高针对厨电设备的语音控制指令识别率,增强厨电设备对用户所发出语音响应的及时性;
步骤4-2,消除该外部语音信号X中的外部噪声信号Noise,得到消噪处理后的用户语音信号Sound;也就是说,在执行完毕该步骤2-2后,此处的所谓外部语音信号X中只剩下了用户的语音信号Sound;至于针对此处外部噪声信号Noise的消除,可以采用传统的小波滤噪方法,或者也可以按照上述步骤b1~步骤b4的方式消除此处的外部噪声信号Noise;
步骤4-3,按照预设的语音特征参数,提取用户语音信号中的语音特征参数集合;
例如,预设的语音特征参数可以是基于声音信号的振幅、频率或者频谱等参数得到的特征参数,而在语音特征参数集合中则包含了所需要用来识别语音用的特征参数;语音特征参数集合内的特征参数个数或者类型可以根据实际的需要选择性的设置;
步骤4-4,将提取的语音特征参数集合作为针对该外部语音信号的预处理结果;
步骤5,将预处理后的外部语音信号与预设标准语音控制指令数据库做匹配判断处理:
当预处理后的外部语音信号与预设标准语音控制指令数据库内的任一预设标准语音匹配一致时,说明预处理后的该外部语音信号内容就是要发送该任一预设标准语音所对应的内容,此时将该预设标准语音作为外部语音控制指令,转入步骤6;否则,转入步骤2;
步骤6,命令设备执行与该外部语音控制指令相对应的动作。例如,一旦判断预处理后的外部语音信号(具体地应该是经消噪处理后的用户语音信号Sound)与预设的标准语音“增大档位”语音控制指令S3匹配相一致时,说明用户此时向该厨电设备发出了“增大档位”的控制指令,从而此时的厨电设备就在自身当前档位的基础上增大档位,满足用户对该厨电设备的控制要求。
当然,为了符合用户语音的个性化特点,避免此处的厨电设备难以将用户发音时的方言与预设标准语音控制指令匹配准确度不高的问题,本实施例的设备智能化控制方法在步骤6成功执行完毕后还包括:步骤7,厨电设备针对用户语音执行自学习以及根据自学习结果再次执行相应动作。其中,厨电设备针对用户语音执行自学习以及根据自学习结果再次执行相应动作的过程具体包括如下步骤c1至步骤c5:
步骤c1,将与所述任一预设标准语音数据匹配一致的外部语音信号作为该厨电设备的待学习语音指令;
由于本实施例中假设预处理后的外部语音信号(具体地应该是经消噪处理后的用户语音信号Sound)与预设的标准语音“增大档位”语音控制指令S3匹配相一致,则在该步骤c1中,就将与该“增大档位”语音控制指令S3匹配一致的外部语音信号(具体地应该是经消噪处理后的用户语音信号Sound)作为该厨电设备的待学习语音指令;
步骤c2,获取用户再次发出的与该待学习语音指令内容相同的多次用户语音控制指令;
步骤c3,按照同样的语音特征参数提取方法,分别提取待学习语音指令的待学习语音特征参数集以及各次用户语音控制指令的用户语音特征参数集;
步骤c4,根据提取的待学习语音特征参数集和各次用户语音特征参数集做匹配判断:
当用户语音特征参数集与待学习语音特征参数集的匹配次数达到预设次数时,则将待学习语音特征参数集作为表征用户控制该设备的用户控制语音特征参数集;转入步骤c5;否则,反馈学习语音指令失败的提示信息给用户;
例如,这里要求厨电设备获取到与该待学习语音指令S3内容相同的三次用户语音控制指令,即第一次提取的用户语音指令标记为K1、第二次提取的用户语音指令标记为K3以及第三次提取的用户语音指令标记为K3;假设针对待学习语音指令和这三次用户语音控制指令所采用的语音特征参数集均包含语音特征参数1、语音特征参数2和语音特征参数3;其中,该步骤c4中的预设次数可以由厨电设备的系统预先设置好,也可以又厨电设备根据用户的设置进行调整;当然,预设次数所设置的数值越大,说明利用该待学习语音特征参数集成功识别用户语音的概率越大;
针对步骤c4的匹配判断过程补充说明如下:
在利用预设的语音特征参数集(包含语音特征参数1、语音特征参数2和语音特征参数3)去对待学习语音指令S3和第一次提取的用户语音指令K1做匹配时,如果两个语音指令所对应的三个语音特征参数均位于允许的匹配范围内时,就认为该用户语音指令K1与待学习语音指令S3匹配一致;
同样地,再次执行针对用户语音指令K2与待学习语音指令S3、以及用户语音指令K3与待学习语音指令S3的匹配判断;一旦在执行的这三次匹配过程中的匹配一致次数达到预设次数(例如,预设次数是两次),那么就将此处匹配用的语音特征参数集(包含语音特征参数1、语音特征参数2和语音特征参数3)作为表征该用户控制该设备的用户控制语音特征参数集;也就是说,后续针对该厨电设备的语音控制就以该用户控制语音特征参数集作为识别匹配的标准;
步骤c5,再次获取到包含有与用户控制语音特征参数集匹配一致的用户控制语音时,则由设备执行与该待学习语音指令相对应的动作。由此,通过令此处的厨电设备针对用户语音执行自学习,从而得到符合用户个性化特点的语音特征参数集,避免了厨电设备难以将用户发音时的方言与预设标准语音控制指令匹配准确度不高的问题,由此使得该厨电设备后续一旦再次采集到同样具有该语音特征参数集的语音时,厨电设备就可以准确地识别出用户的个性化语音,提高了厨电设备对用户语音的识别准确率以及该厨电设备对用户语音控制的交互响应效率。
当然,该厨电设备在执行完毕学习模式或者学习执行时间超过预设时限或者接收到退出学习模式的指令后,该厨电设将当前的学习模式切换至识别模式,从而继续及时检测、识别用户可能发来的语音控制指令。
考虑到厨电设备在实际工作中可能会发出语音提示,进而会干扰到该厨电设备对外部语音信号的识别准确率,本实施例中的设备智能化控制方法还进一步增加了如下步骤:
该厨电设备向外界播放语音提示;
该厨电设备在检测到自身播放语音提示后,停止针对外部语音信号的检测获取,且不处理当前已经获取到的外部语音信号;
该厨电设备在检测到自身播放语音提示停止后,重新启动针对外部语音信号的检测获取工作,转入步骤4,实施针对外部语音信号的预处理工作,以为执行后续的步骤5做准备。
至于该厨电设备在播放语音提示停止前所采集的语音信号,则可以由后续阶段(即该厨电设备播放语音提示停止后)所获取到的外部语音信号覆盖掉,从而避免增加厨电设备存储外部语音信号所占用的空间,提高了厨电设备的存储空间利用率。
另外,本实施例中的厨电设备还可以针对每个用户设置对应的用户账号,在用户利用自己的账户成功登录到该厨电设备的主控界面后,厨电设备就将针对该用户语音自主学习得到的用户控制语音特征参数集存储到该用户账户所对应的文件夹内,以便实现同一个厨电设备可以满足家庭内不同用户的语音控制需要,从而很好地满足不同用户针对该厨电设备的控制需求。
需要说明的是,本实施例中基于语音识别的设备智能化控制方法还可以应用在诸如空调器和电视机等家用电器设备或者工厂内的其他设备上。
Claims (10)
1.基于语音识别的设备智能化控制方法,其特征在于,包括如下步骤1至步骤6:
步骤1,构建控制设备执行动作的预设标准语音控制指令数据库;其中,所述预设标准语音控制指令数据库内存储有与设备所执行动作相对应的预设标准语音;
步骤2,预先设置针对所述设备启动语音识别工作的工作模式组;其中,所述设备的工作模式组包括空闲模式、学习模式和识别模式;
步骤3,所述设备在接收到外界选取的工作模式切换指令后,设备转入到该工作模式切换指令所对应的工作模式;
步骤4,所述设备在转入到识别模式后,该设备检测、获取设备外的外部语音信号,并对该外部语音信号做预处理;
步骤5,将所述预处理后的外部语音信号与所述预设标准语音控制指令数据库做匹配判断处理:
当所述预处理后的外部语音信号与所述预设标准语音控制指令数据库内的任一预设标准语音匹配一致时,将该预设标准语音作为外部语音控制指令,转入步骤6;否则,转入步骤2;
步骤6,命令设备执行与所述外部语音控制指令相对应的动作。
2.根据权利要求1所述基于语音识别的设备智能化控制方法,其特征在于,在步骤4中,针对所述外部语音信号的预处理过程包括如下步骤4-1至步骤4-4:
步骤4-1,针对所述外部语音信号做端点检测,获取所述外部语音信号中的用户语音信号和外部噪声信号;
步骤4-2,消除所述外部语音信号中的外部噪声信号,得到消噪处理后的用户语音信号;
步骤4-3,按照预设的语音特征参数,提取所述用户语音信号中的语音特征参数集合;
步骤4-4,将提取的所述语音特征参数集合作为针对所述外部语音信号的预处理结果。
3.根据权利要求2所述基于语音识别的设备智能化控制方法,其特征在于,在步骤4-1中,所述外部语音信号中的用户语音信号和外部噪声信号获取过程如下步骤a1至步骤a3:
步骤a1,构建融合有用户语音信号和外部噪声信号的语音模型;其中,所述语音模型如下:
其中,xk是所选取信号的子带能量;z=0时,代表所选取信号为外部噪声信号;z=1时,代表所选取信号为用户语音信号;rk是包括参数μz和参数σ2的参数集合;μz表示信号z振幅的均值,σ2表示信号z的能量;p(xk|z,rk)表示所选取信号为z的概率;
步骤a2,根据构建的所述语音模型,计算所述外部语音信号内的信号分别为用户语音信号的概率和外部噪声信号的概率;
步骤a3,根据步骤a2所得概率结果,利用假设检验方法确定所述外部语音信号的信号类型;其中所述信号类型为用户语音信号或者外部噪声信号。
4.根据权利要求3所述基于语音识别的设备智能化控制方法,其特征在于,在步骤a3中,所述外部语音信号中的用户语音信号和外部噪声信号的信号类型确定过程包括如下步骤b1至步骤b7:
步骤b1,利用启动步骤5前的第一预设帧数的信号特征数据构建噪声模型;
步骤b2,利用启动步骤5前的第二预设帧数的信号强度计算归一化频谱差值;
步骤b3,根据构建的所述噪声模型以及所得归一化频谱差值,采用概率密度函数计算出每帧信号内的信噪比以及区分出用户语音信号和外部噪声信号;
步骤b4,根据所得每帧信号内的信噪比,使用维纳滤波器在频域内消除所述外部语音信号中的外部噪声信号;
步骤b5,计算所述外部语音信号在消噪前后所对应的消噪前后能量比以及所述外部语音信号在消噪前后所对应的消噪前后信噪似然比;
步骤b6,利用所述消噪前后能量比和所述消噪前后信噪似然比,对消除噪声后的所述外部语音信号做修复调整;
步骤b7,将修复调整后的所述外部语音信号作为用户语音信号输出。
5.根据权利要求1所述基于语音识别的设备智能化控制方法,其特征在于,在步骤6成功执行完毕后还包括:步骤7,所述设备在接收到外界选取的切换至学习模式的指令后,所述设备转入到学习模式,由该设备针对用户语音执行自学习以及根据自学习结果再次执行相应动作。
6.根据权利要求5所述基于语音识别的设备智能化控制方法,其特征在于,所述设备针对用户语音执行自学习以及根据自学习结果再次执行相应动作的过程包括如下步骤c1至步骤c5:
步骤c1,将与所述任一预设标准语音数据匹配一致的所述外部语音信号作为设备的待学习语音指令;
步骤c2,获取用户再次发出的与该待学习语音指令内容相同的多次用户语音控制指令;
步骤c3,按照同样的语音特征参数提取方法,分别提取所述待学习语音指令的待学习语音特征参数集以及所述各次用户语音控制指令的用户语音特征参数集;
步骤c4,根据提取的所述待学习语音特征参数集和各次用户语音特征参数集做匹配判断:
当所述用户语音特征参数集与所述待学习语音特征参数集的匹配次数达到预设次数时,则将所述待学习语音特征参数集作为表征所述用户控制该设备的用户控制语音特征参数集;转入步骤c5;否则,反馈学习语音指令失败的提示信息给所述用户;
步骤c5,再次获取到包含有与所述用户控制语音特征参数集匹配一致的用户控制语音时,则由所述设备执行与该待学习语音指令相对应的动作。
7.根据权利要求6所述基于语音识别的设备智能化控制方法,其特征在于,所述设备在执行完毕学习模式或者学习执行时间超过预设时限或者接收到退出学习模式的指令后,该设备将当前的学习模式切换至识别模式。
8.根据权利要求1~6任一项所述基于语音识别的设备智能化控制方法,其特征在于,所述预设标准语音控制指令数据库内的预设标准语音为设备系统自带的语音控制指令或者为由用户录入的语音指令。
9.根据权利要求1~6任一项所述基于语音识别的设备智能化控制方法,其特征在于,所述设备按照预设采集间隔检测、获取设备外的外部语音信号。
10.根据权利要求9所述基于语音识别的设备智能化控制方法,其特征在于,还包括:
所述设备向外界播放语音提示;
所述设备在检测到自身播放语音提示后,停止针对外部语音信号的检测获取,且不处理当前已经获取到的外部语音信号;
所述设备在检测到自身播放语音提示停止后,重新启动针对外部语音信号的检测获取工作,转入步骤4。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811264418.8A CN111192573B (zh) | 2018-10-29 | 2018-10-29 | 基于语音识别的设备智能化控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811264418.8A CN111192573B (zh) | 2018-10-29 | 2018-10-29 | 基于语音识别的设备智能化控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111192573A true CN111192573A (zh) | 2020-05-22 |
CN111192573B CN111192573B (zh) | 2023-08-18 |
Family
ID=70708868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811264418.8A Active CN111192573B (zh) | 2018-10-29 | 2018-10-29 | 基于语音识别的设备智能化控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111192573B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111554300A (zh) * | 2020-06-30 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 音频数据处理方法、装置、存储介质及设备 |
CN113763935A (zh) * | 2021-08-20 | 2021-12-07 | 重庆长安汽车股份有限公司 | 车外语音控制车身电器的方法、系统、车辆及存储介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1236928A (zh) * | 1998-05-25 | 1999-12-01 | 郭巧 | 计算机辅助汉语智能教学系统及其实现方法 |
JP2000317869A (ja) * | 1999-05-12 | 2000-11-21 | Hitachi Ltd | マイクロロボット制御装置及び制御方法 |
US20040148166A1 (en) * | 2001-06-22 | 2004-07-29 | Huimin Zheng | Noise-stripping device |
CN1783211A (zh) * | 2004-11-25 | 2006-06-07 | Lg电子株式会社 | 语音区别方法 |
US20080199152A1 (en) * | 2007-02-15 | 2008-08-21 | Sony Corporation | Sound processing apparatus, sound processing method and program |
CN102117618A (zh) * | 2009-12-30 | 2011-07-06 | 华为技术有限公司 | 一种消除音乐噪声的方法、装置及系统 |
CN102890930A (zh) * | 2011-07-19 | 2013-01-23 | 上海上大海润信息系统有限公司 | 基于hmm/sofmnn混合模型的语音情感识别方法 |
KR20140060187A (ko) * | 2012-11-09 | 2014-05-19 | 현대자동차주식회사 | 음성인식시스템의 증폭율 조정장치 및 방법 |
CN105202721A (zh) * | 2015-07-31 | 2015-12-30 | 广东美的制冷设备有限公司 | 空调器及其控制方法 |
CN105791931A (zh) * | 2016-02-26 | 2016-07-20 | 深圳Tcl数字技术有限公司 | 智能电视及其语音控制方法 |
CN106057202A (zh) * | 2016-05-12 | 2016-10-26 | 王爱萍 | 中文学习用词语查询装置 |
CN107146615A (zh) * | 2017-05-16 | 2017-09-08 | 南京理工大学 | 基于匹配模型二次识别的语音识别方法及系统 |
US20180075859A1 (en) * | 2016-09-09 | 2018-03-15 | Continental Automotive Systems, Inc. | Robust noise estimation for speech enhancement in variable noise conditions |
WO2018107874A1 (zh) * | 2016-12-16 | 2018-06-21 | 广州视源电子科技股份有限公司 | 一种音频数据的自动增益控制方法与装置 |
CN108231063A (zh) * | 2016-12-13 | 2018-06-29 | 中国移动通信有限公司研究院 | 一种语音控制指令的识别方法及装置 |
-
2018
- 2018-10-29 CN CN201811264418.8A patent/CN111192573B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1236928A (zh) * | 1998-05-25 | 1999-12-01 | 郭巧 | 计算机辅助汉语智能教学系统及其实现方法 |
JP2000317869A (ja) * | 1999-05-12 | 2000-11-21 | Hitachi Ltd | マイクロロボット制御装置及び制御方法 |
US20040148166A1 (en) * | 2001-06-22 | 2004-07-29 | Huimin Zheng | Noise-stripping device |
CN1783211A (zh) * | 2004-11-25 | 2006-06-07 | Lg电子株式会社 | 语音区别方法 |
US20080199152A1 (en) * | 2007-02-15 | 2008-08-21 | Sony Corporation | Sound processing apparatus, sound processing method and program |
CN102117618A (zh) * | 2009-12-30 | 2011-07-06 | 华为技术有限公司 | 一种消除音乐噪声的方法、装置及系统 |
CN102890930A (zh) * | 2011-07-19 | 2013-01-23 | 上海上大海润信息系统有限公司 | 基于hmm/sofmnn混合模型的语音情感识别方法 |
KR20140060187A (ko) * | 2012-11-09 | 2014-05-19 | 현대자동차주식회사 | 음성인식시스템의 증폭율 조정장치 및 방법 |
CN105202721A (zh) * | 2015-07-31 | 2015-12-30 | 广东美的制冷设备有限公司 | 空调器及其控制方法 |
CN105791931A (zh) * | 2016-02-26 | 2016-07-20 | 深圳Tcl数字技术有限公司 | 智能电视及其语音控制方法 |
CN106057202A (zh) * | 2016-05-12 | 2016-10-26 | 王爱萍 | 中文学习用词语查询装置 |
US20180075859A1 (en) * | 2016-09-09 | 2018-03-15 | Continental Automotive Systems, Inc. | Robust noise estimation for speech enhancement in variable noise conditions |
CN108231063A (zh) * | 2016-12-13 | 2018-06-29 | 中国移动通信有限公司研究院 | 一种语音控制指令的识别方法及装置 |
WO2018107874A1 (zh) * | 2016-12-16 | 2018-06-21 | 广州视源电子科技股份有限公司 | 一种音频数据的自动增益控制方法与装置 |
CN107146615A (zh) * | 2017-05-16 | 2017-09-08 | 南京理工大学 | 基于匹配模型二次识别的语音识别方法及系统 |
Non-Patent Citations (2)
Title |
---|
SOHN J 等: "Wonyong. A Statistical Model-based Voice Activity Detection", 《IEEE SIGNAL PROCESSING LETTERS》, vol. 6, no. 1, pages 1 - 3 * |
章雒霏: "基于机器学习的双麦克风手机语音增强算法研究", 《中国博士学位论文全文数据库信息科技辑》, no. 01, pages 136 - 27 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111554300A (zh) * | 2020-06-30 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 音频数据处理方法、装置、存储介质及设备 |
CN113763935A (zh) * | 2021-08-20 | 2021-12-07 | 重庆长安汽车股份有限公司 | 车外语音控制车身电器的方法、系统、车辆及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111192573B (zh) | 2023-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111105798B (zh) | 基于语音识别的设备控制方法 | |
CN109817211B (zh) | 一种电器控制方法、装置、存储介质及电器 | |
CN109448711A (zh) | 一种语音识别的方法、装置及计算机存储介质 | |
CN104731549A (zh) | 一种基于鼠标的语音识别人机交互装置及其方法 | |
CN111192573B (zh) | 基于语音识别的设备智能化控制方法 | |
CN109545213A (zh) | 设备控制方法、装置、存储介质及空调 | |
CN108470568A (zh) | 智能设备控制方法及装置、存储介质、电子设备 | |
CN107729433B (zh) | 一种音频处理方法及设备 | |
CN111081223B (zh) | 一种语音识别方法、装置、设备和存储介质 | |
CN103198829A (zh) | 一种降低车内噪音提高语音识别率的方法、装置和设备 | |
CN110931018A (zh) | 智能语音交互的方法、装置及计算机可读存储介质 | |
CN110211609A (zh) | 一种提升语音识别准确率的方法 | |
CN107767860B (zh) | 一种语音信息处理方法和装置 | |
CN111402880A (zh) | 一种数据处理方法、装置及电子设备 | |
CN112002315A (zh) | 一种语音控制方法、装置、电器设备、存储介质及处理器 | |
CN114639379A (zh) | 智能电器的交互方法、装置、计算机设备及介质 | |
CN113077812B (zh) | 语音信号生成模型训练方法、回声消除方法和装置及设备 | |
CN109343481A (zh) | 一种控制设备的方法与设备 | |
CN112992131A (zh) | 一种在复杂场景下提取目标人声的乒乓球指令的方法 | |
CN113516975A (zh) | 一种智能家居声控开关系统及控制方法 | |
CN108492821B (zh) | 一种减弱语音识别中说话人影响的方法 | |
CN115331670B (zh) | 一种家用电器用离线语音遥控器 | |
CN110970019A (zh) | 智能家居系统的控制方法和装置 | |
CN109949831B (zh) | 智能设备中语音识别的方法、装置及计算机可读存储介质 | |
CN210575088U (zh) | 语音识别家电控制装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |