一种语音命令的校正方法、校正系统和电子设备
技术领域
本发明涉及电子技术领域,尤其涉及一种语音命令的校正方法、校正系统和电子设备。
背景技术
语音命令操作方式非常普遍的一种人机交互方式,也是一种非常自然的人机交互方式。随着近年来用户终端设备(如智能手机、平板电脑、iPad等)的处理能力越来越强大,在用户终端设备上应用语音命令操作成为一种趋势。
电子设备在接收到输入的语音信息时,根据输入的语音信息提取语音特征信息,然后在语音特征库中查找与所述提取的语音特征信息对应的语音命令,执行所述语音命令,从而完成语音命令操作。
因为,语音特征库是区分不同用户、区分不同命令的关键数据,是用户“专属”的个性化数据,同时也受到用户终端设备的硬件条件、使用环境等多个因素的影响。因此,在用户终端设备更换后或者语音特征库升级后,语音特征库的部分或者全部语音命令的语音特征信息与设备采集的对应语音特征信息会存在偏差,从而在语音命令操作时,会存在识别不准确或者不能识别输入的语音信息的情况。
发明内容
本申请提供一种语音命令的校正方法、校正系统和电子设备,解决现有了技术中在用户终端设备更换后或者语音特征库升级后,语音特征库的部分或者全部语音命令的语音特征信息与设备采集的对应语音特征信息会存在偏差,从而在语音命令操作时存在识别不准确或者不能识别输入的语音信息的技术问题。
本发明实施例第一方面提供了一种语音命令的校正方法,所述方法包括:获得语音特征库中需要校正的语音命令;提示用户输入与所述语音命令对应的语音信息;采集所述用户输入的语音信息;根据采集到的语音信息获得语音特征信息;根据获得的语音特征信息更新所述需要校正的语音命令的语音特征信息,以校正所述语音命令。
在第一方面第一种可能的实现方式中,所述获得语音特征库中需要校正的语音命令,具体包括:
接收所述语音特征库;
根据系统预先设定的所述语音特征库中的特定语音命令,或者根据所述语音特征库中语音命令的使用频率,或者按照用户的输入信息在所述语音特征库中选择的语音命令确定需要校正的语音命令,所述特定语音命令为每次接收语音特征库后需要校正的语音命令。
结合第一方面,在第一方面第二种可能的实现方式中,所述获得语音特征库中需要校正的语音命令,具体包括:
接收更新的语音命令及其语音特征信息,将所述更新的语音命令确定为需要校正的语音命令。
结合第一方面、第一方面的第一或第二种可能的实现方式,在第一方面第三种可能的实现方式中,所述根据获得的语音特征信息更新所述需要校正的语音命令的语音特征信息,具体为:将获得的语音特征信息替换所述需要校正的语音命令的语音特征信息。
结合第一方面第一到第三种任一可能的实现方式,在第一方面第四种可能的实现方式中,所述提示用户输入与所述语音命令对应的语音信息,具体为:
根据所述语音命令的语音特征信息生成语音信息并播放;或者
播放所述语音命令对应的机器音;或者
显示所述语音命令对应的文字或图像信息。
本发明实施例第二方面提供了一种语音命令的校正方法,所述方法包括:
获得语音特征库中需要校正的语音命令集合,所述语音命令集合包括M个语音命令,所述M为大于等于2的整数;
对语音命令集合中的第一个到第N个语音命令中每个语音命令执行:提示用户输入与所述第一语音命令对应的语音信息、采集所述用户输入的语音信息、根据采集到的语音信息获得语音特征信息、根据获得的语音特征信息更新更新所述语音特征库中所述第一语音命令的语音特征信息以校正所述第一语音命令,所述N为小于所述M大于0的整数,所述第一语音命令为所述第一个到第N个语音命令中的任意一个语音命令;
对所述语音命令集合中的第N+1个到第M个语音命令中的每个语音命令执行:根据已校正完成的N个第一语音命令在校正前和校正后的语音特征信息的N个偏差值,确定对所述第二语音命令进行校正的方式,根据确定出的校正方式对所述第二语音命令进行校正,所述第二语音命令为所述第N+1个到第M个语音命令中的任意一个语音命令。
在第二方面第一种可能的实现方式中,所述根据已校正完成的N个第一语音命令在校正前和校正后的语音特征信息的N个偏差值,确定对所述第二语音命令进行校正的方式,包括:
若所述N个偏差值在第一阈值与第二阈值之间,所述第一阈值小于所述第二阈值,则根据所述N个偏差值查找变化规律;
若查找到变化规律,则确定根据所述变化规律对所述第二语音命令的语音特征信息进行更新以校正所述第二语音命令;否则,确定对所述第二语音命令执行:提示用户输入与所述第二语音命令对应的语音信息、采集所述用户输入的语音信息、根据采集到的语音信息获得语音特征信息、根据获得的语音特征信息更新所述第二语音命令的语音特征信息,以校正所述第二语音命令。
结合第二方面第一种可能实现的方式,在第二方面第二种可能的实现方式中,所述根据已校正完成的N个第一语音命令在校正前和校正后的语音特征信息的N个偏差值,确定对所述第二语音命令进行校正的方式,还包括:若所述N个偏差值小于所述第一阈值,则放弃对所述第二语音命令的校正。
结合第二方面第一种可能实现的方式,在第二方面第三种可能实现的方式中,所述根据已校正完成的N个第一语音命令在校正前和校正后的语音特征信息的N个偏差值,确定对所述第二语音命令进行校正的方式,还包括:若所述N个偏差值大于所述第二阈值,则重新确定所述语音特征库中需要校正的语音命令集合。
本发明实施例第三方面提供了一种语音命令的校正系统,所述系统包括:确定单元,用于获得语音特征库中需要校正的语音命令;提示单元,用于提示用户输入与所述语音命令对应的语音信息;采集单元,用于采集所述用户输入的语音信息;获得单元,用于根据采集到的语音信息获得语音特征信息;校正单元,用于根据获得的语音特征信息更新所述需要校正的语音命令的语音特征信息,以校正所述语音命令。
在第三方面第一种可能的实现方式中,所述确定单元具体用于:接收所述语音特征库;根据系统预先设定的所述语音特征库中的特定语音命令,或者根据所述语音特征库中语音命令的使用频率,或者按照用户的输入信息在所述语音特征库中选择的语音命令确定需要校正的语音命令,所述特定语音命令为每次接收语音特征库后需要校正的语音命令。
结合第三方面,在第三方面第二种可能的实现方式中,所述确定单元具体用于:
接收更新的语音命令及其语音特征信息,将所述更新的语音命令确定为需要校正的语音命令。
结合第三方面、第三方面的第一种或第二种可能实现的方式,在第三方面第三种可能实现的方式中,所述校正单元具体用于:将获得的语音特征信息替换所述需要校正的语音命令的语音特征信息。
结合第三方面、第三方面的第一种、第二种或第三种可能实现的方式,在第三方面第四种可能实现的方式中,所述提示单元具体用于:根据所述语音命令的语音特征信息生成语音信息并播放,或者播放所述语音命令对应的机器音;或者显示所述语音命令对应的文字或图像信息。
本发明实施例第四方面提供了一种语音命令的校正系统,所述系统包括:
获得单元,用于获得语音特征库中需要校正的语音命令集合,所述语音命令集合包括M个语音命令,所述M为大于等于2的整数;
第一校正单元,用于对语音命令集合中的第一个到第N个语音命令中每个语音命令执行:提示用户输入与所述第一语音命令对应的语音信息、采集所述用户输入的语音信息、根据采集到的语音信息获得语音特征信息、根据获得的语音特征信息更新所述语音特征库中所述第一语音命令的音特征信息以校正所述第一语音命令,所述N为小于所述M大于0的整数,所述第一语音命令为所述第一个到第N个语音命令中的任意一个语音命令;
第二校正单元,用于对所述语音命令集合中的第N+1个到第M个语音命令中的每个语音命令执行:根据已校正完成的N个第一语音命令在校正前和校正后的语音特征信息的N个偏差值,确定对所述第二语音命令进行校正的方式,根据确定出的校正方式对所述第二语音命令进行校正,所述第二语音命令为所述第N+1个到第M个语音命令中的任意一个语音命令。
结合第四方面,在第四方面第一种可能的实现方式中,所述第二校正单元具体用于:
若所述N个偏差值在第一阈值与第二阈值之间,所述第一阈值小于所述第二阈值,则根据所述N个偏差值查找变化规律;
若查找到变化规律,则确定根据所述变化规律对所述第二语音命令的语音特征信息进行更新以校正所述第二语音命令;否则,确定对所述第二语音命令执行:提示用户输入与所述第二语音命令对应的语音信息、采集所述用户输入的语音信息、根据采集到的语音信息获得语音特征信息、根据获得的语音特征信息更新所述第二语音命令的语音特征信息,以校正所述第二语音命令。
结合第四方面的第一种可能的实现方式,在第四方面第二种可能的实现方式中,述第二校正单元还用于:若所述N个偏差值小于所述第一阈值,则放弃对所述第二语音命令的校正。
结合第四方面的第一种可能的实现方式,在第四方面第三种可能的实现方式中,所述确定单元还用于:若所述N个偏差值大于所述第二阈值,则重新确定所述语音特征库中需要校正的语音命令集合。
本发明实施例第五方面提供了一种电子设备,所述电子设备包括:存储器,用于存储语音特征库,所述语音特征库包括多个语音命令;处理器,用于获得语音特征库中需要校正的语音命令,根据采集到的语音信息获得语音特征信息,并根据所述获得的语音特征信息更新所述需要校正的语音命令的语音特征信息,以校正所述语音命令;输出装置,用于提示用户输入与所述语音命令对应的语音信息;输入装置,用于采集所述用户输入的语音信息。
在第五方面第一种可能的实现方式中,所述电子设备接收到所述语音特征库时,所述处理器具体用于:根据系统预先设定的所述语音特征库中的特定语音命令,或者根据所述语音特征库中语音命令的使用频率,或者按照用户的输入信息在所述语音特征库中选择的语音命令确定需要校正的语音命令,所述特定语音命令为每次接收语音特征库后需要校正的语音命令。
结合第五方面,在第五方面的第二种可能的实现方式中,所述电子设备在接收到第二语音特征库时,所述处理器还用于:接收更新的语音命令及其语音特征信息,并将所述更新的语音命令确定为需要校正的语音命令。
结合第五方面、第五方面的第一种或第二种可能的实现方式中,在第五方面的第三种可能的实现方式中,所述处理器具体用于:将获得的语音特征信息替换所述需要校正的语音命令的语音特征信息。
结合第五方面、第五方面的第一种、第二种或第三种可能的实现方式中,在第五方面的第四种可能的实现方式中,所述输出装置具体为语音播放器或者显示屏;所述语音播放器用于根据所述语音命令的语音特征信息生成语音信息并播放,或播放所述语音命令对应的机器音;所述显示屏用于显示所述语音命令对应的文字或图像信息。
本发明实施例第六方面提供了一种电子设备,所述电子设备包括:
存储器,用于存储语音特征库,所述语音特征库包括多个语音命令;
处理器,用于获得所述语音特征库中需要校正的语音命令集合,对语音命令集合中的第一个到第N个语音命令中每个语音命令执行:根据采集到的语音信息获得语音特征信息、根据获得的语音特征信息更新所述语音特征库中所述第一语音命令的语音特征信息以校正所述第一语音命令;对所述语音命令集合中的第N+1个到第M个语音命令中的每个语音命令执行:根据已校正完成的N个第一语音命令在校正前和校正后的语音特征信息的N个偏差值,确定对所述第二语音命令进行校正的方式,根据确定出的校正方式对所述第二语音命令进行校正,所述M为大于等于2的整数,所述N为小于所述M大于0的整数,所述第一语音命令为所述第一个到第N个语音命令中的任意一个语音命令,所述第二语音命令为所述第N+1个到第M个语音命令中的任意一个语音命令;
输出装置,用于提示用户输入与所述第一语音命令对应的语音信息;
输入装置,用于采集所述用户输入的语音信息。
在第六方面第一种可能的实现方式中,所述处理器具体用于:
若所述N个偏差值在第一阈值与第二阈值之间,所述第一阈值小于所述第二阈值,则根据所述N个偏差值查找变化规律;
若查找到变化规律,则确定根据所述变化规律对所述第二语音命令的第一语音特征信息进行更新以校正所述第二语音命令;否则,确定对所述第二语音命令执行:提示用户输入与所述第二语音命令对应的语音信息、采集所述用户输入的语音信息、根据采集到的语音信息获得语音特征信息、根据获得的语音特征信息更新所述第二语音命令的语音特征信息,以校正所述第二语音命令。
结合第六方面第一种可能的实现方式中,在第六方面第二种可能的实现方式中,所述处理器具体还用于:若所述N个偏差值小于所述第一阈值,则放弃对所述第二语音命令的校正。
结合第六方面第一种可能的实现方式中,在第六方面第三种可能的实现方式中,所述处理器具体还用于:若所述N个偏差值大于所述第二阈值,则重新确定所述语音特征库中需要校正的语音命令集合。
本申请有益效果如下:
上述语音命令的校正方法、校正系统和电子设备,通过提示用户输入与所述语音命令对应的语音信息,接收用户根据提示输入的语音信息,根据该语音信息获取语音特征信息,将该语音特征信息更新所述需要校正的语音命令的原语音特征信息;或者,在所述需要校正的语音命令为M个时,所述M个需要校正的语音命令的中前N个语音命令采用输入的语音信息的语音特征信息替换对应的语音特征信息以校正所述前N个语音命令,所述后(M-N)个语音命令通过已校正的前N个语音命令的原语音特征信息和输入的语音特征信息的偏差值选择校正方式,从而对所述后(M-N)个语音命令进行校正,从而使得语音命令的语言特征信息能够适应于用户终端设备更换后或者语音特征库升级后,解决了现有技术中在用户终端设备更换后或者语音特征库升级后,语音特征库的部分或者全部语音命令的语音特征信息与设备采集的对应语音特征信息会存在偏差,从而在语音命令操作时存在识别不准确或者不能识别输入的语音信息的技术问题。
附图说明
图1为本申请第一较佳实施方式语音命令的校正方法的方法流程图;
图2为本申请第二较佳实施方式语音命令的校正方法的方法流程图;
图3为本申请第三较佳实施方式语音命令的校正系统的结构框图;
图4为本申请第四较佳实施方式语音命令的校正系统的结构框图;
图5为本申请第五较佳实施方式电子设备的结构示意图;
图6为本申请第六较佳实施方式电子设备的结构示意图。
具体实施方式
本申请实施例通过提供一种语音命令的校正方法、校正系统和电子设备,解决了现有技术中在用户终端设备更换后或者语音特征库升级后,语音特征库的部分或者全部语音命令的语音特征信息与设备采集的对应语音特征信息会存在偏差,从而在语音命令操作时存在识别不准确或者不能识别输入的语音信息的技术问题。
本申请实施例中的技术方案为解决上述问题,总体思路如下:
对所述语音特征库中的部分或者全部语音命令执行:提示用户输入与所述语音命令对应的语音信息;采集所述用户输入的语音信息;根据采集到的语音信息获得语音特征信息;根据获得的语音特征信息更新所述需要校正的语音命令的语音特征信息,以校正所述语音命令。
通过上述技术方案,从而对所述语音命令进行校正,使得语音命令的语言特征信息能够适应于用户终端设备更换后或者语音特征库升级后,解决了现有技术中在用户终端设备更换后或者语音特征库升级后,语音特征库的部分或者全部语音命令的语音特征信息与设备采集的对应语音特征信息会存在偏差,从而在语音命令操作时存在识别不准确或者不能识别输入的语音信息的技术问题。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例一
如图1所示,为本申请第一较佳实施方式语音命令的校正方法的方法流程图。所述语音命令的校正方法包括以下步骤:
步骤110,获得语音特征库中需要校正的语音命令。
具体地,语音特征库通常包括多个语音命令、与所述多个语音命令对应的语音特征信息,进一步的还可包括与所述多个命令对应的文字信息。语音特征库中的语音命令通常为控制指令名称,当电子设备通过音频输入装置采集到的语音信息的特征值与语音特征库中的某个语音命令的对应的特征信息匹配时,则所述电子设备会根据所述语音命令对应的控制指令名称执行相应的控制操作。语音特征信息,即语音特征值,是根据识别特定语音输入语音命令时产生的语音信息中提取的特征值,不同的使用者语音输入同一语音命令时产生的语音信息中的语音特征值可能不同。
步骤120,提示用户输入与所述语音命令对应的语音信息。
具体地,提示的方式可以有多种,第一种:通过电子设备的音频输出装置(如音响、耳机等)播放与所述语音命令对应的语音信息,如根据所述语音命令的语音特征信息生成语音信息并播放,或,直接播放所述语音命令对应的机器音,举例说明,在所述语音命令对应于打开相机控制指令时,则通过根据语音特征信息生成语音信息播放或者根据与所述语音命令对应的机器音播放带有“打开相机”的语音信息。第二种:显示所述语音命令对应的文字或图像信息,如,在所述语音命令对应于打开相机控制指令时,则通过显示屏等显示带有“打开相机”字样的文字信息。
步骤130,采集所述用户输入的语音信息。
具体的,可通过电子设备的音频输入装置(如话筒等)采集用户根据所述提示进行复述时的语音。
以下继续以所述语音命令对应与打开相机控制指令进行说明。在使用者收到上述提示后,语音输入带有“打开相机”的语音信息。通过输入设备如麦克风等采集该带有“打开相机”的语音信息。
步骤140,根据采集到的语音信息获得语音特征信息,即,根据采集到的语音信息,提取该语音信息的语音特征值。
语音特征信息可以通过提取采集的语音信息中的美尔倒谱系数(MFCC,MelFrequency Cepstrum Coefficient)获得:
其中,N为对采集到的语音信息进行傅立叶变换的点数,M为其后使用的滤波器组的滤波器个数,S(m)为每个滤波器组输出的对数能量。不同的系统可能采用不同阶数的MFCC系数进行语音特征的提取和识别。
MFCC系数是目前应用广泛的特征信息参数,提取采集的语音信息中的美尔倒谱系数提取语音特征信息是本申请的一种获取语音特征信息的方式,还可以通过采用经验模态分解(EMD)技术等提取语音特征信息,并不限定使用MFCC系数。
步骤150,根据获得的语音特征信息更新所述需要校正的语音命令的语音特征信息,以校正所述语音命令。
更新的方式至少有以下两种:第一,直接将所述原语音特征信息替换为获得的语音特征信息,不再保留所述原语音特征信息,即,将获得的语音特征信息替换所述需要校正的语音命令的语音特征信息;第二,根据获得的语音特征信息与所述需要校正的语音命令的语音特征信息的偏差值,调整所述需要校正的语音命令的语音特征信息的参数值,使得所述语音命令的语音特征信息能够适用。
以下通过举例说明该语音命令的校正方法的具体实施过程,首先在所述语音特征库中获得一个需要校正的语音命令,假设该语音命令对应于控制设备执行打开相机操作的控制指令;然后通过喇叭等输出带有“打开相机”的语音信息,或者文字信息的提示;在使用者收到上述提示后,语音输入带有“打开相机”的语音信息,通过输入设备如麦克风等采集该带有“打开相机”的语音信息;根据采集到的语音信息提取语音特征信息;最后,采用该语音特征信息更新原语音特征信息,如替换原语音特征信息,至此,校正完成。
上述语音命令的校正方法,通过提示所述需要校正的语音命令,接收使用者输入的对应所述语音命令的语音信息,根据该语音信息获取语音特征信息,将该语音特征信息更新对应的原语音特征信息,从而使得语音命令的语言特征信息能够适应于用户终端设备更换后或者语音特征库升级后,解决了现有技术中在用户终端设备更换后或者语音特征库升级后,语音特征库的部分或者全部语音命令的语音特征信息与设备采集的对应语音特征信息会存在偏差,从而在语音命令操作时存在识别不准确或者不能识别输入的语音信息的技术问题。
需要校正的语音命令可以为所述语音特征库中的一个命令,也可以为多个命令,在所述语音命令为多个时,可对所述多个语音命令中的每个语音命令执行以下步骤120、130、140和150,或者,对所述多个语音命令逐一执行以下步骤,即第一个语音命令校正后,进行第二个语音命令校正,再进行第三个语音命令校正,……,直到校正完成。
具体地,对于步骤110中,如何获取所述获得所述语音特征库中需要校正语音命令,有以下两种方式:
第一种,在所述用户终端设备更换后,也就是说在一个终端设备上新安装一个语音特征库时,可采用该方式。该方式具体包括以下步骤:
接收所述语音特征库;
根据系统预先设定的所述语音特征库中的特定语音命令,或者根据所述语音特征库中语音命令的使用频率,或者按照用户的输入信息在所述语音特征库中选择的语音命令确定需要校正的语音命令,所述特定语音命令为每次接收语音特征库后需要校正的语音命令。
第二种,在对所述语音特征库进行数据升级时,可以采用该方式,该方式具体为:
接收更新的语音命令及其语音特征信息,将所述更新的语音命令确定为需要校正的语音命令。
升级语音命令集合可以包括对所述语音特征库内原语音命令对应的语音特征信息等,也可以为新增加的语音命令及其对应的语音特征信息等。因此,确定需要校正的语音命令可能是原有的语音命令,也可能是新增加的语音命令。
上述语音命令的校正方法,通过提示用户输入与所述语音命令对应的语音信息,接收用户根据提示输入的语音信息,根据该语音信息获取语音特征信息,将该语音特征信息更新需要校正的语音命令的语音特征信息,从而使得语音命令的语言特征信息能够适应于用户终端设备更换后或者语音特征库升级后,解决了现有技术中在用户终端设备更换后或者语音特征库升级后,语音特征库的部分或者全部语音命令的语音特征信息与设备采集的对应语音特征信息会存在偏差,从而在语音命令操作时存在识别不准确或者不能识别输入的语音信息的技术问题。
实施例二
基于同样的发明构思,本申请还提供了一种语音命令的校正方法,如图2所示,为本申请第二较佳实施方式语音命令的校正方法的方法流程图。所述语音命令的校正方法包括以下步骤:
步骤210,获得所述语音特征库中需要校正的语音命令集合,所述语音命令集合包括M个语音命令,所述M为大于等于2的整数。
具体地,语音特征库通常包括多个语音命令、与所述多个语音命令对应的语音特征信息,进一步的还可包括与所述多个命令对应的文字信息。语音特征库中的语音命令通常为控制指令名称,当电子设备通过音频输入装置采集到的语音信息的特征值与语音特征库中的某个语音命令的对应的特征信息匹配时,则所述电子设备会根据所述语音命令对应的控制指令名称执行相应的控制操作。语音特征信息,即语音特征值,是根据识别特定语音输入语音命令时产生的语音信息中提取的特征值,不同的使用者语音输入同一语音命令时产生的语音信息中的语音特征值可能不同。
步骤220,对语音命令集合中的第一个到第N个语音命令中每个语音命令执行:提示用户输入与所述第一语音命令对应的语音信息、采集所述用户输入的语音信息、根据采集到的语音信息获得语音特征信息、根据获得的语音特征信息更新所述语音特征库中所述第一语音命令的语音特征信息以校正所述第一语音命令,所述N为小于所述M大于0的整数,所述第一语音命令为所述第一个到第N个语音命令中的任意一个语音命令。
对第一个到第N个语音命令中每个语音命令执行:提示用户输入与所述第一语音命令对应的语音信息、采集所述用户输入的语音信息、根据采集到的语音信息获得语音特征信息、根据获得的语音特征信息更新所述语音特征库中所述第一语音命令的语音特征信息以校正所述第一语音命令,可以通过以下方式实现:对所述第一个到第N个语音命令中的每个语音命令同时执行,或者,对所述第一个到第N个语音命令逐一执行,即先对第一个语音命令中的进行校正后,再对第二个语音命令进行校正,……,直到对第N个语音命令校正完成为止。
另外,语音特征信息可以通过提取采集的语音信息中的美尔倒谱系数(MFCC,MelFrequency Cepstrum Coefficient)获得:
其中,N为对采集到的语音信息进行傅立叶变换的点数,M为其后使用的滤波器组的滤波器个数,S(m)为每个滤波器组输出的对数能量。不同的系统可能采用不同阶数的MFCC系数进行语音特征的提取和识别。
MFCC系数是目前应用广泛的特征信息参数,提取采集的语音信息中的美尔倒谱系数提取语音特征信息是本申请的一种获取语音特征信息的方式,还可以通过采用经验模态分解(EMD)技术等提取语音特征信息,并不限定使用MFCC系数。
步骤230,对所述语音命令集合中的第N+1个到第M个语音命令中的每个语音命令执行:根据已校正完成的N个第一语音命令在校正前和校正后的语音特征信息的N个偏差值,确定对所述第二语音命令进行校正的方式,根据确定出的校正方式对所述第二语音命令进行校正,所述第二语音命令为所述第N+1个到第M个语音命令中的任意一个语音命令。
也就是说,在所述N个偏差值满足不同条件时,对所述(M-N)个语音命令中的每个语音命令校正的方式不同,具体参见后续描述。
N个偏差值中的每个偏差值可以通过上述MFCC系数获得语音特征信息,与对应的第一语音命令的语音特征信息进行比较,获取偏差值,其中,偏差值可以是获得的语音特征信息与对应的第一语音命令的语音特征信息的比值,也可以是获得的语音特征信息与对应的第一语音命令的语音特征信息的差值。
上述语音命令的校正方法,通过将所述M个需要校正的语音命令的中第一个到第N个语音命令采用输入的语音信息的语音特征信息更新对应的语音特征信息以校正所述N个语音命令,再根据已校正完成的N个第一语音命令在校正前和校正后的语音特征信息的N个偏差值校正第N+1个到第M个语音命令,从而完成对所述M个语音命令的校正,使得所述语音特征库内的语音命令的语言特征信息能够适应于用户终端设备更换后或者语音特征库升级后,解决了现有技术中在用户终端设备更换后或者语音特征库升级后,语音特征库的部分或者全部语音命令的语音特征信息与设备采集的对应语音特征信息会存在偏差,从而在语音命令操作时存在识别不准确或者不能识别输入的语音信息的技术问题。
具体地,对于如何获取所述获得所述语音特征库中需要校正第一语音特征信息的语音命令,有以下两种方式:
第一种,在所述用户终端设备更换后,也就是说在一个终端设备上新安装一个语音特征库时,可采用该方式。该方式具体包括以下步骤:
接收所述语音特征库;
根据系统预先设定的所述语音特征库中的特定语音命令,或者根据所述语音特征库中语音命令的使用频率,或者按照用户的输入信息在所述语音特征库中选择的语音命令确定需要校正的语音命令,所述特定语音命令为每次接收语音特征库后需要校正的语音命令。
第二种,在对所述语音特征库进行数据升级时,可以采用该方式,该方式具体包括以下步骤:
接收更新的语音命令及其语音特征信息,将所述更新的语音命令确定为需要校正的语音命令。
升级语音命令集合可以包括对所述语音特征库内原语音命令对应的语音特征信息等,也可以为新增加的语音命令及其对应的语音特征信息等。因此,发生变化的语音命令可能是原有的语音命令,也可能是新增加的语音命令。
具体地,在所述N个偏差值不同时,采用以下方法确定所述语音命令集合中的第N+1个到第M个语音命令中的每个语音命令进行校正的方式:
若所述N个偏差值在第一阈值与第二阈值之间,所述第一阈值小于所述第二阈值,则根据所述N个偏差值查找变化规律;
若查找到变化规律,则确定根据所述变化规律对所述第二语音命令的语音特征信息进行更新以校正所述第二语音命令;否则,确定对所述第二语音命令执行:提示用户输入与所述第二语音命令对应的语音信息、采集所述用户输入的语音信息、根据采集到的语音信息获得语音特征信息、根据获得的语音特征信息更新所述第二语音命令的语音特征信息,以校正所述第二语音命令;
若所述N个偏差值小于所述第一阈值,则放弃对所述第二语音命令的校正。
若所述N个偏差值大于所述第二阈值,则重新确定所述语音特征库中需要校正语音特征信息的语音命令集合。
以下通过举例说明,在所述N个偏差值不同时,采用以下方法确定所述语音命令集合中的(M-N)个语音命令中的每个语音命令的第一语音特征信息进行校正的方式。假设所述第一阈值为5%,第二阈值为20%,假设所述N等于3。
在第一种情况时,第一偏差值为5.9%,第二偏差值为6%,第三偏差值为6%,因三个偏差值之间的差值范围仅为0.1,则认为三个偏差值存在变化规律,即第一语音特征信息与需要的语音特征信息之间相差6%,系统可以发出提示,如通过显示单元显示“是否需要按照偏差值6%调整所述(M-N)个语音命令中的每个语音命令的第一语音特征信息”,当使用者选择“是”时,则对所述(M-N)个语音命令中的每个语音命令的第一语音特征信息按照偏差值为6%进行校正。
在第二种情况时,若第一偏差值为1%,第二偏差值为2%,第三偏差值为4%,因三个偏差值均小于5%,因此,放弃对所述(M-N)个语音命令中的每个语音命令的校正。
在第三种情况时,若第一偏差值为15%,第二偏差值为30%,第三偏差值为40%,因三个偏差值中两个偏差值大于20%,因此,则重新确定所述语音特征库中需要校正第一语音特征信息的语音命令集合,如将所述语音特征库的未校正的所有语音命令均列为需要校正第一语音特征信息的语音命令。
上述语音命令的校正方法200,通过将所述M个需要校正的语音命令的中前N个语音命令采用输入的语音信息的语音特征信息更换对应的语音特征信息以校正所述前N个语音命令,所述后(M-N)个语音命令通过已校正的N个语音命令的原语音特征信息和输入的语音特征信息的偏差值选择校正方式,从而对所述后(M-N)个语音命令进行校正,从而使得语音命令的语言特征信息能够适应于用户终端设备更换后或者语音特征库升级后,解决了现有技术中在用户终端设备更换后或者语音特征库升级后,语音特征库的部分或者全部语音命令的语音特征信息与设备采集的对应语音特征信息会存在偏差,从而在语音命令操作时存在识别不准确或者不能识别输入的语音信息的技术问题。
实施例三
基于同样的发明构思,本申请还提供了一种语音命令的校正系统300,如图3所示,为本申请第三较佳实施方式语音命令的校正系统300的结构框图。所述校正系统300包括:确定单元310、提示单元320、采集单元330、获得单元340和校正单元350。
确定单元310,用于获得语音特征库中需要校正的语音命令;
提示单元320,用于提示用户输入与所述语音命令对应的语音信息;
采集单元330,用于采集所述用户输入的语音信息;
获得单元340,用于根据采集到的语音信息获得语音特征信息;
校正单元350,用于根据获得的语音特征信息更新所述需要校正的语音命令的语音特征信息,以校正所述语音命令。
在具体实施方式中,所述确定单元310具体用于:接收所述语音特征库;根据系统预先设定的所述语音特征库中的特定语音命令,或者根据所述语音特征库中语音命令的使用频率,或者按照用户的输入信息在所述语音特征库中选择的语音命令确定需要校正的语音命令,所述特定语音命令为每次接收语音特征库后需要校正的语音命令。
在具体实施方式中,所述确定单元310具体用于:接收更新的语音命令及其语音特征信息,将所述更新的语音命令确定为需要校正的语音命令。
在具体实施方式中,所述校正单元350具体用于:将获得的语音特征信息替换所述需要校正的语音命令的语音特征信息。
在具体实施方式中,所述提示单元320具体用于:根据所述语音命令的语音特征信息生成语音信息并播放,或者播放所述语音命令对应的机器音;或者显示所述语音命令对应的文字或图像信息。
上述语音命令的校正系统300,通过提示单元320提示用户输入与所述第一语音命令对应的语音信息,通过采集单元330采集用户根据提示输入的语音信息,通过获得单元340根据该语音信息获取语音特征信息,通过校正单元350将该语音特征信息更新所述需要校正的语音命令的语音特征信息,从而使得语音命令的语言特征信息能够适应于用户终端设备更换后或者语音特征库升级后,解决了现有技术中在用户终端设备更换后或者语音特征库升级后,语音特征库的部分或者全部语音命令的语音特征信息与设备采集的对应语音特征信息会存在偏差,从而在语音命令操作时存在识别不准确或者不能识别输入的语音信息的技术问题。
实施例四
基于同样的发明构思,本申请还提供了一种语音命令的校正系统,如图4所示,为本申请第四较佳实施方式语音命令的校正系统400的结构框图。所述校正系统400包括:获得单元410、第一校正单元420和第二校正单元430。
获得单元410,用于获得语音特征库中需要校正的语音命令集合,所述语音命令集合包括M个语音命令,所述M为大于等于2的整数;
第一校正单元420,用于对语音命令集合中的第一个到第N个语音命令中每个语音命令执行:提示用户输入与所述第一语音命令对应的语音信息、采集所述用户输入的语音信息、根据采集到的语音信息获得语音特征信息、根据获得的语音特征信息更新所述语音特征库中所述第一语音命令的音特征信息以校正所述第一语音命令,所述N为小于所述M大于0的整数,所述第一语音命令为所述第一个到第N个语音命令中的任意一个语音命令。
第二校正单元430,用于对所述语音命令集合中的第N+1个到第M个语音命令中的每个语音命令执行:根据已校正完成的N个第一语音命令在校正前和校正后的语音特征信息的N个偏差值,确定对所述第二语音命令进行校正的方式,根据确定出的校正方式对所述第二语音命令进行校正,所述第二语音命令为所述第N+1个到第M个语音命令中的任意一个语音命令。
在具体实施方式中,所述第二校正单元430具体用于:
若所述N个偏差值在第一阈值与第二阈值之间,所述第一阈值小于所述第二阈值,则根据所述N个偏差值查找变化规律;
若查找到变化规律,则确定根据所述变化规律对所述第二语音命令的语音特征信息进行更新以校正所述第二语音命令;否则,确定对所述第二语音命令执行:提示用户输入与所述第二语音命令对应的语音信息、采集所述用户输入的语音信息、根据采集到的语音信息获得语音特征信息、根据获得的语音特征信息更新所述第二语音命令的语音特征信息,以校正所述第二语音命令。
在具体实施方式中,所述第二校正单元430还用于:若所述N个偏差值小于所述第一阈值,则放弃对所述第二语音命令的校正。
在具体实施方式中,所述第二校正单元430还用于:若所述N个偏差值大于所述第二阈值,则重新确定所述语音特征库中需要校正的语音命令集合。
上述语音命令的校正系统400,通过第一校正单元420将所述M个需要校正的语音命令的中第一个到第N个语音命令采用输入的语音信息的语音特征信息更新对应的语音特征信息以校正所述N个语音命令,通过第二校正单元430根据所述N个偏差值确定第N+1个到第M个语音命令的校正方式,对所述(M-N)个语音命令进行校正,从而使得语音命令的语言特征信息能够适应于用户终端设备更换后或者语音特征库升级后,解决了现有技术中在用户终端设备更换后或者语音特征库升级后,语音特征库的部分或者全部语音命令的语音特征信息与设备采集的对应语音特征信息会存在偏差,从而在语音命令操作时存在识别不准确或者不能识别输入的语音信息的技术问题。
实施例五
基于同样的发明构思,本申请还提供了一种电子设备500,如图5所示,为本申请第五较佳实施方式电子设备500的结构示意图。所述电子设备500包括:存储器510、处理器520、输出装置530和输入装置540。
存储器510,用于存储语音特征库,所述语音特征库包括多个语音命令;存储器510是终端系统中的记忆设备,用来存放程序和数据。存储器510也可以为外部存储器如磁性介质或光盘,也可以为内部存储器。
处理器520,用于获得语音特征库中需要校正的语音命令,根据采集到的语音信息获得语音特征信息,并根据所述语音特征信息更新所述需要校正的语音命令的语音特征信息,以校正所述语音命令。
输出装置530,用于提示用户输入与所述语音命令对应的语音信息。输出设备530是将数据以数字、字符、图像、声音等形式表示出来,如显示器、语音输出系统如喇叭等。
输入装置540,用于采集所述用户输入的语音信息。输入装置540可以为麦克风、话筒等装置。
在具体实施方式中,在所述电子设备500在接收到所述语音特征库时,所述处理器520具体用于:根据系统预先设定的所述语音特征库中的特定语音命令,或者根据所述语音特征库中语音命令的使用频率,或者按照用户的输入信息在所述语音特征库中选择的语音命令确定需要校正的语音命令,所述特定语音命令为每次接收语音特征库后需要校正的语音命令。
在具体实施方式中,所述处理器520还用于:接收更新的语音命令及其语音特征信息,并将所述更新的语音命令确定为需要校正的语音命令。
在具体实施方式中,所述处理器520具体用于:将获得的语音特征信息替换所述需要校正的语音命令的语音特征信息。
在具体实施方式中,所述输出装置530具体为语音播放器或者显示屏;所述语音播放器用于根据所述语音命令的语音特征信息生成语音信息并播放,或播放所述语音命令对应的机器音;所述显示屏用于显示所述语音命令对应的文字或图像信息。
上述电子设备500,通过所述输出装置530提示用户输入与所述语音命令对应的语音信息,通过输入装置540接收用户根据提示输入的语音信息,通过处理器520根据该语音信息获取语音特征信息,将该语音特征信息更新所述需要校正的语音特征信息,从而使得语音命令的语言特征信息能够适应于用户终端设备更换后或者语音特征库升级后,解决了现有技术中在用户终端设备更换后或者语音特征库升级后,语音特征库的部分或者全部语音命令的语音特征信息与设备采集的对应语音特征信息会存在偏差,从而在语音命令操作时存在识别不准确或者不能识别输入的语音信息的技术问题。
实施例六
基于同样的发明构思,本申请还提供了一种电子设备600,如图6所示,为本申请第六较佳实施方式电子设备600的结构示意图。所述电子设备600包括:存储器610、处理器620、输出装置630、输入装置640。
存储器610,用于存储语音特征库,所述语音特征库包括多个语音命令。存储器610是终端系统中的记忆设备,用来存放程序和数据。存储器610也可以为外部存储器如磁性介质或光盘,也可以为内部存储器。
处理器620,用于获得语音特征库中需要校正的语音命令集合,对语音命令集合中的第一个到第N个语音命令中每个语音命令执行:根据采集到的语音信息获得语音特征信息、根据获得的语音特征信息更新所述语音特征库中所述第一语音命令的音特征信息以校正所述第一语音命令;对所述语音命令集合中的第N+1个到第M个语音命令中的每个语音命令执行:根据已校正完成的N个第一语音命令在校正前和校正后的语音特征信息的N个偏差值,确定对所述第二语音命令进行校正的方式,根据确定出的校正方式对所述第二语音命令进行校正,所述M为大于等于2的整数,所述N为小于所述M大于0的整数,所述第一语音命令为所述第一个到第N个语音命令中的任意一个语音命令,所述第二语音命令为所述第N+1个到第M个语音命令中的任意一个语音命令;
输出装置630,用于提示用户输入与所述第一语音命令对应的语音信息。输出设备630是将数据以数字、字符、图像、声音等形式表示出来,如显示器、语音输出系统如喇叭等。
输入装置640,用于采集所述用户输入的语音信息。输入装置640可以为麦克风、话筒等装置。
在具体实施方式中,所述处理器620具体用于:若所述N个偏差值在第一阈值与第二阈值之间,所述第一阈值小于所述第二阈值,则根据所述N个偏差值查找变化规律;
若查找到变化规律,则确定根据所述变化规律对所述第二语音命令的第一语音特征信息进行更新以校正所述第二语音命令;否则,确定对所述第二语音命令执行:提示用户输入与所述第二语音命令对应的语音信息、采集所述用户输入的语音信息、根据采集到的语音信息获得语音特征信息、根据获得的语音特征信息更新所述第二语音命令的语音特征信息,以校正所述第二语音命令。
在具体实施方式中,所述处理器620具体还用于:若所述N个偏差值小于所述第一阈值,则放弃对所述第二语音命令的校正。
在具体实施方式中,所述处理器620具体还用于:若所述N个偏差值大于所述第二阈值,则重新确定所述语音特征库中需要校正的语音命令集合。
上述电子设备600,通过输出装置630提示用户输入与所述第一语音命令对应的语音信息,通过输入装置640采集用户根据提示输入的语音信息,通过处理器620提取所述语音信息中的语音特征信息,将提取的语音特征信息更新所述第一语音命令的语音特征信息,从而完成所述M个语音命令中的第一个到第N个语音命令的校正,再通过所述处理器620,跟据所述根据已校正完成的N个第一语音命令在校正前和校正后的语音特征信息的N个偏差值选择对所述M个语音命令中(M-N)个语音命令的校正方式,跟据所述校正方式对所述(M-N)个语音命令进行校正,从而使得语音命令的语言特征信息能够适应于用户终端设备更换后或者语音特征库升级后,解决了现有技术中在用户终端设备更换后或者语音特征库升级后,语音特征库的部分或者全部语音命令的语音特征信息与设备采集的对应语音特征信息会存在偏差,从而在语音命令操作时存在识别不准确或者不能识别输入的语音信息的技术问题。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。