一种语音信息的反馈方法及装置
技术领域
本发明涉及音频技术领域,尤其涉及一种语音信息的反馈方法及装置。
背景技术
随着电子技术的发展,电子设备升级换代使其具备越来越多的功能,其中,语音控制功能备受关注,各类语音助手类应用随之出现,语音助手类应用使得用户可以通过电子设备阅读短信、介绍餐厅、询问天气等。
实现语音助手类应用中的关键为语音识别系统,语音识别系统识别语音的过程即为将用户的语音信息转换为文字信息的过程。由于在实际应用中,语音识别面对的环境十分复杂,语音识别系统在某些情况下无法准确地识别出用户输入的语音信息,尤其是在用户输入的语音内容不清楚、过大或过小等情况下,很容易导致语音信息的声音超出语音识别系统中硬件检测的范围,进而导致系统无法识别。
发明内容
本发明实施例提供一种语音信息的反馈方法及装置,用于实现对无法识别的语音信息进行反馈,从而提高语音交互的效果。
一种语音信息的反馈方法,包括以下步骤:
接收用户输入的语音信息;
检测所述语音信息的语音特征;
根据所述语音特征,判断所述语音信息是否满足预设反馈条件;
当所述语音信息满足所述预设反馈条件时,输出对所述语音信息的反馈信息,所述反馈信息用于提示用户对所述语音信息的输入进行调整。
本发明实施例的一些有益效果可以包括:
上述技术方案,通过对接收到的语音信息进行检测,并对满足预设反馈条件的语音信息进行反馈,使得用户能够根据反馈信息及时对无法识别的语音信息进行调整,从而重新输入系统能够识别的语音信息,避免了因无法识别语音信息而导致无法办理相关业务的情况,提高了语音交互的效果。
在一个实施例中,所述语音特征包括声波波形。
该实施例中,通过对语音信息的声波波形进行检测,从而能够更加方便准确地检测出语音信息是否满足预设反馈条件,进而准确及时地对满足预设反馈条件的语音信息进行反馈。
在一个实施例中,所述语音信息包括有效语音信息和无效语音信息,其中,所述无效语音信息为所述语音信息中除所述有效语音信息之外的信息;所述检测所述语音信息的语音参数,包括:
从所述语音信息中获取所述有效语音信息和/或所述无效语音信息;
检测所述有效语音信息的语音特征,和/或,检测所述无效语音信息的语音特征。
该实施例中,通过分别获取语音信息中的有效语音信息或无效语音信息,并分别对有效语音信息或无效语音信息的语音特征进行检测,使得对语音信息的检测更加准确,进而准确及时地对满足预设反馈条件的语音信息进行反馈。
在一个实施例中,所述根据所述语音特征,判断所述语音信息是否满足预设反馈条件,包括:
当所述有效语音信息的声波波形中存在削波和/或跳变时,判断所述削波和/或跳变的时长是否达到第一预设时长;
当所述削波和/或跳变的时长达到所述第一预设时长时,确定所述语音信息满足预设反馈条件。
该实施例中,通过对有效语音信息的声波波形进行检测,并对存在削波和/或跳变情况且达到一定时长的语音信息进行反馈,使得出现爆音情况的语音信息能够被准确检测出来,从而能够对出现爆音情况的语音信息进行反馈,使得用户能够根据反馈信息及时对出现爆音情况的语音信息进行调整,从而重新输入没有爆音的语音信息,避免了因爆音而无法识别语音信息的情况,提高了语音交互的效果。
在一个实施例中,所述根据所述语音特征,判断所述语音信息是否满足预设反馈条件,包括:
当所述有效语音信息的声波波形的幅度始终低于所述第一预设阈值时,确定所述语音信息满足预设反馈条件。
该实施例中,通过对有效语音信息的声波波形的幅度进行检测,并对声波波形的幅度始终低于预设阈值的语音信息进行反馈,使得音量过小的语音信息能够被准确检测出来,从而能够对音量过小的语音信息进行反馈,使得用户能够根据反馈信息及时对音量过小的语音信息进行调整,从而重新输入音量大小合适的语音信息,避免了因音量过小而无法识别语音信息的情况,提高了语音交互的效果。
在一个实施例中,所述根据所述语音特征,判断所述语音信息是否满足预设反馈条件,包括:
计算所述有效语音信息的声波波形的幅度的第一平均值,以及所述无效语音信息的声波波形的幅度的第二平均值;
根据所述第一平均值和所述第二平均值,计算所述语音信息的信噪比;
判断第二预设时长内的所述信噪比是否始终低于第二预设阈值;
当所述第二预设时长内的所述信噪比始终低于所述第二预设阈值时,确定所述语音信息满足预设反馈条件。
该实施例中,通过对语音信息的信噪比进行检测,并对信噪比过低的语音信息进行反馈,使得信噪比过低的语音信息能够被准确检测出来,从而能够对信噪比过低的语音信息进行反馈,使得用户能够根据反馈信息及时对信噪比过低的语音信息进行调整,减少噪音,避免了因噪音过大而无法识别语音信息的情况,提高了语音交互的效果。
在一个实施例中,所述输出对所述语音信息的反馈信息,包括:
输出与所述预设反馈条件相对应的反馈信息。
该实施例中,通过输出与预设反馈条件相对应的反馈信息,使得用户能够根据反馈信息获知语音信息无法识别的原因,从而能够根据原因作出相应的调整,重新输入系统能够识别的语音信息,避免了因无法识别语音信息而导致无法办理相关业务的情况,提高了语音交互的效果。
一种语音信息的反馈装置,包括:
接收模块,用于接收用户输入的语音信息;
检测模块,用于检测所述语音信息的语音特征;
判断模块,用于根据所述语音特征,判断所述语音信息是否满足预设反馈条件;
输出模块,用于当所述语音信息满足所述预设反馈条件时,输出对所述语音信息的反馈信息,所述反馈信息用于提示用户对所述语音信息的输入进行调整。
在一个实施例中,所述检测模块所检测的语音特征包括声波波形。
在一个实施例中,所述接收模块接收到的语音信息包括有效语音信息和无效语音信息,其中,所述无效语音信息为所述语音信息中除所述有效语音信息之外的信息;所述检测模块包括:
获取子模块,用于从所述语音信息中获取所述有效语音信息和/或所述无效语音信息;
检测子模块,用于检测所述有效语音信息的语音特征,和/或,检测所述无效语音信息的语音特征。
在一个实施例中,所述判断模块包括:
第一判断子模块,用于当所述有效语音信息的声波波形中存在削波和/或跳变时,判断所述削波和/或跳变的时长是否达到第一预设时长;
第一确定子模块,用于当所述削波和/或跳变的时长达到所述第一预设时长时,确定所述语音信息满足预设反馈条件。
在一个实施例中,所述判断模块包括:
第二确定子模块,用于当所述有效语音信息的声波波形的幅度始终低于所述第一预设阈值时,确定所述语音信息满足预设反馈条件。
在一个实施例中,所述判断模块包括:
第一计算子模块,用于计算所述有效语音信息的声波波形的幅度的第一平均值,以及所述无效语音信息的声波波形的幅度的第二平均值;
第二计算子模块,用于根据所述第一平均值和所述第二平均值,计算所述语音信息的信噪比;
第二判断子模块,用于判断第二预设时长内的所述信噪比是否始终低于第二预设阈值;
第三确定子模块,用于当所述第二预设时长内的所述信噪比始终低于所述第二预设阈值时,确定所述语音信息满足预设反馈条件。
在一个实施例中,所述输出模块包括:
输出子模块,用于输出与所述预设反馈条件相对应的反馈信息。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种语音信息的反馈方法的流程图;
图2为本发明实施例中一种语音信息的反馈方法的流程图;
图3为本发明实施例中一种语音信息的反馈方法的流程图;
图4为本发明实施例中一种语音信息的反馈方法的流程图;
图5为本发明实施例中一种语音信息的反馈装置的框图;
图6为本发明实施例中一种语音信息的反馈装置中检测模块的框图;
图7为本发明实施例中一种语音信息的反馈装置中判断模块的框图;
图8为本发明实施例中一种语音信息的反馈装置中判断模块的框图;
图9为本发明实施例中一种语音信息的反馈装置中输出模块的框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1为本发明实施例中一种语音信息的反馈方法的流程图。如图1所示,该语音信息的反馈方法用于终端中,其中,终端可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等,该方法包括以下步骤S11-S14:
步骤S11,接收用户输入的语音信息。
其中,用户输入的语音信息中既包括有效语音信息,也包括无效语音信息,无效语音信息即为语音信息中除有效语音信息之外的信息。例如,用户输入语音信息时,用户说话的部分即为有效语音信息,前后出现的噪音即为无效语音信息。可通过VAD(Voiceactivity detection,语音活动检测)工具获取其中的有效语音信息和/或无效语音信息。
步骤S12,检测语音信息的语音特征。
该步骤实施时,可分别对有效语音信息的语音特征进行检测,或对无效语音信息的语音特征进行检测。
步骤S13,根据语音特征,判断语音信息是否满足预设反馈条件。
步骤S14,当语音信息满足预设反馈条件时,输出对语音信息的反馈信息,反馈信息用于提示用户对语音信息的输入进行调整。
采用本发明实施例提供的技术方案,通过对接收到的语音信息进行检测,并对满足预设反馈条件的语音信息进行反馈,使得用户能够根据反馈信息及时对无法识别的语音信息进行调整,从而重新输入系统能够识别的语音信息,避免了因无法识别语音信息而导致无法办理相关业务的情况,提高了语音交互的效果。
上述方法中,预设反馈条件可以包括以下几种条件中的任一种或多种:语音信息中音量过大或过小、语音信息中出现爆音情况、语音信息中噪音过大等。对于语音信息是否满足预设反馈条件,当语音特征包括声波波形时,可通过检测语音信息的声波波形来确定。因此,步骤S14还可实施为:输出与预设反馈条件相对应的反馈信息。例如,当语音信息中音量过大或出现爆音时,输出的反馈信息用于提示用户语音信息音量过大,可适当调小语音信息的音量,或者距离麦克稍远一些;当语音信息音量过小时,输出的反馈信息可用于提示用户语音信息音量过小,可适当调大语音信息的音量,或者距离麦克稍近一些;当语音信息中噪音过大时,输出的反馈信息用于提示用户语音信息中噪音过大,可选择较为安静的环境重新输入语音信息,等等。
在一个实施例中,预设反馈条件包括语音信息中出现爆音情况,此时,如图2所示,上述方法还可实施为以下步骤S21-S27:
步骤S21,接收用户输入的语音信息。
步骤S22,检测语音信息中有效语音信息的声波波形。
步骤S23,判断有效语音信息的声波波形中是否存在削波或跳变。如果有效语音信息的声波波形中存在削波或跳变,则执行步骤S24;如果有效语音信息的声波波形中不存在削波或跳变,则执行步骤S27。
该步骤中,削波即为方波,正常的语音信息的声波波形为弧度曲线,如果语音信息超出了终端的检测范围,则声波波形的峰值就会趋近于直线或者在较大值和较小值之间频繁变化,如果声波波形的峰值趋近于直线,也就是说存在了削波或方波,如果声波波形的峰值在较大值和较小值之间频繁变化,也就是说存在了跳变情况。
步骤S24,判断削波或跳变的时长是否达到第一预设时长。如果削波或跳变的时长达到第一预设时长,则执行步骤S25;如果削波或跳变的时长未达到第一预设时长,则执行步骤S27。
该步骤中,如果削波或跳变的时长未达到第一预设时长,即语音信息中存在的削波或跳变时长很短,终端在识别语音信息时可以忽略,即仍然能够准确识别出语音信息。
步骤S25,确定语音信息中出现爆音情况。该步骤相当于确定出语音信息满足预设反馈条件。
步骤S26,输出对语音信息的反馈信息;其中,反馈信息用于提示用户对语音信息中出现爆音情况,可适当减小语音信息的音量。
步骤S27,确定语音信息不满足预设反馈条件,执行当前语音业务。
本实施例中,通过对有效语音信息的声波波形进行检测,并对存在削波和/或跳变情况且达到一定时长的语音信息进行反馈,使得出现爆音情况的语音信息能够被准确检测出来,从而能够对出现爆音情况的语音信息进行反馈,使得用户能够根据反馈信息及时对出现爆音情况的语音信息进行调整,从而重新输入没有爆音的语音信息,避免了因爆音而无法识别语音信息的情况,提高了语音交互的效果。
在一个实施例中,预设反馈条件包括语音信息音量过小,此时,如图3所示,上述方法还可实施为以下步骤S31-S36:
步骤S31,接收用户输入的语音信息。
步骤S32,检测语音信息中有效语音信息的声波波形。
步骤S33,判断有效语音信息的声波波形的幅度是否始终低于第一预设阈值。如果有效语音信息的声波波形的幅度始终低于第一预设阈值,则执行步骤S34;如果有效语音信息的声波波形的幅度并非始终低于第一预设阈值,则执行步骤S36。
该步骤中,可对声波波形中的一部分进行判断,例如,选择连续5秒内的有效语音信息的声波波形的幅度是否始终低于第一预设阈值。第一预设阈值可设置为终端能够检测到的语音信息的最低能量值。
步骤S34,确定语音信息的音量过小。该步骤相当于确定出语音信息满足预设反馈条件。
步骤S35,输出对语音信息的反馈信息;其中,反馈信息用于提示用户对语音信息音量过小,可适当增大语音信息的音量。
步骤S36,确定语音信息不满足预设反馈条件,执行当前语音业务。
本实施例中,通过对有效语音信息的声波波形的幅度进行检测,并对声波波形的幅度始终低于预设阈值的语音信息进行反馈,使得音量过小的语音信息能够被准确检测出来,从而能够对音量过小的语音信息进行反馈,使得用户能够根据反馈信息及时对音量过小的语音信息进行调整,从而重新输入音量大小合适的语音信息,避免了因音量过小而无法识别语音信息的情况,提高了语音交互的效果。
在一个实施例中,预设反馈条件包括语音信息中噪音过大,此时,如图4所示,上述方法还可实施为以下步骤S41-S48:
步骤S41,接收用户输入的语音信息。
步骤S42,检测语音信息中有效语音信息的声波波形以及无效语音信息的声波波形。
步骤S43,计算有效语音信息的声波波形的幅度的第一平均值,以及无效语音信息的声波波形的幅度的第二平均值。
步骤S44,根据第一平均值和第二平均值,计算语音信息的信噪比。
该步骤中,第一平均值表征有效语音信息的能量,第二平均值表征无效语音信息的能量,第一平均值和第二平均值的比值即为信噪比,信噪比的大小可表征语音信息中噪音的大小,其中,信噪比越大,语音信息中噪音越小,反之,信噪比越小,则语音信息中噪音越大。
步骤S45,判断第二预设时长内的信噪比是否始终低于第二预设阈值。如果第二预设时长内的信噪比始终低于第二预设阈值,则执行步骤S46;如果第二预设时长内的信噪比并非始终低于第二预设阈值,则执行步骤S48。
步骤S46,确定语音信息中噪音过大。该步骤相当于确定出语音信息满足预设反馈条件。
步骤S47,输出对语音信息的反馈信息;其中,反馈信息用于提示用户对语音信息中噪音过大,可选择较为安静的环境重新输入语音信息。
步骤S48,确定语音信息不满足预设反馈条件,执行当前语音业务。
本实施例中,通过对语音信息的信噪比进行检测,并对信噪比过低的语音信息进行反馈,使得信噪比过低的语音信息能够被准确检测出来,从而能够对信噪比过低的语音信息进行反馈,使得用户能够根据反馈信息及时对信噪比过低的语音信息进行调整,减少噪音,避免了因噪音过大而无法识别语音信息的情况,提高了语音交互的效果。
此外,本发明实施例中,判断语音信息是否满足预设反馈条件,不限于上述通过检测语音信息的声波波形的方法,还可以通过其他方法来判断语音信息的声音是否过大或过小等,在此不一一赘述。
此外,在上述任一实施例中,终端对语音信息进行反馈时,还可结合用户当前所处的环境或者当前使用的语音应用平台来输出详细的反馈信息。例如,用户当前使用车载导航设备输入语音信息,如果语音信息中噪音过大,则车载导航设备可输出反馈信息“噪音过大,请关闭车窗以减少噪音”。这样,用户根据反馈信息对语音信息的输入进行调整时,即可明确知道进行调整的方法,从而提高用户重新输入语音信息的效率,不仅为用户节省时间,且提高用户的体验度。
对应于上述实施例中的语音信息的反馈方法,本发明还提供一种语音信息的反馈装置,用以执行上述方法。
图5为本发明实施例中一种语音信息的反馈装置的框图。如图5所示,该装置包括:
接收模块51,用于接收用户输入的语音信息;
检测模块52,用于检测语音信息的语音特征;
判断模块53,用于根据语音特征,判断语音信息是否满足预设反馈条件;
输出模块54,用于当语音信息满足预设反馈条件时,输出对语音信息的反馈信息,反馈信息用于提示用户对语音信息的输入进行调整。
在一个实施例中,检测模块52所检测的语音特征包括声波波形。
在一个实施例中,接收模块51接收到的语音信息包括有效语音信息和无效语音信息,其中,无效语音信息为语音信息中除有效语音信息之外的信息;如图6所示,检测模块52包括:
获取子模块521,用于从语音信息中获取有效语音信息和/或无效语音信息;
检测子模块522,用于检测有效语音信息的语音特征,和/或,检测无效语音信息的语音特征。
在一个实施例中,如图7所示,判断模块53包括:
第一判断子模块531,用于当有效语音信息的声波波形中存在削波和/或跳变时,判断削波和/或跳变的时长是否达到第一预设时长;
第一确定子模块532,用于当削波和/或跳变的时长达到第一预设时长时,确定语音信息满足预设反馈条件。
第二确定子模块533,用于当有效语音信息的声波波形的幅度始终低于第一预设阈值时,确定语音信息满足预设反馈条件。
在一个实施例中,如图8所示,判断模块53包括:
第一计算子模块534,用于计算有效语音信息的声波波形的幅度的第一平均值,以及无效语音信息的声波波形的幅度的第二平均值;
第二计算子模块535,用于根据第一平均值和第二平均值,计算语音信息的信噪比;
第二判断子模块536,用于判断第二预设时长内的信噪比是否始终低于第二预设阈值;
第三确定子模块537,用于当第二预设时长内的信噪比始终低于第二预设阈值时,确定语音信息满足预设反馈条件。
在一个实施例中,如图9所示,输出模块54包括:
输出子模块541,用于输出与预设反馈条件相对应的反馈信息。
采用本发明实施例提供的装置,通过对接收到的语音信息进行检测,并对满足预设反馈条件的语音信息进行反馈,使得用户能够根据反馈信息及时对无法识别的语音信息进行调整,从而重新输入系统能够识别的语音信息,避免了因无法识别语音信息而导致无法办理相关业务的情况,提高了语音交互的效果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。