WO2019218749A1

WO2019218749A1 - 基于语音的交互方法及系统

Info

Publication number: WO2019218749A1
Application number: PCT/CN2019/076066
Authority: WO
Inventors: 陈志鹏
Original assignee: 浙江口碑网络技术有限公司
Priority date: 2018-05-15
Filing date: 2019-02-25
Publication date: 2019-11-21
Also published as: CN108766460A; CN108766460B

Abstract

一种基于语音的交互方法及系统，该方法包括：确定当前采样时间内的语音音量值，判断当前采样时间是否为首个采样时间(S110)；若是，将与当前采样时间内的语音音量值相对应的音量等级确定为初始等级，执行与初始等级相对应的交互操作(S120)；若否，根据与上一个采样时间内的语音音量值相对应的音量等级，以及当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量，确定与当前采样时间内的语音音量值相对应的音量等级，执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作(S130)。

Description

基于语音的交互方法及系统

相关申请的交叉参考

本申请要求于2018年5月15日提交中国专利局、申请号为201810462653.X、名称为“基于语音的交互方法及系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本公开涉及电子信息领域，具体涉及一种基于语音的交互方法及系统。

背景技术

当前很多平台(windows/ios/android)的应用都引入了语音交互的功能。在这些语音交互的界面中，为了给用户及时地反馈语音交互效果并提高语音交互的趣味性，通常会根据实时的录音显示出交互动画。比如，“全民K歌”、“唱吧”等唱歌软件，会在用户唱歌时给出音频高低的提示；比如“支付宝App”的语音搜索，会在用户录音时给出声波动画等。

另外，随着科技的发展，出现了许多需要识别音量大小的业务场景，比如抽奖领红包等资源配置活动。在抽奖领红包的业务场景中，为了提升娱乐性，活动举办者希望实现“声音越大，红包越大”，同时在录音界面希望实现“声音越大，动画越快”的活动效果。但是，发明人在实现本公开的过程中，发现在现有技术中至少存在如下问题：手机录音识别音量大小的效果受“麦克风灵敏性”以及“声源与麦克风的距离”的影响非常大，如果直接使用客户端获取到的音量大小，可能导致某些客户端在资源配置活动中收到的奖金一直很小或显示在客户端界面的动画一直很慢。

发明内容

鉴于上述问题，提出了本公开以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于语音的交互方法及系统。

根据本公开的一个方面，提供了一种基于语音的交互方法，包括：确定当前采样时间内的语音音量值，判断当前采样时间是否为首个采样时间；

若是，将与当前采样时间内的语音音量值相对应的音量等级确定为初始等级，执行与初始等级相对应的交互操作；

若否，根据与上一个采样时间内的语音音量值相对应的音量等级，以及当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量，确定与当前采样时间内的语音音量值相对应的音量等级，执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作。

根据本公开的另一方面，提供了一种基于语音的交互方法，包括：

接收用于实现交互操作的语音输入内容；

确定语音输入内容在当前采样时间内的语音音量值，判断当前采样时间是否为首个采样时间；

若是，将与当前采样时间内的语音音量值相对应的音量等级确定为初始等级，执行与初始等级相对应的交互操作，并展现初始等级相对应的交互操作所对应的交互界面；

若否，根据与上一个采样时间内的语音音量值相对应的音量等级，以及当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量，确定与当前采样时间内的语音音量值相对应的音量等级，执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作，并展现音量等级相对应的交互操作所对应的交互界面。

根据本公开的又一方面，提供了一种基于语音的交互系统，包括：

确定模块，适于确定当前采样时间内的语音音量值，判断当前采样时间是否为首个采样时间；

第一执行模块，适于若是，将与当前采样时间内的语音音量值相对应的音量等级确定为初始等级，执行与初始等级相对应的交互操作；

第二执行模块，适于若否，根据与上一个采样时间内的语音音量值相对应的音量等级，以及当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量，确定与当前采样时间内的语音音量值相对应的音量等级，执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作。

根据本公开的再一方面，提供了一种基于语音的交互系统，包括：接收模块、确定模块、第一执行模块、第二执行模块、以及展现模块，其中，

接收模块，适于接收用于实现交互操作的语音输入内容；

确定模块，适于确定语音输入内容在当前采样时间内的语音音量值，判断当前采样时间是否为首个采样时间；

第一执行模块，适于若是，将与当前采样时间内的语音音量值相对应的音量等级确定为初始等级，执行与初始等级相对应的交互操作，则展现模块适于展现初始等级相对应的交互操作所对应的交互界面；

第二执行模块，适于若否，根据与上一个采样时间内的语音音量值相对应的音量等级，以及当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量，确定与当前采样时间内的语音音量值相对应的音量等级，执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作，则展现模块适于展现音量等级相对应的交互操作所对应的交互界面。

根据本公开的再一方面，提供了一种电子设备，包括：处理器、存储器、通信接口和通信总线，处理器、存储器和通信接口通过所述通信总线完成相互间的通信；

存储器用于存放至少一可执行指令，可执行指令使处理器执行如上述的基于语音的交互方法对应的操作。

依据本公开的再一方面，提供了另一种电子设备，包括：处理器、存储器、通信接口和通信总线，处理器、存储器和通信接口通过通信总线完成相互间的通信；

根据本公开的再一方面，提供了一种非易失性计算机可读存储介质，该非易失性计算机可读存储介质中存储有至少一可执行指令，可执行指令使处理器执行如上述的基于语音的交互方法对应的操作。

根据本公开的再又一方面，还提供了一种计算机程序产品，该计算机程序产品包括存储在上述非易失性计算机可读存储介质上的计算程序。

根据本公开的再一方面，提供了另一种非易失性计算机可读存储介质，该非易失性计算机可读存储介质中存储有至少一可执行指令，可执行指令使处理器执行如上述的基于语音的交互方法对应的操作。

根据本公开提供的基于语音的交互方法及系统，通过确定当前采样时间内的语音音量值，判断当前采样时间是否为首个采样时间，若是则将与当前采样时间内的语音音量值相对应的音量等级确定为初始等级，执行与初始等级相对应的交互操作，若否则根据与上一个采样时间内的语音音量值相对应的音量等级，以及当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量，确定与当前采样时间内的语音音量值相对应的音量等级，执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作。根据该方法，能够使客户端当前采样时间内的语音音量值相对应的音量等级只与该用户的上一个采样时间内的语音音量值相对应的音量等级相比较，从而得到当前采样时间内的语音音量值相对应的音量等级，并根据该音量等级执行其相对应的交互操作，这样避免了由于用户的设备灵敏性差异以及声源与设备之间的距离对客户端采集到的语音音量等级的影响，进而提高了用户在各种动态交互活动中的体验。

上述说明仅是本公开技术方案的概述，为了能够更清楚了解本公开的技术手段，而可依照说明书的内容予以实施，并且为了让本公开的上述和其它目的、特征和优点能够更明显易懂，以下特举本公开的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本公开的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本公开实施例一提供的一种基于语音的交互方法的流程图；

图2示出了本公开实施例二提供的一种基于语音的交互方法的流程图；

图3示出了自定义音量等级与声波动画对应时间以及奖金对应范围的对照关系的示例性示意图；

图4a示出了本公开又一实施例提供的一种基于语音的交互方法的方法流程图；

图4b示出了本公开提供的基于语音的交互方法所对应的示意性流程图；

图5示出了本公开实施例三提供的一种基于语音的交互系统的结构图；

图6示出了本公开实施例五提供的一种电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

实施例一

图1示出了本公开实施例一提供的一种基于语音的交互方法的流程图。如图1所示，该方法包括：

步骤S110：确定当前采样时间内的语音音量值，判断当前采样时间是否为首个采样时间。

其中，上述语音音量值可以是系统接口获取的原始值，也可以是处理后的分贝值，还可以是可以表示音量大小的其他类型的数值，总之本公开并不限制语音音量值的具体表现形式，凡是能够表示语音音量值大小的数值均在本公开的保护范围之内。当前采样时间可以为连续时间段中的各个采样时间段或者采样区间。具体地，可以预先划分每个采样区间的持续时长，比如可以将每一秒确定为一个采样区间或者将每隔0.5秒确定为一个采样区间，采样区间的持续时长还可以为其它的时间值，该时间值的大小可以由本领域人员根据想要获取语音音量值的精度与灵敏度来确定。如果想要提高获取语音音量值的精度与灵敏度，则可以将该时间值设置的相对较小，如果对获取语音音量值的精度与灵敏度要求不高，则可以将该时间值设置的相对较大。在确定当前采样时间内的语音音量值之后，判断当前采样时间是否为首个采样时间。

步骤S120：若是，将与当前采样时间内的语音音量值相对应的音量等级确定为初始等级，执行与初始等级相对应的交互操作。

具体地，在执行步骤S110之前可以预先设置多个按照从高到低的顺序依次排列的音量等级，并分别设置与每个音量等级相对应的交互操作的操作类型和/或操作内容。然后可以把上述各个音量等级中的一个或者多个音量等级设置为初始等级。其中，上述操作类型可以为交互动画类型、和/或资源配置类型。相应地，操作内容可以为交互动画的动画种类、动画变化速度、和/或动画持续时长。与上述资源配置类型相对应的操作内容包括：配置的资源种类、和/或资源数额。如果判断当前采样时间为首个采样时间，则可以将当前采样时间内的语音音量值相对应的音量等级确定为初始等级，并且执行与初始等级相对应的交互操作。

步骤S130：若否，根据与上一个采样时间内的语音音量值相对应的音量等级，以及当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量，确定与当前采样时间内的语音音量值相对应的音量等级，执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作。

具体地，可以将上一个采样时间内的语音音量值相对应的音量等级确定为基准音量等级，并且将当前采样时间内的语音音量值与上一个采样时间内的语音音量值进行比较，如果当前采样时间内的语音音量值大于上一个采样时间内的语音音量值，则可以在基准音量等级的基础上增加至少一个音量等级，得到与当前采样时间内的语音音量值相对应的音量等级。如果当前采样时间内的语音音量值小于上一个采样时间内的语音音量值，则可以在基准音量等级的基础上降低至少一个音量等级，得到与当前采样时间内的语音音量值相对应的音量等级。当确定与当前采样时间内的语音音量值相对应的音量等级之后，执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作。

通过执行该步骤S130中的内容，可以使客户端在根据采集的语音变化来改变交互操作时，避免客户端受到用户使用的设备质量的影响以及用户与设备距离大小的影响，从而做到只与自己上一个采样时间内的语音音量值比较来确定与当前采样时间内的语音音量值相对应的音量等级，从而执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作。

根据本申请实施例一提供的基于语音的交互方法的流程图，通过确定当前采样时间内的语音音量值，判断当前采样时间是否为首个采样时间，若是则将与当前采样时间内的语音音量值相对应的音量等级确定为初始等级，执行与初始等级相对应的交互操作，若否则根据与上一个采样时间内的语音音量值相对应的音量等级，以及当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量，确定与当前采样时间内的语音音量值相对应的音量等级，执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作。根据该方法，能够使客户端当前采样时间内的语音音量值相对应的音量等级只与该用户的上一个采样时间内的语音音量值相对应的音量等级相比较，从而得到当前采样时间内的语音音量值相对应的音量等级，并根据该音量等级执行其相对应的交互操作，这样避免了由于用户的设备灵敏性差异以及声源与设备之间的距离对客户端采集到的语音音量等级的影响，进而提高了用户在各种动态交互活动中的体验。

图2示出了本公开实施例二提供的一种基于语音的交互方法的流程图。如图2所示，该方法包括：

步骤S210：设置多个按照从高到低的顺序依次排列的音量等级，并分别设置与每个音量等级相对应的交互操作的操作类型和/或操作内容。

其中，上述交互操作的操作类型包括：交互动画类型、和/或资源配置类型。其中，交互动画类型可以指根据实时的录音给出交互动画，比如在歌唱类软件界面上根据语音呈现的音频高低的提示，在资源配置活动中客户端界面根据语音大小显示的随之发生变化快慢的动画界面。资源配置类型可以指根据语音抢红包，摇转盘来分配奖品等类型的资源配置类型的交互操作。相应地，与上述交互动画类型相对应的操作内容包括：交互动画的动画种类、动画变化速度、和/或动画持续时长。与上述资源配置类型相对应的操作内容包括：配置的资源种类、和/或资源数额。其中，资源配置活动所配置的资源可以为优惠券、现金、电子券、商品兑换码等各种资源。

其中，上述音量等级可以根据音量值的大小来设置，比如可以设置为与音量值成正相关的关系，音量等级随着音量值的增大而增大。可选地，以操作类型为资源配置类型为例，音量等级还可以根据声波动画对应的时间来设置，比如可以设置为与声波动画对应的时间成反比的关系，这样音量等级随着声波动画对应的时间的增大而减小，上述声波动画是指显示在客户端界面上的根据采集到的声音而发生变动的声波动画。图3示出了自定义音量等级与声波动画对应时间以及奖金对应范围的对照关系的示例性示意图。如图3所示，自定义音量等级5所对应的声波动画对应时间为400ms，奖金对应范围为10～14.99；自定义音量等级4所对应的声波动画对应时间为600ms，奖金对应范围为8～9.99；自定义音量等级3所对应的声波动画对应时间为800ms，奖金对应范围为6～7.99，其他自定义音量等级与所对应的声波动画对应时间以及奖金对应范围的对照关系可以参照图3，在此不再一一赘述。值得注意的是，上述图3只是示例性示意图，自定义音量等级与所对应的声波动画对应时间以及奖金对应范围的对照关系除了为上述的对照关系外，还可以由本领域技术人员根据要求资源配置活动达到的趣味性，将上述对照关系设置为其他的对照关系。上述音量等级、以及每个音量等级相对应的交互操作的操作类型和/或操作内容可以在客户端应用中内置，也可以通过服务器端动态下发。

在设置上述多个按照从高到低的顺序依次排列的音量等级之后，分别设置与每个音量等级相对应的交互操作的操作类型和/或操作内容。通过执行该步骤中的内容，在下述步骤中每当确定采样时间内的音量等级之后，可以根据该对照关系执行与每个音量等级相对应的交互操作。

步骤S220：将多个音量等级中的至少一个音量等级设置为初始等级。

为了实现客户端音量识别不受用户设备本身的限制以及不受声源与设备距离大小的影响，在本步骤中可以将多个音量等级中的至少一个音量等级设置为初始音量等级。初始音量等级可以为上述音量等级中的任意一个或者多个，比如可以将自定义声音等级0设置为初始等级，或者将自定义声音等级1设置为初始等级，还可以将其他自定义音量等级设置为初始等级。

步骤S230：确定当前采样时间内的语音音量值，判断当前采样时间是否为首个采样时间。

其中，上述采样时间可以为连续时间段中的采样时间段或者采样区间。具体地，可以预先划分每个采样区间的持续时长，比如可以将每一秒确定为一个采样区间或者将每隔0.5秒确定为一个采样区间，采样区间的持续时长还可以为其它的时间值，在此不作限制。该采样时间可以在客户端的应用中设置，还可以通过服务器端动态下发。在客户端采集到采样时间内用户输入的语音之后，确定当前采样时间内的语音音量值，并且判断当前采样时间是否为首个采样时间。

其中，上述采样时间内的语音音量值根据该采样时间内接收到的语音输入内容的平均音量值、最大音量值、和/或最小音量值确定。上述语音输入内容的音量值可以是从系统接口获取的原始值，也可以是处理后的分贝值，还可以是其他类型的可以表示音量大小的数值，总之本公开并不限制语音音量值的具体表现形式。具体地，上述音量又称响度、音强，是指人耳对所听到的声音大小强弱的主观感受，其客观评价尺度是声音的振幅大小。这种感受源自物体振动时所产生的压力，即声压。物体振动通过不同的介质，将其振动能量传导开去。物体振动通过不同的介质，将其振动能量传导开去。人们为了对声音的感受量化成可以监测的指标，就把声压分成“级”即声压级，以便能客观的表示声音的强弱，其单位称为“分贝”(dB)。其中，分贝(decibel)是量度两个相同单位之数量比例的计量单位，主要用于度量声音强度，常用dB表示。计算公式为：dB＝(20*Math.log10(amplitude/REFERENCE))，其中amplitude是监测到的声压值(单位Pascal)，REFERENCE是参考的声压值(一般为20Pascal，即人耳能感受到的最低声压)。在安卓应用中，可以使用系统接口“MediaRecorder.getMaxAmplitude()”获得原始声压值amplitude，然后代入公式中求得对应的分贝值。另外，音调/声频是指：物体震动产生的声音频率，单位为赫兹(Hz)；人耳可闻的振动频率范围约从20～20000Hz。

步骤S240：若是，将与当前采样时间内的语音音量值相对应的音量等级确定为初始等级，执行与初始等级相对应的交互操作。

如果判断当前采样时间为首个采样时间，则将与当前采样时间内的语音音量值相对应的音量等级确定为初始等级，并按照在步骤S210中设置的与每个音量等级相对应的交互操作的操作类型和/或操作内容来执行与初始等级相对应的交互操作。

步骤S250：若否，则将与上一个采样时间内的语音音量值相对应的音量等级确定为基准音量等级。

如果判断当前采样时间不是首个采样时间，则可以将上一个采样时间段内的语音音量值相对应的音量等级确定为基准音量等级，并将当前采样时间内的语音音量值与上一个采样时间内的语音音量值进行比较，然后根据比较结果以及基准音量等级来确定当前采样时间内的语音音量值相对应的音量等级。

步骤S251：若当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量为正数，在基准音量等级的基础上增加至少一个音量等级，得到与当前采样时间内的语音音量值相对应的音量等级，并执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作。

具体地，若当前采样时间内的语音音量值大于上述上一个采样时间内的语音音量值，则可以在基准音量等级的基础上增加至少一个音量等级，从而得到与当前采样时间内的语音音量值相对应的音量等级，并执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作。具体地，为了防止当前采样时间内的语音音量值相对应的音量等级变化的过于频繁从而使交互变化过于频繁，可以预设变化量阈值，若是判断当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量大于该预设的变化量阈值，则可以在基准音量等级的基础上增加至少一个音量等级，从而得到与当前采样时间内的语音音量值相对应的音量等级。上述变化量阈值可以根据用户希望根据语音变化而改变交互操作的频繁度来确定，具体地，可以通过减低上述变化量阈值来提高改变交互操作的频繁度，通过提高上述变化量阈值来降低改变交互操作的频繁度，具体的数值可以由本领域技术人员根据实际情况来制定，在此不作限制。

进一步地，为了防止因微小波动而导致频繁调整当前采样时间内的语音音量值相对应的音量等级，并且为了更加精确地根据语音音量值调整当前采样时间内的语音音量值相对应的音量等级，可以预先设置音量阶梯值，并且根据上述语音音量值的变化量与音量阶梯值的比较结果来确定增加的音量等级的个数。

步骤S252：若当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量为负数，在基准音量等级的基础上降低至少一个音量等级，得到与当前采样时间内的语音音量值相对应的音量等级，并执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作。

具体地，若当前采样时间内的语音音量值小于上述上一个采样时间内的语音音量值，则可以在基准音量等级的基础上降低至少一个音量等级，从而得到与当前采样时间内的语音音量值相对应的音量等级，并执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作。具体地，为了防止当前采样时间内的语音音量值相对应的音量等级变化得过于频繁从而使动态交互变化地过于频繁，可以预设变化量阈值，若是判断当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量大于该预设的变化量阈值，则可以在基准音量等级的基础上降低至少一个音量等级，从而得到与当前采样时间内的语音音量值相对应的音量等级。上述变化量阈值可以根据用户希望根据语音变化而改变交互操作的频繁度来确定，具体地，可以通过降低上述变化量阈值来提高改变交互操作的频繁度，通过提高上述变化量阈值来降低改变交互操作的频繁度，具体的数值可以由本领域技术人员根据实际情况来制定，在此不作限制。

进一步地，为了防止因微小波动而导致频繁调整当前采样时间内的语音音量值相对应的音量等级，并且为了更加精确地根据语音音量值调整当前采样时间内的语音音量值相对应的音量等级，可以预先设置音量阶梯值，并且根据上述语音音量值的变化量与音量阶梯值得比较结果来确定降低的音量等级的个数。

根据本实施二提供的基于语音的交互方法，通过首先设置多个按照从高到低的顺序依次排列的音量等级，并分别设置与每个音量等级相对应的交互操作的操作类型和/或操作内容，并将多个音量等级中的至少一个音量等级设置为初始等级，然后确定当前采样时间内的语音音量值，判断当前采样时间是否为首个采样时间，若是则将与当前采样时间内的语音音量值相对应的音量等级确定为初始等级，执行与初始等级相对应的交互操作，若否则将与上一个采样时间内的语音音量值相对应的音量等级确定为基准音量等级，并且若当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量为正数，在基准音量等级的基础上增加至少一个音量等级，得到与当前采样时间内的语音音量值相对应的音量等级，并执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作，若当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量为负数，在基准音量等级的基础上降低至少一个音量等级，得到与当前采样时间内的语音音量值相对应的音量等级，并执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作。根据该方法，能够使客户端所确定的用户录入的声音音量值所对应的音量等级不受设备灵敏性、以及声源与设备之间的距离等这些客观因素的干扰，而是只基于用户自己录入的声音音量值的大小来确定音量等级，真正地做到自己与自己作比较来确定当前采样时间内的语音音量值相对应的音量等级，从而执行与上述音量定级相对应的交互操作，这样可以使每个用户都有机会在资源配置活动中达到最快的动画或者获得最高的奖金。

另外，图4a示出了本公开又一实施例提供的一种基于语音的交互方法的方法流程图，如图4a所示，包括：

步骤S410：接收用于实现交互操作的语音输入内容。

具体地，可通过预设的交互入口接收用于实现交互操作的语音输入内容；其中，交互入口包括：用于实现资源配置活动的入口(例如抢红包入口)、用于显示交互动画的入口等。

步骤S420：确定语音输入内容在当前采样时间内的语音音量值，判断当前采样时间是否为首个采样时间。

由于用户输入的语音输入内容通常会持续一段时间，为了能够检测语音输入内容在各个时段内的语音音量值，可以每隔预设时间间隔执行一次步骤S420及其后续步骤。其中，预设时间间隔越小，越能达到近似实时的效果。本领域技术人员可结合实时性和终端设备的性能参数来设置该预设时间间隔。另外，该预设时间间隔也可以等同于采样周期，例如，预设时间间隔为1秒钟，则采样周期也为1秒钟，则在初始阶段，通过步骤S420获取第1秒钟(即当前采样时间)内的语音音量值，相应地，确定当前采样时间为首个采样时间，执行步骤S430。又如，在后续阶段，通过步骤S420获取第n秒钟(即当前采样时间，其中，n大于1)内的语音音量值，相应地，确定当前采样时间非首个采样时间，执行步骤S440。

步骤S430：若是，将与当前采样时间内的语音音量值相对应的音量等级确定为初始等级，执行与初始等级相对应的交互操作，并展现初始等级相对应的交互操作所对应的交互界面。

关于初始等级及其对应的交互操作及交互界面可参照实施例二中相应步骤的描述，此处不再赘述。

步骤S440：若否，根据与上一个采样时间内的语音音量值相对应的音量等级，以及当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量，确定与当前采样时间内的语音音量值相对应的音量等级，执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作，并展现音量等级相对应的交互操作所对应的交互界面。

具体地，将与上一个采样时间内的语音音量值相对应的音量等级确定为基准音量等级；若当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量为正数，在基准音量等级的基础上增加至少一个音量等级，得到与当前采样时间内的语音音量值相对应的音量等级；若当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量为负数，在基准音量等级的基础上降低至少一个音量等级，得到与当前采样时间内的语音音量值相对应的音量等级。可选地，若当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量为正数，在基准音量等级的基础上增加至少一个音量等级的步骤具体包括：判断当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量是否大于预设的变化量阈值；若是，则在基准音量等级的基础上增加至少一个音量等级；若当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量为负数，在基准音量等级的基础上降低至少一个音量等级的步骤具体包括：判断当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量是否大于预设的变化量阈值；若是，则在基准音量等级的基础上降低至少一个音量等级。其中，采样时间内的语音音量值根据该采样时间内接收到的语音输入内容的平均音量值、最大音量值、和/或最小音量值确定。

其中，步骤S440的具体细节可参照实施例二中相应步骤的描述，此处不再赘述。

另外，初始等级相对应的交互操作所对应的交互界面和/或音量等级相对应的交互操作所对应的交互界面包括：资源配置界面、交互动画界面。例如，在资源配置活动中，若音量等级越大，则对应的资源配置界面中包含的资源数量越多、类型越珍贵；反之，音量等级越小，则对应的资源配置界面中包含的资源数量越少、类型越廉价。又如，在交互动画活动中，若音量等级越大，则对应的交互动画界面中的交互动画变化越快、持续时间越短；反之，音量等级越小，则对应的交互动画界面中的交互动画变化越慢、持续时间越长。

可选地，在步骤S410之前，进一步设置多个按照从高到低的顺序依次排列的音量等级，并分别设置与每个音量等级相对应的交互操作的操作类型和/或操作内容。其中，交互操作的操作类型包括：交互动画类型、和/或资源配置类型；与交互动画类型相对应的操作内容包括：交互动画的动画种类、动画变化速度、和/或动画持续时长；与资源配置类型相对应的操作内容包括：配置的资源种类、和/或资源数额。

本领域技术人员可以对本实施例以及实施例二进行结合或各种改动，本实施例中的各个步骤的具体实现细节均可参照实施例二中相应部分的描述，此处不再赘述。

图4b示出了本公开提供的基于语音的交互方法所对应的示意性流程图。为了更加详细地说明本公开的技术方案，以图4b为例，下面将论述本公开提供的基于语音的交互方法的具体步骤。步骤S401：录音开始，客户端开始采集用户的录音；步骤S402：然后假设用户初始声音等级为初始等级L0；步骤S403：接着获取采样时间内的声音的最大分贝d；步骤S404：比较本次分贝值是否大于上一次的分贝值；步骤S405：如果分贝值比上一次大，则声音等级提升一个或者多个等级，到最大等级则不增加；步骤S406：如果分贝值比上一次的小，则声音等级降低一个或者多个等级，到最小等级则不降低；步骤S407：执行与当前声音等级相对应的交互操作，在本次流程中，可以把单个动画完成时间更新为对应的时间；最后在步骤S408中判断录音是否结束，从而判断是否结束本次操作流程，若是则结束本次操作流程，若否则重复执行上述步骤S403～S408直到用户结束录音。

实施例三

图5示出了本公开实施例三提供的一种基于语音的交互系统的结构示意图，该系统包括：

确定模块53，适于确定当前采样时间内的语音音量值，判断当前采样时间是否为首个采样时间；

第一执行模块54，适于若是，将与当前采样时间内的语音音量值相对应的音量等级确定为初始等级，执行与初始等级相对应的交互操作；

第二执行模块55，适于若否，根据与上一个采样时间内的语音音量值相对应的音量等级，以及当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量，确定与当前采样时间内的语音音量值相对应的音量等级，执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作。

可选地，其中，第二执行模块55具体适于：

将与上一个采样时间内的语音音量值相对应的音量等级确定为基准音量等级；

若当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量为正数，在基准音量等级的基础上增加至少一个音量等级，得到与当前采样时间内的语音音量值相对应的音量等级；

若当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量为负数，在基准音量等级的基础上降低至少一个音量等级，得到与当前采样时间内的语音音量值相对应的音量等级。

可选地，其中，第二执行模块具体适于：判断当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量是否大于预设的变化量阈值；若是，则在基准音量等级的基础上增加至少一个音量等级；

第二执行模块55具体适于：判断当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量是否大于预设的变化量阈值；若是，则在基准音量等级的基础上降低至少一个音量等级。

可选地，其中，采样时间内的语音音量值根据该采样时间内接收到的语音输入内容的平均音量值、最大音量值、和/或最小音量值确定。

可选地，其中，系统进一步包括：第一设置模块51，适于设置多个按照从高到低的顺序依次排列的音量等级，并分别设置与每个音量等级相对应的交互操作的操作类型和/或操作内容。

可选地，其中，交互操作的操作类型包括：交互动画类型、和/或资源配置类型；

与交互动画类型相对应的操作内容包括：交互动画的动画种类、动画变化速度、和/或动画持续时长；

与资源配置类型相对应的操作内容包括：配置的资源种类、和/或资源数额。

可选地，其中，系统还进一步包括第二设置模块52，适于：

将多个音量等级中的至少一个音量等级设置为初始等级。

关于上述各个模块的具体结构和工作原理可参照方法实施例中相应部分的描述，此处不再赘述。

另外，本公开还提供了又一种基于语音的交互系统，该系统与图5所示的系统的区别在于，该系统在图5的系统的基础上进一步包括：接收模块和展现模块。相应地，该系统包括：接收模块、确定模块、第一执行模块、第二执行模块、以及展现模块，其中，

接收模块，与确定模块相连，适于接收用于实现交互操作的语音输入内容；

其中，展现模块分别与第一执行模块和第二执行模块相连。

可选地，接收模块具体适于：通过预设的交互入口接收用于实现交互操作的语音输入内容；其中，交互入口包括：用于实现资源配置活动的入口、用于显示交互动画的入口；

初始等级相对应的交互操作所对应的交互界面和/或音量等级相对应的交互操作所对应的交互界面包括：资源配置界面、交互动画界面。

可选地，第二执行模块具体适于：

判断当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量是否大于预设的变化量阈值；若是，则在基准音量等级的基础上增加至少一个音量等级；

判断当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量是否大于预设的变化量阈值；若是，则在基准音量等级的基础上降低至少一个音量等级。

可选地，采样时间内的语音音量值根据该采样时间内接收到的语音输入内容的平均音量值、最大音量值、和/或最小音量值确定。

可选地，系统进一步包括第一设置模块，适于：

将多个音量等级中的至少一个音量等级设置为初始等级。

设置多个按照从高到低的顺序依次排列的音量等级，并分别设置与每个音量等级相对应的交互操作的操作类型和/或操作内容。

可选地，交互操作的操作类型包括：交互动画类型、和/或资源配置类型；

实施例四

本申请实施例四提供了一种非易失性计算机可读存储介质，该非易失性计算机可读存储介质存储有至少一可执行指令，该计算机可执行指令可执行上述任意方法实施例中的基于语音的交互方法。

可执行指令具体可以用于使得处理器执行以下操作：

确定当前采样时间内的语音音量值，判断当前采样时间是否为首个采样时间；

另外，上述可执行指令还可以用于使得处理器执行以下操作：接收用于实现交互操作的语音输入内容；

实施例五

图6示出了根据本公开实施例五的一种电子设备的结构示意图，本公开具体实施例并不对电子设备的具体实现做限定。

如图6所示，该电子设备可以包括：处理器(processor)602、通信接口(Communications Interface)606、存储器(memory)604、以及通信总线608。

其中：

处理器602、通信接口606、以及存储器604通过通信总线608完成相互间的通信。

通信接口606，用于与其它设备比如客户端或其它服务器等的网元通信。

处理器602，用于执行程序610，具体可以执行上述基于语音的交互方法实施例中的相关步骤。

具体地，程序610可以包括程序代码，该程序代码包括计算机操作指令。

处理器602可能是中央处理器CPU，或者是特定集成电路ASIC(Application Specific Integrated Circuit)，或者是被配置成实施本公开实施例的一个或多个集成电路。电子设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器604，用于存放程序610。存储器604可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序510具体可以用于使得处理器502执行以下操作：

另外，程序510还可以用于使得处理器502执行以下操作：

接收用于实现交互操作的语音输入内容；

若否，根据与上一个采样时间内的语音音量值相对应的音量等级，以及所述当前采样时间内的语音音量值相对于上一个采样时间内的语音音量值的变化量，确定与当前采样时间内的语音音量值相对应的音量等级，执行与当前采样时间内的语音音量值相对应的音量等级相对应的交互操作，并展现音量等级相对应的交互操作所对应的交互界面。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本公开也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本公开的内容，并且上面对特定语言所做的描述是为了披露本公开的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本公开的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个公开方面中的一个或多个，在上面对本公开的示例性实施例的描述中，本公开的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本公开要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，公开方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本公开的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本公开的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本公开的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开实施例的基于语音输入信息的抽奖系统中的一些或者全部部件的一些或者全部功能。本公开还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本公开的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本公开进行说明而不是对本公开进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

一种基于语音的交互方法，包括：

确定当前采样时间内的语音音量值，判断所述当前采样时间是否为首个采样时间；

若是，将与所述当前采样时间内的语音音量值相对应的音量等级确定为初始等级，执行与所述初始等级相对应的交互操作；

若否，根据与上一个采样时间内的语音音量值相对应的音量等级，以及所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量，确定与所述当前采样时间内的语音音量值相对应的音量等级，执行与所述当前采样时间内的语音音量值相对应的音量等级相对应的交互操作。
根据权利要求1所述的方法，其中，所述根据与上一个采样时间内的语音音量值相对应的音量等级，以及所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量，确定与所述当前采样时间内的语音音量值相对应的音量等级的步骤具体包括：

将所述与上一个采样时间内的语音音量值相对应的音量等级确定为基准音量等级；

若所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量为正数，在所述基准音量等级的基础上增加至少一个音量等级，得到与所述当前采样时间内的语音音量值相对应的音量等级；

若所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量为负数，在所述基准音量等级的基础上降低至少一个音量等级，得到与所述当前采样时间内的语音音量值相对应的音量等级。
根据权利要求2所述的方法，其中，所述若所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量为正数，在所述基准音量等级的基础上增加至少一个音量等级的步骤具体包括：判断所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量是否大于预设的变化量阈值；若是，则在所述基准音量等级的基础上增加至少一个音量等级；

所述若所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量为负数，在所述基准音量等级的基础上降低至少一个音量等级的步骤具体包括：判断所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量是否大于预设的变化量阈值；若是，则在所述基准音量等级的基础上降低至少一个音量等级。
根据权利要求1-3任一所述的方法，其中，所述采样时间内的语音音量值根据该采样时间内接收到的语音输入内容的平均音量值、最大音量值、和/或最小音量值确定。
根据权利要求1-4任一所述的方法，其中，所述方法执行之前，进一步包括：

设置多个按照从高到低的顺序依次排列的音量等级，并分别设置与每个音量等级相对应的交互操作的操作类型和/或操作内容。
根据权利要求5所述的方法，其中，所述交互操作的操作类型包括：交互动画类型、和/或资源配置类型；

与所述交互动画类型相对应的操作内容包括：交互动画的动画种类、动画变化速度、和/或动画持续时长；

与所述资源配置类型相对应的操作内容包括：配置的资源种类、和/或资源数额。
根据权利要求5或6所述的方法，其中，所述方法执行之前，进一步包括：

将所述多个音量等级中的至少一个音量等级设置为所述初始等级。
一种基于语音的交互方法，包括：

接收用于实现交互操作的语音输入内容；

确定所述语音输入内容在当前采样时间内的语音音量值，判断所述当前采样时间是否为首个采样时间；

若是，将与所述当前采样时间内的语音音量值相对应的音量等级确定为初始等级，执行与所述初始等级相对应的交互操作，并展现所述初始等级相对应的交互操作所对应的交互界面；

若否，根据与上一个采样时间内的语音音量值相对应的音量等级，以及所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量，确定与所述当前采样时间内的语音音量值相对应的音量等级，执行与所述当前采样时间内的语音音量值相对应的音量等级相对应的交互操作，并展现所述音量等级相对应的交互操作所对应的交互界面。
根据权利要求8所述的方法，其中，所述接收用于实现交互操作的语音输入内容的步骤具体包括：通过预设的交互入口接收用于实现交互操作的语音输入内容；其中，所述交互入口包括：用于实现资源配置活动的入口、用于显示交互动画的入口；

所述初始等级相对应的交互操作所对应的交互界面和/或所述音量等级相对应的交互操作所对应的交互界面包括：资源配置界面、交互动画界面。
根据权利要求8或9所述的方法，其中，所述根据与上一个采样时间内的语音音量值相对应的音量等级，以及所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量，确定与所述当前采样时间内的语音音量值相对应的音量等级的步骤具体包括：

将所述与上一个采样时间内的语音音量值相对应的音量等级确定为基准音量等级；

若所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量为正数，在所述基准音量等级的基础上增加至少一个音量等级，得到与所述当前采样时间内的语音音量值相对应的音量等级；

若所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量为负数，在所述基准音量等级的基础上降低至少一个音量等级，得到与所述当前采样时间内的语音音量值相对应的音量等级。
根据权利要求10所述的方法，其中，所述若所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量为正数，在所述基准音量等级的基础上增加至少一个音量等级的步骤具体包括：判断所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量是否大于预设的变化量阈值；若是，则在所述基准音量等级的基础上增加至少一个音量等级；

所述若所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量为负数，在所述基准音量等级的基础上降低至少一个音量等级的步骤具体包括：判断所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量是否大于预设的变化量阈值；若是，则在所述基准音量等级的基础上降低至少一个音量等级。
根据权利要求8-11任一所述的方法，其中，所述采样时间内的语音音量值根据该采样时间内接收到的语音输入内容的平均音量值、最大音量值、和/或最小音量值确定。
根据权利要求8-12任一所述的方法，其中，所述方法执行之前，进一步包括：

设置多个按照从高到低的顺序依次排列的音量等级，并分别设置与每个音量等级相对应的交互操作的操作类型和/或操作内容。
根据权利要求13所述的方法，其中，所述交互操作的操作类型包括：交互动画类型、和/或资源配置类型；

与所述交互动画类型相对应的操作内容包括：交互动画的动画种类、动画变化速度、和/或动画持续时长；

与所述资源配置类型相对应的操作内容包括：配置的资源种类、和/或资源数额。
一种基于语音的交互系统，包括：

确定模块，适于确定当前采样时间内的语音音量值，判断所述当前采样时间是否为首个采样时间；

第一执行模块，适于若是，将与所述当前采样时间内的语音音量值相对应的音量等级确定为初始等级，执行与所述初始等级相对应的交互操作；

第二执行模块，适于若否，根据与上一个采样时间内的语音音量值相对应的音量等级，以及所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量，确定与所述当前采样时间内的语音音量值相对应的音量等级，执行与所述当前采样时间内的语音音量值相对应的音量等级相对应的交互操作。
根据权利要求15所述的系统，其中，所述第二执行模块具体适于：

将所述与上一个采样时间内的语音音量值相对应的音量等级确定为基准音量等级；

若所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量为正数，在所述基准音量等级的基础上增加至少一个音量等级，得到与所述当前采样时间内的语音音量值相对应的音量等级；

若所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量为负数，在所述基准音量等级的基础上降低至少一个音量等级，得到与所述当前采样时间内的语音音量值相对应的音量等级。
根据权利要求16所述的系统，其中，所述第二执行模块具体适于：判断所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量是否大于预设的变化量阈值；若是，则在所述基准音量等级的基础上增加至少一个音量等级；

所述第二执行模块具体适于：判断所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量是否大于预设的变化量阈值；若是，则在所述基准音量等级的基础上降低至少一个音量等级。
根据权利要求15-17任一所述的系统，其中，所述采样时间内的语音音量值根据该采样时间内接收到的语音输入内容的平均音量值、最大音量值、和/或最小音量值确定。
根据权利要求15-18任一所述的系统，其中，所述系统进一步包括：第一设置模块，适于设置多个按照从高到低的顺序依次排列的音量等级，并分别设置与每个音量等级相对应的交互操作的操作类型和/或操作内容。
根据权利要求19所述的系统，其中，所述交互操作的操作类型包括：交互动画类型、和/或资源配置类型；

与所述交互动画类型相对应的操作内容包括：交互动画的动画种类、动画变化速度、和/或动画持续时长；

与所述资源配置类型相对应的操作内容包括：配置的资源种类、和/或资源数额。
根据权利要求19或20所述的系统，其中，所述系统还进一步包括第二设置模块，适于：

将所述多个音量等级中的至少一个音量等级设置为所述初始等级。
一种基于语音的交互系统，包括：接收模块、确定模块、第一执行模块、第二执行模块、以及展现模块，其中，

所述接收模块，适于接收用于实现交互操作的语音输入内容；

所述确定模块，适于确定所述语音输入内容在当前采样时间内的语音音量值，判断所述当前采样时间是否为首个采样时间；

所述第一执行模块，适于若是，将与所述当前采样时间内的语音音量值相对应的音量等级确定为初始等级，执行与所述初始等级相对应的交互操作，则所述展现模块适于展现所述初始等级相对应的交互操作所对应的交互界面；

所述第二执行模块，适于若否，根据与上一个采样时间内的语音音量值相对应的音量等级，以及所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量，确定与所述当前采样时间内的语音音量值相对应的音量等级，执行与所述当前采样时间内的语音音量值相对应的音量等级相对应的交互操作，则所述展现模块适于展现所述音量等级相对应的交互操作所对应的交互界面。
根据权利要求22所述的系统，其中，所述接收模块具体适于：通过预设的交互入口接收用于实现交互操作的语音输入内容；其中，所述交互入口包括：用于实现资源配置活动的入口、用于显示交互动画的入口；

所述初始等级相对应的交互操作所对应的交互界面和/或所述音量等级相对应的交互操作所对应的交互界面包括：资源配置界面、交互动画界面。
根据权利要求22或23所述的系统，其中，所述第二执行模块具体适于：

将所述与上一个采样时间内的语音音量值相对应的音量等级确定为基准音量等级；

若所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量为正数，在所述基准音量等级的基础上增加至少一个音量等级，得到与所述当前采样时间内的语音音量值相对应的音量等级；

若所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量为负数，在所述基准音量等级的基础上降低至少一个音量等级，得到与所述当前采样时间内的语音音量值相对应的音量等级。
根据权利要求24所述的系统，其中，所述第二执行模块具体适于：

判断所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量是否大于预设的变化量阈值；若是，则在所述基准音量等级的基础上增加至少一个音量等级；

判断所述当前采样时间内的语音音量值相对于所述上一个采样时间内的语音音量值的变化量是否大于预设的变化量阈值；若是，则在所述基准音量等级的基础上降低至少一个音量等级。
根据权利要求22-25任一所述的系统，其中，所述采样时间内的语音音量值根据该采样时间内接收到的语音输入内容的平均音量值、最大音量值、和/或最小音量值确定。
根据权利要求22-26任一所述的系统，其中，所述系统进一步包括第一设置模块，适于：

设置多个按照从高到低的顺序依次排列的音量等级，并分别设置与每个音量等级相对应的交互操作的操作类型和/或操作内容。
根据权利要求27所述的系统，其中，所述交互操作的操作类型包括：交互动画类型、和/或资源配置类型；

与所述交互动画类型相对应的操作内容包括：交互动画的动画种类、动画变化速度、和/或动画持续时长；

与所述资源配置类型相对应的操作内容包括：配置的资源种类、和/或资源数额。
一种电子设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的基于语音的交互方法对应的操作。
一种电子设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求8-14中任一项所述的基于语音的交互方法对应的操作。
一种非易失性计算机可读存储介质，所述非易失性计算机可读存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行如权利要求1-7中任一项所述的基于语音的交互方法对应的操作。
一种非易失性计算机可读存储介质，所述非易失性计算机可读存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行如权利要求8-14中任一项所述的基于语音的交互方法对应的操作。
一种计算机程序产品，其中，所述计算机程序产品包括存储在非易失性计算机存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，使所述计算机执行如权利要求1-7中任一项所述的基于语音的交互方法对应的操作。
一种计算机程序产品，其中，所述计算机程序产品包括存储在非易失性计算机存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，使所述计算机执行如权利要求8-14中任一项所述的基于语音的交互方法对应的操作。