CN108681440A

CN108681440A - 一种智能设备音量控制方法及系统

Info

Publication number: CN108681440A
Application number: CN201810291061.6A
Authority: CN
Inventors: 杨鹏; 范冰冰
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd; Shanghai Xiaodu Technology Co Ltd
Priority date: 2018-04-03
Filing date: 2018-04-03
Publication date: 2018-10-19

Abstract

本发明公开了一种智能设备音量控制方法及系统，其中方法包括获取噪声音量值以及语音操作指令对应的人声音量值；根据获取的所述噪声音量值及语音操作指令对应的人声音量值，获取智能设备所需的播放音量值。应用本发明所述方案，能够根据环境噪声智能调整播放音量，不需要用户频繁的进行音量更改，相比较现有技术中用户需要频繁调整音量的控制方式，提高了交互效率。

Description

一种智能设备音量控制方法及系统

【技术领域】

本发明涉及计算机应用技术，特别涉及智能设备音量控制方法及系统。

【背景技术】

随着语音识别技术的日益成熟，市场中正出现越来越多的智能设备，例如智能音箱，这些智能设备基于语音识别技术，为消费者提供更便捷的交互方式。

智能音箱的使用场景多样化，总体可分为家庭使用、办公室使用等场景。智能音箱所处的环境周边噪音情况可能较为复杂，比如家中电视、扫地机器人、音乐、人物对话等噪声，智能音箱所处在这些环境底噪之中，如果音箱的音量过小就会被环境音量覆盖，用户使用时候的体验会很差，只能通过减低周围噪音或者调高音箱音量，来获得相对清晰的效果。

由于音箱的音量经常会被用户进行调整，比如晚上会调得小声点，看电视的时候会调的大声点。音量的经常变动，会使得用户唤醒音箱后，经常存在音箱的声音和周围环境对比起来，音箱的音量可能过大，吓到用户、损害听力；或者音量过小被环境音量覆盖，用户无法听清楚，容易造成迷惑是没有对话成功影响使用还是设备音量小，每次都需要用户进行唤醒对话来调整音量，成本高且影响体验。例如，

当环境安静的时候，如果音箱之前的音量很大，用户唤醒音箱点播音乐服务后，很可能会被大音量惊吓到损害听力，降低体验。为此用户还需要唤醒一次，说出调低音量的query，甚至可能需要多次调整音量才能调到一个适合环境的合适音量。因为用户对于设备音量没有一个整体的把握，很可能只会多次重复说query“声音小一点”。

当环境较吵的时候，音箱的音量很可能被环境音量所覆盖，用户在唤醒音箱后点播音乐服务，很可能就听不到音箱的音量，用户可能怀疑是音箱没有响应，还是音量太小。用户需要尝试再说一次query“播放音乐”或者“声音大一点”，来看看是不是音箱没有点播成功还是音量的问题。

在用户唤醒音箱时候，音箱的音量可能过大，吓到用户、损害听力；或者音量过小被环境音量覆盖，用户无法听清楚，容易造成迷惑是设备音量小还是没有对话成功。

【发明内容】

本申请的多个方面提供了智能设备音量控制方法、系统、设备及存储介质，能够智能调整播放音量，不需要用户频繁的进行音量更改，提高交互效率。

本申请的一方面，提供一种智能设备音量控制方法，包括：

获取噪声音量值以及语音操作指令对应的人声音量值；

根据获取的所述噪声音量值及语音操作指令对应的人声音量值，获取智能设备所需的播放音量值。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述方法还包括：

按照获取的所述播放音量值，播放所述语音操作指令对应的音频信息。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，获取噪声音量值包括：

对唤醒检测得到的非语音段及非唤醒指令对应的语音段进行音量检测，得到噪声音量值。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，获取语音操作指令对应的人声音量值包括：

对唤醒检测得到的唤醒指令的后续语音操作指令对应的语音段进行人声音量检测，得到人声音量值。

对唤醒检测得到的唤醒指令对应的语音段进行人声音量检测，得到人声音量值。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，根据获取的所述噪声音量值及语音操作指令对应的人声音量值，获取智能设备所需的播放音量值包括：

根据获取的噪声音量值及语音操作指令对应的人声音量值，查找预设参数表，从中获取噪声音量值及人声音量值映射的播放音量值。

根据用户与智能设备的距离，对所述播放音量值进行调整。

本发明的另一方面，提供一种智能设备音量控制系统，包括：

参数获取模块，用于获取噪声音量值以及语音操作指令对应的人声音量值；

音量获取模块，用于根据获取的所述噪声音量值及语音操作指令对应的人声音量值，获取智能设备所需的播放音量值。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述系统还包括：

语音播放模块，用于按照获取的所述播放音量值，播放所述语音操作指令对应的音频信息。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述参数获取模块包括噪声音量值获取子模块，具体用于：

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述参数获取模块还包括人声音量值获取子模块，具体用于：

对检测得到的唤醒指令的后续语音操作指令对应的语音段进行人声音量检测，得到人声音量值。

对检测得到的唤醒指令对应的语音段进行人声音量检测，得到人声音量值。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述音量获取模块具体用于：

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述音量获取模块还用于：

根据用户与智能设备的距离，对所述播放音量值进行调整。

本发明的另一方面，提供一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现如以上所述的方法。

本发明的另一方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如以上所述的方法。

基于上述介绍可以看出，采用本发明所述方案，能够智能调整播放音量，不需要用户频繁的进行音量更改，相比较现有技术中用户需要频繁调整音量的控制方式，提高了交互效率。

【附图说明】

图1为本发明所述智能设备服务音量控制方法的流程图；

图2为本发明所述智能设备服务音量控制系统的结构图；

图3示出了适于用来实现本发明实施方式的示例性计算机系统/服务器012的框图。

【具体实施方式】

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例，都属于本申请保护的范围。

图1为本发明所述智能设备音量控制方法实施例的流程图，如图1所示，包括以下步骤：

步骤S11、获取噪声音量值以及语音操作指令对应的人声音量值；

步骤S12、根据获取的所述噪声音量值及语音操作指令对应的人声音量值，获取智能设备所需的播放音量值。

本实施例的执行主体为智能音箱。所述智能音箱包括麦克风、处理器、扬声器等硬件。

其中，所述麦克风为麦克风阵列，是由一定数目的麦克风组成，用来对声场的空间特性进行采样并处理的系统。所述麦克风阵列7x24小时接收外部声音，由处理器持续分析检测唤醒词，一旦检测到了唤醒词，就将后续语音传给服务器进行语音识别。

所述处理器包括唤醒子模块，所述唤醒子模块内置唤醒词算法，随时等待接收用户语音操作指令。优选地，所述唤醒模块可以是低功耗DSP/协处理器。

在步骤S11的一种优选实现方式中，

优选地，智能音箱的麦克风采集智能音箱所处环境中的声音信息；在智能音箱工作时，其中，所述麦克风始终处于拾音状态(持续对声音信息进行采样、量化)。

优选地，也可以根据具体需要，例如为了降低智能音箱的功耗，按照预设周期采集智能音箱所处环境中的声音信息；例如，以10ms为周期进行检测。所述定期音量检测的周期可以在智能音箱出厂时预设，也可以由用户根据自身需求设置。优选地，可以根据智能音箱的运行环境设置相应的检测周期。

本实施例中，所述声音信息可以理解为：智能音箱所处环境中，智能音箱所能够采集到的任意声音对应的信息，例如，人发出的声音、电视发出的声音、智能音箱扬声器播放的音乐或语音等，只要所述智能音箱能够采集即可。

如果由于噪声音量太大和/或用户人声音量太小导致智能音箱无法被唤醒，那对智能音箱的音量进行调整也就失去了意义。因此，在本实施例中，智能音箱在检测到唤醒词之后，才会开始进行用户人声音量检测。若未检测到唤醒词，则认为当前所采集的声音信息为噪音信息。

优选地，获取噪声音量值以及人声音量值，包括以下子步骤：

对麦克风采集的声音信息进行语音检测；

对检测得到的语音段进行唤醒检测；

对检测得到的非语音段及非唤醒指令对应的语音段进行音量检测，得到噪声音量值；

对检测得到的唤醒指令的后续语音操作指令对应的语音段进行人声音量检测，或对检测得到的唤醒指令对应的语音段进行人声音量检测，得到人声音量值。

优选地，本实施例中，将语音操作指令(包括唤醒指令及后续语音操作指令)之外的声音信息作为环境噪声，智能音箱的处理器中的噪声处理模块对检测得到的非语音段声音信息及非唤醒指令对应的语音信息进行音量检测，获取环境噪声的噪声音量值。

在本实施例中，噪声处理模块可以对检测得到的非语音段声音信息及非唤醒指令对应的语音段信息进行音量检测。

优选地，由于实际环境中的噪声可能有起伏变化，为了实现音量的平稳控制，可以将一定时间内，例如1s，获取的噪声音量值的均值作为当前环境噪声的噪声音量值。

优选地，智能音箱的处理器中的唤醒模块内置唤醒词算法，随时等待接收用户语音操作指令。例如，用户发出的语音操作指令的形式是首先发出“小度小度”的唤醒指令，随后发出“播放音乐”的操作指令。因此，当唤醒模块检测到“小度小度”的唤醒指令，对随后的声音信息进行人声音量检测。

优选地，唤醒模块检测唤醒指令包括以下子步骤：

对麦克风采集的声音信息进行语音检测；

对检测得到的语音段信息进行唤醒检测。

对麦克风采集的声音信息进行语音检测(Voice Activity Detection，VAD)，可以准确的检测出音频信号的语音段起始位置，从而分离出语音段和非语音段(静音或噪声)信号。

VAD算法可以粗略的分为三类：基于阈值的VAD、作为分类器的VAD、模型VAD，其中：

基于阈值的VAD：通过提取时域(短时能量、短期过零率等)或频域(MFCC、谱熵等)特征，通过合理的设置门限，达到区分语音和非语音的目的。这是传统的VAD方法。

作为分类器的VAD：可以将语音检测视作语音/非语音的两分类问题，进而用机器学习的方法训练分类器，达到检测语音的目的。

模型VAD：可以利用一个完整的声学模型(建模单元的粒度可以很粗)，在解码的基础，通过全局信息，判别语音段和非语音段。

VAD需要在智能音箱本地实时完成。由于计算资源非常有限，因此，一般会采用基于阈值的VAD；经过工程优化的分类法也可能被利用；而模型VAD目前难以在本地部署应用。

对检测得到的语音段信息进行唤醒检测，由于目标单一(只需检测出指定的唤醒词)，唤醒只需要较小的声学模型和语言模型(只需要区分出有无唤醒词出现)，声学打分和解码可以很快，空间占用少，能够在智能音箱本地实时完成。

现有的智能音箱语音操作多为远场操作，当用户在一定距离发出语音操作指令后，这段语音操作指令会夹杂着环境噪音传输到智能音箱并被拾音，可能包含杂音、或者由于波形的抵消被弱化，与用户原始音差距较大。智能音箱需要对拾取的该段声音信息进行一系列的信号处理，最后得出较为纯净的用户人声信息。

优选地，对唤醒指令的后续语音操作指令进行人声音量检测包括以下子步骤：

对麦克风采集的声音信息进行语音检测，得到唤醒指令的后续语音操作指令对应的语音段；

对唤醒指令的后续语音操作指令对应的语音段进行降噪处理；

对降噪处理后的语音段进行人声音量检测。

具体的，根据智能音箱使用环境的特点，对所述唤醒命令对应的声音信息进行降噪处理包括：降噪、声学回声消除(Acoustic Echo Cancellaction,AEC)、去混响处理、声源定位、波束形成等。具体地，

常用的降噪算法有自适应LMS和维纳滤波等。

声学回声消除的目的是在音箱扬声器工作(播放音乐或语音)时，从麦克风中收集的语音中，去除自身播放的声音信号。

去混响处理的目的是消除语音被墙壁等多次反射造成的延迟语音叠加产生的掩蔽效应。

声源定位的目的是作为波束形成的前导任务，确定空间滤波的参数。

波束形成是利用空间滤波的方法，将多路声音信号，整合为一路信号。一方面可以增强原始的语音信号，另一方面抑制旁路信号，起到降噪和去混响的作用

通过上述信号处理操作，可以得到较为纯净的人声信息，以便进行人声音量检测。

优选地，由于用户发出唤醒指令与其他语音操作指令的音量一般趋于一致，因此可以对唤醒指令对应的语音段进行降噪处理；对降噪处理后的语音段进行人声音量检测。这样，无需再对唤醒指令的后续语音操作指令对应的语音段进行人声音量检测，减少了运算量，提高了反应速度。

在步骤S12的一种优选实现方式中，

优选地，智能音箱的处理器中的音量控制模块根据获取的噪声音量值及人声音量值，查找预设参数表，从中获取噪声音量值及人声音量值映射的播放音量值。

以下为实验室模拟智能音箱目标使用场景——家居环境下，噪声音量值及人声音量值与播放音量值的映射关系。

具体对比策略为，参考60db为标准对话声音：

1)当环境噪音<40db的安静场景情况下，经过智能音箱拾取并处理后的人声音量值，若小于噪声音量值，并且智能音箱能够被唤醒，则智能音箱会将播放音量值调整为50db；经过智能音箱拾取并处理后的人声音量值，若大于噪声音量值，并且智能音箱能够被唤醒，则智能音箱会将播放音量值调整为57db；

2)40db<环境噪音<60db情况下，经过智能音箱拾取并处理后的人声音量值，若小于噪声音量值，并且智能音箱能够被唤醒，则智能音箱会将播放音量值调整为65db；经过智能音箱拾取并处理后的人声音量值，若大于噪声音量值，并且智能音箱能够被唤醒，则智能音箱会将播放音量值调整为70db；

3)60db<环境噪音<70db情况下，经过智能音箱拾取并处理后的人声音量值，若小于噪声音量值，并且智能音箱能够被唤醒，则智能音箱会将播放音量值调整为70db；经过智能音箱拾取并处理后的人声音量值，若大于噪声音量值，并且智能音箱能够被唤醒，则智能音箱会将播放音量值调整为78db；

4)环境噪音>70db情况下，只要智能音箱能够被唤醒，智能音箱会将播放音量值默认调整为80db音量。

在本实施例的一种优选实现方式中，

由于在播放音量一定的情况下，根据用户与智能音箱之间的距离不同，用户所听到的音量也随之变化。

因此，测量用户与智能音箱之间的距离，获取二者之间的距离参数。所述距离参数可以理解为：用户与智能音箱之间的水平距离。本发明实施例中，可以采用红外技术、超声波技术、蓝牙技术等进行距离测量，也可以通过摄像头进行距离测量，本发明实施例对具体测距技术和实现方式不做限定，只要能获取到用户与智能音箱之间的距离即可。

根据所述距离参数对从预设参数表中获取的噪声音量值及人声音量值映射的播放音量值进行调整，例如，距离每增加一米，播放音量值提高2db。

在本发明的一个优选实施例中，所述方法还包括步骤S13，按照获取的所述播放音量值，向用户播放所述语音操作指令对应的音频信息。

应用本发明所述方案，智能音箱能够根据用户在环境噪音中的人声音量值与噪声音量值进行对比后，智能调整播放音量值。该产品方案解决了音箱音量太小被环境噪音覆盖，用户听不到，以及音量太大不适合对话、吓到用户。与人类对话行为较为贴近，人类之间进行对话时候，人与人的距离太远、或者环境噪音略大，人类会选择提高音量；距离近的时候、安静的时候，人类则会降低音量进行对话。方便便捷，不需要用户频繁的进行音量更改，提高效率。并保证了一个清晰明朗的音量，用户能够听到。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

以上是关于方法实施例的介绍，以下通过装置实施例，对本发明所述方案进行进一步说明。

图2为本发明所述智能设备音量控制系统实施例的结构图，如图2所示，包括：

参数获取模块21，用于获取噪声音量值以及语音操作指令对应的人声音量值；

音量获取模块22，用于根据获取的所述噪声音量值及语音操作指令对应的人声音量值，获取智能设备所需的播放音量值。

在参数获取模块21的一种优选实现方式中，

优选地，参数获取模块21获取噪声音量值以及人声音量值，可以采用如下方式：

唤醒子模块对麦克风采集的声音信息进行语音检测，对检测得到的语音段进行唤醒检测；

噪声音量值获取子模块对检测得到的非语音段及非唤醒指令对应的语音段进行音量检测，得到噪声音量值；

人声音量值获取子模块对检测得到的唤醒指令的后续语音操作指令对应的语音段进行人声音量检测，或对检测得到的唤醒指令对应的语音段进行人声音量检测，得到人声音量值。

在本实施例中，参数获取模块21可以对检测得到的非语音段声音信息及非唤醒指令对应的语音信息进行实时音量检测。

优选地，智能音箱的处理器中的唤醒模块内置唤醒词算法，随时等待接收用户语音操作指令。例如，用户发出的语音操作指令的形式是首先发出“小度小度”的唤醒指令，随后发出“播放音乐”的操作指令。因此，参数获取模块21调用唤醒模块对检测得到的语音段信息进行唤醒检测，当唤醒模块检测到“小度小度”的唤醒指令，参数获取模块21对随后的声音信息进行人声音量检测。

优选地，唤醒模块检测唤醒指令可以采用如下方式：

对麦克风采集的声音信息进行语音检测；

对检测得到的语音段信息进行唤醒检测。

优选地，参数获取模块21对唤醒指令的后续语音操作指令进行人声音量检测可以采用如下方式：

对降噪处理后的语音段进行人声音量检测。

常用的降噪算法有自适应LMS和维纳滤波等。

在音量获取模块22的一种优选实现方式中，

具体对比策略为，参考60db为标准对话声音：

在本实施例的一种优选实现方式中，

因此，参数获取模块21还包括距离测量子模块，用于测量用户与智能音箱之间的距离，获取二者之间的距离参数。所述距离参数可以理解为：用户与智能音箱之间的水平距离。本发明实施例中，可以采用红外技术、超声波技术、蓝牙技术等进行距离测量，也可以通过摄像头进行距离测量，本发明实施例对具体测距技术和实现方式不做限定，只要能获取到用户与智能音箱之间的距离即可。

在本发明的一个优选实施例中，所述系统还包括播放模块23，用于按照获取的所述播放音量值，向用户播放所述语音操作指令对应的音频信息。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，所述描述的终端和服务器的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的方法和装置，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理器中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。所述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

图3示出了适于用来实现本发明实施方式的示例性计算机系统/服务器012的框图。图3显示的计算机系统/服务器012仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图3所示，计算机系统/服务器012以通用计算设备的形式表现。计算机系统/服务器012的组件可以包括但不限于：一个或者多个处理器或者处理器016，系统存储器028，连接不同系统组件(包括系统存储器028和处理器016)的总线018。

总线018表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。

计算机系统/服务器012典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器012访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器028可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)030和/或高速缓存存储器032。计算机系统/服务器012可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统034可以用于读写不可移动的、非易失性磁介质(图3未显示，通常称为“硬盘驱动器”)。尽管图3中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线018相连。存储器028可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块042的程序/实用工具040，可以存储在例如存储器028中，这样的程序模块042包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块042通常执行本发明所描述的实施例中的功能和/或方法。

计算机系统/服务器012也可以与一个或多个外部设备014(例如键盘、指向设备、显示器024等)通信，在本发明中，计算机系统/服务器012与外部雷达设备进行通信，还可与一个或者多个使得用户能与该计算机系统/服务器012交互的设备通信，和/或与使得该计算机系统/服务器012能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口022进行。并且，计算机系统/服务器012还可以通过网络适配器020与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图3所示，网络适配器020通过总线018与计算机系统/服务器012的其它模块通信。应当明白，尽管图3中未示出，可以结合计算机系统/服务器012使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理器016通过运行存储在系统存储器028中的程序，从而执行本发明所描述的实施例中的功能和/或方法。

上述的计算机程序可以设置于计算机存储介质中，即该计算机存储介质被编码有计算机程序，该程序在被一个或多个计算机执行时，使得一个或多个计算机执行本发明上述实施例中所示的方法流程和/或装置操作。

随着时间、技术的发展，介质含义越来越广泛，计算机程序的传播途径不再受限于有形介质，还可以直接从网络下载等。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，所述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种智能设备音量控制方法，其特征在于，包括以下步骤：

获取噪声音量值以及语音操作指令对应的人声音量值；

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，获取噪声音量值包括：

4.根据权利要求3所述的方法，其特征在于，获取语音操作指令对应的人声音量值包括：

5.根据权利要求3所述的方法，其特征在于，获取语音操作指令对应的人声音量值包括：

6.根据权利要求1所述的方法，其特征在于，根据获取的所述噪声音量值及语音操作指令对应的人声音量值，获取智能设备所需的播放音量值包括：

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

根据用户与智能设备的距离，对所述播放音量值进行调整。

8.一种智能设备音量控制系统，其特征在于，包括：

9.根据权利要求8所述的系统，其特征在于，所述系统还包括：

10.根据权利要求8所述的系统，其特征在于，所述参数获取模块包括噪声音量值获取子模块，具体用于：

11.根据权利要求10所述的系统，其特征在于，所述参数获取模块还包括人声音量值获取子模块，具体用于：

12.根据权利要求10所述的系统，其特征在于，所述参数获取模块还包括人声音量值获取子模块，具体用于：

13.根据权利要求8所述的系统，其特征在于，所述音量获取模块具体用于：

14.根据权利要求13所述的系统，其特征在于，所述音量获取模块还用于：

根据用户与智能设备的距离，对所述播放音量值进行调整。

15.一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1～7中任一项所述的方法。

16.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1～7中任一项所述的方法。