CN110022487B

CN110022487B - 音量调节方法及装置

Info

Publication number: CN110022487B
Application number: CN201810016538.XA
Authority: CN
Inventors: 吴志栩
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-01-08
Filing date: 2018-01-08
Publication date: 2021-09-28
Anticipated expiration: 2038-01-08
Also published as: CN110022487A

Abstract

本发明是关于一种音量调节方法及装置，涉及计算机应用技术领域。该方法包括：获取设置在多媒体播放设备的遥控器中的声音采集装置采集到的声音信号；获取输出至所述多媒体播放设备的扬声器进行播放的音频信号；根据所述声音信号以及所述音频信号确定目标音量；将所述多媒体播放设备的播放音量调节至所述目标音量，在调节过程中考虑了多媒体播放设备播放的声音对遥控器采集到的声音信号的影响，从而提高了基于遥控器中的声音采集装置采集到的声音信号进行音量调节的准确性，提高音量调节的效果。

Description

音量调节方法及装置

技术领域

本发明涉及计算机应用技术领域，特别涉及一种音量调节方法及装置。

背景技术

随着智能电视等多媒体播放设备的不断普及，如何优化多媒体播放设备的播放音量以提高用户体验，也已经成为业内研究的重点之一。

自动调节多媒体播放设备的音量是优化播放音量的重要方向。在相关技术中，多媒体播放设备可以根据环境音自动调节多媒体节目播放的播放音量。比如，多媒体播放设备可以在设备壳体中设置声音采集装置，通过声音采集装置采集环境音，根据环境音的音量确定是否需要对多媒体播放设备的播放音量进行调节，以及如何调节等。

然而，通过设置在多媒体播放设备中的声音采集装置采集的环境音与用户的真实感受差别较大，并且容易受到多媒体播放设备播放的声音的影响，根据该环境音进行音量调节的准确性较低，音量调节效果较差。

发明内容

本发明实施例提供了一种音量调节方法及装置，可以用于解决相关技术中通过遥控器中的声音采集装置采集到的声音信号的信号强度对多媒体播放设备的播放音量进行调节的准确性较低，音量调节效果较差的问题，技术方案如下：

一方面，提供了一种音量调节方法，所述方法包括：

获取设置在多媒体播放设备的遥控器中的声音采集装置采集到的声音信号；

获取输出至所述多媒体播放设备的扬声器进行播放的音频信号；

根据所述声音信号以及所述音频信号确定目标音量；

将所述多媒体播放设备的播放音量调节至所述目标音量。

一方面，提供了一种音量调节装置，所述装置包括：

声音信号获取模块，用于获取设置在多媒体播放设备的遥控器中的声音采集装置采集到的声音信号；

音频信号获取模块，用于获取输出至所述多媒体播放设备的扬声器进行播放的音频信号；

音量确定模块，用于根据所述声音信号以及所述音频信号确定目标音量；

音量调节模块，用于将所述多媒体播放设备的播放音量调节至所述目标音量。

一方面，提供了一种计算机设备，所述计算机设备包含处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述音量调节方法。

一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述音量调节方法。

本发明提供的技术方案可以包括以下有益效果：

使用遥控器作为采集端，结合遥控器采集到的声音信号以及多媒体播放设备中播放的音频信号实现对多媒体播放设备的音量的自动调节，在调节过程中考虑了多媒体播放设备播放的声音对遥控器采集到的声音信号的影响，从而提高了基于遥控器中的声音采集装置采集到的声音信号进行音量调节的准确性，提高音量调节的效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种多媒体系统的系统构成图；本发明实施例涉及的一种多媒体系统的系统构成图；

图2是根据一示例性实施例示出的一种音量调节的流程示意图；

图3是根据一示例性实施例示出的一种音量控制方法的流程图；

图4是图3所示实施例涉及语音输入和声音信号采集的时序图；

图5是图3所示实施例涉及的一种声音信号划分示意图；

图6是根据一示例性实施例示出的一种音量控制方法的流程图；

图7是根据一示例性实施例示出的一种音量控制方法的流程图；

图8是根据一示例性实施例示出的音量调节功能架构的架构示意图；

图9是图8所示实施例涉及的一种音量调节场景示意图；

图10是根据一示例性实施例示出的一种音量调节装置的结构方框图；

图11是根据一示例性实施例示出的计算机设备的结构框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

请参考图1，其是根据一示例性实施例示出的一种多媒体系统的系统构成图。如图1所示，该多媒体系统中包含多媒体播放设备110和遥控器120。

其中，多媒体播放设备110具有多媒体节目播放功能。比如，多媒体播放设备110可以是电视机、音响或者家庭影院等具有直接的多媒体播放功能的电子设备，或者，该多媒体播放设备110也可以是电视机顶盒或者光盘播放机等间接控制电视机、音响或者家庭影院等播放多媒体节目的电子设备。

遥控器120中设置有声音采集装置，比如，该声音采集装置可以包括高保真麦克风或者由多个高保真麦克风组成的麦克风阵列等。该声音采集装置可以采集遥控器120所处环境的声音信号，可选的，该声音采集装置也可以用于与多媒体播放设备之间进行语音交互。其中，该遥控器120可以是多媒体播放设备110配套的专用遥控器，或者，该遥控器120也可以是具有遥控功能的用户终端，比如该遥控器120可以是智能手机、平板电脑、电子书阅读器、智能手表/手环或者智能眼镜等移动终端。

可选的，多媒体播放设备110中可以运行操作系统，比如Android或Windows系统等，多媒体播放设备110具有一定的计算处理能力。遥控器通过蓝牙协议与电视终端建立连接，作为通信的通道，进行命令与数据的交互。

可选的，多媒体播放设备110和遥控器120之间可以通过短距离无线通信方式进行连接，比如，遥控器120通过蓝牙协议与多媒体播放设备110建立连接，该连接作为通信的通道，进行命令与数据的交互；或者，多媒体播放设备110和遥控器120之间也可以通过Wi-Fi、紫蜂或者超宽带等技术进行连接。

可选的，在本发明实施例中，多媒体播放器110和遥控器120还可以通过无线方式连接至无线接入点设备130，该无线接入点设备130可以是无线路由器或者无线网关设备。

随着多媒体播放设备的控制方式的进步，遥控器已经成为多媒体播放设备不可缺少的组件之一。用户在使用多媒体播放设备中，遥控器经常被放置在用户触手可及的地方，也就是说，遥控器与用户之间的距离通常很短，其所处的位置是最接近用户真实感受的位置，可以认为遥控器所处的声音环境也与用户所处的声音环境相近。基于此，本发明实施例提出一种借助遥控器进行音量调节的方案。

图2是根据一示例性实施例示出的一种音量调节的流程示意图。如图2所示，对多媒体播放设备的音量进行调节的步骤可以包括：

步骤201，获取设置在多媒体播放设备的遥控器中的声音采集装置采集到的声音信号。

步骤202，获取输出至多媒体播放设备的扬声器进行播放的音频信号。

步骤203，根据声音信号以及音频信号确定目标音量。

步骤204，将多媒体播放设备的播放音量调节至目标音量。

在图2所示的方案中，使用遥控器作为采集端，结合遥控器采集到的声音信号以及多媒体播放设备中播放的音频信号实现对多媒体播放设备的音量的自动调节，采集到的声音信号更加接近用户的真实感受，并且在调节过程中考虑了多媒体播放设备播放的声音对遥控器采集到的声音信号的影响，从而提高了基于遥控器中的声音采集装置采集到的声音信号进行音量调节的准确性，提高音量调节的效果。

通过图2所示的方案，可以对多媒体播放设备的全局音量进行控制，也可以针对多媒体播放设备中的单个客户端的音量进行控制。

图2所示的方案可以由音量调节设备来执行，其中，以应用于图1所示的多媒体系统为例，该音量调节设备可以是图1所示系统中的多媒体播放设备110、遥控器120或者无线接入点设备130中任意设备。

比如，当音量调节设备为上述多媒体播放设备110时，多媒体播放设备110可以直接获取输出至该多媒体播放设备110的扬声器的音频信号，并通过与遥控器120之间的短距离无线通信连接，或者，通过无线接入点设备130，接收遥控器120通过声音采集装置采集并发送的声音信号，并结合声音信号和音频信号对该多媒体播放设备110的播放音量进行调节。

当音量调节设备为上述遥控器120时，多媒体播放设备110获取输出至该多媒体播放设备110的扬声器的音频信号后，将获取到的音频信号通过与遥控器120之间的短距离无线通信连接，或者，通过无线接入点设备130，发送给该遥控器120，遥控器120结合声音信号和音频信号对该多媒体播放设备110的播放音量进行调节。

或者，当音量调节设备为上述无线接入点设备130时，无线接入点130分别接收多媒体播放设备110发送的音频信号以及遥控器120发送的声音信号，并结合声音信号和音频信号对该多媒体播放设备110的播放音量进行调节。

通过上述图2所示的方案，可以根据不同的场景对多媒体播放终端的音量进行智能调控，其具体的应用场景包括但不限于以下三种：

应用场景1：通过上述音频信号对声音信号中的环境音信号和媒体音信号分别进行采样分析，如果环境音信号的信号强度较大，则随之增大多媒体播放设备的播放音量，反之则减小多媒体播放设备的播放音量，保证在不同大小的环境音干扰下，用户均可以正常收看多媒体节目，在夜深人静时候也不至于音量过大打扰别人正常休息。

应用场景2：在切换多媒体节目、频道或内容时，经常遇到音量忽大忽小问题，甚至在同一多媒体节目中不同情节处的音量也会出现忽大忽小，导致观看体验较差。而通过图2所示的方案，可以通过分析音频信号中将要播放的信号的强度，同时结合遥控器采集到的声音信号，自动调节多媒体播放设备的播放音量至合适的音量，避免音量忽大忽小的问题，保证用户有较好的观看体验。

应用场景3：当用户观看多媒体节目期间，当用户在进行通话或者交谈时，可以自动降低多媒体播放设备的播放音量，避免影响用户的通话或者交谈。

下面的实施例将分别以上述三种应用场景为例对图2所示的方案进行介绍。

图3是根据一示例性实施例示出的一种音量控制方法的流程图。该方法可以由音量调节设备来执行，以实现上述应用场景1所示的方案。该音量调节设备可以是上述图1所示系统中的多媒体播放设备110、遥控器120或者无线接入点设备130。如图3所示，该音量控制方法可以包括如下几个步骤：

步骤301，获取设置在多媒体播放设备的遥控器中的声音采集装置采集到的声音信号。

在本发明实施例中，多媒体播放设备的遥控器可以通过声音采集装置采集并存储该遥控器所在位置处的声音信号。当音量调节设备是该遥控器时，音量调节设备可以直接获取采集并存储的声音信号；当音量调节设备是遥控器之外的其它设备时，遥控器将采集并存储的声音信号通过无线方式发送给音量调节设备，音量调节设备接收该声音信号。

在一种可选的实现方式中，遥控器可以具有语音输入功能，在获取声音信号时，可以获取遥控器在语音输入功能未启用时采集到的声音信号。

当遥控器具有语音输入功能时，本发明实施例可以复用遥控器中用于语音输入的声音采集装置，此时，就需要处理用户正常语音输入和声音信号采集的复用关系。在本发明实施例中，上述声音信号的采集可以在用户无感知情况下进行，且需要优先保证用户的正常语音输入，即用户的语音输入可以打断声音信号的采集。以音量调节设备控制语音输入和声音信号的采集，且音量调节设备是遥控器之外的其它设备(比如多媒体播放设备)为例，请参考图4，其示出了本发明实施例涉及的语音输入和声音信号采集的时序图。如图4所示，在用户未进行语音输入时，音量调节设备向遥控器发送开始采集声音信号的指令，遥控器即开始采集声音信号，并将采集到的声音信号以数据形式发送给音量调节设备。后续用户按下遥控器中的语音输入按键后，遥控器向音量调节设备发送请求语音输入的指令，音量调节设备向遥控器返回停止采集声音信号的指令以及开始语音输入的指令，遥控器提示用户可以进行语音输入(比如，通过指示灯进行提示，指示灯亮表示可以输入)，同时，遥控器开始录制输入语音，当音量调节设备是多媒体播放设备时，遥控器还可以将录制的输入语音以数据形式发送给音量调节设备。遥控器检测到用户松开语音输入按键后，向音量调节设备发送结束语音输入的指令，音量调节设备向遥控器返回开始采集声音信号的指令。

步骤302，获取输出至多媒体播放设备的扬声器进行播放的音频信号。

在本发明实施例中，多媒体播放设备中的音频信号在传输至多媒体播放设备的扬声器之前可以分为两路，一路传输至扬声器，另一路输出。当音量调节设备是多媒体播放设备时，音量调节设备直接获取输出的这一路音频信号；当音量调节设备是多媒体播放设备之外的其它设备时，多媒体播放设备将输出的这一路音频信号通过无线方式发送给音量调节设备，音量调节设备接收该音频信号。

步骤303，根据音频信号从声音信号中提取环境音信号和媒体音信号。

可选的，在根据音频信号从声音信号中提取环境音信号和媒体音信号时，音量调节设备可以确定第一时间区间和第二时间区间，第一时间区间是音频信号中的信号强度低于第一预设阈值的时间区间，第二时间区间是音频信号中的信号强度高于第二预设阈值的时间区间，第一预设阈值不大于第二预设阈值；将声音信号中，对应在第一时间区间内的信号提取为环境音信号；将声音信号中，对应在第二时间区间内的信号提取为媒体音信号。

在本发明实施例中，音量调节设备可以通过时间维度的划分，将声音信号划分为环境音信号和媒体音信号，其中，环境音信号中包含的由多媒体播放设备发出的声音的音量较低，而媒体音信号中包含的由多媒体播放设备发出的声音的音量较高。并且，声音信号中的媒体音信号和环境音信号各自对应的时间区域由音频信号来确定。

其中，上述第一预设阈值和第二预设阈值可以是开发人员预先设置的信号强度阈值，其中，第一预设阈值可以小于第二预设阈值，或者，第一预设阈值也可以等于第二预设阈值。

请参考图5，其示出了本发明实施例涉及的一种声音信号划分示意图。如图5所示，图5中的(a)部分对应时间区间在[t₁，t₂]上的音频信号在时间轴上的信号强度分布，图5中的(b)部分对应时间区间在[t₁，t₂]上的声音信号在时间轴上的信号强度分布，且图5中(a)部分和(b)部分的时间轴对齐。在图5中，第一预设阈值为N_a(单位为dB)，第二预设阈值为N_b，如图5中(a)部分所示，在时间区间[t₁，t₂]上，音频信号的信号强度小于N_a的时间区间为[t₁，t₃]，音频信号的信号强度大于Nb的时间区间为[t₄，t₂]，相应的，在对应时间区间在[t₁，t₂]上的声音信号中，环境音信号对应的时间区间为[t₁，t₃]，媒体音信号对应的时间区间为[t₄，t₂]。

步骤304，获取环境音信号的信号强度和媒体音信号的信号强度。

可选的，在获取环境音信号的信号强度和媒体音信号的信号强度时，可以对环境音信号在第一时间区间内的各个时间点上的信号强度取平均值，获得环境音信号的信号强度，并对媒体音信号在第二时间区间内的各个时间点上的信号强度取平均值，获得环境音信号的信号强度。

在本发明实施例中，音量调节设备可以将环境音信号和媒体音信号在各自对应的时间区间内的各个时间点上的信号强度的平均值，分别获取为环境音信号和媒体音信号的信号强度。

在获取到环境音信号的信号强度和媒体音信号的信号强度后，音量调节设备即可以根据环境音信号的信号强度和媒体音信号的信号强度之间的差值确定目标音量，确定目标音量的过程可以如下。

步骤305，当环境音信号的信号强度与媒体音信号的信号强度的差大于第一差值时，确定第一目标音量。

其中，第一目标音量大于多媒体播放设备的当前播放音量。

在本发明实施例中，环境音信号的信号强度与媒体音信号的信号强度的差，是指环境音信号的信号强度减去媒体音信号的信号强度获得的差值，当环境音信号的信号强度减去媒体音信号的信号强度获得的差值大于一定的数值(即上述第一差值)时，可以确定多媒体播放设备的播放音量过小，此时，可以确定一个高于多媒体播放设备的当前播放音量的目标音量。

其中，上述第一差值可以是由开发人员预先设置的数值。

可选的，在确定第一目标音量时，音量调节设备可以在多媒体播放设备的当前播放音量的基础上，加上预设步长，以获得上述第一目标音量。其中，该预设步长可以是预先设置的音量调节步长，比如，可以设置该预设步长为1或2等，对于预设步长的数值，本发明实施例不做限定。

步骤306，当媒体音信号的信号强度与环境音信号的信号强度的差大于第二差值时，确定第二目标音量。

第二目标音量小于多媒体播放设备的当前播放音量。

在本发明实施例中，媒体音信号的信号强度与环境音信号的信号强度的差，是指媒体音信号的信号强度减去环境音信号的信号强度获得的差值，当环境音信号的信号强度减去媒体音信号的信号强度获得的差值大于一定的数值(即上述第一差值)时，可以确定多媒体播放设备的播放音量过大，此时，可以确定一个低于多媒体播放设备的当前播放音量的目标音量。

其中，上述第二差值可以是由开发人员预先设置的数值。

可选的，在确定第二目标音量时，音量调节设备可以在多媒体播放设备的当前播放音量的基础上，减去预设步长，以获得上述第二目标音量。

步骤307，将多媒体播放设备的播放音量调节至目标音量。

其中，音量调节设备可以将多媒体播放设备的播放音量调节至第一目标音量或者第二目标音量。

比如，当音量调节设备是多媒体播放设备时，多媒体播放设备直接调节播放音量至目标音量；或者，当音量调节设备是遥控器时，遥控器通过遥控指令控制多媒体播放设备调节播放音量至目标音量；或者，当音量调节设备是无线接入点设备时，该无线接入点设备可以向多媒体播放设备发送控制指令，以控制多媒体播放设备调节播放音量至目标音量。

可选的，在将多媒体播放设备的播放音量调节至目标音量时，音量调节设备可以在多媒体播放设备当前的播放音量与目标音量之间的差的绝对值大于第五差值时，将多媒体播放设备的播放音量调节至目标音量。

在本发明实施例中，在确定目标音量后，音量调节设备可以检测多媒体播放设备当前的播放音量与目标音量之间的差值，当多媒体播放设备当前的播放音量与目标音量之间的差值的绝对值小于或者等于第五差值时，可以认为音量调节之后的效果变化不明显，此时可以不进行调节，只有当当多媒体播放设备当前的播放音量与目标音量之间的差值的绝对值大于第五差值时，才对多媒体播放设备的播放音量进行调节，以减少不必要的调节步骤。

综上所述，本发明实施例所示的方法，在通过多媒体播放设备中由扬声器进行播放的音频信号对遥控器中的声音采集装置采集到的声音信号进行划分，以确定声音采集装置采集到的声音信号中的环境音信号和媒体音信号，并根据环境音信号和媒体音信号的信号强度之间的差值来调整多媒体播放设备的设备音量，在调节过程中考虑了多媒体播放设备播放的声音对遥控器采集到的声音信号的影响，从而提高了基于遥控器中的声音采集装置采集到的声音信号进行音量调节的准确性，提高音量调节的效果。

图6是根据一示例性实施例示出的一种音量控制方法的流程图。该方法可以由音量调节设备来执行，以实现上述应用场景2所示的方案。该音量调节设备可以是上述图1所示系统中的多媒体播放设备110、遥控器120或者无线接入点设备130。如图6所示，该音量控制方法可以包括如下几个步骤：

步骤601，获取设置在多媒体播放设备的遥控器中的声音采集装置采集到的声音信号。

步骤602，获取输出至多媒体播放设备的扬声器进行播放的音频信号。

步骤603，根据音频信号从声音信号中提取环境音信号和媒体音信号。

步骤604，获取环境音信号的信号强度和媒体音信号的信号强度。

上述步骤601至步骤604的执行过程可以参考上述图3所示实施例中的步骤301至步骤304下的描述，此处不再赘述。

对应上述应用场景2，在本发明实施例中，音量调节设备可以结合当前时刻以及当前时刻之前一小段时间内的声音信号，以及当前时刻之后一段时间内的音频信号的信号强度，对多媒体播放设备的播放音量进行调整，以使得当前时刻之后一段时间内，多媒体播放设备的扬声器播放的声音的音量保持在一个合适的范围内，该调整过程请见后续步骤。

步骤605，获取音频信号中，播放时间在预设时间段内的音频片段，预设时间段是从当前时刻开始的预定长度时间段。

在本发明实施例中，音量调节设备可以获取多媒体播放设备在当前时刻之后的第一个预设时间段内即将播放的音频片段，比如，音量调节设备可以获取多媒体播放设备将要在当前时刻之后30s内播放的音频片段，该音频片段中可以包含预设时间段内的各个时间点上的信号强度。

步骤606，当音频片段的信号强度满足第一条件，且环境音信号的信号强度与媒体音信号的信号强度的差大于第三差值时，确定第三目标音量。

其中，第三目标音量大于多媒体播放设备的当前播放音量。

可选的，该第一条件包括以下条件中的至少一种：音频片段中各个时间点上的信号强度的平均值小于第一强度阈值；以及，音频片段中信号强度低于第二强度阈值的时长与预设时间段的总时长之间的比值大于第一比例阈值。

其中，上述第三差值、第一强度阈值、第二强度阈值以及第一比例阈值可以是开发人员预先设置的数值。

在本发明实施例中，当多媒体播放设备内部的音频信号将要有持续的较大的音量输出，或者，将要有平均较大的音量输出时，音量调节设备可以分析遥控器采集到声音信号中的环境音信号的信号强度是否足够多的超过声音信号中的媒体音信号的信号强度，如果是，则确定一个高于多媒体播放设备的当前播放音量的目标音量。

可选的，在确定第三目标音量时，音量调节设备可以在多媒体播放设备的当前播放音量的基础上，加上预设步长，以获得上述第三目标音量。

步骤607，当音频片段的信号强度满足第二条件，且媒体音信号的信号强度与环境音信号的信号强度的差大于第四差值时，确定第四目标音量。

其中，第四目标音量小于多媒体播放设备的当前播放音量。

可选的，该第二条件包括以下条件中的至少一种：音频片段中各个时间点上的信号强度的平均值大于第三强度阈值；音频片段中信号强度大于第四强度阈值的时长与预设时间段的总时长之间的比值大于第二比例阈值。

其中，上述第四差值、第三强度阈值、第四强度阈值以及第二比例阈值可以是开发人员预先设置的数值。

在本发明实施例中，当多媒体播放设备内部的音频信号将要有持续的较小的音量输出，或者，将要有平均较小的音量输出时，音量调节设备可以分析遥控器采集到声音信号中的媒体音信号的信号强度是否足够多的超过环境音信号中的媒体音信号的信号强度，如果是，则确定一个低于多媒体播放设备的当前播放音量的目标音量。

可选的，在确定第四目标音量时，音量调节设备可以在多媒体播放设备的当前播放音量的基础上，减少预设步长，以获得上述第四目标音量。

步骤608，将多媒体播放设备的播放音量调节至目标音量。

其中，音量调节设备可以将多媒体播放设备的播放音量调节至第三目标音量或者第四目标音量。

音量调节设备调节多媒体播放设备的播放音量的过程可以参考上述图3所示实施例中的步骤307下的描述，此处不再赘述。

综上所述，本发明实施例所示的方法，在通过多媒体播放设备中由扬声器进行播放的音频信号对遥控器中的声音采集装置采集到的声音信号进行划分，以确定声音采集装置采集到的声音信号中的环境音信号和媒体音信号，并结合音频信号中将要播放的音频片段的信号强度，以及环境音信号和媒体音信号的信号强度之间的差值来调整多媒体播放设备的设备音量，在调节过程中考虑了多媒体播放设备播放的声音对遥控器采集到的声音信号的影响，从而提高了基于遥控器中的声音采集装置采集到的声音信号进行音量调节的准确性，提高音量调节的效果。

图7是根据一示例性实施例示出的一种音量控制方法的流程图。该方法可以由音量调节设备来执行，以实现上述应用场景3所示的方案。该音量调节设备可以是上述图1所示系统中的多媒体播放设备110、遥控器120或者无线接入点设备130。如图7所示，该音量控制方法可以包括如下几个步骤：

步骤701，获取设置在多媒体播放设备的遥控器中的声音采集装置采集到的声音信号。

步骤702，获取输出至多媒体播放设备的扬声器进行播放的音频信号。

上述步骤701和步骤702的执行过程可以参考上述图3所示实施例中的步骤301和步骤302下的描述，此处不再赘述。

对应上述应用场景3，在本发明实施例中，音量调节设备可以对声音信号中除了多媒体播放设备发出的声音之外的信号进行识别，以确定用户是否在通话或者交谈，并根据识别结果调节多媒体播放设备的音量，从而避免多媒体播放设备播放的声音干扰到用户的通话或者交谈，该调整过程请见后续步骤。

步骤703，根据音频信号对声音信号进行过滤，获得滤除多媒体播放设备的扬声器发出的声音后的过滤信号。

在本发明实施例中，音量调节设备可以通过多媒体播放设备中的音频信号，对遥控器的声音采集装置采集到的声音信号中包含的，多媒体播放设备发出的声音进行抵消，该过程也称为回声抵消，音量调节设备可以通过自适应滤波算法实现上述抵消过程，以去除声音信号中由多媒体播放设备的扬声器发出的声音，避免后续过程中的误识别。

步骤704，对过滤信号进行识别，获得识别结果，识别结果用于指示过滤信号中是否存在预设声音，预设声音包括来电铃声以及语音中的至少一种。

在本发明实施例中，音量调节设备可以通过音频指纹技术和语音检测技术来对过滤信号进行识别，比如，音量调节设备可以识别声音信号中的来电响铃的特征，为了更准确识别来电响铃并接听通话场景，除了识别响铃的声纹特征之外，音量调节设备也可以识别“喂”，“你好”，“您好”等接听通话的语音信号的语谱特征，当检测到来电响铃特征之后，紧接这识别出接听通话的语音信号的语谱特征时，可以认为检测到来电铃声对应的预设声音。音量调节设备也可以识别过滤信号中的语音特征，如果识别出的语音特征持续到一定的时长，则认为用户进入密切交谈的状态，可以认为检测到语音对应的预设声音。

步骤705，当识别结果指示过滤信号中存在预设声音时，确定第五目标音量。

音量调节设备识别出过滤信号中包含来电铃声或者语音中的至少一种时，可以将预先设置好的某一个音量确定为目标音量，即上述第五目标音量。其中，该第五目标音量可以是一个相对于正常音量较低的音量。

其中，上述第五目标音量可以是开发人员预先设置的音量，或者，该第五目标音量也可以是用户自行设置的音量。

步骤706，将多媒体播放设备的播放音量调节至目标音量。

其中，音量调节设备可以将多媒体播放设备的播放音量调节至第五目标音量。

综上所述，本发明实施例所示的方法，对声音信号中除了多媒体播放设备发出的声音之外的信号进行识别，以确定用户是否在通话或者交谈，并根据识别结果调节多媒体播放设备的音量，在调节过程中考虑了多媒体播放设备播放的声音对遥控器采集到的声音信号的影响，从而提高了基于遥控器中的声音采集装置采集到的声音信号进行音量调节的准确性，提高音量调节的效果。

在实际应用中，上述图3、图6以及图7所示的方案可以结合使用，具体的，请参考图8，其是根据一示例性实施例示出的音量调节功能架构的架构示意图。如图2所示，该音量调节功能架构可以包括声音采集器(即遥控器)、音频采样器、音频检测器、音频分析器以及音量控制器等。其中，声音采集器用于采集外界的环境音和媒体音混合之后的声音信号，并将声音信号以数据形式提供给音量调节设备。音频采样器用于对声音信号中的环境音信号和媒体音信号进行周期性捕捉采样，形成信号样本，送到音频分析器进行进一步分析比较。音频检测器用于对声音信号中的来电响铃特征和语音特征进行检测识别，并将识别结果(包含是否是电话来电响铃或语音信号的概率)发送给音量控制器。音频分析器用于进一步计算环境音信号和媒体音信号的音量分贝指标(即上述信号强度)，并与多媒体播放设备内部的音频信号进行比较，获得音量分级的归一化结果，最终把分析结果送入音量控制器。音量控制器收集前置的模块结果并根据优先级产生对多媒体播放设备的播放音量的最终调节动作。

由于遥控器中的声音采集装置采集的是遥控器所处外界的整体声音信号，混合了环境音信号和媒体音信号，为了区分环境音信号和媒体音信号，图8中的音频采样器需要引入多媒体播放设备的内部音频的信号(即上述音频信号)，当多媒体播放设备的内部音频信号为零或小于极小阈值时，则认为当前为媒体音信号的空白期，可以进行环境音信号的捕捉采样。同样的，当多媒体播放设备的内部音频信号非零或者大于阈值时，则认为当前为媒体音的有效期，可以进行媒体音信号的捕捉采样。当然这里的媒体音信号混合了环境音信号，并非纯正的媒体音信号，其中的环境音信号是不可避免的。因此，本发明实施例将环境音信号和媒体音信号，还有多媒体播放设备内部的音频信号送入音频分析器进行进一步分析。

图8中的音频分析器对送入的环境音信号、媒体音信号和多媒体设备内部的音频信号进行分析，首先计算环境音信号和媒体音信号的声强分贝量，对连续的多个样本求平均值并进行归一化，该值可代表在一段时间内的环境音信号和媒体音信号的音量，并计算媒体音信号和环境音信号的差值，可比较出媒体音信号在当前的环境的大小，用作应用场景1的音量调节依据。具体比如，当媒体音信号比环境音信号低，且差值大于预设阈值时，可以按照预设的分级范围进行音量的递增，以确定目标音量；当媒体音信号比环境音信号高，且差值大于预设阈值时，可以按照预设的分级范围进行音量的递减，以确定目标音量。其中，上述确定的目标音量可以设置上下限，以避免多媒体播放设备的播放音量过高或者过低。

此外，图8中的音频分析器可以结合多媒体设备内部的音频信号的分贝量，并结合媒体音信号和环境音信号的音量对比结果，用作应用场景2的音量调节依据。具体比如，当音频信号有持续的较大的声音输出时，会触发分析当前媒体音信号的音量是否远超于环境音信号的音量，分析结果会送到音量控制器，同样的，当音频信号有持续较小声音输出时，也会触发分析当前媒体音信号的音量是否远小于环境音信号的音量，并将分析结果送到音量控制器。音量控制器按照上述步骤607或者步骤608所描述的方式确定目标音量，通过以上方法可以保证节目或影片的声音强度维持在一个合理范围，保证用户观看体验。

音频检测器可以通过音频指纹对采集的声音信号进行提取(即通过音频信号对声音信号进行过滤获得上述过滤信号)和识别，在识别过程中与手机铃声样本库进行定位匹配，如有样本命中则认为当前用户的手机有来电响铃，进一步通过语音识别对“喂”、“你好”、“您好”等语谱特征进行识别，如有命中则可以进一步确认用户手机来电，并用于应用场景3的音量调节依据。音频检测器还可以通过VAD(Voice activity detection，语音活性检测)检测过滤后的过滤信号中的是否有语音信号，如果语音信号持续超过预设时间阈值，则认为用户进入交谈状态，并用于应用场景3的音量调节依据。

在本发明实施例中，音量控制器可以收集前置单元模块的结果，按照预设优先级和策略进行调节，比如，音量控制器以应用场景3的来电和交谈对应的目标音量(对应上述第五目标音量)为最高优先级，应用场景1的自动根据环境音确定待调节的目标音量(即上述第一目标音量或者第二目标音量)次之，应用场景2中用于对音量忽大忽小的情况进行自动调节的目标音量(即上述第三目标音量或者第四目标音量)为最低优先级，根据前置的音频分析的归一化结果，按照预设的分级范围进行音量的递增和递减。

请参考图9，其示出了本发明实施例涉及的一种音量调节场景示意图。以音量调节设备是电视机为例，遥控器通常就在观看电视的用户触手可及的地方，使用遥控器上的声音采集装置采集的声音信号，是最接近用户真实感受的声音信号。本发明实施例提出的，基于遥控器声音采集装置的音量调节方案，使用遥控声音采集装置作为采集端，采集当前的环境音信号和电视音信号(即上述声音信号)并发回电视机，电视机根据采集的信号数据，结合电视机中传输至扬声器进行播放的音频信号，自动调整当前电视音量，形成闭环控制，解决音量忽大忽小问题，达到人耳音量最舒适的范围，同时使用音频指纹技术和语音检测技术，判断当前用户是否处于电话或交谈状态，自动降低音量避免打扰用户，达到更智能的音量控制。本方案无需电视机以外的设备，使用更加简便和智能。

图10是根据一示例性实施例示出的一种音量调节装置的结构方框图。该音量调节装置可以用于音量调节设备中，以执行图3、6或7对应实施例所示的方法的全部或者部分步骤。该音量调节装置可以包括：

声音信号获取模块1001，用于获取设置在多媒体播放设备的遥控器中的声音采集装置采集到的声音信号；

音频信号获取模块1002，用于获取输出至所述多媒体播放设备的扬声器进行播放的音频信号；

音量确定模块1003，用于根据所述声音信号以及所述音频信号确定目标音量；

音量调节模块1004，用于将所述多媒体播放设备的播放音量调节至所述目标音量。

可选的，所述音量确定模块1003，具体用于根据所述音频信号从所述声音信号中提取环境音信号和媒体音信号；获取所述环境音信号的信号强度和所述媒体音信号的信号强度；根据所述环境音信号的信号强度和所述媒体音信号的信号强度之间的差值确定所述目标音量。

可选的，在根据所述音频信号从所述声音信号中提取环境音信号和媒体音信号时，音量确定模块1003，具体用于确定第一时间区间和第二时间区间，所述第一时间区间是所述音频信号中的信号强度低于第一预设阈值的时间区间，所述第二时间区间是所述音频信号中的信号强度高于第二预设阈值的时间区间，所述第一预设阈值不大于所述第二预设阈值；将所述声音信号中，对应在所述第一时间区间内的信号提取为所述环境音信号；将所述声音信号中，对应在所述第二时间区间内的信号提取为所述媒体音信号。

可选的，在根据所述环境音信号的信号强度和所述媒体音信号的信号强度之间的差值确定所述目标音量时，音量确定模块1003，具体用于当所述环境音信号的信号强度与所述媒体音信号的信号强度的差大于第一差值时，确定第一目标音量，所述第一目标音量大于所述多媒体播放设备的当前播放音量；当所述媒体音信号的信号强度与所述环境音信号的信号强度的差大于第二差值时，确定第二目标音量，所述第二目标音量小于所述多媒体播放设备的当前播放音量。

可选的，在根据所述环境音信号的信号强度和所述媒体音信号的信号强度之间的差值确定所述目标音量时，音量确定模块1003，具体用于获取所述音频信号中，播放时间在预设时间段内的音频片段，所述预设时间段是从当前时刻开始的预定长度时间段；当所述音频片段的信号强度满足第一条件，且所述环境音信号的信号强度与所述媒体音信号的信号强度的差大于第三差值时，确定第三目标音量，所述第三目标音量大于所述多媒体播放设备的当前播放音量；当所述音频片段的信号强度满足第二条件，且所述媒体音信号的信号强度与所述环境音信号的信号强度的差大于第四差值时，确定第四目标音量，所述第四目标音量小于所述多媒体播放设备的当前播放音量。

可选的，所述第一条件包括以下条件中的至少一种：

所述音频片段中各个时间点上的信号强度的平均值小于第一强度阈值；

所述音频片段中信号强度低于第二强度阈值的时长与所述预设时间段的总时长之间的比值大于第一比例阈值。

可选的，所述第二条件包括以下条件中的至少一种：

所述音频片段中各个时间点上的信号强度的平均值大于第三强度阈值；

所述音频片段中信号强度大于第四强度阈值的时长与所述预设时间段的总时长之间的比值大于第二比例阈值。

可选的，在获取所述环境音信号的信号强度和所述媒体音信号的信号强度时，音量确定模块1003，具体用于对所述环境音信号在所述第一时间区间内的各个时间点上的信号强度取平均值，获得所述环境音信号的信号强度；对所述媒体音信号在所述第二时间区间内的各个时间点上的信号强度取平均值，获得所述环境音信号的信号强度。

可选的，音量确定模块1003，具体用于根据所述音频信号对所述声音信号进行过滤，获得滤除所述多媒体设备的扬声器发出的声音后的过滤信号；对所述过滤信号进行识别，获得识别结果，所述识别结果用于指示所述过滤信号中是否存在预设声音，所述预设声音包括来电铃声以及语音中的至少一种；当所述识别结果指示所述过滤信号中存在所述预设声音时，确定第五目标音量。

可选的，所述遥控器具有语音输入功能，所述声音信号获取模块1001，具体用于获取所述遥控器在所述语音输入功能未启用时采集到的所述声音信号。

可选的，所述音量调节模块1004，具体用于当所述多媒体播放设备当前的播放音量与所述目标音量之间的差的绝对值大于第五差值时，将所述多媒体播放设备的播放音量调节至所述目标音量。

综上所述，本发明实施例所示的方案，使用遥控器作为采集端，结合遥控器采集到的声音信号以及多媒体播放设备中播放的音频信号实现对多媒体播放设备的音量的自动调节，在调节过程中考虑了多媒体播放设备播放的声音对遥控器采集到的声音信号的影响，从而提高了基于遥控器中的声音采集装置采集到的声音信号进行音量调节的准确性，提高音量调节的效果。

图11是根据一示例性实施例示出的计算机设备1100的结构框图。该计算机设备1100可以是多媒体播放设备，比如电视机、音响、家庭影院或者机顶盒等，或者，该计算机设备1100也可以是多媒体播放设备的遥控器，或者，该计算机设备也可以是无线接入点设备，比如无线路由器或者无线网关；或者，该计算机设备也可以是用户终端，比如智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。

通常，计算机设备1100包括有：处理器1101和存储器1102。

处理器1101可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1101可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1101也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1101可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1101还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器1102可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1102还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1102中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器1101所执行以实现本申请中方法实施例提供的音量调节方法。

在一些实施例中，计算机设备1100还可选包括有：外围设备接口1103和至少一个外围设备。处理器1101、存储器1102和外围设备接口1103之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1103相连。具体地，外围设备包括：射频电路1104、触摸显示屏1105、摄像头1106、音频电路1107、定位组件1108和电源1109中的至少一种。

外围设备接口1103可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器1101和存储器1102。在一些实施例中，处理器1101、存储器1102和外围设备接口1103被集成在同一芯片或电路板上；在一些其他实施例中，处理器1101、存储器1102和外围设备接口1103中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路1104用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路1104通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1104将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路1104包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1104可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路1104还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏1105用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1105是触摸显示屏时，显示屏1105还具有采集在显示屏1105的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1101进行处理。此时，显示屏1105还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏1105可以为一个，设置计算机设备1100的前面板；在另一些实施例中，显示屏1105可以为至少两个，分别设置在计算机设备1100的不同表面或呈折叠设计；在再一些实施例中，显示屏1105可以是柔性显示屏，设置在计算机设备1100的弯曲表面上或折叠面上。甚至，显示屏1105还可以设置成非矩形的不规则图形，也即异形屏。显示屏1105可以采用LCD(Liquid CrystalDisplay，液晶显示屏)、OLED(OrganicLight-Emitting Diode,有机发光二极管)等材质制备。

摄像头组件1106用于采集图像或视频。可选地，摄像头组件1106包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件1106还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路1107可以包括声音采集装置和扬声器。声音采集装置用于采集用户及环境的声波，并将声波转换为电信号输入至处理器1101进行处理，或者输入至射频电路1104以实现语音通信。出于立体声采集或降噪的目的，声音采集装置可以为多个，分别设置在计算机设备1100的不同部位。声音采集装置还可以是阵列型声音采集装置或全向采集型声音采集装置。扬声器则用于将来自处理器1101或射频电路1104的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路1107还可以包括耳机插孔。

定位组件1108用于定位计算机设备1100的当前地理位置，以实现导航或LBS(Location Based Service，基于位置的服务)。定位组件1108可以是基于美国的GPS(Global Positioning System，全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。

电源1109用于为计算机设备1100中的各个组件进行供电。电源1109可以是交流电、直流电、一次性电池或可充电电池。当电源1109包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中，计算机设备1100还包括有一个或多个传感器1110。该一个或多个传感器1110包括但不限于：加速度传感器1111、陀螺仪传感器1112、压力传感器1113、指纹传感器1114、光学传感器1115以及接近传感器1116。

加速度传感器1111可以检测以计算机设备1100建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器1111可以用于检测重力加速度在三个坐标轴上的分量。处理器1101可以根据加速度传感器1111采集的重力加速度信号，控制触摸显示屏1105以横向视图或纵向视图进行用户界面的显示。加速度传感器1111还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器1112可以检测计算机设备1100的机体方向及转动角度，陀螺仪传感器1112可以与加速度传感器1111协同采集用户对计算机设备1100的3D动作。处理器1101根据陀螺仪传感器1112采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器1113可以设置在计算机设备1100的侧边框和/或触摸显示屏1105的下层。当压力传感器1113设置在计算机设备1100的侧边框时，可以检测用户对计算机设备1100的握持信号，由处理器1101根据压力传感器1113采集的握持信号进行左右手识别或快捷操作。当压力传感器1113设置在触摸显示屏1105的下层时，由处理器1101根据用户对触摸显示屏1105的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器1114用于采集用户的指纹，由处理器1101根据指纹传感器1114采集到的指纹识别用户的身份，或者，由指纹传感器1114根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器1101授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1114可以被设置计算机设备1100的正面、背面或侧面。当计算机设备1100上设置有物理按键或厂商Logo时，指纹传感器1114可以与物理按键或厂商Logo集成在一起。

光学传感器1115用于采集环境光强度。在一个实施例中，处理器1101可以根据光学传感器1115采集的环境光强度，控制触摸显示屏1105的显示亮度。具体地，当环境光强度较高时，调高触摸显示屏1105的显示亮度；当环境光强度较低时，调低触摸显示屏1105的显示亮度。在另一个实施例中，处理器1101还可以根据光学传感器1115采集的环境光强度，动态调整摄像头组件1106的拍摄参数。

接近传感器1116，也称距离传感器，通常设置在计算机设备1100的前面板。接近传感器1116用于采集用户与计算机设备1100的正面之间的距离。在一个实施例中，当接近传感器1116检测到用户与计算机设备1100的正面之间的距离逐渐变小时，由处理器1101控制触摸显示屏1105从亮屏状态切换为息屏状态；当接近传感器1116检测到用户与计算机设备1100的正面之间的距离逐渐变大时，由处理器1101控制触摸显示屏1105从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图11中示出的结构并不构成对计算机设备1100的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

在一示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括至少一条指令、至少一段程序、代码集或指令集的存储器，上述至少一条指令、至少一段程序、代码集或指令集可由处理器执行以完成上述图3、6或7任一实施例所示的方法的全部或者部分步骤。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种音量调节方法，其特征在于，所述方法包括：

根据所述声音信号以及所述音频信号确定目标音量；

将所述多媒体播放设备的播放音量调节至所述目标音量;

所述根据所述声音信号以及所述音频信号确定目标音量，包括：

根据所述音频信号从所述声音信号中提取环境音信号和媒体音信号；

获取所述环境音信号的信号强度和所述媒体音信号的信号强度；

根据所述环境音信号的信号强度和所述媒体音信号的信号强度之间的差值确定所述目标音量;

所述根据所述环境音信号的信号强度和所述媒体音信号的信号强度之间的差值确定所述目标音量，包括：

获取所述音频信号中，播放时间在预设时间段内的音频片段，所述预设时间段是从当前时刻开始的预定长度时间段；

当所述音频片段的信号强度满足第一条件，且所述环境音信号的信号强度与所述媒体音信号的信号强度的差大于第三差值时，确定第三目标音量，所述第三目标音量大于所述多媒体播放设备的当前播放音量，其中，所述第一条件包括以下条件中的至少一种：所述音频片段中各个时间点上的信号强度的平均值小于第一强度阈值；以及，所述音频片段中信号强度低于第二强度阈值的时长与所述预设时间段的总时长之间的比值大于第一比例阈值；

当所述音频片段的信号强度满足第二条件，且所述媒体音信号的信号强度与所述环境音信号的信号强度的差大于第四差值时，确定第四目标音量，所述第四目标音量小于所述多媒体播放设备的当前播放音量，其中，所述第二条件包括以下条件中的至少一种：所述音频片段中各个时间点上的信号强度的平均值大于第三强度阈值；以及，所述音频片段中信号强度大于第四强度阈值的时长与预设时间段的总时长之间的比值大于第二比例阈值。

2.根据权利要求1所述的方法，其特征在于，所述根据所述音频信号从所述声音信号中提取环境音信号和媒体音信号，包括：

确定第一时间区间和第二时间区间，所述第一时间区间是所述音频信号中的信号强度低于第一预设阈值的时间区间，所述第二时间区间是所述音频信号中的信号强度高于第二预设阈值的时间区间，所述第一预设阈值不大于所述第二预设阈值；

将所述声音信号中，对应在所述第一时间区间内的信号提取为所述环境音信号；

将所述声音信号中，对应在所述第二时间区间内的信号提取为所述媒体音信号。

3.根据权利要求1或2所述的方法，其特征在于，所述根据所述环境音信号的信号强度和所述媒体音信号的信号强度之间的差值确定所述目标音量，包括：

当所述环境音信号的信号强度与所述媒体音信号的信号强度的差大于第一差值时，确定第一目标音量，所述第一目标音量大于所述多媒体播放设备的当前播放音量；

当所述媒体音信号的信号强度与所述环境音信号的信号强度的差大于第二差值时，确定第二目标音量，所述第二目标音量小于所述多媒体播放设备的当前播放音量。

4.根据权利要求2所述的方法，其特征在于，所述获取所述环境音信号的信号强度和所述媒体音信号的信号强度，包括：

对所述环境音信号在所述第一时间区间内的各个时间点上的信号强度取平均值，获得所述环境音信号的信号强度；

对所述媒体音信号在所述第二时间区间内的各个时间点上的信号强度取平均值，获得所述环境音信号的信号强度。

5.根据权利要求1至2任一所述的方法，其特征在于，所述遥控器具有语音输入功能，所述获取设置在多媒体播放设备的遥控器中的声音采集装置采集到的声音信号，包括：

获取所述遥控器在所述语音输入功能未启用时采集到的所述声音信号。

6.根据权利要求1至2任一所述的方法，其特征在于，所述将所述多媒体播放设备的播放音量调节至所述目标音量，包括：

当所述多媒体播放设备当前的播放音量与所述目标音量之间的差的绝对值大于第五差值时，将所述多媒体播放设备的播放音量调节至所述目标音量。

7.一种音量调节装置，其特征在于，所述装置包括：

音量调节模块，用于将所述多媒体播放设备的播放音量调节至所述目标音量；

其中，所述根据所述声音信号以及所述音频信号确定目标音量，包括：

8.一种计算机设备，其特征在于，所述计算机设备包含处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至6任一所述的音量调节方法。

9.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至6任一所述的音量调节方法。