CN114257854A

CN114257854A - 音量控制方法、音量控制装置以及电子设备

Info

Publication number: CN114257854A
Application number: CN202111381878.0A
Authority: CN
Inventors: 刘杰
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2021-11-19
Filing date: 2021-11-19
Publication date: 2022-03-29

Abstract

本说明书实施例提供一种音量控制方法、音量控制装置以及电子设备，该方法包括：获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数，得到第M状态参数，M为大于1的整数；然后，根据第M状态参数和参考状态参数确定第M状态参数变化量；进一步地，根据第M状态参数变化量，确定该帧对应的音量。

Description

音量控制方法、音量控制装置以及电子设备

技术领域

本说明书涉及计算机技术领域，尤其涉及一种音量控制方法、音量控制装置以及电子设备。

背景技术

视频(如，短视频)作为内容载体，越来越多的呈现在工作与生活中。其中，视频的声音为视频所承载内容的表达起到重要作用。同时，伴随着视频中对象的移动，调整视频声音，以增强视频的生动真实感，并提升观众的代入感，进而提升视频观众粘度。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本说明书的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本说明书的目的在于提供一种音量控制方法、音量控制装置以及电子设备，至少在一定程度上增强了视频的生动真实感。

本说明书的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本说明书的实践而习得。

根据本说明书的一个方面，提供一种音量控制方法，该方法包括：获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数，得到第M状态参数，M为大于1的整数；根据所述第M状态参数和参考状态参数，确定第M状态参数变化量；以及，根据所述第M状态参数变化量，确定所述第M帧对应的音量。

根据本说明书的另一个方面，提供一种音量控制装置，该装置包括：参数获取模块、变化量确定模块，以及音量确定模块。

其中，上述参数获取模块，用于获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数，得到第M状态参数，M为大于1的整数；上述变化量确定模块，用于根据所述第M状态参数和参考状态参数，确定第M状态参数变化量；以及，上述音量确定模块，用于根据所述第M状态参数变化量，确定所述第M帧对应的音量。

根据本说明书的再一个方面，提供一种电子设备，包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序，上述处理器执行上述计算机程序时实现如上述实施例中的音量控制方法。

本说明书的实施例所提供的音量控制方法与装置以及电子设备，具备以下技术效果：

本说明书示例性的实施例提供的方案适用于视频拍摄过程中或者视频播放过程中，基于目标对象在取景框中的状态参数变化量来实时控制视频所播放出的声音。具体地，对于视频中除了第一帧之外的任一帧，获取目标对象在当前帧取景框中的状态参数的变化量，并基于变化量来确定当前帧对应的音量。从而实现视频所播放声音与目标对象的状态变化相关联，增强了视频的生动真实感，提升观众的代入感，进而提升视频观众粘度。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本说明书。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本说明书的实施例，并与说明书一起用于解释本说明书的原理。显而易见地，下面描述中的附图仅仅是本说明书的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书实施例提供的音量控制方案的系统构架示意图。

图2为本说明书一实施例提供的音量控制方法的流程示意图。

图3a为本说明书一实施例提供的目标对象在取景框中的状态参数变化示意图。

图3b为本说明书一实施例提供的目标对象在取景框中的状态参数变化示意图。

图4a为本说明书另一实施例提供的目标对象在取景框中的状态参数变化示意图。

图4b为本说明书另一实施例提供的目标对象在取景框中的状态参数变化示意图。

图5为本说明书一实施例提供的状态参数为目标对象在取景框中的面积占比的情况下音量控制方法的流程示意图。

图6为本说明书另一实施例提供的状态参数为目标对象在取景框中的面积占比的情况下音量控制方法的流程示意图。

图7为本说明书一实施例提供的状态参数为目标对象与取景框中垂线的偏离角度的情况下音量控制方法的流程示意图。

图8为本说明书另一实施例提供的状态参数为目标对象与取景框中垂线的偏离角度的情况下音量控制方法的流程示意图。

图9为本说明书一实施例提供的音量控制装置的结构示意图。

图10为本说明书另一实施例提供的音量控制装置的结构示意图。

图11为本说明书实施例提供的电子设备的结构示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚，下面将结合附图对本说明书实施例方式作进一步地详细描述。

下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反，它们仅是如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本说明书将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本说明书的实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本说明书的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知技术方案以避免喧宾夺主而使得本说明书的各方面变得模糊。

此外，附图仅为本说明书的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

为了实现视频所播放声音与目标对象的状态变化相关联，进而增强视频的生动真实感，相关技术中，一般配备外置收音设备，通过调节外置收音设备与拍摄目标的距离，来控制收音音量。

然而，相关技术存在以下技术问题：需要设置外置收音设备，以及，外置收音设备与拍摄目标的距离，也不能够与拍摄镜头对焦距离同步，从而导致对收音控制精度低，进而无法实现视频所播放声音与目标对象的状态准确地关联变化。

本说明书实施例能够解决上述技术问题，具体的，本说明书实施例提供以下内容：

示例性的，图1为本说明书实施例提供的音量控制方案的系统构架示意图。

如图1所示，系统架构100可以包括终端110、网络120以及服务器130。其中，终端110、网络120以及服务器130之间通过网络120连接。

示例性的，终端110可以是包含摄像部件或视频播放功能的手机、电脑、平板等，也可以是具有摄像功能的摄像机。网络120可以是能够在终端110和服务器130之间提供通信链路的各种连接类型的通信介质，例如可以是有线通信链路、无线通信链路或者光纤电缆等等，本说明书在此不做限制。服务器130可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、以及大数据和人工智能平台等基础云计算服务的云服务器。

示例性的，终端110用于播放视频或者拍摄视频，服务器130可以基于网络120获取目标对象在所拍摄/播放视频的第M帧对应的取景框中的状态参数，进一步地，还根据第M状态参数和参考状态参数，确定第M状态参数变化量，M为大于1的整数；进一步地，服务器130根据第M状态参数变化量，确定第M帧对应的音量。本实施例中基于终端与服务器的交互完成视频音量的控制，具体地，基于服务器较为强大的计算资源确定视频帧对应的音量，相较于仅通过终端完成视频音量的控制，本实施例能够有效较少手机终端的功耗。示例性的，服务器130和/或终端110，将第M帧的标识与第M帧所对应音量关联存储。

可见，本公开实施例所提供的音量控制方法可以由服务器130中的任何一个节点执行。相应地，音量控制装置设置于服务器130中。另外，本公开实施例所提供的音量控制方法也可以由终端110执行，相应的，音量控制装置也可以设置于相应的终端110中，在仅通过终端完成视频音量的控制的实施例中，无需通过网络与服务器或其他终端进行信息交互就可以完成对视频帧音量的控制，适用于无网络连接的场景。本示例性实施例中对此不做特殊限定。具体地：

另一示例性的实施例中，通过终端110所携带的处理器实现：获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数，以及根据第M状态参数和参考状态参数，确定第M状态参数变化量，M为大于1的整数；以及，根据第M状态参数变化量，确定第M帧对应的音量。

可以理解的是，视频的第一帧对应的音量可以是拍摄第一帧时的真实收集到声音的音量。

以下先通过图2至图9对本说明书提供的音量控制方法实施例进行详细阐述：

示例性的，图2为本说明书实施例提供的音量控制方法的流程示意图。参考图2，该实施例所示方法包括：

S210，获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数，M为大于1的整数；S220，根据所述第M状态参数和参考状态参数，确定第M状态参数变化量。以及，S220，根据第M状态参数变化量，控制第M帧对应的音量。

在示例性的实施例中，本说明书实施例提供的音量控制方法适用于视频拍摄过程中，也适用于视频播放过程中。

在示例性的实施例中，参考图3a和图3b，在取景框中存在一个拍摄对象的情况下，上述目标对象可以是该拍摄对象。另外，在取景框中存在多个拍摄对象的情况下，可以提醒用户通过点选的方式确定其中的一个拍摄目标为目标对象。在取景框中存在多个拍摄目标或者用户点选多个拍摄目标的情况下，可以将多个拍摄目标作为一个整体，来确定相关状态参数。也就是说，本说明书实施例提供的音量控制方法适用于取景框中存在一个拍摄目标的情况，也适用于取景框中存在多个拍摄目标的情况。

在示例性的实施例中，除了可以通过用户点选的方式确定视频帧中的目标对象，还可以通过机器学习模型的方式获取视频帧中的目标对象，以提升目标确定的智能化程度。其中，在通过机器学习模型确定的目标对象不满足用户需求时，还可以接收用户点选的拍摄目标作为目标对象。

在一示例性的实施例中，上述状态参数可以是目标对象在取景框中的面积占比。

示例性的，图3a和图3b为本说明书实施例提供的目标对象在取景框中的状态变化示意图。其中，图3a和图3b均示出了在取景框30中的目标对象。通过调整焦距的方式或者拍摄目标靠近镜头的方式，目标对象由图3a的状态31，变为图3b示出的状态31’，其中，目标对象在取景框中的面积占比是变大的。可以理解的，通过调整焦距的方式或者拍摄目标远离镜头的方式，目标对象由图3b的状态31’，变为图3a示出的状态31，其中，目标对象在取景框中的面积占比是变小的。

参考图3a和图3b，由于目标对象状态的改变，在取景框中所显示图像也发生改变。在由3a转变为图3b的过程中，呈现给观众的是目标对象“靠近”观众的景象，因此，在该过程中配合音量变大，则实现视频所播放声音与目标对象的状态变化相关联，有利于增强视频的生动真实感。

在另一示例性的实施例中，上述状态参数还可以是目标对象与取景框中垂线的偏离角度。

示例性的，图4a和图4b为本说明书实施例提供的目标对象在取景框中的状态变化示意图。其中，图4a和图4b均示出了在取景框40中的目标对象。通过调整镜头角度的方式或者拍摄偏离镜头中心(如图中示出的经过中心的中垂线41)的方式，目标对象由图4a的状态42，变为图4b示出的状态42’，其中，目标对象与取景框中垂线的偏离角度是变化的。可以理解的，通过调整镜头角度的方式或者拍摄偏离镜头中心的方式，目标对象由图4b的状态42’，变为图4a示出的状态42，其中，目标对象与取景框中垂线的偏离角度也是变化的。

参考图4a和图4b，由于目标对象状态的改变，在取景框中所显示图像也发生改变。在由4a转变为图4b的过程中，呈现给观众的是目标对象偏向镜头的一侧(如记作“第一侧”)，因此，在该过程中配合第一侧声道对应的音量变大，同时第二侧声道对应的音量变小，则可以实现视频所播放声音与目标对象的状态变化相关联，有利于增强视频的生动真实感。

在一示例性的实施例中，上述参考状态参数可以是目标对象在该视频中第N(小于M)帧对应的取景框中的状态参数，同时，参考音量也是第N帧对应的音量。也就是说，可以以先于当前帧的某一帧作为当前帧进行音量调整的基础。例如，当前帧为第M帧，M取值为100，N取值为80，则对于第100帧音量的调节过程如下：根据目标对象在第100帧对应的取景框中的状态参数和该目标对象在第80帧对应的取景框中的状态参数进行比对，确定状态参数变化量；然后，根据该状态参数变化量来调整第80帧对应的音量，得到第100帧对应的音量。

示例性的，在参考状态参数为目标对象在该视频中第N(小于M)帧对应的取景框中的状态参数的情况下，N的取值应与M的取值差值不大于预设值，也就是说，选取距离当前帧较近的帧作为参考帧，从而，可以使得音量变化平缓，增强用户的视听效果。

示例性的，上述N值可以取1，也就是说，将所拍摄视频的第一帧确定为参考帧。具体地，将目标对象在第一帧对应的取景框中的状态参数为参考状态参数，将第一帧对应的音量确定为参考音量。从而整个视频以统一的参考帧进行音量调整，同样可以使得音量变化平缓，增强用户的视听效果。

在另一示例性的实施例中，上述参考状态参数以及参考音量均为预设值。示例性的，参考状态参数对应的第一预设值以及参考音量对应的第二预设值均可以通过机器学习模型的方式确定。

示例性的，在参考状态参数为第一预设值，参考音量均为第二预设值的情况下，对于当前帧的音量调节过程如下：根据目标对象在当前帧(第M帧)对应的取景框中的状态参数和第一预设值进行比对，确定状态参数变化量；然后，根据该状态参数变化量来调整第二预设值，得到当前帧对应的音量。

以下介绍实现视频所播放声音与目标对象的状态参数关联变化的实施例：

在示例性的实施例中，图5为本说明书一实施例提供的音量控制方法的流程示意图。具体为，状态参数为目标对象在取景框中的面积占比的情况下，音量控制方法的实施例。

参考图5，在S210中，获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数，得到第M状态参数。

示例性的，上述状态参数为目标对象在取景框中的面积占比。参考图3b，示出了目标对象在第M帧对应的取景框中的状态，对应的第M状态参数为：目标对象在取景框中的面积占比为1/2。

在S222中，根据第M状态参数和参考状态参数的比值，确定第M状态参数变化量。

示例性的，上述参考状态参数可以是目标对象在第N(小于M)帧对应的取景框中的状态参数。在该情况下，参考音量为第N帧对应的音量。例如，参考图3a，示出了目标对象在第N帧对应的取景框中的状态，对应的第N状态参数为：目标对象在取景框中的面积占比为1/4。则可以确定相对于第N帧，第M帧中目标对象的状态参数变化量(即，第M状态参数变化量)为2。

当然，上述参考状态参数还可以是第一预设值，则第M帧中目标对象的状态参数变化量(即，第M状态参数变化量)为，第M状态参数与第一预设值的比值。在该情况下，参考音量为第二预设值。

继续参考图5，在S232中，查找预设映射表，确定第M状态参数变化量对应的音量调整幅度，得到第M音量调整幅度；预设映射表包括不同的状态参数变化量各自对应的音量调节幅度；以及，在S234中，基于第M音量调整幅度调节参考音量，得到第M帧对应的音量。

示例性的，预先设置的映射表(即上述预设映射表)，为关于“状态参数变化量(面积占比比值)”和“音量调节幅度”的关联关系。例如，“状态参数变化量”为1，对应的“音量调节幅度”为1，即在参考音量的基础上不改变音量；“状态参数变化量”为1.5，对应的“音量调节幅度”为10％，即在参考音量的基础上增加10％；“状态参数变化量”为2，对应的“音量调节幅度”为25％，即在参考音量的基础上增加25％；“状态参数变化量”为0.5，对应的“音量调节幅度”为-10％，即在第N帧对应音量的基础上减少10％，等。

参考图6，作为S234的一种具体实施方式，在S2342中，判断第M状态参数变化量是否小于1。

若第M状态参数变化量小于1，说明在观众视觉中目标对象在远离镜头的方向移动，为了增加视频的真实生动感，则执行S2344：基于第M帧音量调节幅度对参考音量进行音量减少。

示例性的，第M状态参数变化量为：第M状态参数与第一预设值的比值的情况下，假如，第M状态参数与第一预设值的比值为0.5，则查找上述预设映射表可知，第M音量调节幅度为-10％，即在参考音量(第二预设值)的基础上减少10％。

若第M状态参数变化量大于1，说明在观众视觉中目标对象在朝向镜头移动，为了增加视频的真实生动感，则执行S2346：基于第M帧音量调节幅度对参考音量进行音量增加。

示例性的，仍以上述图3b对应第M帧，参考帧为图3a对应的第N帧为例，同前所述：相对于第N帧，第M帧中目标对象的状态参数变化量(即，第M状态参数变化量)为2。则查找上述预设映射表可知，对应的“第M音量调节幅度”为25％，即在参考音量(图3a对应的第N帧对应的音量)的基础上增加25％。

通过图5和图6对应的实施例，介绍了状态参数为目标对象在取景框中的面积占比的情况下，音量控制方法的实施例。具体地，根据状态参数变化量，确定在观众视觉中目标对象在朝向镜头移动或远离镜头移动，从而有针对性地在参考音量的基础上进行音量增加/音量减小，进而有效增加了视频的真实生动感，提升了观众的视听感受。

除了采用上述预先设置的映射表来确定音量调节幅度，在具体实现中，本说明书实施例还可以采用音量调节模型来确定音量调节幅度。其中，该音量调节模型可基于多个已知音量调节幅度的状态参数变化量训练得到。那么，可将第M状态参数变化量输入到上述音量调节模型中，输出第M帧对应的音量调节量，最终即可得到第M帧对应的音量。

进一步地，可参照目标对象在第M帧中的状态参数采集真实的音量，并基于真实的音量来更新上述音量调节模型，从而使得音量调节模型输出的结果更加真实。

需要说明的是，图5和图6示出实施例中所调节的音量，具体为同步调节第一声道对应的第一部分音量和第二声道对应的第二部分音量。在图7和图8示出的实施例中，由于目标对象在取景框中处于中垂线左侧或者右侧，为了提升观众观看视频的真实感，需要分别调整第一部分音量和第二部分音量。

在示例性的实施例中，图7为本说明书再一实施例提供的音量控制方法的流程示意图。具体为，状态参数为目标对象与取景框中垂线的偏离角度的情况下，音量控制方法的实施例。

参考图7，在S210中，获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数，得到第M状态参数。

示例性的，上述状态参数为目标对象与取景框中垂线的偏离角度。且在偏离角度大于零的情况下取景框中目标对象靠近第一侧声道对应的方向，在偏离角度小于零的情况下取景框中目标对象靠近第二侧声道对应的方向。例如，参考图4b，本实施例中将中垂线右侧记作第一侧声道对应的方向，且第一侧声道对应的方向的偏离角度大于零。反之，本实施例中将中垂线左侧记作第二侧声道对应的方向，且第二侧声道对应的方向的偏离角度小于零。

示例性的，图4b示出了目标对象在第M帧对应的取景框中的状态，对应的第M状态参数为：与取景框中垂线的偏离角度：45度。

在S224中，根据第M状态参数和参考状态参数的差值，确定第M状态参数变化量。

示例性的，上述参考状态参数可以是目标对象在第N(小于M)帧对应的取景框中的状态参数。在该情况下，参考音量为第N帧对应的音量。例如，参考图4a，示出了目标对象在第N帧对应的取景框中的状态，其偏离角度为零(即，第N状态参数)。则可以确定相对于第N帧，第M帧中目标对象的状态参数变化量(即，第M状态参数变化量)为45度。

当然，上述参考状态参数还可以是第一预设值(如，偏离角度为零)，则第M帧中目标对象的状态参数变化量(即，第M状态参数变化量)为，第M状态参数与第一预设值的差值。在该情况下，参考音量为第二预设值。

继续参考图7，在S236中，查找预设映射表，确定第M状态参数变化量对应的第一侧声道的音量调节幅度，得到第M第一侧音量调节幅度，以及确定第M状态参数变化量对应的第二侧声道的音量调节幅度，得到第M第二侧音量调节幅度；以及，在S238中，基于第M第一侧音量调节幅度，调节参考音量对应的第一侧声道的音量；基于第M第二侧声道的音量，调节参考音量对应的第二侧声道的音量。

示例性的，预先设置的映射表(即上述预设映射表)，为关于“状态参数变化量(偏离角度差值)”和“第一侧声道的音量调节幅度”以及“第二侧声道的音量调节幅度”的关联关系。例如，“偏离角度差值”为+10度，“第一侧声道的音量调节幅度”为10％，则在参考音量对应的第一侧声道的音量的基础上增加10％，以及“第二侧声道的音量调节幅度”为-10％，在参考音量对应的第二侧声道的音量的基础上减少10％；“偏离角度差值”为+30度，“第一侧声道的音量调节幅度”为40％，则参考音量对应的第一侧声道的音量的基础上40％，以及“第二侧声道的音量调节幅度”为-40％，则参考音量对应的第二侧声道的音量的基础上减少40％；“偏离角度差值”为+45度，“第一侧声道的音量调节幅度”为60％，则在参考音量对应的第一侧声道的音量的基础上增加60％，以及“第二侧声道的音量调节幅度”为-60％，则在参考音量对应的第二侧声道的音量的基础上减少60％；“偏离角度差值”为-45度，“第二侧声道的音量调节幅度”60％，则在参考音量对应的第二侧声道的音量的基础上增加60％，以及“第一侧声道的音量调节幅度”为-60％，则在参考音量对应的第一侧声道的音量的基础上减少60％，等。

参考图8，作为S238的一种具体实施方式，在S2382中，判断第M状态参数变化量是否小于0。

若第M状态参数变化量小于0，说明在观众视觉中目标对象处于中垂线左侧(第二侧声道对应的方向)，为了增加视频的真实生动感，执行S2384：基于第M第一侧音量调节幅度对参考音量对应的第一侧声道的音量进行音量减少；基于第M第二侧音量调节幅度对参考音量对应的第二侧声道的音量进行音量增加。

示例性的，第M状态参数变化量为：第M状态参数与第一预设值的差值的情况下，假如，第M状态参数与第一预设值的差值为-45度，则查找上述预设映射表可知，第M第一侧音量调节幅度为-60％，即在参考音量对应的第一侧声道的音量地基础上减少60％。同时，第M第二侧音量调节幅度为60％，即在参考音量对应的第二侧声道的音量地基础上增加60％。

若第M状态参数变化量大于0，说明在观众视觉中目标对象处于中垂线右侧(第一侧声道对应的方向)，为了增加视频的真实生动感，执行S2386：基于第M第一侧音量调节幅度对参考音量对应的第一侧声道的音量进行音量增加；基于第M第二侧音量调节幅度对参考音量对应的第二侧声道的音量进行音量减少。

示例性的，仍以上述图4b对应第M帧，参考帧为图4a对应的第N帧为例，同前所述：相对于第N帧，第M帧中目标对象的状态参数变化量(即，第M状态参数变化量)为+45度。则查找上述预设映射表可知，“第一侧声道的音量调节幅度”60％，即在参考音量对应的第一侧声道的音量地基础上增加60％；以及“第二侧声道的音量调节幅度”为-60％，即在参考音量对应的第二侧声道的音量地基础上减少60％。

由于目标对象在取景框中处于中垂线左侧或者右侧，为了提升观众观看视频的真实感，需要分别调整第一部分音量和第二部分音量。通过图7和图8所示的实施例，当视频播放时，控制左声道(第二侧声道)与右声道(第一侧声道)分别对应的音量不同，从而增强了视频的生动真实感，提升观众的代入感，进而提升视频观众粘度。

除了采用上述预先设置的映射表来确定第一侧声道的音量调节幅度和第二侧声道的音量调节幅度，在具体实现中，本说明书实施例还可以采用音量调节模型来确定第一侧声道的音量调节幅度和第二侧声道的音量调节幅度。其中，该音量调节模型可基于多个已知第一侧声道的音量调节幅度和第二侧声道的音量调节幅度的状态参数变化量训练得到。那么，可将第M状态参数变化量输入到上述音量调节模型中，输出第M帧对应的第一侧声道的音量调节幅度和第二侧声道的音量调节幅度，最终即可得到第M帧对应的第一侧声道的音量和第二侧声道的音量。

进一步地，可参照目标对象在第M帧中的状态参数采集真实的第一侧声道的音量和第二侧声道的音量，并基于真实的第一侧声道的音量和第二侧声道的音量来更新上述音量调节模型，从而使得音量调节模型输出的结果更加真实。

需要注意的是，上述附图仅是根据本说明书示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

下述为本说明书装置实施例，可以用于执行本说明书方法实施例。对于本说明书装置实施例中未披露的细节，请参照本说明书方法实施例。

其中，图9示出了可以应用本说明书一实施例的音量控制装置的结构示意图。请参见图9，该图所示的音量控制装置可以通过软件、硬件或者两者的结合实现成为电子设备的全部或一部分，还可以作为独立的模块集成于服务器上，还可以作为独立的模块集成于电子设备中。

本说明书实施例中的上述音量控制装置900包括：参数获取模块910、变化量确定模块920和音量确定模块930。

其中，上述参数获取模块910，用于获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数，得到第M状态参数，M为大于1的整数；上述变化量确定模块920，用于根据上述第M状态参数和参考状态参数，确定第M状态参数变化量；以及，上述音量确定模块930，用于根据上述第M状态参数变化量，确定上述第M帧对应的音量。

在示例性的实施例中，图10示意性示出了根据本说明书另一示例性的实施例中音量控制装置的结构图。请参见图10：

在示例性的实施例中，基于前述方案，上述参考状态参数为上述视频中第N帧对应的取景框中的状态参数，上述第N帧对应的音量为参考音量，N取值为小于M的任一正整数。

在示例性的实施例中，基于前述方案，上述参考状态参数为上述目标对象在上述视频的第一帧对应的取景框中的状态参数。

在示例性的实施例中，基于前述方案，上述参考状态参数为第一预设值，参考音量为第二预设值。

在示例性的实施例中，基于前述方案，上述状态参数为上述目标对象在取景框中的面积占比；

上述变化量确定模块920，具体用于：根据上述第M状态参数与上述参考状态参数的比值，确定上述第M状态参数变化量；上述音量确定模块930，包括：第一查找单元9301和第一调节单元9302；上述第一查找单元9301用于：查找预设映射表，确定上述第M状态参数变化量对应的音量调整幅度，得到第M音量调整幅度；上述预设映射表包括不同的状态参数变化量各自对应的音量调节幅度；上述第一调节单元9302用于：基于上述第M音量调整幅度调节上述参考音量，得到上述第M帧对应的音量。

在示例性的实施例中，基于前述方案，上述第一调节单元9301具体用于：若上述第M状态参数变化量小于1，基于上述第M音量调节幅度对上述参考音量进行音量减少；若上述第M状态参数变化量大于1，基于上述第M音量调节幅度对上述参考音量进行音量增加。

在示例性的实施例中，基于前述方案，上述状态参数为上述目标对象与取景框中垂线的偏离角度，上述偏离角度大于零的情况下上述目标对象靠近第一侧声道对应的方向，上述偏离角度小于零的情况下上述目标对象靠近第二侧声道对应的方向；

上述变化量确定模块920，具体用于：根据上述第M状态参数与上述参考状态参数的差值，确定上述第M状态参数变化量；上述音量确定模块930，包括：第二查找单元9303和第二调节单元9304；

上述第二查找单元9303，用于：查找预设映射表，确定上述第M状态参数变化量对应的第一侧声道的音量调节幅度，得到第M第一侧音量调节幅度，以及确定上述第M状态参数变化量对应的第二侧声道的音量调节幅度，得到第M第二侧音量调节幅度；其中，上述预设映射表包括不同的状态参数变化量各自对应的第一侧声道的音量调节幅度及第二侧声道的音量调节幅度；

上述第二调节单元9304，用于：基于上述第M第一侧音量调节幅度，调节上述参考音量对应的第一侧声道的音量，得到上述第M帧对应的第一侧声道的音量；以及，基于上述第M第二侧声道的音量，调节上述参考音量对应的第二侧声道的音量，得到上述第M帧对应的第二侧声道的音量。

在示例性的实施例中，基于前述方案，上述第二调节单元9304，具体用于：若上述第M状态参数变化量小于零，基于上述第M第一侧音量调节幅度对上述参考音量对应的第一侧声道的音量进行音量减少；若上述第M状态参数变化量大于零，基于上述第M第一侧音量调节幅度对上述参考音量对应的第一侧声道的音量进行音量增加。

在示例性的实施例中，基于前述方案，上述第二调节单元9302，具体用于：若上述第M状态参数变化量小于零，基于上述第M第二侧音量调节幅度对上述参考音量对应的第二侧声道的音量进行音量增加；若上述第M状态参数变化量大于零，基于上述第M第二侧音量调节幅度对上述参考音量对应的第二侧声道的音量进行音量减少。

在示例性的实施例中，基于前述方案，上述第M帧对应的取景框中包括多个拍摄对象；上述装置还包括：接收模块940和目标对象确定模块950；

在上述参数获取模块910获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数之前，上述接收模块940，用于：接收用于从上述多个拍摄对象中选择目标对象的用户操作；上述目标对象确定模块950，用于：响应于上述用户操作，确定上述目标对象。

在示例性的实施例中，基于前述方案，上述第M帧对应的取景框中包括多个拍摄对象；

上述参数获取模块910，具体用于：将上述多个拍摄目标作为上述目标对象；将每个上述拍摄对象第M帧对应的取景框中的状态参数进行叠加，得到上述目标对象在上述第M帧对应的取景框中的状态参数。

需要说明的是，上述实施例提供的音量控制装置在执行音量控制方法时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

另外，上述实施例提供的音量控制装置与音量控制方法实施例属于同一构思，因此对于本说明书装置实施例中未披露的细节，请参照本说明书上述的音量控制方法的实施例，这里不再赘述。

上述本说明书实施例序号仅仅为了描述，不代表实施例的优劣。

本说明书实施例还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时实现上述任一实施例方法的步骤。

图11示意性示出了根据本说明书一示例性的实施例中电子设备的结构图。请参见图11所示，电子设备1100包括有：处理器1101和存储器1102。

本说明书实施例中，处理器1101为计算机系统的控制中心，可以是实体机的处理器，也可以是虚拟机的处理器。处理器1101可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1101可以采用数字信号处理(Digital Signal Processing，DSP)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)、可编程逻辑阵列(Programmable Logic Array，PLA)中的至少一种硬件形式来实现。处理器1101也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。

在本说明书实施例中，上述处理器1101具体用于：

获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数，得到第M状态参数，M为大于1的整数；根据上述第M状态参数和参考状态参数，确定第M状态参数变化量；根据上述第M状态参数变化量，确定上述第M帧对应的音量。

进一步地，上述参考状态参数为上述目标对象在上述视频的第一帧对应的取景框中的状态参数。

进一步地，上述参考状态参数为第一预设值，参考音量为第二预设值。

进一步地，上述状态参数为上述目标对象在取景框中的面积占比；

上述根据上述第M状态参数和参考状态参数，确定第M状态参数变化量，包括：根据上述第M状态参数与上述参考状态参数的比值，确定上述第M状态参数变化量；

上述根据上述第M状态参数变化量，确定上述第M帧对应的音量，包括：查找预设映射表，确定上述第M状态参数变化量对应的音量调整幅度，得到第M音量调整幅度；上述预设映射表包括不同的状态参数变化量各自对应的音量调节幅度；基于上述第M音量调整幅度调节上述参考音量，得到上述第M帧对应的音量。

进一步地，基于上述第M音量调整幅度调节上述参考音量，包括：若上述第M状态参数变化量小于1，基于上述第M音量调节幅度对上述参考音量进行音量减少；若上述第M状态参数变化量大于1，基于上述第M音量调节幅度对上述参考音量进行音量增加。

进一步地，上述状态参数为上述目标对象与取景框中垂线的偏离角度，上述偏离角度大于零的情况下上述取景框中目标对象靠近第一侧声道对应的方向，上述偏离角度小于零的情况下上述取景框中目标对象靠近第二侧声道对应的方向；

上述根据上述第M状态参数和参考状态参数，确定第M状态参数变化量，包括：根据上述第M状态参数与上述参考状态参数的差值，确定上述第M状态参数变化量；

上述根据上述第M状态参数变化量，确定上述第M帧对应的音量，包括：查找预设映射表，确定上述第M状态参数变化量对应的第一侧声道的音量调节幅度，得到第M第一侧音量调节幅度，以及确定上述第M状态参数变化量对应的第二侧声道的音量调节幅度，得到第M第二侧音量调节幅度；其中，上述预设映射表包括不同的状态参数变化量各自对应的第一侧声道的音量调节幅度及第二侧声道的音量调节幅度；基于上述第M第一侧音量调节幅度，调节上述参考音量对应的第一侧声道的音量，得到上述第M帧对应的第一侧声道的音量；基于上述第M第二侧声道的音量，调节上述参考音量对应的第二侧声道的音量，得到上述第M帧对应的第二侧声道的音量。

进一步地，上述基于上述第M第一侧音量调节幅度，调节上述参考音量对应的第一侧声道的音量，包括：若上述第M状态参数变化量小于零，基于上述第M第一侧音量调节幅度对上述参考音量对应的第一侧声道的音量进行音量减少；若上述第M状态参数变化量大于零，基于上述第M第一侧音量调节幅度对上述参考音量对应的第一侧声道的音量进行音量增加。

进一步地，上述基于上述第M第二侧声道的音量，调节上述参考音量对应的第二侧声道的音量，包括：若上述第M状态参数变化量小于零，基于上述第M第二侧音量调节幅度对上述参考音量对应的第二侧声道的音量进行音量增加；若上述第M状态参数变化量大于零，基于上述第M第二侧音量调节幅度对上述参考音量对应的第二侧声道的音量进行音量减少。

进一步地，上述第M帧对应的取景框中包括多个拍摄对象；上述处理器1101还具体用于：在上述获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数之前，接收用于从上述多个拍摄对象中选择目标对象的用户操作；响应于上述用户操作，确定上述目标对象。

进一步地，上述第M帧对应的取景框中包括多个拍摄对象；上述获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数，包括：将上述多个拍摄目标作为上述目标对象；将每个上述拍摄对象第M帧对应的取景框中的状态参数进行叠加，得到所述目标对象在所述第M帧对应的取景框中的状态参数。

存储器1102可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1102还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在本说明书的一些实施例中，存储器1102中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器1101所执行以实现本说明书实施例中的方法。

一些实施例中，电子设备1100还包括有：外围设备接口1103和至少一个外围设备。处理器1101、存储器1102和外围设备接口1103之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1103相连。具体地，外围设备包括：显示屏1104、摄像头1105和音频电路1106中的至少一种。

外围设备接口1103可被用于将输入/输出(Input/Output，I/O)相关的至少一个外围设备连接到处理器1101和存储器1102。在本说明书的一些实施例中，处理器1101、存储器1102和外围设备接口1103被集成在同一芯片或电路板上；在本说明书的一些其他实施例中，处理器1101、存储器1102和外围设备接口1103中的任意一个或两个可以在单独的芯片或电路板上实现。本说明书实施例对此不作具体限定。

显示屏1104用于显示用户界面(User Interface，UI)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1104是触摸显示屏时，显示屏1104还具有采集在显示屏1104的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1101进行处理。此时，显示屏1104还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在本说明书的一些实施例中，显示屏1104可以为一个，设置电子设备1100的前面板；在本说明书的另一些实施例中，显示屏1104可以为至少两个，分别设置在电子设备1100的不同表面或呈折叠设计；在本说明书的再一些实施例中，显示屏1104可以是柔性显示屏，设置在电子设备1100的弯曲表面上或折叠面上。甚至，显示屏1104还可以设置成非矩形的不规则图形，也即异形屏。显示屏1104可以采用液晶显示屏(Liquid CrystalDisplay，LCD)、有机发光二极管(Organic Light-Emitting Diode，OLED)等材质制备。

摄像头1105用于采集图像或视频。可选地，摄像头1105包括前置摄像头和后置摄像头。通常，前置摄像头设置在电子设备的前面板，后置摄像头设置在电子设备的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及虚拟现实(Virtual Reality，VR)拍摄功能或者其它融合拍摄功能。在本说明书的一些实施例中，摄像头1105还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路1106可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器1101进行处理。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在电子设备1100的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。

电源1107用于为电子设备1100中的各个组件进行供电。电源1107可以是交流电、直流电、一次性电池或可充电电池。当电源1107包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

本说明书实施例中示出的电子设备结构框图并不构成对电子设备1100的限定，电子设备1100可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

在本说明书的描述中，需要理解的是，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本说明书中的具体含义。此外，在本说明书的描述中，除非另有说明，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

需要注意的是，上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

以上所述，仅为本说明书的具体实施方式，但本说明书的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本说明书揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本说明书的保护范围之内。因此，依本说明书权利要求所作的等同变化，仍属本说明书所涵盖的范围。

Claims

1.一种音量控制方法，其中，所述方法包括：

获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数，得到第M状态参数，M为大于1的整数；

根据所述第M状态参数和参考状态参数，确定第M状态参数变化量；

根据所述第M状态参数变化量，确定所述第M帧对应的音量。

2.根据权利要求1所述的方法，其中，所述参考状态参数为所述目标对象在所述视频的第N帧对应的取景框中的状态参数，所述第N帧对应的音量为参考音量，N取值为小于M的任一正整数。

3.根据权利要求2所述的方法，其中，所述参考状态参数为所述目标对象在所述视频的第一帧对应的取景框中的状态参数。

4.根据权利要求1所述的方法，其中，所述参考状态参数为第一预设值，参考音量为第二预设值。

5.根据权利要求2至4中任意一项所述的方法，其中，所述状态参数为所述目标对象在取景框中的面积占比；

所述根据所述第M状态参数和参考状态参数，确定第M状态参数变化量，包括：

根据所述第M状态参数与所述参考状态参数的比值，确定所述第M状态参数变化量；

所述根据所述第M状态参数变化量，确定所述第M帧对应的音量，包括：

查找预设映射表，确定所述第M状态参数变化量对应的音量调整幅度，得到第M音量调整幅度；所述预设映射表包括不同的状态参数变化量各自对应的音量调节幅度；

基于所述第M音量调整幅度调节所述参考音量，得到所述第M帧对应的音量。

6.根据权利要求5所述的方法，其中，基于所述第M音量调整幅度调节所述参考音量，包括：

若所述第M状态参数变化量小于1，基于所述第M音量调节幅度对所述参考音量进行音量减少；

若所述第M状态参数变化量大于1，基于所述第M音量调节幅度对所述参考音量进行音量增加。

7.根据权利要求2至4中任意一项所述的方法，其中，所述状态参数为所述目标对象与取景框中垂线的偏离角度，所述偏离角度大于零的情况下所述取景框中目标对象靠近第一侧声道对应的方向，所述偏离角度小于零的情况下所述取景框中目标对象靠近第二侧声道对应的方向；

根据所述第M状态参数与所述参考状态参数的差值，确定所述第M状态参数变化量；

查找预设映射表，确定所述第M状态参数变化量对应的第一侧声道的音量调节幅度，得到第M第一侧音量调节幅度，以及确定所述第M状态参数变化量对应的第二侧声道的音量调节幅度，得到第M第二侧音量调节幅度；其中，所述预设映射表包括不同的状态参数变化量各自对应的第一侧声道的音量调节幅度及第二侧声道的音量调节幅度；

基于所述第M第一侧音量调节幅度，调节所述参考音量对应的第一侧声道的音量，得到所述第M帧对应的第一侧声道的音量；

基于所述第M第二侧声道的音量，调节所述参考音量对应的第二侧声道的音量，得到所述第M帧对应的第二侧声道的音量。

8.根据权利要求7所述的方法，其中，所述基于所述第M第一侧音量调节幅度，调节所述参考音量对应的第一侧声道的音量，包括：

若所述第M状态参数变化量小于零，基于所述第M第一侧音量调节幅度对所述参考音量对应的第一侧声道的音量进行音量减少；

若所述第M状态参数变化量大于零，基于所述第M第一侧音量调节幅度对所述参考音量对应的第一侧声道的音量进行音量增加。

9.根据权利要求7所述的方法，其中，所述基于所述第M第二侧声道的音量，调节所述参考音量对应的第二侧声道的音量，包括：

若所述第M状态参数变化量小于零，基于所述第M第二侧音量调节幅度对所述参考音量对应的第二侧声道的音量进行音量增加；

若所述第M状态参数变化量大于零，基于所述第M第二侧音量调节幅度对所述参考音量对应的第二侧声道的音量进行音量减少。

10.根据权利要求1至4中任意一项所述的方法，其中，所述第M帧对应的取景框中包括多个拍摄对象；

在所述获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数之前，所述方法还包括：

接收用于从所述多个拍摄对象中选择目标对象的用户操作；

响应于所述用户操作，确定所述目标对象。

11.根据权利要求1至4中任意一项所述的方法，其中，所述第M帧对应的取景框中包括多个拍摄对象；

所述获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数，包括：

将所述多个拍摄目标作为所述目标对象；

将每个所述拍摄对象第M帧对应的取景框中的状态参数进行叠加，得到所述目标对象在所述第M帧对应的取景框中的状态参数。

12.一种音量控制装置，其中，所述装置包括：

参数获取模块，用于获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数，得到第M状态参数，M为大于1的整数；

变化量确定模块，用于根据所述第M状态参数和参考状态参数，确定第M状态参数变化量；

音量确定模块，用于根据所述第M状态参数变化量，确定所述第M帧对应的音量。

13.根据权利要求12所述的装置，其中，所述参考状态参数为所述视频中第N帧对应的取景框中的状态参数，所述第N帧对应的音量为参考音量，N取值为小于M的任一正整数。

14.根据权利要求13所述的装置，其中，所述参考状态参数为所述目标对象在所述视频的第一帧对应的取景框中的状态参数。

15.根据权利要求12所述的装置，其中，所述参考状态参数为第一预设值，参考音量为第二预设值。

16.根据权利要求13至15中任意一项所述的装置，其中，所述状态参数为所述目标对象在取景框中的面积占比；

所述变化量确定模块，具体用于：根据所述第M状态参数与所述参考状态参数的比值，确定所述第M状态参数变化量；

所述音量确定模块，包括：第一查找单元和第一调节单元；

所述第一查找单元用于：查找预设映射表，确定所述第M状态参数变化量对应的音量调整幅度，得到第M音量调整幅度；所述预设映射表包括不同的状态参数变化量各自对应的音量调节幅度；

所述第一调节单元用于：基于所述第M音量调整幅度调节所述参考音量，得到所述第M帧对应的音量。

17.根据权利要求16所述的装置，其中，所述第一调节单元具体用于：

18.根据权利要求13至15中任意一项所述的装置，其中，所述状态参数为所述目标对象与取景框中垂线的偏离角度，所述偏离角度大于零的情况下所述目标对象靠近第一侧声道对应的方向，所述偏离角度小于零的情况下所述目标对象靠近第二侧声道对应的方向；

所述变化量确定模块，具体用于：根据所述第M状态参数与所述参考状态参数的差值，确定所述第M状态参数变化量；

所述音量确定模块，包括：第二查找单元和第二调节单元；

所述第二查找单元，用于：查找预设映射表，确定所述第M状态参数变化量对应的第一侧声道的音量调节幅度，得到第M第一侧音量调节幅度，以及确定所述第M状态参数变化量对应的第二侧声道的音量调节幅度，得到第M第二侧音量调节幅度；其中，所述预设映射表包括不同的状态参数变化量各自对应的第一侧声道的音量调节幅度及第二侧声道的音量调节幅度；

所述第二调节单元，用于：基于所述第M第一侧音量调节幅度，调节所述参考音量对应的第一侧声道的音量，得到所述第M帧对应的第一侧声道的音量；以及，基于所述第M第二侧声道的音量，调节所述参考音量对应的第二侧声道的音量，得到所述第M帧对应的第二侧声道的音量。

19.根据权利要求18所述的装置，其中，所述第二调节单元，具体用于：

20.根据权利要求18所述的装置，其中，所述第二调节单元，具体用于：

21.根据权利要求12至15中任意一项所述的装置，其中，所述第M帧对应的取景框中包括多个拍摄对象；所述装置还包括：接收模块和目标对象确定模块；

在参数获取模块所述获取目标对象在所拍摄视频的第M帧对应的取景框中的状态参数之前，所述接收模块，用于：接收用于从所述多个拍摄对象中选择目标对象的用户操作；

所述目标对象确定模块，用于：响应于所述用户操作，确定所述目标对象。

22.根据权利要求12至15中任意一项所述的装置，其中，所述第M帧对应的取景框中包括多个拍摄对象；

所述参数获取模块，具体用于：将所述多个拍摄目标作为所述目标对象；将每个所述拍摄对象第M帧对应的取景框中的状态参数进行叠加，得到所述目标对象在所述第M帧对应的取景框中的状态参数。

23.一种电子设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至11中任一项所述的音量控制方法。