CN114339542A

CN114339542A - 音量调节方法、装置、电子设备和介质

Info

Publication number: CN114339542A
Application number: CN202111421944.2A
Authority: CN
Inventors: 张道林; 勾晓菲; 李娟�; 汪亮
Original assignee: Beijing Rockwell Technology Co Ltd
Current assignee: Beijing Rockwell Technology Co Ltd
Priority date: 2021-11-26
Filing date: 2021-11-26
Publication date: 2022-04-12

Abstract

本公开涉及一种音量调节方法、装置、电子设备和介质；其中，该方法包括：接收第一终端发送的初始语音数据；基于预设的第一音量值，调整初始语音数据的音量值，得到目标语音数据；将目标语音数据发送给第二终端，用于第二终端播放目标语音数据。本公开实施例能够使得接收目标语音数据的参与者听到的语音数据的音量都近似或统一，避免在参与过程中听到参差不齐的声音降低参与体验度的问题，有效平衡每个参与者的声音音量。

Description

音量调节方法、装置、电子设备和介质

技术领域

本公开涉及语音处理技术领域，尤其涉及一种音量调节方法、装置、电子设备和介质。

背景技术

在多人会议/通话中，每个参与者会利用一个终端进行语音数据的输入与接收，来实现与其他参与者的信息交流。

其中，每个参与者使用的终端设置有语音数据的输入音量值，并使得终端将该音量值对应的语音数据输出给其他终端进行语音播放。

但是，每个终端即使设置的是相同的输入音量值，由于使用终端的参与者与终端的距离、外界环境等因素，会导致终端采集参与者语音数据的音量与输入音量值不同，进而在其他终端输出时的语音数据的音量值则是参差不齐的，参与者的体验度较低。

发明内容

为了解决上述技术问题，本公开提供了一种音量调节方法、装置、电子设备和介质。

第一方面，本公开提供了一种音量调节方法，包括：

接收第一终端发送的初始语音数据；

基于预设的第一音量值，调整所述初始语音数据的音量值，得到目标语音数据；

将所述目标语音数据发送给第二终端，用于所述第二终端播放所述目标语音数据。

可选的，所述基于预设的第一音量值，调整所述初始语音数据的音量值，得到目标语音数据之前，还包括：

获取所述初始语音数据的音量值；

所述基于预设的第一音量值，调整所述初始语音数据的音量值，得到目标语音数据，包括：

将所述初始语音数据的音量值调整为所述预设的第一音量值；

基于调整结果，得到目标语音数据。

可选的，所述将所述初始语音数据的音量值调整为所述预设的第一音量值，包括：

在检测到所述初始语音数据的音量值小于所述预设的第一音量值时，将所述初始语音数据的音量值增大至所述预设的第一音量值；

或者，在检测到所述初始语音数据的音量值大于所述预设的第一音量值时，将所述初始语音数据的音量值减小至所述预设的第一音量值。

可选的，所述将所述目标语音数据发送给第二终端之前，还包括：

获取第二终端采用的播放设备的所属类型；

根据所述播放设备的所属类型，重置所述目标语音数据的音量值。

可选的，所述播放设备的所属类型为近距离播放时；

所述根据所述播放设备的所属类型，重置所述目标语音数据的音量值，包括：

将所述目标语音数据的音量值调至预设的第二音量值。

获取第二终端的历史播放信息，所述历史播放信息包括历史语音数据的播放音量值；

基于所述历史语音数据的播放音量值，确定所述第二终端对应的音量值播放范围；

在检测到所述目标语音数据的音量值未在所述第二终端对应的音量值播放范围内，基于所述第二终端对应的音量值播放范围重置所述目标语音数据的音量值。

可选的，所述基于所述第二终端对应的音量值播放范围重置所述目标语音数据的音量值，包括：

确定所述第二终端对应的音量值播放范围内的平均音量值；

基于所述平均音量值，重置所述目标语音数据的音量值。

可选的，所述基于所述平均音量值，重置所述目标语音数据的音量值之前，还包括：

若检测到所述第二终端对应的音量值播放范围内的平均音量值大于所述目标语音数据的音量值，生成播放确认信息，所述播放确认信息用于请求所述目标语音数据的音量值的重置确认指示；

确定接收到所述目标语音数据的音量值的重置确认指示。

第二方面，本公开提供了一种音量调节装置，包括：

接收模块，用于接收第一终端发送的初始语音数据；

调整模块，用于基于预设的第一音量值，调整所述初始语音数据的音量值，得到目标语音数据；

发送模块，用于将所述目标语音数据发送给第二终端，用于所述第二终端播放所述目标语音数据。

可选的，还包括：获取模块；

获取模块，用于获取所述初始语音数据的音量值。

调整模块，包括：调整单元和确定单元；

调整单元，用于将所述初始语音数据的音量值调整为所述预设的第一音量值；

确定单元，用于基于调整结果，得到目标语音数据。

可选的，调整单元，具体用于：

可选的，还包括：重置模块；

获取模块，还用于获取第二终端采用的播放设备的所属类型；

重置模块，用于根据所述播放设备的所属类型，重置所述目标语音数据的音量值。

可选的，所述播放设备的所属类型为近距离播放时；

重置模块，具体用于：

将所述目标语音数据的音量值调至预设的第二音量值。

可选的，还包括：确定模块；

获取模块，还用于获取第二终端的历史播放信息，所述历史播放信息包括历史语音数据的播放音量值；

确定模块，用于基于所述历史语音数据的播放音量值，确定所述第二终端对应的音量值播放范围；

重置模块，还用于在检测到所述目标语音数据的音量值未在所述第二终端对应的音量值播放范围内，基于所述第二终端对应的音量值播放范围重置所述目标语音数据的音量值。

可选的，重置模块，具体用于：

确定所述第二终端对应的音量值播放范围内的平均音量值；

基于所述平均音量值，重置所述目标语音数据的音量值。

可选的，还包括：检测模块；

检测模块，用于若检测到所述第二终端对应的音量值播放范围内的平均音量值大于所述目标语音数据的音量值，生成播放确认信息，所述播放确认信息用于请求所述目标语音数据的音量值的重置确认指示；

确定模块，还用于确定接收到所述目标语音数据的音量值的重置确认指示。

第三方面，本公开还提供了一种电子设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明实施例中的任一种所述的音量调节方法。

第四方面，本公开还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明实施例中的任一种所述的音量调节方法。

第五方面，本公开还提供了一种车辆，包括：采集模块、调整模块和发送模块；

采集模块，用于采集初始语音数据；

调整模块，用于根据预设的第一音量值，调整所述初始语音数据的音量值，得到目标语音数据；

发送模块，用于将所述目标语音数据发送给服务器或其他终端。

本公开实施例提供的技术方案与现有技术相比具有如下优点：通过在会议过程中，接收第一终端发送的初始语音数据，并基于预设的第一音量值，调整该初始语音数据的音量值，得到目标语音数据，以将目标语音数据发送给第二终端，用于第二终端播放目标语音数据，从而，使得接收目标语音数据的参与者听到的语音数据的音量都近似或统一，避免在参与过程中听到参差不齐的声音降低参与体验度的问题，有效平衡每个参与者的声音音量。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本公开实施例提供的一种音量调节方法的流程示意图；

图2是本公开实施例提供的一种语音交互示意图；

图3是本公开实施例提供的另一种音量调节方法的流程示意图；

图4是本公开实施例提供的又一种音量调节方法的流程示意图；

图5是本公开实施例提供的一种音量调节装置的结构示意图；

图6是本公开实施例提供的一种电子设备的结构示意图。

具体实施方式

为了能够更清楚地理解本公开的上述目的、特征和优点，下面将对本公开的方案进行进一步描述。需要说明的是，在不冲突的情况下，本公开的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本公开，但本公开还可以采用其他不同于在此描述的方式来实施；显然，说明书中的实施例只是本公开的一部分实施例，而不是全部的实施例。

在多人会议中，每个参与者使用的终端的类型可能不同，这会导致即使每个终端的输入音量统一的情况下，接收语音数据的其他终端听到的语音数据的音量也不同。

举例而言，在车载会议场景中有三个参与者，第一个参与者使用的终端为第一车载设备，第二个参与者使用的终端是非车载设备，如智能手机等，第三个参与者使用的终端是第二车载设备，此时，当第一个参与者和第二个参与者以统一的终端音量输入一个语音数据时，第三个参与者听到的语音数据的音量也是不同的。这样，会导致接收语音数据的参与者需要不停的调整自己所使用的终端的音量控制器，使得自己听到的语音数据的音量值尽量保持一致或者适应于自己的听力需求。

基于此，本公开通过在服务器端统一调整每个参与者输入的语音数据的音量值，使得输出至其他终端时该语音数据的音量值是统一的。

示例性地，本公开提供了一种音量调节方法、装置、电子设备和介质，通过在会议过程中，接收第一终端发送的初始语音数据，并基于预设的第一音量值，调整该初始语音数据的音量值，得到与初始语音数据音量值不同的目标语音数据，以将目标语音数据发送给第二终端，使得第二终端播放目标语音数据，从而，从而，使得接收目标语音数据的参与者听到的语音数据的音量都近似或统一，避免在参与过程中听到参差不齐的声音降低参与体验度的问题，有效平衡每个参与者的声音音量。

具体参见图1中示例性所示。

图1是本公开实施例提供的一种音量调节方法的流程示意图。本实施例方法可由音量调节装置来执行，该装置可采用硬件/或软件的方式来实现，并可配置于电子设备中。可实现本申请任意实施例所述的音量调节方法。如图1所示，该方法具体包括如下：

S110、接收第一终端发送的初始语音数据。

其中，第一终端可为进行多人会议时的语音发送端，第一终端可包括：智能手机、平板电脑、个人计算机或者车载设备等。

其中，初始语音数据为第一终端接收到的参与者产生的语音数据，如第一终端的参与者说出的话语、或者采用其他媒体介质播放的语音等。

需要说明的是，参与多人会议的每个终端中可具有多个麦克风，其中，多个麦克风中的至少一个麦克风可实时采集参与者的语音信号。

举例而言，在车载会议场景中，多个麦克风可布置于车辆的不同位置，如基于预设距离分布式设置在车腔内，可基于参与者在车辆中的落座位置，控制与参与者距离小于一定距离阈值的至少一个麦克风采集该参与者发出的语音信号。

或者，在车载会议场景中，持续开启每个麦克风，并通过每个麦克风实时采集参与者发出的语音信号。

S120、基于预设的第一音量值，调整初始语音数据的音量值，得到目标语音数据。

其中，预设的第一音量值为服务器预先设定的一个适合人耳正常听力范围内的一个音量值，如可将第一音量值设置为50分贝，也可设置为音量范围，如45-55分贝。

服务器在接收到第一终端发送的语音数据之后，对该语音数据对应的音量值进行大小调整，得到适合会议通话的统一的目标语音数据。

需要说明的是，目标语音数据与初始语音数据的音量值的大小不同，其余如语音内容等一些信息均相同，也就是，目标语音数据是对初始语音数据的音量值进行调整后得到的一个语音数据。

其中，调整初始语音数据的音量值，可包括：服务器将初始语音数据的音量值做增大处理，或者，服务器将初始语音数据的音量值做减小处理。调整时可将第一音量值作为基准，将初始语音数据的平均音量值与第一音量值统一，也可将初始语音数据的最大音量值与第一音量值统一，还可将初始语音数据的最小音量值与第一音量值统一，又可将初始语音数据的动态音量值与第一音量值统一，本公开不做具体限制。

在本实施例中，可选的，基于预设的第一音量值，调整初始语音数据的音量值，得到目标语音数据之前，本实施例方法还可以包括：

获取初始语音数据的音量值。

其中，可基于服务器中安装的或者调用外部的目标应用程序(Application，APP)来测试获取初始语音数据的音量值。

举例而言，服务器在接收到第一终端发送的初始语音数据时，将该初始语音数据输入目标应用程序中，并通过目标应用程序的输出确定初始语音数据的音量值。

其中，服务器在确定出初始语音数据的音量值与预设的第一音量值不匹配时，表明需要调整初始语音数据的音量值的大小，则执行基于预设的第一音量值，调整初始语音数据的音量值，得到目标语音数据。

另外，在调整初始语音数据的音量值之前，可对初始语音数据的音量值与预设的第一音量值进行比对，并在比对出两者音量值不匹配的情况下进行初始语音数据的音量值的调整，以避免两者音量相同导致服务器无效调整音量值的问题。

另外，可基于音量检测传感器确定出初始语音数据的音量值，在确定出初始语音数据的音量值与预设的第一音量值匹配时，则不需要调整初始语音数据的音量值，可直接输出初始语音数据，或者，可将初始语音数据作为目标语音数据再进行输出操作。

其中，可选的，基于预设的第一音量值，调整初始语音数据的音量值，得到目标语音数据，包括：

将初始语音数据的音量值调整为预设的第一音量值；

基于调整结果，得到目标语音数据。

其中，服务器在确定出初始语音数据的音量值需要进行调整时，可通过将初始语音数据的音量值调整为预设的第一音量值，得到目标语音数据，来使得输出的目标语音数据能够适应于第二终端的参与者的听觉需求。

举例而言，预设的第一音量值的大小为50分贝，检测得到的初始语音数据的音量值为40分贝，则可将初始语音数据的音量值调整至50分贝，以将音量值为40分贝的初始语音数据调整为音量值为50分贝的目标语音数据。

其中，可选的，将初始语音数据的音量值调整为预设的第一音量值，包括：

在检测到初始语音数据的音量值小于预设的第一音量值时，将初始语音数据的音量值增大至预设的第一音量值；

或者，在检测到初始语音数据的音量值大于预设的第一音量值时，将初始语音数据的音量值减小至预设的第一音量值。

其中，服务器在检测到初始语音数据的音量值小于预设的第一音量值时，将初始语音数据的音量值增大至预设的第一音量值，从而，避免第二终端输出的音量值过小导致参与者难以听清语音数据的问题。

举例而言，预设的第一音量值的大小为50分贝，检测得到的初始语音数据的音量值为20分贝，则可将初始语音数据的音量值由20分贝调整至50分贝，以将音量值为20分贝的初始语音数据调整为音量值为50分贝的目标语音数据。

其中，服务器在检测到初始语音数据的音量值大于预设的第一音量值时，将初始语音数据的音量值减小至预设的第一音量值，从而，避免第二终端输出的音量值过大导致参与者听觉不适甚至损伤的问题。

举例而言，预设的第一音量值的大小为50分贝，检测得到的初始语音数据的音量值为80分贝，则可将初始语音数据的音量值由80分贝调整至50分贝，以将音量值为80分贝的初始语音数据调整为音量值为50分贝的目标语音数据，便于减少或避免参与者感知音量调节，从而获得舒适的听力环境。

另外，服务器在检测到初始语音数据的音量值与预设的第一音量值匹配时，可不对初始语音数据的音量值进行调整，即直接将初始语音数据作为目标语音数据发送给第二终端。

S130、将目标语音数据发送给第二终端，用于第二终端播放目标语音数据。

其中，第二终端为进行多人会议时的语音接收端，第二终端可包括：智能手机、平板电脑、个人计算机或者车载设备等。

举例而言，在进行多人会议时，第一用户在说话，则第一用户所使用的终端可称为第一终端，参与的其他终端可称为第二终端。

需要说明的是，第一终端和第二终端不表征一个固定的终端设备，可通过不同的语音输入者进行实时终端身份的切换。

举例而言，在上述示例的基础上，第一用户说话完毕后，第二用户开始说话，则第二用户所使用的终端可称为第一终端，参与的其他终端可称为第二终端。

其中，第一终端可表示语音数据的发出者，第二终端可表示语音数据的接收者。

另外，多人会议可支持多人分别使用多个终端进行语音传输，同时，也可支持多个终端的语音过程中，每个终端的使用者可是多人。

在一些实施例中，如第一用户使用终端A，第二用户使用终端B，第三用户使用终端C，以实现第一用户、第二用户和第三用户的语音交互，其中，在第一用户使用终端A说话时，终端A可看作是第一终端，相应的，终端B和终端C可看作是第二终端，在第一用户说话结束之后，且第二用户使用终端B进行说话，此时，终端B可看作是第一终端，终端A和终端C可看作是第二终端。

在另一些实施例中，如第四用户和第五用户同时使用终端D，第六用户使用终端E时进行语音交互时，第四用户和第五用户可分别使用终端D进行语音数据的发出，此时，终端D可看作是第一终端，终端E可看作是第二终端。

需要说明的是，在第四用户和第五用户使用终端D时，服务器可根据预设的第一音量值，对第四用户产生的目标语音数据和第五用户产生的目标语音数据进行音量调整，使得输出给终端E时，不管是第四用户的目标语音数据和第五用户的目标语音数据的音量值均是统一的且等于预设的第一音量值。

从而，在多人使用同一终端与其他终端进行语音交互时，能够有效保证一个终端中多人产生的语音数据输出给其他终端时的音量值是统一的，便于使用其他终端的用户接听到不同输入用户的统一音量值的语音数据，有效平衡一个终端中不同输入用户的音量幅度。

另外，本公开实施例可支持两人通话场景，如第七用户使用终端F，第八用户使用终端G，不管第七用户通过终端F的说话音量值的大小起伏，第八用户通过终端G接收到的音量值始终是一样的。

其中，第七用户的终端F输出的音量值和第八用户的终端G输出的音量值可相同，也可不同。

其中，服务器可将目标语音数据发送给第二终端，使得第二终端能够基于目标语音数据的音量值播放目标语音数据，从而，保证不同的终端以统一的音量值播放语音数据时听到的音量大小均统一。

本实施例提供的音量调节方法，通过在会议过程中，接收第一终端发送的初始语音数据，并基于预设的第一音量值，调整该初始语音数据的音量值，得到与初始语音数据音量值不相同的目标语音数据，以将目标语音数据发送给第二终端，使得第二终端播放目标语音数据，从而，使得接收目标语音数据的参与者听到的语音数据的音量都近似或统一，避免在参与过程中听到参差不齐的声音降低参与体验度的问题，有效平衡每个参与者的声音音量。

图3是本公开实施例提供的另一种音量调节方法的流程示意图。本实施例是在上述实施例的基础上，进一步地，在S130之前，本实施例方法还可以包括：

S1211、获取第二终端采用的播放设备的所属类型。

其中，播放设备为第二终端的参与者使用的语音播放设备，如第二终端中的麦克风、第二终端外的一个音响、或者与第二终端连接的耳机设备等，播放设备的所属类型信息可由播放设备发送，或者根据播放设备的设备信息进行判断。

第二终端采用的播放设备的所属类型可包括近距离播放和远距离播放，其中，近距离和远距离可理解为与参与者的耳朵一个相对概念。

举例而言，耳机设备的所属类型可为近距离播放，第二终端外的一个音响的所属类型可为远距离播放。

S1212、根据播放设备的所属类型，重置目标语音数据的音量值。

其中，在播放设备的所属类型不同时，表明出参与者的耳朵距离播放设备的距离不同，则需要基于播放设备的所属类型，为参与者设置一个适合播放的音量值，便于提升参与者的会议体验。

其中，可选的，播放设备的所属类型为近距离播放时；

根据播放设备的所属类型，重置目标语音数据的音量值，包括：

将目标语音数据的音量值调至预设的第二音量值。

举例而言，目标语音数据的音量值为50分贝，但是检测出参与者是利用耳机来获取声音信号的，尤其是在车载会议的封闭场景中，相同音量下耳机传入参与者耳朵的声音效果会远大于音响声音传入参与者耳朵的声音效果，则需要将目标语音数据的音量值降低至预设的第二音量值，如将目标语音数据的音量值降低至预设的30分贝。

其中，预设的第二音量值为服务器预先设定的一个适合人耳佩戴耳机进行会议听力时的一个音量值，如将第二音量值可设置为30分贝，第二音量值的具体设定大小可基于不同参与者的习惯进行适应性调整，本公开对此不做具体限定。

从而，避免耳机直接接触参与者的耳朵，语音信号的音量过大时导致参与者听力受损的问题。

另外，本公开还支持播放设备的所属类型的切换时，对目标语音数据的音量值进行调整。

其中，在播放设备的所属类型由近距离播放切换至远距离播放时，如由耳机切换至外放，可将目标语音数据的音量值增大至预设的第一音量值。

举例而言，当服务器获取用户当前使用的播放设备的所属类型是由近距离播放切换至远距离播放的信息时，也就是，上一次接听语音数据时使用的是耳机，对应的音量值为预设的第二音量值，切换至使用音响，则在下一次接收语音数据时，服务器调整对应的音量值为预设的第一音量值，则将目标语音数据的音量值由第二音量值增加至预设的第一音量值，也就是用户接收到目标语音数据的音量值切换为音响对应的音量值。

从而，避免用户将播放设备的类型由近距离切换至远距离时出现用户当前接收到的语音数据的音量值极减的问题，满足用户在播放设备的类型切换之后仍然能够接听到合适音量值的语音数据。

图4是本公开实施例提供的又一种音量调节方法的流程示意图。本实施例是在上述实施例的基础上，进一步地，在S130之前，本实施例方法还可以包括：

S1221、获取第二终端的历史播放信息，历史播放信息包括历史语音数据的播放音量值。

其中，第二终端的历史播放信息为使用第二终端的参与者为历史语音数据设置的播放音量值，其可有效反映出第二终端的使用者的参与听力习惯。

需要说明的是，历史语音数据的播放音量值可为第二终端的使用用户在使用第二终端的过程中，依据听力习惯在第二终端上进行调节得到的音量值。

举例而言，在第二终端的历史使用过程中，第二终端的使用用户将第二终端输出的语音数据的播放音量值调整至音量值1，该用户再次使用第二终端时，将第二终端输出的语音数据的播放音量值由音量值1调整为音量值2，则历史语音数据的播放音量值可包括音量值1和音量值2，其中，音量值1和音量值2的具体数值不相等。

具体的，可采集第二终端的至少两项历史参与记录，获取至少两项历史参与记录中输出的语音数据的音量值的具体数值。

S1222、基于历史语音数据的播放音量值，确定第二终端对应的音量值播放范围。

其中，第二终端对应的音量值播放范围为最小播放音量值和最大播放音量值组成的区间范围，最小播放音量值为第二终端在会议过程中播放过的最小的音量值，最大播放音量值为第二终端在会议过程中播放过的最大的音量值。

S1223、在检测到目标语音数据的音量值未在第二终端对应的音量值播放范围内，基于第二终端对应的音量值播放范围重置目标语音数据的音量值。

其中，服务器将目标语音数据的音量值与第二终端对应的音量值播放范围进行匹配，并在确定出目标语音数据的音量值未在第二终端对应的音量值播放范围内，基于第二终端对应的音量值播放范围重置目标语音数据的音量值。

从而，结合第二终端的使用者的历史听力数据，预测出第二终端的使用者的听力习惯，使得第二终端最终输出的语音数据的音量值满足第二终端的使用者的听力习惯，便于提升参与者的参与满意度。

其中，可选的，基于第二终端对应的音量值播放范围重置目标语音数据的音量值，包括：

确定第二终端对应的音量值播放范围内的平均音量值；

基于平均音量值，重置目标语音数据的音量值。

举例而言，第二终端对应的音量值播放范围为30分贝-60分贝，取第二终端对应的音量值播放范围的平均音量值则为45分贝，在确定出目标语音数据的音量值为50分贝时，可将目标语音数据的音量值重置为45分贝。

从而，在确定出第二终端的参与者能够听到其他参与者的统一音量的语音数据的基础上，还能够接听到适合自己听力习惯的音量值的语音数据，能够进一步提升参与者的会议体验度。

其中，可选的，基于平均音量值，重置目标语音数据的音量值之前，本实施例方法还包括：

若检测到第二终端对应的音量值播放范围内的平均音量值大于目标语音数据的音量值，生成播放确认信息，播放确认信息用于请求目标语音数据的音量值的重置确认指示；

确定接收到目标语音数据的音量值的重置确认指示。

其中，在基于第二终端对应的音量值播放范围内的平均音量值，重置目标语音数据的音量值之前，为了适应参与者处于不同会议场景下的参与需求，可在检测到第二终端对应的音量值播放范围内的平均音量值大于目标语音数据的音量值时，向第二终端的参与者发出确认重置目标语音数据的音量值的指示请求。

从而，使得参与者能够基于不同的参与需求，自主选择想要听到的语音数据的音量值。

另外，在检测到第二终端对应的音量值播放范围内的平均音量值小于目标语音数据的音量值，也可生成一个播放确认信息，并在确定接收到目标语音数据的音量值的重置确认指示之后，重置目标语音数据的音量值。

从而，避免语音数据的音量值大于参与者的听力习惯对应的音量值导致参与者听觉不适的问题。

本实施例还提供了一种语音数据的发送端与语音数据的接收端的交互示意图，具体可参见图2示例性所示。

其中，可在语音数据的发送端进行初始语音数据的音量值的大小调整，服务器仅提供一个数据传输的功能，每个终端可对自己接收到的语音信号进行音量大小的调整，使得服务器将调整后的语音信号发送给接收端，以供接收端以统一音量输出语音信号。

其中，语音数据的发送端可为第一终端，语音数据的接收端可为第二终端，发送端中可具有多个麦克风mic，每个麦克风用来实时采集输入至发送端的语音信号，并结合终端内的调节模块，将不同麦克风收到的语音信号进行音量调节，调整到统一大小，并发送至服务器，使得服务器将调整后的语音信号发送给接收端。

图5是本公开实施例提供的一种音量调节装置的结构示意图；该装置配置于电子设备中，可实现本申请任意实施例所述的音量调节方法。该装置具体包括如下：

接收模块510，用于接收第一终端发送的初始语音数据；

调整模块520，用于基于预设的第一音量值，调整所述初始语音数据的音量值，得到目标语音数据；

发送模块530，用于将所述目标语音数据发送给第二终端，用于所述第二终端播放所述目标语音数据。

在本实施例中，可选的，本实施例装置还包括：获取模块；

获取模块，用于获取所述初始语音数据的音量值。

调整模块520，包括：调整单元和确定单元；

确定单元，用于基于调整结果，得到目标语音数据。

在本实施例中，可选的，调整单元，具体用于：

在本实施例中，可选的，本实施例装置还包括：重置模块；

在本实施例中，可选的，所述播放设备的所属类型为近距离播放时；

重置模块，具体用于：

将所述目标语音数据的音量值调至预设的第二音量值。

在本实施例中，可选的，还包括：确定模块；

在本实施例中，可选的，重置模块，具体用于：

确定所述第二终端对应的音量值播放范围内的平均音量值；

基于所述平均音量值，重置所述目标语音数据的音量值。

在本实施例中，可选的，本实施例装置还包括：检测模块；

通过本发明实施例的音量调节装置，通过在会议过程中，接收第一终端发送的初始语音数据，并基于预设的第一音量值，调整该初始语音数据的音量值，得到与初始语音数据音量值不相同的目标语音数据，以将目标语音数据发送给第二终端，使得第二终端播放目标语音数据，从而，能够使得接收目标语音数据的参与者听到的语音数据的音量都近似或相同，避免在参与过程中听到参差不齐的声音降低参与体验度的问题，有效平衡每个参与者的声音音量。

本发明实施例所提供的音量调节装置可执行本发明任意实施例所提供的音量调节方法，具备执行方法相应的功能模块和有益效果。

本公开实施例还提供了一种车辆，该车辆可包括：采集模块、调整模块和发送模块，其中：

采集模块，可用于采集初始语音数据；

调整模块，可用于根据预设的第一音量值，调整初始语音数据的音量值，得到目标语音数据；

发送模块，可用于将目标语音数据发送给服务器或其他终端。

其中，车辆可将目标语音数据发送给服务器，使服务器将目标语音数据发送给其他终端，或者，车辆可直接将目标语音数据发送至其他终端。

需要说明的是，其他终端可包括车辆、终端设备(如手机、平板电脑、智能手表)等。

其中，车辆中包括的发送模块可将目标语音数据发送给服务器，用于指示服务器将目标语音数据发送给服务器或其他终端进行语音数据的播放，从而，便于其他车辆在播放语音数据时，能够在一个车辆中始终采用一个音量值进行播放，稳定接听者的听觉适应。

其中，采集模块可包括多个采集单元，多个采集单元可采用分布式方式基于车辆的落座位置均分分布在车舱内，每个采集单元可采集其所在预设范围内的语音数据。

举例而言，采集单元可为麦克风，车舱内具有三个落座位置，如位置1、位置2和位置3，位置1可对应麦克风A，位置2可对应麦克风B，位置3可对应麦克风C，当位置1上的用户产生语音数据时，此时，三个麦克风均能采集到语音数据，车辆可根据用户位置、声源距离、声音音量或声音清晰度判断，选择将麦克风A采集的语音数据作为初始语音数据，从而，有效保证采集到的初始语音数据的准确性，同时，还可以对麦克风A所采集的语音数据进行降噪处理，从而保证初始语音数据的清晰度。

图6是本公开实施例提供的一种电子设备的结构示意图。如图6所示，该电子设备包括处理器610、存储器620、输入装置630和输出装置640；电子设备中处理器610的数量可以是一个或多个，图6中以一个处理器610为例；电子设备中的处理器610、存储器620、输入装置630和输出装置640可以通过总线或其他方式连接，图6中以通过总线连接为例。

存储器620作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中的音量调节方法对应的程序指令/模块。处理器610通过运行存储在存储器620中的软件程序、指令以及模块，从而执行电子设备的各种功能应用以及数据处理，即实现本发明实施例所提供的音量调节方法。

存储器620可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器620可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器620可进一步包括相对于处理器610远程设置的存储器，这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置630可用于接收输入的数字或字符信息，以及产生与电子设备的用户设置以及功能控制有关的键信号输入，可以包括键盘、鼠标等。输出装置640可包括显示屏等显示设备。

本公开实施例还提供了一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于实现本发明实施例所提供的音量调节方法。

当然，本发明实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的方法操作，还可以执行本发明任意实施例所提供的音量调节方法中的相关操作。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

值得注意的是，上述搜索装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本公开的具体实施方式，使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下，在其它实施例中实现。因此，本公开将不会被限制于本文所述的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种音量调节方法，其特征在于，包括：

接收第一终端发送的初始语音数据；

2.根据权利要求1所述的方法，其特征在于，所述基于预设的第一音量值，调整所述初始语音数据的音量值，得到目标语音数据之前，还包括：

获取所述初始语音数据的音量值；

基于调整结果，得到目标语音数据。

3.根据权利要求2所述的方法，其特征在于，所述将所述初始语音数据的音量值调整为所述预设的第一音量值，包括：

4.根据权利要求1所述的方法，其特征在于，所述将所述目标语音数据发送给第二终端之前，还包括：

获取第二终端采用的播放设备的所属类型；

5.根据权利要求4所述的方法，其特征在于，所述播放设备的所属类型为近距离播放时；所述根据所述播放设备的所属类型，重置所述目标语音数据的音量值，包括：

将所述目标语音数据的音量值调至预设的第二音量值。

6.根据权利要求1所述的方法，其特征在于，所述将所述目标语音数据发送给第二终端之前，还包括：

7.根据权利要求6所述的方法，其特征在于，所述基于所述第二终端对应的音量值播放范围重置所述目标语音数据的音量值，包括：

确定所述第二终端对应的音量值播放范围内的平均音量值；

基于所述平均音量值，重置所述目标语音数据的音量值。

8.根据权利要求7所述的方法，其特征在于，所述基于所述平均音量值，重置所述目标语音数据的音量值之前，还包括：

确定接收到所述目标语音数据的音量值的重置确认指示。

9.一种音量调节装置，其特征在于，包括：

接收模块，用于接收第一终端发送的初始语音数据；

10.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1～8中任一所述的音量调节方法。

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1～8中任一所述的音量调节方法。

12.一种车辆，其特征在于，包括：采集模块、调整模块和发送模块；

所述采集模块，用于采集初始语音数据；

所述调整模块，用于根据预设的第一音量值，调整所述初始语音数据的音量值，得到目标语音数据；

所述发送模块，用于将所述目标语音数据发送给服务器或其他终端。

13.根据权利要求12所述的车辆，其特征在于，所述采集模块包括多个采集单元，所述多个采集单元采用分布式方式分布在车舱内；

所述采集单元，用于采集预设范围内的语音数据。