CN112272170A

CN112272170A - 语音通信方法及装置、电子设备、存储介质

Info

Publication number: CN112272170A
Application number: CN202011119861.3A
Authority: CN
Inventors: 刘伟; 王毅
Original assignee: Guangzhou Boguan Information Technology Co Ltd
Current assignee: Guangzhou Boguan Information Technology Co Ltd
Priority date: 2020-10-19
Filing date: 2020-10-19
Publication date: 2021-01-26
Anticipated expiration: 2040-10-19
Also published as: CN112272170B

Abstract

本公开提供了一种语音通信方法、语音通信装置、电子设备以及计算机可读存储介质，涉及通信技术领域。该语音通信方法包括：接收第一用户终端发送的音频数据；获取与所述第一用户终端匹配的标识数据，并根据所述标识数据确定与所述第一用户终端关联的第二用户终端；确定所述音频数据对应的配置参数；通过所述配置参数对所述音频数据进行配置，并基于所述标识数据将配置后的音频数据广播到所述第二用户终端。本公开实施例的技术方案可以对广播到第二用户终端的音频数据的参数进行统一管理，提高语音通信效率。

Description

语音通信方法及装置、电子设备、存储介质

技术领域

本公开涉及通信技术领域，具体而言，涉及一种语音通信方法、语音通信装置、电子设备以及计算机可读存储介质。

背景技术

随着互联网技术的发展，电子竞技(Electronic Sports)越来越受到人们的欢迎，而电子竞技中比赛队伍的即时语音通信也在电竞比赛中占据越来越重要的地位。

目前，相关的比赛语音通信方案中，要么可以将某队员的麦克风声音和电脑声音通过现实中的调音台调控后发送给队伍中其他人的电脑或耳机；要么可以将队员的麦克风声音和电脑声音载入物理声卡并进行相关数据转换，最终将转换后的音频信号发送到队伍中其他人的物理声卡。但这两种方式由于均采用具有较高处理能力的调音台或者物理声卡，导致设备购买成本和设备维护成本较高，且由于调音台或者物理声卡的调试时间较长，导致电竞比赛中语音通信效率较低。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开实施例的目的在于提供一种语音通信方法、语音通信装置、电子设备以及计算机可读存储介质，进而至少在一定程度上克服相关技术方案中设备购买成本及设备维护成本较高，以及因设备调试时间较长导致电竞比赛中的语音通信效率较低的问题。

本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

根据本公开实施例的第一方面，提供了一种语音通信方法，应用于云端服务器，包括：

接收第一用户终端发送的音频数据；

获取与所述第一用户终端匹配的标识数据，并根据所述标识数据确定与所述第一用户终端关联的第二用户终端；

确定所述音频数据对应的配置参数；

通过所述配置参数对所述音频数据进行配置，并基于所述标识数据将配置后的音频数据广播到所述第二用户终端。

在本公开的一些示例实施例中，基于前述方案，在确定所述音频数据对应的配置参数之前，所述方法还包括：

获取所述音频数据对应的标准化数据；

基于所述标准化数据将接收的所述音频数据进行标准化处理，得到标准化后的音频数据。

在本公开的一些示例实施例中，基于前述方案，确定所述音频数据对应的配置参数，包括：

响应于通过控制端发送的对所述音频数据的音量调控指令，确定所述音频数据对应的多个播放音量数据；其中，所述音量调控指令对应不同的所述标识数据。

在本公开的一些示例实施例中，基于前述方案，在响应于通过控制端发送的对所述音频数据的音量调控指令之前，所述方法还包括：

获取所述标识数据对应的音量调控数据；

基于所述控制端生成所述音量调控数据对应的音量调控指令。

在本公开的一些示例实施例中，基于前述方案，所述通过所述配置参数对所述音频数据进行配置，并基于所述标识数据将配置后的音频数据广播到所述第二用户终端，包括：

通过所述播放音量数据配置所述音频数据在所述标识数据对应的第二用户终端的播放音量；

基于所述标识数据以及所述播放音量将配置后的音频数据广播到所述第二用户终端以在所述第二用户终端播放所述播放音量对应的音频数据。

响应于通过控制端发送的对所述音频数据的录制指令，确定所述音频数据对应的录制参数；

在确定所述音频数据对应的录制参数之后，所述方法还包括：

基于所述录制参数对所述音频数据进行录制，并将录制得到的所述音频数据进行存储。

获取与所述音频数据对应的视频数据，根据所述音频数据以及所述视频数据生成直播数据流；

响应于通过控制端发送的对所述直播数据流的直播指令，确定所述直播数据流对应的直播参数；

在确定所述直播数据流对应的直播参数之后，所述方法还包括：

基于所述直播参数将所述直播数据流发送到第三方直播端进行直播。

根据本公开实施例的第二方面，提供了一种语音通信装置，包括：

音频数据接收模块，用于接收第一用户终端发送的音频数据；

标识数据确定模块，用于获取与所述第一用户终端匹配的标识数据，并根据所述标识数据确定与所述第一用户终端关联的第二用户终端；

配置参数确定模块，用于确定所述音频数据对应的配置参数；

音频数据广播模块，用于通过所述配置参数对所述音频数据进行配置，并基于所述标识数据将配置后的音频数据广播到所述第二用户终端。

在本公开的一种示例性实施例中，基于前述方案，所述语音通信装置还包括音频标准化单元，所述音频标准化单元被配置为：

获取所述音频数据对应的标准化数据；

在本公开的一种示例性实施例中，基于前述方案，所述配置参数确定模块还包括播放音量确定单元，所述播放音量确定被配置为：

在本公开的一种示例性实施例中，基于前述方案，所述语音通信装置还包括音量调控单元，所述音量调控单元被配置为：

获取所述标识数据对应的音量调控数据；

在本公开的一种示例性实施例中，基于前述方案，所述音频数据广播模块还被配置为：

在本公开的一种示例性实施例中，所述配置参数确定模块还包括音频数据录制单元，音频数据录制单元被配置为：

在本公开的一种示例性实施例中，所述配置参数确定模块还包括直播参数确定单元，所述直播参数确定单元被配置为：

在确定所述直播数据流对应的直播参数之后，所述语音通信装置还包括直播单元，所述直播单元被配置为：

本公开实施例提供的技术方案可以包括以下有益效果：

本公开的示例实施例中的语音通信方法，通过云端服务器接收第一用户终端发送的音频数据，根据与第一用户终端匹配的标识数据确定与第一用户终端关联的第二用户终端，并确定音频数据对应的配置参数，基于标识数据以及配置参数将音频数据广播到第二用户终端。一方面，通过云端服务器实现处于同一标识数据中的第一用户终端与第二用户终端的语音通信，不需要额外购买实现第一用户终端与第二用户终端语音通信交互的物理设备，降低实现队伍内语音通信的成本，同时也不需要额外的维护费用；另一方面，通过云端服务器实现处于同一标识数据(队伍标识数据)中的第一用户终端与第二用户终端的语音通信，不需要将音频信号经过调音台或者硬件声卡进行调控，提高了队伍内语音通信的适用范围，降低了基于调音台或者硬件声卡实现队伍内语音通信的局限性；再一方面，云端服务器基于控制端发送的音频数据调控指令，对广播到第二用户终端的音频数据进行统一配置，提高广播到第二用户终端的音频数据的音频质量，提升第二用户终端的用户的使用体验，同时提高了音频数据的配置效率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示出了可以应用本公开实施例的一种语音通信方法示例性系统架构示意图；

图2示意性示出了根据本公开的实施例的语音通信方法的流程示意图；

图3示意性示出了根据本公开的实施例的音频数据标准化的流程示意图；

图4示意性示出了根据本公开的实施例的对音频数据进行音量调控的流程示意图；

图5示意性示出了根据本公开的实施例的队伍内语音通信的应用场景示意图；

图6示意性示出了根据本公开的实施例的队伍内语音通信的流程示意图；

图7示意性示出了根据本公开的实施例的语音通信装置的结构示意图；

图8示意性示出了根据本公开的实施例的电子设备的计算机系统的结构示意图；

图9示意性示出了根据本公开的实施例的计算机可读存储介质的示意图。

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本公开的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。

此外，附图仅为示意性图解，并非一定是按比例绘制。附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

图1示出了可以应用本公开实施例的一种语音通信方法示例性系统架构示意图。

如图1所示，系统架构100可以包括终端设备101、102、103、104、105、106中的一个或多个，网络107和服务器108。网络107用以在终端设备101、102、103、104、105、106和服务器108之间提供通信链路的介质。网络107可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103、104、105、106可以是具有语音通信功能的各种电子设备，包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。比如服务器108可以是多个服务器组成的服务器集群等。

本公开实施例所提供的语音通信方法一般由服务器108执行，相应地，语音通信装置一般设置于服务器108中。但本领域技术人员容易理解的是，本公开实施例所提供的语音通信方法也可以由终端设备101、102、103、104、105、106执行，相应的，语音通信装置也可以设置于终端设备101、102、103、104、105、106中，本示例性实施例中对此不做特殊限定。举例而言，在一种示例性实施例中，可以是用户通过终端设备101、102、103、104、105、106将音频数据上传至具有音频矩阵功能的云端服务器108，服务器通过本公开实施例所提供的语音通信方法，将调控后的音频数据传输给终端设备101、102、103、104、105、106等。

下面对本公开实施例的技术方案进行详细阐述：

在本示例实施例中，首先提供了一种语音通信方法，该语音通信方法可以应用于具有音频矩阵功能的云端服务器，也可以应用于具有音频矩阵功能的终端设备，本示例实施例对此不作特殊限定，下面以云端服务器执行该方法为例进行详细说明。图2示意性示出了根据本公开的一些实施例的语音通信方法流程的示意图。参考图2所示，该语音通信方法可以包括以下步骤：

步骤S210，接收第一用户终端发送的音频数据；

步骤S220，获取与所述第一用户终端匹配的标识数据，并根据所述标识数据确定与所述第一用户终端关联的第二用户终端；

步骤S230，确定所述音频数据对应的配置参数；

步骤S240，基于所述标识数据以及所述配置参数将所述音频数据广播到所述第二用户终端。

根据本示例实施例中的语音通信方法，一方面，通过云端服务器实现处于统一标识集合中的第一用户终端与第二用户终端的语音通信，不需要额外购买实现第一用户终端与第二用户终端语音通信交互的物理设备，降低实现队伍内语音通信的成本，同时也不需要额外的维护费用；另一方面，通过云端服务器实现处于统一标识数据中的第一用户终端与第二用户终端的语音通信，不需要将音频信号经过调音台或者硬件声卡进行调控，提高了队伍内语音通信的适用范围，降低了基于调音台或者硬件声卡实现队伍内语音通信的局限性；再一方面，云端服务器基于控制端发送的音频数据调控指令，对广播到第二用户终端的音频数据进行统一配置，提高广播到第二用户终端的音频数据的音频质量，提升第二用户终端的用户的使用体验，同时提高了音频数据的配置效率。

下面，将对本示例实施例中的语音通信方法进行进一步的说明。

在步骤S210中，接收第一用户终端发送的音频数据。

在本公开的一个示例实施例中，第一用户终端可以是用于采集并发送多媒体数据的终端，例如，第一用户终端可以是参加电竞比赛的队伍A中发送音频数据的电脑，也可以是参加电竞比赛的队伍A中发送音频数据的手机，当然，还可以是其他能够采集并发送多媒体数据的终端，本示例实施例对此不作特殊限定。

可以通过第一用户终端中的语音采集单元(如内置麦克风)或者与第一用户终端连接的语音采集单元(如可以外置麦克风，可以具有麦克风功能的耳机，本示例不以此为限)采集音频数据，并通过与第一用户终端关联的网络传输模块向云端服务器发送采集的音频数据，进而使云端服务器对接收的音频数据进行配置调控。

步骤S220，获取与所述第一用户终端匹配的标识数据，并根据所述标识数据确定与所述第一用户终端关联的第二用户终端。

在本公开的一个示例实施例中，标识集合可以是指属于同一队伍的选手对应终端的唯一标识的集合，例如，标识数据可以是参加电竞比赛的队伍A中，选手1、选手2、选手3、选手4、选手5对应的终端a、b、c、d、e的MAC(Media Access Control Address，媒体存取控制位址)地址或者IMEI(International Mobile Equipment Identity，国际移动设备识别码)序列号构成的集合{001，002，003，004，005}，也可以是参加电竞比赛的队伍A中，选手1、选手2、选手3、选手4、选手5在对应的终端a、b、c、d、e上登录的选手标识(如唯一比赛账号)构成的集合{0001，0002，0003，0004，0005}，当然，还可以是其他能够唯一标识队伍中每个选手使用的终端的数据，本示例实施例对此不作特殊限定。

第二用户终端可以是用于接收多媒体数据的终端，例如，第二用户终端可以是参加电竞比赛的队伍A中接收音频数据的电脑，也可以是参加电竞比赛的队伍A中接收音频数据的手机，当然，还可以是其他能够采集并接收多媒体数据的终端，本示例实施例对此不作特殊限定。

第二用户终端对应的标识数据可以是用于在标识数据中确定与第一用户终端匹配的终端的唯一标识，例如，第二用户终端对应的标识数据可以是接收电竞比赛的队伍A中发出音频数据的选手的电脑MAC号，也可以是接收电竞比赛的队伍A中发出音频数据的选手的手机IMEI序列号，当然，还可以是其他能够接收多媒体数据的终端的唯一标识，本示例实施例对此不作特殊限定。

可以通过控制端发送音频数据的第一用户终端的标识(可以是MAC地址，也可以是IMEI序列号，还可以是唯一比赛账号)，在预先设置的数据库中查询并匹配与第一用户终端的标识匹配的队伍的标识数据。云端服务器根据第一用户终端的标识数据匹配与第一用户终端关联的第二用户终端，并确定第二用户终端对应的标识数据。

举例而言，在电竞比赛中假设队伍A中有五个选手1、选手2、选手3、选手4、选手5，选手1、选手2、选手3、选手4、选手5对应的终端a、b、c、d、e的MAC地址或者IMEI序列号构成的集合{001，002，003，004，005}现在选手1通过电脑或手机发送音频数据，队伍A中第一用户终端的标识集合可以是{001，002，003，004，005}，则与第一用户终端关联的第二用户终端的标识数据可以是{002，003，004，005}。当然，队伍中终端的标识数据，还可以是其他能够唯一标识队伍中每个选手使用的终端的数据，本示例实施例对此不作特殊限定。

步骤S230，确定所述音频数据对应的配置参数。

在本公开的一个示例实施例中，配置参数可以是对音频数据的进行配置后生成的参数，例如，配置参数可以是音频数据的音量的级别数，也可以是音频数据的音量大小，还可以是音频数据的更改音量参数(如正参数表示音量加大的参数、负参数表示音量就减小的参数)；同时，配置参数还可以是位速(一个数据流中每秒钟能通过的信息量)，还可以是采样率(录音设备在一秒钟内对声音信号的采样次数，采样频率越高声音的还原就越真实越自然)，还可以是采样位数(采样位数可以理解为采集卡处理声音的解析度)，此外，配置参数可以是视频码率(数据传输时单位时间传送的数据位数，一般单位是kbps即千位每秒)，还可以是视频的音频比特率(数字信道传送数字信号的速率称为数据传输速率或比特率)，当然，配置参数还可以是其他参数，本示例实施例对此不作特殊限定。

具体的，控制对象(如管理人员或者比赛裁判)可以通过与云端服务器网络连接的网络域名(网页WEB控制系统)设置配置指令或者添加删除选手对应的音频信号源，也可以通过与云端服务器网络连接的终端上提供的应用程序设置配置指令或者添加删除选手对应的音频信号源，其中，配置指令可以是音量调控指令，也可以是音频数据的录制指令，还可以是音频数据的直播指令，当然，还可以是其他能够对广播到第二用户终端的音频数据的参数进行配置的配置指令，本示例实施例对此不作特殊限定。

在本公开的一个示例实施例中，一般可以由终端设备将音频数据通过网络发送至云端服务器，云端服务器根据控制端发送的音频数据配置指令对音频数据进行调控，可以将调控后的音频数据在第二用户终端进行广播，也可以将音频数据在第三方进行录制，还可以根据音频数据的视频数据生成直播数据流，将直播数据流在第三方进行直播，其中，音频数据的视频数据可以指音频数据对应的游戏画面，本示例性实施例中对此不做特殊限定。

在本公开的一个示例实施例中，在确定所述音频数据对应的配置参数之前，可以通过图3中的步骤实现对已采集的音频数据的标准化处理：

步骤S310，获取音频数据对应的标准化数据；

步骤S320，基于标准化数据将接收的所述音频数据进行标准化处理，得到标准化后的音频数据。

其中，标准化数据可以是指预先设置的、将第一用户终端发送的音频数据统一为相同音量标准的参考数据，例如，标准化数据可以是58分贝，具体标准化处理可以是根据标准化数据将第一用户终端发送的多个音频数据的音量统一为58分贝，也可以是数值58，具体标准化处理可以是根据标准化数据将第一用户终端发送的多个音频数据的音量统一为与数值58对应音量大小，当然，标准化数据还可以其他能够将第一用户终端发送的音频数据统一为相同音量标准的参考数据，具体可以根据实际情况进行自定义设置，本示例实施例不以此为限。

举例而言，在电竞比赛中假设队伍A中有五个选手1、选手2、选手3、选手4、选手5，现在选手1和选手2通过电脑或者手机的语音设备发送音频数据，云端音频矩阵接收到选手1和选手2发送的音频数据后，根据音频数据的标准化音量数据如58分贝，将所有音频数据通过标准化处理后，使所有音频数据的音量均为58分贝。管理员通过将选手1和选手2的音频数据的音量统一标准化处理为58分贝，避免了对不同音频数据音量的多次调试，提高了音频数据的传输效率。

在本公开的一个示例实施例中，配置指令可以包括音量调控指令，可以响应于通过控制端发送的对所述音频数据的音量调控指令，确定所述音频数据对应的多个播放音量数据。

其中，音量调控指令可以是控制端发送到云端服务器，以使云端服务器根据音量调控指令对广播到第二用户终端的音频数据的参数进行音量调控的指令。例如，音量调控指令可以是音频数据的音量级别的调控指令，也可以是音频数据的音量大小的调控指令，还可以是当然，还可以是其他能够对发送到第二用户终端的音频数据的参数进行音量调控的指令，本示例实施例对此不作特殊限定。

音量调控参数可以是根据音量调控指令对音频数据的进行音量调控后生成的参数，例如，在音量调控指令是音量调控指令时，音量调控参数可以是音量级别参数，也可以是音频数据的音量大小参数，还可以是音频数据的更改音量参数，本示例实施例对此不作特殊限定。

在本公开的一些示例实施例中，配置指令还可以包括录制指令，可以响应于通过控制端发送的对所述音频数据的录制指令，确定所述音频数据对应的录制参数。

其中，录制指令可以指控制端发送到云端服务器、以使云端服务器根据录制指令对发送到第二用户终端的音频数据的参数进行录制的指令。录制参数可以是指根据录制指令对音频数据的进行录制时的参数，例如，录制参数可以是音频数据的音频录制格式(如MP3、WAV等音频格式)，也可以是音频数据的位速(即一个数据流中每秒钟能通过的信息量)，还可以是音频数据的采样频率(即录音设备在一秒钟内对声音信号的采样次数)，当然，录制参数还可以是其他对音频数据的进行录制时设置的参数，例如，还可以是采样位数(采样位数可以理解为采集卡处理声音的解析度)，本示例实施例不以此为限。

举例而言，工作人员通过控制端的交互界面设置音频数据对应的录制指令，如，设置待录制的音频数据的音频录制格式为MP3格式，设置待录制的音频数据的采样频率为24000Hz等录制指令，并将录制指令发送到云端服务器。云端服务器基于控制端的录制指令生成录制参数，即录制参数为录制MP3格式、采样频率为24000Hz的音频数据。当然，此处仅是示意性举例说明，并不应对本示例实施例做任何特殊限定。

具体的，在确定音频数据对应的录制参数之后，还可以基于录制参数对音频数据进行录制，并将录制得到的音频数据进行存储。

举例而言，假设录制参数为录制MP3格式、采样频率为24000Hz的音频数据，则根据生成的录制参数对第一用户终端发送的音频数据(如音频格式为WAV格式，采样频率为48000Hz)进行调整，即将音频数据从WAV格式转换为MP3格式，并将音频数据的采样频率从48000Hz降低至24000Hz。然后得到与录制指令对应的音频数据，并将转换后的音频数据进行存储，以便于后续使用该音频数据。当然，此处仅是示意性举例说明，并不应对本示例实施例造成任何特殊限定。

在本公开的一些示例实施例中，配置指令还可以包括直播指令，可以通过以下步骤确定直播参数：

响应于通过控制端发送的对所述直播数据流的直播指令，确定所述直播数据流对应的直播参数。

其中，视频数据可以指包含连续的图像序列的数据，例如，视频数据可以是音量数据调节之前的游戏画面的数据，也可以指音量数据调节之后的游戏画面的数据，当然，视频数据还可以指其他连续的图像序列的数据，本例实施例对此不作特殊限定。

直播数据流可以指将同一时间戳的音频数据和图像数据进行合成处理后的音视频数据流，例如，直播数据流可以是包含队伍内语音通信和游戏画面的音视频数据，也可以是将音频数据的音量大小进行标准化处理后的音视频数据，当然，直播数据流还可以指包含游戏画面的音视频数据，本例实施例对此不作特殊限定。

直播指令可以指将调整后的音频数据以及音频数据对应的视频数据进行融合得到直播数据流，并调整直播数据流对应的参数，例如直播画面的画布大小、清晰度、帧数等，直播音频的码率、清晰度、立体声道等的指令，当然，直播指令还可以指调节其他配置参数的指令，本例实施例对此不作特殊限定。

具体的，控制端将直播指令发送到云端服务器、以使云端服务器根据直播指令对发送到第三方直播端(第三方直播平台)的直播数据流在第三方直播平台进行直播。直播参数可以是指根据直播指令在对发送到第三方直播端的直播数据流进行直播时设置的参数，例如，直播参数可以是音频数据的录像格式(如MKV、AVI等录像格式)，也可以是直播数据流的视频分辨率(如1920*1080、1280*720)，还可以是视频数据的串流类型(如ASF、FLV格式)，当然，直播参数还可以是其他对直播数据流的进行直播时设置的参数，本示例实施例不以此为限。

举例而言，工作人员通过控制端的交互界面设置发送到第三方直播平台的直播数据流对应的直播指令，如，设置待直播的直播数据流的录像格式为MKV格式，设置待直播的直播数据流的视频分辨率为1920*1080，设置待直播的直播数据流的串流类型为ASF格式等直播指令，并将直播指令发送到云端服务器。云端服务器基于控制端的直播指令生成直播数据流的直播参数，即直播参数为直播数据流的录像格式为MKV格式，视频分辨率为1920*1080、串流类型为ASF格式。当然，此处仅是示意性举例说明，并不应对本示例实施例造成任何特殊限定。

进一步的在确定所述直播数据流对应的直播参数之后，还可以基于直播参数将直播数据流发送到第三方直播端进行直播。

举例而言，假设直播参数为录像格式为AVI、视频分辨率为1920*1080、串流类型为ASF格式，则根据生成的直播参数对第一用户终端发送的音频数据和视频数据生成的直播数据流(如录像格式为MKV格式，视频分辨率为1920*1080，串流类型为FLV格式)进行调整，即将直播数据流从MKV格式转换为AVI格式，串流类型从FLV格式转换为ASF格式，并将直播数据流的视频分辨率从1920*1080降低至1280*720。然后，基于控制端发送的直播指令，云端服务器将格式转换后的直播数据流，发送到第三方直播平台，在第三方直播平台进行直播。当然，此处仅是示意性举例说明，并不应对本示例实施例造成任何特殊限定。

在本公开的一些示例实施例中，可以基于时间轴或者关键点的时间戳数据将音频数据以及该音频数据对应的视频数据进行对齐，并根据对齐后的音频数据以及视频数据生成直播数据流，其中，直播数据流可以包含队伍内的音频数据以及游戏画面的音视频数据。

具体的，可以通过录制参数将音频数据进行配置，并将配置后的音频数据进行保存；然后基于直播参数对与音频数据对应的视频数据进行配置，并将配置后的视频数据进行保存。进而，可以获取音频数据以及视频数据对应的时间轴，并基于时间轴将保存的音频数据和视频数据进行对齐，并根据对齐后的音频数据以及视频数据生成直播数据流。然后，在第三方直播端上传生成直播数据流，并将音频数据以及视频数据分别添加到声音轨和视频轨中，通过触发直播以在第三方直播端实现直播数据流的播放。

在本公开的一些示例实施例中，在响应于通过控制端发送的对所述音频数据的音量调控指令之前，可以通过图4中的步骤确定音量调控指令：

步骤S410，获取所述标识数据对应的音量调控数据；

步骤S420，基于所述控制端生成所述音量调控数据对应的音量调控指令。

其中，标识数据对应的音量调控数据可以是指不同的标识数据对应的用户(选手)对应的所需播放音量的参考数据，例如，音量调控数据可以是在比赛前对应不同的标识数据对应的用户(选手)采集的耳朵辨识能力(如耳朵辨识能力为轻度耳聋，则相应的音量调控指令为55分贝以上，如耳朵辨识能力为中度耳聋，则相应的音量调控指令为70分贝以上，当然，此处仅是示意性举例说明，本示例实施例不以此为限)，也可以是不同的标识数据对应的用户(选手)在比赛前向相关管理人员上报的语音播放设备的语音播放质量(如语音播放设备的语音播放质量较差，则相应的音量调控指令为60分贝以上，如语音播放设备的语音播放质量较优，则相应的音量调控指令为60分贝以下20分贝以上，当然，此处仅是示意性举例说明，本示例实施例不以此为限)，当然标识数据对应的音量调控数据还可以指其他用户(选手)上报的所需播放音量的参考数据，本示例实施例不以此为限。

举例而言，在电竞比赛中假设队伍A中有五个选手1、选手2、选手3、选手4、选手5，对选手1、选手2、选手3、选手4、选手5的耳朵辨识能力进行采样，采样后的选手1、选手2、选手3、选手4、选手5的音量调控数据分别为53分贝、58分贝、64分贝、61分贝、80分贝，基于1、选手2、选手3、选手4、选手5的音量调控数据，控制端分别生成选手1的音频数据的音量数据为53分贝的音量调控指令，选手2的音频数据的音量数据为58分贝的音量调控指令、选手3的音频数据的音量数据为64分贝的音量调控指令、选手4的音频数据的音量数据为61分贝的音量调控指令、选手5的的音频数据的音量数据为80分贝的音量调控指令。当然，此处仅是示意性举例说明，并不应对本示例实施例造成任何特殊限定。

在本公开的一些示例实施例中，可以通过以下步骤在第二用户终端播放音频数据：

其中，播放音量可以是在第二用户终端播放的音频数据对应的音量，例如，在电竞比赛中假设队伍A中有五个选手1、选手2、选手3、选手4、选手5，对选手1、选手2、选手3、选手4、选手5的耳朵辨识能力进行采样，采样后的选手1、选手2、选手3、选手4、选手5的音量调控数据分别为53分贝、58分贝、64分贝、61分贝、80分贝，则当选手1发送音频数据到第二用户终端时，选手2、选手3、选手4、选手5的音频数据的播放音量分别为53分贝、58分贝、64分贝、61分贝、80分贝，云端服务器根据选手2、选手3、选手4、选手5的音频数据的播放音量将音频数据在第二用户终端进行播放。

在本公开的一个示例实施例中，首先，云端音频矩阵接收第一用户终端发送的音频数据，并根据第一用户终端匹配的标识集合确定与第一用户终端关联的第二用户终端以及第二用户终端对应的标识数据。其次，云端音频矩阵通过获取音频数据对应的标准化数据，对接收的音频数据进行标准化处理，得到标准化后的音频数据。接着，控制端将音频数据的配置指令发送到云端音频矩阵，云端音频矩阵根据音频数据对应的配置参数，确定音频数据对应的多个播放音量数据；最后，云端音频矩阵可以根据标识数据以及配置参数将所述音频数据广播到所述第二用户终端，也可以根据控制端发送的对音频数据的录制指令，确定音频数据对应的录制参数后，对音频数据进行录制并将录制得到的音频数据进行存储，还可以通过获取与音频数据对应的视频数据，根据音频数据以及视频数据生成直播数据流，确定直播数据流对应的直播参数后，将直播数据流发送到第三方直播端进行直播。

图5示意性示出了根据本公开的实施例的队伍内语音通信的应用场景示意图；如图5所示，队伍中有五个选手，选手1、选手2、选手3、选手4、选手5，且选手1、选手2、选手3、选手4、选手5对应的终端a、b、c、d、e的MAC地址或者IMEI序列号构成标识集合{001，002，003，004，005}。控制端可以预先将所有选手对应的音频信号源添加到云端音频矩阵，当选手1和选手2对应的第一用户终端通过语音采集单元如麦克风采集选手1和选手2发出的音频数据，并通过网络传输模块向具有音频矩阵功能的云端服务器发送音频数据。根据选手1和选手2的第一用户终端的标识获取与第一用户终端的标识匹配的标识集合{001，002，003，004，005}，并查询与选手1和选手2的第一用户终端匹配的第二用户终端的标识数据，即与选手1和选手2的第一用户终端匹配的第二用户终端的标识数据为{003，004，005}。其次，控制端通过输入标准化数据，使云端服务器根据标准化数据将选手1的终端和选手2终端发送的音频数据的音量统一标准化处理为58分贝。优选的，可以预先采集选手1、选手2、选手3、选手4、选手5的耳朵辨识能力，控制端根据采集的耳朵辨识能力向云端服务器发送音量调控指令，进而云端服务器根据音量调控指令生成播放音量数据，以使选手1、选手2、选手3、选手4或者选手5在接收到其他选手发送的音频数据后播放的音量分别为53分贝、58分贝、64分贝、61分贝、80分贝。进而，当云端服务器获取到音频数据的音量调控指令时，根据选手的音频数据的播放音量数据对音频数据进行配置后进行广播，即将选手1的58分贝的音频数据调至播放音量分别为58分贝、64分贝、61分贝、80分贝后，根据匹配到的标识数据将调整完播放音量的音频数据发送到选手2、选手3、选手4、选手5的终端。同理，将选手2的58分贝的音频数据调至播放音量分别为53分贝、64分贝、61分贝、80分贝后，根据匹配到的标识数据将调整完播放音量的音频数据发送到选手1、选手3、选手4、选手5的终端。可选的，控制端设置录制指令，当云端服务器获取到音频数据的录制指令后，根据录制指令生成音频数据的录制参数，并根据该录制参数将音频数据进行录制并存储。可选的，控制端设置直播指令，当云端服务器获取到音频数据的直播指令后，将音频数据对应的直播数据流在第三方直播端进行直播。

图6示意性示出了根据本公开的实施例的队伍内语音通信的流程示意图。

参考图6所示，步骤S601，获取第一用户终端发送的音频数据；

步骤S602，根据与第一用户终端匹配的标识集合，确定第二用户终端的标识数据；

步骤S603，获取音频数据的标准化数据，对音频数据标准化处理；

步骤S604，获取标识数据对应的音量调控数据，确定标准化处理后的音频数据对应的多个播放音量数据；

步骤S605，根据音频数据的配置指令(音频数据的音量调控指令、录制指令和直播指令)，确定音频数据的配置参数；

步骤S606，判断是否对音频数据进行广播，在判定音频数据需要广播时执行步骤S607，否则执行步骤S609；

步骤S607，获取音频数据在第二用户终端进行播放时的播放音量；

步骤S608，将播放音量对应的音频数据发送到第二用户终端进行播放；

步骤S609，判断是否对音频数据进行录制，在判定需要对音频数据进行录制时执行步骤S610，否则执行步骤S612；

步骤S610，根据音频数据的录制指令，确定音频数据对应的录制参数；

步骤S611，根据音频数据的录制参数，录制并存储音频数据；

步骤S612，获取音频数据对应的视频数据，根据时间轴将音频数据以及与音频数据对应的视频数据进行对齐后生成直播数据流；

步骤S613，根据音频数据的直播指令，获取音频数据对应的直播参数，将根据直播参数配置后的直播流数据发送到第三方直播端进行播放。

需要说明的是，尽管在附图中以特定顺序描述了本公开中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

此外，在本示例实施例中，还提供了一种语音通信装置。参照图7所示，该语音通信装置700包括：音频数据接收模块710、标识数据确定模块720、配置参数确定模块730和音频数据广播模块740。其中：

音频数据接收模块710用于接收第一用户终端发送的音频数据；

标识数据确定模块720用于获取与所述第一用户终端匹配的标识集合，并根据所述标识集合确定与所述第一用户终端关联的第二用户终端；

配置参数确定模块730用于控制云端音频矩阵根据配置指令和由配置指令确定的配置参数对音频数据进行相应的配置操作；其中，所述配置参数与所述第二用户终端相匹配；

音频数据广播模块740用于通过所述配置参数对所述音频数据进行配置，并基于所述标识数据将配置后的音频数据广播到所述第二用户终端。

在本公开的一种示例性实施例中，基于前述方案，所述语音通信装置700还包括音频标准化单元，所述音频标准化单元被配置为：

获取所述音频数据对应的标准化数据；

在本公开的一种示例性实施例中，基于前述方案，所述配置参数确定模块730还包括播放音量确定单元，所述播放音量确定被配置为：

在本公开的一种示例性实施例中，基于前述方案，所述语音通信装置700还包括音量调控单元，所述音量调控单元被配置为：

获取所述标识数据对应的音量调控数据；

在本公开的一种示例性实施例中，基于前述方案，所述音频数据广播模块740还被配置为：

在本公开的一种示例性实施例中，所述配置参数确定模块730还包括录制参数确定单元，所述录制参数确定单元被配置为：

在确定所述音频数据对应的录制参数之后，所述语音通信装置700还包括音频数据录制单元，所述音频数据录制单元被配置为：

在本公开的一种示例性实施例中，所述配置参数确定模块730还包括直播参数确定单元，所述直播参数确定单元被配置为：

在确定所述直播数据流对应的直播参数之后，所述语音通信装置700还包括直播单元，所述直播单元被配置为：

上述中语音通信装置各模块的具体细节已经在对应的语音通信方法中进行了详细的描述，因此此处不再赘述。

此外，在本公开的示例性实施例中，还提供了一种能够实现上述语音通信方法的电子设备。

所属技术领域的技术人员能够理解，本公开的各个方面可以实现为系统、方法或程序产品。因此，本公开的各个方面可以具体实现为以下形式，即：完全的硬件实施例、完全的软件实施例(包括固件、微代码等)，或硬件和软件方面结合的实施例，这里可以统称为“电路”、“模块”或“系统”。

下面参照图8来描述根据本公开的这种实施例的电子设备800。图8所示的电子设备800仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图8所示，电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于：上述至少一个处理单元810、上述至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830、显示单元840。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元810执行，使得所述处理单元810执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。例如，所述处理单元810可以执行如图2中所示的步骤S210，接收第一用户终端发送的音频数据；步骤S220，获取与所述第一用户终端匹配的标识数据，并根据所述标识数据确定与所述第一用户终端关联的第二用户终端；步骤S230，确定所述音频数据对应的配置参数；步骤S240，通过所述配置参数对所述音频数据进行配置，并基于所述标识数据将配置后的音频数据广播到所述第二用户终端。

存储单元820可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)821和/或高速缓存存储单元822，还可以进一步包括只读存储单元(ROM)823。

存储单元820还可以包括具有一组(至少一个)程序模块825的程序/实用工具824，这样的程序模块825包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线830可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备800也可以与一个或多个外部设备870(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备800交互的设备通信，和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口850进行。并且，电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器860通过总线830与电子设备800的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备800使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施例的描述，本领域的技术人员易于理解，这里描述的示例实施例可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施例的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。

在本公开的示例性实施例中，还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中，本公开的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。

参考图9所示，描述了根据本公开的实施例的用于实现上述语音通信方法的程序产品900，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本公开的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

应当注意，尽管在上文详细描述中提及了语音通信装置的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种语音通信方法，其特征在于，应用于云端服务器，所述方法包括：

接收第一用户终端发送的音频数据；

确定所述音频数据对应的配置参数；

2.根据权利要求1所述的语音通信方法，其特征在于，在确定所述音频数据对应的配置参数之前，所述方法还包括：

获取所述音频数据对应的标准化数据；

3.根据权利要求1所述的语音通信方法，其特征在于，所述确定所述音频数据对应的配置参数，包括：

4.根据权利要求3所述的语音通信方法，其特征在于，在响应于通过控制端发送的对所述音频数据的音量调控指令之前，所述方法还包括：

获取所述标识数据对应的音量调控数据；

5.根据权利要求3所述的语音通信方法，其特征在于，所述通过所述配置参数对所述音频数据进行配置，并基于所述标识数据将配置后的音频数据广播到所述第二用户终端，包括：

6.根据权利要求1所述的语音通信方法，其特征在于，确定所述音频数据对应的配置参数，包括：

7.根据权利要求6所述的语音通信方法，其特征在于，确定所述音频数据对应的配置参数，包括：

8.一种语音通信装置，其特征在于，所述装置包括：

9.一种电子设备，包括：

处理器；以及

存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现如权利要求1至7中任一项所述的语音通信方法。

10.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的语音通信方法。