CN104952454B

CN104952454B - 一种音频数据的处理方法和语音通讯终端

Info

Publication number: CN104952454B
Application number: CN201510274427.5A
Authority: CN
Inventors: 陈静聪; 李斌; 王新亮
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2015-05-26
Filing date: 2015-05-26
Publication date: 2017-07-21
Anticipated expiration: 2035-05-26
Also published as: CN104952454A

Abstract

本发明实施例公开了一种音频数据的处理方法和语音通讯终端，用于实现采用合适的编解码设备对音频数据进行处理，提高对音频数据的处理效果。本发明实施例方法包括：分别获取建立语音通讯的双方终端各自的能力支持信息；选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的编码器，或选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的解码器；使用选择出的编码器或者解码器对音频数据进行处理，然后输出处理完成的音频数据。

Description

一种音频数据的处理方法和语音通讯终端

技术领域

本发明涉及计算机技术领域，尤其涉及一种音频数据的处理方法和语音通讯终端。

背景技术

为了兼容复杂的移动网络条件，现有的IP承载语音(VoIP，Voice over InternetProtocol)应用程序一般采取低采样率、低带宽的语音编解码传输方案。

现有的VoIP应用程序采用低采样率、低带宽进行语音数据的传输，例如采样率为8k或者16k，这样传输的语音音质比较差，无法满足用户对清晰音质的要求，并且现有的VoIP应用程序在传输语音数据对网络环境的使用不够充分，虽然能够完成语音数据的传输，但是不能达到很好的音质效果，例如网络环境为高速的无线保真(Wireless Fidelity，WiFi)或者第四代移动通信技术(the 4th Generation mobile communicationtechnology，4G)网络，如果仍延用低采样率、低带宽，则并不能更好的利用网络带宽，语音还原度很低。

发明内容

本发明实施例提供了一种音频数据的处理方法和语音通讯终端，用于实现采用合适的编解码设备对音频数据进行处理，提高对音频数据的处理效果。

为解决上述技术问题，本发明实施例提供以下技术方案：

第一方面，本发明实施例提供一种音频数据的处理方法，包括：

分别获取建立语音通讯的双方终端各自的能力支持信息；

选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的编码器，或选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的解码器；

使用选择出的编码器或者解码器对音频数据进行处理，然后输出处理完成的音频数据。

第二方面，本发明实施例还提供一种语音通讯终端，包括：

能力获取模块，用于分别获取建立语音通讯的双方终端各自的能力支持信息；

编解码匹配模块，用于选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的编码器，或选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的解码器；

音频传输模块，用于使用选择出的编码器或者解码器对音频数据进行处理，然后输出处理完成的音频数据。

从以上技术方案可以看出，本发明实施例具有以下优点：

在本发明中，首先分别获取建立语音通讯的双方终端各自的能力支持信息，然后选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的编码器，或选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的解码器，最后使用选择出的编码器或者解码器对音频数据进行处理，然后输出处理完成的音频数据。本发明中在语音通讯终端都配置有至少两种不同的编码器，或者配置有至少两种不同的解码器，故可以根据建立语音通讯的双方终端的能力支持情况选择合适的编码器和解码器，使得对音频数据的编解码处理不再采用固定的低采样率和低带宽的处理方式，而是根据建立语音通讯的双方终端的实际能力选择合适的编解码设备，从而能够充分利用语音通讯终端的能力，实现采用合适的编解码设备对音频数据进行处理，提高对音频数据的处理效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种音频数据的处理方法的流程方框示意图；

图2为本发明实施例提供的音频数据发送端和音频数据接收端的交互流程示意图；

图3-a为本发明实施例提供的一种语音通讯终端的组成结构示意图；

图3-b为本发明实施例提供的一种编解码匹配模块的组成结构示意图；

图3-c为本发明实施例提供的另一种编解码匹配模块的组成结构示意图；

图3-d为本发明实施例提供的另一种语音通讯终端的组成结构示意图；

图4为本发明实施例提供的音频数据的处理方法应用于终端的一种组成结构示意图。

具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，下面所描述的实施例仅仅是本发明一部分实施例，而非全部实施例。基于本发明中的实施例，本领域的技术人员所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。

以下分别进行详细说明。

本发明音频数据的处理方法的一个实施例，具体可以应用于对语音通讯的双方终端中，请参阅图1所示，本发明一个实施例提供的音频数据的处理方法，可以包括如下步骤：

101、分别获取建立语音通讯的双方终端各自的能力支持信息。

在本发明实施例中，语音通讯终端首先获取自己的能力支持信息和对端的能力支持信息，语音通讯终端获取双方终端各自的能力支持信息可以是同时获取，也可以是先获取自己的能力支持信息后获取对端的能力支持信息，还可以是先获取对端的能力支持信息互获取自己的能力支持信息。其中，每个语音通讯终端的能力支持信息指的是本终端存在的对音频数据处理起到支持作用的能力大小情况，从能力支持信息中可以得到语音通讯终端处理音频数据的处理能力，能力支持信息具体可以通过能力的数值大小来体现，也可以通过能力的区间范围来体现。具体的，语音通讯终端的能力支持信息可以是某一方面能力的大小，也可以是多个方面能力的大小，例如终端自身的硬件配置情况、终端对所处移动网络的变换情况等，每个语音通讯终端对自身的能力情况进行分析，得到语音通讯终端的能力支持信息。

在本发明的一些实施例中，步骤101分别获取建立语音通讯的双方终端各自的能力支持信息，具体可以包括如下步骤:

1011、根据己方终端的网络条件和设备硬件条件获取己方终端的能力支持信息；

1012、通过信令中转服务器接收对方终端发送的能力支持信息。

其中，语音通讯终端在获取双方终端的能力支持信息时，对于己方终端和对方终端可以采用不同的获取方式，步骤1011中语音通讯终端可以对己方终端的网络条件和设备硬件条件进行分析，获取到己方终端所处网络的网络条件，例如，语音通讯终端获取自身所处网络为第二代移动通信技术(the second Generation mobile communicationtechnology，2G)网络，或第三代移动通信技术(the 3rd Generation mobilecommunication technology，3G)网络，或4G，或WiFi网络，进一步的，语音通讯终端获取自身所处的网络条件还可以指的是，当语音通讯终端发生数据网络切换后，重新获取己方终端的网络条件。另外，语音通讯终端除了获取己方终端的网络条件外，还可以获取己方终端的设备硬件条件，即获取自身的硬件实力，设备硬件条件可以通过语音通讯终端的设备硬件在出厂后的固定配置中获取，或者在更换硬件后从重新解析后得到的配置中获取。

在本发明的一些实施例中，语音通讯终端的能力支持信息可包括如下信息：建立语音通讯的一方终端的网络条件和设备硬件条件；其中，网络条件包括建立语音通讯的一方终端所处网络的网络制式、网络传输速率、干扰情况；设备硬件条件包括建立语音通讯的一方终端的处理器配置情况、缓存配置情况。

具体的，语音通讯终端的网络条件可以是该语音通讯终端所处网络的网络制式，例如具体是2G，还是4G，具体为蜂窝网络还是WiFi网络，或者网络条件进一步包括是全球移动通信系统(Global System for Mobile Communication，GSM)还是码分多址(CodeDivision Multiple Access，CDMA)，网络条件还可以包括语音通讯终端所处网络的网络传输速率、目前网络存在的干扰情况等，语音通讯终端的网络条件直接反映出音频数据被传输时的网络传输情况，可以用语音通讯终端的网络条件作为选择编解码设备的依据，使得采用的编解码设备处理得到的音频数据能够适合在上述网络条件下传输，避免对传输资源的浪费或者超过其实际载荷能力。

语音通讯终端的硬件设备条件可以是该语音通讯终端自身的硬件配置情况，例如处理器为单核还是双核或者四核、八核等，处理器的型号为armv6还是armv7。硬件设备条件还可以包括语音通讯终端的缓存大小，语音通讯终端的硬件设备条件直接反映出音频数据在进行编解码处理时的处理能力，可以用语音通讯终端的硬件设备条件作为选择编解码设备的依据，使得采用的编解码设备能够适用于语音通讯终端的硬件，避免对传输资源的浪费或者超过其实际硬件的处理能力。例如语音通讯终端的处理器配置很高，就可以运行高带宽的编解码设备，快速完成对音频数据的编解码，则对于用户而言，就可以使用高音质进行语音通讯。

在本发明的一些实施例中，本发明提供的音频数据的处理方法还包括如下步骤:

将己方终端的能力支持信息通过信令中转服务器发送给对方终端。

其中，建立语音通讯的双方终端通过信令中转服务器完成信令的发送与接收，信令中转服务器具体可以为云服务器，建立语音通讯的双方终端可以先使用信令中转服务器完成信息的交互，双方终端交互各自的能力支持信息，语音通讯终端可以获知语音通讯对端的能力支持情况。

在本发明的一些实施例中，语音通讯终端在获取双方终端的能力支持信息时，对于己方终端和对方终端可以采用不同的获取方式，步骤1012中语音通讯终端获取对方终端的能力支持信息时可以通过信令中转服务器接收对方终端发送的能力支持信息。具体的，语音通讯终端可以在获取到自身的能力支持信息之后，主动向对方终端发送自己的能力支持信息，也可以根据对方终端的请求发送自己的能力支持信息。

102、选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的编码器，或选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的解码器。

在本发明实施例中，语音通讯终端获取到双方终端各自的能力支持信息之后，根据获取到的双方终端各自的能力支持信息来选择编码器或者选择解码器，以语音通讯终端作为音频数据发送端为例，在每个语音通讯终端中都需要设置有至少两个不同的编码器，这些编码器在对音频数据的编码处理能力是不同的，例如编码器可以分为高带宽编码器和低带宽编码器，其中高带宽编码器可以适用于先进网络且网络信号很强、终端硬件为高配的语音通讯终端，低带宽编码器则适用于低配网络且信号较弱、终端硬件为低配的语音通讯终端。又如，编码器还可以分为高带宽编码器、中带宽编码器和低带宽编码器这三种类型，或者更多类型的编码器，这些编码器中每个编码器都适用于一种终端能力的语音编码，各个编码器在音频数据的编码处理能力上具有差异，以满足不同终端能力支持的情形。相类似的，以语音通讯终端作为音频数据接收端为例，在每个语音通讯终端中都需要设置有至少两个不同的解码器，这些解码器在对音频数据的解码处理能力是不同的，例如解码器可以分为高带宽解码器和低带宽解码器，其中高带宽解码器可以适用于先进网络且网络信号很强、终端硬件为高配的语音通讯终端，低带宽解码器则适用于低配网络且信号较弱、终端硬件为低配的语音通讯终端。又如，解码器还可以分为高带宽解码器、中带宽解码器和低带宽解码器这三种类型，或者更多类型的解码器，这些解码器中每个解码器都适用于一种终端能力的语音解码，各个解码器在音频数据的解码处理能力上具有差异，以满足不同终端能力支持的情形。

需要说明的是，在本发明实施例中，语音通讯的终端中配置至少两种不同的编码器，以根据建立语音通讯的双方终端的能力支持信息选择一种编码器，在具体实现时，这些多个的编码器可以通过承载在一个物理编码器上来实现，只是对于同一个物理编码器可以配置几种不同的带宽接口，并在每个种带宽接口上使用不同的编码能力来对音频数据编码。同样的，语音通讯的终端中配置至少两种不同的解码器，以根据建立语音通讯的双方终端的能力支持信息选择一种解码器，在具体实现时，这些多个的解码器可以通过承载在一个物理解码器上来实现，只是对于同一个物理解码器可以配置几种不同的带宽接口，并在每个种带宽接口上使用不同的解码能力来对音频数据解码。

在本发明的一些实施例中，若己方终端为音频数据发送端，步骤102选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的编码器，包括：

A1、使用二进制表示己方终端的能力支持信息中的能力位，将己方终端的能力位与对方终端的对应能力位进行逻辑与运算；

A2、根据逻辑与运算的结果选择处理带宽与双方能力都匹配的编码器。

在本发明实施例中，图1所示的方法中动作执行主体可以是音频数据发送端，也可以是音频数据接收端，作为音频数据发送端需要选择的是编码器，若为音频数据接收端需要选择的是解码器，步骤A1和A2的实现场景中，音频数据发送端中设置有两种不同的编码器，可以分别定义为高带宽编码器和低带宽编码器，首先将己方终端的能力支持信息中的能力位用二进制表示，其中能力支持信息中可以有一个或多个控制条件，每个控制条件可以是一个能力位，能力位可以用一位二进制数来表示，例如当具备哪一种控制条件时就可以将其对应的能力位记为1，不具备控制条件的能力位记为0。己方终端的能力支持信息可以由己方终端自行完成二进制转换，对于音频数据接收端的能力支持信息可以由音频数据发送端接收到对方终端的能力支持信息之后自行完成二进制转换，也可以由音频数据接收端完成能力位的二进制转换后发送音频数据发送端，则音频数据发送端可以直接使用音频数据接收端的各个能力位。音频数据发送端获取到自己的能力位之后，将自己的能力位与对方终端的对应能力位进行逻辑与运算，得到逻辑与运算的结果，例如音频数据发送端具有3个能力位101，音频数据接收端的3个能力位011，进行逻辑与运算之后，得到结果为001，又如音频数据发送端具有3个能力位111，音频数据接收端的3个能力位111，进行逻辑与运算之后，得到结果为111。若能力位均满足(即111)，则选择高带宽编码器，若能力位不满足(即001)，则选择低带宽编码器，实现从高带宽编码器和低带宽编码器中的二选一，以便适用于不同能力支持的语音通讯终端。

需要说明的是，前述实施例中以编码器的处理带宽为两种进行举例，实现的是编码器的二选一，不限定的是，还可以根据处理带宽设置三种编码器或者更多种，从而可以根据己方终端的能力支持信息和对方终端的能力支持信息从多种编码器中选择一种编码器，实现的是编码器的多选一，多种编码器供终端的选择使用，可以实现对音频数据的不同编码处理，满足多类型音频数据传输的需要。

在本发明的一些实施例中，若己方终端为音频数据接收端，102选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的解码器，包括：

B1、使用二进制表示己方终端的能力支持信息中的能力位，将己方终端的能力位与对方终端的对应能力位进行逻辑与运算；

B2、根据逻辑与运算的结果选择处理带宽与双方能力都匹配的解码器。

在本发明实施例中，图1所示的方法中动作执行主体可以是音频数据发送端，也可以是音频数据接收端，作为音频数据发送端需要选择的是编码器，若为音频数据接收端需要选择的是解码器，步骤B1和B2的实现场景中，音频数据接收端中设置有两种不同的解码器，可以分别定义为高带宽解码器和低带宽解码器，首先将己方终端的能力支持信息中的能力位用二进制表示，其中能力支持信息中可以有一个或多个控制条件，每个控制条件可以是一个能力位，能力位可以用一位二进制数来表示，例如当具备哪一种控制条件时就可以将其对应的能力位记为1，不具备控制条件的能力位记为0。己方终端的能力支持信息可以由己方终端自行完成二进制转换，对于音频数据发送端的能力支持信息可以由音频数据接收端接收到对方终端的能力支持信息之后自行完成二进制转换，也可以由音频数据发送端完成能力位的二进制转换后发送音频数据接收端，则音频数据接收端可以直接使用音频数据发送端的各个能力位。音频数据接收端获取到自己的能力位之后，将自己的能力位与对方终端的对应能力位进行逻辑与运算，得到逻辑与运算的结果，例如音频数据接收端具有3个能力位101，音频数据发送端的3个能力位011，进行逻辑与运算之后，得到结果为001，又如音频数据接收端具有3个能力位111，音频数据发送端的3个能力位111，进行逻辑与运算之后，得到结果为111。若能力位均满足(即111)，则选择高带宽解码器，若能力位不满足(即001)，则选择低带宽解码器，实现从高带宽解码器和低带宽解码器中的二选一，以便适用于不同能力支持的语音通讯终端。

需要说明的是，前述实施例中以解码器的处理带宽为两种进行举例，实现的是解码器的二选一，不限定的是，还可以根据处理带宽设置三种解码器或者更多种，从而可以根据己方终端的能力支持信息和对方终端的能力支持信息从多种解码器中选择一种解码器，实现的是解码器的多选一，多种解码器供终端的选择使用，可以实现对音频数据的不同解码处理，满足多类型音频数据传输的需要。

需要说明的是，在现有技术中VoIP应用程序通常采用低采样率、低带宽对音频数据进行编解码，这样对已有的网络以及升级的硬件设备都利用不够充分，低采样率、低带宽的方式虽然能够完成音频数据的传输，但是音质效果不佳，如果直接使用高采样率、高带宽则可能存在语音通话双方网络条件不兼容的问题。而本发明实施例中可以通过建立语音通讯的双方终端的能力支持信息进行编解码设备的选择，从而可以满足用户对高音质的要求。

103、使用选择出的编码器或者解码器对音频数据进行处理，然后输出处理完成的音频数据。

在本发明实施例中，语音通讯终端选择出编码器后可以执行步骤103，也可以在选择出解码器后执行步骤103，例如语音通讯终端选择出编码器后对音频数据进行编码处理并输出，又如语音通讯终端选择出解码器后对音频数据进行解码处理并输出。

具体的，在本发明的一些实施例中，步骤103使用选择出的编码器或者解码器对音频数据进行处理，然后输出处理完成的音频数据，包括：

C1、使用选择出的编码器对己方终端生成的音频数据进行编码处理，然后通过语音中转服务器向对方终端发送编码后的音频数据；

或，

C2、使用选择出的解码器对对方终端发送的音频数据进行解码处理，然后通过解码器端口输出解码后的音频数据。

其中，图1所示的方法中动作执行主体可以是音频数据发送端，也可以是音频数据接收端，作为音频数据发送端执行步骤C1，若为音频数据接收端执行步骤C2，音频数据发送端使用选择出的编码器对自己生成的音频数据进行编码，完成编码后使用语音中转服务器向对方终端发送。音频数据接收端从语音中转服务器接收到音频数据之后，使用选择出的解码器对接收到的音频数据进行解码，完成解码后通过解码器端口输出，音频数据接收端向用户输出解码后的音频数据。

需要说明的是，在本发明实施例中，语音中转服务器可以指的是云服务器，并且语音中转服务器和信令中转服务器具体可以通过同一个物理服务器来实现，当然也可是独立的两个服务器，此处不做限定。

通过以上实施例对本发明的描述可知，首先分别获取建立语音通讯的双方终端各自的能力支持信息，然后选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的编码器，或选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的解码器，最后使用选择出的编码器或者解码器对音频数据进行处理，然后输出处理完成的音频数据。本发明中在语音通讯终端都配置有至少两种不同的编码器，或者配置有至少两种不同的解码器，故可以根据建立语音通讯的双方终端的能力支持情况选择合适的编码器和解码器，使得对音频数据的编解码处理不再采用固定的低采样率和低带宽的处理方式，而是根据建立语音通讯的双方终端的实际能力选择合适的编解码设备，从而能够充分利用语音通讯终端的能力，实现采用合适的编解码设备对音频数据进行处理，提高对音频数据的处理效果。

为便于更好的理解和实施本发明实施例的上述方案，下面举例相应的应用场景来进行具体说明。

请参阅如图2所示，为本发明实施例提供的音频数据发送端和音频数据接收端的交互流程示意图，本地终端为第一终端，也就是音频数据发送端，与第一终端建立语音通讯的是第二终端，也就是音频数据接收端。

第一终端和第二终端分别把己方的能力支持信息(比如网络条件和设备硬件条件等)传入各自的能力控制器，其中每个终端的输入为b(1)…b(n)，假设能力控制器控制n个条件，记做L[1]，L[2]…L[n]，其中，L[n]中满足条件1记为1否则记为0，满足条件2记为记为1否则记为0，其余条件相类似。每个条件都用二进制的“能力位”表示。如果L[1]＝1，L[2]＝0，L[3]＝1,则第一终端的能力位表示为L＝101。

第一终端和第二终端分别把己方的能力位发送给信令中转服务器，信令中转服务器转发给对方，完成能力位交换。

第一终端作为音频数据发送端，生成音频数据，并进入编码器接口，编码器通过编解码筛选器筛选出低带宽或者高带宽编码器。编解码筛选器的具体实现如下：第一终端和第二终端把交换到的对方的能力位输入到编解码筛选器，假设对方的能力为R[1]，R[2]…R[n]，其中R[n]满足条件n记为1，否则记为0，能力位表示为R(n)。第一终端和第二终端的是否满足能力的判断为逻辑运算，即把本地L和远端R做一次逻辑与操作，ability＝L&R，如果得到的ability全部位等于1，则满足能力，否则不满足能力。在满足能力的情况下选择高带宽编码器，在能力不满足的情况下选择低带宽编码器，同样的，在满足能力的情况下选择高带宽解码器，在能力不满足的情况下选择低带宽解码器。

如果满足能力，选择高带宽编码器，否则选择低带宽编码器。编码器编码音频数据，并发送至语音中转服务器，不全为1选择低带宽编码器，高带宽编码器需要消耗很大的网络和硬件资源，必须全部满足条件才行。第二终端采用相同的方法通过编解码筛选器筛选低带宽或者高带宽的解码器，最后完成音频数据的输出。

需要说明的是，第一终端和第二终端的能力位必须同时满足才能筛选到高宽带编解码器。因为能力交换完成以后就双方开始语音通信，如果一边不支持也无法完成。本发明可以根据当前用户环境，动态切换至高采样率，高带宽的语音编解码进行网络传输，提供音乐品质的语音通信体验。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

为便于更好的实施本发明实施例的上述方案，下面还提供用于实施上述方案的相关装置。

请参阅图3-a所示，本发明实施例提供的一种语音通讯终端300，可以包括：能力获取模块301、编解码匹配模块302、音频传输模块303，其中，

能力获取模块301，用于分别获取建立语音通讯的双方终端各自的能力支持信息；

编解码匹配模块302，用于选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的编码器，或选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的解码器；

音频传输模块303，用于使用选择出的编码器或者解码器对音频数据进行处理，然后输出处理完成的音频数据。

在本发明的一些实施例中，所述能力获取模块301，具体用于根据己方终端的网络条件和设备硬件条件获取己方终端的能力支持信息；通过信令中转服务器接收对方终端发送的能力支持信息。

在本发明的一些实施例中，如图3-b所示，若己方终端为音频数据发送端，所述编解码匹配模块302，包括：

运算模块3021，用于使用二进制表示己方终端的能力支持信息中的能力位，将己方终端的能力位与对方终端的对应能力位进行逻辑与运算；

第一匹配模块3022，用于根据逻辑与运算的结果选择处理带宽与双方能力都匹配的编码器。

在本发明的一些实施例中，如图3-c所示，若己方终端为音频数据接收端，所述编解码匹配模块302，包括：

第二匹配模块3023，用于根据逻辑与运算的结果选择处理带宽与双方能力都匹配的解码器。

在本发明的一些实施例中，所述音频传输模块303，具体用于使用选择出的编码器对己方终端生成的音频数据进行编码处理，然后通过语音中转服务器向对方终端发送编码后的音频数据；或，使用选择出的解码器对对方终端发送的音频数据进行解码处理，然后通过解码器端口输出解码后的音频数据。

在本发明的一些实施例中，如图3-d所示，所述语音通讯终端300还包括:能力传输模块304，用于将己方终端的能力支持信息通过信令中转服务器发送给所述对方终端。

在本发明的一些实施例中，所述能力支持信息包括：建立语音通讯的一方终端的网络条件和设备硬件条件；

所述网络条件包括建立语音通讯的一方终端所处网络的网络制式、网络传输速率、干扰情况；

所述设备硬件条件包括建立语音通讯的一方终端的处理器配置情况、缓存配置情况。

通过以上实施例对本发明的描述可知，能力获取模块首先分别获取建立语音通讯的双方终端各自的能力支持信息，然后编解码匹配模块选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的编码器，或选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的解码器，最后音频传输模块使用选择出的编码器或者解码器对音频数据进行处理，然后输出处理完成的音频数据。本发明中在语音通讯终端都配置有至少两种不同的编码器，或者配置有至少两种不同的解码器，故可以根据建立语音通讯的双方终端的能力支持情况选择合适的编码器和解码器，使得对音频数据的编解码处理不再采用固定的低采样率和低带宽的处理方式，而是根据建立语音通讯的双方终端的实际能力选择合适的编解码设备，从而能够充分利用语音通讯终端的能力，实现采用合适的编解码设备对音频数据进行处理，提高对音频数据的处理效果。

本发明实施例还提供了另一种终端，如图4所示，为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明实施例方法部分。该终端可以为包括手机、平板电脑、PDA(Personal Digital Assistant，个人数字助理)、POS(Point ofSales，销售终端)、车载电脑等任意终端设备，以终端为手机为例：

图4示出的是与本发明实施例提供的终端相关的手机的部分结构的框图。参考图4，手机包括：射频(Radio Frequency，RF)电路410、存储器420、输入单元430、显示单元440、传感器450、音频电路460、无线保真(wireless fidelity，WiFi)模块470、处理器480、以及电源490等部件。本领域技术人员可以理解，图4中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图4对手机的各个构成部件进行具体的介绍：

RF电路410可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器480处理；另外，将设计上行的数据发送给基站。通常，RF电路410包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier，LNA)、双工器等。此外，RF电路410还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(GlobalSystem of Mobile communication，GSM)、通用分组无线服务(General Packet RadioService，GPRS)、码分多址(Code Division Multiple Access，CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution，LTE)、电子邮件、短消息服务(Short Messaging Service，SMS)等。

存储器420可用于存储软件程序以及模块，处理器480通过运行存储在存储器420的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器420可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器420可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元430可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元430可包括触控面板431以及其他输入设备432。触控面板431，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板431上或在触控面板431附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板431可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器480，并能接收处理器480发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板431。除了触控面板431，输入单元430还可以包括其他输入设备432。具体地，其他输入设备432可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元440可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元440可包括显示面板441，可选的，可以采用液晶显示器(Liquid CrystalDisplay，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板441。进一步的，触控面板431可覆盖显示面板441，当触控面板431检测到在其上或附近的触摸操作后，传送给处理器480以确定触摸事件的类型，随后处理器480根据触摸事件的类型在显示面板441上提供相应的视觉输出。虽然在图4中，触控面板431与显示面板441是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板431与显示面板441集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器450，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板441的亮度，接近传感器可在手机移动到耳边时，关闭显示面板441和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路460、扬声器461，传声器462可提供用户与手机之间的音频接口。音频电路460可将接收到的音频数据转换后的电信号，传输到扬声器461，由扬声器461转换为声音信号输出；另一方面，传声器462将收集的声音信号转换为电信号，由音频电路460接收后转换为音频数据，再将音频数据输出处理器480处理后，经RF电路410以发送给比如另一手机，或者将音频数据输出至存储器420以便进一步处理。

WiFi属于短距离无线传输技术，手机通过WiFi模块470可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图4示出了WiFi模块470，但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器480是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器420内的软件程序和/或模块，以及调用存储在存储器420内的数据，执行手机的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器480可包括一个或多个处理单元；优选的，处理器480可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器480中。

手机还包括给各个部件供电的电源490(比如电池)，优选的，电源可以通过电源管理系统与处理器480逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

在本发明实施例中，该终端所包括的处理器480还具有控制执行以上由终端执行的音频数据的处理方法流程。

另外需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本发明提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下，凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现，而且，用来实现同一功能的具体硬件结构也可以是多种多样的，例如模拟电路、数字电路或专用电路等。但是，对本发明而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘，U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

综上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照上述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对上述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种音频数据的处理方法，其特征在于，包括：

分别获取建立语音通讯的双方终端各自的能力支持信息，所述语音通讯的双方终端都配置有至少两种不同的编码器和至少两种不同的解码器，所述至少两种不同的编码器承载在一个物理编码器上，所述至少两种不同的解码器承载在一个物理解码器上；

2.根据权利要求1所述的方法，其特征在于，所述分别获取建立语音通讯的双方终端各自的能力支持信息，包括:

根据己方终端的网络条件和设备硬件条件获取己方终端的能力支持信息；

通过信令中转服务器接收对方终端发送的能力支持信息。

3.根据权利要求1所述的方法，其特征在于，若己方终端为音频数据发送端，所述选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的编码器，包括：

使用二进制表示己方终端的能力支持信息中的能力位，将己方终端的能力位与对方终端的对应能力位进行逻辑与运算；

根据逻辑与运算的结果选择处理带宽与双方能力都匹配的编码器。

4.根据权利要求1所述的方法，其特征在于，若己方终端为音频数据接收端，所述选择与己方终端的能力支持信息和对方终端的能力支持信息都适配的解码器，包括：

根据逻辑与运算的结果选择处理带宽与双方能力都匹配的解码器。

5.根据权利要求1所述的方法，其特征在于，所述使用选择出的编码器或者解码器对音频数据进行处理，然后输出处理完成的音频数据，包括：

使用选择出的编码器对己方终端生成的音频数据进行编码处理，然后通过语音中转服务器向对方终端发送编码后的音频数据；

或，

使用选择出的解码器对对方终端发送的音频数据进行解码处理，然后通过解码器端口输出解码后的音频数据。

6.根据权利要求1至5中任一项所述的方法，其特征在于，所述方法还包括:

将己方终端的能力支持信息通过信令中转服务器发送给所述对方终端。

7.根据权利要求1至5中任一项所述的方法，其特征在于，所述能力支持信息包括：建立语音通讯的一方终端的网络条件和设备硬件条件；

8.一种语音通讯终端，其特征在于，包括：

能力获取模块，用于分别获取建立语音通讯的双方终端各自的能力支持信息，所述语音通讯的双方终端都配置有至少两种不同的编码器和至少两种不同的解码器，所述至少两种不同的编码器承载在一个物理编码器上，所述至少两种不同的解码器承载在一个物理解码器上；

9.根据权利要求8所述的语音通讯终端，其特征在于，所述能力获取模块，具体用于根据己方终端的网络条件和设备硬件条件获取己方终端的能力支持信息；通过信令中转服务器接收对方终端发送的能力支持信息。

10.根据权利要求8所述的语音通讯终端，其特征在于，若己方终端为音频数据发送端，所述编解码匹配模块，包括：

运算模块，用于使用二进制表示己方终端的能力支持信息中的能力位，将己方终端的能力位与对方终端的对应能力位进行逻辑与运算；

第一匹配模块，用于根据逻辑与运算的结果选择处理带宽与双方能力都匹配的编码器。

11.根据权利要求8所述的语音通讯终端，其特征在于，若己方终端为音频数据接收端，所述编解码匹配模块，包括：

第二匹配模块，用于根据逻辑与运算的结果选择处理带宽与双方能力都匹配的解码器。

12.根据权利要求8所述的语音通讯终端，其特征在于，所述音频传输模块，具体用于使用选择出的编码器对己方终端生成的音频数据进行编码处理，然后通过语音中转服务器向对方终端发送编码后的音频数据；或，使用选择出的解码器对对方终端发送的音频数据进行解码处理，然后通过解码器端口输出解码后的音频数据。

13.根据权利要求8至12中任一项所述的语音通讯终端，其特征在于，所述语音通讯终端还包括:能力传输模块，用于将己方终端的能力支持信息通过信令中转服务器发送给所述对方终端。

14.根据权利要求8至12中任一项所述的语音通讯终端，其特征在于，所述能力支持信息包括：建立语音通讯的一方终端的网络条件和设备硬件条件；