CN101763859A

CN101763859A - 音频数据处理方法、装置和多点控制单元

Info

Publication number: CN101763859A
Application number: CN 200910258138
Authority: CN
Inventors: 闫相斌; 刘智辉
Original assignee: Shenzhen Huawei Communication Technologies Co Ltd
Current assignee: Huawei Device Shenzhen Co Ltd
Priority date: 2009-12-16
Filing date: 2009-12-16
Publication date: 2010-06-30
Also published as: WO2011072551A1

Abstract

本发明提出了一种音频数据处理方法、装置和多点控制单元，属于通讯技术领域。本发明实施例通过判断获得窄带音频数据，并对窄带音频数据进行盲频谱扩展，能够提高宽带音频用户的音频体验，防止对带宽、设备造成浪费。同时，在多点控制单元中进行频谱扩展，相比较现有的通过终端进行处理，可以实现网络侧一次升级即可，无需对终端进行改动，这样可以极大的降低系统升级的成本。并且本发明实施例可以兼容各种型号的终端设备，并可以兼容各种音频协议，提高整个系统的兼容性。

Description

音频数据处理方法、装置和多点控制单元

技术领域

本发明涉及通讯技术领域，特别涉及一种音频数据处理方法、装置和多点控制单元。

背景技术

最早的语音通信系统是传统的PSTN(Public Switched Telephone Network，公共交换电话网络)。PSTN网络中由于语音信号的频谱主要集中在4KHz以下的带宽中，因此早期的PSTN为了节省带宽使用了8KHz的采样率来进行语音编码，这就形成了最早的语音编码协议G.711，现在我们称这些协议为窄带协议。对于基本的语音通信来说，窄带协议能够保证基本的语音可懂度。随着网络和语音技术的发展，出现了使用16KHz采样率的语音协议，典型的就是G.722协议，这些协议被称为宽带音频协议。宽带协议使得声音更逼真更饱满，大大提高了用户的音频体验。而随着网络带宽的发展，网络带宽已不是瓶颈，因此有的通信系统也开始使用超宽带(32KHz采样率)或全带(44KHz以上采样率)音频协议。这时的声音质量可以达到高保真的水平，不光可以传输语音，还可以传输各种音乐，用户音频体验最佳。

由于宽带音频提供了更好更真实的音频体验，因此目前语音通信系统逐渐在向宽带和超宽带过渡，但窄带音频还将与宽带音频共存很长一段时间。在多方进行音频数据传输时，例如进行语音和/或视频通讯时，需要兼顾不同网络环境，支持从窄带到宽带的多种常见协议。下面视讯会议为例进行详细说明。

现有的视频会议系统结构可以简单的表示为如图1所示的结构，包括MCU(MultiPointControl Unit，多点控制单元)和多个接入点：会场1、会场2......会场n。其中，MCU的一个重要功能是对音频数据进行混音，将N路音频数据解码之后进行包络比较后再混成一路，再经过重新编码后发给各个连入的会场。其中“多方”的意思是两方或两方以上。

由于在混音时各个会场使用的协议有可能是不同的，这其中有窄带协议也有宽带协议，因此MCU解码出的音频数据有各种不同的采样率。在进行混音时，为了匹配各种音频采样速率，将所有音频数据进行上采样，使得所有音频具有相同的采样频率，这样就可以将窄带协议的采样率提高到全带(48KHz)。然后进行混音，将多路音频混成一路数据。然后在向连入的会场发送的时候，对该数据再进行协议和采样率匹配，根据各会场使用的协议，对数据再进行下采样，并进行编码，然后将编码后的数据发送到各会场。

在现有技术中，有一种“盲频谱扩展”技术，在中国专利申请号为200680005711.1、名称为《与音频带扩展装置》、公开号为CN101128868A的中国专利中公开了这种技术。

在实现本发明的过程中，发明人发现现有技术至少存在以下问题：

采用现有技术中的方法，虽然可以通过上采样将音频数据的采样频率提高，但音频数据的频谱还是集中在窄带部分。这样导致多点接入系统中如果有窄带音频数据，则各会场听到的都是窄带音频，会议中的音频体验比较差。对于具有宽带音频能力的会场，拥有好的网络环境和高端终端，却只能听到最差的音频质量，不光使得用户音频体验较差，还造成了带宽和设备的浪费。

发明内容

为了解决现有技术中在多点进行音频数据传输时，由于窄带音频数据与宽带音频数据共存，导致使用宽带音频设备的用户的音频体验差及带宽、设备浪费的问题，本发明实施例提供了一种音频数据处理方法、装置和多点控制单元。所述技术方案如下：

本发明实施例提出了一种音频数据处理方法，包括：

读取接入点发送的音频数据，并判断所述音频数据是否为窄带音频数据；如果是，则将所述音频数据进行盲频谱扩展；如果否，则不对音频数据进行处理；

将宽带音频数据和/或所述盲频谱扩展后的窄带音频数据发送到多点控制单元。

本发明实施例还提出了一种音频数据处理方法，包括：

对接收到的多路音频数据进行前置操作；

读取处理后的多路音频数据，并判断其中是否包括窄带音频数据，如果是则对所述窄带音频数据进行盲频谱扩展；

将所述多路音频数据进行混音；

将混音后的音频数据进行后续操作后分别发送到各接入点。

本发明实施例还提出了一种音频数据处理装置，包括：

音频识别模块，用于读取接入点发送的音频数据，判断所述音频数据是否为窄带音频数据；

频谱扩展模块，用于将所述音频识别模块识别出的窄带音频数据进行盲频谱扩展；

数据发送模块，用于将宽带音频数据和/或所述盲频谱扩展后的窄带音频数据发送到多点控制单元。

本发明实施例还提出了一种多点控制单元，包括：

接收模块，用于对接收到的多路音频数据进行前置操作；

发送模块，用于将混音后的音频数据后续操作后分别发送到各接入点；

还包括：

音频识别模块，用于读取所述接收模块的多路音频数据，并将其中的窄带音频数据发送到频谱扩展模块；

混音模块，用于将宽带音频数据与所述扩展后的窄带音频数据进行混音，并发送到所述发送模块。

本发明实施例提出了一种音频数据处理方法、装置和多点控制单元，可以应用于多接入点系统，例如多点音频/视频会议系统。本发明实施例通过对窄带音频数据进行盲频谱扩展，这样能够提高宽带音频用户的音频体验，防止对带宽、设备造成浪费。同时，在多点控制单元中进行频谱扩展，相比较现有的通过终端进行处理，可以实现网络侧一次升级即可，无需对终端进行改动，这样可以极大的降低系统升级的成本。并且本发明实施例可以兼容各种型号的终端设备，并可以兼容各种音频协议，提高整个系统的兼容性。

附图说明

图1为现有技术提供的多接入点系统的结构示意图；

图2为本发明第一实施例提供的音频数据处理方法的流程示意图；

图3为本发明第二实施例提供的音频数据处理方法的流程示意图；

图4为本发明第三实施例提供的音频数据处理装置的结构示意图；

图5为本发明第四实施例提供的多点控制单元的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

实施例1

本发明的第一实施例提出了一种音频数据处理方法，其流程如图2所示，包括：

步骤101、读取接入点发送的音频数据；

步骤102、判断该音频数据是否为窄带音频数据；

步骤103、如果是，则将该音频数据进行盲频谱扩展；如果否，则不对该音频数据进行操作；

步骤104、将宽带音频数据和/或盲频谱扩展后的窄带音频数据发送到多点控制单元。

本发明实施例提出了一种音频数据处理方法，通过对窄带音频数据进行盲频谱扩展，从而将窄带音频数据扩展为宽带音频数据。这样在多点控制单元进行混音的时候，每一路音频数据都是宽带音频数据，这样使用宽带音频设备的接入点接收到的就是宽带音频数据。这样能够提高宽带音频用户的音频体验，防止对带宽、设备造成浪费。

该方法可以应用于多点控制单元的前置设备内，预先对接收到的音频数据进行处理后，再发送给多点控制单元。

其中，步骤102的判断音频数据是否为窄带音频数据，可以具体为：通过音频数据的采样率和/或协议，或是通过频谱，判断该音频数据是否为窄带音频数据。

对于通过采样率和/或协议进行判断的方式，则判断音频数据是否为窄带音频数据具体为：

根据该音频数据的采样率和/或协议判断该音频数据是否为窄带音频数据。

由于MCU在对收到的每一个接入点的音频数据进行解码时，可以得知音频码流的协议和采样率。因此音频识别模块可以通过采样率来判断该音频数据是否为8KHz以下，如果是则为窄带音频数据，否则为宽带音频数据。而有些协议的采样率是固定的，例如G.711协议。因此也可以通过直接读取协议进行判断是否为窄带音频数据。

采用这种方式，可以快速的对音频数据进行识别，降低设备的复杂度和升级成本。

对于通过频谱进行判断的方式，则判断音频数据是否为窄带音频数据可以具体包括：

根据该音频数据的频谱判断该音频数据是否为窄带音频数据。

这是由于并不是所有使用宽带音频设备的接入点，其发送到MCU的音频数据就一定是宽带音频数据。例如：某一接入点使用的虽是48KHz采样率的宽带音频数据，而该接入点的声音来源是信号输入(Line in)的经过频带限制的窄带信号，则成为了宽带形式的窄带音频数据。对于这种音频数据，使用前述的那种通过采样率和/或协议无法将其区分出来，还有可能会导致现有技术中存在的问题。而采用这种通过频谱区分的方式，则可以彻底将音频数据进行区分。具体的方法可以为：

频域方法：即对音频数据信号进行快速傅里叶(FFT)变换，计算该信号在4Khz以上频谱总能量，将这部分能量与一个阈值比较，如果大于阈值则该音频数据为宽带音频，如果小于阈值则该音频数据为窄带音频数据；

时域方法：即让信号通过一个截止频率为4Khz的高通滤波器，计算输出信号的时域包络，并用这个包络值与一个阈值比较，如果大于阈值则该音频数据为宽带音频，如果小于阈值则该音频数据为窄带音频数据。

采用这种形式的音频识别模块，可以更为精确地对音频数据进行识别，防止使用宽带音频设备的接入点发送的窄带音频数据对整体效果造成影响。

实施例2

本发明的第二实施例提出了一种音频数据处理方法，其流程如图3所示，包括：

步骤201、对接收到的多路音频数据进行前置操作；

步骤202、读取处理后的多路音频数据，并判断其中是否包括窄带音频数据；

步骤203、如果是，则对该窄带音频数据进行盲频谱扩展；如果否，则不操作；

步骤204、将该多路音频数据进行混音；

步骤205、将混音后的音频数据进行后续操作后分别发送到各接入点。

本发明实施例提出了一种音频数据处理方法，通过对窄带音频数据进行盲频谱扩展，从而将窄带音频数据扩展为宽带音频数据。这样在混音的时候，每一路音频数据都是宽带音频数据，这样使用宽带音频设备的接入点接收到的就是宽带音频数据。这样能够提高宽带音频用户的音频体验，防止对带宽、设备造成浪费。同时，在多点控制单元中进行频谱扩展，相比较现有的通过终端进行处理，可以实现网络侧一次升级即可，无需对终端进行改动，这样可以极大的降低系统升级的成本。并且本发明实施例可以兼容各种型号的终端设备，并可以兼容各种音频协议，提高整个系统的兼容性。

其中，在步骤201中的前置操作，可以包括解码和/或上采样等处理，本领域内技术人员可以根据需要任意设定。且步骤204中的后续操作，可以包括下采样和/或编码等处理，本领域内技术人员可以根据需要任意设定。

其中，步骤202中的判断音频数据是否为窄带音频数据，可以具体为：通过音频数据的采样率和/或协议，或是通过频谱，判断该音频数据是否为窄带音频数据。

对于通过采样率和/或协议进行判断的方式，则判断音频数据是否为窄带音频数据可以具体包括：

实施例3

本发明的第三实施例提出了一种音频数据处理装置，其结构如图4所示，包括：

音频识别模块11，用于读取接收到的音频数据，判断该音频数据是否为窄带音频数据；

频谱扩展模块12，用于将该音频识别模块识别出的窄带音频数据进行盲频谱扩展；

数据发送模块13，用于将宽带音频数据和/或盲频谱扩展后的窄带音频数据发送到多点控制单元。

本发明实施例提出了一种音频数据处理装置，对窄带音频数据进行盲频谱扩展，从而将窄带音频数据扩展为宽带音频数据。这样在多点控制单元进行混音的时候，每一路音频数据都是宽带音频数据，使用宽带音频设备的接入点接收到的就是宽带音频数据。本发明实施例能够提高宽带音频用户的音频体验，防止对带宽、设备造成浪费。

本发明实施例的处理装置，可以作为多点控制单元的前置设备，预先对接收到的音频数据进行处理后，再发送给多点控制单元。

其中，音频识别模块可以通过音频数据的采样率和/或协议，或是通过频谱，判断该音频数据是否为窄带音频数据。

对于通过采样率和/或协议进行判断的音频识别模块，可以具体包括：

第一读取单元，用于读取接收到的该音频数据；

第一判断单元，用于读取该音频数据的采样率和/或协议，并根据采样率和/或协议判断该音频数据是否为窄带音频数据。

采用这种形式的音频识别模块，可以快速的对音频数据进行识别，降低设备的复杂度和升级成本。

对于通过频谱进行判断的音频识别模块，可以具体包括：

第二读取单元，用于读取接收到的该音频数据；

第二判断单元，用于读取该音频数据的频谱，并根据频谱判断该音频数据是否为窄带音频数据。

实施例4

本发明的第四实施例提出了一种多点控制单元，其结构如图5所示，包括：

接收模块4，用于对接收到的多路音频数据进行前置操作；

发送模块5，用于将混音后的音频数据进行后续操作后分别发送到各接入点；

还包括：

音频识别模块1，用于读取该接收模块的多路音频数据，并将其中的窄带音频数据发送到频谱扩展模块；

频谱扩展模块2，用于将该音频识别模块识别出的窄带音频数据进行盲频谱扩展；

混音模块3，用于将宽带音频数据与该扩展后的窄带音频数据进行混音，并发送到该发送模块。

本发明实施例提出了一种多点控制单元。现有的多点控制单元只有接收模块、发送模块和混音模块，对接收到的多路音频信号进行解码后上采样，然后进行混音，混音后再进行下采样和编码，发送到接入点。本发明实施例增加了音频识别模块、频谱扩展模块，并对混音模块进行了改进：对窄带音频数据进行盲频谱扩展，从而将窄带音频数据扩展为宽带音频数据。这样在混音的时候，每一路音频数据都是宽带音频数据，使用宽带音频设备的接入点接收到的就是宽带音频数据。本发明实施例能够提高宽带音频用户的音频体验，防止对带宽、设备造成浪费。同时，在多点控制单元中进行频谱扩展，相比较现有的通过终端进行处理，可以实现网络侧一次升级即可，无需对终端进行改动，这样可以极大的降低系统升级的成本。并且本发明实施例可以兼容各种型号的终端设备，并可以兼容各种音频协议，提高整个系统的兼容性。

其中，接收模块的前置操作，可以包括解码和/或上采样等处理，本领域内技术人员可以根据需要任意设定。发送模块的后续操作，可以包括下采样和/或编码等处理，本领域内技术人员可以根据需要任意设定。

第一读取单元，用于读取接收到的该音频数据；

对于通过频谱进行判断的音频识别模块，可以具体包括：

第二读取单元，用于读取接收到的该音频数据；

本发明上述每一实施例，可应用于多接入点的音频传输系统。其中“多接入点”的意思为两个或两个以上的接入点。典型的多接入点音频传输系统为多点音频/视频会议系统，当然本发明实施例还可以应用于其他多接入点的音频传输系统。

以上实施例提供的技术方案中的全部或部分内容可以通过软件编程实现，其软件程序存储在可读取的存储介质中，存储介质例如：计算机中的硬盘、光盘或软盘。

以上该仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种音频数据处理方法，其特征在于，包括：

读取接入点发送的音频数据，并判断所述音频数据是否为窄带音频数据；如果是，则将所述音频数据进行盲频谱扩展；

2.根据权利要求1所述的音频数据处理方法，其特征在于，所述判断音频数据是否为窄带音频数据具体为：

根据所述音频数据的采样率和/或协议判断所述音频数据是否为窄带音频数据。

3.根据权利要求1所述的音频数据处理方法，其特征在于，所述判断音频数据是否为窄带音频数据具体为：

根据所述音频数据的频谱判断所述音频数据是否为窄带音频数据。

4.一种音频数据处理方法，其特征在于，包括：

对接收到的多路音频数据进行前置操作；

将所述多路音频数据进行混音；

将混音后的音频数据进行后续操作后分别发送到各接入点。

5.根据权利要求4所述的音频数据处理方法，其特征在于，所述判断其中是否包括窄带音频数据具体为：

根据所述音频数据的采样率和/或协议，判断所述音频数据是否为窄带音频数据。

6.根据权利要求4所述的音频数据处理方法，其特征在于，所述判断其中是否包括窄带音频数据具体为：

根据所述音频数据的频谱，判断所述音频数据是否为窄带音频数据。

7.一种音频数据处理装置，其特征在于，包括：

8.根据权利要求7所述的音频数据处理装置，其特征在于，所述音频识别模块包括：

第一读取单元，用于读取接收到的所述音频数据；

第一判断单元，用于读取所述音频数据的采样率和/或协议，并根据采样率和/或协议判断所述音频数据是否为窄带音频数据。

9.根据权利要求7所述的音频数据处理装置，其特征在于，所述音频识别模块包括：

第二读取单元，用于读取接收到的所述音频数据；

第二判断单元，用于读取所述音频数据的频谱，并根据频谱判断所述音频数据是否为窄带音频数据。

10.一种多点控制单元，其特征在于，包括：

接收模块，用于对接收到的多路音频数据进行前置操作；

其特征在于，还包括：

11.根据权利要求10所述的多点控制单元，其特征在于，所述音频识别模块包括：

第一读取单元，用于读取接收到的所述音频数据；

12.根据权利要求10所述的多点控制单元，其特征在于，所述音频识别模块包括：

第二读取单元，用于读取接收到的所述音频数据；