CN101763859A - 音频数据处理方法、装置和多点控制单元 - Google Patents

音频数据处理方法、装置和多点控制单元 Download PDF

Info

Publication number
CN101763859A
CN101763859A CN 200910258138 CN200910258138A CN101763859A CN 101763859 A CN101763859 A CN 101763859A CN 200910258138 CN200910258138 CN 200910258138 CN 200910258138 A CN200910258138 A CN 200910258138A CN 101763859 A CN101763859 A CN 101763859A
Authority
CN
China
Prior art keywords
voice data
audio
arrowband
data
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200910258138
Other languages
English (en)
Inventor
闫相斌
刘智辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Device Shenzhen Co Ltd
Original Assignee
Shenzhen Huawei Communication Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Huawei Communication Technologies Co Ltd filed Critical Shenzhen Huawei Communication Technologies Co Ltd
Priority to CN 200910258138 priority Critical patent/CN101763859A/zh
Publication of CN101763859A publication Critical patent/CN101763859A/zh
Priority to PCT/CN2010/077865 priority patent/WO2011072551A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提出了一种音频数据处理方法、装置和多点控制单元,属于通讯技术领域。本发明实施例通过判断获得窄带音频数据,并对窄带音频数据进行盲频谱扩展,能够提高宽带音频用户的音频体验,防止对带宽、设备造成浪费。同时,在多点控制单元中进行频谱扩展,相比较现有的通过终端进行处理,可以实现网络侧一次升级即可,无需对终端进行改动,这样可以极大的降低系统升级的成本。并且本发明实施例可以兼容各种型号的终端设备,并可以兼容各种音频协议,提高整个系统的兼容性。

Description

音频数据处理方法、装置和多点控制单元
技术领域
本发明涉及通讯技术领域,特别涉及一种音频数据处理方法、装置和多点控制单元。
背景技术
最早的语音通信系统是传统的PSTN(Public Switched Telephone Network,公共交换电话网络)。PSTN网络中由于语音信号的频谱主要集中在4KHz以下的带宽中,因此早期的PSTN为了节省带宽使用了8KHz的采样率来进行语音编码,这就形成了最早的语音编码协议G.711,现在我们称这些协议为窄带协议。对于基本的语音通信来说,窄带协议能够保证基本的语音可懂度。随着网络和语音技术的发展,出现了使用16KHz采样率的语音协议,典型的就是G.722协议,这些协议被称为宽带音频协议。宽带协议使得声音更逼真更饱满,大大提高了用户的音频体验。而随着网络带宽的发展,网络带宽已不是瓶颈,因此有的通信系统也开始使用超宽带(32KHz采样率)或全带(44KHz以上采样率)音频协议。这时的声音质量可以达到高保真的水平,不光可以传输语音,还可以传输各种音乐,用户音频体验最佳。
由于宽带音频提供了更好更真实的音频体验,因此目前语音通信系统逐渐在向宽带和超宽带过渡,但窄带音频还将与宽带音频共存很长一段时间。在多方进行音频数据传输时,例如进行语音和/或视频通讯时,需要兼顾不同网络环境,支持从窄带到宽带的多种常见协议。下面视讯会议为例进行详细说明。
现有的视频会议系统结构可以简单的表示为如图1所示的结构,包括MCU(MultiPointControl Unit,多点控制单元)和多个接入点:会场1、会场2......会场n。其中,MCU的一个重要功能是对音频数据进行混音,将N路音频数据解码之后进行包络比较后再混成一路,再经过重新编码后发给各个连入的会场。其中“多方”的意思是两方或两方以上。
由于在混音时各个会场使用的协议有可能是不同的,这其中有窄带协议也有宽带协议,因此MCU解码出的音频数据有各种不同的采样率。在进行混音时,为了匹配各种音频采样速率,将所有音频数据进行上采样,使得所有音频具有相同的采样频率,这样就可以将窄带协议的采样率提高到全带(48KHz)。然后进行混音,将多路音频混成一路数据。然后在向连入的会场发送的时候,对该数据再进行协议和采样率匹配,根据各会场使用的协议,对数据再进行下采样,并进行编码,然后将编码后的数据发送到各会场。
在现有技术中,有一种“盲频谱扩展”技术,在中国专利申请号为200680005711.1、名称为《与音频带扩展装置》、公开号为CN101128868A的中国专利中公开了这种技术。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
采用现有技术中的方法,虽然可以通过上采样将音频数据的采样频率提高,但音频数据的频谱还是集中在窄带部分。这样导致多点接入系统中如果有窄带音频数据,则各会场听到的都是窄带音频,会议中的音频体验比较差。对于具有宽带音频能力的会场,拥有好的网络环境和高端终端,却只能听到最差的音频质量,不光使得用户音频体验较差,还造成了带宽和设备的浪费。
发明内容
为了解决现有技术中在多点进行音频数据传输时,由于窄带音频数据与宽带音频数据共存,导致使用宽带音频设备的用户的音频体验差及带宽、设备浪费的问题,本发明实施例提供了一种音频数据处理方法、装置和多点控制单元。所述技术方案如下:
本发明实施例提出了一种音频数据处理方法,包括:
读取接入点发送的音频数据,并判断所述音频数据是否为窄带音频数据;如果是,则将所述音频数据进行盲频谱扩展;如果否,则不对音频数据进行处理;
将宽带音频数据和/或所述盲频谱扩展后的窄带音频数据发送到多点控制单元。
本发明实施例还提出了一种音频数据处理方法,包括:
对接收到的多路音频数据进行前置操作;
读取处理后的多路音频数据,并判断其中是否包括窄带音频数据,如果是则对所述窄带音频数据进行盲频谱扩展;
将所述多路音频数据进行混音;
将混音后的音频数据进行后续操作后分别发送到各接入点。
本发明实施例还提出了一种音频数据处理装置,包括:
音频识别模块,用于读取接入点发送的音频数据,判断所述音频数据是否为窄带音频数据;
频谱扩展模块,用于将所述音频识别模块识别出的窄带音频数据进行盲频谱扩展;
数据发送模块,用于将宽带音频数据和/或所述盲频谱扩展后的窄带音频数据发送到多点控制单元。
本发明实施例还提出了一种多点控制单元,包括:
接收模块,用于对接收到的多路音频数据进行前置操作;
发送模块,用于将混音后的音频数据后续操作后分别发送到各接入点;
还包括:
音频识别模块,用于读取所述接收模块的多路音频数据,并将其中的窄带音频数据发送到频谱扩展模块;
频谱扩展模块,用于将所述音频识别模块识别出的窄带音频数据进行盲频谱扩展;
混音模块,用于将宽带音频数据与所述扩展后的窄带音频数据进行混音,并发送到所述发送模块。
本发明实施例提出了一种音频数据处理方法、装置和多点控制单元,可以应用于多接入点系统,例如多点音频/视频会议系统。本发明实施例通过对窄带音频数据进行盲频谱扩展,这样能够提高宽带音频用户的音频体验,防止对带宽、设备造成浪费。同时,在多点控制单元中进行频谱扩展,相比较现有的通过终端进行处理,可以实现网络侧一次升级即可,无需对终端进行改动,这样可以极大的降低系统升级的成本。并且本发明实施例可以兼容各种型号的终端设备,并可以兼容各种音频协议,提高整个系统的兼容性。
附图说明
图1为现有技术提供的多接入点系统的结构示意图;
图2为本发明第一实施例提供的音频数据处理方法的流程示意图;
图3为本发明第二实施例提供的音频数据处理方法的流程示意图;
图4为本发明第三实施例提供的音频数据处理装置的结构示意图;
图5为本发明第四实施例提供的多点控制单元的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例1
本发明的第一实施例提出了一种音频数据处理方法,其流程如图2所示,包括:
步骤101、读取接入点发送的音频数据;
步骤102、判断该音频数据是否为窄带音频数据;
步骤103、如果是,则将该音频数据进行盲频谱扩展;如果否,则不对该音频数据进行操作;
步骤104、将宽带音频数据和/或盲频谱扩展后的窄带音频数据发送到多点控制单元。
本发明实施例提出了一种音频数据处理方法,通过对窄带音频数据进行盲频谱扩展,从而将窄带音频数据扩展为宽带音频数据。这样在多点控制单元进行混音的时候,每一路音频数据都是宽带音频数据,这样使用宽带音频设备的接入点接收到的就是宽带音频数据。这样能够提高宽带音频用户的音频体验,防止对带宽、设备造成浪费。
该方法可以应用于多点控制单元的前置设备内,预先对接收到的音频数据进行处理后,再发送给多点控制单元。
其中,步骤102的判断音频数据是否为窄带音频数据,可以具体为:通过音频数据的采样率和/或协议,或是通过频谱,判断该音频数据是否为窄带音频数据。
对于通过采样率和/或协议进行判断的方式,则判断音频数据是否为窄带音频数据具体为:
根据该音频数据的采样率和/或协议判断该音频数据是否为窄带音频数据。
由于MCU在对收到的每一个接入点的音频数据进行解码时,可以得知音频码流的协议和采样率。因此音频识别模块可以通过采样率来判断该音频数据是否为8KHz以下,如果是则为窄带音频数据,否则为宽带音频数据。而有些协议的采样率是固定的,例如G.711协议。因此也可以通过直接读取协议进行判断是否为窄带音频数据。
采用这种方式,可以快速的对音频数据进行识别,降低设备的复杂度和升级成本。
对于通过频谱进行判断的方式,则判断音频数据是否为窄带音频数据可以具体包括:
根据该音频数据的频谱判断该音频数据是否为窄带音频数据。
这是由于并不是所有使用宽带音频设备的接入点,其发送到MCU的音频数据就一定是宽带音频数据。例如:某一接入点使用的虽是48KHz采样率的宽带音频数据,而该接入点的声音来源是信号输入(Line in)的经过频带限制的窄带信号,则成为了宽带形式的窄带音频数据。对于这种音频数据,使用前述的那种通过采样率和/或协议无法将其区分出来,还有可能会导致现有技术中存在的问题。而采用这种通过频谱区分的方式,则可以彻底将音频数据进行区分。具体的方法可以为:
频域方法:即对音频数据信号进行快速傅里叶(FFT)变换,计算该信号在4Khz以上频谱总能量,将这部分能量与一个阈值比较,如果大于阈值则该音频数据为宽带音频,如果小于阈值则该音频数据为窄带音频数据;
时域方法:即让信号通过一个截止频率为4Khz的高通滤波器,计算输出信号的时域包络,并用这个包络值与一个阈值比较,如果大于阈值则该音频数据为宽带音频,如果小于阈值则该音频数据为窄带音频数据。
采用这种形式的音频识别模块,可以更为精确地对音频数据进行识别,防止使用宽带音频设备的接入点发送的窄带音频数据对整体效果造成影响。
实施例2
本发明的第二实施例提出了一种音频数据处理方法,其流程如图3所示,包括:
步骤201、对接收到的多路音频数据进行前置操作;
步骤202、读取处理后的多路音频数据,并判断其中是否包括窄带音频数据;
步骤203、如果是,则对该窄带音频数据进行盲频谱扩展;如果否,则不操作;
步骤204、将该多路音频数据进行混音;
步骤205、将混音后的音频数据进行后续操作后分别发送到各接入点。
本发明实施例提出了一种音频数据处理方法,通过对窄带音频数据进行盲频谱扩展,从而将窄带音频数据扩展为宽带音频数据。这样在混音的时候,每一路音频数据都是宽带音频数据,这样使用宽带音频设备的接入点接收到的就是宽带音频数据。这样能够提高宽带音频用户的音频体验,防止对带宽、设备造成浪费。同时,在多点控制单元中进行频谱扩展,相比较现有的通过终端进行处理,可以实现网络侧一次升级即可,无需对终端进行改动,这样可以极大的降低系统升级的成本。并且本发明实施例可以兼容各种型号的终端设备,并可以兼容各种音频协议,提高整个系统的兼容性。
其中,在步骤201中的前置操作,可以包括解码和/或上采样等处理,本领域内技术人员可以根据需要任意设定。且步骤204中的后续操作,可以包括下采样和/或编码等处理,本领域内技术人员可以根据需要任意设定。
其中,步骤202中的判断音频数据是否为窄带音频数据,可以具体为:通过音频数据的采样率和/或协议,或是通过频谱,判断该音频数据是否为窄带音频数据。
对于通过采样率和/或协议进行判断的方式,则判断音频数据是否为窄带音频数据可以具体包括:
根据该音频数据的采样率和/或协议判断该音频数据是否为窄带音频数据。
由于MCU在对收到的每一个接入点的音频数据进行解码时,可以得知音频码流的协议和采样率。因此音频识别模块可以通过采样率来判断该音频数据是否为8KHz以下,如果是则为窄带音频数据,否则为宽带音频数据。而有些协议的采样率是固定的,例如G.711协议。因此也可以通过直接读取协议进行判断是否为窄带音频数据。
采用这种方式,可以快速的对音频数据进行识别,降低设备的复杂度和升级成本。
对于通过频谱进行判断的方式,则判断音频数据是否为窄带音频数据可以具体包括:
根据该音频数据的频谱判断该音频数据是否为窄带音频数据。
这是由于并不是所有使用宽带音频设备的接入点,其发送到MCU的音频数据就一定是宽带音频数据。例如:某一接入点使用的虽是48KHz采样率的宽带音频数据,而该接入点的声音来源是信号输入(Line in)的经过频带限制的窄带信号,则成为了宽带形式的窄带音频数据。对于这种音频数据,使用前述的那种通过采样率和/或协议无法将其区分出来,还有可能会导致现有技术中存在的问题。而采用这种通过频谱区分的方式,则可以彻底将音频数据进行区分。具体的方法可以为:
频域方法:即对音频数据信号进行快速傅里叶(FFT)变换,计算该信号在4Khz以上频谱总能量,将这部分能量与一个阈值比较,如果大于阈值则该音频数据为宽带音频,如果小于阈值则该音频数据为窄带音频数据;
时域方法:即让信号通过一个截止频率为4Khz的高通滤波器,计算输出信号的时域包络,并用这个包络值与一个阈值比较,如果大于阈值则该音频数据为宽带音频,如果小于阈值则该音频数据为窄带音频数据。
采用这种形式的音频识别模块,可以更为精确地对音频数据进行识别,防止使用宽带音频设备的接入点发送的窄带音频数据对整体效果造成影响。
实施例3
本发明的第三实施例提出了一种音频数据处理装置,其结构如图4所示,包括:
音频识别模块11,用于读取接收到的音频数据,判断该音频数据是否为窄带音频数据;
频谱扩展模块12,用于将该音频识别模块识别出的窄带音频数据进行盲频谱扩展;
数据发送模块13,用于将宽带音频数据和/或盲频谱扩展后的窄带音频数据发送到多点控制单元。
本发明实施例提出了一种音频数据处理装置,对窄带音频数据进行盲频谱扩展,从而将窄带音频数据扩展为宽带音频数据。这样在多点控制单元进行混音的时候,每一路音频数据都是宽带音频数据,使用宽带音频设备的接入点接收到的就是宽带音频数据。本发明实施例能够提高宽带音频用户的音频体验,防止对带宽、设备造成浪费。
本发明实施例的处理装置,可以作为多点控制单元的前置设备,预先对接收到的音频数据进行处理后,再发送给多点控制单元。
其中,音频识别模块可以通过音频数据的采样率和/或协议,或是通过频谱,判断该音频数据是否为窄带音频数据。
对于通过采样率和/或协议进行判断的音频识别模块,可以具体包括:
第一读取单元,用于读取接收到的该音频数据;
第一判断单元,用于读取该音频数据的采样率和/或协议,并根据采样率和/或协议判断该音频数据是否为窄带音频数据。
由于MCU在对收到的每一个接入点的音频数据进行解码时,可以得知音频码流的协议和采样率。因此音频识别模块可以通过采样率来判断该音频数据是否为8KHz以下,如果是则为窄带音频数据,否则为宽带音频数据。而有些协议的采样率是固定的,例如G.711协议。因此也可以通过直接读取协议进行判断是否为窄带音频数据。
采用这种形式的音频识别模块,可以快速的对音频数据进行识别,降低设备的复杂度和升级成本。
对于通过频谱进行判断的音频识别模块,可以具体包括:
第二读取单元,用于读取接收到的该音频数据;
第二判断单元,用于读取该音频数据的频谱,并根据频谱判断该音频数据是否为窄带音频数据。
这是由于并不是所有使用宽带音频设备的接入点,其发送到MCU的音频数据就一定是宽带音频数据。例如:某一接入点使用的虽是48KHz采样率的宽带音频数据,而该接入点的声音来源是信号输入(Line in)的经过频带限制的窄带信号,则成为了宽带形式的窄带音频数据。对于这种音频数据,使用前述的那种通过采样率和/或协议无法将其区分出来,还有可能会导致现有技术中存在的问题。而采用这种通过频谱区分的方式,则可以彻底将音频数据进行区分。具体的方法可以为:
频域方法:即对音频数据信号进行快速傅里叶(FFT)变换,计算该信号在4Khz以上频谱总能量,将这部分能量与一个阈值比较,如果大于阈值则该音频数据为宽带音频,如果小于阈值则该音频数据为窄带音频数据;
时域方法:即让信号通过一个截止频率为4Khz的高通滤波器,计算输出信号的时域包络,并用这个包络值与一个阈值比较,如果大于阈值则该音频数据为宽带音频,如果小于阈值则该音频数据为窄带音频数据。
采用这种形式的音频识别模块,可以更为精确地对音频数据进行识别,防止使用宽带音频设备的接入点发送的窄带音频数据对整体效果造成影响。
实施例4
本发明的第四实施例提出了一种多点控制单元,其结构如图5所示,包括:
接收模块4,用于对接收到的多路音频数据进行前置操作;
发送模块5,用于将混音后的音频数据进行后续操作后分别发送到各接入点;
还包括:
音频识别模块1,用于读取该接收模块的多路音频数据,并将其中的窄带音频数据发送到频谱扩展模块;
频谱扩展模块2,用于将该音频识别模块识别出的窄带音频数据进行盲频谱扩展;
混音模块3,用于将宽带音频数据与该扩展后的窄带音频数据进行混音,并发送到该发送模块。
本发明实施例提出了一种多点控制单元。现有的多点控制单元只有接收模块、发送模块和混音模块,对接收到的多路音频信号进行解码后上采样,然后进行混音,混音后再进行下采样和编码,发送到接入点。本发明实施例增加了音频识别模块、频谱扩展模块,并对混音模块进行了改进:对窄带音频数据进行盲频谱扩展,从而将窄带音频数据扩展为宽带音频数据。这样在混音的时候,每一路音频数据都是宽带音频数据,使用宽带音频设备的接入点接收到的就是宽带音频数据。本发明实施例能够提高宽带音频用户的音频体验,防止对带宽、设备造成浪费。同时,在多点控制单元中进行频谱扩展,相比较现有的通过终端进行处理,可以实现网络侧一次升级即可,无需对终端进行改动,这样可以极大的降低系统升级的成本。并且本发明实施例可以兼容各种型号的终端设备,并可以兼容各种音频协议,提高整个系统的兼容性。
其中,接收模块的前置操作,可以包括解码和/或上采样等处理,本领域内技术人员可以根据需要任意设定。发送模块的后续操作,可以包括下采样和/或编码等处理,本领域内技术人员可以根据需要任意设定。
其中,音频识别模块可以通过音频数据的采样率和/或协议,或是通过频谱,判断该音频数据是否为窄带音频数据。
对于通过采样率和/或协议进行判断的音频识别模块,可以具体包括:
第一读取单元,用于读取接收到的该音频数据;
第一判断单元,用于读取该音频数据的采样率和/或协议,并根据采样率和/或协议判断该音频数据是否为窄带音频数据。
由于MCU在对收到的每一个接入点的音频数据进行解码时,可以得知音频码流的协议和采样率。因此音频识别模块可以通过采样率来判断该音频数据是否为8KHz以下,如果是则为窄带音频数据,否则为宽带音频数据。而有些协议的采样率是固定的,例如G.711协议。因此也可以通过直接读取协议进行判断是否为窄带音频数据。
采用这种形式的音频识别模块,可以快速的对音频数据进行识别,降低设备的复杂度和升级成本。
对于通过频谱进行判断的音频识别模块,可以具体包括:
第二读取单元,用于读取接收到的该音频数据;
第二判断单元,用于读取该音频数据的频谱,并根据频谱判断该音频数据是否为窄带音频数据。
这是由于并不是所有使用宽带音频设备的接入点,其发送到MCU的音频数据就一定是宽带音频数据。例如:某一接入点使用的虽是48KHz采样率的宽带音频数据,而该接入点的声音来源是信号输入(Line in)的经过频带限制的窄带信号,则成为了宽带形式的窄带音频数据。对于这种音频数据,使用前述的那种通过采样率和/或协议无法将其区分出来,还有可能会导致现有技术中存在的问题。而采用这种通过频谱区分的方式,则可以彻底将音频数据进行区分。具体的方法可以为:
频域方法:即对音频数据信号进行快速傅里叶(FFT)变换,计算该信号在4Khz以上频谱总能量,将这部分能量与一个阈值比较,如果大于阈值则该音频数据为宽带音频,如果小于阈值则该音频数据为窄带音频数据;
时域方法:即让信号通过一个截止频率为4Khz的高通滤波器,计算输出信号的时域包络,并用这个包络值与一个阈值比较,如果大于阈值则该音频数据为宽带音频,如果小于阈值则该音频数据为窄带音频数据。
采用这种形式的音频识别模块,可以更为精确地对音频数据进行识别,防止使用宽带音频设备的接入点发送的窄带音频数据对整体效果造成影响。
本发明上述每一实施例,可应用于多接入点的音频传输系统。其中“多接入点”的意思为两个或两个以上的接入点。典型的多接入点音频传输系统为多点音频/视频会议系统,当然本发明实施例还可以应用于其他多接入点的音频传输系统。
以上实施例提供的技术方案中的全部或部分内容可以通过软件编程实现,其软件程序存储在可读取的存储介质中,存储介质例如:计算机中的硬盘、光盘或软盘。
以上该仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种音频数据处理方法,其特征在于,包括:
读取接入点发送的音频数据,并判断所述音频数据是否为窄带音频数据;如果是,则将所述音频数据进行盲频谱扩展;
将宽带音频数据和/或所述盲频谱扩展后的窄带音频数据发送到多点控制单元。
2.根据权利要求1所述的音频数据处理方法,其特征在于,所述判断音频数据是否为窄带音频数据具体为:
根据所述音频数据的采样率和/或协议判断所述音频数据是否为窄带音频数据。
3.根据权利要求1所述的音频数据处理方法,其特征在于,所述判断音频数据是否为窄带音频数据具体为:
根据所述音频数据的频谱判断所述音频数据是否为窄带音频数据。
4.一种音频数据处理方法,其特征在于,包括:
对接收到的多路音频数据进行前置操作;
读取处理后的多路音频数据,并判断其中是否包括窄带音频数据,如果是则对所述窄带音频数据进行盲频谱扩展;
将所述多路音频数据进行混音;
将混音后的音频数据进行后续操作后分别发送到各接入点。
5.根据权利要求4所述的音频数据处理方法,其特征在于,所述判断其中是否包括窄带音频数据具体为:
根据所述音频数据的采样率和/或协议,判断所述音频数据是否为窄带音频数据。
6.根据权利要求4所述的音频数据处理方法,其特征在于,所述判断其中是否包括窄带音频数据具体为:
根据所述音频数据的频谱,判断所述音频数据是否为窄带音频数据。
7.一种音频数据处理装置,其特征在于,包括:
音频识别模块,用于读取接入点发送的音频数据,判断所述音频数据是否为窄带音频数据;
频谱扩展模块,用于将所述音频识别模块识别出的窄带音频数据进行盲频谱扩展;
数据发送模块,用于将宽带音频数据和/或所述盲频谱扩展后的窄带音频数据发送到多点控制单元。
8.根据权利要求7所述的音频数据处理装置,其特征在于,所述音频识别模块包括:
第一读取单元,用于读取接收到的所述音频数据;
第一判断单元,用于读取所述音频数据的采样率和/或协议,并根据采样率和/或协议判断所述音频数据是否为窄带音频数据。
9.根据权利要求7所述的音频数据处理装置,其特征在于,所述音频识别模块包括:
第二读取单元,用于读取接收到的所述音频数据;
第二判断单元,用于读取所述音频数据的频谱,并根据频谱判断所述音频数据是否为窄带音频数据。
10.一种多点控制单元,其特征在于,包括:
接收模块,用于对接收到的多路音频数据进行前置操作;
发送模块,用于将混音后的音频数据后续操作后分别发送到各接入点;
其特征在于,还包括:
音频识别模块,用于读取所述接收模块的多路音频数据,并将其中的窄带音频数据发送到频谱扩展模块;
频谱扩展模块,用于将所述音频识别模块识别出的窄带音频数据进行盲频谱扩展;
混音模块,用于将宽带音频数据与所述扩展后的窄带音频数据进行混音,并发送到所述发送模块。
11.根据权利要求10所述的多点控制单元,其特征在于,所述音频识别模块包括:
第一读取单元,用于读取接收到的所述音频数据;
第一判断单元,用于读取所述音频数据的采样率和/或协议,并根据采样率和/或协议判断所述音频数据是否为窄带音频数据。
12.根据权利要求10所述的多点控制单元,其特征在于,所述音频识别模块包括:
第二读取单元,用于读取接收到的所述音频数据;
第二判断单元,用于读取所述音频数据的频谱,并根据频谱判断所述音频数据是否为窄带音频数据。
CN 200910258138 2009-12-16 2009-12-16 音频数据处理方法、装置和多点控制单元 Pending CN101763859A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN 200910258138 CN101763859A (zh) 2009-12-16 2009-12-16 音频数据处理方法、装置和多点控制单元
PCT/CN2010/077865 WO2011072551A1 (zh) 2009-12-16 2010-10-19 音频数据处理方法、装置和多点控制单元

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200910258138 CN101763859A (zh) 2009-12-16 2009-12-16 音频数据处理方法、装置和多点控制单元

Publications (1)

Publication Number Publication Date
CN101763859A true CN101763859A (zh) 2010-06-30

Family

ID=42494977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200910258138 Pending CN101763859A (zh) 2009-12-16 2009-12-16 音频数据处理方法、装置和多点控制单元

Country Status (2)

Country Link
CN (1) CN101763859A (zh)
WO (1) WO2011072551A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011072551A1 (zh) * 2009-12-16 2011-06-23 华为终端有限公司 音频数据处理方法、装置和多点控制单元
CN105378831A (zh) * 2013-06-21 2016-03-02 弗朗霍夫应用科学研究促进协会 针对切换式音频编码系统在错误隐藏过程中的改善信号衰落的装置及方法
CN107886966A (zh) * 2017-10-30 2018-04-06 捷开通讯(深圳)有限公司 终端及其优化语音命令的方法、存储装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002082685A (ja) * 2000-06-26 2002-03-22 Matsushita Electric Ind Co Ltd 音声帯域拡張装置及び音声帯域拡張方法
US20020128839A1 (en) * 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US8712768B2 (en) * 2004-05-25 2014-04-29 Nokia Corporation System and method for enhanced artificial bandwidth expansion
CN100585699C (zh) * 2007-11-02 2010-01-27 华为技术有限公司 一种音频解码的方法和装置
CN101763859A (zh) * 2009-12-16 2010-06-30 深圳华为通信技术有限公司 音频数据处理方法、装置和多点控制单元

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011072551A1 (zh) * 2009-12-16 2011-06-23 华为终端有限公司 音频数据处理方法、装置和多点控制单元
US10679632B2 (en) 2013-06-21 2020-06-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved signal fade out for switched audio coding systems during error concealment
CN105378831B (zh) * 2013-06-21 2019-05-31 弗朗霍夫应用科学研究促进协会 针对切换式音频编码系统在错误隐藏过程中的改善信号衰落的装置及方法
US10607614B2 (en) 2013-06-21 2020-03-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method realizing a fading of an MDCT spectrum to white noise prior to FDNS application
US10672404B2 (en) 2013-06-21 2020-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an adaptive spectral shape of comfort noise
CN105378831A (zh) * 2013-06-21 2016-03-02 弗朗霍夫应用科学研究促进协会 针对切换式音频编码系统在错误隐藏过程中的改善信号衰落的装置及方法
US10854208B2 (en) 2013-06-21 2020-12-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method realizing improved concepts for TCX LTP
US10867613B2 (en) 2013-06-21 2020-12-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved signal fade out in different domains during error concealment
US11462221B2 (en) 2013-06-21 2022-10-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an adaptive spectral shape of comfort noise
US11501783B2 (en) 2013-06-21 2022-11-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method realizing a fading of an MDCT spectrum to white noise prior to FDNS application
US11776551B2 (en) 2013-06-21 2023-10-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved signal fade out in different domains during error concealment
US11869514B2 (en) 2013-06-21 2024-01-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved signal fade out for switched audio coding systems during error concealment
CN107886966A (zh) * 2017-10-30 2018-04-06 捷开通讯(深圳)有限公司 终端及其优化语音命令的方法、存储装置

Also Published As

Publication number Publication date
WO2011072551A1 (zh) 2011-06-23

Similar Documents

Publication Publication Date Title
CN103299366B (zh) 用于编码及检测带水印信号的装置
CN101175255B (zh) 用于通过无线通信网络的话音信道进行数据通信的方法
CN101091206B (zh) 语音编码装置和语音编码方法
US9048784B2 (en) Method for data communication via a voice channel of a wireless communication network using continuous signal modulation
CN102216983B (zh) 用于编码与信号源相关联的至少一个参数的设备和方法
KR101590239B1 (ko) 워터마킹된 신호를 인코딩 및 디코딩하는 디바이스들
CN108235052A (zh) 基于ios可选择多音频通道硬件混音、采集及播放的方法
CN105191269A (zh) 使用隐写地嵌入的音频数据的远程会议
KR101279857B1 (ko) 적응적 멀티 레이트 코덱 모드 디코딩 방법 및 장치
KR20130126700A (ko) 워터마킹된 신호의 적응적 인코딩 및 디코딩을 위한 디바이스
CN101763859A (zh) 音频数据处理方法、装置和多点控制单元
CN105551491A (zh) 语音识别方法和设备
CN108882216A (zh) 一种基于蓝牙ble技术的音频数据传输方法及系统
CN107809409A (zh) 一种语音数据的发送、接收和交互的方法及装置
CN107391498B (zh) 语音翻译方法和装置
JP4437011B2 (ja) 音声符号化装置
CN101926159A (zh) 声音混合装置和方法以及多点会议服务器
WO2022146525A1 (en) Systems and methods for conducting an automated dialogue
US7395202B2 (en) Method and apparatus to facilitate vocoder erasure processing
CN112509591B (zh) 一种音频编解码方法及系统
Fantacci et al. A secure radio communication system based on an efficient speech watermarking approach
KR100428717B1 (ko) 무선 데이터 채널상에서의 음성파일 송수신 방법
CN113555024A (zh) 实时通信音频处理方法、装置、电子设备和存储介质
TW504906B (en) Method and apparatus for decoding digital audio data
TWI387960B (zh) 採用多媒體編解碼器之來電答鈴服務方法及系統

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100630