CN105096960A - 实现宽带分组语音的基于分组的声学回声消除方法与设备 - Google Patents
实现宽带分组语音的基于分组的声学回声消除方法与设备 Download PDFInfo
- Publication number
- CN105096960A CN105096960A CN201410199215.0A CN201410199215A CN105096960A CN 105096960 A CN105096960 A CN 105096960A CN 201410199215 A CN201410199215 A CN 201410199215A CN 105096960 A CN105096960 A CN 105096960A
- Authority
- CN
- China
- Prior art keywords
- bit stream
- frequency band
- acoustic echo
- broadband packet
- band bit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明的目的是提供一种用于实现宽带分组语音的基于分组的声学回声消除的方法与设备。具体地,获取待处理的宽带分组语音;根据以下任一项处理方式,对宽带分组语音进行声学回声消除处理:-将宽带分组语音分离为低频带位流和高频带位流,并对低频带位流和低频带位流进行声学回声消除处理;-基于宽带分组语音包含的相关参数,对宽带分组语音进行声学回声消除处理。与现有技术相比,本发明通过多种处理方式对所述宽带分组语音进行声学回声消除处理,来实现消除宽带分组语音中的声学回声;且本发明可与现有的窄带PAEC算法兼容,易于实现。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种用于实现宽带分组语音的基于分组的声学回声消除技术。
背景技术
相比于传统的声学回声消除(AEC,acousticechocancellation)技术,基于分组的声学回声消除(PAEC,Packet-basedAEC)是AEC技术的发展趋势,因其能够更有效并迅速地检测与消除/抑制语音分组中的声学回声。现有技术中,对于分组网络,有供应商采用伪PAEC技术,该方法首先将分组流解码为模拟信号或数字信号,在波形域重新使用传统的AEC技术来消除信号中的声学回声,然后将已消除声学回声的信号重新编码回到分组。伪PAEC技术甚至劣于传统的AEC,因其建立在传统AEC之上并引入了多次编码/解码。
随着高清语音(HDvoice)尤其是VoLTE(VoiceoverLTE)的蓬勃发展,分组网络需要相应地提供宽带基于分组的声学回声消除(WBPAEC,WidebandPAEC),因为不是所有的用户设备(UE,UserEquipment)都配备了AEC,若UE产生声学回声,网络侧需要用PAEC确保声学回声不会经过网络传输。
要充分支持VoLTE和HDvoice,VoLTE产品系统中的WBPAEC就成为了一项关键特性。HDvoice或宽带语音已在文献和标准说明(如EVRC-WB(宽带增强型变速率编解码,widebandEnhancedVariableRateCodec)、EVRC-NW(窄宽带增强型变速率编解码,Narrowband-WidebandEnhancedVariableRateCodec)、宽带语音标准G.722、G.722.2(AMR-WB(自适应多速率宽带,AdaptiveMulti-rate-Wideband)),等等)中有定义,而现有技术中无任何WBPAEC解决方案。
发明内容
本发明的目的是提供一种用于实现宽带分组语音的基于分组的声学回声消除的方法与设备。
根据本发明的一个方面,提供了一种实现宽带分组语音的基于分组的声学回声消除的方法,其中,该方法包括:
a获取待处理的宽带分组语音;
b根据以下任一项处理方式,对所述宽带分组语音进行声学回声消除处理:
-将所述宽带分组语音分离为低频带位流和高频带位流,并对所述低频带位流和高频带位流进行声学回声消除处理;
-基于所述宽带分组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理。
根据本发明的另一个方面,还提供了一种用于实现宽带分组语音的基于分组的声学回声消除的设备,其中,该设备包括:
获取装置,用于获取待处理的宽带分组语音;
回声消除装置,用于根据以下任一项处理方式,对所述宽带分组语音进行声学回声消除处理:
-将所述宽带分组语音分离为低频带位流和高频带位流,并对所述低频带位流和高频带位流进行声学回声消除处理;
-基于所述宽带分组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理。
根据本发明的再一个方面,还提供了一种宽带基于分组的声学回声消除设备,其中,该宽带基于分组的声学回声消除设备包括如前述根据本发明另一个方面的一种用于实现宽带分组语音的基于分组的声学回声消除的设备。
与现有技术相比,本发明通过将宽带分组语音分离为低频带位流和高频带位流,并对所述低频带位流和高频带位流进行声学回声消除处理,或者,基于所述宽带分组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理,来实现消除宽带分组语音中的声学回声,使得不用解码即可消除宽带分组语音中的声学回声;且本发明可与现有的窄带PAEC算法兼容,易于实现。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的一种用于实现宽带分组语音的基于分组的声学回声消除的设备示意图;
图2以EVRC-WB为例示出包括低频带(LB,low-band)和高频带(HB,high-band)部分的宽带语音概念性示意图;
图3示出一个实施例的消除宽带分组语音中的声学回声的过程示意图;
图4示出另一个实施例的消除宽带分组语音中的声学回声的过程示意图;
图5示出再一个实施例的消除宽带分组语音中的声学回声的过程示意图;
图6示出还一个实施例的消除宽带分组语音中的声学回声的过程示意图;
图7示出又一个实施例的消除宽带分组语音中的声学回声的过程示意图;
图8示出根据本发明一个优选实施例的一种用于实现宽带分组语音的基于分组的声学回声消除的设备示意图;
图9示出还一个实施例的消除宽带分组语音中的声学回声的过程示意图;
图10示出根据本发明另一个方面的一种用于实现宽带分组语音的基于分组的声学回声消除的方法流程图;
图11示出根据本发明一个优选实施例的一种用于实现宽带分组语音的基于分组的声学回声消除的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的一种用于实现宽带分组语音的基于分组的声学回声消除的设备1,其中,设备1包括获取装置11和回声消除装置12。具体地,获取装置11获取待处理的宽带分组语音;回声消除装置12根据以下任一项处理方式,对所述宽带分组语音进行声学回声消除处理:-将所述宽带分组语音分离为低频带位流和高频带位流,并对所述低频带位流和高频带位流进行声学回声消除处理;-基于所述宽带分组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理。
在此,所述设备1是任何一种可消除宽带分组语音中的声学回声的电子产品,其可应用于任何宽带编解码,还可部署于用户设备(UE)中/UE端,或者也可部署于分组网络的网络侧中,如部署于网络侧实体MSC(移动交换中心,MobileSwitchingCenter)或MGW(媒体网关,MediaGateWay)。优选地,设备1部署于网络侧。本领域技术人员应能理解上述设备1仅为举例,其他现有的或今后可能出现的宽带基于分组的声学回声消除设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,所述用户设备包括但不限于任何一种可与用户通过键盘、触摸板、或声控设备进行人机交互并能通过移动网络与基站进行信号的相互传送和接收来达到移动通信信号的传送的电子产品,例如平板电脑、智能手机、手机、PDA、IP电话等。在此,设备1包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。
在此,为更清楚地说明本发明的方案,先对宽带语音说明如下:
宽带语音(WidebandAudio),又称高清语音(HDVoice)。人声带宽约为80Hz至14kHz,但一般语音电话的带宽只覆盖300Hz至3.4kHz,高清语音把语音电话覆盖的带宽扩展到50Hz至7kHz或更广,并减轻环境噪音的影响,使通话品质更加清晰。宽带语音分为低频带部分和高频带部分,低频带部分通常被分配较多资源,而高频带部分通常被分配较少资源,其多为摩擦音、噪声等辅助音。图2以EVRC-WB为例示出包括低频带(LB,low-band)和高频带(HB,high-band)部分的宽带语音概念性示意图。
需要说明的是,对宽带语音的说明仅用于更好地理解本发明的方案,而不是对本发明的限制。
以下参考图1对本方案的实施例进行说明:
具体地,获取装置11通过分组网络中的分组交换网络的输入或输出接口,或者,通过将数字语音数据分割为可以在IP网络上传输的分组数据的设备如IP电话网关的输出接口,获取待处理的宽带分组语音。例如,假设用户A通过其用户设备UEa拨打用户B的手机UEb,以与用户B进行通话,语音编码器以G.722宽带语音编码算法,将用户的话音转换为数字话音,速率为64Kbit/s,然后经IP电话网关将数字语音数据通过IP协议分割为可在分组网络上传输的分组数据,则获取装置11可通过IP电话网关的输出接口获取到用户A的语音,相应地即获取到待处理的宽带分组语音如widebandpacketvoice-a(G.72264Kbit/s)。
本领域技术人员应能理解上述获取待处理的宽带分组语音的方式仅为举例,其他现有的或今后可能出现的获取待处理的宽带分组语音的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
回声消除装置12根据以下任一项处理方式,对所述宽带分组语音进行声学回声消除处理:i)将所述宽带分组语音分离为低频带位流和高频带位流,并对所述低频带位流和高频带位流进行声学回声消除处理;ii)基于所述宽带分组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理。
例如,当回声消除装置12以上述处理方式i)对所述宽带分组语音进行声学回声消除处理时,回声消除装置12的处理过程包括但不限于以下至少任一项:
1)首先将所述宽带分组语音分离为低频带位流和高频带位流,以对所述低频带位流和高频带位流分别进行声学回声消除处理;接着,将分别经声学回声消除处理后的所述低频带位流和所述高频带位流进行合并,以获得消除声学回声的所述宽带分组语音。
例如,接上例,回声消除装置12首先通过信号分离器(demultiplexer,DMUX)将宽带分组语音如widebandpacketvoice-a(G.72264Kbit/s)分离为LB位流如LBpacketvoice-a和HB位流如HBpacketvoice-a,如LBpacketvoice-a为48Kbit/s,HBpacketvoice-a为16Kbit/s;然后回声消除装置12采用现有技术中的窄带PAEC(NBPAEC,narrowbandPAEC)技术分别消除LB位流如LBpacketvoice-a和HB位流如HBpacketvoice-a中的声学回声,得到消除了声学回声的LB位流如echofreeLBpacketvoice-a与消除了声学回声的HB位流如echofreeHBpacketvoice-a;接着,回声消除装置12通过多路复用器(multiplexer,MUX)将消除了声学回声的LB位流如echofreeLBpacketvoice-a和echofreeHBpacketvoice-a合并,即可得到消除声学回声的所述宽带分组语音如echofreewidebandpacketvoice-a(echofreeG.72264Kbit/s),该过程如图3所示。
在此,本领域技术人员可以理解,通常,编码器/解码器集成了D/MUX,本发明可确定使用现有的D/MUX,或者具有其自身的D/MUX。此外,消除HB位流中的声学回声时,可微调现有的NBPAEC算法或者设计新的算法以适应HB位流的特性。
2)首先将所述宽带分组语音分离为低频带位流和高频带位流;然后,对所述低频带位流进行声学回声消除处理;接着,再将所述高频带位流和经声学回声消除处理后的所述低频带位流进行合并,以获得消除声学回声的所述宽带分组语音。
例如,还接上例,回声消除装置12可仍首先通过信号分离器(demultiplexer,DMUX)将宽带分组语音如widebandpacketvoice-a(G.72264Kbit/s)分离为LB位流如LBpacketvoice-a和HB位流如HBpacketvoice-a,如LBpacketvoice-a为48Kbit/s,HBpacketvoice-a为16Kbit/s;然后,回声消除装置12采用现有技术中的窄带PAEC(NBPAEC,narrowbandPAEC)技术仅消除LB位流如LBpacketvoice-a中的声学回声,得到消除了声学回声的LB位流如echofreeLBpacketvoice-a;接着,回声消除装置12通过多路复用器(multiplexer,MUX)将消除了声学回声的LB位流如echofreeLBpacketvoice-a和HB位流如HBpacketvoice-a合并,即可得到消除声学回声的所述宽带分组语音如echofreewidebandpacketvoice-a(echofreeG.72264kbit/s),该过程如图4所示。
在此,本发明仅聚焦在LB位流上,因为:1)分配给LB位流的带宽远多于分配给HB位流的带宽,即LB位流是WB分组语音的主要部分;2)LB位流相比于HB位流更多地代表语音波形,而HB位流相比于LB位流更多地代表语音的清晰度,LB位流在确定语音的含义上起决定性作用;3)由于HB位流的衰减和干扰,HB位流可能不包含或包含很少的回声。此时,HB位流中的声学回声可被忽略。
在此,本领域技术人员应能理解,当回声消除装置12以上述处理方式i)对所述宽带分组语音进行声学回声消除处理时,所述宽带分组语音的所对应的编解码类型包括但不限于如G.722等,上述实施例中的编解码类型G.722仅为举例,其他现有的或今后可能出现的编解码类型如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
再如,当回声消除装置12以上述处理方式ii)对所述宽带分组语音进行声学回声消除处理时,具体地,回声消除装置12首先基于所述宽带分组语音包含的相关参数,检测所述宽带分组语音中的第二声学回声;接着,对检测到的所述第二声学回声进行回声消除处理。优选地,所述相关参数包括但不限于以下至少任一项:
-所述宽带分组语音包含的低频带参数;
-所述宽带分组语音包含的通用参数或高频带参数。
在此,所述宽带分组语音所对应的编解码类型包括但不限于如EVRC-WB、EVRC-NW等。本领域技术人员应能理解上述编解码类型仅为举例,其他现有的或今后可能出现的编解码类型如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,需要首先说明的是,若宽带分组语音包含的低频带参数和高频带参数已是天然分离的,本发明可直接使用相关参数检测和消除/抑制宽带分组语音中的声学回声,而无需DMUX将宽带分组语音分离为LB位流和HB位流。此时,本发明将重用现有窄带PAEC算法以处理LB参数,微调现有窄带PAEC算法以处理HB参数并适应HB参数的特性。
例如,若获取装置11获取到的宽带分组语音对应的编解码类型为EVRC-WB,则回声消除装置12可首先基于所述宽带分组语音包含的相关参数,如基于低频带LSP(线谱对,Line-Spectrumpair)参数,检测所述宽带分组语音中的第二声学回声,相关实施例已于下列专利申请中公开:1)公开号为101933306A、题为“用于在分组网络中检测和抑制回声的方法和设备”的进入中国国家阶段的PCT申请;2)公开号为101542600、题为“基于分组的回音取消和抑制”的进入中国国家阶段的PCT申请;3)申请日为2008年9月4日、申请号为US12/231,646、题为“用于基于通信网络使用帧能量估计检测并抑制分组中的回声的方法与设备”(Methodandapparatusforthedetectionandsuppressionofechoinpacketbasedcommunicationnetworksusingframeenergyestimation)的美国专利申请,在此通过合并的方式包含于此;然后回声消除装置12对检测到的所述第二声学回声进行回声消除处理,如将检测到的所述第二声学回声从所述宽带分组语音中减去,该过程如图5所示。
对于EVRC-WB编解码类型,其可自适应选择编解码所采用的帧类型,如全速率WBCELP、全速率WBMDCT(改进的离散余弦变换,ModifiedDiscreteCosineTransform),或者半速率WBNELP(噪声激励线性预测,NoiseExcitedLinearPrediction)等等,以上帧类型的分组格式如以下表1至3所示,其中,表1示出全速率WBCELP帧的分组格式,表2示出全速率WBMDCT帧的分组格式,表3示出半速率WBNELP帧的分组格式:
参数(数值) | bit位数 | 分组中的bit索引 |
Delayhldex | 7 | P0-P6 |
LSP_IDX0 | 6 | P7-P12 |
LSP_IDX1 | 6 | P13-P18 |
LSP_IDX2 | 9 | P19-P27 |
LSP_IDX3 | 7 | P28-P34 |
ACBG_IDX_SF0 | 3 | P35-P37 |
ACBG_IDX_SF1 | 3 | P38-P40 |
ACBG_IDX_SF2 | 3 | P41-P43 |
FCB_PULSE_IDX_DELAY_ADJUST | 94 | P44-P137 |
FCBG_IDX_SF0 | 5 | P138-P142 |
FCBG_IDX_SF1 | 5 | P143-P147 |
FCBG_IDX_SF2 | 5 | P148-P152 |
HIGHBAND_LSP_IDX | 8 | Pl53-P160 |
HIGHBAND_GAIN_SHAPE_IDX | 4 | P161-P164 |
HIGHBAND_GAIN_FRAME_IDX | 4 | P165-P168 |
MODEBIT(CELP/MDCT)(0) | 1 | P169 |
EVRCB_IO_FLAG(1) | 1 | P170 |
表1
参数(数值) | bit位数 | 分组中的bit索引 |
LSP_IDX | 28 | P0-P27 |
MDCT_INDEX | 114 | P28-P141 |
FRAME_GAIN_INDEX | 7 | P142-P148 |
NOISE_GAIN_INDEX | 2 | P149-P150 |
HIGHBAND_LSP_IDX | 8 | P151-P158 |
HIGHBAND_GAIN_SHAPE_IDX | 4 | Pl59-P162 |
HIGHBAND_GAIN_FRAME_IDX | 4 | P163-P166 |
RESERVED | 1 | 167 |
NB_WB_MODE_BIT(1) | 1 | P168 |
MODEBIT(CELP/hIDCT/)(1) | 1 | P169 |
EVRCB_IO_FLAG(1) | 1 | P170 |
表2
参数(数值) | bit位数 | 分组中的bit索引 |
WB_HALFRATE_IDENTIFIER(0x3F) | 6 | P0-P5 |
LSP_IDX | 28 | P6-P33 |
NELP_GAIN_INDEX | 17 | P34-P50 |
NELP_FILTER_ID | 2 | P51-P52 |
HIGHBAND_LSP_DX | 12 | P53-P64 |
HIGHBAND_GAIN_SHAPE_IDX | 8 | P65-P72 |
HIGHBAND_GAIN_FRAME_IDX | 7 | P73-P79 |
表3
从上述表1至3可以看出,全速率WBCELP、全速率WBMDCT和半速率WBNELP均包含(LB)LSP参数(即LSP_IDX[])和HBLSP参数(即HIGHBAND_LSP_IDX),LSP参数比较可被用于检测声学回声。优选地,在声学回声检测过程中HBLSP参数可被忽略,也即HBLSP参数用于声学回声检测的贡献因子为0。
在此,因LB位流相比于HB位流更多地代表语音波形,且具有较多的含义,本发明通过使用LB参数来检测声学回声的方法提高了声学回声检测的效率。
再如,在具有较少干扰的环境中,HB位流所代表的语音波形和语音能量可用于检测声学回声,例如,若获取装置11获取到的宽带分组语音所对应的编解码类型为EVRC-WB,则回声消除装置12可基于所述宽带分组语音包含的相关参数,如基于通用参数或高频带参数(即非LB参数),检测所述宽带分组语音中的第二声学回声,相关实施例已于下列专利申请中公开:1)公开号为101933306A、题为“用于在分组网络中检测和抑制回声的方法和设备”的进入中国国家阶段的PCT申请;2)公开号为101542600、题为“基于分组的回音取消和抑制”的进入中国国家阶段的PCT申请;3)申请日为2008年9月4日、申请号为US12/231,646、题为“用于基于通信网络使用帧能量估计检测并抑制分组中的回声的方法与设备”(Methodandapparatusforthedetectionandsuppressionofechoinpacketbasedcommunicationnetworksusingframeenergyestimation)的美国专利申请,在此通过合并的方式包含于此;然后对检测到的所述第二声学回声进行回声消除处理,如将检测到的所述第二声学回声从所述宽带分组语音中减去,该过程如图6所示。
还如,本发明还可结合上述相关参数的组合来检测宽带分组语音中的声学回声,即根据所述宽带分组语音包含的所有参数(即LB参数和非LB参数)来检测宽带分组语音中的声学回声,从而考虑整体效果并提供便利。不同的编解码或环境可调整各参数的贡献因子。相应地,本发明在通过修改现有的PAEC算法时可加入贡献因子(即权重)机制,即不同的参数具有不同的贡献因子。例如,若获取装置11获取到的宽带分组语音对应的编解码类型为EVRC-WB,则回声消除装置12可基于所述宽带分组语音包含的所有参数,来检测宽带分组语音中的声学回声,在此,基于所述宽带分组语音包含的所有参数检测所述声学回声的方式与前述基于LB参数进行声学回声检测的方式相同或基本相同,为简明起见,故在此不再赘述,并以引用的方式包含于此;然后对检测到的所述第二声学回声进行回声消除处理,如将检测到的所述第二声学回声从所述宽带分组语音中减去,该过程如图7所示。
本领域技术人员应能理解上述消除宽带分组语音中的声学回声的方式仅为举例,其他现有的或今后可能出现的消除宽带分组语音中的声学回声的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
设备1的各个装置之间是持续不断工作的。具体地,获取装置11持续获取待处理的宽带分组语音;回声消除装置12持续根据以下任一项处理方式,对所述宽带分组语音进行声学回声消除处理:-将所述宽带分组语音分离为低频带位流和高频带位流,并对所述低频带位流和高频带位流进行声学回声消除处理;-基于所述宽带分组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理。在此,本领域技术人员应能理解“持续”是指设备1的各装置分别不断地进行待处理的宽带分组语音的获取、对宽带分组语音的声学回声消除处理,直至设备1在较长时间内停止获取待处理的宽带分组语音。
优选地,设备1还包括确定装置(未示出)。具体地,确定装置根据所述宽带分组语音所对应的语音相关信息,确定对所述宽带分组语音进行声学回声消除处理的处理方式;其中,回声消除装置12根据确定的所述处理方式,对所述宽带分组语音进行声学回声消除处理;其中,所述处理方式包括以下任一项:-将所述宽带分组语音分离为低频带位流和高频带位流,并对所述低频带位流和高频带位流进行声学回声消除处理;-基于所述宽带分组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理。
具体地,确定装置根据所述宽带分组语音所对应的语音相关信息,确定对所述宽带分组语音进行声学回声消除处理的处理方式。在此,所述语音相关信息包括但不限于以下至少任一项:1)所述宽带分组语音所对应的编解码类型信息;2)所述宽带分组语音所对应的帧类型信息;3)所述宽带分组语音所对应的分组速率;4)所述宽带分组语音所对应的能量级别;5)所述宽带分组语音所对应的预配置信息,其包括但不限于如编解码类型的映射信息等,例如用数字96表示编解码类型EVRC-WB。
例如,假设获取装置11获取到的所述宽带分组语音的编解码类型为EVRC-WB,因该编解码类型中的低频带参数和高频带参数已是天然分离的,则确定装置可根据该编解码类型,确定对所述宽带分组语音进行声学回声消除处理的处理方式为:基于所述宽带分组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理。
PAEC及时进行高质量高效率的帧比较对语音质量的控制很关键,是PAEC具体实现中特别要注重的,在此,本发明通过根据所述宽带分组语音所对应的语音相关信息,确定对所述宽带分组语音进行声学回声消除处理的处理方式,通过对宽带分组语音的粗略分析自动选择合适的WBPAEC方法,进一步提高了WBPAEC的效率。
接着,回声消除装置12根据确定的所述处理方式,对所述宽带分组语音进行声学回声消除处理。在此,回声消除装置12对所述宽带分组语音进行声学回声消除处理的方式与前述回声消除装置12对所述宽带分组语音进行声学回声消除处理的方式相同或基本相同,为简明起见,故在此不再赘述,并以引用的方式包含与此。
图8示出根据本发明一个优选实施例的一种用于实现宽带分组语音的基于分组的声学回声消除的设备示意图,其中,设备1包括获取装置11’和回声消除装置12’,其中,回声消除装置12’包括分离单元121’、回声消除单元122’和合并单元123’。具体地,获取装置11’获取待处理的宽带分组语音;分离单元121’将所述宽带分组语音分离为低频带位流和高频带位流;回声消除单元122’对所述低频带位流进行声学回声消除处理;合并单元123’将所述高频带位流和经声学回声消除处理后的所述低频带位流进行合并,以获得消除声学回声的所述宽带分组语音。在此,获取装置11’与图1实施例中对应装置的内容相同或基本相同,为简明起见,故在此不再赘述,并以引用的方式包含与此。
具体地,分离单元121’将所述宽带分组语音分离为低频带位流和高频带位流。例如,假设获取装置11’获取到的所述宽带分组语音为符合G.722宽带语音编码算法、速率为64Kbit/s的widebandpacketvoice-a(G.72264Kbit/s),分离单元121’可通过DMUX将宽带分组语音如widebandpacketvoice-a(G.72264Kbit/s)分离为LB位流如LBpacketvoice-a和HB位流如HBpacketvoice-a,如LBpacketvoice-a为48Kbit/s,HBpacketvoice-a为16Kbit/s。
回声消除单元122’对所述低频带位流进行声学回声消除处理。在此,回声消除单元122’对所述低频带位流进行声学回声消除处理的方式包括但不限于以下至少任一项:
1)采用现有技术中的窄带PAEC(NBPAEC,narrowbandPAEC)技术仅消除低频带位流如LBpacketvoice-a中的声学回声,得到消除了声学回声的低频带位流如echofreeLBpacketvoice-a。
2)首先基于所述高频带位流,检测所述低频带位流中的第一声学回声,如基于所述高频带位流的能量变化轨迹,检测所述低频带位流中的第一声学回声;然后对检测到的所述第一声学回声进行回声消除处理。例如,接上例,则回声消除单元122’可首先采用现有技术中的NBPAEC技术并基于HB位流如HBpacketvoice-a的能量变化轨迹检测LB位流如LBpacketvoice-a中的第一声学回声;然后,对检测到的所述第一声学回声进行回声消除处理,如将检测到的所述第二声学回声从所述宽带分组语音中减去,该过程如图9所示。
合并单元123’将所述高频带位流和经声学回声消除处理后的所述低频带位流进行合并,以获得消除声学回声的所述宽带分组语音。例如,接上例,回声消除单元122’得到消除了声学回声的LB位流如echofreeLBpacketvoice-a,则合并单元123’通过MUX将消除了声学回声的LB位流如echofreeLBpacketvoice-a和HB位流如HBpacketvoice-a合并,即可得到消除声学回声的所述宽带分组语音如echofreewidebandpacketvoice-a(echofreeG.72264kbit/s)。
图10示出根据本发明另一个方面的一种用于实现宽带分组语音的基于分组的声学回声消除的方法流程图。
其中,该方法包括步骤S1和步骤S2。具体地,在步骤S1中,设备1获取待处理的宽带分组语音;在步骤S2中,设备1根据以下任一项处理方式,对所述宽带分组语音进行声学回声消除处理:-将所述宽带分组语音分离为低频带位流和高频带位流,并对所述低频带位流和高频带位流进行声学回声消除处理;-基于所述宽带分组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理。
在此,所述设备1是任何一种可消除宽带分组语音中的声学回声的电子产品,其可应用于任何宽带编解码,还可部署于用户设备(UE)中/UE端,或者也可部署于分组网络的网络侧中,如部署于网络侧实体MSC(移动交换中心,MobileSwitchingCenter)或MGW(媒体网关,MediaGateWay)。优选地,设备1部署于网络侧。本领域技术人员应能理解上述设备1仅为举例,其他现有的或今后可能出现的宽带基于分组的声学回声消除设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,所述用户设备包括但不限于任何一种可与用户通过键盘、触摸板、或声控设备进行人机交互并能通过移动网络与基站进行信号的相互传送和接收来达到移动通信信号的传送的电子产品,例如平板电脑、智能手机、手机、PDA、IP电话等。在此,设备1包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。
在此,为更清楚地说明本发明的方案,先对宽带语音说明如下:
宽带语音(WidebandAudio),又称高清语音(HDVoice)。人声带宽约为80Hz至14kHz,但一般语音电话的带宽只覆盖300Hz至3.4kHz,高清语音把语音电话覆盖的带宽扩展到50Hz至7kHz或更广,并减轻环境噪音的影响,使通话品质更加清晰。宽带语音分为低频带部分和高频带部分,低频带部分通常被分配较多资源,而高频带部分通常被分配较少资源,其多为摩擦音、噪声等辅助音。图2以EVRC-WB为例示出包括低频带(LB,low-band)和高频带(HB,high-band)部分的宽带语音概念性示意图。
需要说明的是,对宽带语音的说明仅用于更好地理解本发明的方案,而不是对本发明的限制。
以下参考图10对本方案的实施例进行说明:
具体地,在步骤S1中,设备1通过分组网络中的分组交换网络的输入或输出接口,或者,通过将数字语音数据分割为可以在IP网络上传输的分组数据的设备如IP电话网关的输出接口,获取待处理的宽带分组语音。例如,假设用户A通过其用户设备UEa拨打用户B的手机UEb,以与用户B进行通话,语音编码器以G.722宽带语音编码算法,将用户的话音转换为数字话音,速率为64Kbit/s,然后经IP电话网关将数字语音数据通过IP协议分割为可在分组网络上传输的分组数据,则在步骤S1中,设备1可通过IP电话网关的输出接口获取到用户A的语音,相应地即获取到待处理的宽带分组语音如widebandpacketvoice-a(G.72264Kbit/s)。
本领域技术人员应能理解上述获取待处理的宽带分组语音的方式仅为举例,其他现有的或今后可能出现的获取待处理的宽带分组语音的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S2中,设备1根据以下任一项处理方式,对所述宽带分组语音进行声学回声消除处理:i)将所述宽带分组语音分离为低频带位流和高频带位流,并对所述低频带位流和高频带位流进行声学回声消除处理;ii)基于所述宽带分组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理。
例如,当在步骤S2中,设备1以上述处理方式i)对所述宽带分组语音进行声学回声消除处理时,在步骤S2中,设备1的处理过程包括但不限于以下至少任一项:
1)首先将所述宽带分组语音分离为低频带位流和高频带位流,以对所述低频带位流和高频带位流分别进行声学回声消除处理;接着,将分别经声学回声消除处理后的所述低频带位流和所述高频带位流进行合并,以获得消除声学回声的所述宽带分组语音。
例如,接上例,在步骤S2中,设备1首先通过信号分离器(demultiplexer,DMUX)将宽带分组语音如widebandpacketvoice-a(G.72264Kbit/s)分离为LB位流如LBpacketvoice-a和HB位流如HBpacketvoice-a,如LBpacketvoice-a为48Kbit/s,HBpacketvoice-a为16Kbit/s;然后在步骤S2中,设备1采用现有技术中的窄带PAEC(NBPAEC,narrowbandPAEC)技术分别消除LB位流如LBpacketvoice-a和HB位流如HBpacketvoice-a中的声学回声,得到消除了声学回声的LB位流如echofreeLBpacketvoice-a与消除了声学回声的HB位流如echofreeHBpacketvoice-a;接着,在步骤S2中,设备1通过多路复用器(multiplexer,MUX)将消除了声学回声的LB位流如echofreeLBpacketvoice-a和echofreeHBpacketvoice-a合并,即可得到消除声学回声的所述宽带分组语音如echofreewidebandpacketvoice-a(echofreeG.72264Kbit/s),该过程如图3所示。
在此,本领域技术人员可以理解,通常,编码器/解码器集成了D/MUX,本发明可确定使用现有的D/MUX,或者具有其自身的D/MUX。此外,消除HB位流中的声学回声时,可修改现有的NBPAEC算法或者设计新的算法以适应HB分组/帧的PAEC处理。
2)首先将所述宽带分组语音分离为低频带位流和高频带位流;然后,对所述低频带位流进行声学回声消除处理;接着,再将所述低频带位流和经声学回声消除处理后的所述低频带位流进行合并,以获得消除声学回声的所述宽带分组语音。
例如,还接上例,在步骤S2中,设备1可仍首先通过信号分离器(demultiplexer,DMUX)将宽带分组语音如widebandpacketvoice-a(G.72264Kbit/s)分离为LB位流如LBpacketvoice-a和HB位流如HBpacketvoice-a,如LBpacketvoice-a为48Kbit/s,HBpacketvoice-a为16Kbit/s;然后,在步骤S2中,设备1采用现有技术中的窄带PAEC(NBPAEC,narrowbandPAEC)技术仅消除LB位流如LBpacketvoice-a中的声学回声,得到消除了声学回声的LB位流如echofreeLBpacketvoice-a;接着,在步骤S2中,设备1通过多路复用器(multiplexer,MUX)将消除了声学回声的LB位流如echofreeLBpacketvoice-a和HB位流如HBpacketvoice-a合并,即可得到消除声学回声的所述宽带分组语音如echofreewidebandpacketvoice-a(echofreeG.72264kbit/s),该过程如图4所示。
在此,本发明仅聚焦在LB位流上,因为:1)分配给LB位流的带宽远多于分配给HB位流的带宽,即LB位流是WB分组语音的主要部分;2)LB位流相比于HB位流更多地代表语音波形,而HB位流相比于LB位流更多地代表语音的清晰度,LB位流在确定语音的含义上起决定性作用;3)由于HB位流的衰减和干扰,HB位流可能不包含或包含很少的回声。因此,当宽带分组语音中的HB位流具有较低的能量时,即意味着在高频率范围内不存在或存在较少声学回声,此时,HB位流中的声学回声可被忽略。
在此,本领域技术人员应能理解,当回声消除装置12以上述处理方式i)对所述宽带分组语音进行声学回声消除处理时,所述宽带分组语音的所对应的编解码类型包括但不限于如G.722等,上述实施例中的编解码类型G.722仅为举例,其他现有的或今后可能出现的编解码类型如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
再如,当在步骤S2中,设备1以上述处理方式ii)对所述宽带分组语音进行声学回声消除处理时,具体地,在步骤S2中,设备1首先基于所述宽带分组语音包含的相关参数,检测所述宽带分组语音中的第二声学回声;接着,对检测到的所述第二声学回声进行回声消除处理。优选地,所述相关参数包括但不限于以下至少任一项:
-所述宽带分组语音包含的低频带参数;
-所述宽带分组语音包含的通用参数或高频带参数。
在此,所述宽带分组语音所对应的编解码类型包括但不限于如EVRC-WB、EVRC-NW、EVRC-B等。本领域技术人员应能理解上述编解码类型仅为举例,其他现有的或今后可能出现的编解码类型如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,需要首先说明的是,若宽带分组语音所对应的编解码类型为EVRC-WB,该编解码类型中的低频带参数和高频带参数已是天然分离的,因此,本发明可直接使用编解码中的相关参数检测和消除/抑制宽带分组语音中的声学回声,而无需DMUX将宽带分组语音分离为LB位流和HB位流。此时,本发明将重用现有窄带PAEC算法以处理LB参数,微调现有窄带PAEC算法以处理HB参数并适应HB参数的特性。
例如,还接上例,若宽带分组语音如widebandpacketvoice-a(G.72264Kbit/s)所对应的编解码类型为EVRC-WB,则在步骤S2中,设备1可基于所述宽带分组语音包含的相关参数,如基于低频带参数即LSP参数,检测所述宽带分组语音中的第二声学回声,相关实施例已于下列专利申请中公开:1)公开号为101933306A、题为“用于在分组网络中检测和抑制回声的方法和设备”的进入中国国家阶段的PCT申请;2)公开号为101542600、题为“基于分组的回音取消和抑制”的进入中国国家阶段的PCT申请;3)申请日为2008年9月4日、申请号为US12/231,646、题为“用于基于通信网络使用帧能量估计检测并抑制分组中的回声的方法与设备”(Methodandapparatusforthedetectionandsuppressionofechoinpacketbasedcommunicationnetworksusingframeenergyestimation)的美国专利申请,在此通过合并的方式包含于此;然后对检测到的所述第二声学回声进行回声消除处理,如将检测到的所述第二声学回声从所述宽带分组语音中减去,该过程如图5所示。
对于EVRC-WB编解码类型,其可自适应选择编解码所采用的帧类型,如全速率WBCELP、全速率WBMDCT(改进的离散余弦变换,ModifiedDiscreteCosineTransform),或者半速率WBNELP(噪声激励线性预测,NoiseExcitedLinearPrediction)等等,以上帧类型的分组格式如以下表4至6所示,其中,表4示出全速率WBCELP帧的分组格式,表5示出全速率WBMDCT帧的分组格式,表6示出半速率WBNELP帧的分组格式:
参数(数值) | bit位数 | 分组中的bit索引 |
Delayhldex | 7 | P0-P6 |
LSP_IDX0 | 6 | P7-P12 |
LSP_IDX1 | 6 | P13-P18 |
LSP_IDX2 | 9 | P19-P27 |
LSP_IDX3 | 7 | P28-P34 |
ACBG_IDX_SF0 | 3 | P35-P37 |
ACBG_IDX_SF1 | 3 | P38-P40 |
ACBG_IDX_SF2 | 3 | P41-P43 |
FCB_PULSE_IDX_DELAY_ADJUST | 94 | P44-P137 |
FCBG_IDX_SF0 | 5 | P138-P142 |
FCBG_IDX_SFl | 5 | P143-P147 |
FCBG_IDX_SF2 | 5 | P148-P152 |
HIGHBAND_LSP_IDX | 8 | P153-P160 |
HIGHBAND_GAIN_SHAPE_IDX | 4 | P161-P164 |
HIGHBAND_GAIN_FRAME_IDX | 4 | P165-P168 |
MODEBIT(CELP/MDCT)(0) | 1 | P169 |
EVRCB_IO_FLAG(1) | 1 | P170 |
表4
参数(数值) | bit位数 | 分组中的bit索引 |
LSP IDX | 28 | P0-P27 |
MDCT一INDEX | 114 | P28-P141 |
FRAME GAIN_INDEX | 7 | P142-P148 |
NOISE_GAIN_INDEX | 1 | P149-P150 |
HIGHBAND_LSP_IDX | 8 | Pl51-Pl58 |
HIGHBAND_GAIN_SHAPE_IDX | 4 | P159-P162 |
HIGHBAND_GAIN_FRAME_IDX | 4 | P163-P166 |
RESERVED | 1 | 167 |
NB_WB_MODE_BIT(1) | 1 | P168 |
MODEBIT(CELP/MDCT/)(1) | 1 | P169 |
EVRCB_IO_FLAG(1) | 1 | P170 |
表5
参数(数值) | bit位数 | 分组中的bit索引 |
WB_HALFRATE_IDENTIFIER(0x3F) | 6 | P0-P5 |
LSP IDX | 28 | P6-P33 |
NELP_GAIN_INDEX | 17 | P34-P50 |
NELP_FILTER_ID | 2 | P5l-P52 |
HIGHBAND_LSP_IDX | 12 | P53-P64 |
HIGHBAND_GAIN_SHAPE_IDX | 8 | P65-P72 |
HIGHBAND_GAIN_FRAME_IDX | 7 | P73-P79 |
表6
从上述表4至6可以看出,全速率WBCELP、全速率WBMDCT和半速率WBNELP均包含(LB)LSP参数(即LSP_IDx[])和HBLSP参数(即HIGHBAND_4SP_IDx),LSP参数比较可被用于检测声学回声。优选地,在声学回声检测过程中HBLSP参数可被忽略,也即HBLSP参数用于声学回声检测的贡献因子为0。
在此,因LB位流相比于HB位流更多地代表语音波形,且具有较多的含义,本发明通过使用LB参数来检测声学回声的方法提高了声学回声检测的效率。
再如,在具有较少干扰的环境中,HB位流所代表的语音波形和语音能量可用于检测声学回声,还接上例,若在步骤S1中,设备1获取到的宽带分组语音所对应的编解码类型为EVRC-WB,则在步骤S2中,设备1可基于所述宽带分组语音包含的相关参数,如基于通用参数或高频带参数(即非LB参数),检测所述宽带分组语音中的第二声学回声,相关实施例已于下列专利申请中公开:1)2公开号为101933306A、题为“用于在分组网络中检测和抑制回声的方法和设备”的进入中国国家阶段的PCT申请;2)公开号为101542600、题为“基于分组的回音取消和抑制”的进入中国国家阶段的PCT申请;3)申请日为2008年9月4日、申请号为US12/231,646、题为“用于基于通信网络使用帧能量估计检测并抑制分组中的回声的方法与设备”(Methodandapparatusforthedetectionandsuppressionofechoinpacketbasedcommunicationnetworksusingframeenergyestimation)的美国专利申请,在此通过合并的方式包含于此;然后对检测到的所述第二声学回声进行回声消除处理,如将检测到的所述第二声学回声从所述宽带分组语音中减去,该过程如图6所示。
还如,本发明还可结合上述相关参数的组合来检测宽带分组语音中的声学回声,即根据所述宽带分组语音包含的所有参数(即LB参数和非LB参数)来检测宽带分组语音中的声学回声,从而考虑整体效果并提供便利。不同的编解码或环境可调整各参数的贡献因子。相应地,本发明在通过修改现有的PAEC算法时可加入贡献因子(即权重)机制,即不同的参数具有不同的贡献因子。例如,若在步骤S1中,设备1获取到的宽带分组语音所对应的编解码类型为EVRC-WB,则在步骤S2中,设备1可基于所述宽带分组语音包含的所有参数,来检测宽带分组语音中的声学回声,在此,基于所述宽带分组语音包含的所有参数检测所述声学回声的方式与前述基于LB参数进行声学回声检测的方式相同或基本相同,为简明起见,故在此不再赘述,并以引用的方式包含于此;然后对检测到的所述第二声学回声进行回声消除处理,如将检测到的所述第二声学回声从所述宽带分组语音中减去,该过程如图7所示。
本领域技术人员应能理解上述消除宽带分组语音中的声学回声的方式仅为举例,其他现有的或今后可能出现的消除宽带分组语音中的声学回声的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
设备1的各个步骤之间是持续不断工作的。具体地,在步骤S1中,设备1持续获取待处理的宽带分组语音;在步骤S2中,设备1持续根据以下任一项处理方式,对所述宽带分组语音进行声学回声消除处理:-将所述宽带分组语音分离为低频带位流和高频带位流,并对所述低频带位流和高频带位流进行声学回声消除处理;-基于所述宽带分组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理。在此,本领域技术人员应能理解“持续”是指设备1的各步骤分别不断地进行待处理的宽带分组语音的获取、对宽带分组语音的声学回声消除处理,直至设备1在较长时间内停止获取待处理的宽带分组语音。
优选地,设备1还包括步骤S3(未示出)。具体地,在步骤S3中,设备1根据所述宽带分组语音所对应的语音相关信息,确定对所述宽带分组语音进行声学回声消除处理的处理方式;其中,在步骤S2中,设备1根据确定的所述处理方式,对所述宽带分组语音进行声学回声消除处理;其中,所述处理方式包括以下任一项:-将所述宽带分组语音分离为低频带位流和高频带位流,并对所述低频带位流和高频带位流进行声学回声消除处理;-基于所述宽带分组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理。
具体地,在步骤S3中,设备1根据所述宽带分组语音所对应的语音相关信息,确定对所述宽带分组语音进行声学回声消除处理的处理方式。在此,所述语音相关信息包括但不限于以下至少任一项:1)所述宽带分组语音所对应的编解码类型信息;2)所述宽带分组语音所对应的帧类型信息;3)所述宽带分组语音所对应的分组速率;4)所述宽带分组语音所对应的能量级别;5)所述宽带分组语音所对应的预配置信息,其包括但不限于如编解码类型映射信息等,例如用数字96表示编解码类型EVRC-WB。
例如,假设在步骤S1中,设备1获取到的所述宽带分组语音的编解码类型为EVRC-WB,因该编解码类型中的低频带参数和高频带参数已是天然分离的,则在步骤S3中,设备1可根据该编解码类型,确定对所述宽带分组语音进行声学回声消除处理的处理方式为:基于所述宽带分组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理。
PAEC及时进行高质量高效率的帧比较对语音质量的控制很关键,是PAEC具体实现中特别要注重的,在此,本发明通过根据所述宽带分组语音所对应的语音相关信息,确定对所述宽带分组语音进行声学回声消除处理的处理方式,通过对宽带分组语音的粗略分析自动选择合适的WBPAEC方法,进一步提高了WBPAEC的效率。
接着,在步骤S2中,设备1根据确定的所述处理方式,对所述宽带分组语音进行声学回声消除处理。在此,在步骤S2中,设备1对所述宽带分组语音进行声学回声消除处理的方式与前述在步骤S2中,设备1对所述宽带分组语音进行声学回声消除处理的方式相同或基本相同,为简明起见,故在此不再赘述,并以引用的方式包含与此。
图11示出根据本发明一个优选实施例的一种用于实现宽带分组语音的基于分组的声学回声消除的方法流程图。
其中,该方法包括步骤S1’和步骤S2’,其中,步骤S2’包括步骤S21’、步骤S22’和步骤S23’。具体地,在步骤S1’中,设备1获取待处理的宽带分组语音;在步骤S21’中,设备1将所述宽带分组语音分离为低频带位流和高频带位流;在步骤S22’中,设备1对所述低频带位流进行声学回声消除处理;在步骤S23’中,设备1将所述高频带位流和经声学回声消除处理后的所述低频带位流进行合并,以获得消除声学回声的所述宽带分组语音。在此,步骤S1’与图10实施例中对应步骤的内容相同或基本相同,为简明起见,故在此不再赘述,并以引用的方式包含与此。
具体地,在步骤S21’中,设备1将所述宽带分组语音分离为低频带位流和高频带位流。例如,假设在步骤S1’中,设备1取到的所述宽带分组语音为符合G.722宽带语音编码算法、速率为64Kbit/s的widebandpacketvoice-a(G.72264Kbit/s),在步骤S21’中,设备1可通过DMUX将宽带分组语音如widebandpacketvoice-a(G.72264Kbit/s)分离为LB位流如LBpacketvoice-a和HB位流如HBpacketvoice-a,如LBpacketvoice-a为48Kbit/s,HBpacketvoice-a为16Kbit/s。
在步骤S22’中,设备1对所述低频带位流进行声学回声消除处理。在此,在步骤S22’中,设备1对所述低频带位流进行声学回声消除处理的方式包括但不限于以下至少任一项:
1)采用现有技术中的窄带PAEC(NBPAEC,narrowbandPAEC)技术仅消除LB位流如LBpacketvoice-a中的声学回声,得到消除了声学回声的LB位流如echofreeLBpacketvoice-a。
2)首先结合所述高频带位流,检测所述低频带位流中的第一声学回声,如基于所述高频带位流的能量变化轨迹,检测所述低频带位流中的第一声学回声;然后对检测到的所述第一声学回声进行回声消除处理。例如,接上例,则在步骤S22’中,设备1可首先采用现有技术中的NBPAEC技术并结合HB位流如HBpacketvoice-a的能量变化轨迹检测LB位流如LBpacketvoice-a中的第一声学回声,然后,对检测到的所述第一声学回声进行回声消除处理,如将检测到的所述第二声学回声从所述宽带分组语音中减去,该过程如图9所示。
在步骤S23’中,设备1将所述高频带位流和经声学回声消除处理后的所述低频带位流进行合并,以获得消除声学回声的所述宽带分组语音。例如,接上例,在步骤S22’中,设备1得到消除了声学回声的LB位流如echofreeLBpacketvoice-a,则在步骤S23’中,设备1通过MUX将消除了声学回声的LB位流如echofreeLBpacketvoice-a和HB位流如HBpacketvoice-a合并,即可得到消除声学回声的所述宽带分组语音如echofreewidebandpacketvoice-a(echofreeG.72264kbit/s)。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
Claims (15)
1.一种用于实现宽带分组语音的基于分组的声学回声消除的方法,其中,该方法包括以下步骤:
a获取待处理的宽带分组语音;
b根据以下任一项处理方式,对所述宽带分组语音进行声学回声消除处理:
-将所述宽带分组语音分离为低频带位流和高频带位流,并对所述低频带位流和高频带位流进行声学回声消除处理;
-基于所述宽带分组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理。
2.根据权利要求1所述的方法,其中,所述步骤b包括:
-将所述宽带分组语音分离为低频带位流和高频带位流,以对所述低频带位流和高频带位流分别进行声学回声消除处理;
-将分别经声学回声消除处理后的所述低频带位流和所述高频带位流进行合并,以获得消除声学回声的所述宽带分组语音。
3.根据权利要求1所述的方法,其中,所述步骤b包括:
-将所述宽带分组语音分离为低频带位流和高频带位流;
b2对所述低频带位流进行声学回声消除处理;
-将所述高频带位流和经声学回声消除处理后的所述低频带位流进行合并,以获得消除声学回声的所述宽带分组语音。
4.根据权利要求3所述的方法,其中,所述步骤b2包括:
-基于所述高频带位流,检测所述低频带位流中的第一声学回声;
-对检测到的所述第一声学回声进行回声消除处理。
5.根据权利要求1所述的方法,其中,所述步骤b包括:
-基于所述宽带分组语音包含的相关参数,检测所述宽带分组语音中的第二声学回声;
-对检测到的所述第二声学回声进行回声消除处理。
6.根据权利要求1或5所述的方法,其中,所述相关参数包括以下至少任一项:
-所述宽带分组语音包含的低频带参数;
-所述宽带分组语音包含的通用参数或高频带参数。
7.根据权利要求1至6中任一项所述的方法,其中,该方法还包括:
-根据所述宽带分组语音所对应的语音相关信息,确定对所述宽带分组语音进行声学回声消除处理的处理方式;
其中,所述步骤b包括:
-根据确定的所述处理方式,对所述宽带分组语音进行声学回声消除处理;
其中,所述处理方式包括以下任一项:
-将所述宽带分组语音分离为低频带位流和高频带位流,并对所述低频带位流和高频带位流进行声学回声消除处理;
-基于所述宽带分组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理。
8.一种用于实现宽带分组语音的基于分组的声学回声消除的设备,其中,该设备包括:
获取装置,用于获取待处理的宽带分组语音;
回声消除装置,用于根据以下任一项处理方式,对所述宽带分组语音进行声学回声消除处理:
-将所述宽带分组语音分离为低频带位流和高频带位流,并对所述低频带位流和高频带位流进行声学回声消除处理;
-基于所述宽带分组语音包含的相关参数,对所述宽带分组语音进行声学回声消除处理。
9.根据权利要求8所述的设备,其中,所述回声消除装置用于:
-将所述宽带分组语音分离为低频带位流和高频带位流,以对所述低频带位流和高频带位流分别进行声学回声消除处理;
-将分别经声学回声消除处理后的所述低频带位流和所述高频带位流进行合并,以获得消除声学回声的所述宽带分组语音。
10.根据权利要求8所述的设备,其中,所述回声消除装置包括:
分离单元,用于将所述宽带分组语音分离为低频带位流和高频带位流;
回声消除单元,用于对所述低频带位流进行声学回声消除处理;
合并单元,用于将所述高频带位流和经声学回声消除处理后的所述低频带位流进行合并,以获得消除声学回声的所述宽带分组语音。
11.根据权利要求10所述的设备,其中,所述回声消除单元用于:
-基于所述高频带位流,检测所述低频带位流中的第一声学回声;
-对检测到的所述第一声学回声进行回声消除处理。
12.根据权利要求8所述的设备,其中,所述回声消除装置用于:
-基于所述宽带分组语音包含的相关参数,检测所述宽带分组语音中的第二声学回声;
-对检测到的所述第二声学回声进行回声消除处理。
13.根据权利要求8或12所述的设备,其中,所述相关参数包括以下至少任一项:
-所述宽带分组语音包含的低频带参数;
-所述宽带分组语音包含的通用参数或高频带参数。
14.根据权利要求8至13中任一项所述的设备,其中,该设备还包括:
确定装置,用于根据所述宽带分组语音所对应的语音相关信息,确定对所述宽带分组语音进行声学回声消除处理的处理方式;
其中,所述回声消除装置用于:
-根据确定的所述处理方式,对所述宽带分组语音进行声学回声消除处理;
其中,所述处理方式包括以下任一项:
-将所述宽带分组语音分离为低频带位流和高频带位流,并对所述低频带位流和高频带位流进行声学回声消除处理;
-基于所述宽带分组语音包含的波形描述参数,对所述宽带分组语音进行声学回声消除处理。
15.一种宽带基于分组的声学回声消除设备,其中,该宽带基于分组的声学回声消除设备包括权利要求8至14中任一项所述的设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410199215.0A CN105096960A (zh) | 2014-05-12 | 2014-05-12 | 实现宽带分组语音的基于分组的声学回声消除方法与设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410199215.0A CN105096960A (zh) | 2014-05-12 | 2014-05-12 | 实现宽带分组语音的基于分组的声学回声消除方法与设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105096960A true CN105096960A (zh) | 2015-11-25 |
Family
ID=54577240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410199215.0A Pending CN105096960A (zh) | 2014-05-12 | 2014-05-12 | 实现宽带分组语音的基于分组的声学回声消除方法与设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105096960A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109509482A (zh) * | 2018-12-12 | 2019-03-22 | 北京达佳互联信息技术有限公司 | 回声消除方法、回声消除装置、电子设备和可读介质 |
CN110176244A (zh) * | 2018-06-19 | 2019-08-27 | 腾讯科技(深圳)有限公司 | 回声消除方法、装置、存储介质和计算机设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6718036B1 (en) * | 1999-12-15 | 2004-04-06 | Nortel Networks Limited | Linear predictive coding based acoustic echo cancellation |
CN1504042A (zh) * | 2000-12-29 | 2004-06-09 | ��˹��ŵ�� | 数字网络中的音频信号质量增强 |
US20060217969A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for echo suppression |
CN101542600A (zh) * | 2006-09-19 | 2009-09-23 | 卢森特技术有限公司 | 基于分组的回音取消和抑制 |
CN101933306A (zh) * | 2007-12-31 | 2010-12-29 | 阿尔卡特朗讯美国公司 | 用于在分组网络中检测和抑制回声的方法和设备 |
CN102623016A (zh) * | 2012-03-26 | 2012-08-01 | 华为技术有限公司 | 宽带语音处理方法及装置 |
CN103167196A (zh) * | 2011-12-16 | 2013-06-19 | 宇龙计算机通信科技(深圳)有限公司 | 用于在分组交换域中消除通话回音的方法和终端 |
CN103460613A (zh) * | 2011-04-14 | 2013-12-18 | 阿尔卡特朗讯公司 | 节省计算的用于宽带音频信号的回声消除器 |
CN104468470A (zh) * | 2013-09-13 | 2015-03-25 | 阿尔卡特朗讯 | 一种用于分组声学回声消除的方法与设备 |
-
2014
- 2014-05-12 CN CN201410199215.0A patent/CN105096960A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6718036B1 (en) * | 1999-12-15 | 2004-04-06 | Nortel Networks Limited | Linear predictive coding based acoustic echo cancellation |
CN1504042A (zh) * | 2000-12-29 | 2004-06-09 | ��˹��ŵ�� | 数字网络中的音频信号质量增强 |
US20060217969A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for echo suppression |
CN101542600A (zh) * | 2006-09-19 | 2009-09-23 | 卢森特技术有限公司 | 基于分组的回音取消和抑制 |
CN101933306A (zh) * | 2007-12-31 | 2010-12-29 | 阿尔卡特朗讯美国公司 | 用于在分组网络中检测和抑制回声的方法和设备 |
CN103460613A (zh) * | 2011-04-14 | 2013-12-18 | 阿尔卡特朗讯公司 | 节省计算的用于宽带音频信号的回声消除器 |
CN103167196A (zh) * | 2011-12-16 | 2013-06-19 | 宇龙计算机通信科技(深圳)有限公司 | 用于在分组交换域中消除通话回音的方法和终端 |
CN102623016A (zh) * | 2012-03-26 | 2012-08-01 | 华为技术有限公司 | 宽带语音处理方法及装置 |
CN104468470A (zh) * | 2013-09-13 | 2015-03-25 | 阿尔卡特朗讯 | 一种用于分组声学回声消除的方法与设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110176244A (zh) * | 2018-06-19 | 2019-08-27 | 腾讯科技(深圳)有限公司 | 回声消除方法、装置、存储介质和计算机设备 |
CN110176244B (zh) * | 2018-06-19 | 2023-10-03 | 腾讯科技(深圳)有限公司 | 回声消除方法、装置、存储介质和计算机设备 |
CN109509482A (zh) * | 2018-12-12 | 2019-03-22 | 北京达佳互联信息技术有限公司 | 回声消除方法、回声消除装置、电子设备和可读介质 |
CN109509482B (zh) * | 2018-12-12 | 2022-03-25 | 北京达佳互联信息技术有限公司 | 回声消除方法、回声消除装置、电子设备和可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5694531B2 (ja) | 高調波信号のコーディングのためのシステム、方法、装置、およびコンピュータ可読媒体 | |
RU2421828C2 (ru) | Системы и способы для включения идентификатора в пакет, ассоциативно связанный с речевым сигналом | |
CN101305423B (zh) | 自适应的基于时间/频率的音频编码和解码设备和方法 | |
KR101540371B1 (ko) | 신호 분류 방법 및 장치, 및 인코딩/디코딩 방법 및 장치 | |
CN1969319B (zh) | 在通信系统中对帧进行编码的方法和编码器 | |
KR101092167B1 (ko) | 피치-조정 및 비-피치-조정 코딩을 이용한 신호 인코딩 | |
CN1957398B (zh) | 在基于代数码激励线性预测/变换编码激励的音频压缩期间低频加重的方法和设备 | |
FI118704B (fi) | Menetelmä ja laite lähdekoodauksen tekemiseksi | |
CN107077855B (zh) | 信号编码方法和装置以及信号解码方法和装置 | |
CN101996640A (zh) | 频带扩展方法及装置 | |
CN101399043A (zh) | 一种自适应多速率窄带编码方法及编码器 | |
CN104969291A (zh) | 执行用于增益确定的滤波的系统及方法 | |
CN101281749A (zh) | 可分级的语音和乐音联合编码装置和解码装置 | |
WO2009059632A1 (en) | An encoder | |
US20130346088A1 (en) | Audio coding method and apparatus | |
MXPA02000737A (es) | Metodo y aparato para identificar bandas de frecuencia para calcular desviaciones de fase lineales entre prototipos de cuadro en un codificador de frecuencia vocal. | |
CN105096960A (zh) | 实现宽带分组语音的基于分组的声学回声消除方法与设备 | |
Gomez et al. | Recognition of coded speech transmitted over wireless channels | |
EP2617034B1 (en) | Determining pitch cycle energy and scaling an excitation signal | |
CN101609681A (zh) | 编码方法、编码器、解码方法及解码器 | |
CN112151045A (zh) | 一种立体声编码方法、立体声解码方法和装置 | |
KR20080095492A (ko) | 오디오/스피치 신호의 시간 도메인에서의 부호화 방법 | |
KR101551236B1 (ko) | 패킷 손실 은닉에서의 적응형 뮤팅 방법 | |
HUE035162T2 (en) | Systems, procedures, equipment and computer-readable media for decoding harmonic signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20151125 |