CN101425292A - 一种音频信号的解码方法及装置 - Google Patents

一种音频信号的解码方法及装置 Download PDF

Info

Publication number
CN101425292A
CN101425292A CNA2007101667493A CN200710166749A CN101425292A CN 101425292 A CN101425292 A CN 101425292A CN A2007101667493 A CNA2007101667493 A CN A2007101667493A CN 200710166749 A CN200710166749 A CN 200710166749A CN 101425292 A CN101425292 A CN 101425292A
Authority
CN
China
Prior art keywords
signal
count
component information
fad
sound signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007101667493A
Other languages
English (en)
Other versions
CN101425292B (zh
Inventor
陈喆
代金良
杨磊
张德明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2007101667493A priority Critical patent/CN101425292B/zh
Publication of CN101425292A publication Critical patent/CN101425292A/zh
Application granted granted Critical
Publication of CN101425292B publication Critical patent/CN101425292B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了音频信号的解码方法,包括:当接收到的编码码流对应的音频信号由较窄带宽向较宽带宽进行切换时,获取所述音频信号的较低带信号分量和较高带分量信息;将所述较高带分量信息进行频域整形,并获得较高带信号分量;将所述较高带信号分量和所述较低带信号分量进行合成。本发明还公开了一种音频信号的解码装置和一种音频信号分量信息的频域整形方法。本发明通过将音频信号的较高带分量信息进行频域整形,使得所述音频信号在由较窄带宽向较宽带宽进行切换时满足渐变特性,从而提高了语音信号在由较窄带宽向较宽带宽进行切换时人耳听觉的舒适度。

Description

一种音频信号的解码方法及装置
技术领域
本发明涉及语音通信技术领域,特别是涉及一种音频信号的解码方法及装置。
背景技术
G.729.1是ITU(International Telecommunication Union,国际电信联盟)最新发布的新一代语音编解码标准,这种嵌入式语音编解码标准最大的特点是具有分层编码的特性,能够提供码率范围在8kb/s~32kb/s的窄带到宽带的音频质量,允许在传输过程中,根据信道状况丢弃外层码流,具有良好的信道自适应性。一般来说,在语音编解码领域,窄带信号是指频带0~4000Hz的信号,宽带信号是指频带在0~8000Hz的信号,超宽带信号是指频带在0~16000Hz的信号。宽带信号又可以分解为低带信号分量和高带信号分量,低带信号分量指0~4000Hz的信号,低带信号分量又可以称为窄带信号分量。高带信号分量是指4000~8000Hz的信号,超高带信号分量是指8000~16000Hz的信号。
在G.729.1标准中,通过将码流构造成嵌入式的分层结构来达到分级性,是一种新型的嵌入式可分层的多速率语音编解码器。输入为20ms的超帧,当采样率为16000Hz,帧长为320点。图1为G.729.1各层编码器系统框图,语音编解码器编码的具体过程为:输入信号sWB(n)首先经过QMF(QuadratureMirror Filterbank,正交镜像滤波器)滤波分成(H1(z),H2(z))两个子带,低子带信号
Figure A200710166749D00061
经过50Hz截止频率的高通滤波器进行预处理,输出信号sLB(n)使用8kb/s~12kb/s的窄带嵌入式CELP(Code-Excited Linear-Prediction,码激励线性预测)编码器进行编码,sLB(n)和12Kb/s码率下CELP编码器的本地合成信号
Figure A200710166749D00062
之间的差值信号dLB(n)经过知觉加权滤波(WLB(z))后的信号
Figure A200710166749D00063
通过MDCT(Modified Discrete Cosine Transform,修正的离散余弦变换)变换到频域。加权滤波器WLB(z)包含了增益补偿,用来保持滤波器输出与高子带输入信号sHB(n)之间的谱连续性。加权后的差值信号要变换到频域内。
高子带分量乘上(-1)n进行谱反转之后的信号
Figure A200710166749D00071
通过截止频率为3000HZ的低通滤波器进行预处理,滤波后的信号sHB(n)使用TDBWE(Time-Domain Band Width Extension,时域带宽扩展编码算法)编码器进行编码。进入TDAC编码模块的sHB(n)也要先使用MDCT变换到频域上。
两组MDCT系数和SHB(k)最后使用TDAC(Time Domain AliasCancellation,时域混叠抵消)进行编码。
图2为G.729.1各层解码器系统框图,解码器的实际工作模式由接收到的码流层数决定,也等价于由接收到的码率决定。根据接收端接收到的不同码率各情况分述如下:
1、如果接收到的码率为8kb/s或12kb/s(即仅接收到第一层或者前两层):第一层或者前两层的码流由嵌入式CELP解码器进行解码,得到解码后的信号
Figure A200710166749D00073
再进行后滤波得到经过高通滤波之后进入QMF滤波器组合成16kHz的宽带信号,其中高带分量置0。
2、如果接收到的码率为14kb/s(即接收到前三层):除了嵌入式CELP解码器解码出窄带分量以外,TDBWE解码器也解码出高带信号分量
Figure A200710166749D00075
。对
Figure A200710166749D00076
进行MDCT变换,把高子带分量谱中3000Hz以上(对应于16kHz采样率中7000Hz以上)频率分量置0,然后进行逆MDCT变换,迭加之后并进行谱翻转,然后在QMF滤波器组中与CELP解码器解出的低带分量
Figure A200710166749D00077
一起合成采样率为16kHz的宽带信号。
3、如果接收到14kb/s以上速率的码流(对应于前四层或者更多层):除了CELP解码器解码出低子带分量
Figure A200710166749D00078
TDBWE解码器解码出高子带分量
Figure A200710166749D00079
以外,还要使用TDAC解码器解码出低子带加权差分信号和高子带增强信号,对全带信号进行增强,最终也在QMF滤波器组中合成采样率为16kHz的宽带信号。
G729.1的码流具有分层结构,允许在传输的过程中根据信道的传输能力从外向内丢弃外层码流,以达到对信道状况的自适应。由编解码的算法描述中可以看出,如果信道容量随时间较快的进行变化时,在解码器可能时而收到窄带码流(解码速率等于或者低于12kb/s),此时解码出的信号仅包含4000Hz以下分量;时而收到宽带码流(解码速率等于或者高于14kb/s),此时解码出的信号则包含0~7000Hz的宽带信号。这种带宽的突然变化,我们称之为带宽切换,由于高低频对人耳感受的贡献并不相同,因此这样的频繁切换会给人耳带来明显的不舒适感。特别地,当频繁出现由较窄带宽向较宽带宽的切换时,人耳将能频繁地明显感觉到听到的声音从沉闷跃变为清脆,因此需要使用一种技术来减轻这种频繁切换对人耳听觉带来的不舒适感。
在G.729.1标准中,采用了一种简单的处理算法来解决该问题:即在窄带向宽带切换时,对信号在时域进行能量的渐变处理,即对高带分量的时域能量加入一个时变渐入因子。将时域信号的高带分量与衰减因子相乘,以期使窄带信号缓慢变为宽带信号。每次解码器接收到的码流速率为8k或12k b/s时,过渡帧数count_rcv被置为0,当解码速率为14kb/s或更高时,过渡帧数计算公式为:
count_rcv=min(count_rcv+1,COUNT_RCV_MAX)
其中COUNT_RCV_MAX=50。即该方法期望在1s时间内,对高带信号分量的时域振幅加入一个从0到1按对数曲线变化的时变渐入因子。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:在窄带向宽带切换时,由于仅对宽带信号在时域进行时变渐入,并没有在频域进行渐入处理,使得处理后的信号在频域上仍是突变的,因此当出现较窄带宽向较宽带宽的切换时,人耳的实际听觉感受的舒适程度并不好。
发明内容
本发明实施例要解决的问题是提供一种音频信号的解码方法及装置,目的是要改善语音信号在从较窄带宽向较宽带宽的切换时人耳感受的舒适度。
为达到上述目的,本发明实施例的技术方案提供一种音频信号的解码方法,包括:当接收到的编码码流对应的音频信号由较窄带宽向较宽带宽进行切换时,获取所述音频信号的较低带信号分量和较高带分量信息;将所述较高带分量信息进行频域整形,并获得较高带信号分量;将所述较高带信号分量和所述较低带信号分量进行合成。
本发明实施例的技术方案还提供了一种音频信号的解码装置,包括:切换检测单元,用于检测接收到的编码码流对应的音频信号是否由较窄带宽向较宽带宽进行切换;分量信息获取单元,用于当所述切换检测单元检测到接收到的编码码流对应的音频信号由较窄带宽向较宽带宽进行切换时,获取所述音频信号的较低带信号分量和较高带分量信息;频域整形单元,用于将所述分量信息获取单元获取的较高带分量信息进行频域整形,并获得较高带信号分量;音频信号合成单元,用于将所述从频域整形单元获得的较高带信号分量和所述信号分量信息获取获取的较低带信号分量进行合成。
本发明实施例的技术方案还提供了一种音频信号分量信息的频域整形方法,包括:当音频信号由较窄带宽向较宽带宽进行切换时,获取所述音频信号的分量信息;利用时变的能量增益因子将所述分量信息在时域进行整形,并将时域整形后的分量信息通过时变滤波器进行频域整形;或对频域编码参数进行时变加权。
上述技术方案中的一个实施例具有如下优点:本发明实施例通过将音频信号的较高带分量信息进行频域整形,使得所述音频信号在由较窄带宽向较宽带宽进行切换时满足渐变特性,从而提高了语音信号在由较窄带宽向较宽带宽进行切换时人耳听觉的舒适度。
附图说明
图1是现有技术中G.729.1编码器系统框图;
图2是现有技术中G.729.1解码器系统框图;
图3是本发明的实施例的一种解码器对音频信号的进行解码的方法的流程图;
图4是本发明实施例的一种音频信号的解码的方法的流程图;
图5是本发明实施例的一种频域时变渐入处理在时域实现所用的滤波器极点变化示意图;
图6是本发明实施例的另一种音频信号的解码的方法的流程图;
图7是本发明实施例的另一种音频信号的解码的方法的流程图;
图8是本发明实施例的另一种音频信号的解码的方法流程图;
图9是本发明实施例的一种音频信号的解码装置的结构图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述:
在描述本发明实施例前,先对本发明实施例所使用的全速率帧的结构作简要说明。
本发明实施例的全速率语音帧(20ms帧长)的帧结构如表1所示:
表1
Figure A200710166749D00101
Figure A200710166749D00111
本发明实施例的全速率噪音帧的帧结构如表2所示:
表2
Figure A200710166749D00121
本发明的实施例的一种解码器对音频信号的进行解码的方法如图3所示,首先对输入的编码码流进行参数译码,然后对该编码码流对应的音频信号进行速率检测,根据检测出的速率判断所述音频信号是否由较窄带宽向较宽带宽进行切换,如果否,则对所述音频信号进行正常解码;如果是,则获取所述音频信号的较低带信号分量和较高带分量信息,并对获取的较高带分量信息进行频域整形(也可以再进行时域整形),获得较高带信号分量;最后将所述较高带信号分量和所述较低带信号分量进行合成,完成解码。其中,所述较高带分量信息包括:高带编码参数或者使用高带编码参数恢复出的分量信息,编码参数包括MDCT域的高带包络和TDBWE算法中的频域包络等参数;所述较高带信号分量和所述较低带信号分量是相对应的,如所述较低带信号分量可以为0~2000Hz,则所述较高带信号分量可以为2000~8000Hz,如所述较低带信号分量可以为0~5000Hz,则所述较高带信号分量可以为5000~8000Hz,以下实施例中采用的较低带信号分量为0~4000Hz,采用的较高带信号分量为4000~8000Hz;所述频域整形的过程包括:利用时变的能量增益因子将所述较高带分量信息在时域进行整形,并将时域整形后的较高带分量信息通过时变滤波器进行频域整形;或对频域编码参数进行时变加权。
本发明实施例的一种音频信号的解码方法如图4所示,本实施例利用时变的能量增益因子将所述较高带分量信息在时域进行整形,并将时域整形后的较高带分量信息通过时变滤波器进行频域整形。本实施例所使用的滤波器为时变二阶巴特沃兹滤波器。其零点固定为-1,极点在不断变化,如图5所示,极点沿逆时针方向运动。也就是说,设计出的滤波器通带将不断增大。为了减少存储量,可以预先精确设计一些关键时刻的滤波器参数,其它时刻的滤波器参数由插值近似生成。由于零极点插值的计算量小,所以本发明使用零极点作为滤波器参数。参照图4,本实施例
包括以下步骤:
步骤s401,解码器对接收到的音频信号进行速率检测。
步骤s402,根据检测出的速率判断所述音频信号是否由较窄带宽向较宽带宽进行切换,如果是,则转步骤s403。
步骤s403,将接收到的码流译码出的编码参数,分别解码获取出所述音频信号的较低带信号分量和较高带分量信息。对于所述音频信号的较低带信号分量采用嵌入式CELP解码器进行获取,对于所述音频信号的较高带分量信息,如果码率为14kb/s,则仅采用TDBWE解码算法进行获取即可,如果速率高于14kb/s,则除了用TDBWE解码器获取之外,还需要用TDAC解码器进行获取,然后转步骤s404。
步骤s404,启动时变滤波器开始时变滤波。每次解码器处理8kb/s、12kb/s的语音信号或窄带噪声信号时,窄带宽带切换标志位fad_in_flag置0,滤波点数计数器fad_in_count置0,过渡阶段,解码器开始处理14kb/s或更高速率的语音信号或宽带噪声信号(即所述的较高带分量信息时),窄带宽带切换标志位置1,当滤波点数满足条件fad_in_count<FAD_IN_COUNT_MAX时时变滤波器将一直处于工作状态,在过渡阶段对较高带分量信息进行时变滤波。所述过渡阶段为滤波计数器开始计数到结束计数的阶段,所述滤波计数器的计数由以下公式确定:
fad_in_count=min(fad_in_count+1,FAD_IN_COUNT_MAX);
其中,滤波计数器计数的起始值为0,fad_in_count为滤波计数器的计数值,FAD_IN_COUNT_MAX为过渡阶段持续采样点数,转步骤s405。
步骤s405,当滤波点数满足条件fad_in_count<FAD_IN_COUNT_MAX时持续进行时变滤波。设k时刻,时变滤波器的一个精确极点为rel(k)+img(k)×j;m时刻,该极点精确运动到rel(m)+img(m)×j。
根据公式rel(n)=rel(k)×(N-n)/N+rel(m)×n/N获取n时刻的时变滤波器的插值极点的实部,根据公式img(n)=img(k)×(N-n)/N+img(m)×n/N获取n时刻的时变滤波器的插值极点的虚部,根据公式T(n)=rel(n)+img(n)j获取n时刻的时变滤波器的插值极点;其中,T(n)为n时刻的时变滤波器的插值极点,rel(n)为n时刻的所述时变滤波器的插值极点的实部,rel(k)为关键时刻k的所述时变滤波器的极点的实部,rel(m)为关键时刻m的所述时变滤波器的极点的实部,img(n)为n时刻的所述时变滤波器的插值极点的虚部,img(k)为关键时刻k的所述时变滤波器的极点的虚部,img(m)为关键时刻m的所述时变滤波器的极点的虚部,N为插值点数。
根据所述n时刻的时变滤波器的插值极点可以恢复出n时刻的时变滤波器的系数,得到时变滤波器转移函数:
H ( z ) = 1 + 2 z - 1 + z - 2 1 - 2 rel ( n ) z - 1 + [ rel 2 ( n ) + img 2 ( n ) ] z - 2 ,
其中rel(n)为n时刻的时变滤波器的插值极点的实部,img(n)为n时刻的时变滤波器的插值极点的虚部。
设a1=2×rel(n),a2=-[rel2(n)+img2(n)],x(n)为输入序列,y(n)为输出序列,则时变滤波器的输出计算公式为:
y(n)=gain_filter×[a1×y(n-1)+a2×y(n-2)+x*(n)+2.0×x(n-1)+x(n-2)]其中,gain_filter为时变滤波器的增益,计算公式为:
gain _ filter = 1 - a 1 - a 2 4 ,
转步骤406。
步骤s406,当滤波点数fad_in_count不满足所述滤波条件时,停止时变滤波器的时变滤波,转步骤s407。
步骤s407,在时域完成频域时变滤波渐入处理后,可以在时域进行时变的渐入处理,也就是加入一个时变的渐入因子。处理类似现有技术G.729.1中使用的时域渐入过程,这一过程也可以不用进行,因为这种时域的渐入处理对于人耳听觉质量的提高贡献并不大。
步骤s408,将处理后的较高和较低带信号分量合成,得到全带的重建信号。即将处理后的较高带信号分量和已经解码重建出的窄带信号分量一起,输入QMF滤波器组进行合成滤波,得到全带的重建信号。
本实施例利用时变的能量增益因子将所述较高带分量信息在时域进行整形,并将时域整形后的较高带分量信息通过时变滤波器进行频域整形,使得所述音频信号在由较窄带宽向较宽带宽进行切换时满足渐变特性,从而提高了语音信号在由较窄带宽向较宽带宽进行切换时人耳听觉的舒适度。
本发明实施例的一种音频信号的解码方法的流程如图6所示,本实施例中采用对频域编码参数进行时变加权的方法对所述音频信号在频域进行频域整形,参照图6,本实施例包括以下步骤:
步骤s601,解码器对接收到的音频信号进行速率检测。
步骤s602,根据检测出的速率判断所述音频信号是否由较窄带宽向较宽带宽进行切换,如果是,则转步骤s603。
步骤s603,利用接收到的代表窄带分量的编码参数解码获取出所述音频信号的窄带信号分量,而所述音频信号的高带编码参数暂不解码,然后转步骤s604。
步骤s604,将过渡阶段的较高带分量信息的每个数据帧在频域上划分为多个子带。每次解码器处理8kb/s、12kb/s的语音信号或窄带噪声信号时,窄带宽带切换标志位fad_in_flag置0,过渡帧数计数器fad_in_frame_count置0,过渡阶段,解码器开始处理较高带分量信息(14kb/s或更高的语音信号或宽带噪声信号)时,窄带宽带切换标志位fad_in_flag为置为1,当过渡帧数fad_in_frame_count同时满足fad_in_frame_count<COUNTfad_in条件时,对第n帧(n=1,...,COUNTfad_in,COUNTfad_in为过渡帧数)数据,当该帧为语音帧时,如果当前帧速率高于14kb/s时,则接收到的较高带分量信息的编码参数包括MDCT域的高带包络和TDBWE算法中的频域包络(如果当前帧速率为14kb/s时,则接收到的高带信号分类的编目参数仅包括TDBWE算法中的频域包络),这些频域包络或者MDCT域上的高带包络将整个高带在频域上划分为多个子带,这些谱包络用
Figure A200710166749D00161
(j=0,...,N-1,N为划分的子带数)表示。
如果切换发生后的第n帧(n≤COUNTfad_in)为噪音帧,则接收到的较高带分量信息的编码参数仅为TDBWE算法中的频域包络,这些频域包络将整个高带在频域上划分为N个子带,用(j=0,...,N-1,N为划分的子带数)来表示这些频域包络。
步骤s605,对每个子带的频域编码参数进行时变增益加权。本实施例中所述的编码参数为频谱包络,所述频谱包络按照时变的增益进行加权,即可得到频域上时变渐入的频谱包络。具体是将每个子带对应的频谱包络按时变渐入的增益因子gain(n,j)进行加权,即
Figure A200710166749D00163
而gain(n,j)由公式
gain ( n , j ) = max ( 0 , N &times; n - j &times; COUNT fad _ in ) ( N - j ) &times; COUNT fad _ in , n=1,…,COUNTfad_in j=0,…,N-1
获取,其中gain(n,j)为增益,COUNTfad_in为过渡阶段持续帧数,N为子带编码参数对整个高带在频域上划分的子带数。所述增益由所述数据帧处于过渡阶段的持续数据帧中的位置,和所述子带处于所述多个子带中的位置确定。所述过渡阶段为过渡帧数计数器开始计数到结束计数的阶段,所述过渡帧数计数器的计数由以下公式确定:
fad_in_frame_count=min(fad_in_frame_count+1,COUNTfad_in);
其中,过渡帧数计数器计数的起始值为1,fad_in_frame_count为过渡帧数计数器的计数值,COUNTfad_in为过渡阶段持续帧数。
步骤s606,获取频域时变渐入的较高带信号分量。即对处理后的TDBWE频域包络或MDCT域的高带包络,分别使用TDBWE解码算法或TDAC解码算法,即可获得时变渐入的较高带信号分量,然后转步骤s607。
步骤s607,将处理后的较高和较低带信号分量合成,得到全带的重建信号。即将获得的较高带信号分量和重建出的较低带信号分量一起,输入QMF滤波器组进行合成滤波,得到全频带的重建信号。
本实施例本实施例中采用对频域编码参数进行时变加权的方法对所述音频信号在频域进行频域整形,使得所述音频信号在由较窄带宽向较宽带宽进行切换时满足渐变特性,从而提高了语音信号在由较窄带宽向较宽带宽进行切换时人耳听觉的舒适度。
本发明实施例的一种音频信号的解码方法的流程如图7所示,本实施例中采用对频域编码参数进行时变加权的方法对所述音频信号在频域进行频域整形,参照图7,本实施例包括以下步骤:
步骤s701~步骤s703与以上实施例中的步骤s601~步骤s603相同。
步骤s704,获取过渡阶段的较高带分量信息的每个数据帧在频域上的每个子带的增益。每次解码器处理8kb/s、12kb/s的语音信号或窄带噪声信号时,窄带宽带切换标志位fad_in_flag置0,过渡帧数计数器fad_in_frame_count置0,过渡阶段,解码器开始处理较高带分量信息(14kb/s或更高的语音信号或宽带噪声信号)时,窄带宽带切换标志位fad_in_flag为置为1,当过渡帧数fad_in_frame_count同时满足fad_in_frame_count<COUNTfad_in条件时,对第n帧(n≤COUNTfad_in,COUNTfad_in为过渡帧数)数据,当该帧为语音帧时,如果当前帧速率高于14kb/s时,则接收到的高频信号分量的编码参数包括MDCT域的高带包络和TDBWE算法中的频域包络。这些频域上的包络将整个高带在频域上划分为多个子带,这些谱包络用
Figure A200710166749D00171
(j=0,...,N-1,N为划分的子带数)表示。其中增益gain(n,j)由
gain ( n , j ) = 1 j &le; [ n &CenterDot; N COUNT fad _ in ] 0 j > [ n &CenterDot; N COUNT fad _ in ]
获取;其中gain(n,j)为增益,COUNTfad_in为过渡阶段持续帧数,N为划分的子带数。
如果切换发生后的第n帧(n≤COUNTfad_in)为噪音帧,则接收到的较高带分量信息的编码参数仅为TDBWE算法中的频域包络,这些频域包络将整个高带在频域上划分为N个子带,用
Figure A200710166749D00173
来表示这些频域包络。所述过渡阶段为过渡帧数计数器开始计数到结束计数的阶段,所述过渡帧数计数器的计数由以下公式确定:
fad_in_frame_count=min(fad_in_frame_count+1,COUNTfad_in);
其中,过渡帧数计数器计数的起始值为0,fad_in_frame_count为过渡帧数计数器的计数值,COUNTfad_in为过渡阶段持续帧数。
步骤s705,根据获取的增益,获取频域上时变渐入的频谱包络。即将高带编码参数分别乘以步骤s704中获取的增益,也等效于直接将高于第
Figure A200710166749D00181
个子带的谱包络置0,即:
F ^ env ( j ) = F ^ env ( j ) j &le; [ n &CenterDot; N COUNT fad _ in ] 0 j > [ n &CenterDot; N COUNT fad _ in ]
其中x表示不超过x的最大整数,即可得到频域上时变渐入的频谱包络。
步骤s706,获取较高带信号分量。对于语音帧,将处理后的TDBWE频域包络或MDCT域的高带包络,分别使用TDBWE解码算法或TDAC解码算法即可获得时变渐入的较高带信号分量。而对于噪声帧,只需对处理后的TDBWE频域包络使用TDBWE解码算法即可获取解码重建出的较高带信号分量,然后转步骤s707。
步骤s707,将处理后的较高和较低带信号分量合成,得到全带的重建信号。即将获得的较高带信号分量和已经解码重建出的较低带信号分量一起,输入QMF滤波器组进行合成滤波,得到全带的重建信号。
本实施例中采用对频域编码参数进行时变加权的方法对所述音频信号在频域进行频域整形,使得所述音频信号在由较窄带宽向较宽带宽进行切换时满足渐变特性,从而提高了语音信号在由较窄带宽向较宽带宽进行切换时人耳听觉的舒适度。
本发明实施例的一种音频信号的解码方法的流程如图8所示,本实施例中采用对频域编码参数进行时变加权的方法对所述音频信号在频域进行频域整形,参照图8,本实施例包括以下步骤:
步骤s801,解码器对接收到的音频信号进行速率检测。
步骤s802,根据检测出的速率判断所述音频信号是否由较窄带宽向较宽带宽进行切换,如果是,则转步骤s803。
步骤s803,分别利用接收到的代表窄带分量和宽带分量的编码参数解码获取出所述音频信号的窄带信号分量和较高带分量信息,然后转步骤s804。
步骤s804,利用FFT变换,将高带信号分量划分为多个子带。即对获取的较高带分量信息求取FFT变换,获得的FFT系数将整个高带分成了互不交叠的一系列子带,用
Figure A200710166749D00191
(j=0,...,N-1,N为FFT变换的长度)来表示这些FFT系数。
步骤s805,对每个子带的频域编码参数进行时变增益加权。本实施例中的频域编码参数为每个子带的FFT系数。每次解码器处理8kb/s、12kb/s的语音信号或窄带噪声信号时,窄带宽带切换标志位fad_in_flag置0,过渡帧数计数器fad_in_frame_count置0,过渡阶段,解码器开始处理较高带信号分量(14kb/s或更高的语音信号或宽带噪声信号)时,窄带宽带切换标志位fad_in_flag为置为1,当过渡帧数fad_in_frame_count同时满足fad_in_frame_count<COUNTfad_in条件时,对每个FFT系数按照时变的增益进行加权,即可得到频域上时变渐入的频谱包络。具体是将每个子带按时变渐入的增益因子gain(n,j)进行加权,即
Figure A200710166749D00192
而gain(n,j)由公式
gain ( n , j ) = max ( 0 , N &times; n - j &times; COUNT fad _ in ) ( N - j ) &times; COUNT fad _ in , n=1,…,COUNTfad_in j=0,…,N-1
获取,其中gain(n,j)为增益,COUNTfad_in为过渡阶段持续帧数,N为子带编码参数对整个高带在频域上划分的子带数。所述增益由所述数据帧处于过渡阶段的持续数据帧中的位置,和所述子带处于所述多个子带中的位置确定。
所述过渡阶段为过渡帧数计数器开始计数到结束计数的阶段,所述过渡帧数计数器的计数由以下公式确定:
fad_in_frame_count=min(fad_in_frame_count+1,COUNTfad_in);
其中,过渡帧数计数器计数的起始值为1,fad_in_frame_count为过渡帧数计数器的计数值,COUNTfad_in为过渡阶段持续帧数。
步骤s806,获取频域时变渐入的较高带信号分量。即对处理后的FFT系数进行反FFT变换即可获得时变渐入的较高带信号分量,然后转步骤s807。
步骤s807,将处理后的较高和较低带信号分量合成,得到全带的重建信号。即将获得的较高带信号分量和重建出的窄带信号分量一起,输入QMF滤波器组进行合成滤波,得到全频带的重建信号。
本实施例中采用对频域编码参数进行时变加权的方法对所述音频信号在频域进行频域整形,使得所述音频信号在由较窄带宽向较宽带宽进行切换时满足渐变特性,从而提高了语音信号在由较窄带宽向较宽带宽进行切换时人耳听觉的舒适度。
本发明实施例的一种音频信号的解码装置如图9所示,包括切换检测单元91、分量信息获取单元92、频域整形单元93、时域整形单元94和音频信号合成单元95。其中分量信息获取单元92分别与切换检测单元91和频域整形单元93连接,时域整形单元94分别与频域整形单元93和音频信号合成单元95连接。本实施例中频域整形单元93和时域整形单元94的位置可以互换,时域整形单元94也可以合并到频域整形单元93中。
切换检测单元91用于检测接收到的编码码流对应的音频信号是否由较窄带宽向较宽带宽进行切换;分量信息获取单元92用于当所述切换检测单元检测到接收到的编码码流对应的音频信号由较窄带宽向较宽带宽进行切换时,获取所述音频信号的较低带信号分量和较高带分量信息;频域整形单元93和时域整形单元94用于将分量信息获取单元92获取的较高带分量信息分别在频域和时域进行频域整形,并获得较高带信号分量;音频信号合成单元95用于将频域整形单元93和时域整形单元94处理后获得的较高带信号分量和分量信息获取单元92获取的较低带信号分量进行合成。
本实施例通过将音频信号的较高带分量信息进行频域整形,使得所述音频信号在由较窄带宽向较宽带宽进行切换时满足渐变特性,从而提高了语音信号在由较窄带宽向较宽带宽进行切换时人耳听觉的舒适度。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述仅是本发明的实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (17)

1、一种音频信号的解码方法,其特征在于,包括:
当接收到的编码码流对应的音频信号由较窄带宽向较宽带宽进行切换时,获取所述音频信号的较低带信号分量和较高带分量信息;
将所述较高带分量信息进行频域整形,并获得较高带信号分量;
将所述较高带信号分量和所述较低带信号分量进行合成。
2、如权利要求1所述音频信号的解码方法,其特征在于,所述将较高带分量信息进行频域整形具体包括:
利用时变的能量增益因子将所述较高带分量信息在时域进行整形,并将时域整形后的较高带分量信息通过时变滤波器进行频域整形;或
对频域编码参数进行时变加权。
3、如权利要求1所述音频信号的解码方法,其特征在于,在所述获取音频信号的较低带信号分量和较高带分量信息之后,还包括:将所述较高带分量信息在时域进行时变的渐入处理。
4、如权利要求1所述音频信号的解码方法,其特征在于,所述将较高带分量信息进行频域整形具体包括:
根据关键时刻的时变滤波器的极点和插值点数,获取n时刻的插值极点;
根据所述n时刻的插值极点,获取时变滤波器的转移函数;
根据所述转移函数,对过渡阶段的较高带分量信息进行时变滤波的渐入处理。
5、如权利要求4所述音频信号的解码方法,其特征在于,所述n时刻的插值极点由以下过程获取:
根据公式
rel(n)=rel(k)×(N-n)/N+rel(m)×n/N获取n时刻的插值极点的实部;
根据公式
img(n)=img(k)×(N-n)/N+img(m)×n/N获取n时刻的插值极点的虚部;
根据公式
T(n)=rel(n)+img(n)j获取n时刻的插值极点;
其中,T(n)为n时刻的时变滤波器的插值极点,rel(n)为n时刻的所述时变滤波器的插值极点的实部,rel(k)为关键时刻k的所述时变滤波器的极点的实部,rel(m)为关键时刻m的所述时变滤波器的极点的实部,img(n)为n时刻的所述时变滤波器的插值极点的虚部,img(k)为关键时刻k的所述时变滤波器的极点的虚部,img(m)为关键时刻m的所述时变滤波器的极点的虚部,N为插值点数。
6、如权利要求5所述音频信号的解码方法,其特征在于,所述转移函数由公式
H ( z ) = 1 + 2 z - 1 + z - 2 1 - 2 rel ( n ) z - 1 + [ rel 2 ( n ) + img 2 ( n ) ] z - 2
获取;其中,rel(n)为n时刻的时变滤波器的插值极点的实部,img(n)为n时刻的所述时变滤波器的插值极点的虚部。
7、如权利要求4所述音频信号的解码方法,其特征在于,所述过渡阶段为滤波计数器开始计数到结束计数的阶段,所述滤波计数器的计数由以下公式确定:
fad_in_count=min(fad_in_count+1,FAD_IN_COUNT_MAX);
其中,滤波计数器计数的起始值为0,fad_in_count为滤波计数器的计数值,FAD_IN_COUNT_MAX为过渡阶段持续采样点数。
8、如权利要求1所述音频信号的解码方法,其特征在于,所述将较高带分量信息进行频域整形具体包括:
将过渡阶段的较高带分量信息的每个数据帧在频域上划分为多个子带;
对每个子带的频域编码参数按照时变的增益进行加权。
9、如权利要求8所述音频信号的解码方法,其特征在于,所述增益由所述数据帧处于过渡阶段的持续数据帧中的位置,和所述子带处于所述多个子带中的位置确定。
10、如权利要求8或9所述音频信号的解码方法,其特征在于,所述增益由公式
gain ( n , j ) = max ( 0 , N &times; n - j &times; COUNT fad _ in ) ( N - j ) &times; COUNT fad _ in , n=1,…,COUNTfad_inj=0,…,N-1或
gain ( n , j ) = 1 j &le; [ n &CenterDot; N COUNT fad _ in ] 0 j > [ n &CenterDot; N COUNT fad _ in ]
获取;其中gain(n,j)为增益,COUNTfad_in为过渡阶段持续帧数,N为划分的子带数。
11、如权利要求8所述音频信号的解码方法,其特征在于,所述过渡阶段为过渡帧数计数器开始计数到结束计数的阶段,所述过渡帧数计数器的计数由以下公式确定:
fad_in_frame_count=min(fad_in_frame_count+1,COUNTfad_in);
其中,过渡帧数计数器计数的起始值为0,fad_in_frame_count为过渡帧数计数器的计数值,COUNTfad_in为过渡阶段持续帧数。
12、一种音频信号的解码装置,其特征在于,包括:
切换检测单元,用于检测接收到的编码码流对应的音频信号是否由较窄带宽向较宽带宽进行切换;
分量信息获取单元,用于当所述切换检测单元检测到接收到的音频信号由较窄带宽向较宽带宽进行切换时,获取所述音频信号的较低带信号分量和较高带分量信息;
频域整形单元,用于将所述分量信息获取单元获取的较高带分量信息进行频域整形,并获得较高带信号分量;
音频信号合成单元,用于将所述从频域整形单元获得的较高带信号分量和所述分量信息获取单元获取的较低带信号分量进行合成。
13、如权利要求12所述音频信号的解码装置,其特征在于,还包括时域整形单元,用于将所述音频信号的较高带分量信息在时域进行时变的渐入处理。
14、一种音频信号分量信息的频域整形方法,其特征在于,包括:
当音频信号由较窄带宽向较宽带宽进行切换时,获取所述音频信号的分量信息;
利用时变的能量增益因子将所述分量信息在时域进行整形,并将时域整形后的分量信息通过时变滤波器进行频域整形;或对频域编码参数进行时变加权。
15、如权利要求14所述音频信号分量信息的频域整形方法,其特征在于,在所述获取音频信号的分量信息之后,还包括:将所述分量信息在时域进行时变的渐入处理。
16、如权利要求14所述音频信号分量信息的频域整形方法,其特征在于,所述利用时变的能量增益因子将分量信息在时域进行整形,并将时域整形后的分量信息通过时变滤波器进行频域整形,具体包括:
根据关键时刻的时变滤波器的极点和插值点数,获取n时刻的插值极点;
根据所述n时刻的插值极点,获取时变滤波器的转移函数;
根据所述转移函数,对过渡阶段的分量信息进行时变滤波的渐入处理。
17、如权利要求14所述音频信号分量信息的频域整形方法,其特征在于,所述对频域编码参数进行时变加权,具体包括:
将过渡阶段的分量信息的每个数据帧在频域上划分为多个子带;
对每个子带的频域编码参数按照时变的增益进行加权。
CN2007101667493A 2007-11-02 2007-11-02 一种音频信号的解码方法及装置 Expired - Fee Related CN101425292B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007101667493A CN101425292B (zh) 2007-11-02 2007-11-02 一种音频信号的解码方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101667493A CN101425292B (zh) 2007-11-02 2007-11-02 一种音频信号的解码方法及装置

Publications (2)

Publication Number Publication Date
CN101425292A true CN101425292A (zh) 2009-05-06
CN101425292B CN101425292B (zh) 2013-01-02

Family

ID=40615860

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101667493A Expired - Fee Related CN101425292B (zh) 2007-11-02 2007-11-02 一种音频信号的解码方法及装置

Country Status (1)

Country Link
CN (1) CN101425292B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101990253A (zh) * 2009-07-31 2011-03-23 数维科技(北京)有限公司 一种带宽扩展方法及其装置
WO2011134415A1 (zh) * 2010-04-28 2011-11-03 华为技术有限公司 语音频信号切换方法及装置
WO2012009851A1 (en) * 2010-07-20 2012-01-26 Huawei Technologies Co., Ltd. Audio signal synthesizer
US8214218B2 (en) 2010-04-28 2012-07-03 Huawei Technologies Co., Ltd. Method and apparatus for switching speech or audio signals
CN103548078A (zh) * 2011-02-14 2014-01-29 弗兰霍菲尔运输应用研究公司 支持时域及频域编码模式的音频编解码器
CN103680509A (zh) * 2013-12-16 2014-03-26 重庆邮电大学 一种语音信号非连续传输及背景噪声生成方法
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
CN104869226A (zh) * 2014-02-20 2015-08-26 三星电子株式会社 电子设备和控制电子设备的方法
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9595262B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
CN108332845A (zh) * 2018-05-16 2018-07-27 上海小慧智能科技有限公司 噪声测量方法及噪声仪
CN109100584A (zh) * 2017-06-21 2018-12-28 国网江苏省电力公司常州供电公司 高输出直流电压的继电保护测试装置
CN109830242A (zh) * 2019-03-20 2019-05-31 蔡冠业 一种利用音频进行编码通信的方法及系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5969513B2 (ja) 2011-02-14 2016-08-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101990253A (zh) * 2009-07-31 2011-03-23 数维科技(北京)有限公司 一种带宽扩展方法及其装置
WO2011134415A1 (zh) * 2010-04-28 2011-11-03 华为技术有限公司 语音频信号切换方法及装置
US8214218B2 (en) 2010-04-28 2012-07-03 Huawei Technologies Co., Ltd. Method and apparatus for switching speech or audio signals
CN103069481B (zh) * 2010-07-20 2014-11-05 华为技术有限公司 音频信号合成器
WO2012009851A1 (en) * 2010-07-20 2012-01-26 Huawei Technologies Co., Ltd. Audio signal synthesizer
CN103069481A (zh) * 2010-07-20 2013-04-24 华为技术有限公司 音频信号合成器
US9082396B2 (en) 2010-07-20 2015-07-14 Huawei Technologies Co., Ltd. Audio signal synthesizer
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
CN103548078A (zh) * 2011-02-14 2014-01-29 弗兰霍菲尔运输应用研究公司 支持时域及频域编码模式的音频编解码器
CN103548078B (zh) * 2011-02-14 2015-12-23 弗兰霍菲尔运输应用研究公司 支持时域及频域编码模式的音频编解码器
US9595262B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9037457B2 (en) 2011-02-14 2015-05-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec supporting time-domain and frequency-domain coding modes
CN103680509B (zh) * 2013-12-16 2016-04-06 重庆邮电大学 一种语音信号非连续传输及背景噪声生成方法
CN103680509A (zh) * 2013-12-16 2014-03-26 重庆邮电大学 一种语音信号非连续传输及背景噪声生成方法
CN104869226A (zh) * 2014-02-20 2015-08-26 三星电子株式会社 电子设备和控制电子设备的方法
US9640192B2 (en) 2014-02-20 2017-05-02 Samsung Electronics Co., Ltd. Electronic device and method of controlling electronic device
CN109100584A (zh) * 2017-06-21 2018-12-28 国网江苏省电力公司常州供电公司 高输出直流电压的继电保护测试装置
CN109100584B (zh) * 2017-06-21 2024-04-09 国网江苏省电力公司常州供电公司 高输出直流电压的继电保护测试装置
CN108332845A (zh) * 2018-05-16 2018-07-27 上海小慧智能科技有限公司 噪声测量方法及噪声仪
CN108332845B (zh) * 2018-05-16 2018-09-14 上海小慧智能科技有限公司 噪声测量方法及噪声仪
CN109830242A (zh) * 2019-03-20 2019-05-31 蔡冠业 一种利用音频进行编码通信的方法及系统

Also Published As

Publication number Publication date
CN101425292B (zh) 2013-01-02

Similar Documents

Publication Publication Date Title
CN101425292B (zh) 一种音频信号的解码方法及装置
CN100585699C (zh) 一种音频解码的方法和装置
KR101290622B1 (ko) 오디오 복호화 방법 및 장치
CN101430880A (zh) 一种背景噪声的编解码方法和装置
CN101622661B (zh) 一种数字语音信号的改进编解码方法
KR101344174B1 (ko) 오디오 신호 처리 방법 및 오디오 디코더 장치
CN101263553B (zh) 分级编码/解码设备
EP1719116B1 (en) Switching from ACELP into TCX coding mode
CN101615396B (zh) 语音编码设备、以及语音解码设备
JP5863868B2 (ja) 適応的正弦波パルスコーディングを用いるオーディオ信号の符号化及び復号化方法及び装置
CN101971253B (zh) 编码装置、解码装置以及其方法
CN102184734B (zh) 编码装置、解码装置、编码方法及解码方法
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
EP1141946A1 (en) Coded enhancement feature for improved performance in coding communication signals
KR20020077389A (ko) 광대역 신호의 코딩을 위한 대수적 코드북에서의 펄스위치 및 부호의 인덱싱
CN102436819B (zh) 无线音频压缩、解压缩方法及音频编码器和音频解码器
CN102934163A (zh) 用于宽带语音编码的系统、方法、设备和计算机程序产品
CA2864247C (en) System and method for mixed codebook excitation for speech coding
KR102105305B1 (ko) 계층형 정현파 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치
WO2009029557A1 (en) Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
CN100555414C (zh) 一种dtx判决方法和装置
CN101281748B (zh) 用编码索引实现的空缺子带填充方法及编码索引生成方法
CN101622667A (zh) 用于分层编解码器的后置滤波器
CN101169934B (zh) 时域听觉阈值加权滤波器的构造方法和设备、编解码器
Crochiere et al. Frequency domain techniques for speech coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130102

Termination date: 20191102

CF01 Termination of patent right due to non-payment of annual fee