CN101727906B - 高频带信号的编解码方法及装置 - Google Patents

高频带信号的编解码方法及装置 Download PDF

Info

Publication number
CN101727906B
CN101727906B CN2008101715913A CN200810171591A CN101727906B CN 101727906 B CN101727906 B CN 101727906B CN 2008101715913 A CN2008101715913 A CN 2008101715913A CN 200810171591 A CN200810171591 A CN 200810171591A CN 101727906 B CN101727906 B CN 101727906B
Authority
CN
China
Prior art keywords
frequency band
frequency
signal
spectrum
smooth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008101715913A
Other languages
English (en)
Other versions
CN101727906A (zh
Inventor
刘泽新
苗磊
胡晨
肖玮
陈龙吟
哈维·米希尔·塔迪
张清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jingjiang City Chengzhong Village Investment And Construction Co ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2008101715913A priority Critical patent/CN101727906B/zh
Priority to PCT/CN2009/073129 priority patent/WO2010048827A1/zh
Publication of CN101727906A publication Critical patent/CN101727906A/zh
Application granted granted Critical
Publication of CN101727906B publication Critical patent/CN101727906B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Abstract

本发明公开了一种高频带信号的编解码方法及装置,涉及信号处理领域,解决了现有技术在对高频带信号处理时与原始高频带信号相差较大的问题。本发明实施例通过在编码时计算出高频带信号的平坦信息,以表示高频带信号是否平坦;这样,在解码端进行高频带信号恢复时,可以利用平坦信息及高低频能量信息等来指导高频增益的平滑处理,以使得平滑处理后的高频增益与原始的高频带信号增益更加吻合,从而,使得利用平滑处理后的高频增益修正得到的高频带信号与原高频带信号更加接近。本发明实施例主要用在需要进行高频带信号处理的领域,如音频信号处理。

Description

高频带信号的编解码方法及装置
技术领域
本发明涉及信号处理技术领域,尤其涉及对高频带信号进行编码和解码的方法及装置。
背景技术
音频/语音信号的高频信号一般包含较为丰富的内容,如果缺少高频信号,将损伤音频信号的音质。受采样率和带宽等因素的影响,通常优先保证有足够的比特对低频信号进行编码,而对于音频信号中的高频信号不会直接进行编码,为了降低对音频信号音质的损伤,人们通常采用频带扩展技术还原高频信号。
目前的频带扩展技术的实现如下:在编码的时候,求解高频信号增益参数,并将该增益参数发送给解码端;在解码的时候,利用所述的高频增益参数和解码得出低频信号重构高频信号,然后将重构的高频信号和解码出的低频信号进行整合,得到一个音频信号,该音频信号的频率范围包括高频带,从而提高了音频信号的音质。
在实现上述频带扩展技术的过程中,发明人发现现有技术中至少存在如下问题:由于低频带信号的编码是采用对连续预定个数的采样点计算平均值,这样使得还原的高频信号不连续,导致最后还原的高频信号可能不能准确反映原始高频信号的特性,从而使得听觉音质较差。
发明内容
本发明的实施例提供一种高频带信号的编解码方法及装置,使得解码出的高频带信号能够较为准确反映原始高频信号的特性,提高听觉音质。
为达到上述目的,本发明的实施例采用如下技术方案:
一种高频带信号的编码方法,包括:
利用高频带的时域信号获得频域包络信息;
根据高频带的子带频谱幅度获得高频带的频域信号中每个子带的平坦信息;
将所述高频带的频域包络信息以及所述每个子带的平坦信息合成编码码流。
一种高频带信号的解码方法,包括:
从接收到的编码码流中解码出高频带信号的频域包络信息和平坦信息;
根据所述高频带信号的频域包络信息和已解码出的低频带信号计算高频带的频谱增益;
依据所述平坦信息和所述频域包络信息对所述频谱增益在频域进行平滑;
利用平滑后的频谱增益对低频带信号进行修正得到高频带频谱;
将所述高频带频谱转换为高频带的时域信号。
一种高频带信号的编码装置,包括:
第一获取单元,用于利用高频带的时域信号获得频域包络信息;
第二获取单元,用于根据高频带的子带频谱幅度获得高频带的频域信号中每个子带的平坦信息;
输出单元,用于将所述高频带的频域包络信息以及所述每个子带的平坦信息合成编码码流。
一种高频带信号的解码装置,包括:
解码单元,从接收到的编码码流中解码出高频带信号的频域包络信息和平坦信息;
计算单元,用于根据所述高频带信号的频域包络信息和已解码出的低频带信号计算高频带的频谱增益;
处理单元,用于依据所述平坦信息和所述频域包络信息对所述频谱增益在频域进行平滑;
第一修正单元,用于利用平滑后的频谱增益对低频带信号进行修正得到高频带频谱;
变换单元,用于将所述高频带频谱转换为高频带的时域信号。
本发明实施例提供的高频带信号的编解码方法及装置,在编码时,不仅需要获得频域包络信息,还需要获得高频带信号在频域内的每个子带对应的平坦信息,以便更细节地表示出高频带信号每个子带是否平坦。在进行解码时,利用上述的平坦信息和频域包络信息指导高频增益进行平滑处理,在进行平滑处理后,高频增益能够较为真实地反映高频带信号的频谱特性,所以,采用平滑后的高频增益来修正低频带信号后得到的高频信号与原始的高频信号更为接近,能够较为准确反映原始高频信号的特性,提高听觉音质。
附图说明
图1为本发明实施例1中高频带信号的编码方法的流程图;
图2为本发明实施例1中高频带信号的解码方法的流程图;
图3为本发明实施例1中高频带信号的编码装置的框图;
图4为本发明实施例1中高频带信号的解码装置的框图;
图5为本发明实施例2中高频带信号的编码方法的流程图;
图6为本发明实施例2中高频带信号的解码方法的流程图;
图7为本发明实施例2中高频带信号的编码装置的第一种实现框图;
图8为本发明实施例2中高频带信号的编码装置的第二种实现框图;
图9为本发明实施例2中高频带信号的解码装置的框图。
具体实施方式
下面结合附图对本发明实施例高频带信号的编解码方法及装置进行详细描述。
实施例1:
本实施例提供一种高频带信号的编码方法,如图1所示,该编码方法包括如下步骤:
101、利用高频带的时域信号获得频域包络信息,具体获取过程如下:
首先,按照采样频率对高频带的时域信号进行采样得到高频带的离散信号,采用采样出的离散信号获得高频带的时域包络信息,具体可以采用但不限于如下方式:对连续N(N为大于等于1的正整数,本实施例中取N的值为3)个采样点的能量求平均值,用该平均值的平方根作为该N个采样点时域包络,即在采样点的个数较多的情况下,每连续的N个采样通过相同的值表示,所有的采样点计算完成后得到的信息就是整个帧的时域包络信息。
其次,由于求取时域包络时连续的N个采样点采用了相同值表示,但是这些点的数值可能有一些误差,本步骤中通过将高频带的时域信号变换为高频带的频域信号,求取频域包络来更好地表示高频带信号特性,在后面利用该频域包络能够间接地减小上述误差。本实施例中采用离散余弦变换得到高频带的频域信号。
最后,根据高频带的频域信号计算出频域包络信息,该计算的具体实现可以采用时域信号转换成时域包络信息相似的方式。
102、根据高频带的子带频谱幅度获得高频带的频域信号中每个子带的平坦信息,该平坦信息可以表示高频带频谱中该子带是否平坦,以便于解码的时候能够按照该平坦信息较准确地恢复出高频带的频谱。
103、将上述频域包络信息以及平坦信息合成编码码流,这样就完成了高频带信号的编码。
本实施例还提供一种高频带信号的解码方法,如图2所示,该解码方法包括如下步骤:
201、在接收到编码码流后,从编码码流中解码出高频带信号的频域包络信息和平坦信息。
202、由于本实施例采用修正低频带信号的方式得出高频带信号,所以需要计算出高频带信号相对于低频带信号的高频增益,即:根据频域包络信息和已解码出的低频带信号计算高频增益,可以采用但不限于如下具体计算公式:
gain [ i ] = envH [ i ] envL [ i ] i=0,1…N,其中gain[i]表示第i个子带的增益,envH[i]表示高频带信号第i个子带的能量的平方根,envL[i]表示低频带信号第i个子带的能量的平方根。
203、为了使得恢复出的高频带信号的特性更精确,本实施例中需要利用所述平坦信息和频域包络信息指导上述的高频增益进行平滑处理,也就是当平坦信息表示原始的高频信号某个子带并不平坦且高频前后帧与低频前后帧能量相差不大时,需要将频域包络信息进行一次平滑处理得出与原始高频信号较为接近的高频增益。
204、由于编码的高频信号的信息较少,需要利用高频信号与低频信号之间的关系来恢复高频信号,一般通过低频的频谱信号乘以相应的增益来模拟高频的频谱信号,在本实施例中,利用平滑后的高频增益对低频带的频谱信号进行修正得到高频带的频谱信号,由于高频增益经过平滑处理,所以得到的高频带的频域信号更平滑一些,更能反映原始高频带信号的特性。
205、将高频带的频域信号变换为高频带的时域信号,这样的高频带时域信号是较为准确的,减少了解码出的高频带信号在听觉上的不舒适感。
在实际解码时,还需要通过时域包络修正高频带时域信号,才能得到较为完整的高频带时域信号。
对应于图1中描述的高频带信号的编码方法,本实施例还提供一种高频带信号的编码装置,如图3所示,该编码装置包括:第一获取单元31、第二获取单元32和输出单元33。
其中,第一获取单元31用于利用高频带的时域信号获得频域包络信息,具体实现时,该第一获取单元31首先要对在对高频带的时域信号进行采样得到离散信号,并将采样出的离散信号编码成时域包络信息,然后将高频带的时域信号变换为高频带的频域信号,本实施例中采用离散余弦变换得到高频带的频域信号;最后将高频带的频域信号计算出频域包络信息;第二获取单元32用于根据高频带的子带频谱幅度获得高频带的频域信号中每个子带的平坦信息,该平坦信息可以表示该子带是否平坦,以便于解码的时候能够按照该平坦信息较准确地恢复出高频带频谱特性;输出单元33用于将频域包络信息以及平坦信息合成编码码流。
对应于图2中描述的高频带信号的解码方法,本实施例还提供一种高频带信号的解码装置,如图4所示,该编码装置包括:解码单元41、计算单元42、处理单元43、第一修正单元44和变换单元45。
其中,解码单元41用于从接收到的编码码流中解码出高频带信号的频域包络信息和平坦信息;计算单元42用于根据频域包络信息和已解码出的低频带信号计算高频增益,计算公式可以采用 gain [ i ] = envH [ i ] envL [ i ] i=0,1…N,其中gain[i]表示第i个子带的高频增益,envH[i]表示高频带信号第i个子带的能量的平方根,envL[i]表示低频带信号第i个子带的能量的平方根;处理单元43用于依据所述平坦信息和频域包络信息指导所述高频增益进行平滑处理,这样就可以得出与原始高频信号较为接近的高频增益;第一修正单元44用于利用平滑后的高频增益对低频带信号进行修正得到高频带的频域信号;变换单元45用于将高频带的频域信号变换为高频带的时域信号。由于高频增益经过了平滑处理,更加符合原始高频信号的特性,减少了解码出的高频带信号的不舒适感。
本发明实施例提供的高频带信号的编解码方法及装置,在编码时,不仅需要计算频域包络信息,还需要计算高频带信号的频域信号每个子带对应的平坦信息,以便更细节地表示出高频信号带信号每个子带是否平坦。在进行解码时,就可以利用上述的平坦信息和频域包络信息指导高频增益进行平滑处理,在进行平滑处理后,高频增益就能够较为真实地反映高频带频谱信号的特性,利用平滑后的高频增益来修正低频带频谱信号从而得到高频带的频谱信号,这样就能减少解码出的高频带信号在听觉上的不舒适感,即:最后解码出的频带信号能够较为准确反映原始高频信号的特性,提高听觉音质。
实施例2:
本实施例提供一种高频带信号的编码方法,如图5所示,该编码方法包括如下步骤:
501、按照采样频率对高频带的时域信号进行采样,将采样出的高频带时域信号s(n)延迟N个样点后计算出时域包络信息,具体的计算方式可以采用但不限于如下方式:将高频带时域信号s(n)划分成多个子带,每个子带中包含由n个采样点,对第i个子带中连续n个采样点的能量取平均值,将该平均值作为该子带的功率值,所有的采样点计算完成后得到的信息就得到该帧的时域包络信息。
在具体求解上述时域包络信息时,具体采用的公式如下:
E ( i ) = 1 2 log 2 ( Σ n = 0 N s 2 ( n ) ) - - - ( 1 )
其中,E(i)表示第i个子带的时域包络;n表示第i个子带的时域信号采样点的个数。
502、由于求取时域包络时每个子带的去平均值作为功率值,造成每个子带内的采样点上实际功率值与时域包络表示的功率值之间存在误差,本步骤通过将高频带的时域信号变换为高频带的频域信号,求取频域包络来更好地表示高频带信号特性,通过后续的解码操作能够利用频域包络来减小所述误差。
本实施例中采用修正的离散余弦变换(MDCT)得到高频带的频域信号。
503、将高频带的频域信号计算出频域包络信息,该计算的具体实现可以采用步骤501中相似的方式。
504、根据高频带的子带频谱幅度获得高频带的频域信号中每个子带的平坦信息,平坦信息反映信号频谱在一定的频段内频谱平坦与否,本实施例提供如下两种计算方法:
第一种、在每个子带中,计算出每个子带中频谱幅度的平均值,并查找出每个子带中频谱幅度的最大值;然后将所述平均值除以所述最大值得出频谱幅度比率,并判断所述频谱幅度比率是否小于预定比率,这个预定比率的取值和输入的信号特性有关,一般取0.1至0.2比较合适;如果所述频谱幅度比率小于预定比率,则输出表示不平坦的平坦信息,一般以数值“1”来表示;否则输出表示平坦的平坦信息,一般以数值“0”来表示。
第二种、首先计算每个子带中频谱幅度的几何平均值和算术平均值,然后将所述几何平均值除以所述算术平均值得出频谱幅度比率;其对应公式为:
SFM i = ( Π k = b i e i X [ k ] ) 1 / N 1 N Σ k = b i e i X [ k ] , 其中,X[k]是指频谱幅度,N为第i子带的长度。bi表示第i个子带的频谱首地址,ei表示第i个子带的频谱尾地址。
在得出频谱幅度比率后,判断所述频谱幅度比率是否小于预定比率,这个预定比率的取值和输入的信号特性有关,一般取0.1至0.2比较合适;如果所述频谱幅度比率小于预定比率,则输出表示不平坦的平坦信息,一般以数值“1”来表示;否则输出表示平坦的平坦信息,一般以数值“0”来表示。
505、将上述时域包络信息、频域包络信息以及平坦信息合成编码码流,这样就完成了高频带信号的编码。
在解码时,如果需要解码出高频带信号,需要在低频带信号的基础进行修正,所以本实施例的解码过程中需要先对解码出的低频带信号进行MDCT变换(修正的离散余弦变换),以便得到低频带信号的频谱信息,才能进行高频带信号的解码,如图6所示,本实施例高频带信号的解码方法包括如下步骤:
601、在接收到编码码流后,从编码流中解码出高频带信号的频域包络信息、时域包络信息和平坦信息。
602、由于本实施例采用修正低频带频谱信息的方式得出高频带的频谱信息,所以需要计算出高频带信号相对于低频带信号的频谱增益,即:根据频域包络信息和已解码出的低频带信号计算高频带频谱增益,可以采用但不限于如下具体计算公式:
gain [ i ] = envH [ i ] envL [ i ] i=0,1…N,其中gain[i]表示第i个子带的增益,envH[i]表示高频带信号第i个子带的平均能量的平方根,envL[i]表示低频带信号第i个子带的平均能量的平方根。
603、为了使得恢复出的高频带频谱信号更精确,本实施例中需要依据所述平坦信息和频域包络信息指导上述的高频增益进行平滑处理,首先判断平坦信息和频域包络信息是否满足平滑条件;当满足平滑条件时,执行步骤604,当不满足平滑条件时,执行步骤605。
其中的平滑条件可以包括但不限于如下几个:
1、当前帧高频带信号具有谐波性,用公式表示为:sum_sharpness>M,其中,sum_sharpness为当前帧所有子带平坦信息(sharpness)的总和,M为一个预设的常量,对每个子带,当sharpness=1时,说明此子带并不平坦、谐波性较强;当sharpness=0时,说明当前子带频谱比较平坦,谐波性较弱。故而,当sum_sharpness>M时,能保证当前帧高频信号谐波性较强,需要将频域包络信息进行一次平滑处理得出与原始高频信号较为接近的高频增益。有了保证高频带信号具有谐波性的条件后,本实施就能够保证在执行步骤604时,只对那些高频频谱谐波性较强信号做频谱增益的平滑处理。
2、当前帧与前一帧的对应的高频带信号的频域包络信息连续平稳,用公式表示为:其中,K1、K2、K3、K4为预定的常量,假定一帧内子带个数为N,prev_sum_envH为前一帧高频带N个子带的频域包络总和,即 prev _ sum _ envH = Σ i = 0 N - 1 prev _ envH [ i ] , sum_envH为当前帧高频带N个子带的频域包络总和,即 sum _ envH = Σ i = 0 N - 1 envH [ i ] ; prev_sum_envH_fh为前一帧前N/2个子带的频域包络的总和,即 prev _ sum _ envH _ fh = Σ i = 0 N / 2 prev _ envH [ i ] , sum_envH_fh为当前帧前N/2个子带的频域包络总和,即 sum _ envH _ fh = Σ i = 0 N / 2 envH [ i ] .
将上述两个比值的在预定的范围内时,表示高频带频域包络的前后帧的差别并不大,频域包络信息具有连续平稳的特性,这样就不会在原始信号高频信号本身不连续平稳的部分做平滑,尽可能地使平滑处理后的高频增益能与原高频信号相对应。
3、当前帧与前一帧的对应的低频带信号的频域包络信息连续平稳,用公式表示为:
Figure G2008101715913D00111
其中,K4、K5、K6、K7为预定的常量,sum_envL和prev_sum_envL分别为低频带信号的当前帧和其前一帧的N个子带的频域包络总和,sum_envL_fh和prev_sum_envL_fh分别为低频带信号的当前帧和其前一帧的前N/2个子带的频域包络总和。将上述两个比值的在预定的范围内时,表示对应的低频信号的频域包络的前后帧的差别并不大,频域包络信息具有连续平稳的特性。
当然,本实施例还可以根据高频带信号传输到解码端的其它参数、以及解码出的低频带信号的其它参数、或者参数之间的关系作为增益平滑条件,例如频谱能量、线形预测系数等。
604、在满足平滑条件的情况下,将当前帧每个子带的高频增益与前一帧对应子带的高频增益的加权平均值作为当前帧对应子带的高频增益。prev_gain[i]=α·gain[i]+β·prev_gain[i],其中,gain[i]表示当前帧第i个子带的高频增益,prev_gain[i]表示前一帧第i个子带的高频增益,系数α和β是常数。
一般情况下α和β满足如下关系:α+β=1。
605、对帧内连续子带的频谱增益之间进行平滑处理,高频增益平滑处理的公式如下:
MDCT [ i · M + j ] = MDCT [ i · M + j ] · gain [ i ] i = 0 , j = 0 · · · M / 2 - 1 MDCT [ i · M + j ] = MDCT [ i · M + j ] · ( gain [ i ] · ( 3 / 2 - j / M ) + gain [ i + 1 ] · ( j / M - 1 / 2 ) ) i = 0 · · · N - 2 , j = M / 2 · · · M - 1 MDCT [ i · M + j ] = MDCT [ i · M + j ] · ( gain [ i - 1 ] · ( 1 / 2 - j / M ) + gain [ i ] · ( 1 / 2 + j / M ) ) i = 1 · · · N - 1 , j = 0 · · · M / 2 - 1 MDCT [ i · M + j ] = MDCT [ i · M + j ] · gain [ i ] i = N - 1 , j = M / 2 · · · M
其中,M为第i个子带内元素的个数,N为该帧内子带的个数,i为第i个子带,j为第i个子带中的第j个元素,MDCT[i·M+j]表示第i个子带内第j个元素值。
该公式表示:每帧内第一个子带前一半元素的高频增益、以及最后一个子带的后一半元素的高频增益保持不变,而中间所有子带的频谱增益要和其前后子带的频谱增益进行平滑处理。
606、本实施例利用高频信号与低频信号之间的关系来恢复高频信号,一般来说将低频频谱信号乘以相应的高频带频谱增益来恢复高频频谱信号,在本实施例中,利用平滑后的高频增益对低频带信号进行修正得到高频带的频谱信号,高频增益经过平滑处理,得到的高频带的频域信号与原始的高频频谱信号更为接近。
607、将高频带的频域信号变换为高频带的时域信号,一般采用IMDCT变换方法得到时域信号,此操作是编码端由时域变换到频域的逆过程,编解码端的变换要保持一致。
608、利用时域包络信息修正变换出的高频带的时域信号。
在上述实施例中需要对低频带频域信号进行修正得到高频带的频域信号,所以,低频带频谱信号的特性直接影响了本实施例中解码出的高频带频谱信号的特性,为了进一步提升高频带频谱信号的性能,本实施例中还需要利用平坦信息对低频带频谱信号进行频谱整形,这样,在步骤608中用来修正高频带的试运行好的时域包络信息就是进行频谱整形后的时域包络信息。
对应于本实施例中图5所述的高频带信号的编码方法,本实施提供一种高频带信号的编码装置,如图7所示,该编码装置包括:第一获取单元71、第二获取单元72和输出单元73。
其中,第一获取单元71用于利用高频带的时域信号获得频域包络信息,具体实现时,该第一获取单元71首先要对在对高频带的时域信号进行采样得到离散信号,并将采样出的离散信号编码成时域包络信息,然后将高频带的时域信号变换为高频带的频域信号,本实施例中采用离散余弦变换得到高频带的频域信号;最后将高频带的频域信号计算出频域包络信息;第二获取单元72用于根据高频带的子带频谱幅度获得高频带的频域信号中每个子带的平坦信息,该平坦信息可以表示该子带是否平坦,以便于解码的时候能够按照该平坦信息较准确地恢复出高频带频谱特性;输出单元73用于将频域包络信息以及平坦信息合成编码码流。
上述的第二获取单元72可以采用如下两种实现方式:
第一、如图7所示,该第二获取单元72包括:计算模块721、查找模块722、除法模块723、判断模块724和输出模块725。
其中,计算模块721用于计算每个子带中频谱幅度的平均值;查找模块722用于查找每个子带中频谱幅度的最大值;除法模块723用于将所述平均值除以所述最大值得出频谱幅度比率;判断模块724用于判断所述频谱幅度比率是否小于预定比率;在所述频谱幅度比率小于预定比率时,输出模块725用于输出表示不平坦的平坦信息,一般以数值“1”表示;在所述频谱幅度比率不小于预定比率时,输出模块725用于输出表示平坦的平坦信息,一般以数值“0”表示。
第二、如图8所示,该第二获取单元72包括:计算模块726、除法模块727、判断模块728和输出模块729。
其中,计算模块726用于计算每个子带中频谱幅度的几何平均值和算术平均值;除法模块727用于将所述几何平均值除以所述算术平均值得出频谱幅度比率;判断模块728用于判断所述频谱幅度比率是否小于预定比率;在所述频谱幅度比率小于预定比率时,输出模块729用于输出表示不平坦的平坦信息,一般以数值“1”表示;在所述频谱幅度比率不小于预定比率时,输出模块729用于输出表示平坦的平坦信息,一般以数值“0”表示。
对应于本实施例中图6所描述的高频带信号的解码方法,本实施例提供一种高频带信号的解码装置,如图9所示,该装置包括:解码单元91、计算单元92、处理单元93、第一修正单元94、变换单元95、第二修正单元96、整形单元97和帧内平滑单元98。
其中,解码单元91用于从接收到的编码流中解码出高频带信号的频域包络信息和平坦信息;计算单元92用于根据频域包络信息和已解码出的低频带信号计算高频增益,计算公式可以采用 gain [ i ] = envH [ i ] envL [ i ] i=0,1…N,其中gain[i]表示第i个子带的高频增益,envH[i]表示高频带信号第i个子带的平均能量的平方根,envL[i]表示低频带信号第i个子带的平均能量的平方根;处理单元93用于依据所述平坦信息和频域包络信息指导所述高频增益进行平滑处理,这样就可以得出与原始高频信号较为接近的高频增益。本发明实施例中的处理单元93通过如下方式实现:
该处理单元93包括:判断模块931和平滑模块932。其中,判断模块931用于依据平坦信息和频域包络信息判断频谱增益是否满足平滑条件,这里的平滑条件和步骤603中提到的平滑条件相同,在满足平滑条件的情况下,平滑模块932用于将当前帧每个子带的高频增益与前一帧对应子带的高频增益的加权平均值作为当前帧对应子带的高频增益,公式为:prev_gain[i]=α·gain[i]+β·prev_gain[i],其中,gain[i]表示当前帧第i个子带的高频增益,prev_gain[i]表示前一帧第i个子带的高频增益,系数α和β是常数,一般情况下α和β满足如下关系:α+β=1。
无论是否满足平滑条件,本实施例中的帧内平滑单元98都需要对帧内连续子带的频谱增益进行平滑处理。
在对频谱增益进行平滑处理后,本实施例利用频谱增益以及低频带频谱信号得到高频带频谱信号,为了使恢复出的高频带频谱信号与原始高频带频谱信号更逼近,本实施例对低频带信号进行频谱整形,故而整形单元97用于利用平坦信息对低频带信号进行频谱整形。
本实施例中的第一修正单元94利用平滑后的高频增益对整形后的低频带频谱信号进行修正得到高频带的频域信号;变换单元95用于将高频带的频域信号变换为高频带的时域信号。由于高频增益经过了平滑处理,更加符合原高频信号的特性,这样的高频带时域信号是较为准确的,减少了解码出的高频带信号的不舒适感。本实施例中的第二修正单元96用于利用时域包络信息修正变换出的高频带的时域信号。
本发明实施例提供的高频带信号的编解码方法及装置,在编码时,不仅需要计算出时域包络信息和频域包络信息,还需要计算高频带信号的频域信号每个子带对应的平坦信息,以便更细节地表示出高频信号带信号每个子带是否平坦。在进行解码时,就可以利用上述的平坦信息和频域包络信息指导高频增益进行平滑处理,利用平滑后的高频增益来修正低频带信号频谱从而得到高频带频谱信号,使高频带信号更真实地反映原始高频带信号特性,减少高频带信号解码时的不舒适感。
上述的平滑处理包括帧内相邻子带之间的平滑处理,在满足平滑条件的情况下还包括相邻帧之间的平滑处理,使得满足平滑条件的高频信号不会出现能量突变和不连续平稳的现象,能够提高高频信号的听觉质量。
并且本实施例中作为恢复频带信号的低频带信号是经过整形后的低频带信号,削弱了最后得到的高频信号出现的金属噪音。
本发明实施例主要用在需要处理高频带信号的场合,如:音频信号处理。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (8)

1.一种音频高频带信号的解码方法,其特征在于,包括:
从接收到的编码码流中解码出高频带信号的频域包络信息和平坦信息;
根据所述高频带信号的频域包络信息和已解码出的低频带信号计算高频带的频谱增益;
依据所述平坦信息和所述频域包络信息对所述频谱增益在频域进行平滑;
利用平滑后的频谱增益对低频带信号进行修正得到高频带频谱;
将所述高频带频谱转换为高频带的时域信号;
所述依据所述平坦信息和频域包络信息对所述高频带的频谱增益在频域进行平滑包括:
根据平坦信息和频域包络信息判断高频带的频谱增益是否满足平滑条件;
在满足平滑条件的情况下,将当前帧每个子带的高频带的频谱增益与前一帧对应子带的高频带的频谱增益的加权平均值作为当前帧对应子带的高频带的频谱增益;
所述平滑条件包括:当前帧与前一帧的对应的高频带信号的频域包络信息连续平稳,或者当前帧的平坦信息表示该高频带信号具有谐波性,或者当前帧与前一帧的对应的低频带信号的频域包络信息连续平稳。
2.根据权利要求1所述的音频高频带信号的解码方法,其特征在于,该方法还包括:
从接收到的编码码流中解码出高频带信号的时域包络信息;
利用时域包络信息修正转换出的高频带的时域信号。
3.根据权利要求1所述的音频高频带信号的解码方法,其特征在于,该方法还包括:
利用平坦信息对已解码出的低频带信号进行频谱整形;
所述利用平滑后的频谱增益对低频带信号进行修正得到高频带频谱为:利用平滑后的频谱增益对频谱整形后的低频带信号进行修正得到高频带频谱。
4.根据权利要求1所述的音频高频带信号的解码方法,其特征在于,在利用平滑后的频谱增益对低频带信号进行修正得到高频带频谱之前,该方法还包括:
在帧内连续子带的频谱增益之间进行平滑处理。
5.一种音频高频带信号的解码装置,其特征在于,包括:
解码单元,从接收到的编码码流中解码出高频带信号的频域包络信息和平坦信息;
计算单元,用于根据所述高频带信号的频域包络信息和已解码出的低频带信号计算高频带的频谱增益;
处理单元,用于依据所述平坦信息和所述频域包络信息对所述频谱增益在频域进行平滑;
第一修正单元,用于利用平滑后的频谱增益对低频带信号进行修正得到高频带频谱;
转换单元,用于将所述高频带频谱转换为高频带的时域信号;
所述处理单元包括:
判断模块,用于根据平坦信息和频域包络信息判断高频带的频谱增益是否满足平滑条件;
平滑模块,用于在满足平滑条件的情况下,将当前帧每个子带的高频带的频谱增益与前一帧对应子带的高频带的频谱增益的加权平均值作为当前帧对应子带的高频带的频谱增益;
所述平滑条件包括:当前帧与前一帧的对应的高频带信号的频域包络信息连续平稳,或者当前帧的平坦信息表示该高频带信号具有谐波性,或者当前帧与前一帧的对应的低频带信号的频域包络信息连续平稳。
6.根据权利要求5所述的音频高频带信号的解码装置,其特征在于,所述解码单元还用于从接收到的编码码流中解码出高频带信号的时域包络信息;
该装置还包括:
第二修正单元,用于利用时域包络信息修正转换出的高频带的时域信号。
7.根据权利要求5所述的音频高频带信号的解码装置,其特征在于,该装置还包括:整形单元,用于利用平坦信息对已解码出的低频带信号进行频谱整形;
所述第一修正单元利用平滑后的频谱增益对频谱整形后的低频带信号进行修正得到高频带频谱。
8.根据权利要求5所述的音频高频带信号的解码装置,其特征在于,该装置还包括:
帧内平滑单元,用于对帧内连续子带的频谱增益之间进行平滑处理。
CN2008101715913A 2008-10-29 2008-10-29 高频带信号的编解码方法及装置 Expired - Fee Related CN101727906B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2008101715913A CN101727906B (zh) 2008-10-29 2008-10-29 高频带信号的编解码方法及装置
PCT/CN2009/073129 WO2010048827A1 (zh) 2008-10-29 2009-08-06 高频带信号的编解码方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101715913A CN101727906B (zh) 2008-10-29 2008-10-29 高频带信号的编解码方法及装置

Publications (2)

Publication Number Publication Date
CN101727906A CN101727906A (zh) 2010-06-09
CN101727906B true CN101727906B (zh) 2012-02-01

Family

ID=42128225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101715913A Expired - Fee Related CN101727906B (zh) 2008-10-29 2008-10-29 高频带信号的编解码方法及装置

Country Status (2)

Country Link
CN (1) CN101727906B (zh)
WO (1) WO2010048827A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2656812C2 (ru) * 2014-04-29 2018-06-06 Хуавэй Текнолоджиз Ко., Лтд. Способ и устройство обработки сигналов

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101556799B (zh) 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
TWI496138B (zh) * 2013-09-03 2015-08-11 Helios Semiconductor Inc 用於編解碼高頻聲音信號之技術和系統
CN104681032B (zh) * 2013-11-28 2018-05-11 中国移动通信集团公司 一种语音通信方法和设备
EP3614382B1 (en) * 2014-07-28 2020-10-07 Nippon Telegraph And Telephone Corporation Coding of a sound signal
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN107545900B (zh) * 2017-08-16 2020-12-01 广州广晟数码技术有限公司 带宽扩展编码和解码中高频弦信号生成的方法和装置
CN112242145A (zh) * 2019-07-17 2021-01-19 南京人工智能高等研究院有限公司 语音滤波方法、装置、介质和电子设备
CN110556123B (zh) * 2019-09-18 2024-01-19 腾讯科技(深圳)有限公司 频带扩展方法、装置、电子设备及计算机可读存储介质
CN113808597A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置
CN115148217A (zh) * 2022-06-15 2022-10-04 腾讯科技(深圳)有限公司 音频处理方法、装置、电子设备、存储介质及程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1639770A (zh) * 2002-03-28 2005-07-13 杜比实验室特许公司 根据频率变换重建具有不完全频谱的音频信号的频谱
CN1897467A (zh) * 2005-07-11 2007-01-17 索尼株式会社 信号编码、信号解码装置和方法、程序以及记录介质
CN1954363A (zh) * 2004-05-19 2007-04-25 松下电器产业株式会社 编码装置、解码装置及它们的方法
CN101140759A (zh) * 2006-09-08 2008-03-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1639770A (zh) * 2002-03-28 2005-07-13 杜比实验室特许公司 根据频率变换重建具有不完全频谱的音频信号的频谱
CN1954363A (zh) * 2004-05-19 2007-04-25 松下电器产业株式会社 编码装置、解码装置及它们的方法
CN1897467A (zh) * 2005-07-11 2007-01-17 索尼株式会社 信号编码、信号解码装置和方法、程序以及记录介质
CN101140759A (zh) * 2006-09-08 2008-03-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2656812C2 (ru) * 2014-04-29 2018-06-06 Хуавэй Текнолоджиз Ко., Лтд. Способ и устройство обработки сигналов
RU2688259C2 (ru) * 2014-04-29 2019-05-21 Хуавэй Текнолоджиз Ко., Лтд. Способ и устройство обработки сигналов

Also Published As

Publication number Publication date
WO2010048827A1 (zh) 2010-05-06
CN101727906A (zh) 2010-06-09

Similar Documents

Publication Publication Date Title
CN101727906B (zh) 高频带信号的编解码方法及装置
CN102341852B (zh) 滤波语音信号的方法和滤波器
EP2791937B1 (en) Generation of a high band extension of a bandwidth extended audio signal
CN102308333B (zh) 修改的离散余弦变换音频编码器的带宽扩展方法和装置
CN101067931B (zh) 一种高效可配置的频域参数立体声及多声道编解码方法与系统
CN101662288B (zh) 音频编码、解码方法及装置、系统
CN103117066B (zh) 基于时频瞬时能量谱的低信噪比语音端点检测方法
CN103187065B (zh) 音频数据的处理方法、装置和系统
CN102985969B (zh) 编码装置、解码装置和编码方法、解码方法
CN101512639A (zh) 用于语音/音频发送器和接收器的方法和设备
US11594236B2 (en) Audio encoding/decoding based on an efficient representation of auto-regressive coefficients
CN104011793A (zh) 帧错误隐藏方法和设备以及音频解码方法和设备
CN104025189A (zh) 编码语音信号的方法、解码语音信号的方法,及使用其的装置
CN104978970A (zh) 一种噪声信号的处理和生成方法、编解码器和编解码系统
CN1186765C (zh) 2.3kb/s谐波激励线性预测语音编码方法
US10762912B2 (en) Estimating noise in an audio signal in the LOG2-domain
CN101636785A (zh) 用于增强语音编解码器的质量的设备和方法
EP1497631B1 (en) Generating lsf vectors
JP2002366195A (ja) 音声符号化パラメータ符号化方法及び装置
CN102169694A (zh) 生成心理声学模型的方法及装置
CN101587711B (zh) 基音后处理方法、滤波器以及基音后处理系统
CN100498933C (zh) 代码转换机及代码转换方法
JP4618823B2 (ja) 信号符号化装置及び方法
Dhubkarya et al. HIGH QUALITY AUDIO CODING AT LOW BIT RATE USING WAVELET AND WAVELET PACKET TRANSFORM.
JP2002099300A (ja) 音声符号化方法及び装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201209

Address after: 510640 2414-2416 of the main building 371, five mountain road, Tianhe District, Guangzhou, Guangdong.

Patentee after: GUANGDONG GAOHANG INTELLECTUAL PROPERTY OPERATION Co.,Ltd.

Address before: 518129 headquarters building of Bantian HUAWEI base, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.

Effective date of registration: 20201209

Address after: 214500 Tianping international business center, Jiangping Road, Jingjiang, Taizhou, Jiangsu 706

Patentee after: JINGJIANG SHENGXUN INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 510640 2414-2416 of the main building 371, five mountain road, Tianhe District, Guangzhou, Guangdong.

Patentee before: GUANGDONG GAOHANG INTELLECTUAL PROPERTY OPERATION Co.,Ltd.

TR01 Transfer of patent right

Effective date of registration: 20220602

Address after: 214500 No. 28, Yingbin East Road, Jingjiang City, Taizhou City, Jiangsu Province

Patentee after: Jiangsu Huarong Investment Development Co.,Ltd.

Address before: 214500 Tianping international business center, Jiangping Road, Jingjiang, Taizhou, Jiangsu 706

Patentee before: JINGJIANG SHENGXUN INFORMATION TECHNOLOGY CO.,LTD.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230406

Address after: 214500 Shangcheng Yipin 4-606, Jingjiang City, Taizhou City, Jiangsu Province

Patentee after: Jingjiang City Chengzhong Village Investment and Construction Co.,Ltd.

Address before: 214500 No. 28, Yingbin East Road, Jingjiang City, Taizhou City, Jiangsu Province

Patentee before: Jiangsu Huarong Investment Development Co.,Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120201

CF01 Termination of patent right due to non-payment of annual fee