CN101521010B - 一种音频信号的编解码方法和装置 - Google Patents

一种音频信号的编解码方法和装置 Download PDF

Info

Publication number
CN101521010B
CN101521010B CN 200810006391 CN200810006391A CN101521010B CN 101521010 B CN101521010 B CN 101521010B CN 200810006391 CN200810006391 CN 200810006391 CN 200810006391 A CN200810006391 A CN 200810006391A CN 101521010 B CN101521010 B CN 101521010B
Authority
CN
China
Prior art keywords
temporal envelope
coding
parameter
degree
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 200810006391
Other languages
English (en)
Other versions
CN101521010A (zh
Inventor
张德明
张琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN 200810006391 priority Critical patent/CN101521010B/zh
Priority to PCT/CN2009/070522 priority patent/WO2009109120A1/zh
Publication of CN101521010A publication Critical patent/CN101521010A/zh
Application granted granted Critical
Publication of CN101521010B publication Critical patent/CN101521010B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring

Abstract

本发明实施例公开的一种音频信号的编码方法包括:获得当前帧音频信号的稳定度参数,并根据所述当前帧音频信号的稳定度参数,从所述当前帧音频信号中提取相应个数的时域包络信息;对所提取的时域包络信息量化编码,得到时域包络的编码码字;获得所述时域包络信息的量化值,利用所述量化值对所述当前帧音频信号进行归一化处理;将归一化处理后的当前帧音频信号和前一帧音频信号变换编码。此外本发明还公开一种音频信号的解码方法、及编解码装置。本发明能够在消除瞬态信号带来的噪声泄漏问题的同时还节约了编解码的资源。

Description

一种音频信号的编解码方法和装置
技术领域
本发明涉及信号处理技术,尤其涉及一种音频信号的编解码方法和装置。
背景技术
在如宽带或超宽带语音、音乐等信号(统称“音频信号”)的编解码中,使用较广泛的是基于MDCT(修正的离散余弦变换,Modified Discrete CosineTransform)的变换域编码,其主要方法是将一定长度的音频信号变换到变换域,然后根据特定的量化策略对变换域的系数进行量化编码。但是MDCT得到的信号常会因为信号从相对较小的能量突然过度到很大的能量而出现预回声(pre-echo)效应,即后一帧较大能量的帧的量化误差在解码端通过MDCT的重叠相加泄露到了前面能量相对较小的帧中。如图1中的(a)、(b)所示,分别为MDCT编码前后的信号示意图。
由于这种pre-echo效应引起的量化噪声通常能被人耳察觉,因此,为了克服这种量化噪声泄漏,通常采用的一种音频信号的编码方法是在编码端在MDCT变换的基础上对每一帧信号提取固定个数的时域包络信息,然后再将所提取的时域包络信息经量化及归一化等处理后进行变换编码。在解码端,采用相应的逆函数恢复出原始信号。
然而,在进行本发明创造过程中,发明人发现该现有技术至少存在如下问题:
由于现有技术是对每一帧音频信号都提取固定个数的时域包络信息,而且为了抑制噪声泄漏,通常都会采用较高的时间分辨率,因此提取的时域包络信息的个数会比较多,这样将需要用大量的比特对每一帧音频信号的时域包络信息进行量化编码。但是大多数情况下音频信号是相对稳定的,其时域包络信息也是相对平稳的,因此,如果仍然采用较高的时间分辨率,则会造成额外的编解码资源浪费。
发明内容
本发明实施例的目的在于提供一种音频信号的编解码方法和装置,能够在克服由pre-echo效应引发的量化噪音泄漏的同时还节约了编解码资源。
本发明实施例提供了一种音频信号的编码方法,包括:
获得当前帧音频信号的稳定度参数,并根据所述当前帧音频信号的稳定度参数,从所述当前帧音频信号中提取相应个数的时域包络信息;
对所提取的时域包络信息量化编码,得到时域包络的编码码字;
获得所述时域包络信息的量化值,利用所述量化值对所述当前帧音频信号进行归一化处理;
将归一化处理后的当前帧音频信号和前一帧音频信号变换编码。
基于上述技术方案,本发明还公开了一种音频信号的解码方法,包括:
从接收到的当前帧音频信号的编码码流中读取当前帧音频信号的稳定度参数;
根据所述稳定度参数,按照和编码端相同的对应方式选择与所述稳定度参数对应的时域包络编码个数,从所述当前帧音频信号编码码流中提取所述个数的时域包络编码码字;
对所述时域包络编码码字进行解码得到所述音频信号的时域包络信息的量化值;
对所述当前帧音频信号编码码流中的变换编码信号进行变换解码,利用所述量化值对变换解码后得到的当前帧音频信号进行反归一化处理,以得到重构的音频信号。
基于上述技术方案,本发明还公开了一种音频信号的编码装置,包括:
稳定度获得单元,用于获得当前帧音频信号的稳定度参数;
时域包络提取单元,用于根据所述稳定度获得单元所获得的当前帧音频信号的稳定度参数,从所述当前帧音频信号中提取相应个数的时域包络信息;
量化编码单元,用于对所述时域包络提取单元中提取的时域包络信息量化编码,得到时域包络的编码码字;
归一化处理单元,用于根据所述量化编码单元中的处理结果获得所述时域包络信息的量化值,利用所述量化值对所述当前帧音频信号进行归一化处理;
变换编码单元,用于将所述归一化处理单元中归一化处理后的当前帧音频信号和前一帧音频信号变换编码。
基于上述技术方案,本发明还公开了一种音频信号的解码装置,包括:
稳定度参数单元,用于从接收到的当前帧音频信号的编码码流中读取当前帧音频信号的稳定度参数;
时域包络编码码字提取单元,用于根据所述稳定度参数单元中的稳定度参数,按照和编码端相同的对应方式选择与所述稳定度参数对应的时域包络编码个数,从所述编码码流中提取所述个数的时域包络编码码字;
时域包络解码单元,用于对所述时域包络编码码字提取单元中的时域包络编码码字进行解码得到所述音频信号的时域包络信息的量化值;
变换解码单元,用于对所述编码码流中的变换编码信号进行变换解码,得到当前帧音频信号;
反归一化处理单元,用于利用所述时域包络解码单元中的量化值对所述变换解码单元中得到的当前帧音频信号进行反归一化处理,以得到重构的音频信号。
与现有技术相比,本发明实施例具有以下优点:
本发明实施例在编码端能够根据音频信号的稳定度来提取与该稳定度对应个数的时域包络信息,这样对于稳定度高的音频信号能够提取较少个数的时域包络信息来传输,对于稳定度差的音频信号能够提取较多个数的时域包络信息进行传输,因此,对于提取个数较少的时域包络信息,可使用较少比特对该时域包络信息进行量化编码或解码,因此,本发明实施例能够在消除瞬态信号带来的噪声泄漏问题的同时可大大节约编解码的资源。
附图说明
图1(a)、(b)分别为MDCT编码前、后的信号示意图;
图2为本发明一种音频信号编码方法实施例的流程示意框图;
图3为本发明另一种音频信号编码方法实施例的流程示意框图;
图4为本发明一种音频信号解码方法实施例的流程示意框图;
图5为本发明另一种音频信号解码方法实施例的流程示意框图;
图6为本发明一种音频信号编码装置结构示意框图;
图7为本发明另一种音频信号编码装置结构示意框图;
图8为本发明又一种音频信号编码装置结构示意框图;
图9为本发明又一种音频信号编码装置结构示意框图;
图10为本发明又一种音频信号编码装置结构示意框图;
图11为本发明一种音频信号解码装置结构示意框图。
具体实施方式
下面结合附图对本发明实施例的具体实施方式做进一步的详细阐述。
本发明实施例公开的一种音频信号的编码方法是:根据音频信号的稳定程度,从所述音频信号中提取与该稳定程度对应个数的时域包络信息,例如,对于音频信号稳定程度较高的信号,可采用较低的时间分辨率来提取较少个数的时域包络信息;对于不稳定的音频信号(如瞬态信号),则采用较高的时间分辨率来提取较多个数的时域包络信息,以此消除瞬态信号带来的不利影响。然后,对所提取的这些时域包络信息量化编码,得到时域包络的编码码字。并且利用所述时域包络信息的量化值对所述音频信号进行归一化处理和变换编码。
如图2所示,为本发明一种音频信号编码方法实施例的流程示意框图,该方法包括:
S201:分析当前帧音频信号的稳定程度,得到稳定度参数。例如,对当前帧音频信号按照预先约定的时间分辨率,提取相应个数的时域包络信息;计算所提取的时域包络信息的标准差σ和均值μ;将所述标准差σ除以所述均值μ得到信号幅度变化程度参数D,该值即稳定度参数。
S202:根据所得的稳定度参数,从所述当前帧音频信号中提取与所述稳定度参数对应个数的时域包络信息。
S203:对所提取的时域包络信息进行量化得到时域包络信息的量化值,然后再对所述量化值编码得到所述时域包络信息的编码码字。
S204:获得所述时域包络信息的量化值,利用所述时域包络信息的量化值对所述当前帧音频信号进行归一化处理。其中,所述归一化处理可例如:将所述时域包络信息的量化值进行内插得到归一化因子,以构成平滑的时域包络曲线,然后再利用所述归一化因子对所述当前帧音频信号进行归一化处理。
S205:将前一帧音频信号和归一化处理后的当前帧音频信号变换编码。
此外,在执行完上述实施例之后还可以:将S201中得到的稳定度参数、S203中得到的所述时域包络信息的编码码字、以及所述S205中变换编码后得到的结果一起打包发送。
此外,上述S204中所述的量化值可以为所述S203中对所述时域包络信息量化所得到的量化值,当然,这需要在S203之后还要将所述S203中得到的量化值保存以供S204获得使用;此外,如果所述S203中的量化值没有保存,那么所述S204中获得量化值的方法可以为通过对所述S203中的编码码字进行解码,得到的反量化值即可作为所述S204中的量化值。其中,解码方法为所述S203中编码方法的逆过程。
下面举例说明本发明一种音频信号的编码方法实施例,该实施例所述的音频信号可以是采样率为32KHz的超宽带信号,也可以是采样率为16kHz的宽带信号,或者其他信号。本实施例采用50%的重叠MDCT变换编码,即在一个MDCT分析窗内的M点音频信号中,前M/2点信号为前一帧音频信号,后M/2点信号为当前帧音频信号。如图3所示,为本发明另一种音频信号编码方法实施例的流程示意框图,该实施例包括:
S301:对分析窗内的M点音频信号(如M=640的超宽带信号,或者M=320的宽带信号)中的当前帧p(如对应于超宽带信号p=320,或者对应于宽带信号p=160)点信号{x0…xp-1}按照预先约定的时间分辨率(例如2ms)提取相应个数N(如N=10)的时域包络信息Ai(即{A1…AN})。
其中,所述时域包络信息Ai的提取方法可按照下述方法计算提取,但不限于此方法: A i = N p Σ j = ( i - 1 ) × p / N j = i × p / N x j 2 , i=1…N。
S302:计算所述时域包络信息Ai的标准差σ和均值μ。其中,所述均值μ的计算方法可以为但不限于此: μ = 1 p Σ i = 0 i = p x i 2 ; 所述标准差σ的计算方法可以为但不限于此: σ = Σ i = 1 i = N ( A i - μ ) 2 / N .
S303:根据所述S302中的标准差σ和均值μ,计算信号幅度变化程度参数D。其中,在该实施例中可以将所述信号幅度变化程度参数D作为稳定度参数,其中,所述信号幅度变化程度参数D的计算方法例如: D = σ μ , D>0。所述信号幅度变化程度参数D的值越小表示该音频信号的稳定性越好。
S304:比较所述信号幅度变化程度参数D与L个阈值(如{thr1…thrL})的大小,将所述音频信号的信号幅度变化程度参数D划分在相应第i区间内。其中,共有L+1个区间内,即L+1个等级。
例如,在本实施例中所述L数值可取经验值如3;所述阀值{thr1…thrL}可取经验值如{0.2 0.4 0.6}。此时,则将所述音频信号的信号幅度变化程度D划分成了4个等级(i=0,1,2,3),即第一等级为信号幅度变化程度参数D小于等于0.2的区间,第二等级为信号幅度变化程度参数D大于0.2且小于等于0.4的区间,依此类推。
S305:根据音频信号的信号幅度变化程度参数D所在的区间(或者说对应的信号幅度变化程度等级),选择与该区间对应的时域包络编码个数Ki。例如,所述Ki可取经验值{1 4 8 10}来分别对应(i=0,1,2,3)四个区间。
S306:对所述S301中的p点信号{x0…xp-1}按照S305中所选择的时域包络编码个数Ki,提取Ki个时域包络信息Ai’(即{A′1…A′N})。
其中,所述时域包络信息Ai’的提取方法可采用下述方法计算提取,但并不限于此: A i ′ = K i p Σ j = ( i - 1 ) × p / K i j = i × p / K i x j 2 , i=1…Ki
S307:量化所述S306中得到的时域包络信息Ai’,得到时域包络信息Ai’的量化值{A1 q…AKi q},然后再对所述量化值{A1 q…AKi q}进行编码得到所述时域包络信息Ai’的编码码字{index1…indexKi}。
其中,所述量化的具体方法可以为均匀量化但不限于此,例如:
将区间[Mmin Mmax]等分为m个子区间 M min M min + M max - M min m , M min + M max - M min m M min + 2 × M max - M min m , ……, M min + ( m - 1 ) × M max - M min m M max , 每一个区间对应的量化值为 y i = M min + i × M max - M min m + M max - M min 2 m , 判断Ai位于那个子区间,就将所述Ai量化为该子区间对应的量化值yi
S308:提取之前保存在编码状态寄存器中的前一帧音频信号的最后一个时域包络信息A0 q,并根据该时域包络信息A0 q和所述时域包络信息Ai’的量化值{A1 q…AKi q}进行内插平滑,得到对应于所述当前帧内每一点音频信号的归一化因子
Figure S2008100063912D00081
所述归一化因子即构成一个平滑的时域包络曲线。
其中,可以使用公式 A ^ j = A ^ i q + ( j - p × i K i ) × A ^ i + 1 q - A ^ i q p K i , j = i × p K i · · · ( i + 1 ) × p K i , i=0…Ki对所述量化值进行内插平滑,当然但并不限于此。
S309:利用所述归一化因子
Figure S2008100063912D00084
对所述分析窗内的当前帧音频信号进行归一化处理。其中,所述归一化处理的具体方法可例如: x ^ j = x j A ^ j .
S310:对所述分析窗内的M点信号(即前一帧音频信号和归一化处理后的当前帧音频信号)进行变化编码。其中,所述变换编码的方法可以例如:对分析窗内的M点信号进行M点修正的离散余弦变换(MDCT),得到M/2点频谱系数;然后再将M/2点频谱系数直接量化编码。或者,在得到M/2点频谱系数后,还可以将M/2点频谱系数划分为多个子带,提取每个子带的频域包络(所述提取方法和提取时域包络信息雷同),再对频域包络信息进行内插平滑,使用内插平滑后得到的归一化因子对所述频谱系数进行归一化处理,再对归一化后的频谱系数进行量化编码。
S311:将所述稳定度参数、S307中对时域包络信息量化编码得到的编码码子{index1…indexKi}、以及S310中得到的变换编码结果一起打包发送。
此外,上述实施例S308中的所述时域包络信息Ai’的量化值可以直接使用所述S307中生成的量化值,这就需要在S307中将生成的量化值保存以便在所述S308中能够直接获取保存的所述量化值。然而,如果S307中所述量化值在生成后并没有保存,那么在执行所述S308之前还需要先将所述S307中得到的时域包络信息Ai’的编码码字进行解码,以获得所述时域包络信息Ai’的量化值。
此外,所述信号幅度变化程度参数D的计算方法除了上述S302和S303所述的方法得到外,还可以由其他方法计算,例如:计算所述S301中的时域包络信息Ai的最大偏差(max_deviation),或者计算所述S301中的时域包络信息Ai与相邻的时域包络信息的最大幅度差(max_rise),所得值即为信号幅度变化程度参数D。所述信号幅度变化程度参数D的值越小表示该音频信号的稳定性越好。
相应地,在上述S304中,还可比较所述信号幅度变化程度参数D(max_deviation)与阈值thrd的大小,或者,比较所述信号幅度变化程度参数D(max_rise)与阈值thrr的大小,将所述音频信号的信号幅度变化程度参数D划分在相应第i区间内。其中,共有2个区间,即2个等级。
例如,如果所述信号幅度变化程度参数D(max_deviation)大于thrd,或者所述信号幅度变化程度参数D(max_rise)大于thrr,则稳定度在i=1号区间;否则稳定度在i=0号区间。
相应地,在所述S305中,所述Ki可取经验值{1     10}来分别对应(i=0,1)两个区间。
相应地,在所述S307中,如果S306中只得到1个时域包络信息Ai’,则直接对所述时域包络信息Ai’进行量化编码(例如,可对所述时域包络信息Ai’均匀量化,然后再对均匀量化后的结果进行编码);如果S306中得到10个时域包络信息,即{A′1…A′10},则先计算所述时域包络信息{A′1…A′10}的均值μ,然后再将所述{A′1…A′10}都减去该均值μ得到差值{ΔA′1…ΔA′10},再对所述差值{ΔA′1…ΔA′10}以及所述均值μ都进行量化得到量化差值{ΔA1 q…ΔA10 q}和量化均值μq,然后再分别对所述量化差值{ΔA1 q…ΔA10 q}和量化均值μq编码得到所述时域包络信息{A′1…A′10}的编码码字{index1…indexKi,indexμ}。需要说明的是,这种根据均值μ对所述时域包络信息Ai’进行量化编码的方法同样适用于上述S307中的时域包络信息Ai’。
此外,还可将量化差值{ΔA1 q…ΔA10 q}和量化均值μq相加,得到时域包络信息的量化值{A1 q…AKi q},即 A i q = ΔA i q + μ q , 并保存{A1 q…AKi q},以便在S308中对得到的量化值{A1 q…AKi q}进行内插平滑,以得到对应于所述当前帧内每一点音频信号的归一化因子
Figure S2008100063912D00102
当然,上述实施例中所述的时域包络信息的量化值除了使用上述方法得到外同样可以采用S307中的方法直接对所述时域包络信息{A′1…A′10}进行量化,或者采用上面所述的其他方法,在此不再赘述。其中,对所述差值{ΔA′1…ΔA′10}以及所述均值μ进行量化的方法可以与所述S307中对所述时域包络信息Ai’量化的方法相同,例如均匀量化。
此外,上述实施例S303和S311中所述的稳定度参数除了可以为所述信号幅度变化程度参数D外,还可以是所述信号幅度变化程度参数D所在的区间标识i。当所述稳定度参数为所述信号幅度变化程度参数D所在的区间标识i时,则上述S303中,计算稳定度参数的步骤则可包括上述S302,所述S303中通过所述S302中的标准差σ和均值μ,计算信号幅度变化程度参数D,以及S304中得到所述信号幅度变化程度参数D所在的区间标识i。其中,在S304中得到的所述区间标识i即为所述稳定度参数。同时,在所述S311中,发送的稳定度参数即为信号幅度变化程度参数D所在的区间标识i。
与此同时,在上述公开的音频信号的编码方法实施例的基础上,本发明还公开了一种音频信号的解码方法,如图4所示,为本发明一种音频信号解码方法实施例的流程示意框图,所述解码方法与上述编码方法对应,具体包括:
S401:从接收到的当前帧音频信号编码码流中读取当前帧音频信号的稳定度参数。其中,所述稳定度参数可以是信号幅度变化程度参数D,或者还可以是信号幅度变化程度参数所在区间标识i。
S402:根据所述稳定度参数,按照和编码端相同的对应方式选择与所述稳定度参数对应的时域包络编码个数,从所述当前帧音频信号编码码流中提取所述个数的时域包络编码码字。
S403:对所述时域包络编码码字进行解码得到所述音频信号的时域包络信息的量化值。
S404:对所述当前帧音频信号编码码流中的变换编码信号进行变换解码,利用所述时域包络信息的量化值对变换解码后得到的当前帧音频信号进行反归一化处理,即得到重构的音频信号。
其中,所述利用所述量化值对变换解码后得到的当前帧音频信号进行反归一化处理可具体为,先对所述时域包络信息的量化值进行内插平滑得到归一化因子,然后再利用所述归一化因子对变换解码后得到的当前帧音频信号进行反归一化处理。其中,所述内插平滑采用和编码端相同的方法。
下面举例说明本发明一种音频信号解码方法实施例,该实施例可以以采样率为32KHz的超宽带信号为例,也可以是采样率为16kHz的宽带信号。采用与上述编码方法对应的解码方式,该实施例仍采用M点音频信号的MDCT分析窗,其前一半信号为前一帧音频信号,后一半信号为当前帧音频信号。如图5所示,为本发明一种音频信号解码方法实施例的流程示意框图,该实施例包括:
S501:从接收到的当前帧音频信号编码码流中读取当前帧音频信号的稳定度参数(如信号幅度变化程度参数D所在区间的标识i)。由于在编码端,和其他编码信息一起发送的有该帧音频信号的信号幅度变化程度参数D所在区间的标识i,因此,可在解码端,从接收到的当前帧音频信号编码码流中直接读取该帧音频信号对应的信号幅度变化程度参数D所在区间的标识i。
S502:根据所述音频信号的信号幅度变化程度参数D所在的区间标识i(或者说所处的等级),按照和编码端相同的对应方式选择与该区间标识i对应的时域包络编码个数Ki。其中,所述Ki可取和编码端相同的经验值,如{1 4 8 10}来分别对应如(i=0,1,2,3)四个等级;或者,如{1      10}来分别对应如(i=0,1)两个等级。
S503:从所述当前帧音频信号编码码流中读取Ki个时域包络编码码字{index1…indexKi}。例如,对于只有(i=0,1)两个等级的实施例,当i=0时从码流中读取indexμ,i=1时从码流中读取{index1…indexKi,indexμ}
S504:对所述时域包括编码码字进行解码得到所述音频信号的时域包络信息的量化值{A1 q…AKi q}。例如,对于只有(i=0,1)两个等级的实施例,当i=1时,解码可得到量化差值{ΔA1 q…ΔA10 q}和量化均值μq,则得到的时域包络信息的量化值为 A i q = ΔA i q + μ q
S505:对所述时域包络信息的量化值{A1 q…AKi q}进行和编码端相同的内插平滑,得到对应于所述当前帧内每一点音频信号的归一化因子所述归一化因子即构成一个平滑的时域包络曲线。
其中,可以使用公式 A ^ j = A ^ i q + ( j - p × i K i ) × A ^ i + 1 q - A ^ i q p K i , j = i × p K i · · · ( i + 1 ) × p K i , i=0…Ki对所述量化值进行内插平滑,当然但并不限于此。
S506:对所述当前帧音频信号编码码流中变换编码信号进行变换解码,利用S505中的归一化因子对变换解码后得到的当前帧音频信号进行反归一化处理,即得到重构的音频信号。
上述实施例在编码端能够根据音频信号的稳定度来提取与该稳定度对应个数的时域包络信息,这样对于稳定度高的音频信号能够提取较少个数的时域包络信息来传输,对于稳定度差的音频信号能够提取较多个数的时域包络信息进行传输,因此,对于提取个数较少的时域包络信息,可使用较少比特对该时域包络信息进行量化编码或解码,因此,本发明实施例能够在消除瞬态信号带来的噪声泄漏问题的同时可大大节约编解码的资源。同时,传输较少的时间包络信息还能够将音频信号的动态范围缩小,有利于变换编、解码。
同时,上述实施例能够为每一帧音频信号都传输时域包络的编码码字,因此保证了音频信号在解码端的分析和合成的连贯性,从而确保解码端能够合成高质量的重构信号。
此外,上述编码方法实施例仅在提取时域包络信息时进行了标准差和均值的计算,因此还降低了判断信号稳定程度的复杂度。
基于上述技术方案,本发明还公开了一种音频信号的编码装置,该编码装置位于编码端,能够根据音频信号的稳定程度,从所述音频信号中提取与该稳定程度对应个数的时域包络信息,再对提取的这些时域包络信息量化编码,得到时域包络的编码码字。然后利用所述时域包络信息的量化值对所述音频信号进行归一化处理和变换编码。
如图6所示,为本发明一种音频信号编码装置结构示意框图,所述编码装置可适用于采样率为32KHz的超宽带音频信号,或者采样率为16kHz的宽带音频信号,或者其他信号。所述装置包括:稳定度获得单元601、时域包络提取单元602、量化编码单元603、归一化处理单元604、变换编码单元605,其中,
所述稳定度获得单元601,用于获得当前帧音频信号的稳定度参数;例如,可以按照预先约定的时间分辨率提取相应个数的时域包络信息,再计算所述时域包络信息的标准差和均值,然后将所述标准差除以所述均值得到信号幅度变化程度参数,即为所述稳定度参数。其具体的实现方法可参考图3所示的方法实施例中S301至S303。当然,所述信号幅度变化程度参数还可以通过其他方式得到,所述稳定度参数还可以为信号幅度变化程度参数所在区间的标识,其具体的获取方法可参见上述对图3所示方法的扩充实施例,在此不再赘述。
所述时域包络提取单元602,用于根据所述稳定度获得单元601所获得的当前帧音频信号的稳定度参数,从所述当前帧音频信号中提取与所述稳定度参数对应个数的时域包络信息。其中,所述时域包络信息可采用 A i ′ = K i p Σ j = ( i - 1 ) × p / K i j = i × p / K i x j 2 , i=1…Ki公式进行提取,Ai’表示提取得到的时域包络信息。
其中,由于稳定度参数可以为信号幅度变化程度参数D,或者还可以为信号幅度变化程度参数D所在区间标识i。当所述稳定度参数为信号幅度变化程度参数D时,所述时域包络提取单元602根据所述稳定度获得单元601所获得的当前帧音频信号的稳定度参数,从所述当前帧音频信号中提取与所述稳定度参数对应个数的时域包络信息可通过下述几个子单元实现,当然并不限于此:
第一划分子单元(未图示),用于比较所述信号幅度变化程度参数D与指定个数的阈值的大小,将所述信号幅度变化程度参数D划分在相应的第i区间内;例如,与3个阈值比较时,则划分在共4个区间的第i区间内。
第一编码个数确定子单元(未图示),用于根据所述第一划分子单元(未图示)所划分的信号幅度变化程度参数D所在的区间,选择与该区间对应的时域包络编码个数Ki;例如,所述Ki可取经验值{1 4 8 10}来分别对应(i=0,1,2,3)四个区间。
第一提取子单元(未图示),用于按照所述第一编码个数确定子单元(未图示)所确定的时域包络编码个数Ki,从所述当前帧音频信号中提取所述Ki个时域包络信息。
当然,如果所述稳定度参数为信号幅度变化程度参数D所在区间标识i时,则所述时域包络提取单元602可直接选择与该区间标识i对应的时域包络编码个数Ki,然后从所述当前帧音频信号中提取所述Ki个时域包络信息。
所述量化编码单元603,用于对所述时域包络提取单元602中提取的时域包络信息量化得到时域包络信息的量化值,然后再对所述量化值进行编码得到时域包络的编码码字;其中,可采用均匀量化对所述时域包络信息进行量化,其具体实现方法可参考图3所示实施例中的S307。或者,当所述时域包络提取单元602中提取的时域包络信息为一个时,还可直接所述时域包络信息的均值进行量化编码,得到时域包络的编码码字;当所述时域包络提取单元602中提取的时域包络信息不止一个时,则可将所有提取的时域包络信息都减去均值,得到差值,然后再对所述差值量化编码。
所述归一化处理单元604,用于根据所述量化编码单元603中的处理结果获得所述时域包络信息的量化值,利用所述量化值对所述当前帧音频信号进行归一化处理。例如,可通过对所述时域包络信息的量化值进行内插平滑,得到对应于所述当前帧内每一点音频信号的归一化因子,然后再利用所述归一化因子对所述当前帧音频信号进行归一化处理。
其中,如果所述量化编码单元603将生成的量化值保存,则所述归一化处理单元604可从保存的信息中直接获取所述时域包络信息的量化值;如果所述量化编码单元603没有保存所生成的量化值,那么所述归一化处理单元604则可将所述量化编码单元603中得到的时域包络编码码字进行解码来得到所述时域包络信息的量化值。
所述变换编码单元605,用于将所述归一化处理单元604经归一化处理后得到的当前帧音频信号和前一帧音频信号变换编码。
此外,在上述装置实施例的基础上,所述装置还可包括发送单元(未图示),所述发送单元(未图示)用于将所述变换编码单元605中变换编码后得到的信号,随同所述稳定度获得单元601中的稳定度参数、以及所述量化编码单元603中的时域包络的编码码字一起打包发送。
在上述图6所示装置实施例的基础上,由于所述归一化处理单元604对时域包络信息的量化值的获取可根据所述量化编码单元603对生成的量化值的不同处理来采取不同的获取方法,因此,所述归一化处理单元604可根据不同的情况具有不同的结构功能。
如图7所示,为本发明另一种音频信号编码装置实施例的结构示意框图,该实施例中,所述稳定度参数为信号幅度变化程度参数D,则所述稳定度获得单元601在上述图6所示装置实施例的基础上包括:第一时域包络提取子单元6011、第一计算子单元6012、和第一信号幅度变化程度参数子单元6013,其中,
所述第一时域包络提取子单元6011,用于对当前帧p点音频信号(如对应于超宽带信号p=320,或者对应于宽带信号p=160)按照预先约定的时间分辨率(例如2ms),提取相应个数N(如N=10)的时域包络信息;其中,所述提取方法可采用下述方法计算提取,但不限于此方法: A i = N p Σ j = ( i - 1 ) × p / N j = i × p / N x j 2 , i=1…N。
所述第一计算子单元6012,用于计算所述第一时域包络提取子单元6011中的时域包络信息的标准差σ和均值μ;其中,所述均值μ的计算方法可以为但不限于此: μ = 1 p Σ i = 0 i = p x i 2 ; 所述标准差σ的计算方法可以为但不限于此:
σ = Σ i = 1 i = N ( A i - μ ) 2 / N .
所述第一信号幅度变化程度参数子单元6013,用于将所述第一计算子单元6012中得到的标准差σ除以所述均值μ得到信号幅度变化程度参数D,即 D = σ μ , D>0。
此外,本发明又公开了一种音频信号编码装置实施例,如图8所示,为本发明又一种音频信号编码装置实施例的结构示意框图,该实施例中所述的稳定度参数依然为信号幅度变化程度参数D,所述稳定度获得单元601通过计算所述音频信号的时域包络信息的最大偏差、或者最大幅度差来得到所述信号幅度变化程度参数D。如图8所示,所述稳定度获得单元601在上述图6所示装置实施例的基础上包括:第二时域包络提取子单元6014、第二信号幅度变化程度参数子单元6015,其中,
所述第二时域包络提取子单元6014,用于对当前帧p点音频信号(如对应于超宽带信号p=320,或者对应于宽带信号p=160)按照预先约定的时间分辨率(例如2ms),提取相应个数N(如N=10)的时域包络信息;其中,所述提取方法可采用下述方法计算提取,但不限于此方法: A i = N p Σ j = ( i - 1 ) × p / N j = i × p / N x j 2 , i=1…N。
所述第二信号幅度变化程度参数子单元6015,用于计算所述第二时域包络提取子单元6014中的时域包络信息的最大偏差、或者计算所述时域包络信息与相邻的时域包络信息的最大幅度差,所得值即为信号幅度变化程度参数D。
此外,本发明又公开了一种音频信号编码装置实施例,如图9所示,为本发明又一种音频信号编码装置实施例的结构示意框图,该实施例中所述的稳定度参数为信号幅度变化程度参数所在的区间标识i,该实施例可通过将图7实施例中的所述稳定度获得单元601生成的信号幅度变化程度参数D与预置的阈值比较划分到相应的区间内,该区间标识i即为稳定度参数。如图9所示,所述稳定度获得单元601在上述图6所示装置实施例的基础上包括:第三时域包络提取子单元6016、第二计算子单元6017、第三信号幅度变化程度参数子单元6018、以及第一区间标识子单元6019,其中,
所述第三时域包络提取子单元6016,用于对当前帧p点音频信号(如对应于超宽带信号p=320,或者对应于宽带信号p=160)按照预先约定的时间分辨率(例如2ms),提取相应个数N(如N=10)的时域包络信息;其中,所述提取方法可采用下述方法计算提取,但不限于此方法: A i = N p Σ j = ( i - 1 ) × p / N j = i × p / N x j 2 , i=1…N。
所述第二计算子单元6017,用于计算所述第三时域包络提取子单元6016中时域包络信息的标准差σ和均值μ;其中,所述均值μ的计算方法可以为但不限于此: μ = 1 p Σ i = 0 i = p x i 2 ; 所述标准差σ的计算方法可以为但不限于此:
σ = Σ i = 1 i = N ( A i - μ ) 2 / N .
所述第三信号幅度变化程度参数子单元6018,用于将所述第二计算子单元6017中得到的标准差σ除以所述均值μ得到信号幅度变化程度参数D;
所述第一区间标识子单元6019,用于将所述第三信号幅度变化程度参数子单元6018中的信号幅度变化程度参数D与预置的阈值比较划分到对应的区间内,该区间对应的标识i即为所述稳定度参数。
此外,本发明又公开了一种音频信号编码装置实施例,如图10所示,为本发明又一种音频信号编码装置实施例的结构示意框图,该实施例中所述的稳定度参数为信号幅度变化程度参数所在的区间标识i,该实施例可通过将图8实施例中的所述稳定度获得单元601生成的信号幅度变化程度参数D与预置的阈值比较划分到相应的区间内,该区间标识i即为稳定度参数。如图10所示,所述稳定度获得单元601在上述图7所示装置实施例的基础上包括:第四时域包络提取子单元60110、第四信号幅度变化程度参数子单元60111、以及第二区间标识子单元60112,其中,
所述第四时域包络提取子单元60110,用于对当前帧p点音频信号(如对应于超宽带信号p=320,或者对应于宽带信号p=160)按照预先约定的时间分辨率(例如2ms),提取相应个数N(如N=10)的时域包络信息;其中,所述提取方法可采用下述方法计算提取,但不限于此方法: A i = N p Σ j = ( i - 1 ) × p / N j = i × p / N x j 2 , i=1…N。
所述第四信号幅度变化程度参数子单元60111,用于计算所述第四时域包络提取子单元60110中的时域包络信息的最大偏差、或者计算所述时域包络信息与相邻的时域包络信息的最大幅度差,得到信号幅度变化程度参数D。
所述第二区间标识子单元60112,用于将所述第四信号幅度变化程度参数子单元60111中的信号幅度变化程度参数D与预置的阈值比较划分到对应的区间内,该区间对应的标识i即为所述稳定度参数。
基于上述技术方案,本发明还公开了一种音频信号的解码装置,该解码装置位于解码端,如图11所示,为本发明一种音频信号解码装置结构示意框图,所述解码装置的解码方法与上述编码装置的编码方法对应,同样可适用于采样率为32KHz的超宽带音频信号,或者采样率为16kHz的宽带音频信号,或者其他信号。如图11所示,所述解码装置包括:稳定度参数单元1101、时域包络编码码字提取单元1102、时域包络解码单元1103、变换解码单元1104、反归一化处理单元1105,其中,
所述稳定度参数单元1101,用于从接收到的当前帧音频信号的编码码流中读取当前帧音频信号的稳定度参数。由于接收到的当前帧音频信号编码码流中包括该帧音频信号对应的稳定度参数,因此可直接获取。
所述时域包络编码码字提取单元1102,用于根据所述稳定度参数单元1101中的稳定度参数,按照和编码端相同的对应方式选择与所述稳定度参数对应的时域包络编码个数,从所述编码码流中提取所述个数的时域包络编码码字。
其中,由于所述稳定度参数可以为信号幅度变化程度参数D,或者还可以为信号幅度变化程度参数D所在区间标识i。当所述稳定度参数为信号幅度变化程度参数D时,所述时域包络编码码字提取单元1102根据所述稳定度参数单元1101所获得的当前帧音频信号的稳定度参数,从所述当前帧音频信号中提取与所述稳定度参数对应个数的时域包络编码码字可通过下述几个子单元实现,当然并不限于此:
第二划分子单元(未图示),用于比较所述信号幅度变化程度参数D与指定个数的阈值的大小,将所述信号幅度变化程度参数D划分在相应的第i区间内;例如,与3个阈值比较时,则划分在共4个区间的第i区间内。
第二编码个数确定子单元(未图示),用于根据所述第二划分子单元(未图示)所划分的信号幅度变化程度参数D所在的区间,按照和编码端相同的对应方式选择与该区间对应的时域包络编码个数Ki;例如,所述Ki可取经验值{1 4 8 10}来分别对应(i=0,1,2,3)四个区间。
第二提取子单元(未图示),用于按照所述第二个编码个数确定子单元(未图示)所确定的时域包络编码个数Ki,从所述当前帧音频信号中提取所述个数(即Ki)个时域包络编码码字。
所述时域包络解码单元1103,用于对所述时域包络编码码字提取单元1102中的时域包络编码码字进行解码得到所述音频信号的时域包络信息的量化值。其中,所述解码方法为在编码端采用的量化编码方法的逆过程。
所述变换解码单元1104,用于对所述编码码流中的当前帧音频信号的变换编码信号进行变换解码,得到当前帧音频信号;
所述反归一化处理单元1105,用于利用所述时域包络解码单元1103中的量化值对所述变换解码单元1104中得到的当前帧音频信号进行反归一化处理,以得到重构的音频信号。
其中,在上述图11所示的解码装置实施例的基础上,所述反归一化处理单元1105可具体包括:内插平滑单元(未图示),用于对所述时域包络解码单元1103中的所述时域包络信息的量化值进行内插平滑得到归一化因子。以及反归一化子单元(未图示),用于利用所述内插平滑单元(未图示)中的归一化因子对所述变换解码单元1104中得到的当前帧音频信号进行反归一化处理,以得到重构的音频信号。
上述实施例中由于所述时域包络提取单元602能够根据所述稳定度获得单元601所获得的当前帧音频信号的稳定度参数,来提取与该稳定度参数对应个数的时域包络信息,这样对于稳定度高的音频信号能够提取较少个数的时域包络信息来传输,对于稳定度差的音频信号能够提取较多个数的时域包络信息进行传输,因此,对于提取个数较少的时域包络信息,可使用较少比特对该时域包络信息进行量化编码或解码,因此,本发明实施例能够在消除瞬态信号带来的噪声泄漏问题的同时可大大节约编解码的资源。
同时,上述实施例中可通过发送单元(未图示)为每一帧音频信号都传输时域包络的编码码字,因此保证了解码装置对音频信号的分析和合成的连贯性,从而确保解码装置能够合成高质量的重构信号。
同时,传输较少的时间包络信息还能够将音频信号的动态范围缩小,有利于变换编码和变换解码。此外,上述编码装置实施例仅在提取时域包络信息时进行了标准差和均值的计算,因此还降低了判断信号稳定程度的复杂度。
需要说明的是,上述所有实施例中所述的音频信号可以为语音、或音乐等声音信号,这些音频信号都适用于上述方法例。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (24)

1.一种音频信号的编码方法,其特征在于,包括:
获得当前帧音频信号的稳定度参数,并根据所述当前帧音频信号的稳定度参数,从所述当前帧音频信号中提取相应个数的时域包络信息,所述稳定度参数为信号幅度变化程度参数或信号幅度变化程度参数所在的区间标识;
对所提取的时域包络信息量化编码,得到时域包络的编码码字;
获得所述时域包络信息的量化值,利用所述量化值对所述当前帧音频信号进行归一化处理;
将前一帧音频信号和归一化处理后的当前帧音频信号变换编码。
2.如权利要求1所述的编码方法,其特征在于,还包括:保存所述时域包络信息量化后得到的量化值;
所述获得所述时域包络信息的量化值具体为:
获取保存的所述时域包络信息的量化值。
3.如权利要求1所述的编码方法,其特征在于,所述获得所述时域包络信息的量化值具体为:
对所述时域包络的编码码字解码以获得所述时域包络信息的量化值。
4.如权利要求1所述的编码方法,其特征在于,所述对所提取的时域包络信息量化编码具体为:
计算所述时域包络信息的均值;
将所述时域包络信息都减去所述均值得到差值,对所述差值以及所述均值都量化编码。
5.如权利要求4所述的编码方法,其特征在于,所述获得所述时域包络信息的量化值具体为:
将所述差值量化后得到的量化差值,以及所述均值量化后得到的量化均值相加,以得到所述时域包络信息的量化值。
6.如权利要求1所述的编码方法,其特征在于,所述方法还包括:
将所述稳定度参数、时域包络的编码码字、以及变换编码结果打包发送。
7.如权利要求1至6中任一项所述的编码方法,其特征在于,所述利用所述量化值对所述当前帧音频信号进行归一化处理具体为:
对所述量化值进行内插平滑处理得到归一化因子;
利用所述归一化因子对所述当前帧音频信号进行归一化处理。
8.如权利要求1至6中任一项所述的编码方法,其特征在于,所述稳定度参数为信号幅度变化程度参数,所述获得当前帧音频信号的稳定度参数具体为:
对当前帧音频信号按照预定的时间分辨率,提取相应个数的时域包络信息;
计算所述时域包络信息的标准差σ和均值μ;
将所述标准差σ除以所述均值μ得到信号幅度变化程度参数。
9.如权利要求1至6中任一项所述的编码方法,其特征在于,所述稳定度参数为信号幅度变化程度参数,所述获得当前帧音频信号的稳定度参数具体为:
对当前帧音频信号按照预定的时间分辨率,提取相应个数的时域包络信息;
计算所述时域包络信息的最大偏差、或者计算所述时域包络信息与相邻的时域包络信息的最大幅度差,所得值即为信号幅度变化程度参数。
10.如权利要求1至6中任一项所述的编码方法,其特征在于,所述稳定度参数为信号幅度变化程度参数所在的区间标识,所述获得当前帧音频信号的稳定度参数具体为:
对当前帧音频信号按照预定的时间分辨率,提取相应个数的时域包络信息;
计算所述时域包络信息的标准差σ和均值μ;
将所述标准差σ除以所述均值μ得到信号幅度变化程度参数;
将所述信号幅度变化程度参数与预置的阈值比较,将所述信号幅度变化程度参数划分到对应的区间内,该区间对应的标识即为所述稳定度参数。
11.如权利要求1至6中任一项所述的编码方法,其特征在于,所述稳定度参数为信号幅度变化程度参数所在的区间标识,所述获得当前帧音频信号的稳定度参数具体为:
对当前帧音频信号按照预定的时间分辨率,提取相应个数的时域包络信息;
计算所述时域包络信息的最大偏差、或者计算所述时域包络信息与相邻的时域包络信息的最大幅度差,所得值即为信号幅度变化程度参数;
将所述信号幅度变化程度参数与预置的阈值比较,将所述信号幅度变化程度参数划分到对应的区间内,该区间对应的标识即为所述稳定度参数。
12.如权利要求1至6中任一项所述的编码方法,其特征在于,所述稳定度参数为信号幅度变化程度参数,所述根据所述当前帧音频信号的稳定度参数,从所述当前帧音频信号中提取相应个数的时域包络信息具体为:
比较所述信号幅度变化程度参数与指定个数的阈值的大小,将所述信号幅度变化程度参数划分在相应的区间内;
根据信号幅度变化程度参数所在的区间,选择与该区间对应的时域包络编码个数;
从所述当前帧音频信号中提取所述时域包络编码个数个时域包络信息。
13.一种音频信号的解码方法,其特征在于,包括:
从接收到的当前帧音频信号的编码码流中读取当前帧音频信号的稳定度参数,所述稳定度参数为信号幅度变化程度参数或信号幅度变化程度参数所在的区间标识;
根据所述稳定度参数,按照和编码端相同的对应方式选择与所述稳定度参数对应的时域包络编码个数,从所述当前帧音频信号编码码流中提取所述个数的时域包络编码码字;
对所述时域包络编码码字进行解码得到所述音频信号的时域包络信息的量化值;
对所述当前帧音频信号编码码流中的变换编码信号进行变换解码,利用所述量化值对变换解码后得到的当前帧音频信号进行反归一化处理,以得到重构的音频信号。
14.如权利要求13所述的解码方法,其特征在于,所述利用所述量化值对变换解码后得到的当前帧音频信号进行反归一化处理具体为:
对所述量化值进行内插平滑得到归一化因子;
利用所述归一化因子对变换解码后得到的当前帧音频信号进行反归一化处理。
15.如权利要求13所述的解码方法,其特征在于,所述稳定度参数为信号幅度变化程度参数,所述根据所述稳定度参数,按照和编码端相同的对应方式选择与所述稳定度参数对应的时域包络编码个数具体为:
比较所述信号幅度变化程度参数与指定个数的阈值的大小,将所述信号幅度变化程度参数划分在相应的区间内;
根据信号幅度变化程度参数所在的区间,按照和编码端相同的对应方式选择与该区间对应的时域包络编码个数。
16.一种音频信号的编码装置,其特征在于,包括:
稳定度获得单元,用于获得当前帧音频信号的稳定度参数,所述稳定度参数为信号幅度变化程度参数或信号幅度变化程度参数所在的区间标识;
时域包络提取单元,用于根据所述稳定度获得单元所获得的当前帧音频信号的稳定度参数,从所述当前帧音频信号中提取相应个数的时域包络信息;
量化编码单元,用于对所述时域包络提取单元中提取的时域包络信息量化编码,得到时域包络的编码码字;
归一化处理单元,用于根据所述量化编码单元中的处理结果获得所述时域包络信息的量化值,利用所述量化值对所述当前帧音频信号进行归一化处理;
变换编码单元,用于将前一帧音频信号和所述归一化处理单元中归一化处理后的当前帧音频信号变换编码。
17.如权利要求16所述的编码装置,其特征在于,所述装置还包括:
发送单元,用于将所述稳定度获得单元中的稳定度参数、所述量化编码单元中的时域包络的编码码字、以及所述变换编码单元中的变换编码结果打包发送。
18.如权利要求16或17所述的编码装置,其特征在于,所述稳定度参数为信号幅度变化程度参数,所述稳定度获得单元包括:
第一时域包络提取子单元,用于对当前帧音频信号按照预定的时间分辨率,提取相应个数的时域包络信息;
第一计算子单元,用于计算所述第一时域包络提取子单元中时域包络信息的标准差σ和均值μ;
第一信号幅度变化程度参数子单元,用于将所述第一计算子单元中得到的标准差σ除以所述均值μ得到信号幅度变化程度参数。
19.如权利要求16或17所述的编码装置,其特征在于,所述稳定度参数为信号幅度变化程度参数,所述稳定度获得单元包括:
第二时域包络提取子单元,用于对当前帧音频信号按照预定的时间分辨率,提取相应个数的时域包络信息;
第二信号幅度变化程度参数子单元,用于计算所述第二时域包络提取子单元中的时域包络信息的最大偏差、或者计算所述时域包络信息与相邻的时域包络信息的最大幅度差,所得值即为信号幅度变化程度参数。
20.如权利要求16或17所述的编码装置,其特征在于,所述稳定度参数为信号幅度变化程度参数所在的区间标识,所述稳定度获得单元包括:
第三时域包络提取子单元,用于对当前帧音频信号按照预定的时间分辨率,提取相应个数的时域包络信息;
第二计算子单元,用于计算所述第三时域包络提取子单元中时域包络信息的标准差σ和均值μ;
第三信号幅度变化程度参数子单元,用于将所述第二计算子单元中得到的标准差σ除以所述均值μ得到信号幅度变化程度参数;
第一区间标识子单元,用于将所述第三信号幅度变化程度参数子单元中的信号幅度变化程度参数与预置的阈值比较,将所述信号幅度变化程度参数划分到对应的区间内,该区间对应的标识即为所述稳定度参数。
21.如权利要求16或17所述的编码装置,其特征在于,所述稳定度参数为信号幅度变化程度参数所在的区间标识,所述稳定度获得单元包括:
第四时域包络提取子单元,用于对当前帧音频信号按照预定的时间分辨率,提取相应个数的时域包络信息;
第四信号幅度变化程度参数子单元,用于计算所述第四时域包络提取子单元中的时域包络信息的最大偏差、或者计算所述时域包络信息与相邻的时域包络信息的最大幅度差,得到信号幅度变化程度参数;
第二区间标识子单元,用于将所述第四信号幅度变化程度参数子单元中的信号幅度变化程度参数与预置的阈值比较,将所述信号幅度变化程度参数划分到对应的区间内,该区间对应的标识即为所述稳定度参数。
22.如权利要求16或17所述的编码装置,其特征在于,所述稳定度参数为信号幅度变化程度参数,所述时域包络提取单元包括:
第一划分子单元,用于比较所述信号幅度变化程度参数与指定个数的阈值的大小,将所述信号幅度变化程度参数划分在相应的区间内;
第一编码个数确定子单元,用于根据所述第一划分子单元所划分的信号幅度变化程度参数所在的区间,选择与该区间对应的时域包络编码个数;
第一提取子单元,用于按照所述第一编码个数确定子单元所确定的个数,从所述当前帧音频信号中提取所述个数个时域包络信息。
23.一种音频信号的解码装置,其特征在于,包括:
稳定度参数单元,用于从接收到的当前帧音频信号的编码码流中读取当前帧音频信号的稳定度参数,所述稳定度参数为信号幅度变化程度参数或信号幅度变化程度参数所在的区间标识;
时域包络编码码字提取单元,用于根据所述稳定度参数单元中的稳定度参数,按照和编码端相同的对应方式选择与所述稳定度参数对应的时域包络编码个数,从所述当前帧音频信号中提取所述个数的时域包络编码码字;
时域包络解码单元,用于对所述时域包络编码码字提取单元中的时域包络编码码字进行解码得到所述音频信号的时域包络信息的量化值;
变换解码单元,用于对所述编码码流中的变换编码信号进行变换解码,得到当前帧音频信号;
反归一化处理单元,用于利用所述时域包络解码单元中的量化值对所述变换解码单元中得到的当前帧音频信号进行反归一化处理,以得到重构的音频信号。
24.如权利要求23所述的解码装置,其特征在于,所述稳定度参数为信号幅度变化程度参数,所述时域包络编码码字提取单元包括:
第二划分子单元,用于比较所述信号幅度变化程度参数与指定个数的阈值的大小,将所述信号幅度变化程度参数划分在相应的区间内;
第二编码个数确定子单元,用于根据所述第二划分子单元所划分的信号幅度变化程度参数所在的区间,按照和编码端相同的对应方式选择与该区间对应的时域包络编码个数;
第二提取子单元,用于按照所述第二个编码个数确定子单元所确定的个数,从所述当前帧音频信号中提取所述个数个时域包络编码码字。
CN 200810006391 2008-02-29 2008-02-29 一种音频信号的编解码方法和装置 Expired - Fee Related CN101521010B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN 200810006391 CN101521010B (zh) 2008-02-29 2008-02-29 一种音频信号的编解码方法和装置
PCT/CN2009/070522 WO2009109120A1 (zh) 2008-02-29 2009-02-25 一种音频信号的编解码方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200810006391 CN101521010B (zh) 2008-02-29 2008-02-29 一种音频信号的编解码方法和装置

Publications (2)

Publication Number Publication Date
CN101521010A CN101521010A (zh) 2009-09-02
CN101521010B true CN101521010B (zh) 2011-10-05

Family

ID=41055547

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200810006391 Expired - Fee Related CN101521010B (zh) 2008-02-29 2008-02-29 一种音频信号的编解码方法和装置

Country Status (2)

Country Link
CN (1) CN101521010B (zh)
WO (1) WO2009109120A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102142924B (zh) * 2010-02-03 2014-04-09 中兴通讯股份有限公司 一种多用途语音频编码传输方法和装置
CN102280103A (zh) * 2011-08-02 2011-12-14 天津大学 基于方差的音频信号瞬态段检测方法
PL3008726T3 (pl) 2013-06-10 2018-01-31 Fraunhofer Ges Forschung Urządzenie i sposób kodowania obwiedni sygnału audio, przetwarzania i dekodowania przez modelowanie reprezentacji sumy skumulowanej z zastosowaniem kwantyzacji i kodowania rozkładu
RU2660633C2 (ru) 2013-06-10 2018-07-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для кодирования, обработки и декодирования огибающей аудиосигнала путем разделения огибающей аудиосигнала с использованием квантования и кодирования распределения
ES2837107T3 (es) * 2015-02-26 2021-06-29 Fraunhofer Ges Forschung Aparato y método para procesar una señal de audio para obtener una señal de audio procesada usando una envolvente en el dominio del tiempo objetivo
EP3545693B1 (en) 2016-11-23 2020-06-24 Telefonaktiebolaget LM Ericsson (PUBL) Method and apparatus for adaptive control of decorrelation filters
WO2020094263A1 (en) * 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
CN110263625A (zh) * 2019-05-08 2019-09-20 吉林大学 一种信号脉冲幅度分选的包络提取算法
CN113539281A (zh) * 2020-04-21 2021-10-22 华为技术有限公司 音频信号编码方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1197975A (zh) * 1997-03-28 1998-11-04 索尼公司 信号编码方法及设备
CN1285658A (zh) * 1999-08-23 2001-02-28 索尼株式会社 编码、解码装置及方法,记录、再现装置及方法,记录媒体
CN1465044A (zh) * 2001-06-15 2003-12-31 索尼公司 声信号编码方法和设备、解码方法和设备及记录介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1069299A (ja) * 1996-08-29 1998-03-10 Fujitsu Ltd 音声符号装置及び音声復号装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1197975A (zh) * 1997-03-28 1998-11-04 索尼公司 信号编码方法及设备
CN1285658A (zh) * 1999-08-23 2001-02-28 索尼株式会社 编码、解码装置及方法,记录、再现装置及方法,记录媒体
CN1465044A (zh) * 2001-06-15 2003-12-31 索尼公司 声信号编码方法和设备、解码方法和设备及记录介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JP特开平10-69299A 1998.03.10

Also Published As

Publication number Publication date
CN101521010A (zh) 2009-09-02
WO2009109120A1 (zh) 2009-09-11

Similar Documents

Publication Publication Date Title
CN101521010B (zh) 一种音频信号的编解码方法和装置
CN101223577B (zh) 对低比特率音频信号进行编码/解码的方法和设备
CN1272911C (zh) 音频信号解码装置及音频信号编码装置
CN101809657B (zh) 用于噪声填充的方法和设备
EP3910630B1 (en) Transient speech or audio signal encoding method and device, decoding method and device, processing system and computer-readable storage medium
CN101305423B (zh) 自适应的基于时间/频率的音频编码和解码设备和方法
CN101933086B (zh) 处理音频信号的方法和设备
CN101521014B (zh) 音频带宽扩展编解码装置
US7181404B2 (en) Method and apparatus for audio compression
CN101421780B (zh) 用于编码和解码时变信号的方法和设备
CN101662288B (zh) 音频编码、解码方法及装置、系统
CN101488344B (zh) 一种量化噪声泄漏控制方法及装置
CN104025190A (zh) 能量无损编码方法和设备、音频编码方法和设备、能量无损解码方法和设备、以及音频解码方法和设备
CN101406064B (zh) 量化和反量化输入信号的方法和设备以及对输入信号编码和解码的方法和设备
US20170316786A1 (en) Audio encoding apparatus and method, and audio decoding apparatus and method
CN102376306B (zh) 语音帧等级的获取方法及装置
CN101636785B (zh) 用于增强语音编解码器的质量的设备和方法
CN102194458A (zh) 频带复制方法、装置及音频解码方法、系统
CN102160114B (zh) 用于对数字音频信号中的前回声进行衰减的方法和装置
CN101562015A (zh) 音频处理方法及装置
KR100914220B1 (ko) 선 스펙트럴 주파수(lsf) 벡터들의 발생
US20120123788A1 (en) Coding method, decoding method, and device and program using the methods
CN101740030B (zh) 语音信号的发送及接收方法、及其装置
Samaali et al. Watermark-aided pre-echo reduction in low bit-rate audio coding
CN101609679B (zh) 嵌入式编解码方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111005

Termination date: 20190228