CN101231850A - 编解码方法及装置 - Google Patents

编解码方法及装置 Download PDF

Info

Publication number
CN101231850A
CN101231850A CNA2007100060040A CN200710006004A CN101231850A CN 101231850 A CN101231850 A CN 101231850A CN A2007100060040 A CNA2007100060040 A CN A2007100060040A CN 200710006004 A CN200710006004 A CN 200710006004A CN 101231850 A CN101231850 A CN 101231850A
Authority
CN
China
Prior art keywords
data
frame
coding
decoding
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007100060040A
Other languages
English (en)
Other versions
CN101231850B (zh
Inventor
郭炜
刘佩林
李伟
许丽净
张清
许剑峰
桑盛虎
杜正中
胡晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd, Shanghai Jiaotong University filed Critical Huawei Technologies Co Ltd
Priority to CN2007100060040A priority Critical patent/CN101231850B/zh
Priority to EP08706547A priority patent/EP2120233A4/en
Priority to JP2009546636A priority patent/JP2010517083A/ja
Priority to PCT/CN2008/070170 priority patent/WO2008089705A1/zh
Publication of CN101231850A publication Critical patent/CN101231850A/zh
Priority to US12/508,103 priority patent/US20090299757A1/en
Application granted granted Critical
Publication of CN101231850B publication Critical patent/CN101231850B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种编解码方法及装置,其主要包括:在确定前一帧采用的是第一编码模式进行编码,且当前帧需要采用第二编码模式进行编码后,则根据确定的当前帧与前一帧的编码数据交迭部分数据长度,获取对应的前一帧中的所述交迭部分数据长度的编码数据;之后,将从前一帧中获取的编码数据与当前帧的编码数据进行第二编码模式编码处理,获得编码结果。并在解码端,采用对应的方式进行相应的解码处理。因此,本发明中,无需通过滤波器运算便可以实现相应的变换域编解码处理,从而使得整个模式切换下的变换域编解码过程运算复杂度不高,易于软硬件的实现。

Description

编解码方法及装置
技术领域
本发明涉及编解码技术领域,尤其涉及一种编解码方法及装置。
背景技术
随着多媒体业务的逐渐广泛应用,由于多媒体业务的自身特性使得在针对多媒体业务的编码过程中需要更高的编码效率和实时性,同时,相应的音频的编码带宽也需要进一步扩展。
目前,业界采用的能够满足低码率,高质量音频编码的技术包括AMR-WB+(Adaptive Multi-Rate Wideband codec,适应多速率的宽带多媒体信号编解码器)技术。基于AMR-WB+的编码器主要包括以下两种编码模式:
(1)ACELP(Algebraic Code Excited Linear Prediction,代数码激励线性预测)模式,用于对语音进行编码;
(2)TCX(Transform Coded excitation,变换码激励)模式,用于对乐音进行编码。
该AMR-WB+技术是通过对低码率的语音编码进行扩展而形成,具体是将针对语音的ACELP编码和针对乐音的TCX编码结合在一起形成的一种混合编码方式。在对每帧进行编码过程中,具体是通过比较两种模式的SEGSNR(分段信噪比)值来决定当前选择的编码模式。其中,一种模式切换情况为;前一帧采用的是ACELP编码模式,当前帧需要采用TCX编码模式;在这种情况下,需要在编码过程中采用相应的策略以消除帧间的不连续性。由于前一帧状态所得的零输入响应和当前帧起始部分的信号有很大相似性,为了使模式转换时能保持良好的平滑感,AMR-WB+在ACELP编码帧到TCX编码帧的转换时使用了去除零输入响应的实现方案。
对于前一帧采用ACELP编码模式,当前帧采用TCX编码模式的模式切换情况,相应的TCX编码的实现过程如图1所示,在编码过程中,输入的音频信号首先通过感知加权滤波器后进行判断,之后,在感知加权后的信号中减去加窗处理后的ZIR(零输入响应),进而对获得的信号添加自适应窗、进行变换域编码等处理,以获得相应的TCX编码码流。
与图1对应,同样模式切换情况下,相应的TCX解码的实现过程如图2所示,输入的TCX编码的码流在通过变换域解码、加窗并重叠相加后,由于前一帧采用ACELP编码模式,故在此需要给变换域解码的数据加上加窗处理后的ZIR,进而再通过逆感知加权重建音频信号,完成相应的TCX解码操作。
在AMR-WB+涉及的上述TCX编解码过程中,所述加窗处理后的ZIR值(即zw(n))的计算方式如下:
采用前一帧滤波器的输出状态,求合成加权感知滤波器零输入响应:
Figure A20071000600400061
其中,是合成滤波器,
Figure A20071000600400063
是感知加权滤波器;设z(n)是零输入响应的值,zw(n)是对H(z)进行ZIR计算并进行加窗处理后的值,
zw(n)=z(n)*w(n),当n=0至2*N-1;
在此w(n)=1,当n=0至N-1;
w(n)=(2*N-n)/N,当n=N至2*N-1;
w(n)的形状如图3所示,N为64。
通过上述计算zw(n)值的处理过程可以看出,现有技术提供的在AMR-WB+中消除帧间不连续的编解码方案,由于其理论依据是建立在零输入响应和当前帧起始部分的信号相似性基础上,因此,当零输入响应和当前帧起始部分的信号不相似时,则相应的消除帧间不连续的效果无法得到保证。而且,还由于在消除帧间不连续的处理过程中,需要计算合成加权滤波器的零输入响应,且相应的算法复杂度相对较高,从而使得编解码过程的实现复杂程度也会相应提高。
发明内容
本发明的实施例提供了一种编解码方法及装置,从而可以使得编解码过程中,实现消除帧间不连续的处理过程的复杂程度降低,进而降低了编解码过程的实现复杂度。
本发明的实施例提供了一种编码方法,包括:
确定前一帧采用的是第一编码模式进行编码,且当前帧需要采用第二编码模式进行编码;
根据确定的当前帧与前一帧的编码数据的交迭部分数据长度,获取对应的前一帧中的所述交迭部分数据长度的编码数据;
将从前一帧中获取的编码数据与当前帧的编码数据进行第二编码模式编码处理,获得编码结果。
本发明的实施例提供了一种编码装置,包括编码模式切换识别单元、前一编码帧交迭数据获取单元和第二编码单元,其中:
编码模式切换识别单元,在确定前一帧采用的是第一编码模式进行编码,且当前帧需要采用变换域编码模式进行编码后,触发所述前一编码帧交迭数据获取单元;
前一编码帧交迭数据获取单元,用于根据确定的当前帧与前一帧的编码数据交迭部分数据长度,获取对应的前一帧中相应长度的编码数据,并提供给第二编码单元;
第二编码单元,将前一编码帧交迭数据获取单元获取的编码数据与当前帧的编码数据进行交迭处理,获得编码结果。
本发明的实施例提供了一种解码方法,包括:
对接收到的码流进行解码操作,并确定前一帧采用第一解码模式解码获得,当前帧为采用第二解码模式解码获得;
根据确定的当前帧与前一帧的解码数据交迭部分数据长度,获取对应的前一帧中的所述交迭部分数据长度的解码数据;
将从前一帧中获取的解码数据与当前帧的解码数据进行交迭处理,获得解码结果。
本发明的实施例提供了一种解码装置,包括解码模式切换识别单元、前一解码帧交迭数据获取单元和第二解码单元,其中:
解码模式切换识别单元,用于在根据解码后的码流中的信息确定前一帧采用第一解码模式解码获得,当前帧为采用第二码解码模式解码获得后,触发前一解码帧交迭数据获取单元;
前一解码帧交迭数据获取单元,用于根据确定的当前帧与前一帧的解码数据交迭部分数据长度,获取对应的前一帧中相应长度的解码数据,并提供给第二解码单元;
第二解码单元,用于将前一解码帧交迭数据获取单元获取的解码数据与当前帧的解码数据进行交迭处理,获得解码结果。
由上述本发明的实施例提供的技术方案可以看出,本发明提供的实施例无需通过滤波器运算便可以实现相应的模式切换编解码处理,从而使得整个编解码过程运算复杂度不高,进而更易于软硬件的实现。同时,本发明提供的实施例还可以在零输入响应和当前帧起始部分的信号不相似情况下,使得消除帧间不连续的效果能够得到有效保证
附图说明
图1为现有技术中TCX编码过程的原理框图;
图2为现有技术中TCX解码过程的原理框图;
图3为现有技术中计算加窗处理后的ZIR值过程中应用的时域窗函数w(n)的示意图;
图4为本发明实施例中TCX编码过程的原理框图;
图5为本发明实施例中TCX解码过程的原理框图;
图6为本发明实施例中输入语音帧结构示意图;
图7为本发明实施例中加窗处理后的窗形示意图;
图8为本发明实施例中解码过程中帧间交迭平滑的示意图;
图9为本发明实施例中提供的编解码装置的具体实现结构示意图。
具体实施方式
本发明提供的编码的实施例包括:首先,确定前一帧采用的是第一编码模式进行编码,且进一步确定当前帧需要采用第二编码模式进行编码,即确定编码过程中发生的编码模式的切换;则此时需要根据确定的当前帧与前一帧及后一帧的编码数据交迭部分数据长度,获取对应的前一帧及后一帧中的所述交迭部分数据长度的编码数据;最后,对从前一帧及后一帧数据中获取的编码数据及当前帧的编码数据进行基于第二编码模式的编码处理,获得编码结果。其中,所述的交迭部分数据长度为根据各编码帧的帧长确定并预先设置于编码器中,且所述编码帧的帧长越长则对应的所述交迭部分数据长度也越长。
需要说明的是,在该实施例中,假设所述的当前帧与前一帧的编码数据交迭部分数据长度为第一长度,所述当前帧与后一帧的编码数据交迭部分数据长度为第二长度,则优选地,所述第一长度可以与第二长度相同;当然,相应的实施例在具体应用过程中并不限定为两长度值一定相同。
本发明提供的实施例中,所述的第一编码模式具体可以但不限于为线性预测编码模式,所述的第二编码模式可以但不限于为变换域编码;进一步,相应的实施例可以应用于各种线性预测编码与变换域编码之间的模式切换编码过程中,例如,由ACELP编码到TCX编码之间的模式切换,等等。
对应的,本发明提供的解码的实施例包括:在对接收码流进行解码操作,并确定接收到的码流中的前一帧采用第一解码模式解码获得,当前帧为采用第二解码模式解码获得后,则根据确定的当前帧与前一帧的解码数据对应的交迭部分的数据长度,获取对应的前一帧中的所述交迭部分数据长度的解码数据;之后,将从前一帧中获取的解码数据与当前帧的解码数据进行交迭处理,具体为将前一帧中的所述交迭部分数据长度的解码数据与当前帧的解码数据的头部进行加窗叠加处理,获得解码结果。
以AMR-WB+编码为例,针对由ACELP编码(即线性预测编码)帧到TCX编码(即变换域编码)帧的转换处理过程,本发明的实施例提出了的一种ACELP与TCX编码模式切换的交迭平滑技术,其能够在保证码率不变的情况下获得更好的帧间平滑效果。且在应用所述实施例过程中,不需要通过复杂的合成感知加权滤波器计算,从而使得与现有技术中的AMR-WB+的模式间平滑技术相比,相应的计算复杂度有所降低。
也就是说,本发明的实施例主要是采用模式间交迭平滑技术实现两种编码模式之间切换时对编码所造成的影响,本实施例通过TCX编解码处理,以提高TCX编解码效率,降低TCX编解码复杂程度。下面将对本发明提供的基于模式间交迭平滑技术的TCX编解码技术方案进行说明
(一)采用模式间交迭平滑技术的TCX编码方案
该方案的具体实现如图4所示,对于输入的需要进行TCX编码操作的TCX帧信号,具体是通过感知加权滤波器,自适应加窗和变换域编码处理,以获得到经TCX编码后的码流;其中,如果前一帧采用的是ACELP模式编码,则当前输入的TCX帧信号将与后一帧交迭的数据长度减半,同时,将省出的空间采用前一帧最后一个子帧的若干个采样点值进行补足处理,即分别采用前一帧和后一帧的交迭部分的编码数据与当前帧编码数据一起进行编码处理,以实现帧间的平滑处理。
可以看出,在该图4所示的实施例中,无需再进行零输入响应的去除操作,从而可以简化编码过程中的复杂程度,同时,由于当前帧与前、后帧之间分别采用了交迭数据进行平滑操作,从而可以实现帧间的有效平滑处理。
(二)采用模式间交迭平滑技术的TCX解码方案
与上述TCX编码方案对应,相应的TCX解码方案的实现结构框图如图5所示,在解码处理过程中,TCX解码器接收到TCX编码器发送来的经TCX编码后的码流,之后通过变换域解码,加窗和TCX模式内的重叠相加,然后再通过逆感知加权滤波器得到合成音频信号;其中,若前一帧采用的是ACELP编码模式,则在解码端,采用与上述编码端对应的处理策略,利用前一帧的解码结果中与当前帧交迭部分进行交迭处理,以获得当前帧的解码结果;参照上述编码过程中的实例,则在TCX解码器中,将当前帧的起始交迭部分和上一帧ACELP合成信号的最后一子帧做加窗交迭,以得到最终的合成音频信号。
为便于对本发明实施例的理解,下面将结合附图对本发明实施例提供的编解码算法做详细描述,即对前一帧采用ACELP编码模式,当前帧采用TCX编码模式的情况下的编解码过程进行说明。
(一)编码过程
仍参照图4所示,对于前一帧使用ACELP模式编码的情况,且当前帧需要使用TCX编码时,则具体可以采用的帧间交迭技术包括:
根据当前帧TCX编码模式(如编码帧长分别为256、512或1024的TCX编码模式),将前一帧ACELP处理过的最后若干个音频数据(例如可以为16、32或64点speech数据)和当前帧音频数据一起进行TCX编码,所述的最后若干个音频数据是指根据编码帧长确定的与前一帧交迭部分数据长度的音频数据;
相应的TCX编码器输入的音频帧结构如图6所示,其中,L_frame表示当前帧TCX编码的帧长,可以为256、512或1024分别对应TCX的三种编码模式;其中,L1表示与前一帧交迭所取音频信号的长度,L2是为了与下一帧进行overlap(交迭)所取音频信号的采样点数,L则表示当前帧所处理的实际音频信号长度;图6中的各参数值具体可以为:
当L_frame=256时,L1=16,L2=16,L=288;
当L_frame=512时,L1=32,L2=32,L=576;
当L_frame=1024时,L1=64,L2=64,L=1152。
因此,当前帧与前一帧交迭的长度是随TCX编码模式的变化而变化的,具有自适应的效果。同时,此方法所处理TCX每帧speech信号的实际帧长和AMR-WB+匹配,保证了编码的正确性。
所述的需要进行TCX编码操作的speech信号通过感知加权滤波器处理后,进行自适应加窗操作的窗形参照图7所示,其中:
w(n)=sin(2n/(4L2)),其中,n=L2,...(2L2-1);
其中,w(n)是指图7中L2所示部分;也就是说,对前一帧交迭的部分没有加窗,而对与后一帧的交迭的部分加余弦窗w(n);
而且,因为设置了与前一帧的交迭部分,因此,该余弦窗的窗长仅是AMR-WB+的一半。
另外,当下一帧还是TCX编码时,则下一帧帧头所加的窗长要和L2长度一致,即相应的交迭部分长度应和当前帧一致,以保证帧间的平滑效果。
(二)解码过程
与上述编码过程对应,TCX解码器从接收到的当前帧TCX编码码流中,解码得到当前帧的合成音频信号,将其头部交迭部分与前一帧ACELP的解码的音频信号加窗做叠加,从而得到最终的合成音频输出。
具体为:将前一帧ACELP编码解出的合成音频信号和当前帧TCX编码所解码出的音频信号进行如图8所示的加窗操作,然后,将交迭部分进行叠加得到最后的合成音频信号。
参照图8所示,在交迭部分采用了三角窗,对ACELP最后L1个样点的合成音频信号采用w2(n)表示,对TCX交迭部分的合成音频信号采用w1(n)表示,则相应的合成音频信号具体如下式所示:
(1)w1(n)=n/L1,for n=0,...L1
(2)w2(n)=(L1-n)/L1,for n=0,...L1
经过上述过程,便可以顺利地完成相应的TCX解码操作,以获得相应的TCX解码操作结果。
本发明还提供了一种编解码装置的实施例,具体如图9所示,具体包括编码装置及解码装置,下面将分别对该两装置的具体实现结构进行描述。
(一)编码装置
该装置具体包括编码模式切换识别单元、前一编码帧交迭数据获取单元、后一编码帧交迭数据获取单元和第二编码单元,其中:
编码模式切换识别单元,在确定前一帧采用第一编码模式进行编码,且当前帧需要采用第二编码模式进行编码后,触发所述前一编码帧交迭数据获取单元及后一编码帧交迭数据获取单元;
前一编码帧交迭数据获取单元,根据确定的当前帧与前一帧的编码数据交迭部分数据长度,获取对应的前一帧中相应长度的编码数据,例如,获取前一帧中的相应长度的编码数据,并提供给变换域编码单元;
后一编码帧交迭数据获取单元,根据确定的当前帧与后一帧的编码数据交迭部分数据长度,获取对应的后一帧中相应长度的编码数据,并提供给变换域编码单元;其中,以TCX编码模式作为第二编码模式为例,考虑到目前TCX帧之间的编码过程中需要采用相应的平滑处理方案,故在该装置实施例中可以仍采用该单元,以进行相应的帧间平滑处理;
第二编码单元,将前一编码帧交迭数据获取单元及后一编码帧交迭数据获取单元获取的编码数据与当前帧的编码数据进行交迭处理,获得编码结果,从而实现帧间的平滑处理。
在该装置中,所述的前一帧交迭数据获取单元及后一帧交迭数据获取单元中采用的交迭部分数据长度为根据各编码帧的帧长预先确定;具体一点讲,假设所述的前一帧交迭数据获取单元中采用的交迭部分数据长度为第一长度,与所述后一帧交迭数据获取单元中采用的交迭部分数据长度为第二长度,则所述第一长度与第二长度之间相同,但不限于一定相同。
(二)解码装置
该装置具体包括解码模式切换识别单元、前一解码帧交迭数据获取单元和第二解码单元,其中:
解码模式切换识别单元,用于在对接收到的码流进行解码操作后,若进一步确定收到的码流中的前一帧采用第一解码模式解码获得,当前帧为采用第二解码模式解码获得,则触发所述前一解码帧交迭数据获取单元;
前一解码帧交迭数据获取单元,用于根据确定的当前帧与前一帧的解码数据交迭部分数据长度,获取对应的前一帧中相应长度的解码数据,并提供给第二解码单元;
第二解码单元,用于将前一解码帧交迭数据获取单元获取的解码数据与当前帧的解码数据进行加窗交迭处理,获得解码结果;
交迭部分数据长度的确定单元,用于根据收到的码流中的指示信息确定所述交迭部分数据长度,并提供给所述前一解码帧交迭数据获取单元,例如,在码流中将编码模式(即编码帧的帧长)传递给解码端,解码端收到所述编码模式后则根据该编码模式确定对应的所述交迭部分数据长度值,当然,也可以通过其他指示信息指示解码端可以采用的交迭部分数据长度值。
在上述装置中,所述的第一编码模式为线性预测编码模式,所述的第二编码模式为变换域编码。
需要说明的是,本发明提供的各实施例同样适用于两种不同编码或解码模式之间进行切换时造成的问题。具体可以通过对前后两种编码模式进行交叠编码处理,从而平滑由于切换带来的编码解码质量损失,提高编解码质量。例如,具体还可以应用于由ACELP编码模式到AAC(高级音频编码)模式之间的转换平滑处理,或者,应用于由CELP(线性预测激励编码)模式到AAC模式之间的转换平滑处理,或者,由ACELP编码模式到MDCT(改进的离散余弦变换)编码模式之间的转换平滑处理,等等。
综上所述,由于在解码端合成音频信号上直接做交迭运算,因而可以获得较好的帧间平滑效果。而且,本发明提供的实施例无需通过滤波器运算,从而使得整个编解码过程运算复杂度不高,更易于软硬件的实现。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (16)

1.一种编码方法,其特征在于,该方法包括:
确定前一帧采用的是第一编码模式进行编码,且当前帧需要采用第二编码模式进行编码;
根据确定的当前帧与前一帧编码数据的交迭部分数据长度,获取对应的前一帧中的所述交迭部分数据长度的编码数据;
对获取的前一帧中获取的编码数据和当前帧的编码数据进行第二编码模式编码处理,获得编码结果。
2.根据权利要求1所述的方法,其特征在于,所述的第一编码模式为线性预测编码模式,所述的第二编码模式为变换域编码。
3.根据权利要求1所述的方法,其特征在于,所述的交迭部分数据长度的确定方式包括:
根据各编码帧的帧长确定对应的所述交迭部分数据长度。
4.根据权利要求1、2或3所述的方法,其特征在于,所述的方法还包括:根据确定当前帧与后一帧的编码数据交迭部分数据长度获取后一帧中的编码数据,并将获取的编码数据与从前一帧中获取的编码数据及当前帧的编码数据进行变换域编码处理。
5.根据权利要求4所述的方法,其特征在于,所述的当前帧与前一帧的编码数据交迭部分数据长度,和所述当前帧与后一帧的编码数据交迭部分数据长度相同。
6.一种编码装置,其特征在于,包括编码模式切换识别单元、前一编码帧交迭数据获取单元和变换域编码单元,其中:
编码模式切换识别单元,用于在确定前一帧采用的第一编码模式进行编码,且当前帧需要采用第二编码模式进行编码后,触发所述前一编码帧交迭数据获取单元;
前一编码帧交迭数据获取单元,用于根据确定的当前帧与前一帧的编码数据交迭部分数据长度,获取对应的前一帧中相应长度的编码数据,并提供给变换域编码单元;
第二编码单元,对前一编码帧交迭数据获取单元获取的编码数据及当前帧的编码数据进行第二编码模式编码处理,获得编码结果。
7.根据权利要求6所述的装置,其特征在于,所述的第一编码模式为线性预测编码模式,所述的第二编码模式为变换域编码。
8.根据权利要求6所述的装置,其特征在于,所述的前一帧交迭数据获取单元及后一帧交迭数据获取单元中采用的交迭部分数据长度为根据各编码帧的帧长预先确定。
9.根据权利要求6、7或8所述的装置,其特征在于,所述的方法还包括后一编码帧交迭数据获取单元,用于根据确定的当前帧与后一帧的编码数据交迭部分数据长度,获取对应的后一帧中相应长度的编码数据,并提供给变换域编码单元进行编码操作。
10.根据权利要求9所述的装置,其特征在于,所述的前一帧交迭数据获取单元中采用的交迭部分数据长度,与所述后一帧交迭数据获取单元中采用的交迭部分数据长度相同。
11.一种解码方法,其特征在于,包括:
对接收到的码流进行解码操作,并确定前一帧采用第一解码模式解码获得,当前帧为采用第二解码模式解码获得;
根据确定的当前帧与前一帧的解码数据交迭部分数据长度,获取对应的前一帧中的所述交迭部分数据长度的解码数据;
将从前一帧中获取的解码数据与当前帧的解码数据进行交迭处理,获得解码结果。
12.根据权利要求11所述的方法,其特征在于,所述的第一编码模式为线性预测编码模式,所述的第二编码模式为变换域编码。
13.根据权利要求11所述的方法,其特征在于,所述的交迭部分数据长度的确定方式包括:
根据收到的码流中的指示信息确定所述交迭部分数据长度。
14.一种解码装置,其特征在于,包括解码模式切换识别单元、前一解码帧交迭数据获取单元和第二解码单元,其中:
解码模式切换识别单元,用于在根据解码后的码流中的信息确定前一帧为采用第一解码模式解码获得,当前帧为采用第二解码模式解码获得后,触发前一解码帧交迭数据获取单元;
前一解码帧交迭数据获取单元,用于根据确定的当前帧与前一帧的解码数据交迭部分数据长度,获取对应的前一帧中相应长度的解码数据,并提供给变换域解码单元;
第二解码单元,用于将前一解码帧交迭数据获取单元获取的解码数据与当前帧的解码数据进行交迭处理,获得解码结果。
15.根据权利要求14所述的装置,其特征在于,所述的第一编码模式为线性预测编码模式,所述的第二编码模式为变换域编码。
16.根据权利要求14或15所述的装置,其特征在于,所述的装置还包括交迭部分数据长度的确定单元,用于根据收到的码流中的指示信息确定所述交迭部分数据长度。
CN2007100060040A 2007-01-23 2007-01-23 编解码方法及装置 Active CN101231850B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN2007100060040A CN101231850B (zh) 2007-01-23 2007-01-23 编解码方法及装置
EP08706547A EP2120233A4 (en) 2007-01-23 2008-01-23 DEVICE AND METHOD FOR CODING AND DECODING
JP2009546636A JP2010517083A (ja) 2007-01-23 2008-01-23 符号化及び復号化の方法及び装置
PCT/CN2008/070170 WO2008089705A1 (fr) 2007-01-23 2008-01-23 Procédé et appareil de codage et de décodage
US12/508,103 US20090299757A1 (en) 2007-01-23 2009-07-23 Method and apparatus for encoding and decoding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007100060040A CN101231850B (zh) 2007-01-23 2007-01-23 编解码方法及装置

Publications (2)

Publication Number Publication Date
CN101231850A true CN101231850A (zh) 2008-07-30
CN101231850B CN101231850B (zh) 2012-02-29

Family

ID=39644144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100060040A Active CN101231850B (zh) 2007-01-23 2007-01-23 编解码方法及装置

Country Status (5)

Country Link
US (1) US20090299757A1 (zh)
EP (1) EP2120233A4 (zh)
JP (1) JP2010517083A (zh)
CN (1) CN101231850B (zh)
WO (1) WO2008089705A1 (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010148516A1 (en) * 2009-06-23 2010-12-29 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
CN101968961A (zh) * 2010-09-19 2011-02-09 北京航空航天大学 一种基于faac lc模式的多路音频实时编码软件设计方法
CN101968960A (zh) * 2010-09-19 2011-02-09 北京航空航天大学 一种基于faac及faad2的多路音频实时编解码硬件设计平台
CN102770912A (zh) * 2010-01-13 2012-11-07 沃伊斯亚吉公司 使用线性预测滤波的前向时域混叠消除
CN102884574A (zh) * 2009-10-20 2013-01-16 弗兰霍菲尔运输应用研究公司 音频信号编码器、音频信号解码器、使用混迭抵消来将音频信号编码或解码的方法
CN102388607B (zh) * 2008-11-26 2014-11-05 韩国电子通信研究院 基于模式转换来处理窗口序列的语音/音频统合编解码器
CN105229735A (zh) * 2013-01-29 2016-01-06 弗劳恩霍夫应用研究促进协会 用于编码模式切换补偿的技术
CN106575507A (zh) * 2014-07-28 2017-04-19 弗劳恩霍夫应用研究促进协会 用于处理音频信号的方法和装置,音频解码器和音频编码器
CN106663442A (zh) * 2014-07-28 2017-05-10 弗劳恩霍夫应用研究促进协会 使用零输入响应以获得平滑过渡的音频解码器、方法及计算机程序
WO2017092264A1 (zh) * 2015-12-01 2017-06-08 腾讯科技(深圳)有限公司 一种数据处理方法及其终端
US10002619B2 (en) 2008-11-26 2018-06-19 Electronics And Telecommunications Research Institute Unified speech/audio codec (USAC) processing windows sequence based mode switching
CN109448745A (zh) * 2013-01-07 2019-03-08 中兴通讯股份有限公司 一种编码模式切换方法和装置、解码模式切换方法和装置
WO2022237851A1 (zh) * 2021-05-14 2022-11-17 华为技术有限公司 一种音频编码、解码方法及装置
WO2024169532A1 (zh) * 2023-02-17 2024-08-22 华为技术有限公司 有损编解码器和无损编解码器之间的切换方法和装置

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
FR2936898A1 (fr) * 2008-10-08 2010-04-09 France Telecom Codage a echantillonnage critique avec codeur predictif
WO2010044593A2 (ko) 2008-10-13 2010-04-22 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
KR101649376B1 (ko) * 2008-10-13 2016-08-31 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
CA2777073C (en) * 2009-10-08 2015-11-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping
PL2491553T3 (pl) 2009-10-20 2017-05-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio, dekoder audio, sposób kodowania informacji audio, sposób dekodowania informacji audio i program komputerowy wykorzystujący iteracyjne zmniejszania rozmiaru przedziału
JP5624159B2 (ja) 2010-01-12 2014-11-12 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオ符号化器、オーディオ復号器、オーディオ情報を符号化および復号するための方法、ならびに以前に復号されたスペクトル値のノルムに基づいてコンテキストサブ領域値を取得するコンピュータプログラム
US9275650B2 (en) * 2010-06-14 2016-03-01 Panasonic Corporation Hybrid audio encoder and hybrid audio decoder which perform coding or decoding while switching between different codecs
WO2012000882A1 (en) 2010-07-02 2012-01-05 Dolby International Ab Selective bass post filter
WO2012004349A1 (en) 2010-07-08 2012-01-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coder using forward aliasing cancellation
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
SG191771A1 (en) * 2010-12-29 2013-08-30 Samsung Electronics Co Ltd Apparatus and method for encoding/decoding for high-frequency bandwidth extension
EP2680599A1 (en) * 2012-06-29 2014-01-01 Thomson Licensing Provision of a personalized media content

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
US6359929B1 (en) * 1997-07-04 2002-03-19 Matsushita Electric Industrial Co., Ltd. Image predictive decoding method, image predictive decoding apparatus, image predictive coding apparatus, and data storage medium
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6226608B1 (en) * 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
US6556624B1 (en) * 1999-07-27 2003-04-29 At&T Corp. Method and apparatus for accomplishing multiple description coding for video
JP3806770B2 (ja) * 2000-03-17 2006-08-09 松下電器産業株式会社 窓処理装置および窓処理方法
EP1215663A1 (en) * 2000-12-15 2002-06-19 BRITISH TELECOMMUNICATIONS public limited company Encoding audio signals
CN1251509C (zh) * 2001-04-10 2006-04-12 皇家菲利浦电子有限公司 帧序列的编码方法
AU2002353343A1 (en) * 2002-01-18 2003-07-30 Koninklijke Philips Electronics N.V. Audio coding
WO2004008437A2 (en) * 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7596486B2 (en) * 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
JP2006330256A (ja) * 2005-05-25 2006-12-07 Kddi Corp オーディオ信号に対する電子透かし埋込み方法および検出方法

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11430458B2 (en) 2008-11-26 2022-08-30 Electronics And Telecommunications Research Institute Unified speech/audio codec (USAC) processing windows sequence based mode switching
US10622001B2 (en) 2008-11-26 2020-04-14 Electronics And Telecommunications Research Institute Unified speech/audio codec (USAC) windows sequence based mode switching
CN104282313B (zh) * 2008-11-26 2018-09-21 韩国电子通信研究院 基于模式转换来处理窗口序列的语音/音频统合编解码器
CN102388607B (zh) * 2008-11-26 2014-11-05 韩国电子通信研究院 基于模式转换来处理窗口序列的语音/音频统合编解码器
CN104282313A (zh) * 2008-11-26 2015-01-14 韩国电子通信研究院 基于模式转换来处理窗口序列的语音/音频统合编解码器
US10002619B2 (en) 2008-11-26 2018-06-19 Electronics And Telecommunications Research Institute Unified speech/audio codec (USAC) processing windows sequence based mode switching
US8725503B2 (en) 2009-06-23 2014-05-13 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
WO2010148516A1 (en) * 2009-06-23 2010-12-29 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
CN102884574B (zh) * 2009-10-20 2015-10-14 弗兰霍菲尔运输应用研究公司 音频信号编码器、音频信号解码器、使用混迭抵消来将音频信号编码或解码的方法
CN102884574A (zh) * 2009-10-20 2013-01-16 弗兰霍菲尔运输应用研究公司 音频信号编码器、音频信号解码器、使用混迭抵消来将音频信号编码或解码的方法
CN102770912B (zh) * 2010-01-13 2015-06-10 沃伊斯亚吉公司 使用线性预测滤波的前向时域混叠消除
US9093066B2 (en) 2010-01-13 2015-07-28 Voiceage Corporation Forward time-domain aliasing cancellation using linear-predictive filtering to cancel time reversed and zero input responses of adjacent frames
CN102770912A (zh) * 2010-01-13 2012-11-07 沃伊斯亚吉公司 使用线性预测滤波的前向时域混叠消除
CN101968961A (zh) * 2010-09-19 2011-02-09 北京航空航天大学 一种基于faac lc模式的多路音频实时编码软件设计方法
CN101968960A (zh) * 2010-09-19 2011-02-09 北京航空航天大学 一种基于faac及faad2的多路音频实时编解码硬件设计平台
CN109448745B (zh) * 2013-01-07 2021-09-07 中兴通讯股份有限公司 一种编码模式切换方法和装置、解码模式切换方法和装置
CN109448745A (zh) * 2013-01-07 2019-03-08 中兴通讯股份有限公司 一种编码模式切换方法和装置、解码模式切换方法和装置
US12067996B2 (en) 2013-01-29 2024-08-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for coding mode switching compensation
US11600283B2 (en) 2013-01-29 2023-03-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for coding mode switching compensation
CN105229735A (zh) * 2013-01-29 2016-01-06 弗劳恩霍夫应用研究促进协会 用于编码模式切换补偿的技术
US10734007B2 (en) 2013-01-29 2020-08-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for coding mode switching compensation
CN105229735B (zh) * 2013-01-29 2019-11-01 弗劳恩霍夫应用研究促进协会 用于编码模式切换补偿的技术
CN106663442B (zh) * 2014-07-28 2021-04-02 弗劳恩霍夫应用研究促进协会 使用零输入响应以获得平滑过渡的音频解码器、方法及计算机程序
CN106575507A (zh) * 2014-07-28 2017-04-19 弗劳恩霍夫应用研究促进协会 用于处理音频信号的方法和装置,音频解码器和音频编码器
CN106663442A (zh) * 2014-07-28 2017-05-10 弗劳恩霍夫应用研究促进协会 使用零输入响应以获得平滑过渡的音频解码器、方法及计算机程序
US20230335147A1 (en) * 2014-07-28 2023-10-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
US12014746B2 (en) 2014-07-28 2024-06-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder to filter a discontinuity by a filter which depends on two fir filters and pitch lag
US12033648B2 (en) * 2014-07-28 2024-07-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder for removing a discontinuity between frames by subtracting a portion of a zero-input-reponse
CN106816153B (zh) * 2015-12-01 2019-03-15 腾讯科技(深圳)有限公司 一种数据处理方法及其终端
WO2017092264A1 (zh) * 2015-12-01 2017-06-08 腾讯科技(深圳)有限公司 一种数据处理方法及其终端
US10127009B2 (en) 2015-12-01 2018-11-13 Tencent Technology (Shenzhen) Company Limited Data processing method and terminal thereof
CN106816153A (zh) * 2015-12-01 2017-06-09 腾讯科技(深圳)有限公司 一种数据处理方法及其终端
WO2022237851A1 (zh) * 2021-05-14 2022-11-17 华为技术有限公司 一种音频编码、解码方法及装置
WO2024169532A1 (zh) * 2023-02-17 2024-08-22 华为技术有限公司 有损编解码器和无损编解码器之间的切换方法和装置

Also Published As

Publication number Publication date
CN101231850B (zh) 2012-02-29
US20090299757A1 (en) 2009-12-03
JP2010517083A (ja) 2010-05-20
EP2120233A1 (en) 2009-11-18
WO2008089705A1 (fr) 2008-07-31
EP2120233A4 (en) 2010-01-20

Similar Documents

Publication Publication Date Title
CN101231850B (zh) 编解码方法及装置
US10714103B2 (en) Apparatus for encoding and decoding of integrated speech and audio
JP7568695B2 (ja) ハーモニックフィルタツールのハーモニック依存制御
EP2311032B1 (en) Audio encoder and decoder for encoding and decoding audio samples
CA2730195C (en) Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
US8959015B2 (en) Apparatus for encoding and decoding of integrated speech and audio
JP5882895B2 (ja) 復号装置
WO2013061584A1 (ja) 音信号ハイブリッドデコーダ、音信号ハイブリッドエンコーダ、音信号復号方法、及び音信号符号化方法
JP2014510305A (ja) 整列したルックアヘッド部分を用いてオーディオ信号を符号化及び復号するための装置並びに方法
US9984696B2 (en) Transition from a transform coding/decoding to a predictive coding/decoding
AU2013200679B2 (en) Audio encoder and decoder for encoding and decoding audio samples
CN101197134A (zh) 消除编码模式切换影响的方法和装置以及解码方法和装置
EP3002751A1 (en) Audio encoder and decoder for encoding and decoding audio samples
CN102968997A (zh) 用于宽带语音解码中噪声增强后处理的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20091023

Address after: Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen Province, China: 518129

Applicant after: Huawei Technologies Co., Ltd.

Address before: Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen Province, China: 518129

Applicant before: HUAWEI Technologies Ltd

Co-applicant before: Shanghai Jiao Tong University

C14 Grant of patent or utility model
GR01 Patent grant