CN101842832A - 编码装置和解码装置 - Google Patents

编码装置和解码装置 Download PDF

Info

Publication number
CN101842832A
CN101842832A CN200880113728A CN200880113728A CN101842832A CN 101842832 A CN101842832 A CN 101842832A CN 200880113728 A CN200880113728 A CN 200880113728A CN 200880113728 A CN200880113728 A CN 200880113728A CN 101842832 A CN101842832 A CN 101842832A
Authority
CN
China
Prior art keywords
signal
frequency
residual signals
coefficient
sound channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200880113728A
Other languages
English (en)
Other versions
CN101842832B (zh
Inventor
钟海山
刘宗宪
钟国胜
吉田幸司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
III Holdings 12 LLC
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN101842832A publication Critical patent/CN101842832A/zh
Application granted granted Critical
Publication of CN101842832B publication Critical patent/CN101842832B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

公开了在使用了声道间预测(ICP)的可扩展立体声语音编码中改善ICP的预测性能的编码装置。在该编码装置中,ICP分析单元(113、114、115)分别将旁残差信号的低频部分的频率系数s L′(f)、单声道残差信号的各个子带部分的频率系数mM,i(f)、单声道残差信号的低频部分的频率系数mL(f)作为基准信号候选,进行该基准信号候选与旁残差信号的各个子带部分的频率系数sM,i(f)的ICP分析,并生成第一、第二、第三ICP系数。选择单元(116)通过检查各个基准信号候选与旁残差信号的各个子带部分的频率系数sM,i(f)之间的关系,从基准信号候选中选择最适合的基准信号,并将表示选择出的基准信号的基准信号ID和对应于基准信号的ICP系数输出到ICP参数量化单元(117)。

Description

编码装置和解码装置
技术领域
本发明涉及使用声道间预测(ICP)实现可扩展的立体声语音编码的编码装置和解码装置。
背景技术
以往,语音编码(语音编解码)用于使用电话频带(200Hz~3.4kHz)的窄带语音的通信用途。单声道语音的窄带语音编解码广泛地使用于移动电话、远程会议设备和分组网络(例如,因特网)上的语音通信等通信用途。
实现更具有现场感的语音通信系统的步骤之一为从单声道语音表现向立体声语音表现的转移。宽带立体声语音通信提供更自然的音响环境。可扩展立体声语音编码是用于实现高音质且高可用性的语音通信的核心技术。
作为对立体声语音信号进行编码的一般方法之一,使用基于单声道语音的信号预测方法。也就是说,使用公知的单声道语音编解码器发送基本声道信号,并根据该基本声道信号,使用追加的信息和参数,预测左声道或右声道。在多数的应用中,选择混合了左声道信号和右声道信号的单声道信号作为基本声道信号。
作为对立体声信号进行编码的方法,已知ISC(Intensity Stereo Coding:强度立体声编码)、BCC(Binaural Cue Coding:双声道信号编码)以及ICP(Inter-Channel Prediction:声道间预测)等。这些参数性的立体声编码方式分别具有不同的优点和缺点,并分别适合于不同的声源(source materials)的编码。
在非专利文献1中公开了使用这些编码方法,并基于单声道信号预测立体声信号的技术。具体而言,合成构成立体声信号的声道信号例如左声道信号和右声道信号而获得单声道信号,并使用公知的语音编解码器对所获得的单声道信号进行编码/解码,进而使用预测参数并根据单声道信号,预测左声道与右声道之间的差信号(旁信号(side signal))。在这样的编码方法中,在编码侧使用具有时间依赖性的自适应滤波器使单声道信号与旁信号之间的关系模式化,并将对每个帧计算出的滤波系数发送到解码侧。在解码侧,通过对由单声道编解码器发送的高质量的单声道信号进行滤波,再次生成差信号,并根据再次生成的差信号和单声道信号,计算左声道信号和右声道信号。
另外,在非专利文献2中公开了被称为声道间相关消除(Cross-ChannelCorrelation Canceller)的编码方法,在ICP方式的编码方法中适用声道间相关消除的技术时,能够根据一方的声道预测另一方的声道。
另外,近年来,音频压缩技术迅速发展,其中,改进离散余弦变换(MDCT)方式成为高质量的音频编码中的主要方法(参照非专利文献3、非专利文献4)。
在使用适当的窗口(例如,正弦窗)时,MDCT适用于音频压缩而在听觉上不产生较大的问题。最近,MDCT在多模式变换预测编码(multimodetransform predictive coding)的范例(paradigm)中具有重要的作用。
所谓多模式变换预测编码是指,将语音编码的原理和音频编码的原理归纳为一个编码系统(非专利文献4)。但是,非专利文献4中的基于MDCT的编码结构和其应用被设计为仅对一个声道的信号进行编码,并使用不同的量化方式使不同的频域中的MDCT系数量化。
非专利文献1:Extended AMR Wideband Speech Codec(AMR-WB+):Transcoding functions,3GPP TS 26.290.
非专利文献2:S.Minami and O.Okada,“Stereophonic ADPCM voicecoding method,”in Proc.ICASSP’90,Apr.1990.
非专利文献3:Ye Wang and Miikka Vilermo,“The modified discrete cosinetransform:its implications for audio coding and error concealment,”in AES 22ndInternational Conference on Virtual,Synthetic and Entertainment,2002.
非专利文献4:Sean A.Ramprashad,“The multimode transform predictivecoding paradigm,”IEEE Tran.Speech and Audio Processing,vol.11,pp.117-129,Mar.2003.
非专利文献5:Wai C.Chu,“Speech coding algorithms:foundation andevolution of standardized coders”,ISBN 0-471-37312-5,2003
发明内容
发明需要解决的问题
在非专利文献2中使用的编码方式的情况下,在两个声道间的相关较高时,ICP的性能足够。然而,在相关较低时,需要更高阶数的自适应滤波系数,根据情况,用于提高预测增益的成本过高。若不增加滤波阶数,则预测误差的能级(energy level)有可能与基准信号的能级相同,此时,ICP无用。
对语音信号的质量而言,频带的低频部分在本质上重要。由于解码后的语音的低频部分中的极小差错,大幅损失语音整体的质量。由于语音编码中的ICP的预测性能的界限,在两个声道间的相关不高时,难以达成与低频部分有关的令人满意的性能,优选采用其他的编码方式。
在非专利文献1中,在时域中仅对高频部分的信号适用ICP。这是对上述问题的一个解决方案。然而,在非专利文献1中,在编码器的ICP中使用了输入单声道信号。较为理想的是,应使用解码后的单声道信号。这是因为在解码单元侧,通过ICP合成滤波器获得再次生成的立体声信号,该ICP合成滤波器使用由单声道解码单元解码的单声道信号。然而,在单声道编码器为特别在宽带(7kHz以上)音频编码中广泛使用的MDCT变换编码等变换编码类型的编码器时,为了在编码器侧取得在时域进行解码所得的单声道信号,产生某些追加的算法延迟。
本发明的目的在于,提供使用声道间预测(ICP)实现可扩展的立体声语音编码,并能够改善立体声语音编码中的ICP的预测性能的编码装置和解码装置。
解决问题的方案
本发明的编码装置所采用的结构包括:单声道信号生成单元,合成立体声信号的第一声道信号和第二声道信号而生成单声道信号,并生成作为所述第一声道信号与所述第二声道信号之间的差分的旁信号;旁残差信号取得单元,取得作为对所述旁信号的线性预测残差信号的旁残差信号;单声道残差信号取得单元,取得作为对所述单声道信号的线性预测残差信号的单声道残差信号;第一频谱分割单元,将所述旁残差信号分割为低于规定频率的频带即低频部分和高于所述规定频率的频带即中间频带部分;第二频谱分割单元,将所述单声道残差信号分割为低于所述规定频率的频带即低频部分和高于所述规定频率的频带即中间频带部分;选择单元,将所述旁残差信号的低频部分的频率系数、所述单声道残差信号的中间频带部分的频率系数、以及所述单声道残差信号的低频部分的频率系数作为基准信号候选,并将所述旁残差信号的中间频带部分的频率系数作为目标信号,通过检查所述各个基准信号候选与所述目标信号之间的关系,从所述基准信号候选中选择最适合的信号作为基准信号;以及声道间预测分析单元,进行所述基准信号与所述目标信号的声道间预测分析而获得声道间预测系数。
本发明的解码装置所采用的结构包括:ICP(Inter-Channel Prediction,声道间预测)参数解码单元,对表示从旁残差信号的低于规定频率的频带即低频部分的频率系数、单声道残差信号的高于所述规定频率的频带即中间频带部分的频率系数、以及所述单声道残差信号的低于所述规定频率的频带即低频部分的频率系数中选择出的基准信号的基准信号ID进行解码,并且对通过进行所述旁残差信号的高于所述规定频率的频带即中间频带部分的频率系数与所述基准信号的声道间预测分析所获得的声道间预测系数进行解码,所述旁残差信号是对作为立体声信号的第一声道信号与第二声道信号之间的差分的旁信号的线性预测残差信号,所述单声道残差信号是对合成所述第一声道信号和所述第二声道信号而生成的单声道信号的线性预测残差信号;ICP合成单元,将所述声道间预测系数作为滤波系数,并对所述基准信号进行滤波处理,从而计算所述旁残差信号的所述中间频带部分的频率系数;加法单元,将所述旁残差信号的所述低频部分的频率系数与所述旁残差信号的所述中间频带部分的频率系数相加,获得所述旁残差信号的整个频带的频率系数;变换单元,从所述旁残差信号的整个频带的频率系数变换成时域的旁残差信号;线性预测合成单元,对所述时域的旁残差信号进行线性预测合成滤波,并获得所述旁信号;以及立体声信号计算单元,使用所述单声道信号和所述旁信号,获得所述第一声道信号和所述第二声道信号。
本发明的编码方法包括:单声道信号生成步骤,合成立体声信号的第一声道信号和第二声道信号而生成单声道信号,并生成作为所述第一声道信号与所述第二声道信号之间的差分的旁信号;旁残差信号取得步骤,取得作为对所述旁信号的线性预测残差信号的旁残差信号;单声道残差信号取得步骤,取得作为对所述单声道信号的线性预测残差信号的单声道残差信号;第一频谱分割步骤,将所述旁残差信号分割为低于规定频率的频带即低频部分和高于所述规定频率的频带即中间频带部分;第二频谱分割步骤,将所述单声道残差信号分割为低于所述规定频率的频带即低频部分和高于所述规定频率的频带即中间频带部分;选择步骤,将所述旁残差信号的低频部分的频率系数、所述单声道残差信号的中间频带部分的频率系数、以及所述单声道残差信号的低频部分的频率系数作为基准信号候选,并将所述旁残差信号的中间频带部分的频率系数作为目标信号,通过检查所述各个基准信号候选与所述目标信号之间的关系,从所述基准信号候选中选择最适合的信号作为基准信号;以及声道间预测分析步骤,进行所述基准信号与所述目标信号的声道间预测分析而获得声道间预测系数。
本发明的解码方法包括:ICP参数解码步骤,对表示从旁残差信号的低于规定频率的频带即低频部分的频率系数、单声道残差信号的高于所述规定频率的频带即中间频带部分的频率系数、以及所述单声道残差信号的低于所述规定频率的频带即低频部分的频率系数中选择出的基准信号的基准信号ID进行解码,并且对通过进行所述旁残差信号的高于所述规定频率的频带即中间频带部分的频率系数与所述基准信号的声道间预测分析所获得的声道间预测系数进行解码,所述旁残差信号是对作为立体声信号的第一声道信号与第二声道信号之间的差分的旁信号的线性预测残差信号,所述单声道残差信号是对合成所述第一声道信号和所述第二声道信号而生成的单声道信号的线性预测残差信号;ICP合成步骤,将所述声道间预测系数作为滤波系数,并对所述基准信号进行滤波处理,从而计算所述旁残差信号的所述中间频带部分的频率系数;加法步骤,将所述旁残差信号的所述低频部分的频率系数与所述旁残差信号的所述中间频带部分的频率系数相加,获得所述旁残差信号的整个频带的频率系数;变换步骤,从所述旁残差信号的整个频带的频率系数变换成时域的旁残差信号;线性预测合成步骤,对所述时域的旁残差信号进行线性预测合成滤波,并获得所述旁信号;以及立体声信号计算步骤,使用所述单声道信号和所述旁信号,获得所述第一声道信号和所述第二声道信号。
发明的效果
根据本发明,通过从多个信号中选择带来最佳预测结果的信号作为基准信号,使用基准信号预测旁信号的残差信号,从而能够改善立体声语音编码中的ICP的预测性能。
附图说明
图1是表示本发明实施方式1的编码装置的结构的方框图。
图2是表示本发明实施方式1的ICP分析单元的内部的主要结构的方框图。
图3是表示一例在ICP分析和ICP合成中使用的自适应FIR滤波器的结构的图。
图4是用于说明本发明实施方式1的编码装置的选择单元中的基准信号的选择的图。
图5是表示本发明实施方式1的解码装置的结构的方框图。
图6是表示本发明实施方式1的编码装置的第一例中的选择单元的内部结构的方框图。
图7是表示本发明实施方式1的编码装置的第二例中的选择单元的内部结构的方框图。
图8是表示本发明实施方式2的编码装置的结构的方框图。
图9是表示本发明实施方式2的编码装置的选择单元的内部结构的方框图。
图10是用于说明本发明实施方式3的修正ICP中的预测方法的图。
图11是用于说明本发明实施方式4的修正ICP中的预测方法的图。
具体实施方式
(实施方式1)
以下,使用附图说明本发明的实施方式1。另外,在以下的说明中,将左声道信号、右声道信号、单声道信号、旁信号分别表示为L、R、M、S,以及将这些信号的再生成信号分别表示为L’、R’、M’、S’。另外,在以下的说明中,将各个帧的长度表示为N,将对单声道信号、旁信号的各个信号的MDCT区域信号(称为频率系数或MDCT系数)分别表示为m(f)、s(f)。
图1是表示本实施方式的编码装置的结构的方框图。在图1所示的编码装置100中,按每个帧输入例如由PCM(Pulse Code Modulation,脉冲编码调制)形式中的左声道信号和右声道信号构成的立体声信号。
单声道信号合成单元101通过下式(1)合成左声道信号L和右声道信号R,生成单声道信号M。另外,单声道信号合成单元101使用左声道信号L和右声道信号R,通过下式(2)生成旁信号S。然后,单声道信号合成单元101将旁信号S输出到LP分析/量化单元102和LP逆滤波器103,并将单声道信号M输出到单声道编码单元104。
M ( n ) = 1 2 [ L ( n ) + R ( n ) ] - - - ( 1 )
S ( n ) = 1 2 [ L ( n ) - R ( n ) ] - - - ( 2 )
在该式(1)、式(2)中,n是帧中的时间索引(time index)。另外,用于生成单声道信号的合成方法并不限定于式(1)。例如,也可以使用自适应地进行加权并混合的方法等其他方法生成单声道信号。
LP分析/量化单元102对旁信号S进行基于LP分析(线性预测分析)的LP参数的计算以及进行计算出的LP参数的量化,并将所获得的LP参数的编码数据输出到复用单元118,同时将量化后的LP系数AS输出到LP逆滤波器103。
LP逆滤波器103使用LP系数AS对旁信号S进行LP逆滤波,并将所获得的旁信号的残差信号(以下,称为“旁残差信号”)Sres输出到加窗单元105。
单声道编码单元104对单声道信号M进行编码,并将所获得的编码数据输出到复用单元118。另外,单声道编码单元104将单声道残差信号Mres输出到加窗单元106。另外,残差信号也称为激励信号。在大部分的单声道语音编码装置(例如,基于CELP(Code Excited Linear Prediction,码激励线性预测)的编码装置)中,或者在包含生成LP残差信号或被局部解码的残差信号的处理的类型的编码装置中,能够提取该残差信号。
加窗单元105对旁残差信号Sres进行加窗处理(windowing),并将其输出到MDCT变换单元107。加窗单元106对单声道残差信号Mres进行加窗处理,并将其输出到MDCT变换单元108。
MDCT变换单元107对加窗处理后的旁残差信号Sres进行MDCT变换,并将所获得的旁残差信号的频率系数s(f)输出到频谱分割单元109。MDCT变换单元108对加窗处理后的单声道残差信号Mres进行MDCT变换,并将所获得的单声道残差信号的频率系数m(f)输出到频谱分割单元110。
频谱分割单元109以规定的频率为边界,将旁残差信号的频率系数s(f)的频带分割为低频部分、中间频带部分和高频部分,并将旁残差信号的低频部分的频率系数sL(f)输出到低频编码单元111。另外,频谱分割单元109将旁残差信号的中间频带部分分割为更小的子带i,并将旁残差信号的各个子带部分的频率系数sM,i(f)输出到ICP分析单元113、114和115。另外,i是子带的索引且是0以上的整数。
频谱分割单元110以规定的频率为边界,将单声道残差信号的频率系数m(f)的频带分割为低频部分、中间频带部分和高频部分,并将单声道残差信号的低频部分的频率系数mL(f)输出到ICP分析单元115。另外,频谱分割单元110将单声道残差信号的中间频带部分分割为更小的子带i,并将单声道残差信号的各个子带部分的频率系数mM,i(f)输出到ICP分析单元114。
低频编码单元111对旁残差信号的低频部分的频率系数sL(f)进行编码,并将所获得的编码数据输出到低频解码单元112和复用单元118。
低频解码单元112对旁残差信号的低频部分的频率系数的编码数据进行解码,并将所获得的旁残差信号的低频部分的频率系数sL′(f)输出到ICP分析单元113和选择单元116。
ICP分析单元113由自适应滤波器构成,其将旁残差信号的低频部分的频率系数s L′(f)作为基准信号候选,进行该基准信号候选与旁残差信号的各个子带部分的频率系数sM,i(f)的ICP分析,生成第一ICP系数,并将其输出到选择单元116。
ICP分析单元114由自适应滤波器构成,其将单声道残差信号的各个子带部分的频率系数mM,i(f)作为基准信号候选,进行该基准信号候选与旁残差信号的各个子带部分的频率系数sM,i(f)的ICP分析,生成第二ICP系数,并将其输出到选择单元116。
ICP分析单元115由自适应滤波器构成,其将单声道残差信号的低频部分的频率系数mL(f)作为基准信号候选,进行该基准信号候选与旁残差信号的各个子带部分的频率系数sM,i(f)的ICP分析,生成第三ICP系数,并将其输出到选择单元116。
选择单元116通过检查各个基准信号候选与旁残差信号的各个子带部分的频率系数sM,i(f)之间的关系,从基准信号候选中选择最适合的信号作为基准信号,并将表示选择出的基准信号的基准信号ID(Identification)和对应于基准信号的ICP系数输出到ICP参数量化单元117。另外,在后面叙述选择单元116的内部结构的详细的说明。
ICP参数量化单元117对从选择单元116输出的ICP系数进行量化,并对基准信号ID进行编码。对量化后的ICP系数的编码数据和对基准信号ID的编码数据被输出到复用单元118。
复用单元118将从LP分析/量化单元102输出的LP参数的编码数据、从单声道编码单元104输出的单声道信号的编码数据、从低频编码单元111输出的旁残差信号的低频部分的频率系数的编码数据、以及从ICP参数量化单元117输出的量化ICP系数编码数据与基准信号ID编码数据复用,并输出所获得的比特流。
图2是用于说明构成ICP分析单元113、114和115的自适应滤波器的结构和动作的图。在该图中,H(z)为H(z)=b0+b1(z-1)+b2(z-2)+...+bk(z-k),其表示自适应滤波器、例如FIR(Finite Impulse Response,有限脉冲响应)滤波器的模型(传递函数)。这里,k表示自适应滤波系数的阶数,b=[b0,b1,...,bk]表示自适应滤波系数。x(n)表示自适应滤波器的输入信号(基准信号),y’(n)表示自适应滤波器的输出信号(预测信号),y(n)表示自适应滤波器的目标(target)信号。例如,在ICP分析单元113中,x(n)相当于sL′(f),y(n)相当于sM,i(f)。
自适应滤波器根据下式(3)求预测信号与目标信号的均方误差(MSE)为最小的自适应滤波参数b=[b0,b1,...,bk],并将其输出。另外,在式(3)中,E{}表示整体平均运算(ensemble average operation),k表示滤波阶数,e(n)表示预测误差。
MSE ( b ) = E { [ e ( n ) ] 2 } = E { [ y ( n ) - y ′ ( n ) ] 2 } = E { [ y ( n ) - Σ i = 0 k b i x ( n - i ) ] 2 } , - - - ( 3 )
另外,在图2的H(z)中存在多个其他的结构。图3表示其中之一。图3所示的滤波器结构是以往的FIR滤波器。
图4是用于说明选择单元116中的基准信号的选择的图。在图4中,表示子带的数为2(i=0,1)的情况。另外,图4的横轴为频率,纵轴为频率系数(MDCT系数)的值,上侧为旁残差信号的频带,下侧为单声道残差信号的频带。
此时,选择单元116从第0子带部分的频率系数mM,0(f)、单声道残差信号的低频部分的频率系数mL(f)、旁残差信号的低频部分的频率系数sL′(f)中,选择预测旁残差信号的第0子带部分的频率系数sM,0(f)时的基准信号。同样地,选择单元116从第1子带部分的频率系数mM,1(f)、单声道残差信号的低频部分的频率系数mL(f)、旁残差信号的低频部分的频率系数sL′(f)中,选择预测旁残差信号的第1子带部分的频率系数sM,1(f)时的基准信号。
图5是表示本实施方式的解码装置的结构的方框图。从图1所示的编码装置100发送的比特流被图5所示的解码装置500接收。
分离单元501分离被解码装置500接收到的比特流,将LP参数的编码数据输出到LP参数解码单元512,将ICP系数编码数据和基准信号ID编码数据输出到ICP参数解码单元503,将单声道信号的编码数据输出到单声道解码单元502,并将旁残差信号的低频部分的频率系数的编码数据输出到低频解码单元507。
单声道解码单元502对单声道信号的编码数据进行解码而获得单声道信号M’和单声道残差信号M′res。单声道解码单元502将所获得的单声道残差信号M′res输出到加窗单元504,并将单声道信号M’输出到立体声信号计算单元514。
ICP参数解码单元503对ICP系数编码数据和基准信号ID编码数据进行解码,并将所获得的ICP系数和基准信号ID输出到ICP合成单元508。
加窗单元504对单声道残差信号M′res进行加窗处理,并将其输出到MDCT变换单元505。MDCT变换单元505对加窗处理后的单声道残差信号M′res进行MDCT变换,并将所获得的单声道残差信号的频率系数m′(f)输出到频谱分割单元506。
频谱分割单元506以规定的频率为边界,将单声道残差信号的频率系数m’(f)的频带分割为低频部分、中间频带部分和高频部分,并将单声道残差信号的低频部分的频率系数m’L(f)和中间频带部分的频率系数m’M(f)输出到ICP合成单元508。
低频解码单元507对旁残差信号的低频部分的频率系数的编码数据进行解码,并将所获得的旁残差信号的低频部分的频率系数sL′(f)输出到ICP合成单元508和加法单元509。
ICP合成单元508基于基准信号ID从单声道残差信号的低频部分的频率系数m’L(f)、中间频带部分的频率系数m’M(f)或旁残差信号的低频部分的频率系数sL′(f)中,选择一个作为基准信号。接着,ICP合成单元508通过由下式(4)表示的以量化ICP系数作为滤波系数的滤波处理,计算旁残差信号的各个子带部分的频率系数s’M,i(f),并将其输出到加法单元509。另外,在式(4)中,h(i)为ICP系数,X(f)为基准信号,P为ICP的阶数。
s M , i ′ ( f ) = Σ i = 0 P h ( i ) X ( f - i ) - - - ( 4 )
加法单元509结合旁残差信号的低频部分的频率系数sL′(f)和旁残差信号的各个子带部分的频率系数s′M,i(f),并将所获得的旁残差信号的频率系数s′(f)输出到IMDCT变换单元510。
IMDCT变换单元510对旁残差信号的频率系数s′(f)进行IMDCT变换,并将其输出到加窗单元511。加窗单元511对IMDCT变换单元510的输出信号进行加窗处理,并将所获得的旁残差信号S′res输出到LP合成单元513。
LP参数解码单元512对LP参数的编码数据进行解码,并将所获得的LP系数AS输出到LP合成单元513。
LP合成单元513使用LP系数AS对旁残差信号S′res进行LP合成滤波,并获得旁信号S′。
立体声信号计算单元514使用单声道信号M’和旁信号S′,通过下式(5)和式(6)获得左声道信号L’和右声道信号R’。
L′(n)=M′(n)+S′(n)   (5)
R′(n)=M′(n)-S′(n)   (6)
这样,图5的解码装置500通过对接收到的图1的编码装置100的信号进行解码处理,能够获得左声道信号L’和右声道信号R’。另外,只要使用LP参数的编码数据、ICP系数编码数据、基准信号ID编码数据、单声道信号的编码数据、以及旁残差信号的低频部分的频率系数的编码数据形成比特流,解码装置500就能够进行解码处理。也就是说,只要解码装置500接收的信号是来自可形成这样的比特流的编码装置的信号,其也可以不必是来自图1的结构的编码装置100的信号。
接着,详细地说明选择单元116的内部结构。在本实施方式中,表示基于互相关选择基准信号的情况(第一例)、以及基于预测增益选择基准信号的情况(第二例)。
图6是表示第一例中的选择单元116的内部结构的方框图。选择单元116输入旁残差信号的低频部分的频率系数sL′(f)、单声道残差信号的各个子带部分的频率系数mM,i(f)、单声道残差信号的低频部分的频率系数mL(f)、旁残差信号的各个子带部分的频率系数sM,i(f)、第一ICP系数、第二ICP系数和第三ICP系数。
相关检查单元601、602和603分别通过下式(7)计算互相关,并将作为计算结果的相关值输出到互相关比较单元604。这里,在式(7)中,X(j)表示基准信号候选中的任一个信号,在相关检查单元601中,该X(j)为单声道残差信号的各个子带部分的频率系数mM,i(f);在相关检查单元602中,该X(j)为单声道残差信号的低频部分的频率系数mL(f);在相关检查单元603中,该X(j)为旁残差信号的低频部分的频率系数sL′(f)。
corr = Σ j [ X ( j ) × s M , i ( j ) ] Σ j X ( j ) 2 Σ j s M , i ( j ) 2 - - - ( 7 )
互相关比较单元604选择相关值最高的基准信号候选作为基准信号,并将表示选择出的基准信号的基准信号ID输出到ICP系数选择单元605。
ICP系数选择单元605选择与基准信号ID对应的ICP系数,并将基准信号ID和ICP系数输出到ICP参数量化单元117。
图7是表示第二例中的选择单元116的内部结构的方框图。选择单元116输入旁残差信号的低频部分的频率系数sL′(f)、单声道残差信号的各个子带部分的频率系数mM,i(f)、单声道残差信号的低频部分的频率系数mL(f)、旁残差信号的各个子带部分的频率系数sM,i(f)、第一ICP系数、第二ICP系数和第三ICP系数。
ICP合成单元701、702和703通过上式(4)计算对应于各个基准信号的旁残差信号的各个子带部分的频率系数s’M,i(f),并分别输出到增益确认单元704、705和706。
增益确认单元704、705和706通过下式(8)计算预测增益,并将其输出到预测增益比较单元707。这里,在式(8)中,e(n)=sM,i(f)-s’M,i(f)。式(8)中的预测增益Gain越高,则预测性能越好。
Gain = 10 log 10 Σ s M , i 2 ( n ) Σ e 2 ( n ) - - - ( 8 )
预测增益比较单元707比较预测增益,选择预测增益最高的基准信号候选作为基准信号,并将表示选择出的基准信号的基准信号ID输出到ICP系数选择单元708。
ICP系数选择单元708选择与基准信号ID对应的ICP系数,并将基准信号ID和ICP系数输出到ICP参数量化单元117。
如上所述,根据本实施方式,从多个信号中选择带来最佳预测结果的信号作为基准信号,通过使用基准信号预测旁信号的残差信号,能够改善立体声语音编码中的ICP的预测性能。
另外,在上述第二例中,也可以将量化后的ICP系数用于ICP合成。此时,取代量化前的ICP系数,由ICP系数量化器量化后的量化ICP系数输入到选择单元116。ICP合成单元701、702和703使用量化ICP系数对旁信号进行解码。基于量化ICP系数的预测结果比较预测增益。在该变化中,通过使用在解码装置中使用的量化ICP系数进行预测,能够选择最适合的基准信号。
(实施方式2)
本发明的实施方式2说明在比较互相关后计算ICP系数的情况。图8是表示本实施方式的编码装置的结构的方框图。另外,在图8中,对与图1共用的结构部分附加与图1相同的标号,并省略其说明。图8所示的编码装置800与图1所示的编码装置100比较,采用删除了ICP分析单元113、114和115以及选择单元116,并追加了选择单元801和ICP分析单元802的结构。
选择单元801通过检查各个基准信号候选与旁残差信号的各个子带部分的频率系数sM,i(f)之间的关系,从基准信号候选中选择最适合的信号作为基准信号,并将表示选择出的基准信号的基准信号ID输出到ICP分析单元802。
ICP分析单元802由自适应滤波器构成,其使用基准信号和旁残差信号的各个子带部分的频率系数sM,i(f)进行ICP分析,生成ICP系数,并将其输出到ICP参数量化单元117。
图9是表示选择单元801的内部结构的方框图。图9所示的选择单元801的内部结构与图6所示的选择单元116的内部结构比较,其删除了ICP系数选择单元605。
互相关比较单元604选择相关值最高的基准信号候选作为基准信号,并将表示选择出的基准信号的基准信号ID输出到ICP分析单元802。
这样,根据本实施方式,因为能够在比较互相关后计算ICP系数,所以能够获得与实施方式1相同的效果,并且与实施方式1相比能够削减计算量。
(实施方式3)
实施方式3说明作为对以往的ICP的修正版的修正ICP。修正ICP解决使用长度与目标信号不同的基准信号进行预测的方法的问题。
图10是用于说明本实施方式的修正ICP中的预测方法的图。另外,将本实施方式中的修正ICP的方法称为“复制法”。在图10中,以N1表示基准信号X(f)(矢量)的长度,以N2表示目标信号的长度。X(j)表示基准信号候选中的任一个信号。
在修正ICP中,考虑以下的两个情况。
1.N1=N2的情况
此时,编码装置使用以往ICP计算ICP系数。在任何种类的基准信号中都可能发生该情况。
2.N1<N2或N1>N2的情况
此时,编码装置基于原来的基准信号X(f)生成长度为N2的新的基准信号X-(f),使用新的基准信号X-(f)预测目标信号,并计算ICP系数。然后,解码装置使用与编码装置相同的方法生成X-(f)。在选择了低频旁信号或低频单声道信号作为基准信号时产生该情况。这些信号的长度有可能短于目标信号,也有可能长于目标信号。
本实施方式的复制法解决上述情况2的问题。复制法中有以下的两个阶段。
步骤1:在N1<N2的情况下,如图10所示,将矢量X(f)的前端部的(N2-N1)点复制到矢量X(f)(长度N1)的最后而生成新的矢量X-(f)。另外,在N1>N2的情况下,复制矢量X(f)的最初的N2点而生成新的矢量X-(f)。X(f)是长度为N2的新的基准矢量。
步骤2:使用ICP算法,基于矢量X-(f)预测目标信号sM,i(f)。
这样,根据本实施方式的修正ICP,无论基准信号的长度如何,都能够使目标信号的子带长度可变,并能够使用长度与目标信号不同的基准信号进行预测。也就是说,无需将所有的子带分割为与基准信号相同的固定长度。因为频带的低频部分对语音质量造成的影响较大,所以将低频的子带分割为更短的长度,相反地越是重要性相对低的较高的频率的子带,越是将其分割为更大的长度,通过以该分割频带为单位进行预测,能够实现可扩展立体声语音编码中的编码效率的提高和音质的提高。
另外,在选择低频旁信号作为基准信号时,在以往的ICP中,需要对长度与预测对象的子带相同的基准信号进行编码并将其发送到解码器。另一方面,在本实施方式的修正ICP中,能够使用带宽比对象的子带短的基准信号进行预测,取代对较长的基准信号进行编码,仅对较短的基准信号进行编码即可。因此,本实施方式的修正ICP能够以低比特率将基准信号传输到解码器。
(实施方式4)
在实施方式4中,说明实施方式3的情况2时(N1<N2或N1>N2)的替代方法。本实施方式的修正ICP中的预测方法使用较短的基准矢量内的点的值,通过插值扩展新的基准矢量,或将基准矢量缩短为更短的矢量。另外,将本实施方式的修正ICP中的方法称为“扩展/缩小法”。
本实施方式的扩展/缩小法中有以下的两个阶段。
步骤1:在N1<N2的情况下,如图11所示,通过下式(9)将矢量X(f)(长度N1)扩展为长度N2的矢量X-(f)。
Figure GPA00001118632000151
此时,将最近插值法、线性插值法、立体声样条(spline)插值法、拉格朗日(Lagrange)插值法等各种插值法中的任一个适用于X-(f),求矢量X-(f)的欠缺点的值。另外,在N1>N2的情况下,通过下式(10)将矢量X(f)(长度N1)缩小为长度N2的矢量X-(f)。
Figure GPA00001118632000152
步骤2:使用ICP算法,基于矢量X-(f)预测目标信号sM,i(f)。
(实施方式5)
在实施方式5中,说明实施方式3和4的替代方法(相对于N1<N2或N1>N2的情况的方法)。本实施方式的修正ICP中的预测方法使用长期预测求基准信号和目标信号内的周期。通过基于所获得的周期复制原来的基准信号的几个周期,生成新的基准信号。
本实施方式的方法中有以下的两个阶段。
步骤1:连结基准信号X(f)与目标信号sM,i(f)而获得连续的矢量XL(f)。假设矢量XL(f)内存在周期。通过使下式(11)的误差err最小化求周期T。另外,也能够通过使用自相关法、振幅差函数(magnitude difference function,参照非专利文献5)等其他周期计算算法来求周期T。
err = Σ j = N 1 N 1 + N 2 ( X ^ ( j ) - X L ( j ) ) 2 - - - ( 11 )
此处, X ^ ( j ) = b × X L ( j - T ) , b = Σ N 1 + N 2 X L ( j ) × X L ( j - T ) Σ N 1 + N 2 X L 2 ( j - T ) .
在T>min[N1,N2]的情况下,设T=min[N1,N2]。基于T,从X(f)将长度为T的信号复制一次或数次而获得长度N2的新的基准信号X-(f)。
步骤2:使用ICP算法,基于矢量X-(f)预测目标信号sM,i(f)。
另外,在使用本实施方式的方法时,需要将周期T的信息传输到解码装置。
此外,在实施方式3、4和5的说明中,在选择单声道残差信号的低频部分作为基准信号时,使用上述实施方式中的任一个方法生成扩展了单声道残差信号长度的基准信号后进行预测,但除此以外,本发明也可以通过包含单声道残差信号的中间频带生成期望长度的基准信号。此情况相当于实施方式3所记载的情况1(N1=N2的情况)。
另外,在实施方式3、4和5中,在将旁残差信号的中间频带分割为子带进行预测时,从低频侧的子带向高频侧的子带依次进行预测,由此在选择旁残差信号的低频部分作为基准信号的情况下,也可以使用先行完成了预测的低频侧的子带的信号,生成期望长度的基准信号。
以上,说明了本发明的实施方式。
在ICP中,从多个信号中选择带来最佳预测结果的信号作为基准信号,并使用基准信号预测旁信号的残差信号,所以本发明的方法可以称为“自适应声道预测(ACP:Adaptive Channel Prediction)”。通过使用该本发明的ACP,能够提高可扩展的立体声语音编码中的ICP的预测性能。
另外,在单声道信号编码器/解码器为MDCT变换等的变换编码器时,MDCT区域的解码后的单声道信号(或解码后的单声道LP残差信号)在编码器侧能够直接从单声道编码器获得,而在解码器侧能够直接从单声道解码器获得。
另外,上述各个实施方式所示的编码方式使用单声道信号预测旁信号(称为M-S类型)。也可以使用单声道信号预测左或右信号。此时的动作在上述各实施方式中,除了以左或右声道替换旁声道(将L或R视为S),并对左(或右)声道信号进行编码以外,与M-S方式的处理大致相同。此时,在编码侧进行编码所得的声道(左或右声道)的另一方声道(右或左声道)的信号在解码器中,能够使用解码后的声道信号(左或右声道信号)和单声道信号,并根据下式(12)和式(13)的方式来计算。另外,也可以与上述各个实施方式中的旁信号同样地,一起对两个声道(L和R)进行编码。
R(n)=2M(n)-L(n)(编码对象为左(L)声道时)(12)
L(n)=2M(n)-R(n)(编码对象为右(R)声道时)(13)
另外,本发明也可以使用所述信号的加权和信号(将三种信号乘以规定的加权系数后相加所得的信号)作为上述各个实施方式中的基准信号候选。另外,本发明无需使用三个基准信号候选的全部,例如也可以仅将中间频带的单声道信号和低频的旁信号的两种信号作为候选等。由此,能够减少发送基准信号ID的比特数。
另外,在上述各个实施方式中,以帧为单位进行旁信号的预测。这意味着根据其他频带上的相同帧中的信号预测中间频带的信号。取而代之或除此以外,也可以使用帧间的预测。例如,可以使用已经过去的帧作为基准候选来预测当前的帧信号。
另外,在上述各个实施方式中,说明了作为预测对象的目标信号是去除了低频和高频的中间频带的旁信号,但不限于此,作为目标信号,也可以包含包括中间频带和高频的、除了低频以外的所有的信号频带。而且,也可以将包含低频的所有的信号频带作为对象。即使在这些情况下,仍可以将旁信号的任意频带分割为较小的子带进行预测。由此,编码器和解码器的结构不发生变化。
另外,本发明也可以适用于时域的信号。例如,也可以从时域的(例如由QMF(Quadrature Mirror Filter,正交镜像滤波器)获得的)几个子带信号中选择基准信号,预测时域的中间(或高)频带信号。
另外,以上的说明为本发明的优选实施方式的例证,本发明的范围不限于此。只要是具有编码装置、解码装置的系统,则本发明能够适用于任何情况。
另外,本发明的编码装置和解码装置例如可以作为语音编码装置和语音解码装置等装载在移动通信系统的通信终端装置和基站装置中,由此能够提供具有与上述相同的作用效果的通信终端装置、基站装置和移动通信系统。
另外,虽然这里以用硬件构成本发明的情况为例进行了说明,但是本发明也可以用软件实现。例如,通过编程语言对本发明的算法进行记述,并在内存中保存该程序并通过信息处理装置来实行,从而能够实现与本发明的编码装置/解码装置相同的功能。
另外,用于上述实施方式的说明中的各功能块通常作为集成电路即LSI来实现。这些块既可以单独地集成为一个芯片,也可以包含一部分或全部地集成为一个芯片。
另外,虽然此处称为LSI,但根据集成程度,也可以称为IC、系统LSI、超大LSI(Super LSI)、特大LSI(Ultra LSI)等。
另外,实现集成电路化的方法不仅限于LSI,也可使用专用电路或通用处理器来实现。也可以使用可在LSI制造后编程的FPGA(Field ProgrammableGate Array:现场可编程门阵列),或者可重构LSI内部的电路单元的连接和设定的可重构处理器(Reconfigurable Processor)。
再者,随着半导体的技术进步或随之派生的其它技术的出现,如果能够出现替代LSI的集成电路化的新技术,当然可利用该新技术进行功能块的集成化。还存在着适用生物技术等的可能性。
2007年10月31日提交的特愿第2007-284622号的日本专利申请所包含的说明书、附图以及说明书摘要的公开内容全部引用于本申请。
工业实用性
本发明的编码装置和解码装置适合用于移动电话、IP电话、视频会议等。
权利要求书(按照条约第19条的修改)
1.编码装置,包括:
单声道信号生成单元,合成立体声信号的第一声道信号和第二声道信号而生成单声道信号,并生成作为所述第一声道信号与所述第二声道信号之间的差分的旁信号;
旁残差信号取得单元,取得作为对所述旁信号的线性预测残差信号的旁残差信号;
单声道残差信号取得单元,取得作为对所述单声道信号的线性预测残差信号的单声道残差信号;
第一频谱分割单元,将所述旁残差信号分割为低于规定频率的频带即低频部分和高于所述规定频率的频带即中间频带部分;
第二频谱分割单元,将所述单声道残差信号分割为低于所述规定频率的频带即低频部分和高于所述规定频率的频带即中间频带部分;
选择单元,将所述旁残差信号的低频部分的频率系数、所述单声道残差信号的中间频带部分的频率系数、以及所述单声道残差信号的低频部分的频率系数作为基准信号候选,并将所述旁残差信号的中间频带部分的频率系数作为目标信号,通过检查所述各个基准信号候选与所述目标信号之间的关系,从所述基准信号候选中选择最适合的信号作为基准信号;以及
声道间预测分析单元,进行所述基准信号与所述目标信号的声道间预测分析而获得声道间预测系数。
2.如权利要求1所述的编码装置,所述选择单元比较所述各个基准信号候选与所述目标信号之间的互相关,并选择相关值最高的基准信号候选作为基准信号。
3.如权利要求1所述的编码装置,所述选择单元比较所述各个基准信号候选与所述目标信号之间的预测增益,并选择预测增益值最高的基准信号候选作为基准信号。
4.如权利要求1所述的编码装置,所述第一频谱分割单元将所述旁残差信号的中间频带部分分割为更小的子带部分,
所述第二频谱分割单元将所述单声道残差信号的中间频带部分分割为更小的子带部分,
所述选择单元对每个子带部分选择基准信号。
5.如权利要求1所述的编码装置,在所述基准信号和所述目标信号的长度不同时,所述声道间预测分析单元复制所述基准信号的一部分或仅提取一部分而使长度匹配,并进行声道间预测分析。
6.如权利要求1所述的编码装置,在所述基准信号和所述目标信号的长度不同时,所述声道间预测分析单元扩展或缩小基准信号而使长度匹配,并进行声道间预测分析。
7.如权利要求1所述的编码装置,在所述基准信号和所述目标信号的长度不同时,所述声道间预测分析单元求所述基准信号或所述目标信号的周期,通过以周期为单位进行复制而使长度匹配,并进行声道间预测分析。
8.解码装置,包括:
声道间预测参数解码单元,对表示从旁残差信号的低于规定频率的频带即低频部分的频率系数、单声道残差信号的高于所述规定频率的频带即中间频带部分的频率系数、以及所述单声道残差信号的低于所述规定频率的频带即低频部分的频率系数中选择出的基准信号的基准信号ID进行解码,并且对通过进行所述旁残差信号的高于所述规定频率的频带即中间频带部分的频率系数与所述基准信号的声道间预测分析所获得的声道间预测系数进行解码,所述旁残差信号是对作为立体声信号的第一声道信号与第二声道信号之间的差分的旁信号的线性预测残差信号,所述单声道残差信号是对合成所述第一声道信号和所述第二声道信号而生成的单声道信号的线性预测残差信号;
声道间预测合成单元,将所述声道间预测系数作为滤波系数,并对所述基准信号进行滤波处理,从而计算所述旁残差信号的所述中间频带部分的频率系数;
加法单元,将所述旁残差信号的所述低频部分的频率系数与所述旁残差信号的所述中间频带部分的频率系数相加,获得所述旁残差信号的整个频带的频率系数;
变换单元,从所述旁残差信号的整个频带的频率系数变换成时域的旁残差信号;
线性预测合成单元,对所述时域的旁残差信号进行线性预测合成滤波,并获得所述旁信号;以及
立体声信号计算单元,使用所述单声道信号和所述旁信号,获得所述第一声道信号和所述第二声道信号。
9.编码方法,包括:
单声道信号生成步骤,合成立体声信号的第一声道信号和第二声道信号而生成单声道信号,并生成作为所述第一声道信号与所述第二声道信号之间的差分的旁信号;
旁残差信号取得步骤,取得作为对所述旁信号的线性预测残差信号的旁残差信号;
单声道残差信号取得步骤,取得作为对所述单声道信号的线性预测残差信号的单声道残差信号;
第一频谱分割步骤,将所述旁残差信号分割为低于规定频率的频带即低频部分和高于所述规定频率的频带即中间频带部分;
第二频谱分割步骤,将所述单声道残差信号分割为低于所述规定频率的频带即低频部分和高于所述规定频率的频带即中间频带部分;
选择步骤,将所述旁残差信号的低频部分的频率系数、所述单声道残差信号的中间频带部分的频率系数、以及所述单声道残差信号的低频部分的频率系数作为基准信号候选,并将所述旁残差信号的中间频带部分的频率系数作为目标信号,通过检查所述各个基准信号候选与所述目标信号之间的关系,从所述基准信号候选中选择最适合的信号作为基准信号;以及
声道间预测分析步骤,进行所述基准信号与所述目标信号的声道间预测分析而获得声道间预测系数。
10.解码方法,包括:
声道间预测参数解码步骤,对表示从旁残差信号的低于规定频率的频带即低频部分的频率系数、单声道残差信号的高于所述规定频率的频带即中间频带部分的频率系数、以及所述单声道残差信号的低于所述规定频率的频带即低频部分的频率系数中选择出的基准信号的基准信号ID进行解码,并且对通过进行所述旁残差信号的高于所述规定频率的频带即中间频带部分的频率系数与所述基准信号的声道间预测分析所获得的声道间预测系数进行解码,所述旁残差信号是对作为立体声信号的第一声道信号与第二声道信号之间的差分的旁信号的线性预测残差信号,所述单声道残差信号是对合成所述第一声道信号和所述第二声道信号而生成的单声道信号的线性预测残差信号;
声道间预测合成步骤,将所述声道间预测系数作为滤波系数,并对所述基准信号进行滤波处理,从而计算所述旁残差信号的所述中间频带部分的频率系数;
加法步骤,将所述旁残差信号的所述低频部分的频率系数与所述旁残差信号的所述中间频带部分的频率系数相加,获得所述旁残差信号的整个频带的频率系数;
变换步骤,从所述旁残差信号的整个频带的频率系数变换成时域的旁残差信号;
线性预测合成步骤,对所述时域的旁残差信号进行线性预测合成滤波,并获得所述旁信号;以及
立体声信号计算步骤,使用所述单声道信号和所述旁信号,获得所述第一声道信号和所述第二声道信号。

Claims (10)

1.编码装置,包括:
单声道信号生成单元,合成立体声信号的第一声道信号和第二声道信号而生成单声道信号,并生成作为所述第一声道信号与所述第二声道信号之间的差分的旁信号;
旁残差信号取得单元,取得作为对所述旁信号的线性预测残差信号的旁残差信号;
单声道残差信号取得单元,取得作为对所述单声道信号的线性预测残差信号的单声道残差信号;
第一频谱分割单元,将所述旁残差信号分割为低于规定频率的频带即低频部分和高于所述规定频率的频带即中间频带部分;
第二频谱分割单元,将所述单声道残差信号分割为低于所述规定频率的频带即低频部分和高于所述规定频率的频带即中间频带部分;
选择单元,将所述旁残差信号的低频部分的频率系数、所述单声道残差信号的中间频带部分的频率系数、以及所述单声道残差信号的低频部分的频率系数作为基准信号候选,并将所述旁残差信号的中间频带部分的频率系数作为目标信号,通过检查所述各个基准信号候选与所述目标信号之间的关系,从所述基准信号候选中选择最适合的信号作为基准信号;以及
声道间预测分析单元,进行所述基准信号与所述目标信号的声道间预测分析而获得声道间预测系数。
2.如权利要求1所述的编码装置,所述选择单元比较所述各个基准信号候选与所述目标信号之间的互相关,并选择相关值最高的基准信号候选作为基准信号。
3.如权利要求1所述的编码装置,所述选择单元比较所述各个基准信号候选与所述目标信号之间的预测增益,并选择预测增益值最高的基准信号候选作为基准信号。
4.如权利要求1所述的编码装置,所述第一频谱分割单元将所述旁残差信号的中间频带部分分割为更小的子带部分,
所述第二频谱分割单元将所述单声道残差信号的中间频带部分分割为更小的子带部分,
所述选择单元对每个子带部分选择基准信号。
5.如权利要求1所述的编码装置,在所述基准信号和所述目标信号的长度不同时,所述声道间预测分析单元复制所述基准信号的一部分或仅提取一部分而使长度匹配,并进行声道间预测分析。
6.如权利要求1所述的编码装置,在所述基准信号和所述目标信号的长度不同时,所述声道间预测分析单元扩展或缩小基准信号而使长度匹配,并进行声道间预测分析。
7.如权利要求1所述的编码装置,在所述基准信号和所述目标信号的长度不同时,所述声道间预测分析单元求所述基准信号或所述目标信号的周期,通过以周期为单位进行复制而使长度匹配,并进行声道间预测分析。
8.解码装置,包括:
声道间预测合成单元,从旁残差信号的低于规定频率的频带即低频部分的频率系数、单声道残差信号的高于所述规定频率的频带即中间频带部分的频率系数、以及所述单声道残差信号的低于所述规定频率的频带即低频部分的频率系数中选择基准信号,将通过进行所述旁残差信号的高于所述规定频率的频带即中间频带部分的频率系数与所述基准信号的声道间预测分析所获得的声道间预测系数作为滤波系数,对所述基准信号进行滤波处理,从而计算所述旁残差信号的所述中间频带部分的频率系数,所述旁残差信号是对作为立体声信号的第一声道信号与第二声道信号之间的差分的旁信号的线性预测残差信号,所述单声道残差信号是对合成所述第一声道信号和所述第二声道信号而生成的单声道信号的线性预测残差信号;
加法单元,将所述旁残差信号的所述低频部分的频率系数与所述旁残差信号的所述中间频带部分的频率系数相加,获得所述旁残差信号的整个频带的频率系数;
线性预测合成单元,对所述旁残差信号进行线性预测合成滤波,并获得所述旁信号;以及
立体声信号计算单元,使用所述单声道信号和所述旁信号,获得所述第一声道信号和所述第二声道信号。
9.编码方法,包括:
单声道信号生成步骤,合成立体声信号的第一声道信号和第二声道信号而生成单声道信号,并生成作为所述第一声道信号与所述第二声道信号之间的差分的旁信号;
旁残差信号取得步骤,取得作为对所述旁信号的线性预测残差信号的旁残差信号;
单声道残差信号取得步骤,取得作为对所述单声道信号的线性预测残差信号的单声道残差信号;
第一频谱分割步骤,将所述旁残差信号分割为低于规定频率的频带即低频部分和高于所述规定频率的频带即中间频带部分;
第二频谱分割步骤,将所述单声道残差信号分割为低于所述规定频率的频带即低频部分和高于所述规定频率的频带即中间频带部分;
选择步骤,将所述旁残差信号的低频部分的频率系数、所述单声道残差信号的中间频带部分的频率系数、以及所述单声道残差信号的低频部分的频率系数作为基准信号候选,并将所述旁残差信号的中间频带部分的频率系数作为目标信号,通过检查所述各个基准信号候选与所述目标信号之间的关系,从所述基准信号候选中选择最适合的信号作为基准信号;以及
声道间预测分析步骤,进行所述基准信号与所述目标信号的声道间预测分析而获得声道间预测系数。
10.解码方法,包括:
声道间预测合成步骤,从旁残差信号的低于规定频率的频带即低频部分的频率系数、单声道残差信号的高于所述规定频率的频带即中间频带部分的频率系数、以及所述单声道残差信号的低于所述规定频率的频带即低频部分的频率系数中选择基准信号,将通过进行所述旁残差信号的高于所述规定频率的频带即中间频带部分的频率系数与所述基准信号的声道间预测分析所获得的声道间预测系数作为滤波系数,对所述基准信号进行滤波处理,从而计算所述旁残差信号的所述中间频带部分的频率系数,所述旁残差信号是对作为立体声信号的第一声道信号与第二声道信号之间的差分的旁信号的线性预测残差信号,所述单声道残差信号是对合成所述第一声道信号和所述第二声道信号而生成的单声道信号的线性预测残差信号;
加法步骤,将所述旁残差信号的所述低频部分的频率系数与所述旁残差信号的所述中间频带部分的频率系数相加,获得所述旁残差信号的整个频带的频率系数;
线性预测合成步骤,对所述旁残差信号进行线性预测合成滤波,并获得所述旁信号;以及
立体声信号计算步骤,使用所述单声道信号和所述旁信号,获得所述第一声道信号和所述第二声道信号。
CN2008801137288A 2007-10-31 2008-10-31 编码装置和解码装置 Expired - Fee Related CN101842832B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP284622/07 2007-10-31
JP2007284622 2007-10-31
PCT/JP2008/003151 WO2009057327A1 (ja) 2007-10-31 2008-10-31 符号化装置および復号装置

Publications (2)

Publication Number Publication Date
CN101842832A true CN101842832A (zh) 2010-09-22
CN101842832B CN101842832B (zh) 2012-11-07

Family

ID=40590731

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801137288A Expired - Fee Related CN101842832B (zh) 2007-10-31 2008-10-31 编码装置和解码装置

Country Status (5)

Country Link
US (1) US8374883B2 (zh)
EP (1) EP2209114B1 (zh)
JP (1) JP5413839B2 (zh)
CN (1) CN101842832B (zh)
WO (1) WO2009057327A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107134280A (zh) * 2013-09-12 2017-09-05 杜比国际公司 多声道音频内容的编码
WO2019227991A1 (zh) * 2018-05-31 2019-12-05 华为技术有限公司 立体声信号的编码方法和装置
CN110719564A (zh) * 2018-07-13 2020-01-21 青岛海信电器股份有限公司 音效处理方法和装置

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8359196B2 (en) * 2007-12-28 2013-01-22 Panasonic Corporation Stereo sound decoding apparatus, stereo sound encoding apparatus and lost-frame compensating method
US8140723B2 (en) * 2008-11-04 2012-03-20 Renesas Electronics America Inc. Digital I/O signal scheduler
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
CN102598124B (zh) 2009-10-30 2013-08-28 松下电器产业株式会社 编码装置、解码装置及其方法
US9240192B2 (en) 2010-07-06 2016-01-19 Panasonic Intellectual Property Corporation Of America Device and method for efficiently encoding quantization parameters of spectral coefficient coding
EP2609592B1 (en) * 2010-08-24 2014-11-05 Dolby International AB Concealment of intermittent mono reception of fm stereo radio receivers
JP5841147B2 (ja) * 2011-07-01 2016-01-13 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 受信装置、送信装置、設定方法、及び特定方法
US9779731B1 (en) * 2012-08-20 2017-10-03 Amazon Technologies, Inc. Echo cancellation based on shared reference signals
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
WO2014126689A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for controlling the inter-channel coherence of upmixed audio signals
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
US10147441B1 (en) 2013-12-19 2018-12-04 Amazon Technologies, Inc. Voice controlled system
US10475457B2 (en) 2017-07-03 2019-11-12 Qualcomm Incorporated Time-domain inter-channel prediction
US10734001B2 (en) * 2017-10-05 2020-08-04 Qualcomm Incorporated Encoding or decoding of audio signals

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
JP3343962B2 (ja) * 1992-11-11 2002-11-11 ソニー株式会社 高能率符号化方法及び装置
DE4320990B4 (de) 1993-06-05 2004-04-29 Robert Bosch Gmbh Verfahren zur Redundanzreduktion
DE19526366A1 (de) 1995-07-20 1997-01-23 Bosch Gmbh Robert Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
US6463410B1 (en) * 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
JP4367455B2 (ja) * 1998-10-13 2009-11-18 日本ビクター株式会社 音声信号伝送方法及び音声信号復号方法
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7191136B2 (en) * 2002-10-01 2007-03-13 Ibiquity Digital Corporation Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband
JP4195598B2 (ja) * 2002-10-31 2008-12-10 日本電信電話株式会社 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム
CN100546233C (zh) * 2003-04-30 2009-09-30 诺基亚公司 用于支持多声道音频扩展的方法和设备
ATE474310T1 (de) * 2004-05-28 2010-07-15 Nokia Corp Mehrkanalige audio-erweiterung
ATE442644T1 (de) * 2004-08-26 2009-09-15 Panasonic Corp Mehrkanalige signal-dekodierung
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
JP4977471B2 (ja) * 2004-11-05 2012-07-18 パナソニック株式会社 符号化装置及び符号化方法
US20080162148A1 (en) * 2004-12-28 2008-07-03 Matsushita Electric Industrial Co., Ltd. Scalable Encoding Apparatus And Scalable Encoding Method
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
JP4809370B2 (ja) 2005-02-23 2011-11-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル音声符号化における適応ビット割り当て
EP1876585B1 (en) * 2005-04-28 2010-06-16 Panasonic Corporation Audio encoding device and audio encoding method
JP4948401B2 (ja) * 2005-05-31 2012-06-06 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
WO2007026763A1 (ja) * 2005-08-31 2007-03-08 Matsushita Electric Industrial Co., Ltd. ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法
WO2007052612A1 (ja) * 2005-10-31 2007-05-10 Matsushita Electric Industrial Co., Ltd. ステレオ符号化装置およびステレオ信号予測方法
US20090276210A1 (en) * 2006-03-31 2009-11-05 Panasonic Corporation Stereo audio encoding apparatus, stereo audio decoding apparatus, and method thereof
JP4989095B2 (ja) * 2006-04-06 2012-08-01 日本電信電話株式会社 マルチチャネル符号化方法、その装置、そのプログラム及び記録媒体
JP4399832B2 (ja) * 2006-07-07 2010-01-20 日本ビクター株式会社 音声符号化方法、音声復号化方法及び音声信号伝送方法
DE102006055737A1 (de) * 2006-11-25 2008-05-29 Deutsche Telekom Ag Verfahren zur skalierbaren Codierung von Stereo-Signalen

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107134280A (zh) * 2013-09-12 2017-09-05 杜比国际公司 多声道音频内容的编码
CN107134280B (zh) * 2013-09-12 2020-10-23 杜比国际公司 多声道音频内容的编码
US11410665B2 (en) 2013-09-12 2022-08-09 Dolby International Ab Methods and apparatus for decoding encoded audio signal(s)
US11776552B2 (en) 2013-09-12 2023-10-03 Dolby International Ab Methods and apparatus for decoding encoded audio signal(s)
WO2019227991A1 (zh) * 2018-05-31 2019-12-05 华为技术有限公司 立体声信号的编码方法和装置
CN110719564A (zh) * 2018-07-13 2020-01-21 青岛海信电器股份有限公司 音效处理方法和装置
CN110719564B (zh) * 2018-07-13 2021-06-08 海信视像科技股份有限公司 音效处理方法和装置

Also Published As

Publication number Publication date
EP2209114B1 (en) 2014-05-14
EP2209114A4 (en) 2011-09-28
CN101842832B (zh) 2012-11-07
JPWO2009057327A1 (ja) 2011-03-10
JP5413839B2 (ja) 2014-02-12
EP2209114A1 (en) 2010-07-21
US8374883B2 (en) 2013-02-12
WO2009057327A1 (ja) 2009-05-07
US20100250244A1 (en) 2010-09-30

Similar Documents

Publication Publication Date Title
CN101842832B (zh) 编码装置和解码装置
RU2764287C1 (ru) Способ и система для кодирования левого и правого каналов стереофонического звукового сигнала с выбором между моделями двух и четырех подкадров в зависимости от битового бюджета
US8862463B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
CN101253557B (zh) 立体声编码装置及立体声编码方法
KR101139172B1 (ko) 스케일러블 음성 및 오디오 코덱들에서 양자화된 mdct 스펙트럼에 대한 코드북 인덱스들의 인코딩/디코딩을 위한 기술
RU2459282C2 (ru) Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра
KR100415356B1 (ko) 다중 채널 신호 인코딩 및 디코딩 방법 및 장치
CN103180899B (zh) 立体声信号的编码装置、解码装置、编码方法及解码方法
CN113223540B (zh) 在声音信号编码器和解码器中使用的方法、设备和存储器
US20080091440A1 (en) Sound Encoder And Sound Encoding Method
EP1801783B1 (en) Scalable encoding device, scalable decoding device, and method thereof
CN101128866A (zh) 多声道音频编码中的优化保真度和减少的信令
JP4555299B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
US20110004466A1 (en) Stereo signal encoding device, stereo signal decoding device and methods for them
US8036390B2 (en) Scalable encoding device and scalable encoding method
JP5355387B2 (ja) 符号化装置および符号化方法
CN101572088A (zh) 立体声编解码方法、编解码器及编解码系统
WO2010016270A1 (ja) 量子化装置、符号化装置、量子化方法及び符号化方法
US8024187B2 (en) Pulse allocating method in voice coding
Bhatt Implementation and overall performance evaluation of CELP based GSM AMR NB coder over ABE
KR100718487B1 (ko) 디지털 음성 코더들에서의 고조파 잡음 가중
JP2004348120A (ja) 音声符号化装置、音声復号化装置及びこれらの方法
CN102576539B (zh) 编码装置、通信终端装置、基站装置以及编码方法
MXPA98010783A (en) Audio signal encoder, audio signal decoder, and method for encoding and decoding audio signal

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20140718

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140718

Address after: California, USA

Patentee after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Osaka Japan

Patentee before: Matsushita Electric Industrial Co.,Ltd.

TR01 Transfer of patent right

Effective date of registration: 20170605

Address after: Delaware

Patentee after: III Holdings 12 LLC

Address before: California, USA

Patentee before: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121107

CF01 Termination of patent right due to non-payment of annual fee