CN101996637B - 长期预测编码和长期预测解码的方法和装置 - Google Patents

长期预测编码和长期预测解码的方法和装置 Download PDF

Info

Publication number
CN101996637B
CN101996637B CN2010105102681A CN201010510268A CN101996637B CN 101996637 B CN101996637 B CN 101996637B CN 2010105102681 A CN2010105102681 A CN 2010105102681A CN 201010510268 A CN201010510268 A CN 201010510268A CN 101996637 B CN101996637 B CN 101996637B
Authority
CN
China
Prior art keywords
multiplier
frame
sign indicating
indicating number
time delay
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2010105102681A
Other languages
English (en)
Other versions
CN101996637A (zh
Inventor
守谷健弘
原田登
镰本优
西本卓也
嵯峨山茂树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Original Assignee
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, University of Tokyo NUC filed Critical Nippon Telegraph and Telephone Corp
Publication of CN101996637A publication Critical patent/CN101996637A/zh
Application granted granted Critical
Publication of CN101996637B publication Critical patent/CN101996637B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

长期预测编码和长期预测解码的方法和装置。一种长期预测编码方法,从输入样本时间系列信号的当前样本中减去相乘结果而得到误差信号样本,该相乘结果通过对从输入样本时间系列信号的当前样本开始时间延迟的过去样本乘以乘数而得到,包括:(a)对每个帧选择下列四种方法之一的步骤,(1)对帧将乘数码和时间延迟码输出一次,(2)对帧分割成的多个副帧的每个副帧输出乘数码,(3)对帧分割成的多个副帧的每个副帧输出时间延迟码,(4)对帧分割成的多个副帧的每个副帧输出乘数码和时间延迟码,以使切换码和辅助码以及波形码的组合的综合码量最小或编码失真最小,以及(b)输出所述切换码和辅助码以及波形码的组合的步骤。

Description

长期预测编码和长期预测解码的方法和装置
本发明是以下专利申请的分案申请:申请号:200680001552.8,申请日:2006.1.11,发明名称:长期预测编码方法、长期预测解码方法、装置、其程序及记录介质
技术领域
本发明涉及利用声音信号的时间系列信号的长期预测系数,即音调(pitch)的周期(时间延迟)τ以及增益ρ,将该时间系列信号压缩为较少比特数的编码方法、其解码方法、装置、其程序及记录介质,特别涉及对不允许失真的编码有效的技术。
背景技术
在电话声音信号的编码中进行用于利用每个音调周期的波形的类似性的长期预测。电话声音信号的编码在无线通信等中被使用的可能性高,所以在对于音调预测的参数τ、ρ进行编码的码中使用了一定的(固定的)码长度。而且,在不允许音响信号的失真的编码中,作为使用利用了与离开的样本的相关的预测的方法,例如已知专利文献1。这虽然存在高效率编码装置和高效率编码解码装置,但是这里对于乘数ρ、或时间延迟的参数τ来说,也被编码为固定长度码。
专利文献1:日本特许第3218630号
发明内容
在以往的声音信号编码中,由于将长期预测系数,即音调周期(时间延迟)τ或增益(乘数)ρ编码为固定长度(一定的长度)的码,所以在提高压缩效率方面存在限制。
本发明的目的是提供与以往的声音信号编码方法相比能够进一步提高压缩效率的长期预测编码方法、解码方法以及它们的装置。
技术方案1、一种长期预测编码方法,从输入样本时间系列信号的当前样本中减去相乘结果而得到误差信号样本,该相乘结果通过对从所述输入样本时间系列信号的所述当前样本开始时间延迟的过去样本乘以乘数而得到,所述长期预测编码方法包括:
(a)对每个帧选择下列四种方法之一的步骤,
(1)对所述帧将乘数码和时间延迟码输出一次,
(2)对所述帧分割成的多个副帧的每个副帧输出乘数码,
(3)对所述帧分割成的多个副帧的每个副帧输出时间延迟码,
(4)对所述帧分割成的多个副帧的每个副帧输出乘数码和时间延迟码,
以使切换码和辅助码以及波形码的组合的综合码量最小或编码失真最小,所述切换码表示所选择的四种方法之一,所述辅助码通过编码时间延迟和乘数而得到,所述波形码通过编码误差信号样本而得到;以及
(b)输出所述切换码和辅助码以及波形码的组合的步骤。
技术方案2、一种长期预测编码方法,从输入样本时间系列信号的当前样本中减去相乘结果而得到误差信号样本,该相乘结果通过对从所述输入样本时间系列信号的所述当前样本开始时间延迟的过去样本乘以乘数而得到,所述长期预测编码方法包括:
(a)对每个帧选择下列两种方法之一的步骤,
(1)对所述帧将乘数码和时间延迟码输出一次,
(2)对所述帧分割成的多个副帧的每个副帧输出乘数码和时间延迟码,
以使切换码和辅助码以及波形码的组合的综合码量最小或编码失真最小,所述切换码表示所选择的两种方法之一,所述辅助码通过编码时间延迟和乘数而得到,所述波形码通过编码误差信号样本而得到;以及
(b)输出所述切换码和辅助码以及波形码的组合的步骤。
技术方案3、一种长期预测解码方法,将误差信号的当前样本与相乘结果相加而得到再构成的时间系列信号样本,该相乘结果通过对再构成的时间系列信号的仅进行所述时间延迟的过去样本乘以乘数而得到,所述长期预测解码方法包括:
(a)对每个帧,基于表示下列四种方法之一的切换码,从辅助码对时间延迟和乘数进行解码的步骤,
(1)对所述帧将乘数和时间延迟解码一次,
(2)对所述帧分割成的多个副帧的每个副帧解码乘数,
(3)对所述帧分割成的多个副帧的每个副帧解码时间延迟,以及
(4)对所述帧分割成的多个副帧的每个副帧解码乘数和时间延迟。
技术方案4、一种长期预测解码方法,将误差信号的当前样本与相乘结果相加而得到再构成的时间系列信号样本,该相乘结果通过对再构成的时间系列信号的仅进行所述时间延迟的过去样本乘以乘数而得到,所述长期预测解码方法包括:
(a)对每个帧,基于表示下列两种方法之一的切换码,从辅助码对时间延迟和乘数进行解码的步骤,
(1)对所述帧将乘数和时间延迟解码一次,
(2)对所述帧分割成的多个副帧的每个副帧解码乘数和时间延迟。
技术方案5、一种长期预测编码装置,从输入样本时间系列信号的当前样本中减去相乘结果而得到误差信号样本,该相乘结果通过对从所述输入样本时间系列信号的所述当前样本开始时间延迟的过去样本乘以乘数而得到,所述长期预测编码装置包括:
最小值选择单元,对每个帧选择下列四种方法之一,
(1)对所述帧将乘数码和时间延迟码输出一次,
(2)对所述帧分割成的多个副帧的每个副帧输出乘数码,
(3)对所述帧分割成的多个副帧的每个副帧输出时间延迟码,
(4)对所述帧分割成的多个副帧的每个副帧输出乘数码和时间延迟码,
以使切换码和辅助码以及波形码的组合的综合码量最小或编码失真最小,所述切换码表示所选择的四种方法之一,所述辅助码通过编码时间延迟和乘数而得到,所述波形码通过编码误差信号样本而得到;以及
合成单元,输出所述切换码和辅助码以及波形码的组合。
技术方案6、一种长期预测编码装置,从输入样本时间系列信号的当前样本中减去相乘结果而得到误差信号样本,该相乘结果通过对从所述输入样本时间系列信号的所述当前样本开始时间延迟的过去样本乘以乘数而得到,所述长期预测编码装置包括:
最小值选择单元,对每个帧选择下列两种方法之一,
(1)对所述帧将乘数码和时间延迟码输出一次,
(2)对所述帧分割成的多个副帧的每个副帧输出乘数码和时间延迟码,
以使切换码和辅助码以及波形码的组合的综合码量最小或编码失真最小,所述切换码表示所选择的两种方法之一,所述辅助码通过编码时间延迟和乘数而得到,所述波形码通过编码误差信号样本而得到;以及
合成单元,输出所述切换码和辅助码以及波形码的组合。
技术方案7、一种长期预测解码装置,将误差信号的当前样本与相乘结果相加而得到再构成的时间系列信号样本,该相乘结果通过对再构成的时间系列信号的仅进行所述时间延迟的过去样本乘以乘数而得到,所述长期预测解码装置包括:
解码单元,对每个帧,基于表示下列四种方法之一的切换码,从辅助码对时间延迟和乘数进行解码,
(1)对所述帧将乘数和时间延迟解码一次,
(2)对所述帧分割成的多个副帧的每个副帧解码乘数,
(3)对所述帧分割成的多个副帧的每个副帧解码时间延迟,以及
(4)对所述帧分割成的多个副帧的每个副帧解码乘数和时间延迟。
技术方案8、一种长期预测解码装置,将误差信号的当前样本与相乘结果相加而得到再构成的时间系列信号样本,该相乘结果通过对再构成的时间系列信号的仅进行所述时间延迟的过去样本乘以乘数而得到,所述长期预测解码装置包括:
解码单元,对每个帧,基于表示下列两种方法之一的切换码,从辅助码对时间延迟和乘数进行解码,
(1)对所述帧将乘数和时间延迟解码一次,
(2)对所述帧分割成的多个副帧的每个副帧解码乘数和时间延迟。
技术方案9、一种程序,用于在计算机上实施技术方案5至8任一项的装置。
技术方案10、一种记录介质,其上记录有程序,该程序用于在计算机上实施技术方案5至8任一项的装置。
本发明的长期预测编码方法包括:
(a)将对从输入样本时间系列信号的当前样本开始仅进行规定时间延迟的过去样本乘以了乘数的相乘结果从所述输入样本时间系列信号的所述当前样本中减去,得到相减的结果作为误差信号样本的步骤;
(b)将所述误差信号样本的系列编码而得到第1码的步骤;
(c)将所述时间延迟和所述乘数分别编码而得到第2码和第3码的步骤;以及
(d)输出所述第1码和所述第2码及第3码的步骤,
所述步骤(c)包含将所述时间延迟和所述乘数的至少一个进行可变长度编码的步骤。
本发明的长期预测解码方法包括:
(a)从输入码中的第1码解码误差信号的步骤;
(b)从所述输入码中的第2码和第3码分别解码时间延迟和乘数的步骤;以及
(c)将对所述误差信号的仅进行所述时间延迟的过去样本乘以了所述乘数的相乘结果与所述误差信号的当前样本相加,将相加的结果再构成作为时间系列信号的步骤,
所述步骤(b)包含以下步骤,即将所述时间延迟和所述乘数的至少一个参照可变长度码语的码表来进行解码。
本发明的长期预测编码装置包括:
乘法单元,对从输入样本时间系列信号的当前样本开始仅进行规定时间延迟的过去样本乘以乘数;
减法单元,将所述乘法单元的输出从所述当前样本中减去,输出误差信号;
波形编码单元,将所述误差信号编码并得到波形码;以及
辅助信息编码单元,将所述时间延迟和所述乘数分别编码而输出辅助码,
所述辅助信息编码单元包含可变长度编码单元,该可变长度编码单元对所述时间延迟和所述乘数的至少一个进行可变长度编码。
本发明的长期预测解码装置包括:
波形解码单元,将输入码中的波形码解码而输出误差信号;
辅助信息解码单元,将所述输入码中的辅助码解码而得到时间延迟和乘数;
乘法单元,对所述误差信号的仅进行所述时间延迟的过去样本乘以所述乘数;以及
加法单元,将所述乘法单元的输出与所述误差信号的当前样本相加而再构成时间系列信号,
所述辅助信息解码单元包含可变长度解码单元,该可变长度解码单元将所述时间延迟和所述乘数码的至少一个参照可变长度码语的码表来进行解码。
在长期预测编码中使用的时间延迟τ或乘数ρ等辅助信息有时根据情况其值的发生频率中产生偏差,按照本发明,在这样在发生频率中存在偏差的情况下对辅助信息进行可变长度编码,所以可以提高编码效率。
附图说明
图1是表示第1实施例的编码装置的功能结构例的方框图。
图2是表示图1所示的装置的处理步骤例的流程图。
图3是简单地表示长期预测编码的输入和输出的关系的图。
图4是用坐标图和表表示乘数ρ’小时的延迟τ及其发生频率、对应码语的关系例的图。
图5是用坐标图和表表示乘数ρ’大时的延迟τ及其发生频率、对应码语的关系例的图。
图6是表示第1实施例的解码装置的功能结构例的方框图。
图7是表示图6所示的装置的处理步骤例的流程图。
图8是表示第2实施例的编码装置的要部的功能结构例的方框图。
图9是表示图8所示的装置的处理步骤例的流程图。
图10是用坐标图和表表示乘数ρ’比基准值大时的乘数ρ的发生频率和码语的关系例的图。
图11是用坐标图和表表示乘数ρ’为基准值以下时的乘数ρ的发生频率和码语的关系例的图。
图12是表示乘数编码单元22的另一个实施例的方框图。
图13是用坐标图和表表示差分乘数Δρ的发生频率和码语的关系的图。
图14是表示第2实施例的解码侧的乘数解码单元54的功能结构例的方框图。
图15是表示图14所示的装置的处理步骤例的流程图。
图16是用坐标图和表表示乘数及其发生频率和码语的另一个关系例的图。
图17是表示乘数的发生频率和码语的再一个例子的图。
图18是表示时间延迟τ的编码步骤的另一个例子的流程图。
图19是表示与图18对应的解码的步骤例的流程图。
图20是表示时间延迟τ的编码方法的选择处理步骤的另一个例子的流程图。
图21是用于说明将乘数编码和波形编码的组最佳化的编码的表示要部的结构的方框图。
图22是表示使用多个延迟抽头(tap)数时的编码装置的结构的方框图。
图23是表示与图22的编码装置对应的解码装置的结构的方框图。
图24是表示第5实施例的编码装置的功能结构例的方框图。
图25是表示在基于多个样本生成长期预测信号时应用了本发明的编码装置的要部的功能结构例的方框图。
图26是表示与图25的编码装置对应的解码装置的要部的功能结构例的方框图。
具体实施方式
〔第1实施例〕
编码侧
以下,参照附图说明本发明的实施例,但在附图中对于对应的部分赋予相同的参照标号而省略重复说明。在图1中表示第1实施例的编码装置的功能结构例,在图2中表示其处理步骤例。
首先,在具体说明本发明之前,对长期预测编码方法简单地进行说明。在图1中,对输入端子11提供以一定周期对信号波形采样而得到的数字样本的时间系列信号。该样本的时间系列信号由区间分割单元12分割为规定区间(称为帧),例如每1024~8192个样本的处理单位(步骤S1)。来自区间分割单元12的时间系列信号x(i)(i表示样本号)被延迟单元13延迟τ样本(将延迟量表示为Zτ),作为信号x(i-τ)输出(步骤S2)。乘法单元14对作为延迟单元13的输出的比当前样本提早τ样本的样本(也被称为时间延迟τ的样本)x(i-τ)乘以被量化的乘数(以下,称为量化乘数)ρ’,并且其相乘结果作为长期预测信号由减法单元15从当前样本x(i)减去,得到误差信号y(i)。
通常,τ和ρ’从编码的时间系列信号的自相关函数求出。在将x(i)设为编码的时间系列信号,将帧内的样本数设为N,将该帧的时间系列信号x(i)的向量设为X=(x(0),…x(N-1)),将与该向量对应的延迟了τ样本的向量设为Xτ=(x(-τ),…,x(N-1-τ))时,求将下述的失真d最小化的τ即可。
d=|X-ρXτ|2  (1)
为此,首先,通过将用ρ对式(1)进行偏微分而得到的式设为零来得到下式。
〔算式1〕
ρ = X τ T X / X τ T X τ - - - ( 2 )
Xτ TX和Xτ TXτ是内积,通过下式求出。
〔算式2〕
X τ T X = Σ i = 0 N - 1 x ( i - τ ) x ( i ) - - - ( 3 )
X τ T X τ = Σ i = 0 N - 1 x ( i - τ ) 2 - - - ( 4 )
接着,将式(2)代入式(1)而得到下式。
〔算式3〕
d = | X | 2 - ( X τ T X ) 2 / | X τ | 2 - - - ( 5 )
从式(5),为了将失真d最小化,使τ在预先设定的搜索范围内变化,从而找到(Xτ TX)2/|Xτ|2为最大的τ即可。由此得到的时间延迟τ相当于音调周期。
在图3中表示输入样本系列信号x(i),和来自减法单元15的误差样本系列信号y(i)=x(i)-ρ’x(i-τ)在时间轴上的关系。返回图1的说明,向量X(输入样本系列信号)和由延迟单元13延迟了τ样本的向量Xτ被输入延迟搜索单元17,进行(Xτ TX)2/|Xτ|2为最大的τ的搜索(步骤S3)。其搜索范围可以预先决定为例如样本点256~511等那样,也可以依赖于前一帧的时间延迟τ(以下称为前帧时间延迟τ0),例如将搜索范围设定为τ0-200≤τ≤τ0+200等,并且对每一帧根据前帧时间延迟τ0变更实际的搜索范围。这时,将保持在帧延迟存储单元33中的前帧时间延迟τ0提供给时间延迟搜索单元17。搜索到的τ为了利用在下一帧的时间延迟τ的编码中而被作为τ0存储在帧延迟存储单元33中。而且,根据向量X、以及被延迟τ样本的向量Xτ,在乘数计算单元18中通过式(2)计算乘数ρ(步骤S4)。
将(Xτ TX)2/|Xτ|2设为最大时的基于式(2)的乘数ρ的可取值是-1≤ρ≤1的范围,虽然可能取负值,但通常多取正值。
来自减法单元15的误差样本系列信号在波形编码单元21中例如通过帧间预测编码被可逆编码,输出码CW。在全体的编码也可以是非可逆的情况下,该误差样本系列信号的编码也可以是非可逆编码。而且,乘数ρ在乘数编码单元22中被编码为码Cρ,时间延迟τ在延迟编码单元23中被编码为码Cτ。乘数编码单元22和延迟编码单元23构成辅助信息编码单元27。在合成单元24中,除了码CW,作为辅助码码Cρ和码Cτ被合成,对每一个帧输出。而且,在乘数编码单元22内,解码了码Cρ的量化乘数ρ’被提供给乘法单元14,进行与Xτ的相乘。
在以往,虽然辅助码Cρ和码Cτ的任意一个都是码长一定的固定长度码,但是本发明将辅助码Cρ和Cτ的至少一个通过可变长度编码得到,由此使编码压缩率提高。在该第1实施例中,将时间延迟τ可变长度编码不仅是可变长度编码,而且有时也对每个帧自适应地选择固定长度编码。
另外,在输入信号例如是不包含音调分量的背景音(杂音)信号的情况下的帧中,如图4中的左侧的坐标图35A所示那样,各种时间延迟τ(在纵轴上表示)的发生频率(在横轴上表示)中规律性少,没有大的偏差。但是,在输入信号包含音调分量的情况下,如图5的左侧的坐标图34A所示那样,时间延迟τ在与前帧时间延迟τ0相同、为τ0的两倍或者1/2倍、或与τ0-1相等等情况下的时间延迟τ的发生频率显著变大。其倾向在输入信号的帧间的相关大,乘数ρ大的情况下强。另一方面,图4的坐标图35A所示的倾向多为帧间的相关小,乘数ρ小的情况。因此,在该第1实施例中,根据乘数ρ是否大来选择时间延迟τ的编码方法。
如图1所示,由乘数计算单元18计算的乘数ρ在乘数编码单元22中被编码为乘数码Cρ(步骤S5)。在乘数编码单元22内进行乘数ρ的编码时得到的量化乘数ρ’被输入编码选择单元31内的判定单元31a,进行ρ’是否大于规定的基准值,例如0.2的判断(步骤S6)。如果ρ’大于0.2,则时间延迟τ被可变长度编码。在该可变长度编码中,对于与前帧时间延迟τ0成为如前所述的特定的关系的时间延迟τ分配短的码长的码,对此外的时间延迟τ分配比前述特定关系下的码长更长、并且越接近τ0越短的码。或者也可以分配一定码长的不同的编码。
在本实施例中,如果ρ’比0.2大,则通过判定单元31a,切换单元31b切换到可变长度编码单元34侧,时间延迟τ被提供给可变长度编码单元34。在可变长度编码单元34中被输入来自切换单元31b的τ和来自帧延迟存储单元33的τ0,对于该被输入的τ的值,例如参照图5的右侧的可变长度码表34T而输出对应的可变长度码的延迟码Cτ(步骤S8)。
对图5所示的基于可变长度码表34T的对可变长度码的τ的分配进行说明。图5的坐标图34A表示在前帧的时间延迟为τ0的情况下,通过学习求出的当前帧的时间延迟τ的可取各值的出现频率的结果。如该例所示,时间延迟τ与前帧时间延迟τ0相等的频率突出地大,时间延迟τ为2τ0、τ0/2、τ0-1的频率为τ0的频率和除了τ0以外的时间延迟的频率的中间程度。因此,在图5的可变长度码表34T所示的码分配中,由于τ与τ0为相同值的可能性最大,所以作为τ0=τ的码语(延迟码)Cτ而分配最短的1位长度的码“1”,而且,由于τ成为τ0/2、τ0-1、2τ0的可能性同样高,所以在各个情况下将同样3位长度的不同的码语“001”、“010”、“011”作为码Cτ进行分配,对于其余的τ的值分别分配6位长度的码,该码将开头(上位)3位设为“000”,将下位3位设为τ的发生频率越少值越大。即,预先作成图5的码表34T,使得如果输入信号如声音信号那样包含音调分量,则由于时间延迟τ与前帧的τ0成为如上所述的特定关系的值的频率高,所以分配短的码长的码Cτ,在其它情况下,根据通过预先实验(学习)求出的τ的发生频率来分配上述的码。但是,由于实际上值τ的出现频率由于前帧时间延迟τ0的值而不同,所以需要预先准备对应于τ0的值的多个表34T,但是也可以不需要对τ0的可取的全部值(例如,如果τ的搜索范围为256~511,则为256~511的全部值)分别准备表,例如可以将τ0的可取值的范围分割为多个区域,对各个区域的每一个准备一个表。这时,判断前帧时间延迟τ0是哪个区域,并且选择对应的一个表。
而且,也可以将如图5所示的时间延迟τ的可变长度码表34T分为τ和τ0的关系为特定关系的情况和此外的情况而存储在可变长度编码单元34中。这时,如图1中的点线所示,时间延迟τ也被提供给比较单元32,τ0也被提供给比较单元32。在比较单元32内的运算单元32a中,进行2τ0、τ0/2、τ0-1的各运算,进行时间延迟τ是否与τ0、2τ0、τ0/2、τ0-1的其中一个相等的比较,其比较结果也被输出到可变长度编码单元34。即,决定进行时间延迟τ是否与τ0存在特定关系(步骤S7’)。在可变长度编码单元34中除了来自切换单元31b的τ和来自帧延迟存储单元33的τ0,还输入比较单元32中的比较结果,在比较结果是与τ0、τ0/2、τ0-1、2τ0的其中一个相等的情况下,作为各个码Cτ,编码单元34a输出“1”、“001”、“010”、“011”,在此外的情况下以时间延迟τ参照可变长度编码单元34内的前述表,由编码单元34b输出对应的6位的码Cτ(步骤S8’)。即,取代图2的步骤S8,执行步骤S7’和S8’,而且,在可变长度编码单元34内具有以与τ0的比较结果决定与τ对应的码的编码单元34a,和以τ的发生频率决定与τ对应的码的编码单元34b。
在步骤S6中,如果ρ’不大于0.2,则通过判定单元31a切换单元31b被切换到固定长度编码单元35,时间延迟τ在固定长度编码单元35中被变换为固定长度码的延迟码Cτ(步骤S9)。这时,由于如前所述那样,在时间延迟τ的发生频率中规律性少,没有大的偏差,所以作为时间延迟τ对码语表,例如在图4中使用将τ的可取范围的值固定长度编码的固定长度码表35T。该固定长度码表35T被存储在固定长度编码单元35中,固定长度编码单元35将与被输入的τ对应的码Cτ参照该时间延迟τ的固定长度码表35T来输出。
而且,在判定单元31a中,作为将时间延迟τ可变长度编码还是固定长度编码的判断条件,通过量化乘数ρ’是否比基准值0.2大来判断,但是基准值也可以是0.3左右的值。而且,在延迟搜索单元17中,在前帧量化乘数ρ’大的情况下,也可以将τ搜索范围本身仅限定在包含τ0的附近,例如-3≤τ0≤3左右,和2τ0、τ0/2的各附近,从而可以减少运算量。但是,对于在信息的编码开始时前帧不存在,而且要成为从可能被编码为编码系列的信息(例如乐曲)的中途开始解码的随机访问点(访问开始位置)的帧,需要不使用前帧的信息来进行编码。
随机访问是可以从码系列的被指定的位置(随机访问点)的帧没有过去帧的影响地再构成信号的功能,对每多个帧设定访问点,可以以该单位再构成信号,并且可以进行分组。
例如,作为可以从随机的时刻对通过网络广播的已被编码的音频信息和/或视频信息等的访问的编码的方法,使用以下方法,即在信息的开始帧、和与其连接的帧的每隔一定数量的各帧中,设置不依赖其前后的帧的被帧内编码(intra-frame coding)的帧作为访问点,在相邻访问点间的各帧中通过编码效率高的帧间预测编码对信息进行编码。如果使用这样的编码信息,则可以从任意的访问点马上开始解码。在本发明中,例如在波形编码单元21中通过帧间预测编码对来自减法单元15的误差信号进行编码的情况下,在信息的开始帧和与其连接的隔一定帧数插入的访问点的帧中,不使用前帧的信息而进行帧内预测编码。作为指定该访问点的帧的信号,也可以生成信号FS,该信号FS是例如应用在声音编码装置中的与本发明的编码装置一起使用的、在未图示的视频信息编码装置中指定访问点的信号FS,该访问点信号FS被提供给本发明的编码装置。或者,在图1中对于由区间分割单元12生成的一连串的帧,通过用虚线表示的访问点设定单元25生成用于指定开始帧和与其连接的隔一定帧数的各帧作为访问点的访问点信号FS,并且波形编码单元21按照是否被提供该访问点信号FS,对误差信号进行帧内预测编码或者帧间预测编码。
因此,判定单元31a如图2中虚线所示,按照在步骤S2之后是否被提供访问点信号FS来判断前帧时间延迟τ0能否利用(步骤S14),如果能够利用,则从存储单元(未图示)读出前帧的量化乘数ρ’(以下,称为前帧量化乘数ρ’0)(步骤S15),判断该前帧量化乘数ρ’0是否大于规定的基准值,例如0.2(步骤S16),如果ρ’0比规定值大,则例如如前所述限定在以前帧时间延迟τ0为基准的狭窄范围内而搜索时间延迟τ后转移到步骤S7(步骤S17),如果在步骤S16中ρ’0不比规定值大,则与以往一样,在宽范围内搜索时间延迟τ后转移到步骤S9(步骤S18)。在步骤S14中如果判断前帧时间延迟τ0不能利用,则转移到步骤S3。并且,如虚线步骤S5’中所示那样对乘数ρ进行计算并编码,同时随着编码进行量化乘数ρ’的存储。而且,在访问点的帧的情况下,仅在帧内的信息中搜索τ,并需要求ρ。因此,在编码装置中,访问点信号FS还被输入延迟单元13,并且在延迟单元13中输入了访问点信号FS的情况下,前帧部分的x(i)作为0之后(即,将x(i)(i<0)置换为0),作成时间延迟信号的向量Xτ,将该向量Xτ输入到延迟搜索单元17、乘数计算单元18、和乘法单元14。访问点信号FS既可以与未图示的上述视频信息编码装置编码的视频信号一起发送到解码侧,或者也可以将访问点设定单元25生成的访问点信号FS发送到解码侧。或者,作为系统,在编码侧设置用于生成访问点信息的部件,声音信号或视频信号的码在不同的阶段将访问点信息发送到解码侧。
在延迟单元13中使输入样本时间系列信号仅延迟τ,对该被延迟的信号乘以量化乘数ρ’而生成长期预测信号(步骤S10),在减法单元15中将该长期预测信号从输入样本时间系列信号x(i)中减去(步骤S11),将其剩余差波形信号(误差信号)y(i)在波形编码单元21中编码为波形码CW(步骤S12)。在合成单元24中将码CW、Cρ、Cτ合成后输出(步骤S13)。
在该第1实施例中,对于时间延迟τ,对应于量化乘数ρ’来选择固定长度编码或者可变长度编码,而且在可变长度编码的情况下,在其τ对码语表中,对τ与前帧时间延迟τ0相同、为τ0的整数倍、为τ0的整数分之一、为τ0的相邻附近值的情况分配短的码长的码,所以与以往相比,可以使编码压缩率提高。在该可变长度编码单元34中具有被输入τ0、2τ0、τ0/2、τ0-1而输出码Cρ的部分34a,和被输入τ而输出码Cρ的部分34b这一点上,是与通常的可变长度码的码表不同的结构。
解码侧
与图1和图2所示的编码装置及其处理步骤对应的解码装置的功能结构例表示在图6中,其处理步骤例表示在图7中。来自输入端子51的输入码每一帧在分离单元52中被分离为波形码CW、时间延迟码Cτ和乘数码Cρ(步骤S21)。访问点信号FS可以从例如未图示的视频信号解码装置提供,或者也可以作为系统而利用在其它级接收到的访问点信息。在该解码装置的实施例中,如果访问点判断单元69检测到在由分离单元52分离的码中存在访问点信号FS,则从该时刻的帧开始解码。波形码CW在波形解码单元53中被解码为误差信号(步骤S22)。而且,乘数码Cρ也在乘数解码单元54中被解码为量化乘数ρ’(步骤S22)。
量化乘数ρ’在条件判断单元55中进行是否大于规定值,即图1中的判定单元31a中的判断条件的基准值相同的值、在前述例子中为0.2的判断(步骤S23),如果ρ’比0.2大,则切换单元56被切换到可变长度解码单元57侧,延迟码Cτ被可变长度解码单元57解码,得到时间延迟τ(步骤S24)。在该解码单元57中,存储与被存储在图1中的可变长度编码单元34中的时间延迟τ的可变长度码表34T相同的码表。在步骤S23中,如果判断出ρ’为0.2以下,则切换单元56被切换到固定长度解码单元58,延迟码Cτ被固定长度解码单元58解码,得到时间延迟τ(步骤S25)。在固定长度解码单元58中存储与被存储在图1中的固定长度编码单元35中的时间延迟τ的固定长度码表35T相同的码表。
来自加法单元59的输出解码波形信号在延迟单元61中仅被延迟已被解码的时间延迟τ(步骤S26),在乘法单元62中对该被延迟τ样本的解码信号乘以被解码的量化乘数ρ’(步骤S27),该相乘结果在加法单元59中与被解码的误差信号相加而得到解码波形信号样本时间系列信号(步骤S28)。而且,在访问点的帧的情况下,与编码装置的情况相同,在延迟单元61中将前帧部分的x(i)设为0以后,作成时间延迟信号,输入到乘法单元62。这些样本时间系列信号在每个帧中被得到,将这些帧的样本时间系列信号在连接单元63中连接后输出(步骤S29)。可变长度解码单元57、固定长度解码单元58、条件判断单元55、切换单元56构成延迟解码单元60。而且,延迟解码单元60和乘数解码单元54构成辅助信息解码单元64。
〔第2实施例〕
在第1实施例中,根据条件将时间延迟τ进行了可变长度编码。在该第2实施例中,根据条件将乘数ρ进行可变长度编码,并且时间延迟τ的编码单元23可以与第1实施例一样根据条件进行可变长度编码,或者也可以与以往一样仅固定长度编码,对应于该编码方法,解码装置的延迟解码单元60进行可变长度解码或者进行与以往一样的固定长度解码。
因此,在以下中仅对与第1实施例或以往技术不同的乘数ρ的编码进行说明。这里也和对于时间延迟τ的码表的选择一样,有使用用于明示对于乘数ρ的码表的适应的选择的辅助信息的情况,但是以下叙述不明示选择的情况。
图8表示图1所示的编码装置的乘数编码单元22中应用的基于第2实施例的乘数编码单元22的功能结构例,图9表示其处理步骤。在前帧乘数存储单元70中存储通过在乘数编码单元22中在前帧进行编码而被量化的量化乘数ρ’。该量化乘数ρ’作为前帧量化乘数ρ’0被从前帧乘数存储单元70取出(步骤S30),在ρ条件判断单元71中判断前帧量化乘数ρ’0是否在规定的基准值,例如0.2以下,或者是否还未得到ρ’0(步骤S31),在ρ’0在规定的基准值以下或者还未得到ρ’0的情况下,切换单元72被切换到单独编码单元73,乘数ρ被编码为固定长度码语或者可变长度码语的码Cρ(步骤S32)。在步骤S31中,在判断出ρ’0大于基准值时,切换单元72被切换到可变长度编码单元74,乘数ρ被编码为可变长度码语的码Cρ(步骤S33)。
前帧量化乘数ρ’0比基准值大时的当前帧的乘数ρ的值的出现频率分布例如如图10的坐标图74A所示那样,在ρ=0.2~0.3频率最高,因此,如图10所示的乘数的可变长度码表74T所示,例如对0.3的值分配最短的码“1”,随着比其变大或变小,依次分配长的码。
通过编码单元73或74被编码的乘数码Cρ和通过编码而被量化的量化乘数ρ’被从乘数编码单元22输出,同时,被量化的乘数ρ’被存储在前帧乘数存储单元70,在下一帧作为前帧量化乘数ρ’0被使用。
对该乘数ρ’0小时的编码进一步进行说明。在前帧量化乘数ρ’0小时,或者在不能利用前面的帧的信息时在单独编码单元73中进行单独的编码。作为不能利用前面的帧的信息的例子,有如前所述那样开头的帧或者随机访问的访问点(访问开始)的帧。
单独编码单元73既可以将乘数ρ编码为固定长度码语的码Cρ,也可以如下那样编码为可变长度码语Cρ。在图11的表73T中表示在该单独编码单元73中进行可变长度编码时的乘数ρ的可变长度码表的例子。如图11的坐标图73A中所示的前帧量化乘数ρ’0比基准值小时的当前帧的乘数ρ的各值的出现频率那样,在访问点的帧那种情况下小的值的乘数ρ的发生频率极高,所以分配“1”。乘数ρ的值越大,发生频率越降低,所以分配长的码。在该例子中任意一个码语的2进制数值为1,但是随着发生频率变小而在上位附加0,码语的位数变大。
在将图8所示的乘数编码单元22的实施例应用与图1的编码装置时,延迟编码单元23可以是如图1所示的选择性地执行可变长度编码和固定长度编码的结构,也可以是不进行基于量化乘数ρ’的编码选择,对时间延迟τ始终进行固定长度编码的结构,或者对时间延迟τ始终进行可变长度编码的结构。
作为乘数编码单元22的另一个实施例,图12表示在图8中取代ρ的编码而对当前帧的乘数ρ和前帧量化乘数ρ’0的差分进行编码的结构,并且将其处理步骤表示为在图9中增加了虚线块S34的步骤。对来自前帧乘数存储单元70的前帧量化乘数ρ’0和当前帧的乘数ρ的差分Δρ=ρ-ρ’0进行计算的差分计算单元75被设置在切换单元72和可变长度编码单元74之间,在步骤S31中如果被判断出前帧量化乘数ρ’0不比规定值大,则切换单元72被切换到差分计算单元75,在差分计算单元75中计算该前帧量化乘数ρ’0和当前帧的乘数ρ的差分Δρ=ρ-ρ’0(步骤S34)。可变长度编码单元74将该计算结果Δρ编码为码Cρ,同时将其编码时得到的量化差分Δρ’提供给加法单元76(步骤S33)。而且,加法单元76将量化差分Δρ’和前帧量化乘数ρ’0相加而生成当前帧量化乘数ρ’,并且将其作为对下一帧的前帧量化乘数ρ’0保持在前帧乘数存储单元70中。其它结构和动作与图8的情况相同。
在前帧量化乘数ρ’0大时当前帧的乘数ρ也大的可能性高。因此,当前帧的乘数ρ越离开前帧量化乘数ρ’0,即差分Δρ的绝对值越大,发生频率越降低,所以如图13的可变长度码表74T所示那样,码Cρ与图10一样,随着ρ和ρ’0的差分值的发生频率变小而分配长的码语。在图13的例子中,表示随着差分Δρ变大,使码语的0的位数向上位侧逐一增加的情况。
在乘数ρ或者差分Δρ的编码中,这些值一般不是整数。因此,例如ρ的变化范围被分割为多个小范围,小的值的ρ属于的各被分割的小范围被分配短的码长的码,而且,对各被分配的每个小范围分别决定其代表值(一般为整数)。被输入的ρ属于的小范围的码语作为码Cρ被输出,同时该小范围的代表值作为被解码的量化乘数ρ’被输出。该量化乘数ρ’例如被输出到图1中的乘法单元14、判定单元31a。
接着,在图14中表示与以上叙述的图8的乘数编码单元22对应的解码侧的乘数解码单元54的功能结构例,在图15中表示处理步骤例。
来自分离单元52的乘数码Cρ被输入切换单元81。另一方面,由前帧乘数存储单元82取出前帧量化乘数ρ’0(步骤S41),在判定单元83中进行该ρ’0是否为规定值以下,或者前帧量化乘数ρ’0是否不存在的判断(步骤S42)。该基准值设为与在编码侧的步骤S31中被用于判断的基准值相同的值。如果判断出前帧量化乘数ρ’0在基准值以下,或者不存在,则切换单元81被切换到单独解码单元84,被输入的Cρ在单独解码单元84中被解码(步骤S43)。
在步骤S42中如果ρ’0被判断为不在基准值以下,则切换单元81被切换到可变长度解码单元85侧,码Cρ在可变长度解码单元85中被解码(步骤S44)。单独解码单元84和可变长度解码单元85是与编码侧的单独编码单元73和可变长度编码单元74对应的单元,在本例中在单独解码单元84中存储与图10所示的表74T相同的内容。
在编码侧利用图12的乘数编码单元22对ρ和ρ’0的差分Δρ进行了可变长度编码的情况下,如图14和图15中虚线所示那样,在加法单元86中对在可变长度解码单元85中被解码的差分信号加上前帧量化乘数ρ’0,从而得到量化乘数ρ’(步骤S45)。在这时的可变长度解码单元85中存储有与图13中表示的表74T相同的表。
在图16中表示图11所示的单独编码的码分配的另一个例子。也可以如该例所示,不是随着频率的减少而使编码的位数依次增加,而是频率比较接近的部分如图中表示为“001”、“010”、“011”那样,码的位数相同,作为2进制数值其值逐一错开。在ρ大的情况下,ρ对波形信号产生大的影响。因此,如图17所示,ρ特别大的部分也可以仅使乘数ρ的间距减小。这时码语数量和位数变多,但是这样特别大的ρ的频率显著减小,所以对作为全体的码量基本上不产生影响,可以提高解码波形信号的精度。
变形例
在前述中,在可变长度编码的情况下将参数(τ或者ρ、Δρ)和码语的关系作为码表保持,并且进行了编码或解码。但是,例如在图5、图11、图13、图16、图17所示的例子中,在参数的大小和码语的关系中存在规律性,例如如果知道ρ的值,则设为在1的上位仅附加按照规则的数量的0的码语即可,相反,从码语按照规则,可以求ρ’的值。即,在这些情况下,在可变长度编码、解码单元中也可以不使用参数的码表。
在基于图5所示的码表的编码中,在比较单元32中判断是τ=τ0、τ=τ0-1、τ=τ0/2、τ=2τ0的哪一个,并且在与它们的其中一个一致时,从可变长度编码单元34输出了对应的短的码长(这里例如是1位或者3位)的码Cρ。作为该比较判断,除了这些之外,例如也可以在比较单元32中判断成为τ=τ0+1、τ=τ0/3、τ=τ0/4、τ=3τ0、τ=4τ0等的哪一个,并且在与它们的其中一个一致时,使表示该情况的预定的码长度的码Cρ从可变长度编码单元34输出。
在第1实施例中,按照乘数ρ’是大还是小来区别了是使用图5所示的时间延迟τ的可变长度码表34T(可变长度编码),还是使用图4所示的时间延迟τ的固定长度码表35T(固定长度编码)。
或者也可以如下那样。根据是否要将当前帧独立而进行编码,即根据是否将当前帧作为访问点的帧而进行编码来选择时间延迟τ的编码方法。例如如图18所示那样,判断可否利用前帧的信息(步骤S51)。这里,如图1中的虚线所示,通过是否从访问点设定单元25对判定单元31a提供访问点信号FS来进行是否将当前帧独立来进行编码的判断。在该信号FS已被提供给判定单元31a的情况下,表示当前帧是访问点的帧,并且不使用前帧的信息而对时间延迟τ单独编码(步骤S52),该编码例如使用图4所示的码表35T。在步骤S51中信号FS未被提供的情况下,判断为应使用前帧的信息来进行编码,并且当前帧的时间延迟τ进行可变长度编码(步骤S53)。这时的码表例如使用如图5所示的码表34T。这时的图6中的解码例如如图19所示,首先判断是否有用于表示将当前帧独立解码的信息即前帧信息(步骤S61),如果没有则将时间延迟码Cτ单独解码(步骤S62)。在步骤S61中判断出有前帧信息时,将时间延迟码Cτ可变长度解码(步骤S63)。
作为时间延迟τ的编码方法的选择,也可以通过是否对当前帧独立编码和量化乘数ρ’的大小的组合来决定。这时,在图1的判定单元31a中输入用于表示当前帧是否独立编码的访问点信息FS和来自乘数编码单元22的量化乘数ρ’。在判定单元31a中例如如图20所示,首先判断当前帧中是否有独立编码的访问点信号FS(步骤S71),如果有FS则将时间延迟τ单独编码(步骤S72),如果在步骤S71中没有FS,即有前帧信息,则判断量化乘数ρ’是否比基准值大(步骤S73),如果比基准值大,则时间延迟τ被可变长度编码(步骤S74),如果不比基准值大,则时间延迟τ被固定长度编码(步骤S75)。
这时的解码侧的处理与编码侧相同。即,如图20中括号内书写表示的那样,判断接收编码中是否有FS,如果有则Cτ被单独解码,如果没有则在被解码的ρ’比规定值大时Cτ被可变长度解码,在不比规定值大时Cτ被固定长度解码。
由于在图13中不学习ρ和ρ’的差分值的发生频率,就预先知道在差分值的绝对值小时发生频率高,所以分配随着差分值的绝对值变大码长变长的例如图13所示的码语来作成乘数ρ的可变长度码表74T即可。
〔第3实施例〕
在将图8的乘数编码单元22应用在图1的情况下,也可以构成为进一步使基于波形编码单元21的编码和基于乘数编码单元22的编码的组最佳化。该结构相对于图1的结构是进一步追加了最佳化单元的结构,在图21中表示这时的结构的主要部分。
图21的结构是对最佳化单元26提供波形编码单元21的输出编码CW和乘数编码单元22的输出编码Cρ,计算它们的码量的合计(比特数的合计),使乘数编码单元22的基于被选择的可变长度编码的量化乘数ρ’变化(即改变码表中的ρ’的选择),以使得该合计码量小。进而,通过被选择的ρ’,进行乘法单元14的乘法、基于该相乘结果的减法单元15中的减法、对于该相减结果的基于波形编码单元21的编码。这样,使ρ’变化从而决定CW和Cρ的合计的码量最小的ρ’。将该合计码量最小时的CW和Cρ作为编码结果提供给合成单元24。其它的结构和动作与图1的情况相同。与这样的最佳化的编码相对应的解码可以通过应用了图14的乘数解码单元54的图6的解码装置来实施。
同样,也可以决定来自延迟编码单元23的码Cτ,使得来自图1的波形编码单元21的码CW和来自延迟编码单元23的码Cτ的码量的合计为最小。具体来说,使时间延迟搜索单元17的时间延迟τ变化来进行延迟单元13以后的处理,使得码CW和码Cτ的码量的合计为最小,将码CW和码Cτ的码量的合计为最小时的码CW和码Cτ作为编码结果提供给合成单元24。
如前所述,在已使时间延迟τ变化的情况下,由于对乘数ρ产生影响而对Cρ产生影响,而且,由于对误差信号y(i)也产生影响而对码CW也产生影响。因此,也可以分别调整量化乘数ρ’和时间延迟τ或者调整两者,使得码CW、码Cρ、码Cτ三者组合而使全体的码量最小。
〔第4实施例〕
在前述的实施例中,如图3中说明的那样,对一个时间延迟τ(即一个延迟抽头)的信号Xτ乘以一个乘数ρ’从而生成了相对于信号X的预测信号ρ’Xτ,但是也可以根据时间延迟τ和与其相邻的多个时间延迟的信号生成预测信号。图22表示这时的编码装置的结构。图22的结构是延迟抽头数为3的情况,使图1的结构中的延迟单元13以τ-1样本延迟单元(Zτ-1)13A、和两个单位延迟单元13B、13C串联连接的方式来构成。延迟单元13对于从时间延迟搜索单元17提供的时间延迟τ,在延迟单元13A中设定τ-1样本的延迟。因此,对于输入信号X在延迟单元13A、13B、13C的各个输出中分别输出延迟τ-1样本后的信号Xτ-1、延迟τ样本后的信号Xτ、延迟τ+1样本后的信号Xτ+1
乘法单元14由乘法器14A、14B、14C、和将它们的输出相加,从而将相加结果作为预测信号提供给减法单元15的加法器14D构成。乘数计算单元18如后所述那样根据输入信号X和延迟后的信号Xτ-1、Xτ、Xτ+1计算对于三个延迟抽头的最佳的三个乘数ρ-1、ρ、ρ+1并提供给乘数编码单元22。乘数编码单元22汇总三个乘数ρ-1、ρ、ρ+1而进行编码,并作为乘数码Cρ输出,同时将基于该编码的量化乘数ρ-1’、ρ’、ρ+1’提供给乘数计算单元18的乘法单元14A、14B、14C。而且,将量化乘数ρ’提供给编码选择单元31的判定单元31a。
在乘数计算单元18中的乘法计算如下进行。
对于三个延迟抽头的信号的乘数决定为使得下式的失真d最小。
〔算式4〕
d = Σ i = 0 N - 2 ( x ( i ) - Σ j = - 1 1 ρ j x ( i - τ - j ) ) 2 - - - ( 6 )
这样的乘数ρ-1’、ρ’、ρ+1’可以通过下式计算。
〔算式5〕
ρ - 1 ρ ρ + 1 = X τ - 1 T X τ - 1 X τ - 1 T X τ X τ - 1 T X τ + 1 X τ T X τ - 1 X τ T X τ X τ T X τ + 1 X τ + 1 T X τ - 1 X τ + 1 T X τ X τ + 1 T X τ + 1 X τ - 1 T X X τ T X X τ + 1 T X - - - ( 7 )
这样,在使用来自多个延迟抽头的信号而生成了预测信号的情况下,预测精度更高,因此在减法单元15得到的误差信号的能量变小,能够进行效率更高的编码。在图22中表示延迟抽头数为3的情况,但是不限于此,可以以希望的多个抽头数实现。
图23表示与图22的编码装置对应的解码装置的结构例。在该结构中,与图22的延迟单元13一样,以τ-1样本延迟单元61A、两个单位延迟单元61B、61C的串联连接构成延迟单元61,并且与图22的乘法单元14一样通过三个乘法器62A、62B、62C和加法器62D构成乘法单元62。来自分离单元52的乘数码Cρ在乘数解码单元54中被解码为三个量化乘数ρ-1’、ρ’、ρ+1’。这些量化乘数被分别提供给乘法器62A、62B、62C,与来自延迟单元61A、61B、61C的输出分别相乘。相乘结果在加法器62D中相加,相加结果作为预测信号提供给加法单元59。量化乘数ρ’也被提供给条件判定单元55,被使用在对于时间延迟码Cτ的解码单元57、58的选择判断中。其它的结构和动作与图6的情况一样。
〔第5实施例〕
说明将一个帧分割为四个副帧来进行编码的第5实施例。这时,作为量化乘数ρ’和时间延迟τ的参数的输出的处理方法,考虑下述四种。
(1)将ρ’和τ在帧中仅输出一次。
(2)对每个副帧仅输出量化乘数ρ’。
(3)对每个副帧仅输出时间延迟τ。
(4)对每个副帧输出ρ’和τ。
虽然这些情况的每一个情况下都进行编码而输出,但是将其选择方法,即是这四个的哪一个另外编码,并且对每个帧选择将该选择码和辅助码以及波形码CW综合从而码量最小的组合,或者编码失真小的组合。如图24中简单地表示的那样,通过与对应于前述的四个的(1)~(4)对应的第1~第4编码单元911~914,输入信号x被分别附加编码。从这些第1~第4编码单元911~914,各输出码CW、Cτ、Cρ被分别输入到码量计算单元921~924,分别计算综合码量。这些被计算的综合码量中的最小值被最小值选择单元93选择。设置与第1~第4编码单元911~914对应的门电路941~944,与由最小值选择单元93选择的其最小值对应的门电路打开,来自与该门电路对应编码单元的码CW、Cτ、Cρ被输入到合成单元24。而且,用于表示是最小值选择单元93选择的第1~第4编码单元911~914的哪一个的信号在选择编码单元95中被编码,作为选择码CS输入到合成单元24。
在对每个副帧输出参数时,既可以将前面的副帧的值作为条件来进行编码,例如也可以汇总四个参数,用反映了结合频率的算术码压缩。例如也可以使用以下方法,即将四个参数同时发生的频率的积和该四个参数的关系表在频率差越小时,越设为小的码语。在(1)~(4)的可能性中,例如也可以仅使用(1)、(2)、(4)或者(1)、(4)。而且,副帧的数量不限于四个,而且,也可以例如选择4个的情况和8个的情况下的理想的情况。
进而,在第1和第2实施例中,依赖乘数而变更了时间延迟τ或者乘数ρ的编码方法,但是也可以例如在第1实施例中叙述的那样,将时间延迟τ进行前述固定长度编码,或者前述可变长度编码,求还包括了各个情况下的波形码CW的码量,输出码量少的一个的码,并且还输出用于表示选择了哪个编码方法的切换码(用1位即可)。乘数的编码也对于预定的两个编码同样地进行选择,输出其编码的同时输出切换码即可。
总之,本发明使时间延迟τ、乘数ρ和码语的关系依赖于量化乘数ρ’,或者通过切换码进行切换,即自适应地进行切换。同样,在解码侧也根据被解码的信息,自适应地切换时间延迟τ、量化乘数ρ’和码语的关系。
作为长期预测信号,也可以作为被延迟的多个样本的加权加法来生成。在图25中表示该编码装置的主要部分的功能结构例。在该例中,在利用三个样本的情况下,被分割为帧的输入时间系列信号X在延迟单元13A中被延迟τ-1样本,进而在单位延迟单元13B、13C中依次被延迟1个样本。延迟单元13A、13B、13C的各输出在乘法单元651、652、653中被分别乘以预定的权重,例如w-1=0.25,w0=0.5,w+1=0.25,这些相乘结果在加法单元66中被相加而输入到延迟搜索单元17。在延迟搜索单元17中加法单元66的相加结果作为图1中的延迟搜索单元17的输入Xτ被处理。
来自图1中的乘数编码单元22的量化乘数ρ’在乘法单元671、672、673中被分别乘以预定的权重w-1、w0、w+1,这些相乘结果作为乘数在乘法单元14A、14B、14C中对延迟单元13A、13B、13C的各输出样本分别相乘。这些乘法单元14A、14B、14C的和作为长期预测信号在减法单元15中从输入时间系列信号X中减去。
在图26中表示这时的解码装置的主要部分的功能结构例。来自图6的乘数解码单元54的被解码的量化乘数ρ’在681、682、683中被分别乘以预定的权重w-1、w0、w+1,来自加法单元59的被解码的时间系列信号在构成延迟单元61的τ-1样本延迟单元61A中被延迟τ-1样本(τ由延迟解码单元60输入),进而通过构成延迟单元61的单位延迟单元61B、61C依次被延迟1个样本。乘法单元681、682、683的各相乘结果分别作为乘数在乘法单元621、622、623中对延迟单元61A、61B、61C的各输出相乘。这些乘法单元621、622、623的输出的和作为被解码的长期预测信号在加法单元59中与来自波形解码单元53的被解码的误差信号相加。
至此的说明以1信道的信号为对象,但是在多信道信号的编码中也可以根据其它信道的信号生成长期预测信号,即,ρ、τ也可以利用其它信道信号来生成,在该生成中,对于作为特征的ρ、τ的编码、解码也相同。但是,在1信道的情况下的解码中,有时回归地参照相同帧内的自身过去的信号,但是在利用其它信道信号的情况下就不是这样,这一点有所不同。
可以分别通过计算机起到在前述各实施例中表示的编码装置、解码装置的功能。这时,对于前述的各装置,将用于使计算机作为该装置起作用的程序从CD-ROM、磁盘、半导体记录装置等记录介质中安装到该计算机,或者通过通信线路下载,使计算机执行该程序即可。

Claims (8)

1.一种长期预测编码方法,从输入样本时间系列信号的当前样本中减去相乘结果而得到误差信号样本,该相乘结果通过对从所述输入样本时间系列信号的所述当前样本开始时间延迟的过去样本乘以乘数而得到,所述长期预测编码方法包括:
(a)对每个帧选择下列四种方法之一的步骤,
(1)对所述帧将乘数码和时间延迟码输出一次,
(2)对所述帧分割成的多个副帧的每个副帧输出乘数码,
(3)对所述帧分割成的多个副帧的每个副帧输出时间延迟码,
(4)对所述帧分割成的多个副帧的每个副帧输出乘数码和时间延迟码,
以使选择码和辅助码以及波形码的组合的综合码量最小或编码失真最小,所述选择码表示所选择的四种方法之一,所述辅助码通过编码时间延迟和乘数而得到,所述波形码通过编码误差信号样本而得到;以及
(b)输出所述选择码和辅助码以及波形码的组合的步骤。
2.如权利要求1所述的长期预测编码方法,其中,所选择的方法为:
(1)对所述帧将乘数码和时间延迟码输出一次,
(4)对所述帧分割成的多个副帧的每个副帧输出乘数码和时间延迟码。
3.一种长期预测解码方法,将误差信号的当前样本与相乘结果相加而得到再构成的时间系列信号样本,该相乘结果通过对再构成的时间系列信号的仅进行时间延迟的过去样本乘以乘数而得到,所述长期预测解码方法包括:
(a)对每个帧,基于表示下列四种方法之一的选择码,从辅助码对时间延迟和乘数进行解码的步骤,
(1)对所述帧将乘数和时间延迟解码一次,
(2)对所述帧分割成的多个副帧的每个副帧解码乘数,
(3)对所述帧分割成的多个副帧的每个副帧解码时间延迟,以及
(4)对所述帧分割成的多个副帧的每个副帧解码乘数和时间延迟。
4.如权利要求3所述的长期预测解码方法,其中,选择码所表示的方法为:
(1)对所述帧将乘数和时间延迟解码一次,
(4)对所述帧分割成的多个副帧的每个副帧解码乘数和时间延迟。
5.一种长期预测编码装置,从输入样本时间系列信号的当前样本中减去相乘结果而得到误差信号样本,该相乘结果通过对从所述输入样本时间系列信号的所述当前样本开始时间延迟的过去样本乘以乘数而得到,所述长期预测编码装置包括:
最小值选择单元,对每个帧选择下列四种方法之一,
(1)对所述帧将乘数码和时间延迟码输出一次,
(2)对所述帧分割成的多个副帧的每个副帧输出乘数码,
(3)对所述帧分割成的多个副帧的每个副帧输出时间延迟码,
(4)对所述帧分割成的多个副帧的每个副帧输出乘数码和时间延迟码,
以使选择码和辅助码以及波形码的组合的综合码量最小或编码失真最小,所述选择码表示所选择的四种方法之一,所述辅助码通过编码时间延迟和乘数而得到,所述波形码通过编码误差信号样本而得到;以及
合成单元,输出所述选择码和辅助码以及波形码的组合。
6.如权利要求5所述的长期预测编码装置,其中,所选择的方法为:
(1)对所述帧将乘数码和时间延迟码输出一次,
(4)对所述帧分割成的多个副帧的每个副帧输出乘数码和时间延迟码。
7.一种长期预测解码装置,将误差信号的当前样本与相乘结果相加而得到再构成的时间系列信号样本,该相乘结果通过对再构成的时间系列信号的仅进行时间延迟的过去样本乘以乘数而得到,所述长期预测解码装置包括:
解码单元,对每个帧,基于表示下列四种方法之一的选择码,从辅助码对时间延迟和乘数进行解码,
(1)对所述帧将乘数和时间延迟解码一次,
(2)对所述帧分割成的多个副帧的每个副帧解码乘数,
(3)对所述帧分割成的多个副帧的每个副帧解码时间延迟,以及
(4)对所述帧分割成的多个副帧的每个副帧解码乘数和时间延迟。
8.如权利要求7所述的长期预测解码装置,其中,选择码所表示的方法为:
(1)对所述帧将乘数和时间延迟解码一次,
(4)对所述帧分割成的多个副帧的每个副帧解码乘数和时间延迟。
CN2010105102681A 2005-01-12 2006-01-11 长期预测编码和长期预测解码的方法和装置 Active CN101996637B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP004915/05 2005-01-12
JP2005004915 2005-01-12

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN2006800015528A Division CN101091317B (zh) 2005-01-12 2006-01-11 用于长期预测编码和长期预测解码的方法和装置

Publications (2)

Publication Number Publication Date
CN101996637A CN101996637A (zh) 2011-03-30
CN101996637B true CN101996637B (zh) 2012-08-08

Family

ID=36677630

Family Applications (3)

Application Number Title Priority Date Filing Date
CN2010105102681A Active CN101996637B (zh) 2005-01-12 2006-01-11 长期预测编码和长期预测解码的方法和装置
CN201010104469A Pending CN101794579A (zh) 2005-01-12 2006-01-11 长期预测编码和长期预测解码的方法和装置
CN2006800015528A Active CN101091317B (zh) 2005-01-12 2006-01-11 用于长期预测编码和长期预测解码的方法和装置

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201010104469A Pending CN101794579A (zh) 2005-01-12 2006-01-11 长期预测编码和长期预测解码的方法和装置
CN2006800015528A Active CN101091317B (zh) 2005-01-12 2006-01-11 用于长期预测编码和长期预测解码的方法和装置

Country Status (6)

Country Link
US (2) US7970605B2 (zh)
EP (2) EP1837997B1 (zh)
JP (2) JP4469374B2 (zh)
CN (3) CN101996637B (zh)
DE (1) DE602006020686D1 (zh)
WO (1) WO2006075605A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006075605A1 (ja) * 2005-01-12 2006-07-20 Nippon Telegraph And Telephone Corporation 長期予測符号化方法、長期予測復号化方法、これら装置、そのプログラム及び記録媒体
US7594098B2 (en) * 2005-07-01 2009-09-22 Stmicroelectronics, Sa Processes and devices for compression and decompression of executable code by a microprocessor with RISC architecture and related system
RU2619710C2 (ru) * 2011-04-21 2017-05-17 Самсунг Электроникс Ко., Лтд. Способ квантования коэффициентов кодирования с линейным предсказанием, способ кодирования звука, способ деквантования коэффициентов кодирования с линейным предсказанием, способ декодирования звука и носитель записи
CN104321814B (zh) * 2012-05-23 2018-10-09 日本电信电话株式会社 频域基音周期分析方法和频域基音周期分析装置
KR101797679B1 (ko) * 2013-07-18 2017-11-15 니폰 덴신 덴와 가부시끼가이샤 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체
US9542955B2 (en) * 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
CN110444217B (zh) * 2014-05-01 2022-10-21 日本电信电话株式会社 解码装置、解码方法、记录介质
CN106782577A (zh) * 2016-11-11 2017-05-31 陕西师范大学 一种基于混沌时间序列预测模型的语音信号编码和解码方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5729655A (en) * 1994-05-31 1998-03-17 Alaris, Inc. Method and apparatus for speech compression using multi-mode code excited linear predictive coding
CN1195930A (zh) * 1997-03-14 1998-10-14 诺基亚流动电话有限公司 音频信号编码方法及其有关设备
CN1465138A (zh) * 2001-06-08 2003-12-31 酒井康江 压缩装置及方法、解压缩装置及方法、压缩/解压缩系统、程序、记录媒体

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0650822B2 (ja) 1985-02-04 1994-06-29 日本電信電話株式会社 符号・復号器
JPH03123113A (ja) 1989-10-05 1991-05-24 Fujitsu Ltd ピッチ周期探索方式
JP3010655B2 (ja) 1989-11-29 2000-02-21 ソニー株式会社 圧縮符号化装置及び方法、並びに復号装置及び方法
JPH03218630A (ja) 1990-01-24 1991-09-26 Matsushita Electric Works Ltd 高耐圧半導体装置
JP2686350B2 (ja) 1990-07-11 1997-12-08 シャープ株式会社 音声情報圧縮装置
JP3123113B2 (ja) 1991-05-20 2001-01-09 凸版印刷株式会社 射出成形品
JP3218630B2 (ja) 1991-07-31 2001-10-15 ソニー株式会社 高能率符号化装置及び高能率符号復号化装置
JPH05119800A (ja) 1991-10-24 1993-05-18 Kyocera Corp デジタル音声データの高能率圧縮方法
CA2124713C (en) 1993-06-18 1998-09-22 Willem Bastiaan Kleijn Long term predictor
JP3311518B2 (ja) * 1994-10-24 2002-08-05 松下電器産業株式会社 音声の長期予測装置
US6778965B1 (en) * 1996-10-10 2004-08-17 Koninklijke Philips Electronics N.V. Data compression and expansion of an audio signal
JP3888597B2 (ja) * 1998-06-24 2007-03-07 日本ビクター株式会社 動き補償符号化装置、及び動き補償符号化復号化方法
JP2000022545A (ja) * 1998-06-29 2000-01-21 Nec Corp 音声符号化方式
JP3171830B2 (ja) 1998-08-26 2001-06-04 株式会社エヌ・シー・エヌ 建築構造部材の処理装置
JP3490325B2 (ja) 1999-02-17 2004-01-26 日本電信電話株式会社 音声信号符号化方法、復号方法およびその符号化器、復号器
CN1639984B (zh) * 2002-03-08 2011-05-11 日本电信电话株式会社 数字信号编码方法、解码方法、编码设备、解码设备
WO2006075605A1 (ja) * 2005-01-12 2006-07-20 Nippon Telegraph And Telephone Corporation 長期予測符号化方法、長期予測復号化方法、これら装置、そのプログラム及び記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5729655A (en) * 1994-05-31 1998-03-17 Alaris, Inc. Method and apparatus for speech compression using multi-mode code excited linear predictive coding
CN1195930A (zh) * 1997-03-14 1998-10-14 诺基亚流动电话有限公司 音频信号编码方法及其有关设备
CN1465138A (zh) * 2001-06-08 2003-12-31 酒井康江 压缩装置及方法、解压缩装置及方法、压缩/解压缩系统、程序、记录媒体

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JP特开平5-35297A 1993.02.12
LIEBCHEN T ET AL.MPEG-4 ALS:an emerging standard.《DATA COMPRESSION CONFERENCE,2004.PROCEEDINGS.PISCATAWAY,NJ,USA IEEE》.2004,全文. *
LIEBCHENTETAL.MPEG-4ALS:anemergingstandard.《DATACOMPRESSIONCONFERENCE 2004.PROCEEDINGS.PISCATAWAY

Also Published As

Publication number Publication date
EP1837997B1 (en) 2011-03-16
JP2010136420A (ja) 2010-06-17
CN101091317B (zh) 2011-05-11
US20080126083A1 (en) 2008-05-29
EP2290824A1 (en) 2011-03-02
JP4469374B2 (ja) 2010-05-26
EP1837997A4 (en) 2009-04-08
JP4761251B2 (ja) 2011-08-31
DE602006020686D1 (de) 2011-04-28
JPWO2006075605A1 (ja) 2008-06-12
CN101996637A (zh) 2011-03-30
EP2290824B1 (en) 2012-05-23
WO2006075605A1 (ja) 2006-07-20
US20110166854A1 (en) 2011-07-07
US8160870B2 (en) 2012-04-17
US7970605B2 (en) 2011-06-28
CN101794579A (zh) 2010-08-04
EP1837997A1 (en) 2007-09-26
CN101091317A (zh) 2007-12-19

Similar Documents

Publication Publication Date Title
CN101996637B (zh) 长期预测编码和长期预测解码的方法和装置
CN102119414B (zh) 用于在超帧中量化和逆量化线性预测系数滤波器的设备和方法
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
CN101807403B (zh) 多信道信号编码方法、解码方法、装置
CN101286319B (zh) 改进语音丢包修补质量的语音编码方法
RU93058657A (ru) Вокодер с переменной скоростью кодирования и передачи данных
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
CN102129862A (zh) 降噪装置及包括降噪装置的声音编码装置
CN102341844B (zh) 编码方法、解码方法、编码装置、解码装置
CN105374362A (zh) 编码方法、解码方法、编码装置、解码装置以及程序
Shoham Constrained-stochastic excitation coding of speech at 4.8 kb/s
JPH056199A (ja) 音声パラメータ符号化方式
US6094630A (en) Sequential searching speech coding device
JPH06236199A (ja) 音声パラメータ符号化方式
JPH05216500A (ja) 音声符号化装置
CN101615394B (zh) 分配子帧的方法和装置
JP3404016B2 (ja) 音声符号化装置及び音声符号化方法
CN103518122B (zh) 码激励线性预测编码器和解码器中的变换域码本
CA2130877C (en) Speech pitch coding system
CN101286321B (zh) 双脉冲激励的线性测编码
CA2170007C (en) Determination of gain for pitch period in coding of speech signal
JP3003531B2 (ja) 音声符号化装置
CN100498933C (zh) 代码转换机及代码转换方法
JP2956068B2 (ja) 音声符号化復号化方式
JP4510977B2 (ja) 音声符号化方法および音声復号化方法とその装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant