CN103329199A - 编码方法、编码装置、周期性特征量决定方法、周期性特征量决定装置、程序、记录介质 - Google Patents

编码方法、编码装置、周期性特征量决定方法、周期性特征量决定装置、程序、记录介质 Download PDF

Info

Publication number
CN103329199A
CN103329199A CN2012800063781A CN201280006378A CN103329199A CN 103329199 A CN103329199 A CN 103329199A CN 2012800063781 A CN2012800063781 A CN 2012800063781A CN 201280006378 A CN201280006378 A CN 201280006378A CN 103329199 A CN103329199 A CN 103329199A
Authority
CN
China
Prior art keywords
mentioned
sample
string
candidate
acoustic signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012800063781A
Other languages
English (en)
Other versions
CN103329199B (zh
Inventor
守谷健弘
原田登
日和崎佑介
鎌本优
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of CN103329199A publication Critical patent/CN103329199A/zh
Application granted granted Critical
Publication of CN103329199B publication Critical patent/CN103329199B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Abstract

提供一种编码技术,以低计算量改善在音响信号的低比特下的编码的质量。包含:间隔决定处理,按照每帧,从间隔T的候选的集合S之中决定对应于音响信号的周期性的样本的间隔T、或对应于音响信号的基本频率的整数倍的样本的间隔T;以及辅助信息生成处理,编码在间隔决定处理中决定的间隔T而得到辅助信息。间隔决定处理将由如下的候选构成的集合作为上述集合S而决定上述间隔T:可通过上述辅助信息表现的间隔T的Z个候选之中的、不依赖于在仅规定帧数量的过去的帧中成为间隔决定步骤的对象的候选而选择的Z2个候选(其中,Z2<Z)、以及在仅规定帧数量的过去的帧中成为间隔决定处理的对象的候选的、Y个候选(其中,Y<Z)。

Description

编码方法、编码装置、周期性特征量决定方法、周期性特征量决定装置、程序、记录介质
技术领域
本发明涉及音响信号的编码技术。更详细地说,涉及决定将音响信号变换至频域得到的频域的样本串的编码与该编码处理时成为样本串的重排的指标的周期性特征量(例如基本频率或基音周期)的技术。
背景技术
作为低比特(例如10kbit/s~20kbit/s左右)的语音信号或音响信号的编码方法,已知对DFT(离散傅里叶变换)或MDCT(变形离散余弦变换)等的正交变换系数的自适应编码。例如作为标准规格技术的AMR-WB+(ExtendedAdaptive Multi-Rate Wideband,扩展的自适应多速率宽带)具有TCX(transformcoded excitation:变换编码激励)编码模式,其中,按照每8个样本归一化并矢量量化DFT系数。
此外,TwinVQ(Transform domain Weighted Interleave Vector Quantization,变换域加权交织矢量量化)中,将MDCT系数整体通过固定的规则重排后的样本的集合作为矢量被编码。此时,例如,也存在采用以下的方法等的情况:从MDCT系数提取每个基音周期的较大分量,将对应于基音周期的信息进行编码,进而重排去除了每个基音周期的较大的分量的剩余的MDCT系数串,通过将重排后的MDCT系数串按照规定样本数目矢量量化而编码。作为关于TwinVQ的文献,能够例示非专利文献1、2。
此外,作为等间隔提取样本并编码的技术,能够例示例如专利文献1。
现有技术文献
专利文献
专利文献1:特开2009-156971号公报
非专利文献
非专利文献1:T.Moriya,N.Iwakami,A.Jin,K.Ikeda,and S.Miki,“ADesign of Transform Coder for Both Speech and Audio Signals at1bit/sample,”Proc.ICASSP’97,pp.1371-1374,1997.
非专利文献2:J.Herre,E.Allamanche,K.Brandenburg,M.Dietz,B.Teichmann,B.Grill,A.Jin,T.Moriya,N.Iwakami,T.Norimatsu,M.Tsushima,T.Ishikawa,“The integrated Filterbank Based Scalable MPEG-4Audio Coder,”105th Convention Audio Engineering Society,4810,1998.
发明内容
发明要解决的课题
以AMR-WB+为首,基于TCX的编码中未考虑基于周期性的频域的系数的振幅的偏移,因此若聚集偏移较大的振幅而编码,则导致编码效率降低。在TCX中的量化或编码中有各种变形例,但例如考虑将通过量化而成为离散值的MDCT系数从频率低的一方起排列的串通过熵编码进行压缩的情况。此时,将多个样本作为1个码元(编码单位),依赖该码元之前的码元自适应地控制分配码。一般,若振幅小则分配短码,在振幅大的情况下分配长码。依赖码元之前的码元自适应地控制分配码,因此若振幅的小值连续,则分配越短的码,另一方面,若小振幅的样本之后突然出现大振幅,则分配非常长的码。
此外,现有的TwinVQ以使用对由规定样本构成的矢量的全部分配相同的码本的码的固定长度码的矢量量化作为前提而设计,根本没有设想使用可变长度编码对MDCT系数进行编码。
本发明鉴于这样的技术背景而完成,其目的在于,提供以低运算量改善离散信号、特别是语音音响数字信号在低比特下的编码的质量的编码技术、以及决定成为该编码时实施的样本串的重排的指标的周期性特征量的技术。
用于解决课题的手段
根据本发明的编码技术,一种编码方法用于来自帧单位的音响信号的频域的样本串,具有:间隔决定处理,按照每帧,从间隔T的候选的集合S中决定对应于音响信号的周期性的样本的间隔T、或者对应于音响信号的基本频率的整数倍的样本的间隔T;辅助信息生成处理,对在上述间隔决定处理中决定的间隔T进行编码而得到辅助信息;以及样本串编码处理,将如下的样本串作为重排后的样本串,并对重排后的样本串进行编码得到码串:(1)包含样本串的全部的样本,且(2)基于间隔决定处理中决定的间隔T,重排在样本串中包含的至少一部分样本,以便包含样本串中的对应于音响信号的周期性或基本频率的样本的一个或者连续的多个样本、以及包含样本串中的对应于音响信号的周期性或基本频率的整数倍的样本的一个或者连续的多个样本、的全部或一部分的样本聚集。在间隔决定处理中,将由如下的候选构成的集合作为集合S而决定间隔T:可通过上述辅助信息表现的间隔T的Z个候选之中的、不依赖于在仅规定帧数量的过去的帧中成为间隔决定处理的对象的候选而选择的Z2个候选(其中,Z2<Z)、以及在仅规定帧数量的过去的帧中成为间隔决定处理的对象的候选的、Y个候选(其中,Y<Z)。
间隔决定处理也可以进一步包含追加处理,将与在仅规定帧数量的过去的帧中成为间隔决定处理的对象的候选相邻的值或/和具有规定的差分的值添加于集合S。
间隔决定处理也可以进一步包含预备选择处理,从作为可通过辅助信息表现的间隔T的Z个候选之中的一部分的Z1个候选中,将基于根据当前帧的音响信号或/和样本串求得的指标而选择的一部分的候选设为Z2个候选(其中Z2<Z1)。
间隔决定处理进一步包含:预备选择处理,从作为可通过辅助信息表现的间隔T的Z个候选之中的一部分的Z1个候选中,基于根据当前帧的音响信号或/和样本串求得的指标而选择一部分候选;以及第二追加处理,将在预备选择处理中选择的候选、与相邻于在预备选择处理中选择的候选的值或/和具有规定的差分的值的组设为Z2个候选。
间隔决定处理也可以包含:第二预备选择处理,基于根据当前帧的音响信号或/和样本串求得的指标,选择在集合S中包含的间隔T的候选之中的一部分的候选;以及最终选择处理,以由在第二预备选择处理中选择的一部分候选构成的集合作为对象,决定间隔T。
也可以表示当前帧的音响信号的稳定性的大小的指标值越大,在集合S中在仅规定帧数量的过去的帧中成为间隔决定处理的对象的候选占的比例越大。
也可以在表示当前帧的音响信号的稳定性的大小的指标值比规定的条件小的情况下,在集合S中仅包含Z2个候选。
表示上述当前帧的上述音响信号的稳定性的大小的指标值也可以是在
(a-1)“当前帧的上述音响信号的预测增益”大,
(a-2)“当前帧的上述音响信号的预测增益的估计值”大,
(b-1)“前一帧的预测增益”与“当前帧的预测增益”的差分小,
(b-2)“前一帧的预测增益的估计值”与“当前帧的预测增益的估计值”的差分小,
(c-1)“当前帧中包含的上述音响信号的样本的振幅之和”大,
(c-2)“将当前帧中包含的上述音响信号的样本串变换至频域而得到的样本串中包含的样本的振幅之和”大,
(d-1)“前一帧中包含的上述音响信号的样本的振幅之和”与“当前帧中包含的上述音响信号的样本的振幅之和”的差分小,
(d-2)“将前一帧中包含的上述音响信号的样本串变换至频域而得到的样本串中包含的样本的振幅之和”与“将当前帧中包含的上述音响信号的样本串变换至频域而得到的样本串中包含的样本的振幅之和”的差分小,
(e-1)“当前帧的上述音响信号的功率”大,
(e-2)“将当前帧的上述音响信号的样本串变换至频域而得到的样本串的功率”大,
(f-1)“前一帧的上述音响信号的功率”与“当前帧的上述音响信号的功率”的差分小,
(f-2)“将前一帧的上述音响信号的样本串变换至频域而得到的样本串的功率”与“将当前帧的上述音响信号的样本串变换至频域而得到的样本串的功率”的差分小中的至少任一个条件满足的情况下变大的值。
样本串编码处理也可以包含输出对重排前的样本串进行编码而得到的码串、以及对重排后的样本串进行编码而得到的码串和辅助信息之中码量少的一方的处理。
样本串编码处理也可以在对重排后的样本串进行编码而得到的码串的码量或其估计值与辅助信息的码量的合计,比对重排前的样本串进行编码而得到的码串的码量或其估计值少的情况下,输出对重排后的样本串进行编码而得到的码串与辅助信息,在对重排前的样本串进行编码而得到的码串的码量或其估计值,比对重排后的样本串进行编码而得到的码串的码量或其估计值与辅助信息的码量的合计小的情况下,输出对重排前的样本串进行编码而得到的码串。
也可以在前一个帧中输出的码串是对重排后的样本串进行编码而得到的码串的情况与在前一帧中输出的码串是对重排前的码串进行编码而得到的码串的情况相比,在仅规定帧数量的过去的帧中成为间隔决定处理的对象的候选在集合S中占的比例大。
也可以在之前帧中输出的码串是对重排前的样本串进行编码而得到的码串的情况下,在集合中仅包含Z2个候选。
也可以在当前帧是时间上在前头的帧的情况、在前一帧通过本发明的编码方法以外的方法编码的情况、在前一帧中输出的码串是对重排前的样本串进行编码而得到码串的情况、中的任何一个对应的情况下,在集合S中仅包含上述Z2个候选。
此外,本发明的决定帧单位的音响信号的周期性特征量的方法包含:周期性特征量决定处理,按照每帧,从周期性特征量的候选的集合中决定音响信号的周期性特征量;以及辅助信息生成处理,对在周期性特征量决定处理中得到的周期性特征量进行编码而得到辅助信息。在周期性特征量决定处理中,将由以下候选构成的集合作为周期性特征量的候选的集合S而决定周期性特征量:将可通过辅助信息表现的周期性特征量的Z个候选之中的、不依赖于在仅规定帧数量的过去的帧中成为周期性特征量决定处理的对象的候选而选择的Z2个候选(其中Z2<Z)、以及在仅规定帧数量的过去的帧中成为周期性特征量决定处理的对象的候选、的Y个候选(其中Y<Z)。
周期性特征量决定处理也可以进一步包含追加处理:将与在仅规定帧数量的过去的帧中成为周期性特征量决定处理的对象的候选相邻的值或/和具有规定的差分的值添加于集合S。
也可以表示当前帧的音响信号的稳定性的大小的指标值越大,在仅规定帧数量的过去的帧中成为周期性特征量决定步骤的对象的候选在集合S中占的比例越大。
也可以在表示当前帧的音响信号的稳定性的大小的指标值比规定的条件小的情况下,在集合S中仅包含上述Z2个候选。
表示上述当前帧的音响信号的稳定性的大小的指标值也可以是在,
(a-1)“当前帧的上述音响信号的预测增益”大,
(a-2)“当前帧的上述音响信号的预测增益的估计值”大,
(b-1)“前一帧的预测增益”与“当前帧的预测增益”的差分小,
(b-2)“前一帧的预测增益的估计值”与“当前帧的预测增益的估计值”的差分小,
(c-1)“当前帧中包含的上述音响信号的样本的振幅之和”大,
(c-2)“将当前帧中包含的上述音响信号的样本串变换至频域而得到的样本串中包含的样本的振幅之和”大,
(d-1)“前一帧中包含的上述音响信号的样本的振幅之和”与“当前帧中包含的上述音响信号的样本的振幅之和”的差分小,
(d-2)“将前一帧中包含的上述音响信号的样本串变换至频域而得到的样本串中包含的样本的振幅之和”与“将当前帧中包含的上述音响信号的样本串变换至频域而得到的样本串中包含的样本的振幅之和”的差分小,
(e-1)“当前帧的上述音响信号的功率”大,
(e-2)“将当前帧的上述音响信号的样本串变换至频域而得到的样本串的功率”大,
(f-1)“前一帧的上述音响信号的功率”与“当前帧的上述音响信号的功率”的差分小,
(f-2)“将前一帧的上述音响信号的样本串变换至频域而得到的样本串的功率”与“将当前帧的上述音响信号的样本串变换至频域而得到的样本串的功率”的差分小中的至少任一个条件满足的情况下变大的值。
发明效果
根据本发明,例如通过进行如下处理,实现编码效率的提高和量化失真的减轻等:通过将来自音响信号的频域样本串中包含的至少一部分的样本重排,使得包含音响信号的对应于周期性或基本频率的样本的一个或连续的多个样本、以及包含音响信号的对应于周期性或基本频率的整数倍的样本的一个或连续的多个样本聚集,以进行重排使得反映样本的大小的指标相等或相同程度的样本聚集这样的较少的计算量就可执行。此外,基于音响信号的稳定区间的性质,通过考虑过去的帧中考虑的周期性特征量或上述间隔的候选,能够高效地进行在当前帧中的周期性特征量或上述间隔的决定。
附图说明
图1是表示编码装置的实施方式的功能结构例的图。
图2是表示编码方法的实施方式的处理顺序的图。
图3是用于说明在样本串中包含的样本的重排的一例的概念图。
图4是用于说明在样本串中包含的样本的重排的一例的概念图。
图5是表示解码装置的实施方式的功能结构例的图。
图6是表示解码方法的实施方式的处理顺序的图。
图7是表示用于决定间隔T的处理功能的一例的图。
图8是表示用于决定间隔T的处理顺序的一例的图。
图9是表示用于决定间隔T的处理顺序的变形例的图。
图10是表示编码装置的实施方式的变形例的图。
具体实施方式
参照附图说明本发明的实施方式。另外,对重复的结构要素分配相同的参照标号而省略重复说明。
本发明的特征之一在于,在量化来自规定的时间区间的音响信号的频域的样本串的框架中,通过基于频域的样本的特征量的样本的重排,量化失真变小,并通过利用可变长度编码减少码量这样的编码的改善。以下,将规定的时间区间称为帧。例如在基本周期比较明确的帧中,通过配合周期性的样本的重排,使大振幅的样本集中,从而实现编码的改善。此处,作为来自音响信号的频域的样本串,例如,能够例示帧单位的语音音响数字信号从时域变换至频域而得到的DFT系数串或MDCT系数串、对这样的系数串应用归一化、加权、量化等的处理的系数串等。以下,以MDCT系数串为例说明本发明的实施方式。
[实施方式]
“编码处理”
首先参照图1~图4说明编码处理。本发明的编码处理,通过例如具有频域变换部1、加权包络归一化部2、归一化增益计算部3、量化部4、重排部5、编码部6的图1的编码装置100,或者具有频域变换部1、加权包络归一化部2、归一化增益计算部3、量化部4、重排部5、编码部6、间隔决定部7、辅助信息生成部8的图10的编码装置100a而进行。但是,编码装置100或编码装置100a不需要必须具有频域变换部1、加权包络归一化部2、归一化增益计算部3、量化部4,例如,存在编码装置100由重排部5、编码部6构成,编码装置100a由重排部5、编码部6、间隔决定部7、辅助信息生成部8构成的情况。另外,图10中例示的编码装置100a中,间隔决定部7包含重排部5、编码部6、辅助信息生成部8,但不限于这样的结构。
“频域变换部1”
首先,频域变换部1以帧单位将语音音响数字信号变换为频域的N点MDCT系数串(步骤S1)。
作为一般理论,能够在编码侧量化MDCT系数串,对量化后的MDCT系数串进行编码,将得到的码串传输至解码侧,在解码侧再构成从该码串量化的MDCT系数串,进而通过MDCT反变换再构成时域的语音音响数字信号。但是,MDCT系数的振幅与通常的DFT的功率谱具有近似相同的振幅包络(功率谱包络)。因此,通过进行与振幅包络的对数值成比例的信息分配,能够使全频带的MDCT系数的量化失真(量化误差)均等地分散,能够减小整体的量化失真,此外还实现信息压缩。另外,使用通过线性预测分析求得的线性预测系数,能够有效地估计功率谱包络。作为这样的控制量化误差的方法,有将各MDCT系数的量化比特自适应地分配(在将振幅平坦化后调整量化的步幅)的方法、通过加权矢量量化自适应地加权而决定码的方法。此处,说明在本发明的实施方式中执行的量化方法的一例,但需留意不限于说明的量化方法。
“加权包络归一化部2”
加权包络归一化部2通过利用通过对于帧单位的语音音响数字信号的线性预测分析求得的线性预测系数而估计的语音音响数字信号的功率谱包络系数串,归一化被输入的MDCT系数串的各系数,输出加权归一化MDCT系数串(步骤S2)。此处,为了实现听觉上失真小的量化,加权包络归一化部2使用使功率谱包络缓和的加权功率谱包络系数串,以帧单位归一化MDCT系数串的各系数。其结果,加权归一化MDCT系数串不具有输入的MDCT系数串那样的大振幅的倾斜或振幅的凹凸,但具有与语音音响数字信号的功率谱包络系数串类似的大小关系,即,在对应于低频率的系数侧的区域具有较大的振幅,具有起因于基音周期的微小结构。
[加权包络归一化处理的具体例]
对应于N点的MDCT系数串的各系数X(1),…,X(N)的功率谱包络系数串的各系数W(1),…,W(N)能够将线性预测系数变换至频域而得到。例如,通过作为全极点模型的p次自回归过程,时刻t的时间信号x(t)通过追溯至p时刻的过去的自身的值x(t-1),…,x(t-p)、预测残差e(t)、线性预测系数α1,…,αp,由式(1)表示。此时,功率谱包络系数串的各系数W(n)[1≦n≦N]由式(2)表示。exp(·)是将纳皮尔数作为底的指数函数,j是虚数单位,σ2是预测残差能量。
[数1]
x(t)+α1x(t-1)+…+αpx(t-p)=e(t)   (1)
W ( n ) = &sigma; 2 2 &pi; 1 | 1 + &alpha; 1 exp ( - jn ) + &alpha; 2 exp ( - 2 jn ) + &CenterDot; &CenterDot; &CenterDot; + &alpha; p exp ( - pjn ) | 2 - - - ( 2 )
线性预测系数可以通过加权包络归一化部2将输入到频域变换部1的语音音响数字信号进行线性预测分析而得到,也可以通过编码装置100内或编码装置100a内的未图示的其他部件将语音音响数字信号进行线性预测分析而得到。在这样的情况下,加权包络归一化部2使用线性预测系数求得功率谱包络系数串的各系数W(1),…,W(N)。此外,在通过编码装置100内或编码装置100a内的其他部件(功率谱包络系数串计算部9)已经得到了功率谱包络系数串的各系数W(1),…,W(N)的情况下,加权包络归一化部2能够使用该功率谱包络系数串的各系数W(1),…,W(N)。另外,在后述的解码装置200中也需要得到与编码装置100或编码装置100a中得到的值相同的值,因此利用量化后的线性预测系数和/或功率谱包络系数串。在以后的说明中,只要没有特别提及,“线性预测系数”或“功率谱包络系数串”的意思是量化后的线性预测系数或功率谱包络系数串。此外,线性预测系数例如通过现有的编码技术被编码后,向解码侧传输预测系数码。现有的编码技术是例如将对应于线性预测系数的码作为预测系数码的编码技术、将线性预测系数变换为LSP参数并将对应于LSP参数的码作为预测系数码的编码技术、将线性预测系数变换为PARCOR系数并将对应于PARCOR系数的码作为预测系数码的编码技术等。通过在编码装置100内或编码装置100a内的其他部件得到功率谱包络系数串的结构的情况下,在编码装置100内或编码装置100a内的其他部件中线性预测系数通过现有的编码技术被编码,预测系数码被传输至解码侧。
此处,作为加权包络归一化处理的具体例而表示两个例子,但本发明不限于这些例子。
<例1>
加权包络归一化部2进行如下处理:通过将MDCT系数串的各系数X(1),…,X(N)除以对应于该各系数的功率谱包络系数串的各系数的校正值Wγ(1),…,Wγ(N),得到加权归一化MDCT系数串的各系数X(1)/Wγ(1),…,X(N)/Wγ(N)。校正值Wγ(n)[1≦n≦N]由式(3)提供。其中,γ是1以下的正的常数,是使功率谱系数缓和的常数。
[数2]
W &gamma; ( n ) = &sigma; 2 2 &pi; ( 1 + &Sigma; i = 1 p &alpha; i &gamma; i exp ( - ijn ) ) 2 - - - ( 3 )
<例2>
加权包络归一化部2进行如下处理:通过将MDCT系数串的各系数X(1),…,X(N)除以对应于该各系数的功率谱密包络系数串的各系数的β次方(0<β<1)的值W(1)β,…,W(N)β,得到加权归一化MDCT系数串的各系数X(1)/W(1)β,…,X(N)/W(N)β
其结果,得到帧单位的加权归一化MDCT系数串,但加权归一化MDCT系数串不具有输入的MDCT系数串那样的大振幅的倾斜或振幅的凹凸,但与输入的MDCT系数串的功率谱包络具有类似的大小关系,即,在对应于低频率的系数侧的区域具有较大振幅,具有起因于基音周期的微小结构。
另外,在解码侧进行对应于加权包络归一化处理的反处理,即,进行从加权归一化MDCT系数串复原MDCT系数串的处理,因此需要在编码侧和解码侧预先共用地设定根据功率谱包络系数串算出加权功率谱包络系数串的方法。
“归一化增益计算部3”
接着,归一化增益计算部3使用在全频率的振幅值之和或能量值决定量化步幅,使得在按照每帧,能够通过所提供的总比特数量化加权归一化MDCT系数串的各系数,求得将加权归一化MDCT系数串的各系数进行除法的系数(以下称为增益)以便成为该量化步幅(步骤S3)。表示该增益的信息作为增益信息被传输至解码侧。归一化增益计算部3在每帧,将加权归一化MDCT系数串的各系数通过该增益归一化(进行除法)。
“量化部4”
接着,量化部4按照每帧,将通过增益归一化的加权归一化MDCT系数串的各系数通过在步骤S3的处理中决定的量化步幅进行量化(步骤S4)。
“重排部5”
在步骤S4的处理中得到的帧单位的量化MDCT系数串变为作为本实施方式的主要部分的重排部5的输入,但重排部5的输入并不限定于在步骤S1~步骤S4的各处理中得到的系数串。例如,也可以是未应用加权包络归一化部2的归一化的系数串或未应用量化部4的量化的系数串。为了明示地理解该情况,以下,将重排部5的输入称为来自音响信号的“频域的样本串”或简单称为“样本串”。该实施方式中,在步骤S4的处理中得到的量化MDCT系数串相当于“频域的样本串”,此时,构成频域的样本串的样本相当于在量化MDCT系数串中包含的系数。
重排部5按照每帧,将重排在频域的样本串中包含的至少一部分样本后的样本作为重排后的样本串而输出,使得(1)包含频域的样本串的全部样本,且(2)反映样本的大小的指标相等或同程度的样本聚集(步骤S5)。此处的“反映样本的大小的指标”例如是样本的振幅的绝对值或能量(平方值),但不限定于此。
[重排处理的细节]
说明该重排处理的具体例。例如,重排部5以聚集(1)包含样本串的全部的样本且(2)包含对应于样本串之中的音响信号的周期性或基本频率的样本的一个或连续的多个样本、以及包含对应于样本串之中的音响信号的周期性或基本频率的整数倍的样本的一个或连续的多个样本、的全部或一部分的样本的方式重排在样本串中包含的至少一部分的样本,并将其作为重排后的样本串输出。即,以聚集包含对应于音响信号的周期性或基本频率的样本的一个或连续的几个样本,以及包含对应于该音响信号的周期性或基本频率的整数倍的样本的一个或连续的多个样本的方式,重排在输入的样本串中包含的至少一部分的样本。
其理由是,一种音响信号,该音响信号中对应于基本频率或高次谐波(基本频率的整数倍波)的样本与其附近的样本的振幅的绝对值或能量比对应于去除基本频率和高次谐波的频域的样本的振幅的绝对值或能量大,特别是基于在语音或音乐等中显著的特征。此处,还承认特征如下,由于从语音或音乐等音响信号中提取的音响信号的周期性的特征量(例如基音周期)与基本频率是等价的,所以对应于音响信号的周期性的特征量(例如基音周期)或其整数倍的样本与其附近的样本的振幅的绝对值或能量,比对应于去除周期性特征量和其整数倍的频域的样本的振幅的绝对值或能量大。
然后,包含对应于音响信号的周期性或基本频率的样本的一个或连续的多个样本,以及包含对应于该音响信号的周期性或基本频率的整数倍的样本的一个或连续的多个样本,以在低频率侧聚合的方式被聚集。以下,将表示对应于音响信号的周期性或基本频率的样本与对应于该音响信号的周期性或基本频率的整数倍的样本的间隔(以下简称为间隔)的符号设为T。
作为具体例,重排部5从输入的样本串选择包含对应于间隔T的整数倍的样本F(nT)的前后的样本F(nT-1)、F(nT+1)的3个样本F(nT-1)、F(nT)、F(nT+1)。F(j)是对应于表示与频率对应的样本索引的序号j的样本。假设n是从1起,nT+1不超过预先设定的对象样本的上限N的范围的各整数。n=1对应于基本频率,n>1对应于高次谐波。假设表示对应于频率的样本索引的序号j的最大值为jmax。将根据n选择的样本的集合称为样本群。上限N也可以与jmax一致,但由于在语音或音乐等的音响信号中高频的样本的指标一般充分小的情况较多,所以从为了后述的编码效率的提高而将具有大指标的样本向低频率侧聚集的观点出发,N也可以是比jmax小的值。例如,N也可以是大概jmax的一半左右的值。若将基于上限N决定的n的最大值设为nmax,则在输入的样本串中包含的样本之中,对应于从最低频率到第一规定频率nmax*T+1的各频率的样本成为重排的对象。另外,记号*表示乘法。
重排部5将选择的样本F(j)以保持原来的序号j的大小关系状态,从样本串的前头开始依次配置,从而生成样本串A。例如,在n表示从1至5的各整数的情况下,重排部5从样本串的前头开始排列第一样本群F(T-1)、F(T)、F(T+1),第二样本群F(2T-1)、F(2T)、F(2T+1),第三样本群F(3T-1)、F(3T)、F(3T+1),第四样本群F(4T-1)、F(4T)、F(4T+1),第五样本群F(5T-1)、F(5T)、F(5T+1)。即,15个样本F(T-1)、F(T)、F(T+1)、F(2T-1)、F(2T)、F(2T+1)、F(3T-1)、F(3T)、F(3T+1)、F(4T-1)、F(4T)、F(4T+1)、F(5T-1)、F(5T)、F(5T+1)以该顺序从样本串的前头开始排列,这些15个样本构成样本串A。
进而,重排部5将未被选择的样本F(j),以保持原来的序号j的大小关系状态从样本串A的最后开始依次配置。未被选择的样本F(j)是位于构成样本串A的样本群之间的样本,将这样的连续的聚合的样本称为样本组。即,若是上述例,则第一样本组F(1),…,F(T-2),第二样本组F(T+2),…,F(2T-2),第三样本组F(2T+2),…,F(3T-2),第四样本组F(3T+2),…,F(4T-2),第五样本组F(4T+2),…,F(5T-2),第六样本组F(5T+2),…,F(jmax)从样本串A的最后开始依次排列,这些样本构成样本串B。
总之,若是该例,则输入的样本串F(j)(1≦j≦jmax)重排为F(T-1)、F(T)、F(T+1)、F(2T-1)、F(2T)、F(2T+1)、F(3T-1)、F(3T)、F(3T+1)、F(4T-1)、F(4T)、F(4T+1)、F(5T-1)、F(5T)、F(5T+1)、F(1),…,F(T-2)、F(T+2),…,F(2T-2)、F(2T+2),…,F(3T-2)、F(3T+2),…,F(4T-2)、F(4T+2),…,F(5T-2)、F(5T+2),…F(jmax)(参照图3)。
另外,在低频带中,即使是对应于音响信号的周期性或基本频率的样本或其整数倍的样本以外的样本,各样本具有较大值的振幅或功率的情况较多。因此,也可以不进行对应于从最低频率至规定的频率f的各频率的样本的重排。例如,若设规定的频率f为nT+α,则不重排重排前的样本F(1),…,F(nT+α),将重排前的F(nT+α+1)以后的样本作为重排的对象。α被预先设定为0以上且比T小一定程度的整数(例如不超过T/2的整数)。此处n也可以是2以上的整数。或者,也可以是不重排从对应于重排前的最低频率的样本起连续的p个样本F(1),…F(P),将重排前的F(P+1)以后的样本作为重排的对象。此时,规定的频率f是P。对于成为重排的对象的样本的集合的重排的基准如上所述。另外,在设定第一规定频率的情况下,规定的频率f(第二规定频率)比第一规定频率小。
例如,在不重排重排前的样本F(1),…,F(T+1),将重排前的F(T+2)以后的样本作为重排的对象的情况下,如果按照上述的重排的基准,则输入的样本串F(j)(1≦j≦jmax)重排于F(1),…,F(T+1)、F(2T-1)、F(2T)、F(2T+1)、F(3T-1)、F(3T)、F(3T+1)、F(4T-1)、F(4T)、F(4T+1)、F(5T-1)、F(5T)、F(5T+1)、F(T+2),…,F(2T-2)、F(2T+2),…,F(3T-2)、F(3T+2),…,F(4T-2)、F(4T+2),…,F(5T-2)、F(5T+2),…F(jmax)(参照图4)。另外,在图3以及图4中,图示了频率区域的样本串中包含的全部的样本值是0以上的值的情况,但其仅仅是用于容易理解地图示通过样本的重排,具有更大的振幅的样本偏于低频域侧的情况的权宜之策。有时在频域的样本串中包含的各样本取正或者负或者零值,即使在这样的情况下,只要执行上述的重排处理或后述的重排处理即可。
在全部帧中,用于决定成为重排的对象的序号j的最大值的上限N或第一规定频率也可以不设为共用的值,而是按照每帧设定不同的上限N或第一规定频率。此时,在每帧中向解码侧发送用于指定上限N或第一规定频率的信息即可。此外,也可以不指定成为重排的对象的序号j的最大值,而指定重排的样本群的个数,此时,也可以按照每帧设定样本群的个数,并将用于指定样本群的个数的信息发送至解码侧。当然,也可以在全部的帧中共用重排的样本群的个数。此外,对于第二规定频率f,也可以在全部的帧中不设为共用的值,而按照每帧设定不同的第二规定频率f。此时,按照每帧将用于指定第二规定频率的信息发送至解码侧即可。
这样重排后的样本串在以频率为横轴并以样本的指标为纵轴的情况下,样本的指标的包络线随着频率的增大而示出下降趋势。作为其理由,可举出以下的事实:频率区域的样本串作为音响信号、特别是语音信号或音乐信号的特征,一般高次谐波较少。换言之,重排部5也可以重排在输入的样本串中包含的至少一部分的样本,使得样本的指标的包络线随着频率的增大而示出下降趋势。
进而,在该实施方式中,进行了在低频域侧,聚集包含对应于周期性或基本频率的样本的一个或连续的多个样本、以及包含对应于周期性或基本频率的整数倍的样本的一个或连续的多个样本的重排,但反之也可以进行在高频域侧,聚集包含对应于周期性或基本频率的样本的一个或连续的多个样本、以及包含对应于周期性或基本频率的整数倍的样本的一个或连续的多个样本的重排。此时,在样本串A中样本群以逆序排列,在样本串B中样本组以逆序排列,在低频域配置样本串B且在样本B之后配置样本A。即,若是上述例,则从低频域起,以第六样本组F(5T+2),…F(jmax)、第五样本组F(4T+2),…,F(5T-2)、第四样本组F(3T+2),…,F(4T-2)、第三样本组F(2T+2),…,F(3T-2)、第二样本组F(T+2),…,F(2T-2)、第一样本组F(1),…F(T-2),第五样本群F(5T-1)、F(5T)、F(5T+1)、第四样本群F(4T-1)、F(4T)、F(4T+1)、第三样本群F(3T-1)、F(3T)、F(3T+1)、第二样本群F(2T-1)、F(2T)、F(2T+1)、第一样本群F(T-1)、F(T)、F(T+1)的顺序排列样本。
这样重排后的样本串在以频率为横轴,以样本的指标为纵轴的情况下,样本的指标的包络线随着频率的增大而示出下降趋势。换言之,重排部5也可以重排在输入的样本串中包含的至少一部分的样本,使得样本的指标的包络线随着频率的增大而示出下降趋势。
间隔T也可以不是整数而是小数(例如5.0、5.25、5.5、5.75)。此时,例如,将R(nT)设为将nT四舍五入后的值,选择F(R(nT-1))、F(R(nT))、F(R(nT+1))。
“编码部6”
编码部6对输入的重排后的样本串进行编码,输出得到的码串(步骤S6)。编码部6根据输入的重排后的样本串中包含的样本的振幅的偏向,切换可变长度编码而进行编码。即,通过重排在帧内低频域侧(或高频域侧)聚集振幅大的样本,因此编码部6进行适应于该偏向的可变长度编码。如重排后的样本串那样,若在每个局部区域中聚集具有相同或相同程度的振幅的样本,则例如通过在每个区域中以不同的莱斯参数进行莱斯编码(Rice Coding),从而能够削减平均码量。以下,以在帧内低频域侧(与帧的前头接近的侧)聚集振幅大的样本的情况为例进行说明。
[编码的具体例]
作为具体例,编码部6在聚集具有对应于大振幅的指标的样本的区域中,按照每个样本应用莱斯编码(称为哥伦布-莱斯编码)。
该区域以外的区域中,编码部6按照每多个样本应用熵编码(霍夫曼编码或算数编码等)。关于莱斯编码的应用,也可以固定莱斯编码的应用领域与莱斯参数,或者也可以是能够从不同的多个选项中选择一个莱斯编码的应用区域与莱斯参数的组合的结构。在这样的从多个选项中选择一个时,作为莱斯编码的选择信息,能够使用例如下述那样的可变长度编码(符号“”括起的二进制值),编码部6在码串中还包含选择信息而输出。
“1”:不应用莱斯编码。
“01”:在前头开始的1/32的区域中将莱斯参数取1而应用莱斯编码。
“001”:在前头开始的1/32的区域中将莱斯参数取2而应用莱斯编码。
“0001”:在前头开始的1/16的区域中将莱斯参数取1而应用莱斯编码。
“00001”:在前头开始的1/16的区域中将莱斯参数取2而应用莱斯编码。
“00000”:在前头开始的1/32的区域中将莱斯参数取3而应用莱斯编码。
另外,作为决定从这样的选项中选择哪个好的方法,也可以采用比较对应于在编码处理中得到的各莱斯编码的码串的码量,选择码量最小的选项的方法。
此外,若在重排后的样本串中出现具有0的振幅的样本长时间持续的区域,则对具有0振幅的样本的连续数进行例如行程编码(Run Length coding),能够削减平均码量。在这样的情况下,编码部6(1)在聚集具有对应于大振幅的指标的样本的区域中按照每个样本应用莱斯编码,(2)在该区域以外的区域中,(a)在具有0振幅的样本连续的区域中,进行输出用于表示具有0振幅的样本的连续数的码的编码,(b)在剩余的区域中,按照每多个样本应用熵编码(霍夫曼编码或算术编码等)。即使在这样的情况下,也可以进行上述那样的莱斯编码的选择。此时,需要向解码侧还传输用于表示在哪个区域应用莱斯编码的信息,例如该信息包含于上述码串中。进而,在作为选项准备多个属于熵编码的编码方法的情况下,还需要向解码侧传输用于特定选择哪个编码的信息,例如该信息包含于上述的码串。
[间隔T的决定方法]
说明间隔T的决定方法。作为简便的决定方法的一例,能够列举以下的决定方法:预先准备间隔T不同的Z个候选T1,T2,…,TZ,重排部5对各候选Ti(i=1,2,…,Z),实施样本串中包含的样本的重排,得到对应于后述的编码部6基于各候选Ti得到的样本串的码串的码量,将提供最小的码量的候选Ti作为间隔T来选择。从编码部6输出用于确定样本串中包含的样本的重排的辅助信息、例如对间隔T进行编码而得到的码。
为了决定适当的间隔T,期望Z是充分大的数。但是,若Z是充分大的数,则为了针对全部的候选计算实际的码量需要相当的运算处理量,可能存在从效率的观点出发成为问题的情况。为了从这样的观点出发削减运算处理量,考虑对Z个候选使用预备选择处理从而将候选的数目缩小至Y个。此处,预备选择处理是指通过近似求得对应于基于各候选得到的重排后的样本串(根据情况也可以是重排前的样本串)的码串的码量,(求得码量的估计值),或反映该码串的码量的指标,或被承认与该码串的码量的大小关联的指标(其中,此处的指标与“码量”不同),选择成为最终选择处理的对象的候选的处理。最终选择处理是基于对应于样本串的码串的实际的码量选择间隔T的处理。考虑各种预备选择处理的具体的处理内容,但无论如何分别针对通过预备选择处理得到的Y个候选实际地进行对应于样本串的码串的码量的计算,选择提供最小的码量的候选Tj(Tj∈SY;其中SY表示Y个候选的集合)作为间隔T。Y必须至少满足Y<Z,但从运算处理量的有意义的削减的观点出发,优选预先设定Y为比Z小某种程度的值,以便例如满足Y≦Z/2。一般算出码量的处理需要极大的运算处理量,但若将该运算处理量设为A,预备选择处理的运算处理量假设是其1/10左右的运算处理量A/10,进行针对Z个候选的全部算出码量的处理,则该运算处理量是ZA,另一方面,若针对Z个候选进行预备选择处理,并进行针对在预备选择处理中选定的Y个候选算出码量的处理,则整体的运算处理量是(ZA/10+YA)。此时可知,若满足Y<9Z/10,则经由预备选择处理的方法更能够以较少的运算处理量决定间隔T。
本发明中,提供通过进一步少的运算处理量决定间隔T的方法,在说明该实施方式之前,说明以低运算处理量决定间隔T的概念。
一般来说,在语音或音乐等的音响信号中,跨越多个帧的稳定的信号区间中音响信号的周期性特征量在该多个帧中缓慢变化的情况较多。因此,认为通过考虑在某帧Xt的前一时间的帧Xt-1中决定的间隔Tt-1,能够有效地决定在该帧Xt中的间隔Tt。但是,并不限定于在帧Xt-1中决定的间隔Tt-1在帧Xt中也是适当的间隔Tt,因此,不仅考虑帧Xt-1中决定的间隔Tt-1,而优选将在帧Xt-1中决定间隔Tt-1时使用的间隔T的候选包含于在帧Xt中决定间隔Tt时的间隔T的候选。
另一方面,在跨越多个帧的不稳定的信号区间中,即使是相邻的帧之间,也很难期待音响信号的周期性特征量的连续性。因此,若是未通过未图示的其他手段判定跨越多个帧的信号区间是稳定的信号区间还是不稳定的信号区间的状况,则不能说“从在帧Xt-1中决定间隔Tt-1时使用的间隔T的候选中,探索帧Xt中的间隔Tt”的方法一定带来优选的结果。即,在该状况下,从不依赖于在帧Xt-1中决定间隔Tt-1时使用的间隔T的候选的间隔T的候选之中,也能够探索帧Xt中的间隔Tt较好。
具体说明基于这样的概念的实施方式(参照图7与图8)。该实施方式中,如图10所示,在编码装置100a中具有间隔决定部7,在间隔决定部7内具有重排部5、编码部6、以及辅助信号生成部8。
(A)预备选择处理(步骤S71)
能够通过用于确定在样本串中包含的样本的重排的辅助信息表现的间隔T的候选,与对辅助信息进行固定长度编码还是可变长度编码等的后述的编码方法对应而被预先决定。间隔决定部7预先存储从该预先决定的间隔T不同的Z个候选T1,T2,…,TZ之中预先决定的Z1个候选(Z1<Z)。其目的是减少成为预备选择处理的对象的候选的数目。期望成为预备选择处理的对象的候选中,尽可能多地包含在T1,T2,…,TZ之中作为该帧的间隔T的理想的间隔T。但是实际上在进行预备选择处理前的阶段其理想度不明确,因此,例如,间隔决定部7将从Z个候选T1,T2,…,TZ之中等间隔地选择的Z1个候选作为预备选择处理的对象。例如,也可以是通过“将Z个候选T1,T2,…,TZ之中的奇数序号的候选作为预备选择处理的对象”(此时,Z1=ceil(Z/2),ceil(·)为天井函数)这样的基准,将Z个候选T1,T2,…,TZ之中的Z1个候选作为预备选择处理的对象。将Z个候选的集合设为SZ(SZ={T1,T2,…,TZ}),将Z1个候选的集合设为SZ1
间隔决定部7针对作为预备选择处理的对象的Z1个候选实施上述的选择处理。在该选择处理中将缩小的候选的数目设为Z2个。如所述,考虑种种预备选择处理的具体的处理内容,但作为基于承认与对应于重排后的样本串的码串的码量的大小之间的关联的指标的方法,例如,考虑样本的指标向低频域的集中度,或基于在频率轴中从最高频率向低频域侧具有零的振幅的样本的连续数而决定Z2个候选。
具体而言,在不预先设定Z2的值的情况下进行如下的预备选择处理。间隔决定部7针对各自的候选,基于该候选,进行在上述说明的样本串的重排,求出重排后的样本串的低频域侧起例如1/4区域中包含的样本的振幅的绝对值之和作为承认与对应于样本串的码串的码量的大小之间的关联的指标,若该和比预先决定的阈值大,则选择该候选。或者,间隔决定部7针对各自的候选,基于该候选进行在上述说明的样本串的重排,求出重排后的样本串中从最高频率至低频域侧具有零振幅的样本的连续数,作为承认与对应于样本串的码串的码量的大小之间的关联的指标,若该连续数比预先决定的阈值大,则选择该候选。重排部5进行重排。此时,决定的候选的数目是Z2,按照每帧能够变化Z2的值。
在预先设定Z2的值的情况下进行如下的预备选择处理。针对各自的Z1个候选,间隔决定部7进行基于各候选的在上述说明的样本串的重排,求出重排样本串后样本串的低频域侧起例如1/4区域中包含的样本的振幅的绝对值之和,作为承认与对应于样本串的码串的码量的大小之间的关联的指标,从该和的值大的起选择Z2个候选。或者,针对各自的Z1个候选,进行基于各候选的上述说明的样本串的重排,求出重排样本后的样本串中从最高频率向低频域侧具有零振幅的样本的连续数,作为承认与对应于样本串的码串的码量的大小之间的关联的指标,从该连续数大的起选择Z2个候选。重排部5进行样本串的重排。此时,无论哪个帧,Z2的值都相同。当然,至少满足Z>Z1>Z2的关系。将Z2个候选的集合设为SZ2
(B)追加处理(步骤S72)
接着,间隔决定部7进行在(A)的预备选择处理中得到的候选的集合SZ2中追加一个或多个候选的处理。进行该追加处理的目的是防止在按照每帧Z2的值改变的情况下Z2的值变得过于小,从而在上述的最终选择处理中的间隔T的搜索范围变得过于狭窄,或者,即使Z2的值是某程度大的值,在上述的最终选择处理中决定适当的间隔T的可能性尽量变大一点。另外,本发明的间隔T的决定方法的目的是使运算处理量比现有技术少,因此若将集合SZ2的要素(候选)的数目表示为|SZ2|,则|SZ2|=Z2,若将追加的候选的数目设为Q,Q满足Z2+Q<Z是必要条件。更优选的条件是Q满足Z2+Q<Z1。例如,追加的候选也可以设为在集合SZ2中包含的候选Tk的前后的候选Tk-1、Tk+1∈SZ(此处的“前后”表示在集合SZ={T1,T2,…,TZ}中导入基于值的大小的顺序T1<T2<…<TZ时的前后)。其理由是存在作为(A)的预备选择处理的对象的Z1个候选中不包含候选Tk-1,Tk+1的可能性。但是,也可以是,在候选Tk-1、Tk+1∈SZ且候选Tk-1、Tk+1不包含于集合SZ2的情况下,不追加候选Tk-1、Tk+1。此外,追加的候选只要从集合SZ选择即可,例如,针对在集合SZ2中包含的候选Tk,也可以将Tk-α(其中,Tk-α∈SZ)和/或Tk+β(其中,Tk+β∈SZ)作为新候选而追加。此处,例如,α、β是预先决定的正的实数值。也可以是α=β。Tk-α和/或Tk+β与包含于集合SZ2的其他候选重复的情况下,不追加该Tk-α和/或Tk+β(即使追加也无意义)。将Z2+Q个候选的集合设为SZ3。接着进行(D1)或者(D2)的处理。
(D)预备选择处理(步骤S73)
(D1-步骤S731)间隔决定部7在决定间隔T的对象的帧是时间上在前头的帧的情况下,针对在集合SZ3中包含的Z2+Q个候选实施上述的预备选择处理。将在该预备选择处理中缩小的候选的数目设为Y个。Y满足Y<Z2+Q。
如上述,考虑各种预备选择处理的具体的处理内容,但例如,也可以进行与(A)中的预备选择处理相同内容的处理(其中,输出的候选的数目不同(即Y≠Z2))。此时,必须留意Y的值按照每帧变化。若进行与(A)中的预备选择处理不同的内容的预备选择处理,则例如,针对集合SZ3中包含的Z2+Q个的各个候选,进行在基于各候选的上述说明的样本串的重排,利用预先决定的近似求得对重排后的样本串进行编码而得到的码串的码量的近似式等,求得近似的码量(码量的估计值)。重排部5进行样本串的重排。也可以是,针对在(A)中的预备选择处理得到重排后的样本串的候选,使用在(A)中的预备选择处理中得到的重排后的样本串。此时,若Y的值未被预先设定,则将近似码量成为预先决定的阈值以下的候选作为成为后述的(E)码量计算处理的对象的候选而决定即可(此时,决定的候选的数是Y),若预先设定Y的值,则从近似码量较小的起将Y个候选作为成为后述的(E)最终选择处理的对象的候选而决定即可。Y个候选存储于存储器,这些Y个候选在时间上第二个帧中的间隔T决定时,用于后述的(C)或者(D2)的处理。(D1)的处理之后,进行(E)的最终选择处理。
另外,也可以是,在(D1)进行与(A)的预备选择处理相同内容的预备选择处理,且通过承认与在(A)的预备选择处理中对重排后的样本串进行编码而得到的码串的码量的大小之间的关联的指标和阈值的比较而选择候选的情况下,在(A)的预备选择处理中选择的候选在(D1)的预备选择处理中也必须被选择,因此仅针对在(B)的追加处理中追加的候选进行通过该指标与该阈值的比较而选择候选的处理,此处将选择的候选与在(A)的预备选择处理中选择的候选作为成为(E)的最终选择处理的对象的候选。其中,优选的是,(E)的最终选择处理由于运算处理量较多,因此在(D1)的预备选择处理中将Y的值设为预先设定的固定值,从近似码量较小的起将Y个候选作为成为(E)的最终选择处理的对象的候选而决定。
(D2-步骤S732)间隔决定部7在决定间隔T的对象的帧不是时间上在前头的帧的情况下,针对在和集合SZ3∪SP中包含的最多Z2+Q+Y+W个(其中,|SP|=Y+W)候选实施上述的预备选择处理。此处说明和集合SZ3∪SP。将决定间隔T的对象的帧设为Xt,将帧Xt的时间上之前的帧设为Xt-1。集合SZ3是在上述的(A)-(B)的处理中得到的在帧Xt中的候选的集合,在集合SZ3中包含的候选的数是Z2+Q。集合Sp是,在帧Xt-1中决定间隔T时成为后述的(E)的最终选择处理的对象的候选的集合SY、与对该集合SY通过后述的(C)的追加处理追加的候选的集合SW的和集合。集合SY存储于存储器。|SY|=Y,|SW|=W,至少|SZ3∪SP|<Z是必要条件。针对在和集合SZ3∪SP中包含的最多Z2+Q+Y+W个候选实施上述的预备选择处理。将在该预备选择处理中缩小的候选的数目设为Y个。Y满足Y<|SZ3∪SP|≦Z2+Q+Y+W。如所述,考虑各种预备选择处理的具体的处理内容,但是,例如,也可以进行与上述的(B)中的预备选择处理相同内容的处理(其中,输出的候选的数目不同(即,Y≠Z2))。此时,必须留意Y的值按照每帧变化。若进行与在上述的(B)中的预备选择处理不同的内容的预备选择处理,则例如,针对|SZ3∪SP|个的各个候选,进行基于各候选的上述说明的样本串的重排,利用预先决定的用于近似求得对重排后的样本串进行编码而得到的码串的码量的近似式等,求得近似码量(码量的估计值)。重排部5进行样本串的重排。也可以是,针对在(A)中的预备选择处理中得到重排后的样本串的候选,使用在(A)中的预备选择处理中得到的重排后的样本串。此时,若未预先设定Y的值,则将近似码量在预先设定的阈值以下的候选作为成为后述的(E)的最终选择处理的对象的候选而决定即可(此时,决定的候选的数目是Y),若预先设定Y的值,则从近似码量较小的起将Y个候选作为成为后述的(E)的最终选择处理的对象的候选而决定即可。Y个候选存储于存储器,这些Y个候选利用于时间上下一个帧中的决定间隔T时实施的(D2)的处理。(D2)处理之后,进行(E)的最终选择处理。
另外,在(D2)中进行与(A)的预备选择处理相同内容的预备选择处理,且通过承认对在(A)的预备选择处理中重排后的样本串进行编码而得到的码串的码量的大小关联的指标和阈值的比较选择候选的情况下,由于在(A)的预备选择处理中选择的候选在(D2)的预备选择处理中必须选择,因此针对在(B)的追加处理中追加的候选、在帧Xt-1中决定间隔T时成为后述的(E)的最终选择处理的对象的候选、以及在(C)的追加处理中追加的候选,进行通过该指标与该阈值的比较而选择候选的处理,此处,也可以将选择的候选与在(A)的预备选择处理中选择的候选作为成为(E)的最终选择处理的对象的候选。但是,优选的是,(E)的最终选择处理由于运算处理量较多,因此在(D2)的预备选择处理中将Y的值设为预先决定的固定值,从近似码量较小的起将Y个候选作为成为(E)的最终选择处理的对象的候选而决定。
(C)追加处理(步骤S74)
间隔决定部7进行在帧Xt-1中决定间隔T时向成为后述的(E)的最终选择处理的对象的候选的集合SY追加一个或多个候选的处理。对集合SY追加的候选,例如,也可以设为在集合SY中包含的候选Tm的前后的候选Tm-1,Tm+1(此处的“前后”是表示在集合SZ={T1,T2,…,TZ}中导入基于值的大小的顺序T<T2<…<TZ时的前后)。此外,追加的候选也可以从集合SZ选择,例如,也可以针对在集合SY中包含的候选Tm,将Tm-γ(其中,Tm-γ∈SZ)和/或Tm+η(其中,Tm+η∈SZ)作为新候选而追加。此处γ、η是例如预先决定的正的实数值。也可以是γ=η。在Tm-γ和/或Tm+η与在集合SY中包含的其他候选重复的情况下,不追加该Tm-γ和/或Tm+η(因为即使追加也无意义),接着,进行(D2)的处理。
(E)最终选择处理(步骤S75)
间隔决定部7分别针对Y个候选,进行基于各候选的上述说明的样本串的重排,编码重排后的样本串而得到码串,求得码串的实际的码量,将提供最小的码量的候选作为间隔T而选择。重排部5不进行样本串的重排,编码部6进行重排后的样本串的编码。针对在(A)或(D)中的预备选择处理中得到重排后的样本串的候选,编码部6将在预备选择处理中得到的重排后的样本串作为输入进行编码。
另外,(B)的追加处理、(C)的追加处理,(D)的预备选择处理并非必须,也可以是这其中不进行至少任何一个的实施结构。在不进行(B)的追加处理的情况下,若将集合SZ3的要素(候选)的数目表示为|SZ3|,由于Q=0,因此|SZ3|=Z2。在不进行(D)的预备选择处理的情况下,在集合SZ3中包含的最多Z2+Q个候选(决定间隔T的对象的帧是时间上在前头的帧的情况)或在和集合SZ3∪SP中包含最多Z2+Q+Y+W个候选(决定间隔T的对象的帧不是时间上在前头的帧的情况)成为(E)的最终选择处理的对象。
在关于上述的间隔T的决定的说明中,将“前头的帧”作为“时间上在前头的帧”,但并不限定于这样的帧。“前头的帧”也可以是满足以下(1)-(3)的条件A的帧以外的帧(参照图9)。
<条件A>
关于帧,
(1)该帧不是时间上在前头,
(2)之前一帧根据本发明的编码方法被编码,且,
(3)之前一帧接受上述的重排处理的应用。
在上述的说明中,在(D2)的处理中,将集合SY设为“之前的帧Xt-1中决定间隔T时成为后述的(E)的最终选择处理的对象的候选的集合”,但也可以将集合SY设为“在比决定间隔T的对象的帧时间上较前的多个帧中分别决定间隔T时成为后述的(E)的最终选择处理的对象的候选的集合的和集合”。即,若将过去的帧的个数设为m,则集合SY是在帧Xt-1中决定间隔T时成为后述的(E)的最终选择处理的对象的候选的集合St-1、与在帧Xt-2中决定间隔T时成为后述的(E)的最终选择处理的对象的候选的集合St-2、…、在帧Xt-m中决定间隔T时成为后述的(E)的最终选择处理的对象的候选的集合St-m的和集合,即SY=St-1∪St-2∪…∪St-m。但是,若m较大,则运算处理量增大,因此虽然也依赖于Z、Z1、Z2、Q的值等,但m优选为1、2、3的任意值。
若将算出码量的处理的运算处理量设为A,且假设预备选择处理的运算处理量是其1/10左右的运算处理量A/10,则在Z、Z1、Z2、Q、W、Y作为固定值被预先设定的情况下,实施(A)、(B)、(C)、(D2)的各处理时的运算处理量较高地成为((Z1+Z2+Q+Y+W)A/10+YA)。此处,若设Z2+Q≒3Z2,Y+W≒3Y,则运算处理量为((Z1+3Z2+3Y)A/10+YA)。在与上述运算处理量(ZA/10+YA)比较的情况下,以满足Z>(Z1+3Z2+3Y)的方式设定Z、Z1、Z2、Y,则能够削减运算处理量。例如作为一例能够假设Z=256、Z1=64、Z2=Y=8。
SZ={T1,T2,…,TZ}在每帧可以相同也可以不同。此外Z的值在每帧可以相同也可以不同。但是,要求成为(E)的最终选择处理的对象的候选的数目比Z小,因此在(D2)的处理中|SY|在Z以上的情况下,例如,对从存储器读取的集合SY进行使用了与上述的(A)的预备选择处理相同的指标的候选的缩小,使得成为(E)的最终选择处理的对象的候选的数目比Z小即可。此外,在不进行预备选择处理且|SZ3∪SP|≧Z的情况下,也对SZ3∪SP进行使用了与上述的(A)的预备选择处理相同的指标的候选的缩小,使得成为(E)的最终选择处理的对象的候选的数目比Z小。
<间隔T的决定方法的变形例>
在语音或音乐等的音响信号中跨越多个帧的稳定的信号区间中,当前的帧与过去的帧的相关性高的情况较多。利用稳定信号具有的这样的性质,在(D2)处理中通过改变SZ3与SP的比率维持压缩性能,同时能够进一步下降处理运算量。另外,此处的比率可以决定为SP对SZ3的比,也可以决定为SZ3对SP的比,也可以决定为在SZ3∪SP中SP的占有率,也可以决定为在SZ3∪SP中SZ3的占有率。
某信号区间的稳定性是否大可以通过例如表示稳定性的大小的指标是否在阈值以上,或是否比阈值大而判断。表示稳定性的大小的指标值,例如是下述所示的指标。以下,将决定间隔T的对象的帧称为当前帧,将当前帧的时间上在之前的帧称为之前帧。表示稳定性的大小的指标值是,
(a-1)“当前帧的音响信号的预测增益”大,
(a-2)“当前帧的音响信号的预测增益的估计值”大,
(b-1)“前一帧的音响信号的预测增益”与“当前帧的音响信号的预测增益”的差分小,
(b-2)“前一帧的音响信号的预测增益的估计值”与“当前帧的音响信号的预测增益的估计值”的差分小,
(c-1)“当前帧中包含的音响信号的样本的振幅之和”大,
(c-2)“将当前帧中包含的音响信号的样本串变换至频域而得到的样本串中包含的样本的振幅之和”大,
(d-1)“前一帧中包含的音响信号的样本的振幅之和”与“当前帧中包含的音响信号的样本的振幅之和”的差分小,
(d-2)“将前一帧中包含的音响信号的样本串变换至频域而得到的样本串中包含的样本的振幅之和”与“将当前帧中包含的音响信号的样本串变换至频域而得到的样本串中包含的样本的振幅之和”的差分小,
(e-1)“当前帧的音响信号的功率”大,
(e-2)“将当前帧的音响信号的样本串变换至频域而得到的样本串的功率”大,
(f-1)“前一帧的音响信号的功率”与“当前帧的音响信号的功率”的差分小,
(f-2)“将前一帧的音响信号的样本串变换至频域而得到的样本串的功率”与“将当前帧的音响信号的样本串变换至频域而得到的样本串的功率”的差分小,
这样大的值。
另外,预测增益是在预测编码中的原信号的能量相对于预测误差信号的能量之比,该值是频域变换部1输出的该帧的MDCT系数串中包含的样本的值的绝对值的总和相对于加权包络归一化部2输出的该帧的加权归一化MDCT系数串中包含的样本的值的绝对值的总和之比、或在该帧的MDCT系数串中包含的样本的值的平方的总和相对于在该帧的加权归一化MDCT系数串中包含的样本的值的平方的总和之比、的值大致成比例。因此,作为大小关系与“帧的音响信号的预测增益”等价的值,能够使用上述的任意的比的值。
“帧的音响信号的预测增益”是将在加权包络归一化部2中使用的与该帧的线性预测系数对应的m次的PARCOR系数设为kn时,通过
[数3]
E = 1 / &Pi; m = 1 P ( 1 - k m 2 )
计算的E。此处,对应于线性预测系数的PARCOR系数设为量化前的全次的PARCOR系数。另外,作为与线性预测系数对应的PARCOR系数,使用一部分次数(例如,1次至P2次为止。其中P2<P。)的量化前的PARCOR系数,或者一部分或全部次的量化后的PARCOR系数,计算E的情况下,被计算的E成为“帧的音响信号的预测增益估计值”。
“在帧中包含的音响信号的样本的振幅之和”是在该帧中包含的语音音响数字信号的样本值的绝对值的总和、或在频域变换部1输出的该帧的MDCT系数串中包含的样本的值的绝对值的总和。
“帧的音响信号的功率”是在该帧中包含的语音音响数字信号的样本值的平方的总和、或频域变换部1输出的在该帧的MDCT系数串中包含的样本的值的平方的总和。
另外,可以将例示的(a)~(f)的任意一个用于稳定性的大小判定,也可以将例示的(a)~(f)之中的两个以上之间的逻辑或或逻辑与用于稳定性的大小判定。前者的情况下,间隔决定部7仅使用例如(a)的“当前帧的音响信号的预测增益”,在“当前帧的音响信号的预测增益”G与预先决定的阈值ε之间ε<G成立的情况下判断为稳定性大,或者,例如仅使用(b)的“前一帧的音响信号的预测增益”与“当前帧的音响信号的预测增益”的差分,在“前一帧的音响信号的预测增益”与“当前帧的音响信号的预测增益”的差分Gdiff与预先决定的阈值τ之间Gdiff<τ成立的情况下判断为稳定性大。后者的情况下,间隔决定部7使用例如(c)与(e)的两个基准,在“在当前帧中包含的音响信号的样本的振幅之和”Ac与预先决定的阈值ξ之间ξ<Ac成立且“当前帧的音响信号的功率”Pc与预先决定的阈值δ之间δ<Pc成立的情况下判断为稳定性大,或者,使用例如(a)、(c)、(f)的基准,在“当前帧的音响信号的预测增益”G与预先决定的阈值ε之间ε<G成立或“在当前帧中包含的音响信号的样本的振幅之和”Ac与预先决定的阈值ξ之间ξ<Ac成立,且在“前一帧的音响信号的功率”与“当前帧的音响信号的功率”的差分Pdiff与预先决定的阈值θ之间的Pdiff<θ成立的情况下判断为稳定性大。
通过这样的稳定性的大小判定而变更的SZ3与SP的比率,例如假设预先在间隔决定部7内的检查表中设定。通常,在判定为稳定性大的情况下,设定为在SZ3∪SP中SP的比率变高(相对地SZ3的比率变低,或SZ3∪SP中SP的比率超过50%),在判定为稳定性不大的情况下,设定为在SZ3∪SP中SP的比率变低(相对地SZ3的比率变高,或SZ3∪SP中SP的比率不超过50%),或该比率同程度。在判定为稳定性大的情况下,在(D2)的处理中,参照检查表决定SP的比率(或SZ3的比率),例如通过从与上述的(A)的预备选择处理相同的指标大的起选择候选的处理,减少在集合SZ3中包含的候选的数,以便在SP与SZ3中包含的候选的数目适合于该比率。相反,在判定为稳定性不大的情况下,在(D2)的处理中,参照检查表决定SP的比率(或SZ3的比率),例如通过从与上述的(A)的处理相同的指标大的起选择候选的处理,调整在集合SP中包含的候选的数,以便在SP与SZ3中包含的候选的数目适合于该比率。通过这样的处理,在与使成为(D2)的处理的对象的候选的数目减少的同时,能够提高当前帧的间隔T作为候选而被包含的集合的比率,能够高效率地决定间隔T。另外,也可以在判定为稳定性不大的情况下,将SP设为空集合。即,此时,使在过去的帧中成为(E)的最终选择处理的对象的候选不包含于在当前帧中的(D)的预备选择处理的对象中。
此外,也可以是在检查表中,根据稳定性的大小的程度预先设定SZ3与SP的不同的比率的实施结构。例如仅使用(a)的基准的“当前帧的音响信号的预测增益”判定稳定性的大小的情况下,对“当前帧的音响信号的预测增益”G预先提供多个阈值ε1,ε1,…,εk-1,εk(其中,ε11<…<εk-1k),在检查表中预先设定如下,
G<ε1
Figure BDA00003558802100261
在SZ3∪SP中的SP的比率:10%
ε1≦G<ε2
Figure BDA00003558802100262
在SZ3∪SP中的SP的比率:20%
εk-1≦G<εk
Figure BDA00003558802100271
在SZ3∪SP中的SP的比率:80%
εk≦G
Figure BDA00003558802100272
在SZ3∪SP中的SP的比率:90%
此处,说明仅使用(a)的基准的“当前帧的音响信号的预测增益”的例子,但即使不用说其他基准,将上述(a)~(f)之中两个以上之间的逻辑或或逻辑与用于稳定性的大小判定的情况下,也能够在检查表中根据稳定性的大小的程度预先设定SZ3与SP的不同的比率。
在以上的说明中,说明在(D2)的处理中决定集合SZ3与SP的状况下,基于稳定性的大小判定变更SZ3与SP的比率的实施例,但也可以是在比集合SZ3与SP的决定之前进行稳定性的大小判定的实施。例如,在检查表中,根据与Y的值的关系,预先设定对应于稳定性的大小的判定结果的Z1、Z2、Q、W的值。对应于判定为稳定性大的情况的Z1、Z2、Q的值之中的至少任意一个(优选的是Z2或Q),设定为|SZ3|比Y+W的值(其中,也可假设W=0)小的小值(或设定W为大值)。对应于判定为稳定性不大的情况的Z1、Z2、Q的值之中的至少任意一个(优选的是Z2或Q),设定为|SZ3|比Y+W的值(其中,也可假设W=0)大的大值(或设定W为小值)。
即使在集合SZ3与SP的决定前进行稳定性的大小判定的实施方式中,在检查表中,也能够预先设定对应于稳定性的大小的程度的Z1、Z2、Q的值。例如仅使用(a)的基准的“当前帧的音响信号的预测增益”判定稳定性的大小的情况下,对“当前帧的音响信号的预测增益”G预先提供多个阈值ε1,ε1,…,εk-1,εk(其中,ε11<…<εk-1k),在检查表中预先决定如下,
G<ε1
Figure BDA00003558802100273
Z2=16,Q=30
ε1≦G<ε2 Z2=12,Q=20
εk-1≦G<εk Z2=4,Q=4
εk≦GZ2=2,Q=0
此处,说明仅使用(a)的基准的“当前帧的音响信号的预测增益”的例子,但即使不用说其他基准,将上述(a)~(f)之中两个以上之间的逻辑或或逻辑与用于稳定性的大小判定的情况下,也能够在检查表中预先设定对应于稳定性的大小的程度的Z1、Z2、Q的值。
[周期性特征量决定方法]
至今说明了以少的运算处理量决定间隔T的方法,但通过该方法应决定的对象不限定于间隔T。该方法例如也能够用作决定作为在样本的重排时用于确定上述样本群的信息的音响信息的周期性特征量(例如基本频率或基音周期等)的方法。即,也可以使间隔决定部7作为周期性特征量决定装置起作用,不输出编码重排后的样本串而得到的码串,将间隔T作为周期性特征量而决定。此时,从上述的[间隔T的决定方法]的说明中,将“间隔T”改读为“基音周期”即可,或者将样本串的样本频率以“间隔T”除以后的值作为“基本频率”即可,能够以较少的运算处理量决定用于样本的重排的基本频率或基音周期。
[确定在样本串中包含的样本的重排的辅助信息]
编码部6或辅助信息生成部8输出表示用于确定在样本串中包含的样本的重排的辅助信息,即输出用于表示音响信号的周期性的信息、或表示基本频率的信息、或用于表示对应于音响信号的周期性或基本频率的样本与对应于音响信号的周期性或基本频率的整数倍的样本之间的间隔T的信息。另外,在编码部6输出辅助信息的情况下,可以在样本串的编码处理之中进行得到辅助信息的处理,也可以进行作为不同于该编码处理的处理而进行得到辅助信息的处理。例如在按照每帧决定间隔T的情况下,也按照每帧输出用于确定在样本串中包含的样本的重排的辅助信息。确定在样本串中包含的样本的重排的辅助信息通过按照每帧编码周期性、基本频率或间隔T而得到。该编码可以是固定长度编码,也可以可变长度编码而削减平均码量。在进行固定长度编码的情况下,例如,将辅助信息与能够唯一地确定该辅助信息的码相关联而存储,输出对应于所输入的辅助信息的码。在进行可变长度编码的情况下,也可以将对之前帧的间隔T与当前帧的间隔T的差分进行可变长度编码后的信息作为表示间隔T的信息。此时,例如,将间隔T的差分值与能够唯一地确定该差分值的码相关联后存储,输出对应于输入的之前帧的间隔T与当前帧的间隔T的差分的码。同样,也可以将对之前帧的基本频率与当前帧的基本频率的差分进行可变长度编码后的信息作为表示基本频率的信息。此外,在从多个选项中能够选择n的情况下,也可以在辅助信息中包含n的上限值或上述的上限N。
[聚集的样本的个数]
此外,该实施方式表示在各样本群中包含的样本的个数为,对应于周期性或基本频率乃至其整数倍的样本(以下称为中心样本)与其前后一个样本的总计三个样本的固定的个数的例子,但将在样本群中包含了样本的个数或样本索引设为可变的情况下,表示从不同的多个选项中选择的在样本群中包含的样本个数与样本索引的一个组合的信息也包含于辅助信息。
例如,作为选项,如下设定的情况下,
(1)仅中心样本,F(nT)
(2)中心样本与其前后1个样本的总计3个样本,F(nT-1)、F(nT)、F(nT+1)
(3)中心样本与其前头2个样本的总计3个样本,F(nT-2)、F(nT-1)、F(nT)
(4)中心样本与其前头3个样本的总计4个样本,F(nT-3)、F(nT-2)、F(nT-1)、F(nT)
(5)中心样本与其后头2个样本的总计3个样本,F(nT)、F(nT+1)、F(nT+2)
(6)中心样本与其后头3个样本的总计4个样本,F(nT)、F(nT+1)、F(nT+2)、F(nT+3)
若选择(4),则表示选择了该(4)的情况的信息包含于辅助信息。若是该例,作为表示被选择的选项的信息有3比特就足够。
另外,作为决定从这些选项中选择哪个的方法,采用如下方法即可:在重排部5中实施对应于各选项的重排,在编码部6得到对应于各选项的码串的码量,选择码量最小的选项。此时,确定在样本串中包含的样本的重排的辅助信息并不是从重排部5而是从编码部6输出。该方法在能够选择n的情况下也适合。
但是,作为选项,例如有关于间隔T的选项、关于在样本群中包含的样本的个数与样本索引的组合的选项、关于n的选项,可预想到这些选项的全部的组合有相当多的数目。针对这些选项的全部的组合计算最终的码量消耗处理量,可能存在从效率的观点出发成为问题的情况。为了从这样的观点削减处理量,优选使用下述那样的近似处理。即,编码部6中针对选项的全部的组合简易通过近似的方法求得码量的估计值即近似码量,例如从近似码量最小的起选择规定的多个候选等,从而缩小估计为理想的多个候选,在缩小的候选(选择的候选)中若选择提供最小的码量的选项,则能够以较少的处理量大体上最佳地减小最终的码量。
作为一个例子,也可以是首先将在样本群中包含的样本数目固定为“3个样本”的基础上将间隔T的候选缩小为少数,对各候选,组合在样本群中包含的样本数目,从而选择最优选的选项。
或者,也可以是近似地测定样本的指标之和,根据样本的指标向低频域的集中度、或在频率轴上从最高频率向低频域侧具有零振幅的样本的连续数,决定选项。具体而言,在整体的样本串的低频域侧起1/4的区域内求得重排后的样本串的振幅的绝对值之和,若该总和比预先决定的阈值大,则设想是优选的重排。此外,若按照选择从重排后的样本串的最高频率向低频域侧具有零振幅的样本的连续数最长的选项的方法,则表示在低频域中集中指标大的样本,这也设想为是优选的重排。
若通过上述那样的近似处理决定选项,则处理量少,但产生不一定能选择最终的码量最小的样本串中包含的样本的重排的情况。因此,通过上述那样的近似处理选择多个候选,仅针对这些少数的候选准确地计算最终的码量,选择最优选的(码量小)候选即可。
[变形例]
另外,也考虑没有在样本串中包含的样本的重排中引起的优点的情况。在这样的情况下,应编码重排前的样本串。因此,从重排部5也输出重排前的样本串(未进行重排的样本串),编码部6也对重排前的样本串进行可变长度编码得到码串,比较对重排前的样本串进行可变长度编码而得到的码串的码量、与对重排后的样本串进行可变长度编码而得到的码串的码量和辅助信息的码量的合计码量。
在对重排前的样本串进行可变长度编码而得到的码串的码量较少的情况下,输出对重排前的样本串进行可变长度编码而得到的码串。
在对重排后的样本串进行可变长度编码而得到的码串的码量与辅助信息的码量的合计码量较少的情况下,输出对重排后的样本串进行可变长度编码而得到的码串与辅助信息。
对重排前的样本串进行可变长度编码而得到的码串的码量、与对重排后的样本串进行可变长度编码而得到的码串的码量和辅助信息的码量的合计码量是相同的情况下,输出对重排前的样本串进行可变长度编码而得到的码串、以及对重排后的样本串进行可变长度编码而得到的码串和辅助信息中的任何一方。预先设定输出哪一个。
此外,也输出表示对应于码串的样本串是否是进行重排的样本串的第二辅助信息(参照图10)。作为该第二辅助信息,使用1比特则足够。
另外,在得到对所述那样重排后的样本串进行可变长度编码而得到的码串的近似码量即码量的估计值的情况下,也可以代替对重排后的样本串进行可变长度编码而得到的码串的码量,使用对重排后的样本串进行可变长度编码而得到的码串的近似码量。此外,同样,也可以是得到对重排前的样本串进行可变长度编码而得到的码串的近似码量即码量的估计值,代替对重排前的样本串进行可变长度编码而得到的码串的码量,使用对重排前的样本串进行可变长度编码而得到的码串的近似码量即码量的估计值。
此外,也可以预先决定仅在预测增益或其估计值比某决定了的阈值大的情况下应用在样本串中包含的样本的重排。其利用了在预测增益大时声带振动或乐器的震动强,周期性高的情况较多的语音或音乐的性质。预测增益是将原音的能量以预测残差的能量分割的能量。在将线性预测系数或PARCOR系数作为参数使用的编码中,能够在编码装置与解码装置中共用量化结束的参数。因此,例如,编码部6使用通过在编码装置100内的未图示的其他部件求得的i次的量化结束PARCOR系数k(i),计算以按照次数相乘(1-k(i)*k(i))的数的倒数表示的预测增益的估计值,在计算的估计值比决定的阈值大的情况下,输出对重排后的样本串进行可变长度编码而得到的码串,非此情况下,输出对重排前的样本串进行可变长度编码而得到的码串。如此例那样能够在编码装置与解码装置中共用的情况下,不需要输出用于表示对应于码串的样本串是否为进行了重排的样本串的第二辅助信息。即,若由于预测无效的噪音语音或无语音时效果小的可能性高而不重排,则预先决定对辅助信息或计算的浪费较少。
另外,也可以是如下结构:在重排部5中,进行预测增益或预测增益的估计值的计算,在预测增益或预测增益的估计值比某决定的阈值大的情况下,进行对样本串的重排并将重排后的样本串输出至编码部6,非此情况下,不进行对样本串的重排而将输出至重排部5的样本串本身输出至编码部6,在编码部6中,将从重排部5输出的样本串进行可变长度编码。
另外,在该结构的情况下,假设编码侧或解码侧作为共用的值而预先设定阈值。
另外,由于此处例示的莱斯编码、熵编码、行程编码均被周知,所以省略其详细说明。
“解码处理”
接着参照图5~图6说明解码处理。
在解码装置200中,通过编码装置100或编码装置100a的编码处理的逆序处理再构成MDCT系数。在解码装置200中,至少被输入上述增益信息、上述辅助信息、上述码串。另外,在从编码装置100a输出第二辅助信息的情况下向解码装置200输入第二辅助信息。
“解码部11”
首先,解码部11按照每帧根据选择信息解码被输入的码串而输出频域的样本串(步骤S11)。当然,执行与为了得到码串而执行的编码方法对应的解码方法。解码部11的解码处理的细节与编码装置100的编码部6的编码处理的细节对应,因此此处引用该编码处理的说明,明确记载对应于执行的编码的解码是解码部11进行的解码处理,据此作为解码处理的详细的说明。另外,通过选择信息确定执行了哪个编码方法。在选择信息中,例如,在包含确定莱斯编码的应用区域与莱斯参数的信息、表示行程编码的应用区域的信息、以及确定熵编码的种类的信息的情况下,对应于这些编码方法的解码方法应用于与输入的码串对应的区域。由于对应于莱斯编码的解码处理、对应于熵编码的解码处理、以及对应于行程编码的解码处理被周知所以省略说明。
“恢复部12”
接着,恢复部12按照每帧,根据输入的辅助信息,从解码部11输出的频域的样本串得到原来的样本的排列(步骤S12)。此处的“原来的样本的排列”相当于编码装置100的重排部5中输入的“频域的样本串”。如上述,编码装置100的重排部5的重排方法或对应于重排方法的重排的选项有多种,但在执行了重排的情况下,执行的重排是一种,确定该重排的信息包含于辅助信息,因此,恢复部12基于辅助信息,能够将解码部11输出的频域的样本串返回到原来的样本的排列。
另外,可能还具有在辅助信息中输入用于表示是否进行了重排的第二辅助信息的结构。在该结构中,在用于表示是否进行了重排的第二辅助信息表示进行了重排的情况下,恢复部12将解码部11输出的频域的样本串返回原来的样本的排列而输出,在表示未进行重排的情况下,直接输入由解码部11输出的频域的样本串。
此外,也可能有根据预测增益或预测增益的估计值的大小判定是否进行了重排的结构,在该结构中,例如,恢复部12使用从解码装置200内的未图示的其他部件输入的i次的量化结束PARCOR系数k(i),计算由将(1-k(i)*k(i))按照次数相乘的数的倒数表示的预测增益的估计值,在计算的估计值比某决定的阈值大的情况下,将解码部11输出的频域的样本串返回到原来的样本的排列而输出,在非此情况下将解码部11输出的频域的样本串直接输出。
由于恢复部12的恢复处理的细节对应于编码装置100的重排部5的重排处理的细节,因此此处引用该重排处理的说明,明确记载该重排处理的逆序的处理(逆重排)是恢复部12进行的恢复处理,据此作为解码处理的详细的说明。另外,为了帮助理解,说明对应于上述的重排处理的具体例的恢复处理的一例。
例如,如果是重排部5将样本群聚集于低频域侧而输出F(T-1)、F(T)、F(T+1)、F(2T-1)、F(2T)、F(2T+1)、F(3T-1)、F(3T)、F(3T+1)、F(4T-1)、F(4T)、F(4T+1)、F(5T-1)、F(5T)、F(5T+1)、F(1),…,F(T-2)、F(T+2),…,F(2T-2)、F(2T+2),…,F(3T-2)、F(3T+2),…,F(4T-2)、F(4T+2),…,F(5T-2)、F(5T+2),…F(jmax)的上述的例子,则在恢复部12中输入解码部11输出的频域的样本串F(T-1)、F(T)、F(T+1)、F(2T-1)、F(2T)、F(2T+1)、F(3T-1)、F(3T)、F(3T+1)、F(4T-1)、F(4T)、F(4T+1)、F(5T-1)、F(5T)、F(5T+1)、F(1),…,F(T-2)、F(T+2),…,F(2T-2)、F(2T+2),…,F(3T-2)、F(3T+2),…,F(4T-2)、F(4T+2),…,F(5T-2)、F(5T+2),…F(jmax)。
然后,在辅助信息中,例如,包含关于间隔T的信息、或表示n是1以上5以下的各整数的信息、确定在样本群中包含3个样本的信息等。从而,恢复部12能够基于该辅助信息,将输入的样本串F(T-1)、F(T)、F(T+1)、F(2T-1)、F(2T)、F(2T+1)、F(3T-1)、F(3T)、F(3T+1)、F(4T-1)、F(4T)、F(4T+1)、F(5T-1)、F(5T)、F(5T+1)、F(1),…,F(T-2)、F(T+2),…,F(2T-2)、F(2T+2),…,F(3T-2)、F(3T+2),…,F(4T-2)、F(4T+2),…,F(5T-2)、F(5T+2),…F(jmax)恢复到原来的样本的排列F(j)(1≦j≦jmax)。
“逆量化部13”
接着,逆量化部13按照每帧,对恢复部12输出的原来的样本的排列F(j)(1≦j≦jmax)进行逆量化(步骤S13)。若对应于上述例子而叙述,则通过逆量化,获得对编码装置100的量化部4输入的“通过增益归一化后的加权归一化MDCT系数串”。
“增益乘法部14”
接着,增益乘法部14按照每帧,向逆量化部13输出的“通过增益归一化后的加权归一化MDCT系数串”的各系数乘以通过上述增益信息确定的增益,得到“归一化后的加权归一化MDCT系数串”(步骤S14)。
“加权包络逆归一化部15”
接着,加权包络逆归一化部15按照每帧,通过增益乘法部14所输出的“归一化后的加权归一化MDCT系数串”的各系数除以加权功率谱包络值而得到“MDCT系数串”(步骤S15)。
“时域变换部16”
接着,时域变换部16按照每帧,将加权包络逆归一化部15输出的“MDCT系数串”变换至时域,得到帧单位的语音音响数字信号(步骤S16)。
由于从步骤S13至S16的各处理是现有处理,省略详细说明,但例如,在上述各非专利文献中有详细记载。
从实施方式显然可见,例如在基本频率明确的情况下,通过根据基本频率重排样本串的样本串进行编码,能够有效地进行编码(即能够使平均码长变小)。此外,由于通过在样本串中包含的样本的重排,按照局部集中具有相等或相同程度的指标的样本,所以不仅可变长度编码有效率,而且量化失真的减少或码量的削减也变得可能。
<编码装置/解码装置的硬件结构例>
关于上述的实施方式的编码装置/解码装置具有能够连接键盘等的输入部、能够连接液晶显示器等的输出部、CPU(Central Processing Unit,中央处理单元)[也可以具备高速缓冲存储器等]、作为存储器的RAM(Random AccessMemory,随机存储器)、ROM(Read Only Memory,只读存储器)、作为硬盘的外部存储装置、以及以使这些输入部、输出部、CPU、RAM、ROM、外部存储装置间的数据的交换变得可能的方式连接的总线。此外,也可以根据需要,在编码装置/解码装置中设置能够读写CD-ROM等的存储介质的装置(驱动)等。
在编码装置/解码装置的外部存储装置中,存储用于执行编码/解码的程序以及在该程序的处理中必要的数据等(不限于外部存储装置,例如也可以使作为读出程序的专用存储装置的ROM预先存储。)。此外,通过这些程序的处理得到的数据等适当地存储至RAM或外部存储装置等。以下,将存储数据或该存储区域的地址等的存储装置简单称为“存储部”。
在编码装置的存储部中存储用于进行在来自语音音响信号的频域的样本串中包含的样本的重排的程序、用于在重排中得到的样本串的编码的程序等。
在解码装置的存储部中,存储用于解码输入的码串的程序、用于将解码中得到的码串恢复为在编码装置中进行重排前的样本串的程序等。
编码装置根据需要将在存储部中存储的各程序与各程序的处理必要的数据读入RAM,在CPU中进行解释执行/处理。其结果,通过CPU实现规定的功能(重排部、编码部),实现编码。
在解码装置中,根据需要将在存储部中存储的各程序与各程序的处理所需的数据读入RAM,在CPU中进行解释执行/处理。其结果,通过CPU实现规定的功能(解码部、恢复部),实现编码。
<补记>
本发明不限于上述的实施方式,能够在不脱离本发明的意旨的范围内适当变更。此外,在上述实施方式中说明的处理不仅根据记载顺序时序地执行,也可以根据执行处理的装置的处理能力或需要并列或单独执行。
此外,将在上述实施方式中说明的硬件实体(编码装置/解码装置)中的处理功能通过计算机实现的情况下,硬件实体应具有的功能的处理内容通过程序记述。然后,通过在计算机中执行该程序,在计算机上实现在上述硬件实体中的处理功能。
记述该处理内容的程序能够预先记录至计算机中能够读取的记录介质。在计算机中能够读取的记录介质也可以是例如磁记录装置、光盘、光磁记录介质、半导体存储器等的任何存储器。具体而言,例如,作为磁记录装置,能够使用硬盘装置、软磁盘、磁带等,作为光盘能够使用DVD(digital VersatileDisc,数字多功能光盘)、DVD-RAM(Random Access Memory,随机存取存储器)、CD-ROM(Compact Disc Read Only Memory,光盘只读存储器)、CD-R(Recordable,可记录)/RW(ReWritable,可擦写)等,作为光磁记录介质,能够使用MO(Magneto-Optical disc,磁光盘)等,作为半导体存储器,能够使用EEP-ROM(Electronically Erasable and Programmable-Read Only Memory,电可擦写可编程只读存储器)等。
此外,该程序的流通例如通过贩卖、转让、借出而进行记录了该程序的DVD、CD-ROM等的可移动记录介质。进而,也可以是如下结构:将该程序存储至服务器计算机的存储装置,经由网络,从服务器计算机向其他计算机转发该程序,使该程序流通。
执行这样的程序的计算机,例如,首先,将可移动记录介质中记录的程序或从服务器计算机转发的程序暂时存储至自己的记录装置。然后,执行处理时该计算机读取在自己的记录介质中存储的程序,执行基于读取的程序的处理。此外,作为该程序的其他执行方式,也可以由计算机从可移动记录介质直接读取程序,执行基于该程序的处理,进而,每次从服务器计算机向该计算机转发程序时,依次执行基于接受到的程序的处理。此外,也可以是不进行从服务器计算机向该计算机的程序的转发,仅通过该执行指示与结果取得,实现处理功能,通过所谓ASP(Application Service Provider,应用服务提供商)型的服务,执行上述的处理的结构。另外,在本方式中的程序中,假设包含为了电子计算机的处理用而提供的信息且依赖于程序的数据(并非是对计算机的直接的指令但具有规定计算机的处理的性质的数据)。
此外,在该方式中,通过使在计算机上执行规定的程序,构成硬件实体,但也可以是将这些处理内容的至少一部分在软件上实现。

Claims (23)

1.一种编码方法,用于来自帧单位的音响信号的频域的样本串,其特征在于,具有:
间隔决定步骤,按照每帧,从间隔T的候选的集合S中决定对应于上述音响信号的周期性的样本的间隔T、或者对应于上述音响信号的基本频率的整数倍的样本的间隔T;
辅助信息生成步骤,对在上述间隔决定步骤中决定的间隔T进行编码而得到辅助信息;以及
样本串编码步骤,将如下的样本串作为重排后的样本串,并对上述重排后的样本串进行编码得到码串:(1)包含上述样本串的全部的样本,且(2)基于上述间隔决定步骤中决定的间隔T,重排在上述样本串中包含的至少一部分样本,以便包含上述样本串中的对应于上述音响信号的周期性或基本频率的样本的一个或者连续的多个样本、以及包含上述样本串中的对应于上述音响信号的周期性或基本频率的整数倍的样本的一个或者连续的多个样本、的全部或一部分的样本聚集,
上述间隔决定步骤是将由如下的候选构成的集合作为上述集合S而决定上述间隔T的步骤:可通过上述辅助信息表现的间隔T的Z个候选之中的、不依赖于在仅规定帧数量的过去的帧中成为间隔决定步骤的对象的候选而选择的Z2个候选(其中,Z2<Z)、以及在仅规定帧数量的过去的帧中成为间隔决定步骤的对象的候选的、Y个候选(其中,Y<Z)。
2.如权利要求1所述的编码方法,其特征在于,
上述间隔决定步骤进一步包含追加步骤,将与在上述规定帧数量的过去的帧中成为间隔决定步骤的对象的候选相邻的值或/和具有规定的差分的值添加于上述集合S。
3.如权利要求1或2所述的编码方法,其特征在于,
上述间隔决定步骤进一步包含预备选择步骤,从作为可通过上述辅助信息表现的间隔T的Z个候选之中的一部分的Z1个候选中,将基于根据当前帧的上述音响信号或/和样本串求得的指标而选择的一部分的候选设为上述Z2个候选(其中Z2<Z1)。
4.如权利要求1或2所述的编码方法,其特征在于,
上述间隔决定步骤进一步包含:
预备选择步骤,从作为可通过上述辅助信息表现的间隔T的Z个候选之中的一部分的Z1个候选中,基于根据当前帧的上述音响信号或/和样本串求得的指标而选择一部分候选;以及
第二追加步骤,将在上述预备选择步骤中选择的候选、与相邻于在上述预备选择步骤中选择的候选的值或/和具有规定的差分的值的组设为上述Z2个候选。
5.如权利要求1至4中任一项所述的编码方法,其特征在于,
上述间隔决定步骤包含:
第二预备选择步骤,基于根据当前帧的上述音响信号或/和样本串求得的指标,选择在上述集合S中包含的间隔T的候选之中的一部分的候选;以及
最终选择步骤,以由在上述第二预备选择步骤中选择的一部分候选构成的集合作为对象,决定上述间隔T。
6.如权利要求1至5中任一项所述的编码方法,其特征在于,
表示当前帧的上述音响信号的稳定性的大小的指标值越大,在上述集合S中在上述规定帧数量的过去的帧中成为间隔决定步骤的对象的候选占的比例越大。
7.如权利要求1至6中任一项所述的编码方法,其特征在于,
在表示当前帧的上述音响信号的稳定性的大小的指标值比规定的条件小的情况下,在上述集合S中仅包含上述Z2个候选。
8.如权利要求6或7所述的编码方法,其特征在于,表示上述当前帧的上述音响信号的稳定性的大小的指标值是在
(a-1)“当前帧的上述音响信号的预测增益”大,
(a-2)“当前帧的上述音响信号的预测增益的估计值”大,
(b-1)“前一帧的预测增益”与“当前帧的预测增益”的差分小,
(b-2)“前一帧的预测增益的估计值”与“当前帧的预测增益的估计值”的差分小,
(c-1)“当前帧中包含的上述音响信号的样本的振幅之和”大,
(c-2)“将当前帧中包含的上述音响信号的样本串变换至频域而得到的样本串中包含的样本的振幅之和”大,
(d-1)“前一帧中包含的上述音响信号的样本的振幅之和”与“当前帧中包含的上述音响信号的样本的振幅之和”的差分小,
(d-2)“将前一帧中包含的上述音响信号的样本串变换至频域而得到的样本串中包含的样本的振幅之和”与“将当前帧中包含的上述音响信号的样本串变换至频域而得到的样本串中包含的样本的振幅之和”的差分小,
(e-1)“当前帧的上述音响信号的功率”大,
(e-2)“将当前帧的上述音响信号的样本串变换至频域而得到的样本串的功率”大,
(f-1)“前一帧的上述音响信号的功率”与“当前帧的上述音响信号的功率”的差分小,
(f-2)“将前一帧的上述音响信号的样本串变换至频域而得到的样本串的功率”与“将当前帧的上述音响信号的样本串变换至频域而得到的样本串的功率”的差分小
的至少任一个条件满足的情况下变大的值。
9.如权利要求1至5的任一项所述的编码方法,其特征在于,
上述样本串编码步骤包含输出对上述重排前的样本串进行编码而得到的码串、以及对上述重排后的样本串进行编码而得到的码串和上述辅助信息之中码量少的一方的步骤。
10.如权利要求1至5的任一项所述的编码方法,其特征在于,
上述样本串编码步骤,在对上述重排后的样本串进行编码而得到的码串的码量或其估计值与上述辅助信息的码量的合计,比对上述重排前的样本串进行编码而得到的码串的码量或其估计值少的情况下,输出对上述重排后的样本串进行编码而得到的码串与上述辅助信息,
在对上述重排前的样本串进行编码而得到的码串的码量或其估计值,比对上述重排后的样本串进行编码而得到的码串的码量或其估计值与上述辅助信息的码量的合计小的情况下,输出对上述重排前的样本串进行编码而得到的码串。
11.如权利要求9或10所述的编码方法,其特征在于,
在前一个帧中输出的码串是对重排后的样本串进行编码而得到的码串的情况与在前一帧中输出的码串是对重排前的码串进行编码而得到的码串的情况相比,在上述规定帧数量的过去的帧中成为间隔决定步骤的对象的候选在上述集合S中占的比例大。
12.如权利要求9至11的任一项所述的编码方法,其特征在于,
在之前帧中输出的码串是对重排前的样本串进行编码而得到的码串的情况下,在上述集合中仅包含上述Z2个候选。
13.如权利要求9至11的任一项所述的编码方法,其特征在于,
在当前帧是时间上在前头的帧的情况、在前一帧通过上述的编码方法以外的方法编码的情况、在前一帧中输出的码串是对重排前的样本串进行编码而得到码串的情况、中的任何一个对应的情况下,在上述集合S中仅包含上述Z2个候选。
14.一种周期性特征量决定方法,决定帧单位的音响信号的周期性特征量,其特征在于,包含:
周期性特征量决定步骤,按照每帧,从周期性特征量的候选的集合中决定上述音响信号的周期性特征量;以及
辅助信息生成步骤,对在周期性特征量决定步骤中得到的周期性特征量进行编码而得到辅助信息,
上述周期性特征量决定步骤是将由以下候选构成的集合作为周期性特征量的候选的集合S而决定上述周期性特征量的步骤:将可通过辅助信息表现的周期性特征量的Z个候选之中的、不依赖于在仅规定帧数量的过去的帧中成为周期性特征量决定步骤的对象的候选而选择的Z2个候选(其中Z2<Z)、以及在上述规定帧数量的过去的帧中成为周期性特征量决定步骤的对象的候选、的Y个候选(其中Y<Z)。
15.如权利要求14所述的周期性特征量决定方法,其特征在于,
上述周期性特征量决定步骤进一步包含追加步骤:将与在上述规定帧数量的过去的帧中成为周期性特征量决定步骤的对象的候选相邻的值或/和具有规定的差分的值添加于上述集合S。
16.如权利要求14或15所述的周期性特征量决定方法,其特征在于,
表示当前帧的上述音响信号的稳定性的大小的指标值越大,在上述规定帧数量的过去的帧中成为周期性特征量决定步骤的对象的候选在上述集合S中占的比例越大。
17.如权利要求16所述的周期性特征量决定方法,其特征在于,
在表示当前帧的上述音响信号的稳定性的大小的指标值比规定的条件小的情况下,在上述集合S中仅包含上述Z2个候选。
18.如权利要求16或17所述的周期性特征量决定方法,其特征在于,
表示上述当前帧的上述音响信号的稳定性的大小的指标值是在,
(a-1)“当前帧的上述音响信号的预测增益”大,
(a-2)“当前帧的上述音响信号的预测增益的估计值”大,
(b-1)“前一帧的预测增益”与“当前帧的预测增益”的差分小,
(b-2)“前一帧的预测增益的估计值”与“当前帧的预测增益的估计值”的差分小,
(c-1)“当前帧中包含的上述音响信号的样本的振幅之和”大,
(c-2)“将当前帧中包含的上述音响信号的样本串变换至频域而得到的样本串中包含的样本的振幅之和”大,
(d-1)“前一帧中包含的上述音响信号的样本的振幅之和”与“当前帧中包含的上述音响信号的样本的振幅之和”的差分小,
(d-2)“将前一帧中包含的上述音响信号的样本串变换至频域而得到的样本串中包含的样本的振幅之和”与“将当前帧中包含的上述音响信号的样本串变换至频域而得到的样本串中包含的样本的振幅之和”的差分小,
(e-1)“当前帧的上述音响信号的功率”大,
(e-2)“将当前帧的上述音响信号的样本串变换至频域而得到的样本串的功率”大,
(f-1)“前一帧的上述音响信号的功率”与“当前帧的上述音响信号的功率”的差分小,
(f-2)“将前一帧的上述音响信号的样本串变换至频域而得到的样本串的功率”与“将当前帧的上述音响信号的样本串变换至频域而得到的样本串的功率”的差分小、
的至少任一个条件满足的情况下变大的值。
19.一种编码装置,对来自帧单位的音响信号的频域的样本串进行编码,其特征在于,包含:
间隔决定部,按照每帧,从间隔T的候选的集合S之中决定对应于上述音响信号的周期性的样本的间隔T、或者对应于上述音响信号的基本频率的整数倍的样本间隔T;
辅助信息生成部,对由上述间隔决定部决定的间隔T进行编码而得到辅助信息;以及
样本串编码部,将如下的样本串作为重排后的样本串,并对上述重排后的样本串进行编码得到码串:(1)包含上述样本串的全部的样本,且(2)基于由上述间隔决定部决定的间隔T,重排在上述样本串中包含的至少一部分样本,以便包含上述样本串中的对应于上述音响信号的周期性或基本频率的样本的一个或者连续的多个样本、以及包含上述样本串中的对应于上述音响信号的周期性或基本频率的整数倍的样本的一个或者连续的多个样本、的全部或一部分的样本聚集,
上述间隔决定部将由如下的候选构成的集合作为上述集合S,决定上述间隔T:可通过上述辅助信息表现的间隔T的Z个候选之中的、不依赖于在仅规定帧数量的过去的帧中成为间隔决定部的处理对象的候选而选择的Z2个候选(其中,Z2<Z)、以及在仅规定帧数量的过去的帧中成为间隔决定部的对象的候选的、Y个候选(其中,Y<Z)。
20.如权利要求19所述的编码装置,其特征在于,
上述样本串编码部,在对上述重排后的样本串进行编码而得到的码串的码量或其估计值与上述辅助信息的码量的合计,比对上述重排前的样本串进行编码而得到的码串的码量或其估计值小的情况下,输出对上述重排后的样本串进行编码而得到的码串与上述辅助信息,
在对上述重排前的样本串进行编码而得到的码串的码量或其估计值,比对上述重排后的样本串进行编码而得到的码串的码量或其估计值与上述辅助信息的码量的合计少的情况下,输出对上述重排前的样本串进行编码而得到的码串。
21.一种周期性特征量决定装置,决定帧单位的音响信号的周期性特征量,其特征在于,包含:
周期性特征量决定部,按照每帧,从周期性特征量的候选的集合之中决定上述音响信号的周期性特征量;以及
辅助信息生成部,对通过周期性决定部得到的周期性特征量进行编码而得到辅助信息,
上述周期性决定部将由如下的候选构成的集合作为上述集合S而决定上述周期性特征量:可通过上述辅助信息表现的周期性特征量的Z个候选之中的、不依赖于在仅规定帧数量的过去的帧中成为周期性特征量决定部的处理对象的候选而选择的Z2个候选(其中,Z2<Z)、以及在仅规定帧数量的过去的帧中成为周期性特征量决定部的处理对象的候选的、Y个候选(其中,Y<Z)。
22.用于使计算机执行权利要求1至13的任一项所述的编码方法、或如权利要求14至18的任一项所述的周期性特征量决定方法、的各步骤的程序。
23.记录了用于使计算机执行如权利要求1至13的任一项所述的编码方法、或如权利要求14至18的任一项所述的周期性特征量决定方法、的各步骤的程序的计算机可读取的记录介质。
CN201280006378.1A 2011-01-25 2012-01-18 编码方法、编码装置、周期性特征量决定方法、周期性特征量决定装置、程序、记录介质 Active CN103329199B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011013426 2011-01-25
JP2011-013426 2011-01-25
PCT/JP2012/050970 WO2012102149A1 (ja) 2011-01-25 2012-01-18 符号化方法、符号化装置、周期性特徴量決定方法、周期性特徴量決定装置、プログラム、記録媒体

Publications (2)

Publication Number Publication Date
CN103329199A true CN103329199A (zh) 2013-09-25
CN103329199B CN103329199B (zh) 2015-04-08

Family

ID=46580721

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280006378.1A Active CN103329199B (zh) 2011-01-25 2012-01-18 编码方法、编码装置、周期性特征量决定方法、周期性特征量决定装置、程序、记录介质

Country Status (8)

Country Link
US (1) US9711158B2 (zh)
EP (1) EP2650878B1 (zh)
JP (1) JP5596800B2 (zh)
KR (2) KR20130111611A (zh)
CN (1) CN103329199B (zh)
ES (1) ES2558508T3 (zh)
RU (1) RU2554554C2 (zh)
WO (1) WO2012102149A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105723452A (zh) * 2013-10-18 2016-06-29 弗劳恩霍夫应用研究促进协会 音频信号的频谱的频谱系数的编码
CN106133830A (zh) * 2014-03-24 2016-11-16 日本电信电话株式会社 编码方法、编码装置、程序以及记录介质
CN106373594A (zh) * 2016-08-31 2017-02-01 华为技术有限公司 一种音调检测方法及装置
CN106663437A (zh) * 2014-05-01 2017-05-10 日本电信电话株式会社 编码装置、解码装置、编码方法、解码方法、编码程序、解码程序、记录介质
CN107430869A (zh) * 2015-01-30 2017-12-01 日本电信电话株式会社 参数决定装置、方法、程序及记录介质
CN108665036A (zh) * 2017-04-02 2018-10-16 田雪松 位置编码方法
CN109983535A (zh) * 2016-08-31 2019-07-05 Dts公司 具有子带能量平滑的基于变换的音频编解码器和方法
CN110289008A (zh) * 2014-05-01 2019-09-27 日本电信电话株式会社 周期性综合包络序列生成装置、方法、程序、记录介质
CN110349590A (zh) * 2014-01-24 2019-10-18 日本电信电话株式会社 线性预测分析装置、方法、程序以及记录介质
CN112992164A (zh) * 2014-07-28 2021-06-18 日本电信电话株式会社 编码方法、装置、程序以及记录介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107359880B (zh) * 2012-10-01 2020-08-25 日本电信电话株式会社 编码方法、编码装置以及记录介质
JP6270992B2 (ja) * 2014-04-24 2018-01-31 日本電信電話株式会社 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、プログラム及び記録媒体
JP6758890B2 (ja) * 2016-04-07 2020-09-23 キヤノン株式会社 音声判別装置、音声判別方法、コンピュータプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06131000A (ja) * 1992-10-15 1994-05-13 Nec Corp 基本周期符号化装置
JPH1152994A (ja) * 1997-08-05 1999-02-26 Kokusai Electric Co Ltd 音声符号化装置
JP2006126592A (ja) * 2004-10-29 2006-05-18 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
CN101176147A (zh) * 2005-05-13 2008-05-07 松下电器产业株式会社 语音编码装置以及频谱变形方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
JP3277705B2 (ja) * 1994-07-27 2002-04-22 ソニー株式会社 情報符号化装置及び方法、並びに情報復号化装置及び方法
JP4005154B2 (ja) * 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
JP2001285073A (ja) * 2000-03-29 2001-10-12 Sony Corp 信号処理装置及び方法
US6587816B1 (en) * 2000-07-14 2003-07-01 International Business Machines Corporation Fast frequency-domain pitch estimation
DE60204038T2 (de) * 2001-11-02 2006-01-19 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zum codieren bzw. decodieren eines audiosignals
KR100711989B1 (ko) 2002-03-12 2007-05-02 노키아 코포레이션 효율적으로 개선된 스케일러블 오디오 부호화
JP3871672B2 (ja) * 2002-11-21 2007-01-24 日本電信電話株式会社 ディジタル信号処理方法、その処理器、そのプログラム、及びそのプログラムを格納した記録媒体
RU2383941C2 (ru) * 2005-06-30 2010-03-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для кодирования и декодирования аудиосигналов
US7599840B2 (en) * 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
KR100883656B1 (ko) 2006-12-28 2009-02-18 삼성전자주식회사 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP4964114B2 (ja) 2007-12-25 2012-06-27 日本電信電話株式会社 符号化装置、復号化装置、符号化方法、復号化方法、符号化プログラム、復号化プログラム、および記録媒体
JP4978539B2 (ja) * 2008-04-07 2012-07-18 カシオ計算機株式会社 符号化装置、符号化方法及びプログラム。
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
ES2592416T3 (es) * 2008-07-17 2016-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificación/decodificación de audio que tiene una derivación conmutable
US8207875B2 (en) 2009-10-28 2012-06-26 Motorola Mobility, Inc. Encoder that optimizes bit allocation for information sub-parts
US20120029926A1 (en) * 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06131000A (ja) * 1992-10-15 1994-05-13 Nec Corp 基本周期符号化装置
JPH1152994A (ja) * 1997-08-05 1999-02-26 Kokusai Electric Co Ltd 音声符号化装置
JP2006126592A (ja) * 2004-10-29 2006-05-18 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
CN101176147A (zh) * 2005-05-13 2008-05-07 松下电器产业株式会社 语音编码装置以及频谱变形方法

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105723452A (zh) * 2013-10-18 2016-06-29 弗劳恩霍夫应用研究促进协会 音频信号的频谱的频谱系数的编码
US10847166B2 (en) 2013-10-18 2020-11-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Coding of spectral coefficients of a spectrum of an audio signal
CN111009249A (zh) * 2013-10-18 2020-04-14 弗劳恩霍夫应用研究促进协会 音频信号的频谱的频谱系数的编码
CN105723452B (zh) * 2013-10-18 2020-01-31 弗劳恩霍夫应用研究促进协会 音频信号的频谱的频谱系数的解码方法及解码器
CN110349590B (zh) * 2014-01-24 2023-03-24 日本电信电话株式会社 线性预测分析装置、方法以及记录介质
CN110349590A (zh) * 2014-01-24 2019-10-18 日本电信电话株式会社 线性预测分析装置、方法、程序以及记录介质
CN110491398A (zh) * 2014-03-24 2019-11-22 日本电信电话株式会社 编码方法、编码装置、程序以及记录介质
CN106133830A (zh) * 2014-03-24 2016-11-16 日本电信电话株式会社 编码方法、编码装置、程序以及记录介质
CN110491398B (zh) * 2014-03-24 2022-10-21 日本电信电话株式会社 编码方法、编码装置以及记录介质
CN106133830B (zh) * 2014-03-24 2019-08-16 日本电信电话株式会社 编码方法、编码装置以及记录介质
CN112820305A (zh) * 2014-05-01 2021-05-18 日本电信电话株式会社 编码装置、编码方法、编码程序、记录介质
CN110491402A (zh) * 2014-05-01 2019-11-22 日本电信电话株式会社 周期性综合包络序列生成装置、方法、程序、记录介质
CN110491401A (zh) * 2014-05-01 2019-11-22 日本电信电话株式会社 周期性综合包络序列生成装置、方法、程序、记录介质
CN112820305B (zh) * 2014-05-01 2023-12-15 日本电信电话株式会社 编码装置、编码方法、编码程序、记录介质
CN110289008A (zh) * 2014-05-01 2019-09-27 日本电信电话株式会社 周期性综合包络序列生成装置、方法、程序、记录介质
CN110491402B (zh) * 2014-05-01 2022-10-21 日本电信电话株式会社 周期性综合包络序列生成装置、方法、记录介质
CN110491401B (zh) * 2014-05-01 2022-10-21 日本电信电话株式会社 周期性综合包络序列生成装置、方法、记录介质
CN106663437A (zh) * 2014-05-01 2017-05-10 日本电信电话株式会社 编码装置、解码装置、编码方法、解码方法、编码程序、解码程序、记录介质
CN110289008B (zh) * 2014-05-01 2022-10-21 日本电信电话株式会社 周期性综合包络序列生成装置、方法、记录介质
CN112992164A (zh) * 2014-07-28 2021-06-18 日本电信电话株式会社 编码方法、装置、程序以及记录介质
CN107430869A (zh) * 2015-01-30 2017-12-01 日本电信电话株式会社 参数决定装置、方法、程序及记录介质
CN107430869B (zh) * 2015-01-30 2020-06-12 日本电信电话株式会社 参数决定装置、方法及记录介质
CN109983535A (zh) * 2016-08-31 2019-07-05 Dts公司 具有子带能量平滑的基于变换的音频编解码器和方法
CN106373594A (zh) * 2016-08-31 2017-02-01 华为技术有限公司 一种音调检测方法及装置
CN109983535B (zh) * 2016-08-31 2023-09-12 Dts公司 具有子带能量平滑的基于变换的音频编解码器和方法
CN106373594B (zh) * 2016-08-31 2019-11-26 华为技术有限公司 一种音调检测方法及装置
CN108665036A (zh) * 2017-04-02 2018-10-16 田雪松 位置编码方法

Also Published As

Publication number Publication date
KR20160080115A (ko) 2016-07-07
KR20130111611A (ko) 2013-10-10
RU2013134463A (ru) 2015-03-10
RU2554554C2 (ru) 2015-06-27
JPWO2012102149A1 (ja) 2014-06-30
WO2012102149A1 (ja) 2012-08-02
US20130311192A1 (en) 2013-11-21
EP2650878B1 (en) 2015-11-18
KR101740359B1 (ko) 2017-05-26
JP5596800B2 (ja) 2014-09-24
EP2650878A4 (en) 2014-11-05
ES2558508T3 (es) 2016-02-04
CN103329199B (zh) 2015-04-08
EP2650878A1 (en) 2013-10-16
US9711158B2 (en) 2017-07-18

Similar Documents

Publication Publication Date Title
CN103329199B (zh) 编码方法、编码装置、周期性特征量决定方法、周期性特征量决定装置、程序、记录介质
US11024319B2 (en) Encoding method, decoding method, encoder, decoder, program, and recording medium
CN104321814B (zh) 频域基音周期分析方法和频域基音周期分析装置
CN104704559B (zh) 编码方法以及编码装置
CN101911501A (zh) 编码方法、解码方法及其装置、以及其程序和记录介质
CN104321813B (zh) 编码方法、编码装置
JP5694751B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
CN101266795B (zh) 一种格矢量量化编解码的实现方法及装置
JP5714172B2 (ja) 符号化装置、この方法、プログラムおよび記録媒体
JP5579932B2 (ja) 符号化方法、装置、プログラム及び記録媒体
JP5789816B2 (ja) 符号化装置、この方法、プログラム及び記録媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant