CN109147827A - 编码方法、编码装置、程序以及记录介质 - Google Patents
编码方法、编码装置、程序以及记录介质 Download PDFInfo
- Publication number
- CN109147827A CN109147827A CN201811009738.9A CN201811009738A CN109147827A CN 109147827 A CN109147827 A CN 109147827A CN 201811009738 A CN201811009738 A CN 201811009738A CN 109147827 A CN109147827 A CN 109147827A
- Authority
- CN
- China
- Prior art keywords
- sample
- pitch period
- frequency domain
- mentioned
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 85
- 238000006243 chemical reaction Methods 0.000 claims abstract description 180
- 238000004458 analytical method Methods 0.000 claims abstract description 89
- 241000209094 Oryza Species 0.000 description 148
- 235000007164 Oryza sativa Nutrition 0.000 description 148
- 235000009566 rice Nutrition 0.000 description 148
- 230000007774 longterm Effects 0.000 description 145
- 238000012545 processing Methods 0.000 description 88
- 238000013139 quantization Methods 0.000 description 47
- 238000010606 normalization Methods 0.000 description 30
- 230000005236 sound signal Effects 0.000 description 20
- 230000009466 transformation Effects 0.000 description 19
- 230000008569 process Effects 0.000 description 16
- 230000003595 spectral effect Effects 0.000 description 16
- 238000011084 recovery Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000004069 differentiation Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 229910002056 binary alloy Inorganic materials 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000018199 S phase Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
- G10L2025/903—Pitch determination of speech signals using a laryngograph
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
- G10L2025/906—Pitch tracking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明的编码方法包括:周期换算步骤,时域的基音周期L与预定的时间区间的音响信号的时域基音周期码对应,且获得与上述时域的基音周期L对应的频域的样本间隔作为换算间隔T1;频域基音周期分析步骤,从包括上述换算间隔T1以及上述换算间隔T1的整数倍的值U×T1的候选值中决定源于上述音响信号的频域样本串的基音周期、即第一频域基音周期T,获得表示上述第一频域基音周期T是上述换算间隔T1的几倍的第一频域基音周期码,其中,U是预先决定的第一范围的整数;以及频域基音周期考虑编码步骤,将上述频域样本串以基于上述第一频域基音周期T的编码方法进行编码。
Description
本申请是国际申请日为2013年5月22日、申请号为201380026430.4、发明名称为“编码方法、解码方法、编码装置、解码装置、程序以及记录介质”的发明专利申请的分案申请。
技术领域
本发明涉及音响信号的编码技术以及通过该编码技术而获得的码串的解码技术。更详细而言,涉及将音响信号变换为频域而获得的频域的样本串的编码和其解码。
背景技术
作为低比特(例如,10kbit/s~20kbit/s左右)的声音信号或音响信号的编码方法,已知DFT(离散傅里叶变换)或MDCT(变址离散余弦变换)等的对于正交变换系数的自适应编码。例如,作为标准规格技术的AMR-WB+(Extended Adaptive Multi-Rate Wideband,扩展的自适应多速率宽带)具有TCX(transform coded excitation:变换码激励)编码模式,其中,将DFT系数按每8个样本归一化而进行矢量量化。
此外,在TwinVQ(Transform domain Weighted Interleave VectorQuantization,变换域加权交织矢量量化)中,将MDCT系数整体按照固定的规则排序后的样本的集合作为矢量而进行编码。此时,例如,有时也采用如下方法等:从MDCT系数中提取时域的每个基音周期(pitch period)的大的成分,对与时域的基音周期对应的信息进行编码,进一步,将除去时域的每个基音周期的大的成分的剩余的MDCT系数串进行排序,将排序后的MDCT系数串按每个预定样本数进行矢量量化而进行编码的方法。作为与TwinVQ有关的文献,能够例示非专利文献1、2。
此外,作为等间隔地提取样本而进行编码的技术,例如能够例示专利文献1。
现有技术文献
专利文献
专利文献1:特开2009-156971号公报
非专利文献
非专利文献1:T.Moriya,N.Iwakami,A.Jin,K.Ikeda,and S.Miki,"A Design ofTransform Coder for Both Speech and Audio Signals at 1bit/sample,"Proc.ICASSP'97,pp.1371-1374,1997.
非专利文献2:J.Herre,E.Allamanche,K.Brandenburg,M.Dietz,B.Teichmann,B.Grill,A.Jin,T.Moriya,N.Iwakami,T.Norimatsu,M.Tsushima,T.Ishikawa,"Theintegrated Filterbank Based Scalable MPEG-4 Audio Coder,"105th ConventionAudio Engineering Society,4810,1998.
发明内容
发明要解决的课题
以AMR-WB+为首,在基于TCX的编码中,没有考虑基于周期性的频域的样本串的振幅的偏差,若将振幅的偏差大的样本串汇总进行编码,则编码效率下降。为了提高编码效率,基于频域的样本串的基音周期,按振幅的偏差小的每个样本群,遵照不同的基准进行编码,是有效的。
但是,还不知道有效率地决定频域的样本串的基音周期而进行编码的方法。
本发明鉴于这样的技术的背景,其目的在于,提供一种在编码时能够有效率地决定频域的样本串的基音周期而进行编码,在解码时能够确定频域的样本串的基音周期的技术。
为了解决课题的手段
根据本发明的编码技术,时域的基音周期L与预定的时间区间的音响信号的时域基音周期码对应,且获得与时域的基音周期L对应的频域的样本间隔作为换算间隔T1,从包括换算间隔T1以及换算间隔T1的整数倍的值U×T1的候选值中决定频域基音周期T,获得表示频域基音周期T是换算间隔T1的几倍的频域基音周期码。以在解码侧中能够确定频域基音周期T的方式,输出频域基音周期码。
本发明的编码方法包括:周期换算步骤,时域的基音周期L与预定的时间区间的音响信号的时域基音周期码对应,且获得与上述时域的基音周期L对应的频域的样本间隔作为换算间隔T1;频域基音周期分析步骤,从包括上述换算间隔T1以及上述换算间隔T1的整数倍的值U×T1的候选值中决定源于上述音响信号的频域样本串的基音周期、即第一频域基音周期T,获得表示上述第一频域基音周期T是上述换算间隔T1的几倍的第一频域基音周期码,其中,U是预先决定的第一范围的整数;以及频域基音周期考虑编码步骤,将上述频域样本串以基于上述第一频域基音周期T的编码方法进行编码。
本发明的编码装置包括:周期换算部,时域的基音周期L与预定的时间区间的音响信号的时域基音周期码对应,且获得与上述时域的基音周期L对应的频域的样本间隔作为换算间隔T1;频域基音周期分析部,从包括上述换算间隔T1以及上述换算间隔T1的整数倍的值U×T1的候选值中决定源于上述音响信号的频域样本串的基音周期、即第一频域基音周期T,获得表示上述第一频域基音周期T是上述换算间隔T1的几倍的第一频域基音周期码,其中,U是预先决定的第一范围的整数;以及频域基音周期考虑编码部,将上述频域样本串以基于上述第一频域基音周期T的编码方法进行编码。
发明效果
根据本发明,由于从换算间隔的整数倍中探索频域基音周期T,所以频域基音周期T的探索所需的运算处理量少。进一步,由于使用表示频域基音周期T是换算间隔的几倍的信息作为确定频域基音周期T的信息,所以能够抑制频域基音周期码的码量。由此,在编码时能够有效率地决定频域的样本串的基音周期而进行编码,在解码时能够确定频域的样本串的基音周期。
附图说明
图1是实施方式的编码装置的框图。
图2是实施方式的解码装置的框图。
图3是表示了时域中的基本周期、时域的基音周期、样本点的关系的图。
图4是表示了频域中的理想换算间隔、其m倍的间隔、频率的关系的图。
图5是表示了频域基音周期/(变换帧长*2/时域的基音周期)的频度的图。
图6是用于说明在样本串中包含的样本的排序的一例的概念图。
图7是用于说明在样本串中包含的样本的排序的一例的概念图。
图8是实施方式的编码装置的框图。
图9是实施方式的解码装置的框图。
图10是实施方式的编码装置的框图。
图11是实施方式的解码装置的框图。
图12是例示了实施方式的可变长码簿的图。
图13是例示了实施方式的可变长码簿的图。
图14是实施方式的编码装置的框图。
图15是实施方式的解码装置的框图。
图16是实施方式的频域基音周期分析装置的框图。
具体实施方式
参照附图,说明本发明的实施方式。另外,对重复的结构元素分配相同的参照标号,并省略重复说明。
[第一实施方式]
“编码装置11”
参照图1,说明编码装置11进行的编码处理。编码装置11的各部分以作为预定的时间区间的帧单位,进行以下的动作。在以下的说明中,设为帧的样本数为Nt,1个帧量的数字音响信号为数字音响信号串x(1),...,x(Nt)。
“长期预测分析部111”
(概要)
长期预测分析部111以作为预定的时间区间的帧单位,获得与输入的数字音响信号串x(1),...,x(Nt)对应的时域的基音周期L(步骤S111-1),计算与该时域的基音周期L对应的基音增益gp(步骤S111-2),基于该基音增益gp,求出表示是否执行长期预测的长期预测选择信息而输出(步骤S111-3),在长期预测选择信息表示执行长期预测的情况下,至少还输出时域的基音周期L、确定时域的基音周期L的时域基音周期码CL(步骤S111-4)。
(步骤S111-1:时域的基音周期L)
长期预测分析部111例如从预先决定的时域的基音周期的候选τ中选择通过式(A1)而获得的值成为最大的候选τ,作为与数字音响信号串x(1),...,x(Nt)对应的时域的基音周期L。
[数1]
候选τ以及时域的基音周期L除了只使用整数而表现的情况(整数精度)之外,还有使用整数和小数值(分数值)而表现的情况(小数精度)。在求出对于小数精度的候选τ的式(A1)的值的情况下,使用对多个数字音响信号样本进行加权平均操作的插值滤波器而求出x(t-τ)。
(步骤S111-2:基音增益gp)
长期预测分析部111例如基于数字音响信号和时域的基音周期L,通过式(A2)而计算基音增益gp。
[数2]
(步骤S111-3:长期预测选择信息)
长期预测分析部111在基音增益gp为预先决定的值以上的情况下,获得表示执行长期预测的长期预测选择信息而输出,在基音增益gp小于上述的预先决定的值的情况下,获得表示不执行长期预测的长期预测选择信息而输出。
(步骤S111-4:在执行长期预测的情况下)
在长期预测选择信息表示执行长期预测的情况下,长期预测分析部111进行以下。
在长期预测分析部111中,存储有对预先决定的时域的基音周期的候选τ分配了与该候选唯一对应的索引的信息。长期预测分析部111选择用于确定选择作为时域的基音周期L的候选τ的索引,作为确定时域的基音周期L的时域基音周期码CL。
然后,长期预测分析部111除了上述的长期预测选择信息之外,还输出时域的基音周期L和时域基音周期码CL。
此外,在长期预测分析部111还输出量化完毕基音增益gp^以及基音增益码Cgp的情况下,在长期预测分析部111中,存储有对预先决定的基音增益的候选分配了与该候选唯一对应的索引的信息。长期预测分析部111选择在基音增益的候选中确定最接近基音增益gp的索引,作为确定量化完毕基音增益gp^的基音增益码Cgp。
然后,长期预测分析部111除了上述的长期预测选择信息、时域的基音周期L、时域基音周期码CL之外,还输出量化完毕基音增益gp^和基音增益码Cgp。
“长期预测残差生成部112”
在长期预测分析部111输出的长期预测选择信息表示执行长期预测的情况下,长期预测残差生成部112以作为预定的时间区间的帧单位,生成从输入的数字音响信号串中除去了已进行长期预测的信号所得的长期预测残差信号串而输出。例如,基于输入的数字音响信号串x(1),...,x(Nt)、时域的基音周期L、量化完毕基音增益gp^,通过式(A3)计算长期预测残差信号串xp(1),...,xp(Nt)来生成。在长期预测分析部111不输出量化完毕基音增益gp^的情况下,使用例如0.5等的预先决定的值作为gp^。
xp(t)=x(t)-gp^x(t-L) (A3)
“频域变换部113a”
首先,在长期预测分析部111输出的长期预测选择信息表示执行长期预测的情况下,频域变换部113a以帧单位,将输入的长期预测残差信号串xp(1),...,xp(Nt)变换为频域的N点(将N称为“变换帧长”)的MDCT系数串X(1),...,X(N),在长期预测分析部111输出的长期预测选择信息表示不执行长期预测的情况下,频域变换部113a以帧单位,将输入的数字音响信号串x(1),...,x(Nt)变换为频域的N点(将N称为“变换帧长”)的MDCT系数串X(1),...,X(N)(步骤S113a)。频域变换部113a进行在时域中对2*N点的长期预测残差信号串或者数字音响信号串施加了窗之后的信号串的MDCT变换,在频域中获得N点的系数。另外,符号*表示乘法。频域变换部113a通过将在时域中的窗各错开N点而更新帧。此时,相邻的帧的样本各重复N点。长期预测分析的对象样本和MDCT变换中的窗的对象样本能够独立地以延迟或重合的程度来设定窗的形状。例如,只要从作为长期预测分析的对象样本而没有重合的样本部分中取出Nt点即可。此外,在对有重合的样本也进行长期预测分析的情况下,需要设定重合处理与长期预测的差分和合成的处理的自适应顺序等,使得在编码装置和解码装置中不会产生大的误差。
“加权包络归一化部113b”
加权包络归一化部113b通过使用线性预测系数而估计的数字音响信号串的功率谱包络系数串,对输入的MDCT系数串的各系数进行归一化,并输出加权归一化MDCT系数串,其中,通过对于帧单位的数字音响信号串的线性预测分析而求出该线性预测系数(步骤S113b)。这里,为了实现在听觉上失真减小的量化,加权包络归一化部113b使用使功率谱包络削弱的加权功率谱包络系数串,以帧单位对MDCT系数串的各系数进行归一化。其结果,加权归一化MDCT系数串成为虽然不具有如输入的MDCT系数串程度的大的振幅的倾斜度或振幅的凹凸,但具有与声音音响数字信号的功率谱包络系数串类似的大小关系的系数串,即成为在与低的频率对应的系数侧的区域具有稍微大的振幅,具有由时域的基音周期所引起的微小结构的系数串。
[加权包络归一化处理的具体例]
与N点的MDCT系数串的各系数X(1),...,X(N)对应的功率谱包络系数串的各系数W(1),...,W(N)能够将线性预测系数变换为频域而获得。例如,通过作为全极型模型的p次自回归过程,与时刻对应的样本点t的数字音响信号x(t)通过追溯至p时刻(p是正整数)的过去的自身的值x(t-1),...,x(t-p)、预测残差e(t)、线性预测系数α1,...,αp以式(1)来表示。此时,功率谱包络系数串的各系数W(n)[1≤n≤N]以式(2)来表示。exp(·)是以自然常数为底的指数函数,j是虚数单位,σ2是预测残差能量。
[数3]
x(t)+α1x(t-1)+…+αpx(t-p)=e(t) (1)
线性预测系数既可以设为由加权包络归一化部113b对与输入到长期预测分析部111的数字音响信号串相同的数字音响信号串进行线性预测分析而获得的系数,也可以设为由在编码装置11内存在的未图示的其他部件对声音音响数字信号进行线性预测分析而获得的系数。在这样的情况下,加权包络归一化部113b使用线性预测系数而求出功率谱包络系数串的各系数W(1),...,W(N)。此外,在由在编码装置11内存在的其他部件(功率谱包络系数串计算部)已经获得了功率谱包络系数串的各系数W(1),...,W(N)的情况下,加权包络归一化部113b能够使用该功率谱包络系数串的各系数W(1),...,W(N)。另外,由于在后述的解码装置12中也需要获得与在编码装置11中获得的值相同的值,所以利用量化后的线性预测系数以及/或者功率谱包络系数串。在以后的说明中,只有没有特别提及,则“线性预测系数”或“功率谱包络系数串”意味着量化后的线性预测系数或功率谱包络系数串。此外,线性预测系数例如通过现有的编码技术而进行编码,且由此获得的预测系数码传输到解码侧。现有的编码技术是,例如,将与线性预测系数本身对应的码设为预测系数码的编码技术、将线性预测系数变换为LSP参数且将与LSP参数对应的码设为预测系数码的编码技术、将线性预测系数变换为PARCOR系数且将与PARCOR系数对应的码设为预测系数码的编码技术等。在是通过在编码装置11内存在的其他部件而获得功率谱包络系数串的结构的情况下,在编码装置11内存在的其他部件中,线性预测系数通过现有的编码技术而进行编码后,预测系数码传输到解码侧。
这里,作为加权包络归一化处理的具体例,表示两个例,但本发明并不限定于这些例。
<例1>
加权包络归一化部113b进行如下处理:通过将MDCT系数串的各系数X(1),...,X(N)除以与该各系数对应的功率谱包络系数串的各系数的校正值Wγ(1),...,Wγ(N),从而获得加权归一化MDCT系数串的各系数X(1)/Wγ(1),...,X(N)/Wγ(N)。校正值Wγ(n)[1≤n≤N]在式(3)中提供。其中,γ是1以下的正的常数,是使功率谱系数削弱的常数。
[数4]
<例2>
加权包络归一化部113b进行如下处理:通过将MDCT系数串的各系数X(1),...,X(N)除以与该各系数对应的功率谱包络系数串的各系数的β次方(0<β<1)的值W(1)β,...,W(N)β,从而获得加权归一化MDCT系数串的各系数X(1)/W(1)β,...,X(N)/W(N)β。
其结果,虽然获得帧单位的加权归一化MDCT系数串,但加权归一化MDCT系数串成为虽然不具有如输入的MDCT系数串程度的大的振幅的倾斜度或振幅的凹凸,但具有与输入的MDCT系数串的功率谱包络类似的大小关系的系数串,即成为在与低的频率对应的系数侧的区域具有稍微大的振幅,具有由时域的基音周期所引起的微小结构的系数串。
另外,由于在解码侧进行与加权包络归一化处理对应的逆处理、即从加权归一化MDCT系数串复原MDCT系数串的处理,所以在编码侧和解码侧中需要将从功率谱包络系数串计算加权功率谱包络系数串的方法设为共同的设定。
“归一化增益计算部113c”
接着,归一化增益计算部113c将加权归一化MDCT系数串设为输入,按每个帧,以能够将加权归一化MDCT系数串的各系数使用所提供的总比特数进行量化的方式,在全部频率中使用振幅值的和或者能量值来决定量化步幅,求出以成为该量化步幅的方式对加权归一化MDCT系数串的各系数进行除法运算的系数(以下,称为增益)(步骤S113c)。表示该增益的信息作为增益信息而传输到解码侧。归一化增益计算部113c按每个帧,将输入的加权归一化MDCT系数串的各系数使用该增益进行归一化(除法运算)而输出。
“量化部113d”
接着,量化部113d按每个帧,将使用增益进行了归一化的加权归一化MDCT系数串的各系数,使用在步骤S113c的处理中决定的量化步幅进行量化,输出获得的量化MDCT系数串作为“频域的样本串”(步骤S113d)。
在步骤S113d的处理中获得的帧单位的量化MDCT系数串(频域的样本串)成为频域基音周期分析部115以及排序处理部116a的输入。
“周期换算部114”
周期换算部114在长期预测选择信息表示执行长期预测的情况下,基于输入的时域的基音周期L和频域的样本点数N,通过式(A4)求出换算间隔T1而输出。式(A4)的“INT()”表示舍去了()内的数值的小数点以下。
T1=INT(N*2/L) (A4)
另外,理论上的换算周期是N*2/L-1/2,但在将换算间隔T1设为整数值的情况下,为了将其四舍五入,加上1/2而舍去。或者,也可以将N*2/L-1/2的预先决定的小数点位数以下进行四舍五入而设为换算间隔T1。例如,也可以在N*2/L-1/2以具有二进制5位的小数部的疑似浮动小数点形式保持,将作为整数值的基音周期进行四舍五入而求出的情况下,将舍去了25*(N*2/L-1/2+1/2)的值设为换算间隔T1,将T1进行了整数倍的结果进行1/25=1/32倍,从而返回到浮动小数点数的值作为候选,决定频域的基音周期。
周期换算部114在长期预测选择信息表示不执行长期预测的情况下,什么也不做。但是,即使进行与在长期预测选择信息表示执行长期预测的情况相同的处理,也没有问题。即,周期换算部114也可以是如下结构:不被输入长期预测选择信息,被输入所输入的时域的基音周期L和频域的样本点数N,从而求出换算间隔T1而输出。
“频域基音周期分析部115”
频域基音周期分析部115在长期预测选择信息表示执行长期预测的情况下,将所输入的换算间隔T1以及换算间隔T1的整数倍的值U×T1作为候选值,决定频域基音周期T,输出频域基音周期T和表示频域基音周期T是换算间隔T1的几倍的频域基音周期码。其中,U是预先决定的第一范围的整数。例如,U是除了0的整数,例如U≥2。例如,在预先决定的第一范围的整数为2以上且8以下的情况下,换算间隔T1、换算间隔T1的2倍~8倍的2T1、3T1、4T1、5T1、6T1、7T1、8T1的共8个值是频域基音周期的候选值,从这些候选值中选择频域基音周期T。此时,频域基音周期码是至少3比特的、与1以上且8以下的整数分别一对一对应的码。
频域基音周期分析部115在长期预测选择信息表示不执行长期预测的情况下,将预先决定的第二范围的整数值作为候选值而决定频域基音周期T,输出频域基音周期T和表示频域基音周期T的频域基音周期码。例如,在预先决定的第二范围的整数值为5以上且36以下的情况下,5、6、……、36的共25个值是频域基音周期的候选值,从这些候选值中选择频域基音周期T。此时,频域基音周期码是至少5比特的、与0以上且31以下的整数分别一对一对应的码。
频域基音周期分析部115例如决定表示对于根据预先决定的排序规则而选择的样本群的能量的集中度的指标值成为最大的候选,作为频域基音周期T。表示能量的集中度的指标值是能量的总和、绝对值和等。即,在表示能量的集中度的指标值是能量的总和的情况下,决定在根据预先决定的排序规则而选择的样本群中包含的全部样本的能量的总和成为最大的候选值,作为频域基音周期T。此外,在表示能量的集中度的指标值是绝对值和的情况下,决定在根据预先决定的排序规则而选择的样本群中包含的全部样本的值的绝对值成为最大的候选值,作为频域基音周期T。关于“根据预先决定的排序规则而选择的样本群”,在排序处理部116a的栏中详细说明。
或者,频域基音周期分析部115例如决定对根据预先决定的排序规则而排序的样本串实际进行编码而码量成为最小的候选值,作为频域基音周期T。关于“根据预先决定的排序规则而排序的样本串”,在排序处理部116a的栏中详细说明。
或者,频域基音周期分析部115例如从表示对于根据预先决定的排序规则而选择的样本群的能量的集中度的指标值最大起选择上述预定个数的候选值,并从所选择的候选值中,决定对根据预先决定的排序规则而排序的样本串实际进行编码而码量成为最小的候选值,作为频域基音周期T。
以下,说明频域基音周期分析部115在长期预测选择信息表示执行长期预测的情况下,将换算间隔T1以及换算间隔T1整数倍的值U×T1作为候选值,决定频域基音周期T的含义。
若在时域中对2*N点的长期预测残差信号串施加了窗之后的信号串设为xp’(1),...,xp’(2*N),则通过该信号串xp’(1),...,xp’(2*N)的MDCT变换而获得的MDCT系数串X(1),...,X(N)例如成为如下。
[数5]
其中,ρ是(1/N)1/2等的系数,k是与频率对应的索引k=1,...,N。即,各MDCT系数串X(k)例如是以下的2*N维的归一正交基底矢量B(k)和信号串矢量(xp’(1),...,xp’(2*N))的内积。
[数6]
理想的话,信号串xp’(1),...,xp’(2*N)在时域中具有基本周期Pf(数字音响信号串x(1),...,x(Nt)的基本周期)的周期性,所以由上述的各内积而成的串、即各MDCT系数X(k)的能量或绝对值以频率方向的间隔2*N/Pf(以下,称为“理想换算间隔”)的周期成为极大(其中,除了信号串xp’(1),...,xp’(2*N)为正弦波这样的特殊的情况之外)。因此,理想的话,在步骤S111-1中选择的时域的基音周期L是基本周期Pf,作为Pf=L的理想换算间隔2*N/Pf是频域基音周期T。
但是,x(1),...,x(Nt)以及X(1),...,X(N)分别是离散值。时域中的x(1),...,x(Nt)的邻接样本间隔的整数倍不一定是基本周期Pf,进一步,频域中的X(1),...,X(N)的邻接样本间隔的整数倍也不一定是理想换算间隔2*N/Pf。因此,有时在步骤S111-1中选择的时域的基音周期L不是基本周期Pf或者其附近的候选τ,而是基本周期Pf的整数倍或者其附近的候选τ。在时域的基音周期L是基本周期的整数倍n*Pf的情况下,将时域的基音周期L换算为频域的间隔T1’成为理想换算间隔的整数量的一倍、即(2*N/Pf)/n。其结果,有时不能以理想换算间隔2*N/Pf作为频域基音周期T而选择样本群,通过将间隔T1’=2*N/L的整数倍作为频域基音周期T而选择样本群,能够增大表示对于所选择的样本群的能量的集中度的指标值。以下,使用具体例,说明这些情况。
如前所述,在步骤S111-1中选择的时域的基音周期L是将通过式(A1)而获得的值设为最大的候选τ。一般,式(A1)的x(t)x(t-τ)成为最大是在选择了最接近数字音响信号串x(1),...,x(Nt)的基本周期Pf或者其整数倍、即n*Pf(其中,n是正整数)中的任一个的候选τ的情况下。即,最接近n*Pf中的任一个的候选τ成为时域的基音周期L的倾向高。这里,若基本周期Pf是数字音响信号串x(1),...,x(Nt)的采样周期(邻接样本间隔)的整数倍,则将通过式(A1)而获得基本周期Pf或者与其最接近的候选τ的值设为最大,成为时域的基音周期L的倾向高。另一方面,在基本周期Pf不是采样周期的整数倍的情况下,将通过式(A1)而获得基本周期Pf以外的n*Pf或者与其最接近的候选τ的值设为最大,成为时域的基音周期L的情况多。例如在图3的例中,基本周期Pf不是采样周期的整数倍,选择2*Pf作为时域的基音周期L。在时域基音周期的候选τ中,有多个成为采样周期的整数倍的候选的情况下,候选的值越小则式(A1)的值越大,所以存在越容易选择作为时域基音周期L的倾向。例如,在2*Pf和4*Pf成为采样周期的整数倍的情况下,由于2*Pf时式(A1)的值更大,所以容易选择作为时域基音周期L。即,可以说上述的n存在值越小则被使用的可能性越高的倾向。
即,在步骤S111-1中选择的时域的基音周期L能够近似为L≒n*Pf。因此,将时域的基音周期L换算为频域的间隔T1’=2*N/L能够如下近似。
T1’=2*N/L≒2*N/n*Pf=(2*N/Pf)/n (A41)
即,间隔T1’能够近似于理想换算间隔(2*N/Pf)的1/n倍。在这样的情况下,不是间隔T1’本身对应于理想换算间隔2*N/Pf,而是间隔的整数倍n*T1’对应于理想换算间隔2*N/Pf。
进一步,在频域中的采样间隔的整数倍不一定对应于理想换算间隔2*N/Pf。例如,在图4的例中,由于理想换算间隔2*N/Pf没有成为MDCT系数串X(1),...,X(N)的邻接样本间隔的整数倍,所以不能将理想换算间隔2*N/Pf作为频域基音周期T而选择样本群。但是,在增大对于基于频域的基音周期而选择的样本群的能量的集中度的目的上,即使理想换算间隔2*N/Pf本身不能被选择作为频域的基音周期,通过将理想换算间隔2*N/Pf的m倍(其中,m是正整数)作为频域基音周期T=m*2*N/Pf而选择样本群,也能够增大表示对于选择的样本群的能量的集中度的指标值。即,在增大对于选择的样本群的能量的集中度的目的上,频域基音周期T和换算间隔T1’的关系使用式(A41)而如下书写。
T=m*(2*N/Pf)≒m*n*T1’ (A42)
进一步,式(A42)能够使用式(A4)的换算间隔T1而近似为如下。
T≒m*n*INT(T1’)=m*n*INT(2*N/L)=m*n*T1 (A43)
即,频域的基音周期T能够近似为换算间隔T1的整数倍。换言之,换算间隔T1的整数倍的值为增大表示对于样本群的能量的集中度的指标值的频域的基音周期T的可能性比比除此之外的值更高。即,通过将换算间隔T1、换算间隔T1的整数倍、其附近的值作为候选值而决定频域基音周期T,能够增大表示对于样本群的能量的集中度的指标值。
如上所述,由于存在n的值越小则被使用的可能性越高的倾向,m是正整数,所以可以说在频域中存在对于频域基音周期T的换算间隔T1的乘数m*n越小则越容易被决定作为频域基音周期T的倾向。即,可以说存在换算间隔T1的整数倍的倍数值越小则越容易被决定作为频域基音周期T的倾向。
图5例示以频域基音周期/(变换帧长*2/时域的基音周期)(T/(2*N/L)=T/T1)作为横轴,以其频度作为纵轴的图表。图5是表示增大表示对于样本群的能量的集中度的指标值的频域基音周期和时域基音周期的关系的图。从图5可知,频域基音周期T成为换算间隔T1的整数倍(尤其是1倍、2倍、3倍、4倍)或者其附近的值的频度高,频域基音周期T没有成为换算间隔T1的整数倍的情况下的频度低。即,图5表示增大对于样本群的能量的集中度的频域基音周期T成为换算间隔T1的整数倍或者其附近的值的概率极其高。此外,还已知存在对于频域基音周期T的换算间隔T1的乘数m*n越小则越容易被决定作为频域基音周期T的倾向。因此,通过将换算间隔T1的整数倍以及其附近的值作为候选值而探索频域基音周期,能够获得增大对于样本群的能量的集中度的值作为频域基音周期。
“频域基音周期考虑编码部116”
频域基音周期考虑编码部116包括排序处理部116a和编码部116b,通过基于频域基音周期T的编码方法,对输入的频域的样本串进行编码,并输出由此获得的码串。
“排序处理部116a”
排序处理部116a输出(1)包括频域的样本串的全部样本且(2)以汇集包括在频域的样本串中与频域基音周期分析部115决定的频域基音周期T对应的样本在内的一个或者连续的多个样本以及包括在频域样本串中与频域基音周期T的整数倍对应的样本在内的一个或者连续的多个样本中的全部或者一部分样本的方式,对在样本串中包含的至少一部分样本进行了排序的样本,作为排序后的样本串。即,以汇集包括与频域基音周期T对应的样本在内的一个或者连续的多个样本以及包括与该频域基音周期T的整数倍对应的样本在内的一个或者连续的多个样本的方式,对在输入的样本串中包含的至少一部分样本进行排序。
并且,包括与频域基音周期T对应的样本在内的一个或者连续的多个样本以及包括与该频域基音周期T的整数倍对应的样本在内的一个或者连续的多个样本,在低频侧以成为一体的方式汇集。
作为具体例,排序处理部116a从输入的样本串中,选择包括与频域基音周期T的整数倍对应的样本F(nT)的前后的样本F(nT-1)、F(nT+1)在内的3个样本F(nT-1)、F(nT)、F(nT+1)。由该选择的样本构成的群是频域基音周期分析部115中的“按照预先决定的排序规则而选择的样本群”。F(j)是与表示对应于频率的样本索引的编号j对应的样本。设为n是从1至nT+1不超过预先设定的对象样本的上限N的范围的各整数。将表示与频率对应的样本索引的编号j的最大值设为jmax。将根据n而选择的样本的集合称为样本群。可以使上限N与jmax一致,但由于在声音或乐音等的音响信号中,高频中的样本的指标一般大多数充分小,所以从为了提高后述的编码效率而将具有大的指标的样本汇集在低频侧的观点出发,N也可以是小于jmax的值。例如,N也可以是jmax的一半左右的值。若将基于上限N而确定的n的最大值设为nmax,则在输入的样本串中包含的样本中、与从最低的频率至第一预定的频率nmax*T+1为止的各频率对应的样本,成为排序的对象。另外,符号*表示乘法。
排序处理部116a将所选择的样本F(j),依旧保持原来的编号j的大小关系的同时从样本串的开头起依次配置,生成样本串A。例如,在n表示1至5的各整数的情况下,排序处理部116a从样本串的开头起排列第一样本群F(T-1)、F(T)、F(T+1)、第二样本群F(2T-1)、F(2T)、F(2T+1)、第三样本群F(3T-1)、F(3T)、F(3T+1)、第四样本群F(4T-1)、F(4T)、F(4T+1)、第五样本群F(5T-1)、F(5T)、F(5T+1)。即,15个样本F(T-1)、F(T)、F(T+1)、F(2T-1)、F(2T)、F(2T+1)、F(3T-1)、F(3T)、F(3T+1)、F(4T-1)、F(4T)、F(4T+1)、F(5T-1)、F(5T)、F(5T+1)按照这个顺序从样本串的开头起排列,由这15个样本构成样本串A。
进一步,排序处理部116a将未被选择的样本F(j),依旧保持原来的编号的大小关系的同时从样本串A的最后起依次配置。未被选择的样本F(j)是位于构成样本串A的样本群之间的样本,将这样的连续的一体的样本称为样本集。即,若是上述的例,则第一样本集F(1),...,F(T-2)、第二样本集F(T+2),...,F(2T-2)、第三样本集F(2T+2),...,F(3T-2)、第四样本集F(3T+2),...,F(4T-2)、第五样本集F(4T+2),...,F(5T-2)、第六样本集F(5T+2),...,F(jmax)从样本串A的最后起依次排列,由这些样本构成样本串B。
总之,若是这个例,则输入的样本串F(j)(1≤j≤jmax)按F(T-1)、F(T)、F(T+1)、F(2T-1)、F(2T)、F(2T+1)、F(3T-1)、F(3T)、F(3T+1)、F(4T-1)、F(4T)、F(4T+1)、F(5T-1)、F(5T)、F(5T+1)、F(1),...,F(T-2)、F(T+2),...,F(2T-2)、F(2T+2),...,F(3T-2)、F(3T+2),...,F(4T-2)、F(4T+2),...,F(5T-2)、F(5T+2),...,F(jmax)排序(参照图6)。该排序后的样本串是频域基音周期分析部115中的“按照预先决定的排序规则排序的样本串”。
另外,在低频带中,在与频域基音周期T对应的样本或其整数倍的样本以外的样本中,各样本具有振幅或功率大的值的情况也较多。因此,也可以不进行与从最低的频率到预定的频率f为止的各频率对应的样本的排序。例如,若将预定的频率f设为nT+α,则不对排序前的样本F(1),...,F(nT+α)进行排序,而将排序前的F(nT+α+1)以后的样本设为排序的对象。α被预先设定为0以上且比T小某种程度的整数(例如,不超过T/2的整数)。这里,n也可以是2以上的整数。或者,也可以不对排序前的从与最低频率对应的样本起连续的P个样本F(1),...,F(P)进行排序,而将排序前的F(P+1)以后的样本设为排序的对象。此时,预定的频率f是P。对于成为排序的对象的样本的集合的排序的基准如上所述。另外,在设定了第一预定的频率的情况下,预定的频率f(第二预定的频率)小于第一预定的频率。
例如,在不对排序前的样本F(1),...,F(T+1)进行排序,而将排序前的F(T+2)以后的样本设为排序的对象的情况下,若基于上述的排序的基准,则输入的样本串F(j)(1≤j≤jmax)按F(1),...,F(T+1)、F(2T-1)、F(2T)、F(2T+1)、F(3T-1)、F(3T)、F(3T+1)、F(4T-1)、F(4T)、F(4T+1)、F(5T-1)、F(5T)、F(5T+1)、F(T+2),...,F(2T-2)、F(2T+2),...,F(3T-2)、F(3T+2),...,F(4T-2)、F(4T+2),...,F(5T-2)、F(5T+2),...,F(jmax)排序(参照图7)。
也可以不将决定成为排序的对象的编号j的最大值的上限N或者第一预定的频率对全部帧设为共同的值,而是按每个帧设定不同的上限N或者第一预定的频率。此时,将按每个帧指定上限N或者第一预定的频率的信息发送到解码侧即可。此外,也可以不指定成为排序的对象的编号j的最大值,而是指定排序的样本群的个数,此时,也可以按每个帧设定样本群的个数,将指定样本群的个数的信息发送到解码侧。当然,也可以将排序的样本群的个数对全部帧设为共同。此外,关于第二预定的频率f,也可以不对全部帧设为共同的值,而按每个帧设定不同的第二预定的频率f。此时,将按每个帧指定第二预定的频率的信息发送到解码侧即可。
在将频率设为横轴,将样本的指标设为纵轴的情况下,在这样排序之后的样本串中,样本的指标的包络线伴随着频率的增大而表示下降倾向。作为其理由,举出作为频域的样本串是音响信号、尤其是声音信号或乐音信号的特征,一般高频成分少的事实。换言之,可以说排序处理部116a对在以样本的指标的包络线伴随着频率的增大而表示下降倾向的方式输入的样本串中包含的至少一部分样本进行排序。另外,在图6以及图7中,为了容易理解地图示通过样本的排序而具有较大的振幅的样本偏向低域侧的情况,图示了在频域的样本串中包含的全部样本为正的值的情况下的例。实际上,在频域的样本串中包含的各样本为正或者负或者零的值的情况也较多,但即使是在这样的情况下,执行上述的排序处理或者后述的排序处理即可。
进一步,在该实施方式中,进行了在低域侧汇集包括与频域基音周期T对应的样本在内的一个或者连续的多个样本以及包括与频域基音周期T的整数倍对应的样本在内的一个或者连续的多个样本的排序,但也可以进行在高频侧汇集包括与频域基音周期T对应的样本在内的一个或者连续的多个样本以及包括与频域基音周期T的整数倍对应的样本在内的一个或者连续的多个样本的排序。此时,在样本串A中,样本群按照逆序排列,在样本串B中,样本集按逆序排列,在低域侧配置样本串B且在样本B的后面配置样本串A。即,若是上述的例,则从低域侧,样本按照第六样本集F(5T+2),...,F(jmax)、第五样本集F(4T+2),...,F(5T-2)、第四样本集F(3T+2),...,F(4T-2)、第三样本集F(2T+2),...,F(3T-2)、第二样本集F(T+2),...,F(2T-2)、第一样本集F(1),...,F(T-2)、第五样本群F(5T-1)、F(5T)、F(5T+1)、第四样本群F(4T-1)、F(4T)、F(4T+1)、第三样本群F(3T-1)、F(3T)、F(3T+1)、第二样本群F(2T-1)、F(2T)、F(2T+1)、第一样本群F(T-1)、F(T)、F(T+1)的顺序排列。
在将频率设为横轴,将样本的指标设为纵轴的情况下,在这样排序之后的样本串中,样本的指标的包络线伴随着频率的增大而表示增大倾向。换言之,可以说排序处理部116a对在以样本的指标的包络线伴随着频率的增大而表示增大倾向的方式输入的样本串中包含的至少一部分样本进行排序。
也有频域基音周期T不是整数而是小数的情况。此时,例如,将R(nT)作为对nT进行了四舍五入的值,选择F(R(nT-1))、F(R(nT))、F(R(nT+1))。
另外,在频域基音周期分析部115进行决定实际的码量成为最小的候选值作为频域基音周期T的处理的情况下,由于在频域基音周期分析部115中生成排序后的样本串,所以频域基音周期考虑编码部116也可以不具有排序处理部116a。
[汇集的样本的个数]
此外,在该实施方式中,表示了在各样本群中包含的样本的个数为与频域基音周期T或其整数倍对应的样本(以下,称为中心样本)和其前后1个样本的共3个样本的、固定的个数的例。但是,在将在样本群中包含的样本的个数或样本索引设为可变的情况下,排序处理部116a输出表示从在样本群中包含的样本的个数和样本索引的组合不同的多个选项中选择的一个的信息,作为辅助信息(第一辅助信息)。
例如,在作为选项而设定了
(1)只有中心样本F(nT)
(2)中心样本和其前后1个样本的共3个样本F(nT-1)、F(nT)、F(nT+1)
(3)中心样本和其前2个样本的共3个样本F(nT-2)、F(nT-1)、F(nT)
(4)中心样本和其前3个样本的共4个样本F(nT-3)、F(nT-2)、F(nT-1)、F(nT)
(5)中心样本和其后2个样本的共3个样本F(nT)、F(nT+1)、F(nT+2)
(6)中心样本和其后3个样本的共4个样本F(nT)、F(nT+1)、F(nT+2)、F(nT+3)
的情况下,
若选择(4),则将表示选择了该(4)的信息设为第一辅助信息。若是这个例,则作为表示所选择的选项的信息有3比特就充分。
另外,作为从这样的选项中要选择哪个的方法,采用如下方法即可:
在排序处理部116a中实施与各选项对应的排序,在后述的编码部116b中获得与各选项对应的码串的码量,选择码量最小的选项。此时,第一辅助信息从编码部116b输出,而不是从排序处理部116a输出。这个方法在能够选择n的情况下也是妥当的。
“编码部116b”
接着,编码部116b对排序处理部116a输出的样本串进行编码,输出所获得的码串(步骤S116b)。例如,编码部116b根据在排序处理部116a输出的样本串中包含的样本的振幅的偏向,切换可变长编码的方法而进行编码。即,由于通过排序处理部116a在帧内在低域侧(或者高频侧)中汇集振幅大的样本,所以编码部116b进行适合该偏向的方法的可变长编码。若如排序处理部116a输出的样本串那样,汇集按局部的每个区域具有同等或者同程度的振幅的样本,则例如通过按每个区域使用不同的Rice参数进行Rice编码,能够削减平均码量。以下,采用在帧内在低域侧(接近帧的开头的侧)汇集振幅大的样本的情况为例,进行说明。
[编码的具体例]
作为具体例,编码部116b在汇集有具有大的振幅的样本的区域中,按每个样本应用Rice编码(也称为Golomb-Rice编码)。在该区域以外的区域中,编码部116b应用在对于汇集了多个样本的样本的集合的编码中也能够适用的熵编码(entropy coding)(哈夫曼编码或算术编码等)。关于Rice编码的应用,既可以是Rice编码的应用区域和Rice参数固定的结构,或者也可以是从Rice编码的应用区域和Rice参数的组合不同的多个选项中选择一个的结构。在从这样的多个选项中选择一个时,作为Rice编码的选择信息,例如能够使用如下述的可变长码(用符号""包围的二进制值),编码部116b还输出选择信息。
"1":不应用Rice编码。
"01":在从开头起1/32的区域,将Rice参数作为1而应用Rice编码。
"001":在从开头起1/32的区域,将Rice参数作为2而应用Rice编码。
"0001":在从开头起1/16的区域,将Rice参数作为1而应用Rice编码。
"00001":在从开头起1/16的区域,将Rice参数作为2而应用Rice编码。
"00000":在从开头起1/32的区域,将Rice参数作为3而应用Rice编码。
另外,作为从这样的选项中要选择哪个的方法,只要采用如下方法即可:对在编码处理中获得的与各Rice编码对应的码串的码量进行比较,选择码量最小的选项。
此外,若在排序后的样本串中出现具有0的振幅的样本持续较长的区域,则通过对具有0的振幅的样本的连续数进行例如游程编码(run length coding),能够削减平均码量。在这样的情况下,编码部116b(1)在具有大的振幅的样本汇集的区域中,按每个样本应用Rice编码,(2)在该区域以外的区域中,(a)在具有0的振幅的样本连续的区域中,进行输出表示具有0的振幅的样本的连续数的码的编码,(b)在剩余的区域中,应用在对于汇集了多个样本的样本的集合的编码中也能够适用的熵编码(哈夫曼编码或算术编码等)。在这样的情况下,也可以进行如上述的Rice编码的选择。此外,在这样的情况下,表示在哪个区域中应用了游程编码的信息也需要传输到解码侧,例如该信息包含在上述选择信息中。进一步,在准备属于熵编码的多个编码方法作为选项的情况下,用于确定选择了哪个编码的信息也需要传输到解码侧,例如该信息包含在上述选择信息中。
另外,也考虑没有在样本串中包含的样本的排序所产生的优点的情况。在这样的情况下,应对排序前的样本串进行编码。因此,还从排序处理部116a输出排序前的样本串(未进行排序的样本串),编码部116b对排序前的样本串和排序后的样本串分别进行可变长编码,将对排序前的样本串进行可变长编码而获得的码串的码量、和对排序后的样本串按每个区域切换可变长编码进行编码而获得的码串的码量进行比较,在排序前的样本串的码量最小的情况下,输出对排序前的样本串进行可变长编码而获得的码串。此时,编码部116b还输出表示与码串对应的样本串是否为进行了样本的排序的样本串的辅助信息(第二辅助信息)。作为该第二辅助信息使用1比特是充分的。另外,在第二辅助信息确定与码串对应的样本串是没有进行样本的排序的样本串的情况下,也可以不输出第一辅助信息。
此外,也可以预先决定为只有在预测增益或者其估计值大于某一确定的阈值的情况下应用样本串的排序。这利用了在预测增益大时声带振动或乐器的振动强、周期性也高的情况较多的声音或乐音的性质。预测增益是将原音的能量除以预测残差的能量所得的。在使用线性预测系数或PARCOR系数作为参数的编码中,能够在编码装置和解码装置中共同使用量化完毕的参数。因此,例如,编码部116b使用由编码装置11内的未图示的其他部件求出的i次的量化完毕PARCOR系数k(i),计算由将(1-k(i)*k(i))按每个次数进行了乘法运算的值的倒数表示的预测增益的估计值,在计算出的估计值大于某一确定的阈值的情况下,输出对排序后的样本串进行可变长编码而获得的码串,否则,输出对排序前的样本串进行可变长编码而获得的码串。此时,不需要输出表示与码串对应的样本串是否为进行了排序的样本串的第二辅助信息。即,在不能预测的噪声的声音或无声时效果小的可能性高,所以决定为不进行排序则第二辅助信息或计算的浪费更少。
另外,在排序处理部116a中,进行预测增益或者预测增益的估计值的计算。也可以构成为在预测增益或者预测增益的估计值大于某一确定的阈值的情况下,进行对于样本串的排序,并将排序后的样本串输出到编码部116b,否则,不进行对于样本串的排序,将输入到排序处理部116a的样本串直接输出到编码部116b,在编码部116b中,对从排序处理部116a输出的样本串进行可变长编码。
另外,在该结构的情况下,设为在编码侧和解码侧将阈值预先设定为共同的值。
另外,这里例示的Rice编码、算术编码、游程编码都是已知的,所以省略其详细的说明。此外,由于量化完毕PARCOR系数是能够从线性预测系数或LSP参数变换的系数,所以也可以代替由编码装置11内的未图示的其他部件而求出量化完毕PARCOR系数,通过编码装置11内的未图示的其他部件而首先求出量化完毕的线性预测系数或量化完毕的LSP参数,接着,根据求出的参数求出量化完毕PARCOR系数,进一步,求出预测增益的估计值。总而言之,预测增益的估计值基于与线性预测系数对应的量化完毕的系数而求出。
在上述的编码处理中,说明了根据在排序处理部116a输出的样本串中包含的样本的振幅的偏向而切换可变长编码方法进行编码的例,但并不限定于这样的编码处理。例如,也可以采用如下的编码处理:将一个或者多个样本作为1个码元(编码单位),依赖由该一个或者多个码元而成的序列(以下,称为码元序列)的紧之前的码元序列,对分配码进行自适应性控制。作为这样的编码处理,例如能够例示在JPEG2000中也采用的自适应型算术码。在自适应型算术编码中,进行建模(modeling)处理和算术编码。在建模处理中,从紧之前的码元序列选择用于算术编码的码元序列的频度表。然后,进行如下算术编码:根据所选择的码元序列的出现概率而划分闭区间半直线[0,1],对表示被划分的区间内的位置的二进制小数值分配对于该码元序列的码。在本发明的实施方式中,作为建模处理,将排序后的频域的样本串(在上述的例中为量化MDCT系数串)从低域起依次分为码元,选择用于算术编码的频度表,进一步,作为算术编码,根据所选择的码元序列的出现概率而划分闭区间半直线[0,1],对表示被划分的区间内的位置的二进制小数值分配对于该码元序列的码。如上所述,通过排序处理,样本串已经以汇集反映样本的大小的指标(例如,振幅的绝对值)同等或同程度的样本的方式排序,所以样本串内的邻接的样本间的反映样本的大小的指标的变动减小,码元的频度表的精度提高,能够抑制通过对于码元的算术编码而获得的码的总码量。
“解码装置”
参照图2,说明解码装置12进行的解码处理。
在解码装置12中,至少输入上述长期预测选择信息、上述增益信息、上述频域基音周期码、上述码串。此外,在上述长期预测选择信息表示执行长期预测的情况下,至少输入时域基音周期码CL。也有除了时域基音周期码CL之外还输入基音增益码Cgp的情况。另外,在从编码装置11输出了选择信息或第一辅助信息或第二辅助信息的情况下,该选择信息或第一辅助信息或第二辅助信息也输入到解码装置12。
“频域基音周期考虑解码部123”
频域基音周期考虑解码部123包括解码部123a和恢复部123b,通过基于频域基音周期T的解码方法,对输入的码串进行解码,获得原来的样本的排列而输出。
“解码部123a”
解码部123a按每个帧,对输入的码串进行解码而输出频域的样本串(步骤S123a)。
在解码装置12中输入第二辅助信息的情况下,根据第二辅助信息是否表示与码串对应的样本串是进行了样本的排序的样本串,解码部123a获得的频域的样本串的输出目的地不同。在第二辅助信息表示与码串对应的样本串是进行了排序的样本串的情况下,解码部123a获得的频域的样本串输出到恢复部123b。在第二辅助信息表示与码串对应的样本串是没有进行排序的样本串的情况下,解码部123a获得的频域的样本串输出到增益乘法部124a。
此外,在编码装置11中预先通过预测增益或者其估计值和阈值的比较结果而进行了是否进行样本的排序的切换的情况下,在解码装置12中也进行相同的切换。即,解码部123a使用由解码装置12内的未图示的其他部件求出的i次的量化完毕PARCOR系数k(i),计算由将(1-k(i)*k(i))按每个次数进行了乘法运算的值的倒数表示的预测增益的估计值。然后,解码部123a在计算出的估计值大于某一确定的阈值的情况下,将解码部123a获得的频域的样本串输出到恢复部123b。否则,解码部123a将解码部123a获得的频域的样本串、即排序前的样本串输出到增益乘法部124a。
另外,作为由解码装置12内的未图示的其他部件求出量化完毕PARCOR系数的方法,只要采用对与PARCOR系数对应的码进行解码而获得量化完毕PARCOR系数的方法、对与LSP参数对应的码进行解码而获得量化完毕LSP参数并将获得的量化完毕LSP参数进行变换而获得量化完毕PARCOR系数的方法等已知方法即可。总而言之,这些方法全部是从与线性预测系数对应的码获得与线性预测系数对应的量化完毕的系数的方法。即,预测增益的估计值是基于与对与线性预测系数对应的码进行解码而获得的线性预测系数对应的量化完毕的系数的值。
在对解码装置12从编码装置11输入了选择信息的情况下,解码部123a对输入的码串,通过对应于选择信息的解码方法执行解码处理。当然执行与为了获得码串而执行的编码方法对应的解码方法。由于解码部123a的解码处理的细节与编码装置11的编码部116b的编码处理的细节对应,所以这里援用该编码处理的说明,明确记载与所执行的编码对应的解码是解码部123a进行的解码处理的情况,并据此说明解码处理的细节。另外,在输入了选择信息的情况下,由该选择信息确定执行了什么样的编码方法。在选择信息中包括例如确定Rice编码的应用区域和Rice参数的信息、表示游程编码的应用区域的信息、确定熵编码的种类的信息的情况下,与这些编码方法对应的解码方法应用到输入的码串的对应的区域。由于与Rice编码对应的解码处理、与熵编码(entropy coding)对应的解码处理、与游程编码(run length coding)对应的解码处理都是已知的,所以省略说明。
“长期预测信息解码部121”
长期预测信息解码部121在长期预测选择信息表示执行长期预测的情况下,对输入的时域基音周期码CL进行解码,获得时域的基音周期L而输出。在还输入了基音增益码Cgp的情况下,进一步,对基音增益码Cgp进行解码,获得量化完毕基音增益gp^而输出。
“周期换算部122”
周期换算部122在长期预测选择信息表示执行长期预测的情况下,对输入的频域基音周期码进行解码而获得表示频域基音周期T是换算间隔T1的几倍的整数值,基于时域的基音周期L和频域的样本点数N,通过式(A4)而获得换算间隔T1,对换算间隔T1乘以整数值,获得频域基音周期T而输出。
周期换算部122在长期预测选择信息表示不执行长期预测的情况下,对输入的频域基音周期码进行解码,获得频域基音周期T而输出。
“恢复部123b”
接着,恢复部123b按每个帧,基于周期换算部122获得的频域基音周期T,或者,在解码装置12中输入了辅助信息的情况下,基于周期换算部122获得的频域基音周期T和输入的辅助信息,从解码部123a输出的频域的样本串获得原来的样本的排列而输出(步骤S123b)。这里,“原来的样本的排列”相当于从编码装置11的频域样本串生成部113输出的“频域的样本串”。如上所述,编码装置11的排序处理部116a的排序方法或与排序方法对应的排序的选项有各种,但在执行了排序的情况下,所执行的排序是一种,其排序能够由频域基音周期T和辅助信息确定。
由于恢复部123b的恢复处理的细节与编码装置11的排序处理部116a的排序处理的细节对应,所以这里援用该排序处理的说明,明确记载排序处理的逆序的处理(逆的排序)为恢复部123b进行的恢复处理,并据此说明恢复处理的细节。另外,为了助于理解,说明与上述的排序处理的具体例对应的恢复处理的一例。
例如,若是排序处理部116a将样本群汇集到低域侧而输出了F(T-1)、F(T)、F(T+1)、F(2T-1)、F(2T)、F(2T+1)、F(3T-1)、F(3T)、F(3T+1)、F(4T-1)、F(4T)、F(4T+1)、F(5T-1)、F(5T)、F(5T+1)、F(1),...,F(T-2)、F(T+2),...,F(2T-2)、F(2T+2),...,F(3T-2)、F(3T+2),...,F(4T-2)、F(4T+2),...,F(5T-2)、F(5T+2),...,F(jmax)的上述的例,则在恢复部123b中,输入解码部123a输出的频域的样本串F(T-1)、F(T)、F(T+1)、F(2T-1)、F(2T)、F(2T+1)、F(3T-1)、F(3T)、F(3T+1)、F(4T-1)、F(4T)、F(4T+1)、F(5T-1)、F(5T)、F(5T+1)、F(1),...,F(T-2)、F(T+2),...,F(2T-2)、F(2T+2),...,F(3T-2)、F(3T+2),...,F(4T-2)、F(4T+2),...,F(5T-2)、F(5T+2),...,F(jmax)。恢复部123b基于频域基音周期T和辅助信息,将输入的样本串F(T-1)、F(T)、F(T+1)、F(2T-1)、F(2T)、F(2T+1)、F(3T-1)、F(3T)、F(3T+1)、F(4T-1)、F(4T)、F(4T+1)、F(5T-1)、F(5T)、F(5T+1)、F(1),...,F(T-2)、F(T+2),...,F(2T-2)、F(2T+2),...,F(3T-2)、F(3T+2),...,F(4T-2)、F(4T+2),...,F(5T-2)、F(5T+2),...,F(jmax)返回到原来的样本的排列F(j)(1≤j≤jmax)。
“增益乘法部124a”
接着,增益乘法部124a按每个帧,对解码部123a或者恢复部123b输出的样本串的各系数乘以由上述增益信息确定的增益,获得“归一化的加权归一化MDCT系数串”而输出(步骤S124a)。
“加权包络逆归一化部124b”
接着,加权包络逆归一化部124b按每个帧,对增益乘法部124a输出的“归一化的加权归一化MDCT系数串”的各系数应用从如前述那样传输的功率谱包络系数串获得的校正系数,获得“MDCT系数串”而输出(步骤S124b)。若对应于在编码装置11中执行的加权包络归一化处理的例而说明具体例,则加权包络逆归一化部124b通过对增益乘法部124a输出的“归一化的加权归一化MDCT系数串”的各系数乘以与该各系数对应的功率谱包络系数串的各系数的β次方(0<β<1)的值W(1)β,...,W(N)β,获得MDCT系数串的各系数X(1),...,X(N)。
“时域变换部124c”
接着,时域变换部124c按每个帧,将加权包络逆归一化部124b输出的“MDCT系数串”变换为时域,获得帧单位的信号串(时域的信号串)而输出(步骤S124c)。在长期预测信息解码部121输出的长期预测选择信息表示执行长期预测的情况下,时域变换部124c获得的信号串作为长期预测残差信号串xp(1),...,xp(Nt)而输入到长期预测合成部125。在长期预测信息解码部121输出的长期预测选择信息表示不执行长期预测的情况下,时域变换部124c获得的信号串作为数字音响信号串x(1),...,x(Nt)而从解码装置12输出。
“长期预测合成部125”
长期预测合成部125在长期预测选择信息表示执行长期预测的情况下,基于时域变换部124c获得的长期预测残差信号串xp(1),...,xp(Nt)、长期预测信息解码部121输出的时域的基音周期L和量化完毕基音增益gp^、长期预测合成部125生成的过去的数字音响信号,通过式(A5)而获得数字音响信号串x(1),...,x(Nt)。在长期预测信息解码部121不输出量化完毕基音增益gp^的情况下,即,在解码装置12中未被输入基音增益码Cgp的情况下,例如使用0.5等的预先决定的值作为gp^。此时的gp^的值在长期预测信息解码部121内预先存储,使得在编码装置11和解码装置12中能够使用相同的值。
x(t)=xp(t)+gp^x(t-L)(A5)
并且,长期预测合成部125获得的信号串作为数字音响信号串x(1),...,x(Nt)而从解码装置12输出。
长期预测合成部125在长期预测选择信息表示不执行长期预测的情况下,什么也不做。
从实施方式可知,例如在清楚频域基音周期T的情况下,通过对根据频域基音周期T对样本串进行了排序后的样本串进行编码,能够进行效率高的编码(即,能够减小平均码长)。此外,由于通过样本串的排序而按每个局部区域集中具有同等或同程度的指标的样本,所以除了可变长编码的效率化之外,还能够减轻量化失真或削减码量。
[第一实施方式的变形例]
在第一实施方式的编码装置11中,将换算间隔T1以及换算间隔T1的整数倍的值U×T1作为候选值而决定了频域基音周期T,但也可以将换算间隔T1的整数倍的值U×T1以外的倍数值作为候选值而决定频域基音周期T。以下,说明与第一实施方式不同的点。
[编码装置11’]
本变形例的编码装置11’与第一实施方式的编码装置11的不同点在于,代替频域基音周期分析部115而包括频域基音周期分析部115’。在本变形例中,频域基音周期分析部115’将换算间隔T1以及换算间隔T1的整数倍的值U×T1以及换算间隔T1的整数倍U×T1以外的预先决定的倍数的值作为候选值,决定频域基音周期T而输出。频域基音周期分析部115’在长期预测选择信息表示不执行长期预测的情况下,与第一实施方式相同地,将预先决定的第二范围的整数值作为候选值,决定频域基音周期T而输出。
“频域基音周期分析部115’”
频域基音周期分析部115’将换算间隔T1以及换算间隔T1的整数倍的值U×T1以及换算间隔T1的整数倍U×T1以外的预先决定的倍数的值作为候选值,决定频域基音周期T(从包括换算间隔T1以及换算间隔T1的整数倍的值U×T1的候选值中决定频域基音周期T),输出频域基音周期T和表示频域基音周期T是换算间隔T1的几倍的频域基音周期码。
例如,在预先决定的第一范围的整数为2以上且9以下的情况下,换算间隔T1、其整数倍的值2T1、3T1、4T1、5T1、6T1、7T1、8T1、9T1、作为换算间隔T1的整数倍以外的预先决定的倍数的值的1.9375T1、2.0625T1、2.125T1、2.1875T1、2.25T1、2.9375T1、3.0625T1的共16个值是频域基音周期的候选值。从这些候选值中选择频域基音周期T。此时,频域基音周期码是与16个候选值分别一对一对应的至少4比特的码。
另外,“预先决定的第一范围的整数”不一定包括某一整数以上且某一整数以下的全部整数。例如,也可以将2以上且9以下、且除了5之外的整数设为预先决定的第一范围的整数。在这个情况下,例如,换算间隔T1、其整数倍的值2T1、3T1、4T1、5T1、6T1、7T1、8T1、9T1、作为换算间隔T1的整数倍以外的预先决定的倍数的值的1.3750T1、1.53125T1、2.03125T1、2.0625T1、2.09375T1、2.1250T1、8.5000T1、14.5000T1的共16个值是频域基音周期的候选值,从这些候选值中选择频域基音周期T。此时,频域基音周期码是与16个候选值分别一对一对应的至少4比特的码。
频域基音周期分析部115’在长期预测选择信息表示不执行长期预测的情况下,与第一实施方式相同地,将预先决定的第二范围的整数值作为候选值而决定频域基音周期T。
[解码装置12’]
本变形例的解码装置12’与第一实施方式的解码装置12的不同点在于,代替周期换算部122而包括周期换算部122’。
“周期换算部122’”
周期换算部122’在长期预测选择信息表示执行长期预测的情况下,对频域基音周期码进行解码而获得表示频域基音周期T是换算间隔T1的几倍的值(倍数值),基于时域的基音周期L和频域的样本点数N,通过式(A4)而获得换算间隔T1,对换算间隔T1乘以表示是几倍的值,获得频域基音周期T而输出。
周期换算部122’在长期预测选择信息表示不执行长期预测的情况下,对频域基音周期码进行解码,获得频域基音周期T而输出。
[第一实施方式的变形例2]
在第一实施例的变形例1中,将换算间隔T1的整数倍的值U×T1以外的倍数值也作为候选值而决定了频域基音周期T。此时,反映具有整数倍的值U×T1比除此以外的值成为频域基音周期T的可能性高的特性的情况,在第一实施方式的变形例2中,由可变长码簿决定频域基音周期码的长度。
此外,在频域基音周期分析部115”中,还考虑频域基音周期码的长度而决定基音周期T。
以下,说明与第一实施方式的变形例1不同的点。本变形例的编码装置11”与第一实施方式的编码装置11的不同点在于,代替频域基音周期分析部115而包括频域基音周期分析部115”。
“频域基音周期分析部115””
频域基音周期分析部115”将换算间隔T1以及换算间隔T1的整数倍的值U×T1以及换算间隔T1的整数倍U×T1以外的预先决定的倍数的值作为候选值,决定频域基音周期T(从包括换算间隔T1以及换算间隔T1的整数倍的值U×T1的候选值中决定频域基音周期T),输出频域基音周期T和表示频域基音周期T是换算间隔T1的几倍的频域基音周期码。
这里,表示频域基音周期T是换算间隔T1的几倍的频域基音周期码使用与换算间隔T1的整数倍的值V×T1对应的码的码长比与除此以外的候选对应的码的码长短的可变长码簿,决定频域基音周期码。其中,V是整数。例如,V是除了0之外的整数,例如,V是正的整数。例如,V∈{1,U}。
例如,也可以使用在频域基音周期T是换算间隔T1本身时的可变长码的码长以及在频域基音周期T是换算间隔T1的整数倍U×T1时的可变长码的码长比除此之外时的可变长码的码长短的可变长码簿(例1),决定频域基音周期码。另外,“可变长码”意味着,对频度高的现象分配比对于频度低的现象的码短的码而缩短平均码长的码。这样的频域基音周期码在频域基音周期T是换算间隔T1本身时、换算间隔T1的整数倍时的码长比除此以外时的码长短。图12表示这样的可变长码簿的例。由于具有换算间隔T1的整数倍比除此以外时被决定作为频域基音周期的频度高的性质,所以通过使用这样的可变长码簿而决定频域基音周期码,能够缩短平均码长。
此外,也可以使用在频域基音周期T为换算间隔T1本身时的可变长码的码长、在频域基音周期T为换算间隔T1的整数倍U×T1时的可变长码的码长、在频域基音周期T为换算间隔T1的附近时的可变长码的码长以及在频域基音周期T为换算间隔T1的整数倍U×T1的附近时的可变长码的码长都比除此以外时的可变长码的码长短的可变长码簿(例2),决定频域基音周期码。此时的频域基音周期码在频域基音周期T为换算间隔T1本身时、换算间隔T1的整数倍时、换算间隔T1的附近时、换算间隔T1的整数倍的附近时的码长比除此以外时的码长短。由于具有在频域基音周期T为换算间隔T1本身时、换算间隔T1的整数倍时、换算间隔T1的附近时、换算间隔T1的整数倍的附近时比除此以外时被选择作为频域基音周期的频度高的性质,所以通过将与这些对应的码长设为比除此以外时的码长短,能够缩短平均码长。
此外,也可以使用在频域基音周期T为换算间隔T1本身时的可变长码的码长比在频域基音周期T为换算间隔T1的整数倍U×T1时的可变长码的码长短的可变长码簿(例3),决定频域基音周期码。此时的频域基音周期码在频域基音周期T为换算间隔T1本身时的码长比换算间隔T1的附近时的码长短。
此外,也可以使用在频域基音周期T为换算间隔T1的整数倍U×T1时的可变长码的码长比在频域基音周期T为换算间隔T1的整数倍U×T1的附近时的可变长码的码长短的可变长码簿(例4)。此时的第一频域基音周期码在第一频域基音周期T为换算间隔T1的整数倍时的码长比换算间隔T1的整数倍的附近时的码长短。
此外,如前所述,在不能使用过去的帧的信息的情况下或者不使用过去的帧的信息的情况下,存在对于频域基音周期T的换算间隔T1的乘数m*n越小则越容易被决定为频域基音周期T的倾向。反映这个情况,如图13所示,也可以使用以至少在频域基音周期T为换算间隔T1的整数倍的值V×T1时的可变长码的码长相对于该整数值V的大小呈单调非减少的关系的方式分配了可变长码的可变长码簿(例5),决定频域基音周期码。此时,至少在上述频域基音周期T为换算间隔T1的整数倍的值V×T1时的频域基音周期码的码长相对于整数V的大小呈单调非减少的关系。
此外,也可以使用兼具了上述的例1、3的特征的可变长码簿(例6),也可以使用兼具了例2、3的特征的可变长码簿(例7),也可以使用兼具了例2、4的特征的可变长码簿(例8),也可以使用兼具了例2、3、4的特征的可变长码簿(例9),也可以使用兼具了例1~9的任一个例和例5的特征的可变长码簿(例10)。
频域基音周期分析部115”考虑表示对于根据预先决定的排序规则而选择的样本群的能量的集中度的指标值和换算间隔T1的关系的码的长度,决定频域基音周期T。例如,若集中度的指标相同,则选择表示与换算间隔T1的关系的码的长度短的指标。或者,作为适当地预先设定了C的常数(权重),设为
变形的集中度指标=集中度的指标-c*(表示与换算间隔T1的关系的码的长度)
,决定变形的集中度指标成为最大的频域基音周期T。
[第二实施方式]
[编码装置21]
本实施方式的编码装置21与第一实施方式的编码装置11的不同点在于,代替频域基音周期分析部115而包括频域基音周期分析部215。在本实施方式中,频域基音周期分析部215在长期预测选择信息表示执行长期预测的情况下,从换算间隔T1以及换算间隔T1的整数倍的值U×T1中决定中间候选值,从中间候选值以及中间候选值的附近的预先决定的第三范围的值中决定频域基音周期T而输出。频域基音周期分析部215在长期预测选择信息表示不执行长期预测的情况下,与第一实施方式相同地,将预先决定的第二范围的整数值作为候选值,决定频域基音周期T而输出。以下,说明与第一实施方式的不同点。
“频域基音周期分析部215”
频域基音周期分析部215在长期预测选择信息表示执行长期预测的情况下,首先,将换算间隔T1以及换算间隔T1的整数倍的值U×T1作为候选值,决定中间候选值。接着,频域基音周期分析部215将中间候选值以及中间候选值的附近的预先决定的第三范围的值作为候选值,决定频域基音周期T而输出频域基音周期T。进一步,频域基音周期分析部215输出表示中间候选值是换算间隔T1的几倍的信息、和表示频域基音周期T和中间候选值之差的信息,作为频域基音周期码。
例如,在预先决定的第一范围的整数为2以上且8以下的情况下,换算间隔T1、换算间隔T1的2倍~8倍的2T1、3T1、4T1、5T1、6T1、7T1、8T1的共8个值是中间候选值的候选,从这些候选中选择中间候选值Tcand。此时,表示中间候选值是换算间隔T1的几倍的信息是至少3比特的、与1以上且8以下的整数分别一对一对应的码。
此外,例如,在预先决定的第三范围为-3以上且4以下的整数的情况下,Tcand-3、Tcand-2、Tcand-1、Tcand、Tcand+1、Tcand+2、Tcand+3、Tcand+4的共8个值是频域基音周期T的候选,从这些候选中选择频域基音周期T。此时,表示频域基音周期T和中间候选值之差的信息是至少3比特的、与-3以上4以下的整数分别一对一对应的码。
另外,预先决定的第三范围的值既可以是整数值,也可以是小数值。此外,也可以与第一实施方式的变形例相同地,除了换算间隔T1以及换算间隔T1的整数倍的值U×T1之外,将换算间隔T1的整数倍的值U×T1以外的倍数值也作为候选值而决定中间候选值。即,也可以从包括换算间隔T1以及换算间隔T1的整数倍的值U×T1的候选值中决定中间候选值。
[解码装置22]
本实施方式的解码装置22与第一实施方式的解码装置12的不同点在于,代替周期换算部122而包括周期换算部222。在本实施方式中,周期换算部222在长期预测选择信息表示执行长期预测的情况下,对频域基音周期码进行解码而获得中间候选值是换算间隔T1的几倍的整数值、和频域基音周期T和中间候选值之差的值,作为频域基音周期T而获得对已对换算间隔T1乘以整数值而获得的值加上上述的差的值所得的值并输出。周期换算部222在长期预测选择信息表示不执行长期预测的情况下,对频域基音周期码进行解码,获得频域基音周期T而输出。
[第三实施方式]
[编码装置31]
本实施方式的编码装置31与第一实施方式、第一实施方式的变形例以及第二实施方式的编码装置11、11’、21的不同点在于,代替频域基音周期分析部115、115’、215而包括频域基音周期分析部315。在本实施方式中,频域基音周期分析部315作为“在量化完毕基音增益gp^为预先决定的值以上的情况下”来代替“在长期预测选择信息表示执行长期预测的情况下”,作为“在量化完毕基音增益gp^小于预先决定的值的情况下”来代替“在长期预测选择信息表示不执行长期预测的情况下”,进行处理。除此之外,与第一实施方式以及第二实施方式相同。另外,本实施方式的前提是,在第一实施方式中编码装置31获得量化完毕基音增益gp^以及基音增益码Cgp的结构。
[解码装置32]
本实施方式的解码装置32与第一实施方式以及第二实施方式的解码装置12、12’、22的不同点在于,代替周期换算部122、122’、222而包括周期换算部322。本实施方式中,周期换算部322作为“在量化完毕基音增益gp^为预先决定的值以上的情况下”来代替“在长期预测选择信息表示执行长期预测的情况下”,作为“在量化完毕基音增益gp^小于预先决定的值的情况下”来代替“在长期预测选择信息表示不执行长期预测的情况下”,进行处理。除此之外,与第一实施方式以及第二实施方式相同。另外,本实施方式的前提是,在第一实施方式中对解码装置32输入基音增益码Cgp且获得量化完毕基音增益gp^的结构。
[第四实施方式]
[编码装置41]
本实施方式的编码装置41与第一实施方式、第一实施方式的变形例以及第二实施方式的编码装置11、11’、21的不同点在于,分别代替长期预测分析部111、长期预测残差生成部112、频域变换部113a、周期换算部114、频域基音周期分析部115、115’、215而包括长期预测分析部411、长期预测残差生成部412、频域变换部413a、周期换算部414、频域基音周期分析部415。
在本实施方式的长期预测分析部411中,与基音增益gp的值无关地执行长期预测。更具体而言,长期预测分析部411与基音增益gp的值无关地,进行长期预测分析部111的“在长期预测选择信息表示执行长期预测的情况下”的处理。因此,长期预测分析部411不需要进行基于基音增益gp是否为预先决定的值以上的、有无执行长期预测的判断,也不需要输出长期预测选择信息。
以后,长期预测残差生成部412、频域变换部413a、周期换算部414、频域基音周期分析部415分别实施与长期预测残差生成部112、频域变换部113a、周期换算部114、频域基音周期分析部115、115’、215的“在长期预测分析部111输出的长期预测选择信息表示执行长期预测的情况下”对应的处理。
[解码装置42]
本实施方式的解码装置42与第一实施方式以及第二实施方式的解码装置12、12’、22的不同点在于,分别代替解码部123a、长期预测信息解码部121、周期换算部122、122’、222、时域变换部124c、长期预测合成部125而包括解码部423a、长期预测信息解码部421、周期换算部422、时域变换部424c、长期预测合成部425。本实施方式与长期预测选择信息或量化完毕基音增益gp^的值无关地,进行长期预测合成。因此,在本实施方式的解码装置42中,不需要输入长期预测选择信息。
本实施方式的解码部423a、长期预测信息解码部421、周期换算部422、时域变换部424c、长期预测合成部425分别实施与解码部123a、长期预测信息解码部121、周期换算部122,122’,222、时域变换部124c、长期预测合成部125的“在长期预测选择信息表示执行长期预测的情况下”对应的处理。
[其他]
在上述的各实施方式的编码装置11、11’、21、31、41中,包括频域变换部113a、413a、加权包络归一化部113b、归一化增益计算部113c和量化部113d,将在量化部113d中获得的帧单位的量化MDCT系数串作为频域基音周期分析部115、115’、215、315、415的输入。但是,编码装置11、11’、21、31、41也可以包括除了频域变换部113a、413a、加权包络归一化部113b、归一化增益计算部113c和量化部113d以外的处理部,或者进行省略了一部分处理部的处理。即,作为一例,编码装置11、11’、21、31、41包括由频域变换部113a、413a、加权包络归一化部113b、归一化增益计算部113c和量化部113d构成的频域样本串生成部113。编码装置11、11’、21、31、41包括的频域样本串生成部113在执行长期预测的情况下,进行获得源于上述长期预测残差信号的频域的样本串的处理,在不执行长期预测的情况下,进行获得源于上述音响信号的频域的样本串的处理。频域样本串生成部113获得的样本串输入到频域基音周期分析部115、115’、215、315、415。
关于解码装置12、12’、22、32、42也是相同的,作为一例,解码装置12、12’、22、32、42包括由增益乘法部124a、加权包络逆归一化部124b、时域变换部124c,424c构成的时域信号串生成部124。解码装置12、12’、22、32、42包括的时域信号串生成部124进行获得源于从解码部123a,423a或者恢复部123b输入的频域的样本串的时域的信号串的处理。在长期预测信息解码部121、421输出的长期预测选择信息表示执行长期预测的情况下,时域信号串生成部124获得的信号串作为长期预测残差信号串xp(1),...,xp(Nt)而输入到长期预测合成部125、425。在长期预测信息解码部121、421输出的长期预测选择信息表示不执行长期预测的情况下,时域信号串生成部124获得的信号串作为数字音响信号串x(1),...,x(Nt)而从解码装置12、12’、22、32、42输出。
[第五实施方式]
[编码装置51]
如图8所示,本实施方式的编码装置51与第一实施方式、第一实施方式的变形例、第二实施方式、第三实施方式以及第四实施方式的编码装置11、11’、21、31、41的不同点在于,编码装置51不包括频域基音周期考虑编码部116。此时,编码装置51作为获得用于确定频域基音周期的码的编码装置发挥作用。在对从编码装置51输出的频域的样本串也进行编码的情况下,从编码装置51输出的频域的样本串例如输入到编码装置51的外部的频域基音周期考虑编码部116进行编码,但也可以使用其他编码部件而进行编码。除此之外,与第一实施方式、第一实施方式的变形例、第二实施方式、第三实施方式以及第四实施方式的编码装置11、11’、21、31、41相同。
[解码装置52]
如图9所示,本实施方式的解码装置52与第一实施方式、第一实施方式的变形例、第二实施方式、第三实施方式以及第四实施方式的解码装置12、12’、22、32、42的不同点在于,解码装置52不包括频域基音周期考虑解码部123、时域信号串生成部124以及长期预测合成部125。此时,解码装置52作为至少从在码串中包含的频域基音周期码和时域基音周期码,至少获得长期预测频域基音周期T、时域的基音周期L的解码装置发挥作用。例如,从解码装置52输出的时域的基音周期L以及量化完毕基音增益gp^成为长期预测合成部125的输入。此外,例如,码串、从解码装置52输出的频域基音周期T(以及,在输入辅助信息的情况下辅助信息)成为频域基音周期考虑解码部123的输入。除此之外,与第一实施方式、第一实施方式的变形例、第二实施方式、第三实施方式以及第四实施方式的解码装置12、12’、22、32、42相同。
[第六实施方式]
如图10以及图11所示,本实施方式的编码装置61以及解码装置62与第一实施方式、第一实施方式的变形例、第二实施方式、第三实施方式以及第四实施方式的不同点在于,代替频域基音周期考虑编码部116而构成频域基音周期考虑编码部616,代替频域基音周期考虑解码部123而构成频域基音周期考虑解码部623。频域的样本串成为频域基音周期考虑编码部616的输入。码串、频域基音周期T以及辅助信息成为频域基音周期考虑解码部623的输入。以下,只说明频域基音周期考虑编码部616以及频域基音周期考虑解码部623。
“频域基音周期考虑编码部616”
频域基音周期考虑编码部616包括编码部616b,通过基于频域基音周期T的编码方法,对输入的频域的样本串进行编码,输出由此获得的码串。
“编码部616b”
编码部616b遵照不同的基准(区分)对样本群G1和样本群G2进行编码,输出由此获得的码串,其中,样本群G1是由在频域的样本串中包括与频域基音周期T对应的样本在内的一个或者连续的多个样本以及在频域的样本串中包括与频域基音周期T的整数倍对应的样本在内的一个或者连续的多个样本的全部或者一部分样本而成的样本群,样本群G2是由在频域的样本串中不包括在样本群G1的样本而成的样本群。
[样本群G1、G2的具体例]
“在频域的样本串中包括与频域基音周期T对应的样本在内的一个或者连续的多个样本以及在频域的样本串中包括与频域基音周期T的整数倍对应的样本在内的一个或者连续的多个样本的全部或者一部分样本”的具体例与第一实施方式相同,由这样的样本而成的群是样本群G1。如第一实施方式中所说明,这样的样本群G1的设定方法中有各种选项。例如,在输入到编码部616b的样本串中由包括与频域基音周期T的整数倍对应的样本F(nT)的前后的样本F(nT-1)、F(nT+1)在内的3个样本F(nT-1)、F(nT)、F(nT+1)而成的样本群的集合是样本群G1的例。例如,在n表示1至5的各整数的情况下,由第一样本群F(T-1)、F(T)、F(T+1)、第二样本群F(2T-1)、F(2T)、F(2T+1)、第三样本群F(3T-1)、F(3T)、F(3T+1)、第四样本群F(4T-1)、F(4T)、F(4T+1)、第五样本群F(5T-1)、F(5T)、F(5T+1)而成的群是样本群G1。
由在输入到编码部616b的样本串中不包括在样本群G1中的样本而成的群是样本群G2。例如,在n表示1至5的各整数的情况下,由第一样本集F(1),...,F(T-2)、第二样本集F(T+2),...,F(2T-2)、第三样本集F(2T+2),...,F(3T-2)、第四样本集F(3T+2),...,F(4T-2)、第五样本集F(4T+2),...,F(5T-2)、第六样本集F(5T+2),...,F(jmax)而成的群是样本群G2的例。
除此之外,如在第一实施方式中所例示,在频域基音周期T是小数的情况下,例如也可以是由F(R(nT-1))、F(R(nT))、F(R(nT+1))而成的样本群的集合是样本群G1。其中,R(nT)是将nT进行了四舍五入的值。此外,也可以将在构成样本群G1的各样本群中包含的样本的个数或样本索引设为可变,输出表示从在构成样本群G1的各样本群中包含的样本的个数和样本索引的组合不同的多个选项中选择的一个的信息,作为辅助信息(第一辅助信息)。
[根据不同的基准的编码的例]
编码部616b不进行在样本群G1、G2中包含的样本的排序,而是将样本群G1和样本群G2根据互不相同的基准进行编码,输出由此获得的码串。
在样本群G1中包含的样本比在样本群G2中包含的样本,振幅平均都大。此时,例如,根据与在样本群G1中包含的样本的振幅的大小或者其估计值对应的基准,对在样本群G1中包含的样本进行可变长编码,根据与在样本群G2中包含的样本的振幅的大小或者其估计值对应的基准,对在样本群G2中包含的样本进行可变长编码。通过设为这样的结构,由于与根据相同的基准对在样本串中包含的全部样本进行可变长编码的情况相比,能够提高样本的振幅的估计精度,所以能够减少可变长码的平均码量。即,若根据相互不同的基准对样本群G1和样本群G2进行编码,则即使没有排序操作,也能够获得减少样本串的码量的效果。振幅的大小的例是振幅的绝对值、振幅的能量等。
[Rice编码的例]
作为可变长编码,说明使用每一个样本的Rice编码的例。
此时,编码部616b使用与在样本群G1中包含的样本的振幅的大小或者其估计值对应的Rice参数,按每一个样本对在样本群G1中包含的样本进行Rice编码。此外,编码部616b使用与在样本群G2中包含的样本的振幅的大小或者其估计值对应的Rice参数,按每一个样本对在样本群G2中包含的样本进行Rice编码。编码部616b输出通过Rice编码而获得的码串和用于确定Rice参数的辅助信息。
例如,编码部616b根据在各帧中在样本群G1中包含的样本的振幅的大小的平均,求出在该帧中的样本群G1的Rice参数。例如,编码部616b根据在各帧中在样本群G2中包含的样本的振幅的大小的平均,求出在该帧中的样本群G2的Rice参数。Rice参数是0以上的整数。编码部616b在各帧中,使用样本群G1的Rice参数,对在样本群G1中包含的样本进行Rice编码,使用样本群G2的Rice参数,对在样本群G2中包含的样本进行Rice编码。由此,能够削减平均码量。以下,详细说明这个情况。
首先,以按每一个样本对在样本群G1中包含的样本进行Rice编码的情况为例。
按每一个样本对在样本群G1中包含的样本X(k)进行Rice编码而获得的码包括对将样本X(k)除以与样本群G1的Rice参数s对应的值所得的商q(k)进行了一元编码(unarycoding)的prefix(k)、确定其余数的sub(k)。即,该例中的与样本X(k)对应的码包括prefix(k)和sub(k)。另外,成为Rice编码对象的样本X(k)以整数表现。
以下,例示q(k)以及sub(k)的计算方法。
在Rice参数s>0的情况下,如下生成商q(k)。其中,floor(χ)是χ以下的最大的整数。
q(k)=floor(X(k)/2s-1)(用于X(k)≥0)…(B1)
q(k)=floor{(-X(k)-1)/2s-1}(用于X(k)<0)…(B2)
在Rice参数s=0的情况下,如下生成商q(k)。
q(k)=2*X(k)(用于X(k)≥0)…(B3)
q(k)=-2*X(k)-1(用于X(k)<0)…(B4)
在Rice参数s>0的情况下,如下生成sub(k)。
sub(k)=X(k)-2s-1*q(k)+2s-1(用于X(k)≥0)…(B5)
sub(k)=(-X(k)-1)-2s-1*q(k)(用于X(k)<0)…(B6)
在Rice参数s=0的情况下,sub(k)为零(null)(sub(k)=null)。
若将式(B1)~(B4)进行公共化而表现商q(k),则成为如下。其中,|·|表示·的绝对值。
q(k)=floor{(2*|X(k)|-z)/2s}(z=0或1或2)…(B7)
在Rice编码的情况下,prefix(k)是将商q(k)进行一元编码的码,其码量能够使用式(B7)而如下表现。
floor{(2*|X(k)|-z)/2s}+1…(B8)
在Rice编码的情况下,确定式(B5)(B6)的余数的sub(k)以s比特表现。因此,与在样本群G1中包含的样本X(k)对应的码(prefix(k)以及sub(k))的总码量C(s,X(k),G1)成为如下。
[数7]
这里,若近似为floor{(2*|X(k)|-z)/2s}=(2*|X(k)|-z)/2s,则式(B9)能够如下近似。其中,|G1|表示在一个帧中的样本群G1中包含的样本X(k)的个数。
[数8]
C(s,X(k),G1)=2-s(2*D-z*|G1|)+(1+s)·|G1|
将关于式(B10)的s的偏微分结果设为0的s表现为s’。
s’=log2{ln2*(2*D/|G1|-z)}…(B11)
若D/|G1|充分大于z,则式(B11)能够如下近似。
s’=log2{ln2*(2·D/|G1|)}…(B12)
由于在式(B12)中获得的s’没有被整数化,所以将把s’量化为整数的值设为Rice参数s。该Rice参数s对应于在样本群G1中包含的样本的振幅的大小的平均D/|G1|(参照式(B12)),将与在样本群G1中包含的样本X(k)对应的码的总码量进行最小化。
以上,对在样本群G2中包含的样本进行Rice编码时也是相同的。因此,在各帧中,根据在样本群G1中包含的样本的振幅的大小的平均,求出用于样本群G1的Rice参数,根据在样本群G2中包含的样本的振幅的大小的平均,求出用于样本群G2的Rice参数,区分样本群G1和样本群G2而进行Rice编码,能够将总码量进行最小化。
另外,基于被近似的式(B10)的总码量C(s,X(k),G1)的评价,在样本X(k)的振幅的大小的变动越小时成为越适当的评价。因此,尤其在样本群G1中包含的样本的振幅的大小大致均等且在样本群G2中包含的样本的振幅的大小大致均等的情况下,获得更大的码量削减效果。
[用于确定Rice参数的辅助信息的例1]
在区分与样本群G1对应的Rice参数和与样本群G2对应的Rice参数而处理的情况下,在解码侧中,需要用于确定与样本群G1对应的Rice参数的辅助信息(第三辅助信息)和用于确定与样本群G2对应的Rice参数的辅助信息(第四辅助信息)。因此,编码部616b也可以除了由按每一个样本对样本串进行Rice编码而获得的码构成的码串之外,还输出第三辅助信息以及第四辅助信息。
[用于确定Rice参数的辅助信息的例2]
在音响信号为编码对象的情况下,在样本群G1中包含的样本的振幅的大小的平均大于在样本群G2中包含的样本的振幅的大小的平均,与样本群G1对应的Rice参数大于与样本群G2对应的Rice参数。利用这个情况,还能够削减用于确定Rice参数的辅助信息的码量。
例如,决定为与样本群G1对应的Rice参数比与样本群G2对应的Rice参数固定地大固定值(例如,1)。即,设为固定地满足“与样本群G1对应的Rice参数=样本群G2对应的Rice参数+固定值”的关系。此时,编码部616b除了输出码串之外,还只输出第三辅助信息或者第四辅助信息中的其中一个即可。
[用于确定Rice参数的辅助信息的例3]
也可以将能够单独确定与样本群G1对应的Rice参数的信息设为第五辅助信息,将能够确定与样本群G1对应的Rice参数和与样本群G2对应的Rice参数的差分的信息设为第六辅助信息。相反地,也可以将能够单独确定与样本群G2对应的Rice参数的信息设为第六辅助信息,将能够确定与样本群G1对应的Rice参数和与样本群G2对应的Rice参数的差分的信息设为第五辅助信息。另外,由于知道与样本群G1对应的Rice参数大于与样本群G2对应的Rice参数,表示与样本群G1对应的Rice参数和与样本群G2对应的Rice参数的大小关系的辅助信息(表示正负的信息等)是无用的。
[用于确定Rice参数的辅助信息的例4]
在确定了分配给帧整体的码比特数的情况下,在步骤S113c中求出的增益的值也相当受限制,样本的振幅可取的范围也较大受限制。此时,根据分配给帧整体的码比特数,能够以某种程度的精度来估计样本的振幅的大小的平均。编码部616b也可以使用从该样本的振幅的大小的平均的估计值估计到的Rice参数,进行Rice编码。
例如,编码部616b也可以使用对该估计到的Rice参数加上第一差分值(例如1)所得的参数作为与样本群G1对应的Rice参数,使用该估计到的Rice参数作为与样本群G2对应的Rice参数。或者,编码部616b也可以使用该估计到的Rice参数作为与样本群G1对应的Rice参数,使用从该估计到的Rice参数减去第二差分值(例如1)所得的参数作为与样本群G2对应的Rice参数。
在这些情况下的编码部616b例如除了输出码串之外,还输出用于确定第一差分值的辅助信息(第七辅助信息)或者用于确定第二差分值的辅助信息(第八辅助信息)即可。
[用于确定Rice参数的辅助信息的例5]
在样本群G1中包含的样本的振幅的大小不均等的情况下或在样本群G2中包含的样本的振幅的大小不均等的情况下,还能够借助样本串X(1),...,X(N)的振幅的包络信息,估计码量削减效果较大的Rice参数。例如,在样本的振幅的大小如高频那么大的情况下,通过使与在样本群G1中包含的样本中的高频侧的样本对应的Rice参数固定地增加,使与在样本群G2中包含的样本中的高频侧的样本对应的Rice参数固定地增加,能够更加削减码量。以下,表示具体例。
[表1]
其中,s1以及s2是在[用于确定Rice参数的辅助信息的例1~4]中例示的、与样本群G1以及G2分别对应的Rice参数。const.1至const.10是预先决定的正整数。在该例的情况下,编码部616b除了输出码串以及在Rice参数的例2、3中例示的辅助信息之外,还输出确定包络信息的辅助信息(第九辅助信息)即可。在解码侧中已知包络信息的情况下,编码部616b也可以不输出第九辅助信息。
“频域基音周期考虑解码部623”
频域基音周期考虑解码部623包括解码部623a,通过基于频域基音周期T的解码方法对码串进行解码,获得频域的样本串而输出。
“解码部623a”
解码部623a通过将样本群G1和样本群G2遵照不同的基准(区分)的解码处理,对码串进行解码,从而获得频域的样本串而输出,其中,样本群G1是由在频域的样本串中包括与频域基音周期T对应的样本在内的一个或者连续的多个样本以及在频域的样本串中包括与频域基音周期T的整数倍对应的样本在内的一个或者连续的多个样本的全部或者一部分样本而成的样本群,样本群G2是由在频域的样本串中不包括在样本群G1的样本而成的样本群。
[码群C1、C2和样本群G1、G2的具体例]
解码部623a根据输入的频域基音周期T(在输入第一辅助信息的情况下,根据频域基音周期T和第一辅助信息),按每个帧,确定在输入的码串中包含的码群C1以及C2、以及在各个码群对应的样本群G1以及G2中包含的样本编号,通过将对码群C1以及C2进行解码而获得的样本值群分配给各码对应的样本编号而获得样本群G1以及G2,从而获得频域的样本串。码群C1由在码串中与在样本群G1中包含的样本对应的码构成,码群C2由在码串中与在样本群G2中包含的样本对应的码构成。解码部623a中的码群C1以及C2的确定方法对应于在编码部616b中的样本群G1以及G2的设定方法,例如是将前述的样本群G1以及G2的设定方法中的“样本”置换为“码”、将“F(j)”置换为“C(j)”、将“样本群G1”置换为“码群C1”、将“样本群G2”置换为“码群C2”的方法。其中,C(j)是与样本F(j)对应的码。
例如,在输入到编码部616b的样本串中、由包括与频域基音周期T的整数倍对应的样本F(nT)的前后的样本F(nT-1)、F(nT+1)在内的3个样本F(nT-1)、F(nT)、F(nT+1)而成的群成为样本群G1的情况下,解码部623a将在被输入的码串C(1),...,C(jmax)中、由与包括与频域基音周期T的整数倍对应的样本编号nT的前后的样本编号nT-1、nT+1在内的3个样本编号对应的码C(nT-1)、C(nT)、C(nT+1)而成的群设为码群C1,将由不包括在码群C1中的码构成的群设为码群C2,对在码群C1中包含的码C(nT-1)、C(nT)、C(nT+1)分别进行解码而获得样本编号nT-1的样本F(nT-1)、样本编号nT的样本F(nT)、样本编号nT+1的样本F(nT+1),对在码群C2中包含的码进行解码而获得样本编号nT-1、nT、nT+1以外的样本编号的样本。例如,在n表示1至5的各整数的情况下,由第一码群C(T-1)、C(T)、C(T+1)、第二码群C(2T-1)、C(2T)、C(2T+1)、第三码群C(3T-1)、C(3T)、C(3T+1)、第四码群C(4T-1)、C(4T)、C(4T+1)、第五码群C(5T-1)、C(5T)、C(5T+1)构成的群是码群C1,由第一码集C(1),...,C(T-2)、第二码集C(T+2),...,C(2T-2)、第三码集C(2T+2),...,C(3T-2)、第四码集C(3T+2),...,C(4T-2)、第五码集C(4T+2),...,C(5T-2)、第六码集C(5T+2),...,C(jmax)构成的群是码群C2,对这些码群和码集分别进行解码而获得第一样本群F(T-1)、F(T)、F(T+1)、第二样本群F(2T-1)、F(2T)、F(2T+1)、第三样本群F(3T-1)、F(3T)、F(3T+1)、第四样本群F(4T-1)、F(4T)、F(4T+1)、第五样本群F(5T-1)、F(5T)、F(5T+1)、第一样本集F(1),...,F(T-2)、第二样本集F(T+2),...,F(2T-2)、第三样本集F(2T+2),...,F(3T-2)、第四样本集F(3T+2),...,F(4T-2)、第五样本集F(4T+2),...,F(5T-2)、第六样本集F(5T+2),...,F(jmax),从而获得频域的样本串。
[根据不同的基准的解码的例]
解码部623a根据相互不同的基准,对码群C1和码群C2进行解码,由此获得频域的样本串而输出。例如,解码部623a根据与在对应于码群C1的样本群G1中包含的样本的振幅的大小或者其估计值对应的基准,对在码群C1中包含的码进行解码,根据与在对应于码群C2的样本群G2中包含的样本的振幅的大小或者其估计值对应的基准,对在码群C2中包含的码进行解码。
[Rice编码的例]
例示通过每个样本的Rice编码而获得码串的情况。
此时,解码部623a按每个帧,将根据输入的辅助信息(第一~第九辅助信息中的至少一部分)而确定的、与样本群G1对应的Rice参数设为与码群C1对应的Rice参数,将与样本群G2对应的Rice参数设为与码群C2对应的Rice参数。以下,例示与前述的[用于确定Rice参数的辅助信息的例1~5]对应的Rice参数的确定方法。
[用于确定Rice参数的辅助信息的例1的情况]
例如,输入了第三辅助信息以及第四辅助信息的解码部623a根据第三辅助信息而确定与样本群G1对应的Rice参数,并将其设为与码群C1对应的Rice参数,根据第四辅助信息而确定与样本群G2对应的Rice参数,并将其设为与码群C2对应的Rice参数。
[用于确定Rice参数的辅助信息的例2的情况]
例如,除了输入码串之外还只输入了第四辅助信息的解码部623a根据第四辅助信息而确定与码群C2对应的Rice参数,并将对与码群C2对应的Rice参数加上固定值(例如1)所得的值设为与码群C1对应的Rice参数。或者,除了输入码串之外还只输入了第三辅助信息的解码部623a根据第三辅助信息而确定与码群C1对应的Rice参数,并将从与码群C1对应的Rice参数减去固定值(例如1)所得的值设为与码群C2对应的Rice参数。
[用于确定Rice参数的辅助信息的例3的情况]
例如,输入了确定Rice参数的第五辅助信息以及确定差分的第六辅助信息的解码部623a根据第五辅助信息而确定与样本群G1对应的Rice参数,并将其设为与码群C1对应的Rice参数。进一步,将从与码群C1对应的Rice参数减去根据第六辅助信息而确定的差分所得的值设为与码群C2对应的Rice参数。
例如,输入了确定差分的第五辅助信息以及确定Rice参数的第六辅助信息的解码部623a根据第六辅助信息而确定与样本群G1对应的Rice参数,并将其设为与码群C1对应的Rice参数。进一步,将对与码群C2对应的Rice参数加上根据第五辅助信息而确定的差分所得的值设为与码群C1对应的Rice参数。
[用于确定Rice参数的辅助信息的例4的情况]
例如,输入了第七辅助信息的解码部623a将根据分配给帧整体的码比特数而估计到的Rice参数设为与码群C2对应的Rice参数,并将对其加上根据第七辅助信息而确定的第一差分值所得的值设为与码群C1对应的Rice参数。
例如,输入了第八辅助信息的解码部623a将根据分配给帧整体的码比特数而估计到的Rice参数设为与码群C1对应的Rice参数,并将从其减去根据第八辅助信息而确定的第二差分值所得的值设为与码群C2对应的Rice参数。
[用于确定Rice参数的辅助信息的例5的情况]
例如,除了输入用于确定上述的Rice参数的辅助信息之外还输入了第九辅助信息的解码部623a使用辅助信息3~8中的至少一部分而确定s1以及s2,基于第九辅助信息而如前述的[表1]那样调整s1以及s2,从而获得与码群C1以及C2分别对应的Rice参数。
即使是在没有输入第九辅助信息的情况下,也通过已知包络信息且编码部616b如前述的[表1]那样调整s1以及s2而获得与样本群G1以及G2分别对应的Rice参数的情况下,解码部623a通过如前述的[表1]那样调整s1以及s2,获得与码群C1以及C2分别对应的Rice参数。
如上所述那样获得了Rice参数的解码部623a按每个帧,使用与码群C1对应的Rice参数,对在码群C1中包含的码进行解码,使用与码群C2对应的Rice参数,对在码群C2中包含的码进行解码,由此获得原来的样本的排列而输出。另外,由于与Rice编码对应的解码处理是已知的,所以省略说明。
[第七实施方式]
在第六实施方式中,表示了在编码装置61的内部构成频域基音周期考虑编码部616,在解码装置62的内部构成频域基音周期考虑解码部623的例。但是,也可以设为在编码装置61中不包括频域基音周期考虑编码部616的结构,在解码装置62中不包括频域基音周期考虑解码部623的结构。由于这是与相对于第一实施方式、第一实施方式的变形例、第二实施方式、第三实施方式、第四实施方式的第五实施方式相同的结构的差异,所以省略详细的说明。
[第八实施方式]
[编码装置81]
如图14所示,本实施方式的编码装置81与第五实施方式的编码装置51的不同点在于,编码装置81不包括长期预测分析部111、长期预测残差生成部112和频域样本串生成部113。此时,编码装置81从编码装置81的外部输入时域的基音周期L、时域基音周期码CL和频域样本串,作为获得用于确定对于频域样本串的频域基音周期的码的编码装置发挥作用。
输入到编码装置81的时域的基音周期L和时域基音周期码CL例如在长期预测分析部111中计算,但也可以使用其他的时域基音周期计算部件而计算。
此外,输入到编码装置81的频域样本串是与将输入数字音响信号串变换为频域的N点的样本串对应的样本串,例如,既可以是在编码装置81的外部的频域样本串生成部113中计算的量化MDCT系数串,也可以是使用其他的频域样本串生成部件而生成的频域样本串。
在编码装置81的周期换算部814中,输入时域的基音周期L和频域的样本点数N,求出换算间隔T1而输出。求出换算间隔T1的处理与周期换算部114相同。另外,也可以代替时域的基音周期L,输入与时域的基音周期L对应的时域基音周期码CL,此时,求出与输入的时域基音周期码CL对应的时域基音周期L,从时域基音周期L求出换算间隔T1而输出。
在频域基音周期分析部815中,输入换算间隔T1和频域样本串。频域基音周期分析部815从包括换算间隔T1和换算间隔T1的整数倍的值U×T1(其中,U是预先决定的第一范围的整数)的候选值中决定频域基音周期,获得用于确定频域基音周期的码而输出。决定频域基音周期的处理及获得用于确定频域基音周期的码的处理与在频域基音周期分析部115、115’、215、315、415的长期预测选择信息表示执行长期预测的情况下的处理相同。
此外,周期换算部814和频域基音周期分析部815也可以构成为,与周期换算部114、414和频域基音周期分析部115、115’、215、315、415相同地,在长期预测选择信息表示执行长期预测的情况下和在长期预测选择信息表示不执行长期预测的情况下进行不同的处理。此时,在编码装置81的外部的长期预测分析部111中,长期预测选择信息也输入到编码装置81。
[解码装置82]
如图15所示,本实施方式的解码装置82与第五实施方式的解码装置52的不同点在于,解码装置82不包括长期预测信息解码部121。此时,解码装置82作为根据由解码装置82的外部的长期预测信息解码部121获得的时域基音周期L和在输入的码串中包含的至少频域基音周期码和时域基音周期码,至少获得频域基音周期T的解码装置发挥作用。例如,码串、从编码装置81输出的频域基音周期T(以及,在输入辅助信息的情况下辅助信息)成为频域基音周期考虑解码部123的输入。除此之外,与第五实施方式的解码装置52相同。
[第九实施方式]
[频域基音周期分析装置91]
此外,在第五实施方式、第七实施方式、第八实施方式中,以将在编码装置51、81中求出的频域基音周期T在外部的频域基音周期考虑编码部116、616中用于频域的样本串的编码作为前提,输出了与频域基音周期T对应的频域基音周期码。但是,还能够将频域基音周期T用于编码以外的目的,此时,也可以不输出与频域基音周期T对应的频域基音周期码。作为编码以外的目的,例如,考虑声音或乐音的分析、多个声音或乐音的分离、声音或乐音的识别等。
如图16所示,第九实施方式的频域基音周期分析装置91与第五实施方式、第七实施方式、第八实施方式的编码装置51、81的不同点在于,不输出与频域基音周期T对应的频域基音周期码。此时,频域基音周期分析装置91作为根据从外部输入的时域的基音周期L决定对于频域样本串的频域基音周期的频域基音周期分析装置发挥作用。
在第九实施方式的周期换算部914中,输入时域的基音周期L和频域的样本点数N,求出换算间隔T1而输出。求出换算间隔T1的处理与周期换算部114相同。
在频域基音周期分析部915中,输入换算间隔T1和频域样本串,从包括换算间隔T1和换算间隔T1的整数倍的值U×T1(其中,U是预先决定的第一范围的整数)的候选值中决定频域基音周期,并输出所决定的频域基音周期。
[其他]
另外,在第一实施方式、第一实施方式的变形例、第二实施方式、第三实施方式、第四实施方式中,作为频域基音周期考虑编码部而说明了由排序处理部116a和编码部116b构成的结构,在第六实施方式中,作为频域基音周期考虑编码部而说明了由编码部616b构成的结构,但哪个频域基音周期考虑编码部也都“通过基于频域基音周期T的编码方法,对输入的频域的样本串进行编码,并输出由此获得的码串。”,更详细而言,“将如下两个样本群遵照不同的基准(区分)进行编码,并输出由此获得的码串,其中,一个样本群是由在频域的样本串中包括与频域基音周期T对应的样本在内的一个或者连续的多个样本以及在频域的样本串中包括与频域基音周期T的整数倍对应的样本在内的一个或者连续的多个样本的全部或者一部分样本而成的样本群G1,另一个样本群是由在频域的样本串中不包括在样本群G1中的样本而成的样本群。”。
关于解码装置,也是相同的,第一实施方式、第一实施方式的变形例、第二实施方式、第三实施方式、第四实施方式的频域基音周期考虑解码部和第六实施方式的频域基音周期考虑解码部是“通过基于频域基音周期T的解码方法,对输入的码串进行解码而输出频域的样本串。”,更详细而言,“从输入的码串中,将如下两个样本群遵照不同的基准(区分)进行解码,获得频域的样本串而输出,其中,一个样本群是由在频域的样本串中包括与频域基音周期T对应的样本在内的一个或者连续的多个样本以及在频域的样本串中包括与频域基音周期T的整数倍对应的样本在内的一个或者连续的多个样本的全部或者一部分样本而成的样本群,另一个样本群是由在频域的样本串中不包括在样本群G1中的样本而成的样本群。”。
<编码装置/解码装置的硬件结构例>
上述的实施方式的编码装置/解码装置包括能够连接键盘等的输入部、能够连接液晶显示器等的输出部、CPU(Central Processing Unit,中央处理器)〔也可以包括高速缓冲存储器等。〕、作为存储器的RAM(Random Access Memory,随机存取存储器)或ROM(ReadOnly Memory,只读存储器)、作为硬盘的外部存储装置、以及以能够进行与这些输入部、输出部、CPU、RAM、ROM、外部存储装置之间的数据的交换的方式连接的总线等。此外,根据需要,也可以在编码装置/解码装置中,设置CD-ROM等的能够对存储介质进行读写的装置(驱动器)等。
在编码装置/解码装置的外部存储装置中,存储有用于执行编码/解码的程序以及在该程序的处理中需要的数据等〔并不限定于外部存储装置,例如也可以使程序预先存储在作为读出专用存储装置的ROM中等。〕。此外,通过这些程序的处理而获得的数据等适当地存储在RAM或外部存储装置等中。以下,将对数据或其存储区域的地址等进行存储的存储装置简称为“存储部”。
在编码装置的存储部中,存储有用于进行源于声音音响信号的频域的样本串的排序的程序、用于通过排序而获得的样本串的编码的程序等。
在解码装置的存储部中,存储有用于对输入的码串进行解码的程序、用于将在解码中获得的样本串恢复到在编码装置中进行排序之前的样本串的程序等。
在编码装置中,在存储部中被存储的各程序和该各程序的处理所需的数据根据需要而读入RAM,在CPU中进行解释执行/处理。其结果,CPU实现预定的功能(排序处理部、编码部等),从而实现编码。
在解码装置中,在存储部中被存储的各程序和该各程序的处理所需的数据根据需要而读入RAM,在CPU中进行解释执行/处理。其结果,CPU实现预定的功能(解码部、恢复部等),从而实现解码。
<补充>
本发明并不限定于上述的实施方式,在不脱离本发明的意旨的范围内能够适当地变更。此外,在上述实施方式中说明的处理除了按照记载的顺序时序地执行之外,也可以根据执行处理的装置的处理能力或者根据需要而并行或者单独执行。例如,在上述的解码处理中,长期预测信息解码部121的处理和解码部123a、523a的处理能够并行执行。
此外,在通过计算机而实现在上述实施方式中说明的硬件实体(编码装置/解码装置)中的处理功能的情况下,硬件实体应具有的功能的处理内容由程序描述。并且,通过在计算机中执行该程序,在计算机上实现上述硬件实体中的处理功能。
描述了该处理内容的程序能够记录在计算机能够读取的记录介质中。计算机能够读取的记录介质的例是非暂时性的(non-transitory)记录介质。作为计算机能够读取的记录介质,例如,也可以是磁记录装置、光盘、光磁记录介质、半导体存储器等的任意的记录介质。具体而言,例如,作为磁记录装置,能够使用硬盘装置、软盘、磁盘等,作为光盘,能够使用DVD(Digital Versatile Disc,数字视盘)、DVD-RAM(Random Access Memory,随机存取存储器)、CD-ROM(Compact Disc Read Only Memory,紧凑只读光盘)、CD-R(Recordable,可记录)/RW(ReWritable,可改写)等,作为光磁记录介质,能够使用MO(Magneto-Opticaldisc,磁光盘)等,作为半导体存储器,能够使用EEP-ROM(Electronically Erasable andProgrammable-Read Only Memory,电可擦除可编程只读存储器)等。
此外,该程序的流通例如通过将记录了该程序的DVD、CD-ROM等的可移动式记录介质进行销售、转让、出借等而进行。此外,也可以是如下结构:将该程序存储在服务器计算机的存储装置中,经由网络从服务器计算机向其他的计算机转发该程序,从而流通该程序。
执行这样的程序的计算机例如首先将记录在可移动式记录介质中的程序或者从服务器计算机转发的程序暂时存储在自己的存储装置中。然后,在执行处理时,该计算机读取在自己的记录介质中存储的程序,并执行基于所读取的程序的处理。此外,作为该程序的其他的执行方式,既可以设为计算机从可移动式记录介质直接读取程序,执行基于该程序的处理,进一步,也可以设为在每次从服务器计算机对该计算机转发程序时,依次执行基于所接受到的程序的处理。此外,也可以设为不进行从服务器计算机对于该计算机的程序的转发,而是通过仅由其执行指示和结果取得而实现处理功能的、所谓的ASP(ApplicationService Provider,应用服务提供商)型的服务,执行上述的处理。另外,设为在本方式中的程序中,包括供于电子计算机的处理且基于程序的信息(虽然不是对于计算机的直接的指令,但具有规定计算机的处理的性质的数据等)。
此外,在该方式中,设为通过在计算机上执行预定的程序而构成硬件实体,但也可以将这些处理内容的至少一部分以硬件方式实现。
Claims (7)
1.一种编码方法,包括:
周期换算步骤,时域的基音周期L与预定的时间区间的音响信号的时域基音周期码对应,且获得与上述时域的基音周期L对应的频域的样本间隔作为换算间隔T1;
频域基音周期分析步骤,从包括上述换算间隔T1以及上述换算间隔T1的整数倍的值U×T1的候选值中决定源于上述音响信号的频域样本串的基音周期、即第一频域基音周期T,获得表示上述第一频域基音周期T是上述换算间隔T1的几倍的第一频域基音周期码,其中,U是预先决定的第一范围的整数;以及
频域基音周期考虑编码步骤,将上述频域样本串以基于上述第一频域基音周期T的编码方法进行编码。
2.如权利要求1所述的编码方法,其特征在于,
上述频域基音周期分析步骤从包括上述换算间隔T1以及上述换算间隔T1的整数倍的值U×T1的候选值中决定中间候选值,从上述中间候选值以及上述中间候选值的附近的预先决定的第三范围的值中决定上述第一频域基音周期T,获得表示上述中间候选值是上述换算间隔T1的几倍的信息、以及表示上述第一频域基音周期T和上述中间候选值之差的信息,作为上述第一频域基音周期码。
3.如权利要求1或2所述的编码方法,
基于上述第一频域基音周期T的编码方法是,将如下两个样本群遵照不同的基准进行编码的编码方法,其中,一个样本群是由在上述频域的样本串中包括与上述第一频域基音周期T对应的样本在内的一个或者连续的多个样本、以及在上述频域的样本串中包括与上述第一频域基音周期T的整数倍对应的样本在内的一个或者连续的多个样本的全部或者一部分样本形成的样本群,另一个样本群是由在上述样本串中不包括于上述样本群的样本形成的第二样本群。
4.一种编码装置,包括:
周期换算部,时域的基音周期L与预定的时间区间的音响信号的时域基音周期码对应,且获得与上述时域的基音周期L对应的频域的样本间隔作为换算间隔T1;
频域基音周期分析部,从包括上述换算间隔T1以及上述换算间隔T1的整数倍的值U×T1的候选值中决定源于上述音响信号的频域样本串的基音周期、即第一频域基音周期T,获得表示上述第一频域基音周期T是上述换算间隔T1的几倍的第一频域基音周期码,其中,U是预先决定的第一范围的整数;以及
频域基音周期考虑编码部,将上述频域样本串以基于上述第一频域基音周期T的编码方法进行编码。
5.如权利要求4所述的编码装置,
基于上述第一频域基音周期T的编码方法是,将如下两个样本群遵照不同的基准进行编码的编码方法,其中,一个样本群是由在上述频域的样本串中包括与上述第一频域基音周期T对应的样本在内的一个或者连续的多个样本、以及在上述频域的样本串中包括与上述第一频域基音周期T的整数倍对应的样本在内的一个或者连续的多个样本的全部或者一部分样本形成的样本群,另一个样本群是由在上述样本串中不包括于上述样本群的样本形成的第二样本群。
6.一种程序,用于使计算机执行权利要求1至3的任意一项所述的编码方法的各步骤。
7.一种计算机可读取的记录介质,保存了用于使计算机执行权利要求1至3的任意一项所述的编码方法的各步骤的程序。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012117172 | 2012-05-23 | ||
JP2012-117172 | 2012-05-23 | ||
JP2012-171155 | 2012-08-01 | ||
JP2012171155 | 2012-08-01 | ||
CN201380026430.4A CN104321814B (zh) | 2012-05-23 | 2013-05-22 | 频域基音周期分析方法和频域基音周期分析装置 |
PCT/JP2013/064209 WO2013176177A1 (ja) | 2012-05-23 | 2013-05-22 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380026430.4A Division CN104321814B (zh) | 2012-05-23 | 2013-05-22 | 频域基音周期分析方法和频域基音周期分析装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109147827A true CN109147827A (zh) | 2019-01-04 |
CN109147827B CN109147827B (zh) | 2023-02-17 |
Family
ID=49623862
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811010320.XA Active CN108962270B (zh) | 2012-05-23 | 2013-05-22 | 解码方法、解码装置以及记录介质 |
CN201811009738.9A Active CN109147827B (zh) | 2012-05-23 | 2013-05-22 | 编码方法、编码装置以及记录介质 |
CN201380026430.4A Active CN104321814B (zh) | 2012-05-23 | 2013-05-22 | 频域基音周期分析方法和频域基音周期分析装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811010320.XA Active CN108962270B (zh) | 2012-05-23 | 2013-05-22 | 解码方法、解码装置以及记录介质 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380026430.4A Active CN104321814B (zh) | 2012-05-23 | 2013-05-22 | 频域基音周期分析方法和频域基音周期分析装置 |
Country Status (8)
Country | Link |
---|---|
US (3) | US9947331B2 (zh) |
EP (3) | EP3576089B1 (zh) |
JP (1) | JP6053196B2 (zh) |
KR (4) | KR20140143438A (zh) |
CN (3) | CN108962270B (zh) |
ES (3) | ES2689072T3 (zh) |
PL (2) | PL2830057T3 (zh) |
WO (1) | WO2013176177A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2689072T3 (es) * | 2012-05-23 | 2018-11-08 | Nippon Telegraph And Telephone Corporation | Codificación de una señal de audio |
WO2016121826A1 (ja) * | 2015-01-30 | 2016-08-04 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法、プログラム及び記録媒体 |
US10276186B2 (en) * | 2015-01-30 | 2019-04-30 | Nippon Telegraph And Telephone Corporation | Parameter determination device, method, program and recording medium for determining a parameter indicating a characteristic of sound signal |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3270376B1 (en) * | 2015-04-13 | 2020-03-18 | Nippon Telegraph and Telephone Corporation | Sound signal linear predictive coding |
CN106373594B (zh) * | 2016-08-31 | 2019-11-26 | 华为技术有限公司 | 一种音调检测方法及装置 |
CN110291583B (zh) * | 2016-09-09 | 2023-06-16 | Dts公司 | 用于音频编解码器中的长期预测的系统和方法 |
JP6712643B2 (ja) * | 2016-09-15 | 2020-06-24 | 日本電信電話株式会社 | サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム |
EP3742441B1 (en) * | 2018-01-17 | 2023-04-12 | Nippon Telegraph And Telephone Corporation | Encoding device, decoding device, fricative determination device, and method and program thereof |
CN110728990B (zh) * | 2019-09-24 | 2022-04-05 | 维沃移动通信有限公司 | 基音检测方法、装置、终端设备和介质 |
US11769071B2 (en) * | 2020-11-30 | 2023-09-26 | IonQ, Inc. | System and method for error correction in quantum computing |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0260053A1 (en) * | 1986-09-11 | 1988-03-16 | AT&T Corp. | Digital speech vocoder |
EP0333121A2 (en) * | 1988-03-14 | 1989-09-20 | Fujitsu Limited | Voice coding apparatus |
JP2000267700A (ja) * | 1999-03-17 | 2000-09-29 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化復号方法および装置 |
CN1274456A (zh) * | 1998-05-21 | 2000-11-22 | 萨里大学 | 语音编码器 |
WO2012046685A1 (ja) * | 2010-10-05 | 2012-04-12 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5127053A (en) * | 1990-12-24 | 1992-06-30 | General Electric Company | Low-complexity method for improving the performance of autocorrelation-based pitch detectors |
JP3362471B2 (ja) * | 1993-07-27 | 2003-01-07 | ソニー株式会社 | 音声信号の符号化方法及び復号化方法 |
JP3890605B2 (ja) * | 1994-08-22 | 2007-03-07 | ソニー株式会社 | 送受信装置 |
TW321810B (zh) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
WO1999059139A2 (en) * | 1998-05-11 | 1999-11-18 | Koninklijke Philips Electronics N.V. | Speech coding based on determining a noise contribution from a phase change |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
JP4550176B2 (ja) * | 1998-10-08 | 2010-09-22 | 株式会社東芝 | 音声符号化方法 |
JP4005359B2 (ja) * | 1999-09-14 | 2007-11-07 | 富士通株式会社 | 音声符号化及び音声復号化装置 |
JP3404350B2 (ja) * | 2000-03-06 | 2003-05-06 | パナソニック モバイルコミュニケーションズ株式会社 | 音声符号化パラメータ取得方法、音声復号方法及び装置 |
CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
JP3731575B2 (ja) * | 2002-10-21 | 2006-01-05 | ソニー株式会社 | 符号化装置及び復号装置 |
EP1619664B1 (en) * | 2003-04-30 | 2012-01-25 | Panasonic Corporation | Speech coding apparatus, speech decoding apparatus and methods thereof |
BRPI0517246A (pt) | 2004-10-28 | 2008-10-07 | Matsushita Electric Ind Co Ltd | aparelho de codificação escalável, aparelho de decodificação escalável e métodos para os mesmos |
WO2006075605A1 (ja) * | 2005-01-12 | 2006-07-20 | Nippon Telegraph And Telephone Corporation | 長期予測符号化方法、長期予測復号化方法、これら装置、そのプログラム及び記録媒体 |
ES2351935T3 (es) * | 2005-04-01 | 2011-02-14 | Qualcomm Incorporated | Procedimiento y aparato para la cuantificación vectorial de una representación de envolvente espectral. |
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
JP4964114B2 (ja) | 2007-12-25 | 2012-06-27 | 日本電信電話株式会社 | 符号化装置、復号化装置、符号化方法、復号化方法、符号化プログラム、復号化プログラム、および記録媒体 |
WO2010140546A1 (ja) * | 2009-06-03 | 2010-12-09 | 日本電信電話株式会社 | 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム及びこれらの記録媒体 |
ES2689072T3 (es) * | 2012-05-23 | 2018-11-08 | Nippon Telegraph And Telephone Corporation | Codificación de una señal de audio |
US9589570B2 (en) * | 2012-09-18 | 2017-03-07 | Huawei Technologies Co., Ltd. | Audio classification based on perceptual quality for low or medium bit rates |
-
2013
- 2013-05-22 ES ES13793620.9T patent/ES2689072T3/es active Active
- 2013-05-22 WO PCT/JP2013/064209 patent/WO2013176177A1/ja active Application Filing
- 2013-05-22 EP EP19185171.6A patent/EP3576089B1/en active Active
- 2013-05-22 ES ES18173806T patent/ES2762160T3/es active Active
- 2013-05-22 CN CN201811010320.XA patent/CN108962270B/zh active Active
- 2013-05-22 KR KR1020147030874A patent/KR20140143438A/ko active Application Filing
- 2013-05-22 KR KR1020177016696A patent/KR101762204B1/ko active IP Right Grant
- 2013-05-22 PL PL13793620T patent/PL2830057T3/pl unknown
- 2013-05-22 KR KR1020167021875A patent/KR101663607B1/ko active IP Right Grant
- 2013-05-22 JP JP2014516829A patent/JP6053196B2/ja active Active
- 2013-05-22 CN CN201811009738.9A patent/CN109147827B/zh active Active
- 2013-05-22 CN CN201380026430.4A patent/CN104321814B/zh active Active
- 2013-05-22 US US14/391,534 patent/US9947331B2/en active Active
- 2013-05-22 EP EP18173806.3A patent/EP3385950B1/en active Active
- 2013-05-22 EP EP13793620.9A patent/EP2830057B1/en active Active
- 2013-05-22 PL PL18173806T patent/PL3385950T3/pl unknown
- 2013-05-22 ES ES19185171T patent/ES2834391T3/es active Active
- 2013-05-22 KR KR1020167018299A patent/KR101750071B1/ko active IP Right Grant
-
2018
- 2018-02-23 US US15/904,159 patent/US10096327B2/en active Active
- 2018-02-23 US US15/904,140 patent/US10083703B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0260053A1 (en) * | 1986-09-11 | 1988-03-16 | AT&T Corp. | Digital speech vocoder |
EP0333121A2 (en) * | 1988-03-14 | 1989-09-20 | Fujitsu Limited | Voice coding apparatus |
CN1274456A (zh) * | 1998-05-21 | 2000-11-22 | 萨里大学 | 语音编码器 |
JP2000267700A (ja) * | 1999-03-17 | 2000-09-29 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化復号方法および装置 |
WO2012046685A1 (ja) * | 2010-10-05 | 2012-04-12 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104321814B (zh) | 频域基音周期分析方法和频域基音周期分析装置 | |
RU2554554C2 (ru) | Способ кодирования, кодер, способ определения величины периодического признака, устройство определения величины периодического признака, программа и носитель записи | |
JP5893153B2 (ja) | 符号化方法、符号化装置、プログラム、および記録媒体 | |
JP5612698B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
JP5694751B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
JPH05232996A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |