CN107004422B - 编码装置、解码装置、它们的方法及程序 - Google Patents

编码装置、解码装置、它们的方法及程序 Download PDF

Info

Publication number
CN107004422B
CN107004422B CN201580064256.1A CN201580064256A CN107004422B CN 107004422 B CN107004422 B CN 107004422B CN 201580064256 A CN201580064256 A CN 201580064256A CN 107004422 B CN107004422 B CN 107004422B
Authority
CN
China
Prior art keywords
spectral envelope
linear prediction
unit
sequence
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580064256.1A
Other languages
English (en)
Other versions
CN107004422A (zh
Inventor
守谷健弘
镰本优
原田登
龟冈弘和
杉浦亮介
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Original Assignee
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, University of Tokyo NUC filed Critical Nippon Telegraph and Telephone Corp
Publication of CN107004422A publication Critical patent/CN107004422A/zh
Application granted granted Critical
Publication of CN107004422B publication Critical patent/CN107004422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/198Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including smoothing of a sequence of encoding parameters, e.g. by averaging, by choice of the maximum, minimum or median value
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

提供能够进行比以往效率好的编码或者解码的编码或者解码技术。将时序信号在频域中进行编码的编码装置具备:频谱包络估计单元(2A),将η设为2以外的规定的正数,将与时序信号对应的频域样本串的绝对值的η次方视为功率谱而进行频谱包络的估计;以及编码单元(2B),对与时序信号对应的频域样本串的各系数进行基于所估计出的频谱包络而改变比特分配或者实质上比特分配改变的编码。

Description

编码装置、解码装置、它们的方法及程序
技术领域
本发明涉及对音信号等时序信号进行编码或者解码的技术。
背景技术
作为低比特(例如10kbit/s~20kbit/s左右)的音信号的编码方法,已知对于DFT(离散傅里叶变换)、MDCT(变形离散余弦变换)等频域中的正交变换系数的自适应编码。例如作为标准规范技术的MEPG USAC(统一语音和音频编码(Unified Speech and AudioCoding))具有TCX(transform coded excitation:变换编码激励)编码模式,其中,将MDCT系数按每帧进行归一化并量化后进行可变长编码(例如,参照非专利文献1)。
在图1中示出以往的基于TCX的编码装置的结构例。图1的编码装置具备频域变换单元11、线性预测分析单元12、振幅频谱包络序列生成单元13、包络归一化单元14、以及编码单元15。以下,说明图1的各单元。
<频域变换单元11>
向频域变换单元11输入时域的音信号。音信号例如是声音信号或者音响信号。
频域变换单元11以规定的时间长度的帧为单位,将所输入的时域的音信号变换为频域的N点的MDCT系数串X(0),X(1),……,X(N-1)。N为正整数。
变换后MDCT系数串X(0),X(1),……,X(N-1)被输出至包络归一化单元14。
<线性预测分析单元12>
向线性预测分析单元12输入时域的音信号。
线性预测分析单元12通过进行对于以帧为单位输入的音信号的线性预测分析,生成线性预测系数α12,……,αp。此外,线性预测分析单元12对所生成的线性预测系数α12,……,αp进行编码而生成线性预测系数码。线性预测系数码的例子是与对应于线性预测系数α12,……,αp的LSP(线谱对(Line Spectrum Pairs))参数串的量化值的串对应的码即LSP码。p为2以上的整数。
此外,线性预测分析单元12生成与所生成的线性预测系数码对应的线性预测系数即量化线性预测系数^α1,^α2,……,^αp
所生成的量化线性预测系数^α1,^α2,……,^αp被输出至振幅频谱包络序列生成单元13。此外,所生成的线性预测系数码被输出至解码装置。
在线性预测分析中,例如,使用求得对于以帧为单位输入的音信号的自相关,利用所求得的自相关进行Levinson-Durbin算法从而得到线性预测系数的方法。或者,也可以使用向线性预测分析单元12输入频域变换单元11求得的MDCT系数串,对于对MDCT系数串的各系数的平方值的序列进行傅里叶逆变换后的序列进行Levinson-Durbin算法从而得到线性预测系数的方法。
<振幅频谱包络序列生成单元13>
向振幅频谱包络序列生成单元13输入线性预测分析单元12生成的量化线性预测系数^α1,^α2,……,^αp
振幅频谱包络序列生成单元13使用量化线性预测系数^α1,^α2,……,^αp,生成由以下的式(1)定义的平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)。将·设为实数,exp(·)为以纳皮尔数为底的指数函数,j为虚数单位。γ为1以下的正的常数,是使由以下的式(2)定义的振幅频谱包络序列^W(0),^W(1),……,^W(N-1)的振幅的凹凸平缓的系数、换言之是将振幅频谱包络序列平滑化的系数。
Figure GDA0001304679970000021
Figure GDA0001304679970000022
所生成的平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)被输出至包络归一化单元14。
<包络归一化单元14>
向包络归一化单元14输入频域变换单元11生成的MDCT系数串X(0),X(1),……,X(N-1)及振幅频谱包络序列生成单元13输出的平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)。
包络归一化单元14将MDCT系数串的各系数X(k)以平滑化振幅频谱包络序列的各值^Wγ(k)归一化,从而生成归一化MDCT系数串XN(0),XN(1),……,XN(N-1)。也就是说,XN(k)=X(k)/^Wγ(k)[k=0,1,……,N-1]。
所生成的归一化MDCT系数串XN(0),XN(1),……,XN(N-1)被输出至编码单元15。
在此,为了实现听觉上失真小的量化,包络归一化单元14使用使振幅频谱包络平缓的序列即平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1),以帧为单位将MDCT系数串X(0),X(1),……,X(N-1)归一化。
<编码单元15>
向编码单元15输入包络归一化单元14生成的归一化MDCT系数串XN(0),XN(1),……,XN(N-1)。
编码单元15生成与归一化MDCT系数串XN(0),XN(1),……,XN(N-1)对应的码。
所生成的与归一化MDCT系数串XN(0),XN(1),……,XN(N-1)对应的码被输出至解码装置。
编码单元15将归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的各系数除以增益(全局增益)g,将对将其结果量化后的整数值的序列即已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)进行编码而得到的码设为整数信号码。在非专利文献1的技术中,编码单元15决定该整数信号码的比特数为预先分配的比特数即分配比特数B以下,且成为尽量大的值的增益g。并且,编码单元15生成与该决定的增益g对应的增益码、和与该决定的增益g对应的整数信号码。
该生成的增益码及整数信号码作为与归一化MDCT系数串XN(0),XN(1),……,XN(N-1)对应的码而被输出至解码装置。
[编码单元15进行的编码处理的具体例]
说明编码单元15进行的编码处理的具体例。
在图2中示出编码单元15的具体例的结构例。编码单元15如图2所示,具备增益取得单元151、量化单元152、Rice参数决定单元153、Golomb-Rice编码单元154、增益编码单元155、判定单元156、以及增益更新单元157。以下,说明图2的各单元。
<增益取得单元151>
增益取得单元151根据所输入的归一化MDCT系数串XN(0),XN(1),……,XN(N-1),决定整数信号码的比特数为预先分配的比特数即分配比特数B以下,且成为尽量大的值的全局增益g并进行输出。增益取得单元151得到的全局增益g成为在量化单元152中使用的全局增益的初始值。
<量化单元152>
量化单元152得到基于将所输入的归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的各系数除以增益取得单元151或者增益更新单元157得到的全局增益g的结果的整数部分的序列即已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)并进行输出。
在此,量化单元152在初次执行时使用的全局增益g是增益取得单元151得到的全局增益g、即全局增益的初始值。此外,量化单元152在第二次以后执行时使用的全局增益g是增益更新单元157得到的全局增益g、即全局增益的更新值。
<Rice参数决定单元153>
Rice参数决定单元153根据量化单元152得到的已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1),通过下述的式(3)得到Rice参数r并进行输出。
Figure GDA0001304679970000041
其中,将·设为任意的数,[·]为对于·的取整操作。
<Golomb-Rice编码单元154>
Golomb-Rice编码单元154使用Rice参数决定单元153得到的Rice参数r,对量化单元152得到的已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)进行Golomb-Rice编码而得到整数信号码,输出整数信号码、和整数信号码的比特数即消耗比特数C。
<判定单元156>
判定单元156在增益的更新次数为预先决定的次数的情况下,输出整数信号码,且对增益编码单元155输出将增益更新单元157得到的全局增益g进行编码的指示信号,在增益的更新次数小于预先决定的次数的情况下,对增益更新单元157输出Golomb-Rice编码单元154测量的消耗比特数C。
<增益更新单元157>
增益更新单元157在Golomb-Rice编码单元154测量的消耗比特数C比分配比特数B多的情况下将全局增益g的值更新为较大的值并进行输出,在消耗比特数C比分配比特数B少的情况下将全局增益g的值更新为较小的值,输出更新后的全局增益g的值。
<增益编码单元155>
增益编码单元155按照判定单元156输出的指示信号,对增益更新单元157得到的全局增益g进行编码而得到增益码并进行输出。
判定单元156输出的整数信号码、和增益编码单元155输出的增益码作为与归一化MDCT系数串对应的码而被输出至解码装置。
以上那样,在以往的基于TCX的编码中,使用使振幅频谱包络平缓的平滑化振幅频谱包络序列对MDCT系数串进行了归一化后,对归一化MDCT系数串进行编码。该编码方法在上述的MPEG-4USAC等中被采用。
现有技术文献
非专利文献
非专利文献1:M.Neuendorf,et al.,“MPEG Unified Speech and Audio Coding-The ISO/MPEG Standard for High-Efficiency Audio Coding of all Content Types,”AES 132nd Convention,Budapest,Hungary,2012.
发明内容
发明要解决的课题
所输入的系数串的包络的凸凹尽量小则编码单元15的编码效率好。但是,在以往的编码装置中,为了减小听觉上的失真,在包络归一化单元14中将MDCT序列X(0),X(1),……,X(N-1)以平滑化振幅频谱包络序列而不是振幅频谱包络序列进行归一化,被输入至编码单元15的归一化MDCT系数串XN(0),XN(1),……,XN(N-1)尽管不像MDCT系数串X(0),X(1),……,X(N-1)那样,但具有包络的凹凸。即,在以往的编码装置中,平滑化振幅频谱包络序列的包络的凸凹引起编码单元15的编码效率变差。
本发明的目的在于,提供能够进行比以往效率好的编码或者解码的编码装置、解码装置、它们的方法及程序。
用于解决课题的手段
根据本发明的一方式的编码装置,将时序信号在频域进行编码,其中,具备:频谱包络估计单元,将η设为2以外的规定的正数,将与时序信号对应的频域样本串的绝对值的η次方视为功率谱而进行频谱包络的估计;以及编码单元,对与时序信号对应的频域样本串的各系数进行基于所估计出的频谱包络而改变比特分配或者实质上比特分配改变的编码。
根据本发明的一方式的解码装置,通过频域中的解码而得到与时序信号对应的频域样本串,其中,包含:线性预测系数解码单元,对所输入的线性预测系数码进行解码而得到能够变换为线性预测系数的系数;非平滑化频谱包络序列生成单元,将η设为2以外的规定的正数,得到对与能够变换为线性预测系数的系数对应的振幅频谱包络的序列进行1/η次方后的序列即非平滑化频谱包络序列;以及解码单元,按照基于非平滑化频谱包络序列而改变的比特分配或者实质上改变的比特分配,进行所输入的整数信号码的解码从而得到与时序信号对应的频域样本串。
发明效果
能够进行比以往效率好的编码或者解码。
附图说明
图1是用于说明以往的编码装置的例子的框图。
图2是用于说明以往的编码单元的例子的框图。
图3是用于说明技术背景的直方图。
图4是用于说明本发明的编码装置的例子的框图。
图5是用于说明本发明的编码方法的例子的流程图。
图6是用于说明本发明的编码单元的例子的框图。
图7是用于说明本发明的编码单元的例子的框图。
图8是用于说明本发明的编码单元的处理的例子的流程图。
图9是用于说明本发明的解码装置的例子的框图。
图10是用于说明本发明的解码方法的例子的流程图。
图11是用于说明本发明的解码单元的处理的例子的流程图。
图12是用于说明本发明的技术背景的图。
图13是用于说明本发明的编码方法的例子的流程图。
图14是用于说明本发明的编码单元的例子的框图。
图15是用于说明本发明的编码单元的例子的框图。
图16是用于说明本发明的解码装置的例子的框图。
图17是用于说明本发明的解码单元的处理的例子的流程图。
具体实施方式
[技术背景]
与基于振幅频谱包络序列的归一化相比,基于平滑化振幅频谱包络的MDCT序列X(0),X(1),……,X(N-1)的归一化不将MDCT序列X(0),X(1),……,X(N-1)白色化。具体而言,与将MDCT系数串X(0),X(1),……,X(N-1)以振幅频谱包络序列^W(0),^W(1),……,^W(N-1)归一化而得到的归一化后的序列X(0)/^W(0),X(1)/^W(1),……,X(N-1)/^W(N-1)相比,将MDCT系数串X(0),X(1),……,X(N-1)以平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)归一化而得到的归一化MDCT系数串XN(0)=X(0)/^Wγ(0),XN(1)=X(1)/^Wγ(1),……,XN(N-1)=X(N-1)/^Wγ(N-1)凸凹大^W(0)/^Wγ(0),^W(1)/^Wγ(1),……,^W(N-1)/^Wγ(N-1)。从而,若设为将MDCT系数串X(0),X(1),……,X(N-1)以振幅频谱包络序列^W(0),^W(1),……,^W(N-1)归一化而得到的归一化后的序列X(0)/^W(0),X(1)/^W(1),……,X(N-1)/^W(N-1)的包络的凸凹被平坦到适于编码单元15中的编码的程度,则在被输入至编码单元15的归一化MDCT系数串XN(0),XN(1),……,XN(N-1)中,残留以^W(0)/^Wγ(0),^W(1)/^Wγ(1),……,^W(N-1)/^Wγ(N-1)的序列(以下,归一化振幅频谱包络序列^WN(0),^WN(1),……,^WN(N-1))表示的包络的凸凹。
在图3中示出归一化MDCT序列的包络的凹凸^W(0)/^Wγ(0),^W(1)/^Wγ(1),……,^W(N-1)/^Wγ(N-1)取各值的情况下的、归一化MDCT系数串中包含的各系数的值的出现频度。envelope:0.2-0.3的曲线表示与归一化MDCT序列的包络的凹凸^W(k)/^Wγ(k)为0.2以上且小于0.3的样本k对应的归一化MDCT系数XN(k)的值的频度。envelope:0.3-0.4的曲线表示与归一化MDCT序列的包络的凹凸^W(k)/^Wγ(k)为0.3以上且小于0.4的样本k对应的归一化MDCT系数XN(k)的值的频度。envelope:0.4-0.5的曲线表示与归一化MDCT序列的包络的凹凸^W(k)/^Wγ(k)为0.4以上且小于0.5的样本k对应的归一化MDCT系数XN(k)的值的频度。
若观看图3,则可知归一化MDCT系数串中包含的各系数的值平均大致为0,但方差与包络的值具有关联性。即,可知归一化MDCT序列的包络的凹凸越大,则表示频度的曲线的斜坡越宽,所以归一化MDCT序列的包络的凹凸大与归一化MDCT系数的值的方差大有关联性。为了实现更高效的压缩,进行利用了该关联性的编码。具体而言,对成为编码的对象的频域样本串的各系数,进行基于频谱包络而改变比特分配或者实质上比特分配改变的编码。
因此,例如(i)在对已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)进行Golomb-Rice编码的情况下,使用基于频谱包络而决定的Rice参数。此外,例如(ii)在对已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)进行算术编码的情况下,使用基于频谱包络而决定的方差参数。
首先,说明(i)的情况下的技术背景。
在以往的编码装置中,根据包含例如已量化归一化系数序列中包含的系数的平均的以下的式(4)而求得在Golomb-Rice编码中使用的Rice参数,对已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)中包含的全部系数使用根据式(4)而求得的相同的Rice参数进行了Golomb-Rice编码。
Figure GDA0001304679970000081
其中,将·设为任意的数,[·]为对于·的取整操作。
相对于此,在本发明的第二实施方式中,根据与各自的系数对应的归一化振幅频谱包络序列^WN(0),^WN(1),……,^WN(N-1)的各值和全局增益g,通过以下的式(5)算出对于已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各系数的Rice参数。
Figure GDA0001304679970000082
其中,σ为预测残差的能量σ2的平方根。即,σ为正数。也就是说,将对于已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各系数的Rice参数设为在将与该各系数对应的归一化振幅频谱包络的值输入至规定的单调非递减函数的情况下的输出值。通过这样,能够得到适于各系数的Rice参数而不会为了表示对于各系数的Rice参数而新追加信息,能够提高Golomb-Rice编码的效率。
另外,也可以利用通过与以往不同的方法而求得的频谱包络。具体而言,在本发明的第一实施方式中,对将MDCT系数的绝对值的序列进行傅里叶逆变换后的序列进行Levinson-Durbin算法,将对由此得到的线性预测系数进行量化后的系数即^β1,^β2,……,^βp代替量化线性预测系数^α1,^α2,……,^αp来使用,分别根据下述的式(6)和式(7)
Figure GDA0001304679970000091
Figure GDA0001304679970000092
求得非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)和平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1),将所求得的非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)的各系数除以对应的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)的各系数而得到归一化振幅频谱包络序列^HN(0)=^H(0)/^Hγ(0),^HN(1)=^H(1)/^Hγ(1),……,^HN(N-1)=^H(N-1)/^Hγ(N-1),根据归一化振幅频谱包络序列和全局增益g,通过下述的式(8)算出Rice参数。
Figure GDA0001304679970000093
在式(8)中,也将对于已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各系数的Rice参数设为在将与该各系数对应的归一化振幅频谱包络的值输入至规定的单调非递减函数的情况下的输出值。
上述技术基于以在对已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)进行Golomb-Rice编码时的码长为基准的最小化问题。以下叙述上述技术的导出。
若在将已量化归一化系数XQ(k)分别通过Rice参数r(k)进行Golomb-Rice编码时的码长忽略四舍五入误差的影响,则由
Figure GDA0001304679970000094
来表示。其中,正负符号设为以其他途径编码。为了减小该码长,考虑基于已经进行了量化及编码的线性预测系数而求得Rice参数序列r(0),r(1),……,r(N-1)。上面的式(9)能够通过进行式变形而重写为
Figure GDA0001304679970000101
。其中,设为ln为以纳皮尔数为底的对数,C为对于Rice参数的常数,并且DIS(X|Y)为X离Y的板仓斋藤距离。
Figure GDA0001304679970000102
也就是说,对于Rice参数序列的码长L的最小化问题被归结于(log2e)2r(k)和XQ(k)的板仓斋藤距离的总和的最小化问题。在此,若决定一个Rice参数序列r(0),r(1),……,r(N-1)和线性预测系数β12,……,βp、预测残差的能量σ2的对应关系,则能够建立求得将码长最小化的线性预测系数的最佳化问题,但为了使用以往的高速解法而在此如下相关联。
Figure GDA0001304679970000103
若已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)忽略量化的影响,则能够使用MDCT序列X(0),X(1),……,X(N-1)和平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)、全局增益g分别表示为XQ(k)=X(k)/(g^Hγ(k)),因此式(10)的依赖于Rice参数的项通过式(11),如
Figure GDA0001304679970000111
那样,表示为MDCT系数序列的绝对值和全极点的频谱包络的板仓斋藤距离。已知以往的线性预测分析、也就是说对将功率谱进行傅里叶逆变换后的功率谱应用Levinson-Durbin算法是求得将功率谱和全极点型的频谱包络的板仓斋藤距离最小化的线性预测系数的操作。从而,上述的码长最小化问题能够通过对将振幅频谱、也就是说MDCT系数序列的绝对值进行傅里叶逆变换后的频谱应用Levinson-Durbin算法,与以往方法同样地求得最佳解。
接着,说明(ii)的情况下的技术背景。
在编码对象所属的概率分布有多样性时,若将假设了属于某概率分布(例如,拉普拉斯分布)的编码对象的最佳的比特分配对属于从该假设偏离的概率分布的编码对象来进行,则存在压缩效率降低的可能性。
因此,作为编码对象所属的概率分布,使用能够表现各种概率分布的分布的、用以下的式表示的一般化高斯分布。
Figure GDA0001304679970000112
Figure GDA0001304679970000113
一般化高斯分布能够通过改变形状参数η(>0),如图12那样,η=1时表现拉普拉斯分布,η=2时表现高斯分布那样的各种分布。η是比0大的规定的数。η也可以是比0大且2以外的规定的数。具体而言,η也可以是小于2的规定的正数。η的值也可以预先决定,或者按每个规定的时间区间即帧而选择或者可变。此外,上式的
Figure GDA0001304679970000124
是与分布的方差对应的值,将该值设为方差参数,编入频谱包络的凹凸的信息。也就是说,根据频谱包络而生成方差参数
Figure GDA0001304679970000125
对各频率k中的已量化归一化系数XQ(k),构成在遵照
Figure GDA0001304679970000126
的情况下成为最佳的算术码,通过基于该结构的算术码而进行编码。
以下,设为决定一个形状参数η。
在本发明的第三实施方式中,除了预测残差的能量σ2及全局增益g的信息之外还取入所使用的分布的信息,将对于已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各系数的方差参数例如通过以下的式(A1)来算出。
Figure GDA0001304679970000121
其中,σ为σ2的平方根。
具体而言,对于将对MDCT系数的绝对值进行η次方后的值的序列进行傅里叶逆变换后的序列进行Levinson-Durbin算法,对将由此得到的线性预测系数进行量化后的系数即β1,^β2,……,^βp代替量化线性预测系数^α1,^α2,……,^αp来使用,分别根据下述的式(A2)和式(A3)
Figure GDA0001304679970000122
Figure GDA0001304679970000123
求得非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)和平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1),将所求得的非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)的各系数除以对应的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)的各系数而得到归一化振幅频谱包络序列^HN(0)=^H(0)/^Hγ(0),^HN(1)=^H(1)/^Hγ(1),……,^HN(N-1)=^H(N-1)/^Hγ(N-1),根据归一化振幅频谱包络序列和全局增益g,通过上述的式(A1)算出方差参数。
在此,式(A1)的σ2/η/g是与熵紧密相关的值,若比特率固定则每帧的值的变动小。因此,还能够使用预先决定为σ2/η/g的固定值。在这样使用固定值的情况下,不需要为了本发明的方法而新追加信息。
上述技术基于以在对已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)进行算术编码时的码长为基准的最小化问题。以下叙述上述技术的导出。
若设为关于在将已量化归一化系数XQ(k)分别通过方差参数
Figure GDA0001304679970000136
以使用了形状参数η的一般化高斯分布的算术码进行编码时的码长,十分细致地进行量化,则与
Figure GDA0001304679970000131
成比例。为了减小该码长,考虑基于已经进行了量化及编码的线性预测系数而求得方差参数序列
Figure GDA0001304679970000132
上的式(A4)能够通过进行式变形而重写为
Figure GDA0001304679970000133
。其中,设为ln为以纳皮尔数为底的对数,C为对于方差参数的常数,并且DIS(X|Y)为X离Y的板仓斋藤距离。
Figure GDA0001304679970000134
也就是说,对于方差参数序列的码长L的最小化问题被归结于
Figure GDA0001304679970000135
和|XQ(k)|η的板仓斋藤距离的总和的最小化问题。在此,若决定一个方差参数序列
Figure GDA0001304679970000141
和线性预测系数β12,……,βp、预测残差的能量σ2的对应关系,则能够建立求得将码长最小化的线性预测系数的最佳化问题,但为了使用以往的高速解法而在此如下相关联。
Figure GDA0001304679970000142
若已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)忽略量化的影响,则能够使用MDCT序列X(0),X(1),……,X(N-1)和平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)、全局增益g分别表示为XQ(k)=X(k)/(g^Hγ(k)),因此式(A5)的依赖于方差参数的项通过式(A6),如
Figure GDA0001304679970000143
那样,表示为MDCT系数序列的绝对值和全极点的频谱包络的板仓斋藤距离。已知以往的线性预测分析、也就是说对将功率谱进行傅里叶逆变换后的功率谱应用Levinson-Durbin算法是求得将功率谱和全极点的频谱包络的板仓斋藤距离最小化的线性预测系数的操作。从而,上述的码长最小化问题能够通过对将振幅频谱的η次方、也就是说MDCT系数序列的绝对值的η次方进行傅里叶逆变换后的频谱应用Levinson-Durbin算法,与以往方法同样地求得最佳解。
[第一实施方式]
(第一实施方式的编码)
在图4中示出第一实施方式的编码装置的结构例。第一实施方式的编码装置如图4所示,例如具备频域变换单元21、线性预测分析单元22、非平滑化振幅频谱包络序列生成单元23、平滑化振幅频谱包络序列生成单元24、包络归一化单元25、以及编码单元26。在图5中示出由该编码装置实现的第一实施方式的编码方法的各处理的例子。
以下,说明图4的各单元。
<频域变换单元21>
向频域变换单元21输入时域的音信号。音信号的例子是声音数字信号或者音响数字信号。
频域变换单元21以规定的时间长的帧为单位,将所输入的时域的音信号变换为频域的N点的MDCT系数串X(0),X(1),……,X(N-1)(步骤A1)。N为正整数。
所得到的MDCT系数串X(0),X(1),……,X(N-1)被输出至线性预测分析单元22和包络归一化单元25。
只要没有特别提及,设为以后的处理以帧为单位来进行。
这样,频域变换单元21求得与音信号对应的、例如作为MDCT系数串的频域样本串。
<线性预测分析单元22>
向线性预测分析单元22输入频域变换单元21得到的MDCT系数串X(0),X(1),……,X(N-1)。
线性预测分析单元22使用MDCT系数串X(0),X(1),……,X(N-1),对由以下的式(12)定义的~X(0),~X(1),……,~X(N-1)进行线性预测分析而生成线性预测系数β12,……,βp,对所生成的线性预测系数β12,……,βp进行编码而生成与线性预测系数码和与线性预测系数码对应的量化后的线性预测系数即量化线性预测系数^β1,^β2,……,^βp(步骤A2)。
Figure GDA0001304679970000151
所生成的量化线性预测系数^β1,^β2,……,^βp被输出至非平滑化频谱包络序列生成单元23和平滑化振幅频谱包络序列生成单元24。
此外,所生成的线性预测系数码被发送至解码装置。
具体而言,线性预测分析单元22首先通过进行相当于将MDCT系数串X(0),X(1),……,X(N-1)的绝对值视为了功率谱的傅里叶逆变换的运算、即式(12)的运算,求得与MDCT系数串X(0),X(1),……,X(N-1)对应的时域的信号串即伪相关函数信号串~X(0),~X(1),……,~X(N-1)。并且,线性预测分析单元22使用所求得的伪相关函数信号串~X(0),~X(1),……,~X(N-1)进行线性预测分析,生成线性预测系数β12,……,βp。并且,线性预测分析单元22通过对所生成的线性预测系数β12,……,βp进行编码,得到线性预测系数码、和与线性预测系数码对应的量化线性预测系数^β1,^β2,……,^βp
线性预测系数β12,……,βp是与在将MDCT系数串X(0),X(1),……,X(N-1)的绝对值视为了功率谱时的时域的信号对应的线性预测系数。
基于线性预测分析单元22的线性预测系数码的生成例如通过以往的编码技术来进行。以往的编码技术例如是将与线性预测系数本身对应的码设为线性预测系数码的编码技术、将线性预测系数变换为LSP参数而将与LSP参数对应的码设为线性预测系数码的编码技术、将线性预测系数变换为PARCOR系数而将与PARCOR系数对应的码设为线性预测系数码的编码技术等。例如,将与线性预测系数本身对应的码设为线性预测系数码的编码技术是,预先决定多个量化线性预测系数的候选,各候选与线性预测系数码预先相关联而存储,决定候选的其中一个作为对于所生成的线性预测系数的量化线性预测系数,得到量化线性预测系数和线性预测系数码的技术。
<非平滑化振幅频谱包络序列生成单元23>
向非平滑化振幅频谱包络序列生成单元23输入线性预测分析单元22生成的量化线性预测系数^β1,^β2,……,^βp
非平滑化振幅频谱包络序列生成单元23生成与量化线性预测系数^β1,^β2,……,^βp对应的振幅频谱包络的序列即非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)(步骤A3)。
所生成的非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)被输出至编码单元26。
非平滑化振幅频谱包络序列生成单元23使用量化线性预测系数^β1,^β2,……,^βp,生成由以下的式(13)定义的非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)作为非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)。
Figure GDA0001304679970000171
这样,非平滑化振幅频谱包络序列生成单元23得到与音信号对应的振幅频谱包络的序列即非平滑化振幅频谱包络序列。
<平滑化振幅频谱包络序列生成单元24>
向平滑化振幅频谱包络序列生成单元24输入线性预测分析单元22生成的量化线性预测系数^β1,^β2,……,^βp
平滑化振幅频谱包络序列生成单元24生成使与量化线性预测系数^β1,^β2,……,^βp对应的振幅频谱包络的序列的振幅的凸凹平缓的序列即平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)(步骤A4)。
所生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)被输出至包络归一化单元25及编码单元26。
平滑化振幅频谱包络序列生成单元24使用量化线性预测系数^β1,^β2,……,^βp和校正系数γ,生成由以下的式(14)定义的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)作为平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)。
Figure GDA0001304679970000172
在此,校正系数γ是预先决定的小于1的常数并且是使非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)的振幅的凹凸平缓的系数、换言之将非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)平滑化的系数。
这样,平滑化振幅频谱包络序列生成单元24得到将非平滑化振幅频谱包络序列的振幅的凸凹平滑化后的序列即平滑化振幅频谱包络序列。
<包络归一化单元25>
向包络归一化单元25输入频域变换单元21得到的MDCT系数串X(0),X(1),……,X(N-1)及平滑化振幅频谱包络序列生成单元24生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)。
包络归一化单元25通过将MDCT系数串X(0),X(1),……,X(N-1)的各系数以对应的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)的各值归一化,从而生成归一化MDCT系数串XN(0),XN(1),……,XN(N-1)(步骤A5)。
所生成的归一化MDCT系数串被输出至编码单元26。
包络归一化单元25通过例如设为k=0,1,……,N-1,将MDCT系数串X(0),X(1),……,X(N-1)的各系数X(k)除以平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1),从而生成归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的各系数XN(k)。即,设为k=0,1,……,N-1,XN(k)=X(k)/^Hγ(k)。
这样,包络归一化单元25例如将MDCT系数串即频域样本串的各样本以平滑化振幅频谱包络序列的对应的样本归一化,得到例如归一化MDCT系数串即归一化频域样本串。
<编码单元26>
向编码单元26输入包络归一化单元25生成的归一化MDCT系数串XN(0),XN(1),……,XN(N-1)、非平滑化振幅频谱包络序列生成单元23生成的非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)及平滑化振幅频谱包络序列生成单元24生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)。
编码单元26通过进行图8中例示的步骤A6-1至步骤A6-5的处理从而进行编码(步骤A6)。即,编码单元26求得与归一化MDCT系数串XN(0),XN(1),……,XN(N-1)对应的全局增益g(步骤A6-1),求得基于对将归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的各系数除以全局增益g后的结果进行量化后的整数值的序列即已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)(步骤A6-2),根据全局增益g、非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)和平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1),通过上述的式(8)求得与已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各系数对应的Rice参数r(0),r(1),……,r(N-1)(步骤A6-3),使用Rice参数r(0),r(1),……,r(N-1)对已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)进行Golomb-Rice编码而得到整数信号码(步骤A6-4),得到与全局增益g对应的增益码(步骤A6-5)。
在此,上述的式(8)中的归一化振幅频谱包络序列^HN(0),^HN(1),……,^HN(N-1)是将非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)的各值除以对应的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)的各值后的序列、即通过以下的式(15)求得的序列。
Figure GDA0001304679970000191
所生成的整数信号码和增益码作为与归一化MDCT系数串对应的码而被输出至解码装置。
编码单元26通过上述的步骤A6-1~A6-5,实现决定整数信号码的比特数为预先分配的比特数即分配比特数B以下,且成为尽量大的值的全局增益g,生成与所决定的全局增益g对应的增益码、和与该决定的全局增益g对应的整数信号码的功能。
编码单元26进行的步骤A6-1至步骤A6-5之中包含特征的处理的是步骤A6-3。在通过对全局增益g和已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各个进行编码从而得到与归一化MDCT系数串对应的码的编码处理本身中,存在包含非专利文献1中记载的技术的各种公知技术。以下说明两个编码单元26进行的编码处理的具体例。
[编码单元26进行的编码处理的具体例1]
作为编码单元26进行的编码处理的具体例1,说明不包含循环处理的例子。
在图6中示出具体例1的编码单元26的结构例。具体例1的编码单元26如图6所示,例如具备增益取得单元261、量化单元262、Rice参数决定单元263、Golomb-Rice编码单元264、以及增益编码单元265。以下,说明图6的各单元。
<增益取得单元261>
增益取得单元261根据所输入的归一化MDCT系数串XN(0),XN(1),……,XN(N-1),决定整数信号码的比特数为预先分配的比特数即分配比特数B以下,且成为尽量大的值的全局增益g并进行输出(步骤261)。增益取得单元261例如得到所输入的归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的能量的合计的平方根和与分配比特数B有负相关的常数的乘法值作为全局增益g并进行输出。或者,也可以是增益取得单元261将所输入的归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的能量的合计、分配比特数B、全局增益g的关系预先表格化,通过参照该表而得到全局增益g并进行输出。
这样,增益取得单元261得到例如用于对归一化MDCT系数串即归一化频域样本串的全样本进行除法的增益。
<量化单元262>
量化单元262得到基于将所输入的归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的各系数除以增益取得单元261得到的全局增益g后的结果的整数部分的序列即已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)并进行输出(步骤262)。
这样,量化单元262例如将归一化MDCT系数串即归一化频域样本串的各样本除以增益且进行量化而求得已量化归一化系数序列。
<Rice参数决定单元263>
Rice参数决定单元263根据增益取得单元261得到的全局增益g、所输入的非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)、所输入的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1),通过上述的式(8)得到Rice参数序列r(0),r(1),……,r(N-1)的各Rice参数并进行输出(步骤263)。
这样,Rice参数决定单元263基于平滑化振幅频谱包络序列、非平滑化振幅频谱包络序列、增益,按量化归一化系数序列的各系数的每个求得用于对已量化归一化系数序列进行Golomb-Rice编码的Rice参数。
编码侧的莱斯参数决定装置是至少具备Rice参数决定单元263的装置。编码侧的莱斯参数决定装置也可以具备非平滑化振幅频谱包络序列生成单元23、平滑化振幅频谱包络序列生成单元24、包络归一化单元25、增益取得单元261、量化单元262等其他单元。
<Golomb-Rice编码单元264>
Golomb-Rice编码单元264使用Rice参数决定单元263得到的Rice参数序列r(0),r(1),……,r(N-1)的各Rice参数作为与已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各系数对应的Rice参数,对量化单元262得到的已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)进行Golomb-Rice编码而得到整数信号码并进行输出(步骤264)。
<增益编码单元265>
增益编码单元265对增益取得单元261得到的全局增益g进行编码而得到增益码并进行输出(步骤265)。
所生成的整数信号码和增益码作为与归一化MDCT系数串对应的码而被输出至解码装置。
即,本具体例的步骤261至265分别与上述的步骤A6-1~A6-5对应。
[编码单元26进行的编码处理的具体例2]
作为编码单元26进行的编码处理的具体例2,说明包含循环处理的例子。
在图7中示出具体例2的编码单元26的结构例。具体例2的编码单元26如图7所示,例如具备增益取得单元261、量化单元262、Rice参数决定单元263、Golomb-Rice编码单元264、增益编码单元265、判定单元266、以及增益更新单元267。以下,说明图7的各单元。
<增益取得单元261>
增益取得单元261根据所输入的归一化MDCT系数串XN(0),XN(1),……,XN(N-1),决定整数信号码的比特数为预先分配的比特数即分配比特数B以下,且成为尽量大的值的全局增益g并进行输出(步骤261)。增益取得单元261例如得到归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的能量的合计的平方根和与分配比特数B有负相关的常数的乘法值作为全局增益g并进行输出。
增益取得单元261得到的全局增益g成为在量化单元262及Rice参数决定单元263中使用的全局增益的初始值。
这样,增益取得单元261得到例如用于对作为归一化MDCT系数串的归一化频域样本串的全样本进行除法的增益。
<量化单元262>
量化单元262得到基于将所输入的归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的各系数除以增益取得单元261或者增益更新单元267得到的全局增益g后的结果的整数部分的序列即已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)并进行输出(步骤262)。
在此,在初次执行量化单元262的处理时使用的全局增益g是增益取得单元261得到的全局增益g、即全局增益的初始值。此外,在第二次以后执行量化单元262的处理时使用的全局增益g是增益更新单元267得到的全局增益g、即全局增益的更新值。
这样,量化单元262将例如归一化MDCT系数串即归一化频域样本串的各样本除以增益且进行量化而求得已量化归一化系数序列。
<Rice参数决定单元263>
Rice参数决定单元263根据增益取得单元261或者增益更新单元267得到的全局增益g、所输入的非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)、所输入的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1),通过上述的式(8)得到Rice参数序列r(0),r(1),……,r(N-1)的各Rice参数并进行输出(步骤263)。
在此,在初次执行Rice参数决定单元263的处理时使用的全局增益g是增益取得单元261得到的全局增益g、即全局增益的初始值。此外,在第二次以后执行Rice参数决定单元263的处理时使用的全局增益g是增益更新单元267得到的全局增益g、即全局增益的更新值。
这样,Rice参数决定单元263基于平滑化振幅频谱包络序列、非平滑化振幅频谱包络序列、增益,按量化归一化系数序列的各系数的每个求得用于对已量化归一化系数序列进行Golomb-Rice编码的Rice参数。
编码侧的莱斯参数决定装置是至少具备Rice参数决定单元263的装置。编码侧的莱斯参数决定装置也可以具备非平滑化振幅频谱包络序列生成单元23、平滑化振幅频谱包络序列生成单元24、包络归一化单元25、增益取得单元261、量化单元262等其他单元。
<Golomb-Rice编码单元264>
Golomb-Rice编码单元264使用Rice参数决定单元263得到的Rice参数序列r(0),r(1),……,r(N-1)的各Rice参数作为与已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各系数对应的Rice参数,对量化单元262得到的已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)进行Golomb-Rice编码而得到整数信号码,输出整数信号码、和整数信号码的比特数即消耗比特数C(步骤264)。
<判定单元266>
判定单元266进行基于增益的更新次数的判定。具体而言,判定单元266在增益的更新次数为预先决定的次数的情况下,输出整数信号码,且对增益编码单元265输出对增益更新单元267得到的全局增益g进行编码的指示信号,在增益的更新次数小于预先决定的次数的情况下,对增益更新单元267输出Golomb-Rice编码单元264测量的消耗比特数C(步骤S266)。
<增益更新单元267>
增益更新单元267在Golomb-Rice编码单元264测量的消耗比特数C比分配比特数B多的情况下将全局增益g的值更新为较大的值并进行输出,在消耗比特数C比分配比特数B少的情况下将全局增益g的值更新为较小的值,输出更新后的全局增益g的值(步骤267)。
<增益编码单元265>
增益编码单元265按照判定单元266输出的指示信号,对增益更新单元267得到的全局增益g进行编码而得到增益码并进行输出(步骤265)。
判定单元266输出的整数信号码、和增益编码单元265输出的增益码作为与归一化MDCT系数串对应的码而被输出至解码装置。
即,在本具体例中,最后进行的步骤267、步骤262、步骤263、步骤264分别对应于上述的步骤A6-1~A6-4,步骤265对应于上述的步骤A6-5。
另外,关于编码单元26进行的编码处理的具体例2,在国际公开2014/054556等中进一步详细说明。
(第一实施方式的解码)
在图9中示出与第一实施方式的编码装置对应的解码装置的结构例。第一实施方式的解码装置如图9所示,例如具备线性预测系数解码单元31、非平滑化振幅频谱包络序列生成单元32、平滑化振幅频谱包络序列生成单元33、解码单元34、包络逆归一化单元35、以及时域变换单元36。在图10中示出由该解码装置实现的第一实施方式的解码方法的各处理的例子。
向解码装置至少输入编码装置输出的与归一化MDCT系数串对应的码及线性预测系数码。
以下,说明图9的各单元。
<线性预测系数解码单元31>
向线性预测系数解码单元31输入编码装置输出的线性预测系数码。
线性预测系数解码单元31按每帧而通过例如以往的解码技术对所输入的线性预测系数码进行解码而得到解码线性预测系数^β1,^β2,……,^βp(步骤B1)。
所得到的解码线性预测系数^β1,^β2,……,^βp被输出至非平滑化振幅频谱包络序列生成单元32及平滑化振幅频谱包络序列生成单元33。
在此,以往的解码技术例如是,在线性预测系数码为与量化后的线性预测系数对应的码的情况下对线性预测系数码进行解码而得到与量化后的线性预测系数相同的解码线性预测系数的技术、在线性预测系数码为与量化后的LSP参数对应的码的情况下对线性预测系数码进行解码而得到与量化后的LSP参数相同的解码LSP参数的技术等。此外,线性预测系数和LSP参数能够相互变换,根据所输入的线性预测系数码和后级的处理中所需的信息,进行解码线性预测系数和解码LSP参数之间的变换处理即可是公知的。根据以上,包含上述的线性预测系数码的解码处理和根据需要进行的上述的变换处理的处理称为“基于以往的解码技术的解码”。
<非平滑化振幅频谱包络序列生成单元32>
向非平滑化振幅频谱包络序列生成单元32输入线性预测系数解码单元31得到的解码线性预测系数^β1,^β2,……,^βp
非平滑化振幅频谱包络序列生成单元32通过上述的式(13)生成与解码线性预测系数^β1,^β2,……,^βp对应的振幅频谱包络的序列即非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)(步骤B2)。
所生成的非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)被输出至解码单元34。
这样,非平滑化振幅频谱包络序列生成单元32得到与对应于所输入的线性预测系数码的线性预测系数对应的振幅频谱包络的序列即非平滑化振幅频谱包络序列。
<平滑化振幅频谱包络序列生成单元33>
向平滑化振幅频谱包络序列生成单元33输入线性预测系数解码单元31得到的解码线性预测系数^β1,^β2,……,^βp
平滑化振幅频谱包络序列生成单元33通过上述的式(14)生成使与解码线性预测系数^β1,^β2,……,^βp对应的振幅频谱包络的序列的振幅的凸凹平缓的序列即平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)(步骤B3)。
所生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)被输出至解码单元34及包络逆归一化单元35。
这样,平滑化振幅频谱包络序列生成单元33得到将与对应于所输入的线性预测系数码的线性预测系数对应的振幅频谱包络的序列的振幅的凸凹平滑化的序列即平滑化振幅频谱包络序列。
<解码单元34>
向解码单元34输入与编码装置输出的归一化MDCT系数串对应的码、非平滑化振幅频谱包络序列生成单元32生成的非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)及平滑化振幅频谱包络序列生成单元33生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)。
解码单元34具备Rice参数决定单元341。
解码单元34通过进行图11中例示的步骤B4-1至步骤B4-4的处理来进行解码(步骤B4)。即,解码单元34按每帧而对与所输入的归一化MDCT系数串对应的码中包含的增益码进行解码而得到全局增益g(步骤B4-1)。解码单元34的Rice参数决定单元341根据全局增益g、非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)、平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1),通过上述的式(8)求得Rice参数序列r(0),r(1),……,r(N-1)的各Rice参数(步骤B4-2)。解码单元34使用Rice参数序列r(0),r(1),……,r(N-1)的各Rice参数对与归一化MDCT系数串对应的码中包含的整数信号码进行Golomb-Rice解码而得到已解码归一化系数序列^XQ(0),^XQ(1),……,^XQ(N-1)(步骤B4-3),对已解码归一化系数序列^XQ(0),^XQ(1),……,^XQ(N-1)的各系数乘以全局增益g而生成解码归一化MDCT系数串^XN(0),^XN(1),……,^XN(N-1)(步骤B4-4)。
所生成的解码归一化MDCT系数串^XN(0),^XN(1),……,^XN(N-1)被输出至包络逆归一化单元35。
这样,Rice参数决定单元341基于平滑化振幅频谱包络序列、非平滑化振幅频谱包络序列、增益,按上述已解码量化归一化系数序列的各系数的每个求得用于通过Golomb-Rice解码得到已解码归一化系数序列的Rice参数。
此外,解码单元34对于对所输入的整数信号码进行Golomb-Rice解码而得到的已解码归一化系数序列的各系数乘以对所输入的增益码进行解码而得到的增益,得到例如解码归一化MDCT系数串即解码归一化频域样本串。
解码侧的莱斯参数决定装置是至少具备Rice参数决定单元341的装置。解码侧的莱斯参数决定装置也可以具备非平滑化振幅频谱包络序列生成单元32等其他单元。
<包络逆归一化单元35>
向包络逆归一化单元35输入平滑化振幅频谱包络序列生成单元33生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)及解码单元34生成的解码归一化MDCT系数串^XN(0),^XN(1),……,^XN(N-1)。
包络逆归一化单元35使用平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1),对解码归一化MDCT系数串^XN(0),^XN(1),……,^XN(N-1)进行逆归一化,从而生成解码MDCT系数串^X(0),^X(1),……,^X(N-1)(步骤B5)。
所生成的解码MDCT系数串^X(0),^X(1),……,^X(N-1)被输出至时域变换单元36。
例如,包络逆归一化单元35设为k=0,1,……,N-1,对解码归一化MDCT系数串^XN(0),^XN(1),……,^XN(N-1)的各系数^XN(k)乘以平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)的各包络值^Hγ(k)从而生成解码MDCT系数串^X(0),^X(1),……,^X(N-1)。即,设为k=0,1,……,N-1,^X(k)=^XN(k)×^Hγ(k)。
这样,包络逆归一化单元35得到例如将解码归一化MDCT系数串即归一化频域样本串的各系数、和平滑化振幅频谱包络序列的对应的系数相乘后的结果即解码频域样本串。
<时域变换单元36>
向时域变换单元36输入包络逆归一化单元35生成的解码MDCT系数串^X(0),^X(1),……,^X(N-1)。
时域变换单元36按每帧而将包络逆归一化单元35得到的解码MDCT系数串^X(0),^X(1),……,^X(N-1)变换为时域,得到帧单位的音信号(解码音信号)(步骤B6)。
这样,时域变换单元36得到例如与解码MDCT系数串即解码频域样本串对应的解码音信号。
[第二实施方式]
(第二实施方式的编码)
在图4中示出第二实施方式的编码装置的结构例。第二实施方式的编码装置如图4所示,例如具备频域变换单元21、线性预测分析单元22、非平滑化振幅频谱包络序列生成单元23、平滑化振幅频谱包络序列生成单元24、包络归一化单元25、编码单元26。在图5中示出由该编码装置实现的第二实施方式的编码方法的各处理的例子。
以下,说明图4的各单元。
<频域变换单元21>
向频域变换单元21输入时域的音信号。音信号的例子是声音数字信号或者音响数字信号。
频域变换单元21以规定的时间长的帧为单位,将所输入的时域的音信号变换为频域的N点的MDCT系数串X(0),X(1),……,X(N-1)(步骤A1)。N为正整数。
所得到的MDCT系数串X(0),X(1),……,X(N-1)被输出至线性预测分析单元22和包络归一化单元25。
只要没有特别提及,设为以后的处理以帧为单位来进行。
这样,频域变换单元21求得与音信号对应的例如MDCT系数串即频域样本串。
<线性预测分析单元22>
向线性预测分析单元22输入频域变换单元21得到的MDCT系数串X(0),X(1),……,X(N-1)。
线性预测分析单元22使用MDCT系数串X(0),X(1),……,X(N-1),对由以下的式(16)定义的~X(0),~X(1),……,~X(N-1)进行线性预测分析而生成线性预测系数α12,……,αp,对所生成的线性预测系数α12,……,αp进行编码,生成线性预测系数码和与线性预测系数码对应的量化后的线性预测系数即量化线性预测系数^α1,^α2,……,^αp(步骤A2)。
Figure GDA0001304679970000271
所生成的量化线性预测系数^α1,^α2,……,^αp被输出至非平滑化频谱包络序列生成单元23和平滑化振幅频谱包络序列生成单元24。
此外,所生成的线性预测系数码被发送至解码装置。
具体而言,线性预测分析单元22通过进行式(16)的运算,求得与MDCT系数串X(0),X(1),……,X(N-1)对应的时域的信号串即伪相关函数信号串~X(0),~X(1),……,~X(N-1)。并且,线性预测分析单元22使用所求得的伪相关函数信号串~X(0),~X(1),……,~X(N-1)进行线性预测分析,生成线性预测系数α12,……,αp。并且,线性预测分析单元22通过对所生成的线性预测系数α12,……,αp进行编码,得到线性预测系数码、和与线性预测系数码对应的量化线性预测系数^α1,^α2,……,^αp
基于线性预测分析单元22的线性预测系数码的生成例如通过以往的编码技术来进行。以往的编码技术例如是,将与线性预测系数本身对应的码设为线性预测系数码的编码技术、将线性预测系数变换为LSP参数而将与LSP参数对应的码设为线性预测系数码的编码技术、将线性预测系数变换为PARCOR系数而将与PARCOR系数对应的码设为线性预测系数码的编码技术等。例如,将与线性预测系数本身对应的码设为线性预测系数码的编码技术是,预先决定多个量化线性预测系数的候选,各候选与线性预测系数码预先相关联而存储,决定候选的其中一个作为对于所生成的线性预测系数的量化线性预测系数,得到量化线性预测系数和线性预测系数码的技术。
<非平滑化振幅频谱包络序列生成单元23>
向非平滑化振幅频谱包络序列生成单元23输入线性预测分析单元22生成的量化线性预测系数^α1,^α2,……,^αp
非平滑化振幅频谱包络序列生成单元23生成与量化线性预测系数^α1,^α2,……,^αp对应的振幅频谱包络的序列即非平滑化振幅频谱包络序列^W(0),^W(1),……,^W(N-1)(步骤A3)。
所生成的非平滑化振幅频谱包络序列^W(0),^W(1),……,^W(N-1)被输出至编码单元26。
非平滑化振幅频谱包络序列生成单元23使用量化线性预测系数^α1,^α2,……,^αp,生成由以下的式(17)定义的非平滑化振幅频谱包络序列^W(0),^W(1),……,^W(N-1)作为非平滑化振幅频谱包络序列^W(0),^W(1),……,^W(N-1)。
Figure GDA0001304679970000281
这样,非平滑化振幅频谱包络序列生成单元23得到与音信号对应的振幅频谱包络的序列即非平滑化振幅频谱包络序列。
<平滑化振幅频谱包络序列生成单元24>
向平滑化振幅频谱包络序列生成单元24输入线性预测分析单元22生成的量化线性预测系数^α1,^α2,……,^αp
平滑化振幅频谱包络序列生成单元24生成使与量化线性预测系数^α1,^α2,……,^αp对应的振幅频谱包络的序列的振幅的凸凹平缓的序列即平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)(步骤A4)。
所生成的平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)被输出至包络归一化单元25及编码单元26。
平滑化振幅频谱包络序列生成单元24使用量化线性预测系数^α1,^α2,……,^αp和校正系数γ,生成由以下的式(18)定义的平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)作为平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)。
Figure GDA0001304679970000291
在此,校正系数γ是预先决定的小于1的常数并且是使非平滑化振幅频谱包络序列^W(0),^W(1),……,^W(N-1)的振幅的凹凸平缓的系数、换言之将非平滑化振幅频谱包络序列^W(0),^W(1),……,^W(N-1)平滑化的系数。
这样,平滑化振幅频谱包络序列生成单元24得到将非平滑化振幅频谱包络序列的振幅的凸凹平滑化的序列即平滑化振幅频谱包络序列。
<包络归一化单元25>
向包络归一化单元25输入频域变换单元21得到的MDCT系数串X(0),X(1),……,X(N-1)及平滑化振幅频谱包络序列生成单元24生成的平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)。
包络归一化单元25通过将MDCT系数串X(0),X(1),……,X(N-1)的各系数以对应的平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)的各值来归一化,从而生成归一化MDCT系数串XN(0),XN(1),……,XN(N-1)(步骤A5)。
所生成的归一化MDCT系数串被输出至编码单元26。
包络归一化单元25例如设为k=0,1,……,N-1,将MDCT系数串X(0),X(1),……,X(N-1)的各系数X(k)除以平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1),从而生成归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的各系数XN(k)。即,设为k=0,1,……,N-1,XN(k)=X(k)/^Wγ(k)。
这样,包络归一化单元25将例如MDCT系数串即频域样本串的各样本以平滑化振幅频谱包络序列的对应的样本来归一化,得到例如归一化MDCT系数串即归一化频域样本串。
<编码单元26>
向编码单元26输入包络归一化单元25生成的归一化MDCT系数串XN(0),XN(1),……,XN(N-1)、非平滑化振幅频谱包络序列生成单元23生成的非平滑化振幅频谱包络序列^W(0),^W(1),……,^W(N-1)及平滑化振幅频谱包络序列生成单元24生成的平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)。
编码单元26通过进行图8中例示的步骤A6-1至步骤A6-5的处理来进行编码(步骤A6)。即,编码单元26求得与归一化MDCT系数串XN(0),XN(1),……,XN(N-1)对应的全局增益g(步骤A6-1),求得基于对将归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的各系数除以全局增益g后的结果进行量化后的整数值的序列即已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)(步骤A6-2),根据全局增益g、非平滑化振幅频谱包络序列^W(0),^W(1),……,^W(N-1)、平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1),通过上述的式(5)求得与已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各系数对应的Rice参数r(0),r(1),……,r(N-1)(步骤A6-3),使用Rice参数r(0),r(1),……,r(N-1)对已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)进行Golomb-Rice编码而得到整数信号码(步骤A6-4),得到与全局增益g对应的增益码(步骤A6-5)。在此,关于上述的式(5)中的归一化振幅频谱包络序列^WN(0),^WN(1),……,^WN,将非平滑化振幅频谱包络序列^W(0),^W(1),……,^W(N-1)的各值除以对应的平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)的各值、即通过以下的式(19)而求得。
Figure GDA0001304679970000301
所生成的整数信号码和增益码作为与归一化MDCT系数串对应的码而被输出至解码装置。
编码单元26通过上述的步骤A6-1~A6-5,实现决定整数信号码的比特数为预先分配的比特数即分配比特数B以下,且成为尽量大的值的全局增益g,生成与所决定的全局增益g对应的增益码、和与该决定的全局增益g对应的整数信号码的功能。
编码单元26进行的步骤A6-1至步骤A6-5之中包含特征的处理的是步骤A6-3。在通过对全局增益g和已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各个进行编码从而得到与归一化MDCT系数串对应的码的编码处理本身中,存在包含非专利文献1中记载的技术的各种公知技术。
编码单元26进行的编码处理的具体例如第一实施方式的编码单元26的说明处所说明的那样。
这样,Rice参数决定单元263基于平滑化振幅频谱包络序列、非平滑化振幅频谱包络序列、增益,按量化归一化系数序列的各系数的每个求得用于对已量化归一化系数序列进行Golomb-Rice编码的Rice参数。
编码侧的莱斯参数决定装置是至少具备Rice参数决定单元263的装置。编码侧的莱斯参数决定装置也可以具备非平滑化振幅频谱包络序列生成单元23、平滑化振幅频谱包络序列生成单元24、包络归一化单元25、增益取得单元261、量化单元262等其他单元。
(第二实施方式的解码)
在图9中示出与第二实施方式的编码装置对应的解码装置的结构例。第二实施方式的解码装置如图9所示,例如具备线性预测系数解码单元31、非平滑化振幅频谱包络序列生成单元32、平滑化振幅频谱包络序列生成单元33、解码单元34、包络逆归一化单元35、时域变换单元36。在图10中示出由该解码装置实现的第二实施方式的解码方法的各处理的例子。
向解码装置至少输入编码装置输出的与归一化MDCT系数串对应的码及线性预测系数码。
以下,说明图9的各单元。
<线性预测系数解码单元31>
向线性预测系数解码单元31输入编码装置输出的线性预测系数码。
线性预测系数解码单元31按每帧而通过例如以往的解码技术对所输入的线性预测系数码进行解码而得到解码线性预测系数^α1,^α2,……,^αp(步骤B1)。
所得到的解码线性预测系数^α1,^α2,……,^αp被输出至非平滑化振幅频谱包络序列生成单元32及平滑化振幅频谱包络序列生成单元33。
在此,以往的解码技术例如是,在线性预测系数码为与量化后的线性预测系数对应的码的情况下对线性预测系数码进行解码而得到与量化后的线性预测系数相同的解码线性预测系数的技术、在线性预测系数码为与量化后的LSP参数对应的码的情况下对线性预测系数码进行解码而得到与量化后的LSP参数相同的解码LSP参数的技术等。此外,线性预测系数和LSP参数能够相互变换,根据所输入的线性预测系数码和后级的处理中所需的信息,进行解码线性预测系数和解码LSP参数之间的变换处理即可是公知的。根据以上,包含上述的线性预测系数码的解码处理和根据需要进行的上述的变换处理的处理称为“基于以往的解码技术的解码”。
<非平滑化振幅频谱包络序列生成单元32>
向非平滑化振幅频谱包络序列生成单元32输入线性预测系数解码单元31得到的解码线性预测系数^α1,^α2,……,^αp
非平滑化振幅频谱包络序列生成单元32通过上述的式(17)生成与解码线性预测系数^α1,^α2,……,^αp对应的振幅频谱包络的序列即非平滑化振幅频谱包络序列^W(0),^W(1),……,^W(N-1)(步骤B2)。
所生成的非平滑化振幅频谱包络序列^W(0),^W(1),……,^W(N-1)被输出至解码单元34。
这样,非平滑化振幅频谱包络序列生成单元32得到与对应于所输入的线性预测系数码的线性预测系数对应的振幅频谱包络的序列即非平滑化振幅频谱包络序列。
<平滑化振幅频谱包络序列生成单元33>
向平滑化振幅频谱包络序列生成单元33输入线性预测系数解码单元31得到的解码线性预测系数^α1,^α2,……,^αp
平滑化振幅频谱包络序列生成单元33通过上述的式(18)生成使与解码线性预测系数^α1,^α2,……,^αp对应的振幅频谱包络的序列的振幅的凸凹平缓的序列即平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)(步骤B3)。
所生成的平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)被输出至解码单元34及包络逆归一化单元35。
这样,平滑化振幅频谱包络序列生成单元33得到将与对应于所输入的线性预测系数码的线性预测系数对应的振幅频谱包络的序列的振幅的凸凹平滑化的序列即平滑化振幅频谱包络序列。
<解码单元34>
向解码单元34输入与编码装置输出的归一化MDCT系数串对应的码、非平滑化振幅频谱包络序列生成单元32生成的非平滑化振幅频谱包络序列^W(0),^W(1),……,^W(N-1)及平滑化振幅频谱包络序列生成单元33生成的平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)。
解码单元34具备Rice参数决定单元341。
解码单元34通过进行图11中例示的步骤B4-1至步骤B4-4的处理来进行解码(步骤B4)。即,解码单元34按每帧而对与所输入的归一化MDCT系数串对应的码中包含的增益码进行解码而得到全局增益g(步骤B4-1)。解码单元34的Rice参数决定单元341根据全局增益g、非平滑化振幅频谱包络序列^W(0),^W(1),……,^W(N-1)、平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1),通过上述的式(5)求得Rice参数序列r(0),r(1),……,r(N-1)的各Rice参数(步骤B4-2)。解码单元34使用Rice参数序列r(0),r(1),……,r(N-1)的各Rice参数对与归一化MDCT系数串对应的码中包含的整数信号码进行Golomb-Rice解码而得到已解码归一化系数序列^XQ(0),^XQ(1),……,^XQ(N-1)(步骤B4-3),对已解码归一化系数序列^XQ(0),^XQ(1),……,^XQ(N-1)的各系数乘以全局增益g而生成解码归一化MDCT系数串^XN(0),^XN(1),……,^XN(N-1)(步骤B4-4)。
所生成的解码归一化MDCT系数串^XN(0),^XN(1),……,^XN(N-1)被输出至包络逆归一化单元35。
这样,Rice参数决定单元341基于平滑化振幅频谱包络序列、非平滑化振幅频谱包络序列、增益,按上述已解码量化归一化系数序列的各系数的每个求得用于通过Golomb-Rice解码得到已解码归一化系数序列的Rice参数。
此外,解码单元34对于对所输入的整数信号码进行Golomb-Rice解码而得到的已解码归一化系数序列的各系数乘以对所输入的增益码进行解码而得到的增益,得到例如解码归一化MDCT系数串即解码归一化频域样本串。
解码侧的莱斯参数决定装置是至少具备Rice参数决定单元341的装置。解码侧的莱斯参数决定装置也可以具备非平滑化振幅频谱包络序列生成单元32等其他单元。
<包络逆归一化单元35>
向包络逆归一化单元35输入平滑化振幅频谱包络序列生成单元33生成的平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)及解码单元34生成的解码归一化MDCT系数串^XN(0),^XN(1),……,^XN(N-1)。
包络逆归一化单元35使用平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1),对解码归一化MDCT系数串^XN(0),^XN(1),……,^XN(N-1)进行逆归一化,从而生成解码MDCT系数串^X(0),^X(1),……,^X(N-1)(步骤B5)。
所生成的解码MDCT系数串^X(0),^X(1),……,^X(N-1)被输出至时域变换单元36。
例如,包络逆归一化单元35设为k=0,1,……,N-1,对解码归一化MDCT系数串^XN(0),^XN(1),……,^XN(N-1)的各系数^XN(k)乘以平滑化振幅频谱包络序列^Wγ(0),^Wγ(1),……,^Wγ(N-1)的各包络值^Wγ(k)从而生成解码MDCT系数串^X(0),^X(1),……,^X(N-1)。即,设为k=0,1,……,N-1,^X(k)=^XN(k)×^Wγ(k)。
这样,包络逆归一化单元35得到例如将解码归一化MDCT系数串即归一化频域样本串的各系数、和平滑化振幅频谱包络序列的对应的系数相乘的解码频域样本串。
<时域变换单元36>
向时域变换单元36输入包络逆归一化单元35生成的解码MDCT系数串^X(0),^X(1),……,^X(N-1)。
时域变换单元36按每帧而将包络逆归一化单元35得到的解码MDCT系数串^X(0),^X(1),……,^X(N-1)变换为时域,得到帧单位的音信号(解码音信号)(步骤B6)。
这样,时域变换单元36得到例如与解码MDCT系数串即解码频域样本串对应的解码音信号。
[第三实施方式]
(第三实施方式的编码)
在图4中示出第三实施方式的编码装置的结构例。第三实施方式的编码装置如图4所示,例如具备频域变换单元21、线性预测分析单元22、非平滑化振幅频谱包络序列生成单元23、平滑化振幅频谱包络序列生成单元24、包络归一化单元25、以及编码单元26。在图5中示出由该编码装置实现的第三实施方式的编码方法的各处理的例子。
以下,说明图4的各单元。
<频域变换单元21>
向频域变换单元21输入作为时域的时序信号的音信号。音信号的例子是声音数字信号或者音响数字信号。
频域变换单元21以规定的时间长的帧为单位,将所输入的时域的音信号变换为频域的N点的MDCT系数串X(0),X(1),……,X(N-1)(步骤A1)。N为正整数。
所得到的MDCT系数串X(0),X(1),……,X(N-1)被输出至线性预测分析单元22和包络归一化单元25。
只要没有特别提及,设为以后的处理以帧为单位来进行。
这样,频域变换单元21求得与音信号对应的例如MDCT系数串即频域样本串。
<线性预测分析单元22>
向线性预测分析单元22输入频域变换单元21得到的MDCT系数串X(0),X(1),……,X(N-1)。
线性预测分析单元22使用MDCT系数串X(0),X(1),……,X(N-1),对由以下的式(A7)定义的~R(0),~R(1),……,~R(N-1)进行线性预测分析而生成线性预测系数β12,……,βp,对所生成的线性预测系数β12,……,βp进行编码而生成线性预测系数码和与线性预测系数码对应的量化后的线性预测系数即量化线性预测系数^β1,^β2,……,^βp(步骤A2)。
Figure GDA0001304679970000351
其中,η为形状参数,预先决定。例如,将η设为2以外的规定的整数。
所生成的量化线性预测系数^β1,^β2,……,^βp被输出至非平滑化频谱包络序列生成单元23和平滑化振幅频谱包络序列生成单元24。另外,以线性预测分析处理的过程算出预测残差的能量σ2。在该情况下,所算出的预测残差的能量σ2被输出至方差参数决定单元268。
此外,所生成的线性预测系数码被发送至解码装置。
具体而言,线性预测分析单元22首先进行相当于将MDCT系数串X(0),X(1),……,X(N-1)的绝对值的η次方视为了功率谱的傅里叶逆变换的运算、即式(A7)的运算,求得与MDCT系数串X(0),X(1),……,X(N-1)的绝对值的η次方对应的时域的信号串即伪相关函数信号串~R(0),~R(1),……,~R(N-1)。并且,线性预测分析单元22使用所求得的伪相关函数信号串~R(0),~R(1),……,~R(N-1)进行线性预测分析,生成线性预测系数β12,……,βp。并且,线性预测分析单元22对所生成的线性预测系数β12,……,βp进行编码,从而得到线性预测系数码、和与线性预测系数码对应的量化线性预测系数^β1,^β2,……,^βp
线性预测系数β12,……,βp是与将MDCT系数串X(0),X(1),……,X(N-1)的绝对值的η次方视为了功率谱时的时域的信号对应的线性预测系数。
基于线性预测分析单元22的线性预测系数码的生成例如通过以往的编码技术来进行。以往的编码技术例如是,将与线性预测系数本身对应的码设为线性预测系数码的编码技术、将线性预测系数变换为LSP参数而将与LSP参数对应的码设为线性预测系数码的编码技术、将线性预测系数变换为PARCOR系数而将与PARCOR系数对应的码设为线性预测系数码的编码技术等。例如,将与线性预测系数本身对应的码设为线性预测系数码的编码技术是,预先决定多个量化线性预测系数的候选,各候选与线性预测系数码预先相关联而存储,决定候选的其中一个作为对于所生成的线性预测系数的量化线性预测系数,得到量化线性预测系数和线性预测系数码的技术。
这样,线性预测分析单元22使用将例如MDCT系数串即频域样本串的绝对值的η次方视为了功率谱的通过进行傅里叶逆变换而得到的伪相关函数信号串来进行线性预测分析,生成能够变换为线性预测系数的系数。
<非平滑化振幅频谱包络序列生成单元23>
向非平滑化振幅频谱包络序列生成单元23输入线性预测分析单元22生成的量化线性预测系数^β1,^β2,……,^βp
非平滑化振幅频谱包络序列生成单元23生成与量化线性预测系数^β1,^β2,……,^βp对应的振幅频谱包络的序列即非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)(步骤A3)。
所生成的非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)被输出至编码单元26。
非平滑化振幅频谱包络序列生成单元23使用量化线性预测系数^β1,^β2,……,^βp,生成由式(A2)定义的非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)作为非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)。
Figure GDA0001304679970000361
这样,非平滑化振幅频谱包络序列生成单元23通过得到对与由线性预测分析单元22生成的能够变换为线性预测系数的系数对应的振幅频谱包络的序列进行1/η次方后的序列即非平滑化频谱包络序列,从而进行频谱包络的估计。在此,将c设为任意的数,对由多个值构成的序列进行c次方后的序列是,由对多个值的各个值进行c次方后的值构成的序列。例如,对振幅频谱包络的序列进行1/η次方后的序列是,由对振幅频谱包络的各系数进行1/η次方后的值构成的序列。
基于非平滑化振幅频谱包络序列生成单元23的1/η次方的处理因由线性预测分析单元22进行的将频域样本串的绝对值的η次方视为了功率谱的处理引起。即,基于非平滑化振幅频谱包络序列生成单元23的1/η次方的处理为了通过由线性预测分析单元22进行的将频域样本串的绝对值的η次方视为了功率谱的处理将η次方后的值返回原来的值而进行。
在第一实施方式及第二实施方式中使用由式(13)定义的Hγ(k)[k=0,1,……,N-1],相对于此,在第三实施方式中使用由式(A2)定义的Hγ(k)[k=0,1,……,N-1]。
<平滑化振幅频谱包络序列生成单元24>
向平滑化振幅频谱包络序列生成单元24输入线性预测分析单元22生成的量化线性预测系数^β1,^β2,……,^βp
平滑化振幅频谱包络序列生成单元24生成使与量化线性预测系数^β1,^β2,……,^βp对应的振幅频谱包络的序列的振幅的凸凹平缓的序列即平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)(步骤A4)。
所生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)被输出至包络归一化单元25及编码单元26。
平滑化振幅频谱包络序列生成单元24使用量化线性预测系数^β1,^β2,……,^βp和校正系数γ,生成由式(A3)定义的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)作为平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)。
Figure GDA0001304679970000371
在此,校正系数γ为预先决定的小于1的常数并且是使非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)的振幅的凹凸平缓的系数、换言之将非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)平滑化的系数。
在第一实施方式及第二实施方式中使用由式(14)定义的^Hγ(k)[k=0,1,……,N-1],相对于此,在第三实施方式中使用由式(A3)定义的^Hγ(k)[k=0,1,……,N-1]。
<包络归一化单元25>
向包络归一化单元25输入频域变换单元21得到的MDCT系数串X(0),X(1),……,X(N-1)及平滑化振幅频谱包络序列生成单元24生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)。
包络归一化单元25通过将MDCT系数串X(0),X(1),……,X(N-1)的各系数以对应的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)的各值来归一化,从而生成归一化MDCT系数串XN(0),XN(1),……,XN(N-1)(步骤A5)。
所生成的归一化MDCT系数串被输出至编码单元26。
包络归一化单元25例如设为k=0,1,……,N-1,将MDCT系数串X(0),X(1),……,X(N-1)的各系数X(k)除以平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1),从而生成归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的各系数XN(k)。即,设为k=0,1,……,N-1,XN(k)=X(k)/^Hγ(k)。
<编码单元26>
向编码单元26输入包络归一化单元25生成的归一化MDCT系数串XN(0),XN(1),……,XN(N-1)、非平滑化振幅频谱包络序列生成单元23生成的非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)、平滑化振幅频谱包络序列生成单元24生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)及线性预测分析单元22算出的平均残差的能量σ2
编码单元26通过例如进行图13所示的步骤A61至步骤A65的处理来进行编码(步骤A6)。
编码单元26求得与归一化MDCT系数串XN(0),XN(1),……,XN(N-1)对应的全局增益g(步骤A61),求得基于对将归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的各系数除以全局增益g后的结果进行量化后的整数值的序列即已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)(步骤A62),根据全局增益g、非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)、平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)、平均残差的能量σ2,通过式(A1)求得与已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各系数对应的方差参数
Figure GDA0001304679970000391
(步骤A63),使用方差参数
Figure GDA0001304679970000392
对已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)进行算术编码而得到整数信号码(步骤A64),得到与全局增益g对应的增益码(步骤A65)。
Figure GDA0001304679970000393
在此,上述的式(A1)中的归一化振幅频谱包络序列^HN(0),^HN(1),……,^HN(N-1)是将非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)的各值除以对应的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)的各值、即通过以下的式(A8)求得的序列。
Figure GDA0001304679970000394
所生成的整数信号码和增益码作为与归一化MDCT系数串对应的码而被输出至解码装置。
编码单元26通过步骤A61至步骤A65,实现以下的功能,即,决定整数信号码的比特数为预先分配的比特数即分配比特数B以下,且成为尽量大的值的全局增益g,生成与所决定的全局增益g对应的增益码、和与该决定的全局增益g对应的整数信号码。
编码单元26进行的步骤A61至步骤A65之中包含特征的处理的是步骤A63,在通过对全局增益g和已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各个进行编码,从而得到与归一化MDCT系数串对应的码的编码处理本身中,存在包含非专利文献1中记载的技术的各种公知技术。以下说明两个编码单元26进行的编码处理的具体例。
[编码单元26进行的编码处理的具体例1]
作为编码单元26进行的编码处理的具体例1,说明不包含循环处理的例子。
在图14中示出具体例1的编码单元26的结构例。具体例1的编码单元26如图14所示,例如具备增益取得单元261、量化单元262、方差参数决定单元268、算术编码单元269、增益编码单元265。以下,说明图14的各单元。
<增益取得单元261>
向增益取得单元261输入包络归一化单元25生成的归一化MDCT系数串XN(0),XN(1),……,XN(N-1)。
增益取得单元261根据归一化MDCT系数串XN(0),XN(1),……,XN(N-1),决定整数信号码的比特数为预先分配的比特数即分配比特数B以下,且成为尽量大的值的全局增益g并进行输出(步骤S261)。增益取得单元261例如得到归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的能量的合计的平方根和与分配比特数B有负相关的常数的乘法值作为全局增益g并进行输出。或者,也可以是增益取得单元261将归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的能量的合计、分配比特数B、全局增益g的关系预先表格化,通过参照该表而得到全局增益g并进行输出。
这样,增益取得单元261得到用于对例如归一化MDCT系数串即归一化频域样本串的全样本进行除法的增益。
所得到的全局增益g被输出至量化单元262及方差参数决定单元268。
<量化单元262>
向量化单元262输入包络归一化单元25生成的归一化MDCT系数串XN(0),XN(1),……,XN(N-1)及增益取得单元261得到的全局增益g。
量化单元262得到基于将归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的各系数除以全局增益g后的结果的整数部分的序列即已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)并进行输出(步骤S262)。
这样,量化单元262将例如归一化MDCT系数串即归一化频域样本串的各样本除以增益且进行量化而求得已量化归一化系数序列。
所得到的已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)被输出至算术编码单元269。
<方差参数决定单元268>
向方差参数决定单元268输入增益取得单元261得到的全局增益g、非平滑化振幅频谱包络序列生成单元23生成的非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)、平滑化振幅频谱包络序列生成单元24生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)及线性预测分析单元22得到的预测残差的能量σ2
方差参数决定单元268根据全局增益g、非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)、平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)、预测残差的能量σ2,通过上述的式(A1)、式(A8)得到方差参数序列
Figure GDA0001304679970000411
的各方差参数并进行输出(步骤S268)。
所得到的方差参数序列
Figure GDA0001304679970000412
被输出至算术编码单元269。
<算术编码单元269>
向算术编码单元269输入量化单元262得到的已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)及方差参数决定单元268得到的方差参数序列
Figure GDA0001304679970000413
算术编码单元269使用方差参数序列
Figure GDA0001304679970000414
的各方差参数作为与已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各系数对应的方差参数,对已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)进行算术编码而得到整数信号码并进行输出(步骤S269)。
算术编码单元269在算术编码时,构成在已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各系数遵照一般化高斯分布
Figure GDA0001304679970000415
时成为最佳的算术码,通过基于该结构的算术码进行编码。其结果,对已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各系数的比特分配的期待值以方差参数序列
Figure GDA0001304679970000416
来决定。
所得到的整数信号码被输出至解码装置。
也可以跨越已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)之中的多个系数进行算术编码。在该情况下,从式(A1),式(A8)可知,方差参数序列
Figure GDA0001304679970000417
的各方差参数是基于非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)的,所以可以说算术编码单元269进行基于所估计出的频谱包络(非平滑化振幅频谱包络)而实质上比特分配改变的编码。
<增益编码单元265>
向增益编码单元265输入增益取得单元261得到的全局增益g。
增益编码单元265对全局增益g进行编码而得到增益码并进行输出(步骤S265)。
所生成的整数信号码和增益码作为与归一化MDCT系数串对应的码而被输出至解码装置。
本具体例1的步骤S261、S262、S268、S269、S265分别对应于上述的步骤A61、A62、A63、A64、A65。
[编码单元26进行的编码处理的具体例2]
作为编码单元26进行的编码处理的具体例2,说明包含循环处理的例子。
在图15中示出具体例2的编码单元26的结构例。具体例2的编码单元26如图15所示,例如具备增益取得单元261、量化单元262、方差参数决定单元268、算术编码单元269、增益编码单元265、判定单元266、增益更新单元267。以下,说明图15的各单元。
<增益取得单元261>
向增益取得单元261输入包络归一化单元25生成的归一化MDCT系数串XN(0),XN(1),……,XN(N-1)。
增益取得单元261根据归一化MDCT系数串XN(0),XN(1),……,XN(N-1),决定整数信号码的比特数为预先分配的比特数即分配比特数B以下,且成为尽量大的值的全局增益g并进行输出(步骤S261)。增益取得单元261例如得到归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的能量的合计的平方根和与分配比特数B有负相关的常数的乘法值作为全局增益g并进行输出。
所得到的全局增益g被输出至量化单元262及方差参数决定单元268。
增益取得单元261得到的全局增益g成为在量化单元262及方差参数决定单元268中使用的全局增益的初始值。
<量化单元262>
向量化单元262输入包络归一化单元25生成的归一化MDCT系数串XN(0),XN(1),……,XN(N-1)及增益取得单元261或者增益更新单元267得到的全局增益g。
量化单元262得到基于将归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的各系数除以全局增益g后的结果的整数部分的序列即已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)并进行输出(步骤S262)。
在此,量化单元262在初次执行时使用的全局增益g是增益取得单元261得到的全局增益g、即全局增益的初始值。此外,量化单元262在第二次以后执行时使用的全局增益g是增益更新单元267得到的全局增益g、即全局增益的更新值。
所得到的已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)被输出至算术编码单元269。
<方差参数决定单元268>
向方差参数决定单元268输入增益取得单元261或者增益更新单元267得到的全局增益g、非平滑化振幅频谱包络序列生成单元23生成的非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)、平滑化振幅频谱包络序列生成单元24生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)及线性预测分析单元22得到的预测残差的能量σ2
方差参数决定单元268根据全局增益g、非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)、平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)、预测残差的能量σ2,通过上述的式(A1)、式(A8)得到方差参数序列
Figure GDA0001304679970000431
的各方差参数并进行输出(步骤S268)。
在此,方差参数决定单元268在初次执行时使用的全局增益g是增益取得单元261得到的全局增益g、即全局增益的初始值。此外,方差参数决定单元268在第二次以后执行时使用的全局增益g是增益更新单元267得到的全局增益g、即全局增益的更新值。
所得到的方差参数序列
Figure GDA0001304679970000432
被输出至算术编码单元269。
<算术编码单元269>
向算术编码单元269输入量化单元262得到的已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)及方差参数决定单元268得到的方差参数序列
Figure GDA0001304679970000433
算术编码单元269使用方差参数序列
Figure GDA0001304679970000434
的各方差参数作为与已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各系数对应的方差参数,对已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)进行算术编码,得到整数信号码和整数信号码的比特数即消耗比特数C并进行输出(步骤S269)。
算术编码单元269在算术编码时,通过算术码进行在已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各系数遵照一般化高斯分布
Figure GDA0001304679970000435
时成为最佳的比特分配,通过基于所进行的比特分配的算术码来进行编码。
所得到的整数信号码及消耗比特数C被输出至判定单元266。
也可以跨越已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)之中的多个系数来进行算术编码。在该情况下,从式(A1),式(A8)可知,方差参数序列
Figure GDA0001304679970000441
的各方差参数是基于非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)的,所以可以说算术编码单元269进行基于所估计出的频谱包络(非平滑化振幅频谱包络)而实质上比特分配改变的编码。
<判定单元266>
向判定单元266输入算术编码单元269得到的整数信号码。
判定单元266在增益的更新次数为预先决定的次数的情况下,输出整数信号码,且对增益编码单元265输出对增益更新单元267得到的全局增益g进行编码的指示信号,在增益的更新次数小于预先决定的次数的情况下,对增益更新单元267输出算术编码单元269测量的消耗比特数C(步骤S266)。
<增益更新单元267>
向增益更新单元267输入算术编码单元269测量的消耗比特数C。
增益更新单元267在消耗比特数C比分配比特数B多的情况下将全局增益g的值更新为较大的值并进行输出,在消耗比特数C比分配比特数B少的情况下将全局增益g的值更新为较小的值,输出更新后的全局增益g的值(步骤S267)。
增益更新单元267得到的更新后的全局增益g被输出至量化单元262及增益编码单元265。
<增益编码单元265>
向增益编码单元265输入来自判定单元266的输出指示及增益更新单元267得到的全局增益g。
增益编码单元265按照指示信号,对全局增益g进行编码而得到增益码并进行输出(步骤265)。
判定单元266输出的整数信号码、和增益编码单元265输出的增益码作为与归一化MDCT系数串对应的码而被输出至解码装置。
即,在本具体例2中,最后进行的步骤S267对应于上述的步骤A61,步骤S262、S263、S264、S265分别对应于上述的步骤A62、A63、A64、A65。
另外,关于编码单元26进行的编码处理的具体例2,在国际公开公报WO2014/054556等中进一步详细说明。
[编码单元26的变形例]
也可以是编码单元26通过进行例如以下的处理,进行基于所估计出的频谱包络(非平滑化振幅频谱包络)而改变比特分配的编码。
编码单元26首先求得与归一化MDCT系数串XN(0),XN(1),……,XN(N-1)对应的全局增益g,求得基于对将归一化MDCT系数串XN(0),XN(1),……,XN(N-1)的各系数除以全局增益g后的结果进行量化后的整数值的序列即已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)。
假设与该已量化归一化系数序列XQ(0),XQ(1),……,XQ(N-1)的各系数对应的量化比特的XQ(k)的分布在某范围内一致,能够根据包络的估计值来决定该范围。还能够对多个样本的每个的包络的估计值进行编码,但编码单元26能够例如以下的式(A9)那样使用基于线性预测的归一化振幅频谱包络序列的值^HN(k)来决定XQ(k)的范围。
Figure GDA0001304679970000451
在对某k时的XQ(k)进行量化时,为了将XQ(k)的平方误差设为最小,基于
Figure GDA0001304679970000452
的制约,还能够设定所分配的比特数b(k)。
Figure GDA0001304679970000453
B为预先决定的正整数。此时也可以是编码单元26进行以下b(k)的再调整的处理:进行四舍五入以使b(k)成为整数,或在比0小的情况下设为b(k)=0等。
此外,编码单元26将多个样本汇总而决定分配比特数而不是按每个样本的分配,对量化来说也能够进行将多个样本汇总的每个矢量的量化而不是按每个样本的标量量化。
若样本k的XQ(k)的量化比特数b(k)如上述提供,按每个样本进行编码,则XQ(k)可以取-2b(k)-1至2b(k)-1的2b(k)种类的整数。编码单元26以b(k)比特对各样本进行编码而得到整数信号码。
所生成的整数信号码被输出至解码装置。例如,与所生成的XQ(k)对应的b(k)比特的整数信号码从k=0依次被输出至解码装置。
如果XQ(k)超过上述的-2b(k)-1至2b(k)-1的范围的情况下置换为最大值、或者最小值。
若g过小则在该置换中产生量化失真,若g过大则量化误差变大,XQ(k)可取的范围与b(k)相比过小,不能有效利用信息。因此,也可以进行g的最佳化。
编码单元26对全局增益g进行编码而得到增益码并进行输出。
如该编码单元26的变形例那样,编码单元26也可以进行算术编码以外的编码。
(第三实施方式的解码)
在图16中示出与第三实施方式的编码装置对应的解码装置的结构例。第三实施方式的解码装置如图16所示,例如具备线性预测系数解码单元31、非平滑化振幅频谱包络序列生成单元32、平滑化振幅频谱包络序列生成单元33、解码单元34、包络逆归一化单元35、时域变换单元36。在图10中示出由该解码装置实现的第三实施方式的解码方法的各处理的例子。
向解码装置至少输入编码装置输出的与归一化MDCT系数串对应的码及线性预测系数码。
以下,说明图16的各单元。
<线性预测系数解码单元31>
向线性预测系数解码单元31输入编码装置输出的线性预测系数码。
线性预测系数解码单元31按每帧而通过例如以往的解码技术对所输入的线性预测系数码进行解码,得到解码线性预测系数^β1,^β2,……,^βp(步骤B1)。
所得到的解码线性预测系数^β1,^β2,……,^βp被输出至非平滑化振幅频谱包络序列生成单元32及平滑化振幅频谱包络序列生成单元33。
在此,以往的解码技术例如是,在线性预测系数码为与量化后的线性预测系数对应的码的情况下对线性预测系数码进行解码而得到与量化后的线性预测系数相同的解码线性预测系数的技术、在与线性预测系数码为与量化后的LSP参数对应的码的情况下对线性预测系数码进行解码而得到与量化后的LSP参数相同的解码LSP参数的技术等。此外,线性预测系数和LSP参数能够相互变换,根据所输入的线性预测系数码和后级的处理中所需的信息,进行解码线性预测系数和解码LSP参数之间的变换处理即可是公知的。根据以上,包含上述的线性预测系数码的解码处理和根据需要进行的上述的变换处理的处理称为“基于以往的解码技术的解码”。
这样,线性预测系数解码单元31通过对所输入的线性预测系数码进行解码,生成能够变换为与通过进行将与时序信号对应的频域样本串的绝对值的η次方视为了功率谱的傅里叶逆变换而得到的伪相关函数信号串对应的线性预测系数的系数。
<非平滑化振幅频谱包络序列生成单元32>
向非平滑化振幅频谱包络序列生成单元32输入线性预测系数解码单元31得到的解码线性预测系数^β1,^β2,……,^βp
非平滑化振幅频谱包络序列生成单元32通过上述的式(A2)生成与解码线性预测系数^β1,^β2,……,^βp对应的振幅频谱包络的序列即非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)(步骤B2)。
所生成的非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)被输出至解码单元34。
这样,非平滑化振幅频谱包络序列生成单元32将η设为2以外的规定的正数,得到对与由线性预测系数解码单元31生成的能够变换为线性预测系数的系数对应的振幅频谱包络的序列进行1/η次方后的序列即非平滑化频谱包络序列。非平滑化振幅频谱包络序列生成单元32使用的η为预先决定,与对应的编码装置中预先决定的η相同。
<平滑化振幅频谱包络序列生成单元33>
向平滑化振幅频谱包络序列生成单元33输入线性预测系数解码单元31得到的解码线性预测系数^β1,^β2,……,^βp
平滑化振幅频谱包络序列生成单元33通过上述的式A(3)生成使与解码线性预测系数^β1,^β2,……,^βp对应的振幅频谱包络的序列的振幅的凹凸平缓的序列即平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)(步骤B3)。
所生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)被输出至解码单元34及包络逆归一化单元35。
<解码单元34>
向解码单元34输入与编码装置输出的归一化MDCT系数串对应的码、非平滑化振幅频谱包络序列生成单元32生成的非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)及平滑化振幅频谱包络序列生成单元33生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)。
解码单元34具备方差参数决定单元342。
解码单元34通过例如进行图17所示的步骤B41至步骤B44的处理来进行解码(步骤B4)。即,解码单元34按每帧而对与所输入的归一化MDCT系数串对应的码中包含的增益码进行解码,得到全局增益g(步骤B41)。解码单元34的方差参数决定单元342根据全局增益g、非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)、平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1),通过上述的式(A1)求得方差参数序列
Figure GDA0001304679970000484
的各方差参数(步骤B42)。解码单元34按照与方差参数序列
Figure GDA0001304679970000485
的各方差参数对应的算术解码的结构,对与归一化MDCT系数串对应的码中包含的整数信号码进行算术解码而得到已解码归一化系数序列^XQ(0),^XQ(1),……,^XQ(N-1)(步骤B43),对已解码归一化系数序列^XQ(0),^XQ(1),……,^XQ(N-1)的各系数乘以全局增益g而生成解码归一化MDCT系数串^XN(0),^XN(1),……,^XN(N-1)(步骤B44)。这样,解码单元34也可以按照基于非平滑化频谱包络序列而实质上改变的比特分配,进行所输入的整数信号码的解码。
另外,在通过[编码单元26的变形例]中记载的处理进行编码的情况下,解码单元34例如进行以下的处理。解码单元34按每帧而对与所输入的归一化MDCT系数串对应的码中包含的增益码进行解码,得到全局增益g。解码单元34的方差参数决定单元342根据非平滑化振幅频谱包络序列^H(0),^H(1),……,^H(N-1)、平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1),通过上述的式(A9)求得方差参数序列
Figure GDA0001304679970000481
的各方差参数。解码单元34能够基于方差参数序列
Figure GDA0001304679970000482
的各方差参数
Figure GDA0001304679970000483
通过式(A10)求得b(k),将XQ(k)的值以其比特数b(k)依次进行解码,得到已解码归一化系数序列^XQ(0),^XQ(1),……,^XQ(N-1),对已解码归一化系数序列^XQ(0),^XQ(1),……,^XQ(N-1)的各系数乘以全局增益g而生成解码归一化MDCT系数串^XN(0),^XN(1),……,^XN(N-1)。这样,解码单元34也可以按照基于非平滑化频谱包络序列而改变的比特分配,进行所输入的整数信号码的解码。
所生成的解码归一化MDCT系数串^XN(0),^XN(1),……,^XN(N-1)被输出至包络逆归一化单元35。
<包络逆归一化单元35>
向包络逆归一化单元35输入平滑化振幅频谱包络序列生成单元33生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)及解码单元34生成的解码归一化MDCT系数串^XN(0),^XN(1),……,^XN(N-1)。
包络逆归一化单元35使用平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1),对解码归一化MDCT系数串^XN(0),^XN(1),……,^XN(N-1)进行逆归一化,从而生成解码MDCT系数串^X(0),^X(1),……,^X(N-1)(步骤B5)。
所生成的解码MDCT系数串^X(0),^X(1),……,^X(N-1)被输出至时域变换单元36。
例如,包络逆归一化单元35设为k=0,1,……,N-1,对解码归一化MDCT系数串^XN(0),^XN(1),……,^XN(N-1)的各系数^XN(k)乘以平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),……,^Hγ(N-1)的各包络值^Hγ(k)从而生成解码MDCT系数串^X(0),^X(1),……,^X(N-1)。即,设为k=0,1,……,N-1,^X(k)=^XN(k)×^Hγ(k)。
<时域变换单元36>
向时域变换单元36输入包络逆归一化单元35生成的解码MDCT系数串^X(0),^X(1),……,^X(N-1)。
时域变换单元36按每帧而将包络逆归一化单元35得到的解码MDCT系数串^X(0),^X(1),……,^X(N-1)变换为时域变换,得到帧单位的音信号(解码音信号)(步骤B6)。
这样,解码装置通过频域中的解码而得到时序信号。
[变形例等]
可以说若将线性预测分析单元22及非平滑化振幅频谱包络序列生成单元23理解为一个频谱包络估计单元2A,则该频谱包络估计单元2A将η设为2以外的规定的正数,进行将与时序信号对应的例如MDCT系数串即频域样本串的绝对值的η次方视为了功率谱的频谱包络(非平滑化振幅频谱包络序列)的估计。例如,在第一实施方式中可以说是进行η为1的情况下的处理。在第二实施方式中可以说是进行η为2的情况下的处理。此外,在第三实施方式中可以说是进行η为2以外的规定的正数的情况下的处理。在此,“视为了功率谱”“视为功率谱”意味着,在通常使用功率谱时使用η次方的频谱。
在该情况下,可以说将η设为2以外的规定的整数,频谱包络估计单元2A的线性预测分析单元22使用通过进行将例如MDCT系数串即频域样本串的绝对值的η次方视为了功率谱的傅里叶逆变换而得到的伪相关函数信号串来进行线性预测分析,得到能够变换为线性预测系数的系数。此外,可以说频谱包络估计单元2A的非平滑化振幅频谱包络序列生成单元23将η设为2以外的规定的整数,通过得到将与由线性预测分析单元22得到的能够变换为线性预测系数的系数对应的振幅频谱包络的序列进行1/η次方后的序列即非平滑化频谱包络序列从而进行频谱包络的估计。
此外,可以说若将平滑化振幅频谱包络序列生成单元24、包络归一化单元25及编码单元26理解为一个编码单元2B,则该编码单元2B对与时序信号对应的例如MDCT系数串即频域样本串的各系数进行基于由频谱包络估计单元2A估计的频谱包络(非平滑化振幅频谱包络序列)而改变比特分配或者实质上比特分配改变的编码。
第一实施方式至第三实施方式中说明的频谱包络估计单元2A的处理(即,线性预测分析单元22及非平滑化振幅频谱包络序列生成单元23的处理)、及编码单元2B的处理(即,平滑化振幅频谱包络序列生成单元24、包络归一化单元25及编码单元26的处理)不过是一例。频谱包络估计单元2A也可以进行第一实施方式至第三实施方式中说明的处理以外的、将与时序信号对应的例如MDCT系数串即频域样本串的绝对值的η次方视为了功率谱的频谱包络(非平滑化振幅频谱包络序列)的估计的处理。此外,编码单元2B也可以进行第一实施方式至第三实施方式中说明的处理以外的、对与时序信号对应的例如MDCT系数串即频域样本串的各系数进行基于由频谱包络估计单元2A估计的频谱包络(非平滑化振幅频谱包络序列)而改变比特分配或者实质上比特分配改变的编码的处理。
例如也可以在编码单元2B中不设置平滑化振幅频谱包络序列生成单元24。在该情况下,不进行基于包络归一化单元25的MDCT系数串的归一化处理,编码单元26代替归一化MDCT系数串而对MDCT系数串进行与上述同样的编码处理。此外,在该情况下,编码单元26的方差参数决定单元268代替式(A1)而基于下述的式(A11)决定方差参数。
Figure GDA0001304679970000501
此外,在该情况下,也可以在解码装置中不设置平滑化振幅频谱包络序列生成单元33。在该情况下,不进行基于包络逆归一化单元35的解码归一化MDCT系数串的逆归一化处理,通过解码单元34的解码而得到解码MDCT系数串。此外,在该情况下,解码单元34的方差参数决定单元342代替式(A1)而基于上述的式(A11)决定方差参数。进而,在该情况下,时域变换单元36代替解码归一化MDCT系数串而对解码MDCT系数串进行与上述同样的时域变换。
此外,例如也可以在编码单元2B中不设置包络归一化单元25。在该情况下,编码单元26代替归一化MDCT系数串而对MDCT系数串进行与上述同样的编码处理。此外,在该情况下,也可以在解码装置中不设置包络逆归一化单元35。在该情况下,通过解码单元34的解码而得到解码MDCT系数串,时域变换单元36代替解码归一化MDCT系数串而对解码MDCT系数串进行与上述同样的时域变换。
可以说若将解码单元34及包络逆归一化单元35理解为一个解码单元3A,则该解码单元3A按照基于非平滑化频谱包络序列而改变的比特分配或者实质上改变的比特分配,进行所输入的整数信号码的解码从而得到与时序信号对应的频域样本串。
上述说明的处理不仅按照记载的顺序而时序地执行,也可以根据执行处理的装置的处理能力或者根据需要而并行或者单独执行。
此外,也可以由计算机来实现各装置中的各单元的处理。在该情况下,各装置的处理内容通过程序来记述。并且,通过在计算机中执行该程序,从而在计算机上实现各装置中的各单元的处理。
记述了该处理内容的程序能够记录至计算机可读取的记录介质。作为计算机可读取的记录介质,例如也可以是磁记录装置、光盘、光磁记录介质、半导体存储器等任意介质。
此外,该程序的流通例如通过对记录了该程序的DVD、CD-ROM等可移动记录介质进行销售、转让、借出等来进行。进而,也可以将该程序储存至服务器计算机的存储装置,经由网络从服务器计算机向其他计算机转发该程序,从而使该程序流通。
执行这样的程序的计算机例如首先将在可移动记录介质中记录的程序或从服务器计算机转发的程序暂时储存至自己的存储部。并且,在执行处理时,该计算机读取在自己的存储部中储存的程序,执行按照所读取的程序的处理。此外,作为该程序的另一实施方式,也可以设为计算机从可移动记录介质直接读取程序,执行按照该程序的处理。进而,也可以设为在每次从服务器计算机向该计算机转发程序时,逐次执行按照所接受的程序的处理。此外,也可以设为不进行从服务器计算机向该计算机的程序的转发,而是通过仅通过其执行指示和结果取得来实现处理功能的所谓ASP((应用服务提供商(Application ServiceProvider))型的服务来执行上述的处理的结构。另外,设为在程序中,包括供于电子计算机的处理用的信息且遵照程序的数据(虽然不是对于计算机的直接指令但具有规定计算机的处理的性质的数据等)。
此外,设为在计算机上执行预定的程序而构成了各装置,但这些处理内容的至少一部分也可以通过硬件来实现。

Claims (13)

1.一种编码装置,将时序信号在频域进行编码,其中,包含:
频谱包络估计单元,将η设为1,将与所述时序信号对应的频域样本串的绝对值的η次方视为功率谱而进行频谱包络的估计;以及
编码单元,对与所述时序信号对应的频域样本串的各样本进行基于所述频谱包络的估计而改变比特分配或者实质上比特分配改变的编码。
2.如权利要求1所述的编码装置,其中,
所述频谱包络估计单元包含:
线性预测分析单元,使用伪相关函数信号串来进行线性预测分析而得到线性预测系数,其中所述伪相关函数信号串是使用所述频域样本串X(0),X(1),…,X(N-1)通过式(12)得到的;以及
非平滑化频谱包络序列生成单元,通过得到非平滑化频谱包络序列,从而进行所述频谱包络的估计,其中所述非平滑化频谱包络序列是使用所述线性预测系数^β1,^β2,…,^βp通过式(13)得到的,
其中N为正整数,将·设为实数,exp(·)为以纳皮尔数为底的指数函数,j为虚数单位,~X(0),~X(1),…,~X(N-1)是所述伪相关函数信号串,^H(0),^H(1),……,^H(N-1)是所述非平滑化频谱包络序列,p是2以上的整数,式(12)以及式(13)是如下式:
Figure FDA0002493742070000011
Figure FDA0002493742070000012
3.一种解码装置,通过频域中的解码而得到与时序信号对应的频域样本串,其中,包含:
线性预测系数解码单元,对所输入的线性预测系数码进行解码而得到线性预测系数;
非平滑化频谱包络序列生成单元,使用所述线性预测系数^β1,^β2,…,^βp通过式(13)得到非平滑化频谱包络序列;以及
解码单元,按照基于所述非平滑化频谱包络序列而改变的比特分配或者实质上改变的比特分配,进行所输入的整数信号码的解码从而得到与所述时序信号对应的频域样本串,
其中N为正整数,将·设为实数,exp(·)为以纳皮尔数为底的指数函数,j为虚数单位,^H(0),^H(1),……,^H(N-1)是所述非平滑化频谱包络序列,p是2以上的整数,式(13)是如下式:
Figure FDA0002493742070000021
4.一种编码装置,将时序信号在频域进行编码,其中,包含:
频谱包络估计单元,将η设为非1且非2的规定的正数,将与所述时序信号对应的频域样本串的绝对值的η次方视为功率谱而进行频谱包络的估计;以及
编码单元,对与所述时序信号对应的频域样本串的各样本进行基于所述频谱包络的估计而改变比特分配或者实质上比特分配改变的编码。
5.如权利要求4所述的编码装置,其中,
所述频谱包络估计单元包含:
线性预测分析单元,使用伪相关函数信号串来进行线性预测分析而得到线性预测系数,其中所述伪相关函数信号串是使用所述频域样本串X(0),X(1),…,X(N-1)通过式(A7)得到的;以及
非平滑化频谱包络序列生成单元,通过得到非平滑化频谱包络序列,从而进行所述频谱包络的估计,其中所述非平滑化频谱包络序列是使用所述线性预测系数^β1,^β2,…,^βp通过式(A2)得到的,
其中N为正整数,将·设为实数,exp(·)为以纳皮尔数为底的指数函数,j为虚数单位,~R(0),~R(1),…,~R(N-1)是所述伪相关函数信号串,^H(0),^H(1),……,^H(N-1)是所述非平滑化频谱包络序列,p是2以上的整数,式(A7)以及式(A2)是如下式:
Figure FDA0002493742070000022
Figure FDA0002493742070000031
6.一种解码装置,通过频域中的解码而得到与时序信号对应的频域样本串,其中,包含:
线性预测系数解码单元,对所输入的线性预测系数码进行解码而得到线性预测系数;
非平滑化频谱包络序列生成单元,将η设为非1且非2的规定的正数,使用所述线性预测系数^β1,^β2,…,^βp通过式(A2)得到非平滑化频谱包络序列;以及
解码单元,按照基于所述非平滑化频谱包络序列而改变的比特分配或者实质上改变的比特分配,进行所输入的整数信号码的解码从而得到与所述时序信号对应的频域样本串,
其中N为正整数,将·设为实数,exp(·)为以纳皮尔数为底的指数函数,j为虚数单位,^H(0),^H(1),……,^H(N-1)是所述非平滑化频谱包络序列,p是2以上的整数,式(A2)是如下式:
Figure FDA0002493742070000032
7.一种编码方法,将时序信号在频域中进行编码,其中,包含:
频谱包络估计步骤,将η设为1,将与所述时序信号对应的频域样本串的绝对值的η次方视为功率谱而进行频谱包络的估计;以及
编码步骤,对与所述时序信号对应的频域样本串的各样本进行基于所述频谱包络的估计而改变比特分配或者实质上比特分配改变的编码。
8.如权利要求7所述的编码方法,其中,
所述频谱包络估计步骤包含:
线性预测分析步骤,使用伪相关函数信号串来进行线性预测分析而得到线性预测系数,其中所述伪相关函数信号串是使用所述频域样本串X(0),X(1),…,X(N-1)通过式(12)得到的;以及
非平滑化频谱包络序列生成步骤,通过得到非平滑化频谱包络序列从而进行所述频谱包络的估计,其中所述非平滑化频谱包络序列是使用所述线性预测系数^β1,^β2,…,^βp通过式(13)得到的,
其中N为正整数,将·设为实数,exp(·)为以纳皮尔数为底的指数函数,j为虚数单位,~X(0),~X(1),…,~X(N-1)是所述伪相关函数信号串,^H(0),^H(1),……,^H(N-1)是所述非平滑化频谱包络序列,p是2以上的整数,式(12)以及式(13)是如下式:
Figure FDA0002493742070000041
Figure FDA0002493742070000042
9.一种解码方法,通过频域中的解码而得到与时序信号对应的频域样本串,其中,包含:
线性预测系数解码步骤,对所输入的线性预测系数码进行解码而得到线性预测系数;
非平滑化频谱包络序列生成步骤,使用所述线性预测系数^β1,^β2,…,^βp通过式(13)得到非平滑化频谱包络序列;以及
解码步骤,按照基于所述非平滑化频谱包络序列而改变的比特分配或者实质上改变的比特分配,进行所输入的整数信号码的解码从而得到与所述时序信号对应的频域样本串,
其中N为正整数,将·设为实数,exp(·)为以纳皮尔数为底的指数函数,j为虚数单位,^H(0),^H(1),……,^H(N-1)是所述非平滑化频谱包络序列,p是2以上的整数,式(13)是如下式:
Figure FDA0002493742070000043
10.一种编码方法,将时序信号在频域中进行编码,其中,包含:
频谱包络估计步骤,将η设为非1且非2的规定的正数,将与所述时序信号对应的频域样本串的绝对值的η次方视为功率谱而进行频谱包络的估计;以及
编码步骤,对与所述时序信号对应的频域样本串的各样本进行基于所述频谱包络的估计而改变比特分配或者实质上比特分配改变的编码。
11.如权利要求10所述的编码方法,其中,
所述频谱包络估计步骤包含:
线性预测分析步骤,使用伪相关函数信号串来进行线性预测分析而得到线性预测系数,其中所述伪相关函数信号串是使用所述频域样本串X(0),X(1),…,X(N-1)通过式(A7)得到的;以及
非平滑化频谱包络序列生成步骤,通过得到非平滑化频谱包络序列从而进行所述频谱包络的估计,其中所述非平滑化频谱包络序列是使用所述线性预测系数^β1,^β2,…,^βp通过式(A2)得到的,
其中N为正整数,将·设为实数,exp(·)为以纳皮尔数为底的指数函数,j为虚数单位,~R(0),~R(1),…,~R(N-1)是所述伪相关函数信号串,^H(0),^H(1),……,^H(N-1)是所述非平滑化频谱包络序列,p是2以上的整数,式(A7)以及式(A2)是如下式:
Figure FDA0002493742070000051
Figure FDA0002493742070000052
12.一种解码方法,通过频域中的解码而得到与时序信号对应的频域样本串,其中,包含:
线性预测系数解码步骤,对所输入的线性预测系数码进行解码而得到线性预测系数;
非平滑化频谱包络序列生成步骤,将η设为非1且非2的规定的正数,使用所述线性预测系数^β1,^β2,…,^βp通过式(A2)得到非平滑化频谱包络序列;以及
解码步骤,按照基于所述非平滑化频谱包络序列而改变的比特分配或者实质上改变的比特分配,进行所输入的整数信号码的解码从而得到与所述时序信号对应的频域样本串,
其中N为正整数,将·设为实数,exp(·)为以纳皮尔数为底的指数函数,j为虚数单位,^H(0),^H(1),……,^H(N-1)是所述非平滑化频谱包络序列,p是2以上的整数,式(A2)是如下式:
Figure FDA0002493742070000061
13.一种计算机可读取的记录介质,
记录了用于使计算机作为权利要求1、2、4、5的任一项的编码装置或者权利要求3或6的解码装置的各单元而发挥作用的程序。
CN201580064256.1A 2014-11-27 2015-11-24 编码装置、解码装置、它们的方法及程序 Active CN107004422B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2014-239644 2014-11-27
JP2014239644 2014-11-27
JP2015017692 2015-01-30
JP2015-017692 2015-01-30
PCT/JP2015/082839 WO2016084764A1 (ja) 2014-11-27 2015-11-24 符号化装置、復号装置、これらの方法及びプログラム

Publications (2)

Publication Number Publication Date
CN107004422A CN107004422A (zh) 2017-08-01
CN107004422B true CN107004422B (zh) 2020-08-25

Family

ID=56074324

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580064256.1A Active CN107004422B (zh) 2014-11-27 2015-11-24 编码装置、解码装置、它们的方法及程序

Country Status (5)

Country Link
US (1) US9838700B2 (zh)
EP (1) EP3226243B1 (zh)
JP (1) JP6457552B2 (zh)
CN (1) CN107004422B (zh)
WO (1) WO2016084764A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3252758B1 (en) 2015-01-30 2020-03-18 Nippon Telegraph and Telephone Corporation Encoding apparatus, decoding apparatus, and methods, programs and recording media for encoding apparatus and decoding apparatus
EP3252768B1 (en) * 2015-01-30 2020-08-19 Nippon Telegraph and Telephone Corporation Parameter determination device, method, program, and recording medium
KR102061300B1 (ko) * 2015-04-13 2020-02-11 니폰 덴신 덴와 가부시끼가이샤 선형 예측 부호화 장치, 선형 예측 복호 장치, 이들의 방법, 프로그램 및 기록 매체
JP6766264B2 (ja) * 2017-06-22 2020-10-07 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法、およびプログラム
EP3761313B1 (en) * 2018-03-02 2023-01-18 Nippon Telegraph And Telephone Corporation Encoding device, encoding method, program, and recording medium

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1669075A (zh) * 2002-07-16 2005-09-14 皇家飞利浦电子股份有限公司 音频编码
KR100663379B1 (ko) * 2005-08-29 2007-01-02 주식회사 레인콤 멀티미디어용 휴대기기 오디오의 음질 향상 시스템 및 그향상 방법
CN101140759A (zh) * 2006-09-08 2008-03-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
CN101273404A (zh) * 2005-09-30 2008-09-24 松下电器产业株式会社 语音编码装置以及语音编码方法
CN101320565A (zh) * 2007-06-08 2008-12-10 华为技术有限公司 感知加权滤波方法及感知加权滤波器
CN101662288A (zh) * 2008-08-28 2010-03-03 华为技术有限公司 音频编码、解码方法及装置、系统
CN101958120A (zh) * 2009-07-17 2011-01-26 索尼公司 信号编码和解码设备及处理方法、信号处理系统、程序
CN102208188A (zh) * 2011-07-13 2011-10-05 华为技术有限公司 音频信号编解码方法和设备
KR20130025963A (ko) * 2010-07-19 2013-03-12 후아웨이 테크놀러지 컴퍼니 리미티드 대역폭 확장을 위한 스펙트럼 평탄도 제어

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2897742A1 (fr) * 2006-02-17 2007-08-24 France Telecom Codage/decodage perfectionnes de signaux numeriques, en particulier en quantification vectorielle avec codes a permutation
EP2234273B8 (en) * 2008-01-24 2013-08-07 Nippon Telegraph and Telephone Corporation Coding method, decoding method, apparatuses thereof, programs thereof, and recording medium
CN101572092B (zh) * 2008-04-30 2012-11-21 华为技术有限公司 编解码端的固定码本激励的搜索方法及装置
US9536534B2 (en) * 2011-04-20 2017-01-03 Panasonic Intellectual Property Corporation Of America Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof
WO2013142650A1 (en) * 2012-03-23 2013-09-26 Dolby International Ab Enabling sampling rate diversity in a voice communication system
ES2657039T3 (es) 2012-10-01 2018-03-01 Nippon Telegraph And Telephone Corporation Método de codificación, dispositivo de codificación, programa, y medio de grabación

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1669075A (zh) * 2002-07-16 2005-09-14 皇家飞利浦电子股份有限公司 音频编码
KR100663379B1 (ko) * 2005-08-29 2007-01-02 주식회사 레인콤 멀티미디어용 휴대기기 오디오의 음질 향상 시스템 및 그향상 방법
CN101273404A (zh) * 2005-09-30 2008-09-24 松下电器产业株式会社 语音编码装置以及语音编码方法
CN101140759A (zh) * 2006-09-08 2008-03-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
CN101320565A (zh) * 2007-06-08 2008-12-10 华为技术有限公司 感知加权滤波方法及感知加权滤波器
CN101662288A (zh) * 2008-08-28 2010-03-03 华为技术有限公司 音频编码、解码方法及装置、系统
CN101958120A (zh) * 2009-07-17 2011-01-26 索尼公司 信号编码和解码设备及处理方法、信号处理系统、程序
KR20130025963A (ko) * 2010-07-19 2013-03-12 후아웨이 테크놀러지 컴퍼니 리미티드 대역폭 확장을 위한 스펙트럼 평탄도 제어
CN102208188A (zh) * 2011-07-13 2011-10-05 华为技术有限公司 音频信号编解码方法和设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Golomb-Rice Coding Optimized via LPC for Frequency Domain Audio Coder;Ryosuke Sugiura等;《IEEE Global Conference on Signal and Information Processing(GlobalSIP)》;20141205;第1024-1028页 *

Also Published As

Publication number Publication date
EP3226243A4 (en) 2018-04-11
WO2016084764A1 (ja) 2016-06-02
US9838700B2 (en) 2017-12-05
US20170272766A1 (en) 2017-09-21
JP6457552B2 (ja) 2019-01-23
CN107004422A (zh) 2017-08-01
EP3226243A1 (en) 2017-10-04
EP3226243B1 (en) 2022-01-05
JPWO2016084764A1 (ja) 2017-10-05

Similar Documents

Publication Publication Date Title
JP6422813B2 (ja) 符号化装置、復号装置、これらの方法及びプログラム
CN107004422B (zh) 编码装置、解码装置、它们的方法及程序
JP6272619B2 (ja) オーディオ信号の符号化用エンコーダ、オーディオ伝送システムおよび補正値の判定方法
US20210312933A1 (en) Periodic-combined-envelope-sequence generation device, periodic-combined-envelope-sequence generation method, periodic-combined-envelope-sequence generation program and recording medium
JP6979048B2 (ja) 低複雑度の調性適応音声信号量子化
CN107408390B (zh) 线性预测编码装置、线性预测解码装置、它们的方法以及记录介质
JP2019032551A (ja) 符号化方法、符号化装置、プログラム、および記録媒体
CN107210042B (zh) 编码装置、编码方法以及记录介质
CN107430869B (zh) 参数决定装置、方法及记录介质
CN112820304A (zh) 解码装置、解码方法、解码程序、记录介质
JP5336942B2 (ja) 符号化方法、復号方法、符号化器、復号器、プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant