CN106796801B - 编码方法、装置、以及记录介质 - Google Patents
编码方法、装置、以及记录介质 Download PDFInfo
- Publication number
- CN106796801B CN106796801B CN201580041465.4A CN201580041465A CN106796801B CN 106796801 B CN106796801 B CN 106796801B CN 201580041465 A CN201580041465 A CN 201580041465A CN 106796801 B CN106796801 B CN 106796801B
- Authority
- CN
- China
- Prior art keywords
- encoding
- acoustic signal
- input acoustic
- encoding process
- current frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 508
- 230000003595 spectral effect Effects 0.000 claims description 72
- 238000001228 spectrum Methods 0.000 claims description 41
- 230000003044 adaptive effect Effects 0.000 description 17
- 238000013139 quantization Methods 0.000 description 17
- 238000010606 normalization Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000001131 transforming effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241000271566 Aves Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0016—Codebook for LPC parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Spectroscopy & Molecular Physics (AREA)
Abstract
目的在于提供一种编码技术,与输入音响信号的特性无关地高效地进行编码,且能够得到收听者感到不自然的情况较少的解码音响信号。一种编码方法,将输入音响信号按规定时间区间的帧的每个,通过在频域上的多个编码处理之中被决定的编码处理来进行编码,其中,决定部(380)在前一帧的输入音响信号的高频分量的能量的大小与当前帧的输入音响信号的高频分量的能量的大小的至少其中一个为规定的阈值以下的情况下,设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理。
Description
技术领域
本发明涉及音响信号的编码技术。尤其,涉及将音响信号变换为频域而进行编码的编码技术。
背景技术
在声音或音乐等音响信号的编码中,将输入音响信号在频域进行编码的方法正在被广泛使用。作为音响信号的频域上的编码方法,有例如非专利文献1或非专利文献2的方法。
在非专利文献1所记载的编码方法中,进行使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理。具体地,在非专利文献1所记载的编码方法中,对从输入音响信号中得到的能够变换为线性预测系数的系数进行编码从而得到线性预测系数码,通过能够变换为与线性预测系数码对应的量化后的线性预测系数的系数所对应的频谱包络系数列,编码对与输入音响信号对应的频域系数列进行正规化而得到的正规化系数列,从而得到正规化系数码。能够变换为线性预测系数的系数是指,线性预测系数其本身、PARCOR系数(偏自相关系数)或者LSP参数等。
在非专利文献2所记载的编码方法中,取得划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值的差分,进行伴随差分值可变长度编码的编码处理。具体地,在非专利文献2所记载的编码方法中,将与输入音响信号对应的频域系数列划分为越低频则采样数越少而越高频则采样数越多的频域,得到划分后的每个频域的平均能量,将该平均能量通过对数轴进行量化。对量化后的值、与将相邻的频域的平均能量同样通过对数轴进行量化后的值的差分进行可变长度编码。使用划分后的每个频域的通过对数轴量化后的平均能量,适应性地决定各频域系数的量化比特数或各频域系数的量化步长,从而对各频域系数进行量化,进而对其进行可变长度编码。
现有技术文献
非专利文献
非专利文献1:Anthony Vetro,“MPEG Unified Speech and Audio Coding”,Industry and Standards,IEEE MultiMedia,April-June,2013.
非专利文献2:M.Bosi and R.E.Goldberg,”Introduction to Digital AudioCoding and Standards”,Kluwer Academic Publishers,2003.
发明内容
发明要解决的课题
根据非专利文献2的编码方法,在输入音响信号的频谱包络的起伏不大的情况或频谱的集中度不高的情况下,通过对平均能量的差分进行可变长度编码从而能够减少平均能量码的码量,因此,能够高效地对输入音响信号进行编码。可是,在输入音响信号的频谱包络的起伏大的情况或频谱的集中度高的情况下,对平均能量的差分进行可变长度编码而得到的平均能量码的码量变多。
对此,根据非专利文献1的编码方法,通过能够变换为线性预测系数的系数,能够高效地对频谱包络进行编码,因此,在输入音响信号的频谱包络的起伏大的情况或频谱的集中度高的情况下,能够比非专利文献2的编码方法更高效地对输入音响信号进行编码。可是,在输入音响信号的频谱包络的起伏不大的情况或频谱的集中度不高的情况下,不能如非专利文献2的编码方法那样高效地进行编码。
如此,在以往的编码方法中,存在根据输入音响信号的特性而不能高效地进行编码的情况。
本发明的目的在于,提供一种编码方法、装置、程序以及记录介质,与输入音响信号的特性无关地,高效地进行编码,且能够得到收听者感到不自然的情况较少的解码音响信号。
用于解决课题的手段
本发明的一个方式的编码方法是,将输入音响信号按规定时间区间的帧的每个,通过在频域上的多个编码处理之中被决定的编码处理来进行编码的编码方法,所述编码方法包含:决定步骤,在前一帧的输入音响信号的高频分量的能量的大小和当前帧的输入音响信号的高频分量的能量的大小的至少其中一个为规定的阈值以下的情况下,设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理。
本发明的一个方式的编码方法是,将输入音响信号按规定时间区间的帧的每个,通过在频域上的多个编码处理之中被决定的编码处理来进行编码的编码方法,所述编码方法包含:决定步骤,在前一帧的输入音响信号的高频分量的能量的大小和当前帧的输入音响信号的高频分量的能量的大小的至少其中一个为规定的阈值以下的情况下,设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理,在并非如此的情况下,根据输入音响信号的高频分量为稀疏的状态,决定是设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理,还是将与前一帧相同的编码处理决定作为当前帧的编码处理。
本发明的一方式的编码方法是,将输入音响信号按规定时间区间的帧的每个,通过在频域上的多个编码处理之中被决定的编码处理来进行编码的编码方法,所述编码方法包含:第一编码步骤,使用基于能够变换为与输入音响信号对应的线性预测系数的系数的频谱包络,对与输入音响信号对应的频域的系数列进行编码;第二编码步骤,针对与输入音响信号对应的频域的系数列,伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码,进行编码;以及决定步骤,在当前帧的输入音响信号的频谱的起伏大的情况或者集中度高的情况下,设为能够决定将当前帧通过第一编码步骤来进行编码,在当前帧的输入音响信号的频谱的起伏小的情况或者集中度低的情况下,设为能够决定将当前帧通过第二编码步骤来进行编码。
发明效果
通过能够按每个帧选择在频域上进行编码的多个编码处理的其中一个的结构,从而能够得到收听者感到不自然的情况较少的解码音响信号。
附图说明
图1是示例了编码装置的结构的框图。
图2是示例了解码装置的结构的框图。
图3是表示编码方法的处理的流程的例的图。
图4是表示决定部380的处理的流程的例的图。
图5是表示适合编码处理判定部382的处理的流程的例的图。
图6是表示第二实施方式的切换决定部383的处理的流程的例的图。
图7是表示第三实施方式的适合编码处理判定部382的处理的流程的例的图。
图8是第一编码处理以及第二编码处理的概念图。
具体实施方式
[第一实施方式]
以下,说明本发明的第一实施方式。第一实施方式是如下的结构:在通过进行在频域上的编码处理的多个不同的编码处理的其中一个而对与每个帧的输入音响信号对应的频域的系数列进行编码的结构中,仅在输入音响信号或者/以及与输入音响信号对应的频域的系数列的高频分量的能量小的情况下,进行编码处理的切换。输入音响信号的高频分量的能量是指,输入音响信号的高频分量的能量的大小本身、或高频分量的能量在输入音响信号中占据的大小等。
<编码装置300>
编码装置300的结构在图1中示出。编码装置300具备:频域变换部110、决定部380、第一编码部101、第二编码部201。第一编码部101具备:例如,线性预测分析编码部120、频谱包络系数列生成部130、包络正规化部140、正规化系数编码部150。第二编码部201具备:例如,领域分割部220、平均对数能量差分可变长度编码部240、系数编码部250。在编码装置300中,以规定的时间区间即帧为单位,时域的声音音响数字信号(以下,设为输入音响信号。)被输入,按每个帧进行以下的处理。以下,设为当前的输入音响信号是第f个帧,对各部的具体处理进行说明。将第f个帧的输入音响信号设为xf(n)(n=1,...,Nt)。在此,Nt是每个帧的采样数。
以下,针对编码装置300的动作进行说明。通过编码装置300,执行在图3中示例的编码方法的各步骤的处理。
<频域变换部110>
频域变换部110将输入音响信号xf(n)(n=1,...,Nt)变换为频域的系数列、例如N点的MDCT系数列Xf(n)(n=1,...,N),并进行输出(步骤S110)。其中,N是在频域中的采样数,是正整数。向频域的变换也可以通过不是MDCT的公知的变换方法来进行。
此外,当在第一编码部101、第二编码部201、决定部380中通过多个精度或方法得到的频域的系数列为必须的情况下,在频域变换部110中,通过多个精度或方法得到频域的系数列即可。例如,在第一编码部101和第二编码部201将MDCT系数列作为频域的系数列来使用,且决定部380将功率谱(power spetrum)序列作为频域的系数列来使用的情况下,频域变换部110从输入音响信号中求出MDCT系数列和功率谱序列即可。此外,例如,在第一编码部101和第二编码部201将MDCT系数列作为频域的系数列来使用,且决定部380将每个频带的能量的序列作为频域的系数列来使用的情况下,频域变换部110从输入音响信号中求出MDCT系数列和每个频带的能量的序列即可。此外,例如,在第一编码部101和第二编码部201将MDCT系数列作为频域的系数列来使用,且决定部380的切换可否判定部381将每个频带的能量的序列作为频域的系数列来使用,且决定部380的适合编码处理判定部382将功率谱序列作为频域的系数列来使用的情况下,频域变换部110从输入音响信号中求出MDCT系数列和每个频带的能量的序列和功率谱序列即可。
<决定部380>
决定部380在前一帧的输入音响信号的高频分量的能量的大小、和当前帧的输入音响信号的高频分量的能量的大小的至少其中一个比规定的阈值小的情况下,能够将与前一帧不同的编码处理决定为当前帧的编码处理(步骤S380)。
换而言之,决定部380进行如下判定,进行切换控制以使根据该判定结果来对当前帧的频域的系数列进行编码,其中,所述判定是在至少输入音响信号的高频分量的能量小的情况下,允许通过与对前一帧的频域的系数列进行了编码的编码处理不同的编码处理来对当前帧的频域的系数列进行编码,在并非如此的情况下不允许通过与对前一帧的频域的系数列进行了编码的编码处理不同的编码处理来对当前帧的频域的系数列进行编码。
决定部380具备:例如,切换可否判定部381、适合编码处理判定部382、切换决定部383、切换部384。以下,针对决定部380的一例进行说明。决定部380进行在图4中示例的各步骤的处理。
<切换可否判定部381>
切换可否判定部381在前一帧的输入音响信号的高频分量的能量的大小、与当前帧的输入音响信号的高频分量的能量的大小的至少其中一个比规定的阈值小的情况下,判定为可切换、即能够通过与对前一帧的频域的系数列进行了编码的编码处理不同的编码处理来对当前帧的频域的系数列进行编码,在并非如此的情况下判定为不可切换、即不允许通过与对前一帧的频域的系数列进行了编码的编码处理不同的编码处理来对当前帧的频域的系数列进行编码,并输出判定结果(步骤S381)。
以下,对切换可否判定部381的动作的例进行说明。首先,说明作为输入音响信号的高频分量的能量的大小,使用MDCT系数列的高频的能量的例。
切换可否判定部381首先分别通过下述的式(1)求出前一帧的MDCT系数列Xf-1(n)(n=1,...,N)的高频的能量Ehf-1,通过下述的式(2)求出当前帧的MDCT系数列Xf(n)(n=1,...,N)的高频的能量Ehf(步骤S3811)。在式(1)和式(2)中,M是比N小的预先决定的正整数。
【数1】
切换可否判定部381接着在前一帧的高频的能量Ehf-1和当前帧的高频的能量Ehf的至少其中一个比预先决定的阈值TH1小的情况、即Ehf-1<TH1以及/或者Ehf<TH1的情况下判定为可切换,在并非如此的情况下判定为不可切换,输出切换可否的信息(步骤S3812)。
另外,在当前帧的步骤S3811中求出的前一帧的高频的能量Ehf-1与在前一帧的步骤S3811中求出的当前帧的高频的能量Ehf是相同的。因此,如果将计算出的高频的能量Ehf至少直到紧后的帧为止存储在切换可否判定部381内,则不需要计算前一帧的高频的能量Ehf-1。
接着,说明作为输入音响信号的高频分量的能量的大小,使用高频的能量相对于MDCT系数列的全部能量的比例的例。
切换可否判定部381首先分别通过下述的式(1A)来求出前一帧的高频的能量相对于MDCT系数列Xf-1(n)(n=1,...,N)的全部能量的比例Eh’f-1,通过下述的式(2A)来求出当前帧的高频的能量相对于MDCT系数列Xf(n)(n=1,...,N)的全部能量的比例Eh’f(步骤S3811)。在式(1A)和式(2A)中,M是预先决定的正整数。
【数2】
切换可否判定部381接着在前一帧的高频的能量相对于全部能量的比例Eh’f-1与当前帧的高频的能量相对于全部能量的比例Eh’f的至少其中一个比预先决定的阈值TH1小的情况、即Eh’f-1<TH1以及/或者Eh’f<TH1的情况下判定为可切换,在并非如此的情况下判定为不可切换,并输出切换可否的信息(步骤S3812)。
另外,在当前帧的步骤S3811中求出的前一帧的高频的能量相对于全部能量的比例Eh’f-1与在前一帧的步骤S3811中求出的当前帧的高频的能量相对于全部能量的比例Eh’f是相同的。因此,如果将计算出的高频的能量相对于全部能量的比例Eh’f至少直到紧后的帧为止存储在切换可否判定部381内,则不需要计算前一帧的高频的能量相对于全部能量的比例Eh’f-1。
另外,在上述的2个例中,在Ehf-1<TH1以及/或者Ehf<TH1的情况下判定为可切换,或者在Eh’f-1<TH1以及/或者Eh’f<TH1的情况下判定为可切换,在并非如此的情况下判定为不可切换,但是,也可以在Ehf-1<TH1且Ehf<TH1的情况下判定为可切换,或者也可以在Eh’f-1<TH1且Eh’f<TH1的情况下判定为可切换,在并非如此的情况下判定为不可切换。即,也可以在前一帧的输入音响信号的高频分量的能量的大小与当前帧的输入音响信号的高频分量的能量的大小的双方比规定的阈值小的情况下,判定为可切换、即能够通过与对前一帧的频域的系数列进行了编码的编码处理不同的编码处理来对当前帧的频域的系数列进行编码,在并非如此的情况下判定为不可切换、即不允许通过与对前一帧的频域的系数列进行了编码的编码处理不同的编码处理来对当前帧的频域的系数列进行编码。
此外,在上述的例中,使用MDCT系数列求出了高频的能量或高频的能量相对于全部能量的比例,但是,也可以使用功率谱序列或每个频带的能量的序列来求出高频的能量或高频的能量相对于全部能量的比例。
<适合编码处理判定部382>
适合编码处理判定部382判定与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理的哪一个,并输出判定结果(步骤S382)。
以下,说明适合编码处理判定部382的动作的一例。适合编码处理判定部382进行在图5中示例的各步骤的处理。在以下的例中,第一编码部101的编码处理是非专利文献1中示例的、使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理,第二编码部201的编码处理是非专利文献2中示例的、伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码的编码处理。
在该例中,在输入音响信号的频谱包络的起伏大或者/以及集中度高的情况下,判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理,在输入音响信号的频谱包络的起伏小或者/以及集中度低的情况下,判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理,并输出判定结果。
作为估计频谱的起伏或集中度的方法,可以采用任意的方法,在以下的例中,针对估计频谱或者该包络的谷的深度的结构进行说明。在该结构中,在频谱或者该包络的谷浅时被判定为频谱的起伏小且集中度低,在频谱或者该包络的谷深时被判定为频谱的起伏大且集中度高。频谱或者该包络的谷浅也可以说成是噪声基地(noise floor)高。此外,频谱或者该包络的谷深也可以说成是噪声基地低。
适合编码处理判定部382首先将当前帧的MDCT系数列Xf(n)(n=1,...,N)划分为每P采样的Q个部分系数列XSf(1)(n)(n=1,...,P),XSf(2)(n)(n=1,...,P),...,XSf(Q)(n)(n=1,...,P)(步骤S3821)。P以及Q是满足P×Q=N的关系的正整数。也可以P=1。此外,在此设为在适合编码处理判定部382中也使用在第一编码部101或者第二编码部201中成为编码处理的对象的频域的系数列即MDCT系数列Xf(n)(n=1,...,N)的结构,但是,也可以将通过与MDCT系数列Xf(n)(n=1,...,N)不同的精度或方法来变换为频域而得到的频域的系数列、例如功率谱序列,作为适合编码处理判定部382的处理的对象。
适合编码处理判定部382接着求出部分系数列XSf(1)(n)(n=1,...,P),XSf(2)(n)(n=1,...,P),...,XSf(Q)(n)(n=1,...,P)的每一个的功率的平均值或者其对数值的序列AVEXS(q)(q=1,...,Q)(步骤S3822)。功率的平均值是通过式(3)求出的AVEXS(q)。此外,功率的平均值的对数值是通过式(3A)求出的AVEXS(q)。
【数3】
适合编码处理判定部382接着针对功率的平均值或者功率的平均值的对数值的序列AVEXS(1),AVEXS(2),...,AVEXS(Q)的各元素,判定是否比相邻的2个元素之中的任一个都小,求出被判定的元素数(步骤S3823)。即,求出满足式(4)的q的个数Vally。
【数4】
AVEXS(q)-min(AVEXS(q-1),AVEXS(q+1))<0 (4)
适合编码处理判定部382接着求出与满足式(4)的q对应的Vally个AVEXS(q)的平均值EV、即谷的部分领域的平均值EV(步骤S3824)。在AVEXS(q)是功率的平均值的情况下,步骤S3824中求出的EV是谷的部分的部分领域的功率的平均值。在AVEXS(q)是功率的平均值的对数值的情况下,步骤S3824中求出的EV是部分领域的功率的平均值的对数值的谷的部分的平均值。此外,适合编码处理判定部382求出所有的部分领域的功率的平均值或者功率的平均值的对数值(步骤S3825)。所有的部分领域的功率的平均值是MDCT系数列Xf(n)(n=1,...,N)的功率的平均值,是通过式(11)求出的E。所有的部分领域的功率的平均值的对数值是MDCT系数列Xf(n)(n=1,...,N)的功率的平均值的对数值,是通过式(11A)求出的E。
【数5】
适合编码处理判定部382接着在所有的部分领域的AVEXS(q)的平均值E和谷的部分领域的AVEXS(q)的平均值EV之差为规定的阈值TH2以下的情况下,被估计为是频谱的谷浅、频谱包络的起伏少或者集中度低的频谱,所以,判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理。相反地,在所有的部分领域的AVEXS(q)的平均值E与谷的部分领域的AVEXS(q)的平均值EV之差比阈值TH2大的情况下,被估计为频谱的谷深、频谱包络的起伏大或者集中度高的频谱,所以,判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理。适合编码处理判定部382对哪个编码处理适合的信息进行输出(步骤S3826)。适合的编码处理的信息也称为适合信息。
此外,在步骤S3821中,也可以设为对每个部分系数列不同的采样数。例如,也可以将当前帧的MDCT系数列Xf(n)(n=1,...,N)划分为Q个部分系数列XSf(1)(n)(n=1,...,P1),XSf(2)(n)(n=1,...,P2),...,XSf(Q)(n)(n=1,...,PQ)。P1,P2,...,PQ是满足P1+P2+...+PQ=N的正整数。此外,优选为P1,P2,...,PQ满足P1≤P2≤...≤PQ。此外,Q是正整数。
<切换决定部383>
切换决定部383根据切换可否判定部381得到的切换可否的信息、和适合编码处理判定部382得到的哪个编码处理适合的信息,决定将当前帧的频域的系数列在第一编码部101中进行编码还是在第二编码部201中进行编码,并输出能够确定所决定的编码处理的码即切换码(步骤S383)。所输出的切换码被输入至解码装置400。在此,切换决定部383在为不可切换的情况下,不论当前帧适合的编码处理是哪个编码处理,都决定通过与前一帧相同的编码处理来对当前帧的频域的系数列进行编码。此外,在为可切换的情况下,不论前一帧的编码处理是哪个编码处理,都决定通过当前帧适合的编码处理来对当前帧的频域的系数列进行编码。其中,也可以包含如下情况:即使在为可切换的情况下,也决定为不是通过当前帧适合的编码处理,而是通过与前一帧相同的编码处理来对当前帧的频域的系数列进行编码。
以下,说明切换决定部383的动作的一例。在以下的例中,第一编码部101的编码处理是非专利文献1中示例的、使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理,第二编码部201的编码处理是非专利文献2中示例的、伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码的编码处理。
切换决定部383在切换可否判定部381得到的切换可否的信息表示不可切换的情况、以及/或者、适合编码处理判定部382得到的哪个编码处理适合的信息表示与前一帧的MDCT系数列Xf-1(n)(n=1,...,N)的编码处理相同的编码处理的情况下,将与前一帧的MDCT系数列Xf-1(n)(n=1,...,N)的编码处理相同的编码处理决定为当前帧的MDCT系数列Xf(n)(n=1,...,N)的编码处理。
即,在前一帧的MDCT系数列Xf-1(n)(n=1,...,N)在第一编码部101中被编码的情况、且切换可否判定部381得到的切换可否的信息表示不可切换的情况下,决定为当前帧的MDCT系数列Xf(n)(n=1,...,N)也在第一编码部101中进行编码。此外,在前一帧的MDCT系数列Xf-1(n)(n=1,...,N)在第一编码部101中被编码的情况、且适合编码处理判定部382得到的哪个编码处理适合的信息表示第一编码部101的编码处理的情况下,也决定为当前帧的MDCT系数列Xf(n)(n=1,...,N)也在第一编码部101中进行编码。
此外,在前一帧的MDCT系数列Xf-1(n)(n=1,...,N)在第二编码部201中被编码的情况、且切换可否判定部381得到的切换可否的信息表示不可切换的情况下,决定为当前帧的MDCT系数列Xf(n)(n=1,...,N)也在第二编码部201中进行编码。此外,在前一帧的MDCT系数列Xf-1(n)(n=1,...,N)在第二编码部201被编码的情况、且适合编码处理判定部382得到的哪个编码处理适合的信息表示第二编码部201的编码处理的情况下,也决定为当前帧的MDCT系数列Xf(n)(n=1,...,N)也在第二编码部201中进行编码。
在切换可否判定部381得到的切换可否的信息表示可切换的情况、且适合编码处理判定部382得到的哪个编码处理适合的信息表示与前一帧的MDCT系数列Xf-1(n)(n=1,...,N)的编码处理不同的编码处理的情况下,将与前一帧的MDCT系数列Xf-1(n)(n=1,...,N)的编码处理不同的编码处理决定为当前帧的MDCT系数列Xf(n)(n=1,...,N)的编码处理。即,在前一帧的MDCT系数列Xf-1(n)(n=1,...,N)在第一编码部101中被编码的情况、且切换可否判定部381得到的切换可否的信息表示可切换,适合编码处理判定部382得到的哪个编码处理适合的信息表示第二编码部201的编码处理的情况下,决定为当前帧的MDCT系数列Xf(n)(n=1,...,N)在第二编码部201中进行编码。此外,在前一帧的MDCT系数列Xf-1(n)(n=1,...,N)在第二编码部201中被编码的情况、且切换可否判定部381得到的切换可否的信息表示可切换,适合编码处理判定部382得到的哪个编码处理适合的信息表示第一编码部101的编码处理的情况下,决定为当前帧的MDCT系数列Xf(n)(n=1,...,N)在第一编码部101中进行编码。
<切换部384>
切换部384进行控制以使将频域变换部110输出的MDCT系数列Xf(n)(n=1,...,N)输入至第一编码部101或者第二编码部201,使得通过在切换决定部383中决定的编码处理对当前帧的MDCT系数列Xf(n)(n=1,...,N)进行编码(步骤S384)。此外,在为了当前帧的MDCT系数列Xf(n)(n=1,...,N)的编码,当前帧的输入音响信号xf(n)(n=1,...,Nt)也是必须的情况下,将当前帧的输入音响信号xf(n)(n=1,...,Nt)也输入至第一编码部101或者/以及第二编码部201。
例如,在第一编码部101的编码处理是非专利文献1中示例的、使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理,且第二编码部201的编码处理是非专利文献2中示例的、伴随着划分后的每个频域的系数的平均能量与相邻的频域的平均能量之差分的可变长度编码的编码处理的情况下,由于仅在第一编码部101中当前帧的输入音响信号xf(n)(n=1,...,Nt)成为必须,因此,在将MDCT系数列Xf(n)(n=1,...,N)输入至第一编码部101的情况下将当前帧的输入音响信号xf(n)(n=1,...,Nt)也输入至第一编码部101。
<第一编码部101、第二编码部201>
第一编码部101和第二编码部201都进行将频域的系数列编码的编码处理,但是,进行的编码处理相互不同。即,第一编码部101通过与第二编码部201不同的编码处理来对当前帧的频域的系数列进行编码,输出作为所得到的码的第一码(步骤S101)。此外,第二编码部201通过与第一编码部101不同的编码处理来对当前帧的频域的系数列进行编码,输出作为所得到的码的第二码(步骤S201)。例如,第一编码部101进行使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理,第二编码部201进行使用了划分后的每个频域的系数的平均能量的编码处理。
以下,说明第一编码部101和第二编码部201的动作的一例。在以下的例中,第一编码部101的编码处理是非专利文献1中示例的、使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理,第二编码部201的编码处理是非专利文献2中示例的、伴随着划分后的每个频域的系数的平均能量与相邻的频域的平均能量之差分的可变长度编码的编码处理。
在该例中,第一编码部101的第一编码处理是如图8的左边示例那样通过能够变换为线性预测系数的系数来表现频域的频谱包络形状的处理。另一方面,第二编码部201的第二编码处理是如图8的右边示例那样通过比例因子带(scale factor band;频域系数列的向多个领域的划分)来表现包络形状的处理。根据第二编码处理,由于使用各领域的平均的高度的差分值的可变长度编码,因此,在平均值平滑变化的情况下,也可以说效率非常好。
基于决定部380的决定或者选择的结果,进行作为在频域中的多个编码处理的第一编码部101的处理以及第二编码部201的处理之中的一个。
<第一编码部101>
第一编码部101具备:线性预测分析编码部120、频谱包络系数列生成部130、包络正规化部140、正规化系数编码部150。在第一编码部101中,输入当前帧的MDCT系数列Xf(n)(n=1,...,N)和输入音响信号x f(n)(n=1,...,Nt),输出包含线性预测系数码CLf和正规化系数码CNf的第一码。所输出的第一码被输入至解码装置400。另外,第一编码部101是从非专利文献1所记载的编码处理中除去了将输入音响信号变换为频域的系数列的部分的部件。即,在频域变换部110和第一编码部101中进行的编码处理与非专利文献1所记载的编码处理是同样的。
<线性预测分析编码部120>
线性预测分析编码部120对输入音响信号xf(n)(n=1,...,Nt)进行线性预测分析而求出能够变换为线性预测系数的系数,对能够变换为线性预测系数的系数进行编码,得到线性预测系数码CLf、和能够变换为与线性预测系数码CLf对应的量化后的线性预测系数的系数,并输出(步骤S120)。能够变换为线性预测系数的系数是指,线性预测系数其本身、PARCOR系数(偏自相关系数)或者LSP参数等。
<频谱包络系数列生成部130>
频谱包络系数列生成部130得到与线性预测分析编码部120得到的能够变换为量化后的线性预测系数的系数对应的功率谱包络系数列Wf(n)(n=1,...,N),并输出(步骤S130)。
<包络正规化部140>
包络正规化部140使用频谱包络系数列生成部130得到的功率谱包络系数列Wf(n)(n=1,...,N),对频域变换部110得到的MDCT系数列的各系数Xf(n)(n=1,...,N)进行正规化,对正规化MDCT系数列XNf(n)(n=1,...,N)进行输出(步骤S140)。即,求出将MDCT系数列Xf(n)(n=1,...,N)的各系数除以功率谱包络系数列Wf(n)(n=1,...,N)中包含的对应的系数后的值的序列,作为正规化MDCT系数列XNf(n)(n=1,...,N)。
<正规化系数编码部150>
正规化系数编码部150对包络正规化部140得到的正规化MDCT系数列XNf(n)(n=1,...,N)进行编码而得到正规化系数码CNf(步骤S150)。
<第二编码部201>
此外,第二编码部201具备:领域分割部220、平均对数能量差分可变长度编码部240、系数编码部250。在第二编码部201中,输入当前帧的MDCT系数列Xf(n)(n=1,...,N),输出包含平均能量码CAf和系数码CDf的第二码。所输出的第二码被输入至解码装置400。另外,第二编码部201是从非专利文献2所记载的编码处理中除去了将输入音响信号变换为频域的系数列的部分的部件。即,在频域变换部110和第二编码部201中进行的编码处理与非专利文献2所记载的编码处理是同样的。
<领域分割部220>
领域分割部220将频域变换部110得到的MDCT系数列Xf(n)(n=1,...,N)划分为越低频的部分领域则采样数越少而越高频的部分领域则采样数越多的多个部分领域(步骤S220)。若将部分领域的个数设为R,将各部分领域中包含的采样数设为S1,...,SR,则MDCT系数列的各系数Xf(n)(n=1,...,N)从最低频的采样起依次按各部分领域划分为XBf(1)(n)(n=1,...,S1),XBf(2)(n)(n=1,...,S2),...,XBf(R)(n)(n=1,...,SR)。R以及S1,...,SR是正整数。S1,...,SR设为满足S1≤S2≤...≤SR的关系。将XBf(1)(n)(n=1,...,S1),XBf(2)(n)(n=1,...,S2),...,XBf(R)(n)(n=1,...,SR)称作部分领域系数列。
<平均对数能量差分可变长度编码部240>
平均对数能量差分可变长度编码部240针对领域分割部220得到的各部分领域,求出部分领域中包含的系数的平均能量,针对部分领域的平均能量分别在对数轴上进行量化,对与相邻的部分领域的平均能量的对数轴上的量化值之差进行可变长度编码,得到平均能量码CAf(步骤S240)。
平均对数能量差分可变长度编码部240首先通过式(5)而求出各部分领域r(r=1,...,R)的平均能量EXB(r)(r=1,...,R)(步骤S2401)。
【数6】
平均对数能量差分可变长度编码部240接着针对各部分领域,进行平均能量EXB(r)(r=1,...,R)的对数领域上的标量量化(scalar quantization),得到平均能量的对数领域上的量化值Q(log(EXB(r)))(r=1,...,R)(步骤S2402)。平均对数能量差分可变长度编码部240接着针对各部分领域,求出平均能量的对数领域上的量化值Q(log(EXB(r)))、与相邻的部分领域中包含的系数的平均能量的对数领域上的量化值Q(log(EXB(r-1)))之差DiffEXB(r)(步骤S2403)。其中,在r=1的情况下,将平均能量EXB(1)的对数值的标量量化值Q(log(EXB(r)))其本身设为DiffEXB(1)。将DiffEXB(r)(r=1,...,R)称作平均对数能量差分。即,DiffEXB(r)(r=1,...,R)通过式(6)而求出。其中,将Q()设为标量量化函数,设为如下的函数:输出对将输入以预先决定的值进行正规化(除法运算)所得的值的小数部分进行四舍五入而得到的整数值。
【数7】
平均对数能量差分可变长度编码部240接着对平均对数能量差分DiffEXB(r)(r=1,...,R)进行可变长度编码而得到平均能量码CAf(步骤S2404)。另外,由于平均对数能量差分DiffEXB(r)的绝对值小的情况统计学上的出现频度更高,因此,可变长度码被预先决定为与绝对值大的情况相比码量变少。即,在平均对数能量的每个领域的变动小的情况下,即频谱包络的起伏小的情况、频谱包络的集中度低的情况下,存在能够缩短平均能量码CAf的码的长度的趋势。
<系数编码部250>
系数编码部250使用平均对数能量差分可变长度编码部240得到的平均能量的对数领域上的量化值Q(log(EXB(r))(r=1,...,R),对领域分割部220得到的部分领域系数列XBf(1)(n)(n=1,...,S1),XBf(2)(n)(n=1,...,S2),...,XBf(R)(n)(n=1,...,SR)的各系数进行例如标量量化,得到系数码CDf(步骤S250)。在该标量量化中使用的量化步长(stepwidth)或量化比特数是对领域分割部220得到的部分领域系数列XBf(1)(n)(n=1,...,S1),XBf(2)(n)(n=1,...,S2),...,XBf(R)(n)(n=1,...,SR)的每一个,根据平均能量的量化值Q(EXB(r))(r=1,...,R)而决定的。另外,平均能量的量化值Q(EXB(r))(r=1,...,R)是将平均能量的对数领域上的量化值Q(log(EXB(r))(r=1,...,R)通过式(7)设为线性领域的值从而求出的。
【数8】
系数编码部250首先考虑与各领域对应的平均能量的对数领域上的量化值Q(log(EXB(r))(r=1,...,R)、和该值与通过频率估计的听觉上不能识别的频谱等级的能量的对数值之差的值,将作为系数码CDf的码量而给定的比特数分配给各部分领域系数列的各系数(步骤S2501)。
系数编码部250接着根据各部分领域的平均能量的量化值Q(EXB(r))(r=1,...,R)和所分配的比特数,求出各部分领域系数列的各系数的标量量化的步长(步骤S2502)。
系数编码部250接着将各部分领域系数列的各系数以所决定的步长和比特数进行量化,进而对量化后的各系数的整数值进行可变长度编码,得到系数码CDf(步骤S2503)。
<解码装置400>
在图2中示出解码装置400的结构。解码装置400具备:切换部480、第一解码部401以及第二解码部501。第一解码部401具备:例如,线性预测解码部420、频谱包络系数列生成部430、正规化系数解码部450以及包络逆正规化部440。第二解码部501具备:例如,平均对数能量差分可变长度解码部540以及系数解码部550。在解码装置400中,以作为规定的时间区间的帧为单位,输入包含切换码和输入码的码。在是由第一编码部101编码后的帧的情况下,输入码包含线性预测系数码CLf和正规化系数码CNf,在是由第二编码部201编码后的帧的情况下,输入码包含平均能量码CAf和系数码CDf。以下,设为成为当前处理的对象的帧是第f个帧,对各部的具体处理进行说明。
以下,说明解码装置400的动作。
<切换部480>
切换部480根据所输入的切换码,决定将当前帧的输入码在第一解码部401中进行解码还是在第二解码部501中进行解码,进行控制以使将输入码输入至第一解码部401或者第二解码部501,使得能够进行所决定的解码处理(步骤S480)。
具体地,切换部480在所输入的切换码是用于确定第一编码部101的编码处理的码、即用于确定使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理的码的情况下,进行控制以使将输入码输入至进行与第一编码部101的编码处理对应的解码处理的第一解码部401。此外,在所输入的切换码是用于确定第二编码部201的编码处理的码、即用于确定伴随着划分后的每个频域的系数的平均能量与相邻的频域的平均能量之差分的可变长度编码的编码处理的码的情况下,进行控制以使将输入码输入至进行与第二编码部201的编码处理对应的解码处理的第二解码部501。
<第一解码部401>
第一解码部401具备:线性预测解码部420、频谱包络系数列生成部430、正规化系数解码部450、包络逆正规化部440。在第一解码部401中,输入当前帧的线性预测系数码CLf和正规化系数码CNf,输出频域的系数列Xf(n)(n=1,...,N)。
<线性预测解码部420>
线性预测解码部420对输入码中包含的线性预测系数码CLf进行解码,得到能够变换为解码后的线性预测系数的系数。能够变换为解码后的线性预测系数的系数与编码装置300的线性预测分析编码部120得到的能够变换为量化后的线性预测系数的系数是相同的。此外,线性预测解码部420进行的解码处理是与编码装置300的线性预测分析编码部120进行的编码处理对应的处理。另外,能够变换为线性预测系数的系数是指,线性预测系数其本身、PARCOR系数(偏自相关系数)或者LSP参数等。
<频谱包络系数列生成部430>
频谱包络系数列生成部430得到与线性预测解码部420得到的能够变换为解码后的线性预测系数的系数对应的功率谱包络系数列Wf(n)(n=1,...,N),并输出。其中,N是频域中的采样数,且是正整数。
<正规化系数解码部450>
正规化系数解码部450对所输入的正规化系数码CNf进行解码,得到解码正规化MDCT系数列^XNf(n)(n=1,...,N)(步骤S450)。在此,正规化系数解码部450进行的解码处理是与编码装置300的正规化系数编码部150进行的编码处理对应的处理。即,当在编码装置300中进行了向不是MDCT的频域的变换处理的情况下,^XNf(n)(n=1,...,N)是与编码装置300的向频域的变换处理对应的不是MDCT的域的频域的系数列。另外,解码正规化MDCT系数列^XNf(n)(n=1,...,N)对应于输入至编码装置300的正规化系数编码部150的正规化MDCT系数列XNf(n)(n=1,...,N),由于各自的系数中包含量化误差,因此,设为对XNf(n)附加了“^”的^XNf(n)。
<包络逆正规化部440>
包络逆正规化部440使用频谱包络系数列生成部430得到的功率谱包络系数列Wf(n)(n=1,...,N),对正规化系数解码部450得到的解码正规化MDCT系数列的各系数^XNf(n)(n=1,...,N)进行逆正规化,并输出解码MDCT系数列^XNf(n)(n=1,...,N)(步骤S440)。即,求出将解码正规化MDCT系数列XNf(n)(n=1,...,N)的各系数与功率谱包络系数列Wf(n)(n=1,...,N)的各系数对应的系数之间进行乘法运算而得到的值的序列,作为解码MDCT系数列^Xf(n)(n=1,...,N)。
<第二解码部501>
第二解码部501具备:平均对数能量差分可变长度解码部540、系数解码部550。在第二解码部501中,输入当前帧的平均能量码CAf和系数码CDf,输出频域的系数列Xf(n)(n=1,...,N)。
<平均对数能量差分可变长度解码部540>
平均对数能量差分可变长度解码部540对所输入的平均能量码CAf进行解码,得到部分领域的解码平均能量Q(EXB(r))(r=1,...,R)(步骤S540)。另外,解码平均能量由于与在编码装置300的系数编码部250中得到的平均能量的量化值是相同的,因此,使用了相同的记号Q(EXB(r))。
平均对数能量差分可变长度解码部540首先对平均能量码CAf进行解码,得到各部分领域的对数领域上的能量的差DiffEXB(r)(r=1,...,R)(步骤S5401)。在此,平均对数能量差分可变长度解码部540进行的解码处理是与编码装置300的平均对数能量差分可变长度编码部240进行的编码处理对应的处理。另外,各部分领域的对数领域上的能量的差由于与在编码装置300的平均对数能量差分可变长度编码部240中得到的各部分领域的对数领域上的能量的差是相同的,因此,使用了相同的记号DiffEXB(r)。
平均对数能量差分可变长度解码部540接着对每个部分领域,将对数领域上的能量的差DiffEXB(r)(r=1,...,R)加上相邻的部分领域的平均能量的对数领域上的解码值Q(log(EXB(r-1))),得到平均能量的对数领域上的解码值Q(log(EXB(r))(步骤S5402)。另外,平均能量的对数领域上的解码值由于与在编码装置300的平均对数能量差分可变长度编码部240中得到的平均能量的对数领域上的量化值是相同的,因此,使用了相同的记号Q(log(EXB(r))。
【数9】
平均对数能量差分可变长度解码部540接着得到将平均能量的对数领域上的解码值Q(log(EXB(r-1)))(r=1,...,R)设为线性领域的值后的值,作为解码平均能量Q(EXB(r))(r=1,...,R)(步骤S5403)。
<系数解码部550>
系数解码部550使用在平均对数能量差分可变长度解码部540中得到的解码平均能量Q(EXB(r))(r=1,...,R),对系数码CDf进行解码从而得到解码系数列^Xf(n)(n=1,...,N)(步骤S550)。在此,系数解码部550进行的解码处理是与编码装置300的系数编码部250进行的编码处理对应的处理。所输入的系数码CDf是在编码装置300的系数编码部250中对各部分领域系数列的各系数进行可变长度编码而得到的,因此,与系数码CDf之中的各系数对应的码部分的码长度能够自动复原。此外,根据在平均对数能量差分可变长度解码部540中得到的解码平均能量Q(EXB(r)),求出各领域的量化步长。基于此,能够根据系数码CDf而得到频域的解码MDCT系数列^Xf(n)(n=1,...,N)。
<时域变换部410>
时域变换部410将N点的解码MDCT系数列^Xf(n)(n=1,...,N)变换到时域,得到解码音响信号^xf(n)(n=1,...,Nt),并进行输出(步骤S410)。其中,Nt是时域上的采样数,且是正整数。当在编码装置300的频域变换部110进行了向不是MDCT的频域的变换的情况下,进行与该变换处理对应的向时域的变换处理即可。
根据第一实施方式,由于仅在输入音响信号的高频的能量小的情况下能够进行编码处理以及解码处理的切换,因此,即使在安装了高频分量的量化特性不同的多个编码处理以及解码处理的情况下,也能够得到收听者感到不自然的情况较少的解码音响信号。
根据第一实施方式,此外,不实际尝试进行编码,就能够选择在使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理和使用了划分后的每个频域的系数的平均能量的编码处理之中适合于输入音响信号的编码处理,因此,能够通过较少的演算处理量来进行适合于输入音响信号的编码处理。
根据第一实施方式,进而,能够从使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理和使用了划分后的每个频域的系数的平均能量的编码处理之中选择编码处理并进行编码,因此,无论是输入音响信号的频谱的起伏大的情况或者集中度高的情况下还是并非如此的情况下,都能够与输入音响信号的特性无关地进行高效率的编码处理。
[第二实施方式]
在第一实施方式中,在输入音响信号的高频分量的能量的大小较大的情况下必定通过与前一帧的编码处理相同的编码处理来对当前帧的频域的系数列进行编码,但是,在第二实施方式中,即使在输入音响信号的高频分量的能量的大小较大的情况下,也在输入音响信号的高频分量为稀疏的状态下,允许通过与前一帧的编码处理不同的编码处理来对当前帧的频域的系数列进行编码。
第二实施方式的编码装置在输入音响信号的高频分量的能量小的情况下,能够将与前一帧不同的编码处理决定为当前帧的编码处理,在并非如此的情况下,根据输入音响信号的高频分量为稀疏的状态,决定是能够将与前一帧不同的编码处理决定为当前帧的编码处理,还是将与前一帧相同的编码处理决定为当前帧的编码处理。
第二实施方式的编码装置的结构是与第一实施方式相同的图1。在第二实施方式的编码装置300中,除了决定部380内的切换可否判定部381和切换决定部383的处理不同的部分以外,与第一实施方式的编码装置300是相同的。第二实施方式的解码装置的结构是与第一实施方式相同的图2,各部的处理与第一实施方式的解码装置也是相同的。以下,说明进行与第一实施方式的编码装置300不同的处理的决定部380内的切换可否判定部381和切换决定部383。
<切换可否判定部381>
切换可否判定部381在前一帧的输入音响信号的高频分量的能量的大小、和当前帧的输入音响信号的高频分量的能量的大小的至少其中一个比规定的阈值小的情况下,判定为可切换、即设为能够通过与对前一帧的频域的系数列进行编码的编码处理不同的编码处理来对当前帧的频域的系数列进行编码,并输出判定结果(步骤S381)。在上述以外的情况下,即没有判定为可切换也没有判定为不可切换,将表示没有判定为任一个的信息作为判定结果进行输出,或者不输出判定结果。作为输入音响信号的高频分量的能量的大小,也可以使用高频的能量,也可以使用高频的能量相对于全部能量的比例,这与第一实施方式是同样的。
<切换决定部383>
切换决定部383根据切换可否判定部381得到的切换可否的信息、适合编码处理判定部382得到的哪个编码处理适合的信息、从输入音响信号求出的输入音响信号的高频分量是否稀疏的状态,决定将当前帧的频域的系数列在第一编码部101中进行编码还是在第二编码部201中进行编码,输出能够确定所决定的编码处理的码即切换码(步骤S383B)。所输出的切换码被输入至解码装置400。
在切换可否判定部381得到的切换可否的信息为可切换的情况下,即在输入音响信号的高频分量的能量小的情况下,切换决定部383进行与第一实施方式的切换决定部383相同的处理。在切换可否判定部381得到的切换可否的信息表示没有判定为任一个的情况下、或者没有对切换可否判定部381输入判定结果的情况下,即输入音响信号的高频分量的能量大的情况下,基于从输入音响信号求出的输入音响信号的高频分量是否稀疏的状态,决定是否允许通过与前一帧的编码处理不同的编码处理来对当前帧的频域的系数列进行编码。
以下,说明切换决定部383的动作之中与第一实施方式的切换决定部383不同的部分、即输入音响信号的高频分量的能量大的情况下的切换决定部383的动作的一例。在以下的例中,与第一实施方式同样地,第一编码部101的编码处理是非专利文献1中示例的、使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理,第二编码部201的编码处理是非专利文献2中示例的、伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码的编码处理。切换决定部383进行例如图6的步骤S3831B至S3836B的处理。
切换决定部383首先将当前帧的MDCT系数列Xf(n)(n=1,...,N)划分为每P采样的Q个部分系数列XSf(1)(n)(n=1,...,P),XSf(2)(n)(n=1,...,P),...,XSf(Q)(n)(n=1,...,P)(步骤S3831B)。P以及Q是满足P×Q=N的关系的正整数。也可以P=1。此外,在此设为在切换决定部383中也使用在第一编码部101或者第二编码部201中成为编码处理的对象的频域的系数列即MDCT系数列Xf(n)(n=1,...,N)的结构,但是,也可以将通过与MDCT系数列Xf(n)(n=1,...,N)不同的精度或方法变换至频域而得到的频域的系数列、例如功率谱序列,作为切换决定部383的处理的对象。
切换决定部383接着求出部分系数列XSf(1)(n)(n=1,...,P),XSf(2)(n)(n=1,...,P),...,XSf(Q)(n)(n=1,...,P)的每一个的功率的平均值的对数值的序列AVEXS(q)(q=1,...,Q)(步骤S3832B)。每个部分系数列的功率的平均值的对数值是通过式(3A)求出的AVEXS(q)。
切换决定部383还求出MDCT系数列Xf(n)(n=1,...,N)的功率的平均值的对数值(步骤S3833B)。MDCT系数列的功率的平均值的对数值是通过式(9)求出的AVETotal。
【数10】
切换决定部383接着求出q在预先设定的QLow(其中,1<QLow)至QHigh(其中,QLow≤QHigh≤Q)的范围内、即位于预先决定的高频侧的1个或多个部分领域的范围内满足式(10)的AVEXS(q)的个数、即峰(peak)的领域的个数(步骤S3834B)。M以及λ是正的常数。
【数11】
AVEXS(q)≥μ·AVETotal+λ (10)
切换决定部383接着在峰的领域的个数为阈值TH3以下的情况下,判定为当前帧的输入音响信号的高频分量稀疏,在峰的领域的个数超过阈值TH3的情况下,判定为当前帧的输入音响信号的高频分量不稀疏(步骤S3835B)。在此,阈值TH3是根据预先决定的规则而决定的值,使得在与当前帧相近的过去的帧的输入音响信号的高频分量稀疏的情况下成为比与当前帧相近的过去的帧的输入音响信号的高频分量不稀疏的情况更大的值。例如,在与当前帧相近的过去的帧的输入音响信号的高频分量稀疏的情况下将预先决定的TH3_1设为阈值TH3,在与当前帧相近的过去的帧的输入音响信号的高频分量不稀疏的情况下将比TH3_1更小的值的预先决定的TH3_2设为阈值TH3。在此,与当前帧相近的过去的帧是指,例如前一帧或2帧前的帧等。当前帧的输入音响信号的高频分量是否稀疏的判定结果直到至少2帧后为止存储在切换决定部383内。
切换决定部383接着基于前一帧的编码处理、和针对当前帧以及与当前帧相近的过去的帧的输入音响信号的高频分量是否稀疏的判定结果,决定将当前帧的频域的系数列在第一编码部101和第二编码部201的哪一个中进行编码(步骤S3836B)。即,决定是否允许通过与前一帧的编码处理不同的编码处理来对当前帧的频域的系数列进行编码。
例如,切换决定部383针对之前的帧的MDCT系数列Xf-1(n)(n=1,...,N)在第一编码部101中被编码的情况,在当前帧的高频分量不稀疏、且前一帧和2帧前的帧的至少其中一个中高频分量稀疏的情况下,能够决定将当前帧的MDCT系数列Xf(n)(n=1,...,N)在第二编码部201中进行编码,在除此之外的情况下,决定将当前帧的MDCT系数列Xf(n)(n=1,...,N)在第一编码部101中进行编码。即,切换决定部383针对之前的帧的MDCT系数列Xf-1(n)(n=1,...,N)在第一编码部101中被编码的情况,在当前帧的高频分量不稀疏、且前一帧和2帧前的帧的至少其中一个中高频分量稀疏的情况下,允许通过与前一帧的编码处理不同的编码处理来对当前帧的频域的系数列进行编码,在除此之外的情况下,不允许通过与前一帧的编码处理的不同的编码处理来对当前帧的频域的系数列进行编码。
此外,切换决定部383针对之前的帧的MDCT系数列Xf-1(n)(n=1,...,N)在第二编码部201中被编码的情况,在(1)当前帧的高频分量稀疏且前一帧的高频分量不稀疏的情况下、或者(2)当前帧的高频分量稀疏且前一帧的高频分量稀疏且2帧前的帧的高频分量不稀疏的情况下,能够决定将当前帧的MDCT系数列Xf(n)(n=1,...,N)在第一编码部101中进行编码,在除此之外的情况下,决定将当前帧的MDCT系数列Xf(n)(n=1,...,N)在第二编码部201中进行编码。即,切换决定部383针对之前的帧的MDCT系数列Xf-1(n)(n=1,...,N)在第二编码部201中被编码的情况,在(1)当前帧的高频分量稀疏且前一帧的高频分量不稀疏的情况下、或者(2)当前帧的高频分量稀疏且前一帧的高频分量稀疏且2帧前的帧的高频分量不稀疏的情况下,允许通过与前一帧的编码处理不同的编码处理来对当前帧的频域的系数列进行编码,在除此之外的情况下,不允许通过与前一帧的编码处理不同的编码处理来对当前帧的频域的系数列进行编码。
另外,切换决定部383在允许了通过与前一帧的编码处理不同的编码处理来对当前帧的频域的系数列进行编码的情况下,基于适合编码处理判定部382得到的哪个编码处理适合的信息,决定当前帧的频域的系数列的编码处理。例如,切换决定部383在允许了通过与前一帧的编码处理不同的编码处理来对当前帧的频域的系数列进行编码的情况下,即使在前一帧的MDCT系数列Xf-1(n)(n=1,...,N)在第二编码部201中被编码的情况下,在适合编码处理判定部382得到的哪个编码处理适合的信息表示第一编码部101的编码处理的情况下,也决定为将当前帧的MDCT系数列Xf(n)(n=1,...,N)在第一编码部101中进行编码。此外,切换决定部383在允许了通过与前一帧的编码处理不同的编码处理来对当前帧的频域的系数列进行编码的情况下,即使在前一帧的MDCT系数列Xf-1(n)(n=1,...,N)在第一编码部101中被编码的情况下,在适合编码处理判定部382得到的哪个编码处理适合的信息表示第二编码部201的编码处理的情况下,也决定为将当前帧的MDCT系数列Xf(n)(n=1,...,N)在第二编码部201中进行编码。
另外,切换决定部383在即使允许了通过与前一帧的编码处理不同的编码处理来对当前帧的频域的系数列进行编码的情况下,在根据编码装置300中未图示的部件得到的其他的信息已判定为应该通过与前一帧的编码处理相同的编码处理来对当前帧的频域的系数列进行编码的情况下,也可以通过与前一帧的编码处理相同的编码处理来对与当前帧的输入音响信号对应的频域的系数列进行编码。
此外,在步骤S3831B中也可以设为对每个部分系数列不同的采样数。例如,也可以将当前帧的MDCT系数列Xf(n)(n=1,...,N)划分为Q个部分系数列XSf(1)(n)(n=1,...,P1),XSf(2)(n)(n=1,...,P2),...,XSf(Q)(n)(n=1,...,PQ)。P1,P2,...,PQ是满足P1+P2+...+PQ=N的正整数。此外,优选为P1,P2,...,PQ满足P1≤P2≤...≤PQ。此外,Q是正整数。
此外,在适合编码处理判定部382进行了与步骤S3831B或步骤S3832B或步骤S3833B的处理相同的处理的情况下,切换决定部383也可以使用由适合编码处理判定部382进行的处理结果,而不进行步骤S3831B或步骤S3832B或步骤S3833B。
[第三实施方式]
在第一实施方式以及第二实施方式中使用1个阈值来判定当前帧适合的编码处理,但是,第三实施方式进行使用了2个阈值的判定。
第三实施方式的编码装置的结构是与第一实施方式相同的图1。第三实施方式的编码装置300除了决定部380内的适合编码处理判定部382和切换决定部383的处理不同的部分以外,与第一实施方式或者第二实施方式的编码装置300是相同的。第三实施方式的解码装置的结构是与第一实施方式相同的图2,各部的处理与第一实施方式的解码装置也是相同的。以下,说明进行与第一实施方式的编码装置300不同的处理的决定部380内的适合编码处理判定部382和切换决定部383。
<适合编码处理判定部382>
适合编码处理判定部382进行图7中示例的各步骤的处理。适合编码处理判定部382判定与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理的哪一个,换而言之,判定是否进行其中一个编码处理就可以,并输出判定结果(步骤S382A)。
以下,对适合编码处理判定部382的动作的一例进行说明。适合编码处理判定部382进行图7中示例的各步骤的处理。在以下的例中,第一编码部101的编码处理是非专利文献1中示例的、使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理,第二编码部201的编码处理是非专利文献2中示例的、伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码的编码处理。
在该例中,适合编码处理判定部382在输入音响信号的频谱包络的起伏大或者/以及集中度高的情况下,判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理,在输入音响信号的频谱包络的起伏小或者/以及集中度低的情况下,判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理,在输入音响信号的频谱包络的起伏为中等程度或者/以及集中度为中等程度的情况下,判定为与当前帧的输入音响信号对应的频域的系数列进行第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理都可以、即适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理,并输出判定结果。
在输入音响信号的频谱包络的起伏为中等程度或者/以及集中度为中等程度的情况下,如后述那样,在切换决定部383中决定通过与前一帧相同的编码处理来对当前帧的频域的系数列进行编码。即,在切换决定部383中,决定当前帧的编码处理,使得由于在前一帧和当前帧之间编码处理切换而收听者感到不自然的情况较少。因此,输入音响信号的频谱包络的起伏为中等程度或者/以及集中度为中等程度的情况不仅仅包含与当前帧的输入音响信号对应的频域的系数列进行第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理都可以的情况、或适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况,还包含很难说与当前帧的输入音响信号对应的频域的系数列适合第一编码部101的编码处理和第二编码部201的编码处理的哪一个编码处理的情况、或有可能与当前帧的输入音响信号对应的频域的系数列不适合第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况。即,也可以将上述的“适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理”的判定,读作“无法判别对于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的适合性”的判定。
作为估计频谱的起伏或集中度的方法,也可以采用任意的方法,但是,对估计频谱包络的谷的深度的结构进行说明。在该结构中,在频谱包络的谷浅时判定为频谱的起伏小且集中度低,在频谱包络的谷深时判定为频谱的起伏大且集中度高,在频谱包络的谷的深度为中等程度时判定为频谱的起伏为中等程度且集中度为中等程度。
适合编码处理判定部382进行与第一实施方式的适合编码处理判定部382相同的步骤S3821至S3825、和与第一实施方式的适合编码处理判定部382不同的步骤S3826A。以下,对与第一实施方式的适合编码处理判定部382不同的部分进行说明。
适合编码处理判定部382在步骤S3825之后,进行使用了阈值TH2_1,TH2_2的下面的判定处理以及后述的适合信息的输出(步骤S3826A)。
适合编码处理判定部382在所有的部分领域的AVEXS(q)的平均值E与谷的部分领域的AVEXS(q)的平均值EV之差比规定的阈值TH2_1小的情况下,被估计为是频谱的谷浅、频谱包络的起伏少或者集中度低的频谱,所以,判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理。
此外,适合编码处理判定部382在所有的部分领域的AVEXS(q)的平均值E与谷的部分领域的AVEXS(q)的平均值EV之差大于作为比阈值TH2_1大的值的规定的阈值TH2_2的情况下,被估计为是频谱的谷深、频谱包络的起伏大或者集中度高的频谱,所以,判定为与当前帧的输入音响信号对应的频域的系数列适合第一编码部101的编码处理。
此外,适合编码处理判定部382在所有的部分领域的AVEXS(q)的平均值E与谷的部分领域的AVEXS(q)的平均值EV之差为阈值TH2_1以上阈值TH2_2以下的情况下,被估计为是频谱的谷的深度为中等程度、频谱包络的起伏为中等程度或者集中度为中等程度的频谱,所以,与当前帧的输入音响信号对应的频域的系数列进行第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理都可以。即,判定为适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理。
之后,适合编码处理判定部382对适合的编码处理的信息即适合信息进行输出。适合信息是适合编码处理判定部382的判定结果,也可以称作其中一个或者双方的编码处理是否适合的信息。
另外,适合编码处理判定部382也可以设为如下结构:仅在判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理的其中一个的情况下,输出表示适合于第一编码部101的编码处理的信息或者表示适合于第二编码部201的编码处理的信息,在判定为与当前帧的输入音响信号对应的频域的系数列进行第一编码部101的编码处理和第二编码部201的编码处理的哪一个编码处理都可以、即适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况下,不输出判定结果。
<切换决定部383>
切换决定部383根据切换可否判定部381得到的切换可否的信息、和适合编码处理判定部382得到的其中一个或者双方的编码处理是否适合的信息、即适合的编码处理的信息(适合信息),决定将当前帧的频域的系数列在第一编码部101中进行编码还是在第二编码部201中进行编码,对能够确定所决定的编码处理的码即切换码进行输出(步骤S383A)。所输出的切换码被输入至解码装置400。在此,切换决定部383在是不可切换的情况下,不论当前帧适合的编码处理是哪一个编码处理,都决定通过与前一帧相同的编码处理来对当前帧的频域的系数列进行编码。此外,切换决定部383在是可切换、且当前帧适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况下,决定通过与前一帧相同的编码处理来对当前帧的频域的系数列进行编码。此外,切换决定部383在是可切换、且当前帧适合于第一编码部101的编码处理和第二编码部201的编码处理的其中一个的情况下,不论前一帧的编码处理是哪一个编码处理,都决定通过当前帧适合的编码处理来对当前帧的频域的系数列进行编码。
以下,说明切换决定部383的动作的一例。在以下的例中,第一编码部101的编码处理是非专利文献1中示例的、使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理,第二编码部201的编码处理是非专利文献2中示例的、伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码的编码处理。
切换决定部383在切换可否判定部381得到的切换可否的信息表示不可切换的情况、以及/或者、适合编码处理判定部382得到的哪个编码处理适合的信息(适合信息)表示与前一帧的MDCT系数列Xf-1(n)(n=1,...,N)的编码处理相同的编码处理的情况或者表示第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理都适合的情况下,将与前一帧的MDCT系数列Xf-1(n)(n=1,...,N)的编码处理相同的编码处理,决定为当前帧的MDCT系数列Xf(n)(n=1,...,N)的编码处理。
即,切换决定部383在前一帧的MDCT系数列Xf-1(n)(n=1,...,N)在第一编码部101中被编码的情况、且切换可否判定部381得到的切换可否的信息表示不可切换的情况下,决定为当前帧的MDCT系数列Xf(n)(n=1,...,N)也在第一编码部101中进行编码。此外,切换决定部383在前一帧的MDCT系数列Xf-1(n)(n=1,...,N)在第一编码部101中被编码的情况、且适合编码处理判定部382得到的哪个编码处理适合的信息(适合信息)表示第一编码部101的编码处理的情况下,决定为当前帧的MDCT系数列Xf(n)(n=1,...,N)也在第一编码部101中进行编码。此外,切换决定部383在前一帧的MDCT系数列Xf-1(n)(n=1,...,N)在第一编码部101中被编码的情况、且适合编码处理判定部382得到的哪个编码处理适合的信息(适合信息)表示第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理都适合的情况下,决定为当前帧的MDCT系数列Xf(n)(n=1,...,N)也在第一编码部101中进行编码。
此外,切换决定部383在前一帧的MDCT系数列Xf-1(n)(n=1,...,N)在第二编码部201中被编码的情况、且切换可否判定部381得到的切换可否的信息表示不可切换的情况下,决定为当前帧的MDCT系数列Xf(n)(n=1,...,N)也在第二编码部201中进行编码。此外,切换决定部383在前一帧的MDCT系数列Xf-1(n)(n=1,...,N)在第二编码部201中被编码的情况、且适合编码处理判定部382得到的哪个编码处理适合的信息(适合信息)表示第二编码部201的编码处理的情况下,决定为当前帧的MDCT系数列Xf(n)(n=1,...,N)也在第二编码部201中进行编码。此外,切换决定部383在前一帧的MDCT系数列Xf-1(n)(n=1,...,N)在第二编码部201中被编码的情况、且适合编码处理判定部382得到的哪个编码处理适合的信息(适合信息)表示第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理都适合的情况下,决定为当前帧的MDCT系数列Xf(n)(n=1,...,N)也在第二编码部201中进行编码。
切换决定部383在切换可否判定部381得到的切换可否的信息表示可切换的情况、且适合编码处理判定部382得到的哪个编码处理适合的信息(适合信息)表示与前一帧的MDCT系数列Xf-1(n)(n=1,...,N)的编码处理不同的编码处理的情况下,将与前一帧的MDCT系数列Xf-1(n)(n=1,...,N)的编码处理不同的编码处理,决定为当前帧的MDCT系数列Xf(n)(n=1,...,N)的编码处理。即,切换决定部383在前一帧的MDCT系数列Xf-1(n)(n=1,...,N)在第一编码部101中被编码的情况、切换可否判定部381得到的切换可否的信息表示可切换、且适合编码处理判定部382得到的哪个编码处理适合的信息(适合信息)表示第二编码部201的编码处理的情况下,决定为将当前帧的MDCT系数列Xf(n)(n=1,...,N)在第二编码部201中进行编码。此外,切换决定部383在前一帧的MDCT系数列Xf-1(n)(n=1,...,N)在第二编码部201中被编码的情况、切换可否判定部381得到的切换可否的信息表示可切换、且适合编码处理判定部382得到的哪个编码处理适合的信息(适合信息)表示第一编码部101的编码处理的情况下,决定为将当前帧的MDCT系数列Xf(n)(n=1,...,N)在第一编码部101中进行编码。
另外,在将适合编码处理判定部382设为在判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况下不输出判定结果的结构的情况下,切换决定部383在没有输入适合的编码处理的信息的情况下,进行上述的哪个编码处理适合的信息(适合信息)表示适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况下的处理即可。
[第一变形例]
在当前帧的输入音响信号适合非专利文献1中示例的使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理、和非专利文献2中示例的伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码的编码处理的哪一个编码处理的判定中,除了输入音响信号的频谱包络的起伏的大小或集中度之外,还可以进行包含其他的信息的判定。
例如,即使在与前一帧的输入音响信号对应的频域的系数列通过第一编码部101编码、切换可否判定部381判定为可切换、且适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理的情况下,在根据编码装置300中未图示的部件得到的其他的信息而判定为应该将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101的编码处理来进行编码的情况下,也可以将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101来进行编码。即,编码装置300是如下的结构即可:在与前一帧的输入音响信号对应的频域的系数列通过第一编码部101编码、切换可否判定部381判定为可切换、且适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理的情况下,能够决定将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201进行编码。
此外,相反地,即使在与前一帧的输入音响信号对应的频域的系数列通过第二编码部201编码、切换可否判定部381判定为可切换、且适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理的情况下,在根据编码装置300中未图示的部件得到的其他的信息而判定为应该将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201的编码处理来进行编码的情况下,也可以将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201来进行编码。即,编码装置300是如下的结构即可:在与前一帧的输入音响信号对应的频域的系数列通过第二编码部201编码、切换可否判定部381判定为可切换、且适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理的情况下,能够决定将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101进行编码。
此外,例如,在第三实施方式的编码装置300中,即使在与前一帧的输入音响信号对应的频域的系数列通过第一编码部101编码、适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况下,在切换可否判定部381判定为可切换、且根据编码装置300中未图示的部件得到的其他的信息而判定为应该将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201的编码处理来进行编码的情况下,也可以将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201来进行编码。
此外,相反地,即使在与前一帧的输入音响信号对应的频域的系数列通过第二编码部201编码、适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理的第二编码部201的编码处理中的任一个编码处理的情况下,在切换可否判定部381判定为可切换、且根据编码装置300中未图示的部件得到的其他的信息而判定为应该将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101的编码处理来进行编码的情况下,也可以将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101来进行编码。
即,第三实施方式的编码装置300是如下的结构即可:在切换可否判定部381判定为可切换、且适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况下,能够决定将与当前帧的输入音响信号对应的频域的系数列通过与前一帧相同的编码处理来进行编码。
[第二变形例]
在将当前帧的频域的系数列在第一编码部101中进行编码还是在第二编码部201中进行编码的决定中,也可以不使用切换可否判定部381得到的切换可否的信息。在该情况下,在决定部380内也可以不具备切换可否判定部381。
在该情况下,切换决定部383不使用切换可否判定部381得到的切换可否的信息,而是根据适合编码处理判定部382得到的适合信息,决定将当前帧的频域的系数列在第一编码部101中进行编码还是在第二编码部201中进行编码,对能够确定所决定的编码处理的码即切换码进行输出。
例如,在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理的情况下,将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101来进行编码,在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理的情况下,将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201来进行编码即可。
在该情况下,与第一变形例同样地,也可以进行包含其他的信息的判定。例如,即使在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理的情况下,在根据编码装置300中未图示的部件得到的其他的信息而判定为应该将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201的编码处理来进行编码的情况下,也可以将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201来进行编码。
相反地,即使在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理的情况下,在根据编码装置300中未图示的部件得到的其他的信息而判定为应该将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101的编码处理来进行编码的情况下,也可以将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101来进行编码。
即,作为如下结构即可:在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理的情况下,能够决定将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101的编码处理进行编码。此外,作为如下结构即可:在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理的情况下,能够决定将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201的编码处理来进行编码。
此外,例如,在第三实施方式的编码装置300中,在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况之中,在根据编码装置300中未图示的部件得到的其他的信息而判定为应该将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101的编码处理来进行编码的情况下,也可以将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101来进行编码。
此外,在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况之中,在根据编码装置300中未图示的部件得到的其他的信息而判定为应该将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201的编码处理来进行编码的情况下,也可以将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201来进行编码。
即,第三实施方式的编码装置300是如下的结构即可:在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况下,能够决定将与当前帧的输入音响信号对应的频域的系数列通过与前一帧相同的编码处理来进行编码。
另外,在上述的各实施方式中的、计算出的值和阈值的比较中,在计算出的值与阈值为相同的值的情况下,设定为分类到以阈值为边界而相邻的2个情况的任一个即可。即,也可以将是某个阈值以上的情况作为比该阈值大的情况,并且,将比该阈值小的情况作为是该阈值以下的情况。此外,也可以将比某个阈值大的情况作为是该阈值以上的情况,并且,将是该阈值以下的情况作为比该阈值小的情况。
例如,在第一实施方式中,决定部380也可以在前一帧的输入音响信号的高频分量的能量的大小、和当前帧的输入音响信号的高频分量的能量的大小的至少其中一个是规定的阈值以下的情况下,能够将与前一帧不同的编码处理决定作为当前帧的编码处理(步骤S380)。
此外,在第二实施方式中,切换可否判定部381也可以在前一帧的输入音响信号的高频分量的能量的大小、和当前帧的输入音响信号的高频分量的能量的大小的至少其中一个是规定的阈值以下的情况下,判定为可切换、即能够通过与对前一帧的频域的系数列进行了编码的编码处理不同的编码处理来对当前帧的频域的系数列进行编码,并输出判定结果。
此外,在第一实施方式中,适合编码处理判定部382在所有的部分领域的AVEXS(q)的平均值E和谷的部分领域的AVEXS(q)的平均值EV之差比规定的阈值TH2小的情况下,被估计为是频谱的谷浅、频谱包络的起伏少或者集中度低的频谱,所以,也可以判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理。相反地,在所有的部分领域的AVEXS(q)的平均值E和谷的部分领域的AVEXS(q)的平均值EV之差是阈值TH2以上的情况下,被估计为是频谱的谷深、频谱包络的起伏大或者集中度高的频谱,所以,也可以判定为与当前帧的输入音响信号对应的频域的系数列适合第一编码部101的编码处理。
此外,在第三实施方式中,适合编码处理判定部382在所有的部分领域的AVEXS(q)的平均值E与谷的部分领域的AVEXS(q)的平均值EV之差是作为比阈值TH2_1更大的值的规定的阈值TH2_2以上的情况下,被估计为是频谱的谷深、频谱包络的起伏大或者集中度高的频谱,所以,也可以判定为与当前帧的输入音响信号对应的频域的系数列适合第一编码部101的编码处理。在该情况下,适合编码处理判定部382在所有的部分领域的AVEXS(q)的平均值E和谷的部分领域的AVEXS(q)的平均值EV之差为阈值TH2_1以上且比阈值TH2_2小的情况下,被估计为是频谱的谷的深度为中等程度、频谱包络的起伏为中等程度或者集中度为中等程度的频谱,所以,设为与当前帧的输入音响信号对应的频域的系数列也可以进行第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理。
在编码装置以及编码方法中所说明的处理不仅可以根据记载的顺序按时间序列执行,也可以根据执行处理的装置的处理能力或者根据需要,并行地或者单独地执行。
此外,在将编码方法中的各步骤通过计算机来实现的情况下,编码方法应该具有的功能的处理内容由程序来记述。然后,将该程序在计算机中进行执行,从而其各步骤在计算机上被实现。
记述了该处理内容的程序能够记录在计算机可读取的记录介质中。作为计算机可读取的记录介质,例如,磁记录装置、光盘、光磁记录介质、半导体存储器等任意介质均可。
此外,各处理部件也可以设为通过在计算机上执行规定的程序而构成,也可以设为将这些处理内容的至少一部分以硬件方式来实现。
另外,不言而喻的是在不脱离本发明的宗旨的范围能够适当地进行变更。
Claims (9)
1.一种编码方法,将输入音响信号按规定时间区间的帧的每个,通过在频域上的多个编码处理之中被决定的编码处理来进行编码,其特征在于,
所述编码方法包含:
决定步骤,在前一帧的输入音响信号的高频分量的能量的大小与当前帧的输入音响信号的高频分量的能量的大小的至少其中一个为规定的阈值以下的情况下,设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理,在并非如此的情况下,根据所述输入音响信号的高频分量为稀疏的状态,决定是设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理,还是将与前一帧相同的编码处理决定作为当前帧的编码处理,
所述高频分量为稀疏的状态是以下状态,即,将输入音响信号的频域的系数列中的规定频率以上的系数列分到规定的多个频带,将由此得到的系数列设为部分系数列,将部分系数列的能量为基于输入音响信号的频域的系数列的能量的阈值以上的部分系数列的个数设为峰值的个数,并且所述峰值的个数为通过预定的规则确定的阈值以下的状态。
2.一种编码方法,将输入音响信号按规定时间区间的帧的每个,通过在频域上的多个编码处理之中被决定的编码处理来进行编码,其特征在于,
所述编码方法包含:
决定步骤,在前一帧的输入音响信号的高频分量的能量的大小和当前帧的输入音响信号的高频分量的能量的大小的至少其中一个为规定的阈值以下的情况下,设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理,
所述编码方法还具有:
第一编码步骤,使用基于能够变换为与所述输入音响信号对应的线性预测系数的系数的频谱包络,对与所述输入音响信号对应的频域的系数列进行编码;以及
第二编码步骤,针对与所述输入音响信号对应的频域的系数列,伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码,进行编码,
在所述决定步骤中,进一步在已设为能够将与前一帧不同的编码处理作为当前帧的编码处理的情况之中,在将前一帧的所述输入音响信号通过第一编码步骤来进行编码,且表示当前帧的所述输入音响信号的频谱的起伏大或者集中度高的指标比规定的阈值小的情况下,决定将当前帧通过第二编码步骤来进行编码。
3.一种编码方法,将输入音响信号按规定时间区间的帧的每个,通过在频域上的多个编码处理之中被决定的编码处理来进行编码,其特征在于,
所述编码方法包含:
决定步骤,在前一帧的输入音响信号的高频分量的能量的大小与当前帧的输入音响信号的高频分量的能量的大小的至少其中一个为规定的阈值以下的情况下,设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理,在并非如此的情况下,根据所述输入音响信号的高频分量为稀疏的状态,决定是设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理,还是将与前一帧相同的编码处理决定作为当前帧的编码处理,
所述编码方法还具有:
第一编码步骤,使用基于能够变换为与所述输入音响信号对应的线性预测系数的系数的频谱包络,对与所述输入音响信号对应的频域的系数列进行编码;以及
第二编码步骤,针对与所述输入音响信号对应的频域的系数列,伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码,进行编码,
在所述决定步骤中,进一步在已设为能够将与前一帧不同的编码处理作为当前帧的编码处理的情况之中,在将前一帧的所述输入音响信号通过第一编码步骤来进行编码,且表示当前帧的所述输入音响信号的频谱的起伏大或者集中度高的指标比规定的阈值小的情况下,决定将当前帧通过第二编码步骤来进行编码。
4.如权利要求2或3所述的编码方法,
表示所述频谱的起伏大或者集中度高的指标是,当前帧的所述输入音响信号的频谱的全部的部分区域的功率的平均值和谷的部分区域的功率的平均值的差,或者当前帧的所述输入音响信号的频谱的全部的部分区域的功率的平均值的对数值和谷的部分区域的功率的平均值的对数值的差。
5.一种编码装置,将输入音响信号按规定时间区间的帧的每个,通过在频域上的多个编码处理之中被决定的编码处理来进行编码,其特征在于,
所述编码装置包括:
决定部,在前一帧的输入音响信号的高频分量的能量的大小和当前帧的输入音响信号的高频分量的能量的大小的至少其中一个为规定的阈值以下的情况下,设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理,在并非如此的情况下,根据所述输入音响信号的高频分量为稀疏的状态,决定是设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理,还是将与前一帧相同的编码处理决定作为当前帧的编码处理,
所述高频分量为稀疏的状态是以下状态,即,将输入音响信号的频域的系数列中的规定频率以上的系数列分到规定的多个频带,将由此得到的系数列设为部分系数列,将部分系数列的能量为基于输入音响信号的频域的系数列的能量的阈值以上的部分系数列的个数设为峰值的个数,并且所述峰值的个数为通过预定的规则确定的阈值以下的状态。
6.一种编码装置,将输入音响信号按规定时间区间的帧的每个,通过在频域上的多个编码处理之中被决定的编码处理来进行编码,其特征在于,
所述编码装置具有:
决定部,在前一帧的输入音响信号的高频分量的能量的大小和当前帧的输入音响信号的高频分量的能量的大小的至少其中一个为规定的阈值以下的情况下,设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理,
所述编码装置还具有:
第一编码部,使用基于能够变换为与所述输入音响信号对应的线性预测系数的系数的频谱包络,对与所述输入音响信号对应的频域的系数列进行编码;以及
第二编码部,针对与所述输入音响信号对应的频域的系数列,伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码,进行编码,
所述决定部进一步在已设为能够将与前一帧不同的编码处理作为当前帧的编码处理的情况之中,在将前一帧的所述输入音响信号通过第一编码部来进行编码,且表示当前帧的所述输入音响信号的频谱的起伏大或者集中度高的指标比规定的阈值小的情况下,决定将当前帧通过第二编码部来进行编码。
7.一种编码装置,将输入音响信号按规定时间区间的帧的每个,通过在频域上的多个编码处理之中被决定的编码处理来进行编码,其特征在于,
所述编码装置具有:
决定部,在前一帧的输入音响信号的高频分量的能量的大小与当前帧的输入音响信号的高频分量的能量的大小的至少其中一个为规定的阈值以下的情况下,设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理,在并非如此的情况下,根据所述输入音响信号的高频分量为稀疏的状态,决定是设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理,还是将与前一帧相同的编码处理决定作为当前帧的编码处理,
所述编码装置还具有:
第一编码部,使用基于能够变换为与所述输入音响信号对应的线性预测系数的系数的频谱包络,对与所述输入音响信号对应的频域的系数列进行编码;以及
第二编码部,针对与所述输入音响信号对应的频域的系数列,伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码,进行编码,
在所述决定部中,进一步在已设为能够将与前一帧不同的编码处理作为当前帧的编码处理的情况之中,在将前一帧的所述输入音响信号通过第一编码部来进行编码,且表示当前帧的所述输入音响信号的频谱的起伏大或者集中度高的指标比规定的阈值小的情况下,决定将当前帧通过第二编码部来进行编码。
8.如权利要求6或7所述的编码装置,
表示所述频谱的起伏大或者集中度高的指标是,当前帧的所述输入音响信号的频谱的全部的部分区域的功率的平均值和谷的部分区域的功率的平均值的差,或者当前帧的所述输入音响信号的频谱的全部的部分区域的功率的平均值的对数值和谷的部分区域的功率的平均值的对数值的差。
9.一种计算机可读取的记录介质,记录了用于使计算机执行权利要求1至3的任一项的编码方法的各步骤的程序。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110195328.3A CN112992164A (zh) | 2014-07-28 | 2015-05-15 | 编码方法、装置、程序以及记录介质 |
CN202110191341.1A CN112992163A (zh) | 2014-07-28 | 2015-05-15 | 编码方法、装置、程序以及记录介质 |
CN202110195414.4A CN112992165A (zh) | 2014-07-28 | 2015-05-15 | 编码方法、装置、程序以及记录介质 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014-152958 | 2014-07-28 | ||
JP2014152958 | 2014-07-28 | ||
PCT/JP2015/063989 WO2016017238A1 (ja) | 2014-07-28 | 2015-05-15 | 符号化方法、装置、プログラム及び記録媒体 |
Related Child Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110195414.4A Division CN112992165A (zh) | 2014-07-28 | 2015-05-15 | 编码方法、装置、程序以及记录介质 |
CN202110191341.1A Division CN112992163A (zh) | 2014-07-28 | 2015-05-15 | 编码方法、装置、程序以及记录介质 |
CN202110195328.3A Division CN112992164A (zh) | 2014-07-28 | 2015-05-15 | 编码方法、装置、程序以及记录介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106796801A CN106796801A (zh) | 2017-05-31 |
CN106796801B true CN106796801B (zh) | 2021-02-26 |
Family
ID=55217142
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110191341.1A Pending CN112992163A (zh) | 2014-07-28 | 2015-05-15 | 编码方法、装置、程序以及记录介质 |
CN202110195414.4A Pending CN112992165A (zh) | 2014-07-28 | 2015-05-15 | 编码方法、装置、程序以及记录介质 |
CN202110195328.3A Pending CN112992164A (zh) | 2014-07-28 | 2015-05-15 | 编码方法、装置、程序以及记录介质 |
CN201580041465.4A Active CN106796801B (zh) | 2014-07-28 | 2015-05-15 | 编码方法、装置、以及记录介质 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110191341.1A Pending CN112992163A (zh) | 2014-07-28 | 2015-05-15 | 编码方法、装置、程序以及记录介质 |
CN202110195414.4A Pending CN112992165A (zh) | 2014-07-28 | 2015-05-15 | 编码方法、装置、程序以及记录介质 |
CN202110195328.3A Pending CN112992164A (zh) | 2014-07-28 | 2015-05-15 | 编码方法、装置、程序以及记录介质 |
Country Status (8)
Country | Link |
---|---|
US (4) | US10304472B2 (zh) |
EP (3) | EP3796314B1 (zh) |
JP (3) | JP6411509B2 (zh) |
KR (3) | KR101993828B1 (zh) |
CN (4) | CN112992163A (zh) |
ES (3) | ES2770704T3 (zh) |
PL (2) | PL3796314T3 (zh) |
WO (1) | WO2016017238A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3796314B1 (en) * | 2014-07-28 | 2021-12-22 | Nippon Telegraph And Telephone Corporation | Coding of a sound signal |
CN109389987B (zh) * | 2017-08-10 | 2022-05-10 | 华为技术有限公司 | 音频编解码模式确定方法和相关产品 |
CN110868220B (zh) * | 2018-08-28 | 2021-09-07 | 株洲中车时代电气股份有限公司 | 车辆设备的身份标识的配置及异常检测方法 |
CN113948085B (zh) * | 2021-12-22 | 2022-03-25 | 中国科学院自动化研究所 | 语音识别方法、系统、电子设备和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040111256A1 (en) * | 2000-10-26 | 2004-06-10 | Hirohisa Tasaki | Voice encoding method and apparatus |
CN101080767A (zh) * | 2004-11-03 | 2007-11-28 | 诺基亚公司 | 用于低比特率语音编码的方法和装置 |
CN101496097A (zh) * | 2006-07-31 | 2009-07-29 | 高通股份有限公司 | 用于在与语音信号相关联的包中包含识别符的系统及方法 |
CN101552006A (zh) * | 2009-05-12 | 2009-10-07 | 武汉大学 | 加窗信号mdct域的能量及相位调整方法及其装置 |
CN101763856A (zh) * | 2008-12-23 | 2010-06-30 | 华为技术有限公司 | 信号分类处理方法、分类处理装置及编码系统 |
US20130110522A1 (en) * | 2011-10-21 | 2013-05-02 | Samsung Electronics Co., Ltd. | Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
HU219627B (hu) * | 1994-03-31 | 2001-05-28 | The Arbitron Company | Berendezés és eljárás audiojel kódolására |
US5450490A (en) * | 1994-03-31 | 1995-09-12 | The Arbitron Company | Apparatus and methods for including codes in audio signals and decoding |
US5742734A (en) * | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
US5774846A (en) * | 1994-12-19 | 1998-06-30 | Matsushita Electric Industrial Co., Ltd. | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
JP3317470B2 (ja) * | 1995-03-28 | 2002-08-26 | 日本電信電話株式会社 | 音響信号符号化方法、音響信号復号化方法 |
US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
JP3612260B2 (ja) * | 2000-02-29 | 2005-01-19 | 株式会社東芝 | 音声符号化方法及び装置並びに及び音声復号方法及び装置 |
JP3453116B2 (ja) * | 2000-09-26 | 2003-10-06 | パナソニック モバイルコミュニケーションズ株式会社 | 音声符号化方法及び装置 |
US7200561B2 (en) * | 2001-08-23 | 2007-04-03 | Nippon Telegraph And Telephone Corporation | Digital signal coding and decoding methods and apparatuses and programs therefor |
JP3960932B2 (ja) * | 2002-03-08 | 2007-08-15 | 日本電信電話株式会社 | ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム |
AU2003213439A1 (en) * | 2002-03-08 | 2003-09-22 | Nippon Telegraph And Telephone Corporation | Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
US7379864B2 (en) * | 2003-05-06 | 2008-05-27 | Lucent Technologies Inc. | Method and apparatus for the detection of previous packet loss in non-packetized speech |
CN1954363B (zh) * | 2004-05-19 | 2011-10-12 | 松下电器产业株式会社 | 编码装置和编码方法 |
US20060224381A1 (en) * | 2005-04-04 | 2006-10-05 | Nokia Corporation | Detecting speech frames belonging to a low energy sequence |
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
CN101140759B (zh) * | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
ATE518224T1 (de) * | 2008-01-04 | 2011-08-15 | Dolby Int Ab | Audiokodierer und -dekodierer |
US8600740B2 (en) * | 2008-01-28 | 2013-12-03 | Qualcomm Incorporated | Systems, methods and apparatus for context descriptor transmission |
CN101727906B (zh) * | 2008-10-29 | 2012-02-01 | 华为技术有限公司 | 高频带信号的编解码方法及装置 |
CN101615395B (zh) * | 2008-12-31 | 2011-01-12 | 华为技术有限公司 | 信号编码、解码方法及装置、系统 |
CN101770775B (zh) * | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
KR20100136890A (ko) * | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
JP5730303B2 (ja) * | 2010-06-21 | 2015-06-10 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 復号装置、符号化装置およびこれらの方法 |
CN102446508B (zh) * | 2010-10-11 | 2013-09-11 | 华为技术有限公司 | 语音音频统一编码窗型选择方法及装置 |
JP5694751B2 (ja) * | 2010-12-13 | 2015-04-01 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
EP2650878B1 (en) * | 2011-01-25 | 2015-11-18 | Nippon Telegraph and Telephone Corporation | Encoding method, encoder, periodic feature amount determination method, periodic feature amount determination apparatus, program and recording medium |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
CN103366750B (zh) * | 2012-03-28 | 2015-10-21 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN104217727B (zh) * | 2013-05-31 | 2017-07-21 | 华为技术有限公司 | 信号解码方法及设备 |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
US9911423B2 (en) * | 2014-01-13 | 2018-03-06 | Nokia Technologies Oy | Multi-channel audio signal classifier |
EP3594948B1 (en) * | 2014-05-08 | 2021-03-03 | Telefonaktiebolaget LM Ericsson (publ) | Audio signal classifier |
GB2526128A (en) * | 2014-05-15 | 2015-11-18 | Nokia Technologies Oy | Audio codec mode selector |
CN106415717B (zh) * | 2014-05-15 | 2020-03-13 | 瑞典爱立信有限公司 | 音频信号分类和编码 |
EP3796314B1 (en) * | 2014-07-28 | 2021-12-22 | Nippon Telegraph And Telephone Corporation | Coding of a sound signal |
TWI602172B (zh) * | 2014-08-27 | 2017-10-11 | 弗勞恩霍夫爾協會 | 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法 |
US10049684B2 (en) * | 2015-04-05 | 2018-08-14 | Qualcomm Incorporated | Audio bandwidth selection |
-
2015
- 2015-05-15 EP EP20200287.9A patent/EP3796314B1/en active Active
- 2015-05-15 US US15/327,490 patent/US10304472B2/en active Active
- 2015-05-15 ES ES15826810T patent/ES2770704T3/es active Active
- 2015-05-15 JP JP2016538178A patent/JP6411509B2/ja active Active
- 2015-05-15 CN CN202110191341.1A patent/CN112992163A/zh active Pending
- 2015-05-15 ES ES19201443T patent/ES2838006T3/es active Active
- 2015-05-15 PL PL20200287T patent/PL3796314T3/pl unknown
- 2015-05-15 ES ES20200287T patent/ES2908564T3/es active Active
- 2015-05-15 KR KR1020177002231A patent/KR101993828B1/ko active IP Right Grant
- 2015-05-15 WO PCT/JP2015/063989 patent/WO2016017238A1/ja active Application Filing
- 2015-05-15 EP EP15826810.2A patent/EP3163571B1/en active Active
- 2015-05-15 KR KR1020197018004A patent/KR102061316B1/ko active IP Right Grant
- 2015-05-15 CN CN202110195414.4A patent/CN112992165A/zh active Pending
- 2015-05-15 CN CN202110195328.3A patent/CN112992164A/zh active Pending
- 2015-05-15 EP EP19201443.9A patent/EP3614382B1/en active Active
- 2015-05-15 KR KR1020197011029A patent/KR102049294B1/ko active IP Right Grant
- 2015-05-15 PL PL15826810T patent/PL3163571T3/pl unknown
- 2015-05-15 CN CN201580041465.4A patent/CN106796801B/zh active Active
-
2018
- 2018-04-25 JP JP2018083901A patent/JP6608993B2/ja active Active
-
2019
- 2019-03-07 US US16/295,039 patent/US10629217B2/en active Active
- 2019-07-31 JP JP2019140886A patent/JP6739604B2/ja active Active
-
2020
- 2020-02-05 US US16/782,725 patent/US11043227B2/en active Active
- 2020-02-05 US US16/782,700 patent/US11037579B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040111256A1 (en) * | 2000-10-26 | 2004-06-10 | Hirohisa Tasaki | Voice encoding method and apparatus |
CN101080767A (zh) * | 2004-11-03 | 2007-11-28 | 诺基亚公司 | 用于低比特率语音编码的方法和装置 |
CN101496097A (zh) * | 2006-07-31 | 2009-07-29 | 高通股份有限公司 | 用于在与语音信号相关联的包中包含识别符的系统及方法 |
CN101763856A (zh) * | 2008-12-23 | 2010-06-30 | 华为技术有限公司 | 信号分类处理方法、分类处理装置及编码系统 |
CN101552006A (zh) * | 2009-05-12 | 2009-10-07 | 武汉大学 | 加窗信号mdct域的能量及相位调整方法及其装置 |
US20130110522A1 (en) * | 2011-10-21 | 2013-05-02 | Samsung Electronics Co., Ltd. | Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6739604B2 (ja) | 符号化方法、装置、プログラム及び記録媒体 | |
US10734009B2 (en) | Periodic-combined-envelope-sequence generation device, periodic-combined-envelope-sequence generation method, periodic-combined-envelope-sequence generation program and recording medium | |
JP6744471B2 (ja) | 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体 | |
JP6250140B2 (ja) | 符号化方法、符号化装置、プログラム、および記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |