JP5596800B2 - 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム - Google Patents
符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム Download PDFInfo
- Publication number
- JP5596800B2 JP5596800B2 JP2012554739A JP2012554739A JP5596800B2 JP 5596800 B2 JP5596800 B2 JP 5596800B2 JP 2012554739 A JP2012554739 A JP 2012554739A JP 2012554739 A JP2012554739 A JP 2012554739A JP 5596800 B2 JP5596800 B2 JP 5596800B2
- Authority
- JP
- Japan
- Prior art keywords
- candidates
- interval
- acoustic signal
- periodic feature
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 267
- 230000000737 periodic effect Effects 0.000 title claims description 154
- 230000008707 rearrangement Effects 0.000 claims description 139
- 238000012545 processing Methods 0.000 claims description 107
- 230000008569 process Effects 0.000 description 169
- 238000013139 quantization Methods 0.000 description 36
- 238000004364 calculation method Methods 0.000 description 32
- 238000010606 normalization Methods 0.000 description 29
- 241000209094 Oryza Species 0.000 description 26
- 235000007164 Oryza sativa Nutrition 0.000 description 26
- 235000009566 rice Nutrition 0.000 description 26
- 238000001228 spectrum Methods 0.000 description 24
- 230000005236 sound signal Effects 0.000 description 16
- 238000011084 recovery Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 12
- 239000013598 vector Substances 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
(a-1)「現在のフレームの上記音響信号の予測利得」が大きくなる、
(a-2)「現在のフレームの上記音響信号の予測利得の推定値」が大きくなる、
(b-1)「直前のフレームの予測利得」と「現在のフレームの予測利得」との差分が小さくなる、
(b-2)「直前のフレームの予測利得の推定値」と「現在のフレームの予測利得の推定値」との差分が小さくなる、
(c-1)「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」が大きくなる、
(c-2)「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」が大きくなる、
(d-1)「直前のフレームに含まれる上記音響信号のサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」との差分が小さくなる、
(d-2)「直前のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」との差分が小さくなる、
(e-1)「現在のフレームの上記音響信号のパワー」が大きくなる、
(e-2)「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」が大きくなる、
(f-1)「直前のフレームの上記音響信号のパワー」と「現在のフレームの上記音響信号のパワー」との差分が小さくなる、
(f-2)「直前のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」と「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」との差分が小さくなる、の少なくともいずれか一つの条件を満たす場合に、大きくなる値である。
(a-1)「現在のフレームの上記音響信号の予測利得」が大きくなる、
(a-2)「現在のフレームの上記音響信号の予測利得の推定値」が大きくなる、
(b-1)「直前のフレームの予測利得」と「現在のフレームの予測利得」との差分が小さくなる、
(b-2)「直前のフレームの予測利得の推定値」と「現在のフレームの予測利得の推定値」との差分が小さくなる、
(c-1)「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」が大きくなる、
(c-2)「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」が大きくなる、
(d-1)「直前のフレームに含まれる上記音響信号のサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」との差分が小さくなる、
(d-2)「直前のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」との差分が小さくなる、
(e-1)「現在のフレームの上記音響信号のパワー」が大きくなる、
(e-2)「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」が大きくなる、
(f-1)「直前のフレームの上記音響信号のパワー」と「現在のフレームの上記音響信号のパワー」との差分が小さくなる、
(f-2)「直前のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」と「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」との差分が小さくなる、の少なくともいずれか一つの条件を満たす場合に、大きくなる値である。
「符号化処理」
最初に図1〜図4を参照して符号化処理を説明する。本発明の符号化処理は、例えば、周波数領域変換部1と重み付け包絡正規化部2と正規化利得計算部3と量子化部4と並べ替え部5と符号化部6とを備える図1の符号化装置100、または、周波数領域変換部1と重み付け包絡正規化部2と正規化利得計算部3と量子化部4と並べ替え部5と符号化部6と間隔決定部7と補助情報生成部8を備える図10の符号化装置100aにより行われる。ただし、符号化装置100または符号化装置100aは周波数領域変換部1と重み付け包絡正規化部2と正規化利得計算部3と量子化部4とは必ずしも備える必要は無く、例えば、符号化装置100は並べ替え部5と符号化部6、符号化装置100aは並べ替え部5と符号化部6と間隔決定部7と補助情報生成部8とにより構成されることもある。なお、図10に例示される符号化装置100aでは間隔決定部7が並べ替え部5と符号化部6と補助情報生成部8を含むが、このような構成に限定されるものではない。
まず、周波数領域変換部1がフレーム単位で音声音響ディジタル信号を周波数領域のN点のMDCT係数列に変換する(ステップS1)。
重み付け包絡正規化部2が、フレーム単位の音声音響ディジタル信号に対する線形予測分析によって求められた線形予測係数を用いて推定された音声音響ディジタル信号のパワースペクトル包絡係数列によって、入力されたMDCT係数列の各係数を正規化し、重み付け正規化MDCT係数列を出力する(ステップS2)。ここでは聴覚的に歪が小さくなるような量子化の実現のために、重み付け包絡正規化部2は、パワースペクトル包絡を鈍らせた重み付けパワースペクトル包絡係数列を用いて、フレーム単位でMDCT係数列の各係数を正規化する。この結果、重み付け正規化MDCT係数列は、入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、音声音響ディジタル信号のパワースペクトル包絡係数列と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、ピッチ周期に起因する微細構造をもつもの、となる。
N点のMDCT係数列の各係数X(1),・・・,X(N)に対応するパワースペクトル包絡係数列の各係数W(1),・・・,W(N)は、線形予測係数を周波数領域に変換して得ることができる。例えば、全極型モデルであるp次自己回帰過程により、時刻tの時間信号x(t)は、p時点まで遡った過去の自分自身の値x(t-1),・・・,x(t-p)と予測残差e(t)と線形予測係数α1,・・・,αpによって式(1)で表される。このとき、パワースペクトル包絡係数列の各係数W(n)[1≦n≦N]は式(2)で表される。exp(・)はネイピア数を底とする指数関数、jは虚数単位、σ2は予測残差エネルギーである。
<例1>
重み付け包絡正規化部2は、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数の補正値Wγ(1),・・・,Wγ(N)で除算することによって、重み付け正規化MDCT係数列の各係数X(1)/Wγ(1),・・・,X(N)/Wγ(N)を得る処理を行う。補正値Wγ(n)[1≦n≦N]は式(3)で与えられる。但し、γは1以下の正の定数であり、パワースペクトル係数を鈍らせる定数である。
重み付け包絡正規化部2は、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数のβ乗(0<β<1)の値W(1)β,・・・,W(N)βで除算することによって、重み付け正規化MDCT係数列の各係数X(1)/W(1)β,・・・,X(N)/W(N)βを得る処理を行う。
次に、正規化利得計算部3が、フレームごとに、重み付け正規化MDCT係数列の各係数を与えられた総ビット数で量子化できるように、全周波数に亘る振幅値の和またはエネルギー値を用いて量子化ステップ幅を決定し、この量子化ステップ幅になるように重み付け正規化MDCT係数列の各係数を割り算する係数(以下、利得という。)を求める(ステップS3)。この利得を表す情報は、利得情報として復号側へ伝送される。正規化利得計算部3は、フレームごとに、重み付け正規化MDCT係数列の各係数をこの利得で正規化(除算)する。
次に、量子化部4が、フレームごとに、利得で正規化された重み付け正規化MDCT係数列の各係数をステップS3の処理で決定された量子化ステップ幅で量子化する(ステップS4)。
ステップS4の処理で得られたフレーム単位の量子化MDCT係数列は、本実施形態の要部である並べ替え部5の入力となるが、並べ替え部5の入力は、ステップS1〜ステップS4の各処理で得られた係数列に限定されない。例えば、重み付け包絡正規化部2による正規化が適用されていない係数列や量子化部4による量子化が適用されていない係数列であってもよい。このことを明示的に理解するため、以下、並べ替え部5の入力を音響信号に由来する「周波数領域のサンプル列」あるいは単に「サンプル列」と呼称することにする。この実施形態では、ステップS4の処理で得られた量子化MDCT係数列が「周波数領域のサンプル列」に相当し、この場合、周波数領域のサンプル列を構成するサンプルは量子化MDCT係数列に含まれる係数に相当する。
この並べ替え処理の具体例を説明する。例えば、並べ替え部5は、(1)サンプル列の全てのサンプルを含み、かつ、(2)サンプル列のうちの音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、サンプル列のうちの音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるようにサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、を並べ替え後のサンプル列として出力する。つまり、音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、当該音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルが集まるように、入力されたサンプル列に含まれる少なくとも一部のサンプルが並べ替えられる。
このように並べ替えられた後のサンプル列は、周波数を横軸とし、サンプルの指標を縦軸とした場合に、サンプルの指標の包絡線が周波数の増大に伴って増大傾向を示すことになる。換言すれば、並べ替え部5は、サンプルの指標の包絡線が周波数の増大に伴って増大傾向を示すように入力されたサンプル列に含まれる少なくとも一部のサンプルを並べ替えると言ってもよい。
符号化部6が、入力された並べ替え後のサンプル列を符号化し、得られた符号列を出力する(ステップS6)。符号化部6は、入力された並べ替え後のサンプル列に含まれるサンプルの振幅の偏りに応じて可変長符号化を切り替えて符号化する。つまり、並べ替えによってフレーム内で低域側(あるいは高域側)に振幅の大きなサンプルが集められているので、符号化部6はその偏りに適した可変長符号化を行う。並べ替え後のサンプル列のように、局所的な領域ごとに同等か同程度の振幅を持つサンプルが集まっていると、例えば領域ごとに異なるライスパラメータでライス符号化することによって平均符号量を削減できる。以下、フレーム内で低域側(フレームの先頭に近い側)に振幅の大きなサンプルが集められている場合を例に採って説明する。
具体例として、符号化部6は、大きな振幅に対応する指標をもつサンプルが集まっている領域ではサンプルごとにライス符号化(ゴロム-ライス符号化ともいう)を適用する。
"1":ライス符号化を適用しない。
"01":ライス符号化を先頭から1/32の領域にライスパラメータを1として適用する。
"001":ライス符号化を先頭から1/32の領域にライスパラメータを2として適用する。
"0001":ライス符号化を先頭から1/16の領域にライスパラメータを1として適用する。
"00001":ライス符号化を先頭から1/16の領域にライスパラメータを2として適用する。
"00000":ライス符号化を先頭から1/32の領域にライスパラメータを3として適用する。
間隔Tの決定方法について説明する。簡便な決定方法の一例として、間隔Tの異なるZ個の候補T1,T2,…,TZを予め用意しておき、並べ替え部5が各候補Ti(i=1,2,…,Z)についてサンプル列に含まれるサンプルの並べ替えを実施し、後述する符号化部6が各候補Tiに基づいて得られたサンプル列に対応する符号列の符号量を得て、最小の符号量を与えた候補Tiを間隔Tとして選択するという決定方法を挙げることができる。サンプル列に含まれるサンプルの並べ替えを特定する補助情報、例えば、間隔Tを符号化して得られる符号、は符号化部6から出力される。
サンプル列に含まれるサンプルの並べ替えを特定する補助情報によって表現することが可能な間隔Tの候補は、補助情報を固定長符号化するか可変長符号化するか等の後述する符号化方法と対応して予め定められている。間隔決定部7は、この予め定められている間隔Tの異なるZ個の候補T1,T2,…,TZの中から予め決定されたZ1個の候補を記憶しておく(Z1<Z)。その目的は予備選択処理の対象となる候補の数を少なくすることにある。予備選択処理の対象となる候補には、T1,T2,…,TZのうち、そのフレームの間隔Tとして好ましいものをできるだけ多く含むことが望まれる。しかし実際には予備選択処理を行う前の段階では好ましさは不明であるので、間隔決定部7は、例えば、Z個の候補T1,T2,…,TZの中から等間隔に選択したZ1個の候補を予備選択処理の対象とする。例えば「Z個の候補T1,T2,…,TZの中の奇数番目の候補を予備選択処理の対象とする」(この場合、Z1=ceil(Z/2)となる。ceil(・)は天井関数である)という基準でZ個の候補T1,T2,…,TZの中のZ1個の候補を予備選択処理の対象とすればよい。Z個の候補の集合をSZとし(SZ={T1,T2,…,TZ})、Z1個の候補の集合をSZ1とする。
次に、間隔決定部7は、(A)の予備選択処理で得られた候補の集合SZ2に一つまたは複数の候補を追加する処理を行う。この追加処理を行う目的は、フレームごとにZ2の値が変わりえる場合にZ2の値が小さくなりすぎて上述の最終選択処理における間隔Tの探索範囲が狭くなりすぎることを防止すること、あるいは、Z2の値がある程度大きな値であったとしても、上述の最終選択処理において適切な間隔Tが決定される可能性を少しでも広げること、である。なお、本発明の間隔Tの決定方法の目的は、演算処理量を従来技術より少なくすることであるから、集合SZ2の要素(候補)の数を|SZ2|と表せば|SZ2|=Z2であり、追加される候補の数をQとすると、QがZ2+Q<Zを満たすことが必須条件となる。さらに好ましい条件は、QがZ2+Q<Z1を満たすことである。追加される候補は、例えば、集合SZ2に含まれる候補Tkの前後の候補Tk-1,Tk+1∈SZとしてもよい(ここでの「前後」とは、集合SZ={T1,T2,…,TZ}に値の大きさに基づく順序T1<T2<…<TZを導入したときの前後を意味する)。この理由は(A)の予備選択処理の対象であるZ1個の候補に候補Tk-1,Tk+1が含まれていない可能性があるからである。ただし、候補Tk-1,Tk+1∈SZ1であって候補Tk-1,Tk+1が集合SZ2に含まれない場合、候補Tk-1,Tk+1を追加しないようにしてもよい。また、追加される候補は、集合SZから選択されればよく、例えば、集合SZ2に含まれる候補Tkについて、Tk−α(ただし、Tk−α∈SZ)および/またはTk+β(ただし、Tk+β∈SZ)を新しい候補として追加するようにしてもよい。ここでα,βは例えば予め定められた正の実数値である。α=βであってもよい。Tk−αおよび/またはTk+βが集合SZ2に含まれる他の候補と重複する場合は、このTk−αおよび/またはTk+βを追加しないようにする(追加しても意味がないからである)。Z2+Q個の候補の集合をSZ3とする。続いて、(D1)または(D2)の処理が行われる。
(D1−ステップS731)間隔決定部7は、間隔Tを決定する対象のフレームが時間的に先頭のフレームである場合、集合SZ3に含まれるZ2+Q個の候補について上述の予備選択処理を実施する。この予備選択処理で絞り込まれた候補の数をY個とする。YはY<Z2+Qを満たす。
間隔決定部7は、フレームXt-1において間隔Tを決定する際に後述の(E)の最終選択処理の対象となった候補の集合SYに一つまたは複数の候補を追加する処理を行う。集合SYに対して追加される候補は、例えば、集合SYに含まれる候補Tmの前後の候補Tm-1,Tm+1∈SZとしてもよい(ここでの「前後」とは、集合SZ={T1,T2,…,TZ}に値の大きさに基づく順序T1<T2<…<TZを導入したときの前後を意味する)。また、追加される候補は、集合SZから選択されればよく、例えば、集合SYに含まれる候補Tmについて、Tm−γ(ただし、Tm−γ∈SZ)および/またはTm+η(ただし、Tm+η∈SZ)を新しい候補として追加するようにしてもよい。ここでγ,ηは例えば予め定められた正の実数値である。γ=ηであってもよい。Tm−γおよび/またはTm+ηが集合SYに含まれる他の候補と重複する場合は、このTm−γおよび/またはTm+ηを追加しないようにする(追加しても意味がないからである)。続いて、(D2)の処理が行われる。
間隔決定部7はY個の候補のそれぞれについて、各候補に基づく上記で説明したサンプル列の並べ替えを行い、並べ替え後のサンプル列を符号化して符号列を得て、符号列の実際の符号量を求め、最小の符号量を与えた候補を間隔Tとして選択する。サンプル列の並べ替えは並べ替え部5が行ない、並べ替え後のサンプル列の符号化は符号化部6が行う。(A)または(D)における予備選択処理で並べ替え後のサンプル列が得られている候補については、予備選択処理で得られた並べ替え後のサンプル列を入力として符号化部6が符号化を行えばよい。
<条件A>
フレームについて、
(1)当該フレームが時間的に先頭ではなく、
(2)一つ前のフレームが本発明の符号化方法に従って符号化されたものであり、かつ、
(3)一つ前のフレームが上述の並べ替え処理の適用を受けている。
音声や楽音などの音響信号では複数のフレームに跨る定常的な信号区間では現在のフレームと過去のフレームとの相関が高いことが多い。定常信号の持つこのような性質を利用して、(D2)の処理にてSZ3とSPの比率を変えることによって圧縮性能を維持しつつ、より処理演算量を下げることができる。なお、ここでの比率は、SZ3に対するSPの比として定められていてもよいし、SPに対するSZ3の比として定められていてもよいし、SZ3∪SPにおけるSPの占有率として定められていてもよいし、SZ3∪SPにおけるSZ3の占有率として定められていてもよい。
(a-1)「現フレームの音響信号の予測利得」が大きい、
(a-2)「現フレームの音響信号の予測利得の推定値」が大きい、
(b-1)「直前フレームの音響信号の予測利得」と「現フレームの音響信号の予測利得」との差分が小さい、
(b-2)「直前フレームの音響信号の予測利得の推定値」と「現フレームの音響信号の予測利得の推定値」との差分が小さい
(c-1)「現フレームに含まれる音響信号のサンプルの振幅の和」が大きい、
(c-2)「現フレームに含まれる音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」が大きい、
(d-1)「直前フレームに含まれる音響信号のサンプルの振幅の和」と「現フレームに含まれる音響信号のサンプルの振幅の和」との差分が小さい、
(d-2)「直前フレームに含まれる音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」と「現フレームに含まれる音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」との差分が小さい、
(e-1)「現フレームの音響信号のパワー」が大きい、
(e-2)「現フレームの音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」が大きい、
(f-1)「直前フレームの音響信号のパワー」と「現フレームの音響信号のパワー」との差分が小さい、
(f-2)「直前フレームの音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」と「現フレームの音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」との差分が小さい、
ほど大きくなる値である。
「フレームの音響信号の予測利得」は、重み付け包絡正規化部2で用いる当該フレームの線形予測係数と対応するm次のPARCOR係数をkmとしたとき、
により計算されるEのことである。ここで、線形予測係数と対応するPARCOR 係数は、量子化前の全次のPARCOR係数とする。なお、線形予測係数と対応するPARCOR 係数として、一部の次数(例えば、1次からP2次まで。ただし、P2<P。)の量子化前のPARCOR係数、または、一部または全次の量子化後のPARCOR係数、を用いてEを計算した場合は、計算されたEは「フレームの音響信号の予測利得の推定値」となる。
「フレームに含まれる音響信号のサンプルの振幅の和」とは、当該フレームに含まれる音声音響ディジタル信号のサンプル値の絶対値の総和、または、周波数領域変換部1が出力した当該フレームのMDCT係数列に含まれるサンプルの値の絶対値の総和、である。
「フレームの音響信号のパワー」とは、当該フレームに含まれる音声音響ディジタル信号のサンプル値の二乗の総和、または、周波数領域変換部1が出力した当該フレームのMDCT係数列に含まれるサンプルの値の二乗の総和、である。
G<ε1 ⇒ SZ3∪SPにおけるSPの比率:10%
ε1≦G<ε2 ⇒ SZ3∪SPにおけるSPの比率:20%
…
εk-1≦G<εk ⇒ SZ3∪SPにおけるSPの比率:80%
εk≦G ⇒ SZ3∪SPにおけるSPの比率:90%
と予め定めておくのである。ここでは(a)の基準の「現フレームの音響信号の予測利得」だけを用いる例について説明したが、他の基準はもとより、上記(a)〜(f)のうち二つ以上の間の論理和や論理積を定常性の大小判定に用いる場合であっても、ルックアップテーブルに、定常性の大小の程度に応じてSZ3とSPの異なる比率を設定しておくことができる。
G<ε1 ⇒ Z2=16,Q=30
ε1≦G<ε2 ⇒ Z2=12,Q=20
…
εk-1≦G<εk ⇒ Z2=4,Q=4
εk≦G ⇒ Z2=2,Q=0
と予め定めておくのである。ここでは(a)の基準の「現フレームの音響信号の予測利得」だけを用いる例について説明したが、他の基準はもとより、上記(a)〜(f)のうち二つ以上の間の論理和や論理積を定常性の大小判定に用いる場合であっても、ルックアップテーブルに、定常性の大小の程度に応じたZ1,Z2,Qの値を設定しておくことができる。
これまで少ない演算処理量で間隔Tを決定する方法を説明したが、当該方法によって決定されるべき対象は間隔Tに限定されない。当該方法は、例えば、サンプルの並べ替えの際に上記サンプル群を特定するための情報である音響信号の周期性特徴量(例えば基本周波数やピッチ周期など)を決定する方法としても使用することができる。すなわち、間隔決定部7を周期性特徴量決定装置として機能させ、並べ替え後のサンプル列を符号化して得られる符号列を出力することなく、間隔Tを周期性特徴量として決定してもよい。この場合、上述の[間隔Tの決定方法]の説明にて、「間隔T」を「ピッチ周期」に読み替えればよく、または、サンプル列のサンプリング周波数を「間隔T」で除算した値を「基本周波数」とすればよく、少ない演算処理量でサンプルの並べ替えのための基本周波数やピッチ周期を決定することができる。
符号化部6または補助情報生成部8は、サンプル列に含まれるサンプルの並べ替えを特定する補助情報、すなわち、音響信号の周期性を表す情報、または基本周波数を表す情報、または音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔Tを表す情報を出力する。なお、符号化部6が補助情報を出力する場合、サンプル列の符号化処理の中で補助情報を得る処理を行ってもよいし、当該符号化処理と別の処理として補助情報を得る処理を行ってもよい。例えば間隔Tをフレーム毎に決定する場合は、サンプル列に含まれるサンプルの並べ替えを特定する補助情報もフレーム毎に出力されることになる。サンプル列に含まれるサンプルの並べ替えを特定する補助情報は、周期性、基本周波数または間隔Tをフレーム毎に符号化して得られる。この符号化は固定長符号化であってもよいし、可変長符号化して平均符号量を削減してもよい。固定長符号化する場合は、例えば、補助情報と当該補助情報を一意に特定可能な符号とが対応付けられて記憶されており、入力された補助情報に対応する符号を出力する構成となる。可変長符号化する場合は、前フレームの間隔Tと現フレームの間隔Tの差分を可変長符号化した情報を間隔Tを表す情報としもよい。この場合は、例えば、間隔Tの差分値と当該差分値を一意に特定可能な符号とが対応付けられて記憶されており、入力された前フレームの間隔Tと現フレームの間隔Tの差分に対応する符号を出力する構成となる。同様に、前フレームの基本周波数と現フレームの基本周波数の差分を可変長符号化した情報を基本周波数を表す情報としてもよい。また、nを複数の選択肢から選択可能な場合には、nの上限値あるいは上述の上限Nを補助情報に含めてもよい。
また、この実施形態では、各サンプル群に含まれるサンプルの個数が、周期性や基本周波数ないしその整数倍に対応するサンプル(以下、中心サンプルという)とその前後1サンプルの計3サンプルであるという固定された個数の例を示したが、サンプル群に含まれるサンプルの個数やサンプルインデックスを可変とする場合には、サンプル群に含まれるサンプルの個数とサンプルインデックスの組み合わせが異なる複数の選択肢の中から選択された一つを表す情報も補助情報に含める。
例えば、選択肢として、
(1)中心サンプルのみ、F(nT)
(2)中心サンプルとその前後1サンプルの計3サンプル、F(nT-1),F(nT),F(nT+1)
(3)中心サンプルとその前2サンプルの計3サンプル、F(nT-2),F(nT-1),F(nT)
(4)中心サンプルとその前3サンプルの計4サンプル、F(nT-3),F(nT-2),F(nT-1),F(nT)
(5)中心サンプルとその後2サンプルの計3サンプル、F(nT),F(nT+1),F(nT+2)
(6)中心サンプルとその後3サンプルの計4サンプル、F(nT),F(nT+1),F(nT+2),F(nT+3)
が設定されている場合に、(4)が選択されたならば、この(4)が選択されたことを表す情報が補助情報に含められる。この例であれば、選択された選択肢を表す情報として3ビットあれば十分である。
なお、サンプル列に含まれるサンプルの並べ替えによる利点が無い場合も考えられる。このような場合には並べ替え前のサンプル列を符号化すべきである。そこで、並べ替え部5からは並べ替え前のサンプル列(並べ替えを行っていないサンプル列)も出力し、符号化部6は並べ替え前のサンプル列も可変長符号化して符号列を得て、並べ替え前のサンプル列を可変長符号化して得られる符号列の符号量と、並べ替え後のサンプル列を可変長符号化して得られる符号列の符号量と補助情報の符号量との合計符号量とを比較する。
続いて図5〜図6を参照して復号処理を説明する。
復号装置200では、符号化装置100または符号化装置100aによる符号化処理と逆順の処理でMDCT係数が再構成される。復号装置200には、少なくとも、上記利得情報と、上記補助情報と、上記符号列が入力される。なお、符号化装置100aから第2補助情報が出力された場合にはこの第2補助情報も復号装置200に入力される。
まず、復号部11が、フレームごとに、入力された符号列を選択情報に応じて復号して周波数領域のサンプル列を出力する(ステップS11)。当然であるが、符号列を得るために実行された符号化方法に対応する復号方法が実行される。復号部11による復号処理の詳細は符号化装置100の符号化部6による符号化処理の詳細に対応するので、当該符号化処理の説明をここに援用し、実行された符号化に対応する復号が復号部11の行う復号処理であることを明記し、これをもって復号処理の詳細な説明とする。なお、どのような符号化方法が実行されたかは選択情報によって特定される。選択情報に、例えば、ライス符号化の適用領域とライスパラメータを特定する情報と、ランレングス符号化の適用領域を表す情報と、エントロピー符号化の種類を特定する情報が含まれている場合には、これらの符号化方法に応じた復号方法が入力された符号列の対応する領域に適用される。ライス符号化に対応する復号処理、エントロピー符号化に対応する復号処理、ランレングス符号化に対応する復号処理はいずれも周知であるから説明を省略する。
次に、回復部12が、フレームごとに、入力された補助情報に従って、復号部11が出力した周波数領域のサンプル列から元のサンプルの並びを得る(ステップS12)。ここで「元のサンプルの並び」とは、符号化装置100の並べ替え部5に入力された「周波数領域のサンプル列」に相当する。上述のとおり、符号化装置100の並べ替え部5による並べ替え方法や並べ替え方法に対応する並べ替えの選択肢は種々あるが、並べ替えが実行された場合には実行された並べ替えは一つであり、その並べ替えを特定する情報は補助情報に含まれている。よって、回復部12は補助情報に基づいて復号部11が出力した周波数領域のサンプル列を元のサンプルの並びに戻すことができる。
そして、補助情報には、例えば、間隔Tに関する情報や、nが1以上5以下の各整数であることを表す情報や、サンプル群には3サンプルが含まれることを特定する情報などが含められている。従って、回復部12は、この補助情報に基づいて、入力されたサンプル列F(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1),F(1),…,F(T-2),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…F(jmax)を元のサンプルの並びF(j)(1≦j≦jmax)に戻すことができる。
次に、逆量子化部13が、フレームごとに、回復部12が出力した元のサンプルの並びF(j)(1≦j≦jmax)を逆量子化する(ステップS13)。上述の例に対応させて述べれば、逆量子化によって、符号化装置100の量子化部4に入力された「利得で正規化された重み付け正規化MDCT係数列」が得られる。
次に、利得乗算部14が、フレームごとに、逆量子化部13が出力した「利得で正規化された重み付け正規化MDCT係数列」の各係数に、上記利得情報で特定される利得を乗じて、「正規化された重み付け正規化MDCT係数列」を得る(ステップS14)。
次に、重み付け包絡逆正規化部15が、フレームごとに、利得乗算部14が出力した「正規化された重み付け正規化MDCT係数列」の各係数に重み付けパワースペクトル包絡値を除算することで「MDCT係数列」を得る(ステップS15)。
次に、時間領域変換部16が、フレームごとに、重み付け包絡逆正規化部15が出力した「MDCT係数列」を時間領域に変換してフレーム単位の音声音響ディジタル信号を得る(ステップS16)。
上述の実施形態に関わる符号化装置/復号装置は、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、CPU(Central Processing Unit)〔キャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)やROM(Read Only Memory)と、ハードディスクである外部記憶装置、並びにこれらの入力部、出力部、CPU、RAM、ROM、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、符号化装置/復号装置に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
Claims (26)
- フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔T、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定ステップと、
上記間隔決定ステップで決定された間隔Tを符号化して補助情報を得る補助情報生成ステップと、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記間隔決定ステップで決定された間隔Tに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
上記間隔決定ステップは、
上記補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を上記集合Sとして、上記間隔Tを決定するステップであり、
上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に隣接する値または/および所定の差分を持つ値を上記集合Sに加える追加ステップを更に含む
ことを特徴とする符号化方法。 - フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔T、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定ステップと、
上記間隔決定ステップで決定された間隔Tを符号化して補助情報を得る補助情報生成ステップと、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記間隔決定ステップで決定された間隔Tに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
上記間隔決定ステップは、
上記補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を上記集合Sとして、上記間隔Tを決定するステップであり、
上記補助情報で表現可能な間隔TのZ個の候補のうちの一部であるZ1個の候補から、現在のフレームの上記音響信号または/およびサンプル列から求まる指標に基づいて選択した一部の候補を上記Z2個の候補(ただしZ2<Z1)とする予備選択ステップを更に含む
ことを特徴とする符号化方法。 - フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔T、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定ステップと、
上記間隔決定ステップで決定された間隔Tを符号化して補助情報を得る補助情報生成ステップと、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記間隔決定ステップで決定された間隔Tに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
上記間隔決定ステップは、
上記補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を上記集合Sとして、上記間隔Tを決定するステップであり、
上記補助情報で表現可能な間隔TのZ個の候補のうちの一部であるZ1個の候補から、現在のフレームの上記音響信号または/およびサンプル列から求まる指標に基づいて一部の候補を選択する予備選択ステップと、
上記予備選択ステップで選択された候補と、上記予備選択ステップで選択された候補に隣接する値または/および所定の差分を持つ値とのセットを上記Z2個の候補とする第二追加ステップを更に含む
ことを特徴とする符号化方法。 - フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔T、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定ステップと、
上記間隔決定ステップで決定された間隔Tを符号化して補助情報を得る補助情報生成ステップと、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記間隔決定ステップで決定された間隔Tに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
上記間隔決定ステップは、
上記補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を上記集合Sとして、上記間隔Tを決定するステップであり、
現在のフレームの上記音響信号または/およびサンプル列から求まる指標に基づいて、上記集合Sに含まれる間隔Tの候補のうちの一部の候補を選択する第二予備選択ステップと、
上記第二予備選択ステップで選択された一部の候補により構成される集合を対象として上記間隔Tを決定する最終選択ステップとを含む
こと特徴とする符号化方法。 - フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔T、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定ステップと、
上記間隔決定ステップで決定された間隔Tを符号化して補助情報を得る補助情報生成ステップと、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記間隔決定ステップで決定された間隔Tに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
上記間隔決定ステップは、
上記補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を上記集合Sとして、上記間隔Tを決定するステップであり、
現在のフレームの上記音響信号の定常性の大きさを表す指標値が大きいほど、上記集合Sにて、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補が占める割合が大きい
ことを特徴とする符号化方法。 - フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔T、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定ステップと、
上記間隔決定ステップで決定された間隔Tを符号化して補助情報を得る補助情報生成ステップと、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記間隔決定ステップで決定された間隔Tに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
上記間隔決定ステップは、
上記補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を上記集合Sとして、上記間隔Tを決定するステップであり、
現在のフレームの上記音響信号の定常性の大きさを表す指標値が所定の条件より小さい場合には、上記集合Sには上記Z2個の候補のみが含まれる
ことを特徴とする符号化方法。 - 請求項5または請求項6に記載の符号化方法であって、上記現在のフレームの上記音響信号の定常性の大きさを表す指標値は、
(a-1)「現在のフレームの上記音響信号の予測利得」が大きくなる、
(a-2)「現在のフレームの上記音響信号の予測利得の推定値」が大きくなる、
(b-1)「直前のフレームの予測利得」と「現在のフレームの予測利得」との差分が小さくなる、
(b-2)「直前のフレームの予測利得の推定値」と「現在のフレームの予測利得の推定値」との差分が小さくなる、
(c-1)「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」が大きくなる、
(c-2)「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」が大きくなる、
(d-1)「直前のフレームに含まれる上記音響信号のサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」との差分が小さくなる、
(d-2)「直前のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」との差分が小さくなる、
(e-1)「現在のフレームの上記音響信号のパワー」が大きくなる、
(e-2)「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」が大きくなる、
(f-1)「直前のフレームの上記音響信号のパワー」と「現在のフレームの上記音響信号のパワー」との差分が小さくなる、
(f-2)「直前のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」と「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」との差分が小さくなる、の少なくともいずれか一つの条件を満たす場合に、大きくなる値である
ことを特徴とする符号化方法。 - フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔T、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定ステップと、
上記間隔決定ステップで決定された間隔Tを符号化して補助情報を得る補助情報生成ステップと、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記間隔決定ステップで決定された間隔Tに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
上記間隔決定ステップは、
上記補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を上記集合Sとして、上記間隔Tを決定するステップであり、
上記サンプル列符号化ステップは、
上記並べ替え前のサンプル列を符号化して得られる符号列と、上記並べ替え後のサンプル列を符号化して得られる符号列と上記補助情報、のうち符号量が少ない方を出力するステップを含む
ことを特徴とする符号化方法。 - フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔T、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定ステップと、
上記間隔決定ステップで決定された間隔Tを符号化して補助情報を得る補助情報生成ステップと、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記間隔決定ステップで決定された間隔Tに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
上記間隔決定ステップは、
上記補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を上記集合Sとして、上記間隔Tを決定するステップであり、
上記サンプル列符号化ステップは、
上記並べ替え後のサンプル列を符号化して得られる符号列の符号量またはその推定値と上記補助情報の符号量との合計が、上記並べ替え前のサンプル列を符号化して得られる符号列の符号量またはその推定値より少ない場合には、上記並べ替え後のサンプル列を符号化して得られる符号列と上記補助情報とを出力し、
上記並べ替え前のサンプル列を符号化して得られる符号列の符号量またはその推定値が、上記並べ替え後のサンプル列を符号化して得られる符号列の符号量またはその推定値と上記補助情報の符号量との合計より少ない場合には、上記並べ替え前のサンプル列を符号化して得られる符号列を出力する
ことを特徴とする符号化方法。 - 請求項8または請求項9に記載の符号化方法であって、
直前のフレームで出力した符号列が並べ替え後のサンプル列を符号化して得られた符号列である場合のほうが、直前のフレームで出力した符号列が並べ替え前のサンプル列を符号化して得られた符号列である場合よりも、上記集合Sにて、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補が占める割合が大きい
ことを特徴とする符号化方法。 - 請求項8から請求項10のいずれかに記載の符号化方法であって、
直前のフレームで出力した符号列が並べ替え前のサンプル列を符号化して得られた符号列である場合には、上記集合Sには上記Z2個の候補のみが含まれる
ことを特徴とする符号化方法。 - 請求項8から請求項10のいずれかに記載の符号化方法であって、
現在のフレームが時間的に先頭にあるフレームである場合、直前のフレームが上記の符号化方法以外で符号化された場合、直前のフレームで出力した符号列が並べ替え前のサンプル列を符号化して得られた符号列である場合、の何れかに該当する場合には、上記集合Sには上記Z2個の候補のみが含まれる
ことを特徴とする符号化方法。 - フレーム単位の音響信号の周期性特徴量を決定する方法であって、
フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定ステップと、
周期性特徴量決定ステップで得られた周期性特徴量を符号化して補助情報を得る補助情報生成ステップとを有し、
上記周期性特徴量決定ステップは、
上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するステップであり、
上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補に隣接する値または/および所定の差分を持つ値を上記集合Sに加える追加ステップを更に含む
ことを特徴とする周期性特徴量決定方法。 - フレーム単位の音響信号の周期性特徴量を決定する方法であって、
フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定ステップと、
周期性特徴量決定ステップで得られた周期性特徴量を符号化して補助情報を得る補助情報生成ステップとを有し、
上記周期性特徴量決定ステップは、
上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するステップであり、
上記補助情報で表現可能な間隔TのZ個の候補のうちの一部であるZ 1 個の候補から、現在のフレームの上記音響信号または/および上記音響信号に由来する周波数領域のサンプル列から求まる指標に基づいて選択した一部の候補を上記Z 2 個の候補(ただしZ 2 <Z 1 )とする予備選択ステップを更に含む
ことを特徴とする周期性特徴量決定方法。 - フレーム単位の音響信号の周期性特徴量を決定する方法であって、
フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定ステップと、
周期性特徴量決定ステップで得られた周期性特徴量を符号化して補助情報を得る補助情報生成ステップとを有し、
上記周期性特徴量決定ステップは、
上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するステップであり、
上記補助情報で表現可能な間隔TのZ個の候補のうちの一部であるZ 1 個の候補から、現在のフレームの上記音響信号または/および上記音響信号に由来する周波数領域のサンプル列から求まる指標に基づいて一部の候補を選択する予備選択ステップと、
上記予備選択ステップで選択された候補と、上記予備選択ステップで選択された候補に隣接する値または/および所定の差分を持つ値とのセットを上記Z 2 個の候補とする第二追加ステップを更に含む
ことを特徴とする周期性特徴量決定方法。 - フレーム単位の音響信号の周期性特徴量を決定する方法であって、
フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定ステップと、
周期性特徴量決定ステップで得られた周期性特徴量を符号化して補助情報を得る補助情報生成ステップとを有し、
上記周期性特徴量決定ステップは、
上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するステップであり、
現在のフレームの上記音響信号または/および上記音響信号に由来する周波数領域のサンプル列から求まる指標に基づいて、上記集合Sに含まれる間隔Tの候補のうちの一部の候補を選択する第二予備選択ステップと、
上記第二予備選択ステップで選択された一部の候補により構成される集合を対象として上記間隔Tを決定する最終選択ステップとを含む
ことを特徴とする周期性特徴量決定方法。 - フレーム単位の音響信号の周期性特徴量を決定する方法であって、
フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定ステップと、
周期性特徴量決定ステップで得られた周期性特徴量を符号化して補助情報を得る補助情報生成ステップとを有し、
上記周期性特徴量決定ステップは、
上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するステップであり、
現在のフレームの上記音響信号の定常性の大きさを表す指標値が大きいほど、上記集合Sにて、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補が占める割合が大きい
ことを特徴とする周期性特徴量決定方法。 - 請求項17に記載の周期性特徴量決定方法であって、
現在のフレームの上記音響信号の定常性の大きさを表す指標値が所定の条件より小さい場合には、上記集合Sには上記Z2個の候補のみが含まれる
ことを特徴とする周期性特徴量決定方法。 - 請求項17または請求項18に記載の周期性特徴量決定方法であって、上記現在のフレームの上記音響信号の定常性の大きさを表す指標値は、
(a-1)「現在のフレームの上記音響信号の予測利得」が大きくなる、
(a-2)「現在のフレームの上記音響信号の予測利得の推定値」が大きくなる、
(b-1)「直前のフレームの予測利得」と「現在のフレームの予測利得」との差分が小さくなる、
(b-2)「直前のフレームの予測利得の推定値」と「現在のフレームの予測利得の推定値」との差分が小さくなる、
(c-1)「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」が大きくなる、
(c-2)「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」が大きくなる、
(d-1)「直前のフレームに含まれる上記音響信号のサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」との差分が小さくなる、
(d-2)「直前のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」との差分が小さくなる、
(e-1)「現在のフレームの上記音響信号のパワー」が大きくなる、
(e-2)「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」が大きくなる、
(f-1)「直前のフレームの上記音響信号のパワー」と「現在のフレームの上記音響信号のパワー」との差分が小さくなる、
(f-2)「直前のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」と「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」との差分が小さくなる、の少なくともいずれか一つの条件を満たす場合に、大きくなる値である
ことを特徴とする周期性特徴量決定方法。 - フレーム単位の音響信号の周期性特徴量を決定する装置であって、
フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定部と、
周期性特徴量決定部で得られた周期性特徴量を符号化して補助情報を得る補助情報生成部とを有し、
上記周期性特徴量決定部は、
上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するものであり、
上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補に隣接する値または/および所定の差分を持つ値を上記集合Sに加える追加部を更に含む
ことを特徴とする周期性特徴量決定装置。 - フレーム単位の音響信号の周期性特徴量を決定する装置であって、
フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定部と、
周期性特徴量決定部で得られた周期性特徴量を符号化して補助情報を得る補助情報生成部とを有し、
上記周期性特徴量決定部は、
上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するものであり、
上記補助情報で表現可能な間隔TのZ個の候補のうちの一部であるZ 1 個の候補から、現在のフレームの上記音響信号または/および上記音響信号に由来する周波数領域のサンプル列から求まる指標に基づいて選択した一部の候補を上記Z 2 個の候補(ただしZ 2 <Z 1 )とする予備選択部を更に含む
ことを特徴とする周期性特徴量決定装置。 - フレーム単位の音響信号の周期性特徴量を決定する装置であって、
フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定部と、
周期性特徴量決定部で得られた周期性特徴量を符号化して補助情報を得る補助情報生成部とを有し、
上記周期性特徴量決定部は、
上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するものであり、
上記補助情報で表現可能な間隔TのZ個の候補のうちの一部であるZ 1 個の候補から、現在のフレームの上記音響信号または/および上記音響信号に由来する周波数領域のサンプル列から求まる指標に基づいて一部の候補を選択する予備選択部と、
上記予備選択部で選択された候補と、上記予備選択部で選択された候補に隣接する値または/および所定の差分を持つ値とのセットを上記Z 2 個の候補とする第二追加部を更に含む
ことを特徴とする周期性特徴量決定装置。 - フレーム単位の音響信号の周期性特徴量を決定する装置であって、
フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定部と、
周期性特徴量決定部で得られた周期性特徴量を符号化して補助情報を得る補助情報生成部とを有し、
上記周期性特徴量決定部は、
上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するものであり、
現在のフレームの上記音響信号または/および上記音響信号に由来する周波数領域のサンプル列から求まる指標に基づいて、上記集合Sに含まれる間隔Tの候補のうちの一部の候補を選択する第二予備選択部と、
上記第二予備選択部で選択された一部の候補により構成される集合を対象として上記間隔Tを決定する最終選択部とを含む
ことを特徴とする周期性特徴量決定装置。 - フレーム単位の音響信号の周期性特徴量を決定する装置であって、
フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定部と、
周期性特徴量決定部で得られた周期性特徴量を符号化して補助情報を得る補助情報生成部とを有し、
上記周期性特徴量決定部は、
上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補に依存せずに選択されたZ 2 個の候補(ただし、Z 2 <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するものであり、
現在のフレームの上記音響信号の定常性の大きさを表す指標値が大きいほど、上記集合Sにて、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補が占める割合が大きい
ことを特徴とする周期性特徴量決定装置。 - 請求項24に記載の周期性特徴量決定装置であって、
現在のフレームの上記音響信号の定常性の大きさを表す指標値が所定の条件より小さい場合には、上記集合Sには上記Z 2 個の候補のみが含まれる
ことを特徴とする周期性特徴量決定装置。 - 請求項1から請求項12のいずれかに記載された符号化方法、または、請求項13から請求項19のいずれかに記載された周期性特徴量決定方法、の各ステップをコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012554739A JP5596800B2 (ja) | 2011-01-25 | 2012-01-18 | 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011013426 | 2011-01-25 | ||
JP2011013426 | 2011-01-25 | ||
PCT/JP2012/050970 WO2012102149A1 (ja) | 2011-01-25 | 2012-01-18 | 符号化方法、符号化装置、周期性特徴量決定方法、周期性特徴量決定装置、プログラム、記録媒体 |
JP2012554739A JP5596800B2 (ja) | 2011-01-25 | 2012-01-18 | 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012102149A1 JPWO2012102149A1 (ja) | 2014-06-30 |
JP5596800B2 true JP5596800B2 (ja) | 2014-09-24 |
Family
ID=46580721
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012554739A Active JP5596800B2 (ja) | 2011-01-25 | 2012-01-18 | 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム |
Country Status (8)
Country | Link |
---|---|
US (1) | US9711158B2 (ja) |
EP (1) | EP2650878B1 (ja) |
JP (1) | JP5596800B2 (ja) |
KR (2) | KR101740359B1 (ja) |
CN (1) | CN103329199B (ja) |
ES (1) | ES2558508T3 (ja) |
RU (1) | RU2554554C2 (ja) |
WO (1) | WO2012102149A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9524725B2 (en) * | 2012-10-01 | 2016-12-20 | Nippon Telegraph And Telephone Corporation | Encoding method, encoder, program and recording medium |
BR112016008117B1 (pt) * | 2013-10-18 | 2021-12-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificação de coeficientes espectrais de um espectro de um sinal de áudio |
US9928850B2 (en) * | 2014-01-24 | 2018-03-27 | Nippon Telegraph And Telephone Corporation | Linear predictive analysis apparatus, method, program and recording medium |
ES2768090T3 (es) * | 2014-03-24 | 2020-06-19 | Nippon Telegraph & Telephone | Método de codificación, codificador, programa y soporte de registro |
TR201900472T4 (tr) * | 2014-04-24 | 2019-02-21 | Nippon Telegraph & Telephone | Frekans alanı parametre dizisi oluşturma metodu, kodlama metodu, kod çözme metodu, frekans alanı parametre dizisi oluşturma aparatı, kodlama aparatı, kod çözme aparatı, programı ve kayıt ortamı. |
PL3139381T3 (pl) * | 2014-05-01 | 2019-10-31 | Nippon Telegraph & Telephone | Urządzenie generujące sekwencję okresowej połączonej obwiedni, sposób generowania sekwencji okresowej połączonej obwiedni, program do generowania sekwencji okresowej połączonej obwiedni i nośnik rejestrujący |
CN106663437B (zh) | 2014-05-01 | 2021-02-02 | 日本电信电话株式会社 | 编码装置、解码装置、编码方法、解码方法、记录介质 |
PL3163571T3 (pl) * | 2014-07-28 | 2020-05-18 | Nippon Telegraph And Telephone Corporation | Kodowanie sygnału dźwiękowego |
CN107430869B (zh) * | 2015-01-30 | 2020-06-12 | 日本电信电话株式会社 | 参数决定装置、方法及记录介质 |
JP6758890B2 (ja) * | 2016-04-07 | 2020-09-23 | キヤノン株式会社 | 音声判別装置、音声判別方法、コンピュータプログラム |
US10146500B2 (en) * | 2016-08-31 | 2018-12-04 | Dts, Inc. | Transform-based audio codec and method with subband energy smoothing |
CN106373594B (zh) * | 2016-08-31 | 2019-11-26 | 华为技术有限公司 | 一种音调检测方法及装置 |
CN108665036A (zh) * | 2017-04-02 | 2018-10-16 | 田雪松 | 位置编码方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06131000A (ja) * | 1992-10-15 | 1994-05-13 | Nec Corp | 基本周期符号化装置 |
JPH1152994A (ja) * | 1997-08-05 | 1999-02-26 | Kokusai Electric Co Ltd | 音声符号化装置 |
JP2004187290A (ja) * | 2002-11-21 | 2004-07-02 | Nippon Telegr & Teleph Corp <Ntt> | ディジタル信号処理方法、その処理器、そのプログラム、及びそのプログラムを格納した記録媒体 |
JP2006126592A (ja) * | 2004-10-29 | 2006-05-18 | Casio Comput Co Ltd | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 |
WO2006121101A1 (ja) * | 2005-05-13 | 2006-11-16 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置およびスペクトル変形方法 |
JP2009253706A (ja) * | 2008-04-07 | 2009-10-29 | Casio Comput Co Ltd | 符号化装置、復号装置、符号化方法、復号方法及びプログラム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5765127A (en) * | 1992-03-18 | 1998-06-09 | Sony Corp | High efficiency encoding method |
JP3277705B2 (ja) * | 1994-07-27 | 2002-04-22 | ソニー株式会社 | 情報符号化装置及び方法、並びに情報復号化装置及び方法 |
JP4005154B2 (ja) * | 1995-10-26 | 2007-11-07 | ソニー株式会社 | 音声復号化方法及び装置 |
JP2001285073A (ja) * | 2000-03-29 | 2001-10-12 | Sony Corp | 信号処理装置及び方法 |
US6587816B1 (en) * | 2000-07-14 | 2003-07-01 | International Business Machines Corporation | Fast frequency-domain pitch estimation |
WO2003038812A1 (en) * | 2001-11-02 | 2003-05-08 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding device |
EP1483759B1 (en) | 2002-03-12 | 2006-09-06 | Nokia Corporation | Scalable audio coding |
RU2383941C2 (ru) * | 2005-06-30 | 2010-03-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для кодирования и декодирования аудиосигналов |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
KR100883656B1 (ko) | 2006-12-28 | 2009-02-18 | 삼성전자주식회사 | 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 |
JP4871894B2 (ja) * | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
JP4964114B2 (ja) | 2007-12-25 | 2012-06-27 | 日本電信電話株式会社 | 符号化装置、復号化装置、符号化方法、復号化方法、符号化プログラム、復号化プログラム、および記録媒体 |
US20090319261A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
PL2146344T3 (pl) * | 2008-07-17 | 2017-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście |
US8207875B2 (en) | 2009-10-28 | 2012-06-26 | Motorola Mobility, Inc. | Encoder that optimizes bit allocation for information sub-parts |
US9236063B2 (en) * | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
-
2012
- 2012-01-18 CN CN201280006378.1A patent/CN103329199B/zh active Active
- 2012-01-18 RU RU2013134463/08A patent/RU2554554C2/ru active
- 2012-01-18 EP EP12739924.4A patent/EP2650878B1/en active Active
- 2012-01-18 WO PCT/JP2012/050970 patent/WO2012102149A1/ja active Application Filing
- 2012-01-18 JP JP2012554739A patent/JP5596800B2/ja active Active
- 2012-01-18 ES ES12739924.4T patent/ES2558508T3/es active Active
- 2012-01-18 US US13/981,125 patent/US9711158B2/en active Active
- 2012-01-18 KR KR1020167017192A patent/KR101740359B1/ko active IP Right Grant
- 2012-01-18 KR KR1020137019179A patent/KR20130111611A/ko active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06131000A (ja) * | 1992-10-15 | 1994-05-13 | Nec Corp | 基本周期符号化装置 |
JPH1152994A (ja) * | 1997-08-05 | 1999-02-26 | Kokusai Electric Co Ltd | 音声符号化装置 |
JP2004187290A (ja) * | 2002-11-21 | 2004-07-02 | Nippon Telegr & Teleph Corp <Ntt> | ディジタル信号処理方法、その処理器、そのプログラム、及びそのプログラムを格納した記録媒体 |
JP2006126592A (ja) * | 2004-10-29 | 2006-05-18 | Casio Comput Co Ltd | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 |
WO2006121101A1 (ja) * | 2005-05-13 | 2006-11-16 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置およびスペクトル変形方法 |
JP2009253706A (ja) * | 2008-04-07 | 2009-10-29 | Casio Comput Co Ltd | 符号化装置、復号装置、符号化方法、復号方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20130311192A1 (en) | 2013-11-21 |
CN103329199A (zh) | 2013-09-25 |
RU2554554C2 (ru) | 2015-06-27 |
KR20160080115A (ko) | 2016-07-07 |
EP2650878A4 (en) | 2014-11-05 |
RU2013134463A (ru) | 2015-03-10 |
KR20130111611A (ko) | 2013-10-10 |
US9711158B2 (en) | 2017-07-18 |
KR101740359B1 (ko) | 2017-05-26 |
EP2650878B1 (en) | 2015-11-18 |
ES2558508T3 (es) | 2016-02-04 |
CN103329199B (zh) | 2015-04-08 |
WO2012102149A1 (ja) | 2012-08-02 |
JPWO2012102149A1 (ja) | 2014-06-30 |
EP2650878A1 (en) | 2013-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5596800B2 (ja) | 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム | |
US11074919B2 (en) | Encoding method, decoding method, encoder, decoder, program, and recording medium | |
JP5612698B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
JP6053196B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 | |
JP5893153B2 (ja) | 符号化方法、符号化装置、プログラム、および記録媒体 | |
JP6542796B2 (ja) | 線形予測係数量子化方法及びその装置、並びに線形予測係数逆量子化方法及びその装置 | |
JP5694751B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
JP5663461B2 (ja) | 符号化方法、符号化装置、プログラム、記録媒体 | |
JP6387117B2 (ja) | 符号化装置、復号装置、これらの方法、プログラム及び記録媒体 | |
JPWO2013129528A1 (ja) | 符号化装置、この方法、プログラムおよび記録媒体 | |
JPWO2013002238A1 (ja) | 符号化方法、装置、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140603 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140702 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140729 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140807 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5596800 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |