JP5612698B2 - 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 - Google Patents
符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 Download PDFInfo
- Publication number
- JP5612698B2 JP5612698B2 JP2012537696A JP2012537696A JP5612698B2 JP 5612698 B2 JP5612698 B2 JP 5612698B2 JP 2012537696 A JP2012537696 A JP 2012537696A JP 2012537696 A JP2012537696 A JP 2012537696A JP 5612698 B2 JP5612698 B2 JP 5612698B2
- Authority
- JP
- Japan
- Prior art keywords
- sample
- samples
- acoustic signal
- frequency
- sample sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 139
- 230000008707 rearrangement Effects 0.000 claims description 97
- 238000011084 recovery Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 description 56
- 241000209094 Oryza Species 0.000 description 26
- 235000007164 Oryza sativa Nutrition 0.000 description 26
- 238000013139 quantization Methods 0.000 description 26
- 235000009566 rice Nutrition 0.000 description 26
- 238000001228 spectrum Methods 0.000 description 26
- 238000010606 normalization Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 9
- 230000003044 adaptive effect Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
所定の時間区間の音響信号に由来する周波数領域のサンプル列について、(1)サンプル列の全てのサンプルが含まれ、かつ、(2)サンプル列のうちの音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、サンプル列のうちの音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるようにサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、を並べ替え後のサンプル列として出力する[並べ替え処理]。所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定めた閾値よりも大きい場合は、並べ替えステップで得られたサンプル列を符号化し、所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定めた閾値以下である場合は、音響信号に由来する周波数領域のサンプル列を符号化してもよい[並べ替え処理]。
「符号化処理」
最初に図1〜図4を参照して符号化装置100が行う符号化処理を説明する。
まず、周波数領域変換部1がフレーム単位で音声音響ディジタル信号を周波数領域のN点のMDCT係数列に変換する(ステップS1)。
重み付け包絡正規化部2が、フレーム単位の音声音響ディジタル信号に対する線形予測分析によって求められた線形予測係数を用いて推定された音声音響ディジタル信号のパワースペクトル包絡係数列によって、入力されたMDCT係数列の各係数を正規化し、重み付け正規化MDCT係数列を出力する(ステップS2)。ここでは聴覚的に歪が小さくなるような量子化の実現のために、重み付け包絡正規化部2は、パワースペクトル包絡を鈍らせた重み付けパワースペクトル包絡係数列を用いて、フレーム単位でMDCT係数列の各係数を正規化する。この結果、重み付け正規化MDCT係数列は、入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、音声音響ディジタル信号のパワースペクトル包絡係数列と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、ピッチ周期に起因する微細構造をもつもの、となる。
N点のMDCT係数列の各係数X(1),・・・,X(N)に対応するパワースペクトル包絡係数列の各係数W(1),・・・,W(N)は、線形予測係数を周波数領域に変換して得ることができる。例えば、全極型モデルであるp次自己回帰過程により、時刻tの時間信号x(t)は、p時点まで遡った過去の自分自身の値x(t-1),・・・,x(t-p)と予測残差e(t)と線形予測係数α1,・・・,αpによって式(1)で表される。このとき、パワースペクトル包絡係数列の各係数W(n)[1≦n≦N]は式(2)で表される。exp(・)はネイピア数を底とする指数関数、jは虚数単位、σ2は予測残差エネルギーである。
<例1>
重み付け包絡正規化部2は、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数の補正値Wγ(1),・・・,Wγ(N)で除算することによって、重み付け正規化MDCT係数列の各係数X(1)/Wγ(1),・・・,X(N)/Wγ(N)を得る処理を行う。補正値Wγ(n)[1≦n≦N]は式(3)で与えられる。但し、γは1以下の正の定数であり、パワースペクトル係数を鈍らせる定数である。
重み付け包絡正規化部2は、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数のβ乗(0<β<1)の値W(1)β,・・・,W(N)βで除算することによって、重み付け正規化MDCT係数列の各係数X(1)/W(1)β,・・・,X(N)/W(N)βを得る処理を行う。
次に、正規化利得計算部3が、フレームごとに、重み付け正規化MDCT係数列の各係数を与えられた総ビット数で量子化できるように、全周波数に亘る振幅値の和またはエネルギー値を用いて量子化ステップ幅を決定し、この量子化ステップ幅になるように重み付け正規化MDCT係数列の各係数を割り算する係数(以下、利得という。)を求める(ステップS3)。この利得を表す情報は、利得情報として復号側へ伝送される。正規化利得計算部3は、フレームごとに、重み付け正規化MDCT係数列の各係数をこの利得で正規化(除算)する。
次に、量子化部4が、フレームごとに、利得で正規化された重み付け正規化MDCT係数列の各係数をステップS3の処理で決定された量子化ステップ幅で量子化する(ステップS4)。
ステップS4の処理で得られたフレーム単位の量子化MDCT係数列は、本実施形態の要部である並べ替え部5の入力となるが、並べ替え部5の入力は、ステップS1〜ステップS4の各処理で得られた係数列に限定されない。このことを明示的に理解するため、以下、並べ替え部5の入力を音響信号に由来する「周波数領域のサンプル列」あるいは単に「サンプル列」と呼称することにする。この実施形態では、ステップS4の処理で得られた量子化MDCT係数列が「周波数領域のサンプル列」に相当し、この場合、周波数領域のサンプル列を構成するサンプルは量子化MDCT係数列に含まれる係数に相当する。
この並べ替え処理の具体例を説明する。例えば、並べ替え部5は、(1)サンプル列の全てのサンプルを含み、かつ、(2)サンプル列のうちの音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、サンプル列のうちの音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるようにサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、を並べ替え後のサンプル列として出力する。つまり、音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、当該音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルが集まるように、入力されたサンプル列に含まれる少なくとも一部のサンプルが並べ替えられる。
このように並べ替えられた後のサンプル列は、周波数を横軸とし、サンプルの指標を縦軸とした場合に、サンプルの指標の包絡線が周波数の増大に伴って増大傾向を示すことになる。換言すれば、並べ替え部5は、サンプルの指標の包絡線が周波数の増大に伴って増大傾向を示すように入力されたサンプル列に含まれる少なくとも一部のサンプルを並べ替えると言ってもよい。
間隔Tは、入力されたサンプル列に応じて、つまりフレームごとに、値を設定することが好ましい。フレームごとに間隔Tを決定する方法として、例えば、サンプルの指標(絶対値や二乗値)の周期性を探索し、平均絶対値や平均二乗値の偏りが大きくなるように間隔Tを設定する方法を採用してもよい。
並べ替え部5または符号化部6は、サンプル列の並べ替えを特定する補助情報(第1補助情報)、すなわち、音響信号の周期性を表す情報、または基本周波数を表す情報、または音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔Tを表す情報を出力する。例えば間隔Tをフレーム毎に決定する場合は、サンプル列の並べ替えを特定する補助情報もフレーム毎に出力されることになる。サンプル列の並べ替えを特定する補助情報は、周期性、基本周波数または間隔Tをフレーム毎に符号化して得られる。この符号化は固定長符号化であってもよいし、可変長符号化して平均符号量を削減してもよい。可変長符号化する場合は、前フレームの間隔Tと現フレームの間隔Tの差分を可変長符号化した情報を間隔Tを表す情報としてもよい。同様に、前フレームの基本周波数と現フレームの基本周波数の差分を可変長符号化した情報を基本周波数を表す情報としてもよい。なお、符号化装置100内の図示しない別の手段によって基本周波数を表す情報が得られている場合は、並べ替え部5ではなく、当該別の手段によって得られた基本周波数を表す情報をサンプル列の並べ替えを特定する補助情報として用いてもよい。また、nを複数の選択肢から選択可能な場合には、nの上限値あるいは上述の上限Nをサンプル列の並べ替えを特定する補助情報に含めてもよい。
また、この実施形態では、各サンプル群に含まれるサンプルの個数が、周期性や基本周波数ないしその整数倍に対応するサンプル(以下、中心サンプルという)とその前後1サンプルの計3サンプルであるという固定された個数の例を示したが、サンプル群に含まれるサンプルの個数やサンプルインデックスを可変とする場合には、サンプル群に含まれるサンプルの個数とサンプルインデックスの組み合わせが異なる複数の選択肢の中から選択された一つを表す情報もサンプル列の並べ替えを特定する補助情報に含める。
例えば、選択肢として、
(1)中心サンプルのみ、F(nT)
(2)中心サンプルとその前後1サンプルの計3サンプル、F(nT-1),F(nT),F(nT+1)
(3)中心サンプルとその前2サンプルの計3サンプル、F(nT-2),F(nT-1),F(nT)
(4)中心サンプルとその前3サンプルの計4サンプル、F(nT-3),F(nT-2),F(nT-1),F(nT)
(5)中心サンプルとその後2サンプルの計3サンプル、F(nT),F(nT+1),F(nT+2)
(6)中心サンプルとその後3サンプルの計4サンプル、F(nT),F(nT+1),F(nT+2),F(nT+3)
が設定されている場合に、(4)が選択されたならば、この(4)が選択されたことを表す情報がサンプル列の並べ替えを特定する補助情報に含められる。この例であれば、選択された選択肢を表す情報として3ビットあれば十分である。
次に、符号化部6が、並べ替え部5が出力したサンプル列を符号化し、得られた符号列を出力する(ステップS6)。例えば、符号化部6は、並べ替え部5が出力したサンプル列に含まれるサンプルの振幅の偏りに応じて可変長符号化の方法を切り替えて符号化する。つまり、並べ替え部5によってフレーム内で、低域側(あるいは高域側)に振幅の大きなサンプルが集められているので、符号化部6はその偏りに適した方法による可変長符号化を行う。並べ替え部5が出力したサンプル列のように、局所的な領域ごとに同等か同程度の振幅を持つサンプルが集まっていると、例えば領域ごとに異なるライスパラメータでライス符号化することによって平均符号量を削減できる。以下、フレーム内で低域側(フレームの先頭に近い側)に振幅の大きなサンプルが集められている場合を例に採って説明する。
具体例として、符号化部6は、大きな振幅を持つサンプルが集まっている領域ではサンプルごとにライス符号化(ゴロム-ライス符号化ともいう)を適用する。この領域以外の領域では、符号化部6は、複数のサンプルをまとめたサンプルの集合に対する符号化にも適するエントロピー符号化(ハフマン符号化や算術符号化など)を適用する。ライス符号化の適用に関して、ライス符号化の適用領域とライスパラメータが固定されていてもよいし、あるいは、ライス符号化の適用領域とライスパラメータの組み合わせが異なる複数の選択肢の中から一つ選択できる構成であってもよい。このような複数の選択肢から一つを選択する際、ライス符号化の選択情報として、例えば下記のような可変長符号(記号""で囲まれたバイナリ値)を使うことができ、符号化部6は選択情報も出力する。
"1":ライス符号化を適用しない
"01":ライス符号化を先頭から1/32の領域にライスパラメータを1として適用する。
"001":ライス符号化を先頭から1/32の領域にライスパラメータを2として適用する。
"0001":ライス符号化を先頭から1/16の領域にライスパラメータを1として適用する。
"00001":ライス符号化を先頭から1/16の領域にライスパラメータを2として適用する。
"00000":ライス符号化を先頭から1/32の領域にライスパラメータを3として適用する。
(参考文献1)David Salomon, "Data Compression : The Complete Reference," 3rd edition, Springer-Verlag, ISBN-10: 0-387-40697-2, 2004.
続いて図5〜図6を参照して復号処理を説明する。
復号装置200では、符号化装置100による符号化処理と逆順の処理でMDCT係数が再構成される。復号装置200には、少なくとも、上記利得情報と、上記補助情報と、上記符号列と、上記予測係数符号が入力される。なお、符号化装置100から選択情報が出力された場合にはこの選択情報も復号装置200に入力される。
線形予測係数復号部10は、フレームごとに、入力された予測係数符号を従来的な復号技術によって復号してパワースペクトル包絡係数列の各係数W(1),・・・,W(N)を求める(ステップS10)。後記の回復部12でPARCOR係数を用いる場合は、線形予測係数復号部10は、線形予測係数に対応するPARCOR係数も得る。従来的な復号技術とは、例えば、予測係数符号が線形予測係数に対応する符号である場合に予測係数符号を復号して線形予測係数を得る技術、予測係数符号がLSPパラメータに対応する符号である場合に予測係数符号を復号してLSPパラメータを得る技術、予測係数符号がPARCOR係数に対応する符号である場合に予測係数符号を復号してPARCOR係数を得る技術、などである。また、線形予測係数、LSPパラメータ、PARCOR係数、パワースペクトル包絡係数列は互いに変換可能なものであり、入力された予測係数符号と後段での処理において必要な情報に応じて、変換処理を行なえばよいのは周知である。以上から、上記の予測係数符号の復号処理と必要に応じて行なう上記の変換処理とを包含したものが「従来的な復号技術による復号」ということになる。
復号部11が、フレームごとに、入力された符号列を復号して周波数領域のサンプル列を出力する(ステップS11)。復号装置200に符号化装置100から選択情報が入力された場合には、復号部11は入力された符号列に対して選択情報に応じた復号方法で復号処理を実行する。当然であるが、符号列を得るために実行された符号化方法に対応する復号方法が実行される。復号部11による復号処理の詳細は符号化装置100の符号化部6による符号化処理の詳細に対応するので、当該符号化処理の説明をここに援用し、実行された符号化に対応する復号が復号部11の行う復号処理であることを明記し、これをもって復号処理の詳細な説明とする。なお、選択情報が入力された場合には、どのような符号化方法が実行されたかは当該選択情報によって特定される。選択情報に、例えば、ライス符号化の適用領域とライスパラメータを特定する情報と、ランレングス符号化の適用領域を表す情報と、エントロピー符号化の種類を特定する情報が含まれている場合には、これらの符号化方法に応じた復号方法が入力された符号列の対応する領域に適用される。ライス符号化に対応する復号処理、エントロピー符号化に対応する復号処理、ランレングス符号化に対応する復号処理はいずれも周知であるから説明を省略する(例えば上記参考文献1参照)。
次に、回復部12が、フレームごとに、入力された補助情報に含まれるサンプル列の並べ替えを特定する補助情報(第1補助情報)に従って、復号部11が出力した周波数領域のサンプル列から元のサンプルの並びを得る(ステップS12)。ここで「元のサンプルの並び」とは、符号化装置100の並べ替え部5に入力された「周波数領域のサンプル列」に相当する。上述のとおり、符号化装置100の並べ替え部5による並べ替え方法や並べ替え方法に対応する並べ替えの選択肢は種々あるが、並べ替えが実行された場合には実行された並べ替えは一つであり、その並べ替えを特定する情報は第1補助情報として補助情報に含まれている。よって、回復部12は第1補助情報に基づいて復号部11が出力した周波数領域のサンプル列を元のサンプルの並びに戻すことができる。
次に、逆量子化部13が、フレームごとに、回復部12が出力した元のサンプルの並びを逆量子化する(ステップS13)。上述の例に対応させて述べれば、逆量子化によって、符号化装置100の量子化部4に入力された「利得で正規化された重み付け正規化MDCT係数列」が得られる。
次に、利得乗算部14が、フレームごとに、逆量子化部13が出力した「利得で正規化された重み付け正規化MDCT係数列」の各係数に、上記利得情報で特定される利得を乗じて、「正規化された重み付け正規化MDCT係数列」を得る(ステップS14)。
次に、重み付け包絡逆正規化部15が、フレームごとに、利得乗算部14が出力した「正規化された重み付け正規化MDCT係数列」の各係数に、線形予測係数復号部10で得られたパワースペクトル包絡係数列から得られる補正係数を適用することで「MDCT係数列」を得る(ステップS15)。符号化装置100で実行された重み付け包絡正規化処理の例に対応させて具体例を説明すると、重み付け包絡逆正規化部15は、利得乗算部14が出力した「正規化された重み付け正規化MDCT係数列」の各係数に、当該各係数に対応するパワースペクトル包絡係数列の各係数のβ乗(0<β<1)の値W(1)β,・・・,W(N)βを乗算することによって、MDCT係数列の各係数X(1),・・・,X(N)を得る。
次に、時間領域変換部16が、フレームごとに、重み付け包絡逆正規化部15が出力した「MDCT係数列」を時間領域に変換してフレーム単位の音声音響ディジタル信号を得る(ステップS16)。
(参考文献2)守谷健弘著、「音声符号化」第9章、社団法人電子情報通信学会、1998.
上述の実施形態に関わる符号化装置/復号装置は、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、CPU(Central Processing Unit)〔キャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)やROM(Read Only Memory)と、ハードディスクである外部記憶装置、並びにこれらの入力部、出力部、CPU、RAM、ROM、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、符号化装置/復号装置に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。例えば、上述の復号処理において、線形予測係数復号部10による処理と復号部11による処理とは、並列に実行することができる。
Claims (18)
- 所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
上記所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定めた閾値以下である場合は、上記サンプル列を並べ替え後のサンプル列として出力し、
上記所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定めた閾値よりも大きい場合は、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として出力する並べ替えステップと、
上記並べ替えステップで得られたサンプル列を符号化する符号化ステップと
を有する符号化方法。 - 所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として出力する並べ替えステップと、
上記所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定めた閾値よりも大きい場合は、上記並べ替えステップで得られたサンプル列を符号化し、上記所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定めた閾値以下である場合は、上記音響信号に由来する周波数領域のサンプル列を符号化する符号化ステップと
を有する符号化方法。 - 請求項1又は2に記載の符号化方法であって、
上記音響信号の周期性を表す情報、上記音響信号の基本周波数を表す情報、上記並べ替えステップにおける上記音響信号の周期性または基本周波数に対応するサンプルと上記音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報、のいずれかを補助情報として出力するステップを有する
ことを特徴とする符号化方法。 - 請求項1から請求項3のいずれかに記載の符号化方法であって、
上記並べ替えステップでは、
最低の周波数から第1の所定の周波数までの各周波数に対応するサンプルの並べ替えを行う
ことを特徴とする符号化方法。 - 請求項1から請求項3のいずれかに記載の符号化方法であって、
上記並べ替えステップでは、
最低の周波数から所定の周波数までの各周波数に対応するサンプルの並べ替えを行わない
ことを特徴とする符号化方法。 - 請求項4に記載の符号化方法であって、
上記並べ替えステップでは、
最低の周波数から上記第1の所定の周波数より小さい第2の所定の周波数までの各周波数に対応するサンプルの並べ替えを行わない
ことを特徴とする符号化方法。 - 入力された符号列を復号する復号方法であって、
所定の時間区間ごとに、
入力された符号列を復号して、周波数領域のサンプル列を得る復号ステップと、
入力された予測係数符号に対応するPARCOR係数に変換可能な係数から計算される予測利得の推定値が予め定めた閾値以下である場合は、上記復号ステップで得られたサンプル列をそのまま音響信号に由来するサンプル列として得て、入力された予測係数符号に対応するPARCOR係数に変換可能な係数から計算される予測利得の推定値が予め定めた閾値よりも大きい場合は、上記復号ステップで得られたサンプル列に含まれる少なくとも一部のサンプルを、当該サンプル列への並べ替えを特定する情報(以下、補助情報という)に基づいて並べ替えて音響信号に由来するサンプル列を得る回復ステップと
を有し、
上記復号ステップで得られたサンプル列は、(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、(2)上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように、周波数領域のサンプルが並べられたものである
ことを特徴とする復号方法。 - 請求項7に記載の復号方法であって、
上記補助情報は、上記音響信号の周期性を表す情報、上記音響信号の基本周波数を表す情報、上記音響信号の周期性または基本周波数に対応するサンプルと上記音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報、のいずれかである
ことを特徴とする復号方法。 - 請求項7または請求項8に記載の復号方法であって、
上記復号ステップで得られたサンプル列は、最低の周波数から第1の所定の周波数までの各周波数に対応するサンプルの並べ替えが行われたサンプル列である
ことを特徴とする復号方法。 - 請求項7または請求項8に記載の復号方法であって、
上記復号ステップで得られたサンプル列は、最低の周波数から所定の周波数までの各周波数に対応するサンプルの並べ替えが行われていないサンプル列である
ことを特徴とする復号方法。 - 請求項9に記載の復号方法であって、
上記復号ステップで得られたサンプル列は、最低の周波数から上記第1の所定の周波数より小さい第2の所定の周波数までの各周波数に対応するサンプルの並べ替えが行われていないサンプル列である
ことを特徴とする復号方法。 - 所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化装置であって、
上記所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定めた閾値以下である場合は、上記サンプル列を並べ替え後のサンプル列として出力し、
上記所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定めた閾値よりも大きい場合は、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として出力する並べ替え部と、
上記並べ替え部で得られたサンプル列を符号化する符号化部と
を有する符号化装置。 - 所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化装置であって、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として出力する並べ替え部と、
上記所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定めた閾値よりも大きい場合は、上記並べ替え部で得られたサンプル列を符号化し、上記所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定めた閾値以下である場合は、上記音響信号に由来する周波数領域のサンプル列を符号化する符号化部と
を有する符号化装置。 - 入力された符号列を復号する復号装置であって、
所定の時間区間ごとに、
入力された符号列を復号して、周波数領域のサンプル列を得る復号部と、
入力された予測係数符号に対応するPARCOR係数に変換可能な係数から計算される予測利得の推定値が予め定めた閾値以下である場合は、上記復号部で得られたサンプル列をそのまま音響信号に由来するサンプル列として得て、入力された予測係数符号に対応するPARCOR係数に変換可能な係数から計算される予測利得の推定値が予め定めた閾値よりも大きい場合は、上記復号部で得られたサンプル列に含まれる少なくとも一部のサンプルを、当該サンプル列への並べ替えを特定する情報(以下、補助情報という)に基づいて並べ替えて音響信号に由来するサンプル列を得る回復部と
を有し、
上記復号部で得られたサンプル列は、(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、(2)上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように、周波数領域のサンプルが並べられたものである
ことを特徴とする復号装置。 - 請求項1から請求項6のいずれかに記載された符号化方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項7から請求項11のいずれかに記載された復号方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項1から請求項6のいずれかに記載された符号化方法の各ステップをコンピュータに実行させるためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
- 請求項7から請求項11のいずれかに記載された復号方法の各ステップをコンピュータに実行させるためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012537696A JP5612698B2 (ja) | 2010-10-05 | 2011-10-03 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010225949 | 2010-10-05 | ||
JP2010225949 | 2010-10-05 | ||
PCT/JP2011/072752 WO2012046685A1 (ja) | 2010-10-05 | 2011-10-03 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
JP2012537696A JP5612698B2 (ja) | 2010-10-05 | 2011-10-03 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012046685A1 JPWO2012046685A1 (ja) | 2014-02-24 |
JP5612698B2 true JP5612698B2 (ja) | 2014-10-22 |
Family
ID=45927681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012537696A Active JP5612698B2 (ja) | 2010-10-05 | 2011-10-03 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5612698B2 (ja) |
WO (1) | WO2012046685A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5694751B2 (ja) * | 2010-12-13 | 2015-04-01 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
CN103460287B (zh) | 2011-04-05 | 2016-03-23 | 日本电信电话株式会社 | 音响信号的编码方法、解码方法、编码装置、解码装置 |
CN108962270B (zh) * | 2012-05-23 | 2023-03-17 | 日本电信电话株式会社 | 解码方法、解码装置以及记录介质 |
KR101700855B1 (ko) | 2012-10-01 | 2017-01-31 | 니폰 덴신 덴와 가부시끼가이샤 | 부호화 방법, 부호화 장치, 프로그램 및 기록 매체 |
MX362139B (es) | 2012-11-15 | 2019-01-07 | Ntt Docomo Inc | Dispositivo codificador de audio, metodo de codificacion de audio, programa de codificacion de audio, dispositivo decodificador de audio, metodo de decodificacion de audio, y programa de decodificacion de audio. |
MX343572B (es) | 2013-01-29 | 2016-11-09 | Fraunhofer Ges Forschung | Concepto de llenado con ruido. |
ES2699582T3 (es) * | 2013-07-18 | 2019-02-11 | Nippon Telegraph & Telephone | Dispositivo, método, programa y medio de almacenamiento de análisis de predicción lineal |
KR102268836B1 (ko) * | 2013-10-09 | 2021-06-25 | 소니그룹주식회사 | 부호화 장치 및 방법, 복호 장치 및 방법, 그리고 프로그램 |
ES2768090T3 (es) | 2014-03-24 | 2020-06-19 | Nippon Telegraph & Telephone | Método de codificación, codificador, programa y soporte de registro |
JP6259378B2 (ja) * | 2014-08-26 | 2018-01-10 | 日本電信電話株式会社 | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置及びプログラム |
EP3252758B1 (en) * | 2015-01-30 | 2020-03-18 | Nippon Telegraph and Telephone Corporation | Encoding apparatus, decoding apparatus, and methods, programs and recording media for encoding apparatus and decoding apparatus |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09106299A (ja) * | 1995-10-09 | 1997-04-22 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号変換符号化方法および復号化方法 |
JP2009501943A (ja) * | 2005-07-15 | 2009-01-22 | マイクロソフト コーポレーション | 適応コーディングおよびデコーディングでの複数のエントロピモデルの選択的使用 |
-
2011
- 2011-10-03 WO PCT/JP2011/072752 patent/WO2012046685A1/ja active Application Filing
- 2011-10-03 JP JP2012537696A patent/JP5612698B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09106299A (ja) * | 1995-10-09 | 1997-04-22 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号変換符号化方法および復号化方法 |
JP2009501943A (ja) * | 2005-07-15 | 2009-01-22 | マイクロソフト コーポレーション | 適応コーディングおよびデコーディングでの複数のエントロピモデルの選択的使用 |
Also Published As
Publication number | Publication date |
---|---|
WO2012046685A1 (ja) | 2012-04-12 |
JPWO2012046685A1 (ja) | 2014-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5612698B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
JP5596800B2 (ja) | 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム | |
JP6053196B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 | |
JP5603484B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
JP5893153B2 (ja) | 符号化方法、符号化装置、プログラム、および記録媒体 | |
JP5694751B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
JP2013120225A (ja) | 符号化方法、符号化装置、プログラム、記録媒体 | |
JP5579932B2 (ja) | 符号化方法、装置、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140401 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140523 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140826 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140904 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5612698 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |