JP5872034B2 - 符号化方法、符号化装置、プログラム、および記録媒体 - Google Patents
符号化方法、符号化装置、プログラム、および記録媒体 Download PDFInfo
- Publication number
- JP5872034B2 JP5872034B2 JP2014518696A JP2014518696A JP5872034B2 JP 5872034 B2 JP5872034 B2 JP 5872034B2 JP 2014518696 A JP2014518696 A JP 2014518696A JP 2014518696 A JP2014518696 A JP 2014518696A JP 5872034 B2 JP5872034 B2 JP 5872034B2
- Authority
- JP
- Japan
- Prior art keywords
- gain
- bits
- value
- consumed
- update
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 71
- 238000012545 processing Methods 0.000 claims description 87
- 230000009467 reduction Effects 0.000 claims description 71
- 238000013139 quantization Methods 0.000 claims description 61
- 230000008569 process Effects 0.000 claims description 30
- 230000007423 decrease Effects 0.000 claims description 11
- 108091026890 Coding region Proteins 0.000 claims 1
- 238000001228 spectrum Methods 0.000 description 40
- 238000010606 normalization Methods 0.000 description 23
- 238000004364 calculation method Methods 0.000 description 16
- 230000004048 modification Effects 0.000 description 13
- 238000012986 modification Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000005259 measurement Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
従来のTCX符号化の符号化装置1000の構成例を図1に示す。以下、図1の各部について説明する。
周波数領域変換部1001は、所定の時間区間であるフレーム単位で、入力された音響ディジタル信号を周波数領域のN点のMDCT係数列X(1),・・・,X(N)に変換して出力する。ただし、Nは正整数である。
パワースペクトル包絡係数列計算部1002は、フレーム単位の音響ディジタル信号に対する線形予測分析を行って線形予測係数を求め、その線形予測係数を用いてN点の音響ディジタル信号のパワースペクトル包絡係数列W(1),・・・,W(N)を得て出力する。
重み付け包絡正規化部1003は、パワースペクトル包絡係数列計算部1002が得たパワースペクトル包絡係数列を用いて、周波数領域変換部1001が得たMDCT係数列の各係数を正規化し、重み付け正規化MDCT係数列XN(1),・・・,XN(N)を出力する。ここでは聴覚的に歪が小さくなるような量子化の実現のために、重み付け包絡正規化部1003は、パワースペクトル包絡を鈍らせた重み付けパワースペクトル包絡係数列を用いて、フレーム単位でMDCT係数列の各係数を正規化する。この結果、重み付け正規化MDCT係数列XN(1),・・・,XN(N)は、入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、音響ディジタル信号のパワースペクトル包絡係数列と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、ピッチ周期に起因する微細構造をもつもの、となる。
初期化部1004は、利得(グローバルゲイン)gの初期値を設定する。利得の初期値は、重み付け正規化MDCT係数列XN(1),・・・,XN(N)のエネルギーと可変長符号化部1006が出力する符号に予め配分されたビット数などから決めることができる。以下、可変長符号化部1006が出力する符号に予め配分されたビット数を配分ビット数Bと呼ぶ。また、初期化部は、利得の更新回数の初期値として0を設定する。
利得更新ループ処理部1130は、重み付け正規化MDCT係数列XN(1),・・・,XN(N)中の各係数を利得で除算して得られる系列を所定のビット数で符号化できるように利得を決定し、重み付け正規化MDCT係数列XN(1),・・・,XN(N)中の各係数を決定した利得で除算して得られる系列を可変長符号化して得た整数信号符号と、決定した利得を符号化して得た利得符号と、を出力する。
利得更新ループ処理部1130は、量子化部1005と、可変長符号化部1006と、判定部1007と、利得拡大更新部1131と、利得縮小更新部1132と、切り捨て部1016と、利得符号化部1017と、を有する。
量子化部1005は、重み付け正規化MDCT係数列XN(1),・・・,XN (N)の各係数を利得gで割り算して得られる値を量子化して、整数値による系列である量子化正規化済係数系列XQ(1),・・・,XQ(N)を得て出力する。
可変長符号化部1006は、量子化正規化済係数系列XQ(1),・・・,XQ(N)を可変長符号化して符号を得て出力する。この符号を整数信号符号と呼ぶ。この可変長符号化には、例えば、量子化正規化済係数系列中の複数の係数を纏めて符号化する方法を用いる。また、可変長符号化部1006は、可変長符号化で得た整数信号符号のビット数を計測する。以下では、このビット数を消費ビット数cと呼ぶ。
判定部1007は、利得の更新回数が予め定めた回数の場合は、利得、整数信号符号、消費ビット数cを出力する。
利得の更新回数が予め定めた回数未満である場合は、可変長符号化部1006が計測した消費ビット数cが配分ビット数Bより多い場合には利得拡大更新部1131が、可変長符号化部1006が計測した消費ビット数cが配分ビット数Bより少ない場合には利得縮小更新部1132が、次の処理を行うように制御する。なお、消費ビット数cと配分ビット数Bが等しいときは、今回の利得の値が最適な値であることを意味するので、利得、整数信号符号、消費ビット数cを出力する。
利得拡大更新部1131は、今回の利得gの値よりも大きな値g’>gを新たな利得として設定する。利得拡大更新部1131は、利得下限設定部1008と、第1分岐部1009と、第1利得更新部1010と、利得拡大部1011と、を有する。
利得下限設定部1008は、今回の利得gの値を利得の下限値gminとして設定する(gmin←g)。この利得の下限値gminは、少なくとも利得の値はこれ以上であるべきことを意味する。
利得下限設定部1008で利得の下限値gminが設定された場合、第1分岐部1009は、利得の上限値gmaxが既に設定されている場合には第1利得更新部1010が、そうでない場合には利得拡大部1011が、次の処理を行うように制御する。
第1利得更新部1010は、例えば、今回の利得gの値と利得の上限値gmaxの平均値を新たに利得gの値として設定する(g←(g+gmax)/2)。これは、最適な利得の値は、今回の利得gの値と利得の上限値gmaxとの間に存在するからである。今回の利得gの値は利得の下限値gminとして設定されているので、利得の上限値gmaxと利得の下限値gminの平均値を新たに利得gの値として設定するとも言える(g←(gmax+gmin)/2)。その後、量子化部1005の処理に戻る。
利得拡大部1011は、今回の利得gの値より大きな値を新たな利得gの値として設定する。例えば、今回の利得gの値に予め定めた値である利得変更量Δgを加算したものを新たな利得gの値として設定する(g←g+Δg)。また例えば、利得の上限値gmaxが設定されずに、消費ビット数cが配分ビット数Bより多い状態が複数回続いている場合には、予め定めた値より大きな値を利得変更量Δgとして用いる。その後、量子化部1005の処理に戻る。
利得縮小更新部1132は、今回の利得gの値よりも小さな値g’<gを新たな利得として設定する。利得縮小更新部1132は、利得上限設定部1012と、第2分岐部1013と、第2利得更新部1014と、利得縮小部1015と、を有する。
利得上限設定部1012は、今回の利得gの値を利得の上限値gmaxと設定する(gmax←g)。この利得の上限値gmaxは、少なくとも利得の値はこれ以下であるべきことを意味する。
利得上限設定部1012で利得の上限値gmaxが設定された場合、第2分岐部1013は、利得の下限値gminが既に設定されている場合には第2利得更新部1014が、そうでない場合には利得縮小部1015が、次の処理を行うように制御する。
第2利得更新部1014は、例えば、今回の利得gの値と利得の下限値gminの平均値を新たな利得gの値として設定する(g←(g+gmin)/2)。これは、最適な利得の値は、今回の利得gの値と利得の下限値gminとの間に存在するからである。今回の利得gの値は利得の上限値gmaxとして設定されているので、利得の上限値gmaxと利得の下限値gminの平均値を新たに利得gの値として設定するとも言える(g←(gmax+gmin)/2)。その後、量子化部1005の処理に戻る。
利得縮小部1015は、今回の利得gの値より小さな値を新たな利得gの値として設定する。例えば、今回の利得gの値から予め定めた値である利得変更量Δgを減算したものを新たな利得gの値として設定する(g←g−Δg)。また例えば、利得の下限値gminが設定されずに、消費ビット数cが配分ビット数Bより少ない状態が複数回続いている場合には、予め定めた値より大きな値を利得変更量Δgとして用いる。その後、量子化部1005の処理に戻る。
切り捨て部1016は、判定部1007が出力した消費ビット数cが配分ビット数Bより多い場合には、判定部1007が出力した整数信号符号のうち、消費ビット数cが配分ビット数Bを上回る分だけの符号を、高い周波数側の量子化正規化済係数に対応する符号から取り除いたものを、新たな整数信号符号として出力する。すなわち切り捨て部1016は、消費ビット数cの配分ビット数Bに対する上回り分c−Bに対応する高い周波数側の量子化正規化済係数に対応する符号を整数信号符号から取り除くことで得られる、残りの符号を、新たな整数信号符号として出力する。
判定部1007が出力した利得を所定のビット数で符号化して利得符号を得て、出力する。
利得の上限値が設定されずに、利得拡大部1011の処理が複数回必要となる場合には利得の初期値がきわめて小さすぎた可能性があるので、利得変更量Δgを所定の値より大きくして、利得の上限値に到達できる確率を高めざるをえないが、これにより適正な利得を大幅に超えた値を新たな利得の値として設定してしまうこともあり、収束に回数がかかり、所定の回数で適切な利得の値を求められないことがあった。
利得の下限値が設定されずに、利得縮小部1015の処理が複数回必要となる場合には利得の初期値がきわめて大きすぎた可能性があるので、利得変更量Δgを所定の値より大きくして、利得の下限値に到達できる確率を高めざるをえないが、これにより適正な利得を大幅に超えた値を新たな利得の値として設定してしまうこともあり、収束に回数がかかり、所定の回数で適切な利得の値を求められないことがあった。
<符号化装置100>
図2を参照して第1実施形態の符号化装置100が行う符号化処理を説明する。
周波数領域変換部101は、所定の時間区間であるフレーム単位で、入力された音響ディジタル信号(入力音響信号)を周波数領域のN点のMDCT係数列X(1),・・・,X(N)に変換して出力する。ただし、Nは正整数である。
パワースペクトル包絡係数列計算部102は、フレーム単位の音響ディジタル信号に対する線形予測分析を行って線形予測係数を求め、その線形予測係数を用いてN点の音響ディジタル信号のパワースペクトル包絡係数列W(1),・・・,W(N)を得て出力する。
重み付け包絡正規化部103は、パワースペクトル包絡係数列計算部102が得たパワースペクトル包絡係数列を用いて、周波数領域変換部101が得たMDCT係数列の各係数を正規化し、重み付け正規化MDCT係数列XN(1),・・・,XN(N)を出力する。ここでは聴覚的に歪が小さくなるような量子化の実現のために、重み付け包絡正規化部103は、パワースペクトル包絡を鈍らせた重み付けパワースペクトル包絡係数列を用いて、フレーム単位でMDCT係数列の各係数を正規化する。この結果、重み付け正規化MDCT係数列XN(1),・・・,XN(N)は、入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、音響ディジタル信号のパワースペクトル包絡係数列と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、ピッチ周期に起因する微細構造をもつもの、となる。
N点のMDCT係数列の各係数X(1),・・・,X(N)に対応するパワースペクトル包絡係数列の各係数W(1),・・・,W(N)は、線形予測係数を周波数領域に変換して得ることができる。例えば、全極型モデルであるp次自己回帰過程により(ただしpは正整数)、時刻tの時間信号x(t)は、p時点まで遡った過去の自分自身の値x(t-1),・・・,x(t-p)と予測残差e(t)と線形予測係数α1,・・・,αpによって式(1)で表される。このとき、パワースペクトル包絡係数列の各係数W(n)[1≦n≦N]は式(2)で表される。exp(・)はネイピア数を底とする指数関数、jは虚数単位、σ2は予測残差エネルギーである。
<例1>
重み付け包絡正規化部103は、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数の補正値Wγ(1),・・・,Wγ(N)で除算することによって、重み付け正規化MDCT係数列の各係数X(1)/Wγ(1),・・・,X(N)/Wγ(N)を得る処理を行う。補正値Wγ(n)[1≦n≦N]は式(3)で与えられる。但し、γは1以下の正の定数であり、パワースペクトル係数を鈍らせる定数である。
重み付け包絡正規化部103は、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数のβ乗(0<β<1)の値W(1)β,・・・,W(N)βで除算することによって、重み付け正規化MDCT係数列の各係数X(1)/W(1)β,・・・,X(N)/W(N)βを得る処理を行う。
初期化部104は、利得(グローバルゲイン)gの初期値を設定する。利得の初期値は、重み付け正規化MDCT係数列XN(1),・・・,XN(N)のエネルギーと可変長符号化部106が出力する符号に予め配分されたビット数などから決めることができる。また、利得gの初期値は正値である。以下、可変長符号化部106が出力する符号に予め配分されたビット数を配分ビット数Bと呼ぶ。また、初期化部は、利得の更新回数の初期値として0を設定する。
利得更新ループ処理部130は、重み付け正規化MDCT係数列XN(1),・・・,XN(N)中の各係数を利得で除算して得られる系列(整数値サンプルによる列)を所定のビット数で符号化できるように利得を決定し、重み付け正規化MDCT係数列XN(1),・・・,XN(N)中の各係数を決定した利得で除算して得られる系列(整数値サンプルによる列)を可変長符号化して得た整数信号符号と、決定した利得を符号化して得た利得符号(利得に対応する利得符号)と、を出力する。利得更新ループ処理部130は、上記の整数値サンプルによる列を符号化して得られる符号のビット数と、所定の配分ビット数Bと、の差が大きいほど、更新前の利得と更新後の利得との差が大きくなるように利得の値を更新する。
利得更新ループ処理部130は、量子化部105と、可変長符号化部106と、判定部107と、利得拡大更新部131と、利得縮小更新部132と、切り捨て部116と、利得符号化部117と、を含む。
量子化部105は、入力された重み付け正規化MDCT係数列XN(1),・・・,XN (N)(所定の区間の入力音響信号に由来するサンプル列)の各係数(各サンプル)を利得gで割り算して得られる値を量子化して、整数値(量子化正規化済サンプル)による系列である量子化正規化済係数系列XQ(1),・・・,XQ(N)を得て出力する。
また量子化部105は、最も低い周波数側にある量子化正規化済係数から、値が0ではない最も高い周波数側にある量子化正規化済係数までの、サンプル数sを計数し、このサンプル数sを出力する。
可変長符号化部106は、入力された量子化正規化済係数系列XQ(1),・・・,XQ(N)を可変長符号化して符号(サンプル列符号)を得て出力する。この符号を整数信号符号と呼ぶ。この可変長符号化には、例えば、量子化正規化済係数系列中の複数の係数を纏めて符号化する方法を用いる。また、可変長符号化部106は、可変長符号化で得た整数信号符号のビット数を計測する。本形態では、このビット数を消費ビット数cと呼ぶ。
判定部107は、利得の更新回数が予め定めた回数の場合は、利得g、整数信号符号、消費ビット数cを出力する。
利得の更新回数が予め定めた回数未満である場合は、可変長符号化部106が計測した消費ビット数cが配分ビット数Bより多い場合には利得拡大更新部131が、可変長符号化部106が計測した消費ビット数cが配分ビット数Bより少ない場合には利得縮小更新部132が、次の処理を行うように制御する。なお、可変長符号化部106が計測した消費ビット数cが配分ビット数Bと等しい場合は、判定部107は、利得g、整数信号符号、消費ビット数cを出力する。
利得拡大更新部131は、今回の利得gの値よりも大きな値g’>gを新たな利得として設定する。利得拡大更新部131は、サンプル数計測部118と、利得下限設定部108と、第1分岐部109と、第1利得更新部110と、利得拡大部111と、を含む。
サンプル数計測部118は、消費ビット数cが配分ビット数Bより多い場合には、判定部107が出力した整数信号符号のうち、消費ビット数cが配分ビット数Bを上回らないように、高い周波数側の量子化正規化済係数に対応する符号を取り除いた符号に対応する量子化正規化済係数のサンプル数tを出力する。
つまり、サンプル数計測部118は、消費ビット数cの配分ビット数Bに対する上回り分c−Bに対応する符号(切り捨て符号)に対応する高い周波数側の量子化正規化済係数を、量子化部105が出力した量子化正規化済係数系列から取り除いた残りである、対応する符号が取り除かれなかった量子化正規化済係数のサンプル数tを出力する。切り捨て符号の例は、最も高い周波数を含む領域内の1個以上の量子化正規化済係数に対応する符号のうち、ビット数がc−B以上かつ最小の符号である。言い換えれば、低い周波数側の量子化正規化済係数のみを符号化対象とし、残りの高い周波数側の量子化正規化済係数を符号化対象としないことにより、対応する可変長符号の長さが配分ビット数B以下かつ最大となるときの、符号化対象とする量子化正規化済係数のサンプル数がtである。
消費ビット数cが配分ビット数Bより多い場合には、さらに利得下限設定部108が、今回の利得gの値(当該消費ビット数cに対応する利得g)を利得の下限値gminとして設定する(gmin←g)。この利得の下限値gminは、少なくとも利得の値はこれ以上であるべきことを意味する。
利得下限設定部108で利得の下限値gminが設定された場合、第1分岐部109は、利得の上限値gmaxが既に設定されている場合には第1利得更新部110が、そうでない場合には利得拡大部111が、次の処理を行うように制御する。
第1利得更新部110は、今回の利得gの値(消費ビット数cに対応する利得g)と利得の上限値gmaxとの間の値を、利得gの新たな値とする。これは、最適な利得の値は、今回の利得gの値と利得の上限値gmaxとの間に存在するからである。第1利得更新部110は、例えば、今回の利得gの値と利得の上限値gmaxの平均値を新たに利得gとして設定する(g←(g+gmax)/2)。今回の利得gの値は利得の下限値gminとして設定されているので、利得の上限値gmaxと利得の下限値gminの平均値を新たに利得gの値として設定するとも言える(g←(gmax+gmin)/2)。その後、量子化部105の処理に戻る。
利得拡大部111は、最も低い周波数側にある量子化正規化済係数から値が0ではない最も高い周波数側にある量子化正規化済係数までのサンプル数sから、サンプル数計測部118が出力したサンプル数tを減算して得られる値u=s−t、が大きいほど、今回の利得から新たな利得への増分が大きくなるようにする。例えば、新たな利得g←今回の利得g×(1+u/N×α)とする。ここで、αは予め定めた正の定数とする。
または、利得拡大部111は、符号化対象のすべてのサンプル数Nから、サンプル数計測部118が出力したサンプル数tを減算して得られるv=N−tが大きいほど、今回の利得から新たな利得への増分が大きくなるようにする。たとえば、新たな利得g←今回の利得g×(1+v/N×α)とする。
すなわち利得拡大部111は、量子化正規化済サンプル列の一部または全てのサンプル数から、上記の対応する符号が取り除かれなかった量子化正規化済係数のサンプル数、を減算して得られる値が大きいほど、利得gの値を大きく増加させる。その後、量子化部105の処理に戻る。言い換えると、利得拡大部111は、量子化正規化済サンプル列の一部または全てのサンプル数から、上記の対応する符号が取り除かれなかった量子化正規化済係数のサンプル数、を減算して得られる値が大きいほど、利得の更新前の値から更新後の値への増分が大きくなるように利得の値を更新し、その後の量子化部105の処理を行わせる。
利得縮小更新部132は、今回の利得gの値よりも小さな値g’<gを新たな利得として設定する。利得縮小更新部132は、利得上限設定部112と、第2分岐部113と、第2利得更新部114と、利得縮小部115と、を含む。
消費ビット数cが配分ビット数Bよりも少ない場合には、利得上限設定部112が、今回の利得gの値(当該消費ビット数cに対応する利得gの値)を利得の上限値gmaxと設定する(gmax←g)。この利得の上限値gmaxは、少なくとも利得の値はこれ以下であるべきことを意味する。
利得上限設定部112で利得の上限値gmaxが設定された場合、第2分岐部113は、利得の下限値gminが既に設定されている場合には第2利得更新部114が、そうでない場合には利得縮小部115が、次の処理を行うように制御する。
第2利得更新部114は、今回の利得gの値(消費ビット数cに対応する利得gの値)と、利得の下限値gminとの間の値を、利得gの新たな値とする。これは、最適な利得の値は、今回の利得gの値と利得の下限値gminとの間に存在するからである。第2利得更新部114は、例えば、今回の利得gの値と利得の下限値gminの平均値を新たな利得gの値として設定する(g←(g+gmin)/2)。今回の利得gの値は利得の上限値gmaxとして設定されているので、利得の上限値gmaxと利得の下限値gminの平均値を新たに利得gの値として設定するとも言える(g←(gmax+gmin)/2)。その後、量子化部105の処理に戻る。
利得縮小部115は、配分ビット数Bから消費ビット数cを減算して得られる値である余剰ビット数B−cが大きいほど、今回の利得gの値から新たな利得gの値への減少分が大きくなるようにする。ただし、新たな利得gの値も正値である。例えば、新たな利得g←今回の利得g×(1-(B-c)/B×β)とする。ここで、βは予め定めた正の定数とする。すなわち利得縮小部115は、配分ビット数Bから消費ビット数cを減算して得られる値B−cが大きいほど、利得gの値を大きく減少させる。その後、量子化部105の処理に戻る。言い換えると、利得縮小部115は、配分ビット数Bから消費ビット数cを減算して得られる値B−cが大きいほど、利得gの更新前の値から更新後の値への減少分が大きくなるように利得gの値を更新し、その後の量子化部105の処理を行わせる。
<切り捨て部116>
切り捨て部116は、判定部107が出力した消費ビット数cが配分ビット数Bより多い場合には、判定部107が出力した整数信号符号のうち、消費ビット数cが配分ビット数Bを上回る分だけの符号を、高い周波数側の量子化正規化済係数に対応する符号から取り除いたものを、新たな整数信号符号として出力する。すなわち切り捨て部116は、消費ビット数cの配分ビット数Bに対する上回り分c−Bに対応する高い周波数側の量子化正規化済係数に対応する符号(切り捨て符号)を整数信号符号(サンプル列符号)から取り除くことで得られる、残りの符号(切り捨て済サンプル列符号)を、新たな整数信号符号として出力する。
判定部107が出力した利得を所定のビット数で符号化して利得符号を得て、出力する。
<符号化装置150>
図3を参照して第1実施形態の変形例の符号化装置150が行う符号化処理を説明する。第1実施形態の変形例の符号化装置150が第1実施形態の符号化装置100と異なるのは、可変長符号化で得た整数信号符号のビット数に代えて、整数信号符号の推定ビット数を消費ビット数cとする点である。符号化装置150は、符号化装置100の利得更新ループ処理部130に代えて、利得更新ループ処理部190を備える。利得更新ループ処理部190は、利得更新ループ処理部130の可変長符号化部106、判定部107、利得拡大更新部131、および切り捨て部116に代えて、ビット数推定部156、判定部157、利得拡大更新部191、および可変長符号化部159を備える。利得拡大更新部191は、利得拡大更新部131の利得拡大部111、およびサンプル数計測部118に代えて、利得拡大部151、およびサンプル数計測部168を備える。
以下、第1実施形態との差分についてのみ説明する。
ビット数推定部156は、量子化正規化済係数系列XQ(1),・・・,XQ(N)を可変長符号化して得られる符号のビット数の推定値(推定ビット数)を求めて出力する。第1実施形態の変形例では、この推定ビット数を消費ビット数cと呼ぶ。
判定部157は、利得の更新回数が予め定めた回数の場合は、利得g、量子化正規化済係数系列XQ(1),・・・,XQ(N)を出力する。
利得の更新回数が予め定めた回数未満である場合は、ビット数推定部156が推定した消費ビット数cが配分ビット数Bより多い場合には利得拡大更新部191が、ビット数推定部156が推定した消費ビット数cが配分ビット数Bより少ない場合には利得縮小更新部132が、次の処理を行うように制御する。なお、ビット数推定部156が推定した消費ビット数cが配分ビット数Bと等しい場合は、判定部157は、利得g、量子化正規化済係数系列XQ(1),・・・,XQ(N)を出力する。
サンプル数計測部168は、消費ビット数cが配分ビット数Bより多い場合には、消費ビット数cの配分ビット数Bに対する上回り分c−Bに対応する符号(切り捨て符号)の対象となる高い周波数側の量子化正規化済係数を、量子化部105が出力した量子化正規化済係数系列XQ(1),・・・,XQ(N)から取り除いた残りの量子化正規化済係数のサンプル数tを出力する。
利得拡大部151は、第1実施形態の利得拡大部111におけるサンプル数計測部118が出力したサンプル数tの代わりに、サンプル数計測部168が出力したサンプル数tを用いる点を除いては同じである。
すなわち、利得拡大部151は、最も低い周波数側にある量子化正規化済係数から値が0ではない最も高い周波数側にある量子化正規化済係数までのサンプル数sから、サンプル数計測部118が出力したサンプル数tを減算して得られる値u=s−t、が大きいほど、今回の利得から新たな利得への増分が大きくなるようにする。例えば、新たな利得g←今回の利得g×(1+u/N×α)とする。ここで、αは予め定めた正の定数とする。
または、利得拡大部151は、符号化対象のすべてのサンプル数Nから、サンプル数計測部118が出力したサンプル数tを減算して得られるv=N−tが大きいほど、今回の利得から新たな利得への増分が大きくなるようにする。たとえば、新たな利得g←今回の利得g×(1+v/N×α)とする。
すなわち利得拡大部151は、量子化正規化済サンプル列の一部または全てのサンプル数から、上記の対応する符号が取り除かれなかった量子化正規化済係数のサンプル数、を減算して得られる値が大きいほど、利得gの値を大きく増加させる。その後、量子化部105の処理に戻る。言い換えると、利得拡大部151は、量子化正規化済サンプル列の一部または全てのサンプル数から、上記の切り捨て符号の対象となる高い周波数側の量子化正規化済係数を量子化部105が出力した量子化正規化済係数系列XQ(1),・・・,XQ(N)から取り除いた残りの量子化正規化済係数のサンプル数t、を減算して得られる値が大きいほど、利得の更新前の値から更新後の値への増分が大きくなるように利得の値を更新し、その後の量子化部105の処理を行わせる。
可変長符号化部159は、判定部157から出力された量子化正規化済係数系列XQ(1),・・・,XQ(N)を可変長符号化して符号を得て、得られた符号を整数信号符号(サンプル列符号)として出力する。可変長符号化によって配分ビット数Bを超えるビット数の符号が得られる場合、可変長符号化部159は、可変長符号化により得られた符号のうち、配分ビット数Bを上回る分だけの符号を、高い周波数側の量子化正規化済係数に対応する符号から取り除いたものを、整数信号符号として出力する。
<符号化装置200>
図4を参照して第2実施形態の符号化装置200が行う符号化処理を説明する。第2実施形態の符号化装置200が第1実施形態の符号化装置100と異なるのは、利得更新ループ処理部130に代えて利得更新ループ処理部230を備え、利得更新ループ処理部230が、利得更新ループ処理部130の量子化部105、判定部107、利得拡大更新部131、および切り捨て部116に代えて、量子化部205、判定部207、利得拡大更新部231、および切り捨て部216を備える点、ならびに第1利得更新部110、第2利得更新部114、および利得縮小部115の処理の後、量子化部105の処理に戻ることに代えて、量子化部205の処理に戻る点である。利得拡大更新部231は、第1実施形態の利得拡大更新部131におけるサンプル数計測部118を含まず、利得下限設定部108と、第1分岐部109と、第1利得更新部110と、利得拡大部211と、から構成される。以下、第1実施形態との差分についてのみ説明する。
量子化部205は、重み付け正規化MDCT係数列XN(1),・・・,XN(N) (所定の区間の入力音響信号に由来するサンプル列)の各係数(各サンプル)を利得gで割り算して得られる値を量子化して、整数値(量子化正規化済サンプル)による系列である量子化正規化済係数系列XQ(1),・・・,XQ(N)を得て出力する。
判定部207は、利得の更新回数が予め定めた回数の場合は、利得、整数信号符号、消費ビット数cを出力する。
利得の更新回数が予め定めた回数未満である場合は、可変長符号化部106が計測した消費ビット数cが配分ビット数Bより多い場合には利得拡大更新部231が、可変長符号化部106が計測した消費ビット数cが配分ビット数Bより少ない場合には利得縮小更新部132が、第1実施形態で説明した処理を行うように制御する。なお、可変長符号化部106が計測した消費ビット数cが配分ビット数Bと等しい場合は、判定部207は、利得、整数信号符号、消費ビット数cを出力する。
切り捨て部216は、判定部207が出力した消費ビット数cが配分ビット数Bより多い場合には、判定部207が出力した整数信号符号のうち、消費ビット数cが配分ビット数Bを上回る分だけの符号を、高い周波数側の量子化正規化済係数に対応する符号から取り除いたものを、新たな整数信号符号として出力する。すなわち切り捨て部216は、消費ビット数cの配分ビット数Bに対する上回り分c−Bに対応する高い周波数側の量子化正規化済係数に対応する符号(切り捨て符号)を整数信号符号(サンプル列符号)から取り除くことで得られる、残りの符号(切り捨て済サンプル列符号)を、新たな整数信号符号として出力する。
利得拡大部211は、消費ビット数cから配分ビット数Bを減算して得られる値である不足ビット数c−Bが大きいほど、今回の利得から新たな利得への増加分が大きくなるようにする。たとえば、新たな利得g←今回の利得g×(1+(c−B)/B×α)とする。ここで、αは予め定めた正の定数とする。すなわち、消費ビット数cが配分ビット数Bよりも多く、なおかつ、利得の上限値gmaxが設定されていない場合、利得拡大部211が、消費ビット数cから配分ビット数Bを減算して得られる値c−Bが大きいほど、利得gの値を大きく増加させる。その後、量子化部205の処理に戻る。言い換えると、利得拡大部211は、消費ビット数cから配分ビット数Bを減算して得られる値c−Bが大きいほど、利得gの更新前の値から更新後の値への増分が大きくなるように利得gの値を更新し、その後の量子化部205の処理を行わせる。
<符号化装置250>
図5を参照して第2実施形態の変形例の符号化装置250が行う符号化処理を説明する。第2実施形態の変形例の符号化装置250が第2実施形態の符号化装置200と異なるのは、可変長符号化で得た整数信号符号のビット数に代えて、整数信号符号の推定ビット数を消費ビット数cとする点である。符号化装置250は、符号化装置200の利得更新ループ処理部230に代えて利得更新ループ処理部290を備え、利得更新ループ処理部290が利得更新ループ処理部230の可変長符号化部106、切り捨て部216、および判定部207に代えて、ビット数推定部156、可変長符号化部159、および判定部257を備える。以下、第2実施形態との差分についてのみ説明する。
ビット数推定部156は、第1実施形態の変形例と同じである。
判定部257は、利得の更新回数が予め定めた回数の場合は、利得、量子化正規化済係数系列、消費ビット数cを出力する。
利得の更新回数が予め定めた回数未満である場合は、ビット数推定部156が推定した消費ビット数cが配分ビット数Bより多い場合には利得拡大更新部231が、ビット数推定部156が推定した消費ビット数cが配分ビット数Bより少ない場合には利得縮小更新部132が、第1実施形態で説明した処理を行うように制御する。なお、ビット数推定部156が推定した消費ビット数cが配分ビット数Bと等しい場合は、判定部257は、利得、量子化正規化済係数系列、消費ビット数cを出力する。
可変長符号化部159は、第1実施形態の変形例と同じである。
<符号化装置300>
図6を参照して第3実施形態の符号化装置300が行う符号化処理を説明する。第3実施形態の符号化装置300が第1実施形態の符号化装置100と異なるのは、利得下限設定部108、第1利得更新部110、利得上限設定部112、および第2利得更新部114に代えて、利得下限設定部308、第1利得更新部310、利得上限設定部312、第2利得更新部314、および消費ビット数記憶部320を備える点である。利得拡大更新部331は、利得拡大更新部131の利得下限設定部108、第1利得更新部110に代えて、利得下限設定部308、第1利得更新部310を備える。利得縮小更新部332は、利得縮小更新部132の利得上限設定部112、第2利得更新部114に代えて、利得上限設定部312、第2利得更新部314を備える。利得更新ループ処理部330は、利得更新ループ処理部130の利得拡大更新部131と利得縮小更新部132に代えて、利得拡大更新部331と利得縮小更新部332を備える。以下、第1実施形態との差分についてのみ説明する。
利得下限設定部308は、今回の利得gの値を利得の下限値gminとして設定する(gmin←g)。また、利得下限設定部308は、消費ビット数cを下限設定時消費ビット数cLとして消費ビット数記憶部320に記憶する。すなわち利得下限設定部308は、消費ビット数cが配分ビット数Bよりも多い場合に、第1実施形態の利得下限設定部108の処理に加え、さらに消費ビット数cを下限設定時消費ビット数cLとして設定して消費ビット数記憶部320に記憶する。
利得上限設定部312は、今回の利得gの値を利得の上限値gmaxと設定する(gmax←g)。また、利得上限設定部312は、消費ビット数cを上限設定時消費ビット数cUとして消費ビット数記憶部320に記憶する。すなわち利得上限設定部312は、消費ビット数cが配分ビット数Bよりも少ない場合に、第1実施形態の利得上限設定部112の処理に加え、さらに消費ビット数cを上限設定時消費ビット数cUとして設定して消費ビット数記憶部320に記憶する。
消費ビット数cが配分ビット数Bよりも多く、なおかつ、利得の上限値gmaxが既に設定されている場合、第1利得更新部310は、配分ビット数Bと上限設定時消費ビット数cUと下限設定時消費ビット数cLとに基づき、利得の下限値gminのもっともらしさの指標と利得の上限値gmaxのもっともらしさの指標との少なくとも何れかを求める。なお、「もっともらしさの指標」とは、利得gの値としてのもっともらしさを表す指標を意味する。
第1利得更新部310は、例えば、利得の下限値gminの相対的もっともらしさを表す指標wを式Aにより求める。
w=(B−cU)/(cL−cU) (式A)
式Aは、意味的には、配分ビット数Bと上限設定時消費ビット数cUとの差、と下限設定時消費ビット数cLと配分ビット数Bとの差に基づく式Bの右辺を変形したものである。
w=(B−cU)/(B−cU+cL−B) (式B)
従って、式Aではなく式Bにより指標wを求めてもよい。
式Aまたは式Bにより求まる指標wが大きいときには、利得の下限値gminのほうが利得gの値としてもっともらしく、指標wが小さいときには、利得の上限値gmaxのほうが利得gの値としてもっともらしいことになる。
利得の上限値gmaxの相対的もっともらしさは(1−w)である。
すなわち、式Aまたは式Bにより指標wを求めることに代えて、利得の上限値gmaxのもっともらしさの指標(1−w)を式Cによって求めてもよい。
(1−w)=(cL−B)/(cL−cU) (式C)
式Cは、意味的には、配分ビット数Bと上限設定時消費ビット数cUとの差B−cU、と下限設定時消費ビット数cLと配分ビット数Bとの差cL−Bに基づく式Dの右辺を変形したものである。
1−w=(cL−B)/(B−cU+cL−B) (式D)
従って、式Cではなく式Dにより指標(1−w)を求めてもよい。
式Aまたは式Bにより求まる指標(1−w)が大きいときには、利得の上限値gmaxのほうが利得gの値としてもっともらしく、指標(1−w)が小さいときには、利得の下限値gminのほうが利得gの値としてもっともらしいことになる。
(1−w)=(cL−B+C)/(cL−cU+2×C)
となり、新たな利得gの値は利得の上限値gmaxと利得の下限値gminの算術平均値と消費ビット数と配分ビット数の差に基づく重みつき平均の中間となる。
その後、量子化部105の処理に戻る。
消費ビット数cが配分ビット数Bよりも少なく、なおかつ、利得の下限値gminが既に設定されている場合に、第2利得更新部314は第1利得更新部310と同じ動作をする。
あるいは、
を利得gの新たな値として得てもよい。すなわち、配分ビット数Bと上限設定時消費ビット数cUの差が大きいほど、利得の上限値gmaxのほうに大きな重みを与えた、または、下限設定時消費ビット数cLと配分ビット数Bの差が大きいほど、利得の下限値gminのほうに大きな重みを与えた、利得の下限値gminと利得の上限値gmaxとの重みつき平均を、利得gの新たな値とすればよく、その処理過程に限定はない。
あるいは、第1利得更新部310および第2利得更新部314が、切り捨てられたサンプル数Trに基づき利得gを更新する構成とする場合には、第1利得更新部310が、
もしくは、
を利得gの新たな値として得てもよい。
また例えば、利得の下限値gminと利得の上限値gmaxの何れかに重みを与えた、利得の下限値gminと利得の上限値gmaxとの重みつき平均を、利得gの新たな値としても良い。例えば、
(ω1×gmin+gmax)/(ω1+1)
を利得gの新たな値としても良い。ここで、ω1は、例えば、gminの方がもっともらしい場合、すなわち(B−cU)>(cL−B)の場合、に1以上の正の値を取り、gmaxの方がもっともらしい場合、すなわち(B−cU)<(cL−B)の場合、に1以下の正の値を取り、B−cUが大きいほど大きな値を取るように設定すればよい。例えば、ω1をB−cUに関する単調増加関数値とすれば良い。あるいは、
(gmin+ω2×gmax)/(1+ω2)
を利得gの新たな値としても良い。ここで、ω2は、例えば、gmaxの方がもっともらしい場合に1以上の正の値を取り、gminの方がもっともらしい場合に1以下の正の値を取り、cL−Bが大きいほど大きな値を取るように設定すればよい。例えば、ω2を、cL−Bに関する単調増加関数値とすれば良い。あるいは、ω3を1以上の正の値であって、B−cUに関する単調増加関数値を取るものとし、ω4を1以上の正の値であってcL−Bに関する単調増加関数値を取るものとして、gminの方がもっともらしい場合((B−cU)>(cL−B)の場合)に
(ω3×gmin+gmax)/(ω3+1)
を利得gの新たな値とし、gmaxの方がもっともらしい場合((B−cU)<(cL−B)の場合)に
(gmin+ω4×gmax)/(1+ω4)
を利得gの新たな値としても良い。
このように、配分ビット数Bと下限設定時消費ビット数cLと上限設定時消費ビット数cUとに少なくとも基づく重みを、利得の上限値gmaxと利得の下限値gminとの少なくとも何れかに与えた、利得の上限値と利得の下限値の重み付き平均を更新後の利得としてもよい。
上記の第3実施形態では第1実施形態の利得下限設定部108、利得上限設定部112、第1利得更新部110、第2利得更新部114を置き換えるものとして説明したが、第2実施形態の利得下限設定部108、利得上限設定部112、第1利得更新部110、第2利得更新部114を上記の第3実施形態で説明したものに置き換えて実施してもよいし、[背景技術]に記載したTCX符号化の符号化装置1000の利得下限設定部1008、利得上限設定部1012、第1利得更新部1010、第2利得更新部1014を上記の第3実施形態で説明したものに置き換えて実施してもよい。
上述の実施形態に関わる符号化装置は、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、CPU(Central Processing Unit)〔キャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)やROM(Read Only Memory)、ハードディスクである外部記憶装置、およびこれらの入力部、出力部、CPU、RAM、ROM、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、符号化装置に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。例えば、上記の各実施形態では、消費ビット数が配分ビット数より少ない場合には利得縮小更新部の処理を行い、消費ビット数が配分ビット数と等しい場合に判定部が利得等を出力することとした。しかしながら、消費ビット数が配分ビット数より多くない場合に利得縮小更新部の処理を行ってもよい。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
Claims (28)
- 所定の区間の入力音響信号に由来するサンプル列の符号化を行う符号化装置の符号化方法であって、
上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数と、所定の配分ビット数Bと、の差が大きいほど、更新前の利得と更新後の利得との差が大きくなるように利得の値を更新する利得拡大縮小ステップを含む処理を行って、利得を得る利得更新ループ処理ステップと、
上記利得更新ループ処理ステップにより得られた利得に対応する利得符号と、上記サンプル列の各サンプルを上記利得で除算して得られる整数値サンプルによる列を符号化して得られる整数信号符号とを得る符号出力ステップと、
を有する符号化方法。 - 所定の区間の入力音響信号に由来するサンプル列について、利得をループ処理により求める利得更新ループ処理ステップにより得られた利得に対応する利得符号と、上記サンプル列の各サンプルを上記利得で除算して得られる整数値サンプルによる列を符号化して得られる整数信号符号とを得る符号化装置の符号化方法であって、
上記利得更新ループ処理ステップは、
上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、所定の配分ビット数Bより多い場合に、上記更新前の利得を利得の下限値gminとして設定する利得下限値設定ステップと、
上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより少ない場合に、上記更新前の利得を利得の上限値gmaxとして設定する利得上限値設定ステップと、
上記配分ビット数Bと、上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより多い場合の上記ビット数または推定ビット数である下限設定時消費ビット数cLと、上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより少ない場合の上記ビット数または推定ビット数である上限設定時消費ビット数cUと、に少なくとも基づく重みを、利得の上限値gmaxと利得の下限値gminとの少なくとも何れかに与えた、利得の上限値と利得の下限値の重み付き平均を更新後の利得とする利得更新ステップと、
を含む符号化方法。 - 所定の区間の入力音響信号に由来するサンプル列の符号化を行う符号化装置の符号化方法であって、
上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化ステップと、
上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化ステップと、
上記利得よりも大きな値を新たな利得として設定する利得拡大更新ステップと、
上記利得よりも小さな値を新たな利得として設定する利得縮小更新ステップと、
上記利得の更新回数が予め定めた回数の場合は上記利得と上記サンプル列符号とを出力し、上記利得の更新回数が予め定めた回数未満かつ上記サンプル列符号のビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に利得縮小更新ステップを行わせる判定ステップと、
を有し、
上記利得拡大更新ステップは、
上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定ステップと、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記量子化正規化済サンプル列の一部または全てのサンプル数Aから、上記消費ビット数の上記配分ビット数に対する上回り分に対応する切り捨て符号を上記サンプル列符号から取り除くことで得られる残りの切り捨て済サンプル列符号に対応する量子化正規化済サンプルのサンプル数T、を減算して得られる値A−Tが大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得拡大ステップと、
を含み、
上記利得縮小更新ステップは、
上記消費ビット数が上記配分ビット数よりも少ない場合に上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定ステップと、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得縮小ステップと、
を含む符号化方法。 - 所定の区間の入力音響信号に由来するサンプル列の符号化を行う符号化装置の符号化方法であって、
上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化ステップと、
上記利得よりも大きな値を新たな利得として設定する利得拡大更新ステップと、
上記利得よりも小さな値を新たな利得として設定する利得縮小更新ステップと、
上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化ステップと、
上記利得の更新回数が予め定めた回数の場合は可変長符号化ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記量子化正規化済サンプル列に対応する符号の推定ビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新ステップを行わせる判定ステップと、
を有し、
上記利得拡大更新ステップは、
上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定ステップと、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記量子化正規化済サンプル列の一部または全てのサンプル数Aから、上記消費ビット数の上記配分ビット数に対する上回り分に対応する切り捨て符号の対象となる量子化正規化済サンプルを上記量子化正規化済サンプル列から取り除いた残りのサンプル数T、を減算して得られる値A−Tが大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得拡大ステップと、
を含み、
上記利得縮小更新ステップは、
上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定ステップと、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得縮小ステップと、
を含む符号化方法。 - 所定の区間の入力音響信号に由来するサンプル列の符号化を行う符号化装置の符号化方法であって、
上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化ステップと、
上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化ステップと、
上記利得よりも大きな値を新たな利得として設定する利得拡大更新ステップと、
上記利得よりも小さな値を新たな利得として設定する利得縮小更新ステップと、
上記利得の更新回数が予め定めた回数の場合は上記利得と上記サンプル列符号とを出力し、上記利得の更新回数が予め定めた回数未満かつ上記サンプル列符号のビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新ステップを行わせる判定ステップと、
を有し、
上記利得拡大更新ステップは、
上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定ステップと、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記消費ビット数から上記配分ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得拡大ステップと、
を含み、
上記利得縮小更新ステップは、
上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定ステップと、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得縮小ステップと、
を含む符号化方法。 - 所定の区間の入力音響信号に由来するサンプル列の符号化を行う符号化装置の符号化方法であって、
上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化ステップと、
上記利得よりも大きな値を新たな利得として設定する利得拡大更新ステップと、
上記利得よりも小さな値を新たな利得として設定する利得縮小更新ステップと、
上記利得の更新回数が予め定めた回数の場合は可変長符号化ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記量子化正規化済サンプル列に対応する符号の推定ビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新ステップを行わせる判定ステップと、
を有し、
上記利得拡大更新ステップは、
上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定ステップと、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記消費ビット数から上記配分ビット数を減算して得られる値が大きいほど、利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得拡大ステップと、
を含み、
上記利得縮小更新ステップは、
上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定ステップと、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得縮小ステップと、
上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化ステップと、
を含む符号化方法。 - 請求項4から7の何れかの符号化方法であって、
上記利得拡大更新ステップは、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数、上記消費ビット数が上記配分ビット数よりも多い場合の上記消費ビット数である下限設定時消費ビット数、および、上記消費ビット数が上記配分ビット数よりも少ない場合の上記消費ビット数である上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第1利得更新ステップ
をさらに含み、
上記利得縮小更新ステップは、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、上記配分ビット数、上記下限設定時消費ビット数、および上記上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第2利得更新ステップ
をさらに含む符号化方法。 - 請求項4から7の何れかの符号化方法であって、
上記利得拡大更新ステップは、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記消費ビット数が上記配分ビット数よりも多い場合の上記消費ビット数である下限設定時消費ビット数cL、上記消費ビット数が上記配分ビット数よりも少ない場合の上記消費ビット数である上限設定時消費ビット数cU、上記利得の下限値gmin、および上記利得の上限値gmaxについての
を、上記利得の新たな値とする第1利得更新ステップ
をさらに含み、
上記利得縮小更新ステップは、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
を、上記利得の新たな値とする第2利得更新ステップ
をさらに含む符号化方法。 - 請求項4から7の何れかの符号化方法であって、
上記利得拡大更新ステップは、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記消費ビット数が上記配分ビット数よりも多い場合の上記消費ビット数である下限設定時消費ビット数cL、上記消費ビット数が上記配分ビット数よりも少ない場合の上記消費ビット数である上限設定時消費ビット数cU、上記利得の下限値gmin、上記利得の上限値gmax、および正の定数Cについての
を、上記利得の新たな値とする第1利得更新ステップ
をさらに含み、
上記利得縮小更新ステップは、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
を、上記利得の新たな値とする第2利得更新ステップ
をさらに含む符号化方法。 - 請求項4または5の符号化方法であって、
上記利得拡大更新ステップは、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数、および、上記消費ビット数が上記配分ビット数よりも少ない場合における上記消費ビット数である上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第1利得更新ステップ
をさらに含み、
上記利得縮小更新ステップは、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、上記配分ビット数、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数、および上記上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第2利得更新ステップ
をさらに含む符号化方法。 - 請求項4または5の符号化方法であって、
上記利得拡大更新ステップは、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数Tr、および、上記消費ビット数が上記配分ビット数よりも少ない場合における上記消費ビット数である上限設定時消費ビット数cU、上記利得の下限値gmin、上記利得の上限値gmax、および係数γについての
を、上記利得の新たな値とする第1利得更新ステップ
をさらに含み、
上記利得縮小更新ステップは、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
を、上記利得の新たな値とする第2利得更新ステップ
をさらに含む符号化方法。 - 請求項4または5の符号化方法であって、
上記利得拡大更新ステップは、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数Tr、および、上記消費ビット数が上記配分ビット数よりも少ない場合における上記消費ビット数である上限設定時消費ビット数cU、上記利得の下限値gmin、上記利得の上限値gmax、係数γ、および正の定数Cについての
を、上記利得の新たな値とする第1利得更新ステップ
をさらに含み、
上記利得縮小更新ステップは、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
を、上記利得の新たな値とする第2利得更新ステップ
をさらに含む符号化方法。 - 所定の区間の入力音響信号に由来するサンプル列の符号化装置であって、
上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数と、所定の配分ビット数Bと、の差が大きいほど、更新前の利得と更新後の利得との差が大きくなるように利得の値を更新する利得拡大縮小部の処理を含む処理を行って、利得を得る利得更新ループ処理部と、
上記利得更新ループ処理部により得られた利得に対応する利得符号と、上記サンプル列の各サンプルを上記利得で除算して得られる整数値サンプルによる列を符号化して得られる整数信号符号とを得る符号出力部と、
を有する符号化装置。 - 所定の区間の入力音響信号に由来するサンプル列について、利得をループ処理により求める利得更新ループ処理部により得られた利得に対応する利得符号と、上記サンプル列の各サンプルを上記利得で除算して得られる整数値サンプルによる列を符号化して得られる整数信号符号とを得る符号化装置であって、
上記利得更新ループ処理部は、
上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより多い場合に、上記更新前の利得を利得の下限値gminとして設定する利得下限値設定部と、
上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより少ない場合に、上記更新前の利得を利得の上限値gmaxとして設定する利得上限値設定部と、
上記配分ビット数Bと、上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより多い場合の上記ビット数または推定ビット数である下限設定時消費ビット数cLと、上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより少ない場合の上記ビット数または推定ビット数である上限設定時消費ビット数cUと、に少なくとも基づく重みを、利得の上限値gmaxと利得の下限値gminとの少なくとも何れかに与えた、利得の上限値と利得の下限値の重み付き平均を更新後の利得とする利得更新部と、
を含む符号化装置。 - 所定の区間の入力音響信号に由来するサンプル列の符号化装置であって、
上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化部と、
上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化部と、
上記利得よりも大きな値を新たな利得として設定する利得拡大更新部と、
上記利得よりも小さな値を新たな利得として設定する利得縮小更新部と、
上記利得の更新回数が予め定めた回数の場合は上記利得と上記サンプル列符号とを出力し、上記利得の更新回数が予め定めた回数未満かつ上記サンプル列符号のビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に利得縮小更新部の処理を行わせる判定部と、
を有し、
上記利得拡大更新部は、
上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定部と、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記量子化正規化済サンプル列の一部または全てのサンプル数Aから、上記消費ビット数の上記配分ビット数に対する上回り分に対応する切り捨て符号を上記サンプル列符号から取り除くことで得られる残りの切り捨て済サンプル列符号に対応する量子化正規化済サンプルのサンプル数T、を減算して得られる値A−Tが大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得拡大部と、
を含み、
上記利得縮小更新部は、
上記消費ビット数が上記配分ビット数よりも少ない場合に上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定部と、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得縮小部と、
を含む符号化装置。 - 所定の区間の入力音響信号に由来するサンプル列の符号化装置であって、
上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化部と、
上記利得よりも大きな値を新たな利得として設定する利得拡大更新部と、
上記利得よりも小さな値を新たな利得として設定する利得縮小更新部と、
上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化部と、
上記利得の更新回数が予め定めた回数の場合は可変長符号化部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記量子化正規化済サンプル列に対応する符号の推定ビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新部の処理を行わせる判定部と、
を有し、
上記利得拡大更新部は、
上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定部と、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記量子化正規化済サンプル列の一部または全てのサンプル数Aから、上記消費ビット数の上記配分ビット数に対する上回り分に対応する切り捨て符号の対象となる量子化正規化済サンプルを上記量子化正規化済サンプル列から取り除いた残りのサンプル数T、を減算して得られる値A−Tが大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得拡大部と、
を含み、
上記利得縮小更新部は、
上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定部と、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得縮小部と、
を含む符号化装置。 - 所定の区間の入力音響信号に由来するサンプル列の符号化装置であって、
上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化部と、
上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化部と、
上記利得よりも大きな値を新たな利得として設定する利得拡大更新部と、
上記利得よりも小さな値を新たな利得として設定する利得縮小更新部と、
上記利得の更新回数が予め定めた回数の場合は上記利得と上記サンプル列符号とを出力し、上記利得の更新回数が予め定めた回数未満かつ上記サンプル列符号のビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新部の処理を行わせる判定部と、
を有し、
上記利得拡大更新部は、
上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定部と、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記消費ビット数から上記配分ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得拡大部と、
を含み、
上記利得縮小更新部は、
上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定部と、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得縮小部と、
を含む符号化装置。 - 所定の区間の入力音響信号に由来するサンプル列の符号化装置であって、
上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化部と、
上記利得よりも大きな値を新たな利得として設定する利得拡大更新部と、
上記利得よりも小さな値を新たな利得として設定する利得縮小更新部と、
上記利得の更新回数が予め定めた回数の場合は可変長符号化部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記量子化正規化済サンプル列に対応する符号の推定ビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新部の処理を行わせる判定部と、
を有し、
上記利得拡大更新部は、
上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定部と、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記消費ビット数から上記配分ビット数を減算して得られる値が大きいほど、利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得拡大部と、
を含み、
上記利得縮小更新部は、
上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定部と、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得縮小部と、
上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化部と、
を含む符号化装置。 - 請求項17から20の何れかの符号化装置であって、
上記利得拡大更新部は、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数、上記下限設定時消費ビット数、および上記上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第1利得更新部
をさらに含み、
上記利得縮小更新部は、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、上記配分ビット数、上記消費ビット数が上記配分ビット数よりも多い場合の上記消費ビット数である下限設定時消費ビット数、および、上記消費ビット数が上記配分ビット数よりも少ない場合の上記消費ビット数である上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第2利得更新部
をさらに含む符号化装置。 - 請求項17から20の何れかの符号化装置であって、
上記利得拡大更新部は、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記消費ビット数が上記配分ビット数よりも多い場合の上記消費ビット数である下限設定時消費ビット数cL、上記消費ビット数が上記配分ビット数よりも少ない場合の上記消費ビット数である上限設定時消費ビット数cU、上記利得の下限値gmin、および上記利得の上限値gmaxについての
を、上記利得の新たな値とする第1利得更新部
をさらに含み、
上記利得縮小更新部は、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
を、上記利得の新たな値とする第2利得更新部
をさらに含む符号化装置。 - 請求項17から20の何れかの符号化装置であって、
上記利得拡大更新部は、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記消費ビット数が上記配分ビット数よりも多い場合の上記消費ビット数である下限設定時消費ビット数cL、上記消費ビット数が上記配分ビット数よりも少ない場合の上記消費ビット数である上限設定時消費ビット数cU、上記利得の下限値gmin、上記利得の上限値gmax、および正の定数Cについての
を、上記利得の新たな値とする第1利得更新部
をさらに含み、
上記利得縮小更新部は、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
を、上記利得の新たな値とする第2利得更新部
をさらに含む符号化装置。 - 請求項17または18の符号化装置であって、
上記利得拡大更新部は、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数、および、上記消費ビット数が上記配分ビット数よりも少ない場合における上記消費ビット数である上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第1利得更新部
をさらに含み、
上記利得縮小更新部は、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、上記配分ビット数、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数、および上記上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第2利得更新部
をさらに含む符号化装置。 - 請求項17または18の符号化装置であって、
上記利得拡大更新部は、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数Tr、および、上記消費ビット数が上記配分ビット数よりも少ない場合における上記消費ビット数である上限設定時消費ビット数cU、上記利得の下限値gmin、上記利得の上限値gmax、および係数γについての
を、上記利得の新たな値とする第1利得更新部
をさらに含み、
上記利得縮小更新部は、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
を、上記利得の新たな値とする第2利得更新部
をさらに含む符号化装置。 - 請求項17または18の符号化装置であって、
上記利得拡大更新部は、
上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数Tr、および、上記消費ビット数が上記配分ビット数よりも少ない場合における上記消費ビット数である上限設定時消費ビット数cU、上記利得の下限値gmin、上記利得の上限値gmax、係数γ、および正の定数Cについての
を、上記利得の新たな値とする第1利得更新部
をさらに含み、
上記利得縮小更新部は、
上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
を、上記利得の新たな値とする第2利得更新部
をさらに含む符号化装置。 - 請求項1から13の何れかの符号化方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項1から13の何れかの符号化方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014518696A JP5872034B2 (ja) | 2012-05-30 | 2013-05-29 | 符号化方法、符号化装置、プログラム、および記録媒体 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012122785 | 2012-05-30 | ||
JP2012122785 | 2012-05-30 | ||
PCT/JP2013/064877 WO2013180164A1 (ja) | 2012-05-30 | 2013-05-29 | 符号化方法、符号化装置、プログラム、および記録媒体 |
JP2014518696A JP5872034B2 (ja) | 2012-05-30 | 2013-05-29 | 符号化方法、符号化装置、プログラム、および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2013180164A1 JPWO2013180164A1 (ja) | 2016-01-21 |
JP5872034B2 true JP5872034B2 (ja) | 2016-03-01 |
Family
ID=49673352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014518696A Active JP5872034B2 (ja) | 2012-05-30 | 2013-05-29 | 符号化方法、符号化装置、プログラム、および記録媒体 |
Country Status (8)
Country | Link |
---|---|
US (1) | US9552821B2 (ja) |
EP (3) | EP2827328B1 (ja) |
JP (1) | JP5872034B2 (ja) |
KR (4) | KR101746697B1 (ja) |
CN (1) | CN104321813B (ja) |
ES (3) | ES2661504T3 (ja) |
PL (2) | PL3534367T3 (ja) |
WO (1) | WO2013180164A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4407609A3 (en) * | 2013-12-02 | 2024-08-21 | Top Quality Telephony, Llc | A computer-readable storage medium and a computer software product |
US9911427B2 (en) * | 2014-03-24 | 2018-03-06 | Nippon Telegraph And Telephone Corporation | Gain adjustment coding for audio encoder by periodicity-based and non-periodicity-based encoding methods |
CN106448688B (zh) | 2014-07-28 | 2019-11-05 | 华为技术有限公司 | 音频编码方法及相关装置 |
CN107430869B (zh) * | 2015-01-30 | 2020-06-12 | 日本电信电话株式会社 | 参数决定装置、方法及记录介质 |
US11087774B2 (en) * | 2017-06-07 | 2021-08-10 | Nippon Telegraph And Telephone Corporation | Encoding apparatus, decoding apparatus, smoothing apparatus, inverse smoothing apparatus, methods therefor, and recording media |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
US20230121712A1 (en) * | 2021-10-18 | 2023-04-20 | S&P Global Inc. | String Alignment with Translocation Insensitivity |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6732071B2 (en) | 2001-09-27 | 2004-05-04 | Intel Corporation | Method, apparatus, and system for efficient rate control in audio encoding |
US7940839B2 (en) * | 2004-01-26 | 2011-05-10 | Diablo Technologies Inc. | Fully adaptive equalization for high loss communications channels |
US7292092B2 (en) * | 2004-08-31 | 2007-11-06 | Integration Associates Inc. | Tunable poly-phase filter and method for calibration thereof |
EP1632902B1 (en) * | 2004-09-03 | 2007-12-05 | STMicroelectronics S.r.l. | Method for image compression, related system and computer product therefor |
KR100682890B1 (ko) | 2004-09-08 | 2007-02-15 | 삼성전자주식회사 | 비트량 고속제어가 가능한 오디오 부호화 방법 및 장치 |
JP4639073B2 (ja) * | 2004-11-18 | 2011-02-23 | キヤノン株式会社 | オーディオ信号符号化装置および方法 |
JP4641272B2 (ja) * | 2006-03-08 | 2011-03-02 | シャープ株式会社 | デジタルデータ復号化装置 |
US8374857B2 (en) * | 2006-08-08 | 2013-02-12 | Stmicroelectronics Asia Pacific Pte, Ltd. | Estimating rate controlling parameters in perceptual audio encoders |
JP5224666B2 (ja) * | 2006-09-08 | 2013-07-03 | 株式会社東芝 | オーディオ符号化装置 |
WO2009001874A1 (ja) * | 2007-06-27 | 2008-12-31 | Nec Corporation | オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム |
US8566106B2 (en) * | 2007-09-11 | 2013-10-22 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
JP2010281965A (ja) * | 2009-06-03 | 2010-12-16 | Sony Corp | 量子化装置、再生装置、量子化方法およびプログラム |
US9240192B2 (en) * | 2010-07-06 | 2016-01-19 | Panasonic Intellectual Property Corporation Of America | Device and method for efficiently encoding quantization parameters of spectral coefficient coding |
US20150341158A1 (en) * | 2014-05-23 | 2015-11-26 | Mediatek Inc. | Loop gain calibration apparatus for controlling loop gain of timing recovery loop and related loop gain calibration method |
-
2013
- 2013-05-29 US US14/394,158 patent/US9552821B2/en active Active
- 2013-05-29 EP EP13796771.7A patent/EP2827328B1/en active Active
- 2013-05-29 ES ES13796771.7T patent/ES2661504T3/es active Active
- 2013-05-29 CN CN201380026180.4A patent/CN104321813B/zh active Active
- 2013-05-29 KR KR1020167026537A patent/KR101746697B1/ko active IP Right Grant
- 2013-05-29 EP EP19169511.3A patent/EP3534367B1/en active Active
- 2013-05-29 KR KR1020177015496A patent/KR101762205B1/ko active IP Right Grant
- 2013-05-29 JP JP2014518696A patent/JP5872034B2/ja active Active
- 2013-05-29 PL PL19169511T patent/PL3534367T3/pl unknown
- 2013-05-29 KR KR1020147032029A patent/KR101661917B1/ko active IP Right Grant
- 2013-05-29 KR KR1020177015504A patent/KR101762210B1/ko active IP Right Grant
- 2013-05-29 EP EP17175244.7A patent/EP3236468B1/en active Active
- 2013-05-29 PL PL17175244T patent/PL3236468T3/pl unknown
- 2013-05-29 ES ES19169511T patent/ES2807241T3/es active Active
- 2013-05-29 WO PCT/JP2013/064877 patent/WO2013180164A1/ja active Application Filing
- 2013-05-29 ES ES17175244T patent/ES2742481T3/es active Active
Also Published As
Publication number | Publication date |
---|---|
KR101746697B1 (ko) | 2017-06-14 |
EP3534367B1 (en) | 2020-05-13 |
CN104321813A (zh) | 2015-01-28 |
KR20170068617A (ko) | 2017-06-19 |
US9552821B2 (en) | 2017-01-24 |
WO2013180164A1 (ja) | 2013-12-05 |
US20150088529A1 (en) | 2015-03-26 |
EP2827328A4 (en) | 2016-04-13 |
JPWO2013180164A1 (ja) | 2016-01-21 |
EP3236468B1 (en) | 2019-05-29 |
KR101762205B1 (ko) | 2017-07-27 |
KR20170069294A (ko) | 2017-06-20 |
EP2827328B1 (en) | 2018-01-03 |
PL3534367T3 (pl) | 2020-10-05 |
PL3236468T3 (pl) | 2019-10-31 |
EP3534367A1 (en) | 2019-09-04 |
KR20150003817A (ko) | 2015-01-09 |
EP3236468A1 (en) | 2017-10-25 |
KR101661917B1 (ko) | 2016-10-05 |
CN104321813B (zh) | 2016-12-14 |
KR101762210B1 (ko) | 2017-07-27 |
ES2742481T3 (es) | 2020-02-14 |
ES2807241T3 (es) | 2021-02-22 |
ES2661504T3 (es) | 2018-04-02 |
KR20160114200A (ko) | 2016-10-04 |
EP2827328A1 (en) | 2015-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5872034B2 (ja) | 符号化方法、符号化装置、プログラム、および記録媒体 | |
JP5603484B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
JP5893153B2 (ja) | 符号化方法、符号化装置、プログラム、および記録媒体 | |
JP5612698B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
JP6595687B2 (ja) | 符号化方法、符号化装置、プログラム、および記録媒体 | |
JP6979048B2 (ja) | 低複雑度の調性適応音声信号量子化 | |
US9838700B2 (en) | Encoding apparatus, decoding apparatus, and method and program for the same | |
JP5663461B2 (ja) | 符号化方法、符号化装置、プログラム、記録媒体 | |
EP3252758A1 (en) | Encoding device, decoding device, methods therefor, program, and recording medium | |
JP5361565B2 (ja) | 符号化方法、復号方法、符号化器、復号器およびプログラム | |
JP5336942B2 (ja) | 符号化方法、復号方法、符号化器、復号器、プログラム | |
JP5579932B2 (ja) | 符号化方法、装置、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160112 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5872034 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R157 | Certificate of patent or utility model (correction) |
Free format text: JAPANESE INTERMEDIATE CODE: R157 |