JP2009532976A - 多重経路トレリス符号化量子化方法およびこれを用いた多重経路トレリス符号化量子化装置 - Google Patents
多重経路トレリス符号化量子化方法およびこれを用いた多重経路トレリス符号化量子化装置 Download PDFInfo
- Publication number
- JP2009532976A JP2009532976A JP2009504102A JP2009504102A JP2009532976A JP 2009532976 A JP2009532976 A JP 2009532976A JP 2009504102 A JP2009504102 A JP 2009504102A JP 2009504102 A JP2009504102 A JP 2009504102A JP 2009532976 A JP2009532976 A JP 2009532976A
- Authority
- JP
- Japan
- Prior art keywords
- trellis
- distortion
- stage
- paths
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013139 quantization Methods 0.000 title claims abstract description 102
- 238000000034 method Methods 0.000 title claims abstract description 80
- 230000004083 survival effect Effects 0.000 claims abstract description 64
- 230000001186 cumulative effect Effects 0.000 claims abstract description 51
- 238000004364 calculation method Methods 0.000 claims description 26
- 230000003595 spectral effect Effects 0.000 claims description 5
- 238000001228 spectrum Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 16
- 230000005540 biological transmission Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Error Detection And Correction (AREA)
Abstract
本発明は、トレリス符号化量子化に関し、より詳細には、音声符号化システムに用いられるトレリス符号化量子化方法および装置に関する。
本発明の一実施形態に係る多重経路トレリス符号化量子化方法は、トレリスのI(Iは0以上の整数)番目ステージのノードのうち1つに入ってくる2N(Nは2以上の整数)個の生存経路それぞれに相応する累積歪みを算出するステップと、2N個の生存経路それぞれに相応する累積歪みを比較し、2N個の生存経路のうち累積歪みが少ないN個の経路を選択するステップと、N個の経路をI+1番目ステージに入力される生存経路として設定するステップと、前記トレリスの最後のステージのノードそれぞれに対して2N個ずつ存在する生存経路のうち前記累積歪みが最も少ない経路を最適経路として選択するステップとを含むことを特徴とする。したがって、より多くの経路を候補経路として考慮して量子化性能を高めることができる。
本発明の一実施形態に係る多重経路トレリス符号化量子化方法は、トレリスのI(Iは0以上の整数)番目ステージのノードのうち1つに入ってくる2N(Nは2以上の整数)個の生存経路それぞれに相応する累積歪みを算出するステップと、2N個の生存経路それぞれに相応する累積歪みを比較し、2N個の生存経路のうち累積歪みが少ないN個の経路を選択するステップと、N個の経路をI+1番目ステージに入力される生存経路として設定するステップと、前記トレリスの最後のステージのノードそれぞれに対して2N個ずつ存在する生存経路のうち前記累積歪みが最も少ない経路を最適経路として選択するステップとを含むことを特徴とする。したがって、より多くの経路を候補経路として考慮して量子化性能を高めることができる。
Description
本発明は、トレリス符号化量子化(trellis coded quantization:TCQ)に関し、より詳細には、音声符号化システムに用いられるトレリス符号化量子化方法および装置に関する。
音声符号化システムにおいて、高音質の音声符号化のためには、音声信号の短区間相関度を示す線形予測符号(Linear Predictive Coding:LPC)係数を効率的に量子化することが極めて重要である。LPCフィルタで最適な線形予測符号係数値は、音声入力信号をフレーム単位に分け、各フレーム別に予測誤差のエネルギを最小化させる形態で求める。3GPPでIMP−2000システム用広帯域音声符号化器として標準化したAMR_WB(Adaptive Multi−Rate_WideBand)音声符号化器のLPCフィルタは16次all−poleフィルタであり、このとき用いられる16個のLPC係数の量子化のために多くのビットが割り当てられる。例えば、CDMA移動通信システムに用いられる音声符号化方式であるIS−96A QCELP(Qualcomm Code Excited Linear Prediction)は、全体ビットの25%をLPC量子化に用いており、Nokia社のAMR_WB音声符号化器は、合計9個のモードのうち全体ビットの最高27.3%から最低9.6%をLPC量子化に用いている。
今まで、LPC係数の効率的な量子化のための多くの方法が開発され、実際に音声圧縮機に用いられている。このような方法のうちLPCフィルタの係数を直接量子化する方法は、フィルタの特性がLPC係数の量子化誤差に極めて敏感であり、量子化後のLPCフィルタの安全性が保障されないという問題点があった。したがって、LPC係数を量子化特性が優れた他のパラメータに変換して量子化しなければならず、主に反射係数(reflection coefficient)またはLSF(Line Spectrum Frequency:ラインスペクトル周波数)係数に変換して量子化する。特に、LSF係数は、音声の周波数特性と密接に関連する性質があり、最近開発された標準音声圧縮機の大部分はLSF量子化方法を用いる。
また、LSF係数のフレーム間の相関関係を用いれば、より効率的な量子化を実現することができる。すなわち、現在フレームのLSFを直接量子化せずに、過去フレームのLSF情報から現在フレームのLSFを予測し、予測された2つのフレーム間の誤差を量子化するものである。このLSF値は、音声信号の周波数特性と密接な関係があるため、時間的に予測が可能なだけでなく、極めて大きい予測利得を得ることができる。
LSF値予測方法としては、AR(auto−regressive)フィルタを用いる方法と、MA(moving average)フィルタを用いる方法がある。ARフィルタは、予測性能が優れている反面、受信側で伝達エラーの影響がフレーム進行にしたがって継続して伝播されるという短所がある。MAフィルタはARフィルタに比べて予測性能は落ちるが、伝達エラーの影響が時間的に制限されるという長所がある。したがって、無線通信のように伝達エラーが多発する環境に用いられるAMR、AMR−WB、SMVなどのような音声圧縮機には、MAフィルタを用いたLSF値予測方法が用いられている。また、フレーム間のLSF値予測の他に、フレーム内で隣り合うLSF要素値間の相関度を用いた予測方法も開発された。LSF値は常に手順性質を繰り返すため、この方法を用いれば量子化の効率をさらに増大させることができる。
LSF係数の予測エラー値に対する量子化方法は、スカラー量子化とベクトル量子化とに分けることができる。現在、性能に比べて多くのビットを用いるスカラー量子化よりもベクトル量子化が広く用いられている。ベクトル量子化で全体ベクトルを一度に量子化することは、ベクトルテーブルのサイズが極めて大きくなり、検索時間が多く所要されるため不可能である。これを解決するために、全体ベクトルを幾つかの副ベクトルに分け、それぞれを独立的にベクトル量子化する方法が開発されたが、これを分割ベクトル量子化(Split Vector Quantization:SVQ)方法と言う。例えば、20ビットを用いた10次ベクトル量子化で一度に量子化する場合、ベクトルテーブルのサイズが10×220となるが、2個の5次副ベクトルに分けて10ビットずつ割り当てる格子ベクトル量子化方法を用いれば、ベクトルテーブルのサイズが5×210×2となる。
韓国登録特許第10−486732号には、「ブロック制限されたトレリス符号化量子化方法と音声符号化システムにおいて、これを採用したラインスペクトル周波数係数量子化方法および装置」が開示されている。韓国登録特許第10−486732号は、入力信号および係数の量子化時に要求されるメモリサイズとコードブック探索過程で計算量および複雑度を減少させながらも優れたSNR(Signal to Noise Ratio)性能を有する符号化量子化方法を提供するために、トレリス符号化量子化(trellis coded quantization:TCQ)で最初と最後のステージ(stage)に制約(constraint)を置き、初期状態(initial state)に割り当てられるビットを減らすことができる。
しかしながら、韓国登録特許第10−486732号は、各ステージで生存経路(survivor path)を1つずつのみ格納するため、累積歪み(distortion)が最小である経路が漏れるという短所がある。
したがって、より効果的に累積歪みが少ないトレリス上の経路を探し出すことができる新しいトレリス符号化量子化方法および装置の必要性が切に求められている。
本発明は、上述した従来技術の問題点を解決するために案出されたものであって、低い送信率で量子化性能を高めることを目的とする。
また、本発明は、入力信号の相関度(correlation)を用いるトレリス符号化量子化において、生存経路を1つだけ格納する場合に発生する問題点を解決することを他の目的とする。
さらに、本発明は、BC−TCQ(Block Constrained−TCQ)のような量子化を用いる音声符号化システムにおいて、入力信号および係数の量子化を効率的に実行して量子化性能を向上させることをさらに他の目的とする。
上述した目的を達成し、従来技術の問題点を解決するために、本発明の多重経路トレリス符号化量子化方法は、トレリスのI(Iは0以上の整数)番目ステージのノードのうち1つに入ってくる2N(Nは2以上の整数)個の生存経路それぞれに相応する累積歪みを算出するステップと、前記2N個の生存経路それぞれに相応する累積歪みを比較し、前記2N個の生存経路のうち前記累積歪みが少ないN個の経路を選択するステップと、前記N個の経路をI+1番目ステージに入力される生存経路として設定するステップと、前記トレリスの最後のステージのノードそれぞれに対して2N個ずつ存在する前記生存経路のうち前記累積歪みが最も少ない経路を最適経路として選択するステップとを含むことを特徴とする。
このとき、累積歪みを算出するステップは、前記2N個の生存経路で量子化された値を用いて前記トレリスのI番目ステージに相応する値を予測するステップと、前記予測された値を用いて前記トレリスのI番目ステージの2N個の予測エラー(prediction error)を求めるステップと、前記トレリスのI番目ステージに相応する各ブランチに割り当てられたサブコードブックから選択された代表値と前記予測エラーとの間の歪みを求めるステップと、前記歪みを用いて前記I番目ステージまでの累積歪みを算出するステップとを含むことができる。
また、本発明の一実施形態に係る多重経路トレリス符号化量子化装置は、トレリスのI(Iは0以上の整数)番目ステージのノードのうち1つに入ってくる2N(Nは2以上の整数)個の生存経路それぞれに相応する累積歪みを算出する累積歪み算出部と、前記2N個の生存経路それぞれに相応する累積歪みを比較し、前記2N個の生存経路のうち前記累積歪みが少ないN個の経路を選択し、選択された前記N個の経路をI+1番目ステージに入力される生存経路として設定する生存経路設定部と、前記トレリスの最後のステージのノードそれぞれに対して2N個ずつ存在する前記生存経路のうち前記累積歪みが最も少ない経路を最適経路として選択する最適経路選択部とを備えることを特徴とする。
このとき、累積歪み算出部は、前記2N個の生存経路で量子化された値を用いて前記トレリスのI番目ステージに相応する値を予測する予測部と、前記予測された値を用いて前記トレリスのI番目ステージの2N個の予測エラーを算出する予測エラー算出部と、前記トレリスのI番目ステージに相応する各ブランチに割り当てられたサブコードブックから選択された代表値と前記予測エラーとの間の歪みを算出する歪み算出部と、前記歪みを用いて前記I番目ステージまでの累積歪みを算出する累積算出部とを備えることを特徴とする。
このとき、前記多重経路トレリス符号化量子化方法および装置は、入力信号のフレーム間に実行された予測エラー値の量子化に用いることができる。
このとき、前記多重経路トレリス符号化量子化方法および装置は、前処理(preprocessing)された入力信号を量子化するのに用いることができる。
また、本発明の一実施形態に係る音声入力信号符号化方法は、音声入力信号に対応する線形予測符号係数を計算するステップと、前記線形予測符号係数に基づいてラインスペクトル周波数係数を計算するステップと、前記ラインスペクトル周波数係数をトレリス符号化量子化するステップと、前記量子化されたラインスペクトル周波数係数によってビットストリームを生成するステップとを含む。ここで、前記トレリス符号化量子化するステップは、第1ステージのノードからトレリス構造の最後のステージのノードとして複数の生存経路を判断するステップと、前記複数の生存経路それぞれに対する累積歪み値を計算するステップと、前記累積歪み値に基づいて前記複数の生存経路から最適経路を選択するステップとを含む。
また、本発明の一実施形態に係るトレリス符号化量子化方法は、第1ステージのノードからトレリス構造の最後のステージのノードとして複数の生存経路を判断するステップと、前記複数の生存経路それぞれに対する累積歪み値を計算するステップと、前記累積歪み値に基づいて前記複数の生存経路から最適経路を選択するステップとを含む。
また、本発明の一実施形態に係るトレリス構造を探索する方法は、I番目のステージの第1ノードとトレリス構造のI+1番目の第2ノードとの間で2N個の生存経路を判断するステップと、前記2N個の生存経路それぞれに対応する予め決定された変数を計算するステップと、前記予め決定された変数に基づいて前記N個の2N個の生存経路から生存経路を選択するステップとを含む。
以下、本発明に係る好ましい実施形態について、添付の図面を参照しながら詳細に説明する。
図1は、本発明の一実施形態に係る多重経路トレリス符号化量子化方法の必要性を説明するためのトレリス図である。図1を参照するに、トレリス符号化量子化において、各ステージで1つのノードに対して1つずつの生存経路(survive path)を残しておく場合に、最適経路が捨てられるという問題点があることが分かる。
すなわち、i−1番目ステージでノード121に対してノード111からの経路およびノード113からの経路のうちノード113からの経路1つだけが生存経路(survivor path)となって次のステージに伝達されれば、i番目ステージでノード131に対してノード113およびノード121を経る経路だけが選択されることができ、ノード111およびノード121を経る経路は選択されることができない。しかしながら、実際には、トレリス符号化量子化方法で入力信号の相関度を用いて生存経路を算出するため、i番目ステージでノード131に対してノード113およびノード121を経る経路よりも、ノード111およびノード121を経る経路が累積歪みが小さい場合がある。
したがって、より効率的にトレリス符号化量子化を実行するためには、各ステージでノード1つに入っていく経路を2つ以上格納する必要がある。
図2は、本発明の多重経路トレリス符号化量子化方法を従来技術と比較して示す概念図である。図2を参照するに、従来技術の場合には、トレリスの特定ノードに入ってくる2つの経路のうち1つを生存経路として選択する。これに反し、本発明の多重経路トレリス符号化方法は、トレリスの特定ノードに入ってくる4つ以上の経路のうち2つ以上を生存経路として選択する。すなわち、図2において、Tは2以上の整数である。
このように、各ステージでノード1つに入っていく経路を2つ以上格納することで、累積歪みの小さい経路が捨てられるという問題点を解決することができ、より効率的にトレリス符号化量子化を実行することができる。
図3〜5は、本発明の一実施形態に係る多重経路トレリス符号化量子化方法を説明するためのトレリス図である。図3を参照するに、i番目ステージでノード331を介してノード342に入っていく生存経路(survivor path)が2つ格納されている。すなわち、ノード331を介してノード342に入っていく生存経路は、ノード311、ノード321、およびノード331を経る経路と、ノード312、ノード323、およびノード331を経る経路の2つである。
このとき、ノード311、ノード321、ノード331、およびノード342でで連結する経路と、ノード312、ノード323、ノード331、およびノード342で連結する経路の歪みは、それぞれ下記式(1)および式(2)のように計算することができる。
図4を参照するに、i番目ステージでノード333を介してノード342に入っていく生存経路も2つであることが分かる。これは、各ステージで1つのノードに入っていく経路が2つ格納されるためである。すなわち、ノード333を介してノード342に入っていく経路は、ノード311、ノード322、およびノード333を経る経路と、ノード314、ノード324、およびノード333を経る経路の2つである。
このとき、ノード311、ノード322、ノード333、およびノード342で連結する経路と、ノード314、ノード324、ノード333、およびノード342で連結する経路の歪みは、それぞれ下記式(3)および式(4)のように計算することができる。
本発明の一実施形態に係る多重経路トレリス符号化量子化方法は、1つのノードに入ってくる4つの経路のうち累積歪みが小さい2つの経路を生存経路として選択することができる。
図5を参照するに、ノード342に入ってくる4つの経路のうち、ノード311、ノード321、およびノード331を経る経路と、ノード314、ノード324、およびノード333を経る経路の2つが選択されて生存経路となる。このとき、本発明の一実施形態に係る多重経路トレリス符号化量子化方法は、4つの経路のうち累積歪みが小さい順に2つの経路を選択することができる。
図6〜8は、本発明の一実施形態に係る多重経路トレリス符号化量子化過程を示すトレリス図である。
図6を参照するに、ステージ0のノード1(621)に対してx1,1 0とx3,1 0を探索した後、d0 1,1とd0 3,1を計算する。また、ステージ0のノード2(622)に対してx1,2 0とx3,2 0を探索した後、d0 1,2とd0 3,2を計算する。また、ステージ0のノード3(623)に対してx2,3 0とx4,3 0を探索した後、d0 2,3とd0 4,3を計算する。また、ステージ0のノード4(624)に対してx2,4 0とx4,4 0を探索した後、d0 2,4とd0 4,4を計算する。
このとき、dk a,bは、k−1番目ステージのノードaとk番目ステージのノードbとの間のブランチ(branch)に割り当てられたサブコードブックと入力との間の歪みである。
例えば、di 1,1はmin(d(xi,yi 1,1)|yi 1,1∈Di 1,1)であり、di 3,1はmin(d(xi,yi 3,1)|yi 3,1∈Di 3,1)であり得る。
図7を参照するに、本発明の一実施形態に係る多重経路トレリス符号化量子化方法は、ステージ1のノード731に対しても、図6に示す過程で計算された値を用いてe1,1 1、e3,1 1、e2,3 1、e4,3 1を計算する。次に、トレリス符号化量子化方法は、サブコードブックD1 1,1のエントリとe1,1 1およびe3,1 1とをそれぞれ比較する。また、トレリス符号化量子化方法は、サブコードブックD1 3,1のエントリとe2,3 1およびe4,3 1とをそれぞれ比較する。
次に、トレリス符号化量子化方法は、サブコードブックから探索された値を用いてd1 1,1,1、d1 3,1,1、d1 2,3,1、およびd1 4,3,1を計算する。
また、トレリス符号化量子化方法は、d1 1,1,1+d0 1,1、d1 3,1,1+d0 3,1、d1 2,3,1+d0 2,3、およびd1 4,3,1+d0 4,3をそれぞれ計算して累積歪みを求めた後、累積歪みが少ない2つの経路を選択する。図7に示す例では、ノード711、ノード721、およびノード731を結ぶ経路と、ノード712、ノード723、およびノード731を結ぶ経路が他の2つの経路よりも累積歪みが小さいため、生存経路として選択される。
図7に示すステージ1の他のノードに対しても、同じ演算を実行することができる。
図8を参照するに、ステージ2のノード841に対して、ノード811、ノード821、ノード831、およびノード841を経る経路と、ノード811、ノード822、ノード833、およびノード841を経る経路と、ノード812、ノード823、ノード831、およびノード841を経る経路と、ノード812、ノード824、ノード833、およびノード841を経る経路の4種類の生存経路が存在する。
本発明の一実施形態に係る多重経路トレリス符号化量子化方法は、ステージ2のノード841に対して、以前過程で計算された値を用いてe1,1 2、e3,1 2、e2,3 2、e4,3 2を計算する。次に、トレリス符号化量子化方法は、サブコードブックD2 1,1のエントリとe1,1 2およびe3,1 2とをそれぞれ比較する。また、トレリス符号化量子化方法は、サブコードブックD2 3,1のエントリとe2,3 2およびe4,3 2とをそれぞれ比較する。
次に、トレリス符号化量子化方法は、サブコードブックから探索された値を用いてd2 1,1,1、d2 3,1,1、d2 2,3,1、およびd2 4,3,1を計算する。
また、トレリス符号化量子化方法は、d2 1,1,1+d1 1,1,1、d2 3,1,1+d1 2,3,1、d2 2,3,1+d1 1,2,3、およびd2 4,3,1+d1 2,4,3をそれぞれ計算して累積歪みを求めた後、累積歪みが少ない2つの経路を選択する。
図8に示すステージ2の他のノードに対しても、同じ演算を実行することができる。
図6〜8を参照しながら説明した過程は、各ステージで繰り返されて実行される。トレリスの最後のステージで4個のノードに対して2つずつの生存経路が発生し、したがって本発明の多重経路トレリス符号化量子化方法は、8個の経路のうち累積歪みが最も小さい経路を最適経路として算出することができる。
図9は、本発明の一実施形態に係る多重経路トレリス符号化量子化装置を示すブロック図である。図9を参照するに、本発明の一実施形態に係る多重経路トレリス符号化量子化装置は、累積歪み算出部910と、生存経路設定部920と、最適経路選択部930とを備える。
累積歪み算出部910は、トレリスのI(Iは0以上の整数)番目ステージのノードのうち1つに入ってくる2N(Nは2以上の整数)個の生存経路それぞれに相応する累積歪みを算出する。
生存経路設定部920は、2N個の生存経路それぞれに相応する累積歪みを比較し、2N個の生存経路のうち累積歪みが少ないN個の経路を選択し、選択されたN個の経路をI+1番目ステージに入力される生存経路として設定する。
累積歪み算出部910および生存経路設定部920は、Iを1ずつ増加させながら各ステージで設定された演算を繰り返し実行する。
最適経路選択部930は、トレリスの最後のステージのノードそれぞれに対して、2N個ずつ存在する生存経路のうち累積歪みが最も少ない経路を最適経路として選択する。
図10は、図9に示す累積歪み算出部の一例を示すブロック図である。図10を参照するに、図9に示す累積歪み算出部910は、予測部1010と、予測エラー算出部1020と、歪み算出部1030と、累積算出部1040とを備える。
予測部1010は、2N個の生存経路で量子化された値を用いてトレリスのI番目ステージに相応する値を予測する。
予測エラー算出部1020は、予測された値を用いてトレリスのI番目ステージの2N個の予測エラーを求める。
歪み算出部1030は、トレリスのI番目ステージに相応する各ブランチに割り当てられたサブコードブックから選択された代表値と予測エラーとの間の歪みを算出する。このとき、選択された代表値は、サブコードブックで予測エラーとの歪みが小さいものであり得る。
実施形態により、歪み算出部1030は、予測エラーと選択された代表値との間の差に対して所定の加重値を適用して歪みを算出することができる。
累積算出部1040は、歪みを用いてI番目ステージまでの累積歪みを算出する。
このとき、図10に示す累積歪み算出部の動作は、図6〜8を参照しがらすでに詳しく説明したため、ここでは説明を省略する。
本発明の多重経路トレリス符号化量子化方法および装置は、入力信号のフレーム間に実行された予測エラー値の量子化に用いることができる。また、本発明の多重経路トレリス符号化量子化方法および装置は、前処理された入力信号を量子化するのに用いることもできる。
上述したように、本発明の好ましい実施形態を参照して説明したが、該当の技術分野において熟練した当業者にとっては、特許請求の範囲に記載された本発明の思想および領域から逸脱しない範囲内で、本発明を多様に修正および変更させることができることを理解することができるであろう。すなわち、本発明の技術的範囲は、特許請求の範囲に基づいて定められ、発明を実施するための最良の形態により制限されるものではない。
本発明の多重経路トレリス符号化量子化方法および装置は、低い送信率で効率的に量子化を実行することができる。
また、本発明は、入力信号の相関度を用いるトレリス符号化量子化において、生存経路を1つだけ格納する場合に発生する問題点を効果的に解決することができる。
さらに、本発明は、BC−TCQ(Block Constrained−TCQ)のような量子化を用いる音声符号化システムにおいて、入力信号および係数の量子化を効率的に実行して量子化性能を向上させることができる。
Claims (21)
- トレリスのI(Iは0以上の整数)番目ステージのノードのうち1つに入ってくる2N(Nは2以上の整数)個の生存経路それぞれに相応する累積歪みを算出するステップと、
前記2N個の生存経路それぞれに相応する累積歪みを比較し、前記2N個の生存経路のうち前記累積歪みが少ないN個の経路を選択するステップと、
前記N個の経路をI+1番目ステージに入力される生存経路として設定するステップと、
前記トレリスの最後のステージのノードそれぞれに対して2N個ずつ存在する前記生存経路のうち前記累積歪みが最も少ない経路を最適経路として選択するステップと、
を含むことを特徴とする多重経路トレリス符号化量子化方法。 - 前記累積歪みを算出するステップは、
前記2N個の生存経路で量子化された値を用いて前記トレリスのI番目ステージに相応する値を予測するステップと、
前記予測された値を用いて前記トレリスのI番目ステージの2N個の予測エラーを求めるステップと、
前記トレリスのI番目ステージに相応する各ブランチに割り当てられたサブコードブックから選択された代表値と前記予測エラーとの間の歪みを求めるステップと、
前記歪みを用いて前記I番目ステージまでの累積歪みを算出するステップと、
を含むことを特徴とする請求項1に記載の多重経路トレリス符号化量子化方法。 - 前記選択された代表値は、前記サブコードブックで予測エラーとの歪みが小さいものであることを特徴とする請求項2に記載の多重経路トレリス符号化量子化方法。
- 前記歪みを算出するステップは、
前記予測エラーと前記選択された代表値との間の差に対して所定の加重値を適用して前記歪みを算出することを特徴とする請求項3に記載の多重経路トレリス符号化量子化方法。 - 前記多重経路トレリス符号化量子化方法は、入力信号のフレーム間に実行された予測エラー値の量子化に用いられることを特徴とする請求項1に記載の多重経路トレリス符号化量子化方法。
- 前記多重経路トレリス符号化量子化方法は、前処理された入力信号を量子化するのに用いられることを特徴とする請求項1に記載の多重経路トレリス符号化量子化方法。
- トレリスのI(Iは0以上の整数)番目ステージのノードのうち1つに入ってくる2N(Nは2以上の整数)個の生存経路それぞれに相応する累積歪みを算出する累積歪み算出部と、
前記2N個の生存経路それぞれに相応する累積歪みを比較し、前記2N個の生存経路のうち前記累積歪みが少ないN個の経路を選択し、選択された前記N個の経路をI+1番目ステージに入力される生存経路として設定する生存経路設定部と、
前記トレリスの最後のステージのノードそれぞれに対して2N個ずつ存在する前記生存経路のうち前記累積歪みが最も少ない経路を最適経路として選択する最適経路選択部と、
を備えることを特徴とする多重経路トレリス符号化量子化装置。 - 前記累積歪み算出部は、
前記2N個の生存経路で量子化された値を用いて前記トレリスのI番目ステージに相応する値を予測する予測部と、
前記予測された値を用いて前記トレリスのI番目ステージの2N個の予測エラーを算出する予測エラー算出部と、
前記トレリスのI番目ステージに相応する各ブランチに割り当てられたサブコードブックから選択された代表値と前記予測エラーとの間の歪みを算出する歪み算出部と、
前記歪みを用いて前記I番目ステージまでの累積歪みを算出する累積算出部と、
を備えることを特徴とする請求項7に記載の多重経路トレリス符号化量子化装置。 - 前記選択された代表値は、前記サブコードブックで予測エラーとの歪みが小さいものであることを特徴とする請求項8に記載の多重経路トレリス符号化量子化装置。
- 前記歪み算出部は、
前記予測エラーと前記選択された代表値との間の差に対して所定の加重値を適用して前記歪みを算出することを特徴とする請求項9に記載の多重経路トレリス符号化量子化装置。 - 前記多重経路トレリス符号化量子化装置は、入力信号のフレーム間に実行された予測エラー値の量子化に用いられることを特徴とする請求項7に記載の多重経路トレリス符号化量子化装置。
- 前記多重経路トレリス符号化量子化装置は、前処理された入力信号を量子化するのに用いられることを特徴とする請求項7に記載の多重経路トレリス符号化量子化装置。
- 請求項1の方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
- 第1ステージのノードからトレリス構造の最後のステージのノードとして複数の生存経路を判断するステップと、
前記複数の生存経路それぞれに対する累積歪み値を計算するステップと、
前記累積歪み値に基づいて前記複数の生存経路から最適経路を選択するステップと、
を含むことを特徴とするトレリス符号化量子化方法。 - 前記累積歪み値は、予測値とサブコードブックの代表値との間の差に基づいて決定されることを特徴とする請求項14に記載のトレリス符号化量子化方法。
- 音声入力信号に対応する線形予測符号係数を計算するステップと、
前記線形予測符号係数に基づいてラインスペクトル周波数係数を計算するステップと、
前記ラインスペクトル周波数係数をトレリス符号量子化するステップと、
前記量子化されたラインスペクトル周波数係数によってビットストリームを生成するステップと、
を含み、
前記トレリス符号量子化ステップは、
第1ステージのノードからトレリス構造の最後のステージのノードとして複数の生存経路を判断するステップと、
前記複数の生存経路それぞれに対する累積歪み値を計算するステップと、
前記累積歪み値に基づいて前記複数の生存経路から最適経路を選択するステップと、
を含むことを特徴とする音声入力信号符号化方法。 - 前記ラインスペクトル周波数係数は、前記音声入力信号のフレーム間の係数値の相互相関に基づいて計算されることを特徴とする請求項16に記載の音声入力信号符号化方法。
- 前記ラインスペクトル周波数係数は、前記音声入力信号の単一フレーム内にある隣接した係数値の相互相関に基づいて計算されることを特徴とする請求項16に記載の音声入力信号符号化方法。
- 前記トレリス符号量子化するステップは、ベクトル量子化を用いて実行されることを特徴とする請求項16に記載の音声入力信号符号化方法。
- I番目のステージの第1ノードとトレリス構造のI+1番目の第2ノードとの間で2N個の生存経路を判断するステップと、
前記2N個の生存経路それぞれに対応する予め決定された変数を計算するステップと、
前記予め決定された変数に基づいて前記N個の2N個の生存経路から生存経路を選択するステップと、
を含み、
前記Nは2よりも大きいか同じ整数であることを特徴とするトレリス構造を探索する方法。 - 前記予め決定された変数は、歪み値であることを特徴とする請求項20に記載のトレリス構造を探索する方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060030576A KR100728056B1 (ko) | 2006-04-04 | 2006-04-04 | 다중 경로 트랠리스 부호화 양자화 방법 및 이를 이용한다중 경로 트랠리스 부호화 양자화 장치 |
PCT/KR2006/005422 WO2007114555A1 (en) | 2006-04-04 | 2006-12-13 | Multi-path trellis coded quantization method and multi-path coded quantizer using the same |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009532976A true JP2009532976A (ja) | 2009-09-10 |
Family
ID=38359316
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009504102A Pending JP2009532976A (ja) | 2006-04-04 | 2006-12-13 | 多重経路トレリス符号化量子化方法およびこれを用いた多重経路トレリス符号化量子化装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8706481B2 (ja) |
EP (1) | EP2008271A4 (ja) |
JP (1) | JP2009532976A (ja) |
KR (1) | KR100728056B1 (ja) |
WO (1) | WO2007114555A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014512028A (ja) * | 2011-04-21 | 2014-05-19 | サムスン エレクトロニクス カンパニー リミテッド | 線形予測係数の量子化装置、サウンド符号化装置、線形予測係数の逆量子化装置、サウンド復号化装置及び電子機器 |
JP2014519044A (ja) * | 2011-04-21 | 2014-08-07 | サムスン エレクトロニクス カンパニー リミテッド | 線形予測係数量子化方法、サウンド符号化方法、線形予測係数逆量子化方法、サウンド復号化方法、その記録媒体及び電子機器 |
JP2017528751A (ja) * | 2014-07-28 | 2017-09-28 | サムスン エレクトロニクス カンパニー リミテッド | 信号符号化方法及びその装置、並びに信号復号方法及びその装置 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10145707B2 (en) * | 2011-05-25 | 2018-12-04 | CSR Technology Holdings Inc. | Hierarchical context detection method to determine location of a mobile device on a person's body |
US10305557B2 (en) | 2013-12-20 | 2019-05-28 | Samsung Electronics Co., Ltd. | Codebook for multiple-input multiple-output system and communication method and apparatus using same |
KR20240010550A (ko) | 2014-03-28 | 2024-01-23 | 삼성전자주식회사 | 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치 |
CN107077857B (zh) | 2014-05-07 | 2021-03-09 | 三星电子株式会社 | 对线性预测系数量化的方法和装置及解量化的方法和装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5271089A (en) * | 1990-11-02 | 1993-12-14 | Nec Corporation | Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits |
US7003171B1 (en) | 1998-07-17 | 2006-02-21 | Fuji Photo Film Co., Ltd. | Method, apparatus and recording medium for data compression |
US6148283A (en) * | 1998-09-23 | 2000-11-14 | Qualcomm Inc. | Method and apparatus using multi-path multi-stage vector quantizer |
FI111887B (fi) | 2001-12-17 | 2003-09-30 | Nokia Corp | Menetelmä ja järjestely trelliksen läpikäymisen tehostamiseksi |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
KR100463577B1 (ko) * | 2002-11-01 | 2004-12-29 | 한국전자통신연구원 | 음성 부호화기용 선스펙트럼주파수 벡터 양자화 장치 |
KR100486732B1 (ko) | 2003-02-19 | 2005-05-03 | 삼성전자주식회사 | 블럭제한된 트렐리스 부호화 양자화방법과 음성부호화시스템에있어서 이를 채용한 라인스펙트럼주파수 계수양자화방법 및 장치 |
-
2006
- 2006-04-04 KR KR1020060030576A patent/KR100728056B1/ko not_active IP Right Cessation
- 2006-12-11 US US11/608,956 patent/US8706481B2/en not_active Expired - Fee Related
- 2006-12-13 EP EP06824126A patent/EP2008271A4/en not_active Withdrawn
- 2006-12-13 WO PCT/KR2006/005422 patent/WO2007114555A1/en active Application Filing
- 2006-12-13 JP JP2009504102A patent/JP2009532976A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014512028A (ja) * | 2011-04-21 | 2014-05-19 | サムスン エレクトロニクス カンパニー リミテッド | 線形予測係数の量子化装置、サウンド符号化装置、線形予測係数の逆量子化装置、サウンド復号化装置及び電子機器 |
JP2014519044A (ja) * | 2011-04-21 | 2014-08-07 | サムスン エレクトロニクス カンパニー リミテッド | 線形予測係数量子化方法、サウンド符号化方法、線形予測係数逆量子化方法、サウンド復号化方法、その記録媒体及び電子機器 |
US9626979B2 (en) | 2011-04-21 | 2017-04-18 | Samsung Electronics Co., Ltd. | Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefore |
US9626980B2 (en) | 2011-04-21 | 2017-04-18 | Samsung Electronics Co., Ltd. | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium and electronic device therefor |
US10224051B2 (en) | 2011-04-21 | 2019-03-05 | Samsung Electronics Co., Ltd. | Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefore |
US10229692B2 (en) | 2011-04-21 | 2019-03-12 | Samsung Electronics Co., Ltd. | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium and electronic device therefor |
JP2017528751A (ja) * | 2014-07-28 | 2017-09-28 | サムスン エレクトロニクス カンパニー リミテッド | 信号符号化方法及びその装置、並びに信号復号方法及びその装置 |
US10827175B2 (en) | 2014-07-28 | 2020-11-03 | Samsung Electronics Co., Ltd. | Signal encoding method and apparatus and signal decoding method and apparatus |
US11616954B2 (en) | 2014-07-28 | 2023-03-28 | Samsung Electronics Co., Ltd. | Signal encoding method and apparatus and signal decoding method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
WO2007114555A1 (en) | 2007-10-11 |
EP2008271A4 (en) | 2012-02-08 |
KR100728056B1 (ko) | 2007-06-13 |
US8706481B2 (en) | 2014-04-22 |
EP2008271A1 (en) | 2008-12-31 |
US20070233473A1 (en) | 2007-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100712056B1 (ko) | 가변 비트율 음성 부호화에서의 선형 예측 매개변수들의견실한 예측 벡터 양자화를 위한 방법 및 장치 | |
JP4390803B2 (ja) | 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置 | |
US5271089A (en) | Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits | |
US8229749B2 (en) | Wide-band encoding device, wide-band LSP prediction device, band scalable encoding device, wide-band encoding method | |
KR101175651B1 (ko) | 다중 압축 부호화 방법 및 장치 | |
CA2443443C (en) | Method and system for line spectral frequency vector quantization in speech codec | |
JPH08263099A (ja) | 符号化装置 | |
KR100464369B1 (ko) | 음성 부호화 시스템의 여기 코드북 탐색 방법 | |
US7529663B2 (en) | Method for flexible bit rate code vector generation and wideband vocoder employing the same | |
JP2009532976A (ja) | 多重経路トレリス符号化量子化方法およびこれを用いた多重経路トレリス符号化量子化装置 | |
KR100903110B1 (ko) | 트렐리스 부호 양자화 알고리듬을 이용한 광대역 음성 부호화기용 lsf 계수 양자화 장치 및 방법 | |
JP4750366B2 (ja) | ブロック制限されたtcqにおけるトレリス経路決定方法、ならびに音声符号化システムにおいてそのtcqにおけるトレリス経路決定方法を採用したラインスペクトル周波数係数の量子化方法及び装置 | |
JP2006525533A5 (ja) | ||
JP2011150357A (ja) | スーパーフレーム構造のlpcハーモニックボコーダ | |
US6988067B2 (en) | LSF quantizer for wideband speech coder | |
JPWO2011132368A1 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
KR20050006883A (ko) | 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법 | |
JP4091506B2 (ja) | 2段音声画像符号化方法、その装置及びプログラム及びこのプログラムを記録した記録媒体 | |
EP0483882B1 (en) | Speech parameter encoding method capable of transmitting a spectrum parameter with a reduced number of bits | |
EP0755047B1 (en) | Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits | |
JP3700310B2 (ja) | ベクトル量子化装置及びベクトル量子化方法 | |
Shin et al. | Low-complexity predictive trellis coded quantization of wideband speech LSF parameters | |
Nurminen | Multi-mode quantization of adjacent speech parameters using a low-complexity prediction scheme. | |
KR20010084468A (ko) | 음성 부호화기의 lsp 양자화기를 위한 고속 탐색 방법 | |
JPH04220700A (ja) | ピッチ周波数符号化復号化器 |