JP2012124890A - 符号化信号を、この符号化信号と副情報との間の統計的依存性に基づいて復号する方法および復号器 - Google Patents
符号化信号を、この符号化信号と副情報との間の統計的依存性に基づいて復号する方法および復号器 Download PDFInfo
- Publication number
- JP2012124890A JP2012124890A JP2011248616A JP2011248616A JP2012124890A JP 2012124890 A JP2012124890 A JP 2012124890A JP 2011248616 A JP2011248616 A JP 2011248616A JP 2011248616 A JP2011248616 A JP 2011248616A JP 2012124890 A JP2012124890 A JP 2012124890A
- Authority
- JP
- Japan
- Prior art keywords
- statistical
- transform
- transform block
- group
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/395—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving distributed video coding [DVC], e.g. Wyner-Ziv video coding or Slepian-Wolf video coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/48—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
Abstract
【課題】符号化信号を、この符号化信号と副情報との間の統計的依存性に基づいて復号する。
【解決手段】副情報の各変換ブロックの統計的信頼性が、変換ブロックの変換係数の絶対値の関数として求められる。副情報の変換ブロックは、各変換ブロックの統計的信頼性に基づいて1組のグループにグループ化される。復号は、符号化信号の変換ブロックと、副情報の対応する変換ブロックを含むグループとの間の統計的依存性を用いて実行される。
【選択図】図1
【解決手段】副情報の各変換ブロックの統計的信頼性が、変換ブロックの変換係数の絶対値の関数として求められる。副情報の変換ブロックは、各変換ブロックの統計的信頼性に基づいて1組のグループにグループ化される。復号は、符号化信号の変換ブロックと、副情報の対応する変換ブロックを含むグループとの間の統計的依存性を用いて実行される。
【選択図】図1
Description
本発明は、包括的には信号コーディングに関し、より詳細には、信号と副情報(side information)との間の空間統計的依存性を用いた信号の符号化および復号に関する。
動画専門家グループ(MPEG:Moving Picture Experts Group)および国際電気通信連合(ITU:International Telecommunication Union)の標準規格によるコーディング等の従来技術の画像符号化およびビデオ符号化は、復号器を有する低複雑度の受信機(TV)がより多数存在するが、符号化器を有する高複雑度の送信機は少数しか存在しないときのブロードキャストされるビデオおよびマルチメディアの配信によく適している。
そのようなビデオ配信モデルでは、ビデオフレーム間の時間相関を利用するために、計算的に要求の大きい動き推定技法が符号化器において用いられる。送信前に時間冗長性を利用するこのプロセスは、優れた圧縮効率をもたらし、復号を簡略化する。
図6は、動き推定110を用いた従来の符号化器100を示している。入力ビデオ101のフレームは、1度に1ブロック処理される。動き推定器110は、フレームメモリ111内に格納された基準フレームの、符号化されることになる現在のブロックに最も適合したブロックを求める。この最も適合したブロックは、現在のブロックの予測としての役割を果たす。対応する動きベクトル112がエントロピー符号化される(150)。動き補償予測器130によって生成される、入力ビデオの現在のブロックと予測ブロック121との間の差分120が取得される。次に、差分信号が変換/量子化プロセス140を受け、1組の量子化された変換係数141がもたらされる。これらの係数は、エントロピー符号化され(150)、圧縮されたビットストリーム109がもたらされる。
量子化された変換係数141に対して逆変換/逆量子化160を実行すること、およびこの結果を動き補償予測121に加算すること(170)によって、基準フレームが生成され、この基準フレームは、フレームメモリ111内に格納され、入力ビデオ101の後続のフレームを予測する(130)のに用いられる。動きベクトル112およびテクスチャ141の情報のエントロピー符号化150に基づいて、出力ビットストリーム109が生成される。
図7は、対応する従来の復号器200を示している。入力ビットストリーム201がエントロピー復号器210に与えられ、量子化された変換係数211および対応する動きベクトル212がもたらされる。動きベクトルは、動き補償予測器220によって用いられ、予測信号221がもたらされる。量子化された変換係数211は、逆変換/逆量子化され(230)、予測信号221に加算され(240)、再構成されたビデオ209がもたらされる。後続のフレームを復号するのに用いられる再構成されたビデオのフレームは、フレームメモリ250に格納される。
上述したコーディングは、優れた圧縮効率を達成するが、かなりの処理コストおよび電力コストを有する。これは、ほぼ無制限のリソースを有する映画スタジオおよび放送スタジオ等の大規模な商業用途においては問題でない。しかしながら、画像およびビデオの捕捉および符号化が、限られた電池および処理能力、並びに限られたストレージおよび帯域幅を有するデバイス、たとえば携帯電話、PDA、環境センサー、並びに厳しく制限された処理リソース、ストレージリソース、および電力リソースを有する単純なデジタルカメラで行われる用途が増えている。通常、これらの電池で動作するデバイスは、単純なマイクロプロセッサまたはマイクロコントローラーを用いる。したがって、符号化信号における良好な圧縮効率および復号器における高品質画像をもたらすことができる低複雑度の符号化器が必要とされている。
図8は、そのような従来の低複雑度の符号化器300を示している。入力ビデオ301が分類される(310)。分類器は、現在のフレームにおけるブロックごとの時空間相関の度合いを推定する。符号化されることになるブロックと、前の符号化されたフレームの同じロケーションにあるブロックとの間の二乗誤差の差に基づいて、クラスが求められる。たとえば、「SKIP」クラスは、相関が非常に高く、現在のブロックを符号化する必要がないことを示す一方、「INTRA」クラスは、相関が非常に低く、現在のブロックが従来のイントラコーディング方式を用いて最も良好に符号化されることを示す。これらの2つの両極端のものの間の相関について、シンドロームに基づく(syndrome−based)コーディング方式が用いられる。
次のステップにおいて、離散コサイン変換(DCT:discrete cosine transform)等のブロック変換320が適用され、データが脱相関(decorrelate)される。次に、変換係数がジグザグスキャン330を受け、エネルギーの降順で順序付けされた1Dベクトルにされる。
低周波数係数331に対応する係数のわずかな部分、たとえば総係数の約20%が基本量子化340を受ける。次に、量子化された係数は、シンドローム符号化器370に入力され、シンドロームビット371が生成される。その特定の方式では、1/2レートのトレリス符号がシンドロームコーディングに用いられる。シンドローム符号化された係数の目標品質を達成するために、精緻量子化(refinement quantization)360が実行される。この操作は、基本量子化間隔を、目標量子化ステップサイズに等しいサイズの間隔にプログレッシブに分割する。ここで、基本量子化間隔内の精緻量子化間隔のインデックス361は、最終的に復号器に送信される。
より高い周波数係数332に対応する係数の大きな部分、たとえば係数の残りの80%が従来のイントラコーディングを受ける。イントラコーディングにおいて、係数は、上述したように従来の量子化350およびエントロピー符号化380の操作を受ける。
上記に加えて、量子化された符号語シーケンスの巡回冗長検査(CRC:cyclic redundancy check)がCRC生成器390によって計算され、CRCビット391が生成される。これらも復号器に送信される。CRCビット391は、復号器においていくつかの候補予測子間で最も良好な予測子を求めるのに用いられる。CRCビット391は、ブロック360、370および380からの出力と結合され(399)、ビットストリーム309の形態で出力符号化信号が生成される。
図9は、対応する復号器400を示している。符号化された入力ビットストリーム401をデインターリーブした(410)後、復号器は、動き推定405を実行する。動き推定405は、フレームメモリ406からの空間的にシフトされたピクセルを含む予測子407を出力する。異なる空間シフトを有する複数の予測子が生成される。シンドローム復号器440が予測子ごとに受信シンドロームビットに基づいて量子化された係数のシーケンスを生成する。シンドローム符号化は、トレリス符号に基づくので、ビタビプロセスを用いて候補予測子に最も近い係数シーケンスが特定される。復号された係数がCRC検査445によるCRCに適合する場合、復号は成功したと宣言される。復号されたシンドローム係数および符号化器によって送信される精緻量子化間隔のインデックスを与えると、逆基本量子化および逆精緻化420を実行して低周波数係数の再構成されたセットをもたらすことができる。より高い周波数係数がエントロピー復号450および逆量子化操作460を通じて復号される。次に、係数の双方のセットが逆スキャン430および逆ブロック変換470を受け、復号されたビデオ409がもたらされる。また、復号されたフレーム408は、後続のフレームの復号のためにフレームメモリ406内に格納される。
上記の方式には、いくつかの不利な点が存在する。第1に、変換係数、すなわち高周波数係数の大部分が従来の量子化技法350およびエントロピー符号化技法380を用いて符号化される。複雑なシーンは、相当量の高周波数情報を含む。したがって、従来技術の方式は、かなりの量のオーバーヘッドを有し、効率性の損失につながる。第2に、従来技術のシンドローム符号化は、比較的小さな8×8のマクロブロックに基づき、これによって全体圧縮レートが減少する。第3に、CRCは、係数を確実に反映する必要がある。これは、全てのブロックのオーバーヘッドであるだけでなく、復号が正しく実行される保証もない。
分散ソースコーディング
分散ソースコーディング方式は、独立して符号化されるが共同で復号される相関したソースに対する2つの影響力を持つ(seminal)情報理論的結果に基づく。分散ソースコーディング法は、ソースの共同符号化と同じ漸近可逆圧縮性能を達成する。たとえば、ソースが結合ガウス分布している場合、分散ソースコーディングは、共同符号化と同じレート歪みペナルティを有する。ソースが結合ガウス分布していない場合であっても、共同符号化に関するレート歪みペナルティには制限がある。
分散ソースコーディング方式は、独立して符号化されるが共同で復号される相関したソースに対する2つの影響力を持つ(seminal)情報理論的結果に基づく。分散ソースコーディング法は、ソースの共同符号化と同じ漸近可逆圧縮性能を達成する。たとえば、ソースが結合ガウス分布している場合、分散ソースコーディングは、共同符号化と同じレート歪みペナルティを有する。ソースが結合ガウス分布していない場合であっても、共同符号化に関するレート歪みペナルティには制限がある。
図10の従来技術の符号化器500に示されるように、入力ビデオ501は、スイッチ510を用いて2つのタイプのフレーム、すなわちキーフレーム511およびワイナー・ジブフレーム512に分割される。キーフレームは、規則的に離間したフレームである。これらのフレームは、従来のフレーム内符号化520、たとえばDCT、量子化、およびエントロピーコーディングを用いて符号化され、目標品質レベルにおいてコーディングされる。ワイナー・ジブフレーム512は、スカラー量子化513、およびシンドロームコーディングの1つの形態であるターボ符号化器530にかけられる。出力ビットストリーム509は、符号化されたキーフレームおよびワイナー・ジブフレームの双方に対応するビットを結合した(540)ものである。この従来技術の方式では、シンドロームビットは、ワイナー・ジブフレームのためにのみ生成され、キーフレームのためには生成されず、イントラ符号化は、従来のものであり、すなわち低周波数係数および高周波数係数の双方が符号化されることが留意される。
図11は、対応する従来技術の復号器600を示している。入力ビットストリーム601は、符号化されたキーフレームおよびワイナー・ジブフレームを含む。符号化されたキーフレームは、フレーム内復号器610を用いて復号され、再構成されたキーフレーム611がもたらされるのに対して、ワイナー・ジブフレームは、まずターボ復号器620にかけられ、1組のシンドローム係数がもたらされる。その1組のシンドローム係数は、再構成プロセス630を受け、スイッチ660を用いて最終的な再構成されたビデオ609がもたらされる。再構成は、ターボ復号器によって出力された係数および補間された(640)フレームデータに基づく。再構成されたワイナー・ジブフレームおよびキーフレームは、後続のフレームを復号するためにフレームメモリ650に格納される。
この方法の2つの主要な不利な点は、高品質のキーフレームを送信する際に導入されるオーバーヘッド、および過去のフレームを復号するのに必要とされる未来のキーフレームを送信することによって被る遅延である。従来のコーディング方式の観点において、キーフレームは、Iフレームであり、ワイナー・ジブフレームは、Bフレームに類似している。他の従来のコーディング方式と同様に、Iフレーム間の距離は、遅延の量を示している。高い遅延を許容することができると仮定すると、キーフレームをさらに離して配置することによって、オーバーヘッドの量が減少する。しかしながら、それを行うことによって、補間の品質も減少し、補間によって生じる誤りを補正するのにさらなるシンドロームビットが必要とされるので、事実上、全体コーディング効率が減少する。
明らかに、低い符号化複雑度を有する、すなわち、イントラのみのコーディングに類似しているが、高いコーディング効率を有する、すなわち最良のフレーム間コーディング方式のコーディング効率により近いコーディング方式を有することが望ましい。たとえば、分散ビデオコーディング方法は、個々のフレームに対して単純な符号化方式を用い、復号器においてのみフレーム間依存を利用する。同様に、複雑な帯域間予測符号化を用いる代わりに複数帯域画像データを分散コーディングする方法は、単純な符号化方式を画像データの個々の帯域に適用し、復号器においてのみ帯域間依存を利用する。
統計的に依存する副情報に基づいて符号化された信号を復号する同じ技法が、他のソースの分散圧縮に適用される。他のソースには、限定ではないが、ビデオ信号、ハイパースペクトル画像、マルチビュー画像、光照射野画像が含まれる。したがって、統計的に依存する副情報を用いて符号化信号を復号するために、復号器の性能を改善する必要がある。
発明の実施の形態は、符号化信号が、この符号化信号と副情報との間の統計的依存性に基づいて復号される分散コーディング法について、その統計的依存性は均一でなく、符号化信号内の特定の変換ブロックの空間ロケーションに依拠するという認識に基づく。符号化信号には、限定ではないが、ビデオフレーム、マルチスペクトル画像、ハイパースペクトル画像、または生体信号を含めることができる。
たとえば、地球のマルチスペクトル衛星画像において、海または雲を含む領域内の変換ブロックの変換係数は、画像の全ての帯域にわたって、都市のシーンを含む変換ブロック領域の変換係数よりも確実に予測可能である。
実施の形態は、変換ブロック内の有意でない変換係数の数と、このブロックの統計的信頼性との間に相関があるという驚くべき観測結果に基づいている。具体的には、有意でない係数の数が大きくなるほど、副情報がより信頼性が高いことを示す。実施の形態は、この観測結果を用いて副情報を複数のグループにグループ化する。
したがって、実施の形態は、変換ブロックの統計的依存性が、各変換ブロックの統計的信頼性によって示すことができるという別の認識に基づいている。さらに、各変換ブロックの統計的信頼性は、変換ブロックの変換係数の絶対値の関数として求めることができる。
これらの認識によって、異なるロケーションにある信号の異なる変換ブロックが同じ統計的依存性を有することができる一方、隣接している変換ブロックが異なる統計的依存性を有する可能性があるという驚くべき結果が導かれる。したがって、本発明の実施の形態は、副情報を、変換ブロックの統計的信頼性に基づいて変換ブロックの1組のグループに分割し、グループごとに独立して統計的依存性を求める。
たとえば、1つの実施の形態では、1組のグループ内のグループの数が予め決められ、グループごとに、統計的信頼性の値の特定の範囲が割り当てられる。変換係数の絶対値の関数によって、変換ブロックの統計的信頼性が決まる。いくつかの実施の形態では、この関数は、閾値未満の絶対値を有するその変換ブロック内の変換係数の数であり、変換ブロックは、この変換ブロックの統計的信頼性を、グループについて指定された統計的信頼性の範囲と比較することによってグループ化される。
次に、符号化信号の各変換ブロックが、符号化信号の変換ブロックと、副情報の対応する変換ブロックを含む変換ブロックのグループとの間の統計的依存性を用いて復号され、統計的依存性は、変換ブロックのグループごとに独立して求められる。
したがって、統計的依存性は、変換ブロックのグループごとに求められ、したがって副情報全体について求められた統計的依存性よりも正確である。このため、本発明の実施の形態は、従来の手法よりも効率的で信頼性のあるコーディング方法を提供する。
このため、1つの実施の形態は、符号化信号を、前記符号化信号と副情報との間の統計的依存性に基づいて復号する方法であって、前記方法は、前記副情報の各変換ブロックの統計的信頼性を、前記変換ブロックの変換係数の絶対値の関数として求めるステップと、前記副情報の前記変換ブロックを、各前記変換ブロックの前記統計的信頼性に基づいて1組のグループにグループ化するステップであって、各前記グループの前記変換ブロックの前記統計的信頼性が実質的に同様になるようにグループ化する、グループ化するステップと、前記符号化信号の各前記変換ブロックを、前記符号化信号の前記変換ブロックと、前記副情報の対応する変換ブロックを含むグループとの間の前記統計的依存性を用いて復号するステップであって、前記統計的依存性は、前記副情報の前記変換ブロックの前記グループごとに独立して求められ、復号信号が生成される、復号するステップと、を含む、方法を開示する。前記復号信号は、メモリ内に格納される。
別の実施の形態は、符号化信号および副情報から、前記信号と前記副情報との間の統計的依存性に基づいて信号を復号する復号器であって、前記副情報の各変換ブロックの統計的信頼性を、前記変換ブロックの変換係数の絶対値の関数として求める手段と、前記副情報の前記変換ブロックを、各前記変換ブロックの前記統計的信頼性に基づいて1組のグループにグループ化する手段であって、各前記グループの前記変換ブロックの前記統計的信頼性が実質的に同様になるようにする、グループ化する手段と、前記1組のグループ内の前記グループごとに前記統計的依存性を求める手段と、を備える、復号器を開示する。
定義
本発明の実施の形態を説明する際に、全体を通じて(上記を含む)以下の定義が適用可能である。
本発明の実施の形態を説明する際に、全体を通じて(上記を含む)以下の定義が適用可能である。
「コンピュータ」は、構造化された入力を受け入れ、この構造化された入力を所定の規則に従って処理し、処理結果を出力として生成することが可能な任意の装置を指す。コンピュータの例には、コンピュータ、汎用コンピュータ、スーパーコンピュータ、メインフレーム、スーパーミニコンピュータ、ミニコンピュータ、ワークステーション、マイクロコンピュータ、サーバ、双方向テレビ、コンピュータおよび双方向テレビのハイブリッドな組み合わせ、並びにコンピュータおよび/またはソフトウェアをエミュレートする特定用途向けハードウェアが含まれる。コンピュータは、単一のプロセッサ、または並列に動作しかつ/若しくは並列に動作しないことができる複数のプロセッサを有することができる。コンピュータは、コンピュータ間で情報を送信または受信するネットワークを介して共に接続された2つ以上のコンピュータも指す。そのようなコンピュータの例には、ネットワークによってリンクされたコンピュータを介して情報を処理する分散コンピュータシステムが含まれる。
「中央処理ユニット(CPU:central processing unit)」または「プロセッサ」は、ソフトウェア命令を読み出して実行するコンピュータまたはコンピュータの構成要素を指す。
「メモリ」または「コンピュータ可読媒体」は、コンピュータによってアクセス可能なデータを格納するための任意のストレージを指す。例には、磁気ハードディスク、フロッピーディスク、CD−ROMまたはDVDのような光ディスク、磁気テープ、メモリチップ、並びに電子メールを送受信する際に、またはネットワークおよびコンピュータメモリ、たとえばランダムアクセスメモリ(RAM:random access memory)にアクセスする際に用いられる搬送波等の、コンピュータ可読電子データを搬送するのに用いられる搬送波が含まれる。
「ソフトウェア」は、コンピュータを動作させるための所定の規則を指す。ソフトウェアの例には、ソフトウェア、コードセグメント、命令、コンピュータプログラム、およびプログラムロジックが含まれる。インテリジェントシステムのソフトウェアは、自己学習が可能とすることができる。
「モジュール」または「ユニット」は、タスクまたはタスクの一部を実行するコンピュータにおける基本構成要素を指す。「モジュール」または「ユニット」は、ソフトウェアによってもハードウェアによっても実施することができる。
これにより、復号器の性能を改善することができる。
本発明の実施の形態は、符号化信号と副情報との間の統計的依存性に基づいて、符号化信号を復号するシステムおよび方法を提供する。符号化信号には、限定ではないが、ビデオフレーム、マルチスペクトル画像、ハイパースペクトル画像、または生体信号を含めることができる。信号がビデオである場合、ビデオはフレームのシーケンスを含み、各フレームがブロックに分割される。
様々な実施の形態では、信号は符号化器によってシンドロームビットとして符号化され、復号器に送信される。副情報は、信号との統計的依存性を有する任意の情報、たとえば復号器に送信されるキーフレーム、または以前に復号されたフレームとすることができる。
本発明の実施の形態は、信号と副情報との間の統計的依存性が均一でなく、副情報内の変換ブロックのロケーションに空間的に依存するという認識に基づく。変換ブロックは、符号化/復号操作の最小単位である。たとえば、信号が1組の画像である場合、変換ブロックは、画像の8×8ピクセルブロックとすることができる。
したがって、実施の形態は、変換ブロックの統計的信頼性の類似度に従って、副情報の変換ブロックを1組のグループにグループ化する。統計的信頼性は、符号化信号内の変換ブロックを副情報信号内の対応する変換ブロックから予測することができる信頼度を示している。統計的信頼性は、各変換ブロックの変換係数の絶対値の関数として求められる。統計的依存性は、グループごとに独立して求められ、符号化信号を復号するのに用いられる。実施の形態は、当該技術分野において既知のプロセッサを用いて実施される。
図1は、副情報の変換ブロック710を、この変換ブロックの統計的信頼性735を用いて1組のグループ720にグループ化する方法700のブロック図を示している。各変換ブロック、たとえば変換ブロック711の統計的信頼性731は、変換ブロックの変換係数の絶対値の関数750として求められる(730)。
1つの実施の形態では、関数は閾値751未満の絶対値を有する変換係数の数を計算する。別の実施の形態では、関数は、閾値よりも大きい絶対値を有する変換係数の数を計算する。実施の形態は、変換ブロック内の有意でない変換係数の数と、そのブロックの統計的信頼性との間に相関があるという驚くべき観測結果に基づく。具体的には、有意でない係数の数が多くなると、副情報の信頼性がより高くなることを示す。実施の形態は、この観測結果を用いて副情報を複数のグループにグループ化する。
たとえば、閾値が20である場合、図2Aに示す変換ブロックは、図2Bに示す変換ブロックよりも信頼性が高い。様々な実施の形態では、閾値は、トレーニングデータに基づいて、かつ符号化される信号のタイプ、たとえばビデオフレーム、マルチスペクトル画像、ハイパースペクトル画像、または生体信号のタイプに基づいて経験的に求められる。
したがって、実施の形態は、副情報の変換ブロックを、各変換ブロックの統計的信頼性に基づいて、各グループ、たとえばグループ721の変換ブロックの統計的信頼性が実質的に同様になるように、1組のグループ720にグループ化する(740)。たとえば、1つの実施の形態は、1組のグループ内のグループ数Tを決定し、各グループに統計的信頼性の値の範囲760を割り当てる。変換ブロックのグループ化は、変換ブロックの統計的信頼性を、少なくとも1つのグループについて指定された統計的信頼性の範囲と比較することによって達成される。このため、この実施の形態では、実質的に同様の統計的信頼性とは、同じ値の範囲に入る統計的信頼性である。たとえば、T=8の場合、最大8個の有意でない係数を有する変換ブロックが1つのグループに配置され、9個〜16個の有意でない係数を有する変換ブロックが第2のグループに配置され、17個〜23個の有意でない係数を有する変換ブロックが第3のグループに配置され、8個のグループが形成されるまで以下同様である。グループ内の全ての変換ブロックについて、この変換ブロックを副情報内の対応するブロックから予測することができる統計的信頼性が実質的に同様であると仮定される。
統計的依存性771および772は、グループ721および722ごとに独立して求められ、符号化信号の各変換ブロックは、符号化信号の変換ブロックと、副情報の対応する変換ブロックを含む変換ブロックのグループとの間の統計的依存性を用いて復号される。
図3は、符号化信号と副情報との間の統計的依存性に基づいて符号化信号を復号する方法のブロック図を示している。信号810の変換ブロック815ごとに、対応する変換ブロック711の統計的依存性825が、グループの統計的依存性のセット840から選択される。統計的依存性825は、副情報の対応する変換ブロック711を含む変換ブロックのグループの統計的依存性である。
統計的依存性は、グループごとに独立して求められ、符号化信号の対応する変換ブロックを復号するのに用いられる。たとえば、第1の変換ブロック711の第1の統計的依存性825は、符号化信号の第1の部分815を復号している間に求められ、第1の変換ブロックおよび第2の変換ブロックが同じグループ内にある場合、符号化信号の第2の部分816は、第2の変換ブロック712および第1の統計的依存性825を用いて復号される。
1つの実施の形態では、統計的依存性は、たとえばグループの変換ブロックの統計的信頼性に基づいて初期化され、復号中にさらに更新される。別の実施の形態では、統計的依存性は以前に復号された信号に基づいて初期化される。さらに別の実施の形態では、統計的依存性は一様分布として初期化され、その後復号中に更新される。
たとえば、いくつかの実施の形態では、統計的依存性は、符号化信号の変換ブロックの変換係数と副情報の変換ブロックの変換係数との差分Δの分布である。統計的依存性は、以下に従って、ゼロ平均ラプラシアンパラメーターλに基づいてモデル化される。
ラプラシアンパラメーターは、同じグループ内の以前に復号された変換ブロックから推定される。変換係数のλの値が小さくなると、その係数について帯域間予測を実行するのが容易になり、このため副情報の信頼性がより高くなる。
たとえば、いくつかの実施の形態では、復号器は、シンドローム復号を用いて全ての変換係数の全てのビットプレーンを復号する。様々な実施の形態では、復号830は、符号化器によって用いられるシンドローム符号に依拠する。1つの実施の形態では、低密度パリティ検査(LDPC:low density parity check)符号が用いられる。LDPC符号の場合、確率伝搬(BP:belief propagation)法を用いて復号が実行される。BP復号を初期化するために、符号グラフの検査ノードが符号化信号の受信シンドロームビットと関連付けられる。
1つの実施の形態は、変換係数のビット数の推定を
によって表す。ここで、
は最上位ビットである。ほとんどの従来技術による分散ソースコーディングと対照的に、実施の形態は、最下位ビットから最上位ビットまで、すなわち
から
まで復号する。その論拠は、より下位のビットプレーンが復号されると、より上位のビットプレーンは、候補値がより離れた距離にあるので復号が容易になることである。より離れた距離にあることにより、より上位のビットプレーンの復号は、よりロバストである。
i番目のビットプレーンを復号する間、j番目の変数ノードの初期LLR(log−likelihood ratio:対数尤度比)が以下に従って求められる。
ここで、Wijは、シンドローム符号のj番目の変数ノードに対応する副情報の変換係数の値である。i番目のビットの条件付き確率は、ラプラシアンパラメーターに基づいて、信号の以前に復号されたビットの値から求められる。
したがって、1つの実施の形態では、復号830の出力は、メモリ850内に格納され、対応するグループの統計的依存性を更新する(860)のに用いられる。様々な実施の形態が、対応するグループに属する復号信号の既に復号された変換ブロックを用いて、信号の変換ブロックの対応するグループと副情報との間の統計的依存性を独立して更新することができる。
最新技術による方法では、上記のLLRを導出するのに用いられるラプラシアンパラメーターは、符号化信号の全ての部分について同じである。しかしながら、本発明の実施の形態は、
に従ってラプラシアンパラメーターを求め、更新し、再利用する。ここで、下付き文字tは、T個のグループのうちの1つをインデックス付けする。パラメーターは、BP復号器に対して、副情報の対応する変換ブロックが、信号の変換ブロックを復号するのにどれだけ信頼性があるかを直接示す。このため、BP復号の性能が改善される。換言すれば、所与の数のシンドロームについて、実施の形態は、復号信号内の誤りの数を低減する。
符号化器の例
図4は、本発明の1つの実施の形態による符号化器900の例を示している。この実施の形態では、符号化器は、ワイナー・ジブ符号化器であり、当該技術分野において既知のプロセッサを用いて実装される。
図4は、本発明の1つの実施の形態による符号化器900の例を示している。この実施の形態では、符号化器は、ワイナー・ジブ符号化器であり、当該技術分野において既知のプロセッサを用いて実装される。
ブロック変換モジュール920によって変換操作が信号901に適用され、変換係数921が生成される。変換係数は、基本量子化モジュール940によって、全ての変換係数について一定のステップサイズを用いる一様量子化器を用いて量子化される。他の実施の形態において、量子化器は、非一様であるか、または異なる変換係数について異なるステップを用いる。
量子化された変換係数941は、シンドローム符号化器モジュール970によってビットプレーンに変換され、各ビットプレーンにシンドローム符号が適用されてシンドロームビット971が生成される。1つの実施の形態では、シンドローム符号は、低密度パリティ検査(LDPC)符号である。他の実施の形態では、シンドローム符号は、リード・ソロモン符号、ボーズ・チョドーリ・オッケンジェム(BCH:Bose Chaudhuri Hocquenheim)符号、ターボ符号、ラプター符号、ファウンテン符号(Fountain Code)、不規則反復蓄積(IRA:irregular repeat accumulate)符号等の任意の線形チャネル符号である。
シンドローム符号化器モジュールは、変換係数から抽出された各ビットプレーンをベクトルとして表し、このベクトルをシンドローム符号のパリティ検査行列と乗算する。この乗算の結果、シンドロームベクトルの形態のシンドロームビットとなる。シンドロームベクトルの長さは、チャネル符号のレートに依拠し、たとえば、高レートの符号が低周波数係数のより上位のビットプレーンに用いられ、結果として小さなシンドロームベクトルが生じる。
シンドロームベクトルは、復号器に送信される(909)符号化信号をビットストリームとして表す。復号器は、副情報の変換係数からの信号を、シンドロームベクトルを用いて復号する。副情報は、信号との統計的依存性を有する任意の情報、たとえばキーフレーム910とすることができる。いくつかの実施の形態では、キーフレームは、規則的に離間したフレームである。これらのフレームは、目標品質レベルにおいて符号化される。符号化は、当該技術分野において既知のブロック変換モジュール930、量子化モジュール950、およびエントロピー符号化器モジュール980を用いる。通常、キーフレームの送信レートは、シンドロームベクトルの送信レートよりも低い。シンドロームベクトルは、キーフレームと結合して(999)送信する(909)こともできるし、別個に送信することもできる。
追加の情報
いくつかの用途では、送信されたシンドロームは、信号を復号するのに不十分である。したがって、1つの実施の形態では、LDPC累積(LDPCA:LDPC accumulate)符号が用いられ、復号が成功するまで追加のシンドロームビットが増分的に生成されるようにする。これらの実施の形態において、符号レートは、特定のビットプレーンを復号する難易度に適合する。さらなるシンドロームを送信する要求は、復号器からのフィードバックチャネルを介して符号化器によって受信される。
いくつかの用途では、送信されたシンドロームは、信号を復号するのに不十分である。したがって、1つの実施の形態では、LDPC累積(LDPCA:LDPC accumulate)符号が用いられ、復号が成功するまで追加のシンドロームビットが増分的に生成されるようにする。これらの実施の形態において、符号レートは、特定のビットプレーンを復号する難易度に適合する。さらなるシンドロームを送信する要求は、復号器からのフィードバックチャネルを介して符号化器によって受信される。
別の実施の形態では、追加の補助情報が復号器に送信される。たとえば、信号が1組の画像である場合、各画像は、変換ブロックのサイズ、たとえば8×8ピクセルのブロックに分割され、これらのブロックのそれぞれにおける平均ピクセル値が補助情報として復号器に送信される。この実施の形態では、副情報は、補助情報を利用するために復号器において平均シフトされる。具体的には、副情報から平均ピクセル値が取り去られ、補助情報として受信された平均ピクセル値と置換される。別の実施の形態では、平均ピクセル値および追加のシンドロームビットの双方の組合せが復号器に送信される。
復号器
図5に示すように、復号器1000は、シンドロームベクトルのシンドロームビット1041および副情報1042に基づいて符号化信号1001を復号する。復号器は、シンドローム復号1040を用いて全ての変換係数の全てのビットプレーンを復号する。復号は、用いられるシンドローム符号に依拠する。1つの実施の形態では、LDPCA符号が用いられ、この場合、復号は、BP復号によって行われる。
図5に示すように、復号器1000は、シンドロームベクトルのシンドロームビット1041および副情報1042に基づいて符号化信号1001を復号する。復号器は、シンドローム復号1040を用いて全ての変換係数の全てのビットプレーンを復号する。復号は、用いられるシンドローム符号に依拠する。1つの実施の形態では、LDPCA符号が用いられ、この場合、復号は、BP復号によって行われる。
反復BP技法を用いて、LDPC符号は、それらのブロック長に対して線形の時間に復号される(1040)。BPは、ベイズネットワークおよびマルコフ確率場等のグラフィックモデルに対する推論を実行するメッセージパッシングプロセスである。BPは、任意の観測されたノードを条件として観測されていないノードごとの周辺分布を計算する。確率伝搬は、人工知能および情報理論において一般的に用いられており、低密度パリティ検査符号、ターボ符号、自由エネルギー近似、および充足可能性を含む多数の用途において経験的成功が実証されている。
BP復号を初期化するために、符号グラフの検査ノードが受信シンドロームビット1041と関連付けられる。上述したように、統計的依存性推定器1010によって求められた各グループの統計的依存性1015に基づいて、観測されていないノードごとの周辺分布が求められる。1つの実施の形態では、副情報1042、たとえばキーフレームは、符号化器から受信され、エントロピー復号され(1020)、逆量子化され(1030)、逆変換される(1070)。結果として生じる信号は、メモリ850内に格納され、後続の復号のために用いられる。
さらに、シンドローム復号1040によって復号された信号の部分は、逆量子化され(1050)、逆変換され(1070)、メモリ内の副情報を更新し最終的な復号信号1080を形成する。さまざまな実施の形態では、変換係数は、ビットプレーンごとに復号され、統計的依存性は、各ビットプレーンの復号後に更新され、更新された統計的依存性を用いて後続のビットプレーンが復号される。たとえば、この実施の形態の1つの変形形態では、統計的依存性の更新は、符号化信号のビットプレーンを復号するための確率伝搬の対数尤度比の更新を含む。
本発明の趣旨および範囲内で様々な他の適合および変更を行うことができることが理解される。したがって、添付の特許請求の範囲の目的は、全てのそのような変形形態および変更形態を、本発明の真の趣旨および範囲内に入るものとして包含することである。
Claims (19)
- 符号化信号を、前記符号化信号と副情報との間の統計的依存性に基づいて復号する方法であって、前記統計的依存性は空間的であり、前記方法は、
前記副情報の各変換ブロックの統計的信頼性を、前記変換ブロックの変換係数の絶対値の関数として求めるステップと、
前記副情報の前記変換ブロックを、各前記変換ブロックの前記統計的信頼性に基づいて1組のグループにグループ化するステップであって、各前記グループの前記変換ブロックの前記統計的信頼性が実質的に同様になるようにグループ化する、グループ化するステップと、
前記符号化信号の各前記変換ブロックを、前記符号化信号の前記変換ブロックと、前記副情報の対応する変換ブロックを含むグループとの間の前記統計的依存性を用いて復号するステップであって、前記統計的依存性は、前記副情報の前記変換ブロックの前記グループごとに独立して求められ、復号信号が生成される、復号するステップと、
を含み、前記方法の前記ステップは、プロセッサによって実行される方法。 - 前記統計的依存性は、ラプラシアンパラメーターによって表されるラプラシアン分布である、請求項1に記載の方法。
- 前記統計的依存性のパラメーターは、前記グループごとに一意である、請求項1に記載の方法。
- 前記符号化信号の第1の部分を復号する間に第1の変換ブロックの第1の統計的依存性を求めるステップと、
前記第1の変換ブロックおよび第2の変換ブロックが同じグループにある場合、前記第2の変換ブロックおよび前記第1の統計的依存性を用いて前記符号化信号の第2の部分を復号するステップと、
をさらに含む、請求項1に記載の方法。 - 前記符号化信号の前記変換ブロックごとに、前記副情報の前記対応する変換ブロックを求めるステップと、
前記対応する変換ブロックの前記グループを求めるステップと、
前記グループの前記統計的依存性を選択するステップと、
前記副情報の前記対応する変換ブロックおよび前記選択された統計的依存性を用いて前記符号化信号の前記変換ブロックを復号するステップと、
をさらに含む、請求項1に記載の方法。 - 対応するグループ内の前記復号信号の前記変換ブロックを用いて、前記符号化信号の前記変換ブロックの前記対応するグループと前記副情報との間の前記統計的依存性を独立して更新するステップをさらに含む、請求項1に記載の方法。
- 前記関数は、閾値未満の絶対値を有する変換係数の数を求める、請求項1に記載の方法。
- 前記グループ化するステップは、
前記1組のグループ内のグループ数を求めるステップと、
各前記グループに前記統計的信頼性の値の範囲を割り当てるステップと、
前記変換ブロックの統計的特性を少なくとも1つのグループについて指定された前記統計的信頼性の範囲と比較することによって前記変換ブロックをグループ化するステップと、
をさらに含む、請求項1に記載の方法。 - 前記符号化信号の前記変換ブロックの前記変換係数のビットプレーンを復号するステップと、
前記ビットプレーンを復号するステップの後に前記統計的依存性を更新するステップと、
前記更新された統計的依存性を用いて後続のビットプレーンを復号するステップと、
をさらに含む、請求項1に記載の方法。 - 前記更新するステップは、
前記後続のビットプレーンを復号するために確率伝搬法の対数尤度比を更新するステップをさらに含む、請求項9に記載の方法。 - 符号化信号を、前記符号化信号と副情報との間の統計的依存性に基づいて復号する復号器であって、
前記副情報の各変換ブロックの統計的信頼性を、前記変換ブロックの変換係数の絶対値の関数として求める手段と、
前記副情報の前記変換ブロックを、各前記変換ブロックの前記統計的信頼性に基づいて1組のグループにグループ化する手段であって、各前記グループの前記変換ブロックの前記統計的信頼性が実質的に同様になるようにする、グループ化する手段と、
前記1組のグループ内の前記グループごとに前記統計的依存性を求める手段であって、復号信号を生成する、求める手段と、
を備える、復号器。 - 前記統計的依存性は、前記グループごとに独立して求められる、請求項11に記載の復号器。
- 前記符号化信号の変換ブロックに対応する前記副情報の前記変換ブロックの前記グループに基づいて、1組の統計的依存性から前記統計的依存性を選択する手段をさらに備える、請求項11に記載の復号器。
- 前記統計的依存性に基づいて前記副情報の前記変換ブロックの前記変換係数から前記符号化信号の前記変換ブロックの変換係数を求める手段をさらに備える、請求項13に記載の復号器。
- 前記変換ブロックの前記変換係数を求めたことに応答して、前記グループの前記統計的依存性を更新する手段をさらに備える、請求項14に記載の復号器。
- 前記符号化信号の変換ブロックと、前記副情報の対応する変換ブロックを含むグループとの間の前記統計的依存性を用いて前記符号化信号の各前記変換ブロックを復号する手段であって、前記統計的依存性は、前記副情報の前記変換ブロックの前記グループごとに独立して求められる、復号する手段と、
前記復号信号を格納するためのメモリと、
をさらに備える、請求項11に記載の復号器。 - 前記信号の前記変換ブロックの対応するグループと前記副情報との間の前記統計的依存性を独立して更新する手段をさらに備える、請求項11に記載の復号器。
- 前記変換ブロックの前記統計的信頼性を特定のグループについて指定された前記統計的信頼性の範囲と比較する手段をさらに備える、請求項11に記載の復号器。
- 前記信号は、フレームのシーケンスを含むビデオであり、各前記フレームは、前記変換ブロックに分割される、請求項11に記載の復号器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/960,974 US20120140829A1 (en) | 2010-12-06 | 2010-12-06 | Signal Coding Using Spatial Statistical Dependencies |
US12/960,974 | 2010-12-06 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012124890A true JP2012124890A (ja) | 2012-06-28 |
Family
ID=46162216
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011248616A Pending JP2012124890A (ja) | 2010-12-06 | 2011-11-14 | 符号化信号を、この符号化信号と副情報との間の統計的依存性に基づいて復号する方法および復号器 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20120140829A1 (ja) |
JP (1) | JP2012124890A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015065645A (ja) * | 2013-09-25 | 2015-04-09 | 三菱電機株式会社 | 画像推定方法 |
JP2015065644A (ja) * | 2013-09-25 | 2015-04-09 | 三菱電機株式会社 | 画像推定方法 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8503523B2 (en) * | 2007-06-29 | 2013-08-06 | Microsoft Corporation | Forming a representation of a video item and use thereof |
EP2823409A4 (en) * | 2012-03-04 | 2015-12-02 | Adam Jeffries | DATA SYSTEM PROCESSING |
US9451290B2 (en) * | 2013-12-26 | 2016-09-20 | Google Technology Holdings LLC | Multi-spectral image compression |
US10044374B2 (en) * | 2015-07-30 | 2018-08-07 | Quantum Corporation | Adaptive erasure codes |
EP3160142A1 (en) | 2015-10-21 | 2017-04-26 | Thomson Licensing | Method for encoding and method for decoding a light field based image and corresponding devices |
US10455250B2 (en) * | 2017-05-30 | 2019-10-22 | Mitsubishi Electric Research Laboratories, Inc. | Method and system for distributed coding of images |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5831559A (en) * | 1996-01-24 | 1998-11-03 | Intel Corporation | Encoding/decoding video signals using multiple run-val mapping tables |
US6011499A (en) * | 1996-06-27 | 2000-01-04 | Intel Corporation | Encoding/decoding video signals using multiple run-val mapping tables |
AUPP248298A0 (en) * | 1998-03-20 | 1998-04-23 | Canon Kabushiki Kaisha | A method and apparatus for hierarchical encoding and decoding an image |
US6510247B1 (en) * | 1998-09-25 | 2003-01-21 | Hewlett-Packard Company | Decoding of embedded bit streams produced by context-based ordering and coding of transform coeffiecient bit-planes |
US6356665B1 (en) * | 1998-12-09 | 2002-03-12 | Sharp Laboratories Of America, Inc. | Quad-tree embedded image compression and decompression method and apparatus |
CN101711481B (zh) * | 2006-10-18 | 2013-01-09 | 汤姆森特许公司 | 使用预测数据精选进行视频编码的方法和装置 |
US7894550B2 (en) * | 2007-01-10 | 2011-02-22 | International Business Machines Corporation | Method, apparatus, and system for source coding with iterative side information generation and decoding process |
KR20090097013A (ko) * | 2008-03-10 | 2009-09-15 | 삼성전자주식회사 | 영상 부호화장치 및 영상 복호화장치 |
KR101375668B1 (ko) * | 2008-03-17 | 2014-03-18 | 삼성전자주식회사 | 변환 계수의 부호화, 복호화 방법 및 장치 |
US9131238B2 (en) * | 2010-06-18 | 2015-09-08 | The Trustees Of Princeton University | System and method for lossy source-channel coding at the application layer |
-
2010
- 2010-12-06 US US12/960,974 patent/US20120140829A1/en not_active Abandoned
-
2011
- 2011-11-14 JP JP2011248616A patent/JP2012124890A/ja active Pending
Non-Patent Citations (1)
Title |
---|
JPN6015040373; Ghazaleh R. Esmaili and Pamela C. Cosman: 'Correlation noise classification based on matching success for transform domain Wyner-Ziv video codi' IEEE International Conference on Acoustics, Speech and Signal Processing, 2009. ICASSP 2009. , 20090419, pp.801-804 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015065645A (ja) * | 2013-09-25 | 2015-04-09 | 三菱電機株式会社 | 画像推定方法 |
JP2015065644A (ja) * | 2013-09-25 | 2015-04-09 | 三菱電機株式会社 | 画像推定方法 |
Also Published As
Publication number | Publication date |
---|---|
US20120140829A1 (en) | 2012-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2012124890A (ja) | 符号化信号を、この符号化信号と副情報との間の統計的依存性に基づいて復号する方法および復号器 | |
US7400774B2 (en) | Encoding and decoding of digital data using cues derivable at a decoder | |
EP3677027B1 (en) | Mixing of probabilities for entropy coding in video compression | |
US20130266078A1 (en) | Method and device for correlation channel estimation | |
US9014499B2 (en) | Distributed source coding using prediction modes obtained from side information | |
WO2019075063A1 (en) | BINARY ARITHMETIC CODING WITH PROGRESSIVE CHANGE OF ADAPTATION PARAMETERS | |
Zhou et al. | Distributed video coding using interval overlapped arithmetic coding | |
US7894550B2 (en) | Method, apparatus, and system for source coding with iterative side information generation and decoding process | |
WO2011084908A2 (en) | Orthogonal multiple description coding | |
JP2012531776A (ja) | 算術符号化及び復号化方法 | |
US9307257B2 (en) | Method for improving compression efficiency of distributed source coding using intra-band information | |
Vijayanagar et al. | Low complexity distributed video coding | |
CN103959788A (zh) | 通过模式匹配在解码器层面的运动估计 | |
Hanca et al. | Real-time distributed video coding for 1K-pixel visual sensor networks | |
Qing et al. | Practical distributed video coding in packet lossy channels | |
Thao et al. | Side information creation using adaptive block size for distributed video coding | |
Ye et al. | Feedback-free distributed video coding using parallelized design | |
Haqqani et al. | Encoder rate control for transform domain Wyner-Ziv Video Coding | |
US10628165B2 (en) | Gain control for multiple description coding | |
Rup et al. | Recent advances in distributed video coding | |
Nguyen et al. | Artificial Intelligence Based Adaptive GOP Size Selection for Effective Wyner-Ziv Video Coding | |
KR101413706B1 (ko) | 움직임 정보 피드백을 갖는 위너-지브 비디오 코덱의 패리티 비트 요구량을 결정하는 방법 | |
KR100969135B1 (ko) | 복원정보 신뢰도에 기반하여 계속적으로 보조정보를 향상시키는 분산비디오 부호화 영상의 복호화 장치 및 그 방법 | |
KR101059318B1 (ko) | 분산 비디오 부호화/복호화 방법, 분산 비디오 부호화/복호화 장치 및 변환 부호화 장치 | |
Lahsini et al. | A low complexity video encoding scheme using DCT |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141001 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150925 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151013 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160315 |