JP5094960B2 - 空間的に強化される変換符号化 - Google Patents

空間的に強化される変換符号化 Download PDF

Info

Publication number
JP5094960B2
JP5094960B2 JP2010502623A JP2010502623A JP5094960B2 JP 5094960 B2 JP5094960 B2 JP 5094960B2 JP 2010502623 A JP2010502623 A JP 2010502623A JP 2010502623 A JP2010502623 A JP 2010502623A JP 5094960 B2 JP5094960 B2 JP 5094960B2
Authority
JP
Japan
Prior art keywords
spatial
decoding
transform
outlier
prediction error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010502623A
Other languages
English (en)
Other versions
JP2010524380A (ja
Inventor
ヤニ ライネマ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=39767013&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP5094960(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2010524380A publication Critical patent/JP2010524380A/ja
Application granted granted Critical
Publication of JP5094960B2 publication Critical patent/JP5094960B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/55Motion estimation with spatial constraints, e.g. at image or region borders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

本発明は、デジタル映像材料の符号化および復号に関する。より具体的には、本発明は、周波数領域および空間領域の両方における予測誤差符号化(prediction error coding)に関する。
発明の背景
本項は、請求項に列挙される本発明の背景または内容を提供することを意図する。本項における説明は、追求され得る概念を含む場合があり、必ずしも過去に着想または追求された概念だけではない。したがって、本明細書において別途明示されない限り、本項に説明される事項は、本出願における説明および請求項に対する従来技術と認められるものではなく、本項に含められることだけでは従来技術であるとは認められない。
映像コーデックは、入力映像を、格納および/または伝送に適した圧縮表現に変換する符号化器と、圧縮された映像表現を再び可視形式に解凍可能である復号器とを備える。通常、符号化器は、映像をよりコンパクトな形式で、すなわちより低いビットレートで表現するために、原映像シーケンスからいくつかの情報を削除する。
典型的なハイブリット型映像コーデック、例えば、ITU−TのH.263やH.264は、映像情報を2段階で符号化する。第1段階では、特定のピクチャ範囲または「ブロック」における画素値が予測される。これらの画素値は、例えば、動き補償機構によって予測可能であり、この動き補償機構は、先行して符号化された映像フレームの1つから中に、符号化されるブロックに良く対応する領域を見つけて示すことを伴う。さらに、画素値は、空間機構によって予測可能であり、この空間機構は、所定の方式で符号化されるブロック周辺の画素値を使用することを伴う。第2段階は、予測誤差、すなわち、予測されたブロックの画素と、原ブロックの画素との間の差を符号化することを伴う。これは、通常、所定の変換(例えば、離散コサイン変換(Discrete Cosine Transform; DCT)またはその変形)を使用して、画素値の差分を変換し、係数を量子化し、量子化された係数をエントロピー符号化することによって達成される。量子化プロセスの忠実度を変更することによって、符号化器は、画素表現の精度(すなわち、ピクチャの質)と、最終的に符号化される映像表現のサイズ(すなわち、ファイルサイズまたは伝送ビットレート)との間のバランスを制御することが可能である。
復号器は、画素ブロックの予測表現を形成するべく、符号化器が使用する機構に類似する予測機構と、予測誤差復号とを適用することによって、出力映像を再構成する。この予測機構には、符号化器により生成されて圧縮表現に格納される、動き情報または空間情報が用いられる。また、予測誤差復号(prediction error decoding)は、予測誤差符号化の逆処理であり、空間画素領域で量子化された予測誤差信号を復元する。予測プロセスおよび予測誤差復号プロセスの適用後、復号器は、予測信号および予測誤差信号(すなわち、画素値)をまとめて、出力映像フレームを形成する。また復号器(および符号化器)は、出力映像がディスプレイに送られる前に、および/または映像シーケンスにおける出力映像を映像シーケンスにおける次のフレームの予測基準として格納する前に、出力映像の質を改善するために、追加のフィルタリングプロセスを適用することもできる。
典型的な映像コーデックでは、動き情報は、動き補償された各画像ブロックに関連する動きベクトルにより表される。これらの動きベクトルの各々は、符号化されるピクチャ(符号化器側)または復号されるピクチャ(復号器側)における画像ブロックと、先行して符号化または復号されたピクチャのうちの1つにおける予測源ブロックとの位置のずれ(displacement)を表現する。動きベクトルを効率的に表現するために、動きベクトルは、通常、ブロック特有の予測された動きベクトルとは別個に符号化される。典型的な映像コーデックでは、予測された動きベクトルは、所定の方式で、例えば、隣接ブロックの符号化または復号された動きベクトルの中央値を計算することによって生成される。
典型的な映像符号化器は、ラグランジュのコスト関数を利用して、最適な符号化モード、例えば、所望のマクロブロックモードおよび関連の動きベクトルを探索する。この種類のコスト関数は、重み付け係数λを使用して、非可逆符号化方法による正確な又は推定された画像歪みと、画像範囲における画素値の表現に必要な正確な又は推定された量の情報とを以下のように合わせる。
C=D+λR (1)
式(1)において、Cは、最小化されるラグランジュコストであり、Dは、モードベクトルおよび動きベクトルを考慮した画像歪み(例えば、平均2乗誤差)であり、Rは、復号器において画像ブロックを再構成するために必要なデータの表現に必要なビット数である(候補となる動きベクトルを表現するためのデータ量を含む)。
通常、映像または画像圧縮システムにおける予測誤差信号の変換符号化は、DCTベースの線形変換、変換されたDCT係数の量子化、および量子化された係数のコンテクストベースのエントロピー符号化を含む。しかしながら、この変換は、特定の統計データの場合のみ、予測誤差信号のエネルギーを効率的に圧縮し、変換される予測誤差の相関が低い場合には、符号化性能は劣化する。このため、特に、符号化される画像ブロックの高品質な予測を達成するために高度な動き補償プロセスおよび空間予測プロセスを用いる(ひいては、予測誤差信号を最小化および無相関化する)現在の映像および画像符号化システムにおいては、準最適な性能しか得られない。
上記問題のうちのいくつかに対処するために、多くのハイブリット型映像符号化スキームが開発されている。これらのハイブリット型システムは、通常、2つの冗長度低減技術(つまり予測および変換)のハイブリット型である。予測は、ピクチャ間予測(Inter-picture prediction)の形式を取ることができ、これを使用して信号における時間冗長性を除去する。また、ピクチャ内予測(Intra-picture prediction)を、H.264/高度映像符号化(Advanced Video Coding; AVC)規格において使用してもよい。この規格においては、ピクチャフレーム内の近傍領域間の類似性を利用することによって空間冗長性が除去され得る。これらのピクチャ間およびピクチャ内予測技術により、残留信号/誤差信号は、予測されたピクチャフレームを原ピクチャフレームから除去することによって形成される。次いで、この予測誤差信号は、通常、信号における空間冗長性を低減するために、8×8のDCT変換を使用してブロック変換符号化される。
本発明の種々の実施形態は、選択された変換および量子化された空間サンプルの異なる基底関数の加重和として、予測誤差信号を表現するためのシステムおよび方法を提供する。選択された変換の基底関数は、基底ベクトルの直交系を含んでもよく、または基底関数は、直交系を含まなくてもよい。種々の実施形態によると、1個の画像ブロックの予測誤差信号は、変換基底関数(transform basis function)および空間サンプル(すなわち画素値)の両方を使用して構成されるが、それによって、上述の変換符号化手法および空間符号化手法の両方の望ましい特徴が組み合わせられる。これによって、最小量の変換係数で画像ブロックの優れた全体表現をもたらす変換基底関数の利用が可能になる。(変換係数は、基底関数との相関が大きい予測誤差信号の成分を表現する。)また、本発明の種々の実施形態は、同じ画像ブロックの予測誤差信号の成分のうち、適用される変換の基底関数との相関が小さい成分(特定の種類のセンサ雑音、高周波テクスチャ、エッジ情報など)についての、効率的な空間表現を可能とする。
本発明の種々の実施形態による、データブロックのための予測誤差信号(prediction error signal)を符号化するシステムおよび方法は、予測されたデータブロックのサンプル値と、オリジナルの入力ブロックの値との間の差分を表現する差分信号(difference signal)を計算することを含む。変換符号化(transform coding)および空間符号化(spatial coding)の両方を、前記差分信号に適用し、それによって、前記差分信号の第1の成分および第2の成分の第1の表現および第2の表現を生成する。次いで、前記予想誤差信号を提供するために、前記第1の表現および第2の表現を組み合わせる。
また、本発明の種々の実施形態は、データブロックのための予測誤差信号を復号するシステムおよび方法も提供し、複数の変換係数および複数の空間サンプルを含む、符号化された予測誤差信号を受信することを含む。前記複数の変換された係数は、復号された変換情報に復号され、前記複数の空間サンプルは、復号された空間情報に復号される。前記復号された変換情報、前記復号された空間情報、および前記データブロックの再構成された予測は積算され、それによって、前記データブロックの復号された表現が形成される。
本発明の種々の実施形態の実装は、現代の映像および画像コーデックの圧縮効率を改善する役割を果たす。符号化に関する計算複雑性がある程度増すかもしれないが、従来の変換符号化ベースの手法の複雑性レベル程度にはそれを低下させるために、高速アルゴリズムを適用することができる。本発明の種々の実施形態の実装において、復号における複雑性への影響は無視できる。
本発明に関するこれらの利点および特徴ならびにその他の利点および特徴と、その動作の機構および方式とは、添付図面および以下の詳細説明により明白になる。添付の図面において、同一要素には同一の符号が付されている。
画像データの符号化に使用可能なアダマール変換(Hadamard transform)の基底関数(basis function)の例を示す。
図2(a)は、原画像と予測画像との間の予測誤差信号を表現する、符号化または復号されるべき4つのスカラー値の例であり、図2(b)は、予測誤差信号へと積算される、図1における4つの重み付け基底関数を示し、図2(c)は、第1の基底関数および矢印により表現される単一の空間サンプルのみを積算することによって、同じ予測誤差信号を再構成することを可能にする方法を示している。
本発明の一実施形態に従って構成される映像符号化器のブロック図である。
本発明のある実施形態において使用され得る1つの符号化アルゴリズムを示すフローチャートである。
本発明の種々の実施形態において使用され得る1つの復号アルゴリズムを示すフローチャートである。
本発明の一実施形態に従って構成される映像復号器のブロック図である。
本発明の種々の実施形態が実装され得るシステムの概略図である。
本発明の種々の実施形態の実装と併せて使用可能である電子機器の斜視図である。
図8の電子機器に含まれ得る回路の概略表現である。
種々の実施形態の詳細な説明
本発明の種々の実施形態は、選択された変換および量子化された空間サンプルの異なる基底関数の加重和として、予測誤差信号を表現するためのシステムおよび方法を提供する。種々の実施形態によると、1個の画像ブロックの予測誤差信号は、変換基底関数(transform basis function)および空間サンプル(すなわち画素値)の両方を使用して構成されるが、それによって、上述の変換符号化手法および空間符号化手法の両方の望ましい特徴が組み合わせられる。これによって、最小量の変換係数で画像ブロックの優れた全体表現をもたらす変換基底関数の利用が可能になる。(変換係数は、基底関数との相関が大きい予測誤差信号の成分を表現する。)また、本発明の種々の実施形態は、同じ画像ブロックの予測誤差信号の成分のうち、適用される変換の基底関数との相関が小さい成分(特定の種類のセンサ雑音、高周波テクスチャ、エッジ情報など)についての、効率的な空間表現を可能とする。
図1および図2は、本発明の種々の実施形態が一次元でどのように動作しうるかを示す簡単な例である。図1は、画像データの符号化に使用可能である一次元線形変換の基底関数(basis function)の例を示す。この変換は、アダマール変換(Hadamard transform)と呼ばれる。
これらの4つの基底関数の加重和(weighted sum)は、任意の4つのサンプルの表現に使用可能である。図2(a)は、原画像と予測画像との間の予測誤差信号を表現する、符号化または復号されるべき4つのスカラー値の例である。図2(b)では、図1における4つの重み付け基底関数は、予測誤差信号へと積算されている(第1の基底関数の1.5倍、第2の基底関数の0.5倍、第3の基底関数の−0.5倍、および第4の基底関数の−0.5倍)。図2(c)では、第1の基底関数および矢印により表現される単一の空間サンプルのみを積算することによって、同一の予測誤差信号を再構成可能にする方法を実証する。この例では、4つのアダマール基底関数(図2(b)に示す)を重み付けする4つの変換係数の代わりに僅か1個の変換係数および1個の空間サンプルによって信号が表現されるため、圧縮効率の改善を期待することができる。
図3は、本発明の一実施形態に従い構成される映像符号化器のブロック図である。より具体的には、図3は、符号化される画像300が、画素予測302、予測誤差符号化303、および予測誤差復号304の各処理をどのように受けるかを示す。画素予測処理302では、画像300は、ピクチャ間予測(inter-prediction)306およびピクチャ内予測308(intra-prediction)の両方の処理を受け、これらによって、モード選択310の後に、画像ブロック312の予測表現がもたらされる。また、仮再構成画像(preliminary reconstructed image)314もピクチャ内予測308に使用される。画像ブロックの全てが処理されると、仮再構成画像314は、316においてフィルタリングされて、最終再構成画像340が生成される。最終再構成画像340は、参照フレームメモリ318に送信され、今後のフレームのピクチャ間予測306に使用される。
画像ブロック312の予測表現ならびに符号化される画像300は、予測誤差符号化処理303に使用する予測誤差信号320を定義するために、一緒に使用される。予測誤差符号化部303では、予測誤差信号320は、特徴選択(feature selection)322および空間量子化(spatial quantization)324、ならびに変換(transform)326および量子化(quantization)328の各処理を受ける。変換326および量子化328は、特徴選択322の後に行われる。
画像ブロック312の予測誤差および予測表現を記述するデータ(例えば、動きベクトル、モード情報、量子化されたDCT+空間サンプル)は、エントロピー符号化処理330に送られる。予測誤差復号処理304は、予測誤差符号化処理303の実質的に逆であり、予測誤差復号処理は、逆空間量子化部332、逆変換部334、および逆量子化部336を含む。予測誤差復号部304の結果は、再構成された予測誤差信号338であり、これは、仮再構成画像314を生成するために、画像ブロック312の予測された表現と組み合わせて使用される。
図4は、本発明のある実施形態において使用され得る1つの符号化アルゴリズムを示すフローチャートである。しかしながら、後述のように、多種多様の異なるアルゴリズムが、本発明の原理に従い使用され得る。図4の400において、予測されたブロックのサンプル値と、オリジナルの入力ブロックとの間の差分が計算される。本明細書において、「値(value)」および「外れ値(outlier value)」の語句が、これらの差分値を言及するように意図されうることに留意されたい。410において、外れ値が探索される。この場合、探索される外れ値の大きさは、符号化される表現の精度に依存する。高ビットレートの良質な表現を目標とする場合は、差分値が小さくとも外れ値としてみなされ、低品質でも低いビットレートの表現を目標とする場合には、差分値が大きい場合にのみ外れ値としてみなされる。420では、修正された予測誤差信号が変換符号化(transform code)される。ここでは、変換(transform)、量子化(quantization)、およびエントロピー符号化(entropy coding)を伴う。ここで外れ値は、例えば、近傍の予測誤差値を平均化することによって、これらの値の補間表現に置換される。430において、修正された予測誤差信号は、空間領域に再び変換復号(transform decode)される。440において、元の外れ値と、変換復号された外れ値との間の差分に空間符号化が適用される。ここでは、変換は伴わず、量子化およびエントロピー符号化のみを伴う。450において、変換符号化データおよび空間符号化データを結合する(joining)ことによって、予測誤差信号の最終符号化表現が形成される。別の実施形態では、空間符号化は、変換符号化の前に行われる。
図2(a)〜図2(c)に示す一次元の例について検討すると、図4に概説されるアルゴリズムは、データを次のように処理し得る。前述のように、図2(a)は、符号化されるべき差分信号[1131]を表現する。この場合、[3]は外れ値である。ゆえに、予測誤差信号は、第2および第4のサンプルの平均と[3]とを置換することによって修正され、信号[1111]を生成する。次いで、元の外れ値サンプル([3])と変換符号化された外れ値([1])との間の差分が空間符号化され、空間符号化された信号[0020]を生成する。次いで、変換符号化および空間符号化された信号のエントロピー符号化された表現が、ビットストリームに書き込まれる。ゆえに、復号器は、逆変換されたデータ[1111]および逆空間符号化されたデータ[0020]を積算することによって(画像ブロックの予測サンプルと合わせて)、符号化された信号を復元することが可能である。
上記例を検討すると、変換に関するアダマール基底ベクトルの選択が、単に例示的であるように意図されていることに留意することが重要である。実際は、本明細書に記載の種々の方法および技術は、基底関数を用いる任意の変換に適用可能であり、基底関数は、必ずしも直交である必要はない。
本発明の種々の実施形態によると、映像または画像コーデックは、種々の方式で実装可能である。符号化器の場合、符号化器は、所望の変換係数および空間サンプルを見つけるために、様々な戦略を使用することが可能である。例えば、符号化器は、最初に信号を変換符号化し、残りの信号に空間符号化を適用することが可能である。また、符号化器は、最初に空間符号化を信号に適用し、その後、残りの信号に変換符号化を適用することが可能である。さらに、符号化性能を改善するために、変換係数の一部または全部をゼロに設定することも可能である。また、符号化性能を改善するために、空間サンプルの一部または全部をゼロに設定することも可能である。また、符号化器は、符号化性能を改善するために、所望の性能または所定の最大の反復数に達するまで、変換係数および/または空間サンプルを繰り返し修正することが可能である。
量子化および逆量子化に関し、変換係数および空間サンプルの量子化および逆量子化を結びつけることが可能である。例えば、変換係数および空間サンプルの両方の量子化ステップサイズを、単一のパラメータから導くことが可能である。別の方法では、変換係数および空間サンプルに対し、異なる量子化および逆量子化法を適用することも可能である。
空間サンプルの符号化および復号では、このような符号化および復号は、変換係数(transform coefficient)に依存することが可能であり、またその逆も同様である。実施形態によっては、空間サンプル、変換係数、またはその両方の符号化および復号が、予測信号(prediction signal)に依存し、また同じ画像または他の画像における他の変換係数および空間サンプルに依存することが可能である。
上記に加えて、特定の画像範囲または画像に変換係数または空間サンプルが存在しないことを示すこと可能である。また、空間符号化のみまたは変換符号化のみを、特定の画像範囲または画像に使用することを示すことが可能である。空間サンプルの数は、例えば、特定のテクスチャパターンを表現する単位で符号化および復号可能である。予測信号、予測誤差信号により再構成された信号、またはそれらの任意の組み合わせには、適切な処理前の機構および/または処理後の機構を組み合わせることができる。予測誤差信号の代わりに、または予測誤差信号に加えて、他の情報を符号化および復号してもよい。コーデックは、変換係数または空間サンプルのいずれかの利用を制限し得る。(例えば、低周波数の変換係数のみが信号の符号化表現に使用可能とする。)
図5は、本発明の種々の実施形態に従う復号プロセスを示す。図5の500において、映像復号器は、符号化された予測誤差信号を受信し、この信号は、変換された係数および空間サンプルの両方を含む。510において、変換された係数および空間サンプルの両方が復号される。520において、復号された変換情報、復号された空間情報、および画像ブロックの再構成された予測は、画像ブロックの復号表現を形成するように積算される。
図6は、本発明の一実施形態に従い構成される映像復号器のブロック図である。図6に示すように、エントロピー復号部600の後に、予測誤差復号部602および画素予測部604の両方が続く。予測誤差復号部602では、逆変換606および逆量子化608に加えて、上述のように逆空間量子化610が行われ、最終的に、再構成された予測誤差信号612がもたらされる。画素予測部604では、ピクチャ内予測またはピクチャ間予測が614において行われ、画像ブロック616の予測された表現を生成する。画像ブロック616の予測された表現と、再構成された予測誤差信号612とを併せて使用して、仮再構成画像618が生成される。仮再構成画像618は、予測処理614のためにも使用可能である。全ての画像ブロックが処理されると、仮再構成画像618はフィルタリング部620に送られる。フィルタリングされた画像は、参照フレームメモリ624にも格納可能であり、予測614でも使用可能になる。
図7は、本発明の種々の実施形態が利用可能なシステム10を示し、このシステムは、1つ以上のネットワークを介して通信可能な多数の通信機器を備える。システム10は、携帯電話機ネットワーク、無線ローカルエリアネットワーク(Local Area Network; LAN)、Bluetoothパーソナルエリアネットワーク、イーサネットLAN、トークンリングLAN、広域ネットワーク、インターネット等を含むが、これらに限定されない有線ネットワークまたは無線ネットワークの任意の組み合わせを備えてもよい。システム10は、有線および無線の両方の通信機器を含んでもよい。
例証のために、図7に示されるシステム10は、携帯電話機ネットワーク11およびインターネット28を含む。インターネット28に対する接続性には、長距離無線接続、短距離無線接続、ならびに電話線、ケーブル線、電力線、およびその同等物を含むがこれらに限定されない、種々の有線接続が含まれ得るが、これらに限定されない。
システム10の例示的な通信機器には、電子機器50、携帯情報端末(personal digital assistant; PDA)および携帯電話機14の組み合わせ、PDA16、一体型メッセージング機器(Integrated Messaging Device; IMD)18、デスクトップ型コンピュータ20、ならびにノート型コンピュータ22が含まれ得るが、これらに限定されない。通信機器は、固定型または移動中の個人によって持ち運ばれるような携帯型であってもよい。また、通信機器は、自動車、トラック、タクシー、バス、ボート、飛行機、自転車、バイク等を含むが、これらに限定されない輸送手段に位置してもよい。通信機器の一部または全部は、呼およびメッセージを送受信してもよく、また、無線接続25から基地局24を介してサービスプロバイダと通信してもよい。基地局24は、携帯電話機ネットワーク11およびインターネット28間の通信を可能にするネットワークサーバ26に接続されてもよい。システム10は、追加の通信機器および異なる型の通信機器を含んでもよい。
通信機器は、種々の伝送技術を使用して通信してもよく、この通信技術には、符号分割多元接続(Code Division Multiple Access; CDMA)、モバイル通信のためのグローバルシステム(Global System for Mobile Communications; GSM)、ユニバーサル移動体通信システム(Universal Mobile Telecommunications System; UMTS)、時分割多元接続(Time Division Multiple Access; TDMA)、周波数分割多元接続(Frequency Division Multiple Access; FDMA)、伝送制御プロトコル/インターネットプロトコル(Transmission Control Protocol/Internet Protocol; TCP/IP)、ショートメッセージサービス(Short Messaging Service; SMS)、マルチメディアメッセージサービス(Multimedia Messaging Service; MMS)、電子メール、インスタントメッセージサービス(Instant Messaging Service; IMS)、Bluetooth、IEEE 802.11等が含まれるが、これらに限定されない。本発明の種々の実施形態の実装に伴う通信機器は、無線接続、赤外線接続、レーザ接続、ケーブル接続、およびその同等物を含むが、これらに限定されない種々の媒体を使用して通信してもよい。
図8および図9は、本発明が実装され得る1つの代表的な電子機器50を示す。しかしながら、本発明が、1つの特定の型の機器に限定されるように意図されないことを理解されたい。図8および図9の電子機器50は、ハウジング30、液晶ディスプレイ形式のディスプレイ32、キーパッド34、マイクロホン36、イヤホン38、バッテリ40、赤外線ポート42、アンテナ44、本発明の一実施形態に従うUICC形式のスマートカード46、カード読み取り器48、無線インターフェース回路52、コーデック回路54、制御器56、およびメモリ58を含む。個々の回路および要素の全ては、当技術分野において、例えば、ノキアの種類の携帯電話機において周知の型を有する。
本明細書において説明する本発明の種々の実施形態は、方法ステップまたはプロセスの一般的な内容において説明され、これは、ネットワーク環境においてコンピュータにより実行されるプログラムコード等の、コンピュータにより実行可能な命令を含むプログラム製品であって、コンピュータ可読媒体に内蔵されるコンピュータ製品によって、一実施形態において実装され得る。概して、プログラムモジュールは、特定のタスクを実行するか、または特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、構成要素、データ構造等を含み得る。コンピュータにより実行可能な命令、関連のデータ構造、およびプログラムモジュールは、本明細書に開示する方法のステップを実行するためのプログラムコードの例を表す。特定の一連のこのような実行可能な命令または関連のデータ構造は、このようなステップまたはプロセスにおいて説明する機能を実装するための対応する動作の例を表す。
本発明の種々の実施形態のソフトウェアおよびウェブ実装は、種々のデータベース検索ステップまたはプロセス、相関ステップまたはプロセス、比較ステップまたはプロセス、ならびに決定ステップまたはプロセスを達成するために、法則ベースの論理および他の論理を含む標準的なプログラミング技法により達成可能である。本明細書および以下の請求項で使用する際、単語の「構成要素」および「モジュール」は、1つ以上の種類のソフトウェアコード、および/またはハードウェア実装、および/または手動入力を受信するための設備を使用する実装を包含するように意図されることに留意されたい。
本発明の実施形態に関する前述の説明は、例証目的および説明目的のために提示されている。前述の説明は、包括的であるように、または開示される厳密な形式に本発明を限定するように意図されず、また、上記教示を考慮した修正および変形が可能であるか、または、これらの修正および変形は、本発明の実践により入手され得る。本明細書において論じられる実施形態は、本発明の種々の実施形態およびその実用的な用途に関する原理および性質を説明して、種々の実施形態における本発明および想定される特定の使用に適合する種々の修正を有する本発明を当業者が利用できるように、選択および説明されている。

Claims (32)

  1. データブロックのための予測誤差信号(prediction error signal)を符号化する方法であって、
    予測されたデータブロックのサンプル値と、オリジナルの入力ブロックの値との間の差分を表現する差分信号(difference signal)を計算することと、
    前記差分信号における外れ値(outlier value)を非外れ値(non-outlier value)と置換することによって、修正した予測誤差信号を生成することと、
    変換符号化(transform coding)を生成された前記修正された予測誤差信号に適用することによって、前記差分信号の第1の成分の第1の表現を生成することと、
    空間符号化(spatial coding)を前記外れ値と変換復号された前記非外れ値との間の差分に適用することによって、前記差分信号の第1の成分の第2の表現を生成することと、
    前記第1の表現と第2の表現とを結合すること(joining)と、
    を含む、方法。
  2. 変換符号化のために、少なくとも1つの変換係数がゼロに設定される、請求項1に記載の方法。
  3. 空間符号化のために、少なくとも1つの空間サンプルがゼロに設定される、請求項1または2に記載の方法。
  4. 前記外れ値の置換に使用される前記非外れ値は、複数の近傍予測誤差値(neighboring prediction error value)の平均を含む、請求項1から3のいずれかに記載の方法。
  5. 前記データブロックにおいて変換係数が存在しないという表示子を提供することをさらに含む、請求項1から4のいずれかに記載の方法。
  6. 前記データブロックにおいて空間サンプルが存在しないという表示子を提供することをさらに含む、請求項1から5のいずれかに記載の方法。
  7. 前記変換符号化において、離散変換基底ベクトルの重み付け係数を含む変換係数が形成される、請求項1から6のいずれかに記載の方法。
  8. 前記離散変換は離散直交変換を含む、請求項7に記載の方法。
  9. 請求項1から8のいずれか1項に記載の方法をコンピュータに実行させるように構成される、コンピュータプログラム。
  10. プロセッサと、前記プロセッサに通信可能に接続されるメモリユニットとを備える装置であって、前記メモリユニットはコンピュータコードを備え、前記コンピュータコードが前記プロセッサによって実行されると、前記装置に動作を実行させ、前記動作が、
    予測されたデータブロックのサンプル値と、オリジナルの入力ブロックの値との間の差分を表現する差分信号(difference signal)を計算することと、
    前記差分信号における外れ値を非外れ値と置換することによって、修正した予測誤差信号を生成することと、
    変換符号化を生成された前記修正された予測誤差信号に適用することによって、前記差分信号の第1の成分の第1の表現を生成することと、
    空間符号化を前記外れ値と変換復号された前記非外れ値との間の差分に適用することによって、前記差分信号の第1の成分の第2の表現を生成することと、
    前記第1の表現と第2の表現とを結合することと、
    を含む、装置。
  11. 変換符号化のために、少なくとも1つの変換係数をゼロに設定する、請求項10に記載の装置。
  12. 空間符号化のために、少なくとも1つの空間サンプルをゼロに設定する、請求項10または11に記載の装置。
  13. 前記外れ値の置換に使用される前記非外れ値は、複数の近傍予測誤差値(neighboring prediction error value)の平均を含む、請求項10から12のいずれかに記載の装置。
  14. 前記動作は、前記データブロックにおいて変換係数が存在しないという表示子を提供することをさらに含む、請求項10から13のいずれかに記載の装置。
  15. 前記動作は、前記データブロックに空間サンプルが存在しないという表示子を提供することをさらに含む、請求項10から14のいずれかに記載の装置。
  16. データブロックのための予測誤差信号(prediction error signal)を復号する方法であって、
    複数の変換された係数および複数の空間サンプルを含む、符号化された予測誤差信号を受信することであって、前記変換された係数は変換された差分信号を表現し、前記差分信号における外れ値は非外れ値に置換されており、前記空間サンプルは前記外れ値と変換復号された前記非外れ値との間の差分を表現する、前記受信することと、
    前記複数の変換された係数を、変換情報へと復号することと、
    前記複数の空間サンプルを、空間情報へと復号することと、
    前記復号された変換情報、前記復号された空間情報、および前記データブロックの再構成された予測を積算することによって、前記データブロックの復号表現を形成することと、
    を含む、方法。
  17. 前記データブロックにおいて変換係数が存在しないという表示子が提供される、請求項16に記載の方法。
  18. 前記データブロックに空間サンプルが存在しないという表示子が提供される、請求項16または17に記載の方法。
  19. 前記複数の変換された係数および空間サンプルの前記復号は、各々の逆量子化を含み、変換された係数および空間サンプルの前記逆量子化は、相互に関連する、請求項16から18のいずれかに記載の方法。
  20. 前記複数の変換された係数および空間サンプルの前記復号は、各々の逆量子化を含み、変換された係数および空間サンプルの前記逆量子化は、相互に異なる、請求項16から18のいずれかに記載の方法。
  21. 前記空間サンプルの前記復号は、前記変換された係数の前記復号に依存する、請求項16から18のいずれかに記載の方法。
  22. 前記変換された係数の前記復号は、前記空間サンプルの前記復号に依存する、請求項16から18のいずれかに記載の方法。
  23. 前記複数の空間サンプルのうちの少なくともいくつかは、単一のユニットとして復号される、請求項16から22のいずれかに記載の方法。
  24. 請求項16から23のいずれか1項に記載の方法をコンピュータに実行させるように構成される、コンピュータプログラム。
  25. プロセッサと、前記プロセッサに通信可能に接続されるメモリユニットとを備える装置であって、前記メモリユニットはコンピュータコードを備え、前記コンピュータコードが前記プロセッサによって実行されると、前記装置に、データブロックのための予測誤差信号(prediction error signal)を復号するための処理を実行させ、ただし前記処理は、
    複数の変換された係数および複数の空間サンプルを含む、符号化された予測誤差信号を受信することであって、前記変換された係数は変換された差分信号を表現し、前記差分信号における外れ値は非外れ値に置換されており、前記空間サンプルは前記外れ値と変換復号された前記非外れ値との間の差分を表現する、前記受信することと、
    前記複数の変換された係数を、変換情報へと復号することと、
    前記複数の空間サンプルを、空間情報へと復号することと、
    前記復号された変換情報、前記復号された空間情報、および前記データブロックの再構成された予測を積算することによって、前記データブロックの復号表現を形成することと、
    を含む、装置。
  26. 前記データブロックにおいて変換係数が存在しないという表示子が提供される、請求項25に記載の装置。
  27. 前記データブロックに空間サンプルが存在しないという表示子が提供される、請求項25または26に記載の装置。
  28. 前記複数の変換された係数および空間サンプルの前記復号は、各々の逆量子化を含み、変換された係数および空間サンプルの前記逆量子化は、相互に関連する、請求項25から27のいずれかに記載の装置。
  29. 前記複数の変換された係数および空間サンプルの前記復号は、各々の逆量子化を含み、変換された係数および空間サンプルの前記逆量子化は、相互に異なる、請求項25から27のいずれかに記載の装置。
  30. 前記空間サンプルの前記復号は、前記変換された係数の前記復号に依存する、請求項25から27のいずれかに記載の装置。
  31. 前記変換された係数の前記復号は、前記空間サンプルの前記復号に依存する、請求項25から27のいずれかに記載の装置。
  32. 前記複数の空間サンプルのうちの少なくともいくつかは、単一のユニットとして復号される、請求項25から31のいずれかに記載の装置。
JP2010502623A 2007-04-12 2008-04-09 空間的に強化される変換符号化 Expired - Fee Related JP5094960B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US91148007P 2007-04-12 2007-04-12
US60/911,480 2007-04-12
PCT/IB2008/051351 WO2008126019A2 (en) 2007-04-12 2008-04-09 Spatially enhanced transform coding

Publications (2)

Publication Number Publication Date
JP2010524380A JP2010524380A (ja) 2010-07-15
JP5094960B2 true JP5094960B2 (ja) 2012-12-12

Family

ID=39767013

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010502623A Expired - Fee Related JP5094960B2 (ja) 2007-04-12 2008-04-09 空間的に強化される変換符号化

Country Status (10)

Country Link
US (1) US8077991B2 (ja)
EP (1) EP2156675A2 (ja)
JP (1) JP5094960B2 (ja)
KR (1) KR101182634B1 (ja)
CN (1) CN101682787A (ja)
CA (1) CA2684110A1 (ja)
MX (1) MX2009010921A (ja)
RU (1) RU2427099C2 (ja)
TW (1) TW200901775A (ja)
WO (1) WO2008126019A2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100939917B1 (ko) 2008-03-07 2010-02-03 에스케이 텔레콤주식회사 움직임 예측을 통한 부호화 시스템 및 움직임 예측을 통한부호화 방법
EP2448124A4 (en) * 2009-06-22 2012-08-29 Univ Barcelona METHOD FOR COMPLETELY ADAPTIVE CALIBRATION OF A PREDICTION ERROR ENCODER
CN101931817A (zh) * 2010-04-12 2010-12-29 中山大学 一种变换基自适应的变换编码方法
US9106916B1 (en) 2010-10-29 2015-08-11 Qualcomm Technologies, Inc. Saturation insensitive H.264 weighted prediction coefficients estimation
JP5698644B2 (ja) * 2011-10-18 2015-04-08 株式会社Nttドコモ 動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム、動画像予測復号方法、動画像予測復号装置及び動画像予測復号プログラム
JP5485969B2 (ja) * 2011-11-07 2014-05-07 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム
CA2825767C (en) * 2011-12-21 2018-11-27 Panasonic Corporation Image coding method, image decoding method, image coding apparatus and image decoding apparatus
US9106888B2 (en) * 2013-09-25 2015-08-11 Apple Inc. Reducing quantization artifacts using neighbor-based weighted dithering
EP3345396A4 (en) 2015-09-01 2019-03-27 Telefonaktiebolaget LM Ericsson (publ) SPATIAL IMPROVEMENT OF TRANSFORMER BLOCKS

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4125861A (en) * 1977-08-18 1978-11-14 Bell Telephone Laboratories, Incorporated Video signal encoding
JPH07118808B2 (ja) * 1985-03-20 1995-12-18 日本電気株式会社 動画像信号の符号化・復号化装置
JPH0832040B2 (ja) * 1985-09-26 1996-03-27 日本電気株式会社 動画像信号の符号化装置
JP3590996B2 (ja) * 1993-09-30 2004-11-17 ソニー株式会社 ディジタル画像信号の階層符号化および復号装置
EP0998824A1 (en) * 1997-07-28 2000-05-10 IDT INTERNATIONAL DIGITAL TECHNOLOGIES DEUTSCHLAND GmbH Method and apparatus for compression of video images and image residuals
KR100249223B1 (ko) * 1997-09-12 2000-03-15 구자홍 엠팩(mpeg)-4의움직임벡터코딩방법
GB2366679A (en) * 2000-09-05 2002-03-13 Sony Uk Ltd Processing data having multiple components
US7620108B2 (en) * 2005-09-16 2009-11-17 Sony Corporation Integrated spatial-temporal prediction

Also Published As

Publication number Publication date
TW200901775A (en) 2009-01-01
KR101182634B1 (ko) 2012-09-14
CN101682787A (zh) 2010-03-24
RU2009141606A (ru) 2011-05-20
MX2009010921A (es) 2009-11-19
US8077991B2 (en) 2011-12-13
RU2427099C2 (ru) 2011-08-20
WO2008126019A2 (en) 2008-10-23
US20080260270A1 (en) 2008-10-23
EP2156675A2 (en) 2010-02-24
WO2008126019A3 (en) 2008-12-04
KR20090127953A (ko) 2009-12-14
JP2010524380A (ja) 2010-07-15
CA2684110A1 (en) 2008-10-23

Similar Documents

Publication Publication Date Title
US20210409756A1 (en) Method for video coding and an apparatus
JP5094960B2 (ja) 空間的に強化される変換符号化
US11375204B2 (en) Feature-domain residual for video coding for machines
KR101464423B1 (ko) 비디오 프로세싱을 위한 장치, 방법 및 컴퓨터 프로그램
US20080240242A1 (en) Method and system for motion vector predictions
US20090016626A1 (en) Joint coding of multiple transform blocks with reduced number of coefficients
US20230217028A1 (en) Guided probability model for compressed representation of neural networks
KR20160056901A (ko) 비디오 코딩 방법, 장치 및 컴퓨터 프로그램
WO2010116268A1 (en) Method and apparatus for encoding and decoding of image and video signals
KR20140131352A (ko) 코딩을 위한 방법 및 장치
WO2022195409A1 (en) Method, apparatus and computer program product for end-to-end learned predictive coding of media frames
WO2022269441A1 (en) Learned adaptive motion estimation for neural video coding

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120911

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120918

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150928

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees