JP5107649B2 - ビデオの映像コード化およびイントラ・コード化のための固定型または適応型デインターリープドトランスフォームコード化方法及び装置 - Google Patents

ビデオの映像コード化およびイントラ・コード化のための固定型または適応型デインターリープドトランスフォームコード化方法及び装置 Download PDF

Info

Publication number
JP5107649B2
JP5107649B2 JP2007253879A JP2007253879A JP5107649B2 JP 5107649 B2 JP5107649 B2 JP 5107649B2 JP 2007253879 A JP2007253879 A JP 2007253879A JP 2007253879 A JP2007253879 A JP 2007253879A JP 5107649 B2 JP5107649 B2 JP 5107649B2
Authority
JP
Japan
Prior art keywords
video
subset
value
generate
video subset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2007253879A
Other languages
English (en)
Other versions
JP2008067396A (ja
Inventor
プリ アタル
ルイス シュミット ロバート
リー ウェイピン
ワス ジョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JP2008067396A publication Critical patent/JP2008067396A/ja
Application granted granted Critical
Publication of JP5107649B2 publication Critical patent/JP5107649B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/008Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

本発明は、1996年9月25日出願の米国仮出願第60/027,436号に基づく出願である。
本発明は、ひろくは映像のコード化およびビデオのイントラ・コード化のための方法および装置に関し、より詳しくは、トランスフォームコード化を用いた映像のコード化およびビデオのイントラ・コード化のための方法および装置に関する。イントラ・コード化は、単純な符号化/復号化、低遅延性、高度の耐エラー頑強性、あるいは高いレベルの対話性を必要とする用途にとって重要である。この種の用途の例としては、インターネットでの映像/ビデオ、無線ビデオ、ネットワーク式ビデオゲーム等が挙げられる。
映像コード化およびビデオのイントラ・コード化の最新技術では、トランスフォームコード化(例、離散コサイントランスフォーム、DCT)が用いられるが、これは、映像を8×8の寸法の非重複ブロックに仕切り、2×2のルミナンス(Y)ブロックのアレーおよび対応するCr信号のクロミナンス・ブロックおよびCb信号のブロック(ともにマクロブロックと呼ばれる)の単位にコード化することを含むものである。予め復元されたDC係数を用いてDCTブロックのDC係数を予測することによってイントラ・コード化の性能の改善が行なわれている。最近では、AC係数を予測することによってMPEG−4でさらなる改善が行なわれている。
過去数年間に、多くの研究者がトランスフォームコード化の代わりにウェイブレッツ(wavelets)を用いた異なるアプローチに迫っている。これらの研究者は、かなりの改善が得られたことを報告しているが、同時に複雑さも増大している。最近、コード化に先立てサブサンプリングを用いるウェイブレッツコード化のバリエーションがあらわれており(その中には、MPEG−4で現在実験が行なわれているものもある)、それらは、サブサンプリングの効果を利用した高度な量子化の技法を用いてさらに高い性能を実現しているが、同時に極端に複雑なものとなっている。
したがって、本発明は、高いコード化効率を示すがコード化の複雑さが比較的低い映像およびビデオのコード化のための方法および装置を開発する問題を扱うものである。
本発明は、トランスフォームステップに先立ってデインターリービング・ステップを適当な量子化の技法と組み合せて用いることによってこの問題を解決するものである。デインターリービングは、サブサンプリングより可撓性に富んでいる。本発明の方法および装置は、したがって、ウェイブレッツコード化のコード化効率を達成しながら、従来のトランスフォームコード化に比して複雑さがわずかだけ増し、ウェイブレッツコード化に比して複雑さが大きく低減したものである。
本発明は、符号化のプロセスで二つの形のデインターリービングを含む。本発明にもとづけば、固定型または適応型デインターリービング、トランスフォーム(例、DCT)、拡張をともなう量子化、およびエントロピー符号化(例、可変長符号化VLEまたは算術符号化AE)によって改善されたイントラ・コード化が達成される。本発明に基づけば、コード化に二つの主要なアプローチが存在する。第一のものは、固定型デインターリービングを用い、第二のものは、適応型デインターリービングを用いる。本発明によって、固定型デインターリービングのアプローチを用いて高いコード化効率を達成する簡単なトランスフォームコード化法を用いるか、あるいは適応型デインターリービングのアプローチにもとづいてそれよりややすぐれた結果を産み出すわずかに複雑な方法を用いることが可能となった。ただし、これらのアプローチのいずれも、ウェイブレッツコード化よりは複雑でなく、しかも同じまたはほぼ同じコード化効率を達成することができる。
本発明の効果的な実施形態にもとづけば、各アプローチごとに二つのバリエーションが存在する。一つは、動き/テクスチャ部分のそれぞれに対して分離してMPEG−4検定モデル(VM)(グローバルトランスフォーム)コード化するものであり、もう一つは、動き/テクスチャを組み合わせてVM(局部トランスフォーム)コード化するものである。
本発明にもとづけば、トランスフォームコード化の枠組みの中でイントラ・コード化の効率を有意に改善することが可能である。本発明は、MPEG−4で使用するために考案されたものである。MPEG−1/2ビデオ・コード化にあっては、しばしば、I−画像と呼ばれるそれ自体でコード化された画像のため、あるいは予測可能にコード化された画像(P−画像またはB−画像)のイントラ・マクロブロックのためにイントラ・コード化が用いられる。MPEG−4にあっては、画像またはマクロブロックの他に、ビデオ・オブジェクト(VO)およびビデオ・オブジェクト・プレーン(VOPs)のコンセプトが導入される。
MPEG−4コード化では、画面がある数のビデオ・オブジェクトに仕切られることができ、これらのビデオ・オブジェクトは、各々を独立してコード化することができる。VOPは、ビデオ・オブジェクトの時間的スナップショットである。実際、画像は、そこで形状が直方形のVOPの特殊なケースとなる。
MPEG−4コード化は、また、それぞれI−画像、P−画像、およびB−画像の一般化であるI−VOPs、P−VOPs、およびB−VOPsなど異なる種類のVOPsのコード化を含む。すなわち、I−画像のコード化およびイントラ・マクロブロックに加えて、本発明は、形状が直方形および任意のI−VOPsのコード化のためにも使用することができる。
本発明が扱う主な機能分野は、I−VOPsのコード化効率であるが、このアプローチは、P−VOPsおよびB−VOPsのコード化にも拡張することができる。本発明によって間接的に得られる付加的な機能分野は、空間的スケーラビリティである。
本発明は、デインターリービングおよび拡張量子化を加えたDCTコード化の枠組みを維持しながら、イントラ・コード化の効率を有意に改善することができる(1.5以上の因子によって)。一般に、イントラ・コード化の効率は、DC係数の予測をさらに改善し、またAC係数の予測および走査の適応を組み込むことによって若干は改善されるが、これらの手法をすべて組み合わせたとしても、本発明の改善の可能性と比較すればこれらの改善は小さい。
MPEG−4におけるI−VOPsコード化に関して、図1は、本発明に基づくグローバルデインターリーブドトランスフォーム(GDT)コード化の基本エンコーダ10のブロック線図を示す。デインターリーバ11への入力では、映像は、画素形式であり、各画素は、デジタル値であるルミナンス、クロミナンス、および彩度の三構成成分によってあらわされる。これらのデジタル値は、デインターリーバ11内へ送られ、デインターリーバ11は、映像内の隣接するサンプルを分離する。換言すれば、デインターリーバ11は、画素セットを多数の画素サブセットに分離するが、非隣接画素からサブセットを生成することによってそれを行なう。そのためには、使用される分離パターンの明細が必要である。各サブセットは、いくつかのデジタル・サンプルを含んでいるが、あたえられたサブセット内のサンプルは、元画像の中では互いに隣接していない。
トランスフォーム操作12によって各サブセットの中のデジタルの画素値がトランスフォーム係数にトランスフォームされ、エネルギーのほとんどは、わずかな係数にパックされる。コード化ステップでは、例えば、離散コサイントランスフォーム(DCT)を使用することができる。
なお、他の公知のトランスフォームの手法も使用することができる。
トランスフォーマ12は、デインターリーバ11から画素のサブセットを受け取る。各サブセットは、いくつかの画素を含み、各画素は、ルミナンス、クロミナンス、および彩度、または等価の色のシステムによってあらわされる。トランスフォーマ12は、次に、各サブセット内の値の空間周波数成分を表す係数を出力する。この時点では、真の圧縮はないが、DCTトランスフォームによってデータが分類され、これによってDCTは、有意にデータを減少させるように処理を行なう。DCTトランスフォームは、サブセット内の情報を比較的低い空間周波数で定義し、比較的高い空間周波数の多くはゼロとなり、その結果、後に圧縮が行なわれる。トランスフォーマ12の出力は、係数のブロックであり、デインターリービング・プロセス11によって生成される各サブセットに一つのブロックが割り当てられる。
クゥアントXプロセス13は、通常の量子化プラス・コード化効率を改善するための若干の拡張を含み、エントロピー・エンコーダ14のためのデータを用意する。これは、以下で、三つの異なるクゥアントXプロセス13を示して詳細に説明する。クゥアントXプロセス13の出力は、ビットのブロックで、デインターリービング・プロセス11で生成される各サブセットに一つのビットが割り当てられる。
クゥアントXプロセス13の後に符号化のプロセス14がつづく。この場合には、エントロピー符号化が用いられる。どのような形のエントロピー符号化でもよい。可変長符号化(VLE)は、エントロピー符号化の一例である。算術符号化(AE)は、他の一例である。エントロピー・エンコーダ14によって生成された符号化されたビットストリームは、保存または伝送することができる。
他の公知のエントロピー符号化も使用することができる。
図2は、図1に示すエンコーダ10に対応するデコーダ20を示す。I−VOPsのグローバルデインターリーブドDCTエンコード化は、エントロピー・デコーダ21、逆量子化22、逆トランスフォーム23、およびリインターリーバ24を含む。エントロピー・デコーダ21は、コードワードを逆転させて係数データへ戻す。逆量子化22は、量子化13の逆操作に加えてエンコーダ10で行なわれた若干の拡張を行なう。逆トランスフォーム23は、トランスフォーム12の逆操作を行ない、リインターリーバ24は、デインターリーバ11の逆を行なう。
コード化されたビットストリームは、エントロピー・デコーダ21内へ送られる。エントロピー・デコーダ21は、エントロピー・エンコーダ14への入力と同様なデータのブロックを出力する。コード化側で行なわれたデインターリービング11のために、このデータのブロックは、デインターリーバ11によって生成されたサブセットに対応するブロックにサブ分類される。エントロピー・デコーダ21は、インバース・クゥアントX22へこのデータのブロックを出力する。
以下では、インバース・クゥアントX22を詳細に説明するが、行なわれるコード化のプロセスに応じて三つの異なるプロセスが示されている。インバース・クゥアントX22は、その出力を逆トランスフォーム23へ送る。インバース・クゥアントX22の出力は、係数のブロックであり、それらは、デインターリービング・プロセス11によって生成されるサブセットにもとづいてサブ分類される。
逆トランスフォーム23は、次に、係数の各サブブロックに逆トランスフォーム操作を行ない、それを画素サブセットのサブブロックに変換する。これらのサブブロックは、リインターリーバ24は、次に、画素が現われた元の順序を復元する。
図3は、LDTコード化の基本エンコーダ30のブロック線図を示す。図1と比較して主な相違点は、デインターリービングに先立って、入力VOPまたは画像が局部領域に分割されることである。これらの領域は、正方形(ブロック)とすることもあるいは任意の形状とすることもできる。このようなセグメンテーションによって、トランスフォームの大きさおよびクゥアントXに関係するコード化の詳細が変わる可能性がある。
画素形式の映像は、局部領域セグメンタ31へ送られる。セグメンタ31は、分割された映像信号をデインターリーバ32へ出力する。この場合、局部領域セグメンタ31は、隣接する画素のサブセットを生成する。次に、デインターリービング・ステップ32で、これらのサブセットがさらに仕切られ、その結果得られる仕切られたサブセットは、各々が非隣接画素を含んでいる。
残りのプロセスは、図1と同じである。デインターリーバ32は、その出力をトランスフォーマ33へ送り、トランスフォーマ33は、その出力をクゥアントX34へ送る。クゥアントX34は、その出力をエントロピー・エンコーダ35へ送り、エントロピー・エンコーダ35は、コード化されたビットストリームを出力する。
図4は、図3に示すエンコーダ30に対応するデコーダ40を示す。図2に示すGDTデコーダとの主な相違点は、復号プロセスの終わりに局部領域アセンブラ45(例、ブロック・アンフォーマッタ)が付加されていることである。局部領域アセンブラ45は、局部領域セグメンタ31の逆操作を行なう。LDTデコーダ40は、エントロピー・デコーダ41、逆量子化42、逆トランスフォーム43、リインターリーバ44、および局部領域アセンブラ45を含む。
図4に示すプロセスは、その各ステップが図2と異なって仕切られたサブセット上で行なわれる以外、図2に示すプロセスと同じである。例えば、符号化されたビットは、エントロピー・デコーダ41内へ送られる。これらのビットは、符号化のプロセス30で生成された局部領域によって順序づけされる。すなわち、各ステップは、各局部領域グループ上で個別に行なわれる。次に、デコーダ41は、ビットのブロックのグループをクゥアントX42へ出力し、クゥアントX42は、逆トランスフォームプロセス43のために必要な係数のブロックのグループを生成する。逆トランスフォームプロセス43は、次に、画素のグループをリインターリーバ44へ出力し、リインターリーバ44は、各グループ内の画素をリインターリーブする。したがって、リインターリーバ44の出力は、局部領域セグメンタによって生成された局部領域である。この場合のデコーデング・プロセス40は、各局部領域で個別に行なわれることがわかろう。このデコーデング・プロセス40の終わりで、局部領域は、局部領域アセンブラ45によってアセンブルされ、画素映像が分割された局部領域31に示されるとき、それが復元される。
以下、このプロセスの中のいくつかのステップをより詳細に説明する。これらのステップには、デインターリービングおよびクゥアントXが含まれる。
デインターリービング
デインターリービングは、入力画像(または領域)をサブ画像(またはサブ領域)に分離して、入力画像(または領域)内の隣接するサンプルを異なるサブ画像(またはサブ領域)に割り当てられるようにするプロセスである。したがって、その結果得られるサブ領域またはサブ画像は、元の画像では隣接していないサンプルを含んでいる。
図5は、水平および垂直の両方向に2の係数で領域をデインターリービングする簡単な例を示す。画素(o、x、+、−)で構成される元の画像51は、4つのサブ画像52−55にデインターリーブされる。第1横列(o、x、o、x、o、x)の一つおきの素子が、サブ画像の第1横列52(o、o、o)とサブ画像の第2横列53(x、x、x)に割り当てられる。残る奇数横列の場合も同じである。偶数横列は、それぞれ第3および4のサブ画像(+、+、+)および(−、−、−)に割り当てられ、やはり分割される。基本的に、各画素(Pij)は、サブ画像k,m に割り当てられる。ただし、k=mod(i/n)およびm=mod(j/n)で、そのサブ画像のpr,s となる。ただし、r=(i−k)/nおよびs=(j−m)/nである。
例えば、図5でn=2とすると、素子56(すなわち、p23)がサブ画像01(素子53)に割り当てられることがわかる。すなわち、k=mod(2/2)=0およびm=mod(3/2)=1である。サブ画像01(素子53)を調べると、素子57は、そのサブ画像の画素11としてあらわれ、r=(i−k)/n=(2−0)/2=1およびs=(j−m)/n=(3−1)/2=1であることがわかる。
この例では、GDTコード化で、QCIF入力解像度(176×144)ではデインターリービング係数が8:1に固定されている。この解像度に関して、図6は、サブ画像の8×8のアレー、63、を示している。水平および垂直方向での8:1のデインターリービングをルミナンス信号に適応する結果、各サブ画像62は、大きさが22×18である。また、各クロミナンス成分は、4:1の係数でデインターリーブされ、その結果、各々の大きさが22×18のサブ画像の4×4のアレーが得られる。
他方、LDTコード化では、デインターリービング係数は、QCIF入力解像度では4:1に固定される。図7は、水平および垂直方向での4:1のデインターリービングをルミナンス信号の32×32領域に適応した結果得られる、各々の大きさが8×8のサブ画像72の4×4のアレー73を示す。この場合には、各クロミナンス成分は、2:1の係数でデインターリーブされ、その結果、各々の大きさが8×8のサブ領域の2×2のアレーが得られる。
DCT
デインターリーブされたサブ画像あるいはサブ領域には二次元DCTが適用される。QCIF解像度でのGDTコード化では、DCTの大きさは、ルミナンス成分およびクロミナンス成分ともに22×18に選ばれる。QCIF解像度でのLDTコード化では、LDTの大きさは、ルミナンス成分およびクロミナンス成分ともに8×8に選ばれる。
クゥアントXの選択
通常のスカラー量子化は、トランスフォームコード化がデインターリーブされたデータ上で行なわれる事実を考慮して修正する必要がある。量子化の後でも、実験の係数予測は、デインターリーブされた隣接のサブ画像(サブ領域)の係数の間の相関が高いため、コード化効率を高めるためにより効果的である。他のアプローチとしては、同じスペクトル周波数の係数のベクトルを形成してこの相関を利用し、それらのベクトル(ブロック)上でDCTコード化を行なうものがある。最後に、さらに他のアプローチとして、ベクトルの量子化すなわち格子ベクトル量子化(LVQ)と呼ばれる特殊なバリエーションを使用するものがある。これは、MPEG−4で現在検討されている。これらの各種のアプローチは、ここでは、クゥアントXと呼ぶが、性能と複雑さの関係でそれぞれに異なる長所と短所があり、用途に応じて選ぶことができる。
クゥアントXメソッド1: 量子化およびDCT係数予測
図8を参照してこの方法を説明する。クゥアントX80への信号入力はクゥアンタイザ81によって受け取られる。クゥアンタイザ81の出力は分割される。一つの通路は、DC&AC係数予測器82へ通じ、他の通路は、減算器83の一つの入力へ通じている。DC&AC係数予測器82の出力は、減算器83の他の入力に接続されている。DC&AC係数予測器82の出力がクゥアンタイザ81の出力から減算され、例えばジグザグ・スキャナーなどのスキャナー84へ送られる。
GDTコード化では、大きさが22×18のDCT係数サブ画像が通常のスカラー量子化で量子化され、次に前に量子化された係数サブ画像にもとづいて係数サブ画像が予測され、係数差のサブ画像が形成される。LDTコード化では、大きさが8×8のDCT係数サブ画像上でほぼ同様な操作が行なわれる。差係数が走査され(例、ジグザグ走査され)て事象を形成(ラン、レベル)する。
図9は、図8に示したクゥアントXの逆操作を示す。逆クゥアントX90への信号入力は逆スキャナー91によって受け取られる。逆スキャナー91の出力は、加算器92の一つの入力へ送られる。加算器92の第二の入力は、DC&AC係数予測器93の出力に接続されている。DC&AC係数予測器93は、加算器92の出力からその入力を受け取る。加算器92の出力は、逆クゥアンタイザ94へ送られ、のぞむ信号が出力される。
図10は、量子化されたDC係数予測のための仕組みを示す。GDTコード化では、左端のサブ領域(サブ画像)のDC予測が128に選択され、LDTコード化では、1ビットのオーバーヘッドを用いて、水平および垂直方向に隣接するサブ領域(サブ画像)のDC値の間の選択が行なわれる。第1横列の残るサブ領域に関しては、第1横列の前のサブ領域(サブ画像)がDC予測に使用される。第2横列の最初のサブ領域(サブ画像)に関しては、上のサブ領域(サブ画像)からDC予測がとられる。この横列の他のすべてのサブ領域(サブ画像)には、オーバーヘッドを用いずに水平および垂直方向に隣接するサブ領域(サブ画像)のDC値を選択してグラハムの予測器を適応させて使用する。その後の横列に関しては、第2横列の予測のプロセスが繰り返して用いられる。
AC係数予測がどのように行なわれるかを説明する。図11は、用いられるAC係数予測構造の例を示す。8×8サブ領域のLDTコード化の場合には、サブ領域に関して2横列と2行のAC係数予測を用いることができる。LDTコード化でサブ領域の大きさがそれより大きい場合あるいはGDTコード化で画像がそれより大きい場合には、より多くのAC係数を予測することができる。予測される係数の数および構造は異なる場合があるが、予測の基本原理は同じである。
領域(画像)の左端のサブ領域(サブ画像)に関しては、AC係数予測は0にリセットされる。サブ領域の第1横列のその後のサブ領域(サブ画像)に関しては、L−字形の強調した区域(DC係数のない)がサブ領域(サブ画像)から予測される。サブ領域の第2横列の最初のサブ領域に関しては、すぐ上のサブ領域から同じL−字形の区域が予測される。第2横列のその後のサブ領域は、前のサブ領域から係数の最初の2行と上のサブ領域から最初の2横列を用いて予測される。1係数(AC11)の重複が一つあるが、これは、この係数の二つの予測の選択肢を平均して単一の予測係数を生成することで解消される。その後の横列に関しては、第2横列の予測のプロセスが繰り返して用いられる。
さらに、(オーバーヘッドを用いまたは用いずに)適応性予測プロセスを用いることもできる。
GDTコード化での22×18の大きさの差係数サブ画像およびLDTコード化での8×8の大きさのサブブロックは、ジグザグ走査されて事象を形成(ラン、レベル)する。
クゥアントXメソッド2:DCT係数ベクトルのDCTの量子化
図12は、このクゥアントXの方法に用いられる操作を示す。QCIF画像のGDTコード化では、22×18の大きさのDCT係数サブ画像が小さい量子化レベル(Qp=2または3)で予備量子化されて、そのダイナミックレンジを下げ、次に、(ルミナンスでは8×8の大きさ、クロミナンスでは4×4の大きさの)ベクトルが、すべてのサブ画像を通じて同じ周波数のすべての係数を集めて生成され、DCTされ、量子化される。32×32の大きさの領域のLDTコード化では、ほぼ同様な操作が行なわれて(ルミナンスでは4×4の大きさ、クロミナンスでは2×2の大きさの)係数ベクトルが得られ、これらのベクトルがDCTされ、量子化される。GDTコード化では、ルミナンスでは8×8の大きさ、クロミナンスでは4×4の大きさの量子化されたDCT係数ベクトルがジグザグ走査されて事象を形成(ラン、レベル)する。
図12を参照して、クゥアントX120は、プレクゥアンタイザ121、ベクトル・フォーマッタ122、トランスフォーム123、クゥアンタイザ124、およびスキャナー125を含む。プレクゥアンタイザ121は、クゥアントX120への信号入力を受け、その信号をベクトル・フォーマッタ122へ出力する。ベクトル・フォーマッタは、その出力をトランスフォーム123へ送る。トランスフォーム123は、その出力をクゥアンタイザ124へ送り、クゥアンタイザ124は、その出力をスキャナー125へ送る。スキャナーは、その信号をクゥアントX120の出力として出力する。
図13は、図12に示したクゥアントX120の逆走査130を示す。逆クゥアントX130の入力は、逆走査131へ送られ、逆走査131は、その出力を逆クゥアンタイザ132へ送り、逆クゥアンタイザ132は、その出力を逆トランスフォーム133へ送る。ベクトル・アンフォーマッタ134は、逆トランスフォーム133から出力を受け取り、その信号を逆プレクゥアンタイザ135へ出力し、逆プレクゥアンタイザ135の出力は、逆クゥアントX130の出力を表す。
クゥアントXメソッド3:DCT係数ベクトルの格子ベクトル量子化
図14は、このクゥアントXの方法で用いられる操作を示す。クゥアントX140へに信号入力は、ベクトル・フォーマッタ141によって受け取られ、その出力は、縮尺器142へ送られ、縮尺器142は、その出力をベクトル・クゥアンタイザ143へ送る。ベクトル・クゥアンタイザ143は、その出力をベクトル量子化指数順序づけ器144へ送り、順序づけ器144の出力がクゥアントX140の出力となる。
22×18の大きさのDCT係数サブ画像を用いるQCIF画像のGDTコード化では、すべてのサブ画像を通じて同じ周波数のすべての係数を集めて(ルミナンスでは8×8の大きさ、クロミナンスでは4×4の大きさの)ベクトルが生成される。これらのベクトルは、LVQによって量子化される。32×32の領域の大きさのLDTコード化では、これとほぼ同じ操作が行なわれて(ルミナンスでは4×4の大きさ、クロミナンスでは2×2の大きさの)係数ベクトルが得られる。これらのベクトルも、やはりLVQによって量子化される。VQは、管理可能な大きさの(あるいはLVQでは、管理可能な複雑さの)コードブックを必要とする場合が多いので、これらのベクトルもやはりLVQによって量子化される。ベクトルの縮尺が必要な場合があり、その場合には縮尺器によって行なわれるが、これは、係数のベクトルをサブベクトルに分割するだけの簡単な操作である場合と、より複雑な操作である場合がある。LVQのプロセスは、文献に説明されており、ここでは説明しない。ただし、簡単に述べると、最初に16の大きさのLVQが試行され、その結果閾値より大きいエラーが生成されると、4の大きさのLVQが試行される。また、LVQの後、効率を高めるために全画像または領域のLVQ指数が順序づけすることもできる。このプロセスは、VQ指数順序づけ器の中で行なわれる。
図15は、図14に示すクゥアントX140の逆操作を示す図である。逆クゥアントX150の入力は、ベクトル量子化指数再順序づけ器151へ送られ、逆順序づけ器151はその出力を逆ベクトル・クゥアンタイザ152へ送り、逆ベクトル・クゥアンタイザ152は、その出力を復尺器153へ送る。ベクトル・アンフォーマッタ154は、復尺器153からその出力を受け、自らの信号を逆クゥアントX150の出力として出力する。クゥアントX140の場合と同様に、逆クゥアントX150では、まず16のLVQが試行される。その結果閾値より高いエラーが生成されれば、4の大きさのLVQが試行される。LVQの仕様は、MPEG−4のトライアルの実験T.5のものと同じである。
エントロピー・コーディング
次に、係数(ラン、レベル)事象のためのVLコード化およびデコーディングについて説明する。これらの事象は、より高い効率を得るために統計的変動を用いてコード化される。
GDTコード化において、拡張クゥアントXメソッド1が用いられる場合には、最大396のランが可能であり、少なくとも±255のレベルがサポートされる必要がある。ルミナンスのラン/レベル事象のコード化に関しては、ピュリ、シュミット、およびハスケルのアメリカ合衆国特許出願第08/813,218号「映像コード化およびビデオのイントラ・コード化のための適応型および予測型コード化」のイントラVLCテーブルを使用する。アメリカ合衆国特許出願第08/813,218号は、参考資料として添付し、ここにその全体を説明したものとする。ただし、このテーブルは、64の最大ランと±128のレベル(MPEG−4VMと同じ)だけをサポートするものなので、レベルに関しては余分な1ビットをまたランに関しては余分な3ビットを付加してこの領域の外側まで拡張し、25ビットまで使用するようにする。クロミナンスのラン/レベル事象のコード化に関して、使用されるVCLテーブルは、レベルに関しては余分な1ビットをまたランに関しては余分な3ビットを付加して現在サポートされている領域の外側まで出るようにし、26ビットまで使用するようにして、396の最大ランと±255のレベルをサポートするように拡張したVMで使用されるものと同じである。LDTコード化の場合には、サブ領域の大きさが8×8であるので、ルミナンスには参考資料として添付して上に述べた既特許出願のVLCテーブルを用い、クロミナンスにはVMのVLCテーブルを用いる。これらのテーブルは、ともに拡張を必要としない。
GDTコード化で拡張量子化クゥアントXメソッド2が用いられる場合には、ベクトルの大きさが8×8であるので、ルミナンスには参考資料として添付した特許出願のVLCテーブルを用い、クロミナンスにはVMのVLCテーブルを用いる。これらのテーブルは、ともに拡張を必要としない。LDTコード化の場合には、最大ランがルミナンスでは15でクロミナンスでは3であるので、この場合には、添付した特許出願のサブセットである新しいテーブルが用いられる。
拡張量子化クゥアントXメソッド3が用いられる場合には、使用されるVLCテーブルは、MPEG−4のコア実験T5で利用されまた一般に利用可能なテーブルに基づくものとなる。
適応型デインターリーブドトランスフォームコード化
適応型グローバルデインターリーブドトランスフォーム(AGDT)エンコーダ160のブロック線図を示す図16のコード化構造を用いれば、DTコード化をさらに改善することが可能である。図1との主な相違点は、デインターリーバに先立って全画像またはVOPベースでクゥアドツリー・セグメンタを用いたクゥアドツリー・セグメンテーションが採用され、それが、固定型セグメンテーションではなく適応型セグメンテーションであることである。したがって、デインターリービングは、グローバルクゥアドツリー・セグメンタによってデインターリービングに値すると識別された部分にのみデインターリービングが行なわれ、その他の部分は、デインターリービングなしにコード化される。他のブロックの操作は、固定型GDTに関して説明したと同様である。
図16を参照して、映像は、グローバルクゥアドツリー・セグメンタ161へ送られ、その出力は、デインターリーバ162へ送られ、後者の出力は、トランスフォーム163へ送られる。クゥアントX164は、トランスフォーム163から出力を受け、出力をエントロピー・エンコーダ165へ送る。エンコーダ165はコード化されたビットストリームを出力する。
図17は、図16に示すAGDTエンコーダ160に対応するAGDTデコーダ170のブロック線図を示す。コード化されたビットストリームは、エントロピー・デコーダ171へ送られ、その出力は、逆クゥアントX172へ送られ、後者の出力は、逆トランスフォーム173へ送られる。リインターリーバ174は、逆トランスフォーム173から出力を受け取り、その出力をグローバルクゥアドツリー・アセンブラ175へ送り、アセンブラ175は、復元された映像を出力する。
図18は、適応型局部デインターリーブドトランスフォーム(ALDT)エンコーダ180のブロック線図を示す。図16との主な相違点は、クゥアドツリーセグメンテーションが全画像あるいはVOPではなく局部的に(領域に)適用されることである。次に、局部クゥアドツリー・セグメンタによってデインターリービングに値すると識別された領域にデインターリービングが行なわれる。他のブロックは、上に述べたものと同様である。
映像信号は、局部クゥアドツリー・セグメンタ181へ入力され、その出力は、デインターリーバ182へ送られ、後者の出力は、トランスフォーム183へ送られる。クゥアントX184は、トランスフォーム183から出力を受け取り、その出力をエントロピー・エンコーダ185へ送る。エンコーダ185は、コード化されたビットストリームを出力する。
図19は、図18のエンコーダに対応するALDTデコーダ190を示す。コード化されたビットは、エントロピー・デコーダ191へ送られ、その出力は、逆クゥアントX192へ送られる、後者の出力は、逆トランスフォーム193へ送られる。逆トランスフォーム193は、その出力をリインターリーバ194へ送る。局部クゥアドツリー・アセンブラ195は、リインターリーバ194の出力を受け取り、復元された映像を出力する。
クゥアドツリー・セグメンタ
図16および図18に示すように、デインターリービングの量をコード化されている画像の空間的内容に適応させるために、デインターリービングに先立ってクゥアドツリー・セグメンテーションが用いられる。
図20は、用いられるクゥアドツリー・セグメンテーションの例を示す。GDおよびLDTの双方で、この種のセグメンテーションが用いられる。その唯一の違いは、用いられるレベルの数である。GDTでは、 レベルのセグメンテーションが用いられ、LDTでは、レベルのセグメンテーションが用いられる。
図20に示すように、画像ブロック200がサブブロック202−205に分割される。次に、サブブロック203が、さらにセクション206−209に仕切られる。残りのブロックは分割されず、このプロセスは必要なブロックのみを分割することを示している。
MPEG−4に関するシンタックス(Syntax)およびシマンティックス(SemanTics)
本発明を用いてコード化されたビットストリームを生成するために必要なシンタックスおよびそのシマンティックスについて説明する。以下で用いる各種のクラスは、MPEG−4VM3.2の現行のシンタックスに対応する。
ビデオセッション・クラス
このクラスにはいかなる変更も行なう必要がない。
ビデオオブジェクト・クラス
このクラスにはいかなる変更も行なう必要がない。
ビデオオブジェクト・レーヤー・クラス
このクラスにはいかなる変更も行なう必要がない。
ビデオオブジェクト・プレーン・クラス
このクラスには、二つの新しいシンタックス要素が導入される。


region size(領域 大きさ)
deinterleave ratio(デインターリーブ 比)


これらのシンタックス要素は、次のように定義される。
region size(領域 大きさ)
これは、コード化に先立ってデインターリービングが行なわれる領域の大きさを指定する3−ビットのコードである。各コードごとの領域の大きさを下の表1に示す。
(表1)
コード 意味
000 16×16
001 32×32
010 64×64
011 128×128
100 保留
101 保留
110 保留
111 全画像

deinterleave ratio(デインターリーブ 比)
これは、コード化に先立って識別された領域で行なわれるデインターリービングの量を指定する3−ビットのコードである。水平および垂直ともに同じデインターリービング比が用いられる。各コードごとのデインターリービングの量を下の表2に示す。
(表2)
コード 意味
000 1:1
001 2:1
010 4:1
011 8:1
100 16:1
101 保留
110 保留
111 保留

領域クラス
各領域に関するデータは、領域ヘッダの後にサブ領域データが付いたもので構成される。
(表3)
Rtype Rquant Subregion data

Rquant
Rquantは、1から31間での間の非線形値をとる3−ビットのクゥアンタイザである。表4にその意味を示す。
(表4)
コード Qp
000 2
001 43
010 7
011 10
100 14
101 18
110 23
111 28

サブ領域・クラス
サブ領域データの定義は、用いられるクゥアントXメソッドに依存し、以下のように指定される。
クゥアントXメソッド1:
(表5)
Cod subreg Tcoefs subreg
クゥアントXメソッド1に関するサブ領域・クラスの構造

Cod subreg
Cod subregは、そのサブ領域に関するなんらかのコード化されたデータ(ゼロでない値)が存在するか否かを識別する1−ビットのフラッグである。
Tcoefs subreg
Tcoefs subregは、ストリームの微分量子化係数である。
クゥアントXメソッド2:
(表6)
Cod vector Tcoefs vector
クゥアントXメソッド2に関するサブ領域・クラスの構造
Cod vector
Cod vectorは、そのサブ領域に関するなんらかのコード化されたデータが存在するか否かを識別する1−ビットのフラッグである。
Tcoefs vector
Tcoefs vectorは、ベクトルの二度量子化された係数をさす。
クゥアントXメソッド3:
本発明に基づくグローバルデインターリーブドトランスフォーム(GDT)コード化のための基本エンコーダのブロック線図である。 本発明に基づく図1に示すエンコーダのための対応するデコーダを示す図である。 本発明に基づく局部デインターリーブドトランスフォーム(LDT)コード化の基本エンコーダのブロック線図である。 本発明に基づく図3に示すエンコーダのための対応するデコーダを示す図である。 サブ領域を生成するために一つの領域を水平および垂直の両方向に2の係数でデインターリーブする簡単な例を示す図である。 サブ画像の8×8のアレーを示す図である。その各々は、寸法が22×18で、(QCIF)解像度に関してGDTコード化のルミナンス信号へ水平および垂直方向に8:1のデインターリービングを適用することで得られる。 サブ画像の4×4のアレーを示す図である。その各々は、寸法が8×8で、QCIF解像度に関してLDTコード化のルミナンス信号の32×32の領域へへ水平および垂直方向に4:1のデインターリービングを適用することで得られる。 本発明に基づく拡張量子化の一方法、クゥアントXメソッド1を示す図である。 本発明に基づく図8に示す拡張量子化法、クゥアントXメソッド1の逆操作を示す図である。 本発明で用いられる量子化されたDC係数予測の例を示す図である。 本発明で用いられるAC係数予測の例を示す図である。 本発明に基づく拡張量子化の他の方法、クゥアントXメソッド2を示す図である。 本発明に基づく図12に示す拡張量子化法、クゥアントXメソッド2の逆操作を示す図である。 本発明に基づく拡張量子化の他の方法、クゥアントXメソッド3を示す図である。 本発明に基づく図13に示す拡張量子化法、クゥアントXメソッド3の逆操作を示す図である。 本発明で用いられる適応型グローバルデインターリーブドトランスフォーム(AGDT)エンコーダ150のブロック線図である。 図16のAGDTに対応する本発明で用いられるAGDTデコーダのブロック線図である。 本発明で用いられる適応型グローバルデインターリーブドトランスフォーム(AGDT)エンコーダのブロック線図である。 図18のAGDTに対応する本発明で用いられるAGDTデコーダのブロック線図である。 本発明で用いられるクゥアドツリー・セグメンテーションの例を示す図である。
符号の説明
11 デインターリーバ、12 トランスフォーム(DCT、・・・)、13 クゥアントX、14 エントロピー・エンコーダ(VLE、AE、・・・)、21 エントロピー・デコーダ(VLD、AD、・・・)、22 逆クゥアントX、23 逆トランスフォーム(DCT、・・・)、24 リインターリーバ、31 局部領域セグメンタ(ブロック、フォーマッタ、・・・)、45 局部領域アセンブラ(ブロック、アンフォーマッタ、・・・)、81 クゥアント、82 DC&AC係数予測器、84 走査(ジグザグ)、91 逆走査(ジグザグ)、94 逆クゥアント、144 VQ指数順序づけ器(走査、ツリー、・・・)、151 VQ指数再順序づけ器(走査、ツリー、・・・)、152 逆ベクトル・クゥアント(VQ、LVQ、・・・)、153 復尺器(組み合せ器、・・・)、154 ベクトル・アンフォーマッタ、161 グローバルクゥアドツリー・セグメンタ、175 グローバルクゥアドツリー・アセンブラ。

Claims (18)

  1. a)映像をデインターリーブして複数の映像サブセットを形成するステップであって、前記複数の映像サブセットにおいて、第1の映像サブセットは対象映像サブセットに対し水平方向左側に隣接し、第2の映像サブセットは前記第1の映像サブセットに対し垂直方向上部に隣接し、第3の映像サブセットは前記対象映像サブセットに対し垂直方向上部に隣接し、
    b)前記複数の映像サブセットを64のトランスフォーム係数を有する複数のブロックにトランスフォームするステップと、
    c)前記64のトランスフォーム係数を有する複数のブロックからビットストリームを生成するステップであって、
    (i)前記64のトランスフォーム係数を有する複数のブロックを量子化して複数の量子化値を生成し、
    (ii)前記第1の映像サブセットと前記第2の映像サブセットとのDC値間の第1の勾配を決定し、前記第2の映像サブセットと前記第3の映像サブセットとのDC値間の第2の勾配を決定し、その後、前記第1の勾配と前記第2の勾配以外のいずれの勾配も参照せずに前記第1の勾配と前記第2の勾配とを比較して、前記対象映像サブセットのDC予測値を生成し、
    (iii)前記DC予測値とDC量子化値との差を決定して差分値を生成し、
    (iv)前記差分値の符号化を行う、
    ことによって、ビットストリームを生成するステップと、
    を含む方法。
  2. 請求項1に記載の方法において、
    前記ビットストリームを生成するステップは、さらに、
    複数の差分値を走査して複数のサンプルを生成するステップと、
    前記複数のサンプルの符号化を行って、ビットストリームを生成するステップと、
    を含む方法。
  3. 請求項1に記載の方法において、
    ステップc)(ii)は、さらに、前記第3の映像サブセットの第1横列の値を用いて前記対象映像サブセットの第1横列の値を予測し、又は前記第1の映像サブセットの第1縦列の値を用いて前記対象映像サブセットの第1縦列の値を予測して、複数のAC予測値を生成するステップを含み、
    ステップc)(iii)は、さらに、前記複数のAC予測値と複数の量子化値との差を決定するステップを含む、
    方法。
  4. 請求項1に記載の方法において、
    前記ステップa)は、
    (i)前記映像を複数のセグメントに分割するステップと、
    (ii)前記複数のセグメントのうちデインターリーブのための少なくとも1つのセグメントを特定し、特定されたセグメントを生成するステップと、
    (iii)前記特定されたセグメントをデインターリーブするステップと、
    を含む、方法。
  5. 請求項1に記載の方法であって、さらに、
    前記映像のデインターリーブに先立ち、前記映像を複数の局部領域に分割するステップを含み、前記ステップa)は、前記複数の局部領域をデインターリーブして複数のデインターリーブ領域を生成するステップを含み、
    前記ステップb)は、前記複数のデインターリーブ領域を複数のトランスフォーム係数にトランスフォームするステップを含む、
    方法。
  6. ビットストリームを処理して映像を生成する方法であって、
    a)前記ビットストリームの復号化を行い、複数の差分値を生成するステップと、
    b)前記複数の差分値を64のトランスフォーム係数に変換するステップであって、前記複数の差分値のうち少なくとも一つの差分値について、
    (i)第1の映像サブセットと第2の映像サブセットとのDC値間の第1の勾配を決定し、前記第1の映像サブセットは対象映像サブセットに対し水平方向左側に隣接し、前記第2の映像サブセットは前記第1の映像サブセットに対し垂直方向上部に隣接し、前記第2の映像サブセットと第3の映像サブセットとのDC値間の第2の勾配を決定し、前記第3の映像サブセットは前記対象映像サブセットに対し垂直方向上部に隣接し、前記第1の勾配と前記第2の勾配以外のいずれの勾配も参照せずに前記第1の勾配と前記第2の勾配とを比較し、前記対象映像サブセットのDC予測値を生成し、
    (ii)DC差分値を前記DC予測値に加算して量子化値を生成し、
    (iii)前記量子化値の逆量子化を行って、前記64のトランスフォーム係数の一つを生成する、
    ことにより、前記複数の差分値を64のトランスフォーム係数に変換するステップと、
    c)前記64のトランスフォーム係数に対して逆トランスフォームを行い、複数の映像サブセットを生成するステップと、
    d)前記複数の映像サブセットをリインターリーブして前記映像を生成するステップと、
    を含む方法。
  7. 請求項6に記載の方法であって、さらに、
    前記ビットストリームから生成された複数のサンプルを逆走査するステップを含み、
    前記復号化は、さらに、前記複数のサンプルを処理して、前記複数の差分値を生成するステップを含む、方法。
  8. 請求項6に記載の方法において、
    ステップb)(i)は、さらに、前記第3の映像サブセットの第1横列の値を用いて前記対象映像サブセットの第1横列の値を予測し、又は前記第1の映像サブセットの第1縦列の値を用いて前記対象映像サブセットの第1縦列の値を予測して、前記対象映像サブセットの複数のAC予測値を生成するステップを含み、
    ステップb)(ii)は、さらに、前記複数の差分値を前記複数のAC予測値に加算するステップを含む、
    方法。
  9. 請求項6に記載の方法において、
    ステップd)のリインターリーブするステップは、さらに、
    (i)前記複数の映像サブセットをリインターリーブして複数のセグメントを生成するステップと、
    (ii)前記複数のセグメントを組み立てて前記映像を形成するステップと、
    を含む、方法。
  10. 請求項6に記載の方法において、
    ステップc)は、前記64のトランスフォーム係数の逆トランスフォームを行い、複数のデインターリーブ領域を生成するステップを含み、
    ステップd)は、前記複数のデインターリーブ領域をリインターリーブして複数の局部領域を生成し、前記局部領域を組み立てて前記映像を生成するステップを含む、
    方法。
  11. 映像をコード化する装置であって、
    a)映像を受け取って前記映像をデインターリーブして複数の映像サブセットを形成するデインターリーバ(11)であって、前記複数の映像サブセットにおいて、第1の映像サブセットは対象映像サブセットに対し水平方向左側に隣接し、第2の映像サブセットは前記第1の映像サブセットに対し垂直方向上部に隣接し、第3の映像サブセットは前記対象映像サブセットに対し垂直方向上部に隣接する、デインターリーバと、
    b)前記デインターリーバに連結され、前記複数の映像サブセットを64のトランスフォーム係数を有する複数のブロックにトランスフォームするトランスフォーム器(12)と、
    c)前記トランスフォーム器に連結され、前記64のトランスフォーム係数を有する複数のブロックを複数のサンプルに変換するコンバータ(13)と、
    d)前記コンバータに連結され、前記複数のサンプルの符号化を行い、符号化されたビットストリームを生成する、エンコーダ(14)と、
    を有し、
    前記コンバータ(13)は、
    (1)前記トランスフォーム器に連結され、前記64のトランスフォーム係数を有する複数のブロックを量子化して複数の量子化値を生成するクゥアンタイザ(81)と、
    (2)前記クゥアンタイザに連結され、前記第1の映像サブセットと前記第2の映像サブセットとのDC値間の第1の勾配を決定し、前記第2の映像サブセットと前記第3の映像サブセットとのDC値間の第2の勾配を決定し、前記第1の勾配と前記第2の勾配以外のいずれの勾配も参照せずに前記第1の勾配と前記第2の勾配とを比較して、前記対象映像サブセットのDC予測値を生成する係数予測器(82)と、
    (3)前記クゥアンタイザと前記係数予測器とに連結され、前記DC予測値とDC量子化値との差を決定して、差分値を生成する比較器(83)と、
    を有する、装置。
  12. 請求項11に記載の装置において、
    前記コンバータ(13)は、さらに、
    (4)前記比較器に連結され、複数の差分値を走査して前記複数のサンプルを生成するスキャナ(84)を、有する装置。
  13. 請求項11に記載の装置において、
    前記係数予測器(82)は、前記第3の映像サブセットの第1横列の値を用いて前記対象映像サブセットの第1横列の値を予測し、又は前記第1の映像サブセットの第1縦列の値を用いて前記対象映像サブセットの第1縦列の値を予測して、複数のAC予測値を生成し、
    前記比較器(83)は、さらに、前記複数のAC予測値と前記複数の量子化値との差を決定する、
    装置。
  14. 請求項11に記載の装置であって、さらに、
    前記映像を受け取って、前記映像を複数の局部領域に分割するセグメンタを含み、
    前記デインターリーバは、前記複数の局部領域をデインターリーブして複数の局部領域サブセットを生成し、
    前記トランスフォーム器は、前記複数の局部領域サブセットを前記複数のトランスフォーム係数にトランスフォームする、
    装置。
  15. ビットストリームを処理して映像を生成する装置であって、
    a)前記ビットストリームを受け取って前記ビットストリームの復号化を行い複数の差分値を生成するデコーダ(21)と、
    b)前記デコーダに連結され、前記複数の差分値を64のトランスフォーム係数を有するブロックに変換するコンバータ(22)と、
    c)前記コンバータに連結され、前記64のトランスフォーム係数を有するブロックに逆トランスフォームを行い複数の映像サブセット生成する逆トランスフォーム器(23)と、
    d)前記逆トランスフォーム器に連結され、前記複数の映像サブセットのリインターリーブを行い前記映像を生成するリインターリーバ(24)と、
    を含み、
    前記コンバータは、
    (1)係数予測器(93)であって、第1の映像サブセットと第2の映像サブセットとのDC値間の第1の勾配を決定し、ここで、前記第1の映像サブセットは対象映像サブセットに対し水平方向左側に隣接し、前記第2の映像サブセットは前記第1の映像サブセットに対し垂直方向上部に隣接し、前記第2の映像サブセットと第3の映像サブセットとのDC値間の第2の勾配を決定し、前記第3の映像サブセットは前記対象映像サブセットに対し垂直方向上部に隣接し、前記第1の勾配と前記第2の勾配以外のいずれの勾配も参照せずに前記第1の勾配と前記第2の勾配とを比較して、前記対象映像サブセットのDC予測値を生成する、係数予測器(93)と、
    (2)前記DC予測値をDC差分値に加算して量子化値を生成する加算器(92)と、
    (3)前記加算器に連結され、前記量子化値を逆量子化してトランスフォーム係数を生成する逆クゥアンタイザと、
    を有する、装置。
  16. 請求項15に記載のビットストリームを処理して映像を生成する装置において、
    前記係数予測器(93)は、さらに、前記第3の映像サブセットの第1横列の値を用いて前記対象映像サブセットの第1横列の値を予測し、又は前記第1の映像サブセットの第1縦列の値を用いて前記対象映像サブセットの第1縦列の値を予測して、複数のAC予測値を生成し、
    前記加算器(92)は、前記複数の差分値を前記複数のAC予測値に加算する、
    装置。
  17. 請求項15に記載のビットストリームを処理して映像を生成する装置において、
    前記デコーダ(21)は、複数のサンプルを生成し、
    前記装置は、さらに、前記デコーダ(21)に連結され、前記複数のサンプルを逆走査して前記複数の差分値を生成する逆スキャナ(91)を有する、
    装置。
  18. 請求項15に記載のビットストリームを処理して映像を生成する装置において、
    前記逆トランスフォーム器は、さらに、前記複数のトランスフォーム係数の逆トランスフォームを行い、複数の局部領域サブセットを生成し、
    前前記リインターリーバは、さらに、前記複数の局部領域サブセットをリインターリーブして複数の局部領域を生成し、
    前記装置は、さらに、
    前記リインターリーバに連結され、前記複数の局部領域を組み立てて前記映像を生成するアセンブラ、を有する、装置。
JP2007253879A 1996-09-25 2007-09-28 ビデオの映像コード化およびイントラ・コード化のための固定型または適応型デインターリープドトランスフォームコード化方法及び装置 Expired - Lifetime JP5107649B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US2743696P 1996-09-25 1996-09-25
US60/027,436 1996-09-25
US08/813,218 1997-03-07
US08/813,218 US6134269A (en) 1996-09-25 1997-03-07 Fixed or adaptive deinterleaved transform coding for image coding and intra coding of video

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP25983597A Division JP4248038B2 (ja) 1996-09-25 1997-09-25 ビデオの映像コード化およびイントラ・コード化のための固定型または適応型デインターリーブドトランスフォームコード化方法及び装置

Publications (2)

Publication Number Publication Date
JP2008067396A JP2008067396A (ja) 2008-03-21
JP5107649B2 true JP5107649B2 (ja) 2012-12-26

Family

ID=26702475

Family Applications (2)

Application Number Title Priority Date Filing Date
JP25983597A Expired - Lifetime JP4248038B2 (ja) 1996-09-25 1997-09-25 ビデオの映像コード化およびイントラ・コード化のための固定型または適応型デインターリーブドトランスフォームコード化方法及び装置
JP2007253879A Expired - Lifetime JP5107649B2 (ja) 1996-09-25 2007-09-28 ビデオの映像コード化およびイントラ・コード化のための固定型または適応型デインターリープドトランスフォームコード化方法及び装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP25983597A Expired - Lifetime JP4248038B2 (ja) 1996-09-25 1997-09-25 ビデオの映像コード化およびイントラ・コード化のための固定型または適応型デインターリーブドトランスフォームコード化方法及び装置

Country Status (4)

Country Link
US (1) US6134269A (ja)
EP (2) EP2775451A1 (ja)
JP (2) JP4248038B2 (ja)
CA (1) CA2214663C (ja)

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100303685B1 (ko) * 1996-09-30 2001-09-24 송문섭 영상 예측부호화 장치 및 그 방법
DE69835039T2 (de) 1997-02-14 2007-07-12 The Trustees Of Columbia University In The City Of New York Objektbasiertes audiovisuelles Endgerät und entsprechende Bitstromstruktur
JPH11112985A (ja) * 1997-09-29 1999-04-23 Sony Corp 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、および、伝送媒体
EP1025707B1 (en) * 1997-10-23 2008-07-23 Sony Electronics Inc. Apparatus and method for mapping an image to blocks to provide for robust error recovery in a lossy transmission environment
US6298085B1 (en) * 1997-10-23 2001-10-02 Sony Corporation Source encoding using shuffling of data to provide robust error recovery in a burst error-environment
US6581170B1 (en) 1997-10-23 2003-06-17 Sony Corporation Source coding to provide for robust error recovery during transmission losses
JP3205532B2 (ja) * 1997-12-04 2001-09-04 松下電器産業株式会社 画像処理方法及び画像処理装置,並びにデータ記憶媒体
US7199836B1 (en) * 1998-02-13 2007-04-03 The Trustees Of Columbia University In The City Of New York Object-based audio-visual terminal and bitstream structure
US6307560B1 (en) 1999-02-12 2001-10-23 Sony Corporation Classified adaptive spatio-temporal format conversion method and apparatus
US6192161B1 (en) 1999-02-12 2001-02-20 Sony Corporation Method and apparatus for adaptive filter tap selection according to a class
US6535148B1 (en) 1999-02-12 2003-03-18 Sony Corporation Method and apparatus for truncated decoding
US6519369B1 (en) 1999-02-12 2003-02-11 Sony Corporation Method and apparatus for filter tap expansion
US6170074B1 (en) 1999-02-12 2001-01-02 Sony Corporation Source coding to provide for robust error recovery
US6621936B1 (en) 1999-02-12 2003-09-16 Sony Corporation Method and apparatus for spatial class reduction
US6154761A (en) * 1999-02-12 2000-11-28 Sony Corporation Classified adaptive multiple processing system
US6363118B1 (en) 1999-02-12 2002-03-26 Sony Corporation Apparatus and method for the recovery of compression constants in the encoded domain
US6307979B1 (en) 1999-02-12 2001-10-23 Sony Corporation Classified adaptive error recovery method and apparatus
US6178266B1 (en) 1999-02-12 2001-01-23 Sony Corporation Method and apparatus for the recovery of compression constants in the encoded domain
US6151416A (en) * 1999-02-12 2000-11-21 Sony Corporation Method and apparatus for adaptive class tap selection according to multiple classification
US6591398B1 (en) 1999-02-12 2003-07-08 Sony Corporation Multiple processing system
US6697489B1 (en) 1999-03-30 2004-02-24 Sony Corporation Method and apparatus for securing control words
US7730300B2 (en) 1999-03-30 2010-06-01 Sony Corporation Method and apparatus for protecting the transfer of data
US6493842B1 (en) 1999-06-29 2002-12-10 Sony Corporation Time-varying randomization for data synchronization and implicit information transmission
US6389562B1 (en) 1999-06-29 2002-05-14 Sony Corporation Source code shuffling to provide for robust error recovery
US6473876B1 (en) 1999-06-29 2002-10-29 Sony Corporation Method and apparatus for encoding of bitstreams using rotation
US6549672B1 (en) 1999-06-29 2003-04-15 Sony Corporation Method and apparatus for recovery of encoded data using central value
US6522785B1 (en) 1999-09-24 2003-02-18 Sony Corporation Classified adaptive error recovery method and apparatus
US6351494B1 (en) 1999-09-24 2002-02-26 Sony Corporation Classified adaptive error recovery method and apparatus
US7039614B1 (en) 1999-11-09 2006-05-02 Sony Corporation Method for simulcrypting scrambled data to a plurality of conditional access devices
US6539517B1 (en) 1999-11-09 2003-03-25 Sony Corporation Data transformation for explicit transmission of control information
US6754371B1 (en) 1999-12-07 2004-06-22 Sony Corporation Method and apparatus for past and future motion classification
US6826232B2 (en) * 1999-12-20 2004-11-30 Koninklijke Philips Electronics N.V. Fine granular scalable video with embedded DCT coding of the enhancement layer
US6914939B1 (en) 2000-11-13 2005-07-05 International Business Machines Corporation Method and apparatus for producing pseudo-constant bits per picture video bit-streams for low-delay compression system
JP2003009102A (ja) * 2001-04-18 2003-01-10 Victor Co Of Japan Ltd オブジェクトデータの符号化方法、オブジェクトデータの伝送方法、オブジェクトデータの復号方法、オブジェクトデータ符号化装置、オブジェクトデータ生成装置、オブジェクトデータ復号装置、オブジェクトデータ符号化用プログラム、オブジェクトデータ復号用プログラム、及びオブジェクトデータ記録媒体
US7895616B2 (en) 2001-06-06 2011-02-22 Sony Corporation Reconstitution of program streams split across multiple packet identifiers
US7151831B2 (en) 2001-06-06 2006-12-19 Sony Corporation Partial encryption and PID mapping
US7747853B2 (en) 2001-06-06 2010-06-29 Sony Corporation IP delivery of secure digital content
US7823174B2 (en) 2002-01-02 2010-10-26 Sony Corporation Macro-block based content replacement by PID mapping
US7765567B2 (en) 2002-01-02 2010-07-27 Sony Corporation Content replacement by PID mapping
US8818896B2 (en) 2002-09-09 2014-08-26 Sony Corporation Selective encryption with coverage encryption
US8572408B2 (en) 2002-11-05 2013-10-29 Sony Corporation Digital rights management of a digital device
US7724907B2 (en) 2002-11-05 2010-05-25 Sony Corporation Mechanism for protecting the transfer of digital content
US8667525B2 (en) 2002-12-13 2014-03-04 Sony Corporation Targeted advertisement selection from a digital stream
US8645988B2 (en) 2002-12-13 2014-02-04 Sony Corporation Content personalization for digital content
JP3934568B2 (ja) * 2003-03-04 2007-06-20 松下電器産業株式会社 動画符号化方法および装置
JP4612787B2 (ja) * 2003-03-07 2011-01-12 キヤノン株式会社 画像データの暗号化装置の制御方法及び画像データ変換装置の制御方法、及び、それらの装置、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
US7853980B2 (en) 2003-10-31 2010-12-14 Sony Corporation Bi-directional indices for trick mode video-on-demand
US7895617B2 (en) 2004-12-15 2011-02-22 Sony Corporation Content substitution editor
US8041190B2 (en) 2004-12-15 2011-10-18 Sony Corporation System and method for the creation, synchronization and delivery of alternate content
KR101108681B1 (ko) * 2005-01-19 2012-01-25 삼성전자주식회사 동영상 코덱에서의 주파수 변환 계수 예측 방법 및 장치,이를 구비한 부호화 및 복호화 장치와 방법
JP4580880B2 (ja) * 2005-10-28 2010-11-17 日本放送協会 画像符号化装置、画像復号装置及び画像処理システム
US8185921B2 (en) 2006-02-28 2012-05-22 Sony Corporation Parental control of displayed content using closed captioning
JP4621629B2 (ja) * 2006-05-25 2011-01-26 株式会社東芝 画像復号装置
CN101266795B (zh) * 2007-03-12 2011-08-10 华为技术有限公司 一种格矢量量化编解码的实现方法及装置
EP2076041A1 (en) * 2007-12-21 2009-07-01 Deutsche Thomson OHG Method for transferring a real-time uncompressed video stream in a network of subscriber stations
US20090279601A1 (en) * 2008-05-08 2009-11-12 Telefonaktiebolaget Lm Ericsson (Publ) Method and Apparatus of Displaying Video
US9237327B2 (en) * 2008-09-23 2016-01-12 Dolby Laboratories Licensing Corporation Encoding and decoding architecture of checkerboard multiplexed image data
JP5406942B2 (ja) * 2009-01-29 2014-02-05 ドルビー ラボラトリーズ ライセンシング コーポレイション 立体画像である複数の画像をサブサンプリング及びインタリーブする方法及び装置
CN102450010A (zh) 2009-04-20 2012-05-09 杜比实验室特许公司 定向内插和数据后处理
JP5537293B2 (ja) * 2009-07-03 2014-07-02 パナソニック株式会社 画像符号化装置及び画像復号化装置
KR101487686B1 (ko) 2009-08-14 2015-01-30 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101302660B1 (ko) * 2009-09-14 2013-09-03 에스케이텔레콤 주식회사 고해상도 동영상의 부호화/복호화 방법 및 장치
US20120114034A1 (en) * 2010-11-08 2012-05-10 Mediatek Inc. Method and Apparatus of Delta Quantization Parameter Processing for High Efficiency Video Coding
US10298939B2 (en) * 2011-06-22 2019-05-21 Qualcomm Incorporated Quantization in video coding
US9894386B2 (en) * 2012-04-12 2018-02-13 Goldpeak Innovations Inc. Transform method based on block information, and apparatus using said method
CN104335584B (zh) * 2012-06-29 2019-06-18 英特尔公司 用于基于系数采样的可扩展视频编码的系统、方法和计算机程序产品
US10516898B2 (en) 2013-10-10 2019-12-24 Intel Corporation Systems, methods, and computer program products for scalable video coding based on coefficient sampling
CN107742050B (zh) * 2017-11-14 2020-09-22 中国空气动力研究与发展中心计算空气动力研究所 一种面向混合网格高精度阻力预测的熵修正方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2905756A (en) * 1956-11-30 1959-09-22 Bell Telephone Labor Inc Method and apparatus for reducing television bandwidth
JPS63197185A (ja) * 1987-02-12 1988-08-16 Toshiba Corp 直交変換符号化方式
US4958226A (en) * 1989-09-27 1990-09-18 At&T Bell Laboratories Conditional motion compensated interpolation of digital motion video
US5134476A (en) * 1990-03-30 1992-07-28 At&T Bell Laboratories Video signal encoding with bit rate control
US4999705A (en) * 1990-05-03 1991-03-12 At&T Bell Laboratories Three dimensional motion compensated video coding
US5189526A (en) * 1990-09-21 1993-02-23 Eastman Kodak Company Method and apparatus for performing image compression using discrete cosine transform
US5214507A (en) * 1991-11-08 1993-05-25 At&T Bell Laboratories Video signal quantization for an mpeg like coding environment
US5227878A (en) * 1991-11-15 1993-07-13 At&T Bell Laboratories Adaptive coding and decoding of frames and fields of video
US5253055A (en) * 1992-07-02 1993-10-12 At&T Bell Laboratories Efficient frequency scalable video encoding with coefficient selection
US5270813A (en) * 1992-07-02 1993-12-14 At&T Bell Laboratories Spatially scalable video coding facilitating the derivation of variable-resolution images
US5253056A (en) * 1992-07-02 1993-10-12 At&T Bell Laboratories Spatial/frequency hybrid video coding facilitating the derivatives of variable-resolution images
US5436985A (en) * 1993-05-10 1995-07-25 Competitive Technologies, Inc. Apparatus and method for encoding and decoding images
US5500678A (en) * 1994-03-18 1996-03-19 At&T Corp. Optimized scanning of transform coefficients in video coding
JPH07298258A (ja) * 1994-04-28 1995-11-10 Nippon Telegr & Teleph Corp <Ntt> 画像符号化復号化方法
US5883981A (en) * 1995-10-20 1999-03-16 Competitive Technologies Of Pa, Inc. Lattice vector transform coding method for image and video compression
JP3249729B2 (ja) * 1995-10-24 2002-01-21 シャープ株式会社 画像符号化装置及び画像復号装置

Also Published As

Publication number Publication date
US6134269A (en) 2000-10-17
CA2214663C (en) 2002-08-20
JPH10200895A (ja) 1998-07-31
JP4248038B2 (ja) 2009-04-02
EP0833517A3 (en) 1999-11-17
EP0833517B1 (en) 2014-08-20
EP2775451A1 (en) 2014-09-10
JP2008067396A (ja) 2008-03-21
EP0833517A2 (en) 1998-04-01
CA2214663A1 (en) 1998-03-25

Similar Documents

Publication Publication Date Title
JP5107649B2 (ja) ビデオの映像コード化およびイントラ・コード化のための固定型または適応型デインターリープドトランスフォームコード化方法及び装置
US10334257B2 (en) Method for decoding chroma image using luma quantization
US10375390B2 (en) Method and apparatus of deriving intra prediction mode using most probable mode group
CN111263148B (zh) 帧内预测及帧内模式译码
KR950006772B1 (ko) 압축된 비데오 데이타 표시를 발생하는 방법
US7469011B2 (en) Escape mode code resizing for fields and slices
RU2658137C2 (ru) Устройство интра-предсказания
EP1529401B1 (en) System and method for rate-distortion optimized data partitioning for video coding using backward adaptation
US7215707B2 (en) Optimal scanning method for transform coefficients in coding/decoding of image and video
KR100578049B1 (ko) 인터레이스드디지털비디오를위한인트라-매크로블록디씨및에이씨계수예측방법및장치
US7711196B2 (en) Apparatus and method for generating coded block pattern for alpha channel image and alpha channel image encoding/decoding apparatus and method using the same
US20040136457A1 (en) Method and system for supercompression of compressed digital video
KR20220127948A (ko) 적응적인 화소 분류 기준에 따른 인루프 필터링 방법
US6192077B1 (en) Coding and decoding apparatus with motion compensation
CN111164975A (zh) 图像数据编码和解码
KR100728032B1 (ko) 워핑 기반의 인트라 예측 방법
CN114830643A (zh) 图像编码方法和图像解码方法
Lee Standard coding for mpeg-1, mpeg-2 and advanced coding for mpeg-4
KR20090046791A (ko) 인코딩 방법, 디코딩 방법, 상기 방법을 구현하는 디바이스, 및 비트스트림
Ng et al. An adaptive multiresolution modification of the H. 263 video
Ng et al. An adaptive multiresolution modification of the H. 263 video coding algorithm
KR980013416A (ko) 매크로 블록의 합병을 이용한 모양 적응 부호와 시스템

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101214

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110221

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111213

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120307

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120312

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120410

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120911

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121004

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151012

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term