JP5300921B2 - 符号化および復号のための方法および装置 - Google Patents

符号化および復号のための方法および装置 Download PDF

Info

Publication number
JP5300921B2
JP5300921B2 JP2011130250A JP2011130250A JP5300921B2 JP 5300921 B2 JP5300921 B2 JP 5300921B2 JP 2011130250 A JP2011130250 A JP 2011130250A JP 2011130250 A JP2011130250 A JP 2011130250A JP 5300921 B2 JP5300921 B2 JP 5300921B2
Authority
JP
Japan
Prior art keywords
block structure
block
cif
texture
4cif
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011130250A
Other languages
English (en)
Other versions
JP2011172297A (ja
Inventor
アモン ペーター
フッター アンドレアス
ティンマーマン ブノア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of JP2011172297A publication Critical patent/JP2011172297A/ja
Application granted granted Critical
Publication of JP5300921B2 publication Critical patent/JP5300921B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Description

本発明は、請求項1の上位概念に記載のビデオ符号化方法、請求項20の上位概念に記載の復号方法、ならびに請求項21の上位概念に記載のビデオ符号化のための符号化装置、請求項22の上位概念に記載の復号装置に関する。
ディジタルビデオデータは、記憶あるいは伝送のために膨大なデータ容量を著しく低減する目的で一般的に圧縮される。その際に圧縮は、ビデオデータ中に含まれている信号冗長性の排除によっても行われるし、人間の目では知覚できない重要ではない信号成分の除去によっても行われる。これは通常、ハイブリッド符号化方式によって行われ、これによれば符号化すべき画像が最初に時間的に予測され、ついで残留する予測誤差が周波数領域においてたとえば離散コサイン変換などによって変換され、その状態で量子化され、可変長符号によって符号化される。その後、動き情報および量子化されたスペクトル係数が伝送される。
次に伝送すべき画像情報に対するこのような予測が向上すればするほど、予測後に残留する予測誤差が小さくなり、引き続きその誤差を符号化するためにデータレートをいっそう僅かにしか使わなくて済むようになる。したがってビデオデータを圧縮する際の重要な課題は、符号化すべき画像のできるかぎり精確な予測をすでに先行して伝送されている画像情報から得ることである。
画像の予測はこれまで、画像を最初にたとえば規則的な部分ブロックに分割し、典型的には8×8画素サイズまたは16×16画素サイズの正方形ブロックに分割し、次にこれらの画像ブロック各々について、すでに受信側において既知である画像情報に基づき動き補償によって予測が求められることによって行われていた。(ただしこの場合、それぞれ異なるサイズのブロックを生じさせることもできる。)図1には、このようなやり方が示されている。この場合、予測に関して2つの基本的なケースを区別することができる。
単方向予測:この場合、動き補償はもっぱら、先行して伝送された画像に基づき行われ、これによりいわゆる「Pフレーム」が形成される。
双方向予測:この場合、画像の予測は2つの画像の重畳によって行われ、これらの画像のうちの一方は時間的に前、他方は時間的に後に続くものであり、これによっていわゆる「Bフレーム」が形成される。ここで留意したいのは、2つの参照画像双方がすでに伝送されていることである。
これら考えられる2つの予測のケースに応じて、動き補償された時間的なフィルタリング(Motion Compensated Temporal Filtering, MTCF)においてMSRA(非特許文献1)による方式によれば、図2に描かれているように5つの方向モードが生じることになる。
可能なビットレートに関して、ならびに時間的および局所的な分解能レベルに関して、著しく広い範囲にわたり良好なビデオ品質を保証する目的で、MCTFベースのスケーラブルビデオ符号化が用いられる。ただしこの場合、今日知られているMCTFアルゴリズムは低減されたビットレートについては許容できない結果を示しており、これは画像シーケンスにより定義されるビデオの動き情報(ブロック構造および動きベクトル)に係わる情報に比べてテクスチャ(ブロック情報)が少なすぎることに起因する。
したがってテクスチャと動きデータとの間の最適な関係を各ビットレートおよび分解能においても達成するためには、動き情報のスケーラブルなフォームが必要である。この目的で非特許文献1によれば、MCTFアルゴリズムの現在の状態を表すMSRA(Microsoft Research Asia)のソリューションが知られている。
この場合、MSRAソリューションによれば、動きをレイヤごとに表示させるか、もしくは動きを漸次細分化された構造に分解することが提案されている。したがってMSRA方式によって、低いビットレートにおいて画像の品質を概して向上させることができるようになる。
ただしこのソリューションの欠点は、再構成された画像においていくらかずれが引き起こされることである。これは動き情報とテクスチャとの間のずれに起因する。
特許文献1によれば、これに対する改善策が知られている。
そこに記載されている手法によれば、符号化側で定義されるたとえばMSRAに従って生成される完全な動きベクトルフィールド(一時的なブロック構造MV_QCIF,MV_CIFおよびMV_4CIF)が完全に伝送されるのではなく、この動きベクトルフィールドの最も重要な部分だけが伝送されるにすぎない。その際、最も重要な部分の生成はブロック構造に対する一種の細分化により行われ、これは構造特性に基づき相前後して続くブロック構造間における構造差の一部分だけを求めて、細分化されたブロック構造の生成のために用いることによって実現される。
ここで問題となるのは、細分化されたブロック構造およびそれに属するテクスチャにより達成される視覚的品質のどれもが、対応する基本構造およびそれに属するテクスチャにより達成可能な視覚的な品質よりも高まるわけではないことである。
ドイツ連邦共和国特許出願第10 2004 038 110.0号
Jizheng Xu, Ruiqin Xiong, Bo Feng, Gary Sullivan, Ming-Chieh Lee, Feng Wu, Shipeng Li, "3D subband video coding using Barbell lifting", ISO/IEC JTC1/SC29/ WG11 MPEG 68th meeting, M10569/s05, Munich, March 2004.
本発明の基礎となる課題は、細分化された構造の改善された埋め込みないしは組み込みを可能にする符号化および復号のための方法を提供することにある。
この課題は、請求項1の上位概念に記載された符号化方法において、その特徴部分に記載された方法により解決される。
さらに上記の課題は、請求項20の上位概念に記載の復号方法、請求項21の上位概念に記載の符号化器、ならびに請求項22の上位概念に記載の復号器において、それらの特徴部分に記載された構成によって解決される。
スケーラブルな動き情報を生成するための動き予測モデルを示す図である。 このために必要とされる方向モードを示す図である。 ここで用いられるサブブロックサイズを示す図である。 本発明に従って生成されるブロック構造を示す図である。 更新に関する本発明の判定について示す図である。 更新されたビットストリームを本発明に従って生成する様子を示す図である。
本発明による画像シーケンスのビデオ符号化方法によれば、画像シーケンスの画像がスケーリングされ符号化されて、発生したビデオデータが、画像表現ごとに画素数により定義された画像分解能に関して、および/または画像品質に関して(たとえばデータレートに依存して)、それぞれ異なる複数のレベルで画像を表現可能な情報を含み、符号化がブロックベースで行われ、複数の画像のうち1つの画像の一部分について画像シーケンス中に場合によっては含まれる動きを記述するために、動きを記述する少なくとも1つのブロック構造が生成され、このブロック構造は、1つのブロックから複数の部分ブロックへ分割され、同時に一部分でそれらの部分ブロックが順次細かく分けられたサブブロックに分割される。この場合、一時的に少なくとも第1の分解能レベルのために第1のブロック構造が生成され、第2のブロック構造のために第2のブロック構造が生成され、その際、第1の分解能レベルは第2の分解能レベルよりも低い画素数および/または画像品質を有している。さらに第2の第2のブロック構造が第1のブロック構造と比較され、これらのブロック構造における差が求められる。その結果、このような構造差の特性に基づき、第2のブロック構造の部分集合を成す構造をもつ変更された第2のブロック構造が生成される。さらに、変更された第2のブロック構造と第2のブロック構造が、少なくとも画像品質に比例する値に基づき比較され、改善された品質に正比例する値をもつブロック構造がビットシーケンス符号化の基礎とされる。
この方法のステップによって、各テクスチャ情報間の差が最小化され、しかもこれらの情報を最低限の煩雑さで符号化できるようになる。しかも、たとえば最も細かい動きベクトルフィールドが選択されているケースではずれがなくなり、その結果、ビットレートと分解能が比較的低くても画像品質の向上が可能となる。
さらに本発明による比較動作によれば殊に、動き予測と残留エラー画像の埋め込みないしは取り込みとの間においてステップごとに絶えずいっそう良好に整合していくとりわけ最適なマッチングが実現される。しかも本発明は殊に効率的な点で優れている。
この目的で有利には差の形成のために追加されたサブブロックが捕捉され、その際、差の形成のために択一的にもしくはこれに加えるかたちでサブブロックの特性が捕捉される。
サブブロック特性としてサブブロックのブロックサイズが捕捉されるならば、生成されるブロック構造の細かさの程度に対し実際の適用においてきわめて良好な指標が得られる。
差を求めるために、第2のブロック構造の部分ブロックに対応する第1のブロック構造における部分ブロックだけが利用されるならば、テクスチャ情報の差分をさらにいっそう低減することができる。
ここで有利であるのは、第2のブロック構造において定義可能な閾値に達したブロックサイズをもつサブブロックを、変更された第2のブロック構造に取り込むことである。これにより、ブロック構造全体すなわち動きベクトルフィールド全体を伝送する必要はなく、ブロック構造における最も重要な部分だけを伝送すればよくなる。1つにはこれによって、伝送すべき情報が低減されることになり、しかもこのような低減にもかかわらずずれがなくなり、もしくは減少し、その結果、符号化された画像におけるアーチファクトがなくなり、もしくは減少する。実際の適用において、定義可能な閾値を用いるのは著しく有利であり、その理由は、たとえばシミュレーションまたは実験的試行により求められた最適な値をここで調整できるからであり、そのような値について、シミュレーションもしくは実験の結果に基づき非常に良好な結果が期待されるものである。
その際、閾値を以下のように定義するのが有利である。すなわち第2のブロック構造における1つのサブブロックのブロックサイズと、比較に利用される第1のブロック構造の領域中に含まれこの領域の最小サブブロックに属するブロックサイズとの比が、上述の閾値によって表されるよう定義される。
さらに1つの実施形態によれば、取り込まれたサブブロックは非二項ないしは非ダイアディック(non-dyadic)に分割可能であることを特徴としている。
第3の分解能レベルにおける第1のブロック構造として、第2の分解能レベルにおける変更された第2のブロック構造が用いられ、この第2の分解能レベルは、上述の第3の分解能レベルよりも低い画素数および/または画像品質を有するように構成すれば、復号画像の表示に関してさらに結果を向上させることができる。
つまりこれによって、変更された第2のブロック構造を生成するためにいっそう高い分解能レベルのさらに別の可能なブロック構造が用いられ、その際、それぞれ先行する分解能レベルの変更された第2のブロック構造が本発明による比較のために使われる。
符号化を以下のようにして行うのも復号のために有利である。すなわちこの場合、変更された第2のブロック構造に取り込まれないサブブロックがそれぞれ識別されるよう、符号化を行うのである。
このために有利であるのは、たとえば「非細分化」と称する方向モードを適用して上述の識別を行うことである。
本発明の1つの実施形態によれば、ビットシーケンスの符号化にあたりビットストリームが、これによってスケーラブルなテクスチャが表現されるよう生成される。その際にこのことは有利には以下のことにより行われる。すなわちビットストリームがビットプレーンの個数により実現されることによって、ならびにビットストリームが少なくとも比較結果および伝送のために実現すべきビットレートに殊に依存して変更されることによって行われる。これによって、マッチングされたSNRスケーラビリティが達成される。
しかも、ビットプレーンの個数を分解能レベルに依存して変更すれば、SNRスケーラビリティの細かい粒度が保証される。
有利には、変更された第2のブロック構造の値が正比例であれば、第2のブロック構造を表すビットプレーンにおける少なくとも第1の部分が更新される。これにより復号器側で、対応する変更された第2のブロック構造が利用できるようになる。
その際、更新はたとえば、第2の部分の伝送が行われることによって実施され、あるいは択一的にビットプレーンの第1の部分が第2の部分により変更されることによって行われる。
ここで、この更新は有利には次のようにして行われる。すなわち、第2のブロック構造に属するテクスチャにおいて、変更された第2のブロック構造により定義されている領域が細分化され、それによって最終結果において、種々の局所時間分解能もしくはビットレートであっても良好な画像品質が得られるようになり、その際、動きベクトルフィールドとブロック構造の細分化に利用されない残留エラーブロックとの間のずれによって生じるドリフトは伴わない。
高いビットレートにおいて前述の個数を上回る第2の個数のビットプレーンを伝送すれば、いっそう細かい粒度の付加的なサポートが実現される。
本発明の基礎とする課題は、符号化画像シーケンスを復号する方法によっても解決さる。すなわちこの方法によれば、画像シーケンス中に含まれており動き情報更新方法たとえば上述の方法に従って生成された情報、ならびにスケーラブルテクスチャを表現するビットストリームを考慮して、スケーリングされた画像シーケンス表現が生成される。
上述の課題を解決するために、さらに本発明による符号化器ならびにこれに対応する復号器も寄与している。この場合、符号化器は本発明による方法を実施する手段を有しており、復号器は本発明による方法に従い生成された符号化画像シーケンスを復号する手段を有している。
有利にはこの目的で復号器には、スケーラブルテクスチャを表現するビットストリーム部分を示す第1の信号を検出する手段と、さらにこれに加えて、更新すべき領域を示す第2の信号を検出する手段が設けられている。これらの信号はそれぞれたとえばシンタックスエレメントとして構成されている。この構成により、本発明による方法によって達成される表示品質向上を復号器側で実施できるようになる。
更新によって符号化画像シーケンス表現を向上させるビットプレーンを求める手段が復号器に設けられていれば、さらに択一的にあるいはこの手段に加えて、テクスチャの更新を行うべきビットプレーンを求める手段が復号器に設けられていれば、細分化されたもしくはスケーリング可能な画像シーケンス表現を精確に再構成できるようになる。
更新された動き情報が考慮されるように構成されたテクスチャ更新手段が復号器に設けられているならば、本発明による符号化方法によって達成されるずれの解消が、復号器側で生成されたスケーリング可能な画像シーケンス表現において保証される。
ここで復号器は有利には、存在するテクスチャから更新されたテクスチャが以下のようにして形成されるように構成された更新手段が設けられていることを特徴としている。すなわちこの更新手段によって、テクスチャに属するテクスチャ情報とテクスチャ更新情報から更新されたテクスチャ情報が形成される。さらにこの更新手段は、テクスチャ情報が少なくとも部分的にテクスチャ更新情報によって置き換えられるように構成されている。
図1〜図7を参照しながら本発明の実施例に基づき、本発明の詳細な点ならびに利点について説明する。
図1には、従来技術により知られているMSRAソリューションが描かれており、本発明の理解を深めるためにこれについて説明する。なぜならば以下で説明する実施例では、このソリューションが少なくとも部分的に適用されるからである。
MSRAによれば、既述のマルチレイヤ動き予測が一時的なレイヤにおいて実施される。この場合、動き予測は、生成される動きベクトルフィールドを復号された分解能に整合させることができるようにする目的で、それぞれ異なるマクロブロックサイズを有する一定の空間分解能において実現される。たとえば、元の分解能レベルがCIF符号化されたフォーマットであり、復号される分解能レベルがQCIFフォーマットとして行われるのであれば、CIFフォーマットの分解能レベルもしくはCIF分解能で動き予測が実行され、この動き予測はベースとして32×32のブロックサイズで、また、最小ブロックサイズとして8×8のマクロブロックサイズで行われる。これに対し復号されるフォーマットがCIFフォーマットであれば、図1に示されているようにマクロブロックのサイズはファクタ2だけ下方にスケーリングされる。
さらに図1に示されているように、QCIFフォーマットとして存在するブロックの復号に関してそこに描かれている処理の下方の分岐において元の動きベクトルが伝送される一方、それよりも高いレイヤ各々については、たとえばCIFブロック復号のために用いられるレイヤについては、動きベクトルに関する差分情報だけが利用される。この場合、ブロックをいっそう小さい部分ブロックに分割すれば、低い方のレイヤにおける単一の動きベクトルを高い方のレイヤにおける複数のベクトルの予測に用いることができる。
既述のように、また、図2に描かれているように、ここで種々のモードは動き補償の方向を表す一方、MSRA方式によるブロック構造は、MPEG-4 AVC (Advanced Video Coding 特許文献1)標準で用いられるのと同じ方法に従って符号化される。
符号化すべきブロック構造および動き補償の方向を選択する目的でMSRAアプローチによればいわゆるコスト関数が利用され、これはこの関数のために定義されており、「レート歪み最適化 Rate Distortion Optimisation」という用語で知られている。
MSRAによる動きのマルチレイヤ表現において、それぞれ異なる局所分解能に整合される種々の動きの記述が、同じ一時的なレイヤ(フレームレート)のために生成される。この場合、いっそう高い分解能に属する動き予測は、粗い動き情報の検出をベースとして拡充された情報(enhancement layer/information)とみなされる。粗い動きベクトルフィールドにより生成された残留エラーブロックには著しく大きいエネルギーが含まれているので、最も細かい動き補償により生成される残留エラーブロックのみが伝送される。その結果、殊に粗い動き情報が選択されると、再構成された残留エラー画像においてきわめて強いアーチファクトが生じてしまい、しかもこれ自体が著しく高いビットレートにおいて行われる。
図4は、本発明に従って生成された一時的なブロック構造が本発明による方法を用いて処理されて、最終的に伝送すべきブロック構造が形成される様子を表している。
図4には、3つの一時的なブロック構造MV_QCIF,MV_CIF,MV_4CIFが描かれている。ここではこれらのブロック構造の各々が本発明に従いそれぞれ1つの分解能レベルに割り当てられており、その際、分解能レベルによって分解能のフォーマットが表され、このフォーマットによって本発明による方法に従い符号化された画像シーケンスから成るビデオ信号を表すことができる。
本発明による実施例に関してこれは共通中間フォーマットCommon Intermediate Format (CIF)、QCIFならびに4CIFフォーマットである。
ここでQCIFは、第1の分解能レベルすなわち本発明による方法のために選択される分解能レベルに関して最も低い分解能レベルを成しており、したがってこの分解能レベルに対し本発明によれば第1のブロック構造MV_QCIFも割り当てられる一方、CIFは第2の分解能レベルを成しており、これに対して本発明によれば第2のブロック構造MV_CIFが生成される。
その際、ブロック構造の生成は、たとえば既述のMCTFおよび/またはMSRA方式を利用して、動き予測アルゴリズムにおいて行われる。
さらにここに示されているように、一時的なブロック構造MV_QCIF,MV_CIF,MV_4CIFは漸次細分化していく部分ブロック構造を有しており、この部分ブロック構造の特徴は、一時的なブロック構造MV_QCIF,MV_CIF,MV_4CIFごとに定義される部分ブロックMB1_QCIF〜MB4_QCIFに基づき、さらに微細になる別のサブブロックが生じることである。
さらにこの図に示されているように、一時的なブロック構造MV_QCIF,MV_CIF,MV_4CIFは等しい局所分解能を有しており、したがってこれは分解能レベルごとに画素数が高まるにもかかわらず一定に保たれている。
図4には、伝送すべきもしくは最終的にたとえばストリーミングアプリケーションのために伝送されるブロック構造MV_QCIF,MV_CIF,MV_4CIFが示されており、これらのブロック構造は本発明による方法を適用して一時的なブロック構造MV_QCIF,MV_CIF,MV_4CIFから以下のようにして生成される。すなわち、高い分解能レベルに属するそれぞれ1つのブロック構造が、すぐ次に低い分解能レベルに属するブロック構造と比較され、その結果として、着目中の分解能レベルに属する変更されたブロック構造が生成され、このブロック構造は、同じ分解能レベルに属する一時的なブロック構造の部分集合のみを含むサブブロック構造を有している。その際にこれは、変更されたブロック構造のサブブロック構造が対応する一時的なブロック構造のサブブロック構造と同一であるケースが除外されることになる真の部分集合ではなく、この特別なケースが本発明による方法に従って現れる可能性もあることから、たとえば数学的に知られている(単純な)部分集合にすぎない。
以下、本発明によるアルゴリズムについていくらか詳しく説明する。
本発明によれば、最も低い分解能レベルに属するブロック構造の生成から開始される。その際、本発明によればこの第1のブロック構造MV_QCIFから変更されたブロック構造MV_QCIFがダイレクトに生成される。それというのも、このケースでは当然ながら先行のブロック構造との比較を行うことができないからである。したがってダイレクトに生成された変更されたブロック構造MV_QCIFは、第1のブロック構造MV_QCIFが有するものと同じサブブロック構造をもっている。
本発明によれば次のステップにおいて、すぐ次に高い分解能レベルのために、このケースではCIFにおいて、第2のブロック構造MV_CIFが生成される。この場合、第2のブロック構造MV_CIFに別のサブブロックが追加されていることがわかり、これによって、第1のブロック構造MV_QCIFと比較していっそう細かいサブブロック構造が生じる。追加されているサブブロックないしはサブブロック構造は図中、一点鎖線で描かれている。
このため本発明によれば次のステップにおいて比較が行われ、追加されたサブブロックについて、それらが第1のブロック構造の対応する部分領域の最小ブロックサイズよりも4つぶん以上小さいブロックサイズを有するか否かについてチェックされる。
このことが該当するならば、対応するサブブロック構造が変更された第2のブロック構造MV_CIFにおいて行われ、他方、チェックすべきサブブロックが比較的僅かな細分化状態を成しているケースでは、伝送すべき変更された第2のブロック構造におけるそのサブブロック構造の取り込みが取りやめになる。
このことについていっそうわかりやすく説明できるようにする目的で、図4では第2のブロック構造MV_CIFに含まれているサブブロックのうち2つのサブブロックすなわち第1のサブブロックSB1と第2のサブブロックSB2が一例として抜き出されている。
第1のサブブロックSB1は、第2のブロック構造MV_CIFにおける第1の部分ブロックMB1_CIF中に存在している。このため本発明によれば、第2のブロック構造MV_CIFにおける第1の部分ブロックMB1_CIFに対応する第1のブロック構造MV_QCIFの第1の部分ブロックMB1_QCIFにおいて、それがここで発生する最小サブブロックサイズであるかについてチェックが行われる。ここで示した実施例では、この最小ブロックサイズは最小の第1のサブブロックMIN_SB1によって規定される。ここに示されているように、第1のサブブロックのサイズは第1の最小サブブロックのサイズに対応しているので、このケースでは細分化はまったく行われない。このため本発明によれば、伝送すべき第2のブロック構造MV_CIFにおいて、第1のサブブロックに基づくサブブロック構造は取り込まれず、したがって図4に示されている変更された第2のブロック構造MV_CIFでは対応個所に一点鎖線の格子は描かれていない。
この比較にあたり、とりわけ第2のサブブロックSB2も比較のために利用される。第2のサブブロックSB2は第2のブロック構造MV_CIFにおける第4の部分ブロックMB4_CIFに含まれているので、相応に第1のブロック構造MV_QCIFにおける第4の部分ブロックにおいて最小サブブロックサイズが求められる。これは第2の最小サブブロックMIN_SB2によって与えられ、このケースでは第2の最小サブブロックMIN_SB2は第1のブロック構造MV_QCFにおける第4の部分ブロックMB4_QCFを正確に分割している。ここに示されているようにこのケースでは第2のサブブロックSB2のサイズは、第2の最小ブロックMIN_SB2のサイズの8分の1を成しており、したがって第1のブロック構造MV_QCIFに比べて8倍の細分化が行われる。それゆえ本発明によれば、第2のサブブロックを規定するサブブロック構造が変更された第2のブロック構造MV′_CIFにおいても取り込まれる。変更された第2のブロック構造MV′_CFにおける破線の構造で図4に示されているように、これと同じことは第2のブロック構造MV_CIFにおけるすべてのブロックについてあてはまる。
第2のブロック構造MV_CIFと変更された第2のブロック構造MV′_CIFとの比較から明らかなように、第2のブロック構造MV′_CIFにおけるサブブロック構造のすべてが取り込まれるわけではない。符号化されたこの種の画像シーケンスを適正に表示できるようにする目的で、伝送すべきブロック構造の符号化にあたり、変更されたブロック構造に取り込まれなかったサブブロックの識別が符号化に取り込まれる。その際、本発明による方法は、別の分解能レベルにおいても同じように適用される。たとえばこの実施例に従って、フォーマット4CIFに対してもブロック構造MV_4CIFが生成される。この場合、本発明によればこれは第2のブロック構造として適用される一方、第1のブロック構造は先行する第2のブロック構造MV_CIFによって形成される。その際、これら双方のブロック構造の比較により生成された変更された第2のブロック構造MV′_4CIF自体は、図4によれば加えられたサブブロック構造の一部分によってのみ細分化されており、これは図中、点線で表されている。
択一的にまたはさらに補うかたちで、比較のために一時的なブロック構造の代わりにすでに生成されて伝送されたすなわち変更された第2のブロック構造を、第1のブロック構造として利用することができる。
その際、本発明によれば、画像シーケンスにおいて符号化されたすべての分解能レベルのために本発明に従い伝送すべきブロック構造を生成する必要はなく、たとえば上述の分解能のうち部分分解能においてのみ生成すればよく、たとえばQCIF,CIFまたは4CIFが適用されたケースではCIFについてのみ、あるいはQCIFとCIFが適用されたケースではCIFについてのみ生成すればよい。むしろ実際の適用においては、存在するすべての分解能レベルとの比較において中間的ないしは平均的な分解能レベルにこのことを適用すれば十分である。なぜならば平均的な分解能レベルで最高のパフォーマンスが得られるからであって、その理由はこれによりブロック構造および動きベクトルを何度もアップサンプリングおよびダウンサンプリングすることを回避できるからである。この場合、パラメータによって、種々の局所分解能レベルのために動き情報に対するデータレートがそれぞれ設定され、それによって動き情報およびテクスチャ情報に対するデータレートの最適な関係ないしは比率が各分解能レベルで与えられることになる。
なお、本発明は、図4を参照しながら説明した実施例に限定されるものではなく、当業者の知識範囲において考慮の対象となるものであって本発明の核となる着想をもつすべての実現形態を含むものである。
たとえば、MSRAに従って生成される完全な動きベクトルフィールド(一時的なブロック構造MV_QCIF,MV_CIF,MV_4CIF)は符号化側で定義されもしくは存在するものであるが、これを完全に伝送する必要はなく、この動きベクトルの最も重要な部分だけを伝送すればよい。
その際、本発明によるアルゴリズムの重要は利点は、低いビットレートでも低い分解能でも画像品質が向上することである。
さて、図5には、これまで説明してきたシグナリングもしくは以下で説明するビットストリーム生成を基礎とする方法のステップが示されている。
前述の本発明による選択的な細分化手法に従い本発明により提案されている新たなブロックモードは、現在着目中の動きベクトルフィールドを後続の動きベクトルフィールドのために分割する必要があるか否かを示すものである。そのためこのブロックモードに基づき、低い方のレイヤに割り当てられている先行の残留エラーブロックとは異なる現在の残留エラーブロックが存在する領域を位置特定することができる。
この場合、それらの領域に対応づけられているもしくはそれらの領域に属するブロックは、先行の残留エラーブロック内に存在するブロックにおける同じポジションと比較され、それらに対する差分が符号化される。この情報が符号化側で記憶された後、動き情報とテクスチャとの間の最良のマッチングすなわち最適なマッチングを個々のビットレートについて行う必要がある。
このためには通常、符号化側で利用可能なすべての情報を最適に利用できるよう伝送前にビットストリームを生成する必要がある。
これを実現する目的で図5に示されているようにたとえば、動きベクトルフィールド(ブロック構造)を細分化する必要があるか否かについての判定を下す評価を行うために比較が実行される。
本発明によればこのことが有利である理由は、実際の適用においては、基本動きベクトルフィールド(ブロック構造)MVFIELD1と対応するテクスチャTEXTUR1によってテクスチャTEXTUR1のx%を成す値だけ達成される結果よりも改善可能な可視的な品質が生じる可能性があるからであり、これは上述の動きベクトルフィールドが変更されたブロック構造MVFIELD2に細分化された場合であり、つまり((TEXTUR1)のy%+細分化により定義される)テクスチャTEXTUR′1の相応の細分化よりも改善されている。この場合、ビットレートが等しければyはxよりも小さい。
ここに図示されている相応の判定手順からわかるように、細分化が必要だと思われるケースでは、テクスチャ情報に関する情報の一部分をそれ相応に加える必要がある。ただしこのことによって、テキスト情報の一部分を細分化情報に割り当てる、という問題点も生じる。
このことは上述のように1つには適切なシグナリングによって実現することができ、これによれば細分化可能な殊に細分化すべき残留エラーブロック内の領域を復号器の側で位置特定することができる。したがってこれにより復号器は、残留エラーブロックの埋め込みが行えるよう、すなわち1つの残留エラーブロックにおける細分化の一部分がいくつかの別のブロックにより表現されるよう、動き情報の細分化が加えられる本発明による前述のやり方を識別し、それに応じて考慮できるようになる。
2つめとしてこのためには適切な符号化も必要であり、その目的は圧縮効率について効果的になるようにすることであり、これは次のようにして行われる。すなわち細分化ブロックがブロックベースの変換(IT,DCT等)により符号化され、その際、これらのブロックは動きベクトルフィールドの細分化に基づく残留エラーブロックと、細分化された動きベクトルフィールドには基づかずに生成され所定数のビットプレーンたとえばN個のビットプレーンを有する残留エラーブロックとの差分を表すものである。
ただしこのためには図6に示されているように、伝送のために生成すべきビットストリームの適切な編成も必要である。
本発明によるこのようなビットストリーム生成の目的は、動きベクトルフィールドと残留エラーブロックとのずれにより発生する可能性のあるドリフトを伴うことなく、種々の空間的/時間的な分解能レベルもしくはビットレートに対し良好な画像品質を保証することである。したがって本発明により達成されるこれらのステップは概略的に描かれたものである。
ここで示した実施例は初期状態から出発しており、この状態においては特定の個数の動きベクトルフィールドが相応の残留エラーブロックによって符号化側で生成されたものである。たとえば、QCIF分解能のためには第1の動きベクトルフィールドMVF1と第1の細分化された動きベクトルフィールドMVF1′であり、CIF分解能のためには第1の細分化された動きベクトルフィールドMVF1′と(図示されていない)第2の動きベクトルフィールドであり、4CIF分解能のためには第2の動きベクトルフィールドと第3の動きベクトルフィールドである。QCIF分解能におけるこの種のシナリオに対する符号化もしくは復号は、本発明によれば以下のようにして行われる:QCIF分解能のためにビットレートの広い範囲を復号しなければならないとすれば、最初のステップにおいて必要とされるのは、第1の動きベクトルフィールドMV1と対応する残留エラーブロックを伝送することである。この場合、ビットレートが大きくなるにつれて、残留エラーブロックを表すビットプレーンBTPL1〜BTPLN+Mの個数が増える。さらにこの場合、冒頭で説明したブロック細分化に関する判定によって個数が制限されることもあてはまる。
ここに示した実施例によれば、ビットプレーン数はN個に制限される。本発明による評価に従い細分化が必要であると判定が下されると、第1の動きベクトルフィールドMVF1は、細分化された動きベクトルMVF1′が生成されるよう細分化される。したがってこのようなケースでは、動きベクトルフィールドと個々のテクスチャとの間のずれを回避する目的で、第1の動きベクトルフィールドMVF1に対応するテクスチャが更新("updated")されるようにすることも必要である。
本発明によって提案されるアルゴリズムも図面に示されており、これは以下のように進行する。
動き情報の上述の評価により、動き情報の更新が必要であるという結果が出た場合、一般には特定の個数のビットプレーンBTPL1〜BTPLNがすでに伝送されていたことになる。所定の限界値BTPLnまでは、細分化されていない残留エラーブロックを表すビットプレーン(BTPL1〜BTPLn)を変更する必要はない。これに対しこの限界値BTPLnに到達すると、この実施例によれば次に続くビットプレーンが更新される。
その際にこれは、細分化されていない残留エラーブロックにおける最後のビットプレーンを表すビットプレーンBTPLnから始められ、すでに伝送されているビットプレーンBTPLNまで拡げられていく。
その際にこの更新は以下のようにして行われる。すなわち細分化されている部分REFINEMENTに属する領域が後続の動きベクトルフィールドと一致するよう、すなわちここに示した実施例によれば第1の細分化されたベクトルフィールドMVF1′と一致するよう、その領域が更新される。
この場合、本発明によれば、いっそう高いビットレートであるならば、すでに伝送されているビットプレーン数BTPLNを超える個数のビットプレーンBTPLN+1〜BTPLN+Mまでを付加的に伝送することができる。このコンセプトはここでは、各空間分解能および/または品質レベルについて反復され、これによって信号−ノイズのスケーラビリティ(SNRスケーラビリティ)の粒度をいっそう細かくすることができる。
このような前提シナリオによれば、CIF分解能レベルにおける符号化および復号は以下のようにして行われる。
ここでも本発明によればSNRと空間的スケーラビリティを組み合わせるべきであるので、たとえば(ビデオ)ビットストリームをCIF分解能で復号する必要があり、かつこれをいっそう低いビットレートにおいて行うべきである場合、変更された第1の動きベクトルフィールドMVF1′がQCIF分解能からCIF分解能へと高められるかたちでスケーリングされる。しかもこの場合、テクスチャTEXTUR1およびテクスチャTEXTUR′1のいっそう高い空間分解能を達成する目的で、たとえば逆ウェーブレット変換が行われ、あるいは補間が実行される。
ここで留意したいのは、著しく低いビットレートであればテクスチャTEXTUR1からテクスチャTEXTUR′1へのテクスチャの更新を行う必要がないことである(たとえばCIF分解能を符号化する目的でn個のビットプレーンよりも少ないビットレートしか必要とされない場合)。全体としてこれにより空間的スケーラビリティが達成される。
CIF分解能におけるSNRスケーラビリティは、元の細分化されたCIF残留エラーブロックと補間されたまたは逆ウェーブレット変換された細分化されたQCIFビットプレーンとの差分のビットプレーンを符号化することによって達成される。細分化を行うべきか否かの判定がCIF分解能において肯定の結果であれば、QCIFに対する上述の手法について説明したのと同じストラテジーに従い進められる。同じことはCIFから4CIFへのスケーリングについてもあてはまる。
ただし、本発明はこれまで説明してきた実施例に限定されるものではない。そうではなく以下のことも適用される:
1.SNRスケーラビリティは既述の実施例によればテクスチャ情報のビットプレーンごとの表現により生成されるが、このことに限定されるものではない。なぜならば、スケーリング可能である択一的なテクスチャ表現によっても、これを達成できるからである。
2.細分化の前に生じるビットプレーン(BTPLN)の最大数を、空間分解能ごとに異ならせることができる。
3.さらに、1つの空間分解能レベル内で2回以上の更新を行うことができ、これはその空間分解能レベルについて2つよりも多くの動き情報レイヤが利用される場合である。
その際にこれらのこととは別に、ビットレートならびに空間的時間的分解能の広い領域について動き情報とテクスチャとの著しく良好なマッチングが常に実現され、これは画像品質の劣化を伴わずに行われる。その理由は、本発明による方法によってきわめて良好な情報の分配が達成されるからであり、つまりは動き情報とテクスチャとのずれもなくなるからである。

Claims (27)

  1. 画像シーケンスのビデオ符号化方法において、
    画像シーケンスの画像がスケーリングされ符号化されて、発生したビデオデータが、画像表現ごとに画素数により定義された画像分解能(QCIF,CIF,4CIF)に関して、および/または画像品質に関して、それぞれ異なる複数のレベルで画像を表現可能な情報を含み、
    符号化がブロックベースで行われ、複数の画像のうち1つの画像の一部分について画像シーケンス中に場合によっては含まれる動きを記述するために、該動きを記述する少なくとも1つのブロック構造(MV_QCIF,MV_CIF,MV_4CIF)が生成され、該ブロック構造(MV_QCIF,MV_CIF,MV_4CIF)は、1つのブロックから複数の部分ブロックへ分割され、同時に一部分で該部分ブロック(MB1_QCIF〜MB4_QCIF,MB1_CIF〜MB4_CIF,MB1_4CIF〜MB4_4CIF)が順次細かく分けられたサブブロックに分割され、
    a)一時的に少なくとも第1の分解能レベルに対し第1のブロック構造(MV_QCIF;MV_CIF)が生成され、第2の分解能レベルに対し第2のブロック構造(MV_CIF,MV_4CIF)が生成されるステップが設けられており、前記第1の分解能レベルは第2の分解能レベルよりも低い画素数および/または画像品質を有しており、
    b)前記第2のブロック構造(MV_CIF;MV_4CIF)が前記第1のブロック構造(MV_QCIF、MV_CIF)と比較されて、各ブロック構造における差が求められるステップと、
    c)前記各ブロック構造における差の特性に基づき、変更された第2のブロック構造(MV′_CIF,MV′_4CIF)が生成されて、該変更された第2のブロック構造(MV′_CIF,MV′_4CIF)の構造によって前記第2のブロック構造(MV_CIF;MV_4CIF)の部分集合が表されるステップと、
    d)前記各画像品質がそれぞれ複数のテクスチャ分解能レベルによって実現されるステップが設けられており、画像品質の向上はさらに複数のテクスチャ分解能レベルを追加することにより可能であり、
    e)前記第2のブロック構造と付加的なテクスチャ分解能レベル(N+1)の第1の符号化により生じる第1の可視的品質が生成され、前記変更された第2のブロック構造と既に使用されたテクスチャ分解能レベル(1…N)の更新と付加的なテクスチャ分解能レベル(N+1)の第2の符号化により生じる第2の可視的品質が生成されるステップが設けられており、ただしその際、前記第1および第2の可視的品質は前記符号化の基礎をなす同一のビットレートで生成され、
    f)前記第2の可視的品質が前記第1の可視的品質よりも高ければ、前記第2の符号化を以降のビデオ符号化の基礎とし、前記第1の可視的品質が前記第2の可視的品質よりも高ければ、前記第1の符号化を以降のビデオ符号化の基礎とするステップ
    が設けられていることを特徴とする、画像シーケンスのビデオ符号化方法。
  2. 請求項1記載の方法において、
    前記差を求めるために、前記第2のブロック構造に加えられたサブブロックが捕捉されることを特徴とする方法。
  3. 請求項1または2記載の方法において、
    前記差を求めるために、サブブロック特性が捕捉され、
    サブブロック特性として前記サブブロックのブロックサイズが捕捉されることを特徴とする方法。
  4. 請求項1から3のいずれか1項記載の方法において、
    前記差を求めるために、前記第2のブロック構造(MV_CIF;MV_4CIF)の部分ブロック(MB1_CIF〜MB4_CIF;MB1_4CIF〜MB4_4CIF)に対応する第1のブロック構造(MV_QCIF;MV_CIF)の部分ブロック(MB1_QCIF〜MB4_QCIF;MB1_CIF〜MB4_CIF)のみが利用されることを特徴とする方法。
  5. 請求項3または4記載の方法において、
    第2のブロック構造(MV_CIF;MV_4CIF)において、設定可能な閾値に達するブロックサイズをもつサブブロックのみが、前記変更された第2のブロック構造(MV′_CIF;MV′_4CIF)に取り込まれることを特徴とする方法。
  6. 請求項5記載の方法において、
    前記閾値の定義によって、前記第2のブロック構造(MV_CIF;MV_4CIF)における1つのサブブロックのブロックサイズと、比較に利用される前記第1のブロック構造(MV_QCIF;MV_CIF)の領域中に含まれ該領域の最小サブブロックに属するブロックサイズとの比が前記閾値により表されることを特徴とする方法。
  7. 請求項1から6のいずれか1項記載の方法において、
    前記取り込まれたサブブロックは2つ以外に分割可能であることを特徴とする方法。
  8. 請求項1から7のいずれか1項記載の方法において、
    第3の分解能レベルにおける第1のブロック構造(MV_CIF)として、前記第2の分解能レベルにおける前記変更された第2のブロック構造(MV′_4CIF)が用いられ、該第2の分解能レベルは、前記第3の分解能レベルよりも低い画素数および/または画像品質を有することを特徴とする方法。
  9. 請求項5から8のいずれか1項記載の方法において、
    前記符号化により、前記変更された第2のブロック構造(MV_CIF;MV_4CIF)に取り込まれなかったサブブロックがそれぞれ識別されることを特徴とする方法。
  10. 請求項7から9のいずれか1項記載の方法において、
    前記符号化により、2つ以外に分割されたサブブロックがそれぞれ識別されることを特徴とする方法。
  11. 請求項9または10記載の方法において、
    方向モードにより前記識別が行われることを特徴とする方法。
  12. 請求項1から11のいずれか1項記載の方法において、
    ビットシーケンスの符号化にあたりビットストリームが生成されて、該ビットストリームはブロック構造と動きベクトルの更新と連携してスケーラブルテクスチャを表現し、該スケーラブルテクスチャ表現は、ビットストリームがテクスチャ分解能レベルによって実現されることにより、およびビットストリームが少なくとも比較結果および伝送のために実現すべきビットレートに依存して変更されることにより行われる
    ことを特徴とする方法。
  13. 請求項12記載の方法において、
    前記テクスチャ分解能レベルはビットプレーンの個数として実現されることを特徴とする方法。
  14. 請求項13記載の方法において、
    前記ビットプレーン(BTPL1〜BTPLN)の個数は前記分解能レベルに依存して変更されることを特徴とする方法。
  15. 請求項13または14記載の方法において、
    前記変更された第2のブロック構造(MV′_CIF;MV′_4CIF)の値が正比例している場合、前記テクスチャを表すビットプレーン(BTPLn〜BTPLN)における少なくとも第1の部分が更新されることを特徴とする方法。
  16. 請求項15記載の方法において、
    前記更新は第2の部分(BTPLn′〜BTPLN′)の伝送によって行われることを特徴とする方法。
  17. 請求項15記載の方法において、
    前記更新は、前記ビットプレーンの第1の部分(BTPLn〜BTPLN)が前記第2の部分(BTPLn′〜BTPLN′)により変更されることによって行われることを特徴とする方法。
  18. 請求項14から17のいずれか1項記載の方法において、
    前記更新は、第2のブロック構造に属するテクスチャ(TEXTUR1)において前記変更された第2のブロック構造(MV′_CIF;MV′_4CIF)により定義されている領域(REFINEMENT)が細分化されることにより行われることを特徴とする方法。
  19. 請求項12から17のいずれか1項記載の方法において、
    前記個数(BTPL1〜BTPLN)よりも大きい第2の個数のビットプレーン(BTPLN〜BTPLN+M)が高いビットレートで伝送されることを特徴とする方法。
  20. 請求項12から18のいずれか1項記載の方法により生成され符号化されたビットシーケンスの復号方法において、
    画像シーケンス中に含まれる請求項12から18のいずれか1項記載の方法に従い生成されたブロック構造と動きベクトルの更新ならびにスケーラブルテクスチャを表すビットストリームに基づき、前記画像シーケンスのスケーラブル表現が生成されることを特徴とする方法。
  21. 請求項1から18いずれか1項記載の方法を実施する手段が設けられていることを特徴とする、符号化画像シーケンスを生成する符号化器。
  22. 請求項1から18のいずれか1項記載の方法により生成された符号化ビットシーケンスを復号する手段が設けられおり、
    スケーラブルテクスチャを表すビットストリーム部分を示す第1の信号を検出する手段と、
    更新すべき領域を示す第2の信号を検出する手段と、
    テクスチャの更新を行うべきビットプレーン(BTPLN)を求める手段と、
    更新されるブロック構造と動きベクトルとを考慮して、テクスチャを更新する手段と
    が設けられている
    ことを特徴とする復号器。
  23. 請求項22記載の復号器において、
    前記第1の信号がシンタックス要素として構成されていることを特徴とする復号器。
  24. 請求項22記載の復号器において、
    前記第2の信号がシンタックス要素として構成されていることを特徴とする復号器。
  25. 請求項22から24のいずれか1項記載の復号器において、
    符号化されたビットシーケンスの表現更新によって向上させるビットプレーン(BTPLn)を求める手段が設けられていることを特徴とする復号器。
  26. 請求項22から25のいずれか1項記載の復号器において、
    更新手段が設けられており、該更新手段により、テクスチャに属するテクスチャ情報とテクスチャ更新情報から更新されたテクスチャ情報が形成されることによって、存在するテクスチャから更新されたテクスチャが形成されることを特徴とする復号器。
  27. 請求項26記載の復号器において、
    前記更新手段により、テクスチャ情報が少なくとも部分的にテクスチャ更新情報によって置き換えられることを特徴とする復号器。
JP2011130250A 2004-08-27 2011-06-10 符号化および復号のための方法および装置 Expired - Fee Related JP5300921B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004041664A DE102004041664A1 (de) 2004-08-27 2004-08-27 Verfahren zum Codieren und Decodieren, sowie Codier- und Decodiervorrichtung zur Videocodierung
DE102004041664.8 2004-08-27

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007528814A Division JP2008511226A (ja) 2004-08-27 2005-07-29 符号化および復号のための方法および装置

Publications (2)

Publication Number Publication Date
JP2011172297A JP2011172297A (ja) 2011-09-01
JP5300921B2 true JP5300921B2 (ja) 2013-09-25

Family

ID=35063418

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007528814A Pending JP2008511226A (ja) 2004-08-27 2005-07-29 符号化および復号のための方法および装置
JP2011130250A Expired - Fee Related JP5300921B2 (ja) 2004-08-27 2011-06-10 符号化および復号のための方法および装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2007528814A Pending JP2008511226A (ja) 2004-08-27 2005-07-29 符号化および復号のための方法および装置

Country Status (7)

Country Link
US (1) US8290058B2 (ja)
EP (1) EP1782634A1 (ja)
JP (2) JP2008511226A (ja)
KR (1) KR101240441B1 (ja)
CN (1) CN101010961B (ja)
DE (1) DE102004041664A1 (ja)
WO (1) WO2006024584A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004041664A1 (de) 2004-08-27 2006-03-09 Siemens Ag Verfahren zum Codieren und Decodieren, sowie Codier- und Decodiervorrichtung zur Videocodierung
DE102005016827A1 (de) * 2005-04-12 2006-10-19 Siemens Ag Adaptive Interpolation bei der Bild- oder Videokodierung
KR100970697B1 (ko) * 2008-05-27 2010-07-16 그리다 주식회사 이미지 데이터의 부분 갱신 방법
US8306122B2 (en) * 2008-06-23 2012-11-06 Broadcom Corporation Method and apparatus for processing image data
US20110002554A1 (en) * 2009-06-11 2011-01-06 Motorola, Inc. Digital image compression by residual decimation
US20110002391A1 (en) * 2009-06-11 2011-01-06 Motorola, Inc. Digital image compression by resolution-adaptive macroblock coding
KR101675118B1 (ko) 2010-01-14 2016-11-10 삼성전자 주식회사 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
US8532408B2 (en) 2010-02-17 2013-09-10 University-Industry Cooperation Group Of Kyung Hee University Coding structure
JP5616984B2 (ja) * 2011-01-26 2014-10-29 株式会社日立製作所 画像復号化装置
KR102257542B1 (ko) 2012-10-01 2021-05-31 지이 비디오 컴프레션, 엘엘씨 향상 레이어에서 변환 계수 블록들의 서브블록-기반 코딩을 이용한 스케일러블 비디오 코딩
TWI479473B (zh) * 2013-05-28 2015-04-01 Innolux Corp 液晶顯示器及其顯示方法
WO2015059876A1 (ja) * 2013-10-22 2015-04-30 日本電気株式会社 ブロック構造決定回路およびブロック構造決定方法
US10275646B2 (en) * 2017-08-03 2019-04-30 Gyrfalcon Technology Inc. Motion recognition via a two-dimensional symbol having multiple ideograms contained therein
US10593097B2 (en) * 2018-05-08 2020-03-17 Qualcomm Technologies, Inc. Distributed graphics processing

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6084908A (en) * 1995-10-25 2000-07-04 Sarnoff Corporation Apparatus and method for quadtree based variable block size motion estimation
AUPO951297A0 (en) * 1997-09-29 1997-10-23 Canon Information Systems Research Australia Pty Ltd Method and apparatus for digital data compression
JP3660548B2 (ja) * 2000-02-01 2005-06-15 日本電信電話株式会社 画像符号化方法及び画像復号方法、画像符号化装置及び画像復号装置、並びにそれらのプログラムを記憶した媒体
DE10022520A1 (de) 2000-05-10 2001-11-15 Bosch Gmbh Robert Verfahren zur örtlichen skalierbaren Bewegtbildcodierung
KR20020030101A (ko) * 2000-06-30 2002-04-22 요트.게.아. 롤페즈 비디오 시퀀스의 압축을 위한 인코딩 방법
KR100353851B1 (ko) * 2000-07-07 2002-09-28 한국전자통신연구원 파문 스캔 장치 및 그 방법과 그를 이용한 영상코딩/디코딩 장치 및 그 방법
FI120125B (fi) * 2000-08-21 2009-06-30 Nokia Corp Kuvankoodaus
KR100783396B1 (ko) * 2001-04-19 2007-12-10 엘지전자 주식회사 부호기의 서브밴드 분할을 이용한 시공간 스케일러빌러티방법
DE10219640B4 (de) 2001-09-14 2012-05-24 Siemens Ag Verfahren zum Codieren und Decodieren von Videosequenzen und Computerprogrammprodukt
US6909753B2 (en) * 2001-12-05 2005-06-21 Koninklijke Philips Electronics, N.V. Combined MPEG-4 FGS and modulation algorithm for wireless video transmission
KR20040046892A (ko) * 2002-11-28 2004-06-05 엘지전자 주식회사 움직임 벡터 예측 부호화 및 복호화 방법
DE102004038110B3 (de) * 2004-08-05 2005-12-29 Siemens Ag Verfahren zum Codieren und Decodieren, sowie Codier- und Decodiervorrichtung zur Videocodierung
DE102004041664A1 (de) 2004-08-27 2006-03-09 Siemens Ag Verfahren zum Codieren und Decodieren, sowie Codier- und Decodiervorrichtung zur Videocodierung
JP2007096479A (ja) * 2005-09-27 2007-04-12 Nippon Telegr & Teleph Corp <Ntt> 階層間予測符号化方法および装置,階層間予測復号方法および装置,並びにそれらのプログラムおよび記録媒体

Also Published As

Publication number Publication date
EP1782634A1 (de) 2007-05-09
KR101240441B1 (ko) 2013-03-08
WO2006024584A1 (de) 2006-03-09
US8290058B2 (en) 2012-10-16
KR20070046880A (ko) 2007-05-03
US20080095241A1 (en) 2008-04-24
JP2008511226A (ja) 2008-04-10
CN101010961B (zh) 2010-12-01
DE102004041664A1 (de) 2006-03-09
CN101010961A (zh) 2007-08-01
JP2011172297A (ja) 2011-09-01

Similar Documents

Publication Publication Date Title
JP5300921B2 (ja) 符号化および復号のための方法および装置
US8351502B2 (en) Method and apparatus for adaptively selecting context model for entropy coding
RU2355126C2 (ru) Основывающиеся на множестве слоев способ кодирования/декодирования и видеокодер/декодер, в которых используется сглаживающее предсказание
KR100679031B1 (ko) 다 계층 기반의 비디오 인코딩 방법, 디코딩 방법 및 상기방법을 이용한 장치
KR100772883B1 (ko) 인트라 bl 모드를 고려한 디블록 필터링 방법, 및 상기방법을 이용하는 다 계층 비디오 인코더/디코더
AU2006201490B2 (en) Method and apparatus for adaptively selecting context model for entropy coding
JP4922391B2 (ja) 多階層基盤のビデオエンコーディング方法および装置
US20060104354A1 (en) Multi-layered intra-prediction method and video coding method and apparatus using the same
US8428140B2 (en) Coding and decoding method and device
CN100352283C (zh) 用于对细粒度可扩缩编码的视频进行代码转换的方法
JP2009543490A (ja) 画像符号化及び復号化
KR20200128375A (ko) 인트라 예측 모드 스케일러블 코딩 방법 및 장치
JP2012151894A (ja) 画像シーケンスを符号化する方法または復号する方法および装置
WO2006059848A1 (en) Method and apparatus for multi-layered video encoding and decoding
KR101529903B1 (ko) 블록기반 깊이정보 맵의 코딩 방법과 장치, 및 이를 이용한 3차원 비디오 코딩 방법
JP4956527B2 (ja) 量子化誤差を低減する方法および装置
JP4385928B2 (ja) スケーラブル動画像符号化・復号化方法及びシステム
AU2008201768A1 (en) Method and apparatus for adaptively selecting context model for entropy coding
JP2007142499A (ja) 画像符号化装置及びプログラム及びコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110610

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121122

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130218

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130221

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130322

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130327

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130520

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130618

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees