JP2003523667A - プログレッシブファイングラニュラリティスケーラブル(pfgs)ビデオ符号化のための事前予測ビットプレーン符号化を使用するシステムおよび方法 - Google Patents
プログレッシブファイングラニュラリティスケーラブル(pfgs)ビデオ符号化のための事前予測ビットプレーン符号化を使用するシステムおよび方法Info
- Publication number
- JP2003523667A JP2003523667A JP2001560143A JP2001560143A JP2003523667A JP 2003523667 A JP2003523667 A JP 2003523667A JP 2001560143 A JP2001560143 A JP 2001560143A JP 2001560143 A JP2001560143 A JP 2001560143A JP 2003523667 A JP2003523667 A JP 2003523667A
- Authority
- JP
- Japan
- Prior art keywords
- quality
- layer
- residue
- low
- high quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/187—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/34—Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Abstract
Description
細には、ファイングラニュラリティ階層符号化を使用する動き補償ベースのビデ
オ符号化スキームに関する。
の送付が、ますます重要になっていきている。ビデオは、静的イメージおよびテ
キストよりもはるかに豊かなユーザ体験を提供するため、非常に魅力的である。
例えば、飾り気のない印刷で出来事に関して読むよりも、勝ち越しのタッチダウ
ンまたは大統領演説のビデオクリップを見る方が興味深い。残念ながら、ビデオ
データは、インターネットを介して送付される他のデータタイプより相当に大き
い。例として、1秒間の圧縮していないビデオデータが、1メガバイトまたはそ
れ以上のデータを消費する可能性がある。そのような大量のデータをインターネ
ットや無線網などの誤りの起きやすいネットワークを介して送付することは、効
率と信頼性の両方の点で困難な課題を有する。
して、ネットワークを介して実際に転送されるデータ量を低減する。圧縮の結果
、イメージ品質が失われるが、そのような損失は、一般に、許容可能な転送速度
を得るのに必要であるものとして許容される。いくつかのケースでは、品質の損
失は、見る人にとって感知可能でさえない可能性がある。
ベースのビデオ符号化スキームであり、このスキームは、MPEG−1、MPE
G−2、MPEG−4、H.261、およびH.263などの符号化において使
用される。
リティ階層符号化である。階層符号化は、ソース情報が「層」と呼ばれるセット
に区分される一系統の信号表現技法である。層は、最下層、つまり「基本層」が
、了解度に関して最低限の情報を含むように編成される。「拡張層」と呼ばれる
その他の層が、ビデオの全体的品質を増分式に向上させる追加の情報を含む。階
層符号化では、ビデオデータのより下位の層を使用してビデオデータの1つ以上
のより上位の層を予測する。
、符号化プロセスおよび伝送帯域幅を含む多数の要因に依存して、大きな幅があ
る。「クオリティオブサービス(Quality of Service)」ま
たは「QoS」が、ビデオを送付できる様々な品質レベルを一般的に表すのに使
用する名称である。階層ビデオ符号化スキームは、様々なビデオ品質にアプリケ
ーションが対応できるようにするある範囲のQoSを提供する。例えば、インタ
ーネットを介して送信されたビデオデータを扱うように設計されたアプリケーシ
ョン(例えば、マルチパーティビデオ会議)は、インターネットを形成する多数
の異種のサブネットワークを介してデータを経路指定する際に固有の常に変化す
るデータ転送速度に迅速に対応しなければならない。受信側におけるビデオのQ
oSが、現在利用可能などのような帯域幅にも、動的に適合されなければならな
い。階層ビデオ符号化は、この問題に対する効率的な手法である。その理由は、
階層ビデオ符号化が、ビデオソースの単一の表現をある範囲の品質レベルで復号
化して提示することが可能ないくつかの層に符号化するからである。
符号化スキームでは、層のそれぞれに関する階層依存関係が存在する。より高位
の層は、通常、より下位の層に関する、または前の予測フレームの中の同位の層
に関するすべてのデータが存在しているときにだけ復号化することができる。あ
る層の情報が欠けている場合、同位の層またはより高位の層に関するどのデータ
も役立たない。ネットワークアプリケーションでは、この依存関係により、階層
符号化スキームは、特に下位の層においてパケット損失の許容度が非常に低くな
る。階層ストリームにおいて損失率が高い場合、受信側におけるビデオ品質は、
非常に劣悪である。
arity Scalable)」または「FGS」として知られる従来の階層
符号化スキーム20を描いている。第1のイントラフレーム(intrafra
me)、つまりイントラフレーム22と、それに続いてイントラフレーム22か
ら予測された2つの予測フレーム24および26を含む3つのフレームが示され
ている。フレームは、4つの層、基本層28、第1の層30、第2の層32、お
よび第3の層34に符号化される。基本層は、通常、再生されたとき、見る人に
とって最低限で許容可能なビデオデータを含む。各追加の層が、基本層を拡張す
るビデオデータの増分式に増える構成要素を含む。これにより、ビデオの品質が
、各追加の層とともに向上する。この技法は、Weiping Li著、「Fi
ne Granularity Scalability Using Bit
−Plane Coding of DCT Coefficients」とい
う名称の論文、ISO/IEC JTC1/SC29/WG11、MGEG98
/M4204(1998年12月)で説明されている。
て送信することができ、ビデオの品質レベルは、各サブストリームが受信され、
復号化されるにつれて向上する。基本層ビデオ28は、誤りまたはパケット損失
を最小限に抑えるようによく制御されたチャネルで伝送される。言い換えれば、
基本層は、最小限のチャネル帯域幅に合うように符号化される。目標は、最低限
の品質のビデオを提供するように少なくとも基本層28を送付して復号化するこ
とである。ネットワーク条件がビデオ品質(例えば、表示サイズ、解像度、フレ
ーム速度等)を向上させるのを許すにつれ、拡張30〜34層が送付され、復号
化される。さらに、選好および能力に従って特定の品質を得るため、これらの層
の特定の部分つまりサブセットを選択して復号化するようにデコーダを構成する
ことができる。
中の基本層28から予測式に符号化されることである。図1に示す通り、予測フ
レーム24および26の中の拡張層30〜34のそれぞれを先行するフレームの
基本層から予測することができる。この例では、予測フレーム24の拡張層をイ
ントラフレーム22の基本層から予測することができる。同様に、予測フレーム
26の拡張層を先行する予測フレーム24の基本層から予測することができる。
な信頼性を提供する。基本層からすべての拡張層を予測することにより、伝送中
の1つ以上の拡張層の損失または破壊を基本層からの拡張層の再構成によって修
復することができる。例えば、フレーム24に、伝送中、何らかの誤りが生じた
と想定する。この場合、先行するイントラフレーム22の基本層28を使用して
フレーム24の基本層および拡張層を予測することができる。
ことから、符号化および圧縮の点で非常に非効率であるという相当な欠点を有す
る。したがって、誤り回復を犠牲にすることなく効率的である階層符号化スキー
ムが、必要とされることに変わりない。
よびJohn Arnold著、「Results on Fine Gran
ularity Scalability」という名称の論文、ISO/IEC
JTC1/SC29/WG11、MPEG99/m5122(1999年10
月)で紹介される技法を使用して3つのフレームが符号化されている別の従来の
階層符号化スキーム40を描いている。3つのフレームは、第1のフレーム42
と、それに続く第1のフレーム42から予測された2つの予測フレーム44およ
び46を含む。フレームは、4つの層、基本層48、第1の層50、第2の層5
2、第3の層54に符号化されている。このスキームでは、フレームの中の各層
は、前のフレームの同位の層から予測される。例えば、予測フレーム44の拡張
層を前のフレーム42の対応する層から予測することができる。同様に、予測フ
レーム46の拡張層を前のフレーム44の対応する層から予測することができる
。
有する。ただし、この符号化スキームは、データ損失から容易に回復することが
できないという重大な欠点を抱えている。拡張層において誤りまたはパケット損
失が生じると、その誤りまたはパケット損失が、GOP(予測フレームのグルー
プ)の終りまで伝播し、後続の予測フレームのより高位の層において深刻なドリ
フトが引き起こされる。後に十分な帯域幅が存在していてさえも、デコーダは、
別のGOPが開始するまで最高品質を回復することができない。
ビデオ符号化スキームが、必要とされることに変わりない。
ブル(PFGS)階層符号化を使用して、比較的低品質のビデオの基本層および
順により高品質になるビデオの複数の拡張層を含む複数の層にビデオデータフレ
ームを符号化する。現行のフレームの中の拡張層のいくつかが、基準フレームの
中の少なくとも1つの同じ品質の層またはより低品質の層から予測され、より低
品質の層は、必ずしも基本層ではない。
層を含む複数の層にビデオデータのフレームを符号化する。基本層は、最低品質
のビデオデータを含み、拡張層は、順により高品質になるビデオデータを含む。
予測フレームの中の層は、基本層と1つ以上の拡張層の両方から予測される。
の差として定義される。離散コサイン変換(DCT)などの一次変換を使用する
場合、予測された剰余の係数が、元のイメージのDCT係数と予測イメージのD
CT係数の差に等しい。PFGS符号化スキームは、予測のための複数の基準層
を使用するので、この符号化スキームは、複数のセットの予測DCT係数をもた
らす。予測DCT係数は、予測のためにどのような基準層が使用されたかに応じ
てその品質に幅がある。より低品質の予測DCT係数(または「LQPD」)が
、基本層などのより低品質の基準層を使用することによってもたらされる。より
高品質の予測DCT係数(または「HQPD」)が、より高品質の拡張層を基準
として使用することによってもたらされる。
をもたらすことである。この理由は、基準層が、より高品質であり、したがって
、元のイメージにより近いからである。より低いDCT剰余は、符号化層の数が
より少なくなることを意味し、これにより、より良好な符号化効率がもたらされ
る。この予期は、平均値の点では妥当であるが、DCT剰余の様々な品質は、フ
レーム間の動き、およびその他の理由により変動する傾向がある。いくつかの場
合、HQPD係数の中の個々のDCT剰余は、より低品質の層を基準として生成
したDCT剰余(すなわち、LQDP係数の中の剰余)と比べて、実際に増大す
る。望ましくない変動および増大の結果、符号化の効率が低下する。
T係数の変動をなくすため、HQPD係数は、基本層および低位の拡張層の一部
であるか、または基本層および低位の拡張層に部分的に符号化しなければならな
い。ただし、実際には、より低品質のLQPD係数だけが、基本層および低位の
拡張層の中で符号化されている。
化されたLQPD係数からHQPD係数を予測することにより、これらの変動を
効率的になくす。これらの予測HQPD係数、または予測HQPD係数から導出
された高品質剰余をエンコーダとデコーダの両方において計算することができる
。それでも最大限度を超えるHQPD予測からのあらゆる剰余を例外として、基
本層および低品質の拡張層を含むビットストリームを変更する必要がない。予測
HQPD係数の使用が、符号化に先立つ大きな変動をなくすことにより、符号化
効率を向上させる。
する階層ビデオ符号化スキームを説明する。符号化スキームは、インターネット
または無線網などのネットワークを介してビデオデータを送付するコンテキスト
で説明する。ただし、階層ビデオ符号化スキームは、多種多様な環境に対する一
般的適用可能性を有する。
び/またはネットワーク64を介してクライアント66に配信するビデオ配信シ
ステム60を示している。ネットワークは、インターネット、LAN(ローカル
エリアネットワーク)、WAN(ワイドエリアネットワーク)、SAN(ストー
レッジエリアネットワーク)および無線網(例えば、サテライト、セルラー、R
F等)を含む多数の異なるタイプのネットワークを代表している。
および配信するように構成された1つ以上のサーバコンピュータとしての形態を
含め、多くの仕方で実装することができる。コンテンツプロデューサ/プロバイ
ダ62は、デジタルビデオファイル72をストアするビデオストレージ70、お
よびビデオデータを符号化し、ネットワーク64を介してビデオデータを配信す
る配信サーバ74を有する。サーバ74は、プロセッサ76、オペレーティング
システム78(例えば、Windows(登録商標)NT、Unix(登録商標
)等)、およびビデオエンコーダ80を有する。ビデオエンコーダ80は、ソフ
トウェア、ファームウェア、および/またはハードウェアで実装することができ
る。エンコーダは、説明のため、別個の独立型モジュールとして示しているが、
プロセッサ76の一部として構成すること、またはオペレーティングシステム7
8または他のアプリケーション(図示せず)に組み込むことも可能である。
データ72を符号化する。より具体的には、エンコーダ80は、プログレッシブ
ファイングラニュラリティスケーラブル(progressive fine
granularity scalable)(PFGS)階層符号化スキーム
を使用する。ビデオエンコーダ80は、基本層および1つ以上の拡張層を含む複
数の層にビデオを符号化する。「ファイングラニュラリティ」符号化とは、任意
の2つの層の間の差が、小さい場合でさえ、デコーダによって使用されてイメー
ジ品質を向上させるのが可能であることを意味する。ファイングラニュラリティ
階層ビデオ符号化は、現行のビデオフレームのより低位の層からの次のビデオフ
レームの予測が、ビデオ符号化全体の効率を保つだけ十分に良好であることを確
実にする。
成要素82およびビデオデータを1つ以上の拡張層に符号化する拡張層符号化構
成要素84を有する。ビデオエンコーダは、ビデオデータを符号化し、現行フレ
ームの中の拡張層のいくつかが、基準フレームの中の少なくとも1つの同品質の
層またはより低品質の層から予測されるようにし、より低品質の層は、必ずしも
基本層ではない。また、ビデオエンコーダ80は、より高位の拡張層の中のデー
タを予測するビットプレーン符号化(bit−plane coding)構成
要素86も含む。ビデオエンコーダ80の様々な実施形態を以下に図9、図19
、および図21を参照してより詳細に説明する。
ア出力装置94を備えている。メモリ92は、プロセッサ90上で実行されるオ
ペレーティングシステム96(例えば、Windows(登録商標)ブランドの
オペレーティングシステム)をストアする。オペレーティングシステム96は、
クライアント側ビデオデコーダ98を実装して階層ビデオストリームを元のビデ
オに復号化する。データが損失した場合、デコーダ98は、正常に転送されたフ
レームからビデオの欠落した部分を再構成することができる。クライアント側デ
コーダ98は、基本層復号化構成要素95、拡張層復号化構成要素97、および
オプションとして、ビットプレーン符号化構成要素99を有する。ビデオエンコ
ーダ80の様々な実施形態を以下に図20および図22を参照してより詳細に説
明する。
メディア出力装置94を介して再生する。クライアント26は、コンピュータ、
ハンドヘルドエンターテイメント装置、セットトップボックス、テレビジョン、
特定用途向けIC(ASIC)などを含む多くの異なる仕方で実現することがで
きる。
、現行のフレームの中の拡張層のいくつかが、必ずしも基本層ではない基準フレ
ームの中の少なくとも1つのより低品質の層から予測されるようにする。このF
PGS階層符号化スキームを実装する多くの仕方が存在する。説明の目的で、ま
たこのスキームの利点を指摘するために一例を図4に示す。
スキーム100を概念的に示している。エンコーダ80が、ビデオデータのフレ
ームを基本層および複数の拡張層を含む複数の層に符号化する。説明の目的で、
図4は、4つの層、基本層102、第1の層104、第2の層106、および第
3の層108を示している。上位の3つの層104〜108が、基本ビデオ層1
02に対する拡張層である。本明細書で、層という用語は、空間的層またはSN
R(品質層)、あるいはその両方を指す。5つの連続フレームを説明の目的で示
している。
て予測イメージを形成することによって補償される。予測からもたらされた剰余
が、元のイメージと予測イメージの間の差として定義される。例として、元のイ
メージを変換するのに使用する1つの一次変換が、離散コサイン変換(DCT)
である。その線形性のため、予測剰余のDCT係数は、元のイメージのDCT係
数と予測イメージのDCT係数の差に等しい。
、剰余を符号化するのに必要な層の数に基づく。例えば、最大剰余を2進形式に
おいて5ビットで表すことができるものと想定する。この場合、そのような剰余
を符号化するのに5つの拡張層が使用され、第1の層を使用して最上位ビットを
符号化し、第2の層を使用して最上位の次のビットを符号化し、以下同様である
。
またはより低品質の層から予測されるが、この層は、必ずしも基本層ではない。
示す例では、基本層符号化を例外として、予測フレーム(Pフレーム)の中のい
くつかの拡張層の予測は、再構成された基準フレームの1つ下の層に基づく。こ
の場合、偶数フレームは、先行するフレームの偶数層から予測され、また奇数フ
レームは、先行するフレームの奇数層から予測される。例えば、偶数フレーム2
が、先行するフレーム1の偶数層(すなわち、基本層102および第2の層10
6)から予測される。奇数フレーム3の層が、先行するフレーム2の奇数層(す
なわち、第1の層104および第3の層106)から予測される。偶数フレーム
4の層が、やはり、先行するフレーム3の偶数層から予測される。この交互パタ
ーンが、ビデオビットストリームの符号化全体にわたって続く。さらに、同一フ
レームの中のより低位の層と1つ高位の層の間の相関も、より高い符号化効率を
得るのに利用することができる。
スキームは、以下の関係式で一般的に表現されるクラスの符号化スキームにおけ
る特殊例を例示するものである。
、またMは、フレームグループ深度を示す。層グループ深度は、どれだけの数の
層が、ある共通の基準層を基準としていることが可能かを定義する。フレームグ
ループ深度は、予測目的で一緒にグループ化されるフレームまたは周期の数を示
す。
用される。方程式が真である場合、層は、先行する再構成されたフレームの中の
より低位の基準層に基づいて符号化される。
深度がともに2であるときの特殊ケースである。したがって、この関係式は、N
=Mであるため、L mod N=i mod Nに変更することができる。N
=M=2であるこのケースでは、フレームiが2であり、層Lが1(すなわち、
第1の層104)であるとき、値L mod Nは、i mod Nの値に等し
くなく、したがって、再構成された基準フレーム1の1つ低位の基準層(すなわ
ち、基本層102)が使用される。フレームiが2であり、層Lが2(すなわち
、第2の層106)である場合、値L mod Nは、i mod Nの値に等
しく、したがって、基準フレームのより高位の層(すなわち、第2の拡張層10
6)が使用される。
ム2および4に関して、先行するフレーム1および3の偶数層(すなわち、基本
層102および第2の層106)がそれぞれ基準として使用され、一方、奇数フ
レーム3および5に関して、先行するフレーム2および4の奇数層(すなわち、
第1の層104および第3の層108)がそれぞれ基準として使用されるものと
する。
の予測パスがいくつかのフレームにわたって維持される限り、使用される予測を
ランダムに割り当てることができる、より一般的なケースのやはり特殊ケースで
ある。
提案の符号化スキームは、インターネットまたは無線チャネルを介するビデオ伝
送に提供するとき、特に有益である。1つの利点は、ドリフト問題なしに、符号
化されたビットストリームをチャネルの利用可能な帯域幅に適合させるのが可能
であることである。
示している。破線10が、伝送されるビデオ層をたどっている。フレーム2およ
び3において、帯域幅の減少が存在し、これにより、伝送できるデータの量が制
限される。これら2つのフレームにおいて、サーバは、より高位の層のビットを
単にドロップする(すなわち、第3の層108が、フレーム2からドロップされ
、また第2の層106および第3の層108が、フレーム3からドロップされる
)。ただし、フレーム3の後、帯域幅が再び増大し、サーバは、より多数の層の
ビデオビットを伝送する。フレーム5までに、クライアントにおけるデコーダは
、最高品質のビデオ層を再び獲得することができる。
可能性があるより高位のビデオ層をいくつかの所定のフレームの後、より低位の
層から回復できることである。図6は、フレーム3の第3の層および第4の層が
、受信側クライアントにおいて正しく受信されない例を示している。この場合、
破線の矢印で表す通り、フレーム3の第3の層106を先行する基準フレーム2
の第1の層104から部分的に再構成することができる。この結果、ビデオビッ
トストリームの符号化および伝送を全くやり直す必要がない。ビデオのすべての
層が、単一のビットストリームの中に効率的に符号化され、埋め込まれる。
macroblock)を符号化するために使用されるとき、非常に優れた誤り
回復力特性(error resilience property)を示すこ
とである。誤りが生じやすいネットワーク(例えば、インターネット、無線チャ
ネル等)では、ときとして極めて頻繁にパケット損失または誤りが生じる可能性
が高い。どのようにこれらのパケット損失または誤りから優美に回復するかは、
多くの活発な研究の主題となっている。図4の階層符号化スキーム100では、
基本層102にパケット損失または誤りが全くない限り、伝送をやり直すこと、
またはドリフト問題なしに、より高位の層の中のパケット損失/誤りをいくつか
のフレームを介して常に優美に回復できるのを示すことが可能である。
20が、基準フレームの中の基準マクロブロック124をポイントする例を示し
ている。基準MB124は、基準フレームの中の元のMBの境界と必ずしも揃っ
ていない。最悪ケースでは、基準MB124は、基準フレームの中の4つの隣接
するMB126、128、130、および132からのピクセルで構成される。
りが生じ、MB126〜132のそれぞれが、最大限誤りのない層に再構成され
ていると想定する。例えば、MB126〜132が、層M1、M2、M3、およ
びM4においてそれぞれ再構成されている。基準MB124は、再構成された層
のうち最低限の層(すなわち、min(M1、M2、M3、M4))に等しい層
において、基準フレームの中の再構成された4つの隣接するMB126〜132
からのピクセルで構成される。この結果、予測フレームの中で復号化されるMB
122は、
用される層の数に依存して、いくつかのフレームを介して誤りのないフレームが
再構成される。
実施される一般的階層符号化プロセスを示している。プロセスは、ハードウェア
および/またはソフトウェアで実施することができる。このプロセスを図3を参
照して説明する。
(または「Iフレーム」)の中の各マクロブロックを異なる層に符号化する。図
4を参照して、フレーム1がIフレームであり、またエンコーダ80が基本層お
よび3つの拡張層102〜108を形成するものと想定する。ステップ152で
、エンコーダ80が、各予測フレーム(または「Pフレーム」)を異なる層に符
号化する。フレーム2がPフレームであると想定する。エンコーダ80は、従来
の技法に従ってフレーム2の基本層102を符号化し、また関係式L mod
N=i mod Mに従ってフレーム2の拡張層104〜108を符号化する。
らにPフレームが存在するかどうかを評価する。存在する場合(すなわち、ステ
ップ154からの「はい」の分岐)、次のPフレームが同じ仕方で符号化される
。そうでない場合、グループに関するすべてのPフレームが符号化されている(
ステップ156)。
レームが符号化されるまで続く。その後、符号化されたビットストリームを圧縮
形式でビデオストレージ70の中にストアし、および/またはサーバ74からネ
ットワーク64を介してクライアント66に伝送することができる(ステップ1
60)。伝送の際、サーバは、割り振られた帯域幅の中で基本層を伝送して基本
層の送付を確実にする。また、サーバは、帯域幅の可用性に応じて1つ以上の拡
張層を伝送する。帯域幅の変動に応じて、サーバは、変化するネットワーク条件
に対応するようにより多い、またはより少ない拡張層を伝送する。
用可能な層までIフレームを復号化する(ステップ162)。次に、デコーダ9
8が、利用可能な層まで各Pフレームの中の各マクロブロックを復号化する(ス
テップ164)。1つ以上の層が受信されなかった場合、または誤りを含んでい
る場合、デコーダ98が、同じフレームまたは前のフレームのより低位の層から
層を再構成しようと試みる(ステップ166)。デコーダは、符号化されたビッ
トストリームの中のすべてのPフレームおよびIフレームを復号化する(ステッ
プ168〜172)。ステップ174で、クライアントが、復号化されたビット
ストリームをストアし、および/または再生する。
イルを符号化するようにサーバ74によって使用されるビデオエンコーダ80の
例としての実施形態を示している。ビデオエンコーダ80は、層グループ深度N
とフレームグループ深度Mがともに2に等しい図4に示した階層符号化スキーム
に従ってビデオデータを符号化するように構成されている。
2および拡張層エンコーダ84を有する。ビデオエンコーダ80は、ビデオデー
タ入力ストリームを受信して、そのビデオデータをIフレームとPフレームに分
離するフレーム分離器202を含む。Pフレームは、Iフレームの中の位置から
Pフレームの中の別の位置へのオブジェクトの移動を推定する動き推定器(es
timator)204に送られる。また、動き推定器204は、現行の入力に
関する基準として、フレームメモリ0の中にストアされた前の再構成フレーム、
ならびにフレームメモリ0ないしn−1の中にストアされた異なるSNR(信号
対雑音比)解像度を有する基準層も受け取る。
構成フレームの1つ低位の層から予測して、動き予測を可能な限り正確にする。
例えば、拡張層jが、フレームメモリj−1の中にストアされた基準再構成フレ
ームの層j−1によって予測される。動き推定器204は、結果を動き補償器(
compensator)206に出力する。動き推定器204および動き補償
器206は、従来のMPEG符号化において使用される周知の構成要素である。
させられたフレーム差(DFD)が、8×8ブロックに分割される。時刻tにお
ける基本層の中のDFDイメージのブロックkが、以下の通り与えられる。
x,y)は、時刻tにおける元のイメージであり、またft-1,0(x,y)は、
時刻t−1における基準再構成イメージの基本層である。ベクトル(Δx,Δy
)は、ft-1,0(x,y)を基準とするブロックkの動きベクトルである。
8によって変換され、次に、モジュール210において量子化関数Qによって量
子化される。基本層のビットストリームは、以下の通り、可変長テーブル(VL
T)212を使用して量子化されたDCT係数を変換することによって生成され
る。
ization)関数Q-1にも通す。したがって、基本層の中の復号されたDC
T係数は、以下の通りである。
る。このDCT係数は、n個のフレームメモリステージに渡される。基本ステー
ジ0を除くすべてのステージにおいて、DCT係数は、拡張層エンコーダ84か
らの係数に加算される。次の、この係数が逆DCT(IDCT)モジュール21
6(0)、216(1)...216(n−1)を通るようにし、結果が、フレ
ームメモリ218(0)、218(1)...218(n−1)の中にストアさ
れる。フレームメモリ218の内容が、動き推定器204にフィードバックされ
る。
である。
、および量子化モジュール210からの量子化されたDCT係数を受け取り、拡
張ビットストリームを生成する。8×8ブロックの中のすべてのDCT係数剰余
を取り込んだ後、基準発見(find reference)モジュール220
が、剰余の絶対値を表すランレングス記号を形成する。剰余ブロックの64個の
絶対値をジグザグな順序で1次元アレイに配列し、メモリ222の中にストアす
る。モジュール224が、すべての絶対値の最大値を以下の通り計算する。
る拡張層の数を決める。この場合、可変長符号化(VLC)を使用してn個の拡
張層を符号化するn個のビットプレーン(bit−plane)226(1)〜
226(n)が存在する。
の通りである。
拡張層iを符号化した後、DCT係数領域の剰余は、以下の通りである。
合計値は、以下の通りである。
ている。ステップ300で、ビデオエンコーダが、IフレームとPフレームを区
別する。Iフレームの符号化に関して、ビデオエンコーダは、対応するビットス
トリームを生成し、様々なフレームメモリ218(0)〜218(n−1)を更
新する。例えば、基本層を符号化してフレームメモリ0の中にストアする(ステ
ップ302および304)。拡張層1を符号化してフレームメモリ1の中にスト
アする(ステップ306および308)。これが、すべての拡張層1ないしnに
関して続けられ、拡張層n−1の符号化結果が、フレームメモリn−1の中にス
トアされる(ステップ310、312、および314)。
化を行う。基本層と第1の拡張層はともに、フレームメモリ0の中の基本層を基
準として使用する(ステップ320および322)。Pフレームの中のこれらの
層の符号化結果が、フレームメモリ0を更新するのにも使用される。Pフレーム
の中の残りの拡張層は、符号化されてフレームメモリ1を更新するのに使用され
る拡張層2(ステップ324)、および符号化されたフレームメモリn−1を更
新するのに使用される拡張層n(ステップ326)で示される通り、1つ低位の
層を基準として使用する。
うに階層化が実施されるかを明確に伝える目的で、n個のフレームメモリ218
(0)〜218(nー1)を描いていることに留意されたい。ただし、実施の際
、フレームメモリ218の数をほどんど1/2に削減することが可能である。図
4の符号化スキームでは、偶数フレーム(例えば、フレーム2および4)に関し
て、前のフレームの偶数層(例えば、フレーム1および3の第2の層)だけが予
測のために使用され、奇数層は使用されない。したがって、エンコーダ80は、
予測のためにフレームメモリの中に前のフレームの偶数層をストアするだけでよ
い。同様に、奇数フレーム(例えば、フレーム3および5)に関して、前のフレ
ームの奇数層(例えば、フレーム2および4の第1の層102および第3の層1
08)が予測のために使用され、偶数層は使用されない。その時点で、エンコー
ダ80は、予測のためにフレームメモリの中に奇数層だけをストアしている。し
たがって、実際には、エンコーダにn/2個のフレームバッファを実装してより
高位の拡張層の交互の符号化に対応することが可能である。さらに、エンコーダ
は、基本層のために1つの追加フレームを使用する。したがって、図4の符号化
スキームを実施するのに必要なフレームメモリの総数は、(n+1)/2である
。
拡張層を基準とすることにより、イメージが元のイメージから予測される。図4
では、フレーム2の中の基本層および拡張層が、前のフレーム1の中の基本層お
よび第2の拡張層を基準とする。フレーム3の中の基本層および拡張層は、前の
フレーム2の中の基本層および第1の拡張層を基準とする。拡張層の品質は、基
本層の品質より高いので、PFGS符号化スキームは、符号化効率を維持しなが
ら、任意の所与のビデオ層に関して、動き予測を可能な限り正確にする。
の間の差として定義される。一次DCT変換を使用する場合、予測された剰余の
DCT係数は、元のイメージのDCT係数と予測イメージのDCT係数の差に等
しい。図4の符号化スキームは、予測のために2つの基準層を使用するので、こ
の符号化スキームは、次の2組の予測されたDCT係数を生成する。(1)基本
層などの低品質の基準層を基準とすることによって形成された予測イメージの第
1のセットの予測されたDCT係数、および(2)拡張層などのより高品質の基
準層を基準とすることによって形成された予測イメージの第2のセットの予測さ
れたDCT係数。便宜のため、第1のセットのDCT係数を低品質予測DCT(
LQPD)係数と呼び、また第2のセットのDCT係数を高品質予測DCT(H
QPD)係数と呼ぶ。他の符号化スキームでは、2組より多くの予測されたDC
T係数を生成するのも可能であることに留意されたい。
り、基準層が高品質であり、したがって、元のイメージにより近いため、より高
い効率の符号化がもたらされることである。これは、平均の点からは真実である
が、より低品質の層を基準とすることによってもたらされるDCT剰余(すなわ
ち、LQPD係数剰余)と比べて、実際に増大するHQPD係数における個々の
DCT剰余が存在する。この望ましくない増大は、フレーム間の動き、およびそ
の他の理由によるものであり、剰余を符号化するのにより多くのデータが必要と
されるため、結果として符号化の効率がより低くなる。
余を導入する可能性があるか(より低品質の基準と比べて)の例を提示している
。この例では、周知のMPEG試験シーケンスである「コーストガード(Coa
stguard)」として知られるシーケンスの第3のフレームの第398のブ
ロックからデータが選択されている。
ックの中の基本層から予測された予測層400の1組の低品質予測DCT(LQ
PD)係数を示している。予測層400は、8×8アレイのピクセルに関するL
QPD係数を含んでいる。このLDPD係数は、ビットストリームに符号化され
るのに先立って量子化される。
って生成された予測基本層402を示している。層402の中の量子化されたD
CT係数は、可変長符号化などの符号化プロセスを使用して基本層のビットスト
リームに圧縮される。層402の中の量子化されたLQPD係数は、量子化誤り
がどれほどの規模であるかを判定するため、続いて復号される。層400の中の
LQPD係数と層402の中の復号されたLQPD係数の差が、DCT領域にお
ける剰余を形成する。このDCT剰余をビットプレーン符号化を使用して圧縮し
て、拡張層のビットストリームを形成する。DCT剰余は、2進形式で表現され
、したがって、その2進値に従っていくつかのビットプレーンの層に符号化する
ことができる。ビットプレーンレベルの最大数は、最大剰余値を2進形式で表現
するのに必要なビット数に設定される。
係数の差からもたらされたDCT係数を符号化するのに使用される5つの拡張層
404、406、408、410、および412を示している。この場合、最大
DCT剰余は、16であり、この剰余は、5桁の2進数「10000」で表すこ
とができ、5つの拡張層404〜412を使用して符号化することができる。8
×8アレイの位置(1,1)の係数を考慮されたい。層400のLQPD係数は
、「36」であり、基本層402の復号されたLQPD係数は、「35」である
。差は「1」(すなわち、36−35=1)であり、この差を5桁の2進値で「
00001」として表すことができる。したがって、各拡張層404〜412の
位置(1,1)が、集合として値「00001」を定義する。
いて、絶対剰余値が、複数の層構造の中で符号化され、符号ビットが一回、符号
化される。符号ビットは、別々に符号化され、したがって、図13の層構造は、
DCT係数の絶対剰余を示す。一般に、各剰余値の符号ビットは、最上位ビット
に続く1ビットで符号化される。2進数「1」が正を表し、2進数「0」が負を
表す。例えば、位置(3,4)の符号ビットが、第1の拡張層404の中で「0
」に符号化され、また位置(1,2)の符号ビットが、第2の拡張層406の中
で「1」に符号化される。
および第2の拡張層406)が、DCT剰余のより大きいビット、つまりより上
位のビットを効果的に符号化する。例えば、8(すなわち、43−35=8)で
あるアレイ位置(1,2)に対応するDCT剰余を考慮されたい。この値は、「
01000」として符号化され、第2の拡張層406の中の「1」ビットをもた
らす。同様に、より大きい剰余が位置(3,4)に生じ、第1の拡張層404の
中で「1」ビットがもたらされる。
的に「符号化されたDCT」または「ECD」と呼ぶ。例えば、第1の拡張層4
04が、低位の拡張層として符号化されたと想定する。ECD係数は、基本層4
02および第1の拡張層404の中のDCT係数の合計である。
係数420を示している。第1の拡張層404は、8×8アレイの中の位置(3
,4)に単一の2進数「1」を有することに留意されたい。この「1」ビットは
、5ビット数「1××××」の中の最上位ビットであり、したがって、値16を
表す。基本層402の対応する位置(3,4)の値「0」に16を加算すること
により、位置(3,4)において符号化された層420の中で示される通り、「
16」の絶対符号化値がもたらされる。この場合も、次の1ビットにより、負の
符号が規定される。この場合、次のビットは、「0」であり、負を示す。
数(図14)の差から導出された層430の中の低品質DCT剰余を示している
。この剰余は、位置(4,3)における15の最大絶対値から0の最小絶対値ま
での範囲にある。
ックの中の第2の拡張層から予測された予測拡張層440の例としての1組の高
品質予測DCT(HQPD)係数を示している。より高品質の拡張層が基準とし
て使用されるため、予測イメージが元のイメージにより近くなるものと予期され
る。この結果、予期されるのは、HQPD係数に関連する剰余が、LQPD係数
に関連する剰余より小さくなるはずであり、これにより、より高い符号化効率が
可能になることである。ただし、常にそうなるわけではない。
導出された層450の中の高品質DCT剰余を示している。高品質DCT剰余を
層430の中の低品質DCT剰余(図15)と比較すると、剰余には大きな幅が
あることが明白である。つまり、異なる品質の層を基準として使用することによ
って引き起こされる剰余値の変動が存在する。また、すべての個々の高品質DC
T剰余が、対応する低品質DCT剰余よりも小さいわけではないのも明白である
。例えば、位置(2,1)および(1,2)における「29」および「10」の
高品質DCT剰余は、それぞれ、「10」および「8」の対応する低品質DCT
剰余より大きい。さらに、位置(2,1)における高品質DCT剰余は、「29
」であり、この剰余は、拡張層1が既にビットストリームの一部として形成され
ているため、剰余の4つのビットプレーンによって許容される符号化範囲を超え
る。この場合、符号化効率は、良好な方法により、運悪く、利用可能なビットプ
レーンの数を超過することがもたらされることに起因して、急速に低下する。高
品質DCT係数の自乗平均(mean square)は、低品質DCT係数の
自乗平均より小さいが、異なる品質の層を基準として使用することに起因して変
動するいくつかの個々のDCT剰余が、やはり存在する。
とによって引き起こされる変動を効率的になくすように構成する。理想的には、
この変動をなくすため、HQPD係数も、基本層および低位の拡張層の中で符号
化しなければならない。ただし、実際には、LQPD係数だけが、基本層および
低位の拡張層の中で実際に符号化される。したがって、剰余の変動を効果的にな
くすため、基本層および拡張層の中に符号化されたDCT係数からHQPD係数
を予測しなければならない。
号化DCT(ECD)係数からHQPDを予測するように構成する。HQPD係
数は、デコーダ98の中で明確に利用可能ではないが、基準層のDCT係数、お
よび符号化DCT係数は、エンコーダにおいても、デコーダにおいてもともに利
用可能である。図3に示す通り、エンコーダ80およびデコーダ98は、それぞ
れ、ビットプレーン符号化に関するHQPD係数の予測を行う、事前予測ビット
プレーンコーダ(ABPC)86および99を備えている。
ができる係数を予測するための2つの可能な方法を提示する。第1の方法は、損
失なしに再構成されたイメージを回復できる。第2の方法は、すべての層におけ
る再構成されたイメージに何らかの軽微な誤りをもたらすが、低い計算上の複雑
さのため、リアルタイムの用途に非常に適している。
とのできるLQPD係数を考慮されたい。
後の前の基本層の予測イメージのDCT係数を表す。基本層および低位の拡張層
の中で符号化された再構成されたDCT係数を以下の通り記述することができる
。
の拡張層の中のビットプレーン量子化を含む。モジュラー関数
されたステップであるだけでなく、スカラ量子化およびビットプレーン量子化を
含む量子化されたパラメータも表す。
表す。
は、HQPD係数に対応するECD値、
D値が、以下の通り得られる。
2つの予測イメージのDCT係数、DCToおよびDCThに関する。この第1の
項の中の要素は、エンコーダ80とデコーダ98の両方において利用可能である
。
された誤りである。この第2の項は、デコーダ98にとって利用可能ではない。
ただし、その確率密度分布を使用して
分布および一般ガウス密度(Generalized Gaussian De
nsity)(GGD)分布である。ラプラス分布に関しては、R.C.Rei
ningerおよびJ.D.Gibson著、「Distribution o
f two−dimentional DCT coefficients f
or images」という名称の論文、IEEE trans.com.Vo
l 31、835〜839ページ、(1983年)が、イメージのほどんどのD
CT係数が相当によくラプラス分布としてモデル化されることをコルモゴロフ−
スミルノフ(Kolmogrov−Smirnov)試験の使用が示すのを説明
している。GGDは、F.Muller著、「Distribution sh
ape of two−dimensional DCT coefficie
nts of natural image」という名称の論文、Electr
on.Letter、Vol 29、1935〜1936ページ、(1993年
)で説明されており、著者は、GGD関数でイメージのDCT係数をモデル化す
ることが、ラプラシアンと比べて相当に小さい試験統計上のχ2をもたらすこと
を示している。
GGD分布の方がより好ましい。一般ガウス密度関数は、以下の通り与えられる
ことを思い起されたい。
の場合、形状パラメータは、2(すなわち、v=2.0)であり、一方、ラプラ
ス分布の場合、形状パラメータは、1(すなわち、v=1.0)である。導出し
たパラメータを使用して、1組のサンプルに関するGGDソースを迅速かつ正確
にモデル化することができる。GGD形状における形状パラメータvのこの柔軟
性により、DCT係数の多様な統計上の特性を効率的にキャプチャすることが可
能となる。
計として書き直すことが可能である。
において入手可能ではない。予測値
計分布特性を有する最適量子化Yから導出される。1つの問題は、ゼロビンのス
テップおよびゼロではないビンのステップをどのように計算するかに関する。
Grace Chang、Bin Yu、およびMartin Vetterl
i著、「Lossy Compression and Wavelet Th
resholding for Image Denoising」という名称
の、IEEE Transactions on Image Process
ingに提出された論文で説明される方法は、以下の通り、ほぼ最適なしきい値
を得る。
れたYは、Tより大きい場合、ゼロではない。そうではない場合、量子化された
Yは、ゼロに設定される。パラメータσは、記号εから推定することができる。
パラメータσxおよびvは、R.L.JoshiおよびT.R.Fischer
著、「Comparison of generalized Gausian
and Laplacian modeling in DCT image
coding」という名称の論文、IEEE signal process
ing letters、Vol 2、no 5、81〜82ページ、(199
5年)で説明される方法に従って記号Xから推定することができる。
ラメータσxおよびvは、したがって、ビットストリームの一部として伝送する
のではなく、同じ方法を使用してデコーダ98の中で計算することができる。パ
ラメータσは、デコーダ98の中で推定することができないが、各層に関する何
らかの値は、経験的に導出することができる。
ることによって判定することができる。図18は、例としての一様しきい値量子
化器480、再構成されたレベルを表す中心、およびこの中心の各側にあるΔの
等間隔のk個のレベルを有するゼロではないビンを示している。境界bl-1およ
びblを有するrlの再構成された値は、以下の通りである。
、ゼロではないビンに関してblに等しい。前述のプロセスは、変動を効果的に
なくすことができる統計的な意味で最適な値
と予測値
る。例えば、X=ECT+DCTl−DCThが、しきい値Tより小さい値である
のが可能であるが、値LQPD−ECDは、それでも、剰余ビットプレーンによ
って示される最大値に近い可能性がある。そのような場合、合計は、剰余ビット
プレーンによる最大値を超える可能性がある。Xが3に等しいと想定すると、予
測値
場合、合計は、18に等しく、これは、4つの剰余ビットプレーンによって許容
される符号化範囲15を超える。このケースに関する解決策は、LQPD−EC
Dを先に進めて低位の拡張層に量子化することである。
すことができ、最上位ビットは、拡張層406の中にある。値LQPD−ECD
を16として量子化して、その剰余は、「−1」である。この場合、値LQPD
−ECDの最上位ビットは、拡張層404を先に進める。このことは、第1の拡
張層の中で値16が符号化され、最後の拡張層の中で値−1が符号化されること
を意味する。コストとして、変動が最大範囲を超えるのを回避するため、2つの
符号ビットが符号化される。前述した通り、符号ビットは、MSBに続いて符号
化する。2つの符号ビットが存在する場合、第1の符号ビットは、低位の拡張層
の中で符号化し、また第2の符号ビットは、基準を変更する層の中で符号化する
。
第1に、第2の符号ビットは、MSBが低位の層の中で符号化されている係数の
中でだけ現れる。第2に、第2の符号は、最大範囲を超える変動が小さい確率の
イベントであるため、ほとんど場合、第1の符号と同じである。
化されたLQPDに関してDCT係数を符号化することである。すべての拡張層
が、HQPD係数と復号されたLQPD係数の差を符号化する。この方法の違い
は、低位の拡張層の中で符号化されるDCT係数が、LQPD係数ではなく、H
QPD係数から導出されることである。この解決策は、基準を変更する最中にコ
ストの高い予測動作を回避することができるため、計算上の複雑さの点で低コス
トのものである。同時に、何らかの誤りが、低位の拡張層の中にもたらされる。
低位の拡張層の中で、HQPD係数と復号されたLQPD係数の差が、LQPD
係数と復号されたLQPD係数の差に取って代って符号化され、伝送される。こ
の置換が小さな誤りを導入する。
誤りが存在しないのが幸いである。この結果、低位の拡張層の中の軽微な誤りは
、PFGSの誤り回復における優れた特性のため、1つまたは2つのフレームの
中でだけ伝播する。例えば、図4のフレーム2の拡張層104の中の何らかの誤
りは、フレーム3のすべての拡張層、ならびにフレーム4の拡張層106および
108だけに影響を与える。この解決策は、計算上の複雑さの点で低コストのた
め、リアルタイムの用途に関して見合うものである。
される通り、ネットワーク64を介して配信するのに先立ってビデオデータファ
イルを符号化することができるビデオエンコーダの一例としての実施形態を示し
ている。図19で、ビデオエンコーダは、図9のエンコーダ80と区別するため
、一般的に番号80′が付けられている。図9のエンコーダ80と同様に、ビデ
オエンコーダ80′は、PFGS階層符号化スキームに従ってビデオデータを符
号化するように構成されている。ただし、エンコーダ80とは異なり、ビデオエ
ンコーダ80′は、HQPD係数を予測し、HQPD係数に基づいて高品質の剰
余を符号化して剰余の変動を除去または低減し、これにより、符号化効率を向上
させる。
うに設計されている。詳細には、示すアーキテクチャは、2つの再構成された層
が基準として使用される図4のPFGS階層符号化スキームを実施する。ビデオ
エンコーダ80′は、2つのフレームバッファ502および504を使用し、こ
れにより、符号化効率と、メモリおよび計算上の複雑さの間で良好なトレードオ
フが提供される。第1のフレームバッファ502を使用して、再構成された基本
層を予測フレームの基本層および低位の拡張層のための基準として保存する。第
2のフレームバッファ504を使用して、前のフレームの中の再構成された拡張
層をより高品質の拡張層のための基準として保存する。
する基本層エンコーダ506、および1つ以上の拡張層を符号化されたビットス
トリームに符号化する2つの拡張層エンコーダ508および509を有する。ま
た、ビデオエンコーダは、方程式(5)で与えられる予測符号化値
する。予測符号化値
イメージフレームを動き推定器204に導き、フレームの中のオブジェクトの移
動を推定する。動き推定器204が、現行の入力に関する基準として、フレーム
バッファ502の中にストアされた前の再構成されたフレームを受け取る。動き
推定器204は、結果を2つの動き補償器206および207に出力し、次に、
動き補償器206および207が、予測イメージを生成する。第1の動き補償器
206は、フレームバッファ502の中の再構成された基本層を基準とすること
によってイメージを予測する。第2の動き補償器207は、フレームバッファ5
04の中の再構成された拡張層を基準とすることによってイメージを予測する。
2つの補償器を示しているが、この2つを単一の構成要素として統合することも
可能である。動き推定器204および動き補償器206、207は、従来のMP
EG符号化において使用される周知の構成要素である。
て計算される。この差が、一次離散コサイン変換(DCT)522を使用して変
換され、方程式(1)で前述した通り、動き補償からもたらされる低品質予測D
CT(LQPD)剰余が生成される。LQPD係数が量子化器(すなわち、「Q
」モジュール)524によって量子化され、可変長コーダ(VLC)526によ
って基本層のビットストリームに圧縮される。
器(すなわち、「Q-1」モジュール)528によって復号される。復号されたL
QPD係数が、逆DCT(IDCT)530を通るようにされ、基本層が再構成
される。再構成された基本層をフレームバッファ502の中にストアする。
よび復号されたLQPD(例えば、層402の中の係数)を基本層エンコーダ5
06から受け取る。これらの係数の差が、合計540において計算されて、図1
3に示す通りビットプレーン符号化を使用して拡張層のビットストリームに符号
化することができるDCT剰余が形成される。「最大発見(find max)
」モジュール542が、DCT剰余の中のすべての絶対値の最大値を計算して、
その剰余を表現するのに必要なビットプレーンの数を判定する。次に、DCT剰
余は、ビットプレーンコーダ544によって複数のビットプレーンに符号化され
、可変長コーダ(VLC)546によって拡張層のビットストリームに圧縮され
る。複数のVLCを示しているが、基本層のデータおよび拡張層のデータに対し
て行われるすべての圧縮に関して共通のVLCを使用できることに留意されたい
。
プレーンに含まれるDCT剰余、および基本層エンコーダ506からの復号され
たLQPD係数を合計する。これは、基本的に図14に示す動作であり、基本層
402の復号されたDCT係数が第1の拡張層404に加算されて、符号化DC
T(ECD)係数420が生成される。逆DCT552が、ECD係数に関する
逆変換を計算して拡張層を再構成する。再構成された拡張層は、スイッチ556
の位置に依存して、動き補償器206からの予測基本層、または動き補償器20
7からの予測拡張層と合計554において合計される。
て計算される。この差がDCT変換562を使用して変換されて、方程式(3)
で前述した通り、動き補償からもたらされる高品質予測DCT(HQPD)剰余
が生成される。HQPD係数は、合計564に入力される。
き補償器207からの拡張層、および合計550からのECD係数を受け取る。
DCTモジュール570および572が、その基本層および拡張層を変換してD
CT係数を生成し、次に、このDCT係数がECD係数とともに予測モジュール
574に入力される。
ThのECD係数およびDCT係数を含む。予測モジュール574の出力が、予
測されたHQPD係数である。
に図17に示す動作であり、例外は、符号化されたDCT層が、予測された
り小さい剰余および相当に少ない変動を示す。
最大値を計算して、その剰余を表現するのに必要なビットプレーン(bit−p
lanes)の数を判定する。次に、この高品質のDCT剰余が、ビットプレー
ンコーダ582によって複数のビットプレーンに符号化され、可変長コーダ(V
LC)584によって拡張層のビットストリームに圧縮される。
ルを復号化する、クライアント66によって実装されることが可能な補完的ビデ
オデコーダ98′を示している。デコーダ98′は、基本層に関してビットスト
リームを復号化するビット層デコーダ602、およびビットストリームを復号化
して拡張層を回復する2つの拡張層デコーダ604および606を有する。また
、デコーダ98′は、基本的に図19のエンコーダ側APBIC510と同一で
ある事前予測ビットプレーンコーダ(APBIC)610も有する。
ームを復号化して量子化されたLQPD係数を回復する。復号化からの動きベク
トル(MV)が、動き補償器622および624に渡される。これらの係数が、
復号器(すなわち、「Q-1」モジュール)626によって復号され、次に、逆D
CT(IDCT)変換628を通るようにされて、基本層が再構成される。再構
成された基本層は、合計630を介して動き補償器622からの予測された基本
層と合計され、クリッピング(clipping)モジュール632によってク
リップされ、出力される。また、再構成された基本層は、フレームバッファ63
4の中にストアされる。
のDCT剰余を搬送するビットストリームを復号化する。回復されたDCT係数
が、合計642を介して、基本層デコーダ602からの復号されたLQPD係数
と合計されて、符号化DCT(EDC)係数が再現される。このECD係数が、
IDCT変換器644に渡されて拡張層が再構成される。再構成された拡張層は
、合計646を介して、スイッチ648の位置に依存して、動き補償器622か
らの予測された基本層または動き補償器624からの予測された拡張層と合計さ
れる。補償された拡張層が、クリッピングモジュール650によってクリップさ
れ、出力される。また、再構成された拡張層は、フレームバッファ652の中に
ストアされる。
償器624からの拡張層、および合計642からのECD係数を受け取る。DC
Tモジュール660および662が、基本層および拡張層を変換してDCT係数
を生成し、次に、このDCT係数がECD係数とともに予測モジュール664に
入力される。予測モジュール664は、方程式(5)の予測値
ThのECD係数およびDCT係数を含む。
のDCT剰余を搬送するビットストリームを復号化する。合計672が、高品質
のDCT係数と予測値
HQPD係数から拡張層を再構成する。再構成された拡張層が、合計676にお
いて動き補償器624の出力によって補償され、次に、クリッピングモジュール
678によってクリップされる。
コーダ80′の単純化したバージョンである別の例としてのビデオエンコーダ8
0″を示している。すなわち、エンコーダ80′とは異なり、図21のビデオエ
ンコーダ80″は、拡張層の中で符号化されるDCT剰余が、HQPD係数と基
本層の再構成されたDCT係数の差と等しくなるように変更されている。すべて
の拡張層が、HQPD係数と基本層の中の復号された係数の間の剰余を符号化す
る。この結果、予測は全く使用されない。したがって、このエンコーダ80″は
、コストの高い予測動作が取り除かれるため、計算上の複雑さの点で低コストの
解決策である。
QPD係数とECD係数の差ではなく、HQPD係数とECD係数の差が、符号
化中に何らかの誤りを導入する。幸いなことに、基本層の中に全く誤りが存在し
ないため、この誤りは抑え込まれる。PFGSの誤り回復の優れた特性のため、
拡張層の中の誤りは、1つまたは2つのフレームの中でしか伝播しない。この第
2の解決策は、計算上の複雑さの点で低コストのため、リアルタイムの用途にお
ける可用性が高い。
98″を示している。
てそれぞれ実施される例としてのビデオ符号化プロセスを示している。このビデ
オ符号化プロセスは、ハードウェア、ソフトウェア、またはハードウェアとソフ
トウェアの組み合わせで実施することが可能である。このプロセスを図19およ
び図21のエンコーダにさらに参照して説明する。
コーダ508の動作、および高品質拡張層エンコーダ509の動作の組み合わせ
として説明することができる。ステップ700で、基本層エンコーダ506が基
本層を表すビットストリームを符号化する。ステップ702で、低品質拡張層エ
ンコーダ508が、低品質の拡張層を表すビットストリームを符号化する。これ
は、動き補償されたイメージの低品質の予測からもたらされる低品質の剰余を符
号化することによって行われる。ステップ704で、高品質拡張層エンコーダ5
09が、基本層および低品質の拡張層から予測された値に部分的に基づき、高品
質の拡張層を表すビットストリームを符号化する。これは、部分的に低品質の剰
余から予測された予測高品質剰余を符号化することによって実施することができ
る。ビットストリームは、ディスク上にストアすること、および/またはネット
ワークを介してクライアントに伝送することが可能である。
つのサブプロセスを示している。ステップ710で、基本層エンコーダ506が
、フレームバッファ502の中にストアされた低品質の再構成された層から、低
品質の予測イメージを予測する。この予測イメージは、動き推定器204および
動き補償器206によって判定されるイメージの中のオブジェクトの動きに起因
して、元のイメージとは相当に異なる。
などの変換を使用して低品質の予測イメージを変換して、低品質予測DCT(L
QPD)係数を生成する。このLQPD係数が、量子化器524によって量子化
され(ステップ714)、可変長コーダ526によって圧縮される(ステップ7
16)。
めの1つのサブプロセスを示している。ステップ720で、基本層エンコーダ5
06が、量子化されたLQPD係数を復号する。低品質拡張層エンコーダ508
が、低品質のイメージの予測からもたらされる低品質の剰余を導出する(ステッ
プ722)。この低品質の剰余は、LQPD係数と復号されたLQPD係数の差
として計算される。
号化されて、符号化DCT(ECD)係数が形成される。ステップ726で、低
品質拡張層エンコーダ508が、可変長コーダ546を使用してそのECD係数
を圧縮する。
めの1つのサブプロセスを示している。ステップ730で、高品質拡張層エンコ
ーダ509が、第2のフレームバッファ504の中にストアされた高品質の再構
成されたイメージから、高品質の予測イメージを予測する。この予測イメージは
、動き推定器204および動き補償器207によって判定されるイメージの中の
オブジェクトの動きに起因して、元のイメージとは相当に異なっている。ステッ
プ732で、高品質拡張層エンコーダ509が、一次離散コサイン変換562な
どの変換を使用して高品質の予測イメージを変換して、高品質予測DCT(HQ
PD)係数を生成する。
のエンコーダ80″が使用されるかに依存して、わずかに異なる。エンコーダ8
0′が使用される場合、APBIC510が、ECD係数から1組の予測HQP
D係数を予測する(ステップ734)。次に、高品質拡張層エンコーダ509が
、HQPD係数と予測HQPD係数の差として高品質の剰余を導出する(ステッ
プ736)。
れる。したがって、高品質拡張層エンコーダ509は、HQPD係数とECD係
数の差として高品質の剰余を導出する(ステップ738)。
582を介して高品質の剰余を符号化する。この符号化された高品質の剰余が、
可変長コーダ584を使用して圧縮される(ステップ742)。
ライアントにおけるビデオデコーダが、そのビットストリームを復号化して基本
層、低品質の剰余、および高品質の剰余を回復する。このデータから、デコーダ
は、元のビデオイメージを再キャプチャすることができる。
明してきたが、頭記の特許請求の範囲で定義される本発明は、説明した特定の特
徴またはステップに必ずしも限定されないことを理解されたい。むしろ、特定の
特徴およびステップは、請求する発明を実施する好ましい形態として開示してい
る。
きる従来技術の階層符号化スキームを示す図である。
構成要素から予測される従来技術の階層符号化スキームを示す図である。
ークを介して符号化したビデオデータをクライアントに転送するビデオ配信シス
テムを示すブロック図である。
使用される階層符号化スキームを示す図である。
幅の可用性に応じて動的に変更できるかをさらに示す図である。
再構成したフレームの中の基準層から再構成できるかをさらに示す図である。
予測フレームの中のマクロブロックを示す図である。
法を示す流れ図である。
ンコーダを示すブロック図である。
方法を示す流れ図である。
のに使用する複数の拡張層を示す図である。
図である。
図である。
zer)によって実施される量子化レベルを示す図である。
オエンコーダを示すブロック図である。
例としてのビデオデコーダを示すブロック図である。
のビデオエンコーダを示すブロック図である。
としてのビデオデコーダを示すブロック図である。
セスを示す流れ図である。
Claims (45)
- 【請求項1】 各フレームが、低品質の基本層から順により高品質になる拡
張層までの範囲を有する複数の層を有する複数階層フレームとしてビデオデータ
が表現される階層符号化技法による前記ビデオデータを符号化するための方法で
あって、 基本層を表す第1のビットストリームを符号化すること、 1つ以上の低品質の拡張層を表す第2のビットストリームを符号化すること、
および、 前記基本層および前記低品質の拡張層から予測された値に部分的に基づいて1
つ以上の高品質の拡張層を表す第3のビットストリームを符号化すること を含むことを特徴とする方法。 - 【請求項2】 基本層を表す第1のビットストリームを前記符号化すること
は、 前記基本層を基準として使用して元のイメージを動き補償して低品質の予測イ
メージを形成すること、 前記低品質の予測イメージを変換して低品質の予測係数を形成すること、 前記低品質の予測係数を量子化して量子化された係数を形成すること、および
、 可変長符号化を使用して前記量子化された係数を圧縮すること を含むことを特徴とする請求項1に記載の方法。 - 【請求項3】 1つ以上の低品質の拡張層を表す第2のビットストリームを
前記符号化することは、 前記基本層を基準として使用して元のイメージを動き補償して低品質の予測イ
メージを形成すること、 前記低品質の予測イメージを変換して低品質の予測係数を形成すること、 前記低品質の予測係数を量子化して量子化された係数を形成すること、 前記量子化された係数を復号(dequantize)して復号された係数を
形成すること、 前記低品質の予測係数と前記復号された係数の差として低品質の剰余を導出す
ること、 前記低品質の剰余をビットプレーン符号化して符号化した低品質剰余を形成す
ること、および、 可変長符号化を使用して前記符号化された低品質の剰余を圧縮すること を含むことを特徴とする請求項1に記載の方法。 - 【請求項4】 1つ以上の高品質の拡張層を表す第3のビットストリームを
前記符号化することは、 拡張層を基準として使用して元のイメージを動き補償して高品質の予測イメー
ジを形成すること、 前記高品質の予測イメージを変換して第1のセットの高品質の係数を形成する
こと、 前記符号化された低品質の剰余から第2のセットの高品質の係数を予測するこ
と、 前記第1のセットの高品質の係数と前記第2のセットの高品質の係数の差とし
て高品質の剰余を導出すること、 前記高品質の剰余をビットプレーン符号化すること、および、 可変長符号化を使用して前記符号化した高品質剰余を圧縮すること を含むことを特徴とする請求項3に記載の方法。 - 【請求項5】 1つ以上の低品質の拡張層を表す第2のビットストリームを
前記符号化すること、および1つ以上の高品質の拡張層を表す第3のビットスト
リームを前記符号化することは、 前記基本層を基準として使用して元のイメージを動き補償して低品質の予測イ
メージを形成し、また拡張層を基準として使用して前記元のイメージを動き補償
して高品質の予測イメージを形成すること、 前記低品質の予測イメージを変換して低品質の予測係数を形成し、また前記高
品質の予測イメージを変換して高品質の予測係数を形成すること、 前記低品質の予測係数を量子化して量子化された係数を形成すること、 前記量子化された係数を復号して復号された係数を形成すること、 前記高品質の予測係数と前記復号した係数の差として低品質の剰余を導出する
こと、 前記低品質の剰余をビットプレーン符号化して符号化された低品質の剰余を形
成すること、 前記高品質の予測係数と前記符号化された低品質の剰余の差として高品質の剰
余を導出すること、 前記高品質の剰余をビットプレーン符号化して符号化された高品質の剰余を形
成すること、および、 可変長符号化を使用して前記符号化された低品質の剰余および前記符号化され
た高品質の剰余を圧縮すること を含むことを特徴とする請求項1に記載の方法。 - 【請求項6】 前記基本層を表す前記第1のビットストリームを復号化する
こと、 1つ以上の低品質の拡張層を表す前記第2のビットストリームを復号化するこ
と、および、 前記基本層および前記低品質の拡張層から予測された値に部分的に基づいて1
つ以上の前記高品質の拡張層を表す前記第3のビットストリームを復号化するこ
と をさらに含むことを特徴とする請求項1に記載の方法。 - 【請求項7】 プロセッサ上で実行されたとき、コンピュータが請求項1に
記載の前記ステップを行うように導くコンピュータ実行可能命令を有することを
特徴とするコンピュータ可読媒体。 - 【請求項8】 各フレームが、低品質の基本層から順により高品質になる拡
張層までの範囲を有する複数の層を有する複数階層フレームとしてビデオデータ
が表現される階層符号化技法による前記ビデオデータを符号化するための方法で
あって、 基本層、および前のフレームの基本層から予測された現行のフレームの1つ以
上の低品質の拡張層を符号化すること、 前記基本層および前記低品質の拡張層の予測からもたらされた低品質の剰余を
符号化すること、および、 前記低品質の剰余から導出された高品質の剰余を符号化すること を含むことを特徴とする方法。 - 【請求項9】 高品質の剰余を前記符号化することは、 前記前のフレームの高品質の拡張層から前記現行のフレームの1つ以上の高品
質の拡張層を予測すること、 前記高品質の拡張層を変換して第1のセットの高品質の係数を形成すること、 前記低品質の剰余から第2のセットの高品質の係数を予測すること、および、 前記第1のセットの高品質の係数および前記第2のセットの高品質の係数から
前記高品質の剰余を形成すること を含むことを特徴とする請求項8に記載の方法。 - 【請求項10】 高品質の剰余を前記符号化することは、 前記前のフレームの高品質の拡張層から前記現行のフレームの高品質の拡張層
を予測すること、 前記高品質の拡張層を変換して高品質の係数を形成すること、および、 前記高品質の係数および前記低品質の剰余から前記高品質の剰余を形成するこ
と を含むことを特徴とする請求項8に記載の方法。 - 【請求項11】 プロセッサ上で実行されたとき、コンピュータが請求項8
に記載の前記ステップを行うように導くコンピュータ実行可能命令を有すること
を特徴とするコンピュータ可読媒体。 - 【請求項12】 各フレームが、低品質の基本層から順により高品質になる
拡張層までの範囲を有する複数の層を有する複数階層フレームとしてビデオデー
タが表現される階層符号化技法による前記ビデオデータを符号化するための方法
であって、 前のフレームの中の様々な品質の複数の層を使用して現行のフレームの中の層
を予測すること、 前記現行のフレームの中の低品質の層および前記前のフレームの中の低品質の
層から低品質の予測剰余を導出すること、 前記低品質の予測剰余を符号化すること、および、 前記符号化された低品質の剰余から、前記現行のフレームの中の高品質の層と
前記前のフレームの中の高品質の層の間の差を表す高品質の予測剰余を予測する
こと を含むことを特徴とする方法。 - 【請求項13】 層を前記予測することは、前記前のフレームの中のより低
品質の層から前記現行のフレームの中のより高品質の層を予測することを含むこ
とを特徴とする請求項12に記載の方法。 - 【請求項14】 前記符号化することは、前記低品質の予測剰余を量子化し
て量子化された剰余を生成し、可変長符号化を使用して前記量子化された剰余を
圧縮することを含むことを特徴とする請求項12に記載の方法。 - 【請求項15】 前記符号化することは、前記低品質の予測剰余をビットプ
レーン符号化することを含むことを特徴とする請求項12に記載の方法。 - 【請求項16】 高品質の予測剰余を前記予測することは、前記符号化され
た低品質の剰余および2つの予測イメージに基づいて予測値を計算することを含
むことを特徴とする請求項12に記載の方法。 - 【請求項17】 高品質の予測値を前記予測することは、2つの予測イメー
ジ、および前記2つの予測イメージのどちらかの推定に基づいて予測値を計算す
ることを含むことを特徴とする請求項12に記載の方法。 - 【請求項18】 プロセッサ上で実行されたとき、コンピュータが請求項1
2に記載の前記ステップを行うように導くコンピュータ実行可能命令を有するこ
とを特徴とするコンピュータ可読媒体。 - 【請求項19】 各フレームが、低品質の基本層から順により高品質になる
拡張層までの範囲を有する複数の層を有する複数階層フレームとしてビデオデー
タが表現される階層符号化技法による前記ビデオデータを符号化するための方法
であって、 元のイメージを表す第1のフレームの中の基本層および複数の拡張層を形成す
ること、 前記第1のフレームの中の前記基本層および少なくとも1つの拡張層から、予
測イメージを表す第2のフレームの中の基本層および複数の拡張層を予測するこ
と、 前記元のイメージの前記基本層および低品質の拡張層を前記予測することから
もたらされる低品質の剰余を導出すること、 前記低品質の剰余を符号化すること、および、 前記符号化された低品質の剰余から、前記元のイメージから高品質の拡張層を
予測することからの結果を表す高品質の剰余を予測すること を含むことを特徴とする方法。 - 【請求項20】 前記複数の拡張層は、少なくとも第1の層、第2の層、お
よび第3の層を含み、前記複数の拡張層を前記形成することは、先行するフレー
ムの前記基本層および前記第2の層から偶数フレームを予測し、また先行するフ
レームの前記基本層および前記第3の層から奇数フレームを予測することを含む
ことを特徴とする請求項19に記載の方法。 - 【請求項21】 前記複数の拡張層を前記形成することは、 L mod N=i mod M ただし、Lは特定の拡張層を指定する変数であり、iは特定のフレームを指定す
る変数であり、Nは共通の基準層からいくつの層が予測されるかという層グルー
プ深度を表す変数であり、また、Mは予測の目的でいくつのフレームがグループ
化されるかというフレームグループ深度を表す変数である関係式が真である場合
、基準フレームの低品質の基準層から現行のフレームの中の各拡張層を予測する
ことを含むことを特徴とする請求項19に記載の方法。 - 【請求項22】 前記高品質の剰余を符号化することをさらに含むことを特
徴とする請求項19に記載の方法。 - 【請求項23】 前記符号化された低品質の剰余および前記高品質の剰余を
伝送することをさらに含むことを特徴とする請求項22に記載の方法。 - 【請求項24】 プロセッサ上で実行されたとき、コンピュータが請求項1
9に記載の前記ステップを行うように導くコンピュータ実行可能命令を有するこ
とを特徴とするコンピュータ可読媒体。 - 【請求項25】 各フレームが、低品質の基本層と、低品質の拡張層と、順
により高品質になる1つ以上のより高品質の拡張層とを含むビデオデータを複数
階層フレームに符号化し、より高品質の拡張層の符号化が、前記基本層および前
記低品質の拡張層から予測された値に部分的に基づくこと、および、 前記基本層、前記低品質の拡張層、および前記1つ以上のより高品質の拡張層
をネットワークを介して伝送すること を含むことを特徴とする方法。 - 【請求項26】 前記ネットワークから前記基本層、前記低品質の拡張層、
および前記1つ以上のより高品質の拡張層を受信すること、および、 前記基本層、前記低品質の拡張層、および前記1つ以上のより高品質の拡張層
を復号化して前記ビデオデータを回復すること をさらに含むことを特徴とする請求項25に記載の方法。 - 【請求項27】 プロセッサ上で実行されたとき、コンピュータが、 前のフレームの低品質の層からビデオデータの現行のフレームの低品質の層を
予測し、 前記低品質の層を符号化し、 前記低品質の層の予測からもたらされる低品質の剰余を導出し、 前記低品質の剰余を符号化し、 前のフレームの高品質の層からビデオデータの現行のフレームの高品質の層を
予測し、 前記高品質の層および前記低品質の剰余から高品質の剰余を導出し、また 前記高品質の剰余を符号化するように導くコンピュータ可読命令を有すること
を特徴とするコンピュータ可読媒体。 - 【請求項28】 プロセッサ上で実行されたとき、コンピュータが、 (A)基本層を基準として使用して元のイメージを動き補償して低品質の予測
イメージを形成し、 前記低品質の予測イメージを変換して低品質の予測係数を形成し、 前記低品質の予測係数を量子化して量子化された係数を形成することによって
基本層を表す第1のビットストリームを符号化し、 (B)前記量子化された係数を復号して復号された係数を形成し、 前記低品質の予測係数と前記復号された係数の差として低品質の剰余を導出し
、 前記低品質の剰余をビットプレーン符号化して符号化された低品質の剰余を形
成することによって低品質の拡張層を表す第2のビットストリームを符号化し、 (C)拡張層を基準として使用して元のイメージを動き補償して高品質の予測
イメージを形成し、 前記高品質の予測イメージを変換して第1のセットの高品質の係数を形成し、 前記符号化された低品質の剰余から第2のセットの高品質の係数を予測し、 前記第1のセットの高品質の係数と前記第2のセットの高品質の係数の差とし
て高品質の剰余を導出し、 前記高品質の剰余をビットプレーン符号化することによって高品質の拡張層を
表す第3のビットストリームを符号化するように導くコンピュータ実行可能命令
を有することを特徴とするコンピュータ可読媒体。 - 【請求項29】 プロセッサ上で実行されたとき、コンピュータが、可変長
符号化を使用して前記量子化された係数、前記符号化された低品質の剰余、およ
び前記符号化された高品質の剰余を圧縮するように導くコンピュータ実行可能命
令をさらに含むことを特徴とする請求項28に記載のコンピュータ可読媒体。 - 【請求項30】 プロセッサ上で実行されたとき、コンピュータが、 (A)基本層を基準として使用して元のイメージを動き補償して低品質の予測
イメージを形成し、 前記低品質の予測イメージを変換して低品質の予測係数を形成し、 前記低品質の予測係数を量子化して量子化された係数を形成することによって
基本層を表す第1のビットストリームを符号化し、 (B)前記量子化された係数を復号して復号された係数を形成し、 拡張層を基準として使用して前記元のイメージを動き補償して高品質の予測イ
メージを形成し、 前記高品質の予測イメージを変換して高品質の予測係数を形成し、 前記高品質の予測係数および前記復号された係数から低品質の剰余を導出し、 前記低品質の剰余をビットプレーン符号化して符号化された低品質の剰余を形
成し、 前記高品質の予測係数および前記符号化された低品質の剰余から高品質の剰余
を導出し、 前記高品質の剰余をビットプレーン符号化して符号化された高品質の剰余を形
成することによって低品質の拡張層を表す第2のビットストリームおよび高品質
の拡張層を表す第3のビットストリームを符号化するように導くコンピュータ実
行可能命令を有することを特徴とするコンピュータ可読媒体。 - 【請求項31】 プロセッサ上で実行されたとき、コンピュータが、可変長
符号化を使用して前記量子化された係数、前記符号化された低品質の剰余、およ
び前記符号化された高品質の剰余を圧縮するように導くコンピュータ実行可能命
令をさらに含むことを特徴とする請求項30に記載のコンピュータ可読媒体。 - 【請求項32】 ビデオデータの基本層を表すビットストリームを符号化す
る基本層エンコーダと、 1つ以上の低品質の拡張層を表すビットストリームを符号化する低品質拡張層
エンコーダと、 前記基本層および前記低品質の拡張層から予測された値に部分的に基づいて1
つ以上の高品質の拡張層を表すビットストリームを符号化する高品質拡張層エン
コーダとを含むことを特徴とするビデオ符号化システム。 - 【請求項33】 前記基本層および前記低品質の拡張層から前記値を予測す
る予測モジュールをさらに含むことを特徴とする請求項32に記載のビデオ符号
化システム。 - 【請求項34】 再構成された基本層を保持する第1のフレームバッファと
、 再構成された拡張層を保持する第2のフレームバッファとさらにを含み、 前記基本層エンコーダは、前記第1のフレームバッファの中の前記再構成され
た基本層を基準として使用して元のイメージを動き補償して低品質の予測イメー
ジを形成し、前記低品質の予測イメージを変換して、ビデオデータの基本層を表
す前記ビットストリームの中に符号化することができる低品質の予測係数を形成
するように構成され、 前記低品質拡張層エンコーダは、前記低品質の予測係数から低品質の剰余を導
出し、前記低品質の剰余を符号化して、低品質の拡張層を表す前記ビットストリ
ームに関する符号化された低品質の剰余を形成するように構成され、 前記高品質拡張層エンコーダは、前記第2のフレームバッファの中の前記再構
成された拡張層を使用して前記元のイメージを動き補償して高品質の予測イメー
ジを形成し、前記高品質の予測イメージを変換して高品質の予測係数を形成する
ように構成され、 前記高品質の予測係数および前記符号化された低品質の剰余から高品質の剰余
を予測する予測モジュールをさらに含むことを特徴とする請求項32に記載のビ
デオ符号化システム。 - 【請求項35】 前記高品質拡張層エンコーダは、高品質の拡張層を表す前
記ビットストリームに関する前記予測された高品質の剰余を符号化するように構
成されていることを特徴とする請求項34に記載のビデオ符号化システム。 - 【請求項36】 請求項32に記載のビデオ符号化システムを含むことを特
徴とするオペレーティングシステム。 - 【請求項37】 イメージの前のフレームの再構成された層を保持する複数
のフレームバッファであって、前記再構成された層が、低品質から高品質までの
範囲の品質を有するバッファと、 前記フレームバッファの1つの中の低品質の再構成された層から低品質の予測
イメージを予測し、前記予測からもたらされる低品質の剰余を導出する低品質層
エンコーダであって、前記低品質の予測イメージおよび前記低品質の剰余を1つ
以上のビットストリームの中に符号化するように構成されたエンコーダと、 前記フレームバッファの別の1つのの中の高品質の再構成された層から高品質
の予測イメージを予測する高品質層エンコーダと、 前記高品質の予測イメージおよび前記符号化された低品質の予測イメージから
高品質の剰余を予測する予測モジュールとを含み、 前記高品質層エンコーダは、前記高品質の剰余をビットストリームの中に符号
化するように構成されていることを特徴とするビデオ符号化システム。 - 【請求項38】 請求項37に記載の前記ビデオ符号化システムを含むこと
を特徴とするオペレーティングシステム。 - 【請求項39】 イメージの前のフレームの再構成された層を保持する複数
のフレームバッファであって、前記再構成された層が、低品質から高品質までの
範囲の品質を有するバッファと、 前記フレームバッファの1つの中の低品質の再構成された層から低品質の予測
イメージを予測し、前記予測からもたらされる低品質の剰余を導出する低品質層
エンコーダであって、前記低品質の予測イメージおよび前記低品質の剰余を1つ
以上のビットストリームの中に符号化するように構成されたエンコーダと、 前記フレームバッファの別の1つの中の高品質の再構成された層から高品質の
予測イメージを予測し、前記高品質の予測イメージおよび前記符号化された低品
質の予測イメージから高品質の剰余を導出する高品質層エンコーダであって、前
記高品質の剰余をビットストリームの中に符号化するように構成されたエンコー
ダとを含むことを特徴とするビデオ符号化システム。 - 【請求項40】 請求項39に記載の前記ビデオ符号化システムを含むこと
を特徴とするオペレーティングシステム。 - 【請求項41】 前のフレームの中の様々な品質の複数の層を使用して現行
のフレームの中の層を予測するための手段と、 前記現行のフレームの中の低品質の層および前記前のフレームの中の低品質の
層から低品質の予測剰余を導出するための手段と、 前記低品質の予測剰余を符号化するための手段と、 前記符号化された低品質の剰余から、前記現行のフレームの中の高品質の層と
前記前のフレームの中の高品質の層の間の差を表す高品質の予測剰余を予測する
ための手段とを含むことを特徴とするビデオ符号化システム。 - 【請求項42】 請求項41に記載の前記ビデオ符号化システムを含むこと
を特徴とするオペレーティングシステム。 - 【請求項43】 元のイメージを表す第1のフレームの中の基本層および複
数の拡張層を形成するための手段と、 前記第1のフレームの中の前記基本層および少なくとも1つの拡張層から、予
測イメージを表す第2のフレームの中の基本層および複数の拡張層を予測するた
めの手段と、 前記元のイメージから前記基本層および低品質の拡張層を前記予測することか
らもたらされる低品質の剰余を導出するための手段と、 前記低品質の剰余を符号化するための手段と、 前記符号化された低品質の剰余から、前記元のイメージから高品質の拡張層を
予測することからの結果を表す高品質の剰余を予測するための手段とを含むこと
を特徴とするビデオ符号化システム。 - 【請求項44】 請求項43に記載の前記ビデオ符号化システムを含むこと
を特徴とするオペレーティングシステム。 - 【請求項45】 前記ビデオデータをストアするビデオストレージ、および
ネットワークを介して前記ビデオデータを提供するビデオサーバを有するコンテ
ンツプロバイダであって、前記ビデオサーバは、各フレームが低品質の基本層、
低品質の拡張層、および順により高品質になる1つ以上のより高品質の拡張層を
含む複数階層フレームの中に前記ビデオデータを符号化するように構成され、前
記基本層および前記低品質の拡張層から予測された値に部分的に基づいてより高
品質の拡張層を符号化するプロバイダと、 前記コンテンツプロバイダから提供される前記符号化されたビデオデータを受
信するように構成されたクライアントであって、前記ビデオデータを復号化する
ように構成されたクライアントとを含むことを特徴とするビデオ配信アーキテク
チャ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/505,254 US6700933B1 (en) | 2000-02-15 | 2000-02-15 | System and method with advance predicted bit-plane coding for progressive fine-granularity scalable (PFGS) video coding |
US09/505,254 | 2000-02-15 | ||
PCT/US2001/001668 WO2001062010A1 (en) | 2000-02-15 | 2001-01-17 | System and method with advance predicted bit-plane coding for progressive fine-granularity scalable (pfgs) video coding |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2003523667A true JP2003523667A (ja) | 2003-08-05 |
JP2003523667A5 JP2003523667A5 (ja) | 2008-03-06 |
JP4842486B2 JP4842486B2 (ja) | 2011-12-21 |
Family
ID=24009591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001560143A Expired - Fee Related JP4842486B2 (ja) | 2000-02-15 | 2001-01-17 | プログレッシブファイングラニュラリティスケーラブル(pfgs)ビデオ符号化のための事前予測ビットプレーン符号化を使用するシステムおよび方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US6700933B1 (ja) |
EP (2) | EP1258147B1 (ja) |
JP (1) | JP4842486B2 (ja) |
AT (1) | ATE291329T1 (ja) |
AU (1) | AU2001229595A1 (ja) |
DE (1) | DE60109423T2 (ja) |
TW (1) | TW519843B (ja) |
WO (1) | WO2001062010A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008507180A (ja) * | 2004-07-13 | 2008-03-06 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 空間的及びsnr画像圧縮の方法 |
JP2010136428A (ja) * | 2002-04-29 | 2010-06-17 | Nokia Corp | デジタル画像内の領域のサイズ、形状および位置を示す方法、デジタル画像を符号化してビットストリームを生成するためのエンコーダ、ビットストリームを復号するためのデコーダ、およびコンピュータ・プログラム製品 |
Families Citing this family (89)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6614936B1 (en) * | 1999-12-03 | 2003-09-02 | Microsoft Corporation | System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding |
US6940912B2 (en) * | 2000-04-21 | 2005-09-06 | Microsoft Corporation | Dynamically adaptive multimedia application program interface and related methods |
US7634011B2 (en) * | 2000-04-21 | 2009-12-15 | Microsoft Corporation | Application program interface (API) facilitating decoder control of accelerator resources |
US6891893B2 (en) * | 2000-04-21 | 2005-05-10 | Microsoft Corp. | Extensible multimedia application program interface and related methods |
US7649943B2 (en) * | 2000-04-21 | 2010-01-19 | Microsoft Corporation | Interface and related methods facilitating motion compensation in media processing |
GB2362532B (en) * | 2000-05-15 | 2004-05-05 | Nokia Mobile Phones Ltd | Video coding |
US7751473B2 (en) * | 2000-05-15 | 2010-07-06 | Nokia Corporation | Video coding |
JP3343104B2 (ja) * | 2000-07-06 | 2002-11-11 | 松下電送システム株式会社 | 画像処理装置及び画像処理方法 |
US7111163B1 (en) | 2000-07-10 | 2006-09-19 | Alterwan, Inc. | Wide area network using internet with quality of service |
US7068717B2 (en) * | 2000-07-12 | 2006-06-27 | Koninklijke Philips Electronics N.V. | Method and apparatus for dynamic allocation of scalable selective enhanced fine granular encoded images |
US7085843B2 (en) * | 2000-07-13 | 2006-08-01 | Lucent Technologies Inc. | Method and system for data layout and replacement in distributed streaming caches on a network |
US7042944B2 (en) * | 2000-09-22 | 2006-05-09 | Koninklijke Philips Electronics N.V. | Single-loop motion-compensation fine granular scalability |
US7082221B1 (en) * | 2000-09-29 | 2006-07-25 | Intel Corporation | Bandwidth determination for multiple layer digital video |
US7463683B2 (en) * | 2000-10-11 | 2008-12-09 | Koninklijke Philips Electronics N.V. | Method and apparatus for decoding spatially scaled fine granular encoded video signals |
AU2002218009A1 (en) * | 2000-11-01 | 2002-05-15 | Webcast Technologies Inc | Encoding and decoding of video signals |
US6961383B1 (en) * | 2000-11-22 | 2005-11-01 | At&T Corp. | Scalable video encoder/decoder with drift control |
ATE330427T1 (de) * | 2000-11-23 | 2006-07-15 | Koninkl Philips Electronics Nv | Videodekodierungsverfahren und entsprechender dekodierer |
US6907070B2 (en) * | 2000-12-15 | 2005-06-14 | Microsoft Corporation | Drifting reduction and macroblock-based control in progressive fine granularity scalable video coding |
US20020126759A1 (en) | 2001-01-10 | 2002-09-12 | Wen-Hsiao Peng | Method and apparatus for providing prediction mode fine granularity scalability |
US20020118742A1 (en) * | 2001-02-26 | 2002-08-29 | Philips Electronics North America Corporation. | Prediction structures for enhancement layer in fine granular scalability video coding |
US20020118743A1 (en) * | 2001-02-28 | 2002-08-29 | Hong Jiang | Method, apparatus and system for multiple-layer scalable video coding |
US6792044B2 (en) * | 2001-05-16 | 2004-09-14 | Koninklijke Philips Electronics N.V. | Method of and system for activity-based frequency weighting for FGS enhancement layers |
FR2825855A1 (fr) * | 2001-06-06 | 2002-12-13 | France Telecom | Procedes et dispositifs de codage et de decodage d'images mettant en oeuvre des maillages emboites, programme, signal et application correspondantes |
US7010043B2 (en) * | 2001-07-05 | 2006-03-07 | Sharp Laboratories Of America, Inc. | Resolution scalable video coder for low latency |
AU2002316532A1 (en) * | 2001-07-05 | 2003-01-21 | Board Of Trustees Operating Michigan State University | Transcaling: a video coding and multicasting framework for wireless ip multimedia services |
US20040208247A1 (en) * | 2001-07-10 | 2004-10-21 | Eric Barrau | Method and device for generating a scalable coded video signal from a non-scalable coded video signal |
US9894379B2 (en) * | 2001-07-10 | 2018-02-13 | The Directv Group, Inc. | System and methodology for video compression |
US20030093800A1 (en) * | 2001-09-12 | 2003-05-15 | Jason Demas | Command packets for personal video recorder |
WO2003026271A2 (de) * | 2001-09-14 | 2003-03-27 | Siemens Aktiengesellschaft | Verfahren zum kodieren und dekodieren von videosequenzen und computerprogrammprodukt |
US7263124B2 (en) * | 2001-09-26 | 2007-08-28 | Intel Corporation | Scalable coding scheme for low latency applications |
KR20040054746A (ko) * | 2001-10-26 | 2004-06-25 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 공간 스케일가능 압축 방법 및 장치 |
US20030118099A1 (en) * | 2001-12-20 | 2003-06-26 | Comer Mary Lafuze | Fine-grain scalable video encoder with conditional replacement |
US20030118113A1 (en) * | 2001-12-20 | 2003-06-26 | Comer Mary Lafuze | Fine-grain scalable video decoder with conditional replacement |
US6996173B2 (en) * | 2002-01-25 | 2006-02-07 | Microsoft Corporation | Seamless switching of scalable video bitstreams |
US20030151753A1 (en) * | 2002-02-08 | 2003-08-14 | Shipeng Li | Methods and apparatuses for use in switching between streaming video bitstreams |
US6944222B2 (en) * | 2002-03-04 | 2005-09-13 | Koninklijke Philips Electronics N.V. | Efficiency FGST framework employing higher quality reference frames |
GB2386275B (en) * | 2002-03-05 | 2004-03-17 | Motorola Inc | Scalable video transmissions |
WO2004014083A1 (en) * | 2002-07-31 | 2004-02-12 | Koninklijke Philips Electronics N.V. | Method and apparatus for performing multiple description motion compensation using hybrid predictive codes |
US7072394B2 (en) * | 2002-08-27 | 2006-07-04 | National Chiao Tung University | Architecture and method for fine granularity scalable video coding |
AU2003260192B2 (en) * | 2002-09-20 | 2010-03-04 | Newsouth Innovations Pty Limited | Method of signalling motion information for efficient scalable video compression |
AU2002951574A0 (en) * | 2002-09-20 | 2002-10-03 | Unisearch Limited | Method of signalling motion information for efficient scalable video compression |
US8204079B2 (en) * | 2002-10-28 | 2012-06-19 | Qualcomm Incorporated | Joint transmission of multiple multimedia streams |
KR100465318B1 (ko) * | 2002-12-20 | 2005-01-13 | 학교법인연세대학교 | 광대역 음성신호의 송수신 장치 및 그 송수신 방법 |
US6973128B2 (en) * | 2003-02-21 | 2005-12-06 | Mitsubishi Electric Research Labs, Inc. | Multi-path transmission of fine-granular scalability video streams |
US7283589B2 (en) * | 2003-03-10 | 2007-10-16 | Microsoft Corporation | Packetization of FGS/PFGS video bitstreams |
US7424493B2 (en) * | 2003-04-21 | 2008-09-09 | Microsoft Corporation | Replication-based propagation mechanism for pipelines |
US7206455B1 (en) * | 2003-08-20 | 2007-04-17 | Eastman Kodak Company | Adaptive setting of wavelet sub-band thresholds for low-light image denoising |
EP1695558A2 (en) * | 2003-12-09 | 2006-08-30 | Koninklijke Philips Electronics N.V. | Spatial and snr scalable video coding |
US7860161B2 (en) * | 2003-12-15 | 2010-12-28 | Microsoft Corporation | Enhancement layer transcoding of fine-granular scalable video bitstreams |
US7627037B2 (en) * | 2004-02-27 | 2009-12-01 | Microsoft Corporation | Barbell lifting for multi-layer wavelet coding |
US7580461B2 (en) * | 2004-02-27 | 2009-08-25 | Microsoft Corporation | Barbell lifting for wavelet coding |
US20050195896A1 (en) * | 2004-03-08 | 2005-09-08 | National Chiao Tung University | Architecture for stack robust fine granularity scalability |
US20050201629A1 (en) * | 2004-03-09 | 2005-09-15 | Nokia Corporation | Method and system for scalable binarization of video data |
US20050201462A1 (en) * | 2004-03-09 | 2005-09-15 | Nokia Corporation | Method and device for motion estimation in scalable video editing |
US8442108B2 (en) * | 2004-07-12 | 2013-05-14 | Microsoft Corporation | Adaptive updates in motion-compensated temporal filtering |
US8340177B2 (en) * | 2004-07-12 | 2012-12-25 | Microsoft Corporation | Embedded base layer codec for 3D sub-band coding |
US8374238B2 (en) * | 2004-07-13 | 2013-02-12 | Microsoft Corporation | Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video |
US7561620B2 (en) * | 2004-08-03 | 2009-07-14 | Microsoft Corporation | System and process for compressing and decompressing multiple, layered, video streams employing spatial and temporal encoding |
US7271749B2 (en) * | 2004-09-14 | 2007-09-18 | Hewlett-Packard Development Company, L.P. | Context-based denoiser that simultaneously updates probabilities for multiple contexts |
US20060176953A1 (en) * | 2005-02-04 | 2006-08-10 | Nader Mohsenian | Method and system for video encoding with rate control |
US7995656B2 (en) * | 2005-03-10 | 2011-08-09 | Qualcomm Incorporated | Scalable video coding with two layer encoding and single layer decoding |
US7725799B2 (en) * | 2005-03-31 | 2010-05-25 | Qualcomm Incorporated | Power savings in hierarchically coded modulation |
KR20080006607A (ko) * | 2005-04-12 | 2008-01-16 | 노키아 코포레이션 | 편차 제어를 통한 움직임 보상된 미세 입도 규모 가변성비디오 부호화를 위한 방법 및 시스템 |
US20060233262A1 (en) * | 2005-04-13 | 2006-10-19 | Nokia Corporation | Signaling of bit stream ordering in scalable video coding |
KR100703772B1 (ko) * | 2005-04-13 | 2007-04-06 | 삼성전자주식회사 | 인코더-디코더 간 불일치를 감소시키는 mctf 기반의비디오 코딩 방법 및 장치 |
US8619860B2 (en) | 2005-05-03 | 2013-12-31 | Qualcomm Incorporated | System and method for scalable encoding and decoding of multimedia data using multiple layers |
KR100667815B1 (ko) * | 2005-09-22 | 2007-01-12 | 삼성전자주식회사 | 영상 부호화 및 복호화 장치와, 그 방법, 및 이를 수행하기위한 프로그램이 기록된 기록 매체 |
US7956930B2 (en) | 2006-01-06 | 2011-06-07 | Microsoft Corporation | Resampling and picture resizing operations for multi-resolution video coding and decoding |
US8369417B2 (en) * | 2006-05-19 | 2013-02-05 | The Hong Kong University Of Science And Technology | Optimal denoising for video coding |
US8831111B2 (en) * | 2006-05-19 | 2014-09-09 | The Hong Kong University Of Science And Technology | Decoding with embedded denoising |
US8325819B2 (en) * | 2006-10-12 | 2012-12-04 | Qualcomm Incorporated | Variable length coding table selection based on video block type for refinement coefficient coding |
US8599926B2 (en) * | 2006-10-12 | 2013-12-03 | Qualcomm Incorporated | Combined run-length coding of refinement and significant coefficients in scalable video coding enhancement layers |
US8565314B2 (en) * | 2006-10-12 | 2013-10-22 | Qualcomm Incorporated | Variable length coding table selection based on block type statistics for refinement coefficient coding |
US9319700B2 (en) * | 2006-10-12 | 2016-04-19 | Qualcomm Incorporated | Refinement coefficient coding based on history of corresponding transform coefficient values |
CN101622878B (zh) * | 2007-01-10 | 2015-01-14 | 汤姆逊许可公司 | 用于实现位深度可分级性的视频编解码方法和视频编解码设备 |
KR101375663B1 (ko) * | 2007-12-06 | 2014-04-03 | 삼성전자주식회사 | 영상을 계층적으로 부호화/복호화하는 방법 및 장치 |
US8953673B2 (en) * | 2008-02-29 | 2015-02-10 | Microsoft Corporation | Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers |
US8711948B2 (en) * | 2008-03-21 | 2014-04-29 | Microsoft Corporation | Motion-compensated prediction of inter-layer residuals |
US9571856B2 (en) | 2008-08-25 | 2017-02-14 | Microsoft Technology Licensing, Llc | Conversion operations in scalable video encoding and decoding |
US8213503B2 (en) | 2008-09-05 | 2012-07-03 | Microsoft Corporation | Skip modes for inter-layer residual video coding and decoding |
TW201016017A (en) * | 2008-10-08 | 2010-04-16 | Univ Nat Taiwan | Memory management method and system of video encoder |
US8345749B2 (en) * | 2009-08-31 | 2013-01-01 | IAD Gesellschaft für Informatik, Automatisierung und Datenverarbeitung mbH | Method and system for transcoding regions of interests in video surveillance |
KR101418101B1 (ko) | 2009-09-23 | 2014-07-16 | 에스케이 텔레콤주식회사 | 저주파수 성분을 고려한 영상 부호화/복호화 방법 및 장치 |
EP2355511A1 (en) * | 2009-12-21 | 2011-08-10 | Alcatel Lucent | Method and arrangement for jointly encoding a plurality of video streams |
GB2492397A (en) * | 2011-06-30 | 2013-01-02 | Canon Kk | Encoding and decoding residual image data using probabilistic models |
GB2492396A (en) * | 2011-06-30 | 2013-01-02 | Canon Kk | Decoding a Scalable Video Bit-Stream |
WO2013103490A1 (en) | 2012-01-04 | 2013-07-11 | Dolby Laboratories Licensing Corporation | Dual-layer backwards-compatible progressive video delivery |
US20140092953A1 (en) * | 2012-10-02 | 2014-04-03 | Sharp Laboratories Of America, Inc. | Method for signaling a step-wise temporal sub-layer access sample |
CN111447445B (zh) * | 2020-03-16 | 2022-09-09 | 西安万像电子科技有限公司 | 数据传输方法及装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4330040B2 (ja) * | 1995-06-29 | 2009-09-09 | トムソン マルチメデイア ソシエテ アノニム | 階層化圧縮ビデオ・データを符号化し復号化するためのシステム |
US6173013B1 (en) * | 1996-11-08 | 2001-01-09 | Sony Corporation | Method and apparatus for encoding enhancement and base layer image signals using a predicted image signal |
US6728775B1 (en) * | 1997-03-17 | 2004-04-27 | Microsoft Corporation | Multiple multicasting of multimedia streams |
KR100295798B1 (ko) * | 1997-07-11 | 2001-08-07 | 전주범 | 스케일러빌리티를구현한이진현상신호부호화장치 |
IL128836A (en) * | 1997-07-18 | 2003-10-31 | Sony Corp | Method and system for multiplexing image signal, method and system for demultiplexing image signal, and transmission medium |
AU1928999A (en) | 1997-12-19 | 1999-07-12 | Kenneth Rose | Scalable predictive coding method and apparatus |
JP3132456B2 (ja) * | 1998-03-05 | 2001-02-05 | 日本電気株式会社 | 階層的画像符号化方式、及び階層的画像復号方式 |
US6292512B1 (en) * | 1998-07-06 | 2001-09-18 | U.S. Philips Corporation | Scalable video coding system |
US6275531B1 (en) | 1998-07-23 | 2001-08-14 | Optivision, Inc. | Scalable video coding method and apparatus |
US6490705B1 (en) * | 1998-10-22 | 2002-12-03 | Lucent Technologies Inc. | Method and apparatus for receiving MPEG video over the internet |
US6496980B1 (en) * | 1998-12-07 | 2002-12-17 | Intel Corporation | Method of providing replay on demand for streaming digital multimedia |
JP2000209580A (ja) * | 1999-01-13 | 2000-07-28 | Canon Inc | 画像処理装置およびその方法 |
US6263022B1 (en) * | 1999-07-06 | 2001-07-17 | Philips Electronics North America Corp. | System and method for fine granular scalable video with selective quality enhancement |
US6480547B1 (en) * | 1999-10-15 | 2002-11-12 | Koninklijke Philips Electronics N.V. | System and method for encoding and decoding the residual signal for fine granular scalable video |
-
2000
- 2000-02-15 US US09/505,254 patent/US6700933B1/en not_active Expired - Lifetime
-
2001
- 2001-01-17 AT AT01953046T patent/ATE291329T1/de not_active IP Right Cessation
- 2001-01-17 EP EP01953046A patent/EP1258147B1/en not_active Expired - Lifetime
- 2001-01-17 JP JP2001560143A patent/JP4842486B2/ja not_active Expired - Fee Related
- 2001-01-17 AU AU2001229595A patent/AU2001229595A1/en not_active Abandoned
- 2001-01-17 WO PCT/US2001/001668 patent/WO2001062010A1/en active IP Right Grant
- 2001-01-17 EP EP04025577A patent/EP1511324A1/en not_active Ceased
- 2001-01-17 DE DE60109423T patent/DE60109423T2/de not_active Expired - Lifetime
- 2001-02-15 TW TW090103400A patent/TW519843B/zh not_active IP Right Cessation
Non-Patent Citations (1)
Title |
---|
JPN7010001192, Shipeng Li, Feng Wu, Ya−Qin Zhang, "Study of a new approach to improve FGS video coding efficiency", ISO/IEC JTC1/SC29/WG11 MPEG99/m5583, 199912 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010136428A (ja) * | 2002-04-29 | 2010-06-17 | Nokia Corp | デジタル画像内の領域のサイズ、形状および位置を示す方法、デジタル画像を符号化してビットストリームを生成するためのエンコーダ、ビットストリームを復号するためのデコーダ、およびコンピュータ・プログラム製品 |
JP2008507180A (ja) * | 2004-07-13 | 2008-03-06 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 空間的及びsnr画像圧縮の方法 |
Also Published As
Publication number | Publication date |
---|---|
EP1258147B1 (en) | 2005-03-16 |
US6700933B1 (en) | 2004-03-02 |
WO2001062010A1 (en) | 2001-08-23 |
DE60109423D1 (de) | 2005-04-21 |
ATE291329T1 (de) | 2005-04-15 |
EP1258147A1 (en) | 2002-11-20 |
DE60109423T2 (de) | 2005-08-04 |
EP1511324A1 (en) | 2005-03-02 |
TW519843B (en) | 2003-02-01 |
JP4842486B2 (ja) | 2011-12-21 |
AU2001229595A1 (en) | 2001-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4842486B2 (ja) | プログレッシブファイングラニュラリティスケーラブル(pfgs)ビデオ符号化のための事前予測ビットプレーン符号化を使用するシステムおよび方法 | |
US7269289B2 (en) | System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding | |
US8130830B2 (en) | Enhancement layer switching for scalable video coding | |
US6392705B1 (en) | Multimedia compression system with additive temporal layers | |
EP1331822B1 (en) | Seamless switching of scalable video bitstreams | |
Brites et al. | Evaluating a feedback channel based transform domain Wyner–Ziv video codec | |
US6233017B1 (en) | Multimedia compression system with adaptive block sizes | |
US6907070B2 (en) | Drifting reduction and macroblock-based control in progressive fine granularity scalable video coding | |
US7627040B2 (en) | Method for processing I-blocks used with motion compensated temporal filtering | |
US20050195897A1 (en) | Scalable video coding method supporting variable GOP size and scalable video encoder | |
WO2001091454A2 (en) | Bit-plane dependent signal compression | |
JP2003511919A (ja) | 基本層量子化データを使用して改善層データを符号化及び復号するシステム及び方法 | |
JP2005531258A (ja) | スケーラブルで頑強なビデオ圧縮 | |
WO2002035854A1 (en) | Dct-based scalable video compression | |
WO2005032138A1 (en) | System and method for combining advanced data partitioning and fine granularity scalability for efficient spatio-temporal-snr scalability video coding and streaming | |
WO2004093460A1 (en) | System and method for rate-distortion optimized data partitioning for video coding using parametric rate-distortion model | |
Reibman et al. | Scalable video coding with managed drift | |
US8634467B2 (en) | Flexible Wyner-Ziv video frame coding | |
Abd Al-azeez et al. | Optimal quality ultra high video streaming based H. 265 | |
US20030118099A1 (en) | Fine-grain scalable video encoder with conditional replacement | |
Ouaret et al. | Codec-independent scalable distributed video coding | |
Conci et al. | Multiple description video coding by coefficients ordering and interpolation | |
Zhang | Robust scalable video compression using multiple description coding | |
Kodavalla et al. | CHROMA CODING IN DISTRIBUTED VIDEO CODING | |
Ugur | Scalable coding of H. 264 video |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080117 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080117 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100420 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100806 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101028 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110317 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20110318 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110318 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20110408 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110603 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110905 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110930 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111006 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141014 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |