JP2005528046A - 高品質参照フレームを利用する、効率を向上させたfgstフレームワーク - Google Patents
高品質参照フレームを利用する、効率を向上させたfgstフレームワーク Download PDFInfo
- Publication number
- JP2005528046A JP2005528046A JP2004507259A JP2004507259A JP2005528046A JP 2005528046 A JP2005528046 A JP 2005528046A JP 2004507259 A JP2004507259 A JP 2004507259A JP 2004507259 A JP2004507259 A JP 2004507259A JP 2005528046 A JP2005528046 A JP 2005528046A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- motion compensated
- level
- video
- data stream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002123 temporal effect Effects 0.000 claims abstract description 40
- 238000000034 method Methods 0.000 claims abstract description 33
- LSEKLPKUWRDLKY-UHFFFAOYSA-N protoleucomelone Chemical compound C1=CC(OC(=O)C)=CC=C1C1=C(OC(C)=O)C(OC(C)=O)=C(C=2C(=CC(OC(C)=O)=C(OC(C)=O)C=2)O2)C2=C1OC(C)=O LSEKLPKUWRDLKY-UHFFFAOYSA-N 0.000 description 9
- 238000012545 processing Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/36—Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/31—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/34—Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
ビデオを符号化する方法(200,300)及び装置は動き補償拡張参照フレームを時間的残余画像フレームの少なくとも部分から構築する工程を有する。動き補償拡張参照フレームは、FGS動き補償された、残余画像フレーム又は時間的フレーム、の別のレベルを双方向及び/又は単一方向に予測するのに用いられる。
Description
本発明は、一般的に、細粒度スケーラビリティ(FGS)ビデオ符号化に関し、特に、FGS符号化手法で、多層の、双方向及び/又は単一方向に予測されたFGS時間的(FGST)フレームが、高品質参照フレームで、ベース・レイヤ情報及び少なくとも拡張レイヤ情報の一部分を有するもの、から予測されるもの、に関する。
インターネット・プロトコル(IP)ネットワークによるビデオ・ストリーミングは広範囲のマルチメディア・アプリケーションを容易にした。インターネット・ビデオ・ストリーミングは連続メディア・コンテンツのリアル・タイム配信及び提供を備える一方で、インターネット上でのサービス品質(QoS)保証がないことを補償する。IPネットワーク上での帯域幅及び別の性能パラメータ(例えば、パケット損失レート)が変動し、予測できないことによって、一般的に、提案されているストリーミング・ソルーションの大部分は何かの種類の階層型(すなわちスケーラブルな)ビデオ符号化手法に基づくものである。
図1A及び1Bはハイブリッド型時間的SNR細粒度スケーラビリティ(FGS HS)として知られる一種のスケーラブルなビデオ符号化手法の例示的なスケーラビリティ構造10A,10Bを示し、このFGS HSは詳細に、本発明の譲受人に譲渡された、同時係属の米国特許出願番号第09/590,825号に記載されている。各FGS HS構造10A,10Bはベース・レイヤ11A,11B(BL)及び拡張レイヤ12A,12B(EL)を有する。スケーラブルなビデオ・ストリームのBL部分は、一般的に、そのストリームを復号化するのに要する最小データ量を表す。このストリームのEL部分は付加情報、すなわち、FGS SNRフレーム又はピクチャ、及び、(FGSTと表す)FGS時間的フレーム又はピクチャで、受信器によって復号化された場合にビデオ信号表現を拡張するもの、を表す。特に、この付加時間的フレームは高フレーム・レートを得るよう挿入される。MPEG-4のFGS標準は図1Aの双方向に予測されたFGSTピクチャの種類と図1Bの前方予測FGSTピクチャの種類との両方をサポートする。
図2は、米国特許出願番号第09/590,825号に記載された例示的なFGS HSビデオ符号器100の機能的アーキテクチャを示す。符号化処理はDCT変換に基づくものであるが、別の変換(例えば、ウェーブレット)も用い得る。このビデオ符号器100は図1A及び1BのFGS HS構造10A,10Bを生成することができる。ビデオ符号器はBL符号器110及びEL符号器130を有する。ビデオ符号器100は元のビデオ信号を受信し、この信号はBL符号器110によってIとPのフレームのBLビットストリームに処理され、EL符号器130によってFGS SNRのIとPのフレーム及び/又はPとBのFGSTフレームのELビットストリームに処理される。
図1A及び1BのFGS HS構造においては、FGSTフレームはフレーム・メモリ・ブロックに記憶された低品質ベース・レイヤ参照フレームから予測される。その結果、発生する動き補償残余エラーは高く、したがってこれらのフレームを圧縮するのに多数のビットを要する。したがって、高フレーム・レートへの移行が、低ビット・レートと非常に高いビット・レートとの何れかで行われる。
したがって、FGSTフレームをFGS HSビデオ符号化手法において挿入するのに要する帯域幅を低減する手法が必要となる。
本発明の第1の特徴はビデオ符号化に関する。この特徴は第1レベルの動き補償残余画像フレームの少なくとも部分から動き補償拡張参照フレームを構築することに関する。第2レベルの動き補償残余画像フレームは動き拡張参照フレーム及びビデオから予測される。第2レベルの動き補償残余画像フレームは時間的フレームのデータ・ストリームに細粒度スケーラブル符号化される。
本発明の第2の特徴はビデオ復号化に関する。この特徴は第1レベルの動き補償残余画像フレームの少なくとも部分から動き補償拡張参照フレームを構築することに関する。拡張レイヤ・データ・ストリームの第2レベルの時間的フレーム部分は細粒度スケーラブル復号化されて第2レベルの動き補償残余フレームを構築する。動き補償拡張参照フレームは第2レベルの動き補償残余フレームと合成されて第2レベルの時間的フレームを構築する。
本発明の効果、特性、及び種々の別の特徴は、添付図面に関連して詳細に次に記載する例示的実施例を検討することによって十分に明らかとなり、添付図面では同じ参照番号は図面を通して同様な構成要素を示す。
図3Aは本発明の第1例示的実施例によるFGSベースのハイブリッド型時間的SNRスケーラビリティ構造(FGS HS構造30A)を示す。FGS HS構造30AはIとPのフレームによって符号化されたBL31Aと、残余SNRのIとPのフレーム33A及び、少なくとも、第1と第2のレベルの、動き補償された、残余又は時間的(FGST)、双方向予測(B)フレーム34,35a,並びに35B、とによってFGS符号化された単一のEL32Aを有する。
第1レベルのFGSTフレーム34は、高品質「拡張」BL参照フレームで、各々がBLフレーム全体と、少なくともELフレームの一部分、すなわち、ELフレームの1つ若しくは複数のビットプレーン、又はビットプレーンの部分、とから構築されるもの、から双方向に予測される。第2レベルのFGSTフレーム35Aは、高品質拡張BL参照フレームと、高品質「拡張」FGST参照フレーム、すなわち、FGSTフレーム34の1つ若しくは複数のビットプレーン、又はビットプレーンの部分、とから双方向に予測し得る。第2レベルのFGSTフレーム35Bは2つの別の高品質拡張FGST参照フレームの少なくとも部分から双方向に予測し得る。
図3Bは本発明の第2の例示的実施例によるFGSハイブリッド型時間的SNRスケーラビリティ構造(FGS HS構造30B)を示す。FGS HS構造30BはIとPのフレームによって符号化されたBL31B並びに、残余SNRのIとPのフレーム33Bと、少なくとも第1と第2のレベルの動き補償された、残余又は時間的(FGST)、単一方向予測(B)フレーム36,37,及び38とによってFGS符号化された単一のEL 32Bを有する。
第1レベルのFGSTフレーム36は少なくともSNRフレーム33Bの一部分から導き出された高品質拡張BL参照フレームから単一方向に予測される。第2レベルのFGSTフレーム37は更に、少なくともこの高品質拡張BL参照フレームの一部分から単一方向に予測される。第2レベルのFGSTフレーム38は、高品質拡張FGST参照フレーム、すなわち、少なくとも第1レベルのFGSTフレーム36の一部分、から単一方向に予測される。
これらの拡張参照フレームはずっと高い品質のものであるので、FGSTフレーム内部で符号化された残余動き補償エラーは図1A及び1BのFGS HS構造のFGSTフレームにおいてよりもずっと低い。したがって、本発明のFGSTフレームは少ないビット数で効率的に伝送し得る。本発明の高符号化効率は特に、符号化効率利得が必要な、無線の応用分野、に有用である。
図4は本発明の例示的実施例によるFGS HSビデオ符号器200の機能的アーキテクチャを示す。このビデオ符号器200は図3A及び3BのFGS HS構造30A,30Bによってビデオ信号を符号化することができるものである。ビデオ符号器200はBL符号器210及びEL符号器230を有する。ビデオ符号器200は元のビデオ信号を受信し、この信号はBL符号器210によってIとPのフレームのBLビット・ストリームに処理され、EL符号器230によって、FGS SNRのIとPのフレーム及び/又はPとBのFGSTフレームのELビット・ストリームに処理される。図4の符号器200は離散コサイン変換に基づくものであるが、ウェーブレットのような、別の変換を用い得る。
BL符号器210は、動き予測器211、動き補償器212、離散コサイン変換(DCT)213、量子化装置214、及びエントロピ符号器215を有する、第1ビデオ信号処理分岐で、BLビット・ストリームを生成するもの、を有する。BL符号器210は更に、逆量子化装置216、逆離散コサイン変換(IDCT)217、及びフレーム・メモリ218を含む第2ビデオ信号処理分岐を有する。
フレーム・メモリ218は、標準BL参照フレーム、拡張BL参照フレーム、及びFGST参照フレームを記憶するのに用いられる。動き予測器211は元のビデオ信号を受信し、フレーム・メモリ218に記憶された参照フレームと元のビデオ信号におけるビデオ・フレームとの間の動きの量で、画素特性における変動によって表されるもの、を予測し、BL動きベクトルと予測モード(BL参照フレーム)、又はEL動きベクトルと予測モード(拡張BL参照フレーム及びFGST参照フレーム)を有する動き情報信号を生成する。動き情報信号は動き補償器212及び第1データフロー・コントローラ219に印加される。
標準BL参照フレーム信号、BL動きベクトル及び予測モード信号が動き補償器212によって利用されて、標準BLのPフレームを予測するのに用いられる動き補償参照フレーム信号を生成する。拡張BL参照フレーム信号、FGST参照フレーム信号、及び、FGSTフレームに対するEL動き情報信号、が、動き補償器212によって利用されて、FGSTフレームの第1と第2のレベルを予測するのに用いられる、動き補償拡張BL参照フレーム信号及び動き補償FGST参照フレーム信号を生成する。
動き補償残余BLのPフレーム信号が第1減算器220で、標準動き補償BL参照フレーム信号を元のビデオ信号から減算することによって、生成される。第1レベルのFGSTフレームを生成する動き補償残余FGSTフレーム信号は第1減算器220で、動き補償拡張BL参照フレーム信号を元のビデオ信号から減算することによって、生成される。図3Aの第2レベルのFGSTフレーム35Aを生成する動き補償残余FGSTフレーム信号は第1減算器220で、動き補償拡張BL参照フレームと動き補償拡張FGST参照フレーム信号を合成したものを元のビデオ信号から減算することによって、生成する。図3Aの第2レベルFGSTフレーム35Bを生成する動き補償残余FGSTフレーム信号は第1減算器220で、2つの別の動き補償拡張FGST参照フレームを有する合成動き補償拡張FGST参照フレーム信号を元のビデオ信号から、減算することによって、生成される。
図3Bの第2レベルのFGSTフレーム37を生成する動き補償残余FGSTフレーム信号は第1減算器220で、動き補償拡張BL参照フレーム信号を元のビデオ信号から減算することによって、生成される。図3Bの第2レベルのFGSTフレーム38を生成する動き補償残余FGSTフレーム信号は第1減算器220で、動き補償FGST参照フレーム信号を元のビデオ信号から減算することによって、生成される。
DCT213は圧縮を、動き補償された残余の、FGSTとBLのPのフレーム信号における空間的情報を周波数領域に慣例的に変換することによって、実現する。元のビデオ信号におけるBLのIフレームもこの方法でDCT213によって圧縮される。適切な時点で、第2データフロー・コントローラ221はDCT213の出力で生成されたBLのIとPのフレームのDCTビットプレーン信号を量子化装置214に送信し、更に圧縮する。
エントロピ符号器215は通常の可変長符号化などの手法を用いて更に、量子化装置214の出力での量子化DCTビットプレーン信号を圧縮する。第1多重化装置222はエントロピ符号器215の出力での信号を、第1多重化装置222に、上記動き予測器から第1データフロー・コントローラ219を介して、転送される、BL動き情報信号、と多重化してIとPのフレームのBLビット・ストリームを生成する。
逆量子化装置216は量子化装置214の出力を逆量子化して、量子化装置214に対する変換入力を表す信号を生成する。この信号は再構築された、BLのDCT係数を表す。IDCT217は再構築された、BLのDCT係数を復号化して、変換及び量子化の処理によって修正された元のビデオ信号のBLのIとPのフレームの表現を備える信号を生成する。第1加算器223はIDCT217の出力での信号と動き補償器212の出力での適切な参照フレーム信号からBLのIとPのフレームを再構築する。これらの再構築されたBLのIとPのフレームはフレーム・メモリ218に記憶され、別のBLのPフレームと第1レベルのFGSTフレームを予測する標準BL参照フレームとして用いられる。
EL符号器230は、DCT残余画像メモリ231、適応型量子化装置232、及びFGS符号器235を有する第1ビデオ信号処理分岐を有する。EL符号器230は更に、第1ビットプレーン選定器236、第2IDCT237、第2ビットプレーン選定器244、及び第3IDCT246を有する第2ビデオ信号処理分岐を有する。
EL符号器230における第2減算器238はDCT213の出力でのBLのDCTビットプレーン信号を量子化装置214の出力での量子化されたBLのDCTビットプレーン信号から減算してSNRのDCTビットプレーン残余画像を生成する。適切な時点で、第3のデータフロー・コントローラ239がSNRのDCTビットプレーン残余画像信号(SNR残余信号)を第2減算器238の出力に印加するか、動き補償された第1と第2のレベルのFGST のDCTビットプレーン残余信号(FGST残余信号)が第2データフロー・コントローラ221によってDCT残余画像メモリ231に転送されて記憶される。
適応型量子化装置232は変換符号化ビデオの視覚品質を向上させる既知の符号化ツールである。適応型量子化装置232はSNRとFGSTの残余信号に選択的拡張を、残余画像フレーム内部の選定マクロブロックをビット・シフトすることによって、行う既知の選択的拡張ツール233、及び選定係数をビット・シフトする任意の既知の周波数重み付けツールを有する。
適応型量子化装置232でのSNR残余信号はFGS符号器235によって、ビットプレーンDCT走査及びエントロピ符号化を用いて圧縮され、それによってFGSのSNRビットストリームが生成される。第4データ・フロー・コントローラ240は適切な時点でFGSのSNRビットストリームを第3多重化装置243に送出する。適応型量子化装置232の出力でのFGST残余信号は更に、FGS符号器235によって、ビットプレーンDCT走査及びエントロピ符号化を用いて圧縮される。FGS符号器235の出力での圧縮FGST残余信号は第4データフロー・コントローラ240によって適切な時点で第2多重化装置241に送出され、該第2多重化装置241は第1データフロー・コントローラ219を介して転送されるEL動き情報信号を圧縮FGST残余信号と多重化し、それによってFGSTビットストリームを生成する。SNR FGS ELビットストリームと時間的FGSビットストリームは、第3多重化装置243を介して多重化されて(SNRと、第1と第2のレベルの時間的、との両方のFGSフレームを有する)単一のELビット・ストリームを生成するか、2つの別個のストリームにおいて記憶/送信される。
第1ビットプレーン選定器すなわちマスキング装置236は、SNR残余画像信号の、少なくともビットプレーンの一部分、すなわち、ビットプレーンの一部分、1つ若しくは複数のビットプレーンの全部、又はビットプレーンの全部とビットプレーンの一部分との如何なる組み合わせでもあるもの、を選定する。このデータ信号は第2加算器242で、BL符号器210のIDCT216の出力でのその相当するBLフレーム信号と合成されて拡張BL参照フレームを構築する。第2IDCT237は拡張BL参照フレームのDCT係数を復号化する。第3加算器224は、第2IDCT237の出力での拡張BLフレーム信号と動き補償器212での出力での適切な参照フレーム信号とを合成する。第3加算器224で構築された拡張BLフレームはフレーム・メモリ218に記憶され、FGSTフレームを予測する拡張BL参照フレームとして用いられる。
第2ビットプレーン選定器244、第4と第5の加算器245並びに247、及び第3のIDCT246は第2レベルのFGSTフレームを予測するのに用いられるFGST参照フレームを生成する。図3Aの第2レベルのFGSTフレーム35Aの場合には、第2ビットプレーン選定器244は参照FGST DCTビットプレーン残余画像34の少なくとも一部分と参照SNR DCTビットプレーン残余画像33Aの少なくとも一部分を選定する。このデータ信号は、第4加算器245でBL符号器210のIDCT216の出力での相当するBL DCT残余フレーム信号と合成されて、図3AのFGSTフレーム35Aを双方向に予測するFGST参照フレーム信号を構築する。このデータ信号は更に、第3IDCT246に印加される。
図3Aの第2レベルのFGSTフレーム35Bの場合、第2ビットプレーン選定器244は参照FGST DCTビットプレーン残余画像34の各々の少なくとも一部分を選定する。このデータ信号は図3AのFGSTフレーム35Bを双方向に予測するFGST参照フレーム信号を有する。このデータ信号は第4加算器245によって処理されるものでなく、したがって、第3IDCT246に印加される。
図3Bの第2レベルのFGSTフレーム37の場合、第2ビットプレーン選定器244は参照SNR DCTビットプレーン残余画像33Bの少なくとも一部分を選定する。このデータ信号は第4加算器245で、BL符号器210のIDCT216の出力での相当するBL DCT残余フレーム信号と合成されて図3Bの第2レベルFGSTフレーム37を単一方向に予測するFGST参照フレーム信号を構築する。
図3Bのもう1つの第2レベルFGSTフレーム38の場合、第2ビットプレーン選定器244は参照FGST DCTビットプレーン残余画像36の少なくとも一部分を選定する。このデータ信号は図3BのFGSTフレーム38を単一方向に予測するFGST参照フレーム信号を有する。このデータ信号は第4加算器245によって処理されるものでなく、したがって、第3IDCT246に印加される。
第3IDCT246は上記参照フレーム信号のDCT係数を復号化する。第5加算器247は第3IDCT246の出力での信号と動き補償器218の出力での適切な参照フレーム信号とを合成する。第5加算器247で構築された、拡張FGSTフレーム(すなわち、図3Aの第1レベルFGST参照フレーム34とSNR参照フレーム33A、並びに図3Bの第1レベルFGST参照フレーム36から導き出されたもの)及び拡張BL参照フレーム(すなわち、図3Bの第1レベルSNR参照フレームから導き出されたもの)はフレーム・メモリ218に記憶されて、第2レベルFGSTフレームを予測する参照フレームとして用いられる。
図5は本発明の例示的実施例によるFGS HSビデオ復号器300の機能的アーキテクチャを示す。このビデオ復号器300は図4のビデオ符号器200によって生成されるBLとELのビットストリームを復号化することができる。
ビデオ復号器300はBL復号器310及びEL復号器330を有する。BL復号器はBL可変長復号器(VLD)311、逆量子化装置311、並びに第1IDCT313、BLフレーム・メモリ314及び動き補償器315を有する。
EL復号器330はFGSビットプレーン復号器331、第1ビットプレーン選定器332、第2IDCT333、ELフレーム・メモリ334、第2ビットプレーン選定器343、及び第3IDCT344を有する。EL復号器330は動き補償器315をBL復号器310と共有する。
BLビットストリームはBL復号器310によって受信され、第1逆多重化装置316を介して、逆多重化されて、符号化BL情報信号をBL動き情報信号から分離する。BL VLD311はBL情報信号を受信し、BL符号器210からのエントロピ符号化処理を逆にして量子化BL DCT係数信号を生成する。量子化BL情報信号は逆量子化装置312によって逆量子化されてBL DCT係数信号を再構築する。第1IDCT313はBL DCT係数信号を逆コサイン変換する。第1IDCT313の出力でのBLのIのフレーム部分は更なる処理を何ら要するものでない。したがって、第1加算器319でのBLのIフレームはBLフレーム・メモリ314に記憶される。
動き補償器315は、第1データフロー・コントローラによって制御されて、適切な時点でBL動き情報信号を受信する。動き補償器315は更に、BLフレーム・メモリ314に記憶されたBL動き情報及び、BLのIとPの参照フレーム、を用いて、BLのPフレームを予測するのに用いられる動き補償BL参照フレームを再構築する。
動き補償器315の出力での動き補償BL参照フレーム信号は第1加算器319に適切な時点で第2データフロー・コントローラ318によって印加される。第1加算器319はこの信号と、第1IDCT313の出力での信号の残りの部分とを合成してBL Pフレームを再構築し、その結果はBLフレーム・メモリ314に記憶される。第1加算器319の出力で生成されたBLフレーム信号は任意にBLビデオとして出力し得る。
ELビットストリームはEL復号器330によって受信され、第2逆多重化装置335によって逆多重化されて符号化FGS SNR信号を符号化FGST信号から分離する。符号化FGS SNR信号は適切な時点で第3データフロー・コントローラ337を介して、FGSビットプレーン復号器331に入力され、該復号器は符号化FGS SNR信号のビットプレーンを、可変長復号化、逆シフト、及び逆離散コサイン変換の処理を行うことによって、復号化する。第2加算器340は、FGSビットプレーン復号器331の出力での復号化FGSのIとPのSNRフレーム信号を第1加算器319の出力での復号化されたBLのIとPのフレーム信号と適切な時点で第4データフロー・コントローラ338を介して合成する。第5データフロー・コントローラ341は、適切な時点を選定して第1加算器319の出力で、合成されたBLとSNRのフレーム信号を、拡張ビデオとして出力する。
第1ビットプレーン選定器332はFGSビットプレーン復号器331によって処理されるFGS SNR残余画像又はフレームの信号を逆離散コサイン変換する前に入力し、先行して選定された、いくつかの参照ビットプレーン、ビットプレーンの一部など、で、符号化中に第1レベルFGSTフレームを予測するのに用いられたもの、を選定する。第2IDCT333は選定された部分的に復号化された参照FGS SNRビットプレーンに逆コサイン変換を行う。第3加算器342は第2IDCT333の出力での完全に復号化された参照FGS SNR残余画像又はフレームの部分を、BLフレーム・メモリ314に記憶された相当するBLフレームと合成して、拡張BL参照フレームを再構築する。拡張BL参照フレームはELフレーム・メモリ334に記憶されて、後に第1レベルFGSTフレームを再構築するのに用いられる。
第3逆多重化装置336はFGST情報信号を逆多重化して符号化FGST残余画像又はフレームの信号をEL動き情報信号から分離する。符号化FGST残余画像又はフレームの信号はFGSビットプレーン復号器331によって適切な瞬間に、第3データフロー・コントローラ337を介して、受信され、次に説明するように処理される。
図3Aの双方向に予測されたFGSTフレーム35Aについては、第2ビットプレーン選定器332はFGSビットプレーン復号器331によって処理される、FGSのSNRとFGSTとの両方の、残余の、画像又はフレームの信号を、逆離散コサイン変換する前に、入力し、先行して選定された、いくつかの、参照ビットプレーン、ビットプレーンの部分、など、で、符号化中に第2レベルFGSTフレーム35Aを予測するのに用いられたもの、を選定する。第3IDCT344は選定された部分的に復号化された参照FGSのSNRとFGSTのビットプレーンに逆コサイン変換を行う。FGS SNRビットプレーンの場合、第4加算器345が第3IDCT344の出力での完全に復号化された参照FGS SNR残余画像又はフレームの部分をBLフレーム・メモリ314に記憶された相当するBLフレームと合成して第2レベルのFGSTフレーム35Aに対する拡張BL参照フレームを再構築する。これらの拡張BL参照フレームはELフレーム・メモリ334に記憶される。FGSTビットプレーンの場合、第4加算器は何の役目を担うものでなく、したがって、第3IDCT344の出力での完全に復号化された拡張FGST参照フレームがELフレーム・メモリ334に、相当する拡張BL参照フレームとともに、記憶されて、後に第2レベルのFGSTフレーム35Aを再構築するのに用いられる。
図3Aの双方向に予測されたFGSTフレーム35Bについては、第2ビットプレーン選定器332はFGSビットプレーン復号器331によって処理されるFGST残余画像又はフレームの信号のみを逆離散コサイン変換する前に入力し、先行して選定された、いくつかの参照ビットプレーン、ビットプレーンの部分、など、で、符号化中に第2レベルのFGSTフレーム35Bを予測するのに用いられたもの、を選定する。第3IDCT344は選定された部分的に復号化された参照FGSTビットプレーンに逆コサイン変換を行う。第4加算器はFGSTビットプレーンの場合には、役目を何ら担うものでないため、第3IDCT344の出力での完全に復号化された拡張FGST参照フレームはELフレーム・メモリ334に記憶されて、第2レベルFGSTフレーム35Bを再構築するのに後に用いられる。
図3Bの単一方向に予測されたFGSTフレーム37については、第2ビットプレーン332は、FGSビットプレーン復号器331によって処理されるFGS SNRの残余の画像又はフレームの信号を入力し、先行して選定された、いくつかの参照ビットプレーン、ビットプレーンの部分、など、で、符号化中に、第2レベルのFGSTフレーム37を予測するのに用いられたもの、を選定する。第3IDCT344は選定された部分的に復号化された参照FGS SNRビットプレーンに逆コサイン変換を行う。第4加算器345は第3IDCT344の出力での完全に復号化された参照FGS SNR残余画像又はフレームの部分をBLフレーム・メモリ314に記憶された相当するBLフレームと合成して第2レベルのFGSTフレーム37に対する拡張BL参照フレームを再構築する。これらの拡張BL参照フレームはELフレーム・メモリ334に記憶されて後に、第2レベルFGSTフレーム37を再構築するのに用いられる。
図3Bの単一方向に予測されるFGSTフレーム38については、第2ビットプレーン選定器332はFGSビットプレーン復号器331によって処理されるFGST残余の画像又はフレームの信号のみを、逆離散コサイン変換前に、入力し、先行して選定された、いくつかの参照ビットプレーン、ビットプレーンの部分、など、で、符号化中に第2レベルFGSTフレーム38を予測するのに用いられたもの、を選定する。第3IDCT344は選定された部分的に復号化された参照FGSTビットプレーンに逆コサイン変換を行う。第4加算器はFGSTビットプレーンの場合には何ら役目を担うものでないため、第3IDCT344の出力での完全に復号化された拡張FGST参照残余画像又はフレームの部分はELフレーム・メモリ334に記憶されて、第2レベルFGSTフレーム38を再構築するのに後に用いられる。
EL動き情報信号は動き補償器315によって適切な瞬間に、第1データフロー・コントローラ317を介して、受信される。動き補償器は、ELフレーム・メモリにおいて記憶された、EL動き情報と、拡張BL並びにFGSTの参照フレーム、を用いて動き補償拡張BLとFGSTの参照フレームを再構築する。
第5加算器339は動き補償器315の出力での動き補償拡張BLとFGSTの参照フレーム信号をFGS復号器331の出力での復号化FGST残余フレーム信号と合成する。この機能のタイミングは第4データフロー・コントローラ338によって制御される。第5データフロー・コントローラ341は、適切な時点で、第5加算器の出力で、再構築されたFGSTフレーム信号を、拡張ビデオとして出力する。
図6は本発明の原理を実施するのに用い得るシステム400の例示的実施例を示す。システム400はテレビ受信機、セット・トップ・ボックス、デスクトップ型、ラップトップ型若しくはパームトップ型のコンピュータ、携帯情報端末(PDA)、ビデオ・カセット・レコーダ(VCR)、ディジタル・ビデオ・レコーダ(DVR)、TiVO(ティーボ)装置など、のようなビデオ/画像記憶装置、更には、これら及び別の装置の一部分又は組み合わせを表し得る。システム400は1つ又は複数のビデオ/画像源401、1つ又は複数の入力/出力装置402、プロセッサ403及びメモリ404を有する。ビデオ/画像源401は、例えば、テレビジョン受信器、VCR又は別のビデオ/画像記憶装置を表し得る。上記ビデオ/画像源401は代替として、例えば、インターネットのようなグローバル・コンピュータ・ネットワーク、ワイド・エリア・ネットワーク、メトロポリタン・エリア・ネットワーク、ローカル・エリア・ネットワーク、地上波放送システム、ケーブル・ネットワーク、衛星ネットワーク、無線ネットワーク、若しくは電話ネットワーク、更には、これら及び別の種類のネットワークの部分又は組み合わせを介して1つ若しくは複数のサーバからビデオを受信する1つ又は複数のネットワーク接続を表し得る。
入出力装置402、プロセッサ403及びメモリ404は通信媒体405を介して通信し得る。通信媒体405は、例えば、バス、通信ネットワーク、回路、回路カード若しくは別の装置の1つ又は複数の内部接続、更には、これら並びに別の通信装置の一部分及び組み合わせを表し得る。上記ビデオ/画像源401からの入力ビデオ・データはメモリ404に記憶された1つ又は複数のソフトウェア・プログラムによって処理され、プロセッサ403によって、表示装置406に供給される出力ビデオ/画像を生成するよう、実行される。
好適実施例では、本発明の原理を利用する符号化及び復号化はコンピュータが判読可能なコードで、このシステムによって実行されるもの、によって実施し得る。このコードはメモリ404に記憶され得るか、CD-ROM又はフロッピー(登録商標)・ディスクのようなメモリ媒体からの読み取り/ダウンロードが行われ得る。別の実施例では、ハードウェア回路を、ソフトウェア命令の代わりか、ソフトウェア命令との組み合わせで用いて、本発明を実施し得る。例えば、図4及び5に表す機能的構成要素は更に、別個のハードウェア構成要素として実施し得る。
本発明は特定の実施例によって上記に記載したが、本発明は本明細書及び特許請求の範囲開示の実施例に限定すなわち制限することを意図するものでないこととする。例えば、DCT以外の別の変換を利用し得るものであり、該別の変換はウェーブレット又は対戦追撃法を有するものであるが、これらに限定されるものでない。これら及び別の全てのそのような修正及び変更は本特許請求の範囲記載の範囲内におさまるものとする。
Claims (14)
- ビデオを符号化する方法であって:
第1レベル動き補償残余画像フレームの少なくとも部分から動き補償拡張参照フレームを構築する工程;
該動き補償拡張参照フレーム並びに該ビデオから第2レベル動き補償残余画像フレームを予測する工程;及び
該第2レベル動き補償残余画像フレームを時間的フレームのデータ・ストリームに細粒度スケーラブル符号化する工程;
を有することを特徴とする、ビデオを符号化する方法。 - 請求項1記載の、ビデオを符号化する方法であって、更に:
該ビデオをベース・レイヤ・フレームのデータ・ストリームに符号化する工程;
残余画像フレームを該ベース・レイヤ・フレームから算定する工程;及び
該残余画像フレームをSNR品質フレームのデータ・ストリームに細粒度スケーラブル符号化する工程;
を有することを特徴とする、ビデオを符号化する方法。 - 請求項2記載の、ビデオを符号化する方法であって、更に:
該ベース・レイヤ・フレーム並びに、該残余画像フレームの少なくとも部分、から動き補償拡張ベース・レイヤ参照フレームを構築する工程;
該動き補償拡張ベース・レイヤ参照フレーム並びに該ビデオから該第1レベル動き補償残余画像フレームを予測する工程;及び
該第1レベル動き補償残余画像フレームを該時間的フレームのデータ・ストリームに細粒度スケーラブル符号化する工程;
を有することを特徴とする、ビデオを符号化する方法。 - 請求項3記載の、ビデオを符号化する方法であって、更に:
該時間的フレームのデータ・ストリームを該SNR品質フレームのデータ・ストリームと合成して、該時間的フレームと該SNR品質フレームとの、単一データ・ストリームを構築する工程;
を有することを特徴とする、ビデオを符号化する方法。 - 請求項2記載の、ビデオを符号化する方法であって、更に:
該時間的フレームのデータ・ストリームを該SNR品質フレームのデータ・ストリームと合成して、該時間的フレームと該SNR品質フレームとの、単一データ・ストリーム、を構築する工程;
を有することを特徴とする、ビデオを符号化する方法。 - ビデオ信号を符号化する方法であって:
第1レベル動き補償残余画像フレームの少なくとも部分から動き補償拡張参照フレームを構築する工程;
該動き補償拡張参照フレーム並びに該ビデオから第2レベル動き補償残余画像フレームを予測する工程;及び
該第2レベル動き補償残余画像フレームを時間的フレームのデータ・ストリームに細粒度スケーラブル符号化する工程;
を有することを特徴とする、ビデオ信号を符号化する方法。 - ビデオを符号化する装置であって:
第1レベル動き補償残余画像フレームの少なくとも部分から動き補償拡張参照フレームを構築する手段;
該動き補償拡張参照フレーム並びに該ビデオから第2レベル動き補償残余画像フレームを予測する手段;及び
該第2レベル動き補償残余画像フレームを時間的フレームのデータ・ストリームに細粒度スケーラブル符号化する手段;
を有することを特徴とする、ビデオを符号化する装置。 - ビデオを符号化するメモリ媒体であって:
第1レベル動き補償残余画像フレームの少なくとも部分から動き補償拡張参照フレームを構築するコード;
該動き補償拡張参照フレーム並びに該ビデオから第2レベル動き補償残余画像フレームを予測するコード;及び
該第2レベル動き補償残余画像フレームを時間的フレームのデータ・ストリームに細粒度スケーラブル符号化するコード;
を有することを特徴とする、ビデオを符号化するメモリ媒体。 - ベース・レイヤ・データ・ストリームと拡張レイヤ・データ・ストリームで、併せてビデオを表すもの、を、復号化する方法であって:
第1レベル動き補償残余画像フレームの少なくとも部分から動き補償拡張参照を構築する工程;
該拡張レイヤ・データ・ストリームの第2レベル時間的フレーム部分を細粒度スケーラブル復号化して第2レベル動き補償残余フレームを構築する工程;及び
該動き補償拡張参照フレームを該第2レベル動き補償残余フレームと合成して第2レベル時間的フレームを構築する工程;
を有することを特徴とする、復号化する方法。 - 請求項9記載の復号化する方法であって、更に:
該ベース・レイヤ・データ・ストリームを復号化してベース・レイヤ・フレームを構築する工程;
該拡張レイヤ・データ・ストリームのSNR品質フレーム部分を細粒度スケーラブル復号化してSNR品質フレームを構築する工程;
該ベース・レイヤ・フレーム並びに、該SNR品質フレームの少なくとも部分、から動き補償拡張ベース・レイヤ参照フレームを構築する工程;
該拡張レイヤ・データ・ストリームの時間的フレーム部分を細粒度スケーラブル復号化して該第1レベル動き補償残余フレームを構築する工程;及び
該動き補償拡張ベース・レイヤ参照フレームを該第1レベル動き補償残余フレームと合成して第1レベル時間的フレームを構築する工程;
を有することを特徴とする、復号化する方法。 - 請求項10記載の復号化する方法であって、更に:
該ベース・レイヤ・フレーム及び該SNR品質フレームを拡張ビデオに合成する工程;
を有することを特徴とする、復号化する方法。 - 請求項10記載の復号化する方法であって、更に:
該ベース・レイヤ・フレーム、該SNR品質フレーム、及び、該第1と該第2のレベルの時間的フレーム、を拡張ビデオに合成する工程;
を有することを特徴とする、復号化する方法。 - ベース・レイヤ・データ・ストリームと拡張レイヤ・データ・ストリームで、併せてビデオを表すもの、を、復号化する装置であって:
第1レベル動き補償残余画像フレームの少なくとも部分から動き補償拡張参照を構築する手段;
該拡張レイヤ・データ・ストリームの第2レベル時間的フレーム部分を細粒度スケーラブル復号化して第2レベル動き補償残余フレームを構築する手段;及び
該動き補償拡張参照フレームを該第2レベル動き補償残余フレームと合成して第2レベル時間的フレームを構築する手段;
を有することを特徴とする、復号化する装置。 - ベース・レイヤ・データ・ストリームと拡張レイヤ・データ・ストリームで、併せてビデオを表すもの、を、復号化するメモリ媒体であって:
第1レベル動き補償残余画像フレームの少なくとも部分から動き補償拡張参照を構築するコード;
該拡張レイヤ・データ・ストリームの第2レベル時間的フレーム部分を細粒度スケーラブル復号化して第2レベル動き補償残余フレームを構築するコード;及び
該動き補償拡張参照フレームを該第2レベル動き補償残余フレームと合成して第2レベル時間的フレームを構築するコード;
を有することを特徴とする、復号化するメモリ媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/156,410 US6944346B2 (en) | 2002-05-28 | 2002-05-28 | Efficiency FGST framework employing higher quality reference frames |
PCT/IB2003/002030 WO2003101116A1 (en) | 2002-05-28 | 2003-05-27 | Improved efficiency fgst framework employing higher quality reference frames |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005528046A true JP2005528046A (ja) | 2005-09-15 |
Family
ID=29582253
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004507259A Pending JP2005528046A (ja) | 2002-05-28 | 2003-05-27 | 高品質参照フレームを利用する、効率を向上させたfgstフレームワーク |
Country Status (7)
Country | Link |
---|---|
US (1) | US6944346B2 (ja) |
EP (1) | EP1512293A1 (ja) |
JP (1) | JP2005528046A (ja) |
KR (1) | KR20050012755A (ja) |
CN (1) | CN1656816A (ja) |
AU (1) | AU2003241071A1 (ja) |
WO (1) | WO2003101116A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100556838B1 (ko) * | 2002-09-17 | 2006-03-10 | 엘지전자 주식회사 | 미세단위 신축형 부호화 및 복호화 장치와 방법 |
KR100539923B1 (ko) * | 2003-02-10 | 2005-12-28 | 삼성전자주식회사 | 화상통화시 화자의 영상을 구분하여 차등적 부호화할 수있는 비디오 엔코더 및 이를 이용한 비디오신호의 압축방법 |
KR100679018B1 (ko) * | 2004-09-07 | 2007-02-05 | 삼성전자주식회사 | 다계층 비디오 코딩 및 디코딩 방법, 비디오 인코더 및디코더 |
US7778474B2 (en) * | 2004-10-06 | 2010-08-17 | Nippon Telegraph And Telephone Corporation | Scalable encoding method and apparatus, scalable decoding method and apparatus, programs therefor, and storage media for storing the programs |
KR100891662B1 (ko) | 2005-10-05 | 2009-04-02 | 엘지전자 주식회사 | 비디오 신호 디코딩 및 인코딩 방법 |
EP1932363B1 (en) * | 2005-10-05 | 2016-05-18 | LG Electronics Inc. | Method and apparatus for reconstructing image blocks |
KR20070096751A (ko) * | 2006-03-24 | 2007-10-02 | 엘지전자 주식회사 | 영상 데이터를 코딩/디코딩하는 방법 및 장치 |
KR100891663B1 (ko) * | 2005-10-05 | 2009-04-02 | 엘지전자 주식회사 | 비디오 신호 디코딩 및 인코딩 방법 |
KR20070038396A (ko) * | 2005-10-05 | 2007-04-10 | 엘지전자 주식회사 | 영상 신호의 인코딩 및 디코딩 방법 |
CN104125464A (zh) * | 2005-12-08 | 2014-10-29 | 维德约股份有限公司 | 用于视频通信系统中的差错弹性和随机接入的系统和方法 |
KR101105340B1 (ko) | 2009-08-21 | 2012-01-16 | 주식회사 캐프 | 차량용 와이퍼 블레이드의 금속재 클램프와 바디 스프링의 조립방법 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5508823A (en) * | 1991-08-28 | 1996-04-16 | Canon Kabushiki Kaisha | Image processing method and apparatus |
US6181822B1 (en) * | 1993-05-12 | 2001-01-30 | The Duck Corporation | Data compression apparatus and method |
JPH0787327A (ja) * | 1993-09-17 | 1995-03-31 | Fuji Xerox Co Ltd | 画像符号化装置 |
KR970003799B1 (ko) * | 1993-12-29 | 1997-03-21 | 양승택 | 영상 프레임차를 이용한 영상신호 전송장치 |
US6263022B1 (en) * | 1999-07-06 | 2001-07-17 | Philips Electronics North America Corp. | System and method for fine granular scalable video with selective quality enhancement |
GB2364842A (en) | 2000-07-11 | 2002-02-06 | Motorola Inc | Method and system for improving video quality |
US6940905B2 (en) * | 2000-09-22 | 2005-09-06 | Koninklijke Philips Electronics N.V. | Double-loop motion-compensation fine granular scalability |
US20020037046A1 (en) | 2000-09-22 | 2002-03-28 | Philips Electronics North America Corporation | Totally embedded FGS video coding with motion compensation |
-
2002
- 2002-05-28 US US10/156,410 patent/US6944346B2/en not_active Expired - Fee Related
-
2003
- 2003-05-27 CN CNA038122987A patent/CN1656816A/zh active Pending
- 2003-05-27 KR KR10-2004-7019144A patent/KR20050012755A/ko not_active Application Discontinuation
- 2003-05-27 JP JP2004507259A patent/JP2005528046A/ja active Pending
- 2003-05-27 WO PCT/IB2003/002030 patent/WO2003101116A1/en active Application Filing
- 2003-05-27 AU AU2003241071A patent/AU2003241071A1/en not_active Abandoned
- 2003-05-27 EP EP03730391A patent/EP1512293A1/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
CN1656816A (zh) | 2005-08-17 |
US6944346B2 (en) | 2005-09-13 |
KR20050012755A (ko) | 2005-02-02 |
AU2003241071A1 (en) | 2003-12-12 |
US20030223643A1 (en) | 2003-12-04 |
WO2003101116A1 (en) | 2003-12-04 |
EP1512293A1 (en) | 2005-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6944222B2 (en) | Efficiency FGST framework employing higher quality reference frames | |
JP4729220B2 (ja) | ハイブリッドな時間的/snr的微細粒状スケーラビリティビデオ符号化 | |
JP4446660B2 (ja) | 細粒度スケーラビリティビデオ符号化における上位レイヤのための改善された予測構造 | |
US6697426B1 (en) | Reduction of layer-decoding complexity by reordering the transmission of enhancement layer frames | |
US7042944B2 (en) | Single-loop motion-compensation fine granular scalability | |
US6940905B2 (en) | Double-loop motion-compensation fine granular scalability | |
US20020037046A1 (en) | Totally embedded FGS video coding with motion compensation | |
US20070121719A1 (en) | System and method for combining advanced data partitioning and fine granularity scalability for efficient spatiotemporal-snr scalability video coding and streaming | |
US6944346B2 (en) | Efficiency FGST framework employing higher quality reference frames | |
US6904092B2 (en) | Minimizing drift in motion-compensation fine granular scalable structures | |
KR100860950B1 (ko) | 이중 루프 움직임 보상 파인 그래뉼 스케일러빌러티 | |
US20050135478A1 (en) | Reduction of layer-decoding complexity by reordering the transmission of enhancement layer frames |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060525 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090929 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100309 |