JP5683350B2 - 圧縮されたディジタルビデオ信号のインタラクティブな遠隔ブラウジングを提供する方法およびシステム - Google Patents

圧縮されたディジタルビデオ信号のインタラクティブな遠隔ブラウジングを提供する方法およびシステム Download PDF

Info

Publication number
JP5683350B2
JP5683350B2 JP2011072616A JP2011072616A JP5683350B2 JP 5683350 B2 JP5683350 B2 JP 5683350B2 JP 2011072616 A JP2011072616 A JP 2011072616A JP 2011072616 A JP2011072616 A JP 2011072616A JP 5683350 B2 JP5683350 B2 JP 5683350B2
Authority
JP
Japan
Prior art keywords
client
video
code block
computer system
motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2011072616A
Other languages
English (en)
Other versions
JP2011176852A (ja
Inventor
トーブマン、デイヴィッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisearch Ltd
Original Assignee
Unisearch Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisearch Ltd filed Critical Unisearch Ltd
Publication of JP2011176852A publication Critical patent/JP2011176852A/ja
Application granted granted Critical
Publication of JP5683350B2 publication Critical patent/JP5683350B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/007Transform coding, e.g. discrete cosine transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)

Description

本発明は、包括的には、ビデオを圧縮形式で送信できるようにするビデオ信号の処理に関し、特に、これに限られるわけではないが、スケーラブルな形式でビデオを効率的に送信できるようするビデオ信号の処理に関する。
現在、インターネットのようなコンピュータネットワーク上で利用可能なほとんどのビデオコンテンツは、通常のモデム接続を介して何十分もの時間を要し得るプロセスで予めロードされなければならない。それにもかかわらず、ロードプロセス後のビデオの品質および継続時間は、まったく期待はずれであることがある。中には、ビデオのストリーミングか可能な状況もあり、この状況では、ビデオは、受信されながら、実時間で伸張およびレンダリングされる。しかしながら、これは、当該ネットワーク接続の能力よりも低い圧縮ビットレートに限定される。これらの問題に対処する最も明らか方法は、個々のクライアントが、自身のニーズおよび忍耐に最も適したビットレートおよびそれに付随する品質でその素材をブラウジングすることを選択できるように、ビデオコンテンツをさまざまな異なるビットレートで圧縮し、記憶することであろう。しかしながら、この種のアプローチは、ビデオのブラウジングの問題に対する効果的な解決法を意味しない。これを理解するために、ビデオが、R、2R、3R、4Rおよび5Rのビットレートで圧縮されていると仮定する。この場合、ビデオサーバには、これら個別に圧縮されたすべてのビットストリーム用の記憶容量を確保しなければならない。これは、明らかに無駄である。より重要なことは、ビデオの低ビットレートバージョンと関連した品質が、不十分であると判明すると、新しいバージョン一式を、より高いビットレートでダウンロードしなければならないことである。この新しいビットストリームは、ダウンロードするのにより長い時間を必要としなければならず、これは、一般に、ビデオストリーミングのあらゆる可能性を排除する。
遠隔でビデオをブラウジングする問題に対する現実的な解決を可能にするために、スケーラブル圧縮技術が必要とされる。スケーラブル圧縮とは、組み込みサブセット(embedded subset)を含むビットストリームの生成をいい、組み込みサブセットのそれぞれは、オリジナルのビデオの効率的な圧縮を連続的により高い品質で表現する。上記簡単な例に戻って、スケーラブル圧縮されたビデオのビットストリームは、R、2R、3R、4Rおよび5Rのビットレートを有する組み込みサブセットを、同じビットレートを有する非スケーラブルのビットストリームに匹敵する品質で含むことができる。しかしながら、これらのサブセットは、すべてお互いの内部に組み込まれるので、ビデオサーバに必要とされる記憶容量は、利用可能な最も高いビットレートの記憶容量と同一である。より重要なことは、ビデオの低ビットレートバージョンと関連した品質が、不十分であると判明すると、次のより高いレベルの品質を達成するために必要とされる増加コントリビューションのみを、サーバから取り出さなければならないことである。ある特定のアプリケーションでは、レートRのバージョンが、実時間でクライアントに直接ストリーミングされることがある。もしその品質が不十分であるならば、次のレートRの増分をクライアントにストリーミングして、キャッシュされた前のビットストリームに付加することができ、実時間でより高い品質のレンディションを再生することができる。このプロセスは、徐々に改善されるビデオコンテンツを、サーバから受信しながら実時間で表示する能力を犠牲にすることなく、永久に続けることができる。
しかしながら、主要な問題は、高効率のスケーラブルビデオ圧縮アルゴリズムが、実用面にも、学術的な文献にも存在していないということである。効率的なスケーラブル画像圧縮アルゴリズムは、以前から存在する。その中で最もよく知られている例は、いわゆる組み込み型ゼロツリーアルゴリズム(embedded zero-tree algorithm)である。このアルゴリズムは、J. Shapiro著「An embedded hierarchical image coder using zerotrees of wavelet coefficients」 Data Compression Conference (Snowbird, Utah), pp. 214-223, 1993で最初に提案され、後に、A. SaidおよびW. Pearlman著「A new, fast and efficient image codec based on set partitioning in hierarchical trees」IEEE Trans. Circuits and Systems for Video Technology, vol. 6, pp. 243-250, June 1996で拡張されている。実際には、スケーラブルビデオ圧縮用に進歩したアルゴリズムの多くは、本質的には、ビデオシーケンスの連続フレームに独立に適用されるスケーラブル画像圧縮方式である。これについては、S. McCanne、M. VetterliおよびV. Jacobson著「Low-complexity video coding for receiver-driven Layered Multicast」IEEE Journal on Selected Areas in Communications, vol. 15, August 97, PP. 983-1001を参照されたい。しかしながら、非スケーラブル技術の効率に対抗するには、フレーム間冗長を、場面およびカメラの動きに反応するように利用することが不可欠である。
動き補償予測(MCP:Motion Compensated Prediction)は、ビデオ圧縮にフレーム間冗長を利用する、圧倒的に最も知られているアプローチである。図1は、MPEG−1、MPEG−2、MPEG−4およびH.263といった主要な規格がすべて準拠するMCP圧縮の顕著な特徴を示している。ビデオシーケンスの各フレームを別々に圧縮するのではなく、画像圧縮アルゴリズムに共通の空間変換エレメント、量子化エレメントおよびエントロピーコーディングエレメントは、伸張装置によって再構成されるように、現在のフレームと、前のフレームのピクセルに動き補償アルゴリズムを適用することによって形成されるフレームの予測との差分に適用される。
図1は、動き補償予測(MCP)フィードバックループを用いてビデオを圧縮する従来技術の装置の概略ブロック図である。図に示されるブロックは、適切なハードウェアおよび/またはソフトウェアによって実施されることが理解されるであろう。
ブロック1は、フレーム遅延素子および動き補償器である。これは、前のフレームの復号されたバージョンを記憶し、動き情報(通常、圧縮データストリームと共に明示的に送信される)を用いて、現在のフレームの予測を形成する。減算器2は、ブロック1によって生成された動き補償予測フレームを、現在のビデオフレームから減算する。空間変換ブロック3は、ブロック2によって生成された予測残部フレームを、符号化用の個々のコンポーネントに分解する。個々のコンポーネントは、通常、異なる空間周波数に対応し、予測残部フレームのオリジナルサンプルよりもお互いの相関関係は少ない。量子化ブロック4は、容易に符号化されるラベル(通常、整数)によって特定される多くの代表値によって、変換係数のそれぞれを近似する。このステップは、符号化に先立って行われる。
ブロック5は、エントロピー符号器である。エントロピー符号器は、ブロック4によって生成された量子化ラベルを効率的に表現し、かつネットワークを介して送信することができるビットストリームを生成する。
逆量子化ブロック6は、ブロック4によって生成されたラベルを用いて、ブロック4によって量子化された変換係数のそれぞれの代表値を再構成する。
逆変換ブロック7は、空間変換オペレータの逆の処理を行う。
ブロック8は、ブロック7から再生された、復号された予測残部を予測フレーム自身に加算し、これにより、伸張装置で利用可能になるフレームと同一の復号されたビデオフレームの複製を再生する。
MCPは、予測フィードバックに基づいている。それは、前のフレーム用に伸張装置によって再構成されるピクセル値の知識を必要とする。スケーラブルの設定では、伸張装置によって再構成されるピクセル値は、実際に受信され、伸張される組み込みビットストリームの特定のサブセットに依存するので、この知識は利用できない。この問題は、高効率のスケーラブルビデオ圧縮装置の開発を妨げる主な原因となっていた。MPEG−2は、ある程度の小さなスケーラビリティを可能にするが、この能力の有用な範囲は、2つまたは3つの異なる品質のサブセットに限定され、その場合にも、効率が大幅に失われる。MPEG−4は、高度にスケーラブルであることを主張するが、この主張は、いわゆる「オブジェクトスケーラビリティ」に関して解釈されるものであり、「オブジェクトスケーラビリティ」は、場面の「オブジェクト」の個数に制限され、適切なセグメンテーションアルゴリズムに依存し、かつ遠隔クライアントに利用可能な帯域幅の関数として、ビデオ品質をスムーズに向上させることができない。他の点で、MPEG−4は、MCPの基本的な不適切さによって制約され、フレーム間冗長を利用することは、このMCPに基づいている。
提案されている2つの著名なスケーラブルビデオ圧縮アルゴリズムは、J. Ohm著「Three dimensional sub-band coding with motion compensation」IEEE Trans. Image Processing, vol. 3, pp. 559-571, September 1994、ならびにD. TaubmanおよびA. Zakhor著「Multi-rate 3-D sub-band coding of video」IEEE Trans. Image Processing, vol. 3, pp. 572-588, September 1994のアルゴリズムである。いずれにしても、アイデアは、3−D変換を適用する前に空間的特徴のアラインメントを改善するために、まずビデオフレームまたはその一部を時間的にシフトした後、何らの予測フィードバックなしに、3次元の分離可能な副帯域変換を用いることである。これらの方式は、単純な全体変換にはうまく機能するが、それらの性能は、場面の動きがより複雑の場合に、かなり悪化する。
本発明の目的は、圧縮されたディジタルビデオ信号のインタラクティブな遠隔ブラウジングを提供することである。
第1の態様によると、本発明は、ビデオシーケンスを圧縮して、圧縮ビデオ信号を生成する方法であって、
ビデオシーケンスを入力信号に構成する(forming)ステップと、
動きの冗長を利用する形式で、入力信号を一組の時間周波数帯域に分解するステップと、
分解された入力信号にスケーラブル符号化方法を適用して、スケーラブル圧縮ビデオ信号を生成するステップとを含み、
前記入力信号を一組の時間周波数帯域に分解するステップは、
前記入力信号を、偶数でインデックスされたフレームの部分シーケンスおよび奇数でインデックスされたフレームの部分シーケンスに分離するステップと、
一連の動き補償リフティング演算を適用して、動きに反応する形式で、前記偶数フレームの部分シーケンスに基づいて前記奇数フレームの部分シーケンスを更新すること、および、その逆も同様に行うことを交互に行うステップと、
を含む方法を提供する。
本発明の重要な特徴の1つは、動きの冗長性が、時間周波数帯域への分解によって直接利用されることである。これにより、予測フィードバックの必要性が回避される。したがって、分解された入力信号を、スケーラブルな形式で符号化することができる。
入力信号を分解するステップは、時間周波数帯域を空間周波数帯域に分解して、空間−時間周波数帯域を提供するステップをさらに備えることが好ましい。後述するように、さまざまな低減されたサイズ(空間解像度)のビデオへの効率的なアクセスを可能にするように、時間および空間の分解のステップを並べ替えることが望ましい場合がある。
動き補償は、入力信号を、偶数でインデックスされたフレームの部分シーケンスおよび奇数でインデックスされたフレームの部分シーケンスに分離し、かつ一連の「動き補償リフティング」演算を適用して、偶数フレームの部分シーケンスに基づいて奇数フレームの部分シーケンスを更新すること、およびその逆も同様に行うことを交互に行うことにより組み込まれることが好ましい。低い時間周波数帯域は、リフティング演算を再帰的に適用することにより、予め定められた数の分解レベルに向けてさらに分解されることが好ましい。
時間帯域を空間周波数帯域にさらに分解した後、その結果としての空間−時間周波数帯域には、スケーラブル符号化方法が施され、スケーラブル圧縮ビデオ信号が生成される。それぞれの空間−時間周波数帯域に属するサンプルは、ブロックに分割され、各ブロックが、他のブロックから独立して符号化されるようになっていることが好ましい。ブロックは、ビデオ内の対象となる領域への効率的なアクセスを提供するような形式で選択されるブロックの空間および時間の次元を有する。
ブロックは、組み込み形式で符号化され、ディジタルビットストリームの組み込みサブセットに増加コントリビューションを提供することが好ましい。このようにして、所望の利用可能な(増減された)解像度および品質で、組み込みサブセットは、計算機システムによって選択的に復号されることが可能となり、ユーザは、ビデオの所望の部分を見ることが可能となる。
したがって、好ましい実施形態では、スケーラブルビットストリームは、異なる時間帯、異なる解像度(時間および空間の双方)ならびに異なる品質レベルに対応する別個のサブセットを含み、クライアントは、最も興味のある特定の時間セグメントと関連した品質を洗練することをインタラクティブに選択することができる。さらに、スケーラブルビットストリームは、異なる空間領域に対応する別個のサブセットを含むこともでき、クライアントは、クライアントの興味のあるレベルによって、特定の時間帯にわたる特定の空間領域と関連した品質を洗練することをインタラクティブに選択することができる。例えば、練習用ビデオでは、ネットワークの遠隔クライアントは、ビデオの所定のセグメントにインタラクティブに「立ち戻る」ことができ、これらセグメントのより高品質の情報を、何らの遅延も受けることなく、ネットワークサーバからストリーミングを続けることができる。
本発明による高度なスケーラブル圧縮ビデオ信号の提供によって、例えばインターネットのようなネットワーク上のコンピュータによるビデオ信号のインタラクティブなブラウジングを容易にすることができる。
本発明の第2の態様によると、圧縮されたディジタルビデオ信号のインタラクティブな遠隔ブラウジングを提供する方法であって、
ビデオシーケンスを表すスケーラブル圧縮信号を、ネットワークに接続されたサーバ計算機システムを介して、ネットワークに利用可能にするステップと、
ビデオシーケンスとして伸張して見るために、スケーラブル圧縮信号の一部を、ネットワークに接続されたクライアント計算機システムを介して選択するステップと、
クライアントによる選択を監視するステップと、
クライアントにとって対象となるスケーラブル圧縮信号のさらなる部分を、クライアントを介して選択するステップと
を備える方法が提供される。
クライアントは、これまでに見た信号部分を記憶することができるキャッシュを含むことが好ましい。クライアントが、ビデオの同じエリアと関連する信号のさらに別の部分(空間領域だけでなく時間領域も含み得る)を見たいならば、クライアントには、例えば、解像度または品質を増加させ、ビデオのより正確なレンディションを提供するのに十分なさらに別の部分の信号のみが必要とされる。クライアントは、全ての信号を再送信される必要はない。サーバは、クライアントが信号のどの部分を既に受信しているかを知り、増減された信号のさらにどの部分が必要とされるかを判断できるように、クライアントのキャッシュの状態を監視するキャッシュ監視手段も含むことが好ましい。
本発明の第3の態様によると、本発明の第2の態様に従った方法であって、スケーラブル圧縮信号は、本発明の第1の態様の方法によって圧縮される方法が提供される。
第4の態様によると、本発明は、ビデオシーケンスを圧縮して、圧縮ビデオ信号を生成する方法であって、
ビデオシーケンスを、偶数でインデックスされたフレームの部分シーケンスおよび奇数でインデックスされたフレームの部分シーケンスに分離することにより、ビデオシーケンスを一組の時間周波数側の帯域に分解するステップと、
一連の動き補償リフティング演算を適用して、動きに反応する形式で、偶数フレームシーケンスに基づいて奇数フレームシーケンスを更新すること、およびその逆も同様に行うことを交互に行うステップと、
符号化方法を適用して、圧縮ビデオ信号を生成するステップと
を含む方法を提供する。
第5の態様によると、本発明は、ビデオシーケンスを圧縮して、圧縮ビデオ信号を生成するシステムであって、該システムは、
ビデオシーケンスを入力信号に構成する手段と、
動きの冗長を利用する形式で、入力信号を一組の時間周波数帯域に分解する手段と、
分解された入力信号にスケーラブル符号化方法を適用して、スケーラブル圧縮ビデオ信号を生成する手段とを備え、
前記入力信号を一組の時間周波数帯域に前記分解する手段は、前記入力信号を、偶数でインデックスされたフレームの部分シーケンスおよび奇数でイン デックスされたフレームの部分シーケンスに分離し、かつ、一連の動き補償リフティング演算を適用して、動きに反応する形式で、前記偶数フレームの部分シー ケンスに基づいて前記奇数フレームの部分シーケンスを更新すること、およびその逆も同様に行うことを交互に行うように構成されるリフティング手段を含むシ ステムを提供する。
第6の態様によると、本発明は、圧縮されたディジタルビデオ信号のインタラクティブな遠隔ブラウジングを提供するシステムであって、
ネットワークに接続されるように構成され、クライアント計算機システムに向けてネットワーク上に配信するためのビデオシーケンスを表すスケーラブル圧縮信号を提供する手段を含むサーバ計算機システムと、
スケーラブル圧縮信号の一部を選択する選択手段と、ビデオシーケンスとして見るためにスケーラブル信号を伸張する伸張装置とを含むクライアント計算機システムであって、選択手段は、該クライアントの対象となる領域に関連するスケーラブル信号のさらなる部分を選択するように構成される、クライアント計算機システムと
を備えるシステムを提供する。
第7の態様によると、本発明は、ビデオシーケンスを圧縮して、圧縮ビデオ信号を生成する装置であって、
ビデオシーケンスを一組の時間帯域に分解する手段と、
入力信号を、偶数でインデックスされたフレームの部分シーケンスおよび奇数でインデックスされたフレームの部分シーケンスに分離する手段と、
一連の動き補償リフティング演算を適用して、動きに反応する形式で、偶数フレームシーケンスに基づいて奇数フレームシーケンスを更新すること、およびその逆も同様に行うことを交互に行う手段と
を備える装置を提供する。
第8の態様によると、本発明は、本発明の第1の態様に従った方法ステップの逆である方法ステップを適用するステップを備える方法を含む、本発明の第1の態様に従った方法を提供する。
第9の態様によると、本発明は、本発明の第8の態様に従った方法を適用する手段を含む伸張システムを提供する。
第10の態様によると、本発明は、計算機システムにロードされると、該計算機システムを制御して、本発明の第1の態様に従った方法を実施するように構成されたコンピュータプログラムを提供する。
第11の態様によると、本発明は、本発明の第10の態様に従ったコンピュータプログラムを提供するように構成されたコンピュータ読み取り可能媒体を提供する。
第12の態様によると、本発明は、システムであって、クライアントは、スケーラブル信号の一部を記憶するように構成されたキャッシュを含み、サーバは、信号のどの部分がクライアントのキャッシュに記憶されているかを判断することを可能にするために、クライアントを監視するように構成されたキャッシュモニタを含み、それによって、サーバは、ビデオの対象となる領域に対するクライアントのリクエストがあると、対象となる領域を再生するために必要とされる信号のさらなる部分のみをクライアントに送信し得る、システムを提供する。
本発明の特徴および利点は、添付図面を参照して、単なる一例として説明される、以下の本発明の実施形態から明らかになるであろう。
本発明によれば、圧縮されたディジタルビデオ信号のインタラクティブな遠隔ブラウジングが提供される。
動き補償予測フィードバックループ(従来技術)を利用したビデオ信号の圧縮および符号化を示す概略ブロック図である。 本発明の実施形態によるビデオ圧縮システムの概略ブロック図である。 本発明の実施形態による、スケーラブル圧縮されたビデオのインタラクティブな遠隔ブラウジング用システムを示す概略ブロック図である。 空間解像度のスケーラブル圧縮を実施する本発明による圧縮システムのさらに別の実施形態の概略ブロック図である。
既に言及したように、効果的なスケーラブルビデオ圧縮技術の開発に対する最も基本的な障害は、高度なスケーラブルフレームワーク内でフレーム間冗長を利用することが困難なことである。MCPに代わって、過去に最も効を奏したアプローチは、時間領域におけるハールウェーブレット(Haar Wavelet)の使用に焦点を合わせ、隣接するフレームの平均および差分に対応する時間的な低域通過副帯域(low-pass sub-band)および高域通過副帯域(high-pass sub-band)を生成するものである。ウェーブレット変換は、低域通過チャネルに沿って繰り返され、再帰的な形式で、低域通過チャネルからさらに低域通過副帯域および高域通過副帯域を生成する。必要メモリを最小にするために、これは、最も低周波の時間副帯域が、8個の隣接するフレームの平均を表すように、通常、2回または3回の繰り返しに対してのみ続けられる。
動き補償を行うために、個々のフレームは、隣接するフレームの共通の空間的特徴を揃えるように、プリワープ(pre-warp)されることがある。これは、D. TaubmanおよびA. Zakhor著「Multi-rate 3-D sub-band coding of video」IEEE Trans Image Processing, vol. 3, pp. 572-588, September 1994の重要なアイデアであり、J. Ohm著「Three dimensional sub-band coding with motion compensation」IEEE Trans. Image Processing, vol. 3, pp. 559-571, September 1994のアプローチに関連する。しかしながら、効率的な圧縮を確実にし、かつオリジナルのビデオシーケンスが、次の符号化段階の間に導入される量子化誤差なしに再生できることを確実にするために、ワープは、可逆的でなければならないか、またはほぼ可逆的でなければならない。可逆性の要件は、空間的なワープ、および、したがって取り込むことができる場面の動きのタイプを、変換および回転角へのスキュー近似に制限する。カメラのズームと関連した部分的な拡大および縮小、ならびに、個々のフレームをワープすることを通じた場面のオブジェクトの動きを、可逆性の要件に反することなく取り込むことは不可能である。いくつかの提案された方式、例えば、J. Tham、S. RanganathおよびA. Kassim著「Highly scalable wavelet-based video code for very low bit-rate environment」IEEE Journal on Selected Areas in Communications, vol. 16, January 1998, pp. 12-27には、可逆性の要件に故意に反し、その結果、高品質の再構成が不可能となるようなものがある。
複雑な場面の動きの下で、フレーム間冗長を効率的に利用するために、本発明では、時間ウェーブレット変換および動き補償演算が共同して実行される。我々は、その結果の変換を、動き補償時間ウェーブレット変換(MCTWT)(Motion Compensated Temporal Wavelet Transform)と呼ぶ。MCTWTの実施は、ウェーブレット変換を実現するリフティングメカニズムに基づいている。これについては、R. Calderbank、I. Daubechies、W. SweldensおよびB. Yeo著「Wavelet transforms that map integers to integers」Applied and Computational Harmonic Analysis, vol. 5, pp. 332-369, July 1998を参照されたい。
ハールウェーブレットの特定の場合に、本発明は、周知のS−変換(S-Transform)の一般化として最も容易に理解される。具体的には、xk[m,n]を、ビデオシーケンスからのフレームのシーケンスとする。MCTWTのリフティングステップは、偶数フレームの部分シーケンスx2k[m,n]および奇数フレームの部分シーケンスx2k+1[m,n]を、それぞれ低域通過時間副帯域(low-pass temporal sub-band)および高域通過時間副帯域(high-pass temporal sub-band)に変換する。Wi,jを、(Wi,j(xi))[m,n]≒xj[m,n],∀m,nとなるような、フレームxi[m,n]の、フレームxj[m,n]の座標系への動き補償写像とする。i<jならば、写像Wi,jは、基本動き補償予測アルゴリズムで使用されるような前方動き補償(forward motion compensation)として一般に知られているものに対応する。i>jならば、写像Wi,jは、双方向動き補償予測アルゴリズムで使用されるような後方動き補償(backward motion compensation)として一般に知られているものに対応する。本発明のさまざまな実施形態において、これらの動き補償写像は、基本をなす動きモデルが区分的定数である従来のブロックベースの動き補償に対応することもできるし、または、基本をなす動きモデルが制御グリッド上の動きベクトルの連続補間である、より複雑なメッシュベースの動き補償に対応することもできる。また、他の動き補償写像も、本発明のさまざまな実施形態に適用することができ、本発明は、特定のタイプのいずれにも制限されない。MCTWTの状況において、高域通過副帯域のフレームは、以下の式によって与えられる。
Figure 0005683350
一方、低域通過時間副帯域のサンプルは、以下の式によって与えられる。
Figure 0005683350
明らかに、動きがなく、Wi,jがすべてのi、jに対して恒等演算子となるような場合には、この2つのリフティングステップのシーケンスは、ハールウェーブレット変換に(倍率まで)なる。
このアプローチは、より多くのリフティングステップまたはより大きなカーネルを有するリフティングステップを含むより複雑なウェーブレット変換に容易に拡張される。さらに別の例は、周知の双直交5−3ウェーブレット変換に基づいている。これは、完全のためであり、かつ、この例が、本発明のいくつかの実施形態に対して上記で与えられたハールの例にとって、より好ましくなり得るからであるとの双方の理由による。この場合、高域通過MCTWTサンプルは、次の式となる。
Figure 0005683350
一方、低域通過時間副帯域サンプルは、次の式によって与えられる。
Figure 0005683350
ここでも、動きがない場合には、この2つのリフティングステップのシーケンスは、5−3双直交ウェーブレット変換になる。ハールの例の場合の高域通過副帯域が、従来の動き補償予測と整合した形で形成される一方、5−3の例の場合の高域通過副帯域は、双方向動き補償予測と整合した形で形成されることに着目することは興味深い。しかしながら、動き補償予測方式と異なり、本実施形態は、既存のビデオ圧縮規格において、効果的なスケーラブル圧縮に不利に働くフィードバックループを導入することなく、完全な再構成を達成する。
従来のIDウェーブレット変換と同様に、MCTWTは、低域通過副帯域に再帰的に適応され、時間解像度レベルの階層を生成することができる。好ましい実施形態では、最も低周波の時間副帯域が、オリジナルのビデオシーケンスのフレームレートの8分の1または16分の1のフレームレートを有するように、このプロセスは、3回または4回続けられる。
上述したMCTWTによって生成される時間副帯域は、空間ウェーブレット変換によって空間副帯域(spatial sub-band)にさらに分解される。あるいは、離散コサイン変換(DCT)のような他の変換が使用されてもよい。これらの空間変換ならびにそれらのさまざまな形式はおよび構造は、当業者に周知である。その結果、オリジナルのビデオシーケンスは、空間−時間副帯域の集まりに分割される。
空間−時間副帯域のそれぞれを表すフレームのシーケンスは、符号ブロックに分割される。ここで、それぞれの符号ブロックは、所定の空間的および時間的な範囲を有する。本発明のさまざまな実施形態において、符号ブロックの範囲は、副帯域ごとに変化し、1つまたは2つ以上の副帯域では、例えば、それぞれの副帯域の単一フレームに広がっていてもよい。本発明の好ましい実施形態では、符号ブロックは、数千のサンプルからなる全ボリュームに対して、比較的小さな空間的および時間的な範囲を有する。例えば、空間的範囲は、4フレームの時間的範囲に対して、32×32または16×16である。
すべての符号ブロックに対して、完全に独立した組み込みビットストリームが生成される。それぞれの符号ブロックに対する組み込みビットストリームBiは、多くの個別の長さの任意のものRn iに切り捨てられ、それぞれの切り捨てられたビットストリームが、レート歪みの意味で、オリジナルサンプル値の適切な効率的表現に対応するようになっていてもよい。効率的な組み込みブロック符号化アルゴリズムは、EBCOTアルゴリズムの形式で画像圧縮用に発表されている。これについては、D. Taubman著の「EBCOT: Embedded block coding with optimised truncation」ISO/IECJTC 1/SC 29/WG1 N1020R, October 1998およびJPEG2000画像圧縮規格を参照されたい。同様の組み込みブロック符号化アルゴリズムは、本発明の好ましい実施形態で使用される。しかしながら、さまざまな実施形態において、ビットストリームBiを生成するために、同様の性質を有する任意の組み込みエントロピー符号化アルゴリズムを使用することができる。
組み込みブロック符号化の最も重要な属性の1つは、全体のビットレートの所定の制約に対する歪みを最小にするように、個々の組み込みビットストリームを最適に切り捨てることができることである。さらに、それぞれの符号ブロックの最適な切捨て長は、目的のビットレートの非減少関数である。これは、全体の圧縮ビットレートRに対応する最適に切り捨てられたブロックビットストリームが、例えば全体の圧縮ビットレート2Rなどの最適に切り捨てられたブロックビットストリームのサブセットを構成することを意味する。これは、まさしく、上記で論じた遠隔ビデオブラウジングアプリケーションを可能にするために必要とされるスケーラビリティの性質そのものである。所定のビットレートに対して歪みを最小にしようとするか、または、所定のレベルの歪みに対してビットレートを最小にしようとするブロック切捨て戦略は、ポスト圧縮レート歪み(PCRD(Post Compression Rate-Distortion))最適化戦略として知られている。知覚によるビデオ品質を最適化するPCRD最適化方式は、個々のアプリケーション[visua199]で記述される。しかしながら、さまざまな実施形態では、異なる戦略を用いて、ブロック切捨て点を決定してもよい。
独立した組み込みブロックのビットストリームからなる圧縮されたビデオビットストリームは、遠隔ビデオブラウジングアプリケーションに非常に関連のある多くの付加的な属性を有する。ビデオシーケンスの低解像度バージョンは、(低い空間解像度に対して)高い空間周波数の副帯域または(低い時間解像度に対して)高い時間周波数の副帯域に対応する符号ブロックを廃棄することによって再構成することができる。関連する組み込みビットストリームの追加部分を取り出すことにより、異なる時間セグメントについて、再構成されたビデオ品質の改善を選択的に要求できるように、それぞれの符号ブロックは、明確な時間的範囲(フレーム数)を有する。最後に、それぞれの符号ブロックは、明確な空間的範囲を有する。具体的には、対象となっている所定の空間領域を再構成するために必要とされる符号ブロックの組は、符号ブロックの次元、ウェーブレット基底関数のサポート、および関連する動きパラメータから計算することができる。これにより、再構成されるビデオの品質が、対象となっている特定の空間領域でのみ選択的に改善されるインタラクティブなブラウジング様式が可能となる。
既に言及したように、全体的に連続して高いビデオビットレートまたは品質レベルに対応して、複数の組の最適なブロック切捨て点を生成するために、PCRD最適化方式を使用することができる。これらは、最終的な圧縮ビデオビットストリーム内において品質レイヤにグループ化される。最初の品質レイヤは、最小ビットレートに対応する、切り捨てられたブロックのビットストリームを含む。これに続く複数の品質レイヤは、全体的に高いビットレートで高い再構成ビデオ品質を連続的に達成するために必要とされるそれぞれの符号ブロックの組み込みビットストリームからの増加コントリビューションを含む。このようにして、最終的なビットストリームは、ビデオシーケンスの空間的および時間的範囲の全体にともに広がる符号ブロックの集まりから構成され、このビデオシーケンスの組み込みビットストリームは、品質レイヤに分割される。最後のステップは、ビットストリームの関連する部分を除くすべてを取り除いて、ある特定のユーザまたはアプリケーションのニーズに合致させることができるように、ビットストリームを、符号ブロックのそれぞれのレイヤコントリビューションを効率的に識別するメカニズムによって増強することである。さまざまな実施形態はこの情報の表現を異なる方法で選択することができる。
図2は、上述した本発明の実施形態の実施を示している。図2に示すブロックは、計算機デバイスまたは計算機システムの適切なソフトウェアおよびハードウェアによって実施できることが理解されるであろう。
図2を参照して、参照番号10は、MCTWTを実施する装置を示す。このブロックは、ビデオフレームのシーケンスを処理し、2つまたは3つ以上の時間副帯域を生成する。最も単純なケースでは、2つの副帯域が存在し、それぞれは、オリジナルのビデオシーケンスの半分のフレームレートを有する。低周波副帯域は、最大フレームレートの半分のフレームレートによるビデオの良好なレンディションを含む一方、他方(高周波)の副帯域は、低周波副帯域から予測できない詳細を含む。上述したように、低周波副帯域は、高周波成分および低周波成分に分割されることが好ましい。そして、このような分割は、予め定められた個数の「時間分解レベル」の間、継続する。
ブロック11は、ブロック10によって生成されたそれぞれの時間副帯域の各フレームを処理し、各フレームを、空間副帯域に分解する。
ブロック12は、ブロック11によって生成されたそれぞれの空間−時間副帯域内のサンプルを、所定の個数のフレームに広がり、かつ、その副帯域内の所定の幅および高さを有するブロックにグループ化する。これらブロックは、相互に独立に符号化される。異なる実施形態および異なる副帯域が、異なるブロックの次元を使用できることに留意されたい。
ブロック13は、それぞれの符号ブロックについての組み込みビットストリームを生成する。組み込みビットストリームは、ビットストリームが多く受信される(復号器に利用可能になる)につれて、符号ブロックによって表される副帯域のサンプルの品質が、次第に良くなるという性質を有する。
ブロック14は、それぞれの符号ブロックの組み込みビットストリームから最適な個数のビットを決定し、圧縮ビットレートまたは再構成されるビデオの品質の制約を受ける最終的な圧縮データストリームに含める。好ましい実施形態では、上述したように、PCRD最適化アルゴリズムのブロックが、複数回実行され、それぞれのレイヤが、それぞれの符号ブロックの組み込みビットストリームからのコントリビューションの最適な分配を含むように、圧縮データストリーム内の連続した層を生成し、全体的に連続して高い圧縮ビットレートおよびビデオ品質を表す。好ましい実施形態では、PCRDアルゴリズムは、ビデオ内の動きの関数として、異なる空間−時間副帯域の視聴者に対する相対的な重要度に反応するであろう。
ブロック15は、その長さがブロック14によって最適化されている符号ブロックコントリビューションを、最終的な圧縮データ表現に組み立てる。この最終的な圧縮データ表現は、それぞれのレイヤと関連した符号ブロックコントリビューションをデータストリームから再生するために必要なすべて情報と共に、1つまたは2つ以上のビデオ品質レイヤから構成される。この識別情報により、連続的に低いビットレートおよびビデオの低品質のレンディションに対応して、最終的な圧縮データストリームのサブセットを容易に抽出することが可能となる。
伸張は、圧縮の逆であり、当業者は、上記圧縮方法および圧縮装置の記述から、適切な伸張装置を設計でき、適切な伸張方法を実施できることが理解されるであろう。可逆性は、圧縮プロセスと関連した前方変換演算を実施するために使用されるリフティング構造の直接の結果である。
ネットワークを介して送信できる高度なスケーラブル圧縮ビデオ信号の提供により、圧縮ビデオのインタラクティブな遠隔ブラウジングが容易になる。本発明のさらに別の側面は、スケーラブル圧縮ビデオのインタラクティブな遠隔ブラウジングのシステムおよび方法に関係する。
図3は、ネットワーク22によって接続されたサーバ計算機システム20およびクライアント計算機システム21を示すブロック図である。図示するように、サーバ20およびクライアント21は、スケーラブル圧縮ビデオのインタラクティブな遠隔ブラウジングに関する本実施形態によるシステムの重要な要素を示している。
クライアント21は、接続マネージャ24、クライアントキャッシュ25、伸張装置26およびグラフィカルユーザインタフェース27を含む。サーバ21は、接続マネージャ28、クライアントのキャッシュ25の状態に関する情報を保持するサブシステム29、およびファイルサーバ30を含む。
接続マネージャ24および28は、サーバ21とクライアント22との間のスケーラブル圧縮データストリームから要素の転送を管理する。接続マネージャは、サーバ21側のコンポーネントおよびクライアント22側のコンポーネントの2つのコンポーネントを含む。接続マネージャは、圧縮データのネットワーク送信、受信データの肯定応答、ネットワークの状態の監視などを操作する。さまざまな実施形態は、通信媒体および効果的なユーザとの相互作用に必要とされる応答性のレベルに応じて、このブロックをさまざまに実施することができる。
クライアントキャッシュ25は、サーバ21によって送信された圧縮データを記憶し、キャッシュが一杯になりすぎると、古いデータを廃棄する広告ポリシーを実施する。さまざまな実施形態は、異なるキャッシュ戦略を使用することができ、このキャッシュ戦略は、サーバ21が、クライアント22のキャッシュの性能に関する知識を有し、その性能からクライアント22のキャッシュの状態のいずれかまたはすべてを予測するという要件のみを対象とする。
クライアントキャッシュ状態追跡ブロック29は、クライアントのキャッシュ25の状態の鏡像を保持し、クライアント22が受信し、記憶したと確信される圧縮データ要素の識別情報を記録する。このエレメントは、クライアント22によって使用される広告キャッシュ戦略を複製し、クライアントのキャッシュから廃棄された可能性のある要素を特定する。クライアント22は、必ずしもこれらを廃棄する必要はないが、サーバのキャッシュ追跡ブロック29が、キャッシュされていると予測するであろう要素を廃棄してはならない。
ファイルサーバ30は、スケーラブル圧縮ビデオデータストリームと相互作用し、クライアントキャッシュ状態追跡装置29とも相互作用する。そして、ファイルサーバ30は、ビデオ内において対象となっているクライアントの現在の領域の知識を用いて、知覚されるビデオ品質を最大にするために、圧縮データストリームのどの要素をクライアントに送信するべきかを決定する。これらの要素は、ブロック29を介して接続マネージャに送信される。ブロック29は、クライアントのキャッシュの内容についてのそのモデルを途中で更新する。
伸張装置26は、クライアントキャッシュ25と相互作用して、現時刻、解像度、およびビデオがユーザ定義のビューポートにレンダリングされる空間領域に関連する圧縮データストリームの要素を再生し、それら要素を必要に応じて伸張し、レンダリングする。
グラフィカルユーザインタフェース27は、ユーザと対話し、ビデオ内の対象となっているユーザの領域(対象となっている空間解像度および時間解像度を含む)を特定するコマンドを受け付けて解釈する。そして、グラフィカルユーザインタフェース27は、この情報をサーバに周期的に送信し、キャッシュにおいて利用可能なすべての関連する情報を用いて必要なビデオコンテンツをレンダリングするために、伸張装置26を起動する。また、グラフィカルユーザインタフェース27は、圧縮データストリームから少なくともいくつかの関連する要素をダウンロードする時間をサーバに与えるために、ユーザリクエストと利用可能なデータのレンダリングとの間の適切な遅延を決定する役割も担っている。レンダリングが開始可能となる前に、関連するすべての圧縮データが取り出されている必要はない。遅れてキャッシュに到着する圧縮データは、対話ユーザが、ビデオシーケンスの同じ部分に戻って、それを再びレンダリングするようにシステムに指示した場合に、有用であると判明することがある。動作中、ユーザは、対象となっている空間時間領域を指定する。この空間時間領域には、対象となっている最大空間解像度および最大時間解像度に関する情報が、オプションとして含まれる。対象となっている領域は、ビデオシーケンス全体を含むこともできるし、または、空間または時間におけるビデオシーケンスの任意のサブセットを含むこともできる。対象となっている領域のリクエストは、伸張装置に伝達される。伸張装置は、クライアントのキャッシュにリクエストを送信し、返信される符号ブロックコントリビューションが到着すると、当該符号ブロックコントリビューションを、ユーザのリクエストを満たすように伸張する。次に、キャッシュは、サーバから要求されなければならない符号ブロックコントリビューションを特定し、ネットワーク接続マネージャを介してサーバに送信される適切でコンパクトなリクエストを形成する。このサーバリクエストは、ビデオ配信のストリーミングを高い確率で可能にするために、キャッシュの現在の内容および接続状態の評価に基づいて形成される。したがって、対象となっている領域がまったく新しく、すべての情報をサーバから直接取り出さなければならない場合には、スケーラブルビットストリームの最初の品質レイヤのみが、リクエストされることになる。他方、対象となっている領域が、以前アクセスされている場合には、サーバは、キャッシュにこれまでに存在しないコンポーネントのみを、制限されたネットワーク接続を介して供給する必要があるので、より高い品質サービスが、実時間で維持できることになる。
サーバは、オプションとして、クライアントのキャッシュの内容のマップを保持する。これにより、サーバは、クライアントのキャッシュに既に記憶されている情報を再送信することなく、リクエストを満たすために必要とされる実際の符号ブロックコントリビューションを決定できるので、クライアントは、そのリクエストをコンパクトな形式で送信することが可能になる。素材がサーバからストリーミングされると、クライアントにおける実時間の伸張処理を容易にするために、サーバは、必要とされる符号ブロックセグメントを適切なシーケンスに編成する。
本発明の実施形態の中には、サーバが、クライアントが沈黙状態の場合におけるアイドル期間中に、クライアントに代わって、自動的にリクエストを生成できるものがある。例えば、リクエストが一旦満たされると、サーバは、さらに別のリクエストが受信されるまで、リクエストの目的点近くの符号ブロックから、連続的に高い品質レイヤを送信することができる。このように、リクエストが一旦満たされると、ユーザの要求した対象となっている領域の最終フレームは、絶え間なく品質を改善することに経験する。本発明の他の実施形態では、沈黙したクライアントがもしあれば、当該クライアントに送信される情報の性質を決定するために、代わりのポリシーを定義してもよい。
図2を参照して上記で説明した実施形態では、空間ウェーブレット変換によって生成される高い空間周波数の副帯域のいくつかを廃棄した後、低減された空間解像度でビデオを再構成することができる。しかしながら、このアプローチの1つの重要な欠点は、動き情報の量が、空間解像度と共に増減しないことである。空間解像度のスケーラビリティを必要とするアプリケーションについては、まず、マルチ解像度変換が使用されて、それぞれのオリジナル画像フレームxk[m,n]が空間副帯域に分解され、次に、MCTWTが、その副帯域に適用される本発明の代替的な実施形態が好ましい。以下の議論では、マルチ解像度空間変換として、2次元離散ウェーブレット変換(DWT)(Discrete wavelet transform)が用いられる。図4は、空間解像度スケーラブル圧縮を実施するシステムのブロック図である。
図4に示すように、それぞれのオリジナルフレームxk[m,n]は、まず、LH1 k[m,n]、HL1 k[m,n]およびHH1 k[m,n]で表す3つの高周波の詳細画像と共に、低減された解像度の画像LL1 k[m,n]に変換される。これらの副帯域画像のそれぞれは、オリジナル画像の次元の約半分の次元を有し、すべての副帯域の全サンプル数は、オリジナル画像のサンプル数と同一である。我々は、空間ウェーブレット解析のこの初期段階を以下の式として表す。
Figure 0005683350
解析演算子を繰り返し適用することにより、LL1 k[m,n]は、付加的な詳細副帯域(detail sub-band)LH2 k[m,n]、HL2 k[m,n]およびHH2 k[m,n]と共に、さらに低い解像度画像LL2 k[m,n]に分解される。このようにして続けることにより、Dレベル変換は、中間の副帯域LL1 k[m,n]からLLD-1 k[m,n]をカウントしないで、合計3D+1個の副帯域を生成する。
重要なことに、それぞれの解析段階は、可逆的である。逆の演算子は、合成段階として知られ、それらの演算は、次の式として表される。
Figure 0005683350
ここで、xk[m,n]は、好都合に、レベル0の副帯域LL0 k[m,n]と同一に扱われる。
本発明の好ましい実施形態では、図4に示すように、前に開発されたMCTWT技術は、まず、最も低い解像度の副帯域フレームLLD Kに直接用される。このMCTWTは、LLD Kフレームの空間解像度と一致するように調整されたそれ自身の動きの情報を使用する。動き補償時間5−3ウェーブレット変換の特定の例では、方程式(3)および(4)は、以下の方程式(4)および(5)になる。接頭文字「H−」および「L−」は、ここでは、高域通過時間副帯域および低域通過時間副帯域をそれぞれ特定するために使用されることに留意されたい。動き補償写像演算子WD i,jの上付き文字Dは、それらの演算子を、DレベルDWTの最も低い空間解像度のフレームと関連付ける。
Figure 0005683350
および
Figure 0005683350
詳細副帯域LHd k、HLd kおよびHHd kの各連続組は、集合的に、「解像度レベル」Rd-1 kを形成する。ここで、dは、Dから1までの範囲を有する。解像度レベルRd-1 kは、空間解像度をLLd kからLLd-1 kに(空間副帯域合成を通じて)増強するために必要とされる情報を保持する。図4に示すように、それぞれの解像度レベルは、LLd-1 kフレームの空間解像度と一致するように調整されたそれ自身の動き情報と共に、それ自身のMCTWTを有する。関連する動き補償写像演算子は、Wd-1 i,jで表される。
任意の所定の解像度レベルRd-1 kについてのMCTWTは、効果的な動き補償が、空間的に合成されたフレームLLd-1 kの領域で実行されることになる点を除いて、これまでに説明したものと原理において同様である。時間リフティングステップは、詳細副帯域に直接適用されるが、動き補償が必要とされるときはいつでも、その解像度レベルの詳細副帯域は、ともに空間合成を受け、LLd-1 kと同じ解像度を有するベースバンド画像を再生する。動き補償は、この領域に適用され、副帯域の解析がそれに続く。副帯域の解析は、動き補償された詳細副帯域を生成する。動き補償の品質、および、したがって変換全体の圧縮効率と干渉し得る空間エイリアシング効果を最小にするために、図4に示すように、ある情報が、低解像度フレームLLd kから借用される。低い空間解像度は、高い空間解像度を参照することなく、最初に再構成することができるので、この情報は、圧縮装置および伸張装置の双方で利用可能である。
例示するため、再び動き補償5−3ウェーブレット変換を検討する。解像度レベルRd-1 kについてのリフティングステップは、動き補償演算子Wd-1 i,jを用い、それらの演算子を、以下の方程式(7)および(8)に従って適用する。
Figure 0005683350
および
Figure 0005683350
上記方程式(8)に現れる項
Figure 0005683350
は、合成されたフレームを作成するためのものであり、この合成されたフレームに対して、動き補償が実際に適用される。この項は、当該リフティングステップがビデオ解像度LLd-1 kに直接適用された場合に現れる項に似ている。変換全体が可逆的であるためには、
Figure 0005683350
は、ビデオ解像度LLd kからの情報にのみ基づいていることが不可欠である。
実施形態の中には、詳細副帯域が合成され、動き補償され、かつ再解析される際に、いくつかのエイリアシング効果が補償されないことを犠牲にして、これらの項がすべて零に設定され得るものがある。他の実施形態では、
Figure 0005683350
は、副帯域H−LLD k、H−LHD k、…、H−HHd+1 kを空間合成することによって得ることができる。
好ましい実施形態では、H−LLd kは、LLd kフレーム(これらは、再構成後、圧縮装置および伸張装置の双方で利用可能である)を、(すべての詳細副帯域を0に設定して)空間合成の1つの段階を通じて補間し、動き補償時間リフティングステップをこの補間された領域に適用し、次に、分析演算子によって生成される詳細副帯域を廃棄する、時間副帯域H−LLd-1 kの空間DWT解析を通じてH−LLd kを再生することにより得られる。この特定の実施形態の、前の実施形態を上回る利点は、H−LLd-1 kおよびそこからH−LLd kを導出するために使用される動き補償リフティングステップが、より高密度の写像演算子Wd-1 i,jと関連した動き情報のすべてを利用できることである。
上述したアイデアは、任意の個数のリフティングステップおよび任意の個数の時間分解のレベルを有する任意の時間ウェーブレット変換に自然に拡張される。このような一般化は、当業者には明らかであろう。最終的な3次元変換の性質は、ビデオフレームが、演算子{WD i,j}から{Wd i,j}に対応する動き情報のみを用いて任意の所定のビデオ解像度LLd kで再生できるように常になっている。これにより、動き情報の全体量(例えば、ブロック動きベクトル、メッシュノード速度などの総数)は、最終的な圧縮データストリーム内の対象となっている解像度と共に増減することが可能となる。
上記議論は、モノクロビデオソースの状況に限定されているが、これは、説明を簡単にするためにすぎない。カラービデオに必要とされるコンポーネントを含む複数のコンポーネントへの一般化は、当業者には明らかであろう。
上記議論は、動画情報の変換および圧縮に関するものであるが、本発明は、画像のシーケンスが圧縮される他の用途に適用できることは明らかである。特定の対象の例として、容積測定医学用画像およびイメージベースの3次元レンダリングアプリケーションによって使用される画像が含まれる。
特定の実施形態によって示された本発明に対して、多くの変形および/または変更を、広く記述された本発明の精神および範囲から逸脱することなく行い得ることは、当業者によって理解されるであろう。したがって、本実施形態は、あらゆる点で例示であり、制限的でないとみなされるべきである。
20 サーバ計算機システム、21 クライアント計算機システム、22 ネットワーク。

Claims (10)

  1. 圧縮されたディジタルビデオ信号のインタラクティブな遠隔ブラウジングを提供する方法であって、
    前記方法は、ビデオシーケンスを表すスケーラブル圧縮信号を、ネットワークに接続されたサーバ計算機システムが記憶するステップを備え、
    前記スケーラブル圧縮信号は、
    ビデオシーケンスを入力信号に構成し、
    動きの冗長を利用する形式で、前記入力信号を一組の時間周波数帯域に分解し、
    前記時間周波数帯域をさらに空間周波数帯域に分解し、その結果として空間−時間周波数帯域を得、
    前記スケーラブル圧縮ビデオ信号を生成するために、限定された空間および時間範囲を有する元のビデオからの情報をそれぞれが表す各符号ブロックを、前記空間−時間周波数帯域から組み込み符号化する
    ことによって生成されたものであり、
    前記方法は、
    ビデオシーケンスとして伸張して見るために、前記スケーラブル圧縮信号の一部を、前記ネットワークに接続されたクライアント計算機システムを介して選択するステップと、
    前記サーバが、前記信号の前記選択された一部を、前記ネットワーク上で前記クライアントに提供するステップと、
    前記サーバが、前記クライアントによる選択を監視するステップと、
    前記クライアントにとって対象となるスケーラブル圧縮信号のさらなる部分を、前記クライアントを介して選択するステップと、
    前記クライアントが符号ブロックビットストリームのどの部分をすでに受信したかを前記サーバ計算機システムが知り、かつ、前記クライアントによる選択に応じて、符号ブロックビットストリームのどのさらなる部分が要求されているかを前記サーバ計算機システムが決定することができるように、前記クライアント計算機システム上のビデオキャッシュの状態を監視するステップと、
    サーバが、前記符号ブロックビットストリームの前記選択された部分を、前記ネットワーク上で前記クライアントに提供するステップと、
    を備える方法。
  2. 前記サーバが、前記クライアントによる前記符号ブロックビットストリームの前記一部の選択を監視するステップをさらに含み、それによって、前記クライアントが、対象となる特定の領域の符号ブロックビットストリームのさらなる部分を選択すると、前記サーバは、符号ブロックビットストリームの適切な部分を前記クライアントに提供することができる、
    請求項1に記載の方法。
  3. 前記信号は、複数の次元でスケーラブルであり、
    前記方法は、前記クライアントが、対象となる前記領域の次元に関連する前記部分を選択するステップをさらに含む、
    請求項1に記載の方法。
  4. 前記クライアント計算機システムは、前記符号ブロックビットストリームの受信した部分をキャッシュするステップをさらに備え、それによって、前記符号ブロックビットストリームの前記さらなる部分は、対象となる前記領域のビデオを生成する伸張を行うために前記キャッシュされた部分に追加することができる、
    請求項1に記載の方法。
  5. 前記サーバ計算機システムは、前記クライアント計算機システムによってキャッシュされている符号ブロックビットストリームの前記部分の状況を把握し、前記クライアント計算機システムによってキャッシュされていない符号ブロックビットストリームの部分のみを送信する、請求項に記載の方法。
  6. 前記入力信号を一組の時間周波数帯域に前記分解するステップは、
    前記入力信号を、偶数でインデックスされたフレームの部分シーケンスおよび奇数でインデックスされたフレームの部分シーケンスに分離するステップと、
    一連となった、1つ以上の動き補償リフティング演算を、動き補償を組み込んで適用するステップであって、前記動き補償リフティング演算のそれぞれは、前記偶数フレームの部分シーケンスからの動き補償されたフレームの線形結合を加えることによって、前記奇数フレームの部分シーケンスを調節するか、または、前記奇数フレームの部分シーケンスからの動き補償されたフレームの線形結合を加えることによって、前記偶数フレームの部分シーケンスを調節する、一連となった、1つ以上の動き補償リフティング演算を動き補償を組み込んで適用するステップと、
    を含む請求項に記載の方法。
  7. 前記スケーラブル圧縮信号を生成するステップは、さらに、全体のビットレートの所定の制約に対する歪みを最小にするように、組み込み符号ブロックビットストリームを最適に切り捨てることを含む、請求項1に記載の方法。
  8. 圧縮されたディジタルビデオ信号のインタラクティブな遠隔ブラウジングを提供するシステムであって、
    前記遠隔ブラウジングを提供するシステムは、ネットワークに接続されるように構成され、クライアント計算機システムに向けて前記ネットワーク上に配信するためのビデオシーケンスを表すスケーラブル圧縮信号を提供する手段を含むサーバ計算機システムを備え、
    前記スケーラブル圧縮信号は、
    ビデオシーケンスを入力信号に構成し、
    動きの冗長を利用する形式で、前記入力信号を一組の時間周波数帯域に分解し、
    前記時間周波数帯域をさらに空間周波数帯域に分解し、その結果として空間−時間周波数帯域を得、
    前記スケーラブル圧縮ビデオ信号を生成するために、符号ブロックを前記空間−時間周波数帯域から組み込み符号化する
    ことによって生成されたものであり、
    前記遠隔ブラウジングを提供するシステムは、クライアント計算機システムを備え、
    前記クライアント計算機システムは、前記スケーラブル圧縮信号の一部を選択する選択手段と、ビデオシーケンスとして見るために前記スケーラブル信号を伸張する伸張装置と、符号ブロックビットストリームのうち前記クライアント計算機システム上で見られた一部を記憶するためのビデオキャッシュとを含み、前記選択手段は、該クライアントの対象となる領域に関連する符号ブロックビットストリームのさらなる部分を選択するように構成され、
    前記サーバ計算機システムは、前記クライアントが符号ブロックビットストリームのどの部分をすでに受信したかを前記サーバが知り、かつ、前記クライアントによる選択に応じて、符号ブロックビットストリームのどのさらなる部分が要求されているかを前記サーバが決定することができるように、前記クライアント計算機システム上のビデオキャッシュの状態を監視するキャッシュ監視手段を含み、
    前記サーバは、前記符号ブロックビットストリームの前記部分および前記符号ブロックビットストリームの前記選択されたさらなる部分を、前記ネットワーク上で前記クライアントに提供する、
    遠隔ブラウジングを提供するシステム。
  9. 前記サーバ計算機システムは、
    前記入力信号を、偶数でインデックスされたフレームの部分シーケンスおよび奇数でインデックスされたフレームの部分シーケンスに分離し、
    一連となった、1つ以上の動き補償リフティング演算を、動き補償を組み込んで適用する
    ことにより、前記入力信号を分解し、
    前記動き補償リフティング演算のそれぞれは、前記偶数フレームの部分シーケンスからの動き補償されたフレームの線形結合を加えることによって、前記奇数フレームの部分シーケンスを調節するか、または、前記奇数フレームの部分シーケンスからの動き補償されたフレームの線形結合を加えることによって、前記偶数フレームの部分シーケンスを調節するものである、請求項に記載のシステム。
  10. 前記スケーラブル圧縮信号を提供する手段は、さらに、全体のビットレートの所定の制約に対する歪みを最小にするように、組み込み符号ブロックビットストリームを最適に切り捨てる手段を含む、請求項8に記載のシステム。
JP2011072616A 2000-12-21 2011-03-29 圧縮されたディジタルビデオ信号のインタラクティブな遠隔ブラウジングを提供する方法およびシステム Expired - Lifetime JP5683350B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AUPR2225A AUPR222500A0 (en) 2000-12-21 2000-12-21 Method for efficient scalable compression of video
AUPR2225 2000-12-21

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007180262A Division JP4755148B2 (ja) 2000-12-21 2007-07-09 圧縮されたディジタルビデオ信号のインタラクティブな遠隔ブラウジングを提供する方法

Publications (2)

Publication Number Publication Date
JP2011176852A JP2011176852A (ja) 2011-09-08
JP5683350B2 true JP5683350B2 (ja) 2015-03-11

Family

ID=3826259

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2002551791A Expired - Lifetime JP4318918B2 (ja) 2000-12-21 2001-12-21 ビデオのスケーラブル圧縮方法および装置
JP2007180262A Expired - Lifetime JP4755148B2 (ja) 2000-12-21 2007-07-09 圧縮されたディジタルビデオ信号のインタラクティブな遠隔ブラウジングを提供する方法
JP2011072616A Expired - Lifetime JP5683350B2 (ja) 2000-12-21 2011-03-29 圧縮されたディジタルビデオ信号のインタラクティブな遠隔ブラウジングを提供する方法およびシステム

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2002551791A Expired - Lifetime JP4318918B2 (ja) 2000-12-21 2001-12-21 ビデオのスケーラブル圧縮方法および装置
JP2007180262A Expired - Lifetime JP4755148B2 (ja) 2000-12-21 2007-07-09 圧縮されたディジタルビデオ信号のインタラクティブな遠隔ブラウジングを提供する方法

Country Status (7)

Country Link
US (2) US7889791B2 (ja)
EP (1) EP1354297B1 (ja)
JP (3) JP4318918B2 (ja)
AT (1) ATE469408T1 (ja)
AU (3) AUPR222500A0 (ja)
DE (1) DE60142255D1 (ja)
WO (1) WO2002050772A1 (ja)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPR222500A0 (en) * 2000-12-21 2001-01-25 Unisearch Limited Method for efficient scalable compression of video
US7324695B2 (en) * 2002-03-18 2008-01-29 Seimens Medical Solutions Usa, Inc. Prioritized image visualization from scalable compressed data
AUPS291002A0 (en) * 2002-06-12 2002-07-04 Unisearch Limited Method and apparatus for scalable compression of video
AU2002951574A0 (en) * 2002-09-20 2002-10-03 Unisearch Limited Method of signalling motion information for efficient scalable video compression
FR2848765B1 (fr) * 2002-12-11 2005-04-29 Canon Kk Procede et dispositif de determination d'une configuration de donnees d'un signal numerique d'image
JPWO2004064405A1 (ja) 2003-01-14 2006-05-18 日本電信電話株式会社 符号化方法及び復号化方法及び符号化装置及び復号化装置
KR100734790B1 (ko) * 2003-07-09 2007-07-03 닛본 덴끼 가부시끼가이샤 동화상 부호화 방법, 동화상 복호 방법, 동화상 부호화 장치, 동화상 복호 장치, 및 프로그램을 수록한 컴퓨터 판독가능 기록매체
JP4815107B2 (ja) * 2003-07-16 2011-11-16 三星電子株式会社 カラー平面間予測を利用した無損失映像符号化/復号化方法及び装置
EP1538844A3 (en) * 2003-11-26 2006-05-31 Samsung Electronics Co., Ltd. Color image residue transformation and encoding method
CN1655620B (zh) * 2004-02-09 2010-09-22 三洋电机株式会社 图像显示装置
CN101036347B (zh) * 2004-04-20 2013-06-19 法国电讯公司 通信对话管理系统以及包含这种系统的数据流集中器
US7450771B2 (en) * 2004-07-09 2008-11-11 National Taiwan University Pre-compression rate-distortion optimization method for JPEG 2000
US8340177B2 (en) * 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
JP2008507170A (ja) * 2004-07-13 2008-03-06 フランス テレコム エス アー ビデオ画像配列の符号化方法および装置
KR100647294B1 (ko) 2004-11-09 2006-11-23 삼성전자주식회사 화상 데이터 부호화 및 복호화 방법 및 장치
KR20060059782A (ko) * 2004-11-29 2006-06-02 엘지전자 주식회사 영상신호의 스케일러블 프로그레시브 다운로딩을 지원하는방법
EP1727372A1 (en) * 2005-05-27 2006-11-29 Thomson Licensing Method and apparatus for encoding and decoding video data,
US8483277B2 (en) 2005-07-15 2013-07-09 Utc Fire & Security Americas Corporation, Inc. Method and apparatus for motion compensated temporal filtering using split update process
US8279918B2 (en) 2005-07-15 2012-10-02 Utc Fire & Security Americas Corporation, Inc. Method and apparatus for motion compensated temporal filtering using residual signal clipping
US7894527B2 (en) * 2005-09-16 2011-02-22 Sony Corporation Multi-stage linked process for adaptive motion vector sampling in video compression
US20070136372A1 (en) * 2005-12-12 2007-06-14 Proctor Lee M Methods of quality of service management and supporting apparatus and readable medium
US7956930B2 (en) 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
WO2008035009A1 (fr) * 2006-09-20 2008-03-27 France Telecom Procede de communication entre plusieurs terminaux
US20080101467A1 (en) * 2006-10-27 2008-05-01 Radiospire Networks, Inc. Method and system for secure and efficient wireless transmission of HDCP-encrypted HDMI/DVI signals
US8553757B2 (en) * 2007-02-14 2013-10-08 Microsoft Corporation Forward error correction for media transmission
US8064708B2 (en) * 2007-02-28 2011-11-22 Arizona Board Of Regents On Behalf Of The University Of Arizona Methods and systems for remotely visualizing images
US8228991B2 (en) * 2007-09-20 2012-07-24 Harmonic Inc. System and method for adaptive video compression motion compensation
JP4849130B2 (ja) * 2008-02-19 2012-01-11 ソニー株式会社 画像処理装置、および画像処理方法、並びにプログラム
US8953673B2 (en) 2008-02-29 2015-02-10 Microsoft Corporation Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
KR100941582B1 (ko) 2008-03-07 2010-02-10 에스케이 텔레콤주식회사 리프팅 기반 방향성 웨이블렛 변환의 적응적 갱신 방법 및갱신 장치와 이를 위한 기록 매체
US8711948B2 (en) 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
IT1394245B1 (it) * 2008-09-15 2012-06-01 St Microelectronics Pvt Ltd Convertitore per video da tipo non-scalabile a tipo scalabile
US9471268B2 (en) * 2009-05-20 2016-10-18 Aten International Co., Ltd. Multi-channel KVM server system employing multiresolution decomposition
US9036001B2 (en) * 2010-12-16 2015-05-19 Massachusetts Institute Of Technology Imaging system for immersive surveillance
US8170334B2 (en) * 2011-10-13 2012-05-01 University Of Dayton Image processing systems employing image compression and accelerated image decompression
US8170333B2 (en) * 2011-10-13 2012-05-01 University Of Dayton Image processing systems employing image compression
US8170335B2 (en) * 2011-10-13 2012-05-01 University Of Dayton Image processing systems employing image compression and accelerated decompression
KR20140090999A (ko) * 2011-10-14 2014-07-18 어드밴스드 마이크로 디바이시즈, 인코포레이티드 영역-기반 이미지 압축
US20130101047A1 (en) * 2011-10-19 2013-04-25 Sony Corporation Context reduction of significance map coding of 4x4 and 8x8 transform coefficient in hm4.0
US8854958B2 (en) * 2011-12-22 2014-10-07 Cygnus Broadband, Inc. Congestion induced video scaling
JP2013187692A (ja) * 2012-03-07 2013-09-19 Sony Corp 画像処理装置及び画像処理方法
WO2014062934A1 (en) 2012-10-19 2014-04-24 Visa International Service Association Digital broadcast methods using secure meshes and wavelets
US9070043B2 (en) * 2013-02-28 2015-06-30 Korea University Research And Business Foundation Method and apparatus for analyzing video based on spatiotemporal patterns
CN106537911B (zh) 2014-06-25 2019-11-01 交互数字Vc控股公司 处理图像的方法和设备
US10749925B1 (en) * 2016-09-02 2020-08-18 Snap Inc. Video streaming optimization for quick start of video display
CN113238828B (zh) * 2021-05-25 2024-07-12 北京达佳互联信息技术有限公司 一种内容显示方法、装置、设备及存储介质
JP7526411B1 (ja) 2023-11-29 2024-08-01 17Live株式会社 端末、方法及びコンピュータプログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2286740B (en) 1994-02-21 1998-04-01 Sony Uk Ltd Coding and decoding of video signals
US6564262B1 (en) * 1996-09-16 2003-05-13 Microsoft Corporation Multiple multicasting of multimedia streams
US6233017B1 (en) * 1996-09-16 2001-05-15 Microsoft Corporation Multimedia compression system with adaptive block sizes
US5991816A (en) * 1996-12-13 1999-11-23 Wisconsin Alumni Research Foundation Image transfer protocol in progressively increasing resolution
JPH1175184A (ja) 1997-08-28 1999-03-16 Sanyo Electric Co Ltd 画像符号化装置及び画像符号化方法
AU3804999A (en) 1998-05-11 1999-11-29 University Of British Columbia, The Method and system for mpeg-2 encoding with frame partitioning
JP3236821B2 (ja) 1998-07-22 2001-12-10 ケイディーディーアイ株式会社 静止画像の階層符号化伝送方法および階層復号化方法
US7356482B2 (en) * 1998-12-18 2008-04-08 Alternative Systems, Inc. Integrated change management unit
US6778709B1 (en) * 1999-03-12 2004-08-17 Hewlett-Packard Development Company, L.P. Embedded block coding with optimized truncation
WO2000074385A2 (en) * 1999-05-27 2000-12-07 University Of Maryland, College Park 3d wavelet based video codec with human perceptual model
CN1181690C (zh) * 1999-07-20 2004-12-22 皇家菲利浦电子有限公司 用于压缩视频序列的编码方法
US6920179B1 (en) * 1999-11-16 2005-07-19 Agere Systems Inc. Method and apparatus for video transmission over a heterogeneous network using progressive video coding
US7389356B2 (en) * 1999-12-15 2008-06-17 Microsoft Corporation Generalized differentiation methods and arrangements for adaptive multimedia communications
US6826232B2 (en) 1999-12-20 2004-11-30 Koninklijke Philips Electronics N.V. Fine granular scalable video with embedded DCT coding of the enhancement layer
EP1285535B1 (en) * 2000-05-03 2010-02-24 IPG Electronics 503 Limited Encoding method for the compression of a video sequence
US6597739B1 (en) * 2000-06-20 2003-07-22 Microsoft Corporation Three-dimensional shape-adaptive wavelet transform for efficient object-based video coding
US6907075B2 (en) * 2000-06-30 2005-06-14 Koninklijke Philips Electronics N.V. Encoding method for the compression of a video sequence
AU2002213714A1 (en) 2000-10-24 2002-05-06 Eyeball Networks Inc. Three-dimensional wavelet-based scalable video compression
AUPR222500A0 (en) 2000-12-21 2001-01-25 Unisearch Limited Method for efficient scalable compression of video
US6801573B2 (en) * 2000-12-21 2004-10-05 The Ohio State University Method for dynamic 3D wavelet transform for video compression
CN1251509C (zh) 2001-04-10 2006-04-12 皇家菲利浦电子有限公司 帧序列的编码方法

Also Published As

Publication number Publication date
AU1570902A (en) 2002-07-01
EP1354297A4 (en) 2008-05-07
US7889791B2 (en) 2011-02-15
JP2011176852A (ja) 2011-09-08
US20120042048A1 (en) 2012-02-16
JP4318918B2 (ja) 2009-08-26
AU2002215709B2 (en) 2008-05-22
JP2004524730A (ja) 2004-08-12
EP1354297A1 (en) 2003-10-22
US8705621B2 (en) 2014-04-22
EP1354297B1 (en) 2010-05-26
US20030035478A1 (en) 2003-02-20
JP4755148B2 (ja) 2011-08-24
JP2007336567A (ja) 2007-12-27
DE60142255D1 (de) 2010-07-08
ATE469408T1 (de) 2010-06-15
AUPR222500A0 (en) 2001-01-25
WO2002050772A1 (en) 2002-06-27

Similar Documents

Publication Publication Date Title
JP5683350B2 (ja) 圧縮されたディジタルビデオ信号のインタラクティブな遠隔ブラウジングを提供する方法およびシステム
US10205951B2 (en) Method of signalling motion information for efficient scalable video compression
KR100664928B1 (ko) 비디오 코딩 방법 및 장치
KR100621581B1 (ko) 기초 계층을 포함하는 비트스트림을 프리디코딩,디코딩하는 방법, 및 장치
US6959120B1 (en) Rebinning methods and arrangements for use in compressing image-based rendering (IBR) data
Taubman Successive refinement of video: fundamental issues, past efforts, and new directions
JP4392783B2 (ja) 動画再生システム、動画送信装置、動画送信方法、プログラム、及び、記録媒体
US20050152611A1 (en) Video/image coding method and system enabling region-of-interest
WO2003107683A1 (en) Method and apparatus for scalable compression of video
Leung et al. Transform and embedded coding techniques for maximum efficiency and random accessibility in 3-D scalable compression
Chang et al. Inter-view wavelet compression of light fields with disparity-compensated lifting
Cheggoju et al. BlinQS: Blind quality scalable image compression algorithm without using PCRD optimization
AU2003260192B2 (en) Method of signalling motion information for efficient scalable video compression
Skodras The JPEG2000 image compression standard in mobile health
Loomans et al. Performance vs. complexity in scalable video coding for embedded surveillance applications
Akujuobi Wavelet Application to Image and Data Compression
Bojkovic et al. Advanced image compression techniques: Comparative functionalities and performances
Liu et al. Fully scalable video codec
Van Wallendael et al. Motion JPEG2000 interactive Region-Of-Interest coding on mobile devices
Cheng et al. Audio/video compression applications using wavelets
Choraś JPEG 2000 Image Coding Standard-A Review and Applications
Sattar NON STANDARD SIZE IMAGE COMPRESSION WITH REVERSIBLE EMBEDDED WAVELETS
JP2006503475A (ja) ドリフトのないビデオ符号化及び復号化方法、並びに対応する装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130226

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130522

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140311

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140605

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140610

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140709

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140714

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140811

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140814

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150113

R150 Certificate of patent or registration of utility model

Ref document number: 5683350

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term