JP2007514359A - デッドゾーンによる空間スケーラブル圧縮スキーム - Google Patents

デッドゾーンによる空間スケーラブル圧縮スキーム Download PDF

Info

Publication number
JP2007514359A
JP2007514359A JP2006543676A JP2006543676A JP2007514359A JP 2007514359 A JP2007514359 A JP 2007514359A JP 2006543676 A JP2006543676 A JP 2006543676A JP 2006543676 A JP2006543676 A JP 2006543676A JP 2007514359 A JP2007514359 A JP 2007514359A
Authority
JP
Japan
Prior art keywords
stream
dead zone
video stream
spatial scalable
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006543676A
Other languages
English (en)
Inventor
フューフト,ヘンリキュス アー ヘー ファン
ハー アー ブリュルス,ウィルヘルミュス
イェー エム フェルフオールト,ヘラルデュス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2007514359A publication Critical patent/JP2007514359A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

圧縮されたデータストリームで捕捉されたビデオフレームをエンコードして出力するエンコーダを含む、複数のフレームで捕捉されるビデオ情報の空間スケーラブル圧縮を実行するために装置が開示され、比較的低い解像度を有するエンコードされたビットストリームを含むベースレイヤ、比較的高い解像度を有する残余信号を含む高解像度のエンハンスメントレイヤを有する。デッドゾーン演算ユニットは、残余信号を減衰し、残余信号は、ベースレイヤからのオリジナルフレームとアップスケールされたフレームとの間の差である。結果として、圧縮されたデータストリームのために必要とされるビット数は、所与の観察されたビデオ品質について低減される。

Description

本発明は、ビデオエンコーダ/デコーダに関し、より詳細には、空間スケーラブル圧縮スキームによりビデオエンコーダ/デコーダに関する。
さらに、本発明は、ビデオ情報のスケーラブル圧縮を実行する装置、及びビデオストリームの空間スケーラブル圧縮を提供する方法に関する。
デジタルビデオに固有の大量のデータのため、フルモーションの高精細デジタルビデオ信号の伝送は、高精細テレビジョンの開発において重要な問題である。より詳細には、それぞれのデジタルイメージフレームは、特定のシステムのディスプレイ解像度に係る画素のアレイから形成される静止画像である。結果として、高精細ビデオ系列に含まれる未処理のデジタル情報量は大量である。送出されるべきデータ量を低減するため、圧縮スキームはデータを圧縮するために使用される。MPEG−2,MPEG−4及びH.263を含む各種のビデオ圧縮規格又はプロセスが確立されている。
1つのストリームで各種解像度及び/又は品質でビデオが利用可能である多くのアプリケーションが可能である。これを達成する方法は、スケーラビリティ技術と呼ばれる。スケーラビリティを展開することができる3つの軸が存在する。第一に、時間軸でのスケーラビリティであり、時間スケーラビリティと呼ばれる。第二に、品質軸でのスケーラビリティ(量子化)があり、SNR(Signal-to-Noise Ratio)スケーラビリティ又はファイングレインスケーラビリティと呼ばれる。第三の軸は、空間スケーラビリティと呼ばれる解像度軸(画像における画素軸)である。階層符号化では、ビットストリームは、2以上のビットストリーム又はレイヤに分割される。それぞれのレイヤは、1つの高品質信号を形成するために結合することができる。たとえば、ベースレイヤは、低品質のビデオ信号を提供し、エンハンスメントレイヤは、ベースレイヤ画像を強調することができる更なる情報を提供する。
特に、空間スケーラビリティは、異なるビデオ規格又はデコーダ機能の間での互換性を提供することができる。空間スケーラビリティにより、ベースレイヤビデオは、入力ビデオ系列よりも低い解像度を有する場合があり、そのケースでは、エンハンスメントレイヤは、入力系列レベルにベースレイヤの解像度を回復することができる情報を搬送する。
図1は、公知の空間スケーラブルビデオエンコーダ100を例示する。図示されたエンコードシステム100は、レイヤ圧縮を達成し、チャネルの一部は、低解像度のベースレイヤを提供するために使用され、残りの部分は、エッジエンハンスメント情報を伝送するために使用され、2つの信号は、システムを高解像度にするために再結合される場合がある。高解像度ビデオ入力101は、スプリッタ102により分割され、データはロウパスフィルタ104及び減算回路106に送出される。ロウパスフィルタ104は、ビデオデータの解像度を低減し、次いで、ベースエンコーダ108に供給される。一般に、ロウパスフィルタ及びエンコーダは、当該技術分野で公知であり、明確さのためにここでは更に詳細に記載されない。エンコーダ108は、低い解像度のベースストリーム110を生成し、この低い解像度のベースストリーム110は、ベースストリームは高精細であると考えられる解像度を提供しないが、ブロードキャストされ、受信することができ、デコーダを介して表示することができる。
エンコーダ108の出力は、システム100でデコーダ112に供給される。そこから、デコードされた信号は、補間及びアップサンプル回路114に供給される。一般に、補間及びアップサンプル回路114は、デコードされたビデオストリームからフィルタ出力された解像度を再構築し、高解像度入力と同じ解像度を有するビデオデータストリームを提供する。しかし、フィルタリング並びに、エンコード及びデコードから生じる損失のため、情報の損失は、再構成されたストリームに存在する。損失は、再構成された高解像度ストリームをオリジナルの変更されていない高解像度ストリームから減算することで、減算回路106で決定される。減算回路106の出力は、合理的な品質エンハンスメントストリーム118を出力するエンハンスメントエンコーダ116に供給される。
これら階層圧縮スキームは良好に機能するために行うことができるが、これらのスキームは、エンハンスメントレイヤが高いビットレートを必要とする点で問題を有する。通常は、エンハンスメントレイヤのビットレートは、ベースレイヤのビットレートに等しいか、又はベースレイヤのビットレートよりも高い。しかし、高精細ビデオ信号を記憶する要求は、一般的な圧縮規格により通常に伝送することができる低いビットレートを必要とする。これは、記録/再生時間が余りに短くなるので、既存の標準精細度システムに高い精細度を導入するのを困難にする。
本発明は、エンハンスメントエンコーダに入力される残りの信号におけるビット数を低減するためデッドゾーンオペレーションを使用することで、他の公知の階層圧縮スキームの問題点の少なくとも1部を克服し、これによりエンハンスメントレイヤのビットレートを低くすることにある。
本発明の1実施の形態によれば、捕捉されたビデオフレームを圧縮されたデータストリームにエンコードして出力するエンコーダを含む、複数のフレームで捕捉されたビデオ情報の空間スケーラブル圧縮を実行する方法及び装置が開示される。ベースレイヤは、比較的低い解像度を有するエンコードされたビットストリームを有する。高い解像度のエンハンスメントレイヤは、比較的高い解像度を有する残余の信号を有する。デッドゾーン演算ユニットは、残余の信号を減衰させ、残余の信号は、ベースレイヤからのオリジナルフレームとアップスケールされたフレームとの間の差である。結果として、圧縮されたデータストリームのために必要とされるビット数は、所与の観察されたビデオ品質について低減される。
本発明の別の実施の形態によれば、ビデオストリームの適応型コンテンツフィルタリングを使用した空間スケーラブル圧縮を提供する方法及び装置が開示される。ビデオストリームは、ビデオストリームの解像度を低減するためにダウンサンプルされる。ダウンサンプルされたビデオストリームは、ベースストリームを生成するためにエンコードされる。ベースストリームは、再構成されたビデオストリームを生成するためにデコード及びアップコンバートされる。再構成されたビデオストリームは、残余のストリームを生成するためにビデオストリームから減算される。残余のストリームは、残余のストリームからビットを除くためにデッドゾーン演算を使用して減衰される。結果的に得られる残余のストリームは、エンハンスメントストリームとしてエンコード及び出力される。
本発明のこれらの態様及び他の態様は、以下に記載される実施の形態を参照して明らかにされるであろう。本発明は、添付図面を参照して例示を通して説明される。
図2(a)〜図2(b)は、本発明の1実施の形態に係る階層型ビデオエンコーダ/デコーダ200のブロック図である。エンコーダ/デコーダ200は、エンコードセクション201及びデコードセクションを有する。高解像度のビデオストリーム202は、エンコードセクション201に入力される。ビデオストリーム202は、スプリッタ204により分割され、これによりビデオストリームは、ロウパスフィルタ206及び減算ユニット212に送出される。ロウパスフィルタ又はダウンサンプリングユニット206は、ビデオストリームの解像度を低減し、次いでベースエンコーダ208に供給される。ベースエンコーダ208は、公知のやり方でダウンサンプルされたビデオストリームをエンコードし、ベースストリーム209を出力する。この実施の形態では、ベースエンコーダ208は、ローカルデコーダ出力をアップコンバートユニット210に出力する。アップコンバートユニット210は、ローカルにデコードされたビデオストリームからフィルタ出力された解像度を再構成し、公知のやり方で高解像度の入力ビデオストリームと基本的に同じ解像度のフォーマットを有する再構成されたビデオストリームを提供する。代替的に、ベースエンコーダ208は、エンコードされた出力をアップコンバートユニット210に出力する場合があり、個別のデコーダ(図示せず)又はアップコンバートユニット210に提供されたデコーダのいずれかは、アップコンバートされる前にエンコードされた信号をはじめにデコードする。
先に記載されたように、再構成されたビデオストリーム及び高解像度の入力ビデオストリームは、減算ユニット212に入力される。減算ユニット212は、残余のストリームを生成するため、入力ビデオストリームから再構成されたビデオストリームを減算する。次いで、デッドゾーン演算は、デッドゾーン演算ユニット214において残余のストリームに適用される。デッドゾーン演算は、非線形の演算であり、より小さな入力はより大きな減衰を受け、より大きな入力は次第に小さくなる減衰を受ける(幾つかのデッドゾーン演算からなる線形結合、及び線形変換として見ることができる)。複数の異なるデッドゾーン演算が以下に記載されるが、如何なるデッドゾーン演算が本発明で使用することができ、本発明はこれに限定されないことは当業者により理解されるであろう。デッドソーン演算の結果は、ピクチャにおいて少ない情報につながる残余信号の小さな値はゼロにクリップされる。結果として、より高い圧縮効率は、画質の知覚的な損失なしに達成することができる。デッドゾーン演算ユニット214からの出力は、エンハンスメントストリーム218を生成するエンハンスメントエンコーダ216に入力される。
デコーダセクション205では、ベースストリーム209は、デコーダ220により公知のやり方でデコードされ、エンハンスメントストリーム218は、デコーダ222により公知のやり方でデコードされる。デコードされたベースストリーム218は、アップコンバートユニット224でアップコンバートされる。アップコンバートされたベースストリーム及びデコードされたエンハンスメントストリームは、次いで、出力ビデオストリーム228を生成するために算術ユニット226で結合される。
図3は、本発明の別の実施の形態に係るエンコーダ300を例示している。この実施の形態では、ピクチャアナライザ304は、図2に例示されるエンコーダに付加されている。スプリッタ302は、高解像度の入力ビデオストリーム202を分割し、これにより入力ビデオストリーム202は、減算ユニット212及びピクチャアナライザ304に送出される。さらに、再構成されたビデオストリームは、ピクチャアナライザ304及び減算ユニット212に入力される。ピクチャアナライザ304は、入力ストリームのフレーム及び/又は再構成されたビデオストリームのフレームを分析し、ビデオストリームのそれぞれのフレームにおけるそれぞれの画素又は画素グループの内容の数値による利得値を生成する。数値による利得値は、たとえば、フレームにおける画素又は画素グループのx,y座標、フレーム番号及び利得値により与えられる画素又は画素グループの位置からなる。画素又は画素グループが多数の詳細を有するとき、利得値は、最大値“1”に向けて移動する。同様に、画素又は画素グループが多くの詳細を有さないとき、利得値は、最小値“0”に向けて移動する。ピクチャアナライザの詳細な基準の幾つかの例が以下に記載されるが、本発明はこれらの例に限定されない。はじめに、ピクチャアナライザは、画素の周りのローカルスプレッド(local spread)対全体のフレームにわたる平均画素スプレッド(average pixel spread)を分析することができる。ピクチャアナライザは、たとえばフレーム全体にわたる平均値に対して分割される画素当たり
−1−1−1, −1 8−1,−1−1−1,
の絶対値といったエッジレベルをも分析する。
詳細の程度を変えるためのゲイン値は、予め決定されており、それぞれの画素又は画素グループの詳細のレベルがひとたび決定されると、読み出すためにルックアップテーブルに記憶される。
先に記載されたように、再構成されたビデオストリーム及び高解像度入力ビデオストリームは、減算ユニット212に入力される。減算ユニット212は、残余のストリームを生成するため、再構成されたビデオストリームを入力ビデオストリームから減算する。ピクチャアナライザ304からの利得値は、残余のストリームの減衰を制御するために使用される乗算器306に送出される。代替的な実施の形態では、ピクチャアナライザ304は、システムから除くことができ、予め決定された利得値は、乗算器306にロードすることができる。利得値で残余のストリームを乗算する作用は、殆ど詳細を有さないそれぞれのフレームの領域についてある種のフィルタリングが行われることである。かかる領域では、通常は、大部分が無関係の低い詳細すなわち雑音に多数のビットが費やされる必要がある。しかし、僅かな詳細又は詳細のない領域についてゼロに向かって移動する利得値で残余のストリームを乗算することで、これらのビットはエンハンスメントエンコーダ216でエンコードされる前に残余のストリームから除くことができる。同様に、乗数は、エッジ及び/又はテキスト領域の1つに向けて移動し、これらのエリアのみがエンコードされる。同様に、乗数はエッジ及び/又はテキストについて1の方向に移動し、それらの領域のみがエンコードされる。通常のピクチャでの作用は、ビットに関して大きな節約となる。ビデオの品質が幾分影響されるが、ビットレートの節約に関して、これは、特に同じ全体のビットレートでの通常の圧縮技術に比較したときに良好な妥協となる。乗算器306の出力は、次いでデッドゾーンの演算ユニット214に供給される。先に記載されたように、デッドゾーン演算ユニット214は、乗算器306からのストリームの小さな値がゼロにクリップされるように、デッドゾーン演算を実行する。デッドゾーン演算ユニット214からの出力は、エンハンスメントストリーム218を生成するエンハンスメントエンコーダ216に入力される。
図4は、本発明の別の実施の形態に係るエンコーダ400を例示している。この実施の形態では、図3に例示されるエンコーダに「クラスタを除く“remove cluster”」演算が追加される。クラスタを除く演算は、図2に例示されるエンコーダでのデッドゾーン演算の後でも実行することができることが理解される。更に符号化効率を改善するため、クラスタを除く演算ユニット402は、デッドゾーン演算ユニット214の後に追加される。クラスタを除く演算は、所定のレンジで1つの画素を除く。これら1つの画素はピクチャの鮮鋭度に寄与しないので、これらの画素は、知覚的な画質の損失なしに除かれる。
クラスタを除く演算は以下のように機能する。はじめに、重要な残余の画素をパスして、全ての他の残りの画素をゼロにする演算である。かかる演算の例は、コンテンツに適応した減衰及び/又はデッドゾーンである。残余の画像は、クラスタの集合から構成され、クラスタは、ゼロの値をもつ画素により完全に囲まれた画素のグループである。次のステップは、非ゼロの残余の画素のそれぞれのクラスタの周囲の長さ(値)を決定することである。この値が所定の閾値以下である場合、対応するクラスタの全ての画素値も同様に強制的にゼロにされる。代替的に、クラスタの周囲の値を決定する代わりに、それぞれのクラスタにおける非ゼロの画素数を決定することができ、予め決定された画素数よりも少ない画素数を有するクラスタは強制的にゼロにされる。
図5は、本発明の1実施の形態に係るデッドゾーン方法を例示している。この実施の形態では、閾値thは、ユーザ、デザイナにより選択されるか、又は図3に例示されるようにコンテンツに適応する。次いで、デッドゾーン演算ユニット214は、閾値よりも小さい画素値をゼロにクリップする。結果として、エンコードされる必要がある残余のストリームにおける画素は殆どない。
図6は、本発明の1実施の形態に係るデッドゾーン方法を例示している。このデッドゾーン演算は、閾値thよりも小さい値をゼロにクリップする。さらに、本方法は、閾値thを残余のストリームにおける全ての他の値から減算する。これは、各画素についてth個の画素のエラーとなる。この他の画素の値の余分の低減のため、小さいが知覚できる画質の損失の犠牲を払って余分の圧縮効率が得られる。
図7は、本発明の1実施の形態に係るデッドゾーン方法を例示する図である。このデッドゾーン演算は、図5及び図6に例示されるデッドゾーン方法をカスケード接続することで得られる。このデッドゾーン演算は、閾値th1よりも小さい値をゼロにクリップする。さらに、この方法は、閾値th2を残余のストリームにおける全ての他の値から減算する。これは、それぞれ大きな画素についてth2個の画素のエラーとなる。図6に例示される方法に比較してこの方法の利点は、この方法を使用して閾値th1を超える画素のエラーが小さいことである。
図8は、本発明の1実施の形態に係るデッドゾーン方法を例示している。このデッドゾーン方法は、閾値th1よりも小さい全ての値をゼロにクリップすることである。閾値th1と閾値th2との間のそれぞれの画素から、th1の値が減算される。閾値th2を超えるそれぞれの画素について、出力は入力と同じである。このように、余分の圧縮効率は、制限された画素数についてth1個の画素のエラーのみで得ることができる。
図9は、本発明の1実施の形態に係る、より一般的なデッドゾーン方法を例示している。先に記載された方法で行われたような個々のステップを使用する代わりに、より一般的なソリューションは、ルックアップテーブルを使用することである。このルックアップテーブルは、全ての可能な入力値について出力値を含んでいる。このように、伝送曲線が可能である。
先に記載された異なるデッドゾーン方法が比較され、比較の結果が以下に提供される。入力として、50フレーム1080p、24Hzシーケンスが使用される。このシーケンスは、標準精細度(720×480)ベースレイヤのMPEG−2及び高精細度(1920×1080)エンハンスメントレイヤのMPEG−2を使用してエンコードされる。図4に例示されるような、動的な解像度制御による符号化スキーム及びクラスタ除去演算が使用される。この比較の結果は、図10に例示されている。方法1の結果的に得られる品質は、デッドゾーン演算がない結果に比較して非常に良好である。方法2及び方法3によれば、解像度の幾つかの損失に明らかに気付くことができる。方法4によれば、解像度の損失は、気付くことができるが、方法2及び方法3における損失よりも小さく、この方法は、方法1及び方法2並びに方法3との間の良好な妥協となるように見える。
図11は、更なる動的な解像度制御又はクラスタ除去演算の使用なしにデッドゾーン演算の結果を例示している。この符号化スキームは、図2に例示されている。これらは、動的な解像度制御及びクラスタ除去演算なしでのデッドゾーン演算の作用を見るための参照として追加される。クラスタ除去演算の影響を見るため、上述されたシーケンスは、クラスタ除去演算が使用されてエンコードされるか、クラスタ除去演算が使用されることなしにエンコードされている。動的な解像度制御及びデッドゾーン方法1も使用される。結果は図12に例示されている。
本発明の先に記載された実施の形態は、エンコードの前に残余のストリームから不必要なビットを除くためにデッドゾーン演算、動的な解像度制御、及び/又はクラスタ除去演算を使用することでエンハンスメントレイヤのビットレートを低下させることで、公知の空間スケーラブル圧縮スキームの効率をエンハンスする。本発明の異なる実施の形態は、幾つかのステップのタイミングが本発明の全体の動作に影響を与えることなしに相互交換することができるので、上述されたステップの正確な順序に制限されないことが理解される。さらに、用語「有する“comprising”」は他のエレメント又はステップを排除するものではなく、用語“a”及び“an”は複数を排除するものではなく、1つのプロセッサ又は他のユニットは、請求項で引用されたユニット又は回路の幾つかの機能を達成する場合がある。さらに、個々の機能が異なる請求項に含まれる場合があるが、これらは有利にも結合することができ、異なる請求項における包含は、機能の組み合わせが実施可能及び/又は有利でないことを意味するものではない。
公知の階層型ビデオエンコーダを表すブロック図である。 図2(a)〜図2(b)は本発明の1実施の形態に係る階層型のビデオエンコーダ/デコーダのブロック図である。 本発明の1実施の形態に係る階層型のビデオエンコーダのブロック図である。 本発明の1実施の形態に係る階層型のビデオエンコーダのブロック図である。 本発明の1実施の形態に係るデッドゾーン方法を説明する図である。 本発明の1実施の形態に係るデッドゾーン方法を説明する図である。 本発明の1実施の形態に係るデッドゾーン方法を例示する図である。 本発明の1実施の形態に係るデッドゾーン方法を例示する図である。 本発明の1実施の形態に係るデッドゾーン方法を例示する図である。 本発明の実施の形態に係る異なるデッドゾーン方法の結果を説明する図である。 本発明の実施の形態に係る異なるデッドゾーン方法の結果を説明する図である。 本発明の実施の形態に係る異なるデッドゾーン方法の結果を説明する図である。

Claims (18)

  1. 捕捉されたビデオフレームを圧縮されたデータストリームにエンコードして出力するエンコーダを含む、複数のフレームで捕捉されたビデオ情報の空間スケーラブル圧縮を実行する装置であって、
    比較的低い解像度を有するエンコードされたビットストリームを有するベースレイヤと、
    比較的高い解像度を有するエンコードされたビットストリームを有する高解像度のエンハンスメントレイヤとを有し、
    デッドゾーン演算ユニットは、オリジナルのフレームと前記ベースレイヤからのアップスケールされたフレームとの間の差である残余の信号を減衰する、
    ことを特徴とする装置。
  2. 前記デッドゾーン演算ユニットは、第一の閾値以下の画素値をゼロにクリップすることで前記残余信号を減衰する、
    請求項1記載のビデオ情報の空間スケーラブル圧縮を実行する装置。
  3. 前記デッドゾーン演算ユニットは、第一の閾値以下の画素値をゼロにクリップし、全ての他の画素値から第一の閾値を減算することで、前記残余信号を減衰させる、
    請求項1記載のビデオ情報の空間スケーラブル圧縮を実行する装置。
  4. 前記デッドゾーン演算ユニットは、第一の閾値以下の画素値をゼロにクリップし、全ての他の画素値から第二の閾値を減算することで、前記残余信号を減衰させる、
    請求項1記載のビデオ情報の空間スケーラブル圧縮を実行する装置。
  5. 前記デッドゾーン演算ユニットは、第一の閾値以下の画素値をゼロにクリップし、前記第一の閾値と第二の閾値との間の画素値から前記第一の閾値を減算することで、残余信号を減衰させる、
    請求項1記載のビデオ情報の空間スケーラブル圧縮を実行する装置。
  6. 前記デッドゾーン演算ユニットは、それぞれの入力値について出力値を生成するため、ルックアップテーブルを使用することで、前記残余信号を減衰させる、
    請求項1記載のビデオ情報の空間スケーラブル圧縮を実行する装置。
  7. アップスケール及び/又はオリジナルフレームを受け、それぞれ受信されたフレームにおけるそれぞれの画素の内容の利得値を計算するピクチャアナライザを更に有し、
    乗算器は、前記デッドゾーン演算ユニットに入力される前に前記残余信号を減衰させるために前記利得値を使用する、
    請求項1記載のビデオ情報の空間スケーラブル圧縮を実行する装置。
  8. 前記利得値は、詳細を有さない領域についてゼロに向かう、
    請求項7記載のビデオ情報の空間スケーラブル圧縮を実行する装置。
  9. 前記利得値は、エッジ及びテキスト領域について1に向かう、
    請求項7記載のビデオ情報の空間スケーラブル圧縮を実行する装置。
  10. 前記利得値は、画素のグループについて計算される、
    請求項7記載のビデオ情報の空間スケーラブル圧縮を実行する装置。
  11. 前記残余の出力から予め決定されたサイズ以下のクラスタについて画素クラスタに属する残余の画素を除くクラスタ除去演算ユニットを更に有する、
    請求項1記載のビデオ情報の空間スケーラブル圧縮を実行する装置。
  12. 前記サイズは、それぞれのクラスタの周辺の値である、
    請求項11記載のビデオ情報の空間スケーラブル圧縮を実行する装置。
  13. 前記サイズは、それぞれのクラスタにおける非ゼロの画素数である、
    請求項11記載のビデオ情報の空間スケーラブル圧縮を実行する装置。
  14. ビデオストリームをエンコード及びデコードするための階層型エンコーダであって、
    ビデオストリームの解像度を低減するダウンサンプリングユニットと、
    低解像度のベースストリームをエンコードするベースエンコーダと、再構成されたビデオストリームを生成するため、前記ベースストリームをデコードして前記ベースストリームの解像度を増加するアップコンバートユニットと、
    残余信号を生成するため、オリジナルのビデオストリームから前記再構成されたビデオストリームを減算する減算ユニットと、
    前記残余信号を減衰するデッドゾーン演算ユニットと、
    前記デッドゾーン演算ユニットから結果的に得られる残余信号をエンコードし、エンハンスメントストリームを出力するエンハンスメントエンコーダと、
    を有することを特徴とする階層型エンコーダ。
  15. 前記ビデオストリーム及び前記再構成されたビデオストリームを受信し、受信されたストリームのそれぞれのフレームにおけるそれぞれの画素の内容の利得値を計算するピクチャアナライザと、
    詳細を有さない領域について残余信号からビットを除くように前記残余信号を利得値で乗算する第一の乗算ユニットとを更に有する、
    請求項14記載の階層型エンコーダ。
  16. ビデオストリームの適応的なコンテンツのフィルタリングを使用して空間スケーラブル圧縮を提供する方法であって、
    前記ビデオストリームの解像度を低減するために前記ビデオストリームをダウンサンプリングするステップと、
    ベースストリームを生成するため、ダウンサンプリングされたビデオストリームをエンコードするステップと、
    再構成されたビデオストリームを生成するため、前記ベースストリームをデコードしてアップコンバートするステップと、
    残余ストリームを生成するため、前記ビデオストリームから前記再構成されたビデオストリームを減算するステップと、
    前記残余のストリームからビットを除くためにデッドゾーン演算を使用して前記残余のストリームを減衰させるステップと、
    結果的に得られた残余信号をエンコードし、エンハンスメントストリームを出力するステップと、
    を含むことを特徴とする方法。
  17. 受信されたビデオストリームのフレームにおけるそれぞれの画素の内容の利得値を生成するため、前記ビデオストリーム及び前記再構成されたビデオストリームを分析するステップと、
    前記デッドゾーン演算の前に前記残余ストリームからビットを除くように、利得値で残余ストリームを乗算するステップとを更に含む、
    請求項16記載のビデオストリームの適合型コンテンツフィルタリングを使用して空間スケーラブル圧縮を提供する方法。
  18. 前記残余の出力から予め決定されたサイズ以下のクラスタについて画素クラスタに属する残余画素を除くステップを更に含む、
    請求項16記載のビデオストリームの適応型コンテンツフィルタリングを使用して空間スケーラブル圧縮を提供する方法。
JP2006543676A 2003-12-08 2004-11-29 デッドゾーンによる空間スケーラブル圧縮スキーム Pending JP2007514359A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03104588 2003-12-08
PCT/IB2004/052583 WO2005057933A1 (en) 2003-12-08 2004-11-29 Spatial scalable compression scheme with a dead zone

Publications (1)

Publication Number Publication Date
JP2007514359A true JP2007514359A (ja) 2007-05-31

Family

ID=34673598

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006543676A Pending JP2007514359A (ja) 2003-12-08 2004-11-29 デッドゾーンによる空間スケーラブル圧縮スキーム

Country Status (7)

Country Link
US (1) US20070160300A1 (ja)
EP (1) EP1695555A1 (ja)
JP (1) JP2007514359A (ja)
KR (1) KR20060126984A (ja)
CN (1) CN1890980A (ja)
TW (1) TW200529674A (ja)
WO (1) WO2005057933A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014521276A (ja) * 2011-07-21 2014-08-25 ロッサト、ルカ 層状の信号品質階層のおける信号処理およびインヘリタンスの方法、プログラム、及び、コンピュータシステム
JP2016522588A (ja) * 2013-03-11 2016-07-28 ドルビー ラボラトリーズ ライセンシング コーポレイション 階層符号化を用いたマルチフォーマットハイダイナミックレンジビデオの配信

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8155454B2 (en) * 2006-07-20 2012-04-10 Qualcomm Incorporated Method and apparatus for encoder assisted post-processing
US8253752B2 (en) * 2006-07-20 2012-08-28 Qualcomm Incorporated Method and apparatus for encoder assisted pre-processing
WO2009130540A1 (en) * 2008-04-23 2009-10-29 Maxtu S.A. Method for high definition video encoding/decoding suitable for real-time video streaming
US8923390B2 (en) * 2009-06-19 2014-12-30 The Hong Kong University Of Science And Technology Scalar quantization using bit-stealing for video processing
US9774882B2 (en) 2009-07-04 2017-09-26 Dolby Laboratories Licensing Corporation Encoding and decoding architectures for format compatible 3D video delivery
US20130222539A1 (en) * 2010-10-08 2013-08-29 Dolby Laboratories Licensing Corporation Scalable frame compatible multiview encoding and decoding methods
GB2492397A (en) * 2011-06-30 2013-01-02 Canon Kk Encoding and decoding residual image data using probabilistic models
GB2492392B (en) * 2011-06-30 2014-09-03 Canon Kk Method for encoding and decoding an image, and corresponding devices
GB2492393A (en) * 2011-06-30 2013-01-02 Canon Kk Selective quantisation of transformed image coefficients
US9549207B2 (en) * 2013-01-02 2017-01-17 Dolby Laboratories Licensing Corporation Backward-compatible coding for ultra high definition video signals with enhanced dynamic range
CN103916673B (zh) * 2013-01-06 2017-12-22 华为技术有限公司 基于双向预测的编码方法、解码方法和装置
US20140355665A1 (en) * 2013-05-31 2014-12-04 Altera Corporation Adaptive Video Reference Frame Compression with Control Elements
US10410398B2 (en) * 2015-02-20 2019-09-10 Qualcomm Incorporated Systems and methods for reducing memory bandwidth using low quality tiles
CA3133777A1 (en) * 2019-03-20 2020-09-24 V-Nova International Ltd Rate control for a video encoder
EP3942818A1 (en) * 2019-03-20 2022-01-26 V-Nova International Ltd Residual filtering in signal enhancement coding
GB2617784B (en) * 2019-03-20 2024-01-10 V Nova Int Ltd Temporal signalling for video coding technology
CN114521327A (zh) * 2019-07-05 2022-05-20 威诺瓦国际有限公司 视频译码中的残差的量化
CN114040197B (zh) * 2021-11-29 2023-07-28 北京字节跳动网络技术有限公司 视频检测方法、装置、设备及存储介质
CN115550669B (zh) * 2022-11-30 2023-03-24 摩尔线程智能科技(北京)有限责任公司 一种视频转码方法及装置、电子设备和存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6269192B1 (en) * 1997-07-11 2001-07-31 Sarnoff Corporation Apparatus and method for multiscale zerotree entropy encoding
US6785423B1 (en) * 2000-05-26 2004-08-31 Eastman Kodak Company Producing a compressed digital image organized into layers having information relating to different viewing conditions and resolutions
US6801573B2 (en) * 2000-12-21 2004-10-05 The Ohio State University Method for dynamic 3D wavelet transform for video compression
US20040258319A1 (en) * 2001-10-26 2004-12-23 Wilhelmus Hendrikus Alfonsus Bruls Spatial scalable compression scheme using adaptive content filtering

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014521276A (ja) * 2011-07-21 2014-08-25 ロッサト、ルカ 層状の信号品質階層のおける信号処理およびインヘリタンスの方法、プログラム、及び、コンピュータシステム
JP2016522588A (ja) * 2013-03-11 2016-07-28 ドルビー ラボラトリーズ ライセンシング コーポレイション 階層符号化を用いたマルチフォーマットハイダイナミックレンジビデオの配信
US11146803B2 (en) 2013-03-11 2021-10-12 Dolby Laboratories Licensing Corporation Distribution of multi-format high dynamic range video using layered coding

Also Published As

Publication number Publication date
WO2005057933A1 (en) 2005-06-23
TW200529674A (en) 2005-09-01
EP1695555A1 (en) 2006-08-30
US20070160300A1 (en) 2007-07-12
CN1890980A (zh) 2007-01-03
KR20060126984A (ko) 2006-12-11

Similar Documents

Publication Publication Date Title
US20040258319A1 (en) Spatial scalable compression scheme using adaptive content filtering
JP2007514359A (ja) デッドゾーンによる空間スケーラブル圧縮スキーム
JP2005506816A5 (ja)
US20040252767A1 (en) Coding
US20040252900A1 (en) Spatial scalable compression
US20140247890A1 (en) Encoding device, encoding method, decoding device, and decoding method
KR20150010903A (ko) 모바일 단말 화면을 위한 3k해상도를 갖는 디스플레이 영상 생성 방법 및 장치
US9036715B2 (en) Video coding
KR20150068402A (ko) 동영상 압축 방법
US7676099B2 (en) Method of down-sampling data values
KR20060123375A (ko) 호환 인터레이싱된 sdtv 및 순차 hdtv
US20110317755A1 (en) Systems and methods for highly efficient compression of video
JP2005531959A (ja) 空間スケーラブル圧縮方法及び装置
JP2006310934A (ja) プリフィルタ
JPH10224790A (ja) 圧縮伸張された画像中のブロック状ノイズを除去するフィルタおよびフィルタ方法
CN106954074B (zh) 一种视频数据处理方法和装置
JPH04192695A (ja) 動画像復号化装置
KR20050019807A (ko) 공간적인 스케일러블 압축
JP2007288627A (ja) Mpeg復号処理回路及びそれに用いるmpegフィルタリング表示方法
JP2006005573A (ja) 画像復号装置
JP2002209220A (ja) 動画像情報の圧縮方法およびそのシステム