JP2012503416A - ビデオ画像の刈り取り方法及び装置 - Google Patents

ビデオ画像の刈り取り方法及び装置 Download PDF

Info

Publication number
JP2012503416A
JP2012503416A JP2011527796A JP2011527796A JP2012503416A JP 2012503416 A JP2012503416 A JP 2012503416A JP 2011527796 A JP2011527796 A JP 2011527796A JP 2011527796 A JP2011527796 A JP 2011527796A JP 2012503416 A JP2012503416 A JP 2012503416A
Authority
JP
Japan
Prior art keywords
region
picture
data
pictures
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011527796A
Other languages
English (en)
Other versions
JP2012503416A5 (ja
Inventor
ヴォ,ダング,トラング
ソーレ,ジョエル
イン,ペン
ジォン,ユンフェイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2012503416A publication Critical patent/JP2012503416A/ja
Publication of JP2012503416A5 publication Critical patent/JP2012503416A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence

Abstract

ビデオ画像の刈り取りを行う方法及び装置が提供される。装置は、符号化による圧縮の前に、符号化による圧縮に備えて、あるピクチャを前処理するデータ刈り取り手段110を含む。データ刈り取り手段は、ピクチャにおける少なくとも1つの領域を空間領域において選択的に除去する。デコーダ側で、装置は、復号化による伸張に続いて、伸張されたピクチャを受け、以前に行われた符号化処理の前に少なくとも1つの領域が除去されたことを示す情報に基づいて、伸張されたピクチャにおける少なくとも1つの領域を空間領域において選択的に復元することで、伸張されたピクチャを後処理するデータ復元手段140を含む。

Description

本発明は、ビデオ符号化及び復号化に関し、より詳細には、ビデオ画像の刈り取り方法及び装置に関する。
本出願は、2008年9月18日に提出された米国特許仮出願第61/098125号の利益を特許請求するものであり、この仮出願の内容は、その完全な形で本明細書に盛り込まれる。
現在、高画質ビデオの要求が増え続けている。ビデオコンテンツの要求は、高い解像度、高いフレームレート、及び高いビット深度に進む傾向にある。高精細(HD)ビデオ及び他のビットレートが集中する開発に対応するビットレートの増加に対抗するため、特に、ネットワーク及び通信技術の伝送の制約に対処するため、ビットレートを更に低減する新たな技術が強く要求される。
圧縮ビットレートを低減することに対する少なくとも2つの基本的なアプローチが存在する。第一のアプローチは、圧縮技術を改善することを含み、第二のアプローチは、圧縮前にある種の前処理を行うことを含む。
第一のアプローチ、すなわち圧縮技術を改善することに関し、この発展は、たとえばISO/IEC(International Organization for Standardization/International Electrotechnical Commission)のMPEG-1規格、ISO/IECのMPEG-2規格、ISO/IECのMPEG-4規格、及びISO/IECのMPEG-4 Part 10 AVC(Advanced Video Coding)規格/ITU-T(International Telecommunication Union, Telecommunication Sector)H.264勧告(以下“MPEG-4 AVC規格”)のような、様々なMPEG(Moving Picture Experts Group)の符号化規格の発展において容易に見る事ができる。
大部分の符号化規格について、量子化ステップサイズを増加することは、ビットレートを低減するために使用される手段である。しかし、この技術は、高周波の詳細の損失による深刻なブロックアーチファクト及び他の符号化アーチファクトとなる可能性がある。
第二のアプローチ、すなわち圧縮前のある種の前処理を行うことに関して、係る前処理の目標は、視覚の観点で重要ではない情報、又はコンテンツを著しく変更することなしに復号化処理の後に回復できる情報を除くことである。また、このビットレートの低減は、データプルーニング(刈り込み)と一般に呼ばれる。このデータプルーニングを通してビットレートの低減を行う幾つかの一般的な技術は、ロウパスフィルタ及び(フィルタリング処理として見る事ができる)ダウンサンプリング、これらに続くデコーダでのアップサンプリングの使用である。これらのスキームの1つの効果は、これらの技術はビットレートを低減するためにビデオにおける高周波情報を除くように設計されているので、復号化及び再構成されたビデオが少しぼやけて見えることである。
たとえば、前に記載されたアップサンプリングのために使用される補間に関して、従来のBilinear及びBi-cubic補間を発端として、POCS(Projection Onto Convex Sets)及び非凸上の偏差分方程式のような洗練された繰り返し補間方法に続いて、広範囲の補間方法及びスキームが議論及び開発されている。
エッジに沿って生じるジャーキネスを回避するため、低解像度画像のマルコフ確率場及び分散を使用したエッジ指向の補間方法が提案されている。
1つの従来のアプローチは、方向性フィルタリング及びデータ融合の組み合わせを利用して、LMMSE(Linear Minimum Mean Square Error)により失われた高解像度(HR)画素を除く。別の補間アルゴリズムのグループは、ウェーブレット変換又はContourlet変換のような異なる種類の変換を使用してその対応する低解像度(LR)画像からHR画像の微細構造を予測する。
先の方法のそれぞれは、水平及び垂直の両方向において、すなわち固定された規則的なデータグリッドにおいて(すなわち、全てのデータポイントは、矩形のグリッドで発見される)同じ比率でアップサンプリングするのに適している。しかし、補間がデータ刈り込みと共に使用されるとき、捨てられたデータに適合し、そしてそれぞれの画素の変動する周囲に適合して最良の性能を達成するための柔軟性が望まれる。
従来技術のこれらの課題及び問題、並びに他の課題及び問題は、ビデオ画像データの刈り取り方法及び装置に向けられる、本願発明により対処される。
本発明の態様によれば、装置が提供され、本装置は、符号化による圧縮の前に、及び符号化による圧縮に備えて、ある画像に前処理を施すデータ刈り取り手段を含む。データ刈り取り手段は、空間領域において、該画像における少なくとも1つの領域を選択的に除く。
本発明の別の態様によれば、方法が提供され、本方法は、符号化による圧縮の前に、及び符号化による圧縮に備えて、ある画像に前処理を施すことを含む。前処理ステップは、空間領域において、プロセッサを有するデータ刈り取り手段を使用して画像における少なくとも1つの領域を選択的に除くことを含む。
本発明の更に別の態様によれば、装置が提供され、本装置は、復号化による伸張の後に伸張された画像を受け、前に実行された符号化処理の前に少なくとも1つの領域が除去されてことを示す情報に基づいて、伸張された画像における少なくとも1つの領域を、空間領域において選択的に復元することで、伸張された画像を後処理するデータ復元手段を含む。
本発明の更なる態様によれば、方法が提供され、本方法は、復号化による伸張に続いて伸張された画像を受けることを含む。さらに、本方法は、プロセッサを有するデータ復元手段を使用して、前に実行された符号化処理の前に少なくとも1つの領域が除去されたことを示す情報に基づいて、伸張された画像における少なくとも1つの領域を選択的に復元することで、伸張された画像を後処理することを含む。
本発明のこれらの態様、特徴及び利点、並びに他の態様、特徴及び利点は、添付図面と共に読まれることとなる例示的な実施の形態の以下の詳細な説明から明らかとなるであろう。
本発明は、以下の例示的な図面に従って良好に理解されるであろう。
本発明の実施の形態に係る、データ刈り取り及び復元の例示的なシステムを示すブロック図である。 本発明の実施の形態に係る、データ刈り取り及び復元の例示的な方法を示すフローチャートである。 本発明の実施の形態に係る、本発明が適用される例示的なビデオエンコーダを示すブロック図である。 本発明の実施の形態に係る、本発明が適用される、例示的なビデオデコーダを示すブロック図である。 本発明の実施の形態に係る、NEDI-4及びNEDI-8に関する高次のエッジに向けられた補間のモデルパラメータを示す図である。 本発明の実施の形態に係る、NEDI-6に関する高次のエッジに向けられた補間のモデルパラメータを示す図である。 本発明の実施の形態に係る、任意のラインをドロップすることによるデータ刈り取りの例を示す図である。 本発明の実施の形態に係る、1つのフレームにおける列及び行をドロップすることによるデータ刈り取りの例を示す図である。 本発明の実施の形態に係る、全体のグループオブピクチャ(GOP)及び/又はシーンの同じ列及び行をドロップすることによるデータ刈り取りの例を示す図である。 本発明の実施の形態に係る、公知のAkiyoシーケンスの第一フレームにおいてドロップされた列及び行を示すラインを示す図である。 本発明の実施の形態に係る、図7Aの例に対応する刈り取られたフレームを示す図である。 本発明の実施の形態に係る、圧縮に基づいたデータ刈り取りの例示的なシステムを示すブロック図である。 本発明の実施の形態に係る、データ刈り取り段階のための例示的なシステムを示すブロック図である。 本発明の実施の形態に係る、最適なデータ刈り取りのための例示的な方法を示すフローチャートである。 本発明の実施の形態に係る、最適なデータ刈り取りのための例示的な方法を示すフローチャートである。 本発明の実施の形態に係る、最適なデータ復元のための例示的な方法を示すフローチャートである。
本発明は、ビデオ画像のデータ刈り取りの方法及び装置に向けられる。
本実施の形態は、本発明を例示するものである。したがって、当業者であれば、本実施の形態に明示的に記載又は図示されないが、本発明を実施する様々なアレンジメントであって、本発明の精神及び範囲に含まれる様々なアレンジメントを創作することができることを理解されたい。
本実施の形態で引用される全ての例及び条件付き言語は、本発明及び当該技術分野を促進するために本発明者により与えられる概念の理解において読者を支援することが意図され、係る詳細に記載される例及び条件に限定されるものではないことが解釈されるべきである。
さらに、本発明の原理、態様及び実施の形態を示す全ての説明は、本発明の特定の例と同様に、本発明の構造的に等価な概念と機能的に等価な概念の両者を包含することが意図される。さらに、係る等価な概念は、現在知られている等価な概念と同様に、将来において開発される等価な概念、すなわち構造に関わらずに同じ機能を実行する開発されたエレメントの両者を含むことが意図される。
したがって、例えば、本実施の形態で与えられるブロック図は、本発明を実施する例示的な回路の概念図を表すことが当業者により理解されるであろう。同様に、任意のフローチャート、フローダイアグラム、状態遷移図、擬似コード等は、コンピュータ読み取り可能な記録媒体の実質的に表現され、コンピュータ又はプロセッサが明示的に示されているか否かに関わらず、係るコンピュータ又はプロセッサにより実行される様々なプロセスを表すことが理解されるであろう。
図示される様々なエレメントの機能は、専用ハードウェアの使用と同様に、適切なソフトウェアと関連されるソフトウェアを実行可能なハードウェアの使用により提供される場合がある。プロセッサにより提供されたとき、単一の専用プロセッサ、単一の共有プロセッサ、そのうちの幾つかが共有される複数の個々のプロセッサによる機能が提供される。さらに、用語「プロセッサ」又は「コントローラ」の明示的な使用は、ソフトウェアを実行可能なハードウェアを排他的に示すように解釈されるべきではなく、限定されれることなしに、デジタルシグナルプロセッサ(DSP)ハードウェア、ソフトウェアを記憶するリードオンリメモリ(ROM)、ランダムアクセスメモリ(RAM)及び不揮発性メモリを暗黙的に含む場合がある。
コンベンショナル及び/又はカスタムである他のハードウェアが含まれる場合もある。同様に、図示される任意のスイッチは、単に概念的なものである。それらの機能は、プログラムロジックの動作を通して、専用ロジックを通して、プログラム制御及び専用ロジックのやり取りを通して、更には手動的に実行される場合があり、特定の技術は、文脈から更に詳細に理解されるように実装者により選択可能である。
本出願の特許請求の範囲では、特定の機能を実行する手段として表現される任意のエレメントは、たとえばa)その機能を実行する回路素子の組み合わせ、b)その機能を実行するソフトウェアを実行する適切な回路と組み合わされる、ファームウェア、マイクロコード等を含む任意の形式でのソフトウェア、を含むその機能を実行する任意の方法を包含することが意図される。係る特許請求の範囲により定義される本発明は、様々な引用される手段により提供される機能が結合され、請求項が求める方法で互いに纏められるという事実にある。従って、それらの機能を提供する任意の手段は、本実施の形態に示されるものと等価であると見なされる。
本発明の「1実施の形態」又は「実施の形態」への明細書への参照は、その他の変形例と同様に、実施の形態と共に記載される特定の特徴、構造、特徴等が本発明の1実施の形態に含まれることを意味する。従って、明細書を通して様々な位置に現れる任意の他の変形例と同様に、記載「1実施の形態では」又は「実施の形態では」の出現は、必ずしも、同じ実施の形態を示すものではない。
以下の記載「/」、「及び/又は」及び「少なくとも1つの」の使用は、たとえば「A/B」、「A及び/又はB」及び「A及びBの少なくとも1つ」の場合、最初の列挙されたオプションAのみの選択、第二の列挙されたオプションBのみの選択、両方のオプション(A及びB)の選択を包含することが意図される。更なる例として、「A、B及び又はC」及び「A、B及びCの少なくとも1つ」の場合、係る記載は、最初に列挙されたオプションAのみの選択、第二の列挙されたオプションBのみの選択、第三の列挙されたオプションCのみの選択、第一及び第二の列挙されたオプション(A及びB)のみの選択、第一及び第三の列挙されたオプション(A及びC)のみの選択、又は、第二及び第三の列挙されたオプション(B及びC)のみの選択、又は、全ての3つのオプション(A及びB及びC)の選択を包含することが意図される。このことは、多数のアイテムが列挙された場合に、当業者によって容易に明らかであるように、拡張される場合がある。
本実施の形態で使用されたとき、用語「画像」及び「ピクチャ」は、交換可能に使用され、ビデオ系列及び/又は静止画像の一部である任意のビデオピクチャを示す場合がある。先に述べたように、本発明は、ビデオ画像のデータ刈り取り方法及び装置に向けられる。
さらに、1以上の本発明の実施の形態がMPEG-4AVC規格に関して記載される一方で、本発明はこの規格のみに限定されるものではなく、本発明の精神を維持する一方で、他のビデオ符号化規格、勧告、及び、MPEG-4AVC規格の拡張を含めて、その拡張に関して利用される場合がある。
図1を参照して、データ刈り取り及び復元の例示的なシステムは、参照符号化100により示される。本システム100は、データ刈り取り器110、エンコーダ(又は圧縮器)120、デコーダ(又は伸張器)130、及びデータ復元器140を含む。データ刈り取り器110は、符号化による圧縮の前に、あるピクチャから少なくとも1つの領域(たとえば直線、曲線、領域等)を空間領域において除く前処理を行う。次いで、エンコーダ120は、少なくとも1つの領域が除かれたピクチャを符号化する。デコーダ130は、少なくとも1つの領域が除かれた符号化されたピクチャを復号化する。データ復元器140は、空間領域において、少なくとも1つの領域を復元して復号化されたピクチャにする後処理を行う。何れかのデータ刈り取り器110、エンコーダ120、デコーダ130及びデータ復元器140は、たとえばそれら対応する機能を実行するため、1以上のプロセッサ、メモリ等を含む場合がある。たとえば、データ刈り取り器110における1以上のプロセッサは、本実施の形態で記載される前処理を行う一方で、データ復元器140における1以上のプロセッサは、本実施の形態で記載される後処理を実行する場合がある。データ刈り取り器110は、幾つかの実施の形態では、データ刈り取り器とは個別である他のエレメントを含む場合があり、他の実施の形態では、データ刈り取り器と統合される他のエレメントを含む場合がある。たとえば、実施の形態では、データ刈り取り器110(又はデータ刈り取り段階)は、間引き器及び補間器(図11参照)を含む場合がある。別の実施の形態では、データ刈り取り器110(又はデータ刈り取り段階)は、(少なくとも1つの領域の実際の除去を行うサブエレメントでとしての)データ刈り取り器、ストア又は圧縮器、及び補間器(たとえば図10参照)を含む場合がある。図1のエレメントのこれらの変形例及び他の変形例は、本発明の精神を維持しつつ、当業者により容易に創作される。
図2を参照して、データ刈り取り及び復元の例示的な方法は、参照符号200により示される。本方法200は、開始ブロック205を含み、この開始ブロックは、機能ブロック210に制御を移す。機能ブロック210は、あるピクチャを受信し、機能ブロック215に制御を移す。機能ブロック215は、該ピクチャから少なくとも1つの領域(たとえば直線、曲線、領域等)を空間領域において除くためにピクチャの前処理を行い、機能ブロック220に制御を移す。機能ブロック220は、少なくとも1つの領域が除去されたピクチャを符号化し、機能ブロック225に制御を移す。機能ブロック225は、符号化されたピクチャをデコーダ(又はデコーダを有する装置)に供給し、機能ブロック230に制御を移す。機能ブロック230は、少なくとも1つの領域が除去された符号化されたピクチャを復号化し、機能ブロック235に制御を移す。機能ブロック235は、少なくとも1つの領域が除去された復号化されたピクチャを受け、少なくとも1つの領域を復元して復号化されたピクチャにするために後処理を実行し、終了ブロック299に制御を移す。
図3を参照して、本発明が適用される例示的なビデオエンコーダは、参照符号300により示される。
ビデオエンコーダ300は、結合器385の非反転入力と接続される出力を有するフレームオーダリングバッファ310を含む。結合器385の出力は、変換器及び量子化器325の第一の入力と接続される。変換器及び量子化器325の出力は、エントロピーコーダ345の第一の入力、並びに、逆変換器及び逆量子化器350の第一の入力と接続される。エントロピーコーダ345の出力は、結合器390の第一の非反転入力と接続される。結合器390の出力は、出力バッファ335の第一の入力と接続される。
エンコーダコントローラ305の第一の出力は、フレームオーダリングバッファ310の第二の入力、逆変換器及び逆量子化器350の第二の入力、ピクチャタイプ判定モジュール315の入力、マクロブロックタイプ(MB-type)判定モジュール320の入力、イントラ予測モジュール360の第二の入力、デブロッキングフィルタ365の第二の入力、動き補償器370の第一の入力、動き予測器375の第一の入力、及び参照画像バッファ380の第二の入力に接続される。
エンコーダコントローラ305の第二の出力は、SEI(Supplemental Enhancement Information)挿入器330の第一の入力、変換器及び量子化器325の第二の入力、エントロピーコーダ345の第二の入力、出力バッファ335の第二の入力、SPS(Sequence Parameter Set)及びPPS(Picture Parameter Set)挿入器340の入力と接続される。
ピクチャタイプ判定モジュール315の第一の出力は、フレームオーダリングバッファ310の第三の入力と接続される。ピクチャタイプ判定モジュール315の第二の出力は、マクロブロックタイプ判定モジュール320の第二の入力と接続される。
SPS(Sequence Parameter Set)及びPPS(Picture Parameter Set)挿入器340の出力は、結合器390の第三の非反転入力に接続される。
逆量子化器及び逆変換器350の出力は、結合器319の第一の非反転入力に接続される。結合器319の出力は、イントラ予測モジュール360の第一の入力とデブロッキングフィルタ365の第一の入力と接続される。デブロッキングフィルタ365の出力は、参照画像バッファ380の第一の入力と接続される。参照画像バッファ380の出力は、動き予測器375の第二の入力と接続される。動き予測器375の第一の出力は、動き補償器370の第二の入力と接続される。動き予測器375の第二の出力は、エントロピー符号化器345の第三の入力と接続される。
動き補償器370の出力は、スイッチ397の第一の入力に接続される。イントラ予測モジュール360の出力は、スイッチ397の第二の入力と接続される。マクロブロックタイプ判定モジュール320の出力は、スイッチ397の第三の入力と接続される。スイッチ397の第三の入力は、スイッチの「データ」入力が(制御入力、すなわち第三の入力に比較して)動き補償器370又はイントラ予測モジュール360により供給されるか否かを判定する。スイッチ397の出力は、結合器319の第二の非反転入力と結合器385の反転入力に接続される。
フレームオーダリングバッファ310及びエンコーダコントローラ305の入力は、入力ピクチャ301を受けるために、エンコーダ300の入力として利用可能である。さらに、SEI(Supplemental Enhancement Information)挿入器330の入力は、メタデータを受けるため、エンコーダ300の入力として利用可能である。出力バッファ335の出力は、ビットストリームを出力するため、エンコーダ300の出力として利用可能である。
図4を参照して、本発明が適用される例示的なビデオデコーダは、参照符号400により示される。
ビデオデコーダ400は、エントロピーデコーダ445の第一の入力と接続される出力を有する入力バッファ410を含む。エントロピーデコーダ445の第一の出力は、逆変換器及び逆量子化器450の第一の入力と接続される。逆変換器及び逆量子化器450の出力は、結合器425の第二の非反転入力と接続される。結合器425の出力は、デブロッキングフィルタ465の第二の入力及びイントラ予測モジュール460の第一の入力と接続される。デブロッキングフィルタ465の第二の出力は、参照画像バッファ480の第一の入力と接続される。参照画像バッファ480の出力は、動き補償器470の第二の入力と接続される。
エントロピーデコーダ445の第二の出力は、動き補償器470の第三の入力及びデブロッキングフィルタ465の第一の入力と接続される。エントロピーデコーダ445の第三の出力は、デコーダコントローラ405の入力と接続される。デコーダコントローラ405の第一の出力は、エントロピーデコーダ445の第二の入力と接続される。デコーダコントローラ405の第二の出力は、逆変換器及び逆量子化器450の第二の入力と接続される。デコーダコントローラ405の第三の出力は、デブロッキングフィルタ465の第三の入力と接続される。デコーダコントローラ405の第四の出力は、イントラ予測モジュール460の第二の入力、動き補償器470の第一の入力、参照画像バッファ480の第二の入力と接続される。
動き補償器470の出力は、スイッチ497の第一の入力と接続される。イントラ予測モジュール460の出力は、スイッチ497の第二の入力と接続される。スイッチ497の出力は、結合器425の第一の非反転入力と接続される。
入力バッファ410の入力は、入力ビットストリームを受けるため、デコーダ400の入力として利用可能である。デブロッキングフィルタ465の第一の出力は、出力ピクチャを出力するため、デコーダ400の出力として利用可能である。
本発明によれば、圧縮されたビデオビットレートを低減するためにデータ刈り取りを行い、同時に、デコーダ側での復号化及び再構成されたピクチャの非常に高画質を維持する新たなスキームが提案される。実施の形態に関する更なる詳細では、オリジナルの画像/ピクチャは、圧縮の前に小さなサイズに刈り取られ、次いで、復号化の後にそれらの本来のサイズに補間される。この補間は、それらの本来のサイズにビデオ画像/ピクチャを戻すため、データ刈り取りステップの間にどの線、セグメント又は領域が刈り取られたかに関する情報を使用する。刈り取りは、幾つかの可能性のある評価スキームのうちの1つに従って、空間領域において、線、セグメント及び/又は領域をドロップすることで符号化の前に行われ、次いで、空間領域にビットストリームを復号化した後に、これらの線、セグメント及び/又は領域が復元される。実施の形態では、その本来のサイズに復号化されたピクチャを再構成するため、エッジに向けられた補間が利用される。画像/ビデオピクチャにおける残りの画素をフィルタリングするのを回避するので、再構成されたピクチャは、低ビットレートから高画質を達成することができる。
1実施の形態では、データ刈り取りは、行又は列のみがドロップされ、従って1方向におけるアップサンプリングのみがこれらの領域で必要とされるような方式で実行される。係る文脈で記載されるが、本発明の精神を維持しつつ、符号化の前に空間領域においてセクションをドロップする他の手段が使用される場合があることが当業者にとって明らかであろう。したがって、ドロップされるラインは、先の記載に限定されないが、列又は行である場合がある。たとえば、ドロップされるラインは、斜線である場合があり、又は、直線の代わりに及び/又は直線に加えて非線形の曲線である場合がある。さらに、同じ原理を当てはめることができ、刈り取られる必須のユニットは、空間領域の直線又は曲線ではなく、むしろセクション又は領域である点で本発明の範囲に含まれる。従って、直線の文脈で本実施の形態で提供される本発明の記載は、直線のみに本発明の範囲を制限するものではなく、符号化の前にドロップされる(そして結果的に復号化の後に復元される)べき空間領域における直線、曲線、セクション及び/又は領域の選択に限定されるものではない。従って、本実施の形態で提供される本発明の教示が与えられると、本発明のこれらの変形及び他の変形例が創作され、本発明の精神を維持しつつ、当業者により容易に実現可能である。本実施の形態で使用される用語「領域」は、1以上の直線、曲線、セクション及び/又は領域を表す場合があることを理解されたい。
例示する目的で、新たなエッジに向けられた補間(NEDI: New Edge-Directed Interpolation, NEDI-4)を補間のためにどのように適合させるかに焦点が向けられる。図5Aを参照して、NEDI-4及びNEDI-8に関する高次のエッジに向けられた補間のモデルパラメータは、参照符号300により示される。この図に示されるように、5点形の準格子を使用した2つのパスが実行される。第一のパスでは、任意の4つの最も近い低解像度の画素の交点にある高解像度の画素は、適応型の4次の補間器を使用することで、それら最も近い画素から補間される。残りの高解像度の画素は、第一のパスにおける低解像度の画素と補間された画素とを使用して、第二のパスにおいて同じアルゴリズムで補間される。補間器の高解像度のモデルパラメータは、低解像度のモデルパラメータから予測される。
[データ刈り取り]
データ刈り取りは、ピクチャにおけるラインをドロップすることで実現される。特定のケースでは、ラインは直線である。そのケースでは、ラインは、行又は列であるか、(図6に示されるような)方向をもつ任意の直線である。図6を参照して、任意のラインをドロップすることによるデータ刈り取りの例は、参照符号600により示される。データ刈り取り600は、フレーム610、刈り取られたライン620及び刈り取られた曲線630を含む。
図7を参照して、1つのフレームにおける列及び行をドロップすることによるデータ刈り取りの例は、参照符号700により示される。データ刈り取り700は、フレーム710、ドロップされた列720、及びドロップされた行730を含む。
図8を参照して、全体のグループオブピクチャ(GOP)及び/又はシーンについて同じ列及び行をドロップすることによるデータ刈り取りの例は、参照符号800により示される。データ刈り取り800は、最初のフレーム810、中間のフレーム820及び最後のフレーム830、ドロップされた行840、及びドロップされた列850を含む。
図9Aを参照して、公知のAkiyoシーケンスの最初のフレームにおけるドロップされた列及び行を示すラインは、参照符号900により示される。図9Bを参照して、図9Aの例に対応する刈り取られたフレームは、参照符号950により示される。
デコーダは失われた画素を補間する必要があるので、デコーダでドロップされたラインの位置を知ることが必要である。ドロップされたラインの画素の位置を指示することと、このドロップされたラインを把握するオーバヘッドとの間にトレードオフが存在する。1実施の形態では、ラインを示すオーバヘッドを大幅に低減するため、列のみ、行のみがドロップされる。このケースでは、記録するために行/列当たり1ビットが使用され、従って(1フレームにおける列及び行をドロップする図7、1GOP/シーンにおける列及び行をドロップする図8、白線がドロップされた列及び行を示す図9A、及び刈り取られたフレームについて図9Bに見られるように)そのラインがドロップされるか否かが示される。別の実施の形態では、奇数ラインのみがドロップされ、偶数ラインは手付かずにされる。1実施の形態では、1GOP/シーンにおける全てのピクチャは、オーバヘッドを更に低減するために同じドロッピングパターンを有する。どのラインが最初にドロップされるかを判定するため、1実施の形態では、圧縮が関与しないこと、歪みの基準が使用されるものとする。最初に、最終的な目標が設定される。この目標は、歪み、画素をドロップするパーセンテージ、及び/又は複雑度の制約である。勿論、本実施の形態で提供される本発明の教示が与えられると、目標は、上記したものに限定されず、本発明の精神を維持しつつ、本発明に従って他の目標が使用される場合がある。1実施の形態では、1つの直線がドロップされることが想定され、圧縮を考慮することなしにドロップされた直線が補間される。次いで、補間された直線の平均平方誤差(MSE)が原画像における同じ直線に比較される。最小のMSEを有する直線が最初にドロップされるために選択される。別の実施の形態では、そのラインの歪みとビットレートの両者が考慮される。1実施の形態では、ラインのビットレートは、その分散を使用して近似される。
[最適なデータ刈り取りの実施の形態]
図10を参照して、データ刈り取りに基づいた圧縮の例示的なシステムは、参照符号1000により示される。システム1000は、データ刈り取り器1010、データストア又は圧縮器1020、及び補間器1030を含む。個別のエレメントとして示されているが、データ刈り取り器1010、データストア又は圧縮器1020、又は補間器1030の1以上が統合されたエレメントに結合される場合がある。たとえば、1実施の形態では、データ刈り取り器1010は、データストア又は圧縮器1020に含まれる場合がある。データストア又は圧縮器1020は、本発明の目的について、エンコーダであると考えられる。サイズM×NのオリジナルフレームIは、より小さなサイズ(M−Mp)×(N−Np)のフレームPに刈り取られ、この場合、Mp及びNpは、それぞれドロップされた行及び列の数である。データ刈り取りの目的は、記憶又は圧縮されたフレームP’を表すビット数を低減することである。次いで、P’は、本来のフレームサイズに再構成するためにI’に補間される。本実施の形態で考慮される圧縮ステージは、MPEG-4AVC規格のコーデックであり、図3に示されるエンコーダと図4に示されるデコーダである。しかし、先に述べたように、本発明は、MPEG-4AVC規格にのみ限定されるものではなく、従って、本発明の精神を維持しつつ、他のビデオ符号化規格、勧告、及び、その拡張に適用される場合がある。
偶数行及び列のみがドロップされることが考慮され、奇数行及び列は、後の補間について保持される。図11を参照して、データ刈り取り段階の例示的なシステムは、参照符号1100により示される。システム1100は、間引き器1110及び補間器1120を含む。データ刈り取り段階では、それぞれ列のみのドロップ、行のみのドロップ、及び行と列の両者のドロップを示すケースについて1×2、2×1及び2×2の割合で、原フレームIは、間引き器1110により低解像度(LR)フレームIlに間引きされる。次いで、フレームIlは、補間器1120により高解像度(HR)フレームIhに補間される。補間のため、再構成されたフレームは、その原フレームとは異なる。Iにおける対応する行及び列に比較して最小のエラーを有するIhにおける行及び列は、ドロップされるように選択される。平均平方誤差(MSE)は、IhとIとの間の平均平方誤差として定義される。
目標となるMSEmaxが与えられると、全体のMSEをMSEmax未満に保持しつつ、大部分の画素をドロップするためにデータ刈り取りが最適化される。ドロップされる行及び列の位置は、αm及びαnによりそれぞれ示される。αiの値が1である場合、i番目の偶数ライン(行又は列)がドロップされ、さもなければ、保持される。これらのインジケータは、符号化されたビットストリームにおけるサイド情報として記憶される。1つのドロップされた直線の平均平方直線誤差(MSLE)は、その直線のみの画素についてIhとIとの間の平均平方誤差として定義される。より小さいMSLEをもつ直線は、より高いMSLEをもつ直線よりもドロップされるべき高い優先度を有する。最小のMSLEをもつMp行及びNp列がドロップされ、これらの直線の最大のMSLEがMSLEmaxであるとする。全体のMSEは、全てのドロップされた画素の平均されたMSEとなる。MSEの上限は、たとえばドロップされた行数Mp、ドロップされた列数Np、及びMSLEmaxに基づいて達成される。この上限は、最適なデータ刈り取りスキームを発見するために条件として、MSEmax未満である。
図12A及び図12Bを参照して、最適なデータ刈り取りの例示的な方法は、参照符号1200により示される。本方法1200は、開始ブロック1201を含み、この開始ブロックは、機能ブロック1203に制御を移す。機能ブロック1203は、フレーム又はGOPを入力し、機能ブロック1206、機能ブロック1209及び機能ブロック1212に制御を移す。機能ブロック1206は、偶数行を除き、機能ブロック1215に制御を移す。機能1215は、たとえばNEDI-6に基づいて補間を行い、機能ブロック1224に制御を移す。機能ブロック1224は、オリジナルの行と再構成された行との間の誤差を発見し(1)、機能ブロック1233に制御を移す。
機能ブロック1209は、偶数列を除去し、機能ブロック1218に制御を移す。機能ブロック1218は、たとえばNEDI-6に基づいて補間を実行し、機能ブロック1227に制御を移す。機能ブロック1227は、オリジナルの列と再構成された列との間の誤差を発見し(2)、機能ブロック1233に制御を移す。
機能ブロック1212は、偶数行及び列を除去し、機能ブロック1221に制御を移す。機能ブロック1221は、たとえばNEDI-8に基づいて補間を行い、機能ブロック1230に制御を移す。機能ブロック1230は、オリジナルの行/列と再構成された行/列との間の誤差を発見し(3)、機能ブロック1233に制御を移す。
機能ブロック1233は、ドロップされた行の番号(No)M_d=0を設定し、ドロップされた列の番号N_d=0を設定し、最大のドロップされた画素Pel=0を設定し、及び判定ブロック1236に制御を移す。判定ブロック1236は、M_d=0であるか否かを判定する。M_d=0であると判定した場合、機能ブロック1242に制御を移す。さもなければ、判定ブロック1239に制御を移す。
機能ブロック1242は、(1)における最小の誤差、すなわち機能ブロック1224あたり計算された誤差をもつN_dの行をドロップするために選択し、機能ブロック1246に制御を移す。機能ブロック1246は、誤差MSE及びドロップされた画素数Pelを計算し、判定ブロック1252に制御を移す。判定ブロック1252は、MSE<MSE_max及びPel>Pel_maxであるか否かを判定する。MSE<MSE_max及びPel>Pel_maxであると判定した場合、機能ブロック1255に制御を移す。さもなければ、機能ブロック1270に制御を移す。
機能ブロック1255は、Pel_max=Pelを設定し、M_d_opt=M_dを設定し、N_d_opt=N_dを設定し、機能ブロック1258に制御を移す。機能ブロック1258は、N_d<Nであるか否かを判定する。N_d<Nであると判定した場合、機能ブロック1264に制御を移す。さもなければ、機能ブロック1261に制御を移す。
機能ブロック1261は、M_d<Mであるか否かを判定する。M_d<Mであると判定した場合、機能ブロック1267に制御を移す。さもなければ、機能ブロック1270に制御を移す。
判定ブロック1239は、N_d=0であるか否かを判定する。N_d=0であると判定した場合、機能ブロック1245に制御を移す。さもなければ、機能ブロック1249に制御を移す。
機能ブロック1245は、(2)における最小の誤差、すなわち機能ブロック1227で計算された誤差をもつM_dの列をドロップするために選択し、機能ブロック1246に制御を移す。
機能ブロック1249は、(3)における最小の誤差、すなわち機能ブロック1230で計算された誤差をもつM_d列及びN_d行をドロップするために選択し、機能ブロック1046に制御を移す。
機能ブロック1270は、M_d_opt及びN_d_optを出力し、終了ブロック1299に制御を移す。
図13を参照して、最適なデータ復元の例示的な方法は、参照符号1300により示される。本方法1300は、開始ブロック1305を含み、この開始ブロックは、機能ブロック1310に制御を移す。機能ブロック1310は、刈り取られたフレーム及び/又はグループオブピクチャ(GOP)、並びにドロップされたフレームのリストを入力し、機能ブロック1315に制御を移す。機能ブロック1315は、フレームをそれらの本来のサイズに変更し、ループリミットブロック1320に制御を移す。ループリミットブロック1320は、刈り取られたデータについてループし、判定ブロック1325に制御を移す。判定ブロック1325は、偶数行及び列が除かれているか否かを判定する。偶数行及び列が除かれていると判定した場合、機能ブロック1330に制御を移す。さもなければ、判定ブロック1340に制御を移す。
機能ブロック1330は、行及び列をNEDI-8により補間し、ループリミットブロック1335に制御を移す。
ループリミットブロック1335は、ループを終了し、機能ブロック1360に制御を移す。機能ブロック1360は、再構成されたフレーム/GOPを出力し、終了ブロック1399に制御を移す。
判定ブロック1340は、偶数行が除かれているか否かを判定する。偶数行が除かれていると判定した場合、機能ブロック1345に制御を移す。さもなければ、判定ブロック1350に制御を移す。
機能ブロック1345は、その行をNEDI-6で補間し、ループリミットブロック1335に制御を移す。
判定ブロック1350は、偶数列が除かれているか否かを判定する。偶数列が除かれていると判定した場合、機能ブロック1355に制御を移す。さもなければ、ループリミットブロック1335に制御を移す。
機能ブロック1355は、その列をNEDI-6で補間し、ループリミットブロック1335に制御を移す。
[高次のエッジに向けられた補間]
補間により、同じ又は一時的に関連するフレームの周辺の画素からかけている画素を推定/充填することができる方法が意図される。係る方法は、それらの周囲から欠けている画素のホールを充填する、Bi-Cubic方法のような古典的な補間、NEDIのような新たな方法、修復(inpainting)のような他の種類の方法とすることができる。勿論、本発明に係る補間は、先に記載した補間技術に限定されるものではなく、本発明の精神を維持しつつ、他の補間技術が使用される場合もある。
デコーダでの補間について、高次のエッジに向けられた補間を適用することが提案され、従って更に多くの方法に適合させることができる。本発明の方法は、低解像度の画像の分散に関連する従来のアプローチで記載されたものとは異なり、この従来のアプローチは、4つの隣接する画素を使用し、2×2のアップサイジング比についてのみ適用される。本発明は、これを提案されるデータ刈り取りスキームについて使用されるように適合させる。実施の形態では、1次元(行のみ又は列のみ)及び2次元(行と列の両者)のそれぞれにおけるラインをドロップするケースについて使用される、6次及び8次のエッジに向けられた補間が使用される。
[実施の形態:NEDI-6]
列のみをドロップするアルゴリズムが記載される。これは、同じアルゴリズムを列のみをドロップするケース及び行のみをドロップするケースについて適用することができるからである。はじめに、原フレームIにおける奇数列に対応するP’の列は、サイズM×(N/2)の低解像度フレームPl’を形成するために抽出される。Pl’の列は、サイズM×NのHRフレームPh’の奇数列にマッピングされる。Ph’の偶数列は、本実施の形態で説明される6次の補間により奇数列から補間される。
補間される画素は、図5Bに示される重み付けされた6つの隣接する周辺の画素の合計である。図5Bを参照して、NEDI-6に関連する高次のエッジに向けられた補間のモデルパラメータは、参照符号500により示される。これらの重みは、高解像度のフレームのモデルパラメータである。最適なモデルパラメータは、モデルパラメータがローカルウィンドウにおいて一定であるという前提で、補間された画素とオリジナルの画素との間のMSEを最小にすることで得られる。幾何学的な二重性の前提を適用して、モデルパラメータは、異なるスケールについて一定であると考えられ、低解像度画素から推定される。図5Bに示されるように、低解像度フレームのモデルパラメータは、オリジナルの画素と補完された画素とを利用可能であると共に、それらの間の誤差を最小にすることで得られる。次いで、これらの低解像度モデルパラメータは、欠けている高解像度の画素を補間するために高解像度のモデルパラメータとして使用される。最後に、列インジケータは、最終的に再構成されたフレームを形成するため、圧縮された刈り取られたフレーム又は補間されたフレームから画素を選択するために使用される。列のインジケータの値が1である場合、再構成された列は、補間されたフレームから取得される。さもなければ、列のインジケータの値が0である場合、再構成された列は、圧縮された刈り取られたフレームから取得される。
[実施の形態:NEDI-8]
NEDI-6と同様に、原フレームIにおけるダウンサンプリング率2×2の低解像度画素に対応するP’における画素は、サイズ(M/2)×(N/2)のLRフレームPl’を形成するために抽出される。補間は、第1回についてNEDI-4を使用して実行され、第2回についてNEDI-8を使用して実行される。第2ラウンドにおける全ての8つの隣接する画素が利用可能となると共に、4つの方向から余分の情報を得るためにNEDI-8が実現される。この第二ラウンドの利点は、モデルパラメータがその高解像度画素から直接的に予測され、従って、NEDI-4のオーバフィッティング問題が緩和される。NEDI-8は、一貫したものとするため、全ての欠けている高解像度画素に適用される。HRスケールの4次のモデルパラメータh4及び8次のモデルパラメータh8は、図3Aに示される。最適値h8は、NEDI-6について採用されたものに同様のアルゴリズムにより計算される。
以下、本発明の多くの付随する利点/特徴の幾つかに関する説明が与えられ、そのうちの幾つかは、上述された。たとえば、1つの利点/特徴は、符号化による圧縮の前に、又は符号化による圧縮に備えて、あるピクチャを前処理するデータ刈り取り手段を有する装置である。データ刈り取り手段は、空間領域において該ピクチャにおける少なくとも1つの領域を選択的に除く。
別の利点/特徴は、上述されたデータ刈り取り手段を有する装置であり、データ刈り取り手段は、エンコーダに含まれる。
更に別の利点/特徴は、上述されたデータ刈り取り手段を有する装置であり、少なくとも1つの領域が除かれたピクチャを符号化するためにデータ刈り取り手段に結合されるエンコーダを更に有する。
また、別の利点/特徴は、上述されたデータ刈り取り手段を有する装置であり、該ピクチャにおける少なくとも1つの領域の位置を示すサイド情報は、デコーダ又は他の装置に明示的又は暗黙的に送信される。
更に別の利点/特徴は、上述されたデータ刈り取り手段を有する装置であり、少なくとも1つの領域は、直線、非線形の曲線及び領域の少なくとも1つを含む。
さらに、別の利点/特徴は、上述されたデータ刈り取り手段を有する装置であり、偶数ラインのみ又は奇数ラインのみがデータ刈り取り器により除かれる。
さらに、別の利点/特徴は、上述されたデータ刈り取り器を有する装置であり、ピクチャは、グループオブピクチャに含まれ、グループオブピクチャにおける全てのピクチャには、同じ除去のパターンが割り当てられる。
また、別の利点/特徴は、上述されたデータ刈り取り器を有する装置であり、選択的に除去された少なくとも1つの領域は、画像の歪みの基準、レート歪みの基準、ドロップされた画素の基準及び複雑度の基準の少なくとも1つの評価に応じて決定される。
さらに、別の利点/特徴は、上述されたデータ刈り取り器を有する装置であり、1次元における少なくとも1つの領域を除去するために6次の補間が使用され、2次元における少なくとも1つの領域を除去するために8次の補間が使用される。
本発明のこれらの特徴及び利点、並びに他の特徴及び利点は、本実施の形態での教示に基づいて当業者により容易に確かめられる場合がある。本発明の教示は、ハードウェア、ソフトウェア、ファームウェア、特定用途向けプロセッサ、又はそれらの組み合わせといった様々な形式で実現されることを理解されたい。
最も好ましくは、本発明の教示は、ハードウェアとソフトエアの組み合わせとして実現される。さらに、ソフトウェアは、プログラムストレージユニットで実施されるアプリケーションプログラムとして実現される場合がある。アプリケーションプログラムは、任意の適切なアーチテクチャを備えるコンピュータにアップロードされて実行される場合がある。好ましくは、コンピュータは、1以上の中央処理装置(CPU)、ランダムアクセスメモリ(RAM)及び入力/出力(I/O)インタフェースのようなハードウェアを有するコンピュータプラットフォームで実現される。また、コンピュータプラットフォームは、オペレーティングシステム又はマイクロコードを含む場合がある。本実施の形態で記載された様々なプロセス及び機能は、CPUにより実行される場合がある、マイクロプログラムの一部であるか又はアプリケーションプログラムの一部、或いはそれらの組み合わせである場合がある。さらに、様々な周辺装置は、更なるデータストレージユニット及びプリンティングユニットのようなコンピュータプラットフォームに接続される場合がある。
添付図面に示されるシステムコンポーネント及び方法の幾つかは、ソフトウェアで好ましくは実現されるため、システムコンポーネント又はプロセス機能ブロック間の実際の接続は、本発明がプログラムされるやり方に依存して異なる場合がある。本実施の形態における教示が与えられると、当業者であれば、本発明のこれらの実現又はコンフィギュレーション、及び類似の実現又はコンフィギュレーションを創作することができるであろう。
例示的な実施の形態が添付図面を参照して本実施の形態で記載されたが、本発明はそれら正確な実施の形態に限定されるものではなく、様々な変更及び変形が本発明の範囲及び精神から逸脱することなしに当業者により実施されることを理解されたい。全ての係る変形及び変更は、特許請求の範囲で述べた本発明の範囲に含まれることが意図される。

Claims (36)

  1. 符号化による圧縮の前に、前記符号化による圧縮に備えて、あるピクチャを前処理するデータ刈り取り手段を備える装置であって、
    前記データ刈り取り手段は、前記ピクチャにおける少なくとも1つの領域を空間領域において選択的に除去する、
    ことを特徴とする装置。
  2. 前記データ刈り取り手段は、エンコーダに含まれる、
    請求項1記載の装置。
  3. 前記少なくとも1つの領域が除かれた前記ピクチャを符号化するため、前記データ刈り取り手段に結合されるエンコーダを更に備える、
    請求項1記載の装置。
  4. 前記ピクチャにおける前記少なくとも1つの領域の位置を示すサイド情報は、デコーダ又は他の装置に明示的に又は暗黙的に送出される、
    請求項1記載の装置。
  5. 前記少なくとも1つの領域は、直線、非線形の曲線及び領域の少なくとも1つである、
    請求項5記載の装置。
  6. 前記データ刈り取り手段により、偶数番の直線のみ又は奇数番の直線のみが除去される、
    請求項1記載の装置。
  7. 前記ピクチャは、グループオブピクチャに含まれており、前記グループオブピクチャにおける全てのピクチャには、同じ除去のパターンが割り当てられる、
    請求項1記載の装置。
  8. 前記選択的に除去された前記少なくとも1つの領域は、画像の歪みの基準、レート歪みの基準、ドロップされる画素の基準及び複雑度の基準の少なくとも1つの評価に応じて決定される、
    請求項1記載の装置。
  9. 1次元である前記少なくとも1つの領域を除去するために6次の補間が使用され、2次元である前記少なくとも1つの領域を除去するために8次の補間が使用される、
    請求項1記載の装置。
  10. 符号化による圧縮の前に、前記符号化による圧縮に備えて、あるピクチャを前処理するステップを含む方法であって、
    前記前処理するステップは、プロセッサを有するデータ刈り取り手段が、前記ピクチャにおける少なくとも1つの領域を空間領域において選択的に除去するステップを含む、
    ことを特徴とする方法。
  11. 当該方法は、エンコーダより実行される、
    請求項10記載の方法。
  12. 前記少なくとも1つの領域が除かれた前記ピクチャを符号化するステップを更に備える、
    請求項10記載の方法。
  13. 前記ピクチャにおける前記少なくとも1つの領域の位置を示すサイド情報は、デコーダ又は他の装置に明示的に又は暗黙的に送出される、
    請求項10記載の方法。
  14. 前記少なくとも1つの領域は、直線、非線形の曲線及び領域の少なくとも1つである、
    請求項10記載の方法。
  15. 前記前処理ステップにより、偶数番の直線のみ又は奇数番の直線のみが除去される、
    請求項10記載の方法。
  16. 前記ピクチャは、グループオブピクチャに含まれており、前記グループオブピクチャにおける全てのピクチャには、同じ除去のパターンが割り当てられる、
    請求項10記載の方法。
  17. 前記選択的に除去された前記少なくとも1つの領域は、画像の歪みの基準、レート歪みの基準、ドロップされる画素の基準及び複雑度の基準の少なくとも1つの評価に応じて決定される、
    請求項10記載の方法。
  18. 1次元である前記少なくとも1つの領域を除去するために6次の補間が使用され、2次元である前記少なくとも1つの領域を除去するために8次の補間が使用される、
    請求項10記載の方法。
  19. 復号化による伸張に続いて、伸張されたピクチャを受け、以前に行われた符号化処理の前に少なくとも1つの領域が除去されたことを示す情報に基づいて、前記伸張されたピクチャにおける前記少なくとも1つの領域を空間領域において選択的に復元することで、前記伸張されたピクチャを後処理するデータ復元手段を備える、
    ことを特徴とする装置。
  20. 前記データ復元手段は、デコーダに含まれる、
    請求項19記載の装置。
  21. 前記少なくとも1つの領域が除かれた前記ピクチャを復号化するため、前記データ復元手段に結合されるデコーダを更に備える、
    請求項19記載の装置。
  22. 前記データ復元手段は、前記ピクチャにおける前記少なくとも1つの領域の位置を示すサイド情報を受信する、
    請求項19記載の装置。
  23. 前記少なくとも1つの領域は、直線、非線形の曲線及び領域の少なくとも1つである、
    請求項19記載の装置。
  24. 前記データ復元手段により、偶数番の直線のみ又は奇数番の直線のみが復元される、
    請求項19記載の装置。
  25. 前記ピクチャは、グループオブピクチャに含まれており、前記グループオブピクチャにおける全てのピクチャには、同じ除去のパターンが割り当てられる、
    請求項19記載の装置。
  26. 1次元である前記少なくとも1つの領域を復元するために6次の補間が使用され、2次元である前記少なくとも1つの領域を復元するために8次の補間が使用される、
    請求項19記載の装置。
  27. 復号化による伸張に続いて、伸張されたピクチャを受信するステップと、
    以前に行われた符号化処理の前に少なくとも1つの領域が除去されたことを示す情報に基づいて、前記伸張されたピクチャにおける前記少なくとも1つの領域を空間領域において選択的に復元することで、プロセッサを有するデータ復元手段を使用して、前記伸張されたピクチャを後処理するステップと、
    を含むことを特徴とする方法。
  28. 当該方法は、デコーダに含まれる、
    請求項27記載の方法。
  29. 前記受信するステップの前に、前記少なくとも1つの領域が除かれた前記ピクチャを復号化するステップを更に含む、
    請求項27記載の方法。
  30. 前記データ復元手段は、前記ピクチャにおける前記少なくとも1つの領域の位置を示すサイド情報を受信する、
    請求項27記載の方法。
  31. 前記少なくとも1つの領域は、直線、非線形の曲線及び領域の少なくとも1つである、
    請求項27記載の方法。
  32. 前記後処理ステップにより、偶数番の直線のみ又は奇数番の直線のみが復元される、
    請求項27記載の方法。
  33. 前記ピクチャは、グループオブピクチャに含まれており、前記グループオブピクチャにおける全てのピクチャには、同じ除去のパターンが割り当てられる、
    請求項19記載の方法。
  34. 1次元である前記少なくとも1つの領域を復元するために6次の補間が使用され、2次元である前記少なくとも1つの領域を復元するために8次の補間が使用される、
    請求項27記載の方法。
  35. ビデオ符号化用のビデオ信号構造であって、
    符号化による圧縮の前に前処理された符号化されたピクチャを含み、
    ピクチャにおける少なくとも1つの領域を空間領域において選択的に除去するように前記ピクチャが前処理される、
    ことを特徴とするビデオ信号構造。
  36. 符号化による圧縮の前に前処理された符号化されたピクチャを含む、符号化されたビデオ信号データを記憶した記録媒体であって、
    ピクチャにおける少なくとも1つの領域を空間領域において選択的に除去するように前記ピクチャが前処理される、
    ことを特徴とするビデオ信号構造。
JP2011527796A 2008-09-18 2009-09-01 ビデオ画像の刈り取り方法及び装置 Pending JP2012503416A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US9812508P 2008-09-18 2008-09-18
US61/098,125 2008-09-18
PCT/US2009/004950 WO2010033151A1 (en) 2008-09-18 2009-09-01 Methods and apparatus for video imaging pruning

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2013263937A Division JP5907941B2 (ja) 2008-09-18 2013-12-20 ビデオ画像の刈り取り方法及び装置

Publications (2)

Publication Number Publication Date
JP2012503416A true JP2012503416A (ja) 2012-02-02
JP2012503416A5 JP2012503416A5 (ja) 2012-10-18

Family

ID=41582015

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2011527796A Pending JP2012503416A (ja) 2008-09-18 2009-09-01 ビデオ画像の刈り取り方法及び装置
JP2013263937A Active JP5907941B2 (ja) 2008-09-18 2013-12-20 ビデオ画像の刈り取り方法及び装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2013263937A Active JP5907941B2 (ja) 2008-09-18 2013-12-20 ビデオ画像の刈り取り方法及び装置

Country Status (8)

Country Link
US (1) US9571857B2 (ja)
EP (1) EP2335419B1 (ja)
JP (2) JP2012503416A (ja)
KR (3) KR20110059766A (ja)
CN (1) CN102217314B (ja)
BR (1) BRPI0918044A2 (ja)
TW (1) TWI499310B (ja)
WO (1) WO2010033151A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110011361A (ko) * 2009-07-28 2011-02-08 삼성전자주식회사 샘플링을 이용한 영상 데이터 인코딩/디코딩 장치 및 인코딩/디코딩 방법
JP5805665B2 (ja) 2010-01-22 2015-11-04 トムソン ライセンシングThomson Licensing Example−based超解像を用いたビデオ圧縮のためのデータプルーニング
KR101789845B1 (ko) 2010-01-22 2017-11-20 톰슨 라이센싱 샘플링 기반 초 해상도 비디오 인코딩 및 디코딩을 위한 방법 및 장치
BR112013005316A2 (pt) * 2010-09-10 2016-08-16 Thomson Licensing codificação de vídeo empregando triagem de dados com resolução baseada em mistura de blocos
US9544598B2 (en) 2010-09-10 2017-01-10 Thomson Licensing Methods and apparatus for pruning decision optimization in example-based data pruning compression
KR101838320B1 (ko) * 2010-09-10 2018-03-13 톰슨 라이센싱 예시-기반 데이터 프루닝을 이용한 비디오 디코딩
US20130170564A1 (en) 2010-09-10 2013-07-04 Thomson Licensing Encoding of a picture in a video sequence by example-based data pruning using intra-frame patch similarity
US20120275511A1 (en) * 2011-04-29 2012-11-01 Google Inc. System and method for providing content aware video adaptation
US9300980B2 (en) * 2011-11-10 2016-03-29 Luca Rossato Upsampling and downsampling of motion maps and other auxiliary maps in a tiered signal quality hierarchy
US9197888B2 (en) 2012-03-13 2015-11-24 Dolby Laboratories Licensing Corporation Overlapped rate control for video splicing applications
CN103379348B (zh) * 2012-04-20 2016-11-16 乐金电子(中国)研究开发中心有限公司 一种编码深度信息时的视点合成方法、装置及编码器
US20140072048A1 (en) * 2012-09-13 2014-03-13 Samsung Electronics Co., Ltd Method and apparatus for a switchable de-ringing filter for image/video coding
WO2017199149A1 (en) * 2016-05-16 2017-11-23 Numeri Ltd. A new pyramid algorithm for video compression and video analysis
KR102010479B1 (ko) * 2018-01-15 2019-08-13 옵티시스 주식회사 비디오 월 시스템
JP6985609B2 (ja) * 2018-05-21 2021-12-22 日本電信電話株式会社 符号化装置、画像補間システム及び符号化プログラム
WO2020037566A1 (zh) * 2018-08-22 2020-02-27 深圳配天智能技术研究院有限公司 一种图像处理、匹配方法、装置及存储介质
US11432009B2 (en) * 2019-07-02 2022-08-30 Intel Corporation Techniques for encoding and decoding immersive video
US11477429B2 (en) 2019-07-05 2022-10-18 Electronics And Telecommunications Research Institute Method for processing immersive video and method for producing immersive video
EP3968636A1 (en) * 2020-09-11 2022-03-16 Axis AB A method for providing prunable video
EP3968635A1 (en) 2020-09-11 2022-03-16 Axis AB A method for providing prunable video

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07177507A (ja) * 1993-12-17 1995-07-14 Victor Co Of Japan Ltd 画像データ圧縮装置
US20020064226A1 (en) * 2000-09-29 2002-05-30 Sven Bauer Method and device for coding and decoding image sequences
JP2004007834A (ja) * 2003-08-29 2004-01-08 Sanyo Electric Co Ltd 動画像符号化装置及び復号装置

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2537269B2 (ja) 1988-07-28 1996-09-25 株式会社竹中工務店 危険薬品使用工場等用クリ―ンル―ム
JP2856219B2 (ja) 1990-12-28 1999-02-10 ソニー株式会社 画像データの符号化装置及び符号化方法
US5293434A (en) * 1991-04-10 1994-03-08 International Business Machines Corporation Technique for use in a transform coder for imparting robustness to compressed image data through use of global block transformations
US6195465B1 (en) * 1994-09-21 2001-02-27 Ricoh Company, Ltd. Method and apparatus for compression using reversible wavelet transforms and an embedded codestream
US5966465A (en) * 1994-09-21 1999-10-12 Ricoh Corporation Compression/decompression using reversible embedded wavelets
US5867602A (en) * 1994-09-21 1999-02-02 Ricoh Corporation Reversible wavelet transform and embedded codestream manipulation
US6873734B1 (en) * 1994-09-21 2005-03-29 Ricoh Company Ltd Method and apparatus for compression using reversible wavelet transforms and an embedded codestream
US5881176A (en) * 1994-09-21 1999-03-09 Ricoh Corporation Compression and decompression with wavelet style and binary style including quantization by device-dependent parser
US6181825B1 (en) * 1994-12-02 2001-01-30 Comsat Corporation Methods for performing 2-dimensional maximum differences coding and decoding during real-time facsimile image compression and apparatus therefor
JPH08331498A (ja) * 1995-06-01 1996-12-13 Asahi Optical Co Ltd 画像データ再圧縮装置
JP3540447B2 (ja) * 1995-07-20 2004-07-07 三洋電機株式会社 動画像符号化装置及び復号装置
KR100192270B1 (ko) * 1996-02-03 1999-06-15 구자홍 에이치디티브이 비데오 디코더 회로
TW364107B (en) * 1996-03-25 1999-07-11 Trw Inc Method and system for three-dimensional compression of digital video signals
JP3747970B2 (ja) 1996-12-24 2006-02-22 ソニー株式会社 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法
US5928313A (en) * 1997-05-05 1999-07-27 Apple Computer, Inc. Method and apparatus for sample rate conversion
US5995923A (en) * 1997-06-26 1999-11-30 Nortel Networks Corporation Method and apparatus for improving the voice quality of tandemed vocoders
GB2333656B (en) * 1998-01-22 2002-08-14 British Broadcasting Corp Compressed signals
US6195394B1 (en) * 1998-11-30 2001-02-27 North Shore Laboratories, Inc. Processing apparatus for use in reducing visible artifacts in the display of statistically compressed and then decompressed digital motion pictures
US6259741B1 (en) * 1999-02-18 2001-07-10 General Instrument Corporation Method of architecture for converting MPEG-2 4:2:2-profile bitstreams into main-profile bitstreams
JP2001359096A (ja) 1999-06-08 2001-12-26 Matsushita Electric Ind Co Ltd 画像符号化装置
US6625322B1 (en) * 1999-06-08 2003-09-23 Matsushita Electric Industrial Co., Ltd. Image coding apparatus
KR20010094694A (ko) * 2000-04-06 2001-11-01 윤종용 티시엠 복호장치 및 방법
IL158156A0 (en) * 2001-03-30 2004-03-28 Yissum Res Dev Co Discriminative feature selection for data sequences
WO2002091219A1 (en) * 2001-05-07 2002-11-14 Hrl Laboratories, Llc Method and apparatus for jointly optimizing linear signal processing filters with subband filters
MXPA03006715A (es) * 2001-11-29 2003-10-24 Matsushita Electric Ind Co Ltd Metodo para la remocion de la distorsion de la codificacion, metodo codificador de video, metodo descodificador de video y aparato y programa para los mismos.
JP3797209B2 (ja) * 2001-11-30 2006-07-12 ソニー株式会社 画像情報符号化方法及び装置、画像情報復号方法及び装置、並びにプログラム
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
US7133368B2 (en) 2002-02-01 2006-11-07 Microsoft Corporation Peer-to-peer method of quality of service (QoS) probing and analysis and infrastructure employing same
EP1483909B1 (en) * 2002-03-13 2010-04-28 Imax Corporation Systems and methods for digitally re-mastering or otherwise modifying motion pictures or other image sequences data
US7136417B2 (en) * 2002-07-15 2006-11-14 Scientific-Atlanta, Inc. Chroma conversion optimization
US6919892B1 (en) * 2002-08-14 2005-07-19 Avaworks, Incorporated Photo realistic talking head creation system and method
US7379496B2 (en) * 2002-09-04 2008-05-27 Microsoft Corporation Multi-resolution video coding and decoding
JP4762486B2 (ja) 2002-09-04 2011-08-31 マイクロソフト コーポレーション マルチ・リゾルーション・ビデオ符号化および復号化
KR20060135667A (ko) 2003-12-17 2006-12-29 코닌클리케 필립스 일렉트로닉스 엔.브이. 이미지 포맷 변환
US8130825B2 (en) * 2004-05-10 2012-03-06 Nvidia Corporation Processor for video data encoding/decoding
US8340177B2 (en) * 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
US8442108B2 (en) * 2004-07-12 2013-05-14 Microsoft Corporation Adaptive updates in motion-compensated temporal filtering
KR100648308B1 (ko) * 2004-08-12 2006-11-23 삼성전자주식회사 해상도 변환방법 및 장치
US8112399B2 (en) * 2005-11-07 2012-02-07 International Business Machines Corporation Method and apparatus for configurable data aggregation in a data warehouse
US20070112876A1 (en) * 2005-11-07 2007-05-17 Blaisdell Russell C Method and apparatus for pruning data in a data warehouse
US8738565B2 (en) * 2005-11-07 2014-05-27 International Business Machines Corporation Collecting data from data sources
US20070127824A1 (en) * 2005-12-07 2007-06-07 Trw Automotive U.S. Llc Method and apparatus for classifying a vehicle occupant via a non-parametric learning algorithm
GB2435140B (en) * 2006-02-13 2011-04-06 Snell & Wilcox Ltd Sport action coding
EP1837826A1 (en) * 2006-03-20 2007-09-26 Matsushita Electric Industrial Co., Ltd. Image acquisition considering super-resolution post-interpolation
US20070258012A1 (en) 2006-05-04 2007-11-08 Syntax Brillian Corp. Method for scaling and cropping images for television display
US20080043832A1 (en) * 2006-08-16 2008-02-21 Microsoft Corporation Techniques for variable resolution encoding and decoding of digital video
US7903894B2 (en) * 2006-10-05 2011-03-08 Microsoft Corporation Color image coding using inter-color correlation
JP2008123086A (ja) * 2006-11-09 2008-05-29 Matsushita Electric Ind Co Ltd 画像処理装置及び画像処理方法
US20080120676A1 (en) * 2006-11-22 2008-05-22 Horizon Semiconductors Ltd. Integrated circuit, an encoder/decoder architecture, and a method for processing a media stream
US8315466B2 (en) * 2006-12-22 2012-11-20 Qualcomm Incorporated Decoder-side region of interest video processing
KR20080071452A (ko) * 2007-01-30 2008-08-04 삼성전자주식회사 리스트 생성용 gui 제공방법 및 이를 적용한 영상기기
US20090299990A1 (en) * 2008-05-30 2009-12-03 Vidya Setlur Method, apparatus and computer program product for providing correlations between information from heterogenous sources
EP2157799A1 (en) * 2008-08-18 2010-02-24 Panasonic Corporation Interpolation filter with local adaptation based on block edges in the reference frame
US8543884B2 (en) * 2009-06-16 2013-09-24 Qualcomm Incorporated Communications channel parallel interleaver and de-interleaver

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07177507A (ja) * 1993-12-17 1995-07-14 Victor Co Of Japan Ltd 画像データ圧縮装置
US20020064226A1 (en) * 2000-09-29 2002-05-30 Sven Bauer Method and device for coding and decoding image sequences
JP2004007834A (ja) * 2003-08-29 2004-01-08 Sanyo Electric Co Ltd 動画像符号化装置及び復号装置

Also Published As

Publication number Publication date
JP2014060805A (ja) 2014-04-03
US20110170615A1 (en) 2011-07-14
US9571857B2 (en) 2017-02-14
BRPI0918044A2 (pt) 2015-12-01
EP2335419A1 (en) 2011-06-22
EP2335419B1 (en) 2020-11-04
TWI499310B (zh) 2015-09-01
KR20110059766A (ko) 2011-06-03
KR20170102033A (ko) 2017-09-06
TW201031215A (en) 2010-08-16
KR101915425B1 (ko) 2018-11-05
JP5907941B2 (ja) 2016-04-26
KR20160114186A (ko) 2016-10-04
CN102217314B (zh) 2017-07-28
CN102217314A (zh) 2011-10-12
WO2010033151A1 (en) 2010-03-25

Similar Documents

Publication Publication Date Title
JP5907941B2 (ja) ビデオ画像の刈り取り方法及び装置
JP7228639B2 (ja) 省略符号化を用いた映像符号化及び復号化装置及びその方法
KR102525578B1 (ko) 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
JP5330647B2 (ja) 適応参照画像の発生
TWI387348B (zh) 解區塊濾波處理裝置及解區塊濾波處理方法
US20110069752A1 (en) Moving image encoding/decoding method and apparatus with filtering function considering edges
KR102528365B1 (ko) 해상도 향상 기법을 이용한 영상의 부호화 및 복호화
CN114521327A (zh) 视频译码中的残差的量化
KR20200044662A (ko) 영상의 ai 부호화 및 ai 복호화를 위한 장치, 및 방법
KR20230108286A (ko) 전처리를 이용한 비디오 인코딩
JP2013110466A (ja) 動画像符号化装置
JP2015033105A (ja) 動画像符号化装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120831

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120831

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130115

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130412

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130419

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130820