JP2013518463A - サンプリングベースの超解像度ビデオ符号化および復号化方法並びに装置 - Google Patents

サンプリングベースの超解像度ビデオ符号化および復号化方法並びに装置 Download PDF

Info

Publication number
JP2013518463A
JP2013518463A JP2012550012A JP2012550012A JP2013518463A JP 2013518463 A JP2013518463 A JP 2013518463A JP 2012550012 A JP2012550012 A JP 2012550012A JP 2012550012 A JP2012550012 A JP 2012550012A JP 2013518463 A JP2013518463 A JP 2013518463A
Authority
JP
Japan
Prior art keywords
resolution image
resolution
metadata
low
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012550012A
Other languages
English (en)
Other versions
JP2013518463A5 (ja
JP5911809B2 (ja
Inventor
バガヴァティ シタラム
リャック ジョアン
ドン−チン チャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2013518463A publication Critical patent/JP2013518463A/ja
Publication of JP2013518463A5 publication Critical patent/JP2013518463A5/ja
Application granted granted Critical
Publication of JP5911809B2 publication Critical patent/JP5911809B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

サンプリングベースの超解像度ビデオ符号化および復号化の方法並びに装置が提供される。符号化方法は、高解像度画像を受け取り(610)、そこから低解像度画像と、低解像度画像およびメタデータの復号化後の後処理をガイドするメタデータとを生成し(625)、次に、少なくとも1つのエンコーダを使用して低解像度画像およびメタデータを符号化する。対応する復号化方法は、ビットストリームを受け取り、そこからデコーダを使用して低解像度画像およびメタデータを復号化し、次に、低解像度画像およびメタデータを使用して、低解像度画像にそれぞれ対応する高解像度画像を復元する。

Description

本発明の原理は、全体として、ビデオ符号化および復号化に関し、より具体的には、サンプリングベースの超解像度ビデオ符号化および復号化の方法並びに装置に関する。
関連出願の相互参照
本出願は、2010年1月22日出願の米国仮出願第61/297,320号明細書の利益を主張し、その全体を参照により本明細書に組み込む。
超解像度を使用するビデオ圧縮の手段は、第1の従来技術の手段で提案された。最初の従来技術の手段では、入力ビデオの空間的サイズは、符号化の前に特定の予め定められた低解像度(LR)サイズまで低減される。低解像度ビデオがデコーダ側で受け取られた後、低解像度ビデオは、ビットストリームで送信された何らかのサイド情報(メタデータ)とともに、超解像度化方法を使用して元のサイズにアップスケールされる。メタデータは、ブロックのフレームベースでのセグメント化を含み、各ブロックは、移動しているブロックとして、移動していない平面ブロックとして、また移動していないテクスチャ付きブロックとして標識付けされる。移動していない平面ブロックは、空間的補間によってアップスケールされる。移動しているブロックでは、受信機に動きベクトルが送られ、サブピクセル情報を回復するために超解像度化技術が適用される。移動していないテクスチャ付きブロックでは、回転順序で4つの相補的ダウンサンプリンググリッドが適用される、ジッタードダウンサンプリング戦略が使用される。
しかし、上述の第1の従来技術の手段は、不利なことに、移動領域に対してスマートサンプリング戦略を使用しない。より正確には、第1の従来技術の手段は、超解像度を得るため、低解像度フレーム間にサブピクセル動きが存在することに依存する。しかし、サブピクセル動きは必ずしも保証されるとは限らない。
第2の従来技術の手段では、カメラはフレームキャプチャ間のサブピクセルシフトにおいて機械的に移動される。目的は、後の超解像度化により一層適した低解像度ビデオをキャプチャすることである。静止背景については、第2の従来技術の手段の方法は、上述の第1の従来技術の手段におけるジッタードサンプリングの概念と類似している。しかし、固定ジッターは、発明者らが目標とする用途、即ち後の超解像度化に向けたダウンサンプリング高解像度ビデオに起こり得るような、非静止背景の場合に有効な戦略ではない。
従来技術のこれらおよび他の欠点並びに不利な点に対して、サンプリングベースの超解像度ビデオ符号化および復号化の方法並びに装置を対象とする本発明の原理によって対処する。
本発明の原理の1つの態様によれば、装置が提供される。装置は、高解像度画像を受け取り、そこから低解像度画像およびメタデータを生成する、ダウンサンプラおよびメタデータ生成器を含む。メタデータは、低解像度画像およびメタデータの復号化後の後処理をガイドするためのものである。装置は、低解像度画像およびメタデータを符号化する少なくとも1つのエンコーダをさらに含む。
本発明の原理の別の態様によれば、方法が提供される。方法は、高解像度画像を受け取るステップと、そこから低解像度画像およびメタデータを生成するステップとを含む。メタデータは、低解像度画像およびメタデータの復号化後の後処理をガイドするためのものである。方法は、少なくとも1つのエンコーダを使用して低解像度画像およびメタデータを符号化するステップをさらに含む。
本発明の原理のさらに別の態様によれば、装置が提供される。装置は、ビットストリームを受け取り、そこから低解像度画像およびメタデータを復号化するデコーダを含む。装置は、低解像度画像およびメタデータを使用して、低解像度画像にそれぞれ対応する高解像度画像を復元する、超解像度ポストプロセッサをさらに含む。
本発明の原理のさらに別の態様によれば、方法が提供される。方法は、ビットストリームを受け取るステップと、デコーダを使用してそこから低解像度画像およびメタデータを復号化するステップとを含む。方法は、低解像度画像およびメタデータを使用して、低解像度画像にそれぞれ対応する高解像度画像を復元するステップをさらに含む。
本発明の原理のこれらおよび他の態様、特徴、並びに利点は、例示的実施形態の以下の詳細な説明を添付図面と併せ読むことによって明白になるであろう。
本発明の原理は、以下の例示的な図面と併せてより一層理解することができる。
本発明の原理の一実施形態による、サンプリングベースの超解像度化の例示的なシステム/方法を示す高次ブロック図である。 本発明の原理の一実施形態による、本発明の原理が適用されてもよい例示的なビデオエンコーダを示すブロック図である。 本発明の原理の一実施形態による、本発明の原理が適用されてもよい例示的なビデオデコーダを示すブロック図である。 本発明の原理の一実施形態による、サンプリングベースの超解像度化方法の前処理段階に関係するデータおよびステップを示す図である。 本発明の原理の一実施形態による、サンプリングベースの超解像度化方法の前処理段階に関係するデータおよびステップを示す図である。 本発明の原理の一実施形態による、サンプリングベースの超解像度化方法の前処理段階に関係するデータおよびステップを示す図である。 本発明の原理の一実施形態による、サンプリングベースの超解像度化方法の前処理段階に関係するデータおよびステップを示す図である。 本発明の原理の一実施形態による、サンプリングベースの超解像度化方法の後処理段階に関係するデータおよびステップを示す図である。 本発明の原理の一実施形態による、サンプリングベースの超解像度化方法の後処理段階に関係するデータおよびステップを示す図である。 本発明の原理の一実施形態による、サンプリングベースの超解像度化方法の後処理段階に関係するデータおよびステップを示す図である。 本発明の原理の一実施形態による、サンプリングベースの超解像度化方法の後処理段階に関係するデータおよびステップを示す図である。 本発明の原理の一実施形態による、サンプリングベースの超解像度化方法の前処理段階に関係する例示的な方法を示すフロー図である。 本発明の原理の一実施形態による、HR高解像度(HR)フレームから低解像度(LR)へのダウンサンプリングに使用されるサンプリンググリッドの例を示す図である。 本発明の原理の一実施形態による、HR高解像度(HR)フレームから低解像度(LR)へのダウンサンプリングに使用されるサンプリンググリッドの例を示す図である。 本発明の原理の一実施形態による、HR高解像度(HR)フレームから低解像度(LR)へのダウンサンプリングに使用されるサンプリンググリッドの例を示す図である。 本発明の原理の一実施形態による、HR高解像度(HR)フレームから低解像度(LR)へのダウンサンプリングに使用されるサンプリンググリッドの例を示す図である。 本発明の原理の一実施形態による、HR高解像度(HR)フレームから低解像度(LR)へのダウンサンプリングに使用されるサンプリンググリッドの例を示す図である。 本発明の原理の一実施形態による、HR高解像度(HR)フレームから低解像度(LR)へのダウンサンプリングに使用されるサンプリンググリッドの例を示す図である。 本発明の原理の一実施形態による、追加の均一なサンプリンググリッドを示す図である。 本発明の原理の一実施形態による、追加の均一なサンプリンググリッドを示す図である。 本発明の原理の一実施形態による、追加の均一なサンプリンググリッドを示す図である。 本発明の原理の一実施形態による、追加の均一なサンプリンググリッドを示す図である。 本発明の原理の一実施形態による、サンプリンググリッドの選択に関係するステップを示す図である。 本発明の原理の一実施形態による、サンプリンググリッドの選択に関係するステップを示す図である。 本発明の原理の一実施形態による、サンプリンググリッドの選択に関係するステップを示す図である。 本発明の原理の一実施形態による、サンプリンググリッドの選択に関係するステップを示す図である。 本発明の原理の一実施形態による、サンプリングベースの超解像度化方法の後処理段階に関係する例示的な方法を示すフローチャートである。 本発明の原理の一実施形態による、2つのフレーム間の前景オブジェクトの動きを示す図である。 本発明の原理の一実施形態による、2つのフレーム間の前景オブジェクトの動きを示す図である。
本発明の原理は、サンプリングベースの超解像度ビデオ符号化および復号化の方法並びに装置を対象とする。
本発明の記載は本発明の原理を例証する。したがって、当業者であれば、本明細書に明示的に記載または図示されないものの、本発明の原理を具体化し、かつ本発明の趣旨および範囲に含まれる様々な構成を考案できることを認識するであろう。
本明細書に列挙されるすべての実施例および条件付きの用語は、発明者(ら)が当該分野を促進するのに寄与する読者が本発明の原理および概念を理解するのを助ける教育目的であるものとし、かかる具体的に列挙される実施例および条件に限定されないものと解釈すべきである。
さらに、本発明の原理の原理、態様、および実施形態を列挙する本明細書のすべての記述、並びにそれらの具体的な実施例は、それらの構造的等価物および機能的等価物の両方を包含するものとする。それに加えて、かかる等価物は、現在知られている等価物、並びに今後開発される等価物、即ち構造にかかわらず同じ機能を実行する、開発されるあらゆる要素の両方を含むものとする。
したがって、例えば、当業者であれば、本明細書に提示されるブロック図は、本発明の原理を具体化する実例的な回路構成の概念図を表すことを認識するであろう。同様に、あらゆるフローチャート、フロー図、状態遷移図、疑似コードなどは、コンピュータ可読媒体で実質的に表され、コンピュータまたはプロセッサが明示的に示されるか否かにかかわらず、かかるコンピュータまたはプロセッサによって実行されてもよい、様々なプロセスを表すことが認識されるであろう。
図面に示される様々な要素の機能は、専用ハードウェア、並びに適当なソフトウェアと共同してソフトウェアを実行することができるハードウェアを使用することによってもたらされてもよい。プロセッサによってもたらされる場合、機能は、単一の専用プロセッサによって、単一の共用プロセッサによって、または一部が共有されてもよい複数の個々のプロセッサによってもたらされてもよい。さらに、「プロセッサ」または「コントローラ」という用語の明示的な使用は、ソフトウェアを実行することができるハードウェアを排他的に指すものと解釈すべきではなく、非限定的に、デジタル信号プロセッサ(「DSP」)ハードウェア、ソフトウェアを格納する読み出し専用メモリ(「ROM」)、ランダムアクセスメモリ(「RAM」)、および不揮発性記憶装置を暗示的に含んでもよい。
他の従来および/またはカスタムのハードウェアも含まれてもよい。同様に、図面に示されるあらゆるスイッチは単に概念上のものである。それらの機能は、プログラム論理の動作によって、専用論理によって、プログラム制御と専用論理の相互作用によって、またはさらには手動で実施されてもよく、文脈からより具体的に理解されるように、開発者によって特定の技術を選択可能である。
特許請求の範囲において、指定の機能を行う手段として表されるあらゆる要素は、例えば、a)その機能を行う回路要素の組み合わせ、またはb)したがって、ファームウェア、マイクロコードなどを含むあらゆる形のソフトウェアと、そのソフトウェアを実行して機能を行わせる適当な回路構成との組み合わせを含む、その機能を行うあらゆる様式を包含するものとする。かかる特許請求の範囲によって定義されるような本発明の原理は、様々な列挙される手段によってもたらされる機能性が、請求項が要求する形で組み合わされ1つにまとめられるという事実に存在する。したがって、それらの機能性をもたらすことができるあらゆる手段は、本明細書に示されるそれらと等価であるものと見なされる。
本明細書における本発明の原理の「1つの実施形態」または「一実施形態」という言及は、実施形態と併せて記載される特定の機能、構造、および特徴が、本発明の原理の少なくとも1つの実施形態に含まれることを意味する。したがって、「1つの実施形態では」または「一実施形態では」という語句、並びに本明細書全体を通して様々な場所に出てくる他のあらゆる変形が出てくる場合、必ずしもすべてが同じ実施形態を指すものではない。
「/」、「および/または」、および「少なくとも1つ」のいずれかの使用は、例えば、「A/B」、「Aおよび/またはB」、および「AおよびBの少なくとも1つ」という場合、1番目に挙げられた選択肢(A)のみを選択すること、2番目に挙げられた選択肢(B)のみを選択すること、または両方の選択肢(AおよびB)を選択することを包含するものとする。さらなる例として、「A、B、および/またはC」および「A、B、およびCの少なくとも1つ」という場合、かかる語句は、1番目に挙げられた選択肢(A)のみを選択すること、2番目に挙げられた選択肢(B)のみを選択すること、もしくは3番目に挙げられた選択肢(C)のみを選択すること、または1番目および2番目に挙げられた選択肢(AおよびB)のみを選択すること、もしくは1番目および3番目に挙げられた選択肢(AおよびC)のみを選択すること、もしくは2番目および3番目に挙げられた選択肢(BおよびC)のみを選択すること、または3つの選択肢すべて(AおよびBおよびC)を選択することを包含するものとする。これは、当該分野および関連分野の当業者には容易に明白であるように、挙げられる事項の数と同じだけ拡張されてもよい。
また、本明細書で使用するとき、「画像」および「イメージ」という用語は交換可能に使用され、ビデオシーケンスからの静止イメージまたは静止画像を指す。既知のように、画像はフレームまたはフィールドであってもよい。
それに加えて、本明細書で使用するとき、「周囲の同位置ピクセル(co-located pixels)」という用語が、例えば、低解像度画像における「周囲の同位置ピクセル」のピクセル値から高解像度モザイクにおけるピクセル位置でピクセル値を補間することによって、本明細書に記載される高解像度モザイクを作成することに関して使用される場合、高解像度モザイクで現在補間されているターゲットピクセルと同位置にある(即ち、同じ位置を有する)特定のピクセルを取り囲む低解像度画像のピクセルを指す。
上述したように、本発明の原理は、サンプリングベースの超解像度ビデオ符号化および復号化の方法並びに装置を対象とする。本発明の原理は、有利には、ビデオ圧縮効率を改善するものと認識されるべきである。特に、フレーム間の動きを扱うことができるスマートダウンサンプリング戦略が提案される。前処理段階では、高解像度(HR)フレームは低解像度(LR)にダウンサンプリングされ、メタデータは後処理をガイドするために生成される。後処理段階では、復号化された低解像度フレームおよび受け取ったメタデータは、新規な超解像度フレームワーク内で高解像度フレームを復元するのに使用される。低解像度フレームのみが符号化され、送信されるメタデータの量は低度から中程度なので、この手段は圧縮比を向上させるという可能性を有する。
スマートダウンサンプリング戦略は、フレーム間の動きを考慮に入れる。ダウンサンプリング戦略は、持っているピクセル情報を互いに補完する(換言すれば、フレーム間のピクセルの冗長度を低減する)ようにしてLRフレームを作成することによって、超解像度化の結果を改善することに寄与する。ある意味では、戦略はフレーム間のサブピクセル動きを強化することを試みる。
発明者らは、従来のビデオ圧縮方法(主に、例えば、国際標準化機構/国際電気標準会議(ISO/IEC)、動画圧縮標準4(MPEG−4)、パート10、高度ビデオ符号化(AVC)規格/国際電気通信連合、電気通信部門(ITU−T)、H.264推奨基準(以下、「MPEG−4AVC規格」)など、ブロックベースの予測方法)は、圧縮比の飽和点に達し始めていることに注目している。データプルーニング方法は、標準的な圧縮方法によって達成されるよりも圧縮効率を改善することを目指す。かかる方法の主な原理は、符号化前(またはその最中)にデータを除去し、復号化後(またはその最中)に受信機側で除去したデータを元に戻すというものである。データプルーニング方法は、それらの目標を、例えばブロック/領域の除去と修復、ラインの除去と補間などを達成する様々な前処理および後処理技術を開発してきた。
本発明の原理によれば、(送信機側での)インテリジェントダウンサンプリングおよび(受信機側での)超解像度化は、データプルーニングのために開発された技術である。超解像度化は、いくつかの低解像度イメージまたはフレームにわたって情報を一時的に統合することによって、イメージまたはビデオの解像度を向上するプロセスである。このデータプルーニング手段の原理が図1に示される。図1を参照すると、サンプリングベースの超解像度化の例示的なシステム/方法が全体的に参照番号100によって示される。高解像度(HR)フレームが入力され、低解像度(LR)フレームおよびメタデータを得るため、ステップ110で(ダウンサンプラおよびメタデータ生成器151による)ダウンサンプリングおよびメタデータ生成にかけられる。ステップ115で、低解像度フレームおよびメタデータは(エンコーダ152によって)符号化される。ステップ120で、符号化された低解像度フレームおよびメタデータは(デコーダ153によって)復号化される。低解像度フレームおよびメタデータは、ステップ130で、高解像度出力フレームを供給するため、(超解像度化ポストプロセッサ154による)超解像度化後処理にかけられる。したがって、前処理段階(ステップ110)では、高解像度フレームは低解像度にダウンサンプリングされ、メタデータは後処理をガイドするために生成される。特に、フレーム間の動きを扱うことができるスマートダウンサンプリング戦略が提案される。後処理段階(ステップ125)では、復号化された低解像度フレームおよび受け取ったメタデータは、新規な超解像度フレームワーク内で高解像度フレームを復元するのに使用される。低解像度フレームのみが符号化され、送信されるメタデータの量は低度から中程度なので、この手段を使用して向上された圧縮比を得ることができる。発明者らは、ダウンサンプラおよびメタデータ生成器151はまた、本明細書においてプリプロセッサとして考慮され引用されてもよいことに注目している。
以下に記載されるエンコーダおよびデコーダの特定の構成に限定されないが、エンコーダ152およびデコーダ153はそれぞれ、図2および図3に示されるように実装することができる。
図2を参照すると、本発明の原理が適用されてもよい例示的なビデオエンコーダは、全体が参照番号200によって示される。ビデオエンコーダ200は、コンバイナ285の非反転入力を有する信号通信の出力を有するフレーム再配列バッファ(frame ordering buffer)210を含む。コンバイナ285の出力は、変換器および量子化器225の第1の入力と信号通信で接続される。変換器および量子化器225の出力は、エントロピー符号器245の第1の入力および逆変換器および逆量子化器250の第1の入力と信号通信で接続される。エントロピー符号器245の出力は、コンバイナ290の第1の非反転入力と信号通信で接続される。コンバイナ290の出力は、出力バッファ235の第1の入力と信号通信で接続される。
エンコーダコントローラ205の第1の出力は、フレーム再配列バッファ210の第2の入力、逆変換器および逆量子化器250の第2の入力、ピクチャタイプ決定モジュール215の入力、マクロブロックタイプ(MBタイプ)決定モジュール220の第1の入力、イントラ予測モジュール260の第2の入力、デブロッキングフィルタ265の第2の入力、動き補償器(motion compensator)270の第1の入力、動き推定器(motion estimator)275の第1の入力、並びに参照画像バッファ280の第2の入力と信号通信で接続される。
エンコーダコントローラ205の第2の出力は、補助強化情報(SEI)挿入器230の第1の入力、変換器および量子化器225の第2の入力、エントロピー符号器245の第2の入力、出力バッファ235の第2の入力、並びにシーケンスパラメータセット(SPS)およびピクチャパラメータセット(PPS)挿入器240の入力と信号通信で接続される。
SEI挿入器230の出力は、コンバイナ290の第2の非反転入力と信号通信で接続される。
ピクチャタイプ決定モジュール215の第1の出力は、フレーム再配列バッファ210の第3の入力と信号通信で接続される。ピクチャタイプ決定モジュール215の第2の出力は、マクロブロックタイプ決定モジュール220の第2の入力と信号通信で接続される。
シーケンスパラメータセット(SPS)およびピクチャパラメータセット(PPS)挿入器240の出力は、コンバイナ290の第3の非反転入力と信号通信で接続される。
逆量子化器および逆変換器250の出力は、コンバイナ219の第1の非反転入力と信号通信で接続される。コンバイナ219の出力は、イントラ予測モジュール260の第1の入力およびデブロッキングフィルタ265の第1の入力と信号通信で接続される。デブロッキングフィルタ265の出力は、参照画像バッファ280の第1の入力と信号通信で接続される。参照画像バッファ280の出力は、動き推定器275の第2の入力および動き補償器270の第3の入力と信号通信で接続される。動き推定器275の第1の出力は、動き補償器270の第2の入力と信号通信で接続される。動き推定器275の第2の出力は、エントロピー符号器245の第3の入力と信号通信で接続される。
動き補償器270の出力は、スイッチ297の第1の入力と信号通信で接続される。イントラ予測モジュール260の出力は、スイッチ297の第2の入力と信号通信で接続される。マクロブロックタイプ決定モジュール220の出力は、スイッチ297の第3の入力と信号通信で接続される。スイッチ297の第3の入力は、(制御入力、即ち第3の入力と比べて)スイッチの「データ」入力が、動き補償器270またはイントラ予測モジュール260によって供給されるものであるか否かを判定する。スイッチ297の出力は、コンバイナ219の第2の非反転入力およびコンバイナ285の反転入力と信号通信で接続される。
フレーム再配列バッファ210の第1の入力およびエンコーダコントローラ205の入力は、入力画像を受け取るために、エンコーダ200の入力として利用可能である。さらに、補助強化情報(SEI)挿入器230の第2の入力は、メタデータを受け取るために、エンコーダ200の入力として利用可能である。出力バッファ235の出力は、ビットストリームを出力するために、エンコーダ200の出力として利用可能である。
図3を参照すると、本発明の原理が適用されてもよい例示的なビデオデコーダは、全体が参照番号300によって示される。ビデオデコーダ300は、エントロピーデコーダ345の第1の入力と信号通信で接続される出力を有する入力バッファ310を含む。エントロピーデコーダ345の第1の出力は、逆変換器および逆量子化器350の第1の入力と信号通信で接続される。逆変換器および逆量子化器350の出力は、コンバイナ325の第2の非反転入力と信号通信で接続される。コンバイナ325の出力は、デブロッキングフィルタ365の第2の入力およびイントラ予測モジュール360の第1の入力と信号通信で接続される。デブロッキングフィルタ365の第2の出力は、参照画像バッファ380の第1の入力と信号通信で接続される。参照画像バッファ380の出力は、動き補償器370の第2の入力と信号通信で接続される。
エントロピーデコーダ345の第2の出力は、動き補償器370の第3の入力、デブロッキングフィルタ365の第1の入力、およびイントラ予測器360の第3の入力と信号通信で接続される。エントロピーデコーダ345の第3の出力は、デコーダコントローラ305の入力と信号通信で接続される。デコーダコントローラ305の第1の出力は、エントロピーデコーダ345の第2の入力と信号通信で接続される。デコーダコントローラ305の第2の出力は、逆変換器および逆量子化器350の第2の入力と信号通信で接続される。デコーダコントローラ305の第3の出力は、デブロッキングフィルタ365の第3の入力と信号通信で接続される。デコーダコントローラ305の第4の出力は、イントラ予測モジュール360の第2の入力、動き補償器370の第1の入力、および参照画像バッファ380の第2の入力と信号通信で接続される。
動き補償器370の出力は、スイッチ397の第1の入力と信号通信で接続される。イントラ予測モジュール360の出力は、スイッチ397の第2の入力と信号通信で接続される。スイッチ397の出力は、コンバイナ325の第1の非反転入力と信号通信で接続される。
入力バッファ310の入力は、入力ビットストリームを受け取るため、デコーダ300の入力として利用可能である。デブロッキングフィルタ365の第1の出力は、出力画像を出力するため、デコーダ300の出力として利用可能である。
サンプリングベースの超解像度化の原理
サンプリングベースSRの中心思想は、図4A〜図4Dおよび図5A〜図5Dに示される。図4A〜図4Dを参照すると、サンプリングベースの超解像度化方法の前処理段階に関係するデータおよびステップは、全体として参照番号400によって示される。特に、図4Aは、高解像度(HR)フレーム410の入力セットを示す。図4Bは、参照フレームに対する動き変換Θt1の推定420を示す。図4Cは、参照フレーム座標における超解像度充填率に基づくサンプリンググリッドStの推定430を示す(Iは恒等変換(identity transformation)を指すことに留意されたい)。図4Dは、ダウンサンプリングされた低解像度(LR)フレームおよび対応するメタデータ440を示す。
図5A〜図5Dを参照すると、サンプリングベースの超解像度化方法の後処理段階に関係するデータおよびステップは、全体として参照番号500によって示される。特に、図5Aは、低解像度フレームおよびメタデータの復号化セット510を示す。図5Bは、参照フレーム座標における低解像度フレームからの超解像度モザイクの作成520を示す(Iは恒等変換を指すことに留意されたい)。図5Cは、超解像度モザイクからの高解像度フレームの復元530を示す。図5Dは、超解像度化された高解像度フレーム540を示す。
後処理段階に関係する図5Aを参照すると、最初に、一組の復号化LRフレーム
Figure 2013518463
Figure 2013518463
が、いくつかの関連メタデータとともに利用可能である。フレームの1つは参照フレーム(図5Aの
Figure 2013518463
)であることが分かっている。図5Bでは、メタデータ情報を使用して低解像度フレームのピクセルを共通座標系(参照フレームの座標系と一致する)に変換した後に、超解像度モザイクが構築される。その後、図5Cを参照すると、メタデータ情報を使用して、超解像度モザイクの情報(現在のフレーム座標に逆変換されたもの)とそれに対応する低解像度フレームを組み合わせることによって、セットの各高解像度フレームが復元される。上述の後処理ステップを実施するため、メタデータは、各フレームと参照フレームとの間のピクセルの動きを記述する必要があり、ダウンサンプリングプロセスは、(前処理段階において)各低解像度フレームを対応する高解像度フレームから作成するのに使用される。この情報は前処理段階で判定され、メタデータとして送られる。
図4Aを参照すると、入力高解像度ビデオは別々に処理されるフレームのセットに分割される。高解像度フレームのセットH1〜H4(H1は参照フレームと見なされる)について考察することとする。図4Bでは、各フレームと参照フレームとの間の動きが推定される。図4Bでは、HtからH1への動き変換がΘt1によって表される。図4Cでは、対応する低解像度フレームLtを作成するため、(ダウン)サンプリンググリッドS1が各フレームH1に対して選択される。図4Dでは、(ダウンサンプリングした)低解像度フレームLtを、エンコーダを使用して圧縮し、対応するメタデータ(動きおよびサンプリンググリッド情報)とともに受信機に送ることができる。受信機の後処理段階では、復号化低解像度フレームをメタデータ情報とともに使用して、上述したように高解像度フレームが復元される。
以下、前処理および後処理段階に関与するステップについてさらに記載する。
サンプリングベースの超解像度化の前処理段階
前処理段階では、入力高解像度ビデオは、最初に連続フレームのセットに分割される。次に、各セットは別々に処理される。一般的に、各セットのM2フレームを選ぶが、ここで、Mはダウンサンプリングファクタ、即ち高解像度と低解像度のフレーム寸法の比である。この根拠は、高解像度フレームが低解像度フレームのM2倍の数のピクセルを含み、したがって、高解像度フレームと同じサイズの超解像度モザイクを構築するのにM2のLRフレームを得るべきであることである。
ここで、ダウンサンプリングファクタが2(即ち、M=2)である場合を考察し、次に4つの高解像度フレームのセット(Ht;t=1、2、3、4)について考察する。
図6を参照すると、サンプリングベースの超解像度化方法の前処理段階に関係する例示的な方法は、全体が参照番号600によって示される。方法600は、機能ブロック610に制御を渡す開始ブロック605を含む。機能ブロック610は、高解像度ビデオフレームt=1、…、Nを入力し、機能ブロック615に制御を渡す。機能ブロック615は、各フレームと参照フレームとの間で全体の動き推定を行って、その動きパラメータを得て、機能ブロック620に制御を渡す。機能ブロック620は、超解像度品質と関連する基準に基づいて各フレームに対するサンプリンググリッドの選択を行って、サンプリンググリッドインデックスを得て、機能ブロック625に制御を渡す。機能ブロック625は、低解像度フレームを得るために高解像度フレームをダウンサンプリングし、機能ブロック630に制御を渡す。機能ブロック630は、低解像度フレーム、t=1、…、Nをエンコーダに出力し、終了ブロック699に制御を渡す。
前処理段階(例えば、図4および図6に関して示されるような)に関与するステップに関係するさらなる詳細は、次の通りに提供される。
1.動き推定:H1を参照フレームとする。各フレームHtから参照フレームへの動きを推定する(図4B)。HtからH1への動き変換はΘt1によって表される。
2.サンプリンググリッドの選択:各フレームHtに対して、サンプリンググリッドStは、対応するLRフレームLtを作成するため、Htから得られるピクセルを示す。グリッドS1は、各フレームが後処理段階の超解像度化プロセス(図5A〜図5D)に対する補助ピクセル情報を供給するように選ばれる。フレーム間の動きはグリッド選択プロセス中に説明される。
3.ダウンサンプリング:選択されたグリッドStを使用して、低解像度フレームLtがそれぞれ作成される。次に、低解像度フレームはエンコーダを使用して圧縮され、受信機に送られる。フレームと使用されるサンプリンググリッドとの間の動きに関する情報も、メタデータとして送られる。
前述のステップそれぞれについて以下にさらに記載する。
動き推定
例証目的のため、以下、所与のセットの参照フレームに対するセットの各フレームHt間の動きを推定する1つの手法について考察する(図4B)。一般性を失うことなく、参照フレームはH1であることが考えられる。フレーム間で全体の動きのみがあるものと考えることによって、問題を単純化することとする。換言すれば、任意の2つのフレーム間でのピクセルの動きは、いくつかのパラメータを用いて全体の変換によって説明できるものと考える。全体の変換の例としては、並進、回転、アフィンワープ、射影変換などが挙げられる。
フレームHiからフレームHjへの動きを推定するため、最初に、フレーム間の動きを説明するパラメータに関する全体の動きモデルを選ぶ。HiおよびHjからのデータを使用して、モデルのパラメータθijを次に決定する。これ以降、変換をΘijによって、そのパラメータをθijによって表すものとする。次に、変換Θijを使用して、HiをHjに位置合わせする(またはワープさせる)(あるいは逆モデルΘji=Θij -1を使用してその逆を行う)ことができる。
全体の動きは、様々なモデルおよび方法を使用して推定することができる。一般に使用される1つのモデルは、次式のように与えられる射影変換である。
Figure 2013518463
上述の式は、Hiの(x,y)にあるピクセルがそこまで移動した、Hjにおける新しい位置(x’,y’)を与える。したがって、8つのモデルパラメータθij={a1,a2,a3,b1,b2,b3,c1,c2}は、HiからHjへの動きを説明する。パラメータは、通常、2つのフレーム間の1セットの点対応を最初に決定し、次に、ランダムサンプル一致(RANSAC)またはその変形などのロバストな推定フレームワークを使用することによって推定される。フレーム間の点対応は、例えば、スケール不変特徴量変換(SIFT)の特徴を抽出し整合すること、またはオプティカルフローを使用することなど、多くの方法によって決定することができる。
サンプリングベースの超解像度化手順の場合、参照フレーム(H1)に対する各フレームHt間の動きを推定しなければならない。したがって、θ21、θ31、およびθ41(それぞれ、変換Θ21、Θ31、およびΘ41に対応する)という三組のパラメータが推定される。変換は逆転可能であり、逆モデルΘji=Θij -1はHjからHiへの動きを説明する。
サンプリンググリッド選択
各高解像度フレームHtに対して、フレームをダウンサンプリングし低解像度版Ltを作成するため、サンプリンググリッドStを選択しなければならない。サンプリンググリッドは、得られ、対応する低解像度フレームに入れられる、高解像度フレーム中のピクセルを示す。図7A〜図7Fを参照すると、HR高解像度(HR)フレームの低解像度(LR)へのダウンサンプリングに使用されるサンプリンググリッドの例は、全体として参照番号700によって示される。さらに詳細には、図7Aは、高解像度フレーム中のピクセル710を示す。図7Bは、ダウンサンプリングファクタ2を有する4つの均一なサンプリンググリッド720を示す。記号「○」は第1のサンプリンググリッドg1を、記号「+」は第2のサンプリンググリッドg2を、記号「×」は第3のサンプリンググリッドg3を、記号「△」は第4のサンプリンググリッドg4を示す。図7Cは、第1のサンプリンググリッドg1から得られる低解像度フレーム730を示す。図7Dは、第2のグリッドg2から得られる低解像度フレーム740を示す。図7Eは、第3のグリッドg3から得られる低解像度フレーム750を示す。図7Fは、第4のグリッドg4から得られる低解像度フレーム460を示す。
図8A〜図8Dを参照すると、追加の均一なサンプリンググリッドは、全体として参照番号800によって示される。さらに詳細には、図8Aは、水平方向に食い違ったグリッド810を示す。図8Bは、参照番号820によって集合的に示され、個々にそれぞれの記号○、+、×、および△によって表される、サンプリンググリッドg5、g6、g7、およびg8を示す。図8Cは、垂直方向に食い違ったサンプリンググリッド830を示す。図8Dは、参照番号840によって集合的に示され、個々にそれぞれの記号○、+、×、および△によって表される、サンプリンググリッドg9、g10、g11、およびg12を示す。
ここで、均一なサンプリンググリッド、即ち高解像度フレームのすべての部分にわたってカバー範囲の密度が均一なもののみを使用するように制約する。均一なグリッドを使用することには別個の利点がある。第一に、高解像度フレームのピクセルの間に存在する空間的および時間的関係がおおむね保存され、これが、エンコーダ(例えば、図1のエンコーダ115、図2のエンコーダ200)が効率的な圧縮のためにビデオの空間的時間的冗長度を活用する助けとなる。第二に、サンプリングベースの超解像度化システムが機能しなくなった場合、均一にサンプリングされたフレームを空間的に補間して高解像度フレームを作成することができ、それによって経験の最小限の質が確保される。第三に、均一なグリッドを使用してサンプリングされたピクセルを低解像度フレームに入れるのがより簡単である。
サンプリンググリッド選択プロセスは、各高解像度フレームHtに対して、グリッドの候補プールG={gi;i=1、…、NG}から適当なサンプリンググリッドStを選択する問題として提起される。一実施形態では、発明者らは、図7B、図8B、および図8Dに示される12の候補グリッドg1〜g12から選ぶ。食い違ったグリッドg5〜g12は、潜在的には、長方形のグリッドg1〜g4よりも良好な、ピクセルのわずかに回転させたまたは変形させたグリッドをキャプチャすることができることに留意されたい。
グリッドを選択する際に発明者らが採用する基本的な基準は、後処理段階において超解像度化の結果(即ち、超解像度モザイク)の予期される質を最大限にするものである。実際には、これは、各フレームが超解像度化プロセスに補助ピクセル情報を供給するようにして、グリッドStを選ぶことによって達成される。グリッド選択プロセスは、超解像度モザイク生成プロセスの一部を複写することによって進行する。一実施形態では、グリッドを選択するのに使用される基準は超解像度充填率である。
図9を参照すると、サンプリンググリッドの選択に関係するステップは、全体として参照番号900によって示される。特に、図9Aは、サンプリンググリッドが参照フレームに対して選ばれるステップ910を示す。図9Bは、H1と同じサイズの未充填の超解像度フレーム(HSR)が初期化されるステップ920を示す(発明者らはHSRとH1との間に動きがないと仮定するので、Iは恒等変換である)。図9Cは、各候補グリッドに対して充填率が選ばれるステップ930を示す。図9Dは、対応するStを選択するために各フレームHtに対して前述のステップが繰り返されるステップ940を示す。
サンプリンググリッド選択の上述の方法900はまた、以下のようにさらに説明されてもよい(4つのフレームのセットについて仮定し、H1は参照フレームである)。
1.参照フレーム(H1)に対する各フレームHt間の運動変換Θt1を演算する。
2.参照フレームに対するサンプリンググリッドをS1=g1として選ぶ。
3.参照フレームの座標における「未充填」の超解像度フレーム(HSR)を初期化する(即ち、HSRとH1との間に動きがないものと仮定する)。グリッドS1によって与えられるピクセル位置に対応するHSRのピクセルを「充填」する。
4.残りのHRフレームHt(t≠1)それぞれについて、可能な候補グリッドそれぞれの充填率をGで演算する。候補グリッドgtの充填率は、Htに対してgtが選択されたときに充填される、HSRにおける以前の未充填ピクセルの数として定義される。次に、最も高い充填率をもたらすグリッドgt*が選択され(即ち、St=gt*)、Htの対応するピクセルが充填される(動き変換Θt1を考慮に入れる)。
5.セットのすべてのフレームHtが処理されると終了する。そうでなければ、ステップ4に戻る。
ステップ4では、候補グリッドgtの充填率は次のように演算される。最初に、Htに対して順に各グリッドg1∈Gを考慮して、Θt1を使用してgtによって与えられるピクセルをHSRに変換(移動)し(HSRの最も近いピクセル位置に丸み付けする)、HSRのどれだけの数の未充填ピクセル位置が変換したピクセルによって充填されたかを記録することによって、充填率を演算する。その後、最も高い充填率をもたらすグリッドgt*が選択される(即ち、St=gt*)。選択されたグリッドStおよび結果として得られる超解像度品質は、フレームHtが処理される順序に依存してもよいことに留意されたい。1つの再配列戦略は、参照フレームからのそれらの時間的距離の順序を増加させる際にフレームを考慮するというものである。例えば、H2が参照フレームである場合、他のフレームは、H1、H3、およびH4の次の順序で処理される。
超解像度品質に関与する充填率の尺度または完全に異なる単位が、グリッド選択の基準として使用されてもよい。例えば、充填済みまたは未充填のものとしてHSRの各ピクセルを表す代わりに、各ピクセルにマッピングされたグリッドピクセルの数を追跡することができる。その後、より大きくHSRに増分的に寄与するグリッドがより高い指数になる増分的情報の尺度として、充填率を再定義することができる。グリッド選択の別の基準は、超解像度化プロセス(以前に選択されたグリッドS1〜St-1およびStに対する現在の候補グリッドを使用する)を完全に複写し、例えば参照フレームに対するPSNRに基づいて、最も高いSR品質をもたらすグリッドStを選ぶことを伴うことができる。
高解像度から低解像度へのダウンサンプリング
グリッド選択プロセスの後、各高解像度フレームHtは対応するサンプリンググリッドStを有する。Stの性質に応じて、Htは次のように低解像度フレームLtにダウンサンプリングされる。
tが長方形のグリッド(図7B)の場合、即ちSt=gi(i=1、2、3、4)の場合、ピクセルをStから取り、それらを図7C〜図7Fに示されるように水平および垂直に入れることによってLtが形成される。
tが水平方向に食い違ったグリッド(図8B)の場合、即ちSt=gi(i=5、6、7、8)の場合、サンプリングされたピクセルを有する各行を、それらすべての行の最初にサンプリングされたピクセルが垂直に並ぶように左側にシフトする。その後、上述のようにピクセルを入れることによってLtが形成される。
tが垂直方向に食い違ったグリッド(図8D)の場合、即ちSt=gi(i=9、10、11、12)の場合、サンプリングされたピクセルを有する各列を、それらすべての列の最初にサンプリングされたピクセルが水平に並ぶように上方向にシフトする。その後、上述のようにピクセルを入れることによってLtが形成される。
様々な他の構造を有する均一なサンプリンググリッドについては、高解像度フレームからサンプリングされたピクセルを使用して長方形の低解像度フレームを形成するような、適切なパッキング戦略が考案されてもよい。
そのように形成された低解像度フレームは、ビデオエンコーダを使用して圧縮される。推定された動き変換パラメータ(θ21、θ31、θ41)および選択されたサンプリンググリッド(S1、S2、S3、S4)を含むサイド情報は、メタデータとして送信される。ここで、グリッド自体の代わりにサンプリンググリッドインデックスを送れば十分であることに留意されたい(即ち、St=giの場合、iを送る)。その結果、後処理段階でルックアップテーブルからグリッドが分かる。
サンプリングベースのSRの後処理段階
後処理段階では、復号化低解像度フレームおよびメタデータを使用して、対応する高解像度フレームを復元する(超解像度化(SR)として知られるプロセス)。図10を参照すると、サンプリングベースの超解像度化方法の後処理段階に関係する例示的な方法は、全体として参照番号1000によって示される。方法1000は、機能ブロック1010に制御を渡す開始ブロック1005を含む。機能ブロック1010は、デコーダから低解像度ビデオフレームt=1、…、Nを入力し、機能ブロック1015に制御を渡す。機能ブロック1015は、各低解像度フレームから有効ピクセルを超解像度モザイク座標に変換し、機能ブロック1020に制御を渡す。機能ブロック1020は、整数ピクセル位置で値を補間することによって超解像度モザイクを作成し、機能ブロック1025に制御を渡す。機能ブロック1025は、超解像度モザイクを高解像度フレーム座標に逆変換することによって各高解像度フレームを復元し、機能ブロック1030に制御を渡す。機能ブロック1030は、高解像度フレームt=1、…、Nを復元し、終了ブロック1099に制御を渡す。機能ブロック1035は、サンプリンググリッドインデックスを機能ブロック1015で使用するために供給する。機能ブロック1040は、動きパラメータ(メタデータ)を機能ブロック1015および1025で使用するために供給する。
前処理段階における高解像度フレームのセットHt(t=1、2、3、4)に対応する復号化LRフレーム
Figure 2013518463
のセットを有するものと推定する(図4A〜図4D)。メタデータは、動きパラメータおよびサンプリンググリッドインデックスを含む。以下は、復号化低解像度フレームおよびサイド情報を使用した高解像度フレーム
Figure 2013518463
の復元に関与するステップ(図5A〜図5Dを参照)である。
1.低解像度フレームからの超解像度モザイクの作成。このステップでは、復号化低解像度フレームのセットからのピクセルおよびサイド情報を使用して、高解像度「SR」モザイクイメージ
Figure 2013518463
が作成される。これは、HRフレームがそこから復元される参照イメージとして役立つ。さらに詳細には、復元されたHRフレームそれぞれの一部分はSRモザイクからのものであり、残りの部分は対応するLRフレームピクセルから空間的に補間される。
2.高解像度フレームの復元。処理をガイドするためのサイド情報を使用し、超解像度モザイクイメージ
Figure 2013518463
および低解像度フレーム
Figure 2013518463
を使用して、セットの各高解像度フレーム
Figure 2013518463
が復元される。
これらのステップを以下でさらに説明する。
低解像度フレームからの超解像度モザイクの生成
このステップでは、高解像度超高解像度モザイクイメージ
Figure 2013518463
は、復号化低解像度フレームのセット
Figure 2013518463
(t=1、2、3、4)、並びに低解像度フレームLtを作成するのに使用されるグリッドStおよび各フレームからセットの参照フレーム(図5Aのt=1におけるフレーム)への変換Θt1を含む、関連するメタデータを使用して構築される。
Figure 2013518463
は、参照フレームと同じ座標にあるものと、即ち
Figure 2013518463
Figure 2013518463
との間に動きがないものと仮定される。以下は、
Figure 2013518463
を構築するステップである。
1.現時点では、
Figure 2013518463
は、非整数ピクセル位置が存在してもよい、例えば
Figure 2013518463
(1.44,2.35)=128である、連続2Dピクセル空間であるものと考える。
2.変換されたグリッド位置Θt1(St)とそれに対応する復号化低解像度フレーム
Figure 2013518463
におけるピクセル値によって与えられる
Figure 2013518463
のピクセル位置を埋める。これを、セット(t=1、2、3、4)の各復号化低解像度フレームに対して行う。
Figure 2013518463
Figure 2013518463
との間に動きがないので、Θt1=I(恒等変換)であることに留意されたい。
3.最後に、すべての整数ピクセル位置それぞれにおける周囲のピクセル値から、十分な(例えば、閾値を使用して決定されるような)データが利用可能である、それらの整数ピクセル位置でピクセル値を補間することによって、イメージ
Figure 2013518463
が構築される。様々な(不均一な)空間的補間方法がこの操作に利用可能である。これらの方法は、ピクセル位置のセットおよび対応する値を取り、任意の数の他の位置における補間された値を出力する。MATLABのグリッドデータ関数を使用して、この補間を実施することができる。
上述のステップの結果は超解像度モザイクイメージ
Figure 2013518463
である。それに加えて、妥当性マップを演算して、
Figure 2013518463
のどのピクセルが、これらのピクセルのみが高解像度フレームの復元に使用されるように信頼性のある情報を含むかが決定されてもよい。妥当性の尺度は、ピクセルの周りの近隣にあるサンプルに基づいて(例えば、サンプルの数または密度)、モザイクイメージの各ピクセルで演算されてもよい。その後、その妥当性値が十分に高い(例えば、所与の閾値を上回る)場合のみ、モザイクのピクセルが復元プロセスに使用される。
高解像度フレームの復元
次に、各高解像度フレーム
Figure 2013518463
(t=1、2、3、4)が次のように復元される。
1.現時点では、
Figure 2013518463
は、非整数ピクセル位置が存在してもよい連続2Dピクセル空間であるものと考える。グリッドStとそれに対応する
Figure 2013518463
におけるピクセル値によって与えられる
Figure 2013518463
のピクセル位置を埋める。
2.動き変換Θ1tを使用して
Figure 2013518463
におけるピクセル位置を変換する。Θ1tはΘt1の逆変換であることに留意されたい。
Figure 2013518463
の整数ピクセル位置xが変換後の
Figure 2013518463
空間における位置yに位置する場合(即ち、y=Θ1t(x))、yをそれに対応する
Figure 2013518463
における値で埋め、即ち
Figure 2013518463
とする。
3.最後に、すべての整数ピクセル位置それぞれにおける周囲のピクセル値から、フレームのそれらの整数ピクセル位置でピクセル値を補間することによって、高解像度フレーム
Figure 2013518463
が復元される。これは、上述の節(ステップ3)に記載されるような空間的補間方法を使用して扱われる。フレーム境界の外側のピクセルは決定されない。
前景オブジェクトの扱い
これまでは、フレーム間の動きは全体の動きモデルによって完全に説明される、即ちすべてのピクセルがこの動きモデルに忠実であるものと仮定してきた。ここで、前景オブジェクトを扱うための戦略を提示する。前景オブジェクトは、フレーム間の全体の動きを追随しないオブジェクト(または領域)として定義される。換言すれば、これらのオブジェクトは、フレーム間の全体の動きとは異なる動きを有する。図11A〜図11Bを参照すると、2つのフレーム(フレーム1およびフレームt)間の前景オブジェクトの動きは、全体として参照番号1100によって示される。サンプリングベースの超解像度化プロセスでのアーチファクトを回避するため、前景オブジェクトを見つけ、手順の特定のステップ中にこの知見を使用することが重要である。前景は、バイナリマスクFtによって表されてもよく、ここで、Ft=1は前景ピクセルを示し、Ft=0は背景ピクセルを示す。
各フレームに対して、その前景ピクセルを示すバイナリマスクFt(図11Bに示されるような)が得られているものと仮定する。FGtを、Ft=1であるすべてのピクセルのセットとし、
Figure 2013518463
を、Ft=0であるすべてのピクセルのセットとする。次に、この情報は次のように使用されてもよい。
サンプリンググリッド選択プロセスでは、Ltを作成するサンプリングHtに対するサンプリンググリッドを決定すると同時に、前景領域は除外されてもよい。ステップ3およびステップ4では、HtからHSRへのFGtにおけるピクセルのマッピングを回避することができる。したがって、充填率(または他の尺度)は背景ピクセルのみに基づいて演算される。さらに、サンプリンググリッド推定の間、Htにおける十分に平らな領域をFGtの一部と見なすことができる。これは、グリッド選択プロセス中に詳細を備えた領域により高い重要性を与えることによって、超解像度を改善することができる。平らな領域は、空間的変化などの尺度に基づいて決定することができる。
高解像度フレームから低解像度へのダウンサンプリングに先立って、アンチエイリアシングフィルタがフレームの前景領域に適用されてもよい。前景領域は本実施形態では超解像度化されないので、アンチエイリアシング操作は、後処理段階でこれらの領域に対してより良好な空間的補間結果を得る助けとなることがある。
超解像度モザイク作成プロセスについて考える。ステップ2では、
Figure 2013518463
の前景ピクセル(FGt)の
Figure 2013518463
への変換を回避してもよい。
高解像度フレーム復元プロセスのステップ2では、FGtによって定義される内部領域に含まれる、
Figure 2013518463
から
Figure 2013518463
へと変換された任意のピクセルを廃棄することができる。さらに、ステップ1では、
Figure 2013518463
によって定義される内部領域をマッピングする、Stからのピクセルを使用しないことを(任意に)選ぶことができる。
上述の2つの修正例では、
Figure 2013518463
または
Figure 2013518463
の十分に(例えば、閾値を使用して決定されるような)平らな領域を、FGtの一部と見なすことができる。この場合、空間的補間を使用してこれらの領域がアップサンプリングされる。
ここまででは、復元された高解像度フレーム
Figure 2013518463
の前景領域は、対応する復号化低解像度フレーム
Figure 2013518463
のピクセルから空間的に補間されただけである。ここで、他の低解像度フレームからの情報は、これらの領域を超解像度化するのには明示的に活用されない。しかし、前景領域を受信機側で部分的にまたは完全に超解像度化するため、ブロック動きベクトル(フレーム間のサブピクセル動きを活用するため)または高解像度パッチなどの何らかの追加情報をメタデータとして送ることが可能であってもよい。
上述のものに加えて、前景情報を使用する他の基準を使用して結果の質が改善されてもよい。
前景マスク推定
独立して動いている領域を有するフレームからクリーンで信頼性のある前景マスクを抽出するのは困難な課題である。ピクセル値のノイズを伴う全体の動き推定におけるエラーはプロセスを複雑にする。さらに、前景情報をメタデータとして簡潔に表しデコーダに送信するという問題もある。
各高解像度フレームHtの前景マスクFtを抽出する1つの方法を次に記載する。これは、高解像度フレームが利用可能な前処理段階で行われる。以下はプロセスのステップである。
1.フレームH1に対して、マスクF1をゼロで充填する。換言すれば、すべてのピクセルが背景と見なされる。
2.Ftを抽出するため、フレームHtはH1t=Θ1t(H1)と比較され、即ち、H1はHtの座標に変換される。正規化相関単位Nt1(x)は、ピクセルの周りの小さな近隣を考慮して、Htの各ピクセルxとそれに対応するH1tのピクセルとの間で演算される。H1tに対応するピクセルがない(即ち、Θt1(x)がH1の境界の外側にある)場合、Ft(x)は1に設定される。そうでなければ、Nt1(x)>T(Tは選ばれた閾値)の場合、Ft(x)=0である。そうでなければ、Ft(x)=1である。
上述のものの変形例を含む他の方法が代わりに使用されてもよい。
マスクが前処理段階で演算される場合、それらはサイド情報として受信機に送信されなければならない。前景マスクの高解像度版を送信するのは不要なことがある。マスクは、Htから低解像度フレームLtを作成するのに使用されるのと同じ戦略を使用して、低解像度にダウンサンプリングされ、次に後処理段階でアップサンプリングされてもよい。マスクはまた、送信に先立って圧縮されてもよい(例えば、ZIP、MPEG−4 AVC規格、および/または他の任意のデータ圧縮スキームを使用する)。あるいは、マスクの送信は、復号化低解像度フレームおよびメタデータを使用して、受信機側でそれらを演算することによって完全に回避されてもよい。しかし、受信機で信頼性のあるマスクを演算することは困難な課題である。
当業者には明白であるような、本発明の原理の1つまたは複数の実施形態で用いられてもよく、依然として本発明の範囲内にある以下の可能な変形例に注目する。
1.方法は4つのフレームのセットについて記載されるが、セットのフレームの数Nは上限を有さない。実際には、Nは少なくとも4であるべきである。セットのサイズは、ダウンサンプリングファクタとフレーム間の動きの量とに基づいて決定することができる。
2.K>Nフレームを有するシーケンスは、それぞれN個のフレームを有する多数のセットに分割することができる。各セットは、提案される方法を使用して取り扱うことができる。
3.参照フレームは必ずしもセットの第1のフレームである必要はない。参照フレームと非参照フレームとの間の動きの量を最小限に抑えるため、セットの(時間的)中心付近のフレームを使用するのが有利なことがある。
4.フレームのセットを復元しながら、フレームの他のセットからの情報が使用されてもよい。例えば、以前のセットから復元された高解像度参照フレームを使用して、現在のセットの非参照フレームが復元されてもよい。この目的のため、フレームのセット間の動き情報がメタデータとして決定され送信されてもよい。また、現在のセットの外側のフレームからの情報が、超解像度モザイク作成プロセス中に使用されてもよい。
5.ここでの取扱いは、グレイスケール(単一成分)フレームおよび色(多重成分)フレームの両方に有効である。前処理ステップおよび後処理ステップの1つまたは複数(例えば、サンプリンググリッド選択)は、各色成分に対して独立して、またはそれらすべてを一緒に考慮することによって実施されてもよい。例えば、各色成分に対して異なるサンプリンググリッドが決定されてもよい。
6.単一のフレームの異なる領域に対して、複数のサンプリンググリッドが推定されてもよい。例えば、フレームは4つの長方形の四半分に分割されてもよく、サンプリンググリッドは各々に対して選択され得る。この場合、「サンプリンググリッド選択」と題した上述の節のステップ2、3、4は、フレーム単位の代わりに四半分単位で実施される。後に続くプロセス(ダウンサンプリング、後処理)はすべて、フレームの異なる領域に対して異なるサンプリンググリッドを使用するように適宜修正される。
7.単一フレームの異なる領域に対して、異なる全体の動き変換が推定されてもよい。例えば、「動き推定」と題した上述の節では、フレームは4つの長方形の四半分に分割されてもよく、セットの各フレームと参照フレームとの間で異なる変換が推定されてもよい。後に続くプロセスはすべて、フレームの各領域に対して対応する変換を使用する。
8.「動き推定」と題した上述の節では、セットの各フレームから参照フレームへの変換を推定する代わりに、各フレームから次のフレーム(またはその逆)への変換を推定し、それらのうち1つまたは複数を組み合わせて必要な変換を導き出すことが可能である。
9.前景マスク(「前景マスク推定」と題した上述の節における)では、境界ピクセルのバンドは、例えば固定の黒い境界を扱うための前景として見なされてもよい。上述したように、十分に平らな領域を前景と見なすことも可能である。
次に、一部については上述してきた、本発明の多くの付随する利点/特徴のいくつかについて記載する。例えば、1つの利点/特徴は、ダウンサンプラおよびメタデータ生成器と少なくとも1つのエンコーダとを有する装置である。ダウンサンプラおよびメタデータ生成器は、高解像度画像を受け取り、そこから低解像度画像およびメタデータを生成するためのものである。メタデータは、低解像度画像およびメタデータの復号化後の後処理をガイドするためのものである。少なくとも1つのエンコーダ(152)は、低解像度画像およびメタデータを符号化するためのものである。
別の利点/特徴は、上述したようなダウンサンプラおよびメタデータ生成器と少なくとも1つのエンコーダとを有する装置であり、メタデータは、動き変換情報およびサンプリンググリッド情報を含む。
さらに別の利点/特徴は、ダウンサンプラおよびメタデータ生成器と少なくとも1つのエンコーダとを有する装置であり、メタデータは、上述したように動き変換情報およびサンプリンググリッド情報を含み、動き変換情報は、高解像度画像の2つ以上の間の全体の動きに関係する全体の動き変換情報を含む。
さらなる別の利点/特徴は、ダウンサンプラおよびメタデータ生成器と少なくとも1つのエンコーダとを有する装置であり、メタデータは、上述したように動き変換情報およびサンプリンググリッド情報を含み、サンプリンググリッド情報は、ダウンサンプリングによって高解像度画像から低解像度画像を生成するのに使用される複数のダウンサンプリンググリッドのそれぞれ1つを示すサンプリンググリッドインデックスを含む。
さらなる利点/特徴は、上述したようにダウンサンプラおよびメタデータ生成器と少なくとも1つのエンコーダとを有する装置であり、高解像度画像は、少なくとも1つの参照画像および1つまたは複数の非参照画像を含み、ダウンサンプラおよびメタデータ生成器は、参照画像から1つまたは複数の非参照画像それぞれへの動きを推定し、動き情報に基づいて高解像度画像をダウンサンプリングするのに使用するため、複数の候補ダウンサンプリンググリッドから1つまたは複数のダウンサンプリンググリッドを選択し、1つまたは複数のダウンサンプリンググリッドを使用して高解像度画像をダウンサンプリングすることによって、低解像度画像を生成する。
さらに、別の利点/特徴は、ダウンサンプラおよびメタデータ生成器と少なくとも1つのエンコーダとを有する装置であり、高解像度画像は、少なくとも1つの参照画像および1つまたは複数の非参照画像を含み、ダウンサンプラおよびメタデータ生成器は、上述したように、参照画像から1つまたは複数の非参照画像それぞれへの動きを推定し、動き情報に基づいて高解像度画像をダウンサンプリングするのに使用するため、複数の候補ダウンサンプリンググリッドから1つまたは複数のダウンサンプリンググリッドを選択し、1つまたは複数のダウンサンプリンググリッドを使用して高解像度画像をダウンサンプリングすることによって、低解像度画像を生成し、1つまたは複数のダウンサンプリンググリッドを使用してダウンサンプリングされたとき、高解像度画像それぞれが、低解像度画像の復号化後の後処理のための補助ピクセル情報を供給するように、1つまたは複数のダウンサンプリンググリッドが動き情報に基づいて選択される。
さらに、別の利点/特徴は、ダウンサンプラおよびメタデータ生成器と少なくとも1つのエンコーダとを有する装置であり、上述したように、1つまたは複数のダウンサンプリンググリッドを使用してダウンサンプリングされたとき、高解像度画像それぞれが、低解像度画像の復号化後の後処理のための補助ピクセル情報を供給するように、1つまたは複数のダウンサンプリンググリッドが動き情報に基づいて選択され、グリッドは、1つまたは複数のダウンサンプリンググリッドの特定の1つを使用して生成される超解像度画像の以前の未充填ピクセルの数を示す充填率に基づいてさらに選択され、超解像度画像は、低解像度画像およびメタデータの復号化後の後処理によって供給される出力に対応する。
また、別の利点/特徴は、ダウンサンプラおよびメタデータ生成器と少なくとも1つのエンコーダとを有する装置であり、上述したように、1つまたは複数のダウンサンプリンググリッドを使用してダウンサンプリングされたとき、高解像度画像それぞれが、低解像度画像の復号化後の後処理のための補助ピクセル情報を供給するように、1つまたは複数のダウンサンプリンググリッドが動き情報に基づいて選択され、グリッドは、歪み尺度に基づいてさらに選択される。
それに加えて、別の利点/特徴は、ダウンサンプラおよびメタデータ生成器と少なくとも1つのエンコーダとを有する装置であり、高解像度画像は少なくとも1つの参照画像および1つまたは複数の非参照画像を含み、ダウンサンプラおよびメタデータ生成器は、上述したように、参照画像から1つまたは複数の非参照画像それぞれへの動きを推定し、動き情報に基づいて高解像度画像をダウンサンプリングするのに使用するため、複数の候補ダウンサンプリンググリッドから1つまたは複数のダウンサンプリンググリッドを選択し、1つまたは複数のダウンサンプリンググリッドを使用して高解像度画像をダウンサンプリングすることによって、低解像度画像を生成し、複数のダウンサンプリンググリッドの異なるものを使用して、高解像度画像の少なくとも1つの特定のものの異なる部分がダウンサンプリングされる。
さらに、別の利点/特徴は、ダウンサンプラおよびメタデータ生成器と少なくとも1つのエンコーダとを有する装置であり、高解像度画像は少なくとも1つの参照画像および1つまたは複数の非参照画像を含み、ダウンサンプラおよびメタデータ生成器は、上述したように、参照画像から1つまたは複数の非参照画像それぞれへの動きを推定し、動き情報に基づいて高解像度画像をダウンサンプリングするのに使用するため、複数の候補ダウンサンプリンググリッドから1つまたは複数のダウンサンプリンググリッドを選択し、1つまたは複数のダウンサンプリンググリッドを使用して高解像度画像をダウンサンプリングすることによって、低解像度画像を生成し、高解像度画像それぞれに対して個々のバイナリマスクが構築され、バイナリマスクは高解像度画像の前景ピクセルの個々の位置を示す。
本発明の原理のこれらおよび他の特徴並びに利点は、本明細書の教示に基づいて、関連技術の当業者によって容易に確認されてもよい。本発明の原理の教示は、様々な形態のハードウェア、ソフトウェア、ファームウェア、専用プロセッサ、またはそれらの組み合わせで実現されてもよいことを理解されたい。
最も好ましくは、本発明の原理の教示はハードウェアとソフトウェアの組み合わせとして実現される。さらに、ソフトウェアはプログラム記憶装置上で有形的に具体化されるアプリケーションプログラムとして実装されてもよい。アプリケーションプログラムは、任意の適切なアーキテクチャを備える機械にアップロードされ、それによって実行されてもよい。好ましくは、機械は、1つまたは複数の中央処理装置(「CPU」)、ランダムアクセスメモリ(「RAM」)、および入出力(「I/O」)インターフェースなどのハードウェアを有するコンピュータプラットフォーム上で実現される。コンピュータプラットフォームはまた、オペレーティングシステムおよびマイクロ命令コードを含んでもよい。本明細書に記載される様々なプロセスおよび機能は、CPUにより実行されてもよい、マイクロ命令コードの一部もしくはアプリケーションプログラムの一部のどちらかまたはそれらの組み合わせであってよい。それに加えて、他の様々な周辺装置は、追加データ記憶装置および印刷装置などのコンピュータプラットフォームに接続されてもよい。
さらに、添付図面に図示される構成要素のシステム構成部品および方法の一部は、好ましくはソフトウェアに実装されるので、システム構成部品またはプロセス機能ブロック間の実際の接続は、本発明の原理がプログラムされるやり方に応じて異なってもよいことを理解されたい。本明細書の教示を所与として、当業者であれば、本発明の原理のこれらおよび類似の実装または構成を想到することができるであろう。
添付図面を参照して例示的な実施形態を本明細書に記載してきたが、本発明の原理はそれらの正確な実施形態に限定されず、本発明の原理の範囲または趣旨から逸脱することなく、関連分野の当業者によって様々な変更および修正が達成されてもよいことを理解されたい。かかる変更および修正はすべて、添付の特許請求の範囲で説明されるような本発明の原理の範囲内に含まれるものとする。

Claims (41)

  1. 高解像度画像を受け取り、そこから低解像度画像およびメタデータを生成するダウンサンプラおよびメタデータ生成器であって、前記メタデータは、前記低解像度画像および前記メタデータの復号化後の後処理をガイドするためのものである、ダウンサンプラおよびメタデータ生成器(151)と、
    前記低解像度画像および前記メタデータを符号化する少なくとも1つのエンコーダ(152)と
    を備えることを特徴とする装置。
  2. 前記メタデータは動き変換情報およびサンプリンググリッド情報を含むことを特徴とする請求項1に記載の装置。
  3. 前記動き変換情報は、前記高解像度画像の2つ以上の間の全体の動きに関係する全体の動き変換情報を含むことを特徴とする請求項2に記載の装置。
  4. 前記サンプリンググリッド情報は、ダウンサンプリングによって前記高解像度画像から前記低解像度画像を生成するのに使用される、複数のダウンサンプリンググリッドのそれぞれ1つを示すサンプリンググリッドインデックスを含むことを特徴とする請求項2に記載の装置。
  5. 前記高解像度画像は、少なくとも1つの参照画像および1つまたは複数の非参照画像を含み、前記ダウンサンプラおよびメタデータ生成器(151)は、参照画像から前記1つまたは複数の非参照画像それぞれへの動きを推定し、前記動き情報に基づいて前記高解像度画像をダウンサンプリングするのに使用するため、複数の候補ダウンサンプリンググリッドから1つまたは複数のダウンサンプリンググリッドを選択し、前記1つまたは複数のダウンサンプリンググリッドを使用して前記高解像度画像をダウンサンプリングすることによって、前記低解像度画像を生成することを特徴とする請求項1に記載の装置。
  6. 前記1つまたは複数のダウンサンプリンググリッドを使用してダウンサンプリングされたとき、前記高解像度画像それぞれが前記低解像度画像の前記復号化後の後処理のための補助ピクセル情報を供給するように、前記1つまたは複数のダウンサンプリンググリッドが前記動き情報に基づいて選択されることを特徴とする請求項5に記載の装置。
  7. 前記グリッドが、前記1つまたは複数のダウンサンプリンググリッドの特定の1つを使用して生成される超解像度画像における以前の未充填ピクセルの数を示す充填率に基づいてさらに選択され、前記超解像度画像は、前記低解像度画像および前記メタデータの前記復号化後の後処理によって供給される出力に対応することを特徴とする請求項6に記載の装置。
  8. 前記グリッドは歪み尺度に基づいてさらに選択されることを特徴とする請求項6に記載の装置。
  9. 前記複数のダウンサンプリンググリッドの異なるものが、前記高解像度画像の少なくとも1つの特定のものの異なる部分をダウンサンプリングするのに使用されることを特徴とする請求項5に記載の装置。
  10. 前記高解像度画像それぞれに対して個々のバイナリマスクが構築され、前記バイナリマスクは前記高解像度画像の前景ピクセルの個々の位置を示すことを特徴とする請求項5に記載の装置。
  11. 高解像度画像を受け取り(610)、そこから低解像度画像およびメタデータを生成する(625、110)ステップであって、前記メタデータは、前記低解像度画像および前記メタデータの復号化後の後処理をガイドするためのものであるステップと、
    少なくとも1つのエンコーダを使用して前記低解像度画像および前記メタデータを符号化する(115)ステップと
    を含むことを特徴とする方法。
  12. 前記メタデータは動き変換情報およびサンプリンググリッド情報を含む(615、620)ことを特徴とする請求項11に記載の方法。
  13. 前記動き変換情報は、前記高解像度画像の2つ以上の間の全体の動きに関係する全体の動き変換情報を含む(615)ことを特徴とする請求項12に記載の方法。
  14. 前記サンプリンググリッド情報は、ダウンサンプリングによって前記高解像度画像から前記低解像度画像を生成するのに使用される、複数のダウンサンプリンググリッドのそれぞれ1つを示すサンプリンググリッドインデックスを含む(620)ことを特徴とする請求項12に記載の方法。
  15. 前記高解像度画像は、少なくとも1つの参照画像および1つまたは複数の非参照画像を含み、前記ダウンサンプラおよびメタデータ生成器は、参照画像から前記1つまたは複数の非参照画像それぞれへの動きを推定し(615)、前記動き情報に基づいて前記高解像度画像をダウンサンプリングするのに使用するため、複数の候補ダウンサンプリンググリッドから1つまたは複数のダウンサンプリンググリッドを選択し(620)、前記1つまたは複数のダウンサンプリンググリッドを使用して前記高解像度画像をダウンサンプリングする(625)ことによって、前記低解像度画像を生成することを特徴とする請求項11に記載の方法。
  16. 前記1つまたは複数のダウンサンプリンググリッドを使用してダウンサンプリングされたとき、前記高解像度画像それぞれが前記低解像度画像の前記復号化後の後処理のための補助ピクセル情報を供給するように、前記1つまたは複数のダウンサンプリンググリッドが前記動き情報に基づいて選択されることを特徴とする請求項15に記載の方法。
  17. 前記グリッドが、前記1つまたは複数のダウンサンプリンググリッドの特定の1つを使用して生成される超解像度画像における以前の未充填ピクセルの数を示す充填率に基づいてさらに選択され、前記超解像度画像は、前記低解像度画像および前記メタデータの前記復号化後の後処理によって供給される出力に対応することを特徴とする請求項16に記載の方法。
  18. 前記グリッドは歪み尺度に基づいてさらに選択されることを特徴とする請求項16に記載の方法。
  19. 前記複数のダウンサンプリンググリッドの異なるものが、前記高解像度画像の少なくとも1つの特定のものの異なる部分をダウンサンプリングするのに使用されることを特徴とする請求項15に記載の方法。
  20. 前記高解像度画像それぞれに対して個々のバイナリマスクが構築され、前記バイナリマスクが前記高解像度画像の前景ピクセルの個々の位置を示すことを特徴とする請求項15に記載の方法。
  21. ビットストリームを受け取り、そこから低解像度画像およびメタデータを復号化するデコーダ(153)と、
    前記低解像度画像および前記メタデータを使用して、前記低解像度画像にそれぞれ対応する高解像度画像を復元する超解像度化ポストプロセッサ(154)と
    を備えることを特徴とする装置。
  22. 前記メタデータは動き変換情報およびサンプリンググリッド情報を含むことを特徴とする請求項21に記載の装置。
  23. 前記動き変換情報は、前記高解像度画像の2つ以上の間の全体の動きに関係する全体の動き変換情報を含むことを特徴とする請求項22に記載の装置。
  24. 前記サンプリンググリッド情報は、ダウンサンプリングによって前記高解像度画像から前記低解像度画像を生成するのに使用される、複数のダウンサンプリンググリッドのそれぞれ1つを示すサンプリンググリッドインデックスを含むことを特徴とする請求項22に記載の装置。
  25. 前記超解像度化ポストプロセッサ(154)は、前記メタデータおよび前記低解像度画像から高解像度モザイクを作成し、前記低解像度画像、前記メタデータ、および前記高解像度モザイクを使用して前記高解像度画像を復元することを特徴とする請求項21に記載の装置。
  26. 前記高解像度モザイクは、前記低解像度画像における周囲の同位置ピクセルのピクセル値から、前記高解像度モザイクのピクセル位置でピクセル値を補間することによって作成されることを特徴とする請求項25に記載の装置。
  27. 前記超解像度化ポストプロセッサ(154)は、前記高解像度モザイクのピクセルそれぞれの妥当性の尺度を含む妥当性マップを生成することを特徴とする請求項25に記載の装置。
  28. 前記高解像度モザイクの前記ピクセルの所与の1つに対する前記妥当性の尺度が、前記ピクセルの前記所与の1つの周りの近隣にあるサンプルに基づいて演算され、前記ピクセルの前記所与の1つは、前記ピクセルの前記所与の1つに対して演算された前記妥当性の尺度が閾値を上回る場合のみ、前記高解像度画像の復元に使用するのに容認可能なものとして指定されることを特徴とする請求項27に記載の装置。
  29. 前記高解像度画像の所与の1つは、前記低解像度画像の対応する1つにおける周囲の同位置ピクセル、前記高解像度モザイクの周囲の同位置ピクセル、および前記低解像度画像の少なくとも別の1つにおける周囲の同位置ピクセルの少なくとも1つのピクセル値から、前記高解像度画像の前記所与の1つのピクセル位置でピクセル値を補間することによって復元され、前記高解像度モザイクの前記周囲の同位置ピクセルからの前記補間は、前記高解像度画像の前記所与の1つと前記高解像度モザイクとの間のピクセルの動き変換を伴い、前記低解像度画像の前記少なくとも別の1つにおける前記周囲の同位置ピクセルからの前記補間は、前記高解像度画像の前記所与の1つと前記低解像度画像の前記少なくとも別の1つとの間のピクセルの動き変換を伴うことを特徴とする請求項25に記載の装置。
  30. 前記高解像度画像の特定の1つの前景ピクセルが、前記低解像度画像における周囲の同位置ピクセルから補間することによって復元されることを特徴とする請求項21に記載の装置。
  31. ビットストリームを受け取り、そこからデコーダを使用して低解像度画像およびメタデータを復号化する(1010)ステップと、
    前記低解像度画像および前記メタデータを使用して、前記低解像度画像にそれぞれ対応する高解像度画像を復元する(1025)ステップと
    を含むことを特徴とする方法。
  32. 前記メタデータは動き変換情報およびサンプリンググリッド情報を含むことを特徴とする請求項31に記載の方法。
  33. 前記動き変換情報は、前記高解像度画像の2つ以上の間の全体の動きに関係する全体の動き変換情報を含むことを特徴とする請求項32に記載の方法。
  34. 前記サンプリンググリッド情報は、ダウンサンプリングによって前記高解像度画像から前記低解像度画像を生成するのに使用される、複数のダウンサンプリンググリッドのそれぞれ1つを示すサンプリンググリッドインデックスを含むことを特徴とする請求項32に記載の方法。
  35. 前記メタデータおよび前記低解像度画像から高解像度モザイクを作成する(1020)ステップをさらに含み、前記復元するステップが、前記低解像度画像、前記メタデータ、および前記高解像度モザイクを使用して前記高解像度画像を復元することを特徴とする請求項31に記載の方法。
  36. 前記高解像度モザイクは、前記低解像度画像における周囲の同位置ピクセルのピクセル値から、前記高解像度モザイクのピクセル位置でピクセル値を補間する(1020)ことによって作成されることを特徴とする請求項35に記載の方法。
  37. 前記高解像度モザイクのピクセルそれぞれの妥当性の尺度を含む妥当性マップを生成するステップをさらに含むことを特徴とする請求項35に記載の方法。
  38. 前記高解像度モザイクの前記ピクセルの所与の1つに対する前記妥当性の尺度が、前記ピクセルの前記所与の1つの周りの近隣にあるサンプルに基づいて演算され、前記ピクセルの前記所与の1つは、前記ピクセルの前記所与の1つに対して演算された前記妥当性の尺度が閾値を上回る場合のみ、前記高解像度画像の復元に使用するのに容認可能なものとして指定されることを特徴とする請求項37に記載の方法。
  39. 前記高解像度画像の所与の1つは、前記低解像度画像の対応する1つにおける周囲の同位置ピクセル、前記高解像度モザイクの周囲の同位置ピクセル、および前記低解像度画像の少なくとも別の1つにおける周囲の同位置ピクセルの少なくとも1つのピクセル値から、前記高解像度画像の前記所与の1つのピクセル位置でピクセル値を補間することによって復元され、前記高解像度モザイクの前記周囲の同位置ピクセルからの前記補間は、前記高解像度画像の前記所与の1つと前記高解像度モザイクとの間のピクセルの動き変換を伴い、前記低解像度画像の前記少なくとも別の1つにおける前記周囲の同位置ピクセルからの前記補間は、前記高解像度画像の前記所与の1つと前記低解像度画像の前記少なくとも別の1つとの間のピクセルの動き変換を伴うことを特徴とする請求項35に記載の方法。
  40. 前記高解像度画像の特定の1つの前景ピクセルが、前記低解像度画像における周囲の同位置ピクセルから補間することによって復元されることを特徴とする請求項31に記載の装置。
  41. 高解像度画像から生成される符号化された低解像度画像および前記高解像度画像から生成されるメタデータを備え、前記メタデータは、前記低解像度画像および前記メタデータの復号化後の後処理をガイドするためのものであることを特徴とする符号化されたビデオ信号データを有するコンピュータ可読記憶媒体。
JP2012550012A 2010-01-22 2011-01-20 サンプリングベースの超解像度ビデオ符号化および復号化方法並びに装置 Active JP5911809B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US29732010P 2010-01-22 2010-01-22
US61/297,320 2010-01-22
PCT/US2011/000107 WO2011090790A1 (en) 2010-01-22 2011-01-20 Methods and apparatus for sampling -based super resolution vido encoding and decoding

Publications (3)

Publication Number Publication Date
JP2013518463A true JP2013518463A (ja) 2013-05-20
JP2013518463A5 JP2013518463A5 (ja) 2014-03-06
JP5911809B2 JP5911809B2 (ja) 2016-04-27

Family

ID=43755097

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012550012A Active JP5911809B2 (ja) 2010-01-22 2011-01-20 サンプリングベースの超解像度ビデオ符号化および復号化方法並びに装置

Country Status (6)

Country Link
US (1) US9602814B2 (ja)
EP (1) EP2526698A1 (ja)
JP (1) JP5911809B2 (ja)
KR (1) KR101789845B1 (ja)
CN (1) CN102823242B (ja)
WO (1) WO2011090790A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017145752A1 (ja) * 2016-02-24 2017-08-31 株式会社日立産業制御ソリューションズ 画像処理システムおよび画像処理装置
US20200280721A1 (en) * 2011-10-14 2020-09-03 Advanced Micro Devices, Inc. Region-based image compression and decompression
WO2022210661A1 (ja) * 2021-03-30 2022-10-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 画像符号化方法、画像復号方法、画像処理方法、画像符号化装置、及び画像復号装置
US11924408B2 (en) 2021-01-14 2024-03-05 Tencent America LLC Method and apparatus for video coding

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8780976B1 (en) * 2011-04-28 2014-07-15 Google Inc. Method and apparatus for encoding video using granular downsampling of frame resolution
US8681866B1 (en) 2011-04-28 2014-03-25 Google Inc. Method and apparatus for encoding video by downsampling frame resolution
EP2555521A1 (en) * 2011-08-01 2013-02-06 Advanced Digital Broadcast S.A. A method and system for transmitting a high resolution video stream as a low resolution video stream
EP2557789B1 (en) 2011-08-09 2017-09-27 Dolby Laboratories Licensing Corporation Guided image up-sampling in video coding
US9236024B2 (en) 2011-12-06 2016-01-12 Glasses.Com Inc. Systems and methods for obtaining a pupillary distance measurement using a mobile computing device
WO2013105946A1 (en) * 2012-01-11 2013-07-18 Thomson Licensing Motion compensating transformation for video coding
US9483853B2 (en) 2012-05-23 2016-11-01 Glasses.Com Inc. Systems and methods to display rendered images
US9286715B2 (en) 2012-05-23 2016-03-15 Glasses.Com Inc. Systems and methods for adjusting a virtual try-on
US20130314401A1 (en) 2012-05-23 2013-11-28 1-800 Contacts, Inc. Systems and methods for generating a 3-d model of a user for a virtual try-on product
TWI674792B (zh) * 2012-08-06 2019-10-11 美商Vid衡器股份有限公司 在多層視訊編碼中空間層取樣格網資訊
US10034004B2 (en) * 2012-08-24 2018-07-24 I-Cubed Research Center Inc. Receiving apparatus, transmitting apparatus, and image transmitting method
US20140118460A1 (en) * 2012-11-01 2014-05-01 Microsoft Corporation Video Coding
US20140119446A1 (en) * 2012-11-01 2014-05-01 Microsoft Corporation Preserving rounding errors in video coding
US20140119456A1 (en) * 2012-11-01 2014-05-01 Microsoft Corporation Encoding video into lower resolution streams
US9185437B2 (en) * 2012-11-01 2015-11-10 Microsoft Technology Licensing, Llc Video data
US10349069B2 (en) * 2012-12-11 2019-07-09 Sony Interactive Entertainment Inc. Software hardware hybrid video encoder
KR101420638B1 (ko) * 2012-12-14 2014-07-17 에스케이플래닛 주식회사 스트리밍 서비스에서 콘텐츠 제공을 위한 장치 및 이를 위한 방법
KR102121558B1 (ko) * 2013-03-15 2020-06-10 삼성전자주식회사 비디오 이미지의 안정화 방법, 후처리 장치 및 이를 포함하는 비디오 디코더
KR102131326B1 (ko) * 2013-08-22 2020-07-07 삼성전자 주식회사 영상 프레임 움직임 추정 장치, 그것의 움직임 추정 방법
US9774865B2 (en) 2013-12-16 2017-09-26 Samsung Electronics Co., Ltd. Method for real-time implementation of super resolution
US20160330400A1 (en) * 2014-01-03 2016-11-10 Thomson Licensing Method, apparatus, and computer program product for optimising the upscaling to ultrahigh definition resolution when rendering video content
US9602811B2 (en) * 2014-09-10 2017-03-21 Faro Technologies, Inc. Method for optically measuring three-dimensional coordinates and controlling a three-dimensional measuring device
GB2539845B (en) 2015-02-19 2017-07-12 Magic Pony Tech Ltd Offline training of hierarchical algorithms
GB201604672D0 (en) 2016-03-18 2016-05-04 Magic Pony Technology Ltd Generative methods of super resolution
GB201603144D0 (en) 2016-02-23 2016-04-06 Magic Pony Technology Ltd Training end-to-end video processes
WO2016156864A1 (en) 2015-03-31 2016-10-06 Magic Pony Technology Limited Training end-to-end video processes
KR20170023484A (ko) 2015-08-24 2017-03-06 삼성전자주식회사 이미지 처리장치 및 방법
JP6909223B2 (ja) 2016-01-25 2021-07-28 コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ 空間スケーラブル・ビデオ・コーディング
WO2017178808A1 (en) 2016-04-12 2017-10-19 Magic Pony Technology Limited Visual data processing using energy networks
KR102520957B1 (ko) * 2016-04-15 2023-04-12 삼성전자주식회사 인코딩 장치, 디코딩 장치 및 이의 제어 방법
GB201607994D0 (en) 2016-05-06 2016-06-22 Magic Pony Technology Ltd Encoder pre-analyser
US10701394B1 (en) 2016-11-10 2020-06-30 Twitter, Inc. Real-time video super-resolution with spatio-temporal networks and motion compensation
TWI632814B (zh) * 2016-11-11 2018-08-11 財團法人工業技術研究院 視訊畫幀產生方法及其系統
US10721471B2 (en) * 2017-10-26 2020-07-21 Intel Corporation Deep learning based quantization parameter estimation for video encoding
CN108184116A (zh) * 2017-12-18 2018-06-19 西南技术物理研究所 一种适用于无线数据链传输的图像重建方法
EP3777166A1 (en) 2018-04-13 2021-02-17 Koninklijke KPN N.V. Frame-level super-resolution-based video coding
KR102190483B1 (ko) * 2018-04-24 2020-12-11 주식회사 지디에프랩 Ai 기반의 영상 압축 및 복원 시스템
WO2020080765A1 (en) 2018-10-19 2020-04-23 Samsung Electronics Co., Ltd. Apparatuses and methods for performing artificial intelligence encoding and artificial intelligence decoding on image
WO2020080665A1 (en) * 2018-10-19 2020-04-23 Samsung Electronics Co., Ltd. Methods and apparatuses for performing artificial intelligence encoding and artificial intelligence decoding on image
WO2020080873A1 (en) 2018-10-19 2020-04-23 Samsung Electronics Co., Ltd. Method and apparatus for streaming data
US10824917B2 (en) 2018-12-03 2020-11-03 Bank Of America Corporation Transformation of electronic documents by low-resolution intelligent up-sampling
WO2020191475A1 (en) * 2019-03-25 2020-10-01 Teledyne Digital Imaging, Inc. Method for generating a super-resolution image and related device
KR102436512B1 (ko) 2019-10-29 2022-08-25 삼성전자주식회사 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
WO2021096159A1 (ko) * 2019-11-15 2021-05-20 한국과학기술원 라이브 비디오 수집 시스템 및 방법
US11367165B2 (en) * 2020-05-19 2022-06-21 Facebook Technologies, Llc. Neural super-sampling for real-time rendering
AU2020281143B1 (en) * 2020-12-04 2021-03-25 Commonwealth Scientific And Industrial Research Organisation Creating super-resolution images
FR3118380A1 (fr) * 2020-12-22 2022-06-24 Fondation B-Com Procédé de codage d’images d’une séquence vidéo à coder, procédé de décodage, dispositifs et système correspondants.
CN113329228B (zh) * 2021-05-27 2024-04-26 杭州网易智企科技有限公司 视频编码方法、解码方法、装置、电子设备及存储介质
CN114339232B (zh) * 2021-12-16 2024-04-16 杭州当虹科技股份有限公司 自适应分辨率的编码方法及其对应的解码方法
KR102632638B1 (ko) * 2022-01-03 2024-02-01 네이버 주식회사 하드웨어 디코더 환경에서의 초해상도 이미지 생성 방법 및 시스템
CN114092337B (zh) * 2022-01-19 2022-04-22 苏州浪潮智能科技有限公司 一种图像任意尺度的超分辨率放大的方法和装置
CN114650449A (zh) * 2022-03-03 2022-06-21 京东科技信息技术有限公司 一种视频数据处理方法和装置
CN116776228B (zh) * 2023-08-17 2023-10-20 合肥工业大学 一种电网时序数据解耦自监督预训练方法与系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07222145A (ja) * 1994-01-31 1995-08-18 Mitsubishi Electric Corp 画像符号化装置
JPH08336134A (ja) * 1995-04-06 1996-12-17 Sanyo Electric Co Ltd 動画像圧縮符号化方法、動画像圧縮符号化装置、動画像復号方法、動画像復号装置、及び、記録媒体
WO2006025339A1 (ja) * 2004-08-30 2006-03-09 Matsushita Electric Industrial Co., Ltd. 復号化装置、符号化装置、復号化方法、符号化方法

Family Cites Families (123)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US845751A (en) 1906-03-03 1907-03-05 Max Ams Machine Co Method of forming covers for sheet-metal cans.
WO1994006099A1 (en) 1992-09-01 1994-03-17 Apple Computer, Inc. Improved vector quantization
JP3679426B2 (ja) 1993-03-15 2005-08-03 マサチューセッツ・インスティチュート・オブ・テクノロジー 画像データを符号化して夫々がコヒーレントな動きの領域を表わす複数の層とそれら層に付随する動きパラメータとにするシステム
JP3027670B2 (ja) 1993-05-07 2000-04-04 キヤノン株式会社 光起電力素子
KR960706267A (ko) 1993-11-15 1996-11-08 존 엠. 클락 3세 쿼드트리 구조형 월시(walsh) 변환 코딩(quadtree-structured walsh transform conding)
US5446806A (en) 1993-11-15 1995-08-29 National Semiconductor Corporation Quadtree-structured Walsh transform video/image coding
US6798834B1 (en) 1996-08-15 2004-09-28 Mitsubishi Denki Kabushiki Kaisha Image coding apparatus with segment classification and segmentation-type motion prediction circuit
JP3448091B2 (ja) 1994-02-18 2003-09-16 富士通株式会社 符号化復号化装置及び符号化復号化方法
US5537155A (en) 1994-04-29 1996-07-16 Motorola, Inc. Method for estimating motion in a video sequence
KR0169662B1 (ko) 1994-12-28 1999-03-20 배순훈 다수의 부호책을 갖는 피티에스 벡터양자화 부호기
KR100207638B1 (ko) 1995-05-29 1999-07-15 윤종용 가변비트율 비디오 부호화방법
US5764374A (en) 1996-02-05 1998-06-09 Hewlett-Packard Company System and method for lossless image compression having improved sequential determination of golomb parameter
US5862342A (en) 1996-10-31 1999-01-19 Sensormatic Electronics Corporation Intelligent video information management system with information archiving capabilities
EP1450275A3 (en) 1996-10-31 2007-08-08 Sensormatic Electronics Corporation Intelligent video information management system
DE69815251T2 (de) 1997-04-02 2004-04-29 Koninklijke Philips Electronics N.V. Bildbearbeitungssystem und -verfahren
US6043838A (en) 1997-11-07 2000-03-28 General Instrument Corporation View offset estimation for stereoscopic video coding
US6937659B1 (en) 1997-11-14 2005-08-30 Ac Capital Management, Inc. Apparatus and method for compressing video information
US6278446B1 (en) 1998-02-23 2001-08-21 Siemens Corporate Research, Inc. System for interactive organization and browsing of video
CN1128097C (zh) 1998-06-19 2003-11-19 中山医科大学中山眼科中心 将珊瑚转变为羟基磷灰石“人工骨”的制备工艺
US6480538B1 (en) 1998-07-08 2002-11-12 Koninklijke Philips Electronics N.V. Low bandwidth encoding scheme for video transmission
JP2002522836A (ja) 1998-08-05 2002-07-23 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 静止画像生成方法および装置
US6782132B1 (en) 1998-08-12 2004-08-24 Pixonics, Inc. Video coding and reconstruction apparatus and methods
US6487249B2 (en) * 1998-10-09 2002-11-26 Matsushita Electric Industrial Co., Ltd. Efficient down conversion system for 2:1 decimation
US6397166B1 (en) 1998-11-06 2002-05-28 International Business Machines Corporation Method and system for model-based clustering and signal-bearing medium for storing program of same
US6272250B1 (en) 1999-01-20 2001-08-07 University Of Washington Color clustering for scene change detection and object tracking in video sequences
US6301387B1 (en) 1998-12-18 2001-10-09 University Of Washington Template matching using correlative auto-predictive search
US6795578B1 (en) 1999-09-29 2004-09-21 Canon Kabushiki Kaisha Image processing apparatus and method, and storage medium
KR100708091B1 (ko) 2000-06-13 2007-04-16 삼성전자주식회사 양방향 움직임 벡터를 이용한 프레임 레이트 변환 장치 및그 방법
US7623706B1 (en) 2000-09-29 2009-11-24 Hewlett-Packard Development Company, L.P. Reduction of chromatic bleeding artifacts in images containing subsampled chrominance values
KR100406593B1 (ko) 2001-06-08 2003-11-20 제일모직주식회사 난연성 열가소성 수지조성물
US6952700B2 (en) 2001-03-22 2005-10-04 International Business Machines Corporation Feature weighting in κ-means clustering
US6766067B2 (en) 2001-04-20 2004-07-20 Mitsubishi Electric Research Laboratories, Inc. One-pass super-resolution images
US7003039B2 (en) 2001-07-18 2006-02-21 Avideh Zakhor Dictionary generation method for video and image compression
FR2828054B1 (fr) 2001-07-27 2003-11-28 Thomson Licensing Sa Procede et dispositif de codage d'une scene
US20060165386A1 (en) 2002-01-08 2006-07-27 Cernium, Inc. Object selective video recording
US7602848B2 (en) 2002-03-26 2009-10-13 General Instrument Corporation Methods and apparatus for efficient global motion compensation encoding and associated decoding
US7433526B2 (en) 2002-04-30 2008-10-07 Hewlett-Packard Development Company, L.P. Method for compressing images and image sequences through adaptive partitioning
WO2003102868A2 (en) 2002-05-29 2003-12-11 Pixonics, Inc. Classifying image areas of a video signal
US7119837B2 (en) 2002-06-28 2006-10-10 Microsoft Corporation Video processing system and method for automatic enhancement of digital video
US7379496B2 (en) 2002-09-04 2008-05-27 Microsoft Corporation Multi-resolution video coding and decoding
JP4762486B2 (ja) 2002-09-04 2011-08-31 マイクロソフト コーポレーション マルチ・リゾルーション・ビデオ符号化および復号化
AU2002951574A0 (en) 2002-09-20 2002-10-03 Unisearch Limited Method of signalling motion information for efficient scalable video compression
JP3759932B2 (ja) 2003-01-15 2006-03-29 ティーオーエー株式会社 画像圧縮方法及び伸張方法
DE10310023A1 (de) 2003-02-28 2004-09-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Anordnung zur Videocodierung, wobei die Videocodierung Texturanalyse und Textursynthese umfasst, sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium
US7218796B2 (en) 2003-04-30 2007-05-15 Microsoft Corporation Patch-based video super-resolution
KR100504594B1 (ko) 2003-06-27 2005-08-30 주식회사 성진씨앤씨 데이터 압축 처리된 저해상도 영상으로부터 초해상도 영상복원 및 재구성 방법
US7383180B2 (en) 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques
WO2005043882A2 (en) 2003-10-21 2005-05-12 Prismvideo, Inc Video source coding with side information
US7720148B2 (en) 2004-03-26 2010-05-18 The Hong Kong University Of Science And Technology Efficient multi-frame motion estimation for video compression
TWI246338B (en) 2004-04-09 2005-12-21 Asustek Comp Inc A hybrid model sprite generator and a method to form a sprite
US7447337B2 (en) 2004-10-25 2008-11-04 Hewlett-Packard Development Company, L.P. Video content understanding through real time video motion analysis
JP2006174415A (ja) 2004-11-19 2006-06-29 Ntt Docomo Inc 画像復号装置、画像復号プログラム、画像復号方法、画像符号化装置、画像符号化プログラム及び画像符号化方法
CN101437162A (zh) * 2004-11-19 2009-05-20 株式会社Ntt都科摩 图像解码装置及其方法、图像编码装置及其方法
US7327904B2 (en) 2004-12-15 2008-02-05 Arcsoft, Inc. Pattern classification and filter design for increasing image resolution
US7671894B2 (en) 2004-12-17 2010-03-02 Mitsubishi Electric Research Laboratories, Inc. Method and system for processing multiview videos for view synthesis using skip and direct modes
JP2006203744A (ja) 2005-01-24 2006-08-03 Victor Co Of Japan Ltd 静止画生成装置及び静止画生成方法
US8391368B2 (en) 2005-04-08 2013-03-05 Sri International Macro-block based mixed resolution video compression system
KR100716998B1 (ko) 2005-05-24 2007-05-10 삼성전자주식회사 블록화 현상을 감소시키기 위한 부호화 및 복호화 장치 및그 방법과, 이를 구현하기 위한 프로그램이 기록된 기록매체
JP2007043651A (ja) 2005-07-05 2007-02-15 Ntt Docomo Inc 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
US7715658B2 (en) 2005-08-03 2010-05-11 Samsung Electronics Co., Ltd. Apparatus and method for super-resolution enhancement processing
US20090274377A1 (en) 2005-11-11 2009-11-05 Japan Advanced Institute Of Science And Technology Clustering System and Image Processing System Having the Same
US8249871B2 (en) 2005-11-18 2012-08-21 Microsoft Corporation Word clustering for input data
CN100413316C (zh) 2006-02-14 2008-08-20 华为技术有限公司 一种视频图像超分辨率重构方法
AU2006201210A1 (en) 2006-03-23 2007-10-11 Canon Information Systems Research Australia Pty Ltd Motion characterisation
US7778472B2 (en) 2006-03-27 2010-08-17 Qualcomm Incorporated Methods and systems for significance coefficient coding in video compression
US8019171B2 (en) 2006-04-19 2011-09-13 Microsoft Corporation Vision-based compression
US7933464B2 (en) 2006-10-17 2011-04-26 Sri International Scene-based non-uniformity correction and enhancement method using super-resolution
EP1926321A1 (en) 2006-11-27 2008-05-28 Matsushita Electric Industrial Co., Ltd. Hybrid texture representation
TWI319547B (en) 2006-12-01 2010-01-11 Compal Electronics Inc Method for generating typographical line
JP4375390B2 (ja) 2006-12-12 2009-12-02 ソニー株式会社 携帯端末装置および表示方法、並びにプログラム
KR101381600B1 (ko) 2006-12-20 2014-04-04 삼성전자주식회사 텍스처 합성을 이용한 영상의 부호화, 복호화 방법 및 장치
KR101383540B1 (ko) 2007-01-03 2014-04-09 삼성전자주식회사 복수의 움직임 벡터 프리딕터들을 사용하여 움직임 벡터를추정하는 방법, 장치, 인코더, 디코더 및 복호화 방법
CN101222641B (zh) 2007-01-11 2011-08-24 华为技术有限公司 帧内预测编解码方法及其装置
JP4467583B2 (ja) 2007-01-17 2010-05-26 富士通株式会社 設計支援プログラム、設計支援方法および設計支援装置
US7792423B2 (en) * 2007-02-06 2010-09-07 Mitsubishi Electric Research Laboratories, Inc. 4D light field cameras
JP5372341B2 (ja) 2007-05-18 2013-12-18 株式会社エヌ・ティ・ティ・ドコモ 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法および画像予測復号プログラム
BRPI0810924A2 (pt) 2007-04-09 2019-09-24 Ntt Docomo Inc predição de imagem/dispositivo de codificação, predição de imagem/ método de codificação, predição de imagem/programa de codificação, predição de imagem/dispositivo de codificação, predição de imagem/método de codificação e predição de imagem/programa de codificação
JP5572802B2 (ja) 2007-05-30 2014-08-20 国立大学法人 香川大学 接着方法並びにそれを用いて作製したバイオケミカルチップ及び光学部品
CN101681499B (zh) 2007-06-14 2013-04-24 汤姆逊许可证公司 修改经编码的比特流
US20090003443A1 (en) 2007-06-26 2009-01-01 Nokia Corporation Priority-based template matching intra prediction video and image coding
US9648325B2 (en) 2007-06-30 2017-05-09 Microsoft Technology Licensing, Llc Video decoding implementations for a graphics processing unit
US8358840B2 (en) 2007-07-16 2013-01-22 Alexander Bronstein Methods and systems for representation and matching of video content
US8417037B2 (en) 2007-07-16 2013-04-09 Alexander Bronstein Methods and systems for representation and matching of video content
US8582908B2 (en) 2007-08-07 2013-11-12 Texas Instruments Incorporated Quantization method and apparatus
US8081842B2 (en) 2007-09-07 2011-12-20 Microsoft Corporation Image resizing for web-based image search
CN101389021B (zh) 2007-09-14 2010-12-22 华为技术有限公司 视频编解码方法及装置
JP4876048B2 (ja) 2007-09-21 2012-02-15 株式会社日立製作所 映像送受信方法、受信装置、映像蓄積装置
US8422559B2 (en) 2007-10-10 2013-04-16 Mediatek Inc. Matching-pixel sub-sampling motion estimation method for video compression
JP5098559B2 (ja) 2007-10-11 2012-12-12 富士ゼロックス株式会社 類似画像検索装置、及び類似画像検索プログラム
CN101415122B (zh) 2007-10-15 2011-11-16 华为技术有限公司 一种帧间预测编解码方法及装置
CN101198064A (zh) * 2007-12-10 2008-06-11 武汉大学 一种分辨率分层技术中的运动矢量预测方法
WO2009087641A2 (en) 2008-01-10 2009-07-16 Ramot At Tel-Aviv University Ltd. System and method for real-time super-resolution
CN101911708B (zh) 2008-01-10 2016-03-09 汤姆森特许公司 帧内预测视频的照明补偿方法和装置
US8228990B2 (en) 2008-01-16 2012-07-24 Sony Corporation Template matching scheme using multiple predictors as candidates for intra-prediction
US8204325B2 (en) 2008-01-18 2012-06-19 Sharp Laboratories Of America, Inc. Systems and methods for texture synthesis for video coding with side information
US20100295922A1 (en) 2008-01-25 2010-11-25 Gene Cheung Coding Mode Selection For Block-Based Encoding
CN101965733B (zh) 2008-03-09 2013-08-07 Lg电子株式会社 用于编码或解码视频信号的方法和设备
JP2009239686A (ja) 2008-03-27 2009-10-15 Hitachi Ltd 放送受信システム、ホームゲートウェイ装置及び放送受信端末装置
US8189933B2 (en) 2008-03-31 2012-05-29 Microsoft Corporation Classifying and controlling encoding quality for textured, dark smooth and smooth video content
JP5406465B2 (ja) 2008-04-24 2014-02-05 株式会社Nttドコモ 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法及び画像予測復号プログラム
BRPI0822815A2 (pt) 2008-06-27 2015-06-30 Thomson Licensing Método e aparelho para compressão de textura utilizando síntese de textura de amostragem baseada em patch
US8340463B1 (en) 2008-08-29 2012-12-25 Adobe Systems Incorporated Candidate pruning for patch transforms
KR20160114186A (ko) 2008-09-18 2016-10-04 톰슨 라이센싱 비디오 영상 프루닝 방법 및 장치
US8233734B2 (en) 2008-09-22 2012-07-31 Microsoft Corporation Image upsampling with training images
CN101459842B (zh) * 2008-12-17 2011-05-11 浙江大学 一种空间降采样解码方法和装置
FR2941581A1 (fr) 2009-01-28 2010-07-30 France Telecom Codage et decodage d'une sequence d'images video par zones d'images
CN101551903A (zh) 2009-05-11 2009-10-07 天津大学 步态识别中的超分辨率图像恢复方法
CN101556690B (zh) 2009-05-14 2015-01-07 复旦大学 基于词典学习和稀疏表示的超分辨率算法
JP2010268259A (ja) 2009-05-15 2010-11-25 Sony Corp 画像処理装置および方法、並びにプログラム
US20110047163A1 (en) 2009-08-24 2011-02-24 Google Inc. Relevance-Based Image Selection
EP2486727A4 (en) 2009-10-05 2014-03-12 Icvt Ltd METHOD AND SYSTEM FOR PROCESSING AN IMAGE
KR20110065997A (ko) 2009-12-10 2011-06-16 삼성전자주식회사 영상처리장치 및 영상처리방법
KR101782661B1 (ko) 2010-01-19 2017-10-23 톰슨 라이센싱 비디오 인코딩 및 디코딩을 위한 템플릿 매칭 예측의 복잡도를 감소시키는 방법 및 장치
CN102726044B (zh) 2010-01-22 2016-08-10 汤姆逊许可证公司 使用基于示例的超分辨率的用于视频压缩的数据剪切
US20110210960A1 (en) 2010-02-26 2011-09-01 Google Inc. Hierarchical blurring of texture maps
DE102010022987B4 (de) 2010-06-08 2012-12-20 Phoenix Contact Gmbh & Co. Kg Elektrisches Gerät mit einem Steckverbinder und elektrische Steckverbindung
CN103210648B (zh) 2010-09-10 2017-06-09 汤姆逊许可公司 使用基于块的混合分辨率数据修剪的视频解码
US9338477B2 (en) 2010-09-10 2016-05-10 Thomson Licensing Recovering a pruned version of a picture in a video sequence for example-based data pruning using intra-frame patch similarity
CN103202017B (zh) 2010-09-10 2017-02-22 汤姆逊许可公司 使用基于样本的数据修剪的视频解码的方法和装置
WO2012033962A2 (en) 2010-09-10 2012-03-15 Thomson Licensing Methods and apparatus for encoding video signals using motion compensated example-based super-resolution for video compression
US8503792B2 (en) 2010-12-17 2013-08-06 Sony Corporation Patch description and modeling for image subscene recognition
WO2013149038A1 (en) 2012-03-28 2013-10-03 University Of Houston System Methods and software for screening and diagnosing skin lesions and plant diseases
JP6192271B2 (ja) 2012-08-22 2017-09-06 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07222145A (ja) * 1994-01-31 1995-08-18 Mitsubishi Electric Corp 画像符号化装置
JPH08336134A (ja) * 1995-04-06 1996-12-17 Sanyo Electric Co Ltd 動画像圧縮符号化方法、動画像圧縮符号化装置、動画像復号方法、動画像復号装置、及び、記録媒体
WO2006025339A1 (ja) * 2004-08-30 2006-03-09 Matsushita Electric Industrial Co., Ltd. 復号化装置、符号化装置、復号化方法、符号化方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200280721A1 (en) * 2011-10-14 2020-09-03 Advanced Micro Devices, Inc. Region-based image compression and decompression
US11503295B2 (en) * 2011-10-14 2022-11-15 Advanced Micro Devices, Inc. Region-based image compression and decompression
WO2017145752A1 (ja) * 2016-02-24 2017-08-31 株式会社日立産業制御ソリューションズ 画像処理システムおよび画像処理装置
US11924408B2 (en) 2021-01-14 2024-03-05 Tencent America LLC Method and apparatus for video coding
JP7462792B2 (ja) 2021-01-14 2024-04-05 テンセント・アメリカ・エルエルシー ビデオ・コーディングのための方法及び装置
WO2022210661A1 (ja) * 2021-03-30 2022-10-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 画像符号化方法、画像復号方法、画像処理方法、画像符号化装置、及び画像復号装置

Also Published As

Publication number Publication date
WO2011090790A1 (en) 2011-07-28
WO2011090790A8 (en) 2012-08-30
KR20120118477A (ko) 2012-10-26
CN102823242A (zh) 2012-12-12
KR101789845B1 (ko) 2017-11-20
CN102823242B (zh) 2016-08-10
JP5911809B2 (ja) 2016-04-27
EP2526698A1 (en) 2012-11-28
US20120294369A1 (en) 2012-11-22
US9602814B2 (en) 2017-03-21

Similar Documents

Publication Publication Date Title
JP5911809B2 (ja) サンプリングベースの超解像度ビデオ符号化および復号化方法並びに装置
Bhat et al. Deep burst super-resolution
CN113612994B (zh) 具有仿射运动补偿的视频编解码的方法
TWI617185B (zh) 具有仿射運動補償的視訊編碼的方法以及裝置
JP5535625B2 (ja) 適応的参照フィルタリングの方法及び装置
JP2019216466A (ja) 省略符号化を用いた映像符号化及び復号化装置及びその方法
KR101915425B1 (ko) 비디오 영상 프루닝 방법 및 장치
KR101878515B1 (ko) 움직임 보상된 샘플 기반 초해상도를 이용한 비디오 인코딩
JP5628155B2 (ja) 動き補償の補間フィルタリング及び参照画像のフィルタリングのための局所的な適応フィルタリングの方法及び装置
JP2013537381A5 (ja)
JP6042899B2 (ja) 映像符号化方法および装置、映像復号方法および装置、それらのプログラム及び記録媒体
CN107801039B (zh) 运动补偿预测方法和装置
JP5844745B2 (ja) パッチシフティングを通じてベクトル量子化誤差を低減する方法および装置
US8170110B2 (en) Method and apparatus for zoom motion estimation
CN115606179A (zh) 用于使用学习的下采样特征进行图像和视频编码的基于学习的下采样的cnn滤波器
CN115486068A (zh) 用于视频编码中基于深度神经网络的帧间预测的方法和设备
CN115552905A (zh) 用于图像和视频编码的基于全局跳过连接的cnn滤波器
NZ590990A (en) Content adaptive and art directable scalable video coding
CN112601095B (zh) 一种视频亮度和色度分数插值模型的创建方法及系统
CN111034198A (zh) 图像编码和解码方法、编码和解码设备及对应计算机程序
WO2024006167A1 (en) Inter coding using deep learning in video compression
JP5941097B2 (ja) パッチベースのサンプリングテクスチャ合成を用いたテクスチャ圧縮の方法及び装置
Callicó et al. Mapping of real-time and low-cost super-resolution algorithms onto a hybrid video encoder
Lou Video frames interpolation using adaptive warping

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140120

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141125

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150225

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150804

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20151104

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160301

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160330

R150 Certificate of patent or registration of utility model

Ref document number: 5911809

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350