JP5259608B2 - 映像符号化における参照フレームのサーチを軽減する装置及び方法 - Google Patents

映像符号化における参照フレームのサーチを軽減する装置及び方法 Download PDF

Info

Publication number
JP5259608B2
JP5259608B2 JP2009536382A JP2009536382A JP5259608B2 JP 5259608 B2 JP5259608 B2 JP 5259608B2 JP 2009536382 A JP2009536382 A JP 2009536382A JP 2009536382 A JP2009536382 A JP 2009536382A JP 5259608 B2 JP5259608 B2 JP 5259608B2
Authority
JP
Japan
Prior art keywords
frame
subset
sub
partial region
reference frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009536382A
Other languages
English (en)
Other versions
JP2010509850A (ja
Inventor
ルーカス、ジュニア・セラフィム・エス.
ティアン、タオ
ラビーンドラン、ビジャヤラクシュミ・アール.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2010509850A publication Critical patent/JP2010509850A/ja
Application granted granted Critical
Publication of JP5259608B2 publication Critical patent/JP5259608B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本願は、マルチメディア信号処理に関わり、特に映像符号化に関わる。
ビデオ符号化器のようなマルチメディア処理システムは、MPEG−xやH.26x規格のような国際規格に基づく符号化方法を用いて、マルチメディアデータを符号化し得る。そのような符号化方法は一般的に、伝送やストレージのためにマルチメディアデータを圧縮することに向けられている。圧縮は、大まかにはデータから冗長さを取り除く処理のことである。
映像信号は、フレーム(写真全体)、またはフィールド(例えば、インターレース映像ストリームは、写真の奇数ラインと偶数ラインの領域を交互に含む)を含む、連続した複数の写真という観点で表現され得る。本明細書では、用語「フレーム」は、写真、フレーム、またはフィールドを指すよう、広い意味で用いられる。映像符号化器のようなマルチメディアプロセッサは、フレームをブロック、または例えば(16×16)のピクセルのマクロブロックに分割することにより、フレームを符号化し得る。符号化器は、各々のマクロブロックを更にサブブロックに分割し得る。各サブブロックは、更なるサブブロックを更に備え得る。例えば、マクロブロックのサブブロックは(16×8)及び(8×16)ピクセルのサブブロックを含み得る。(8×16)ピクセルのサブブロックのサブブロックは、(8×8)ピクセルのサブブロックを含み得る、等である。本明細書において、用語「ブロック」はマクロブロックかサブブロックを示す。
映像符号化方法は、各フレームまたはフレームのブロックを圧縮する可逆または不可逆圧縮アルゴリズムを用いて、映像信号を圧縮する。フレーム内符号化は、フレームを符号化する際に、当該フレームのデータを用いて符号化することを指す。フレーム間符号化は、他の「参照」フレームに基づくフレームの符号化を含むスキームのような、予測符号化スキームを指す。例えば、映像信号はしばしば時間的な冗長性を示し、この冗長性においては、フレームの時間的なシーケンスにおいて互いに近接するフレームは、少なくとも一部領域において、互いに一致、または少なくとも部分的に一致する。符号化器は、この時間的な冗長性を利用して、符号化データのサイズを削減出来る。
符号化器は、あるフレームと、1つ又はそれ以上の参照フレームとの間の差分の観点からフレームを符号化することによっても、時間的な冗長性を利用し得る。例えば映像符号化器は、符号化されるフレームのブロックと、1つまたはそれ以上のその他のフレームの一部領域とを一致させるアルゴリズムをベースにした動き補償を使用し得る。符号化されたフレームのブロックは、参照フレームにおいて一致する領域に対して、フレーム中においてシフトされているかもしれない。このシフトは動きベクトルによって特徴づけられる。このブロックと、参照フレームにおいて部分的に一致する一部領域との間の差分は、残差の部分として特徴づけられ得る。符号化器は、従って、フレームの特定の区分についての動きベクトルと残差の部分とのうちの1つまたはそれ以上を備えたデータとして、フレームを符号化し得る。フレーム符号化のためのブロックの特定の区分は、コスト関数を近似的に最小化することによって選択され得る。コスト関数は例えば、符号化サイズと、符号化の結果得られるフレームの内容のひずみとのバランスを取るものである。
参照フレームは、映像信号において、先行する1つまたはそれ以上のフレーム、または映像信号において、当該フレームの後に後続する1つまたはそれ以上のフレームを含み得る。H.264規格は例えば、最もより良く一致するブロックのサーチに、5つの参照フレームを使用することを定めている。一般的に、多くの参照フレーム内をサーチすることにより、符号化器の、参照フレームのいずれかにおいて符号化対象フレームのブロックに厳密に一致する一部領域を検出する能力は向上する。より良く一致することで、符号化すべき差分は小さくなり、その結果、一般的に、よりコンパクトな符号化が得られる。しかしながら、ブロックについて参照フレームの一致する領域を発見するためには、符号化器は、符号化されるフレームの各ブロック(例えば、マクロブロック及びサブブロック)について、各参照フレーム内をサーチしなければならない。一致する領域はシフトされ得るため、符号化器は通常、参照フレーム毎に多数回の比較処理を実行する。その結果、フレームの符号化は、特に参照フレームの数に対して計算が非常に複雑化し、これによって符号化器の消費電力、コスト、及びサイズが大きくなる。従って、映像符号化器においては、参照フレーム内のサーチについての複雑さを軽減したいという要求があった。
本明細書で説明されるシステム、方法、及びデバイスの例は、それぞれ幾つかの側面を有しており、その望ましい特性をもっぱら奏する唯一ものものでは無い。後述する特許請求の範囲に表現された本発明の範囲を限定することなく、その顕著な特徴がこれより簡単に議論される。本議論を考慮の後、そして特に「詳細な説明」と題されたセクションを読んだ後、開示された特徴が、効率的で、低電力で、及び/または高速な、映像符号化器を含む効果を、如何にして奏するのかを理解するだろう。
一側面は、マルチメディアデータを処理する方法を備える。方法は、フレームの一部領域を、複数の参照フレームと比較することを備える。フレームの一部領域は複数の小領域を備える。方法は更に、比較に基づいて、複数の参照フレームから参照フレームを選択することを備える。方法は更に、選択された参照フレームに基づいて、少なくとも一つの小領域を処理することを備える。
別の側面は、マルチメディアデータを処理する装置を備える。装置は、フレームの一部領域を複数の参照フレームと比較する手段を備える。フレームの一部領域は、複数の小領域を備える。装置は更に、比較に基づいて、複数の参照フレームから参照フレームを選択する手段を備える。装置は更に、選択された参照フレームに基づいて、少なくとも一つの小領域を処理する手段を備える。
別の側面は、マルチメディアデータを処理する装置を備える。装置は、フレームの一部領域を複数の参照フレームと比較するように構成された比較器を備える。フレームの一部領域は、複数の小領域を備える。装置は更に、比較に基づいて複数の参照フレームから参照フレームを選択するように構成されたセレクタを備える。装置は更に、選択された参照フレームに基づいて、少なくとも一つの小領域を比較するように構成されたプロセッサを備える。
一側面は、フレームの一部領域を複数の参照フレームと比較する構成を備えるマルチメディアデータプロセッサを備える。フレームの一部領域は、複数の小領域を備える。構成は更に、比較に基づいて、複数の参照フレームから参照フレームを選択し、選択された参照フレームに基づいて、少なくとも一つの小領域を処理する。
別の側面は、マルチメディアデータを処理する命令を備えた機器読み取り可能な媒体を備える。実行時において命令は機器に対して、フレームの一部領域を、複数の参照フレームと比較させる。フレームの一部領域は、複数の小領域を備える。実行時において命令は、機器に対して比較に基づいて複数の参照フレームから参照フレームを選択させ、選択された参照フレームに基づいて、少なくとも一つの小領域を処理させる。
図1は、一側面に従ったマルチメディア通信システムを示す機能ブロック図。 図2は、図1に示すようなシステムにおいて映像フレームの一部を符号化する方法の一部を視覚的に示す。 図3は、図1に示すようなシステムにおいて映像ストリームの一部を符号化する方法の一例を示すフローチャート。 図4は、図3に示す方法に従った映像データを処理する装置の例を示す機能ブロック図。 図5は、図3に示す方法の一例の一部をより詳細に示すフローチャート。 図6は、図3に示す方法の別の例の一部をより詳細に示すフローチャート。 図7は、図3に示す方法の別の例の一部をより詳細に示すフローチャート。
下記の詳細な説明は、本発明のある特定の側面に向けられている。しかし本発明は、特許請求の範囲において定義され、包括された、数多くの異なる方法で具体化され得る。本説明において、図面に参照符号が付され、全体にわたって、同様の部分は同様の番号で指定される。下記の説明において、具体的な詳細を挙げることによって、説明された側面についての十分な理解が与えられる。しかしながら、これらの側面はこれらの具体的な詳細を有することなく実施され得ることが、当業者によって理解されるだろう。例えば、電気的な要素は、意味のない細部においてこれらの側面が不明確にならないよう、ブロック図の形で示され得る。別の場合では、これらの側面を更に説明するために、そのような要素、他の構造及び方法が細部にわたって示され得る。
更に、実施形態に応じて、本明細書で説明されたあらゆる方法、プロセス、ブロック図、及びフローチャートにおけるある動作または事象は、異なる順序によって実行可能であり、そしてひとまとめにして加えられ、マージされ、または省略され得ることが認識されるだろう(例えば、説明された動作または事象の全てが、この方法の実行に必要なわけでは無い)。更に、ある実施形態では、動作及び事象は順次実行されるよりもむしろ、例えばマルチスレッド処理、割り込み処理、またはマルチプロセッサによって、同時に実行され得る。本明細書で説明された方法、プロセス、ブロック図、及びフローチャートは、その全体または一部が繰り返されても良いことが、更に認識されるだろう。
側面は、マルチメディア通信システムにおける符号化器の処理を向上するシステム及び方法を含む。マルチメディアデータは、動画映像、音声、静止画またはその他のオーディオビジュアルデータの適切なタイプのうちの1つまたはそれ以上を含み得る。側面は、映像データを符号化する装置及び方法を含む。例えば、ある側面は、映像の符号化時において、参照フレームのサーチを軽減する方法を備える。そのような側面のようなひとつは、動き補償の方法において、参照フレームのサーチを軽減する方法を備える。具体的には、参照フレームのセットの全てでは無く、これより少ない数の参照フレーム内をサーチする、一側面に従ったサーチによって、符号化フレームにおけるノイズまたは歪み量を実質的に増加させることなく、動き補償のサーチにおける計算の複雑さを軽減されることが見いだされる。
図1は、一側面に従ったマルチメディア通信システム100を示す機能ブロック図である。システム100は、ネットワーク140を介して復号器150と通信可能な符号化デバイス110を備えている。一例では、符号化デバイスは、外部ソース102からマルチメディア信号を受信し、ネットワーク140上に送信するためこの信号を符号化する。
本例では、符号化デバイス110は、送受信機116、及びメモリ114に接続されたプロセッサ112を備えている。プロセッサ112は、マルチメディアデータソースからのデータを符号化して、ネットワーク140上で通信するために、これを送受信機116に供給する。
本例では、復号化デバイス150は、送受信機156、及びメモリ154に接続されたプロセッサ152を備えている。プロセッサ152は、汎用プロセッサ及びデジタルシグナルプロセッサのうちの1つまたはそれ以上を含み得る。メモリ154は、半導体またはディスクベースの記憶装置のうちの1つまたはそれ以上を含み得る。送受信機156は、ネットワーク140を介してマルチメディアデータを受信し、復号化のためにこれをプロセッサ152に供給可能に構成されている。一例では、送受信機156は、無線送受信機を含む。ネットワーク140は、有線または無線通信システムのうちの1つまたはそれ以上を含み、これらはイーサネット(登録商標)、電話(例えばPOTS)、ケーブル、電力線、及び光ファイバシステムのうちの1つまたはそれ以上を含み、及び/または無線通信システムは、GSM/GPRS(General Packet Radio Service)/EDGE(enhanced data GSM environment)、TETRA(Terrestrial Trunked Radio)移動電話システム、広帯域符号分割多重接続(WCDMA)システム、高データレート(1xEV−DOまたは1xEV−DO Gold Multicast)システム、IEEE802.11システム、MediaFLOシステム、DMBシステム、またはDVB−Hシステムのような、符号分割多重接続(CDMAまたはCDMA2000(登録商標))通信システム、周波数分割多重接続(FDMA)システム、及び時分割多重接続(TDMA)システムのうちのひとつまたはそれ以上を備える。
図2は、図1に示すようなシステムにおける映像フレームの一部分を符号化する方法の側面を視覚的に示している。図2に示すように、フレーム170は、複数のマクロブロック171に分割され得る。各マクロブロックはピクセルの配列、例えばフレーム170における(16×16)のピクセルの配列を備える。更に符号化器110は、マクロブロック171を、(8×8)ピクセルのサブブロック171a、または(4×4)ピクセルのサブブロック171bのような、いくつかの小さなブロックに区分する。任意で、符号化器110はフレーム170内において、及び/または符号化されたフレーム170間で、サブブロックのサイズを変えることも出来る。マクロブロック171と、サブブロック171aのようなマクロブロックの区分を、本明細書ではまとめて「ブロック」と呼び、図2の符号171を参照してまとめて示される。
符号化された映像フレーム170(またはフレーム170のブロック171)は、他のフレームに依存することなく符号化されても良いし(例えばイントラモード)、または符号化された他のフレームに予測的に基づいても良い(インターモード)。フレーム170の一部領域について使用される符号化の個々のモードは、「(符号化の)モード」と呼ばれ得る。符号化器110は、フレームの種々の領域(種々のブロック171またはサブブロック171)を、異なるモードによって符号化し得る。例えば、動き補償アルゴリズムが、フレーム170、またはフレーム170の1つまたはそれ以上のブロック171の符号化に用いられ得る。符号化器110の一例は、(16×16)、(16×8)、(8×16)、(8×8)、(8×4)、(4×8)、(4×4)ピクセルのようなサイズ(しかし、他のサイズが使用されても良い)のブロックを含むブロックの観点から、フレーム170を符号化する。符号化されたフレーム170は、フレームの符号化ブロック171のセットへの区分を含み得る。そしてこの符号化ブロック171のセットが、実質的にフレーム170の全ピクセルを符号化する。符号化ブロック171は、異なるサイズであって良く、コスト関数に基づいて選択され得る。コスト関数は、符号化データサイズや符号化の結果得られる画像の歪みなどの要素の重み付け平均に基づいて、異なる符号化方法を比較する。
上述のように、映像フレームを予測する1つの方法は、動き予測アルゴリズムを用いることである。動き予測アルゴリズムは、映像データにおける時間的な冗長性をうまく利用したものであり、あるフレームと別のフレーム(例えば参照フレーム)との間での少なくとも部分的に一致するブロック171に基づいて、フレーム170を符号化する。動き予測アルゴリズムは、フレーム170のブロック171と同一(例えば、少なくとも部分的に一致する)であり、おそらくは符号化されたフレーム174において場所的にシフトされた、1つまたはそれ以上の参照フレーム174におけるブロック176を特定する。種々の側面において動き予測アルゴリズムは、現在のフレーム170よりも時間的に前の参照フレーム、現在のフレーム170よりも時間的に後の適切な時間の参照フレーム、またはその両方を用い得ることに注意すべきである。フレーム170のブロック171は、動きベクトルと残差データの観点から符号化される。動きベクトルは、ブロック171と176との間での位置的な差分を示す。残差データは、1つまたはそれ以上の参照フレーム174(例えば、参照フレーム174a、174b、174c、174d、174e)のリストから見いだされた参照ブロック(参照フレーム174cのブロック176)におけるピクセルと、フレーム170のブロック171のピクセルとの間の差分を示す。参照フレーム174は、映像信号においてフレーム170の前または後のフレームが、時間順に順序づけられたリストであり得る。図2に示すように符号化器110は、フレーム170のブロック171aを、参照フレーム174と比較して、フレーム174c中のブロック176のような対応するブロックを特定し得る。
符号化器110は、動き補償データを計算し得る。このデータは例えば、ブロック171の(16×16)、(16×8)、(8×16)、(8×8)、(8×4)、(4×8)、及び(4×4)ピクセルのブロック(区分)のようなブロックの集合毎の、動きベクトル及び残差データである。符号化器110はまず、大きいブロック171(例えば(16×16)ピクセル)について動き補償データを算出し、その後、この大きなブロックのサブブロック(例えば(16×8)や(8×8)ピクセル等)の各々について、動き補償データを算出する。符号化器110は、フレーム170の全体を実質的にカバーする1つまたはそれ以上のブロック171のセットまたは特定の区分を選択出来る。符号化器110は、コスト関数に基づいて、フレーム170の各領域についてのそれぞれの予測データ及び個々の区分を選択し得る。コスト関数は、例えばレート−歪み(RD)関数であり、フレームのブロックの個々のセットについての動きベクトルと残差の個々のセットを用いたフレームまたはフレームの一部領域の符号化データサイズと、対応する、結果として得られる画像の歪みの推定値と、に従って、符号化サイズと歪みとの間のトレードオフの関係の指標を備える。符号化器110は、技術的に知られたあらゆる適切なコスト関数を使用し得る。例えば適切なコスト関数は、“Rate-Constrained Coder Control and Comparison of Video Coding Standards”、IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY、VOL. 13、NO. 7、688 (July 2003)に開示されている。コスト関数は、例えばレート−歪み関数、及び/または差分絶対値の和(SAD)関数を含み得る。
図3は、マルチメディアデータを符号化する方法204の例を示すフローチャートである。方法はブロック222において開始され、符号化器110はフレームのブロック(例えば図2に示すフレーム170のブロック171a)を、参照フレーム(例えば図2に示すフレーム174)のリストのそれぞれと比較して、ブロック171aの符号化のためのマッチングデータを特定する。符号化器110は、少なくとも部分的にブロック171aに一致する、フレーム174cのブロック176のような領域を見つけるために、各参照フレーム174内をサーチする。次にブロック224において符号化器110は、ブロック171aとの間を取り持つ符号化コスト関数が最も低い参照フレーム174のいずれか(例えば参照フレーム174c)を選択する。更に符号化器110は、状況に応じて、選択した参照フレームに基づいて参照フレーム174のサブセットを選択することも出来る。例えばサブセットは、選択した参照フレーム、例えば参照フレーム174cのみを含んでも良い。別の例では、参照フレーム174は、フレーム1からフレームNの時間的なシーケンスを備える。この場合、選択した参照フレーム174はこのシーケンス中のフレームjであり、その結果サブセットは参照フレーム(j−M)から(j+M)を備える。なお、Mは自然数であり、サブセットのサイズをパラメータ化したものである。例えば、もしM=1であれば、サブセットはフレーム(j−1)から(j+1)を含み、例えば特定された参照フレームと、連続したフレーム1からNにおいてこれに隣接する参照フレームである。M=1は例示に過ぎず、側面はその他の値のサブセットサイズのパラメータMを使用し得ることが理解できるであろう。更に、このレンジは、シーケンスの下端においてフレームの下限を有し(例えばフレーム1)、シーケンスの上端においてフレームの上限を有し(例えばフレームN)うる。
次にブロック228において符号化器110は、選択された参照フレームに基づいて、小領域(例えばサブブロック)の少なくとも一つにつき処理を行う。符号化器は、フレーム170のサブブロックと選択した参照フレームとを比較して、参照フレーム174において少なくとも部分的に一致する領域176を探索することによって、サブブロックを処理する。例えば、符号化器110は、ブロック171aの各サブブロック(例えば(16×8)及び(8×16)ピクセルのサイズのサブブロック)を、選択された参照フレーム174とのみ、比較し得る。従って符号化器110は、サブブロックを符号化するのに、5つの全ての参照フレーム174内をサーチする必要が無く、これにより、歪みを実質的に増大させることなく、処理の複雑さを低減出来る。
更に、符号化器はまた、上記の方法ブロック224について、サブブロックを参照フレーム174のサブセットと比較しても良い。例えば、(8×8)ピクセルのブロック171aについての参照フレームとしてフレーム174cが特定された場合、参照フレームのサブセットは、フレーム174c、またはフレーム174cにある時間内で隣接するフレームのレンジを備えても良い。このフレームのレンジは、例えばフレーム174bから174dである。更に符号化器110は、全参照フレーム内のサーチ、選択された参照フレーム174内のみのサーチ、または参照フレームのサブセット内のみのサーチ、の組み合わせを実行するように構成されても良い。符号化器110は、これらの組み合わせを、例えばサーチされるブロックのサイズに基づいて選択しても良い。図5、6、7は、そのような組み合わせの具体例を示している。
上記の開示によれば、参照フレーム174の全てでは無く、これより少ない数の参照フレーム内がサーチされる。これにより、符号化フレーム170におけるノイズまたは歪みの量を実質的に増加させることなく、動き補償のサーチにおける計算の複雑さを、好ましく軽減されることが見いだされる。方法204は、フレーム170の別のブロックまたはサブブロック171について繰り返されても良い。
図4は、図3に示された方法に従って映像データを処理する装置の例を示すブロック図である。特に図3では符号化器110の例を示している。符号化器100は、フレームの一部領域を複数の参照フレームと比較するモジュール302、複数の参照フレームから参照フレームを選択するモジュール304、及び選択した参照フレームに基づいて少なくとも1つの小領域を処理するモジュール306とを備えている。フレームの一部領域を比較するモジュール302は、フレームの一部領域を複数の参照フレームと比較可能に構成され得る。例えばモジュール302は、図3のブロック222を参照して説明した動作を実行し得る。参照フレームを選択するモジュール304は、複数の参照フレーム174(図2参照)から、参照フレーム、例えば174cを選択可能に構成され得る。例えば、モジュール304は、図3のブロック224を参照して説明した動作を実行し得る。モジュール304は、上記説明したコスト関数に基づいて、参照フレーム174を選択し得る。参照フレームを選択するモジュール304はまた、特定された参照フレームに基づいて、参照フレームのサブセット、例えばフレームj−1からj+1を選択可能に構成され得る。なお、参照フレームは、時間的に連続した参照フレームのシーケンスにおけるフレームjに特定されている。フレームの小領域を処理するモジュール306は、選択された参照フレーム174に基づいて、少なくとも1つの小領域を処理可能に構成され得る。例えばモジュール306は、図3のブロック228を参照して説明した動作を実行し得る。
下記の表1は、種々のサイズのブロックのサーチについて参照フレーム174のサーチが軽減された符号化方法のいくつかの例についてのシミュレート結果を示している。表1は、本明細書に開示された参照フレームのサーチを軽減する3つの方法に対して、全てのブロックサイズについて、N個全ての参照フレーム内をサーチするコストを比較している。表1は、ビットレート、ピーク信号・ノイズ比(PSNR)、及び例えば軽減されたサーチ方法について増加した信号・ノイズ比である「ペナルティ」を、アニメーション、音楽ビデオ、ニュース、一般的なスポーツ、ケーブルテレビのスポーツチャンネル、ケーブルテレビの映画チャンネル、及び一般的な、すなわち典型的なケーブルテレビ信号の、複数の例となる映像信号について比較している。
図5は、図3の方法204の第1の例の更なる詳細を示すフローチャートである。この最初の例は、表1の例Aに対応し、sub-(8×8)モードにおける参照フレームの軽減方法を含む。例えば、N個の参照フレームの全てが350において、(8×8)ピクセルのサブブロックのデータの符号化のためにサーチされる。特定の参照フレーム174が選択される。例えば(8×8)ピクセルのサブブロックの符号化につき最小のコスト関数値を持つフレームjが選択される。表1のシミュレーションデータでは、Nは5個の参照フレームである。次に352において、シミュレートされた符号化器110は、(8×8)ピクセルのブロックのサブブロック(例えば(8×4)、(4×4)、(4×8)ピクセルのブロック)のデータの符号化のために、選択されたフレームj内のみをサーチする。
図6は、図3の方法204の第2の例の更なる詳細を示すフローチャートである。第2の例は、表1における例Bに対応し、(16×8)及び(8×16)ピクセルのブロックのデータの符号化のためにサーチされた参照フレームを削減する方法を備える。例えば360において符号化器110は、(16×16)ピクセルのブロックのデータの符号化のためにN個の参照フレーム内をサーチし、(16×16)ピクセルのブロックの符号化につき小さい値のコスト関数を与えるフレームjを特定する。最小値は、最小の計算されたコスト値となり得る。次に362において、(16×16)ピクセルのブロックにおける(16×8)及び(8×16)ピクセルのサブブロックについて、符号化器110はデータ符号化のために参照フレームj内のみをサーチする。
図7は、図3の方法204の第3の例の更なる詳細を示すフローチャートである。第3の例は例Cに対応し、(16×8)、(8×16)、(8×8)ピクセルのブロック、及びサブ(8×8)ピクセルのブロックを符号化するために使用される参照フレームを削減する方法を備える。例Cの方法は、選択された参照フレームj内のみをサーチすることにより(16×8)及び(8×16)ピクセルのブロックのサーチを軽減する、図6の項目360、362に関連する動作を含む。次に、362において(16×8)及び(8×16)ピクセルのブロックについて削減された参照フレームに基づいて符号化コストを計算した後、符号化器110は図6の374において、(16×8)及び(8×16)ピクセルのブロックにおける(8×8)ピクセルのサブブロックの各々について、選択された参照フレームjに時間的に隣接する参照フレームのセット(例えば、(8×8)ピクセルのサブブロックについて1フレームの範囲、すなわち、フレーム(0及びj−1の大きい方)乃至フレーム(N及びj+1の小さい方)の参照フレームのセット)内をサーチする。378に移行して符号化器110は、(8×8)ピクセルの各ブロックについて最小の符号化コストを有する参照フレームiを選択する。次に、(8×8)ピクセルのブロックのサブブロックにつき、符号化器110はデータ符号化のために参照フレームi内のみをサーチする。
表1のシミュレーションデータは、適応フレーム符号化及び(32×32)ピクセルのサーチ範囲を仮定した際に得られた。
Figure 0005259608
図示した3つの例は、参照フレームサーチの複雑さと符号化の質との間での、異なるトレードオフの関係を与える。これらの間で、例Cの方法が、約0.15dBに過ぎないPSNRの損失で、最も低い複雑さを有する。
上記の観点から、本発明が、映像データのようなマルチメディアデータの符号化の問題を解決することを理解するだろう。例えば、一側面に従った、参照フレームの軽減されたサーチは、映像の忠実さをほとんど損なうことなく、映像符号化の計算の複雑さを低減する。従って、映像符号化器は低電力、低レイテンシ、及び/または簡便なプロセッサ及び関連する電子機器を用いることが出来る。
当業者は、本明細書で開示された側面に関連して述べられた種々の例示的な論理ブロック、モジュール、回路、及びアルゴリズムステップが、電子的なハードウェア、コンピュータソフトウェア、またはこれらの組み合わせによって実装され得ることを理解するだろう。ハードウェアとソフトウェアとが交換可能なことを明瞭に例示するために、種々の例示的な要素、ブロック、モジュール、回路、及びステップが、全般的にそれらの機能性に関して上記で述べられてきた。そのような機能性がハードウェアで実装されるかハードウェアで実装されるかは、システム全体に課せられた設計の制約や、個々のアプリケーションに依存する。当業者は、個々のアプリケーションについて、様々な方法によって、述べられた機能性を実装し得る。しかし、そのような実装の判断は、本発明の範囲から逸脱するものとして解釈されるべきでは無い。
本明細書に開示された側面に関連して説明された種々の例示的な論理ブロック、モジュール、及び回路は、汎用プロセッサ、デジタルシグナルプロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイシグナル(FPGA)またはその他のプログラマブルな論理回路、ディスクリートゲートまたはトランジスタロジック、ディスクリートハードウェア要素、または本明細書で述べられた機能を実行するように設計されたこれらの組み合わせによって、実行または実装され得る。汎用プロセッサは、マイクロプロセッサであり得るが、代わりにプロセッサは従来の任意のプロセッサ、コントローラ、マイクロコントローラ、またはステートマシンであっても良い。プロセッサはまた、DSPとマイクロプロセッサとの組み合わせなど、演算デバイスの組み合わせ、複数のマイクロプロセッサ、DSPコアと接続された1つまたはそれ以上のマイクロプロセッサ、または他のそのような構成として、実装され得る。
本明細書に開示された側面に関連して述べられたアルゴリズムまたは方法のステップは、ハードウェア、プロセッサによって実行されるソフトウェアモジュール、またはこれらの2つの組み合わせにおいて、直接的に実施され得る。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブルディスク、CD−ROM、または技術的に知られたその他の形態の記憶媒体に保持され得る。典型的な記憶媒体は、この記憶媒体から情報を読み出し、またこの記憶媒体に情報を書き込むことが出来るプロセッサのようなプロセッサに接続される。またはその代わりに、この記憶媒体はプロセッサと一体化されても良い。このプロセッサと記憶媒体は、ASIC内に備えられ得る。ASICはユーザ機器に備えられ得る。代わりに、プロセッサと記憶媒体は、ユーザ機器のディスクリート要素として備えられても良い。
開示された側面の上記説明により、当業者による本発明の構成及び使用が可能となる。当業者には、これらの側面の種々の変形が容易に明らかであろう。そして本明細書に定義された総括的な本質は、本発明の精神または範囲を超えない範囲で、他の形態に適用し得る。よって本発明は、本明細書に示された側面に限定されることを意図されるものでは無いが、本明細書に開示された本質及び新規な点に合致する最大の範囲によって与えられる。
上記の詳細な説明では、種々の側面に適用された発明の新規な点について示され、説明され、指摘された。しかし、示されたデバイスまたはプロセスの形態及び詳細についての省略、置換、及び変更が、本願の思想を逸脱しない範囲で、当業者によりなされ得ることが理解されるだろう。当然ながら本発明は、ある特徴が、別のものとは別個に使用されまたは実行され得る際、本発明で説明された特徴及び効果の全てを与えない構成によって実施され得る。本願の範囲は、上記説明よりもむしろ添付の特許請求の範囲によって示される。特許請求の範囲と同等な意味及び範囲内で生じる全ての変更は、その範囲内のものとして捉えられる。
[1]フレームの一部領域を、複数の参照フレームと比較することであって、前記フレームの前記一部領域が複数の小領域を備えることと、前記比較に基づいて、前記複数の参照フレームから参照フレームを選択することと、前記選択された参照フレームに基づいて、少なくとも一つの前記小領域を処理することとを備える、マルチメディアデータの処理方法。
[2]前記参照フレームを選択することは、前記参照フレームのサブセットを選択することを備え、少なくとも一つの前記小領域を処理することは、前記参照フレームの前記サブセットに基づく、[0]記載の方法。
[3]前記少なくとも一つの前記小領域を処理することは、前記参照フレームの少なくとも一つの前記サブセットを選択することと、少なくとも一つの前記サブセットに少なくとも部分的に基づいて、少なくとも一つの前記小領域を処理することと、を備える、[0]記載の方法。
[4]前記複数の参照フレームは時間的な順序を定義し、前記参照フレームの前記サブセットは、時間的に順番に隣接する少なくとも2つのフレームを備える、[0]記載の方法。
[5]少なくとも一つの前記小領域の処理は、少なくとも一つの前記小領域を、前記選択された参照フレームの少なくとも一部領域と比較することを備える、[0]記載の方法。
[6]前記一部領域はマクロブロックを備え、前記小領域はサブブロックを含む、[0]記載の方法。
[7]前記一部領域はサブブロックを備え、前記小領域は前記サブブロックのサブブロックを備える、[0]記載の方法。
[8]前記フレームの少なくとも前記一部領域につき、符号化のメトリックを計算することを更に備える、[0]記載の方法。
[9]前記参照フレームを選択することは、前記符号化のメトリックに少なくとも部分的に基づく、[8]記載の方法。
[10]前記符号化のメトリックは、符号化データのサイズと、符号化データの歪みの少なくともいずれかに基づく、[8]記載の方法。
[11]フレームの一部領域を複数の参照フレームと比較する手段であって、前記フレームの前記一部領域が複数の小領域を備える手段と、前記比較に基づいて、前記複数の参照フレームから参照フレームを選択する手段と、前記選択された参照フレームに基づいて、少なくとも一つの前記小領域を処理する手段とを備える、マルチメディアデータの処理装置。
[12]前記選択する手段は、前記参照フレームのサブセットを選択するように構成され、前記処理する手段は、前記サブセットに基づいて少なくとも一つの前記小領域を処理するように構成される、[11]記載の装置。
[13]前記処理する手段は、前記参照フレームの少なくとも一つの前記サブセットを選択し、少なくとも一つの前記サブセットに少なくとも部分的に基づいて、少なくとも一つの前記小領域を処理する、ように構成される、[12]記載の装置。
[14]前記複数の参照フレームは時間的な順序を定義し、前記参照フレームの前記サブセットは、時間的に順番に隣接する少なくとも2つのフレームを備える、[12]記載の装置。
[15]前記処理する手段は更に、少なくとも一つの前記小領域を、前記選択された参照フレームの少なくとも一部領域と比較するように構成される、[11]記載の装置。
[16]前記一部領域はマクロブロックを備え、前記小領域はサブブロックを含む、[11]記載の装置。
[17]前記一部領域はサブブロックを備え、前記小領域は前記サブブロックのサブブロックを備える、[11]記載の装置。
[18]前記選択する手段は更に、前記フレームの少なくとも前記一部領域につき、符号化のメトリックを計算するように構成される、[11]記載の装置。
[19]前記処理する手段は更に、少なくとも一つの前記小領域を、前記選択された参照フレームの少なくとも一部領域と比較するように構成される、[11]記載の装置。
[20]前記選択する手段は更に、前記符号化のメトリックに少なくとも部分的に基づいて、前記参照フレームを選択するように構成される、[18]記載の装置。
[21]前記選択する手段は、前記符号化のメトリックに少なくとも部分的に基づいて、前記参照フレームを選択する、[18]記載の装置。
[22]前記符号化のメトリックは、符号化データのサイズと、符号化データの歪みの少なくともいずれかに基づく、[18]記載の装置。
[23]フレームの一部領域を複数の参照フレームと比較するように構成された比較器であって、前記フレームの前記一部領域が複数の小領域を備える比較器と、前記比較に基づいて、前記複数の参照フレームから参照フレームを選択するように構成されたセレクタと、前記選択された参照フレームに基づいて、少なくとも一つの前記小領域を比較するように構成されたプロセッサとを備える、マルチメディアデータの処理装置。
[24]前記セレクタは、前記参照フレームのサブセットを選択するように構成され、前記プロセッサは、前記サブセットに基づいて少なくとも一つの前記小領域を処理するように構成される、[23]記載の装置。
[25]前記プロセッサは、前記参照フレームの少なくとも一つの前記サブセットを選択し、少なくとも一つの前記サブセットに少なくとも部分的に基づいて、少なくとも一つの前記小領域を処理する、ように構成される、[24]の装置。
[26]前記複数の参照フレームは時間的な順序を定義し、参照フレームの前記サブセットは、時間的に順番に隣接する少なくとも2つのフレームを備える、[24]記載の装置。
[27]前記一部領域はマクロブロックを備え、前記小領域はサブブロックを含む、[23]記載の装置。
[28]前記一部領域はサブブロックを備え、前記小領域は前記サブブロックのサブブロックを備える、[23]記載の装置。
[29]前記セレクタは更に、前記フレームの少なくとも前記一部領域につき、符号化のメトリックを計算するように構成される、[23]記載の装置。
[30]前記セレクタは、前記符号化のメトリックに少なくとも部分的に基づいて、前記参照フレームを選択するように構成される、[23]記載の装置。
[31]前記セレクタは更に、前記符号化のメトリックに少なくとも部分的に基づいて、前記参照フレームを選択するように構成される、[23]記載の装置。
[32]前記符号化のメトリックは、符号化データのサイズと、符号化データの歪みの少なくともいずれかに基づく、[23]記載の装置。
[33]フレームの一部領域であって、複数の小領域を備える前記一部領域を、複数の参照フレームと比較し、前記比較に基づいて、前記複数の参照フレームから参照フレームを選択し、且つ前記選択された参照フレームに基づいて、少なくとも一つの前記小領域を処理する構成を備えたマルチメディアデータプロセッサ。
[34]マルチメディアデータを処理する命令を備えた機器読み取り可能な媒体であって、実行時において前記命令は機器に対して、フレームの一部領域であって、複数の小領域を備える前記一部領域を、複数の参照フレームと比較させ、前記比較に基づいて、前記複数の参照フレームから参照フレームを選択させ、且つ前記選択された参照フレームに基づいて、少なくとも一つの前記小領域を処理させる機器読み取り可能な媒体。

Claims (41)

  1. フレームの一部領域を、複数の参照フレームと比較することであって、前記フレームの前記一部領域が複数の小領域を備えることと、
    前記比較に基づいて、前記複数の参照フレームから、前記フレームの前記一部領域についての参照フレームを選択することと、
    前記フレームの前記一部領域についての前記選択された参照フレームに基づいて、少なくとも一つの前記小領域を処理することと
    を備え、前記少なくとも一つの前記小領域を処理することは、
    前記フレームの前記一部領域についての前記選択された参照フレームに基づいて前記複数の参照フレームから選択された一つまたはそれ以上の参照フレームの第1サブセットと、前記複数の小領域のうちの第1小領域とを、比較することと、
    前記フレームの前記一部領域についての前記選択された参照フレームに基づいて前記複数の参照フレームから選択された一つまたはそれ以上の参照フレームの第2サブセットと、前記複数の小領域のうちの第2小領域とを、比較することと
    を備え、前記第1サブセットは前記第2サブセットと異なる、マルチメディアデータの処理方法。
  2. 一つまたはそれ以上の参照フレームの第1サブセットと、前記複数の小領域のうちの第1小領域とを比較することは、前記複数の小領域のうちの前記第1小領域と、前記フレームの前記一部領域について選択された前記参照フレームとを比較することを備え、
    一つまたはそれ以上の参照フレームの第2サブセットと、前記複数の小領域のうちの第2小領域とを比較することは、前記複数の小領域のうちの前記第2小領域と、前記フレームの前記一部領域について選択された前記参照フレーム及び少なくとも一つの追加参照フレームと、を比較することを備える、請求項1記載の方法。
  3. 前記少なくとも一つの前記小領域を処理することは、
    参照フレームの前記第1及び第2サブセットの少なくともいずれかに基づいて、前記第1及び第2小領域を処理すること
    を更に備える、請求項1記載の方法。
  4. 前記複数の参照フレームは時間的な順序を定義し、前記参照フレームの前記第1及び第2サブセットの少なくともいずれかは、時間的に順番に隣接する少なくとも2つのフレームを備える、請求項1記載の方法。
  5. 前記少なくとも一つの前記小領域の処理は、前記少なくとも一つの前記小領域を、前記選択された参照フレームの少なくとも一部領域と比較することを備える、請求項3記載の方法。
  6. 前記一部領域はマクロブロックを備え、前記小領域はサブブロックを含む、請求項1記載の方法。
  7. 前記一部領域はサブブロックを備え、前記小領域は前記サブブロックのサブブロックを備える、請求項1記載の方法。
  8. 前記フレームの少なくとも前記一部領域につき、符号化のメトリックを計算することを更に備え、前記符号化のメトリックは、コスト関数を含む、請求項1記載の方法。
  9. 前記参照フレームの第1及び第2サブセットは、前記符号化のメトリックに少なくとも部分的に基づく、請求項8記載の方法。
  10. 前記符号化のメトリックは、符号化データのサイズと、符号化データの歪みの少なくともいずれかに基づく、請求項8記載の方法。
  11. フレームの一部領域を複数の参照フレームと比較する手段であって、前記フレームの前記一部領域が複数の小領域を備える手段と、
    前記比較に基づいて、前記複数の参照フレームから、前記フレームの前記一部領域についての参照フレームを選択する手段と、
    前記フレームの前記一部領域についての前記選択された参照フレームに基づいて、少なくとも一つの前記小領域を処理する手段と
    を備え、前記処理する手段は、
    前記フレームの前記一部領域についての前記複数の参照フレームから選択された一つまたはそれ以上の参照フレームの第1サブセットと、前記複数の小領域のうちの第1小領域とを、比較する手段と、
    前記フレームの前記一部領域についての前記選択された参照フレームに基づいて前記複数の参照フレームから選択された一つまたはそれ以上の参照フレームの第2サブセットと、前記複数の小領域のうちの第2小領域とを、比較する手段と
    を備え、前記第1サブセットは前記第2サブセットと異なる、マルチメディアデータの処理装置。
  12. 一つまたはそれ以上の参照フレームの第1サブセットと、前記小領域のうちの第1小領域とを比較する手段は、前記複数の小領域のうちの前記第1小領域と、前記フレームの前記一部領域について選択された前記参照フレームとを比較するように構成され、
    一つまたはそれ以上の参照フレームの第2サブセットと、前記小領域のうちの第2小領域とを比較する手段は、前記複数の小領域のうちの前記第2小領域と、前記フレームの前記一部領域について選択された前記参照フレーム及び少なくとも一つの追加参照フレームと、を比較するように構成される、請求項11記載の装置。
  13. 前記処理する手段は更に、
    前記参照フレームの第1及び第2サブセットの少なくともいずれかに基づいて、前記第1及び第2小領域を処理する、ように構成される、請求項11記載の装置。
  14. 前記複数の参照フレームは時間的な順序を定義し、前記参照フレームの前記第1及び第2サブセットの少なくともいずれかは、時間的に順番に隣接する少なくとも2つのフレームを備える、請求項11記載の装置。
  15. 前記処理する手段は更に、少なくとも一つの前記小領域を、前記選択された参照フレームの少なくとも一部領域と比較するように構成される、請求項13記載の装置。
  16. 前記一部領域はマクロブロックを備え、前記小領域はサブブロックを含む、請求項11記載の装置。
  17. 前記一部領域はサブブロックを備え、前記小領域は前記サブブロックのサブブロックを備える、請求項11記載の装置。
  18. 前記選択する手段は更に、前記フレームの少なくとも前記一部領域につき、符号化のメトリックを計算するように構成されており前記符号化のメトリックは、コスト関数を含む、請求項11記載の装置。
  19. 前記選択する手段は更に、前記符号化のメトリックに少なくとも部分的に基づいて、前記参照フレームを選択するように構成される、請求項18記載の装置。
  20. 前記参照フレームの第1及び第2サブセットは、前記符号化のメトリックに少なくとも部分的に基づいて選択される、請求項18記載の装置。
  21. 前記符号化のメトリックは、符号化データのサイズと、符号化データの歪みの少なくともいずれかに基づく、請求項18記載の装置。
  22. フレームの一部領域を複数の参照フレームと比較するように構成された比較器であって、前記フレームの前記一部領域が複数の小領域を備える比較器と、
    前記比較に基づいて、前記複数の参照フレームから、前記フレームの前記一部領域についての参照フレームを選択するように構成されたセレクタと、
    を備え、前記比較器は、
    前記フレームの前記一部領域についての前記選択された参照フレームに基づいて前記複数の参照フレームから選択された一つまたはそれ以上の参照フレームの第1サブセットと、前記複数の小領域のうちの第1小領域とを比較し、
    前記フレームの前記一部領域についての前記選択された参照フレームに基づいて前記複数の参照フレームから選択された一つまたはそれ以上の参照フレームの第2サブセットと、前記複数の小領域のうちの第2小領域とを比較し、
    前記第1サブセットは前記第2サブセットと異なる、マルチメディアデータの処理装置。
  23. 前記比較器は更に、
    前記複数の小領域のうちの前記第1小領域と、前記フレームの前記一部領域について選択された前記参照フレームとを比較し、前記複数の小領域のうちの前記第1小領域と、前記フレームの前記一部領域について選択された前記参照フレーム及び少なくとも一つの追加参照フレームとを比較するように構成される、請求項22記載の装置。
  24. 前記参照フレームの第1及び第2サブセットに基づいて、前記第1及び第2小領域を処理する、ように構成されたプロセッサを更に備える、請求項22記載の装置。
  25. 前記複数の参照フレームは時間的な順序を定義し、前記参照フレームの前記第1及び第2サブセットの少なくともいずれかは、時間的に順番に隣接する少なくとも2つのフレームを備える、請求項22記載の装置。
  26. 前記一部領域はマクロブロックを備え、前記小領域はサブブロックを含む、請求項22記載の装置。
  27. 前記一部領域はサブブロックを備え、前記小領域は前記サブブロックのサブブロックを備える、請求項22記載の装置。
  28. 前記セレクタは更に、前記フレームの少なくとも前記一部領域につき、符号化のメトリックを計算するように構成されており前記符号化のメトリックは、コスト関数を含む、請求項22記載の装置。
  29. 前記参照フレームの第1及び第2サブセットは、前記符号化のメトリックに少なくとも部分的に基づいて選択される、請求項28記載の装置。
  30. 前記符号化のメトリックは、符号化データのサイズと、符号化データの歪みの少なくともいずれかに基づく、請求項28記載の装置。
  31. プログラムを実行することにより、
    フレームの一部領域であって、複数の小領域を備える前記一部領域を、複数の参照フレームと比較するモジュールと、
    前記比較に基づいて、前記複数の参照フレームから、前記フレームの前記一部領域についての参照フレームを選択するモジュールと、
    前記フレームの前記一部領域についての前記選択された参照フレームに基づいて、少なくとも一つの前記小領域を処理するモジュールと
    して機能する構成を備え、前記処理するモジュールは、
    前記フレームの前記一部領域についての、前記複数の参照フレームから選択された一つまたはそれ以上の参照フレームの第1サブセットと、前記複数の小領域のうちの第1小領域とを比較し、
    前記フレームの前記一部領域についての前記選択された参照フレームに基づいて前記複数の参照フレームから選択された一つまたはそれ以上の参照フレームの第2サブセットと、前記複数の小領域のうちの第2小領域とを比較する
    ように構成され、前記第1サブセットは前記第2サブセットと異なるマルチメディアデータプロセッサ。
  32. マルチメディアデータを処理する命令を記録した機器読み取り可能な媒体であって、実行時において前記命令は機器に対して、
    フレームの一部領域であって、複数の小領域を備える前記一部領域を、複数の参照フレームと比較させ、
    前記比較に基づいて、前記複数の参照フレームから、前記フレームの前記一部領域についての参照フレームを選択させ、且つ
    前記フレームの前記一部領域についての前記選択された参照フレームに基づいて、少なくとも一つの前記小領域を処理させ、
    前記少なくとも一つの前記小領域の処理は、
    前記フレームの前記一部領域についての、前記複数の参照フレームから選択された一つまたはそれ以上の参照フレームの第1サブセットと、前記複数の小領域のうちの第1小領域とを、比較することと、
    前記フレームの前記一部領域についての前記選択された参照フレームに基づいて前記複数の参照フレームから選択された一つまたはそれ以上の参照フレームの第2サブセットと、前記複数の小領域のうちの第2小領域とを、比較することと
    を備え、前記第1サブセットは前記第2サブセットと異なる機器読み取り可能な媒体。
  33. 前記第1小領域は第1サイズを有し、前記第2小領域は第2サイズを有し、前記第1サイズは前記第2サイズと異なり、
    前記方法は、前記第1及び第2サイズに基づいて、前記参照フレームの第1及び第2サブセットを選択すること、を更に備える請求項1または2記載の方法。
  34. 前記第1小領域は第1サイズを有し、前記第2小領域は第2サイズを有し、前記第1サイズは前記第2サイズと異なり、
    前記参照フレームの第1及び第2サブセットは、前記第1及び第2サイズに基づいて選択される、請求項11または12記載の装置。
  35. 前記第1小領域は第1サイズを有し、前記第2小領域は第2サイズを有し、前記第1サイズは前記第2サイズと異なり、
    前記参照フレームの第1及び第2サブセットは、前記第1及び第2サイズに基づいて選択される、請求項22または23記載の装置。
  36. 前記第1及び第2サブセットの少なくともいずれか一方は、前記フレームの前記一部領域についての前記選択された参照フレームを含む、請求項1記載の方法。
  37. 前記第1及び第2サブセットの少なくともいずれか一方は、前記フレームの前記一部領域についての前記選択された参照フレームを含む、請求項11記載の装置。
  38. 前記第1及び第2サブセットの少なくともいずれか一方は、前記フレームの前記一部領域についての前記選択された参照フレームを含む、請求項22記載の装置。
  39. 前記第1及び第2サブセットは、少なくとも一つの共通の参照フレームを含む、請求項1記載の方法。
  40. 前記第1及び第2サブセットは、少なくとも一つの共通の参照フレームを含む、請求項11記載の装置。
  41. 前記第1及び第2サブセットは、少なくとも一つの共通の参照フレームを含む、請求項22記載の装置。
JP2009536382A 2006-11-02 2007-10-29 映像符号化における参照フレームのサーチを軽減する装置及び方法 Expired - Fee Related JP5259608B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/555,989 2006-11-02
US11/555,989 US8923393B2 (en) 2006-11-02 2006-11-02 Apparatus and method of reduced reference frame search in video encoding
PCT/US2007/082809 WO2008057819A2 (en) 2006-11-02 2007-10-29 Apparatus and method of reduced reference frame search in video encoding

Publications (2)

Publication Number Publication Date
JP2010509850A JP2010509850A (ja) 2010-03-25
JP5259608B2 true JP5259608B2 (ja) 2013-08-07

Family

ID=39365206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009536382A Expired - Fee Related JP5259608B2 (ja) 2006-11-02 2007-10-29 映像符号化における参照フレームのサーチを軽減する装置及び方法

Country Status (10)

Country Link
US (1) US8923393B2 (ja)
EP (1) EP2084911A2 (ja)
JP (1) JP5259608B2 (ja)
KR (1) KR101184245B1 (ja)
CN (1) CN101529919A (ja)
BR (1) BRPI0717889A2 (ja)
CA (1) CA2666217A1 (ja)
RU (1) RU2404535C1 (ja)
TW (1) TW200838322A (ja)
WO (1) WO2008057819A2 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8861598B2 (en) * 2008-03-19 2014-10-14 Cisco Technology, Inc. Video compression using search techniques of long-term reference memory
US8326075B2 (en) 2008-09-11 2012-12-04 Google Inc. System and method for video encoding using adaptive loop filter
US8385404B2 (en) * 2008-09-11 2013-02-26 Google Inc. System and method for video encoding using constructed reference frame
US8619856B2 (en) 2008-10-03 2013-12-31 Qualcomm Incorporated Video coding with large macroblocks
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US8265155B2 (en) * 2009-01-05 2012-09-11 Electronics And Telecommunications Research Institute Method of block partition for H.264 inter prediction
US8233534B2 (en) * 2010-04-09 2012-07-31 Newport Media, Inc. Frame buffer compression and memory allocation in a video decoder
US8503528B2 (en) 2010-09-15 2013-08-06 Google Inc. System and method for encoding video using temporal filter
US8638854B1 (en) 2011-04-07 2014-01-28 Google Inc. Apparatus and method for creating an alternate reference frame for video compression using maximal differences
US9154799B2 (en) 2011-04-07 2015-10-06 Google Inc. Encoding and decoding motion via image segmentation
US8780971B1 (en) 2011-04-07 2014-07-15 Google, Inc. System and method of encoding using selectable loop filters
US8781004B1 (en) 2011-04-07 2014-07-15 Google Inc. System and method for encoding video using variable loop filter
US8780996B2 (en) 2011-04-07 2014-07-15 Google, Inc. System and method for encoding and decoding video data
US8885706B2 (en) 2011-09-16 2014-11-11 Google Inc. Apparatus and methodology for a video codec system with noise reduction capability
US20150022626A1 (en) * 2012-02-10 2015-01-22 Ibrahim Nahla Data, Multimedia & Video Transmission Updating System
US9131073B1 (en) 2012-03-02 2015-09-08 Google Inc. Motion estimation aided noise reduction
WO2013162980A2 (en) 2012-04-23 2013-10-31 Google Inc. Managing multi-reference picture buffers for video data coding
US9609341B1 (en) 2012-04-23 2017-03-28 Google Inc. Video data encoding and decoding using reference picture lists
US9014266B1 (en) 2012-06-05 2015-04-21 Google Inc. Decimated sliding windows for multi-reference prediction in video coding
US9344729B1 (en) 2012-07-11 2016-05-17 Google Inc. Selective prediction signal filtering
WO2014124215A2 (en) * 2013-02-07 2014-08-14 Services Petroliers Schlumberger Borehole image compression
CN103200408B (zh) * 2013-04-23 2016-03-30 华录出版传媒有限公司 一种视频编解码方法
US9756331B1 (en) 2013-06-17 2017-09-05 Google Inc. Advance coded reference prediction
US10102613B2 (en) 2014-09-25 2018-10-16 Google Llc Frequency-domain denoising
US20160323599A1 (en) * 2015-04-29 2016-11-03 Arris Enterprises Llc Reference picture selection for inter-prediction in video coding
CN116684610A (zh) * 2023-05-17 2023-09-01 北京百度网讯科技有限公司 确定长期参考帧的参考状态的方法、装置及电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR950014862B1 (ko) 1992-02-08 1995-12-16 삼성전자주식회사 움직임추정방법 및 그 장치
JP2003284091A (ja) 2002-03-25 2003-10-03 Toshiba Corp 動画像符号化方法及び動画像符号化装置
JP4841101B2 (ja) * 2002-12-02 2011-12-21 ソニー株式会社 動き予測補償方法及び動き予測補償装置
MXPA05007453A (es) 2003-01-10 2005-09-12 Thomson Licensing Sa Toma de decision en modo rapido para codificacion inter-estructura.
KR100510137B1 (ko) 2003-04-30 2005-08-26 삼성전자주식회사 고속 움직임 추정을 위한 참조 픽쳐 및 블록 모드 결정방법, 그 장치, 블록 모드 결정 방법 및 그 장치
WO2005094083A1 (en) 2004-03-29 2005-10-06 Koninklijke Philips Electronics N.V. A video encoder and method of video encoding
JP5018085B2 (ja) 2004-06-29 2012-09-05 ソニー株式会社 動き予測補償方法及び動き予測補償装置

Also Published As

Publication number Publication date
US20080130755A1 (en) 2008-06-05
TW200838322A (en) 2008-09-16
KR20090085667A (ko) 2009-08-07
EP2084911A2 (en) 2009-08-05
US8923393B2 (en) 2014-12-30
WO2008057819A3 (en) 2008-08-07
BRPI0717889A2 (pt) 2013-11-05
CA2666217A1 (en) 2008-05-15
KR101184245B1 (ko) 2012-09-21
JP2010509850A (ja) 2010-03-25
RU2404535C1 (ru) 2010-11-20
WO2008057819A2 (en) 2008-05-15
CN101529919A (zh) 2009-09-09

Similar Documents

Publication Publication Date Title
JP5259608B2 (ja) 映像符号化における参照フレームのサーチを軽減する装置及び方法
US7120197B2 (en) Motion compensation loop with filtering
KR101024231B1 (ko) 비디오 압축에서의 강화된 프레임 보간의 장치 및 방법
RU2377737C2 (ru) Способ и устройство для преобразования с повышением частоты кадров с помощью кодера (ea-fruc) для сжатия видеоизображения
KR100866293B1 (ko) 예측 프레임에서의 가중 예측을 위한 방법 및 장치
US20100166073A1 (en) Multiple-Candidate Motion Estimation With Advanced Spatial Filtering of Differential Motion Vectors
US20150172687A1 (en) Multiple-candidate motion estimation with advanced spatial filtering of differential motion vectors
KR20080068716A (ko) 비디오 스트리밍에서 샷 검출을 위한 방법 및 장치
KR20070117660A (ko) 컨텐트 적응적 멀티미디어 처리
KR20050045746A (ko) 계층 구조의 가변 블록 크기를 이용한 움직임 추정 방법및 장치
JP2004032718A (ja) フェーディング推定/補償によりビデオフレームを処理するシステムおよび方法
US20140355678A1 (en) Methods, apparatuses, and programs for encoding and decoding picture
US20070133689A1 (en) Low-cost motion estimation apparatus and method thereof
KR20090046812A (ko) 비디오 압축 방법
US10148954B2 (en) Method and system for determining intra mode decision in H.264 video coding
Fogg et al. ISO/IEC software implementation of MPEG-1 video
Kim et al. Reduced 4x4 Block Intra Prediction Modes using Directional Similarity in H. 264/AVC
JP2002516529A (ja) ピクチャシーケンスとして構成された情報ストリームの符号化
Khan et al. Efficient scheme for motion estimation and block size mode selection in H. 264

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110801

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110809

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111109

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111116

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111209

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111216

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120110

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120117

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120717

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121017

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121024

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121119

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121127

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130326

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130424

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160502

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees