JP2009510935A - マルチメディア符号化のためのモード選択技術 - Google Patents

マルチメディア符号化のためのモード選択技術 Download PDF

Info

Publication number
JP2009510935A
JP2009510935A JP2008533637A JP2008533637A JP2009510935A JP 2009510935 A JP2009510935 A JP 2009510935A JP 2008533637 A JP2008533637 A JP 2008533637A JP 2008533637 A JP2008533637 A JP 2008533637A JP 2009510935 A JP2009510935 A JP 2009510935A
Authority
JP
Japan
Prior art keywords
mode
multimedia
block
inter
modes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008533637A
Other languages
English (en)
Other versions
JP5301277B2 (ja
Inventor
ティアン、タオ
ラビーンドラン、ビジャヤラクシュミ・アール.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2009510935A publication Critical patent/JP2009510935A/ja
Application granted granted Critical
Publication of JP5301277B2 publication Critical patent/JP5301277B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本開示は、マルチメディアシーケンスのマルチメディアフレームのマクロブロック(または別のブロック)の符合化を行っている最中にモード選択決定を向上させる技術について記述する。モーションサーチ中に、マクロブロックの符合化モードを決定することで、所望の符合化速度と許容可能なレベルの歪み(即ち、許容可能なレート歪み)を達成することができる。この技術は、マルチメディアフレームのマクロブロックのための少なくとも2組の実施可能なマルチメディア符合化モードの中から1組のマルチメディア符合化モードを、マクロブロックに関連した詳細なメトリックと、マクロブロックに近傍したブロックに関連するモード情報とに基づいて選択することを含んでいてもよい。

Description

関連技術
(特許法第35条119項に基づく優先権主張)
本出願は、2005年9月27日提出の仮出願第60/721,418号、「仮説検定に基づいた高速インターモード決定(FAST INTER MODE DECISION BASED ON HYPOTHESIS TEST)」の優先権を主張する。
本開示は、マルチメディア符号化に関し、より具体的にはマルチメディアシーケンスのフレーム内のマクロブロックの符号化モードの選択に関する。
マルチメディア機能は、ディジタルテレビ、ディジタルダイレクト放送システム、無線通信デバイス、パーソナルディジタルアシスタント(PDA)、ラップトップコンピュータ、デスクトップコンピュータ、ディジタルカメラ、ディジタル記録デバイス、セル式電話または衛星無線電話などを含む幅広い範囲の装置に組み込むことができる。ディジタルマルチメディア符合化は、フルモーションマルチメディアシーケンスを作成、変更、送信、格納、記録、再生する上で、従来のアナログシステムを著しく向上させることができる。例えば放送ネットワークはマルチメディア符合化を使用することで、無線加入者デバイスへの、マルチメディアシーケンスの1または複数チャネルの配信を促進することができる。
ディジタルマルチメディアシーケンスを符合化するために、多数かつ多様なマルチメディア符合化標準が確立されてきた。例えば、動画エキスパートグループ(MPEG)は、MPEG−1、MPEG−2、MPEG−4を含む多数の標準を開発してきた。これ以外の標準には、国際電気通信連合(ITU)のH.263標準、カリフォルニア州キューパティーノにあるアップルコンピュータ社(Apple Computer)が開発したQuickTime(登録商標)技術、ワシントン州レッドモンドにあるマイクロソフト社(Microsoft Corporation)Video for Windows(登録商標)、インテル社(Intel Corporation)が開発したIndeo(商標)、ワシントン州シアトルにあるリアルネットワーク社(RealNetworks、Inc.)からのRealVideo(登録商標)、スーパーマック社(SuperMac,Inc.)が開発したCinepak(登録商標)が含まれる。さらに、新しいITU H.264標準および多数の占有された標準を含む新規の標準の出現および発展が後を切らない。ITU H.264標準はまた、MPEG−4のパート10「アドバンスト・オーディオ・コーディング」にて述べられている。
多くのマルチメディア符合化標準が、マルチメディアフレームの効果的な送信を行うために送信されるべきデータの全体容量を低減するデータ圧縮をサポートしている。例えば、MPEG標準、ITU H.263標準およびITU H.264標準は、フレーム間圧縮を提供するために、時間または空間フレーム相関と呼ばれる連続したビデオフレーム間の類似性を利用した符合化技術をサポートする。このようなフレーム間圧縮は、典型的には、モーションサーチと動き補正符合化技術を介して達成される。これに加えて、いくつかのマルチメディア符合化技術は、空間またはイントラフレーム相関と呼ばれるフレーム内の類似性を利用してビデオフレームの圧縮を行う。
殆どのフレーム間圧縮技術は、マルチメディアフレームをデータのブロックに分割して、これらのブロックを同じマルチメディアシーケンス内の別のフレームのブロックと相関させるブロックベースの符合化を利用する。現在のブロックと別のフレームに予測されるブロックとの差を符合化することにより、データ圧縮が達成される。典型的に、エンコーダは、送信するマルチメディアフレームを、「マクロブロック」と呼ばれる複数ブロックのデータに分割する。このマクロブロックがさらにパーティションまたはサブパーティションに細分されてもよい。ITU H.264標準は、16×16マクロブロック、16×8パーティション、8×16パーティション、8×8パーティション、8×4サブパーティション、4×8サブパーティション、4×4サブパーティションをサポートする。他の標準は、サイズの異なるブロック、マクロブロック、パーティションおよび/またはサブパーティションをサポートすることができる。
エンコーダは、マルチメディアフレーム内の各ブロック(マクロブロック、パーティション、サブパーティション)について、1以上の直前のビデオフレーム(または後続のフレーム)の類似したサイズのブロックを探索することにより、「予測ブロック」と呼ばれる類似したブロックを識別する。現在のビデオブロックを、別フレームのビデオブロックと比較する処理は、一般にモーションサーチと呼ばれている。符合化する所与のブロックに「予測ブロック」が識別されると、エンコーダが、現在のブロックと予測ブロックとの間の差を符合化することができる。この、現在のブロックと予測の間の差を符合化する処理は、動き補正と呼ばれる処理を含んでいる。動き補正は、符合化する現在のブロックと予測ブロックとの間の差を示す差分ブロックを作り出すことを含む。具体的には、動き補正とは 運動ベクトル使用して予測ブロックを取り出し、次に、入力ブロックから予測ブロックを減算して差分ブロックを生成する作用を指すことが普通である。
動き補正が差分ブロックを作成した後に、一般には、差分ブロックの符合化をさらに進めるための一連の追加の符合化ステップが実行される。これらの追加的ステップは、離散コサイン変換、スカラ量子化、ラスタ/ジグザグ並べ替え、ランレングス符合化、ホフマン符合化などを含む。符合化された差分ブロックは、先行フレーム(または後続フレーム)からのどのブロックを符合化に使用したかを示す運動ベクトルと共に送信することができる。デコーダは、この運動ベクトルと符合化された差分ブロックを受信し、受信した情報を復号してマルチメディアシーケンスを再現する。
符合化処理を向上させるために、多くの場合、モーションサーチ処理中にモード決定が行われる。これらのモード決定は、レート制御アルゴリズムの一部であってよく、また、どのようにマクロブロックを分割または細分して所望の速度歪みバランスを確実に達成するかを決定するために使用できる。本開示では、「モード選択」という表現は、マクロブックなどの1以上の実施可能な符合化モードの選択を指す。例えば、マクロブロックは1個の16×16ブロックに符合化されるべきかどうか、あるいは、マクロブロックに2個またはこれ以上のパーティションまたはサブパーティションを定義すべきかどうかを指す。残念なことに、ビデオシーケンスの全てのマクロブロックに対して実施可能な全ての符合化モードの全探索を行うことは、多くのデバイスまたはマルチメディア符合化状況について計算上禁止されている。
本開示は、マルチメディアシーケンスのマルチメディアフレームのマクロブロック(またはマルチメディアデータの別サイズのブロック)を符合化している最中にモード選択決定を向上させる技術について記述する。モーションサーチ中に、マクロブロックの符合化モードを決定することができるので、所望の符合化レートと許容可能なレベルの歪み(即ち、許容可能なレート歪み)を達成することができる。本開示は、そうでなければ実行されたであろうマクロブロックの非常に起こりそうにもないモードに関連したモード探索をおそらく排除するために、マルチメディアシーケンスに対して実行できる事前処理手順について記述する。
この技術は、各マクロブロックに対して詳細なメトリックを利用してもよく、また、この詳細なメトリックは、所与のマクロブロックを均一な視覚的品質で符合化するのに必要なビット数に関連する。この技術は、2組またはこれ以上の組のモードを定義してもよく、また、これらの組の一方を選択することができる。したがって、選択されていない組のモードは、その組のモードが所与のマクロブロックにとって非常にありそうもないものである場合には、排除することができる。いくつかのケースでは、この技術は詳細なメトリックを含んだ確率方程式を使用する。本開示では、2組のモード(インタープレナー、インターディテール)の例を定義しているが、本開示の技術は必ずしもこれに限定されるものではない。
記述した技術は、隣接するブロックに関連したモード情報を決定してもよく、また、このモード情報を使用することにより現在のマクロブロックのモード選択が向上する。さらに、各モード選択に続いて確率方程式内の統計値を更新することができる。この確率方程式への更新は、後続のマクロブロックのモード選択決定に使用することができる。マルチメディアシーケンスのフレーム中のマクロブロックのモード選択の間に確率方程式の統計値を更新することにより、この技術はマルチメディアシーケンスのコンテンツに適合してもよく、これによりマルチメディアシーケンスに対してモード選択が向上する。
いくつかの実施形態では、本開示はマルチメディアデータの処理方法を提供し、この処理方法は、1ブロックのマルチメディアフレームの少なくとも2組の実施可能なマルチメディア符合化モードの中から、1組のマルチメディア符合化モードを、ブロックに関連した詳細なメトリックと、ブロックに隣接したブロックに関するモード情報とに基づいて選択することを備えている。
いくつかの実施形態では、本開示はマルチメディアデータを処理する装置を提供し、この装置は、1ブロックのマルチメディアフレームのための少なくとも2組の実施可能なマルチメディア符合化モードの中から1組のマルチメディア符合化モードを、ブロックに関する詳細なメトリックと、ブロックに隣接するブロックに関連したモード情報とに基づいて選択するエンコーダを備える。
いくつかの実施形態では、本開示はマルチメディアデータを処理するプロセッサを提供し、このプロセッサは、マルチメディアフレームのブロックのための少なくとも2組の実施可能なマルチメディア符合化モードからマルチメディア符合化モードを、ブロックに関連した詳細なメトリックと、ブロックに隣接するブロックに関連したモード情報とに基づいて選択するように構成されている。
いくつかの実施形態では、本開示はマルチメディアデータを処理する装置を提供し、この装置は、1ブロックのマルチメディアフレームについて、少なくとも2組の実施可能なマルチメディア符合化モードの中から1組のマルチメディア符合化モードを、ブロックに関する詳細なメトリックと、ブロックに隣接するブロックに関連したモード情報とに基づいて選択する手段を備える。
本明細書で記述した技術は、ハードウェア、ソフトウェア、ファームウェア、またはこれらの任意の組み合わせにおいて実現することができる。ソフトウェアにて実現する場合には、このソフトウェアはディジタル信号プロセッサ(DSP)または別タイプのプロセッサ上で実行される。この技術を実行するソフトウェアは、まず、コンピュータ読み取り可能媒体のような機械読み取り可能媒体内に格納され、次に、プロセッサ、装置、またはこれ以外の機械内でロードおよび実行されることで、本明細書で記述したモード選択が可能となる。
したがって、本開示はまた、マルチメディアフレームのブロックの少なくとも2組の実施可能なマルチメディア符合化モードの中から1組のマルチメディア符合化モードを、ブロックに関連した詳細なメトリックと、このブロックに隣接したブロックに関連するモード情報とに基づいて、機械に選択させる実行時にマルチメディアデータを処理する命令を備えた機械読み取り可能媒体を意図する。
様々な実施形態の追加の詳細について、添付の図面と以降の記述にて述べる。これ以外の特徴、目的、利点は記述、図面、請求項から明白となる。
詳細な説明
本開示は、マルチメディアシーケンスのマルチメディアフレームのマクロブロックなどの符号化中におけるモード選択決定を向上させる技術について記述している。本開示では、用語「モード選択」は、マクロブックまたは別サイズのマルチメディアデータブロックの1以上の実施可能な符号化モードの選択を指し、例えば、マクロブロックを1つの16×16ブロックと符号化するべきか、あるいはマクロブロックに2つまたはこれ以上のパーティションまたはサブパーティションを定義すべきかを指す。このようなモード決定はモーションサーチ処理中に行われることが多く、また、一連のフルマルチメディアフレームの1フレームに対して望ましいレート歪みのバランスを確保するために、マクロブロックをどのように分割あるいは細分するべきかを決定するためのレート制御アルゴリズムの一部であってよい。マクロブロックに選択したモードは、一般には、パーティションおよび/またはサブパーティション、即ちパーティション、サブパーティション、あるいは、パーティションおよびサブパーティションに関連したマクロブロックの粒度を定義する。しかし、本開示のモード選択技術は必ずしも具体的なサイズの任意のマクロブロック、ブロック、パーティション、サブパーティションに限定されるものではない。
本開示によれば、モーションサーチの最中に、マルチメディアシーケンスに対して事前処理手順を実行することで、マクロブロックの非常にありそうもないモードに関連したモード検索を排除できる。記載された技術は、各マクロブロックに詳細なメトリック(metric)を利用でき、またこの詳細なメトリックは、所与のマクロブロックを均一な視覚的品質で符号化すべきビット数に関連していてよい。この技術はまた、隣接するブロックに関連したモード情報であってよく、さらに、このモード情報を使用して現在のマクロブロックのモード選択を向上させることができる。
この技術は少なくとも2組のモードを定義し、これらの組のうち一方を選択することができる。本開示では、2組のモード(インタープレナー、インターディテール)の一例を定義しているが、本開示の技術はこれに限定されるものではない。いずれのケースでも、選択されなかった組のモードは、その組のモードが所与のマクロブロックにとって非常にありそうもないとき、このモードは考慮の対象から排除される。この技術は、詳細なメトリックと、近隣のブロックに関するモード選択情報とを含んだ確率方程式を使用することができる。
さらに、確率方程式における統計値を各モード選択に従って更新することができ、また、確率方程式への更新を使用して後続のマクロブロックのモード選択決定を行うことができる。こうすることで、マルチメディアシーケンスに対してモード選択を向上させる目的で、本技術を、所与のマルチメディアシーケンスの概念に適合することが可能になる。
図1は、例証的なマルチメディア符号化デバイス10を図示したブロック図である。マルチメディア符号化デバイス10は、符号化およびビデオデータの送信のディジタルビデオデバイス概念の一部を形成してもよい。一例として、マルチメディア符号化デバイス10は、無線加入者デバイスへのマルチメディアシーケンスの1以上のチャネルを放送するための放送デバイスを備えることができる。別の例では、マルチメディア符号化デバイス10は、例えばビデオ電話(VT)または他のマルチメディアアプリケーションを容易にするために、マルチメディアシーケンスを他のデバイスに通信することが可能な無線ハンドヘルド式ユニットを備えることができる。
図1に示すように、マルチメディア符号化デバイス10は、本明細書で記述している1以上の技術を使用してマルチメディアシーケンスを符号化するマルチメディアエンコーダ12を含む。これに加え、マルチメディア符号化デバイス10はこれ以外の多数のコンポーネントを含むことができ、例えば、マルチメディアシーケンスを捕獲するビデオキャプチャデバイス14、マルチメディアシーケンスを格納またはおそらくはアーカイブするメモリ16、符号化したマルチメディアシーケンスを他のデバイスへ送信する送信機18を含むことができる。しかし、これら追加のコンポーネントのいくつかまたは全ては、デバイス10において任意である。マルチメディアエンコーダ12、ビデオ捕獲デバイス14、メモリ16、送信機18は、通信バス15などによって通信可能に結合される。
マルチメディアシーケンスは、ビデオ捕獲デバイス14によって捕獲され、メモリ16から検索され、または別の方法で取得されてもよい。いずれのケースでも、マルチメディア符号化デバイス10のマルチメディアエンコーダ12はマルチメディアシーケンスを符号化するために使用でき、また、この符号化処理を向上させるために、本開示の技術のうち1以上の技術を実現することが可能である。マルチメディア符号化デバイス10は、ディジタル放送システム、ディジタルテレビ、無線通信デバイス、パーソナルディジタルアシスタント(PDA)、ラップトップコンピュータ、デスクトップコンピュータ、ディジタルカメラ、ディジタル記録装置、セル式電話または衛星無線電話のようなデバイス、あるいは、マルチメディア符号化能力を含んだ任意のデバイスにて実現することができる。マルチメディア符号化デバイス10は、MPEG−4、ITU−T H.263、ITU−T H.264、またはこれ以外の、マルチメディアシーケンスのフレーム内のデータのマクロブロックに使用可能ないくつかの符号化モードを提供する符号化基準のようなマルチメディア符号化基準に準拠していてよい。
マルチメディアエンコーダ12は、いわゆる「チップ組」を備えることができ、また、ハードウェア、ソフトウェア、ファームウェア、および/または1以上のマイクロプロセッサ、ディジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラム可能ゲートアレイ(FPGA)、またはこれらの様々な組み合わせを含んでいてよい。マルチメディアエンコーダ12は、ディジタルマルチメディアシーケンスを符号化および復号化するエンコーダ/デコーダ(CODEC)を備えていてもよい。さらに、いくつかのケースでは、マルチメディアエンコーダ12の機能性の全体または一部は、ソフトウェアによって実現されていてもよい。したがって、本開示はまた、実行されると本明細書で記述した技術を機械(プロセッサまたはDSPのような装置)に実行させる命令を備えた機械読み取り可能媒体についても意図する。
マルチメディアエンコーダ12は、モード選択技術を、相互符号化中にモーションサーチ処理の一部として実行するモード選択ユニット20を含む。マルチメディアエンコーダ12はモーションサーチ器/空間推定器22を含み、これらは統合体または分離体であってよい。マルチメディアエンコーダ12はまた、統合体または分離体であってよい動き補償器/イントラ予測ユニット24を含む。探索スペース25は、予測ベース符号化に使用されるデータを格納するためのメモリユニット、例えば、典型的にはマルチメディアシーケンスの先行フレーム、または先行フレームの一部を表す。最後に、マルチメディアエンコーダ12は、モーションサーチ処理および動き補正処理中に生成された残留ブロックに対して1以上の残留符号化処理を実行する残留(residual)符号器26を含む。
符号化処理中に、モーションサーチ器/空間推定器22が、データの現在のマルチメディアブロックを様々な探索スペース25内のブロックと比較することにより、予測ブロックを識別する。一般的に、モーションサーチ器/空間推定器22は、フレーム間符号化にモーションサーチを実行するモーションサーチ器、フレーム内符号化に空間推定を実行する空間推定器、またはモーションサーチと空間推定を実行できる組み合わせユニットを表す。一般に、予測ブロックは、フレーム間相関(または、フレーム内相関)を目的とした、データの現在のマルチメディアブロックとの適切な一致を提供することがわかった候補ブロックであり、これは探索空間内で最も一致に近い候補であってよい。予測ブロックは、モーションサーチ中に評価される、探索空間25内の多数の候補ブロックのうちの1つである。フレーム内符号化では、モーションサーチ処理は、典型的にマクロブロックの各パーティションおよびサブパーティションに関連して実行される。本開示の技術は、所与のマクロブロックを符号化するためのモード(これはパーティションとサブパーティションの数および形状を定義する)の識別を補助することができる。
符号化するデータの現在のマルチメディアブロックと、探索空間内の候補ブロックとの間を比較するために、モーションサーチ器/空間推定器22は絶対差の合計を求める(SAD)の技術、平方差の合計を求める(SSD)技術、またはこれ以外の、ブロックに関する画素強度値への比較技術を実行できる。こうすることで、モーションサーチ器/空間推定器22が異なる候補ブロックの差分値を決定することができる。一般に、低い差分値は、候補ブロックが符号化されているブロックにより一致し、したがって、高い差分値を生産する他の候補ブロックよりも、モーションサーチ符号化への使用に適した候補であることを示す。適切な一致があれば、データの予測ブロックが識別されてもよい。
モーションサーチ器/空間推定器22によるブロックの識別が終わると、動き補償器/イントラ予測ユニット24が剰余を作成する。この剰余は、符号化する現在のマルチメディアブロックとモーションサーチまたは空間推定によって識別された予測ブロックとの間の差分を表す1ブロックのデータである。一般に、動き補償器/イントラ予測ユニット24は、フレーム内符号化に動き補正を実行する動き補償器、フレーム間符号化に空間補正を実行するイントラ予測ユニット、または、フレーム内またはフレーム間符号化のどちらが使用されているかに応じて、動作不補正またはイントラ予測のいずれかを実行できるユニットの組み合わせを示す。動き補正/イントラ予測ユニット24は、運動ベクトルを使用して探索空間25から予測ブロックを取り出し、次に入力ブロックから予測ブロックを減算して剰余を生成する。典型的に、この剰余は、差分ブロックで表されるオリジナルのビデオブロックよりも実質的に低いデータを含み、したがってデータの比較が生じる。
動き補償器/イントラ予測ユニット24によって剰余が作成された後に、例えば、残留符号器26は1以上の残留符号化ステップ、例えば離散コサイン変換(DCT)、ジグザグ走査、ランレングス符号化、可変長(「ハフマン」)符号化、またはこれ以外の、所与の符号化基準に使用される任意の処理を実行することができる。これ以外の多数の残留符号化ステップの実行も可能である。モーションサーチ処理、動き補正処理、残留符号化処理は、所与のマクロブロックの選択されたモードによって定義された各ブロック(即ち、各マクロブロック、パーティションおよび/またはサブパーティション)に関連して実行される。
本開示によれば、各マクロブロックにとって非常にありそうもないモードに関連したモード探索を排除するために、モーションサーチの最中に、モード選択ユニット20が、マルチメディアシーケンスのフレームのマクロブロックに事前処理手順を実行する。特に、モード選択ユニット20がすべてのマクロブロックに対して詳細なメトリックを定義し、この詳細なメトリックは所与のマクロブロックが一定の視覚的品質で符号化される必要があるビット数に関連していてもよい。モード選択ユニット20はまた、そのようなモード選択を実行する際に隣接ブロックのモードをも考慮する。モード選択20は、2組またはこれ以上のモードの組を定義してもよく、これらの組の1つを選択することができる。1例として、モード選択ユニット20はモードのインタープレナーセットと、モードのインターディテールセットを定義できる。インタープレナーモードはマクロブロックモードを含んでおり、このマクロブロックモードでは、マクロブロックが1個の16×16パーティション(インター16×16モード)、2個の16×8パーティション(インター16×8モード)、または2個の8×16パーティション(インター8×16モード)を含む。インタープレナーモードはまた、そのマクロブロックについて符号化がスキップされる「SKIP」モードを含んでいてよい。その一方で、インターディテールモードはマクロブロックモードを含んでおり、このマクロブロックモードは、マクロブロックが4個の8×8パーティション(インター8×8モード)、1または複数個の8×4サブパーティション(インター8×4モード)、1または複数個の4×8サブパーティション(インター4×8モード)、あるいは1または複数個の4×4サブパーティション(インター4×4モード)を含んでいる。
インターディテール内の実施可能なモードの実数は、多くのパーティションおよびサブパーティションの組み合わせと副組み合わせにより相対的に大きい。しかし、実験的研究は、殆どのマルチメディアシーケンス内の95%以上のマクロブロックは、16×16個、16×18個、8×16個、8×8個のパーティションによって符号化される。そのため、典型的に、5%未満のマクロブロックはサブパーティションレベルにて符号化される。実施可能なすべてのモード(パーティションおよびサブパーティションの実施可能なすべての組み合わせ)を探索するために、5%未満のマクロブロックが実際にこれらのモードを使用するけれども、時間の90%以上を小型のサブパーティションを含むモードの探索に費やしてもよい。本開示は、サブパーティションを使用しない可能性が非常に高いと考えられる時を決定する統計的な確率技術を採用する。こうしたケースでは、サブパーティションを含むこのようなモードの探索を回避できる。
したがって、モード選択ユニット20は確率方程式を使用してもよい。確率方程式は変数として、時間帯域幅比率メトリックの形式の詳細なメトリック、隣接するブロックに関連したモード情報を含んでいてよい。詳細なメトリックは、マクロブロック内の時間および空間的詳細を表してもよい。隣接するブロックに関連したモード情報に、現在のブロックへの時間および/または空間的な近接に基づいて重み付けしてもよい。例えば、隣接するブロックのモード情報に対して、モード選択ユニット20は、異なるサブセットのブロック間の時間差により、フレーム内の第1サブセットのブロックのモード情報を、別フレーム内の第2サブセットのブロックのモード情報とは異なるように重み付けしてもよい。いずれの場合にも、詳細なメトリックと、隣接するブロックに関連したモード情報は、現在のマクロブロックのモード選択を向上させるために分析することができる。
確率方程式における統計は、各マクロブックの各モード選択に従って更新することができ、また、確率方程式の更新を後続のマクロブックのモード選択決定に使用することができる。こうすることで、モード選択ユニット20は、全動作マルチメディアシーケンスに対するモード選択を改良するために所定のシーケンスのコンテンツに適応できる。最終的に、モード選択ユニット20は、選択された実施可能なマルチメディア符号化モードの組から、それぞれのマクロブロックを符号化するためのモードを選択する。多くのケースでは、本明細書で記述した技術は、選択されていないマルチメディア符号化モードの組におけるマクロブロックのモードに関連したモーションサーチの回避を補助することができる。
図2は、モード選択ユニット20によって実施されてもよいモード選択処理のツリー線図である。具体的には、モード決定32は、イントラ符号化34または内部符号化36のいずれを使用するかの決定を含んでいてもよい。イントラ符号化34を使用する場合には、モード選択ユニット20は、マクロブロックを16×16ブロック(33)として、または4×4ブロックの組(35)に符号化するかどうかを決定し、また、この決定は、マクロブロック内のコンテンツのレベル、および所望のレート歪みのレベルによって影響を受けてもよい。
内部符号化36を使用する場合には、モード選択ユニット20は、イントラプレーナモード37またはイントラディテールモード38のどちらを使用するかを決定する。この場合も先と同様に、これは、例えばイントラプレーナモード37が選択されたとき詳細なサブパーティション探索を回避することにより、著しく簡単にモード探索できる。このモード選択処理は、符号化処理における符号化レートと歪みレベルをバランスさせることにより、符号化されたシーケンスの相対的に一定のマルチメディア品質を達成するために使用されるレート制御アルゴリズムの一部を形成してもよい。
本開示のモード選択技術は、具体的には、内部符号化中のモーションサーチ処理に関連した事前処理処置の最中に適用される。図3は、これに関連して実行できる技術を図示したフロー線図である。図に示すように、モード選択ユニット20は、モード選択処理(42)に関連した統計を初期化する。例えば、この統計は、装置製造の期間に処理されるマルチメディアフレームの非常に大きなサンプルに対して平均モード関連統計値をアクセスすることによりイニシャライズされる確率方程式を含んでいてもよい。この初期化方程式は、例えば、試験系列のシミュレーションに基づいてプログラムしてもよいが、しかし、マルチメディア符号化デバイス10によって先に実行された符号化処理を反映するよう更新されていてもよい。
次に、モード選択ユニット20は、確率(43)に基づくマルチメディアシーケンスのフレームのマクロブロックのための1組のモードを選択する。この確率は確率方程式として表すことができ、また、この方程式は、マクロブロック内の時間的および空間的詳細と、このマクロブロック近隣のブロックに関連したモード情報とを示す詳細なメトリックを含んでいてもよい。1つの具体的で例証的な例は、複数のモードが、内部符号化のための実施可能な2組のモード、即ち1組のインタープレナーモードと1組のインターディテールモードに分割される。いくつかのケースでは、インタープレナーモードの組が選択されると(45)、インターディテールモードに関連した別のモードを無視できる。いくつかの場合において、インターディテールモードの組が選択されると(46)、インタープレナーモードに関連する他のモードを無視することができる。以下で述べるいくつかのケースでは(図3には示していない)、インターディテールの組とインタープレナーの組の両方の実施可能な各モードを探索するために、包括的な探索が望ましい。換言すれば、図3はインタープレナーモードとインターディテールモードを示しているが、例えば、インタープレナーモードまたはインターディテールモードを統計的に排除することが困難であるいくつかのケースでは、全てのモードのフル検索が実行される。この観念において、図3は、インターディテールモードまたはインタープレナーモードのいずれかが選択されるシナリオを単純に図示しているが、別のシナリオでは、全てのモードを選択および探索することができる。
いずれのケースでも、次に、所望のレベルのレート歪み(48)を達成するために、モード選択ユニット20は、所与のマクロブロックに対して所望のモードを選択する。このケースでは、実施可能なすべてのモードの包括的な探索が、インタープレナーの組またはインターディテールの組におけるこれらモードの探索のために回避された場合には、著しい量の計算が節約される。所与のマクロブロック(48)に対してモードが選択されると、モード選択ユニット20は確率統計(49)を更新し、これによりアルゴリズムが異なるコンテンツに適合するのを可能にする。モード選択処理を次のマクロブロックについて繰り返すことができ、また、これをマルチメディアシーケンスのすべてのフレームのすべてのマクロブロックについて継続させることが可能である。
本開示の技術は、具体的に、ITU H.264(また、「アドバンスト・オーディオ・コーディング」というタイトルが付けられたMPEG−4、パート10)に従ったモード決定に有用である。アドバンスト・オーディオ・コーディングでは、典型的には、モーションサーチの効率の評価後にモード内決定が実行される。しかし、アドバンスト・オーディオ・コーディングはマクロブロック内の多数の異なるブロックサイズを許容し、すべてのブロックパーティションは個々のモーションサーチに関連するため、総合的な計算複雑性が大きくなる。このケースでは、本開示の技術は、所与のマクロブロックに望ましい選択であると思われないいくつかのブロックサイズを無視することができる。
ここでも、モード選択ユニット20はマルチメディアシーケンスを事前処理することにより、すべてのマクロブロックについて時間帯域幅比率メトリックを取得する。既述のように、このメトリックは、それぞれのマクロブロックを一定の視覚的品質にて符号化するために使用されるビット数に大きく関連する。時間帯域幅比率マップの計算の1例は次式のとおりであり:
Figure 2009510935
ここで、Dcsatは感度メトリックフォームであり、Yはマクロブロックの平均輝度成分、αINTER=1は輝度平方およびDcsatの重み付け、β0interは標準化成分、MVP、MVNは現在のマクロブロックの前進運動ベクトルと後進運動ベクトル、SSDは平方差分の合計の略である。SSDが利用できない場合には、SAD2(絶対差分の合計)を代わりに使用することができる。
1例では、2つのケース(H0、H1)に「仮説」検査を定義することができる:HO:INTER−planar(INTER16×16、INTER16×8、INTER8×16、SKIPを含む)、H1:INTER−detail(INTER8×8、INTER8×4、INTER4×8、INTER4×4)。この試験は、確率に基づいて最も可能性のあるモードの組(インタープレナーまたはインターディテール)を仮定することから「仮説」試験と呼ばれる。無論、本開示の技術はさらに多くのケース、即ちさらに多くのモードの組または異なるモードの組にまで拡張することが可能である。
図4に示すように、マルチメディア符号化されたビットストリームの開始時に、モード選択ユニット20はINTER−planar52とINTER−detailのヒストグラムを初期化する。初期化されたヒストグラムは、コンテンツの異なるカテゴリのいくつかの長い試験シミュレーション系列をシミュレーションすることで得たものであってよい。工場で処理され、所与の装置10に事前に格納された試験系列を、初期化されたヒストグラムを定義するために使用されてもよい。しかし、装置10が1以上のマルチメディアシーケンスを処理すると、後続の系列の処理中に、これら追加の系列の処理も初期化されたヒストグラムに反映されてもよい。このようにして、本明細書も記載されたモード選択技術の初期化は時間に従って発展および向上してもよい。
時間帯域幅比率メトリック「b」を有した新規のマクロブロックについて、モード選択ユニット20は、図4のヒストグラムのみに基づいて確率を次式のとおり計算する:
H0(b)+H1(b)≧εである場合には、
Figure 2009510935
H0(b)+H1(b)≧εである場合には、
Figure 2009510935
ここで、εはデータの欠如を防止する小さい正数である。
マクロブロックのモードは、空間および時間的近傍と相関する。すなわち、一般的に、空間および時間的に近傍したマクロブロックについて類似のモードを維持することが望ましい。こうした空間および時間的近傍のモードはマクロブロックモードマップを定義してもよい。スムーズなマクロブロックモードマップを維持することで、マクロブロック符号化されたモードを表すために使用されるビットを減らすことができる。
図5からわかるように、現在のマクロブロックは、マクロブックがフレームの角にあるか、フレームの境界線上にあるか、またはフレーム内にあるかに応じて4〜9個の近傍を有することができる。図5に示す近傍の中でも、上方左(UL)、上方(U)、上方右(UR)、左(L)は、現在のフレーム内で決定された、すなわちフレーム内の空間近傍から決定されたモードを有する。中央(C)、右(R)、左下(BL)、下(B)、右下(BR)のモードは、先行のフレームから、即ち近傍フレーム内の空間的近傍から取得できる。
[0055]モード選択ユニット20は次式を計算してもよい。
=2×(I(MUL=INTERplanar)+I(M=INTERplanar)+I(MUR=INTERplanar)+(I(M=INTERplanar)+I(M=INTERplanar))+I(M=INTERplanar)+I(MBL=INTERplanar)+I(M=INTERplanar)+I(MBR=INTERplanar、さらに、
=2×(I(MUL=INTERdetail)+I(M=INTERdetail)+I(MUR=INTERdetail)+(I(M=INTERdetail)+I(M=INTERdetail))+I(M=INTERdetail)+I(MBL=INTERdetail)+I(M=INTERdetail)+I(MBR=INTERdetail、
ここで、I(・)は指標関数である。指標関数は、組のサブセット内の要素のメンバーシップ(membership)を表すことがこの組上に定義されている関数のことである。上述の例では、4個の空間的に因果関係を示す近傍(UL、U、UR、L)と、別の時間的近傍に関連して時間的な中心近傍(C)とには、これらの現在のマクロブロックに対する空間および時間的な距離により、2倍の重さが付加される。
モード選択ユニット20はまた、インタープレナーの組およびインターディテールの組内のモードの仮説的な確率を次式のとおりに決定してもよい。
Figure 2009510935
Figure 2009510935
ここで、αは、モード決定内における近傍マクロブロックモードの大きさを調整するための重み付けである。
モード選択ユニット20は、信頼レベルを「t」と定義することができる。次に、モード選択ユニット20は更新された仮説的確率を次式のとおり計算できる。
Figure 2009510935
Figure 2009510935
上述のケースでは、完全なレート歪み(R−D)探索を行わずに(w/o)1組のモードが選択される時に、計算の節約が達成されている。すべてのフレームの終わりにおいて、モード選択ユニット20は、現在のフレーム仮説確率のヒストグラムを見つけることができる。現在のフレーム仮説確率はH’0、H’1と記すことができる。したがって、長い項の仮説確率は次式によって更新できる。
Figure 2009510935
Figure 2009510935
ここで、βは更新速度を調整するための重み付けである。
計算負荷とPSNR性能の間のトレードオフを考慮することにより、モード選択ユニット20内でパラメータの組α=0.10、β=0.2、t=0.90を選択することができる。信頼レベルをさらに調整して、符合化されたマルチメディアシーケンス内に異なる数レベルの品質および複雑性を達成できる。シミュレーションの結果は、これらの技術の実施は、ほぼ0.1乃至0.14dBの無視できるPSNR損失を有する完全サーチに対して、完全にサーチされるマクロブロックの数を約1/6に低減することができることを示した。
図6は、符合化100ためのモジュールを図示したブロック線図であり、このモジュールはエンコーダを備えていてよく、また、マルチメディアデータの符合化と送信が可能なディジタルビデオデバイスの一部を形成している。符合化用モジュール100は、内部符合化中にモーションサーチ処理の一部としてモード選択技術を実行するモード選択120用のモジュールを含む。符合化用モジュール120はまた、モーションサーチ122用のモジュールと、動き補償用のモジュール124も含んでおり、これらのモジュールは、モーションサーチ器と動き補償器をそれぞれ備えていてよい。符合化用モジュール100は、メモリユニットなどであってよい格納用モジュール125を備えている。符合化用モジュール100はまた、残留符合化器を備えていてよい残留符合化126用のモジュールを含む。
符合化処理中に、モーションサーチ用モジュール122がモーションサーチ処理を実行し、動き補償用モジュール124が動き補償処理を実行する。この符合化処理で使用されるデータには格納用モジュール125からアクセスすることができる。モーションサーチ処理および動き補償処理が実行され、残留符合化用モジュール126が、残留ブロックに対して1以上の残留符合化ステップを実行する。
本開示によれば、モーションサーチの最中に、モード選択用モジュール120が、マルチメディアシーケンスのフレームのマクロブロックに対して事前処理手順を実行し、これにより、それぞれのマクロブロックの非常にありそうもないモードに関連したモード検索を排除できる。具体的には、モード選択120のモジュールはすべての内部符合化されたマクロブロックに詳細なメトリックを定義し、近傍のブロックに関連したモジュール情報を使用する。モード選択120用のモジュールは確率方程式を使用することができ、この確率方程式は詳細なメトリックと、近傍のブロックに関連したモード情報を含むことができる。
確率方程式における統計値は各マクロブロックの各モード選択に従って更新でき、この確率方程式の更新を後続のマクロブロックのモード選択決定に使用することができる。こうすることで、モード選択用モジュール120は、所与の系列のコンテンツに適合することができ、これにより、フル動作マルチメディアシーケンスに対するモード選択を向上させることができる。最終的に、モード選択用モジュール120は、それぞれのマクロブロックを符合化するモードを選択された実施可能なマルチメディア符合化モードの組の中から選択する。多くのケースにおいて、モジュール選択用モジュール120によって実行される技術は、選択されていないマルチメディア符合化モードの組の中のマクロブロックのモードに関連したモーションサーチを回避するように支援することができる。
本開示によれば、1組のマルチメディア符合化モードを選択する手段は、モード選択ユニット20(図1)または選択するモジュール120(図6)を備えていてよい。同様にモーションサーチのための手段は、モーションサーチ器/空間推定器22(図1)またはモーションサーチ用モジュール122(図6)を備えていてよい。動き補正手段は、動き補償器/内部予測ユニット24(図1)または動き補正用モジュール124(図6)を備えていてよく、さらに、残留符合化手段は、残留コーダ26(図1)または残留符合化用モジュール126(図6)を備えていてよい。格納手段は、探索空間25(図1)または格納用モジュール126(図6)を備えていてもよい。統計を更新する手段は、モード選択決定について確率方程式を更新するために使用でき、この更新手段は、任意のハードウェアソフトウェア、ファームウェアなどを備えていてよく、これらは、例えば図4に示したものと類似するヒストグラムのようなヒストグラムなどへの統計的な更新を実行するように設計またはプログラムされている。
多数の実施形態について記述してきた。具体的には、所望の符合化速度と許容可能レベルの歪み(即ち、許容可能なレート歪み)を達成するべくマクロブロックの符合化モードを決定できるよう、モーションサーチ処理に関するモード選択技術について記述した。既述のように、これらの技術は、すべてのマクロブロックと、それぞれのマクロブロックに近傍したブロックに関するモード情報のための詳細なメトリックを利用してもよい。詳細なメトリックと、近傍のブロックに関連したモード情報とを使用するために確率方程式を実施してもよい。また、確率方程式における統計を各モード選択に従って更新することで、所与の系列のコンテンツに適合させることができる。これらの技術は、少なくとも2組のモードを定義してもよく、これらのうちの1組を選択することにより、他のモード組に関連した非常にありそうもないモードに関連したモード検索を排除できる。これらの技術は、少なくとも2組のモードを定義でき、これらのうちの一方を選択することで、他方のモードの組に関連した不必要な探索を排除することができる。これらの技術はまた、16×16マクロブロック以外の他のブロックサイズにも適用できる。サポートされるブロックおよびモードのサイズは、各符合化基準によって定義される。いずれのケースでも、ブロックは、ブロックのパーティションおよび/またはサブパーティションにより定義されたいくつかの実施可能なモードを有することができ、また、本明細書で記述した技術はモード選択の向上に使用されてもよい。
本明細書で記述した技術は、ハードウェア、ソフトウェア、ファームウェア、またはこれらの任意の組み合わせにおいて実施されてもよい。ソフトウェアで実施する場合、これらの技術を、本明細書で記述の1以上の技術を実行する命令を含んだプログラムコードを備えるコンピュータ読み取り可能媒体(または別の機械読み取り可能媒体)により部分的に実現されてもよい。この場合、コンピュータ読み取り可能媒体は、同期ダイナミックランダムアクセスメモリ(SDRAM)のようなランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、不揮発性ランダムアクセスメモリ(NVRAM)、電気的に消去が可能でプログラム可能な読み出し専用メモリ(EEPROM)、FLASHメモリ、磁気または光学データ格納媒体などを備えていてよい。
命令は、1以上のプロセッサまたは他の機械、例えば1以上のディジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラム論理アレイ(FPGA)、またはこれ以外の同等の集積回路あるいは離散論理回路によって実行される。一般に、命令を実行する機械は装置を備えていてもよい。いくつかの実施形態では、本明細書で記述した機能を専用のソフトウェアモジュールまたはハードウェアモジュール、または符合化および復号化するべく構成されたユニットの内部に提供するか、あるいは、組み合わせたビデオエンコーダ/デコーダ(CODEC)に組み込むことができる。
請求項の範囲から逸脱しない限りで、記述した技術に様々な改造を加えることができる。したがって、上述した具体的な実施形態、これ以外の実施形態は請求項の範囲内に包括される。
本開示のいくつかの実施形態による例証的なマルチメディア符合化装置を図示したブロック図である。 本開示のいくつかの実施形態に一貫したモード選択処理を図示したツリー図である。 本開示のいくつかの実施形態による技術を図示したフロー図である。 本開示のいくつかの実施形態による異なる2組のモードに関連した確率のヒストグラムを示すグラフである。 本開示のいくつかの実施形態による符合化された現在のマクロブロックに対する可能な空間および/または空間的近傍を図示した概念図である。 本開示のいくつかの実施形態による例証的な符合化用モジュールを図示したブロック図である。

Claims (38)

  1. マルチメディアデータの処理方法であって、前記処理方法は、1ブロックのマルチメディアフレームの少なくとも2組の実施可能なマルチメディア符合化モードの中から、1組のマルチメディア符合化モードを、前記ブロックに関連した詳細なメトリックと、前記ブロックに隣接するブロックに関するモード情報とに基づいて選択することを備えている方法。
  2. 前記ブロックは16×16画素マクロブロックを備えている、請求項1に記載の方法。
  3. 前記マルチメディア符合化モードは、パーティション、サブパーティション、またはパーティションおよびサブパーティションに関する前記ブロックの粒度を定義する、請求項1に記載の方法。
  4. 少なくとも2組の実施可能なマルチメディア符合化モードからの選択は、1組のインタープレナーモードと1組のインターディテールモードの間の選択を備えている、請求項1に記載の方法。
  5. 前記インタープレナーモードは、インター16×16モード、インター16×8モード、インター8×16モードを備え、
    前記インターディテールモードは、インター8×8モード、インター8×4モード、インター4×8モード、インター4×4モードを備えている、請求項4に記載の方法。
  6. 前記選択は1以上の確率方程式に基づいており、前記確率方程式は、隣接するブロックに関連した詳細なメトリックと、モード情報とを変数として含む、請求項1に記載の方法。
  7. 前記マルチメディアシーケンスのフレームの後続するブロックのモード選択決定を行うために、前記1以上の確率方程式における統計値を更新することをさらに備える、請求項6に記載の方法。
  8. 前記詳細なメトリックは、前記ブロック内の時間および空間的詳細を示す、請求項1に記載の方法。
  9. 前記ブロックに隣接するブロックに関連した前記モード情報は、前記フレーム内の第1サブセットのブロックと、別のフレーム内の第2サブセットのブロックとによって定義される、請求項1に記載の方法。
  10. 前記フレーム内の前記第1サブセットのブロックに、前記別のフレーム内の第2サブセットのブロックとは異なる重み付けを行うことをさらに備える、請求項9に記載の方法。
  11. 前記選択した実施可能なマルチメディア符合化モードの組の中から、前記ブロックを符合化するためのモードを選択することをさらに備える、請求項1に記載の方法。
  12. 選択されていない1組のマルチメディア符合化モードにおいて前記ブロックのモードに関連したモーションサーチを回避することをさらに備える、請求項11に記載の方法。
  13. マルチメディアデータを処理する装置であって、前記装置は、1ブロックのマルチメディアフレームのための少なくとも2組の実施可能なマルチメディア符合化モードの中から1組のマルチメディア符合化モードを、ブロックに関する詳細なメトリックと、前記ブロックに隣接するブロックに関連したモード情報とに基づいて選択するエンコーダを備える装置。
  14. 前記ブロックは、16×16画素マクロブロックを備えている、請求項13に記載の装置。
  15. 前記マルチメディア符合化モードは、パーティション、サブパーティション、パーティションおよびサブパーティションに関連した前記ブロックの粒度を定義する、請求項13に記載の装置。
  16. 前記エンコーダは、1組のインタープレナーモードと1組のインターディテールモードのいずれかを選択することで、少なくとも2組の実施可能なマルチメディア符合化モードから選択を行い、前記インタープレナーモードは、インター16×16モード、インター16×8モード、インター8×16モードを備えており、
    前記インターディテールモードはインター8×8モード、インター8×4モード、インター4×8モード、インター4×4モードを備えている、請求項13に記載の装置。
  17. 前記エンコーダは、1以上の確率方程式に基づいて前記1組のマルチメディア符合化モードを選択し、前記1以上の確率方程式は、隣接するブロックに関連した詳細なメトリックとモード情報とを変数として備えている、請求項13に記載の装置。
  18. 前記エンコーダは、前記マルチメディアシーケンスのフレームの後続するブロックのモード選択を決定するために、前記1以上の確率方程式内の統計値を更新する、請求項17に記載の装置。
  19. 前記詳細なメトリックは、前記ブロック内の時間および空間的な詳細を表し、前記ブロックに隣接するブロックに関連した前記モード情報は、前記フレーム内の第1サブセットのブロックと、別のフレーム内の第2サブセットとによって定義される、請求項13に記載の装置。
  20. 前記エンコーダは、前記第1のサブセットのブロックに対して前記別のフレーム内の第2サブセットのブロックとは異なる重み付けをする、請求項19に記載の装置。
  21. 前記エンコーダは、選択された実施可能なマルチメディア符合化モードの組の中から、前記ブロックを符合化するモードを選択する、請求項13に記載の装置。
  22. 前記エンコーダは、選択されていないマルチメディア符合化モードの組の中のブロックのモードに関連したモーションサーチを回避する、請求項21に記載の装置。
  23. マルチメディアデータを処理するプロセッサであって、前記プロセッサは、マルチメディアフレームのブロックのための少なくとも2組の実施可能なマルチメディア符合化モードからマルチメディア符合化モードの組を、前記ブロックに関連した詳細なメトリックと、前記ブロックに隣接するブロックに関連したモード情報とに基づいて選択するように構成されている、プロセッサ。
  24. 前記ブロックは16×16画素のマクロブロックを備えている、請求項23に記載のプロセッサ。
  25. 前記マルチメディア符合化モードは、パーティション、サブパーティション、パーティションおよびサブパーティションに関連して前記ブロックの粒度を定義する、請求項23に記載のプロセッサ。
  26. 前記プロセッサは、1組のインタープレナーモードと1組のインターディテールモードの間で選択を行うことにより、少なくとも2組の実施可能なマルチメディア符合化モードから選択するように構成されており、前記インタープレナーモードはインター16×16モード、インター16×8モード、インター8×16モードを備え、前記インターディテールモードはインター8×8モード、インター8×4モード、インター4×8モード、インター4×4モードを備えている、請求項23に記載のプロセッサ。
  27. 前記プロセッサは、1以上の実施可能な方程式に基づいて1組のマルチメディア符合化モードを選択するように構成されており、前記1以上の実施可能な方程式は、隣接するブロックに関連した前記詳細なメトリックとモード情報を変数として備えている、請求項23に記載のプロセッサ。
  28. 前記プロセッサは、前記マルチメディアシーケンスのフレームの後続のブロックのモード選択を決定するために、前記1以上の実施可能な方程式内の統計値を更新するように構成されている、請求項27に記載のプロセッサ。
  29. 機械読み取り可能な媒体であって、前記媒体は命令を備え、前記命令は、1ブロックのマルチメディアフレームの少なくとも2組の実施可能なマルチメディア符合化モードから、ブロックに関連した詳細なメトリックと、前記ブロックに隣接するブロックに関連するモード情報とに基づいて、1組のマルチメディア符合化モードを機械に選択させるマルチメディアデータを処理する、機械読み取り可能媒体。
  30. 前記マルチメディア符合化モードは、パーティション、サブパーティション、パーティションおよびサブパーティションに関連してブロックの粒度を定義する、請求項29に記載の機械読み取り可能媒体。
  31. 前記命令は、1組のインタープレナーモードと1組のインターディテールモードを選択することにより、少なくとも2組の実施可能なマルチメディア符合化モードから選択を行い、前記インタープレナーモードは、インター16×16モード、インター16×8モード、インター8×16モードを含み、前記インターディテールモードは、インター8×4モード、インター4×8モード、インター4×4モードを含む、請求項29に記載の機械読み取り可能媒体。
  32. 前記命令は、1以上の実施可能な方程式に基づいて1組のマルチメディア符合化モードを選択し、前記1以上の実施可能な方程式は、前記隣接するブロックの詳細なメトリックとモード情報とを変数として備えている、請求項29に記載の機械読み取り可能媒体。
  33. 前記命令は、前記マルチメディアシーケンスのフレームの後続するブロックのモード選択決定について、1以上の実施可能な方程式内の統計値を更新する、請求項29に記載の機械読み取り可能媒体。
  34. マルチメディアデータを処理する装置であって、1ブロックのマルチメディアフレームについて、少なくとも2組の実施可能なマルチメディア符合化モードの中から1組のマルチメディア符合化モードを、前記ブロックに関する詳細なメトリックと、前記ブロックに隣接するブロックに関連したモード情報とに基づいて選択する手段を備える、装置。
  35. 前記マルチメディア符合化モードは、パーティション、サブパーティション、パーティションおよびサブパーティションに関連して前記ブロックの粒度を定義する、請求項34に記載の装置。
  36. 前記手段は、1組のインタープレナーモードと1組のインターディテールモードのいずれかを選択することにより、少なくとも2組の実施可能なマルチメディア符合化モードから選択し、前記インタープレナーモードはインター16×16モード、インター16×8モード、インター8×16モードを含み、前記インターディテールモードはインター8×8モード、インター8×4モード、インター4×8モード、インター4×4モードを含む、請求項34に記載の装置。
  37. 前記手段は、1以上の実施可能な方程式に基づいて1組のマルチメディア符合化モードを選択し、前記1以上の実施可能な方程式は、前記隣接するブロックに関する前記詳細なメトリックとモード情報とを変数として含んでいる、請求項34に記載の装置。
  38. 前記マルチメディアシーケンスのフレームの後続するブロックのモード選択決定を行うために、前記1以上の実施可能な方程式内の統計値を更新する手段をさらに備える、請求項34に記載の装置。
JP2008533637A 2005-09-27 2006-09-27 マルチメディア符号化のためのモード選択技術 Active JP5301277B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US72141805P 2005-09-27 2005-09-27
US60/721,418 2005-09-27
US11/509,214 US8446954B2 (en) 2005-09-27 2006-08-23 Mode selection techniques for multimedia coding
US11/509,214 2006-08-23
PCT/US2006/037991 WO2007038722A2 (en) 2005-09-27 2006-09-27 Mode selection techniques for multimedia coding

Publications (2)

Publication Number Publication Date
JP2009510935A true JP2009510935A (ja) 2009-03-12
JP5301277B2 JP5301277B2 (ja) 2013-09-25

Family

ID=37873111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008533637A Active JP5301277B2 (ja) 2005-09-27 2006-09-27 マルチメディア符号化のためのモード選択技術

Country Status (8)

Country Link
US (1) US8446954B2 (ja)
EP (1) EP1938617A2 (ja)
JP (1) JP5301277B2 (ja)
KR (1) KR100957316B1 (ja)
CN (1) CN101313587B (ja)
AR (1) AR055186A1 (ja)
TW (1) TW200746834A (ja)
WO (1) WO2007038722A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013125171A1 (ja) * 2012-02-20 2013-08-29 日本電気株式会社 イントラ予測モード判定装置、方法、プログラム記憶媒体
JP2017507532A (ja) * 2013-12-30 2017-03-16 グーグル インコーポレイテッド 再帰的なブロック・パーティショニング

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200627967A (en) * 2004-07-15 2006-08-01 Qualcomm Inc Methods and apparatus for spatial error concealment
US9055298B2 (en) * 2005-07-15 2015-06-09 Qualcomm Incorporated Video encoding method enabling highly efficient partial decoding of H.264 and other transform coded information
US8229983B2 (en) 2005-09-27 2012-07-24 Qualcomm Incorporated Channel switch frame
US8670437B2 (en) * 2005-09-27 2014-03-11 Qualcomm Incorporated Methods and apparatus for service acquisition
US8149909B1 (en) 2005-10-13 2012-04-03 Maxim Integrated Products, Inc. Video encoding control using non-exclusive content categories
US8081682B1 (en) * 2005-10-13 2011-12-20 Maxim Integrated Products, Inc. Video encoding mode decisions according to content categories
US8126283B1 (en) 2005-10-13 2012-02-28 Maxim Integrated Products, Inc. Video encoding statistics extraction using non-exclusive content categories
BRPI0718629A2 (pt) 2006-11-14 2013-11-26 Qualcomm Inc Sistema e métodos para comutação de canal.
WO2008061211A2 (en) * 2006-11-15 2008-05-22 Qualcomm Incorporated Systems and methods for applications using channel switch frames
KR101366241B1 (ko) * 2007-03-28 2014-02-21 삼성전자주식회사 영상 부호화, 복호화 방법 및 장치
JP5400876B2 (ja) * 2008-06-16 2014-01-29 ドルビー ラボラトリーズ ライセンシング コーポレイション ビデオ符号化のための、スライス依存性に基づくレート制御モデル適合化
US8311115B2 (en) * 2009-01-29 2012-11-13 Microsoft Corporation Video encoding using previously calculated motion information
US8396114B2 (en) * 2009-01-29 2013-03-12 Microsoft Corporation Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
PT3567852T (pt) * 2009-03-23 2023-01-11 Ntt Docomo Inc Dispositivo de descodificação de previsão de imagem e método de descodificação de previsão de imagem
CA2904730C (en) * 2009-05-29 2023-11-21 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method, and image decoding method
US8270473B2 (en) * 2009-06-12 2012-09-18 Microsoft Corporation Motion based dynamic resolution multiple bit rate video encoding
CN102474601B (zh) * 2009-06-29 2017-06-23 汤姆森特许公司 未编码语法的自适应概率更新的方法和装置
PL3457689T3 (pl) 2010-05-25 2020-12-28 Lg Electronics Inc. Nowy tryb predykcji planarnej
US8705616B2 (en) 2010-06-11 2014-04-22 Microsoft Corporation Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures
RU2619202C1 (ru) 2010-07-20 2017-05-12 Нтт Докомо, Инк. Устройство кодирования изображений с предсказанием, способ кодирования изображений с предсказанием, программа кодирования изображений с предсказанием, устройство декодирования изображений с предсказанием, способ декодирования изображений с предсказанием и программа декодирования изображений с предсказанием
US10171813B2 (en) 2011-02-24 2019-01-01 Qualcomm Incorporated Hierarchy of motion prediction video blocks
GB2494469B (en) * 2011-09-12 2015-04-01 Canon Kk Method and device for encoding or decoding information representing prediction modes
US9591318B2 (en) 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
US10230956B2 (en) 2012-09-26 2019-03-12 Integrated Device Technology, Inc. Apparatuses and methods for optimizing rate-distortion of syntax elements
US10277907B2 (en) 2012-10-25 2019-04-30 Integrated Device Technology, Inc. Rate-distortion optimizers and optimization techniques including joint optimization of multiple color components
WO2014110452A1 (en) * 2013-01-11 2014-07-17 Futurewei Technologies Co., Ltd. Method and apparatus of depth prediction mode selection
US20140219331A1 (en) * 2013-02-06 2014-08-07 Magnum Semiconductor, Inc. Apparatuses and methods for performing joint rate-distortion optimization of prediction mode
EP3186964A1 (en) * 2014-08-25 2017-07-05 Intel Corporation Selectively bypassing intra prediction coding based on preprocessing error data
US10142626B2 (en) * 2014-10-31 2018-11-27 Ecole De Technologie Superieure Method and system for fast mode decision for high efficiency video coding
FR3040849A1 (fr) * 2015-09-04 2017-03-10 Stmicroelectronics (Grenoble 2) Sas Procede de compression d'un flux de donnees video
GB2553557B (en) * 2016-09-08 2022-04-20 V Nova Int Ltd Data processing apparatuses, methods, computer programs and computer-readable media
US20190045195A1 (en) * 2018-03-30 2019-02-07 Intel Corporation Reduced Partitioning and Mode Decisions Based on Content Analysis and Learning
US20200068214A1 (en) * 2018-08-27 2020-02-27 Ati Technologies Ulc Motion estimation using pixel activity metrics
KR20220157765A (ko) * 2021-05-21 2022-11-29 삼성전자주식회사 영상 부호화 장치 및 이의 동작 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6697430B1 (en) * 1999-05-19 2004-02-24 Matsushita Electric Industrial Co., Ltd. MPEG encoder
US7869503B2 (en) 2004-02-06 2011-01-11 Apple Inc. Rate and quality controller for H.264/AVC video coder and scene analyzer therefor
US7953152B1 (en) * 2004-06-28 2011-05-31 Google Inc. Video compression and encoding method
TWI256258B (en) * 2004-12-16 2006-06-01 Ind Tech Res Inst Method to speed up the mode decision of video coding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6011023202; Yu, A.C., Martin, G.R.: 'Advanced block size selection algorithm for inter frame coding in H.264/MPEG-4 AVC' Image Proceeding, 2004. ICIP'04. 2004 International Conference on Singapore vol.1, 20041024, Page.95-98, IEEE *
JPN6012025629; Yali Liu et al.: 'Efficient Probability Based Macroblock Mode Selection in H.264/AVC' Visual Communications and Image Processing (VCIP) Vol.5960, 200507, p.1080-1088 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013125171A1 (ja) * 2012-02-20 2013-08-29 日本電気株式会社 イントラ予測モード判定装置、方法、プログラム記憶媒体
JPWO2013125171A1 (ja) * 2012-02-20 2015-07-30 日本電気株式会社 イントラ予測モード判定装置、イントラ予測モード判定方法、及びイントラ予測モード判定プログラム
JP2017507532A (ja) * 2013-12-30 2017-03-16 グーグル インコーポレイテッド 再帰的なブロック・パーティショニング

Also Published As

Publication number Publication date
US20070071105A1 (en) 2007-03-29
AR055186A1 (es) 2007-08-08
US8446954B2 (en) 2013-05-21
KR100957316B1 (ko) 2010-05-12
KR20080067631A (ko) 2008-07-21
JP5301277B2 (ja) 2013-09-25
TW200746834A (en) 2007-12-16
WO2007038722A3 (en) 2007-07-12
EP1938617A2 (en) 2008-07-02
CN101313587A (zh) 2008-11-26
CN101313587B (zh) 2013-09-18
WO2007038722A2 (en) 2007-04-05

Similar Documents

Publication Publication Date Title
JP5301277B2 (ja) マルチメディア符号化のためのモード選択技術
US7693219B2 (en) System and method for fast motion estimation
KR100739714B1 (ko) 인트라 예측 모드 결정 방법 및 장치
US7881386B2 (en) Methods and apparatus for performing fast mode decisions in video codecs
WO2010078212A1 (en) Multiple-candidate motion estimation with advanced spatial filtering of differential motion vectors
JP4501631B2 (ja) 画像符号化装置及び方法、画像符号化装置のコンピュータ・プログラム、並びに携帯端末
US20150172687A1 (en) Multiple-candidate motion estimation with advanced spatial filtering of differential motion vectors
KR20110009141A (ko) 비디오 부호화 및 복호화에서의 템플릿 매칭 예측을 위한 방법 및 장치
KR20120042910A (ko) 비디오 코딩을 위한 템플릿 매칭
JP2008523724A (ja) 動画像符号化のための動き推定技術
CN113727106B (zh) 视频编码、解码方法、装置、电子设备及存储介质
CN114339218A (zh) 图像编码方法、图像编码装置、电子设备和可读存储介质
US20070133689A1 (en) Low-cost motion estimation apparatus and method thereof
KR20090012985A (ko) 비디오 부호화에서 화면내 방향성 예측모드 고속 결정방법
KR100677118B1 (ko) 움직임 추정 방법 및 그 장치
Goel et al. Adaptive search window size algorithm for fast motion estimation in H. 264/AVC standard
Wang et al. Low complexity encoder optimization for HEVC
US8295349B2 (en) Methods and apparatuses for video compression intra prediction mode determination
US20080137743A1 (en) Intra-mode predication search method and apparatus for compression of real-time video signal
CN113992914B (zh) 帧间预测方法及装置、设备、存储介质
JP2005268879A (ja) 画像符号化方法およびその装置
KR100801974B1 (ko) 저비용 움직임 추정 장치 및 움직임 추정 방법
Hsu et al. Fast reference frame selection method for motion estimation in JVT/H. 264
KR20100097387A (ko) 고속 움직임 추정을 위한 부분 블록정합 방법
Liu et al. A fast and novel intra and inter modes decision prediction algorithm for H. 264/AVC based on the characteristics of macro-block

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110510

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110809

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130619

R150 Certificate of patent or registration of utility model

Ref document number: 5301277

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250