JP2005354686A - ビデオ内のマクロブロック毎に最適な符号化モードを選択するための方法およびシステム - Google Patents

ビデオ内のマクロブロック毎に最適な符号化モードを選択するための方法およびシステム Download PDF

Info

Publication number
JP2005354686A
JP2005354686A JP2005159410A JP2005159410A JP2005354686A JP 2005354686 A JP2005354686 A JP 2005354686A JP 2005159410 A JP2005159410 A JP 2005159410A JP 2005159410 A JP2005159410 A JP 2005159410A JP 2005354686 A JP2005354686 A JP 2005354686A
Authority
JP
Japan
Prior art keywords
macroblock
difference
mode
distortion
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005159410A
Other languages
English (en)
Inventor
Jun Xin
ジュン・シン
Vetro Anthony
アンソニー・ヴェトロ
Huifang Sun
ハイファン・スン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Research Laboratories Inc
Original Assignee
Mitsubishi Electric Research Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Research Laboratories Inc filed Critical Mitsubishi Electric Research Laboratories Inc
Publication of JP2005354686A publication Critical patent/JP2005354686A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream

Abstract

【課題】ビデオ内のマクロブロック毎に最適な符号化モードを選択する方法を提供する。
【解決手段】複数の候補符号化モードが存在し、各マクロブロックは1組のマクロブロック区画を含み、入力マクロブロック区画の入力変換係数と予測されるマクロブロック区画の変換係数との間の差が変換ドメインにおいて判定され、その差は量子化され、量子化された差が生成される。量子化された差に関して逆量子化が実行され、再構成された差が生成される。量子化された差を符号化するために必要とされるレートが判定され、その差と、再構成された差とに基づいて歪みが判定される。その後、レートおよび歪みに基づいて候補モード毎にコストが判定され、最小コストを生成する候補符号化モードが、そのマクロブロックのための最適な符号化モードとして選択される。
【選択図】図3

Description

本発明は包括的にはビデオ符号化に関し、より詳細にはビデオ符号化のためのマクロブロック符号化モードを選択することに関する。
MPEG−1、MPEG−2、MPEG−4、H.261、H.263およびH.264/AVCを含む国際ビデオ符号化標準規格は全て、動き補償された予測を用いて時間的な相関を除去し、変換を用いて空間的な相関を除去する基本ハイブリッド符号化フレームワークに基づく。
MPEG−2は、ISO/IECの動画像符号化専門グループ(MPEG)によって開発されたビデオ符号化標準規格である。それは現在、最も広く用いられているビデオ符号化標準規格である。その応用形態は、デジタルテレビジョン放送、直接衛星放送、DVD、ビデオ監視などを含む。MPEG−2および種々の他のビデオ符号化標準規格において用いられる変換は離散コサイン変換(DCT)である。それゆえMPEGで符号化されるビデオはDCT係数を用いる。
H.264/AVC標準規格による次世代ビデオ符号化は、MPEG−2を含む初期の標準規格よりも圧縮効率を大幅に改善することを意図している。この標準規格は、効率的なビデオ蓄積、テレビ会議、およびDSL上でのビデオ放送を含む広範な応用形態を有することが期待される。AVC標準規格は、これ以降、HTと呼ばれる簡易型(Low-complexity)の整数変換を用いる。それゆえ、符号化されたAVCビデオはHT係数を用いる。
そのような標準的な従来技術のビデオ符号器100の基本的な符号化過程が図1に示される。入力ビデオ101の各フレームがマクロブロックに分割される。各マクロブロックは変換/量子化104およびエントロピー符号化115にかけられる。変換/量子化104の出力は逆量子化/変換105にかけられる。動き推定109が実行され、ピクセルバッファ107の容量を考慮して、符号化モード決定110が行われる。符号化モード決定は、最適な符号化モード120を生成する。その後、予測108の結果が入力信号から減算され103、誤差信号が生成される。また予測の結果は逆量子化/変換の出力に加算され106、ピクセルバッファに記憶される。
出力102には、現在のフレームだけからの情報を用いる、イントラマクロブロックとして符号化されるマクロブロックを用いることができる。別法では、出力102には、動き推定によって現在のフレームおよび先行するフレームから推定される動きベクトルを用いて予測される、インターマクロブロックとして符号化されるマクロブロックを用いることができる。イントラ予測あるいはインター予測を実行するための様々な方法がある。
一般的に、ビデオの各フレームは複数のマクロブロックに分割され、各マクロブロックは、よりサイズの小さい複数のブロックからなる。マクロブロックは符号化の基本単位であり、一方、ブロックは典型的には変換の大きさに対応する。たとえば、MPEG−2およびH.264/AVCはいずれも16×16マクロブロックを規定する。しかしながら、MPEG−2のブロックサイズは8×8であり、8×8DCTおよび逆DCT演算に対応する。一方、H.264/AVCのブロックサイズは4×4であり、4×4HTおよび逆HT演算に対応する。
或る共通の予測を共有するマクロブロック内のピクセルのグループを参照するために、多くの場合にマクロブロック区画の概念が用いられる。マクロブロック、ブロックおよびマクロブロック区画の大きさは等しいとは限らない。許容できる1組のマクロブロック区画は典型的には、符号化方式によって異なる。
たとえば、MPEG−2では、16×16マクロブロックは2つの8×16マクロブロック区画を有することができ、各マクロブロック区画は個別の動き補償された予測を受ける。しかしながら、動き補償に差がある結果として、各区画は8×8ブロックとして符号化することができる。一方、AVCは非常に広範な、許容できる1組のマクロブロック区画を定義する。たとえば、16×16マクロブロックは、1つのマクロブロック内に8×8、4×4、4×8および8×4マクロブロック区画の組み合わせを有することができる。その後、マクロブロック区画毎に個別に予測を実行することができるが、符号化は依然として4×4ブロックに基づく。
符号器は、最良のマクロブロック区画、およびマクロブロック区画毎の予測モードを含む、マクロブロックのための符号化モードを選択し、ビデオ符号化性能が最適化されるようにする。選択過程は従来どおりに、「マクロブロックモード決定」と呼ばれる。
最近開発されたH.264/AVCビデオ符号化標準規格では、マクロブロックを符号化するために数多くの利用可能なモードがある。I−スライス内のマクロブロックのために利用可能な符号化モードとしては、ルマサンプルの場合にイントラ_4×4予測およびイントラ_16×16予測があり、クロマサンプルの場合にイントラ_8×8予測がある。
イントラ_4×4予測では、各4×4マクロブロック区画は、H.264/AVC標準規格によって定義される9つの予測モードのうちの1つを用いて符号化することができる。イントラ_16×16およびイントラ_8×8予測では、各16×16あるいは8×8マクロブロック区画は、4つの定義された予測モードのうちの1つを用いて符号化することができる。P−スライスあるいはB−スライス内のマクロブロックの場合、I−スライスのために利用可能な符号化モードに加えて、マクロブロック区画および参照フレームの種々の組み合わせを用いて、さらに多くの符号化モードを利用することができる。全てのマクロブロック符号化モードは、異なるレート−歪み(RD)トレードオフを与える。
本発明の目的は、レート(R)および歪み(D)の両方に対して性能を最適化するマクロブロック符号化モードを選択することである。
典型的には、レート−歪み最適化は、ラグランジュ乗数を用いて、マクロブロックモード決定を行う。レート−歪み最適化は、マクロブロックのための候補符号化モード毎にラグランジュコストを求め、最小ラグランジュコストを有するモードを選択する。
マクロブロックを符号化するためにN個の候補モードがある場合には、n番目の候補モードJのラグランジュコストは、次式で表されるマクロブロック区画のラグランジュコストの和である。
Figure 2005354686
ただし、Pはn番目の候補モードのマクロブロック区画の数である。マクロブロック区画は、予測モードに応じて異なるサイズからなることができる。たとえば、区画サイズは、イントラ_4×4予測の場合に4×4であり、イントラ_16×16予測の場合に16×16である。
n番目のマクロブロックのi番目の区画のための候補符号化モードの数がKn,iである場合には、このマクロブロック区画のコストは以下のとおりである。
Figure 2005354686
ただし、RおよびDはそれぞれレートおよび歪みであり、λはラグランジュ乗数である。ラグランジュ乗数は、マクロブロック符号化のレート−歪みトレードオフを制御し、量子化パラメータから導出することができる。上記の式は、n番目のマクロブロックのi番目の区画のラグランジュコストJn,iが、この区画のための候補符号化モードによって生成されるKn,i個のコストの最小値になるように選択されることを述べている。それゆえ、この区画の最適符号化モードは、Jn,iを生成するモードである。
マクロブロックのための最適な符号化モードは、最小コストを生成する候補モードであるように選択され、すなわち以下の式が成り立つ。
Figure 2005354686
図2は、マクロブロック区画の符号化モードのためのラグランジュコスト、すなわちJn,i,kを計算する従来の過程を示す。入力マクロブロック区画101とその予測201との間の差202が判定され221、HT変換され222(すなわちHT変換はH.264/AVC標準規格に従って4×4変換である)、量子化され223、レート208が計算される227。量子化されたHT係数204は逆量子化(IQ)224、逆HT変換225および予測補償220にもかけられ、マクロブロック区画が再構成される226。その後、再構成されたマクロブロック区画207と入力マクロブロック区画101との間の歪み228が計算される。最終的には、レート208および歪み209を用いて、最小ラグランジュコスト230が計算される229。その際、最適な符号化モード120は、最小コストを有するモードに対応する。
H.264/AVC標準規格に従ってマクロブロックを符号化するために利用することができるモードが数多くあるので、ラグランジュコストを判定するためのこの過程は、何度も実行される必要がある。それゆえ、レート−歪み最適化符号化モード決定の計算は非常に負荷が高い。
したがって、H.264/AVCビデオ符号化において効率的なレート−歪み最適化マクロブロックモード決定を実行することが必要とされている。
方法は、ビデオ内のマクロブロック毎に最適な符号化モードを選択する。各マクロブロックは、多数の候補符号化モードに従って符号化することができる。
入力マクロブロックと予測されるマクロブロックとの間の差が変換ドメインにおいて判定される。その差は量子化され、量子化された差が生成される。量子化された差に関して逆量子化が実行され、再構成された差が生成される。
量子化された差を符号化するために必要とされるレートが判定される。その差と、再構成された差とに基づいて歪みが判定される。その後、レートおよび歪みに基づいて候補モード毎にコストが判定され、最小コストを生成する候補符号化モードが、そのマクロブロックのための最適な符号化モードとして選択される。
本発明はラグランジュコストを判定するための方法を提供し、それによれば、レート−歪みを最適化されたマクロブロックモードが効率的に決定される。
[方法およびシステムの概要]
図3は、ビデオ内のマクロブロック毎に複数の利用可能な候補符号化モードから最適な符号化モードを選択するための、本発明による方法およびシステム300を示す。その選択は、マクロブロック区画の符号化モードのためのラグランジュコストに基づく。
入力マクロブロック区画101および予測される312マクロブロック区画予測322の両方がそれぞれHT変換311および313にかけられる。各変換はそれぞれ入力301および予測された302HT係数を生成する。その際、入力HT係数301と予測されるHT係数302との間の差303が判定される314。その差303は量子化され315、量子化された差304が生成され、そこから符号化レートR306が判定される317。
量子化された差のHT係数は逆量子化316にもかけられ、差のHT係数305が再構成される。その後、再構成されたHT係数と入力差HT係数303とを用いて、歪み307が判定される318。
レートおよび歪みからラグランジュコストが判定された319後に、利用可能な候補符号化モードから、最小ラグランジュコスト320を生成するモードであるように、マクロブロック区画のための最適な符号化モード120が選択される325。
マクロブロックのためのマクロブロック区画および対応するモードの最適な組み合わせが、1組のマクロブロック区画のための個々のラグランジュコストを検査することにより判定される。最小の全体コストを生成する組み合わせが、マクロブロックのための最適な符号化モードとして選択される。
図2に示される従来技術の方法と比べると、本発明は以下の際立った特徴を有する。
本発明は、計算の負荷が高い従来技術の方法の逆HTを排除する。このようにして、マクロブロック区画の再構成も本発明では省かれる。
HT311および313は、従来技術の場合のような、入力と予測される区画との差にではなく、入力および予測される区画の両方に適用される。
入力マクロブロック区画のHT311は、モード決定過程全体において一度だけしか実行される必要がないのに対して、予測される区画のHT313は、予測モード毎に実行される必要がある。それゆえ、本発明では、もう一度HTを計算する必要がある。
しかしながら、後に説明されるように、予測される信号のHTは、いくつかあるイントラ予測モードの場合に、はるかに効率的に計算することができ、結果的な節約は、付加的なHTを相殺して余りあるであろう。
歪みは、従来技術の場合のようにピクセルドメインではなく、変換ドメインにおいて計算され、すなわち歪みはHT係数を用いて直に計算される。以下の説明では、歪みが、ピクセルドメインにおいて一般的に用いられる差の二乗和(SSD)による歪み指標に概ね等しくなるように、変換ドメインにおいて歪みを計算するための方法が提供される。
本明細書では、符号化システムとの関連で、出力のモード決定を効率的に計算するために上記の方法を用いることが強調されている。しかしながら、この方法は、入力および出力ビデオ形式が異なる変換カーネルに基づく場合を含む、ビデオをトランスコードすることにも適用することができる。
詳細には、上記の方法が、イントラフレームをMPEG−2からH.264/AVCにトランスコードする際に用いられるときには、入力マクロブロック区画のHT係数は、MPEG−2ビデオの変換係数から変換ドメインにおいて直に計算することができる。
それゆえ、この場合には、入力マクロブロック区画のHTも省かれる。
[イントラ予測されるHT係数の判定]
HT係数を判定するための従来技術の方法は1−D HT変換を、すなわち4つの列変換の後に4つの行変換を実行する。しかしながら、いくつかのイントラ予測される信号は、それらのHT係数の計算をはるかに効率的にすることができる、或る特性を有する。
ここで、DC予測、水平予測および垂直予測のイントラ予測モードのためのHT係数を判定するための効率的な方法が説明される。これらの予測モードは、ルマサンプルの場合にイントラ_4×4およびイントラ_16×16予測において、クロマサンプルの場合にイントラ_8×8予測において用いられる。
以下の表記を用いて、本発明の詳細を説明する。
p −予測される信号、4×4行列
P −予測される信号pのHT係数、4×4行列
r,c −行および列インデックス、r,c=1、2、3、4
× −乗算
(・) −転置行列
(・)−1 −逆行列
H −H.264/AVC変換(HT)カーネル行列
行列Hは以下のとおりである。
Figure 2005354686
DC予測モードでは、DC予測値はdcであり、以下の式が成り立つ。
Figure 2005354686
dcのHT、すなわちPdcは、以下の式によって与えられるDC係数を除いて全て0である。
Figure 2005354686
それゆえ、DC予測のためのHTを計算するのに1回の演算しか必要としない。
水平予測モードでは、予測信号は以下の式によって表される。
Figure 2005354686
Figure 2005354686
を1−D水平予測ベクトルとする。その際、pのHTは以下のとおりである。
Figure 2005354686
式(7)は、行列Pを、水平予測ベクトルH×hの1回の1−D変換と、4回のシフト演算とによって判定することができることを示唆する。これは、従来技術の方法において必要とされる8回の1−D変換よりもはるかに簡単である。
垂直予測モードでは、予測される信号は以下の式によって表される。
Figure 2005354686
Figure 2005354686
を1−D垂直予測ベクトルとする。その際、pのHTは以下のとおりである。
Figure 2005354686
式(9)は、Pを、垂直予測ベクトルv×HTの1回の1−D変換と、4回のシフト演算とによって判定することができることを示唆する。これは、従来技術の方法において必要とされる8回の1−D変換よりもはるかに簡単である。
上記の3つの予測モードの場合、3つの予測される信号Pdc、PおよびPは大部分が0の成分を有する。Pdcは、1つだけ0以外の成分を有し、Pは、その第1の列においてのみ0以外の成分を有し、Pは、その第1の行においてのみ0以外の成分を有する。それゆえ、入力HT係数と予測されるHT係数との間の差を判定すること314に関する複雑さも軽減される。
他のモード、すなわち対角方向に沿って予測するモードの場合にも、変換された予測を求めるための計算を同様に軽減することができる。
[変換ドメインにおける歪みの判定]
以下の説明では、歪みがピクセルドメインにおいて一般的に用いられる差の二乗和(SSD)歪み指標と概ね同じであるように、変換ドメインにおいて歪みを判定する318ための方法が提供される。
ピクセルドメインのSSD歪みは、入力信号と再構成された信号との間で判定される。入力信号、再構成された信号、予測される信号、予測誤差および再構成された予測誤差はそれぞれx、ハットx、p、e、ハットeである。それらは全て4×4行列である。SSD歪みDは以下のとおりである。
Figure 2005354686
eのHTはEであり、すなわち
Figure 2005354686
であるので、当然、以下の式が成り立つ。
Figure 2005354686
変数ハットEは、その逆HTが、ハットeである信号であり、H.264/AVC仕様において逆HTの後のスケーリングを考慮に入れると、以下の式が成り立つ。
Figure 2005354686
ただし、チルダHinvは、H.264/AVC標準規格において用いられる逆HTのカーネル行列である。
Figure 2005354686
その目的は、歪み計算ブロック318への入力であるEおよびハットEから歪みを判定することである。
式(11)および(12)から、以下の式が成り立つ。
Figure 2005354686
Figure 2005354686
Figure 2005354686
とし、そのとき、式(13)および(14)を式(10)に代入すると、以下の式が得られる。
Figure 2005354686
Figure 2005354686
とする。そのとき、
Figure 2005354686
であるので、(15)は以下のようになる。
Figure 2005354686
式(16)を展開すると、以下の式が得られる。
Figure 2005354686
それゆえ、歪みはその後、式(17)から判定することができる。ただし、Yは式(14)によって与えられる。
H.264/AVC仕様において規定される逆HTは、整数シフト演算を用いて、2の除算を実現するので、厳密には線形ではないことに留意されたい。それゆえ、上記の変換ドメイン歪みとピクセルドメインにおいて計算される歪みとの間にはわずかな丸め誤差がある。さらに、逆HTの後に64だけダウンスケーリングすることにより、近似誤差はさらに小さくされる。
本発明が例示として好ましい実施の形態によって説明されてきたが、本発明の精神および範囲内において種々の他の改変および変更がなされることができることは理解されたい。それゆえ、添付の特許請求の範囲の目的は、本発明の真の精神および範囲に入るような全てのそのような変形および変更を網羅することである。
標準的なビデオ符号器の従来技術の符号化過程のブロック図である。 H.264/AVC標準規格のためのマクロブロック区画のラグランジュコストおよびレート−歪み最適化モード決定を判定するための従来技術の方法のブロック図である。 H.264/AVC標準規格のための本発明によるマクロブロック区画のラグランジュコストおよびレート−歪み最適化モード決定を計算するための方法のブロック図である。

Claims (15)

  1. ビデオ内のマクロブロック毎に最適な符号化モードを選択するための方法であって、複数の候補符号化モードが存在し、各マクロブロックは1組のマクロブロック区画を含み、
    入力マクロブロック区画の入力変換係数と、予測されるマクロブロック区画の予測される変換係数との間の差を判定すること、
    前記差を量子化することによって、量子化された差を生成すること、
    前記量子化された差に対して逆量子化を実行することによって、再構成された差を生成すること、
    前記量子化された差を符号化するために必要とされるレートと、前記差および前記再構成された差に基づく歪みとを判定すること、
    前記レートおよび前記歪みに基づいて前記複数の候補モードのモード毎にコストを判定すること、および
    最小コストを生成する前記候補符号化モードを前記入力マクロブロック区画のための前記最適な符号化モードとして選択すること
    を含む、ビデオ内のマクロブロック毎に最適な符号化モードを選択するための方法。
  2. 前記マクロブロック毎に、前記1組のマクロブロック区画のための前記最小コストを生成する前記最適な符号化モードを選択することをさらに含む
    請求項1に記載の方法。
  3. 前記入力マクロブロック区画の前記入力変換係数、および前記予測されるマクロブロック区画のための前記予測される変換係数はピクセルドメインにおいて変換される
    請求項1に記載の方法。
  4. 前記入力マクロブロック区画の前記入力変換係数は変換ドメインにおいて直に変換される
    請求項1に記載の方法。
  5. 前記候補符号化モードはイントラモードおよびインターモードを含む
    請求項1に記載の方法。
  6. 前記予測される変換係数は、DC予測モード、水平予測モードおよび垂直予測モードを含む、複数のイントラ予測モードの場合に判定される
    請求項1に記載の方法。
  7. 前記DC予測モードのための前記予測される変換係数はDC予測値に基づいて判定される
    請求項6に記載の方法。
  8. 前記水平予測モードのための前記予測される変換係数は、1−D水平予測ベクトルの1回の変換に基づいて判定される
    請求項6に記載の方法。
  9. 前記垂直予測モードのための前記予測される変換係数は、1−D垂直予測ベクトルの1回の変換に基づいて判定される
    請求項6に記載の方法。
  10. 前記歪みは変換ドメインにおいて判定される
    請求項1に記載の方法。
  11. 前記歪みは、ピクセルドメインにおける差の二乗和歪み指標によって近似される
    請求項1に記載の方法。
  12. 前記最適な符号化モードは前記入力マイクロブロック区画をトランスコードするために用いられる
    請求項1に記載の方法。
  13. 前記トランスコードすることは、1回の変換カーネルに基づく異なる形式への変換である
    請求項12に記載の方法。
  14. 前記トランスコードすることは、異なる変換カーネルに基づく異なる形式への変換である
    請求項12に記載の方法。
  15. ビデオ内のマクロブロック毎に最適な符号化モードを選択するためのシステムであって、複数の候補符号化モードが存在し、各マクロブロックは1組のマクロブロック区画を含み、
    入力マクロブロック区画の入力変換係数と、予測されるマクロブロック区画の予測される変換係数との間の差を判定するように構成される加算器と、
    前記差に適用され、量子化された差を生成するための量子化器と、
    前記量子化された差に適用され、再構成された差を生成するための逆量子化器と、
    前記量子化された差を符号化するために必要とされるレートと、前記差および前記再構成された差に基づく歪みとを判定するための手段と、
    前記レートおよび前記歪みに基づいて前記複数の候補モードのモード毎にコストを判定するための手段と、
    最小コストを生成する前記候補符号化モードを前記入力マクロブロック区画のための前記最適な符号化モードとして選択するための手段と
    を備える、ビデオ内のマクロブロック毎に最適な符号化モードを選択するためのシステム。
JP2005159410A 2004-06-01 2005-05-31 ビデオ内のマクロブロック毎に最適な符号化モードを選択するための方法およびシステム Pending JP2005354686A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/858,162 US20050276493A1 (en) 2004-06-01 2004-06-01 Selecting macroblock coding modes for video encoding

Publications (1)

Publication Number Publication Date
JP2005354686A true JP2005354686A (ja) 2005-12-22

Family

ID=35460594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005159410A Pending JP2005354686A (ja) 2004-06-01 2005-05-31 ビデオ内のマクロブロック毎に最適な符号化モードを選択するための方法およびシステム

Country Status (2)

Country Link
US (1) US20050276493A1 (ja)
JP (1) JP2005354686A (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100728031B1 (ko) * 2006-01-23 2007-06-14 삼성전자주식회사 가변 블록 크기 움직임 예측을 위한 부호화 모드 결정 방법및 장치
JP2007184711A (ja) * 2006-01-05 2007-07-19 Hitachi Kokusai Electric Inc 画像情報の符号化装置及び符号化方法
JP2008306711A (ja) * 2007-05-25 2008-12-18 Nvidia Corp データフレームのシーケンスの効率的な符号化/復号
JP2011130192A (ja) * 2009-12-17 2011-06-30 Mega Chips Corp エンコーダおよび画像変換装置
KR101363044B1 (ko) 2007-10-19 2014-02-17 광주과학기술원 비디오 영상의 부호화 모드 결정 방법 및 장치, 이를이용한 비디오 영상의 부호화/복호화 장치 및 방법 그리고상기 방법을 수행하는 프로그램이 기록된 기록 매체
US8660182B2 (en) 2003-06-09 2014-02-25 Nvidia Corporation MPEG motion estimation based on dual start points
US8660380B2 (en) 2006-08-25 2014-02-25 Nvidia Corporation Method and system for performing two-dimensional transform on data value array with reduced power consumption
US8666181B2 (en) 2008-12-10 2014-03-04 Nvidia Corporation Adaptive multiple engine image motion detection system and method
US8724702B1 (en) 2006-03-29 2014-05-13 Nvidia Corporation Methods and systems for motion estimation used in video coding
US8731071B1 (en) 2005-12-15 2014-05-20 Nvidia Corporation System for performing finite input response (FIR) filtering in motion estimation
US8873625B2 (en) 2007-07-18 2014-10-28 Nvidia Corporation Enhanced compression in representing non-frame-edge blocks of image frames
US9118927B2 (en) 2007-06-13 2015-08-25 Nvidia Corporation Sub-pixel interpolation and its application in motion compensated encoding of a video signal
US9330060B1 (en) 2003-04-15 2016-05-03 Nvidia Corporation Method and device for encoding and decoding video image data

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100543611B1 (ko) * 2004-03-02 2006-01-20 엘지전자 주식회사 인트라 압축 방법
US7953152B1 (en) 2004-06-28 2011-05-31 Google Inc. Video compression and encoding method
US7751478B2 (en) * 2005-01-21 2010-07-06 Seiko Epson Corporation Prediction intra-mode selection in an encoder
US20090003454A1 (en) * 2005-01-28 2009-01-01 John William Richardson Method and Apparatus for Real-Time Frame Encoding
WO2006100946A1 (ja) * 2005-03-24 2006-09-28 Pioneer Corporation 画像信号再符号化装置及び画像信号再符号化方法
US8422546B2 (en) 2005-05-25 2013-04-16 Microsoft Corporation Adaptive video encoding using a perceptual model
JP5061122B2 (ja) 2006-01-09 2012-10-31 マティアス・ナロシュケ ハイブリッドなビデオ符号化における予測誤差の適応符号化
KR101330630B1 (ko) * 2006-03-13 2013-11-22 삼성전자주식회사 최적인 예측 모드를 적응적으로 적용하여 동영상을부호화하는 방법 및 장치, 동영상을 복호화하는 방법 및장치
US7995649B2 (en) 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US8503536B2 (en) 2006-04-07 2013-08-06 Microsoft Corporation Quantization adjustments for DC shift artifacts
US8059721B2 (en) 2006-04-07 2011-11-15 Microsoft Corporation Estimating sample-domain distortion in the transform domain with rounding compensation
US7974340B2 (en) 2006-04-07 2011-07-05 Microsoft Corporation Adaptive B-picture quantization control
US8130828B2 (en) 2006-04-07 2012-03-06 Microsoft Corporation Adjusting quantization to preserve non-zero AC coefficients
US8711925B2 (en) 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
US8737485B2 (en) * 2007-01-31 2014-05-27 Sony Corporation Video coding mode selection system
US8238424B2 (en) 2007-02-09 2012-08-07 Microsoft Corporation Complexity-based adaptive preprocessing for multiple-pass video compression
US8498335B2 (en) 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US8243797B2 (en) 2007-03-30 2012-08-14 Microsoft Corporation Regions of interest for quality adjustments
US8442337B2 (en) 2007-04-18 2013-05-14 Microsoft Corporation Encoding adjustments for animation content
US8331438B2 (en) 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
CN101415121B (zh) * 2007-10-15 2010-09-29 华为技术有限公司 一种自适应的帧预测的方法及装置
US8189933B2 (en) 2008-03-31 2012-05-29 Microsoft Corporation Classifying and controlling encoding quality for textured, dark smooth and smooth video content
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
KR101369161B1 (ko) 2008-09-05 2014-03-05 에스케이 텔레콤주식회사 예측 방향 전환 장치 및 방법과 그를 이용한 영상 부호화/복호화 장치 및 방법
US9100646B2 (en) 2008-09-03 2015-08-04 Sk Telecom Co., Ltd. Device and method for image encoding/decoding using prediction direction conversion and selective encoding
US8879637B2 (en) * 2008-10-06 2014-11-04 Lg Electronics Inc. Method and an apparatus for processing a video signal by which coding efficiency of a video signal can be raised by using a mixed prediction mode in predicting different macroblock sizes
US8675979B2 (en) * 2008-12-12 2014-03-18 Panasonic Corporation Transcoder, method of transcoding, and digital recorder
US9113168B2 (en) 2009-05-12 2015-08-18 Lg Electronics Inc. Method and apparatus of processing a video signal
US8964851B2 (en) * 2009-06-09 2015-02-24 Sony Corporation Dual-mode compression of images and videos for reliable real-time transmission
US8457425B2 (en) * 2009-06-09 2013-06-04 Sony Corporation Embedded graphics coding for images with sparse histograms
US20110142129A1 (en) * 2009-12-11 2011-06-16 General Instrument Corporation Mpeg video resolution reduction system
GB2554680B (en) 2016-10-03 2020-04-01 Advanced Risc Mach Ltd Selecting encoding options
GB2567835B (en) 2017-10-25 2020-11-18 Advanced Risc Mach Ltd Selecting encoding options

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03185986A (ja) * 1989-12-14 1991-08-13 Matsushita Electric Ind Co Ltd 動画像符号化装置
JPH0884337A (ja) * 1994-09-02 1996-03-26 Texas Instr Inc <Ti> データ処理装置及びその方法
JP2000222587A (ja) * 1999-01-27 2000-08-11 Matsushita Electric Ind Co Ltd 直交変換―ドメインブロックマッチングを用いる動き推定
US20030063667A1 (en) * 1999-01-27 2003-04-03 Sun Microsystems, Inc. Optimal encoding of motion compensated video

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5963673A (en) * 1995-12-20 1999-10-05 Sanyo Electric Co., Ltd. Method and apparatus for adaptively selecting a coding mode for video encoding
US6249318B1 (en) * 1997-09-12 2001-06-19 8×8, Inc. Video coding/decoding arrangement and method therefor
JP2002209215A (ja) * 2001-01-09 2002-07-26 Sony Corp 符号量制御装置及び方法、並びに画像情報変換装置及び方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03185986A (ja) * 1989-12-14 1991-08-13 Matsushita Electric Ind Co Ltd 動画像符号化装置
JPH0884337A (ja) * 1994-09-02 1996-03-26 Texas Instr Inc <Ti> データ処理装置及びその方法
JP2000222587A (ja) * 1999-01-27 2000-08-11 Matsushita Electric Ind Co Ltd 直交変換―ドメインブロックマッチングを用いる動き推定
US20030063667A1 (en) * 1999-01-27 2003-04-03 Sun Microsystems, Inc. Optimal encoding of motion compensated video

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6010055033, Gary J. Sullivan et al., "Rate−distortion optimization for video compression", IEEE Signal Processing Magazine, 199811, Volume 15, Issue 6, p.74−90 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9330060B1 (en) 2003-04-15 2016-05-03 Nvidia Corporation Method and device for encoding and decoding video image data
US8660182B2 (en) 2003-06-09 2014-02-25 Nvidia Corporation MPEG motion estimation based on dual start points
US8731071B1 (en) 2005-12-15 2014-05-20 Nvidia Corporation System for performing finite input response (FIR) filtering in motion estimation
JP2007184711A (ja) * 2006-01-05 2007-07-19 Hitachi Kokusai Electric Inc 画像情報の符号化装置及び符号化方法
KR100728031B1 (ko) * 2006-01-23 2007-06-14 삼성전자주식회사 가변 블록 크기 움직임 예측을 위한 부호화 모드 결정 방법및 장치
US8724702B1 (en) 2006-03-29 2014-05-13 Nvidia Corporation Methods and systems for motion estimation used in video coding
US8660380B2 (en) 2006-08-25 2014-02-25 Nvidia Corporation Method and system for performing two-dimensional transform on data value array with reduced power consumption
US8666166B2 (en) 2006-08-25 2014-03-04 Nvidia Corporation Method and system for performing two-dimensional transform on data value array with reduced power consumption
US8756482B2 (en) 2007-05-25 2014-06-17 Nvidia Corporation Efficient encoding/decoding of a sequence of data frames
JP2008306711A (ja) * 2007-05-25 2008-12-18 Nvidia Corp データフレームのシーケンスの効率的な符号化/復号
US9118927B2 (en) 2007-06-13 2015-08-25 Nvidia Corporation Sub-pixel interpolation and its application in motion compensated encoding of a video signal
US8873625B2 (en) 2007-07-18 2014-10-28 Nvidia Corporation Enhanced compression in representing non-frame-edge blocks of image frames
KR101363044B1 (ko) 2007-10-19 2014-02-17 광주과학기술원 비디오 영상의 부호화 모드 결정 방법 및 장치, 이를이용한 비디오 영상의 부호화/복호화 장치 및 방법 그리고상기 방법을 수행하는 프로그램이 기록된 기록 매체
US8666181B2 (en) 2008-12-10 2014-03-04 Nvidia Corporation Adaptive multiple engine image motion detection system and method
JP2011130192A (ja) * 2009-12-17 2011-06-30 Mega Chips Corp エンコーダおよび画像変換装置

Also Published As

Publication number Publication date
US20050276493A1 (en) 2005-12-15

Similar Documents

Publication Publication Date Title
JP2005354686A (ja) ビデオ内のマクロブロック毎に最適な符号化モードを選択するための方法およびシステム
JP5086422B2 (ja) 動き及び予測の重み付けパラメータを符号化する方法及び装置
US7983496B2 (en) Inverse tone mapping for bit-depth scalable image coding adapted to variable block sizes
TWI401961B (zh) 藉由過濾器選擇之視訊編碼
KR101313956B1 (ko) 스위칭된 보간 필터들에서의 오프셋 계산
CA2703775C (en) Method and apparatus for selecting a coding mode
US20070098067A1 (en) Method and apparatus for video encoding/decoding
JP4844449B2 (ja) 動画像符号化装置、方法、プログラム、動画像復号化装置、方法、およびプログラム
US20080240245A1 (en) Image encoding/decoding method and apparatus
US8306114B2 (en) Method and apparatus for determining coding for coefficients of residual block, encoder and decoder
JP2011130410A (ja) 符号化方法、復号化方法及び装置
JP5188356B2 (ja) 復号器において画像を逆トーンマッピングする方法
JP2008154155A (ja) 動画像符号化装置
TW200952499A (en) Apparatus and method for computationally efficient intra prediction in a video coder
KR20170045013A (ko) 데이터 인코딩 장치 및 데이터 인코딩 방법
CA2879650A1 (en) Encoding device, decoding device, and program
JP4494803B2 (ja) 動き補償に基づいた改善されたノイズ予測方法及びその装置とそれを使用した動画符号化方法及びその装置
KR101700410B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
JP2011166592A (ja) 画像符号化装置及び画像復号装置
JP5841940B2 (ja) 画像のハイブリッド開ループ/閉ループ圧縮
KR101562343B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
Lee et al. An efficient algorithm for VC-1 to H. 264 video transcoding in progressive compression
JP2007266861A (ja) 画像符号化装置
KR102111437B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
KR101934840B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080423

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100921

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110301