JP5111127B2 - 動画像符号化装置及びその制御方法、並びに、コンピュータプログラム - Google Patents

動画像符号化装置及びその制御方法、並びに、コンピュータプログラム Download PDF

Info

Publication number
JP5111127B2
JP5111127B2 JP2008011927A JP2008011927A JP5111127B2 JP 5111127 B2 JP5111127 B2 JP 5111127B2 JP 2008011927 A JP2008011927 A JP 2008011927A JP 2008011927 A JP2008011927 A JP 2008011927A JP 5111127 B2 JP5111127 B2 JP 5111127B2
Authority
JP
Japan
Prior art keywords
block
prediction mode
prediction
frame
processing target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008011927A
Other languages
English (en)
Other versions
JP2009177352A (ja
JP2009177352A5 (ja
Inventor
大輔 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008011927A priority Critical patent/JP5111127B2/ja
Publication of JP2009177352A publication Critical patent/JP2009177352A/ja
Publication of JP2009177352A5 publication Critical patent/JP2009177352A5/ja
Application granted granted Critical
Publication of JP5111127B2 publication Critical patent/JP5111127B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、動画像符号化装置及びその制御方法、並びに、コンピュータプログラムに関する。
近年、マルチメディアに関連する情報のデジタル化が急進しており、それに伴い映像情報の高画質化に向けた要求が高まっている。具体的な例として放送メディアの従来の720×480画素のSDから、1920×1080画素のHDに移行が行われつつあることを挙げることが出来る。
しかしながら、この高画質への要求は同時にデジタルデータの増大を引き起こし、従来の性能を上回る圧縮符号化技術及び復号化技術が求められている。これらの要求に対し、ITU−T SG16やISO/IEC JTC1/SC29/WG11の活動で画像間の相関を利用したフレーム間予測を用いた符号化圧縮方式の標準化作業が進められている。
この中でも、現状最も高能率符号化を実現しているといわれる符号化方式にH.264/MPEG−4 PART10(AVC)(以下、H.264と呼ぶ)がある。また、この中で新たに導入された技術のひとつとして、フレーム内の相関を利用し、フレーム内の画素値を用いて同一フレーム内の画素値を予測するイントラ予測が導入されている。
H.264のイントラ予測によると、符号化対象ブロック近傍のブロック内の画素値を用いて、前記符号化対象ブロックに対する差分値を生成して、当該差分値を符号化する。これにより、例えばイントラ(I)ピクチャであっても、効果的に符号量を抑えることが可能になっている。H.264では、イントラ予測で用いる予測モードを複数用意しており、好適な予測モードを選択する必要がある。
具体的に、イントラ予測で用いる予測モード(以下、イントラ予測モードと呼ぶ)には複数の予測ブロックサイズ及び予測方向が定義されている。例えば、16×16画素のブロックデータを基に予測方向を決定するイントラ16×16予測には4種類の予測方向がある。また、4×4画素のブロックデータを基に予測方向を決定するイントラ4x4予測には9種類の予測方向がある。
H.264では、これらのイントラ予測モードから最も適切なものを選択することにより、高能率な符号化を可能にしている。また、好適なイントラ予測モードを選択しやすくする先行技術として、画像パターンを判定して、判定されたパターンに合ったイントラ予測モードを選択する方法が提案されている(特許文献1参照)。
特開2006-005659号公報
しかしながら、このように多くのイントラ予測モードの中から、好適なイントラ予測モードを選択するには、演算量の負荷が多大なものとなる。またブロックサイズも従来のMPEGに比べて細分化されているため、一層演算が複雑になっている。一方、特許文献1の提案方法によれば、好適な画面内予測モードを選択することに貢献するものの、画像パターンを判定する特殊な回路ブロックを新たに組み込むことが必要である。
このように、H.264では、特に動画像をリアルタイムで符号化処理をする場合などでは、非常に高速なプロセッサが必要になるなど、ハード規模やコストが甚大となったり、消費電力が大きくなったりするという問題が生じる。これに対し、符号化処理を高速化するために、複数ブロックの処理を並列で行うという手法が考えられる。
しかし、複数ブロックの処理を並列で行うと、イントラ予測モード決定のために必要な、周囲のイントラ予測モード指定データが決定されていない状況が生ずるおそれがある。この予測モード指定データは、処理対象のブロックデータの周囲のブロックデータについて決定されたイントラ予測モードを基に生成され、その予測符号量は当該周囲のブロックデータについて決定されたイントラ予測モードに依存する。
そのためイントラ予測モードは、そのブロックデータの予測符号量を最小にするものが選択されるが、当該予測符号量は当該ブロックデータの予測モード指定データの予測符号量にも依存する。従って、周囲のイントラ予測モード指定データが決定されていないと、イントラ予測モードの予測モードが決定できずに最適なイントラ予測モード決定が行えないという問題がある。つまり、低消費電力と最適なイントラ予測符号化を両立した動画像符号化装置の実現は非常に困難であるといえる。
本発明は、このような問題点に鑑みてなされたものであり、イントラ予測符号化を並列処理化した際にもイントラ予測モードを決定することができる動画像符号化技術を提供することを目的とする。
上記の課題を解決するための本発明は、フレームを構成する各々のブロックについて、複数の予測モードのいずれかの予測モードに従って、処理対象ブロックの隣接ブロックの画素データを用いてイントラ予測符号化を行う動画像符号化装置であって、
処理対象ブロックの予測モードを
該処理対象ブロックに隣接する第1のブロックについて選択された予測モードと、
該処理対象ブロックに隣接する第2のブロックについて選択された予測モード、もしくは、前記処理対象ブロックが属する第1のフレーム内で前記第2のブロックが有する空間位置と同一の空間位置を前記第1のフレームと時間的に最も近い符号化済の第2のフレーム内で有する第3のブロックについて選択された予測モードと
に基づいて推定する推定手段であって、該処理対象ブロックに隣接する第1のブロック及び第2のブロックのうち、
双方がイントラ予測符号化済の場合は、該第1のブロックと該第2のブロックとについてそれぞれ選択された前記予測モードに基づき、前記処理対象ブロックの予測モードを推定し、
前記第1のブロックのみがイントラ予測符号化済である場合は、該第1のブロックについて選択された予測モードと、前記第3のブロックについて選択された予測モードとに基づき、前記処理対象ブロックの予測モードを推定する推定手段と、
前記複数の予測モードのそれぞれが前記処理対象ブロックのイントラ予測符号化の際に選択された場合に該選択された予測モードを指定する指定データを、前記推定手段により推定された予測モードに基づき生成し、該指定データの第1の予測符号量を算出する生成手段と、
前記複数の予測モードのそれぞれについて、前記処理対象ブロックをイントラ予測符号化した際の第2の予測符号量を、前記第1の予測符号量を用いて予測する予測手段と、
前記予測手段により予測された第2の予測符号量に基づいて、前記処理対象ブロックのイントラ予測符号化に用いる予測モードを決定する決定手段と
を備える。
本発明によれば、イントラ予測符号化を並列処理化した際にもイントラ予測モードを決定することができる動画像符号化技術を提供することができる。
以下に添付図面を参照しながら、本発明にかかる動画像符号化装置の好適な一実施形態について詳細に説明する。
[第1の実施形態]
図1は、本実施形態に係る動画像符号化装置の機能構成の一例を示すブロック図である。図1に示すように、本発明に係る動画像符号化装置はフレームメモリ101、フィルタ後参照フレームメモリ102、動き予測部103、動き補償部104、イントラ予測部105、直交変換部106、量子化部107を備える。また、エントロピー符号化部108、逆量子化部109、逆直交変換部110、選択スイッチ111、減算器112、加算器113、フィルタ前参照フレームメモリ114、ループフィルタ115、イントラ予測モード保存部116をさらに備える。
係る構成において、まず入力される動画像を符号化する方法について述べる。フレームメモリ101は、表示順に入力画像(原画像)データを保存し、符号化順に符号化対象ブロックを動き予測部103、イントラ予測部105、減算器112に順次送信する。フィルタ後参照フレームメモリ102は、フィルタ処理された符号化済み画像を、フィルタ後参照画像データとして保存し、符号化順に符号化対象ブロックのフィルタ後参照画像データを動き予測部103、動き補償部104に順次送信する。
フィルタ前参照フレームメモリ114は、フィルタ処理される前の符号化済み画像をフィルタ前参照画像データとして保存し、符号化順に符号化対象ブロックのフィルタ前参照画像データをイントラ予測部105に順次送信する。減算器112はフレームメモリ101から送信されてくる符号化対象ブロックから、選択スイッチ111から送信されてくる予測画像ブロックを減算し、画像残差データを出力する。なお、予測画像ブロックの生成方法については後述する。
直交変換部106は、減算器112から出力された画像残差データを直交変換処理して、直交変換係数を量子化部107に送信する。量子化部107は、直交変換部変換係数を所定の量子化パラメータを用いて量子化し、エントロピー符号化部108および逆量子化部109に送信する。エントロピー符号化部108は、量子化部107で量子化された直交変換係数を入力とし、CAVLC、CABACなどのエントロピー符号化を施して、符号化データストリームとして出力する。
続いて、量子化部107で量子化された変換係数を用いて、各参照画像データを生成する方法について述べる。逆量子化部109は、量子化部107から送信されてくる量子化された直交変換係数を逆量子化する。逆直交変換部110は、逆量子化部109での逆量子化により得られた直交変換係数を逆直交変換し、復号残差データを生成し加算器113に送信する。
加算器113は、復号残差データと後述する予測画像データとを加算し、参照画像データを生成し、フィルタ前参照フレームメモリ114に、フィルタ前参照画像データとして保存する。フィルタ前参照フレームメモリ114は、該フィルタ前参照画像データをループフィルタ115にも送信する。ループフィルタ115は、参照画像データをフィルタリングしてノイズを除去し、フィルタ後参照画像データとしてフィルタ後参照フレームメモリ102に保存する。
続いて、入力画像データ、フィルタ前参照画像データ、フィルタ後参照画像データを用いて、予測画像データを生成する方法について述べる。
動き予測部103は、フィルタ後参照フレームメモリ102から送信されるフィルタ後参照画像データを用いて動き予測処理用の画像データを生成する。そして、フレームメモリ101から送信される符号化対象ブロックとの差分の自乗和あるいは当該自乗和にアダマ−ル変換を施した値と、動きベクトルあるいは動きベクトルの差分の符号量とを加算してCOSTを生成する。動き予測部103は、このCOSTを最小にする動きベクトルを検出し、フィルタ後参照フレーム画像データ番号と共に動き補償部104に送信する。動きベクトルは、エントロピー符号化部108にも送信する。また、同時にそのときのCOSTを選択スイッチ111に送信する。
動き補償部104は、生成された動きベクトルを用いて、フィルタ後参照フレームメモリ102中のフィルタ後参照フレーム画像データ番号で示される参照フレーム画像を選択し、各ブロックの予測画像データを生成し、選択スイッチ111に送信する。
一方、イントラ予測部105はフレームメモリ101からの符号化対象ブロックと符号化対象ブロックの周辺画素とを用いて複数のイントラ予測モードの各々に応じた処理を施し、各イントラ予測モードの予測画像データと指標データCOSTを生成する。
なお、ここでCOSTは、符号化対象ブロックデータと予測画像データとの画素データ間の差分の自乗和あるいは当該自乗和にアダマ−ル変換を施した値と、ヘッダデータの符号量の予測値とを加算して生成する。そして、イントラ予測部105は、上記複数のイントラ予測モードのうち指標データCOSTを最小にするイントラ予測モードを決定し、COSTと予測画像データを選択スイッチ111に送信する。
選択スイッチ111は、動き補償部104およびイントラ予測部105から送信されてくる予測画像データのうち、COSTの小さいほうを適切な予測画像として選択し、減算器112に送信する。
次にイントラ予測部105で選択可能な予測モードによる予測画像の生成方法について説明する。
まず、イントラ16×16予測で選択可能な予測モードによる予測画像の生成方法を説明する。ここで、符号化対象ブロックに属する画素データをP(x,y)とする。
なお、x,yはブロックを構成するマトリクス状の画素データの行方向および列方向の位置を示し、0〜15の整数である。符号化対象ブロックに隣接する画素データを、P(x,-1),P(-1,y)とする。また、画素データは、上記符号化対象ブロックと異なるピクチャあるいは異なるスライスに属する場合などに、「利用可能でない(unavailable) 」であると判断される。
予測モード0:
予測モード0は、vertical(垂直)予測であり、P(x,-1)が「利用可能」である場合に適用される。この場合に、vertical(垂直)予測では、予測画像データPIの画素データPred(x,y)を数1のように生成する。
[数1]
Pred(x,y)=P(x,-1) : x,y = 0..15
予測モード1:
予測モード1は、horizontal(水平)予測であり、P(-1,y)が「利用可能」である場合に適用される。この場合、horizontal(水平)予測では、予測画像データPIの画素データPred(x,y)を数2のように生成する。
[数2]
Pred(x,y)=P(-1,y) : x,y = 0..15
予測モード2:
予測モード2は、DC予測であり、イントラ16x16予測では、予測画像データPIの画素データPred(x,y)を数3のように生成する。
まず、P(x,-1)およびP(-1,y)の全てが「利用可能」である場合に、イントラ16x16予測では、予測画像データPIの画素データPred(x,y)を数3のように生成する。
[数3]
Figure 0005111127
P(x,-1)がunavailableである場合には予測画像データPIの画素データPred(x,y)を数4のように生成する。
[数4]
Figure 0005111127
P(-1,y)がunavailableである場合には予測画像データPIの画素データPred(x,y)を数5のように生成する。
[数5]
Figure 0005111127
P(x,-1)、P(-1,y)がすべてunavailableである場合には予測画像データPIの画素データPred(x,y)は128を用いる。
予測モード3:
予測モード3は、plane予測であり、P(x,-1)、P(-1,y)の全てが上記「利用可能」である場合に適用される。
この場合に、plane予測では、予測画像データPIの画素データPred(x,y)を数6のように生成する。
[数6]
Figure 0005111127
Figure 0005111127
続いてイントラ4x4予測で選択可能な予測モードによる予測ブロックデータの生成方法を、図4を参照して説明する。
図4は、イントラ4x4予測の符号化処理対象となる4x4のブロックに属する画素データa〜pと、当該ブロックデータの周囲に属する画素データA〜Mとの位置関係を説明するための図である。画素データa〜pの予測値によって、予測画像データPIが生成される。なお、画素データA〜Mは、上記処理対象のブロックと異なるピクチャあるいは異なるスライスに属する場合などに、「利用可能でない(unavailable) 」であると判断される。
予測モード0:
予測モード0は、vertical(垂直)予測であり、図4に示す画素データA,B,C,Dの全てが上記「利用可能」である場合に適用される。この場合、vertical予測は、符号化対象ブロックの画素データa〜pの予測値を、画素データA,B,C,Dを用いて数7のように生成する。
[数7]
a,e,i,m: A
b,f,j,n: B
c,g,k,o: C
d,h,l,p: D
予測モード1:
予測モード1は、horizontal(水平)予測であり、図4に示す画素データI,J,K,Lの全てが上記「利用可能」である場合に適用される。この場合、horizontal予測は、符号化対象ブロック画素データa〜pの予測値を、画素データI,J,K,Lを用いて数8のように生成する。
[数8]
a,b,c,d: I
e,f,g,h: J
i,j,k,l: K
m,n,o,p: L
予測モード2:
予測モード2は、DC予測である。図4に示す画素データA,B,C,D,I,J,K,Lの全てが上記「利用可能」である場合には、符号化対象ブロック画素データa〜pの予測値を、画素データA,B,C,D,I,J,K,Lを用いて数9のように生成する。
[数9]
(A+B+C+D+I+J+K+L+4)>>3
また、図4に示す画素データA,B,C,Dの全てが上記「利用可能」でない場合には、符号化対象ブロック画素データa〜pの予測値を、画素データA,B,C,Dを用いて数10のように生成する。
[数10]
(I+J+K+L+2)>>2
また、図4に示す画素データI,J,K,Lの全てが上記「利用可能」でない場合には、符号化対象ブロック画素データa〜pの予測値を、画素データI,J,K,Lを用いて数11のように生成する。
[数11]
(A+B+C+D+2)>>2
また、図4に示す画素データA,B,C,D,I,J,K,Lの全てが上記「利用可能」でない場合には、符号化対象ブロック画素データa〜pの予測値「128」を用いる。
予測モード3:
予測モード3は、Diagonal_Down_Left予測であり、図4に示す画素データA,B,C,D,I,J,K,L,Mの全てが上記「利用可能」である場合に適用される。この場合、Diagonal_Down_Left予測は、符号化対象ブロック画素データa〜pの予測値を、画素データA,B,C,D,I,J,K,L,Mを用いて数12のように生成する。
[数12]
a: (A+2B+C+2)>>2
b,e:(B+2C+D+2)>>2
c,f,i:(C+2D+E+2)>>2
d,g,j,m:(D+2E+F+2)>>2
h,k,n:(E+2F+G+2)>>2
l,o:(F+2G+H+2)>>2
p:(G+3H+2)>>2
予測モード4:
予測モード4は、Diagonal_Down_Right予測であり、図4に示す画素データA,B,C,D,I,J,K,L,Mの全てが上記「利用可能」である場合に適用される。この場合に、符号化対象ブロック画素データa〜pの予測値を、画素データA,B,C,D,I,J,K,L,Mを用いて数13のように生成する。
[数13]
m:(J+2K+L+2)>>2
i,n:(I+2J+K+2)>>2
e,j,o:(M+2I+J+2)>>2
a,f,k,p:(A+2M+I+2)>>2
b,g,l:(M+2A+B+2)>>2
c,h:(A+2B+C+2) >>2
d:(B+2C+D+2)>>2
予測モード5:
予測モード5は、Diagonal_Vertical_Right予測であり、図4に示す画素データA,B,C,D,I,J,K,L,Mの全てが上記「利用可能」である場合に適用される。この場合に、符号化対象ブロック画素データa〜pの予測値を、画素データA,B,C,D,I,J,K,L,Mを用いて数14のように生成する。
[数14]
a,j:(M+A+1)>>1
b,k:(A+B+1)>>1
c,l:(B+C+1)>>1
d:(C+D+1)>>1
e,n:(I+2M+A+2)>>2
f,o:(M+2A+B+2)>>2
g,p:(A+2B+C+2)>>2
h:(B+2C+D+2)>>2
I:(M+2I+J+2)>>2
m:(I+2J+K+2)>>2
予測モード6:
予測モード6は、Horizontal_Down予測であり、図4に示す画素データA,B,C,D,I,J,K,L,Mの全てが上記「利用可能」である場合に適用される。この場合に、符号化対象ブロック画素データa〜pの予測値を、画素データA,B,C,D,I,J,K,L,Mを用いて数15のように生成する。
[数15]
a,g:(M+I+1)>>1
b,h:(I+2M+A+2)>>2
c:(M+2A+B+2)>>2
d:(A+2B+C+2)>>2
e,k:(I+J+1)>>1
f,l:(M+2I+J+2)>>2
i,o:(J+K+1)>>1
j,p:(I+2J+K+2)>>2
m:(K+L+1)>>1
n:(J+2K+L+2)>>2
予測モード7:
予測モード7は、Vertical_Left予測であり、図4に示す画素データA,B,C,D,I,J,K,L,Mの全てが上記「利用可能」である場合に適用される。この場合に、符号化対象ブロック画素データa〜pの予測値を、画素データA,B,C,D,I,J,K,L,Mを用いて数16のように生成する。
[数16]
a:(A+B+1)>>1
b,i:(B+C+1)>>1
c,j:(C+D+1)>>1
d,k:(D+E+1)>>1
l:(E+F+1)>>1
e:(A+2B+C+2)>>2
f,m:(B+2C+D+2)>>2
g,n:(C+2D+E+2)>>2
h,o:(D+2E+F+2)>>2
p:(E+2F+G+2)>>2
予測モード8:
予測モード8は、Horizontal_Up予測であり、図4に示す画素データA,B,C,D,I,J,K,L,Mの全てが上記「利用可能」である場合に適用される。この場合に、符号化対象ブロック画素データa〜pの予測値を、画素データA,B,C,D,I,J,K,L,Mを用いて数17のように生成する。
[数17]
a:(I+J+1)>>1
b:(I+2J+K+2)>>2
c,e:(J+K+1)>>1
d,f:(J+2K+L+2)>>2
g,i:(K+L+1)>>1
h,j:(K+3L+2)>>2
k,l,m,n,o,p:L
なおイントラ16×16予測のモード1は水平方向に高い相関(重み付け)を持たせたモードであり、モード0は垂直方向に高い相関(重み付け)を持たせたモードである。またモード2、3は水平および垂直方向の重み付けを殆ど行っていないモードである。
イントラ4×4予測のモード1,6,8は水平方向に高い相関(重み付け)を持たせたモードであり、モード0,5,7は垂直方向に高い相関(重み付け)を持たせたモードである。また、モード2,4,3は水平および垂直方向の重み付けを殆ど行っていないモードである。
以下、イントラ予測モードを決定するプロセスについて、図2のイントラ予測部105のブロック図、図3のフローチャート、及び、図6のマクロブロック内の4x4ブロックデータをイントラ予測する順序を説明する図を参照して説明する。
図2は、発明の第1の実施形態に係るイントラ予測部105の構成の一例を示すブロック図である。イントラ予測部105は、予測モード決定有無検出回路200、MPM(Most Probable Mode)選択回路201、予測モード指定データ・符号量生成回路202、4x4COST算出回路203、16x16COST算出回路204を含む。また更に、予測モード決定回路205および予測モード指定データ再生成回路206を含む。
係る構成においてイントラ予測モードを選択するプロセスについて述べる。なお、本実施形態では4x4ブロックデータを単位として図2に示す構成要素の全部あるいは一部の処理をパイプライン処理によって実現するものとする。
予測モード決定有無検出回路200は、符号化対象マクロブロック内の処理対象の4x4のブロックデータ(ブロックBLOCK)が、図6に示す第1のグループと第2のグループとのいずれに属するかをアドレスに基づいて判定する。判定結果は、MPM選択回路201に出力する。
ここで、第1のグループは、図6(a)に示すように、「0」,「2」,「4」,「6」,「8」,「10」,「12」,「14」を要素とする。また、第2のグループは、図6(b)に示すように、「1」,「3」,「5」,「7」,「9」,「11」,「13」,「15」を要素とする。ここで、図6の「0」〜「15」の各値は、イントラ予測処理を行う符号化順を示している。
ここで上記第1のグループと第2のグループを規定した趣旨を、図7を参照して説明する。図7は、発明の実施形態に係るMPM選択回路の処理を説明するための図である。
図7において、MPM選択回路201が、ブロックデータCを処理対象とする場合を考える。MPM選択回路201は、ブロックデータCの予測モードを推定する回路であり、MPMデータを生成する。このMPMデータは、推定される予測モードとして最も可能性の高いモードを示し、予め定められたブロックデータAとブロックデータBについて決定されたイントラ予測モードに基づいて特定される。
ここで、ブロックデータAは、ブロックデータCに2次元画像水平方向で隣接し且つ符号化順が上位の第2のブロックデータである。また、ブロックデータBは、ブロックデータCに2次元画像垂直方向で隣接し且つ符号化順が上位の第1のブロックデータである。
本実施形態ではイントラ予測処理を第1のグループ、第2のグループで並列に行うものとする。つまり、並列処理の一段目に第1のグループに属するブロック「0」、第1のグループに属するブロック「1」が同時にイントラ予測処理される。また、二段目で「2」、「3」が、以降、3段目「4」、「5」、4段目「6」、「7」・・・と処理される。
すると、第1のグループに属するブロックデータに対応した上記予め定められたブロックデータは、当該ブロックデータよりも1段階以上前にパイプライン処理が行われる。従って、第1グループに属するブロックデータの処理を開始するタイミングで、それに対応した上記予め決められたブロックデータのイントラ予測モードは既に決定されている。
例えば、図6に示す「6」番目に選択されるブロックデータに対応した上記予め定められたブロックデータとして、「3」および「4」番のブロックが選択される。これらは、「6」番目に選択されるブロックデータよりも1および2段階前にパイプライン処理によりイントラ予測符号化済であるので、双方とも予測モードが確定している。
一方、第2のグループに属するブロックデータの周辺ブロックの符号化は、当該ブロックデータと同時に符号化処理が行われるものがある。従って、第2グループに属するブロックデータの処理を開始するタイミングで、それに対応したブロックデータは符号化されていない場合がある。
例えば、図6に示す「3」番目に選択されるブロックデータを符号化することを考える。この場合、「3」番目に選択されるブロックデータに対応した上記予め定められたブロックデータとして、「1」および「2」番のブロックデータが選択される。このとき「2」番のブロックデータは、当該「3」番目に選択されるブロックデータと同時に符号化処理が開始される。従って、「3」番目に選択されるブロックデータのイントラ予測モードを決定するタイミングで、「2」番のブロックデータが符号化されておらず、MPMデータを用いたイントラ予測モード決定を行うことができない。
そこで、MPM選択回路201では、以下のような処理を行う。MPM選択回路201は、予測モード決定有無検出回路200から入力された判断結果が「符号化対象のブロックデータが第1のグループに属する」ことを示すかどうかを判定する。
もし、示す場合は、符号化対象として選択された4×4のブロックデータ(図7のC)に対し、
垂直方向に隣接し、当該選択された第1のブロックデータによりも前に予測モード決定回路205にてイントラ予測モードが決定される第1のブロックデータ(図7「B」)と、
水平方向で隣接し、当該選択されたブロックデータよりも前に予測モード決定回路205にてイントラ予測モードが決定される第2のブロックデータ(図7の「A」)と
のイントラ予測モードを、イントラ予測部105の外部にあるイントラ予測モード保存部116から受信し、MPMデータを生成する。
具体的には、MPM選択回路201は、該2つのブロックのイントラ予測モードのうち、モード番号が小さいイントラ予測モードを示すMPMデータを生成する。例えば、図7に示す4x4のブロックデータCが第1のグループに属し符号化対象のブロックデータである場合に、そのMPMデータが示すイントラ予測モードMPM(C)は、数18のように生成される。
[数18]
MPM(C)=min(イントラ予測モード(A)、イントラ予測モード(B))
MPM選択回路201は、予測モード決定有無検出回路200から入力した判断結果が「処理対象のブロックデータが第2のグループに属する」ことを示す場合は、以下のようにしてMPMデータを生成する。
まず、処理対象のブロックデータが属するフレーム(第1のフレーム)に時間的に最も近い符号化済みのフレーム(第2のフレーム)を特定する。次に、第2のブロック(図7「A」)が第1のフレーム内で有する空間位置と同一の空間位置を第2のフレーム内で有する第3のブロック(図7「A'」)を特定する。そして、この第3のブロックを、該第2のブロックの代わりに予め決められたブロックとして用いる。MPM選択回路201は、イントラ予測モード保存部116から、該第3のブロックのイントラ予測モードを受信し、選択された符号化対象のブロックデータのMPMデータを生成する。
例えば、図7に示す4×4のブロックデータCが第2のグループに属し、符号化対象ブロックデータである場合、そのMPMデータは、上記第3のブロックA'のイントラ予測モードを用いて、下記の数19のように生成される。
[数19]
MPM(C)=min(イントラ予測モード(A’)、イントラ予測モード(B))
予測モード指定データ・符号量生成回路202は、MPM選択回路201から入力されたMPMデータを基に、処理対象ブロックのヘッダデータとそのヘッダデータを符号化した時の符号量を判断する指標データを生成する。この指標データは、SATD0として生成される。上記ヘッダデータには、最終的に決定されたイントラ予測モードを指定するための予測モード指定データPREV、REMが含まれる。ここで、「PREV」は、予測モードの伝送の有無を示すフラグであり、「REM」は、予測モードを示す。
図3は、予測モード指定データ・符号量生成回路202の処理を説明するためのフローチャートである。
ステップS301において、予測モード指定データ・符号量生成回路202は、選択するモード0〜8の9個のイントラ予測モードを決定するための、モードの番号:Nsを最大値の8にリセットする。次に、ステップS302では、番号Nsに対応するイントラ予測モードを選択する。初期状態では、Nsが8であるので、モード8が選択される。
次に、ステップS303では、予測モード指定データ・符号量生成回路202は、MPM選択回路201から入力されるMPMデータが示すイントラ予測モードと、ステップS302で選択されたイントラ予測モードとが一致するか否かを判定する。予測モード指定データ・符号量生成回路202は、両モードが一致すると判定した場合に、ステップS304に進み、一致しないと判定した場合にステップS305に進む。
ステップS304では、予測モード指定データ・符号量生成回路202は、モード番号Nsに対応する予測モード指定データPREVnsの値を「1」を設定する。この場合、モード番号Nsに対応する予測モード指定データREMnsには、1ビットのデフォルト値を設定する。また、予測モード指定データREMnsを用いず、データ量「0」としてもよい。
ステップS305では、予測モード指定データ・符号量生成回路202は、モード番号Nsに対応する予測モード指定データPREVnsに「0」を設定する。
続くステップS306では予測モード指定データ・符号量生成回路202は、ステップS302で選択したイントラ予測モードのモード番号Nsと、MPM選択回路201から入力されたMPMデータが示すイントラ予測モードのモード番号の大小を判定する。
ここで、もし、ステップモード番号Nsの方が小さい場合(ステップS306で「YES」)は、ステップS307に進む。一方、モード番号NsがMPMデータが示すイントラ予測モードのモード番号以上の場合(ステップS306で「NO」)、ステップS308に進む。
ステップS307では、予測モード指定データ・符号量生成回路202は、モード番号Nsを、該モード番号に対応する予測モード指定データREMnsの値として設定する。また、ステップS307では、予測モード指定データ・符号量生成回路202は、モード番号Nsから一定値(例えば、「1」)を減算した値を、モード番号Nsに対応する予測モード指定データREMnsに設定する。その後ステップS309に移行する。
ステップS309では、予測モード指定データ・符号量生成回路202は、モード番号Nsが0で有るか否かを判定する。もし、Nsが0でない場合は、未選択のモードが存在するので、ステップS310に移行する。一方、Nsが0の場合は、ステップS311に移行する。
ステップS310では、Nsを1減算して、ステップS302に移行する。ステップS302では、新たなモード番号に対応するイントラ予測モードを選択して、上述の処理を実行する。
一方、ステップS311では、予測モード指定データ・符号量生成回路202は、上述した処理を経て得られた全ての予測モード指定データPREVns(nsは、0から8)、REMnsns(nsは、0から8)の予測符号量(第1の予測符号量)を生成する。生成データは、4x4COST算出回路203に出力される。
4x4COST算出回路203は、モード0〜8の9個のイントラ予測モードの各々について、数20に基づいて、符号量を予測する指標(第2の予測符号量)となる指標データCOSTを生成し、予測モード決定回路205に出力する。
[数20]
COST=SATD+λ(QP)×SATD0
数20において、SATD(Sum of Absolute Transformed Difference)は、4x4の予測ブロックデータと、符号化対象の4x4のブロックデータとの画素データ間の差分にアダマール変換を施した値の累積値である。λ(QP)は、量子化パラメータQPに応じて決まるヘッダデータの予測符号量の係数である。SATD0は、予測モード指定データ・符号量生成回路202から入力された、予測モード指定データPREV,REMの予測符号量を示している。
16×16COST算出回路204は、16×16画素を単位としたブロックデータについて数1〜6で予め規定された複数のイントラ予測モードの各々を基に、その予測符号量の指標となる指標データCOSTを数20に基づき生成する。そして、指標データCOSTを予測モード決定回路205に出力する。
予測モード決定回路205は、4×4COST算出回路203と16×16COST算出回路204とから入力された指標データCOSTのうち、最小の(符号化効率が最も高いと予測される)指標データCOSTを特定する。そして、特定したCOSTに対応したイントラ予測モードを、符号化対象のマクロブロックデータのイントラ予測モードに決定する。
ここでもし4x4のイントラ予測モードに決定されれば、予測モード決定回路205は、予測モード指定データ・符号量生成回路202が生成した予測モード指定データPREV,REMを、予測モード指定データ再生成回路206に出力する。
また、予測モード決定回路205は、上記決定した4x4のイントラ予測モードに対応した指標データCOST、並びにその予測画像データを、選択スイッチ111に出力する。
また、イントラ予測モードとして16x16のイントラ予測モードが決定され、選択スイッチ111からイントラ予測が選択されたことを示す選択信号が入力されると、IPMがエントロピー符号化部108に出力される。このIPMは、決定されたイントラ予測モードを表す。また、予測モード決定回路205は、決定された16×16のイントラ予測モードに対応した指標データCOST、並びにその予測画像データを図1に示す選択スイッチ111に出力する。
また、16x16のイントラ予測モード、4x4のイントラ予測モードのいずれが選択された場合でも、各イントラ予測モードを示すIPMがイントラ予測モード保存部116に出力される。
予測モード指定データ再生成回路206は、処理対象のブロックデータについて予め規定された他のブロックデータのイントラ予測モードが予測モード決定回路205において既に決定された後のタイミングで処理を開始する。
他のブロックデータのイントラ予測モードを基に、上述したMPM選択回路201と同様の処理を行って、デコード時に使用される正しい予測モード指定データPREV,REMを生成する。そして、選択スイッチ111からイントラ予測が選択されたことを示す信号が入力されると、予測モード指定データPREV,REMをエントロピー符号化部108に出力する。
以上のように、本実施形態では、処理対象のブロックデータの隣接ブロックのイントラ予測モードが未決定の場合でも、他のブロックの既に決定しているイントラ予測モードを基にMPMデータを仮生成することで擬似的なCOSTを算出可能である。また、仮生成されたMPMデータは画像の変化の少ない時間的に最も近い符号化済み画像の同一位置で選択されたイントラ予測モードを用いているため、信頼性が高い。従って、符号化効率の高いイントラ予測モードを決定することが可能である。
[第2の実施形態]
次に図5のブロック図および図6を参照しながら、本発明にかかる動画像符号化装置の第2の実施形態について詳細に説明する。
図5は、本実施形態に対応する動画像符号化装置の構成の一例を示す図である。本実施形態の動画像符号化装置は、図1に示した第1の実施形態の動画像符号化装置とほぼ同一の構成を有するが、本実施形態ではグローバルベクトル演算部501を更に有する点が異なる。よって、本実施形態では、イントラ予測モード保存部116、グローバルベクトル演算部501以外の構成の動作については、第1の実施形態と同様のため説明を省略する。
グローバルベクトル演算部501は、符号化済みでかつ復号済みで時間的に符号化対象ピクチャから最も近いピクチャ(以下、参照ピクチャ)をフィルタ後参照フレームメモリ102から取得する。併せて、符号化対象ピクチャをフレームメモリ101から取得する。そして符号化対象ピクチャの画素値全てと、参照ピクチャの画素値全てを用いて参照ピクチャに対する符号化対象ピクチャの空間的な位置の差を示すグローバルベクトル演算する。グローバルベクトルの演算には、数21のMSE(Mean Square Error)の評価関数を用いることができる。また、数22のMAE(Mean Absolute Error)を用いてもよい。あるいは、MAD(Mean Absolute Differ ence)を用いることもできる。
[数21]
Figure 0005111127
[数22]
Figure 0005111127
ここで、Scur(m,n)は符号化対象ピクチャでの(m,n)番目の画素値、Sref(m,n)は参照ピクチャでの(m,n)番目の画素値を示す。(i,j)は参照ピクチャに対する符号化対象ピクチャの空間的な位置をそれぞれ示している。
(ただし、M,Nを1フレーム/フィールドの水平及び垂直画素数とすると、m=k×q、n=l×rであり、k、lは0≦m≦M、1≦k≦M、0≦n≦N、1≦l≦Nを満たす自然数である。また、Q,Rは、M−k≦Q≦M、N−l≦R≦Nを満たす。)
以下、MAE値を例にした場合の、グローバルベクトルの選定方法の例を説明する。参照フレームを所定の方向(例えば、x方向)に1画素ずつずらしていき、画素の移動距離ごとにMAE値の総和の平均を取る。そして平均MAE値が最小となるときの移動量がグローバルベクトルの選定基準となる。この処理を例えば所定の方向と直交する他の方向(例えばy方向)についても実行し、この方向で平均MAE値が最小となる移動量が求まれば、2つの移動量とその移動方向からグローバルベクトルを決定することができる。
本実施形態では1ピクチャの画素値全てを用いて1つグローバルベクトルを算出した。しかし、例えばピクチャの縦方向を3等分、横方向を3等分し9つグのローバルベクトルを求めるなどピクチャを複数のエリアに分割し、エリア毎にグローバルベクトルを算出しても良い。その場合には、処理対象のブロックデータが属するエリアについて算出されたグローバルベクトルを利用することができる。
グローバルベクトル演算部501は算出したグローバルベクトルをイントラ予測モード保存部116に送信する。
イントラ予測モード保存部116は第1の実施形態に記載の予測モード決定有無検出回路200の判断結果が「処理対象のブロックデータが第2のグループに属する」であった場合、以下のように処理を行う。まず、時間的に最も近い符号化済みのフレームにおいて第2のブロック(図7「A」)と同一位置の第3のブロック(図7「A'」)を特定する。その上で、該第3のブロックからグローバルベクトル701分ずらした位置にある第4のブロック(図7「A”」)を特定し、該第4のブロックのイントラ予測モードをMPM選択回路201に送信する。
時間的に近くても例えば撮像装置がパンしているなど大きな動きがある場合には最も近いピクチャの同位置にあるブロックであっても相関が低くなってしまう。そのような場合にもグローバルベクトルを用いてピクチャ間の動き分だけ符号化対象ブロックの位置を補正することで相関の高いブロックを選択することが出来る。以上の理由からイントラ予測モード保存部116から送信するイントラ予測モードとして既に符号化済みの時間的に最も近いピクチャの同位置にあるブロックからグローバルベクトル分だけずらしたブロックのものを用いる。
なお、グローバルベクトルの分だけ位置をずらした結果、ピクチャ外を指し示すような場合には例えば、第1の実施形態で挙げた既に符号化済みの時間的に最も近いピクチャの同位置にあるブロックで用いた予測モードを用いても良い。
以降の処理は第1の実施形態と同様のため、説明を省く。
[その他の実施形態]
なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
また、本発明の目的は、前述した機能を実現するコンピュータプログラムのコードを記録した記憶媒体を、システムに供給し、そのシステムがコンピュータプログラムのコードを読み出し実行することによっても達成される。この場合、記憶媒体から読み出されたコンピュータプログラムのコード自体が前述した実施形態の機能を実現し、そのコンピュータプログラムのコードを記憶した記憶媒体は本発明を構成する。また、そのプログラムのコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した機能が実現される場合も含まれる。
さらに、以下の形態で実現しても構わない。すなわち、記憶媒体から読み出されたコンピュータプログラムコードを、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込む。そして、そのコンピュータプログラムのコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行って、前述した機能が実現される場合も含まれる。
本発明を上記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するコンピュータプログラムのコードが格納されることになる。
発明の第1の実施形態に係る動画像符号化装置の機能構成の一例を示すブロック図である。 発明の第1の実施形態に係るイントラ予測部105の構成の一例を示すブロック図である。 発明の第1実施形態に係る動画像符号化装置の、MPM選択回路の動作の一例を示すフローチャートである。 発明の実施形態におけるイントラ予測の予測モードを説明するための図である。 発明の第2の実施形態に係る動画像符号化装置の機能構成の一例を示すブロック図である。 発明の実施形態に係る、マクロブロック内の4×4ブロックデータをイントラ予測する順序およびイントラ予測の並列処理方法を説明するための図である。 発明の実施形態に係るMPM選択回路の処理を説明するための図である。
符号の説明
101 フレームメモリ
102フィルタ後参照フレームメモリ
103 動き予測部
104 動き補償部
105 イントラ予測部
106 直交変換部
107 量子化部
108 エントロピー符号化部
109 逆量子化部
110 逆直交変換部
111 選択スイッチ
112 減算器
113 加算器
114 フィルタ前参照フレームメモリ
115 ループフィルタ
116 イントラ予測モード保存部

Claims (18)

  1. フレームを構成する各々のブロックについて、複数の予測モードのいずれかの予測モードに従って、処理対象ブロックの隣接ブロックの画素データを用いてイントラ予測符号化を行う動画像符号化装置であって、
    処理対象ブロックの予測モードを
    該処理対象ブロックに隣接する第1のブロックについて選択された予測モードと、
    該処理対象ブロックに隣接する第2のブロックについて選択された予測モード、もしくは、前記処理対象ブロックが属する第1のフレーム内で前記第2のブロックが有する空間位置と同一の空間位置を前記第1のフレームと時間的に最も近い符号化済の第2のフレーム内で有する第3のブロックについて選択された予測モードと
    に基づいて推定する推定手段であって、該処理対象ブロックに隣接する第1のブロック及び第2のブロックのうち、
    双方がイントラ予測符号化済の場合は、該第1のブロックと該第2のブロックとについてそれぞれ選択された前記予測モードに基づき、前記処理対象ブロックの予測モードを推定し、
    前記第1のブロックのみがイントラ予測符号化済である場合は、該第1のブロックについて選択された予測モードと、前記第3のブロックについて選択された予測モードとに基づき、前記処理対象ブロックの予測モードを推定する推定手段と、
    前記複数の予測モードのそれぞれが前記処理対象ブロックのイントラ予測符号化の際に選択された場合に該選択された予測モードを指定する指定データを、前記推定手段により推定された予測モードに基づき生成し、該指定データの第1の予測符号量を算出する生成手段と、
    前記複数の予測モードのそれぞれについて、前記処理対象ブロックをイントラ予測符号化した際の第2の予測符号量を、前記第1の予測符号量を用いて予測する予測手段と、
    前記予測手段により予測された第2の予測符号量に基づいて、前記処理対象ブロックのイントラ予測符号化に用いる予測モードを決定する決定手段と
    を備えることを特徴とする動画像符号化装置。
  2. 前記第1のフレームと前記第2のフレームとの空間的な位置の差を示すグローバルベクトルを演算するグローバルベクトル演算手段をさらに備え、
    前記推定手段は、前記第3のブロックの予測モードに換えて、前記第2のブロックが前記第1のフレーム内で有する空間位置と同一の空間位置を前記第2のフレーム内で有するブロックから、前記グローバルベクトル分だけずれた第4のブロックの予測モードに基づき、前記処理対象ブロックの予測モードを推定することを特徴とする請求項1に記載の動画像符号化装置。
  3. 前記グローバルベクトル演算手段は、前記第1のフレームと前記第2のフレームとを複数のエリアに分割し、対応するエリア毎に前記グローバルベクトルを演算し、
    前記推定手段は、前記処理対象ブロックが属するエリアについて求めた前記グローバルベクトルに基づいて、前記第4のブロックを特定することを特徴とする請求項2に記載の動画像符号化装置。
  4. 前記推定手段は、前記第4のブロックが前記第2のフレームに含まれなくなる場合には、前記第1のブロックについて選択された予測モードに基づき、前記処理対象ブロックの予測モードを推定することを特徴とする請求項2又は3に記載の動画像符号化装置。
  5. 前記生成手段は、前記複数の予測モードの各々について、
    該予測モードと前記推定された予測モードとが一致する場合に、該一致を示す情報を含み、当該予測モードを示す値を含まない前記指定データを生成し、
    該予測モードと前記推定された予測モードとが一致しない場合に、該予測モードを示す値、又は、該値から一定値を減算した値を含む前記指定データを生成する
    ことを特徴とする請求項1から4のいずれか1項に記載の動画像符号化装置。
  6. 前記第1のブロックは、前記処理対象ブロックよりも符号化順が上位で、かつ、前記処理対象ブロックと垂直方向に隣接するブロックであり、
    前記第2のブロックは、前記処理対象ブロックよりも符号化順が上位で、かつ、前記処理対象ブロックと水平方向に隣接するブロックである
    ことを特徴とする請求項1から5のいずれか1項に記載の動画像符号化装置。
  7. フレームを構成する各々のブロックについて、複数の予測モードのいずれかの予測モードに従って、処理対象ブロックの隣接ブロックの画素データを用いてイントラ予測符号化を行う動画像符号化装置の制御方法であって、
    推定手段が、処理対象ブロックの予測モードを、
    該処理対象ブロックに隣接する第1のブロックについて選択された予測モードと、
    該処理対象ブロックに隣接する第2のブロックについて選択された予測モード、もしくは、前記処理対象ブロックが属する第1のフレーム内で前記第2のブロックが有する空間位置と同一の空間位置を前記第1のフレームと時間的に最も近い符号化済の第2のフレーム内で有する第3のブロックについて選択された予測モードと
    に基づいて推定する推定工程であって、該処理対象ブロックに隣接する第1のブロック及び第2のブロックのうち、
    双方がイントラ予測符号化済の場合は、該第1のブロックと該第2のブロックとについてそれぞれ選択された前記予測モードに基づき、前記処理対象ブロックの予測モードを推定し、
    前記第1のブロックのみがイントラ予測符号化済である場合は、該第1のブロックについて選択された予測モードと、前記第3のブロックについて選択された予測モードとに基づき、前記処理対象ブロックの予測モードを推定する推定工程と、
    生成手段が、前記複数の予測モードのそれぞれが前記処理対象ブロックのイントラ予測符号化の際に選択された場合に該選択された予測モードを指定する指定データを、前記推定工程において推定された予測モードに基づき生成し、該指定データの第1の予測符号量を算出する生成手段と、
    予測手段が、前記複数の予測モードのそれぞれについて、前記処理対象ブロックをイントラ予測符号化した際の第2の予測符号量を、前記第1の予測符号量を用いて予測する予測工程と、
    決定手段が、前記予測工程において予測された第2の予測符号量に基づいて、前記処理対象ブロックのイントラ予測符号化に用いる予測モードを決定する決定工程と
    を備えることを特徴とする動画像符号化装置の制御方法。
  8. フレームを構成する各々のブロックについて、複数の予測モードのいずれかの予測モードに従って、処理対象ブロックの隣接ブロックの画素データを用いてイントラ予測符号化を行う動画像符号化装置であって、
    処理対象ブロックの予測モードを、前記処理対象ブロックを含む第1のフレーム内における前記処理対象ブロックに隣接するブロックの予測モードと、前記第1のフレームよりも前に符号化された第2のフレーム内における前記隣接するブロックに対応するブロックの予測モードとを用いて決定する決定手段と、
    前記決定された予測モードに従って前記処理対象ブロックをイントラ予測符号化する符号化手段と
    を有し、
    前記決定手段は、
    前記隣接するブロックの予測モードが取得できる場合は、前記第2のフレーム内における前記隣接するブロックに対応するブロックの予測モードを用いずに、前記隣接するブロックの予測モードを用いて、前記処理対象ブロックの予測モードを決定し、
    前記隣接するブロックの予測モードが取得できない場合は、前記第2のフレーム内における前記予測モードが取得できないブロックに対応するブロックの予測モードを用いて、前記処理対象ブロックの予測モードを決定する
    ことを特徴とする動画像符号化装置。
  9. 前記第2のフレーム内における前記予測モードが取得できないブロックに対応するブロックは、前記第1のフレーム内で前記予測モードが取得できないブロックが有する空間位置と同一の空間位置を前記第2のフレーム内で有するブロックであることを特徴とする請求項8記載の動画像符号化装置。
  10. 前記第1のフレームと前記第2のフレームとの空間的な位置の差を示すグローバルベクトルを演算する演算手段をさらに備え、
    前記決定手段は、
    前記隣接するブロックの予測モードが取得できない場合は、前記予測モードが取得できないブロックの前記第1のフレーム内での空間位置と前記グローバルベクトルとに基づいて選択した前記第2のフレーム内のブロックを、前記予測モードが取得できないブロックに対応するブロックとして、前記処理対象ブロックの予測モードを決定することを特徴とする請求項8に記載の動画像符号化装置。
  11. 前記決定手段は、前記処理対象ブロックの予測モードを、前記予測モードが取得できないブロックの前記第1のフレーム内での空間位置から前記グローバルベクトル分だけずれた位置の前記第2のフレーム内のブロックの予測モードを用いて決定することを特徴とする請求項10に記載の動画像符号化装置。
  12. 前記演算手段は、前記第1のフレームと前記第2のフレームとをずらしながら、各フレームの画素値の差分平均値を演算し、該差分平均値が最小になるずれ量に基づいて前記グローバルベクトルを演算することを特徴とする請求項10または11記載の動画像符号化装置。
  13. 前記演算手段は、前記第1のフレームと前記第2のフレームとをそれぞれ複数のエリアに分割し、対応するエリア毎に前記グローバルベクトルを演算し、
    前記決定手段における前記第2のフレーム内のブロックの選択は、前記処理対象ブロックが属するエリアについて求めた前記グローバルベクトルに基づくことを特徴とする請求項10から12のいずれか1項に記載の動画像符号化装置。
  14. 前記決定手段は、
    前記グローバルベクトルに基づくブロックの空間位置が前記第2のフレームの外となる場合には、
    前記第1のフレーム内で前記予測モードが取得できないブロックが有する空間位置と同一の空間位置の前記第2のフレーム内で有するブロックを前記予測モードが取得できないブロックに対応するブロックとして、前記処理対象ブロックの予測モードを決定することを特徴とする請求項10から13のいずれか1項記載の動画像符号化装置。
  15. 前記処理対象ブロックに隣接するブロックは、前記処理対象ブロックに異なる方向でそれぞれ隣接する2つのブロックを含み、
    前記隣接するブロックの予測モードが取得できない場合とは、前記隣接する2つのブロックのうち一方のブロックの予測モードのみが取得できない場合であって、当該場合に前記決定手段は、
    前記第2のフレーム内における前記予測モードが取得できないブロックに対応するブロックの予測モードと、前記隣接する2つのブロックのうち予測モードが取得できた他方のブロックの予測モードとのうち、予測モードを表す番号が小さい予測モードを用いて、前記処理対象ブロックの予測モードを決定することを特徴とする請求項8から13のいずれか1項記載の動画像符号化装置。
  16. 前記符号化手段は、前記第1のフレームの複数のブロックを並列に符号化することを特徴とする請求項8から15のいずれか1項記載の動画像符号化装置。
  17. フレームを構成する各々のブロックについて、複数の予測モードのいずれかの予測モードに従って、処理対象ブロックの隣接ブロックの画素データを用いてイントラ予測符号化を行う動画像符号化装置の制御方法であって、
    決定手段が、処理対象ブロックの予測モードを、前記処理対象ブロックを含む第1のフレーム内における前記処理対象ブロックに隣接するブロックの予測モードと、前記第1のフレームよりも前に符号化された第2のフレーム内における前記隣接するブロックに対応するブロックの予測モードとを用いて決定する決定工程と、
    符号化手段が、前記決定された予測モードに従って前記処理対象ブロックをイントラ予測符号化する符号化工程とを有し、
    前記決定工程において、
    前記隣接するブロックの予測モードが取得できる場合は、前記第2のフレーム内における前記隣接するブロックに対応するブロックの予測モードを用いずに、前記隣接するブロックの予測モードを用いて、前記処理対象ブロックの予測モードを決定し、
    前記隣接するブロックの予測モードが取得できない場合は、前記第2のフレーム内における前記予測モードが取得できないブロックに対応するブロックの予測モードを用いて、前記処理対象ブロックの予測モードを決定する
    ことを特徴とする動画像符号化装置の制御方法。
  18. コンピュータを、請求項1から、8から16のいずれか1項に記載の動画像符号化装置の各手段として機能させるためのコンピュータプログラム。
JP2008011927A 2008-01-22 2008-01-22 動画像符号化装置及びその制御方法、並びに、コンピュータプログラム Expired - Fee Related JP5111127B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008011927A JP5111127B2 (ja) 2008-01-22 2008-01-22 動画像符号化装置及びその制御方法、並びに、コンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008011927A JP5111127B2 (ja) 2008-01-22 2008-01-22 動画像符号化装置及びその制御方法、並びに、コンピュータプログラム

Publications (3)

Publication Number Publication Date
JP2009177352A JP2009177352A (ja) 2009-08-06
JP2009177352A5 JP2009177352A5 (ja) 2011-02-03
JP5111127B2 true JP5111127B2 (ja) 2012-12-26

Family

ID=41032017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008011927A Expired - Fee Related JP5111127B2 (ja) 2008-01-22 2008-01-22 動画像符号化装置及びその制御方法、並びに、コンピュータプログラム

Country Status (1)

Country Link
JP (1) JP5111127B2 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5235818B2 (ja) * 2009-08-11 2013-07-10 キヤノン株式会社 動画像符号化装置、動画像符号化装置の制御方法及びプログラム
KR101452860B1 (ko) 2009-08-17 2014-10-23 삼성전자주식회사 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
US8644375B2 (en) 2010-04-09 2014-02-04 Sharp Laboratories Of America, Inc. Methods and systems for intra prediction
US20110249741A1 (en) * 2010-04-09 2011-10-13 Jie Zhao Methods and Systems for Intra Prediction
US20110249733A1 (en) * 2010-04-09 2011-10-13 Jie Zhao Methods and Systems for Intra Prediction
US8619857B2 (en) * 2010-04-09 2013-12-31 Sharp Laboratories Of America, Inc. Methods and systems for intra prediction
KR101904948B1 (ko) 2010-04-09 2018-10-08 엘지전자 주식회사 비디오 데이터 처리 방법 및 장치
US20110249734A1 (en) * 2010-04-09 2011-10-13 Segall Christopher A Methods and Systems for Intra Prediction
US20110249735A1 (en) * 2010-04-09 2011-10-13 Jie Zhao Methods and Systems for Intra Prediction
JP2012028858A (ja) * 2010-07-20 2012-02-09 Sony Corp 画像処理装置及び画像処理方法
JP5447695B2 (ja) 2011-01-18 2014-03-19 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
WO2012134046A2 (ko) * 2011-04-01 2012-10-04 주식회사 아이벡스피티홀딩스 동영상의 부호화 방법
KR101383775B1 (ko) * 2011-05-20 2014-04-14 주식회사 케이티 화면 내 예측 방법 및 장치
RS56760B1 (sr) 2011-06-28 2018-04-30 Samsung Electronics Co Ltd Ureðaj za dekodiranje videa korištenjem intra predikcije
WO2013062192A1 (ko) * 2011-10-24 2013-05-02 (주)인터앱 인트라 예측 정보 부호화 방법 및 장치
CN104883578B (zh) * 2011-10-24 2018-04-10 英孚布瑞智有限私人贸易公司 对帧内预测模式进行解码的方法
KR101768401B1 (ko) * 2012-01-13 2017-08-14 샤프 가부시키가이샤 화상 복호 장치
KR101336622B1 (ko) 2013-02-26 2013-12-16 에스케이플래닛 주식회사 오디오 데이터를 이용한 프레즌스 정보 제공 시스템, 이를 위한 장치 및 이를 위한 방법
KR101606853B1 (ko) 2014-05-15 2016-04-11 삼성전자주식회사 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR101607611B1 (ko) 2014-10-29 2016-03-30 삼성전자주식회사 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
JP6501532B2 (ja) 2015-01-23 2019-04-17 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム
KR101607613B1 (ko) 2015-07-23 2016-03-30 삼성전자주식회사 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR101607614B1 (ko) 2015-07-23 2016-03-30 삼성전자주식회사 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR101886259B1 (ko) * 2017-07-19 2018-08-08 삼성전자주식회사 영상 부호화 방법 및 장치, 및 부호화된 비트스트림을 포함하는 기록 매체
KR101989160B1 (ko) * 2018-08-01 2019-06-13 삼성전자주식회사 영상 부호화 방법 및 장치

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3520800B2 (ja) * 1999-03-30 2004-04-19 株式会社日立製作所 画像復号化装置及び画像復号化方法
JP4216769B2 (ja) * 2004-06-02 2009-01-28 日本電信電話株式会社 動画像符号化方法、動画像符号化装置、動画像符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2006005438A (ja) * 2004-06-15 2006-01-05 Sony Corp 画像処理装置およびその方法
CN101133650B (zh) * 2005-04-01 2010-05-19 松下电器产业株式会社 图像解码装置以及图像解码方法
EP2052546A4 (en) * 2006-07-12 2010-03-03 Lg Electronics Inc METHOD AND DEVICE FOR SIGNAL PROCESSING

Also Published As

Publication number Publication date
JP2009177352A (ja) 2009-08-06

Similar Documents

Publication Publication Date Title
JP5111127B2 (ja) 動画像符号化装置及びその制御方法、並びに、コンピュータプログラム
US8126052B2 (en) Motion image encoding apparatus, motion image decoding apparatus, motion image encoding method, motion image decoding method, motion image encoding program, and motion image decoding program
EP3174297B1 (en) Video encoding and decoding with improved error resilience
JP5197591B2 (ja) 映像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体
US20170048524A1 (en) Video encoder and video encoding method
US9031125B2 (en) Image predictive encoding and decoding device
WO2010001916A1 (ja) 画像処理装置および方法
JP2004056823A (ja) 動きベクトル符号化/復号化方法及びその装置
WO2011013253A1 (ja) 幾何変換動き補償予測を用いる予測信号生成装置、動画像符号化装置及び動画像復号化装置
JP4939273B2 (ja) 画像符号化装置及び画像符号化方法
JP4732184B2 (ja) 動画像符号化装置及びその制御方法、コンピュータプログラム、記憶媒体
US20140233645A1 (en) Moving image encoding apparatus, method of controlling the same, and program
JP2008219612A (ja) データ埋め込み装置、データ抽出装置、データ埋め込み方法およびデータ抽出方法
US8792549B2 (en) Decoder-derived geometric transformations for motion compensated inter prediction
JP5178616B2 (ja) シーンチェンジ検出装置および映像記録装置
JP4898415B2 (ja) 動画像符号化装置及び動画像符号化方法
JP4677351B2 (ja) 動き補償器、動き補償処理方法、コンピュータプログラム及び記憶媒体
JP4958825B2 (ja) 動画像符号化装置及びその制御方法、コンピュータプログラム
JP4971817B2 (ja) 画像符号化装置
JP4708821B2 (ja) 動画像符号化装置及びその制御方法、コンピュータプログラム及び記憶媒体
JP2009049969A (ja) 動画像符号化装置及び方法並びに動画像復号化装置及び方法
JP5281597B2 (ja) 動きベクトル予測方法,動きベクトル予測装置および動きベクトル予測プログラム
JP5235813B2 (ja) 動画像符号化装置、動画像符号化方法及びコンピュータプログラム
JP2006074520A (ja) 動きベクトル検出装置
JP2008283302A (ja) 動画像処理装置及び動画像処理方法

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101214

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111111

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120907

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121009

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151019

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5111127

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151019

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees