JP2009246511A - 動画像符号化装置及びその制御方法、コンピュータプログラム - Google Patents

動画像符号化装置及びその制御方法、コンピュータプログラム Download PDF

Info

Publication number
JP2009246511A
JP2009246511A JP2008088258A JP2008088258A JP2009246511A JP 2009246511 A JP2009246511 A JP 2009246511A JP 2008088258 A JP2008088258 A JP 2008088258A JP 2008088258 A JP2008088258 A JP 2008088258A JP 2009246511 A JP2009246511 A JP 2009246511A
Authority
JP
Japan
Prior art keywords
prediction mode
prediction
macroblock
determined
belonging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008088258A
Other languages
English (en)
Other versions
JP4958825B2 (ja
Inventor
Daisuke Sakamoto
大輔 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008088258A priority Critical patent/JP4958825B2/ja
Publication of JP2009246511A publication Critical patent/JP2009246511A/ja
Application granted granted Critical
Publication of JP4958825B2 publication Critical patent/JP4958825B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】画質の劣化を抑えたスライスの分割を可能とする動画像符号化技術を提供する。
【解決手段】画像を複数のマクロブロックに分割し、該マクロブロックの隣接画素を用いてイントラ予測を行う動画像符号化装置であって、各マクロブロックにつきイントラ予測に用いる予測モードであって最も符号化効率の良い予測モードを第1の予測モードグループ又は第2の予測モードグループに属する予測モードから決定する決定手段と、決定予測モードを保存する第1予測モード保存手段と、第1予測モード保存手段に保存された第2の予測モードグループに属し、かつ、1水平ライン分のマクロブロックについて決定された予測モードの数をカウントするカウンタと、決定手段により決定された際のカウント値の大きさに基づいて、1水平ラインに属するマクロブロックによりスライス分割を行うか否かを決定するスライス分割判定手段とを備える。
【選択図】図1

Description

本発明は、動画像符号化装置及びその制御方法、コンピュータプログラムに関する。
近年、マルチメディアに関連する情報のデジタル化が急進しており、それに伴い映像情報の高画質化に向けた要求が高まっている。具体的な例として放送メディアの従来の720×480画素のSD(standard definition)から、1920×1080画素のHD(high definition)に移行が行われつつあることを挙げることができる。
その一方で、テレビ電話やテレビ会議システムなど高画質はさほど要求されないものの、リアルタイム性が高くかつ伝送誤り率の少ない符号化方式が求められている。
これらの要求に対し、ITU−T SG16やISO/IEC JTC1/SC29/WG11の活動で画像間の相関を利用したピクチャ間予測を用いた符号化圧縮方式の標準化作業が進められている。
この中でも、現状最も高能率符号化を実現し、かつエラー耐性が高いといわれる符号化方式にH.264/MPEG−4 PART10(AVC)(以下、H.264と呼ぶ)がある。このH.264では、符号化対象のピクチャを複数のブロック(例えば、マクロブロック)に分割した際に、1つ以上のブロックによって"スライス"を形成して、スライスを単位とした符号化を行うことができる。
H.264を前提とするスライスの設定に関する提案としては、特許文献1が知られている。
スライスは、スライスごとに単独で復号することが可能なため、1つのピクチャをできるだけ多くのスライスで分割することで、符号化後のストリームのエラー耐性を高めることができると考えられる。すなわち、ストリームの伝送誤り等によるエラーを最小限に食い止めることができるものである。
ところで、H.264で導入された新たな技術のひとつとして、ピクチャ内の相関性を利用したイントラ予測が導入されている。H.264のイントラ予測とは、同一ピクチャ内における隣接するブロックの画素値を用いて符号化対象ブロックの画素値を予測するものである。
なお、イントラ予測には複数の予測ブロックサイズ・予測方向を定義した予測モード(以下、イントラ予測モード)が存在する。例えば、16×16画素のブロックデータを基に予測方向を決定するイントラ16×16予測には4種類の予測方向が4×4画素のブロックデータを基に予測方向を決定するイントラ4×4予測には9種類の予測方向がある。
H.264ではこれらのイントラ予測モードから最も適切なものを選択することにより、高能率な符号化を実現している。
イントラ予測で最適なイントラ予測モードを求めるためにH.264のリファレンスソフトモデルJM(Joint Model)では全てのイントラ予測モードに対して演算を行い、最適なイントラ予測モードを選択している。なお、H.264はITU−T SG16やISO/IECが提供している。
イントラ予測においては、複数の画素データから構成されるマクロブロックの処理を行う場合に、例えば、当該処理対象のマクロブロックに隣接する所定のマクロブロックの画素データ、予測モードなどの情報を用いて処理を行う。
但し、処理対象のマクロブロックに隣接する上記所定のマクロブロックが、該処理対象のマクロブロックと異なるスライスに属する場合には、当該隣接した所定のマクロブロックの情報は用いることができないため、代替値を用いて処理を行う。このような代替値を用いた処理は、スライス境界に位置するマクロブロックについて生じる。
特開2006−114979号公報
上記のように代替値を用いてイントラ予測モードを選択する場合、代替値を用いたことにより符号化効率が低下し、スライス境界付近で画質の劣化を生じてしまうという問題がある。
本発明は、このような問題点に鑑みてなされたものであり、画質の劣化を抑えたスライスの分割を可能とする動画像符号化技術を提供することを目的とする。
上記の課題を解決するための本発明は、画像データを複数のマクロブロックに分割し、該マクロブロックに隣接する画素を用いてイントラ予測を行う動画像符号化装置であって、
各マクロブロックにつき、前記イントラ予測に用いる予測モードであって、最も符号化効率の良い予測モードを、マクロブロックの垂直方向上側に隣接する画素を用いる第1の予測モードグループと、該垂直方向上側に隣接する画素を用いない第2の予測モードグループとのいずれかに属する予測モードから決定する決定手段と、
決定された前記予測モードを保存する第1予測モード保存手段と、
前記第1予測モード保存手段に保存された第2の予測モードグループに属し、かつ、1水平ライン分のマクロブロックについて決定された予測モードの数をカウントするカウンタと、
前記決定手段により1水平ライン分のマクロブロックについて前記予測モードが決定された際の、前記カウンタのカウント値の大きさに基づいて、前記1水平ラインに属するマクロブロックによりスライス分割を行うか否かを決定するスライス分割判定手段と
を備えることを特徴とする。
本発明によれば、画質の劣化を抑えたスライスの分割を可能とする動画像符号化技術を提供することができる。
以下、図面を参照して発明の実施形態を説明する。
[第1の実施形態]
以下に図1、図2、図3、図4を参照しながら、発明の第1の実施形態に対応する動画像符号化装置について詳細に説明する。
図1は本発明に係る動画像符号化装置のブロック図である。なお、本実施形態では、符号化対象となるピクチャの符号化として、フレーム画像を符号化することを例にして説明する。
図1に示すように、本発明に係る動画像符号化装置はフレームメモリ101、フィルタ後参照フレームメモリ102、動き予測部103、動き補償部104、イントラ予測部105、直交変換部106、量子化部107、
エントロピー符号化部108、逆量子化部109、逆直交変換部110、スイッチ111、減算器112、加算器113、フィルタ前参照フレームメモリ114、ループフィルタ115、スライス分割決定部116を備えて構成される。
係る構成において、まず入力画像を符号化する方法について述べる。
フレームメモリ101には表示順に入力画像データが保存され、入力画像データは符号化対象となる第1のサイズの16×16画素のマクロブロックに分割される。符号化対象ブロックは、符号化順に動き予測部103、イントラ予測部105、減算器112に順次送信される。減算器112はフレームメモリ101から送信される符号化対象ブロックから、スイッチ111から送信される予測画像ブロックを減算し、画像残差データを出力する。なお、予測画像ブロックの生成方法については後述する。
直交変換部106では減算器112から出力された画像残差データを直交変換処理して、変換係数を量子化部107に出力する。量子化部107は直交変換部106から提供された変換係数を所定の量子化パラメータを用いて量子化し、エントロピー符号化部108および逆量子化部109に出力する。エントロピー符号化部108は量子化部107で量子化された変換係数を入力し、CAVLC、CABACなどのエントロピー符号化を施して、符号化データストリームとして出力する。
続いて、量子化部107で量子化された変換係数を用いた参照画像データの生成方法について説明する。
逆量子化部109は量子化部107から提供される量子化された変換係数を、逆量子化する。逆直交変換部110は逆量子化部109で逆量子化された変換係数を逆直交変換し、復号残差データを生成し加算器113に出力する。加算器113は復号残差データと、スイッチ111から出力される後述の予測画像データとを加算し参照画像データを生成する。生成された参照画像データは、フィルタ前参照フレームメモリ114に保存されるとともに、フィルタ前参照フレームメモリ114からループフィルタ115へ出力される。ループフィルタ115は、参照画像データをフィルタリングしてノイズを除去し、フィルタ後の参照画像データをフィルタ後参照フレームメモリ102に保存する。
続いて、入力画像データおよびフィルタ前参照画像データ、フィルタ後参照画像データを用いた予測画像データの生成方法について説明する。
動き予測部103は、符号化対象ブロックのフィルタ後参照画像データでの動き量を表す動きベクトルを検出する。そのために、動き予測部103には、フレームメモリ101から送信される符号化対象ブロックと、フィルタ後参照フレームメモリ102から送信されるフィルタ後参照画像データとが入力される。検出された動きベクトルは、フィルタ後参照フレーム画像データ番号と共に動き補償部104に出力される。
動き補償部104は、動き予測部103から提供された動きベクトルを用いて、フィルタ後参照フレームメモリ102中のフィルタ後参照フレーム画像データ番号で示される参照フレーム画像を参照して、各ブロックの予測画像データを生成する。生成した予測画像データはスイッチ111に出力される。
一方、イントラ予測部105はフレームメモリ101から提供される符号化対象ブロックとフィルタ前参照フレームメモリ114から提供される符号化済みの符号化対象ブロックの周辺画素を用いてイントラ予測を行う。即ち、イントラ予測において適切なイントラ予測モードを選択して予測画像データを生成し、スイッチ111に出力する。
スイッチ111は、動き補償部104およびイントラ予測部105から送信されてくる予測画像データのうち、適切な予測画像を選択して減算器112に出力する。なお、適切な予測画像の選択方法は、例えば符号化対象ブロックと参照画像データの画像残差の絶対値和が小さいほうを選択するなどの方法が挙げられる。但し、本実施形態では、選択方法自体が発明の本質的特徴となるわけではないので、その種類は特に限定されるものではない。
次に、イントラ予測部105で選択可能な予測モードによる予測画像の生成方法について図4を参照して説明する。該予測モードには、第1のサイズの16×16画素のブロックデータを基に予測方向を決定するイントラ16×16予測には4種類が存在する。また、第2のサイズの4×4画素のブロックデータを基に予測方向を決定するイントラ4×4予測には9種類の予測モードがある。
まず、イントラ16×16予測で選択可能な予測モードによる予測画像の生成方法を説明する。ここで、符号化対象ブロックに属する画素データをP(x,y)とする。なお、x,yはブロックを構成するマトリクス状の画素データの行方向および列方向の位置を示し、0〜15の整数である。
ここで、符号化対象ブロックに隣接する画素データをP(x,-1),P(-1,y)とする。また、画素データは、上記符号化対象ブロックと異なるピクチャあるいは異なるスライスに属する場合などに、「利用可能でない(unavailable) 」であると判断される。
予測モード0:
予測モード0は、vertical(垂直)予測であり、P(x,-1)が「利用可能」である場合に適用される。この場合に、vertical(垂直)予測では、予測画像データPIの画素データPred(x,y)を数1のように生成する。
[数1]
Pred(x,y)=P(x,-1) : x,y = 0..15
予測モード1:
予測モード1は、horizontal(水平)予測であり、P(-1,y)が「利用可能」である場合に適用される。この場合、horizontal(水平)予測では、予測画像データPIの画素データPred(x,y)を数2のように生成する。
[数2]
Pred(x,y)=P(-1,y) : x,y = 0..15
予測モード2:
予測モード2は、DC予測であり、イントラ16×16予測では、予測画像データPIの画素データPred(x,y)を数3のように生成する。
まず、P(x,-1)およびP(-1,y)の全てが「利用可能」である場合に、イントラ16×16予測では、予測画像データPIの画素データPred(x,y)を数3のように生成する。
[数3]
Figure 2009246511
P(x,-1)がunavailableである場合には予測画像データPIの画素データPred(x,y)を数4のように生成する。
[数4]
Figure 2009246511
P(-1,y)がunavailableである場合には予測画像データPIの画素データPred(x,y)を数5のように生成する。
[数5]
Figure 2009246511
P(x,-1)、P(-1,y)がすべてunavailableである場合には予測画像データPIの画素データPred(x,y)は128を用いる。
予測モード3:
予測モード3は、plane予測であり、P(x,-1)、P(-1,y)の全てが上記「利用可能」である場合に適用される。この場合に、plane予測では、予測画像データPIの画素データPred(x,y)を数6のように生成する。
[数6]
Figure 2009246511
Figure 2009246511
続いてイントラ4×4予測で選択可能な予測モードによる予測ブロックデータの生成方法を、図4を参照して説明する。
図4は、イントラ4×4予測の符号化処理対象となる4×4のブロックに属する画素データa〜pと、当該ブロックデータの周囲に属する画素データA〜Mとの位置関係を説明するための図である。画素データa〜pの予測値によって、予測画像データPIが生成される。なお、画素データA〜Mは、上記処理対象のブロックと異なるピクチャあるいは異なるスライスに属する場合などに、「利用可能でない(unavailable) 」であると判断される。
予測モード0:
予測モード0は、vertical(垂直)予測であり、図4に示す画素データA,B,C,Dの全てが上記「利用可能」である場合に適用される。この場合、vertical予測は、符号化対象ブロックの画素データa〜pの予測値を、画素データA,B,C,Dを用いて数7のように生成する。
[数7]
a,e,i,m: A
b,f,j,n: B
c,g,k,o: C
d,h,l,p: D
予測モード1:
予測モード1は、horizontal(水平)予測であり、図4に示す画素データI,J,K,Lの全てが上記「利用可能」である場合に適用される。この場合、horizontal予測は、符号化対象ブロック画素データa〜pの予測値を、画素データI,J,K,Lを用いて数8のように生成する。
[数8]
a,b,c,d: I
e,f,g,h: J
i,j,k,l: K
m,n,o,p: L
予測モード2:
予測モード2は、DC予測である。図4に示す画素データA,B,C,D,I,J,K,Lの全てが上記「利用可能」である場合には、符号化対象ブロック画素データa〜pの予測値を、画素データA,B,C,D,I,J,K,Lを用いて数9のように生成する。
[数9]
(A+B+C+D+I+J+K+L+4)>>3
また、図4に示す画素データA,B,C,Dの全てが上記「利用可能」でない場合には、符号化対象ブロック画素データa〜pの予測値を、画素データA,B,C,Dを用いて数10のように生成する。
[数10]
(I+J+K+L+2)>>2
また、図4に示す画素データI,J,K,Lの全てが上記「利用可能」でない場合には、符号化対象ブロック画素データa〜pの予測値を、画素データI,J,K,Lを用いて数11のように生成する。
[数11]
(A+B+C+D+2)>>2
また、図4に示す画素データA,B,C,D,I,J,K,Lの全てが上記「利用可能」でない場合には、符号化対象ブロック画素データa〜pの予測値「128」を用いる。
予測モード3:
予測モード3は、Diagonal_Down_Left予測であり、図4に示す画素データA,B,C,D,I,J,K,L,Mの全てが上記「利用可能」である場合に適用される。この場合、Diagonal_Down_Left予測は、符号化対象ブロック画素データa〜pの予測値を、画素データA,B,C,D,I,J,K,L,Mを用いて数12のように生成する。
[数12]
a: (A+2B+C+2)>>2
b,e:(B+2C+D+2)>>2
c,f,i:(C+2D+E+2)>>2
d,g,j,m:(D+2E+F+2)>>2
h,k,n:(E+2F+G+2)>>2
l,o:(F+2G+H+2)>>2
p:(G+3H+2)>>2
予測モード4:
予測モード4は、Diagonal_Down_Right予測であり、図4に示す画素データA,B,C,D,I,J,K,L,Mの全てが上記「利用可能」である場合に適用される。この場合に、符号化対象ブロック画素データa〜pの予測値を、画素データA,B,C,D,I,J,K,L,Mを用いて数13のように生成する。
[数13]
m:(J+2K+L+2)>>2
i,n:(I+2J+K+2)>>2
e,j,o:(M+2I+J+2)>>2
a,f,k,p:(A+2M+I+2)>>2
b,g,l:(M+2A+B+2)>>2
c,h:(A+2B+C+2) >>2
d:(B+2C+D+2)>>2
予測モード5:
予測モード5は、Diagonal_Vertical_Right予測であり、図4に示す画素データA,B,C,D,I,J,K,L,Mの全てが上記「利用可能」である場合に適用される。この場合に、符号化対象ブロック画素データa〜pの予測値を、画素データA,B,C,D,I,J,K,L,Mを用いて数14のように生成する。
[数14]
a,j:(M+A+1)>>1
b,k:(A+B+1)>>1
c,l:(B+C+1)>>1
d:(C+D+1)>>1
e,n:(I+2M+A+2)>>2
f,o:(M+2A+B+2)>>2
g,p:(A+2B+C+2)>>2
h:(B+2C+D+2)>>2
I:(M+2I+J+2)>>2
m:(I+2J+K+2)>>2
予測モード6:
予測モード6は、Horizontal_Down予測であり、図4に示す画素データA,B,C,D,I,J,K,L,Mの全てが上記「利用可能」である場合に適用される。この場合に、符号化対象ブロック画素データa〜pの予測値を、画素データA,B,C,D,I,J,K,L,Mを用いて数15のように生成する。
[数15]
a,g:(M+I+1)>>1
b,h:(I+2M+A+2)>>2
c:(M+2A+B+2)>>2
d:(A+2B+C+2)>>2
e,k:(I+J+1)>>1
f,l:(M+2I+J+2)>>2
i,o:(J+K+1)>>1
j,p:(I+2J+K+2)>>2
m:(K+L+1)>>1
n:(J+2K+L+2)>>2
予測モード7:
予測モード7は、Vertical_Left予測であり、図4に示す画素データA,B,C,D,I,J,K,L,Mの全てが上記「利用可能」である場合に適用される。この場合に、符号化対象ブロック画素データa〜pの予測値を、画素データA,B,C,D,I,J,K,L,Mを用いて数16のように生成する。
[数16]
a:(A+B+1)>>1
b,i:(B+C+1)>>1
c,j:(C+D+1)>>1
d,k:(D+E+1)>>1
l:(E+F+1)>>1
e:(A+2B+C+2)>>2
f,m:(B+2C+D+2)>>2
g,n:(C+2D+E+2)>>2
h,o:(D+2E+F+2)>>2
p:(E+2F+G+2)>>2
予測モード8:
予測モード8は、Horizontal_Up予測であり、図4に示す画素データI,J,K,Lが上記「利用可能」である場合に適用される。この場合に、符号化対象ブロック画素データa〜pの予測値を、画素データI,J,K,Lを用いて数17のように生成する。
[数17]
a:(I+J+1)>>1
b:(I+2J+K+2)>>2
c,e:(J+K+1)>>1
d,f:(J+2K+L+2)>>2
g,i:(K+L+1)>>1
h,j:(K+3L+2)>>2
k,l,m,n,o,p:L
なおイントラ16×16予測のモード1は水平方向に高い相関(重み付け)を持たせたモードであり、モード0は垂直方向に高い相関(重み付け)を持たせたモードである。またモード2、3は水平および垂直方向の重み付けを殆ど行っていないモードである。
イントラ4×4予測のモード1,6,8は水平方向に高い相関(重み付け)を持たせたモードであり、モード0,5,7は垂直方向に高い相関(重み付け)を持たせたモードである。また、モード2,4,3は水平および垂直方向の重み付けを殆ど行っていないモードである。
次に本発明の最も特徴的な部分であるスライスを分割する処理について説明する。以降では、図5のスライス分割決定部116のブロック図、図2のフローチャート、図3のマクロブロック内の4×4のブロックデータ(ブロックBLOCK)のMBアドレスを説明する図を参照して説明する。
なお、本実施形態では説明の簡略化のため、Iスライスのみで構成されるピクチャを例に挙げて説明する。従って、本実施形態では動き予測部103で動きベクトルを検出する処理は行われない。また、本実施形態では符号化処理がパイプライン的に分割されて処理され、前段で水平方向1ライン分のマクロブロックのイントラ予測モードが決定し、後段で他の符号化処理が行われるものとする。以下では、前段で行われる水平方向1ライン分のマクロブロックのイントラ予測モードの決定処理を説明する。
図2のステップS201において、イントラ予測部105は16×16イントラ予測あるいは4×4イントラ予測の内から最も符号化効率の良い予測モードを選択する。イントラ予測モードを選択する方法としては、例えば、数18に示す予測誤差Costを各予測モードについて求め、Costが最小のものを符号化効率の良い予測モードとする方法を挙げることができる。但し、Costを求める方法の種別については特に問わない。
[数18]
Figure 2009246511
なお、数18においてnはイントラ16×16予測かイントラ4×4予測かで16か4の値を取る。また、Org(i,j)は符号化対象データの左上を(0,0)として右下を(n,n)とした時の画素位置(i,j)の画素値、Pred(mod e,i,j)は同様に予測画像データの画素位置(i,j)の画素値である。また、SAD0(mod e)はヘッダデータのビット数を表し、QP0は量子化パラメータQPと実際に量子化に用いられる量子化スケールを関連付ける係数である。
続くステップS202でイントラ予測部105は、選択された予測モードが4×4のイントラ予測モードであるか否かを判定する。もし、16×16予測の予測モードが選択された場合(ステップS202において「NO」)、ステップS203に移行する。
ステップS203では、予測モードをスライス分割決定部116に送信する。この予測モードは、最も符号化効率の良い予測モードとして、第1予測モード保存部504に保存される。このとき、最も符号化効率の良い予測モードとして予測モード0、3が選ばれた場合、イントラ予測部105は予測モード1、2のうち最も符号化効率の良い予測モードを更に特定し、スライス分割決定部116に出力する。予測モード1、2のうち最も符号化効率の良い予測モードの情報は、第2予測モード保存部503に保存される。
一方、4×4予測の予測モードが選択された場合(ステップS202において「YES」)、ステップS204に移行する。イントラ予測部105は、図3に示す符号化対象マクロブロック内の処理対象の4×4のブロックのうち、所定のMBアドレスのブロックの予測モードのみをスライス分割決定部116に出力する。出力された予測モードは、最も符号化効率の良い予測モードとして、第1予測モード保存部504に保存される。ここで、所定のMBアドレスは、図3における「0」、「1」、「4」、「5」のアドレスをいい、以下これらのブロックの集合を第1の4×4MBグループと呼ぶ。
ステップS204においてイントラ予測部105は更に、イントラ4×4予測時に予測モード0、3、4、5、6、7のいずれかが選ばれた場合には、予測モード1、2、8から最も符号化効率の良い予測モードを特定する。イントラ予測部105は、該特定された予測モードをスライス分割決定部116に出力し、第2予測モード保存部503に保存する。
なお、以後、イントラ16×16予測時の予測モード0、3、イントラ4×4予測時の予測モード0、3、4、5、6、7を第1の予測モードグループという。また、イントラ16×16予測時の予測モード1、2、イントラ4×4予測時の予測モード1、2、8を第2の予測モードグループと呼ぶ。
ここで、第1の4×4MBグループの予測モードとその他のグループ(第2の4×4MBグループ)とで、処理を分ける趣旨を述べる。
まず、第1の4×4MBグループは符号化対象マクロブロックの垂直方向上側の画素に隣接するのに対し、第2の4×4MBグループは隣接しない。そのため、第1の4×4MBグループで垂直方向上側でマクロブロックに隣接する画素を用いた予測モードが適切な予測モードであった場合、該マクロブロックでスライスの分割を行うと画質の劣化を伴うことになる。一方、第2の4×4MBグループの垂直方向上側ではスライスの分割が行われない。
そこで、本実施形態では、第1の4×4MBグループで選択された予測モードを後述するスライス分割決定の指標に用いる。
また、第1の予測モードグループと第2の予測モードグループの2つのグループに分ける趣旨を述べる。
第2の予測モードグループは垂直方向上側に隣接する画素を予測に用いない。そのため、当該16×16のブロックでスライス分割を行っても画質に劣化を伴わない。一方、第1の予測モードグループは垂直方向上側に隣接する画素を予測に用いるため、スライス分割を行うと画質が劣化してしまう。即ち、第2の予測モードグループの数が多ければ、該符号化対象ブロックでスライス分割を行っても、画質の劣化が少ないと判断できる。以上の理由から、第2の予測モードグループの数をスライス分割を行うか否かの指標として用いる。
そこで、図2のフローチャートのステップS205では、第1予測モード保存部504に保存された予測モードが、第2の予測モードグループに属するか否かを判定する。もし、属すると判定された場合(ステップS205において「YES」)、ステップS206に移行する。一方、属しないと判定された場合(ステップS205において「NO」)、ステップS208に移行する。
ステップS206では、図5のスライス分割決定部116内の予測モードカウンタ500が、カウント値(以下、Count)を1だけカウントアップし、ステップS207に移行する。カウンタ500は、1水平ラインに属するマクロブロックのうち、第2の予測モードグループに属する予測モードが選択されたマクロブロックの数をカウントするカウンタである。従って、1水平ラインの処理が終了するたびにCountがリセットされる。ステップS207では、スライス分割決定部116内のブロックアドレス保存部501が、第2の予測モードグループに所属しているブロックのアドレスを保存し、ステップS208に移行する。
ステップS208では、水平方向1ライン分のマクロブロックの処理が終了したか否かを判定する。もし、処理が終了したと判定された場合(ステップS208において「YES」)、ステップS209に移行する。処理が終了していないと判定された場合(ステップS208において「NO」)、ステップS201に戻って次のマクロブロックについて処理を行う。
ステップS209では、予測モードカウンタ500が、Countの値をスライス分割判定部502に出力する。続くステップS210でスライス分割判定部502は、予め設定してある閾値ThとCountとを比較し、Countが閾値Thより大きいか否かを判定する。もし、Countの値が閾値Th以下の場合(ステップS210において「NO」)、ステップS214に移行する。一方、Countの値が閾値Thより大きいの場合(ステップS210において「YES」)、ステップS211に移行する。ステップS211では、該1水平ラインに属するマクロブロックによりスライス分割を行う。スライスが分割されることが決まった場合は図示しないCPUに新たなスライスヘッダをストリームに付加するよう指示すると共に、スライス分割判定部502にもスライス分割が実施されることを示す信号を送信する。
続くステップS212では、処理が終了した1水平ライン分のMBのうち、第2の予測モードグループに属する予測モードが選択されていたMBにつき、第1予測モード保存部504からイントラ予測部105に予測モードをそのまま送信する。
続くステップS213では、第1の予測モードグループに属する予測モードが選択されていたMBにつき、第2予測モード保存部503に保存されている対応する予測モードをイントラ予測部105に送信する。これは、スライスの分割により、第1の予測モードグループに属する予測モードを選択していたブロックは、そのままでは垂直方向の画素が参照できず予測が行えなくなるためである。
ステップS214では、第1予測モード保存部504からイントラ予測部105に予測モードをそのまま送信する。
以上により、イントラ予測部105は、上述したパイプライン処理の後段で行う符号化処理において、スライス分割決定部116から送信されてくる予測モードに応じて予測画像を生成しスイッチ111に送信することができる。
以上、説明したようにスライス分割決定部116によってスライスをまたいだ画素を用いたイントラ予測モードの選択数が少ない時にだけスライス分割を行うことが可能となる。すなわち、スライス境界における画質の劣化を抑制したスライス分割が可能となり、エラー耐性を保ちつつ高品質な画像を提供することが可能になる。
[第2の実施形態]
以下、発明の第2の実施形態を説明する。図6は、本実施形態に対応する動画像符号化装置の構成の一例を示す図である。図6に示す本実施形態に係る動画像符号化装置は第1の実施形態における図1の装置とほぼ同じ構造を有するが、MBカウンタ117を有する点が異なる。
なお、イントラ予測部105とMBカウンタ117以外の構成の動作については第1の実施形態と同様のため説明を省く。
MBカウンタ117はスライスが開始するマクロブロックの値を0として、CPUからマクロブロックの符号化開始を示す信号が送信される度にカウンタ(以後、MBCount)をカウントアップする。即ち、MBカウンタ117は、スライスに含まれるマクロブロック数をカウントするマクロブロックカウンタである。また、同時にMBCountをイントラ予測部105に送信する。また、スライス分割が行われた際にはMBCountを0にリセットする。
イントラ予測部105は第1実施形態と同様、16×16イントラ予測あるいは4×4イントラ予測の内から最も符号化効率の良い予測モードを選択する。イントラ予測モードを選択する方法としては数18に示す予測誤差Costを算出し、Costの最小のものを符号化効率の良い予測モードとするなどを挙げることができるが、Costを算出する方法については問わない。ただし本実施形態では第2の予測モードグループ(垂直方向の画素を予測に用いないグループ)に関しては、たとえば数18で求められるCostから以下の数19で算出される所定値kを減算してCostを求める。
[数19]
Figure 2009246511
なお、Thα>Thβ>Thγとし、α>β>γとする。
このようなCostを算出することで、減算後のCostの値が小さくなり第2の予測モードグループが選択される確率を高め、スライス分割が行われやすくできる。また、数19でα>β>γとしているのは第2の予測モードグループがあまり選択されずスライス分割が行われない場合に、第2の予測モードグループが選択される確率を高め、スライス分割が行われやすくするためである。
なお、数19においてCostから減算する値としてα、β、γを設けたが更に多くの閾値を設け減算する値の種類を増やしても良い。以降の処理は第1の実施形態と同様のため、説明を省く。
以上、本実施形態では、説明したように第2の予測モードグループ(垂直方向の画素を予測に用いないグループ)に関して、通常のCostからMBCountの増加に応じて増加する所定の値を減算する。これにより、なかなかスライス分割が行われない場合にスライス分割が実施される可能性を高め、ストリームのエラー耐性を高めることができる。
[第3の実施形態]
次に発明の第3の実施形態を説明する。本実施形態の動画像符号化装置の構成は図1に示したものと同様であるが、イントラ予測部105における予測モードの決定方法は第1の実施形態の内容とは異なる。なお、イントラ予測部105以外の構成の動作については第1の実施形態と同様のため説明を省く。
イントラ予測部105は第1の実施形態と同様、16×16イントラ予測あるいは4×4イントラ予測の内から最も符号化効率の良い予測モードを選択する。イントラ予測モードを選択する方法としては数18に示す予測誤差Costを求め、Costの最も小さいものを符号化効率の良い予測モードとすることができる。但し、Costを求める方法はこれに限定されるものではない。Costが最も小さい予測モードが第2の予測モードグループに属する場合の処理は、第1実施形態と同様であるためここでは省略する。
Costが最も小さい予測モードが第1の予測モードグループに属する場合のCostを、第1の予測誤差「Cost1」とする。また、その時の第2の予測モードグループに属する予測モードのうち、最もCostが小さかった予測モードのCostを第2の予測誤差「Cost2」とする。
本実施形態では、、Cost2とCost1との差分の大きさに基づいて、予測モードを決定する。具体的にCost2-Cost1<Th を満たす場合には、イントラ予測モードとして第2の予測モードグループのうち最もCostが小さかった予測モードを選択する。一方、Cost2-Cost1≧Th である場合にはイントラ予測モードとして第1の予測モードグループのうち最もCostが小さかった予測モードを選択する。なお、閾値Thの値は、画質の劣化を伴わない程度に十分小さい値を設定する。
即ち、第1の予測モードグループのCostが最も小さい場合でも、第1の予測モードグループのCostと第2の予測モードグループのCostの差がそれほど大きくない場合は、第2の予測モードグループの予測モードをイントラ予測モードとして選択する。
以上のように、本実施形態では、第1の予測モードグループのCost1と第2の予測モードグループのCost2の差が小さい場合のみ第2の予測モードグループを積極的に選択する。これにより、画質の劣化をほとんど伴わず、スライス分割が実施される可能性を高め、ストリームのエラー耐性を高めることができる。
[その他の実施形態]
なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
また、本発明の目的は、前述した機能を実現するコンピュータプログラムのコードを記録した記憶媒体を、システムに供給し、そのシステムがコンピュータプログラムのコードを読み出し実行することによっても達成される。この場合、記憶媒体から読み出されたコンピュータプログラムのコード自体が前述した実施形態の機能を実現し、そのコンピュータプログラムのコードを記憶した記憶媒体は本発明を構成する。また、そのプログラムのコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した機能が実現される場合も含まれる。
さらに、以下の形態で実現しても構わない。すなわち、記憶媒体から読み出されたコンピュータプログラムコードを、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込む。そして、そのコンピュータプログラムのコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行って、前述した機能が実現される場合も含まれる。
本発明を上記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するコンピュータプログラムのコードが格納されることになる。
発明の第1の実施形態及び第3の実施形態に係る動画像符号化装置の構成の一例を示すブロック図である。 発明の第1の実施形態に係る動画像符号化装置のイントラ予測部およびスライス分割部の動作を説明するためのフローチャートである。 発明の第1の実施形態に係る動画像符号化装置の4×4マクロブロックのMBアドレスを説明するための図である。 発明の実施形態に係るイントラ予測の予測モードを説明するための図である。 発明の第1の実施形態に係る動画像符号化装置のスライス分割部の概略の構成を示すブロック図である。 発明の第2の実施形態に係る動画像符号化装置の構成の一例を示すブロック図である。
符号の説明
101 フレームメモリ
102 フィルタ後参照フレームメモリ
103 動き予測部
104 動き補償部
105 イントラ予測部
106 直交変換部
107 量子化部
108 エントロピー符号化部
109 逆量子化部
110 逆直交変換部
111 スイッチ
112 減算器
113 加算器
114 フィルタ前参照フレームメモリ
115 ループフィルタ
116 スライス分割決定部
117 MBカウンタ

Claims (10)

  1. 画像データを複数のマクロブロックに分割し、該マクロブロックに隣接する画素を用いてイントラ予測を行う動画像符号化装置であって、
    各マクロブロックにつき、前記イントラ予測に用いる予測モードであって、最も符号化効率の良い予測モードを、マクロブロックの垂直方向上側に隣接する画素を用いる第1の予測モードグループと、該垂直方向上側に隣接する画素を用いない第2の予測モードグループとのいずれかに属する予測モードから決定する決定手段と、
    決定された前記予測モードを保存する第1予測モード保存手段と、
    前記第1予測モード保存手段に保存された、第2の予測モードグループに属し、かつ、1水平ライン分のマクロブロックについて決定された予測モードの数をカウントするカウンタと、
    前記決定手段により1水平ライン分のマクロブロックについて前記予測モードが決定された際の、前記カウンタのカウント値の大きさに基づいて、前記1水平ラインに属するマクロブロックによりスライス分割を行うか否かを決定するスライス分割判定手段と
    を備えることを特徴とする動画像符号化装置。
  2. 前記決定手段は、第1のサイズのマクロブロックと、該第1のサイズのマクロブロックを更に分割した第2のサイズのマクロブロックであって、該第1のサイズのマクロブロックの垂直方向上側に隣接する画素と隣接する第2のサイズのマクロブロックとについて、前記予測モードを決定することを特徴とする請求項1に記載の動画像符号化装置。
  3. 前記スライス分割判定手段は、前記カウント値が閾値より大きい場合に、スライス分割を行うと判定することを特徴とする請求項1又は2に記載の動画像符号化装置。
  4. 決定された前記予測モードが前記第1の予測モードグループに属する場合に、前記第2の予測モードグループに属する予測モードのうち、最も符号化効率の良い予測モードを保存する第2予測モード保存手段と、
    前記スライス分割判定手段がスライス分割を行なうと判定した場合、前記1水平ラインに属するマクロブロックのうち、決定された前記予測モードが前記第1の予測モードグループに属するマクロブロックについて、前記第2予測モード保存手段に保存された予測モードにより予測画像データを生成するイントラ予測手段と
    をさらに備えることを特徴とする請求項1乃至3のいずれか1項に記載の動画像符号化装置。
  5. 決定された前記予測モードが前記第1の予測モードグループに属するマクロブロックについて、前記画像データにおけるアドレスを保存するアドレス保存手段をさらに備え、
    前記イントラ予測手段は、前記アドレス保存手段に保存されたアドレスに基づいて該マクロブロックを特定し、前記第2予測モード保存手段に保存された予測モードにより前記予測画像データを生成することを特徴とする請求項4に記載の動画像符号化装置。
  6. 前記決定手段は、各予測モードについて予測誤差を算出し、該予測誤差が最小の予測モードを前記最も符号化効率の良い予測モードと決定することを特徴とする請求項1乃至5のいずれか1項に記載の動画像符号化装置。
  7. 前記スライス分割判定手段において決定されたスライス分割に基づき生成されたスライスに属し、符号化されたマクロブロック数をカウントするマクロブロックカウンタをさらに備え、
    前記決定手段は、前記マクロブロックカウンタのカウント値に基づき前記第2の予測モードグループに属する予測モードについて算出した予測誤差から所定値を減算し、減算後の予測誤差に基づいて前記最も符号化効率の良い予測モードを決定することを特徴とする請求項6に記載の動画像符号化装置。
  8. 前記決定手段は、前記第1の予測モードグループに属する予測モードについて算出した予測誤差のうち最小となる第1の予測誤差が、前記第2の予測モードグループに属する予測モードについて算出した予測誤差のうち最小となる第2の予測誤差よりも小さく、かつ、前記第2の予測誤差と前記第1の予測誤差との差分が、所定の差分よりも小さい場合に、前記第2の予測誤差に対応する予測モードを、前記最も符号化効率の良い予測モードに決定することを特徴とする請求項1乃至5のいずれか1項に記載の動画像符号化装置。
  9. 画像データを複数のマクロブロックに分割し、該マクロブロックに隣接する画素を用いてイントラ予測を行う動画像符号化装置の制御方法であって、
    各マクロブロックにつき、前記イントラ予測に用いる予測モードであって、最も符号化効率の良い予測モードを、マクロブロックの垂直方向上側に隣接する画素を用いる第1の予測モードグループと、該垂直方向上側に隣接する画素を用いない第2の予測モードグループとのいずれかに属する予測モードから決定する決定工程と、
    決定された前記予測モードを保存する第1予測モード保存手段に保存する保存工程と、
    前記第1予測モード保存手段に保存された、第2の予測モードグループに属し、かつ、1水平ライン分のマクロブロックについて決定された予測モードの数をカウントするカウンタ工程と、
    前記決定工程において1水平ライン分のマクロブロックについて前記予測モードが決定された際の、前記カウンタのカウント値の大きさに基づいて、前記1水平ラインに属するマクロブロックによりスライス分割を行うか否かを決定するスライス分割判定工程と
    を備えることを特徴とする動画像符号化装置の制御方法。
  10. コンピュータを請求項1乃至8のいずれか1項に記載の動画像符号化装置として機能させるためのコンピュータプログラム。
JP2008088258A 2008-03-28 2008-03-28 動画像符号化装置及びその制御方法、コンピュータプログラム Expired - Fee Related JP4958825B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008088258A JP4958825B2 (ja) 2008-03-28 2008-03-28 動画像符号化装置及びその制御方法、コンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008088258A JP4958825B2 (ja) 2008-03-28 2008-03-28 動画像符号化装置及びその制御方法、コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2009246511A true JP2009246511A (ja) 2009-10-22
JP4958825B2 JP4958825B2 (ja) 2012-06-20

Family

ID=41307979

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008088258A Expired - Fee Related JP4958825B2 (ja) 2008-03-28 2008-03-28 動画像符号化装置及びその制御方法、コンピュータプログラム

Country Status (1)

Country Link
JP (1) JP4958825B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013062193A1 (ko) * 2011-10-24 2013-05-02 (주)인터앱 영상 복호화 방법 및 장치
WO2013062192A1 (ko) * 2011-10-24 2013-05-02 (주)인터앱 인트라 예측 정보 부호화 방법 및 장치
CN107396116A (zh) * 2012-01-30 2017-11-24 三星电子株式会社 视频编码和解码设备及非暂时性计算机可读存储介质
US9854262B2 (en) 2011-10-24 2017-12-26 Infobridge Pte. Ltd. Method and apparatus for image encoding with intra prediction mode

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006101527A (ja) * 2004-09-28 2006-04-13 Thomson Licensing 画像のシーケンスの符号化の方法及び装置
JP2006114979A (ja) * 2004-10-12 2006-04-27 Canon Inc 画像符号化装置及びその方法
JP2008017229A (ja) * 2006-07-06 2008-01-24 Toshiba Corp 動画像符号化装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006101527A (ja) * 2004-09-28 2006-04-13 Thomson Licensing 画像のシーケンスの符号化の方法及び装置
JP2006114979A (ja) * 2004-10-12 2006-04-27 Canon Inc 画像符号化装置及びその方法
JP2008017229A (ja) * 2006-07-06 2008-01-24 Toshiba Corp 動画像符号化装置

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9426470B2 (en) 2011-10-24 2016-08-23 Infobridge Pte. Ltd. Image decoding method using intra prediction mode
US11206397B2 (en) 2011-10-24 2021-12-21 Infobridge Pte. Ltd. Reconstructed block creating method
WO2013062193A1 (ko) * 2011-10-24 2013-05-02 (주)인터앱 영상 복호화 방법 및 장치
CN104170379A (zh) * 2011-10-24 2014-11-26 码间私人有限公司 用于图像解码的方法和装置
US8953683B2 (en) 2011-10-24 2015-02-10 Intercode Pte. Ltd. Method and apparatus for encoding intra prediction information
US9025662B2 (en) 2011-10-24 2015-05-05 Infobridge Pte. Ltd. Image decoding apparatus
US9025663B1 (en) 2011-10-24 2015-05-05 Infobridge Pte. Ltd. Method and apparatus for encoding intra prediction information
US9036704B2 (en) 2011-10-24 2015-05-19 Infobridge Pte. Ltd. Image decoding method using intra prediction mode
US9060179B2 (en) 2011-10-24 2015-06-16 Infobridge Pte. Ltd. Method and apparatus for encoding intra prediction information
US9148671B2 (en) 2011-10-24 2015-09-29 Infobridge Pte. Ltd. Method and apparatus for encoding intra prediction information
CN104170379B (zh) * 2011-10-24 2016-01-20 英孚布瑞智有限私人贸易公司 用于图像解码的方法和装置
US9392284B2 (en) 2011-10-24 2016-07-12 Infobridge Pte. Ltd. Image decoding method using intra prediction mode
WO2013062196A1 (ko) * 2011-10-24 2013-05-02 (주)인터앱 영상 복호화 장치
WO2013062192A1 (ko) * 2011-10-24 2013-05-02 (주)인터앱 인트라 예측 정보 부호화 방법 및 장치
US10341656B2 (en) 2011-10-24 2019-07-02 Infobridge Pte. Ltd. Image decoding method using intra prediction mode
US9615105B2 (en) 2011-10-24 2017-04-04 Infobridge Pte. Ltd. Image decoding apparatus
US9769479B2 (en) 2011-10-24 2017-09-19 Infobridge Pte. Ltd. Image decoding apparatus
US9426471B2 (en) 2011-10-24 2016-08-23 Infobridge Pte. Ltd. Image decoding method using intra prediction mode
US9854262B2 (en) 2011-10-24 2017-12-26 Infobridge Pte. Ltd. Method and apparatus for image encoding with intra prediction mode
US10708584B2 (en) 2011-10-24 2020-07-07 Infobridge Pte. Ltd. Image decoding method using intra prediction mode
US9912946B2 (en) 2011-10-24 2018-03-06 Infobridge Pte. Ltd. Image decoding method using intra prediction mode
US9445097B2 (en) 2011-10-24 2016-09-13 Infobridge Pte. Ltd. Image decoding method using intra prediction mode
US10375409B2 (en) 2011-10-24 2019-08-06 Infobridge Pte. Ltd. Method and apparatus for image encoding with intra prediction mode
CN107396116B (zh) * 2012-01-30 2020-03-27 三星电子株式会社 视频编码和解码设备及非暂时性计算机可读存储介质
CN107623853B (zh) * 2012-01-30 2020-07-03 三星电子株式会社 视频编码和解码方法及非暂时性计算机可读存储介质
CN107623853A (zh) * 2012-01-30 2018-01-23 三星电子株式会社 视频编码和解码方法及非暂时性计算机可读存储介质
CN107396116A (zh) * 2012-01-30 2017-11-24 三星电子株式会社 视频编码和解码设备及非暂时性计算机可读存储介质

Also Published As

Publication number Publication date
JP4958825B2 (ja) 2012-06-20

Similar Documents

Publication Publication Date Title
JP6660074B2 (ja) 映像復号化方法及び装置
KR102398644B1 (ko) 인트라 예측 정보 부호화 방법 및 장치
JP6074082B2 (ja) イントラ予測モードにおける映像復号化方法
JP5111127B2 (ja) 動画像符号化装置及びその制御方法、並びに、コンピュータプログラム
JP5989841B2 (ja) 映像復号化装置
JP5717465B2 (ja) 動画像符号化装置及び動画像符号化方法
KR20140064972A (ko) 화상 부호화 및 복호 방법, 장치, 프로그램
KR20190091236A (ko) 복원 블록을 생성하는 방법 및 장치
JP4939273B2 (ja) 画像符号化装置及び画像符号化方法
JP4958825B2 (ja) 動画像符号化装置及びその制御方法、コンピュータプログラム
JP5178616B2 (ja) シーンチェンジ検出装置および映像記録装置
JP2015128239A (ja) 画像符号化装置、撮像装置、画像符号化方法、及びプログラム
JP4971817B2 (ja) 画像符号化装置
JP2010035025A (ja) 符号化装置およびその方法
JP5235818B2 (ja) 動画像符号化装置、動画像符号化装置の制御方法及びプログラム
JP2006191287A (ja) 画像符号化装置、画像符号化方法および画像符号化プログラム
JP6267929B2 (ja) 画像符号化装置及び画像符号化プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110325

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120215

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120220

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120319

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150330

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4958825

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees