JP2009033245A - 画像符号化装置、画像符号化方法及びプログラム - Google Patents
画像符号化装置、画像符号化方法及びプログラム Download PDFInfo
- Publication number
- JP2009033245A JP2009033245A JP2007192268A JP2007192268A JP2009033245A JP 2009033245 A JP2009033245 A JP 2009033245A JP 2007192268 A JP2007192268 A JP 2007192268A JP 2007192268 A JP2007192268 A JP 2007192268A JP 2009033245 A JP2009033245 A JP 2009033245A
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- pred
- encoding
- image
- prediction modes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】高い符号化効率で、高速にフレーム内予測を行うことができ、隣接画素の符号化歪量を算出し、低ビットレートにおける視覚的劣化を低減する画像符号化装置を提供することを目的とする。
【解決手段】入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化装置において、前記符号化対象ブロックに隣接する画素間の相関を推定する画像特徴抽出手段101と、前記画像特徴抽出手段101から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み手段102とを備えた。これにより、画像特徴に基づいて、予測モードを絞り込むことにより、処理負荷を低減しつつ、符号化効率を向上することができる。
【選択図】図1
【解決手段】入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化装置において、前記符号化対象ブロックに隣接する画素間の相関を推定する画像特徴抽出手段101と、前記画像特徴抽出手段101から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み手段102とを備えた。これにより、画像特徴に基づいて、予測モードを絞り込むことにより、処理負荷を低減しつつ、符号化効率を向上することができる。
【選択図】図1
Description
本発明は、対象ブロック毎に、既に符号化し復号化した領域の復号画像から予測するフレーム内予測において、画像を符号化して高速に好適な符号化データを得る画像符号化装置及び画像符号化方法等に関する。
動画像を圧縮するとき、一般的に動画像を輝度成分と色差成分とに分けて符号化する。従来の動画像圧縮のための国際標準技術は、一つの動画像を各々輝度と色差成分とに分けて符号化する。
まず一枚のピクチャを他のピクチャを参照せずに符号化した後に、このピクチャを参照して時間軸上に以後のピクチャを動きの予測および補償を利用して予測符号化する。他のピクチャを参照せずに符号化することをフレーム内符号化、他のピクチャを参照して動きの予測および補償を利用して符号化することをフレーム間符号化と呼んでいる。
通常、フレーム内符号化およびフレーム間符号化は、全て離散コサイン変換(Discrete Cosine Transformation:DCT)、量子化、エントロピー符号化を通じて損失圧縮される。このとき、フレーム内符号化では、ピクチャ間予測をしないため、圧縮効率を上げるために画面内予測方法を利用することがある。
ISO/IECにおいて規格化されたMPEG−4、ITU−Tにおいて規格化されたH.263+による動画像圧縮方式では、フレーム内予測符号化において、画面内の相関を利用して予測符号化する技術を提示している。なお、ISO/IECは、「International Organization for Standardization/International Electrotechnical Commission」である。MPEGは、「Motion Picture Expert Group」である。ITU−Tは、「International Telecommunication Union−Telecommunication Standardization」である。
一般に、この技術はAC/DC予測と呼ばれており、垂直方向8画素、水平方向8画素(以下、8×8と表記する)単位のブロックを設定する。そして、各ブロックをDCT/量子化する。その後にDC(Direct Current)値およびAC(Alternation Current)値を周辺ブロックのDC値およびAC値を参照して予測符号化することによって圧縮効率を上げる。
また、2003年3月、ISO/IECのMPEGとITU−TのVCEG(Video Coding Experts Group)とが、共同でJVT(Joint Video Team)を組織して新しいビデオ符号化標準の勧告を行った。ISO/IECでは、「MPEG−4 Part10/AVC(Advanced Video Coding)」という名称で、ITU−TではH.264という名称で勧告化されている。この勧告でもフレーム内符号化するときに、画面内の相関を利用して予測符号化を行う技術を提示しており、一般にフレーム内予測と呼ばれている。
フレーム内予測では、輝度成分において13種類の予測モードが規定されており、予測モードは予測するブロックの単位と予測値生成式を決定する。また、色差成分においては4種類の予測モードが規定されている。
輝度成分では、4×4または16×16のブロック単位で予測するが、4×4の場合には9つの予測方法があり、Intra4×4PredMode=0〜8と表し、これを予測モードと呼んでいる。
16×16の場合には4つの予測方法があり、予測モードはIntra16×16PredMode=0〜3となる。各予測モードの番号は予測対象ブロックを予測する方向によって異なっており、番号が小さい予測モード程使用される頻度が高いとされている。
図2に4×4における予測モードの番号と予測方向の関係を示す。Intra4×4PredMode=2は平均値予測である。
図3は4×4のブロックの図であり、一ブロックは一画素を表しており、大文字で表記されている画素A、B、C、・・・は参照に使用される画素(以下、参照画素と表記する)、小文字で表記されている画素a、b、c、・・・は予測対象画素である。
参照画素A、B、C、・・・の輝度値をP(A)、P(B)、P(C)、・・・、予測対象画素a、b、c、・・・に対する予測値をPred(a)、Pred(b)、Pred(c)、・・・と表すと、各予測モードにおける予測値は次のように算出される。
なお、Pred(ALL)はブロック内の全画素の予測値を示し、>>1は右に1ビットシフト演算を行うことを示している。
なお、Pred(ALL)はブロック内の全画素の予測値を示し、>>1は右に1ビットシフト演算を行うことを示している。
<Intra4×4PredMode=0>
Pred(a)=Pred(e)=Pred(i)=Pred(m)=P(A)
Pred(b)=Pred(f)=Pred(j)=Pred(n)=P(B)
Pred(c)=Pred(g)=Pred(k)=Pred(o)=P(C)
Pred(d)=Pred(h)=Pred(l)=Pred(p)=P(D)
Pred(a)=Pred(e)=Pred(i)=Pred(m)=P(A)
Pred(b)=Pred(f)=Pred(j)=Pred(n)=P(B)
Pred(c)=Pred(g)=Pred(k)=Pred(o)=P(C)
Pred(d)=Pred(h)=Pred(l)=Pred(p)=P(D)
<Intra4×4PredMode=1>
Pred(a)=Pred(b)=Pred(c)=Pred(d)=P(A)
Pred(e)=Pred(f)=Pred(g)=Pred(h)=P(B)
Pred(i)=Pred(j)=Pred(k)=Pred(l)=P(C)
Pred(m)=Pred(n)=Pred(o)=Pred(p)=P(D)
Pred(a)=Pred(b)=Pred(c)=Pred(d)=P(A)
Pred(e)=Pred(f)=Pred(g)=Pred(h)=P(B)
Pred(i)=Pred(j)=Pred(k)=Pred(l)=P(C)
Pred(m)=Pred(n)=Pred(o)=Pred(p)=P(D)
<Intra4×4PredMode=2>
[ピクチャの先頭の場合]
Pred(ALL)=128
[ピクチャの上端の場合]
Pred(ALL)={P(I)+P(J)+P(K)+P(L)+2}>>2
[ピクチャの左端の場合]
Pred(ALL)={P(A)+P(B)+P(C)+P(D)+2}>>2
[上記以外の場合]
Pred(ALL)={P(A)+P(B)+P(C)+P(D)+P(I)+P(J)+P(K)+P(L)+4}>>3
[ピクチャの先頭の場合]
Pred(ALL)=128
[ピクチャの上端の場合]
Pred(ALL)={P(I)+P(J)+P(K)+P(L)+2}>>2
[ピクチャの左端の場合]
Pred(ALL)={P(A)+P(B)+P(C)+P(D)+2}>>2
[上記以外の場合]
Pred(ALL)={P(A)+P(B)+P(C)+P(D)+P(I)+P(J)+P(K)+P(L)+4}>>3
<Intra4×4PredMode=3>
Pred(a)={P(A)+2P(B)+P(C)+2}>>2
Pred(b)=Pred(e)={P(B)+2P(C)+P(D)+2}>>2
Pred(c)=Pred(f)=Pred(i)={P(C)+2P(D)+P(E)+2}>>2
Pred(d)=Pred(g)=Pred(j)=Pred(m)={P(D)+2P(E)+P(F)+2}>>2
Pred(h)=Pred(k)=Pred(n)={P(E)+2P(F)+P(G)+2}>>2
Pred(l)=Pred(o)={P(F)+2P(G)+P(H)+2}>>2
Pred(p)={3P(G)+P(H)+2}>>2
Pred(a)={P(A)+2P(B)+P(C)+2}>>2
Pred(b)=Pred(e)={P(B)+2P(C)+P(D)+2}>>2
Pred(c)=Pred(f)=Pred(i)={P(C)+2P(D)+P(E)+2}>>2
Pred(d)=Pred(g)=Pred(j)=Pred(m)={P(D)+2P(E)+P(F)+2}>>2
Pred(h)=Pred(k)=Pred(n)={P(E)+2P(F)+P(G)+2}>>2
Pred(l)=Pred(o)={P(F)+2P(G)+P(H)+2}>>2
Pred(p)={3P(G)+P(H)+2}>>2
<Intra4×4PredMode=4>
Pred(a)=Pred(f)=Pred(k)=Pred(p)={P(A)+2P(M)+P(I)+2}>>2
Pred(b)=Pred(g)=Pred(i)={P(M)+2P(A)+P(B)+2}>>2
Pred(c)=Pred(h)={P(A)+2P(B)+P(C)+2}>>2
Pred(d)={P(C)+2P(D)+P(E)+2}>>2
Pred(e)=Pred(j)=Pred(o)={P(M)+2P(I)+P(J)+2}>>2
Pred(i)=Pred(n)={P(I)+2P(J)+P(K)+2}>>2
Pred(m)={P(J)+2P(K)+P(L)+2}>>2
Pred(a)=Pred(f)=Pred(k)=Pred(p)={P(A)+2P(M)+P(I)+2}>>2
Pred(b)=Pred(g)=Pred(i)={P(M)+2P(A)+P(B)+2}>>2
Pred(c)=Pred(h)={P(A)+2P(B)+P(C)+2}>>2
Pred(d)={P(C)+2P(D)+P(E)+2}>>2
Pred(e)=Pred(j)=Pred(o)={P(M)+2P(I)+P(J)+2}>>2
Pred(i)=Pred(n)={P(I)+2P(J)+P(K)+2}>>2
Pred(m)={P(J)+2P(K)+P(L)+2}>>2
<Intra4×4PredMode=5>
Pred(a)=Pred(j)={P(M)+P(A)+1}>>1
Pred(b)=Pred(k)={P(A)+P(B)+1}>>1
Pred(c)=Pred(l)={P(B)+P(C)+1}>>1
Pred(d)={P(C)+P(D)+1}>>1
Pred(f)=Pred(o)={P(M)+2P(A)+P(B)+2}>>2
Pred(g)=Pred(p)={P(A)+2P(B)+P(C)+2}>>2
Pred(h)={P(B)+2P(C)+P(D)+2}>>2
Pred(e)=Pred(n)={P(I)+2P(M)+P(A)+2}>>2
Pred(i)={P(J)+2P(I)+P(M)+2}>>2
Pred(m)={P(K)+2P(J)+P(I)+2}>>2
Pred(a)=Pred(j)={P(M)+P(A)+1}>>1
Pred(b)=Pred(k)={P(A)+P(B)+1}>>1
Pred(c)=Pred(l)={P(B)+P(C)+1}>>1
Pred(d)={P(C)+P(D)+1}>>1
Pred(f)=Pred(o)={P(M)+2P(A)+P(B)+2}>>2
Pred(g)=Pred(p)={P(A)+2P(B)+P(C)+2}>>2
Pred(h)={P(B)+2P(C)+P(D)+2}>>2
Pred(e)=Pred(n)={P(I)+2P(M)+P(A)+2}>>2
Pred(i)={P(J)+2P(I)+P(M)+2}>>2
Pred(m)={P(K)+2P(J)+P(I)+2}>>2
<Intra4×4PredMode=6>
Pred(a)=Pred(g)={P(M)+P(I)+1}>>1
Pred(e)=Pred(k)={P(I)+P(J)+1}>>1
Pred(i)=Pred(o)={P(J)+P(K)+1}>>1
Pred(m)={P(K)+P(L)+1}>>1
Pred(i)=Pred(l)={P(M)+2P(I)+P(J)+2}>>2
Pred(j)=Pred(p)={P(I)+2P(J)+P(K)+2}>>2
Pred(n)={P(J)+2P(K)+P(L)+2}>>2
Pred(b)=Pred(h)={P(A)+2P(M)+P(I)+2}>>2
Pred(c)={P(B)+2P(A)+P(M)+2}>>2
Pred(d)={P(C)+2P(B)+P(A)+2}>>2
Pred(a)=Pred(g)={P(M)+P(I)+1}>>1
Pred(e)=Pred(k)={P(I)+P(J)+1}>>1
Pred(i)=Pred(o)={P(J)+P(K)+1}>>1
Pred(m)={P(K)+P(L)+1}>>1
Pred(i)=Pred(l)={P(M)+2P(I)+P(J)+2}>>2
Pred(j)=Pred(p)={P(I)+2P(J)+P(K)+2}>>2
Pred(n)={P(J)+2P(K)+P(L)+2}>>2
Pred(b)=Pred(h)={P(A)+2P(M)+P(I)+2}>>2
Pred(c)={P(B)+2P(A)+P(M)+2}>>2
Pred(d)={P(C)+2P(B)+P(A)+2}>>2
<Intra4×4PredMode=7>
Pred(a)={P(A)+P(B)+1}>>1
Pred(b)=Pred(i)={P(B)+P(C)+1}>>1
Pred(c)=Pred(j)={P(C)+P(D)+1}>>1
Pred(d)=Pred(k)={P(D)+P(E)+1}>>1
Pred(l)={P(E)+P(F)+1}>>1
Pred(e)={P(A)+2P(B)+P(C)+2}>>2
Pred(f)=Pred(m)={P(B)+2P(C)+P(D)+2}>>2
Pred(g)=Pred(n)={P(C)+2P(D)+P(E)+2}>>2
Pred(h)=Pred(o)={P(D)+2P(E)+P(F)+2}>>2
Pred(p)={P(E)+2P(F)+P(G)+2}>>2
Pred(a)={P(A)+P(B)+1}>>1
Pred(b)=Pred(i)={P(B)+P(C)+1}>>1
Pred(c)=Pred(j)={P(C)+P(D)+1}>>1
Pred(d)=Pred(k)={P(D)+P(E)+1}>>1
Pred(l)={P(E)+P(F)+1}>>1
Pred(e)={P(A)+2P(B)+P(C)+2}>>2
Pred(f)=Pred(m)={P(B)+2P(C)+P(D)+2}>>2
Pred(g)=Pred(n)={P(C)+2P(D)+P(E)+2}>>2
Pred(h)=Pred(o)={P(D)+2P(E)+P(F)+2}>>2
Pred(p)={P(E)+2P(F)+P(G)+2}>>2
<Intra4×4PredMode=8>
Pred(a)={P(I)+P(J)+1}>>1
Pred(e)=Pred(c)={P(J)+P(K)+1}>>1
Pred(i)=Pred(g)={P(K)+P(L)+1}>>1
Pred(b)={P(I)+2P(J)+P(K)+2}>>2
Pred(f)=Pred(d)={P(J)+2P(K)+P(L)+2}>>2
Pred(j)=Pred(h)={P(J)+3P(K)+2}>>2
Pred(k)=Pred(l)=Pred(m)=Pred(n)=Pred(o)=Pred(p)=P(L)
Pred(a)={P(I)+P(J)+1}>>1
Pred(e)=Pred(c)={P(J)+P(K)+1}>>1
Pred(i)=Pred(g)={P(K)+P(L)+1}>>1
Pred(b)={P(I)+2P(J)+P(K)+2}>>2
Pred(f)=Pred(d)={P(J)+2P(K)+P(L)+2}>>2
Pred(j)=Pred(h)={P(J)+3P(K)+2}>>2
Pred(k)=Pred(l)=Pred(m)=Pred(n)=Pred(o)=Pred(p)=P(L)
また、16×16の場合の予測モードの番号と予測方向の関係は、Intra16×16PredMode=0は垂直予測、Intra16×16PredMode=1は水平予測である。また、Intra16×16PredMode=2は平均値予測、Intra16×16PredMode=3は平面予測となっている。
図4に16×16のブロックの図を示す。画素(x、y)の画素値をP(x、y)、画素(x、y)に対する予測値をPred(x、y)と表すと、各予測モードにおける予測値は次のように算出される。
<Intra16×16PredMode=0>
Pred(x、y)=P(x、−1) (x=0〜15、y=0〜15)
Pred(x、y)=P(x、−1) (x=0〜15、y=0〜15)
<Intra16×16PredMode=1>
Pred(x、y)=P(−1、y) (x=0〜15、y=0〜15)
Pred(x、y)=P(−1、y) (x=0〜15、y=0〜15)
<Intra16×16PredMode=2>
[ピクチャの先頭の場合]
Pred(x、y)=128 (x=0〜15、y=0〜15)
[ピクチャの上端の場合]
Pred(x、y)={ΣP(−1、y)+8}>>4 (x=0〜15、y=0〜15)
[ピクチャの左端の場合]
Pred(x、y)={ΣP(x、−1)+8}>>4 (x=0〜15、y=0〜15)
[上記以外の場合]
Pred(x、y)={ΣP(x、−1)+ΣP(−1、y)+16}>>5 (x=0〜15、y=0〜15)
[ピクチャの先頭の場合]
Pred(x、y)=128 (x=0〜15、y=0〜15)
[ピクチャの上端の場合]
Pred(x、y)={ΣP(−1、y)+8}>>4 (x=0〜15、y=0〜15)
[ピクチャの左端の場合]
Pred(x、y)={ΣP(x、−1)+8}>>4 (x=0〜15、y=0〜15)
[上記以外の場合]
Pred(x、y)={ΣP(x、−1)+ΣP(−1、y)+16}>>5 (x=0〜15、y=0〜15)
<Intra16×16PredMode=3>
Pred(x、y)={a+b×(x−7)+c×(y−7)+16}>>5
(x=0〜15、y=0〜15)
a=16×{(P(−1、15)+P(15、−1))
b=(5×H+32)>>6
c=(5×V+32)>>6
H=P(8、−1)−P(6、−1)+2P(9、−1)−2P(5、−1)+3P(10、−1)−3P(4、−1)+4P(11、−1)−4P(3、−1)+5P(12、−1)−5P(2、−1)―6P(13、−1)―6P(1、−1)+7P(14、−1)−7P(0、−1)+8P(15、−1)−8(−1、−1)
V=P(−1、8)−P(−1、6)+2P(−1、9)−2P(−1、5)+3P(−1、10)−3P(−1、4)+4P(−1、11)−4P(−1、3)+5P(−1、12)−5P(−1、2)―6P(−1、13)―6P(−1、1)+7P(−1、14)−7P(−1、0)+8P(−1、15)−8P(−1、−1)
Pred(x、y)={a+b×(x−7)+c×(y−7)+16}>>5
(x=0〜15、y=0〜15)
a=16×{(P(−1、15)+P(15、−1))
b=(5×H+32)>>6
c=(5×V+32)>>6
H=P(8、−1)−P(6、−1)+2P(9、−1)−2P(5、−1)+3P(10、−1)−3P(4、−1)+4P(11、−1)−4P(3、−1)+5P(12、−1)−5P(2、−1)―6P(13、−1)―6P(1、−1)+7P(14、−1)−7P(0、−1)+8P(15、−1)−8(−1、−1)
V=P(−1、8)−P(−1、6)+2P(−1、9)−2P(−1、5)+3P(−1、10)−3P(−1、4)+4P(−1、11)−4P(−1、3)+5P(−1、12)−5P(−1、2)―6P(−1、13)―6P(−1、1)+7P(−1、14)−7P(−1、0)+8P(−1、15)−8P(−1、−1)
また、色差成分の場合には、輝度成分の16×16で予測する方法と同様に4つの予測方向を使用するが、ブロックサイズは8×8のブロックを使用する。ただし、色差成分の8×8で予測する方法は、輝度成分で16×16を使用して予測する方法とは予測モードの番号と予測方向が異なる。色差成分の8×8予測ではintra_chroma_pred_mode=0は平均値予測である。
また、intra_chroma_pred_mode=1が水平予測、intra_chroma_pred_mode=2が垂直予測、intra_chroma_pred_mode=3が平面予測となっている。
図5に8×8のブロック図を示す。16×16のときと同様に、各予測モードにおける予測値は次のように算出される。
<intra_chroma_pred_mode=0>
[ピクチャの先頭の場合]
Pred(x、y)=128 (x=0〜7、y=0〜7)
[ピクチャの上端の場合]
Pred(x、y)={ΣP(−1、y)+2}>>2 (x=0〜7、y=0〜7)
[ピクチャの左端の場合]
Pred(x、y)={ΣP(x、−1)+2}>>2 (x=0〜7、y=0〜7)
[上記以外の場合]
Pred(x、y)={ΣP(x、−1)+ΣP(−1、y)+4}>>3 (x=0〜7、y=0〜7)
[ピクチャの先頭の場合]
Pred(x、y)=128 (x=0〜7、y=0〜7)
[ピクチャの上端の場合]
Pred(x、y)={ΣP(−1、y)+2}>>2 (x=0〜7、y=0〜7)
[ピクチャの左端の場合]
Pred(x、y)={ΣP(x、−1)+2}>>2 (x=0〜7、y=0〜7)
[上記以外の場合]
Pred(x、y)={ΣP(x、−1)+ΣP(−1、y)+4}>>3 (x=0〜7、y=0〜7)
<intra_chroma_pred_mode=1>
Pred(x、y)=P(−1、y) (x=0〜7、y=0〜7)
Pred(x、y)=P(−1、y) (x=0〜7、y=0〜7)
<intra_chroma_pred_mode=2>
Pred(x、y)=P(x、−1) (x=0〜7、y=0〜7)
Pred(x、y)=P(x、−1) (x=0〜7、y=0〜7)
<intra_chroma_pred_mode=3>
Pred(x、y)={a+b×(x−3)+c×(y−3)+16}>>5
(x=0〜7、y=0〜7)
a=16×{(P(−1、7)+P(7、−1))
b=(17×H+16)>>5
c=(17×V+16)>>5
H=P(4、−1)−P(2、−1)+2P(5、−1)−2P(1、−1)+3P(6、−1)−3P(0、−1)+4P(7、−1)−4P(−1、−1)
V=P(−1、4)−P(−1、2)+2P(−1、5)−2P(−1、1)+3P(−1、6)−3P(−1、0)+4P(−1、7)−4P(−1、−1)
Pred(x、y)={a+b×(x−3)+c×(y−3)+16}>>5
(x=0〜7、y=0〜7)
a=16×{(P(−1、7)+P(7、−1))
b=(17×H+16)>>5
c=(17×V+16)>>5
H=P(4、−1)−P(2、−1)+2P(5、−1)−2P(1、−1)+3P(6、−1)−3P(0、−1)+4P(7、−1)−4P(−1、−1)
V=P(−1、4)−P(−1、2)+2P(−1、5)−2P(−1、1)+3P(−1、6)−3P(−1、0)+4P(−1、7)−4P(−1、−1)
さらに、JVTでは、静止画像符号化処理も含めた、H.264/AVC Fidelity Range Extensions Amendmentも策定中である。
この拡張案では、輝度成分での8×8のブロックを使用する画面内予測方法が提案されている。輝度成分で8×8のブロックを使用して予測する方法では4×4のブロックを使用して予測する方法と同様に、予測方向によって9つの予測方法があり、予測モードと予測方向は4×4の場合と同じである。予測値も4×4と同様に算出する。
このように、フレーム内予測には多くの予測モードが規定されているが、どの予測モードを使用すれば効率が良いかを選択する方法は勧告では規定されていない。
実際に最も効率の良いブロックサイズと予測方向を決定するには、全ての予測モードで一旦予測した結果から最も効率の良い予測モードに決定する方法が考えられる。しかし、全ての予測モードで一旦予測する方法では処理負荷が増大するため、ハードウェアでは回路規模、ソフトウェアでは計算量が増大し、リアルタイムで符号化することは困難になる。
そこで、従来、符号化対象ブロックに属する画素から符号化対象ブロックに対する相関を推定し、相関に応じて予測モードを限定し、限定された予測モードの中で一旦予測を行って最も効率の良い予測モードを決定する技術がある(特許文献1参照)。
しかし、この技術では、処理負荷を低減できるが、本来フレーム内予測に使用される参照画素ではなく、符号化対象ブロックに属する画素から符号化対象ブロックに対する相関を推定しているため、符号化効率は悪くなってしまう。
この問題を解決するために、本来フレーム内予測に使用される参照画素から相関を推定する技術(従来技術1)がある。
しかしながら、上述した従来技術では、符号化効率は良くなるが、符号化対象ブロックの一つ前の符号化対象ブロックに対する局所復号化が終了してからでないと相関を推定できないため、高速に処理を行えないという問題がある。
また、プレーンなカラー背景に線や文字が重畳したグラフィックス画像や、窓枠など縦線、横線などが多い自然画像を符号化すると、低ビットレートにおいては、符号化対象ブロック毎に最適な予測モードを選択する。そのため、局所的な符号化歪を生じる予測モードを選択してしまうことがある。
この結果、横方向や縦方向に伸びる符号化歪がニセ色として視覚的に認識されやすくなる。
そこで、本発明は、高い符号化効率で、高速にフレーム内予測を行うことができ、隣接画素の符号化歪量を算出し、低ビットレートにおける視覚的劣化を低減する画像符号化装置を提供することを目的とする。
本発明の画像符号化装置は、入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化装置において、前記符号化対象ブロックに隣接する画素間の相関を推定する画像特徴抽出手段と、前記画像特徴抽出手段から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み手段と、を備えることを特徴とする。
また、本発明の画像符号化装置は、入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化装置において、前記符号化対象ブロックに隣接する符号化済み画素の符号化歪みを推定する画像特徴抽出手段と、前記画像特徴抽出手段から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み手段と、を備えることを特徴とする。
また、本発明の画像符号化装置は、入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化装置において、前記符号化対象ブロックに隣接する画素間の相関と前記符号化対象ブロックに隣接する符号化済み画素の符号化歪みとを推定する画像特徴抽出手段と、前記画像特徴抽出手段から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み手段と、を備えることを特徴とする。
また、本発明の画像符号化方法は、入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化方法において、前記符号化対象ブロックに隣接する画素間の相関を推定する画像特徴抽出工程と、前記画像特徴抽出工程から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み工程と、を有することを特徴とする。
また、本発明のプログラムは、入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化装置としてコンピュータを機能させるためのプログラムであって、前記符号化対象ブロックに隣接する画素間の相関を推定する画像特徴抽出手段と、前記画像特徴抽出手段から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み手段としてコンピュータを機能させるためのプログラムである。
また、本発明の画像符号化装置は、入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化装置において、前記符号化対象ブロックに隣接する符号化済み画素の符号化歪みを推定する画像特徴抽出手段と、前記画像特徴抽出手段から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み手段と、を備えることを特徴とする。
また、本発明の画像符号化装置は、入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化装置において、前記符号化対象ブロックに隣接する画素間の相関と前記符号化対象ブロックに隣接する符号化済み画素の符号化歪みとを推定する画像特徴抽出手段と、前記画像特徴抽出手段から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み手段と、を備えることを特徴とする。
また、本発明の画像符号化方法は、入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化方法において、前記符号化対象ブロックに隣接する画素間の相関を推定する画像特徴抽出工程と、前記画像特徴抽出工程から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み工程と、を有することを特徴とする。
また、本発明のプログラムは、入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化装置としてコンピュータを機能させるためのプログラムであって、前記符号化対象ブロックに隣接する画素間の相関を推定する画像特徴抽出手段と、前記画像特徴抽出手段から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み手段としてコンピュータを機能させるためのプログラムである。
本発明によれば、少ない処理負荷で高速に符号化効率の高いフレーム内予測符号化を行うことができる。
また、隣接画素の符号化歪量を算出し、該符号化歪量に応じて符号化歪の生じやすいイントラ予測モードの使用を禁止することで、低ビットレートにおける視覚的劣化を低減することができる。
また、隣接画素の符号化歪量を算出し、該符号化歪量に応じて符号化歪の生じやすいイントラ予測モードの使用を禁止することで、低ビットレートにおける視覚的劣化を低減することができる。
以下、本発明の実施の形態について図面を参照しながら詳細に説明する。
(第1の実施の形態)
図1は請求項1に示すフレーム内予測符号化手段の一構成図である。本実施例は入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化装置である。また、前記符号化対象ブロックに隣接する画素間の相関を推定する画像特徴抽出手段を備える。また、前記画像特徴抽出手段から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み手段を備える。
(第1の実施の形態)
図1は請求項1に示すフレーム内予測符号化手段の一構成図である。本実施例は入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化装置である。また、前記符号化対象ブロックに隣接する画素間の相関を推定する画像特徴抽出手段を備える。また、前記画像特徴抽出手段から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み手段を備える。
同図において、101は画像特徴抽出手段、102は予測モード絞込み手段、103はイントラ予測手段、104は予測モード決定手段である。以下、処理について説明する。説明を分かりやすくするために、ブロック単位は4×4に限定して説明する。
前記画像特徴抽出手段101には入力ピクチャが入力される。前記画像特徴抽出手段101は入力ピクチャの符号化対象ブロック(図3におけるa〜p)上部に隣接する画素(図3におけるA〜D)から変化量ΔVを算出する。また、符号化対象ブロック左部に隣接する画素(図3におけるI〜L)の画素から変化量ΔHを算出し、前記予測モード絞込み手段102に出力する。
前記予測モード絞込み手段102は、ΔVとΔHの変化量を比較し、ΔVの変化量が大きい場合には、符号化対象ブロックは上部隣接画素との相関が高いと判断する。また、主に上部隣接画素を参照する予測モードIntra4×4=0、2、3、5、7に使用する予測モードを限定する。ΔHの変化量が大きい場合には、符号化対処ブロックは左部隣接画像との相関が高いと判断し、主に左部隣接画素を参照する予測モードIntra4×4=1、2、4、6、8に使用する予測モードを限定する。
前記イントラ予測手段103では、前記予測モード絞込み手段102によって限定された予測モード、入力ピクチャ、参照画素を入力とする。そして、複数の限定された予測モードについてそれぞれ、該参照画素から勧告通りの予測値を算出し、該入力ピクチャと該予測値の差分である予測誤差を算出する。
また、予測誤差を算出する際、SAD(Sum of Abusolute Difference)等の予測モード決定指標値も同時に算出しておく。前記予測誤差、予測値、予測モード決定指標値は、前記予測モード決定手段104に出力される。
前記予測モード決定手段104では、前記予測モード決定指標値に基づいて、予測モードを決定する。例えば、SADの値が最小の予測モードに決定する。前記予測モード決定手段104は決定した予測モードに応じた、予測誤差、予測値を出力する。
以上、説明したように本発明の画像符号化装置において、画像特徴に基づいて、予測モードを絞り込むことにより、処理負荷を低減しつつ、符号化効率を向上することができる。本実施形態ではブロック単位を4×4の場合に限定して説明をしたが、16×16、8×8の場合でも同様のことがいえることは明らかである。
(第2の実施の形態)
図6は請求項2に示すフレーム内予測符号化手段の一構成図である。同図において、101は画像特徴抽出手段、102は予測モード絞込み手段、103はイントラ予測手段、104は予測モード決定手段である。以下、処理について説明する。説明を分かりやすくするために、ブロック単位は4×4に限定して説明する。
図6は請求項2に示すフレーム内予測符号化手段の一構成図である。同図において、101は画像特徴抽出手段、102は予測モード絞込み手段、103はイントラ予測手段、104は予測モード決定手段である。以下、処理について説明する。説明を分かりやすくするために、ブロック単位は4×4に限定して説明する。
前記画像特徴抽出手段101には入力ピクチャと参照画素(符号化済み画素)が入力される。参照画素は、一旦符号化されたデータを局所復号化したものである。
前記画像特徴抽出手段101は、入力ピクチャの符号化対象ブロックと該符号化対象ブロック上部に隣接する画素(図3におけるA〜D)に位置する参照画素から符号化歪Dvを算出する。そして、該符号化対象ブロック左部に隣接する画素(図3におけるI〜L)に位置する参照画素から符号化歪Dhを算出し、前記予測モード絞込み手段102へ出力する。
前記予測モード絞込み手段102は、前記符号化歪DvとDhに基づき、Dvが大きく垂直方向に符号化歪が激しく発生していると判断した場合、Intra4×4=1、2、3、4、5、6、7、8に使用する予測モードを限定する。そして、Dhが大きく水平方向に符号化歪が激しく発生していると判断した場合、Intra4×4=0、2、3、4、5、6、7、8に使用する予測モードを限定する。
前記イントラ予測手段103では、前記予測モード絞込み手段102によって限定された予測モード、入力ピクチャ、参照画素を入力とする。そして、複数の限定された予測モードについてそれぞれ、該参照画素から勧告通りの予測値を算出し、該入力ピクチャと該予測値の差分である予測誤差を算出する。また、予測誤差を算出する際、SAD(Sum of Abusolute Difference)等の予測モード決定指標値も同時に算出しておく。
前記予測誤差、予測値、予測モード決定指標値は、前記予測モード決定手段104に出力される。前記予測モード決定手段104では、前記予測モード決定指標値に基づいて、予測モードを決定する。例えば、SADの値が最小の予測モードに決定する。前記予測モード決定手段104は決定した予測モードに応じた、予測誤差、予測値を出力する。
以上、説明したように本発明の画像符号化装置において、隣接画素の符号化歪量を算出し、該符号化歪量に応じて符号化歪の生じやすいイントラ予測モードの使用を禁止することで、低ビットレートにおける視覚的劣化を低減することができる。本実施形態ではブロック単位を4×4の場合に限定して説明をしたが、16×16、8×8の場合でも同様のことがいえることは明らかである。
(第3の実施の形態)
図6は請求項3に示すフレーム内予測符号化手段の一構成図である。同図において、101は画像特徴抽出手段、102は予測モード絞込み手段、103はイントラ予測手段、104は予測モード決定手段である。以下、処理について説明する。説明を分かりやすくするために、ブロック単位は4×4に限定して説明する。
図6は請求項3に示すフレーム内予測符号化手段の一構成図である。同図において、101は画像特徴抽出手段、102は予測モード絞込み手段、103はイントラ予測手段、104は予測モード決定手段である。以下、処理について説明する。説明を分かりやすくするために、ブロック単位は4×4に限定して説明する。
前記画像特徴抽出手段101には入力ピクチャと参照画素が入力される。前記画像特徴抽出手段101は入力ピクチャの符号化対象ブロック(図3におけるa〜p)上部に隣接する画素(図3におけるA〜D)から変化量ΔVを算出する。そして、符号化対象ブロック左部に隣接する画素(図3におけるI〜L)の画素から変化量ΔHを算出し、前記予測モード絞込み手段102に出力する。
また、前記画像特徴抽出手段101は、入力ピクチャの符号化対象ブロックと該符号化対象ブロック上部に隣接する画素(図3におけるA〜D)に位置する参照画素から符号化歪Dvを算出する。該符号化対象ブロック左部に隣接する画素(図3におけるI〜L)に位置する参照画素から符号化歪Dhを算出し、前記予測モード絞込み手段102へ出力する。
前記予測モード絞込み手段102は、ΔVとΔHの変化量と前記符号化歪DvとDhに基づき、ΔVの変化量が大きくDv、Dhがあまり大きくない場合には、予測モードIntra4×4=0、2、3、5、7に使用する予測モードを限定する。ΔHの変化量が大きくDv、Dhがあまり大きくない場合には、予測モードIntra4×4=1、2、4、6、8に使用する予測モードを限定する。ΔVの変化量が大きくDvも大きい場合には、予測モードIntra4×4=2、3、5、7に使用する予測モードを限定する。ΔHの変化量が大きくDhが大きい場合には、予測モードIntra4×4=2、4、6、8に使用する予測モードを限定する。
前記イントラ予測手段103では、前記予測モード絞込み手段によって限定された予測モード、入力ピクチャ、参照画素を入力とし、複数の限定された予測モードについてそれぞれ、該参照画素から勧告通りの予測値を算出する。そして、該入力ピクチャと該予測値の差分である予測誤差を算出する。
また、予測誤差を算出する際、SAD(Sum of Abusolute Difference)等の予測モード決定指標値も同時に算出しておく。前記予測誤差、予測値、予測モード決定指標値は、前記予測モード決定手段104に出力される。
前記予測モード決定手段104では、前記予測モード決定指標値に基づいて、予測モードを決定する。例えば、SADの値が最小の予測モードに決定する。前記予測モード決定手段104は決定した予測モードに応じた、予測誤差、予測値を出力する。
以上、説明したように本発明の画像符号化装置において、画像特徴に基づいて、予測モードを絞り込むことにより、処理負荷を低減しつつ、符号化効率を向上することができる。また、隣接画素の符号化歪量を算出し、該符号化歪量に応じて符号化歪の生じやすいイントラ予測モードの使用を禁止することで、低ビットレートにおける視覚的劣化を低減することができる。本実施形態ではブロック単位を4×4の場合に限定して説明をしたが、16×16、8×8の場合でも同様のことがいえることは明らかである。
なお、本発明はハード構成による実現のみならず、コンピュータを本発明の画像符号化装置として動作(機能)させるプログラムにて実現されても良い。
101 画像特徴抽出手段
102 予測モード絞込み手段
103 イントラ予測手段
104 予測モード決定手段
102 予測モード絞込み手段
103 イントラ予測手段
104 予測モード決定手段
Claims (5)
- 入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化装置において、
前記符号化対象ブロックに隣接する画素間の相関を推定する画像特徴抽出手段と、
前記画像特徴抽出手段から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み手段と、を備えることを特徴とする画像符号化装置。 - 入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化装置において、
前記符号化対象ブロックに隣接する符号化済み画素の符号化歪みを推定する画像特徴抽出手段と、
前記画像特徴抽出手段から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み手段と、を備えることを特徴とする画像符号化装置。 - 入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化装置において、
前記符号化対象ブロックに隣接する画素間の相関と前記符号化対象ブロックに隣接する符号化済み画素の符号化歪みとを推定する画像特徴抽出手段と、
前記画像特徴抽出手段から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み手段と、を備えることを特徴とする画像符号化装置。 - 入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化方法において、
前記符号化対象ブロックに隣接する画素間の相関を推定する画像特徴抽出工程と、
前記画像特徴抽出工程から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み工程と、を有することを特徴とする画像符号化方法。 - 入力ピクチャに対して符号化対象ブロック毎にフレーム内予測符号化を行う画像符号化装置としてコンピュータを機能させるためのプログラムであって、
前記符号化対象ブロックに隣接する画素間の相関を推定する画像特徴抽出手段と、
前記画像特徴抽出手段から入力された特徴を用いて、複数の予測モードから使用候補となる予測モードを(全予測モード−1)個以下に絞り込む予測モード絞込み手段としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007192268A JP2009033245A (ja) | 2007-07-24 | 2007-07-24 | 画像符号化装置、画像符号化方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007192268A JP2009033245A (ja) | 2007-07-24 | 2007-07-24 | 画像符号化装置、画像符号化方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009033245A true JP2009033245A (ja) | 2009-02-12 |
Family
ID=40403305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007192268A Pending JP2009033245A (ja) | 2007-07-24 | 2007-07-24 | 画像符号化装置、画像符号化方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009033245A (ja) |
-
2007
- 2007-07-24 JP JP2007192268A patent/JP2009033245A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI765223B (zh) | 動畫像編碼裝置和方法、動畫像解碼裝置和方法及媒體 | |
US8204136B2 (en) | Image encoding apparatus | |
CN101507277B (zh) | 图像编码/解码方法和设备 | |
KR101246294B1 (ko) | 영상의 인트라 예측 부호화, 복호화 방법 및 장치 | |
TWI524780B (zh) | 在變換單元內之多符號位元隱藏 | |
CN101584218B (zh) | 基于帧内预测的编码和解码方法及设备 | |
KR20160032088A (ko) | 비디오 코딩에서 사선 모드의 인트라 예측 향상을 위한 방법 | |
CN104396245A (zh) | 用于对图像进行编码或解码的方法和装置 | |
JP2009177787A (ja) | 映像の符号化、復号化の方法及びその装置 | |
KR20070096737A (ko) | 영상의 부호화 방법 및 장치, 복호화 방법 및 장치 | |
CN110024387A (zh) | 编码装置、解码装置、编码方法和解码方法 | |
JP2008219870A (ja) | 動画像符号化方法及び動画像符号化装置 | |
KR20090087767A (ko) | 영상의 인트라 예측 부호화 방법 | |
JP5004180B2 (ja) | 動画像符号化装置および復号装置 | |
US8290041B2 (en) | Communication terminal | |
JP4939273B2 (ja) | 画像符号化装置及び画像符号化方法 | |
JP2007013298A (ja) | 画像符号化装置 | |
WO2011125314A1 (ja) | 動画像符号化装置および動画像復号装置 | |
JP2010226528A (ja) | 符号化装置およびその方法 | |
JP6992825B2 (ja) | 映像符号化装置、映像符号化方法、映像復号装置、映像復号方法、及び映像符号化システム | |
JP2017073602A (ja) | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム | |
JP2009033245A (ja) | 画像符号化装置、画像符号化方法及びプログラム | |
JP5885886B2 (ja) | 画像解析装置及び画像解析方法 | |
JP2012070249A (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラム | |
WO2021100450A1 (ja) | イントラ予測装置、画像符号化装置、画像復号装置、及びプログラム |