JP2009212790A - 予測モード選択装置および画像符号化装置 - Google Patents
予測モード選択装置および画像符号化装置 Download PDFInfo
- Publication number
- JP2009212790A JP2009212790A JP2008053426A JP2008053426A JP2009212790A JP 2009212790 A JP2009212790 A JP 2009212790A JP 2008053426 A JP2008053426 A JP 2008053426A JP 2008053426 A JP2008053426 A JP 2008053426A JP 2009212790 A JP2009212790 A JP 2009212790A
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- block
- image
- unit
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】 符号化効率が低い予測モードが選択されるという問題があった。
【解決手段】 入力画像の処理対象ブロックとその隣接ブロックの画像データから特徴量を算出する特徴量算出部と、処理対象ブロック内部の基準点から複数の各予測方向に位置する隣接ブロックと処理対象ブロックの各特徴量に基づいて、予測方向に対応する類似度を算出する類似度算出部と、複数の予測方向の類似度が高い方から所定個の類似度に対応する予測方向を選択する予測方向選択部と、選択した所定個の各予測方向に対応する処理対象ブロックの予測画像データを生成する予測画像生成部と、所定個の予測方向に対応する予測画像データと処理対象ブロックの画像データに基づいて、予測モードを判定する評価値を算出する評価値算出部、算出した評価値に基づいて、処理対象ブロックに対する予測モードを判定する予測モード判定部とを備えた。
【選択図】 図1
【解決手段】 入力画像の処理対象ブロックとその隣接ブロックの画像データから特徴量を算出する特徴量算出部と、処理対象ブロック内部の基準点から複数の各予測方向に位置する隣接ブロックと処理対象ブロックの各特徴量に基づいて、予測方向に対応する類似度を算出する類似度算出部と、複数の予測方向の類似度が高い方から所定個の類似度に対応する予測方向を選択する予測方向選択部と、選択した所定個の各予測方向に対応する処理対象ブロックの予測画像データを生成する予測画像生成部と、所定個の予測方向に対応する予測画像データと処理対象ブロックの画像データに基づいて、予測モードを判定する評価値を算出する評価値算出部、算出した評価値に基づいて、処理対象ブロックに対する予測モードを判定する予測モード判定部とを備えた。
【選択図】 図1
Description
この発明は、予測モード選択装置および画像符号化装置に関するものである。
近年の画像・映像のデジタル化に伴い、JPEG、MPEG等の画像や映像の圧縮符号化が広く普及している。その中でも、H.264動画像符号化方式は、映像データ量を効率的に削減するものとして知られている。H.264は、画面間予測だけでなく、画面内予測を用いたフレーム内符号化方式を採用しており、画像符号化も可能である。H.264の画面内予測では、16×16の画素からなるマクロブロックをさらに4×4、8×8、16×16の画素からなる3種類のブロック分割ができる。16×16のブロックには、4つの予測モードしか規定されていないが、4×4ブロックと8×8ブロックには、9種類の予測モードが規定されており、そのうちの1つの予測モードを選択して、隣接画素値を用いた画面内予測を行う。その後、選択した予測モードと、符号化画素と予測画素との差分を符号化して画像符号化データを作成する。
予測モードの選択方法は複数存在するが、演算量の少ない方法として予測画素を作成して原画素との差から予測モードの評価値を算出する方法が考えられる。しかし、予測画素の作成には多くの演算量を必要とするので、さまざまな演算量の削減方法が考えられている。
例えば、対象ブロックが隣接する上と左のブロックにおいて選択された予測モードから、9つの予測モードを可能性の高い順に順序づける方式がある(例えば、特許文献1)。このような順序づけによれば、可能性の高い予測モードのみ評価することが可能となり、評価に伴う予測画素の作成等の演算量が削減される。
また、例えば、対象ブロックが隣接する上と左のブロックにおいて、2つのブロックのそれぞれが対象ブロックとの間で類似が見られる場合と見られない場合の組み合わせで、予測画素を生成して予測モードの評価値を算出する処理をあらかじめ決めておいた所定数の予測モードのみに限って実行する方式がある(例えば、特許文献2)。この方式によって、評価する予測モードは3個から1個に制限される。
フレーム内予測では、予測モードの評価を行う前に、可能性の高い予測モードに絞り込む予測モード選択処理を行って演算量の削減が図られている。しかし、次に示すように、従来の予測モード選択処理では、最も符号化効率のよい予測モードが選択されない問題があった。
特許文献1の方法は、隣接ブロックの選択した予測モードから、可能性の高い予測モードを絞り込んでいるが、例えば、隣接ブロックとの間に被写体の境界がある場合は、隣接ブロックとは画像の性質が異なるため、隣接ブロックの選択した予測モードの相関が低くなってしまい、最も符号化効率のよい予測モードが選択できないという問題点がある。
一方、特許文献2の方法は、隣接するブロック間の特徴を判定しているが、符号化の対象とするブロックの上方向と左方向のブロックで、類似しているか否かを判定しているだけなので、誤判定することがある。例えば、平坦な布部分などに見られるなだらかな変化のある画像では、上方向と左方向のブロックとも類似と判定され、その結果右斜め下およびその付近が評価対象と選択される。しかし、布の起伏によって画素値に微妙な変化が生じているため、最適な予測モードは、この変化する画素値の値に近い画素値を取る予測モードになるため、必ずしも右斜め下およびその付近とは限らなくなり、最も符号化効率のよい予測モードが選択できないという問題点がある。
この発明は、上述のような課題を解決するためになされたもので、符号化するブロックとその隣接するブロックの特徴量に基づく類似度が高い予測方向の候補を絞り込み、絞り込まれた予測方向のみから予測方向を評価して符号化することにより、最も符号化効率のよい予測モードを選択できるようにすることを目的とする。
また、ブロック内の細かい画像パターンを検出して予測方向を選択することにより、その予測モードの誤判定を解消して符号化効率を向上させることを目的とする。
この発明に係る予測モード選択装置は、入力画像の処理対象ブロックとその隣接ブロックの画像データから特徴量を算出する特徴量算出部と、この特徴量算出部が算出した特徴量に基づいて、前記処理対象ブロックの画像データを予測する複数の予測方向について、前記処理対象ブロック内部の基準点から各予測方向に位置する前記隣接ブロックの特徴量と前記処理対象ブロックの特徴量に基づいて、予測方向に対応する類似度を算出する類似度算出部と、この類似度算出部が算出した前記複数の予測方向の類似度を比較して、類似度が高い方から所定個の類似度に対応する予測方向を選択する予測方向選択部と、この予測方向選択部が選択した前記所定個の各予測方向に対応する前記処理対象ブロックの予測画像データを生成する予測画像生成部と、この予測画像生成部が生成した前記所定個の予測方向に対応する予測画像データと前記処理対象ブロックの画像データに基づいて、予測モードを判定する評価値を算出する評価値算出部、この評価値算出部が算出した評価値に基づいて、前記処理対象ブロックに対する予測モードを判定する予測モード判定部とを備えたものである。
また、この発明に係る画像符号化装置は、前記予測モード選択装置を備え、この予測モード選択装置が処理対象ブロックに対して選択する予測モードに基づいて、参照画像から前記処理対象ブロックの予測画像データを生成する予測画像生成部と、この予測画像生成部が生成した前記予測モードの予測画像データと前記処理対象ブロックの画像データから予測誤差画像データを算出する予測誤差算出部と、この予測誤差算出部が算出した予測誤差画像データを直交変換してから量子化する直交変換/量子化部と、この直交変換/量子化部が直交変換してから量子化した予測誤差画像データをエントロピー符号化するエントロピー符号化部と、前記直交変換/量子化部が直交変換してから量子化した予測誤差画像データを逆量子化してから逆直交変換する逆量子化/逆直交変換部と、この逆量子化/逆直交変換部が逆量子化してから逆直交変換した予測誤差画像データと前記予測画像生成部が生成した前記予測モードの予測画像データを足し合わせて参照画像を出力する加算部と、この加算部が出力した参照画像を蓄積するフレームメモリとを備えたものである。
この発明によれば、符号化するブロックとその隣接ブロックの特徴量に基づく類似度が高い予測方向の候補を限定して絞り込み、絞り込まれた予測方向のみから予測方向を評価して符号化するため、最も符号化効率のよい予測モードを選択できるようになる効果がある。
また、この発明によれば、ブロック内の細かい画像パターンを検出して予測方向を選択するため、符号化効率を向上させることができる効果がある。
この発明における予測モード選択装置および画像符号化装置において、演算負荷を軽減し、かつ符号化効率の良いモードを選択する構成及び方法について説明する。
実施の形態1.
図1は、この発明の実施の形態1における予測モード選択装置および画像符号化装置の一例を示すブロック図である。
図1は、この発明の実施の形態1における予測モード選択装置および画像符号化装置の一例を示すブロック図である。
この発明の実施の形態1における予測モード選択装置10aは、次に説明する特徴量算出部11、類似度算出部12、予測方向選択部13、予測画像生成部14a、評価値算出部15および予測モード判定部16を備えたものである。特徴量算出部11は、入力画像の処理対象ブロックとその隣接ブロックの画像データから特徴量を算出する。類似度算出部12は、特徴量算出部11が算出した特徴量に基づいて、処理対象ブロックの画像データを予測する複数の予測方向について、処理対象ブロック内部の基準点から各予測方向に位置する隣接ブロックの特徴量と処理対象ブロックの特徴量に基づいて、予測方向に対応する類似度を算出する。予測方向選択部13は、類似度算出部12が算出した複数の予測方向の類似度を比較して、類似度が高い方から所定個の類似度に対応する予測方向を選択する。予測画像生成部14aは、予測方向選択部13が選択した所定個の各予測方向に対応する処理対象ブロックの予測画像データを生成する。評価値算出部15は、予測画像生成部14aが生成した所定個の予測方向に対応する予測画像データと処理対象ブロックの画像データに基づいて、予測モードを判定する評価値を算出する。予測モード判定部16は、評価値算出部15が算出した評価値に基づいて、処理対象ブロックに対する予測モードを判定する。
また、この発明の実施の形態1における画像符号化装置は、この発明の実施の形態1における予測モード選択装置10aと、次に説明する予測画像生成部101、予測誤差算出部102、直交変換/量子化部103、エントロピー符号化部104、逆量子化/逆直交変換部105、加算部106およびフレームメモリ107を備えたものである。予測画像生成部101は、予測モード選択装置10aが処理対象ブロックに対して選択する予測モードに基づいて、参照画像から処理対象ブロックの予測画像データを生成する。予測誤差算出部102は、予測画像生成部101が生成した予測モードの予測画像データと処理対象ブロックの画像データから予測誤差画像データを算出する。直交変換/量子化部103は、予測誤差算出部102が算出した予測誤差画像データを直交変換してから量子化する。エントロピー符号化部104は、直交変換/量子化部103が直交変換してから量子化した予測誤差画像データをエントロピー符号化する。逆量子化/逆直交変換部105は、直交変換/量子化部103が直交変換してから量子化した予測誤差画像データを逆量子化してから逆直交変換する。加算部106は、逆量子化/逆直交変換部105が逆量子化してから逆直交変換した予測誤差画像データと予測画像生成部が生成した予測モードの予測画像データを足し合わせて参照画像を出力する。フレームメモリ107は、加算部106が出力した参照画像を蓄積する。
なお、画像符号化装置における処理対象ブロックとは、画像符号化装置の構成の一部として備えた予測モード選択装置10aにおいて予測モードを選択する処理対象ブロックであり、符号化対象のブロックである。
この発明の実施の形態1における予測モード選択装置および画像符号化装置は、N×Nの画素からなるブロック単位にフレーム内予測機能を持つものである。以下、図1のブロック構成に基づいて動作を説明する。
特徴量算出部11は、原画像のN×Nの画素からなるブロック毎の平均値Mおよび偏差値Eを次に示す(式1)および(式2)に従って演算する。
ここで、x,yは、現画像の画面内をN×Nの画素からなるブロック単位に分割した場合の、ブロックの水平方向の位置と垂直方向の位置を示す。Aijは、ブロック内の水平位置i,垂直位置jの画素値を表す。
次に、類似度算出部12で類似度を算出する。ここでは、H.264にならって、類似度を算出する予測方向は、図2に示すような2を除く0から8までの番号が付けられているものとして説明するが、この順序付けに限るわけではない。類似度を算出する対象となるブロックは、図3のブロック200が符号化対象とすると、この符号化対象のブロック200とその周辺の201から205までの隣接ブロックである。
類似度の算出は、位置(x,y)の符号化対象のブロック200の中心を基準点として、図4の予測方向の矢印の元方向にあるブロックとの間で行うものとする。予測方向mの算出対象ブロックが、位置(x,y)の符号化対象ブロックから水平方向α(m)、垂直方向β(m)の隣接位置(x+α(m),y+β(m))にあったとすると、m=0,1,3,4の類似度S(m,x,y)は、次に示す(式3)で算出する。ここで、類似度を算出する際に、平均値Mの差分と偏差値Eの差分の各絶対値に1を加えてから乗算することで、一方の差分が0になった場合でも、他方の差分による類似度の評価が行えるようにしている。
ここで、算出対象の位置(x+α(m),y+β(m))のブロックは、図4に図示したように、m=0の時にはブロック202、m=1の時にはブロック204、m=3の時にはブロック203、m=4の時にはブロック201である。
すなわち、ここでは、図4に図示したブロックに対応するα(m)、β(m)の組は、
m=0(ブロック202)
α(0)= 0,β(0)=−1
m=1(ブロック204)
α(1)=−1,β(1)= 0
m=3(ブロック203)
α(3)= 1,β(3)=−1
m=4(ブロック201)
α(4)=−1,β(4)=−1
となる。
m=0(ブロック202)
α(0)= 0,β(0)=−1
m=1(ブロック204)
α(1)=−1,β(1)= 0
m=3(ブロック203)
α(3)= 1,β(3)=−1
m=4(ブロック201)
α(4)=−1,β(4)=−1
となる。
m≧5、すなわちm=5,6,7,8の場合、図5の予測方向の矢印の元は、2つのブロックの境界線上にあるため、隣接する2つのブロックの特徴量の平均値を適用するものとする。予測方向mの算出対象ブロックが、位置(x,y)の符号化対象ブロックから水平方向α1(m)、垂直方向β1(m)および水平方向α2(m)、垂直方向β2(m)の隣接位置(x+α1(m),y+β1(m))および位置(x+α2(m),y+β2(m))にあったとすると、m≧5の類似度S(m,x,y)は、次に示す(式4)で算出する。
ここで、算出対象の位置(x+α1(m),y+β1(m))および位置(x+α2(m),y+β2(m))のブロックとは、図5に図示したように、m=5の時にはブロック201とブロック202、m=6の時にはブロック201とブロック204、m=7の時にはブロック202とブロック203、m=8の時にはブロック204とブロック205である。
すなわち、ここでは図5に図示したブロックに対応するα1(m)、β1(m)およびα2(m)、β2(m)の組は、
m=5(ブロック201,ブロック202)
α1(5)=−1,β1(5)=−1,
α2(5)= 0,β2(5)=−1
m=6(ブロック201,ブロック204)
α1(6)=−1,β1(6)=−1,
α2(6)= 0,β2(6)=−1
m=7(ブロック202,ブロック203)
α1(7)= 0,β1(7)=−1,
α2(7)= 1,β2(7)=−1
m=8(ブロック204,ブロック205)
α1(8)=−1,β1(8)= 0,
α2(8)=−1,β2(8)= 1
となる。
m=5(ブロック201,ブロック202)
α1(5)=−1,β1(5)=−1,
α2(5)= 0,β2(5)=−1
m=6(ブロック201,ブロック204)
α1(6)=−1,β1(6)=−1,
α2(6)= 0,β2(6)=−1
m=7(ブロック202,ブロック203)
α1(7)= 0,β1(7)=−1,
α2(7)= 1,β2(7)=−1
m=8(ブロック204,ブロック205)
α1(8)=−1,β1(8)= 0,
α2(8)=−1,β2(8)= 1
となる。
このように、符号化対象のブロック200の中心に設定した基準点を通る予測方向の傾きをもつ直線が通過する隣接ブロックの特徴量を適用して類似度を算出する。ここで、直線が複数の隣接ブロックを通過するときには、例えば(式4)のように複数の隣接ブロックの特徴量の平均を適用して類似度を算出する。なお、ここでは2つの隣接ブロックの特徴量の平均を適用すると説明したが、例えば、各隣接ブロックを通過する直線の線分の長さの比で重み付ける加重平均を適用してもよい。
予測方向選択部13は、予測方向評価で算出した各類似度S(m,x,y)の値を小さい順に並べて、値の小さい予測方向を小さい順に3つ選択する。予測画像生成部14aは、選択された3つの予測方向について、それぞれ予測画像を参照画像である局所復号画像から生成する。評価値算出部15は、予測画像生成部14aが生成した3つの予測方向に対応する予測画像と処理対象ブロックの画像データに基づいて、予測モードを判定する評価値を算出する。予測モード判定部16は、評価値算出部15で算出した評価値に基づいて、処理対象ブロックに対する予測モードを判定する。
このように、予測モード選択装置10aは、ここまで説明した特徴量算出部11、類似度算出部12、予測方向選択部13、予測画像生成部14a、評価値算出部15および予測モード判定部16を備え、符号化対象ブロックとその隣接ブロックの画像データを処理することで、処理対象ブロックに対する予測モードを選択するものである。
次に、予測画像生成部101は、予測モード選択装置10aの予測モード判定部16から出力された処理対象ブロックに対する予測モードの予測画像を参照画像である局所復号画像から生成する。予測誤差算出部102は、予測画像生成部101で生成された予測画像について、処理対象ブロックの画像データとの差分をとった予測誤差画像を算出する。直交変換/量子化部103は、予測誤差算出部102が算出した予測誤差画像を直交変換および量子化処理する。エントロピー符号化部104は、直交変換および量子化処理された予測誤差画像をエントロピー符号化し、符号データを出力する。逆量子化/逆直交変換部105は、直交変換/量子化部103の出力を逆量子化/逆直交変換する。加算部106は、逆量子化/逆直交変換部105が逆量子化/逆直交変換した予測誤差画像と予測画像生成部101が生成した予測画像を加えて、局所復号画像を参照画像として出力する。フレームメモリ107は、加算部106が出力した参照画像である局所復号画像を蓄積し、蓄積した局所復号画像を予測画像生成部101と予測画像生成部14aに出力する。
なお、この発明の実施の形態1では、特徴量算出部11において、ブロックの特徴量として平均値と偏差値を算出するものとして説明を行ったが、平均値または偏差値の一方のみを算出して、類似度算出部12において、符号化対象ブロックと隣接ブロックの特徴量の差を類似度として算出してもよい。
また、評価値算出部15において算出される評価値は、例えば予測誤差算出部102の処理と同様に、3つの予測方向に対応する予測画像のそれぞれについて、処理対象ブロックの画像データとの差分をとって、その差分絶対値和を評価値として適用することができるが、これに限るものではなく、他の評価方法を適用してもよい。
次に、この発明の実施の形態1の特徴量算出部11、類似度算出部12,予測方向選択部13の処理を具体的な画素値を例に説明する。ここで、図6は、図3のブロック構成に対応させた画素値を示し、中央の4×4ブロックを符号化対象ブロック200とし、上方側および左方側のブロック201からブロック205に対応させた一例について説明する。
特徴量算出部11は、図6の画素のブロックから画素平均値を(式1)、及び画素偏差値を(式2)によって算出する。図7に画素平均値の算出結果、および図8に画素偏差値の算出結果を示す。
次に、類似度算出部12は、m=0,1,3,4の場合の類似度を(式3)によって算出する。図9に矢印の元方向のブロックの画素平均値及び画素偏差値と、類似度の演算結果を示す。また、m≧5の場合の類似度を(式4)によって算出する。図10に矢印の元方向の2つのブロックの画素平均値及び画素偏差値と、類似度の演算結果を示す。
予測方向選択部13では、図9および図10に示した類似度S(m,x,y)の小さい方から順に並べる。図11に類似度に基づいて並べ替えた結果を示す。この図11の場合、小さい方から上位3つの予測方向の予測モードは、5、8、1となる。
ここで、この発明の実施の形態1における画像符号化装置において、演算量が低下していることを示す。予測方法としては、H.264で定義されている予測画素の演算方法を用いて、4×4ブロック(16画素)の予測を行った場合を想定する。
まず、8方向全て予測画素を算出して評価値を求めた場合の演算量を求める。
a)予測モード0,1は、コピーで済むので、演算量0となる。
b)予測モード3,4は、3画素の重み付け加算((A+2×B+C)>>2)で求め、各画素毎にシフト2回、加算3回なので、1予測モード当たりシフト2×(4×4)=32回、加算3×(4×4)=48回となり、2予測モード合わせてシフト32×2=64回、加算48×2=96回の演算量となる。
c)予測モード5,6,7,8は、画素の半分が予測モード3,4と同じ演算((A+2×B+C)>>2)で、半分が2画素の平均((A+B+1)>>1)でシフト1回、加算1回となり、1予測モード当たりシフト(2+1)×(4×4)/2=24回、加算(3+1)×(4×4)/2=32回となり、4予測モード合わせてシフト24×4=96回、加算32×4=128回の演算量となる。
a)予測モード0,1は、コピーで済むので、演算量0となる。
b)予測モード3,4は、3画素の重み付け加算((A+2×B+C)>>2)で求め、各画素毎にシフト2回、加算3回なので、1予測モード当たりシフト2×(4×4)=32回、加算3×(4×4)=48回となり、2予測モード合わせてシフト32×2=64回、加算48×2=96回の演算量となる。
c)予測モード5,6,7,8は、画素の半分が予測モード3,4と同じ演算((A+2×B+C)>>2)で、半分が2画素の平均((A+B+1)>>1)でシフト1回、加算1回となり、1予測モード当たりシフト(2+1)×(4×4)/2=24回、加算(3+1)×(4×4)/2=32回となり、4予測モード合わせてシフト24×4=96回、加算32×4=128回の演算量となる。
このように求まるa),b),c)の各演算量を全て合計すると、1ブロック当たりシフト64+96=160回、加算96+128=224回の演算量となる。
評価値は、予測画素値と原画素値の差分絶対値和で算出した場合で換算すると、1画素当たり差分1回、累算1回となる。(絶対値を取る処理は演算量0とする)加算2回と換算できる。これを1ブロック分算出した場合、2×(4×4)=32回の加算となる。これを8方向分算出するので、1ブロック当たり32×8=256回の加算となる。
よって、8方向全ての予測画素を算出して評価値を求めた場合、1ブロック当たりの演算量はシフト160回、加算224+256=480回となる。
次に、この発明の実施の形態1における演算負荷を算出する。まず、平均値は(式1)で算出するので、1ブロック当たりシフト1回、加算が4×4=16回である。偏差値は(式2)で算出するので、1画素当たり差分1回、累算1回として加算2回分となる。1ブロック当たりでは、シフト1回、加算2×(4×4)=32回である。合計すると、特徴量算出で、1ブロック当たりシフト2回、加算16+32=48回。類似度の算出のためには、隣接するブロックの特徴量算出も必要となるが、画面全体のブロックにこの発明の実施の形態1で示す予測モード選択方法を実施するため、1ブロック当たりの演算負荷は1ブロック分の特徴量算出の負荷と考えてよい。
類似度の算出のうち、m=0,1,3,4の分は、(式3)に従うため1予測モード当たり減算2回、乗算1回。減算は加算と同じコストであるため、加算に換算して加算2回、乗算1回。4予測モード分で加算4×2=8回、乗算4回。m≧5の分は、(式4)に従うので1予測モード当たり加算2回、シフト2回、減算2回、乗算1回。減算を加算に換算して加算4回、シフト2回、乗算1回。4つの予測モード分で加算4×4=16回、シフト2×4=8回、乗算4回。全予測モード分を合わせて1ブロック当たりシフト8回、加算24回、乗算8回となる。
予測画素の算出にかかる演算量は、どの予測モードを選択されるかに依存するため、8予測モードの平均演算量で代用する。1予測モード平均で、シフト160/8=20回、加算224/8=28回である。これを3予測モード分演算するので、1ブロック当たりシフト20×3=60回、加算28×3=84回である。評価値の算出は、差分絶対値和を取るため、1方向当たり32回の加算である。3方向分で、1ブロック当たり96回の加算となる。
このように、この発明の実施の形態1の演算量は、1ブロック当たりシフト2+8+60=70回、加算48+24+84+96=252回、乗算8回である。この発明の実施の形態1によれば、乗算8回が加算されるが、シフトの演算回数は半分以下、加算は半分程度となり、演算負荷を下げる効果がある。
次に、この発明の実施の形態1における予測モード選択装置および画像符号化装置において、2N×2Nの画素からなる領域の予測方法を選択する方法について説明する。
特徴量算出部11で、以下の演算で2N×2Nの領域の特徴量を算出する。予測対象ブロックの位置を、x,yとする。x,yは画面を2N×2Nの領域に分割した際の水平位置と垂直位置である。2N×2Nの領域の平均値および偏差値は、2N×2Nの領域をさらに分割したN×Nの各領域について求めた平均値Mおよび偏差値Eを用いて、次に示す(式5)および(式6)の値で代用する。
類似度算出部12では、(式5)および(式6)で求めた予測対象ブロックの特徴量と、図12に示す符号化対象のブロック300の中心を基準点とした予測方向の矢印の元に存在する隣接ブロックの特徴量との間で類似度を算出する。算出対象とする隣接ブロックは、予測方向0では、ブロック302とブロック303で、特徴量は平均をとり、予測方向1ではブロック305とブロック306で、特徴量は平均をとる。予測方向3ではブロック304、予測方向4ではブロック301、予測方向5はブロック302、予測方向6はブロック305、予測方向7はブロック303、予測方向8はブロック306とする。予測方向選択部13の動作はN×Nの領域の場合の動作と同じである。
このように、2N×2Nの領域に対しても、類似度を算出して評価することで、予測方向を限定して予測モードの判定処理にかかる演算量を削減することができる。
このように、この発明の実施の形態1における予測モード選択装置および画像符号化装置によれば、符号化するブロックとその近接ブロックの特徴量に基づく類似度から予測方向の候補を限定して絞り込んでおき、絞り込まれた予測方向のみから予測方向を評価して符号化するため、演算負荷を軽減できるようになる。
また、この発明の実施の形態1における予測モード選択装置および画像符号化装置によれば、類似度は画像の連続する方向を示す値であるため、このような絞り込みを行なっても符号化効率の良い予測モードが選択できる。
実施の形態2.
図13は、この発明の実施の形態2における予測モード選択装置および画像符号化装置の一例を示すブロック図である。図において、この発明の実施の形態1と同じブロックには、同一符号を付し、説明を省略する。
図13は、この発明の実施の形態2における予測モード選択装置および画像符号化装置の一例を示すブロック図である。図において、この発明の実施の形態1と同じブロックには、同一符号を付し、説明を省略する。
この発明の実施の形態2の予測モード選択装置10bは、この発明の実施の形態1の予測モード選択装置10aに対して、画像パターン検出部21および予測方向候補算出部22を追加するとともに、予測画像生成部14aを予測画像生成部14bに置き換えたものである。画像パターン検出部21は、入力画像の処理対象ブロックの画素から画像パターンを検出する。予測方向算出部22は、処理対象ブロックの画像データを予測する複数の予測方向に合わせてあらかじめ設定された入力画像の処理対象ブロックの画素と隣接ブロックの隣接画素とに基づく評価値を比較して、評価値が低い方から所定個の評価値に対応する予測方向を算出する。予測画像生成部14bは、画像パターン検出部21が画像パターンを検出したとき、予測方向算出部22が算出した所定個の予測方向を選択し、画像パターン検出部21が画像パターンを検出しなかったとき、予測方向選択部13が選択した所定個の予測方向を選択し、選択された所定個の各予測方向に対応する処理対象ブロックの予測画像データを生成する。
また、この発明の実施の形態2における画像符号化装置は、この発明の実施の形態1における画像符号化装置が備える予測モード選択装置10aを、この発明の実施の形態2における予測モード選択装置10bに置き換えたものである。
以下に、動作を説明する。
画像パターン検出部21は、対象ブロックを中心とする領域にあらかじめ設定された画像パターンが現れているか、または現れていないかを検出する。画像パターンは、例えば、細かい縞模様等である。
細かい縞模様の検出は、対象とするブロックの垂直方向と水平方向に隣接する2画素文を含んだ領域に対して演算する。例えば、図14の中央の4×4のブロックで縞模様を検出する場合について、Aで示した行(横方向)の8つの画素値と、Bで示した列(縦方向)の8つの画素値を使用するものとして説明する。ここで、中央の4×4のブロックの符号化画素に対し、周囲の隣接画素には斜線を引いて図示している。なお、符号化画素および隣接画素は、白または黒で示しているが、実際には多値信号であり、各画素において、白は明るい画素、黒は暗い画素を概念的に示して説明するもので、白で示された画素同士や黒で示された画素同士は同一値に限るものではない。
通常、画素値は、8ビットとすると0〜255の範囲の値をとり、図14のAで示した行の画素値は、図15に示すグラフの値をとるとする。ここで、8つの画素中に極小値が2つあった場合、その間隔をDi、値の差をViとする。極大値が2つあった場合、その間隔をDa、値の差をVaとする。例えば、あらかじめ決められた間隔の閾値THD、値の閾値THVの間に以下の3つの関係が同時に成り立つときに縞模様があると判定する。間隔の閾値THD、値の閾値THVは、例えば、THD=2、THV=10等の値を用いて判定すればよい。
|Di−Da|<THD
Vi<THV
Va<THV
|Di−Da|<THD
Vi<THV
Va<THV
同様に、図14のBで示した列の部分について判定すると、範囲内に極小値、極大値が2つ無いため、上記3つの関係が同時には成り立たず、縞模様がないと判定される。しかし、Aで示した行の部分で縞模様があると判定されており、Aで示した行またはBで示した列の一方でも縞模様があると判定される場合には、ブロックに縞模様があると最終判定して通知する。なお、ここでは中央の4×4のブロックの上部の行と左部の列の画素値を例としたが、対象とする4×4のブロックの行を含む任意の行および列を含む任意の列の画素値で判定してもよい。
予測方向候補算出部22は、画像パターン毎に定められた処理を実施し、予測方向の候補を定める。例えば、画像パターンを縞模様とした場合、縞の走る方向を検出して、それに近い予測方向を、予測方向選択部13の予測方向の選択数と同様に、3つ選択する。
3つの予測方向の選択は、各予測方向それぞれについて、その予測方向に隣接画素値と近い値の画素値が並んでいることを判定して行なう。判定方法は、例えば、図16に示すようなブロックの隣接画素Aの画素値と、その隣接画素から判定する予測方向に延ばした線上にある3つまたは4つのブロック内符号化画素Bn(n=1〜3または1〜4)の各画素値との差分絶対値を累算した値を評価値とし、8つの予測方向の評価値を比較して、評価値が小さい方から対応する予測方向3つを選択する。ここで、4×4のブロックの符号化画素に対し、周囲の隣接画素には斜線を引いて図示している。なお、符号化画素および隣接画素は、白または黒で示しているが、実際には多値信号であり、図14と同様に、各画素において、白は明るい画素、黒は暗い画素を概念的に示して説明するもので、白で示された画素同士や黒で示された画素同士は同一値に限るものではない。
ここでは、演算量への影響を考慮し、4×4ブロックで、2本の縞の起点を想定した2つの隣接画素と、それぞれと比較するブロック内画素をN画素(Nはブロックサイズ)までとする。このようにすることで、演算量を差分が2N回、累算が2N回で、加算4N回となる。8方向算出しても32N回となり、4×4ブロックの場合で最大128回の加算で算出できる。
ここで、評価値を算出する隣接画素Aとブロック内画素Bnは予測方向毎にあらかじめ決定しておく。例えば、図17および図18は、4×4ブロックの場合の予測方向と、隣接画素Aとブロック内符号化画素Bnの位置関係を示している。図17は、予測方向0,1,3,4の場合であり、予測方向0は縦方向の縞、予測方向1は横方向の縞で、図示した隣接画素Aと4つのブロック内符号化画素Bn(n=1,2,3,4)から評価値を算出する。また、予測方向3は左斜め下方向への縞、予測方向4は右斜め下方向への縞で、図示した隣接画素Aと3つのブロック内符号化画素Bn(n=1,2,3)から評価値を算出する。図18は、いずれも斜め方向の縞を判定する予測方向5,6,7,8の場合であり、図示した隣接画素Aと4つのブロック内符号化画素Bn(n=1,2,3,4)から評価値を算出する。
同様に、8×8ブロックや16×16ブロックの場合も、あらかじめ判定する予測方向毎に算出する隣接画素とブロック内画素の組を決めておき、決めた位置の画素値の差で評価値を算出し、3つの方向を選択する。
予測画像生成部14bは、画像パターン検出部21からブロック内に画像パターンが現れたか否かを通知され、ブロック内に画像パターンが現れた場合には、予測方向候補算出部22から入力される3つの予測方向の候補を選択し、またブロック内に画像パターンが現れなかった場合には、予測方向選択部13から入力される3つの予測方向の候補を選択して、選択された3つの予測方向について、それぞれ予測画像を参照画像である局所復号画像から生成する。
この予測画像生成部14bから3つの予測方向の候補の予測画像を受ける評価値算出部15以降の処理は、この発明の実施の形態1の予測モード選択装置および画像符号化装置で説明した処理および動作と同様であるため、説明を省略する。
このように、この発明の実施の形態2における予測モード選択装置および画像符号化装置によれば、この発明の実施の形態1における予測モード選択装置および画像符号化装置と同様に、予測方向を選択する演算負荷を軽減し、また符号化効率のよいモードを選択できる。
また、この発明の実施の形態2における予測モード選択装置および画像符号化装置によれば、類似度による評価では、4×4ブロックなどの単位で特徴量を比較するために、実際に符号化効率のよい予測方向が選択できていなかった場合には、ブロック内の細かい画像パターンを検出して予測方向を選択するようにしたので、符号化効率を向上させることができる。例えば、細かい縞柄などの画像パターンでは、縞の走る方向に予測を行えるので、符号化効率が向上する。
以上のように、この発明における予測モード選択装置および画像符号化装置によれば、符号化するブロックとその隣接ブロックの特徴量に基づく類似度が高い予測方向の候補を限定して絞り込むため、予測方向を選択する演算負荷を軽減することができる。
また、この発明における予測モード選択装置および画像符号化装置によれば、符号化するブロックとその隣接ブロックの特徴量に基づく類似度が高い予測方向の候補を限定して絞り込み、絞り込まれた予測方向のみから予測方向を評価して符号化するため、符号化効率のよい予測モードを選択できるようになる効果がある。
また、この発明における予測モード選択装置および画像符号化装置によれば、ブロック内の細かい画像パターンを検出して予測方向を選択するため、符号化効率を向上させることができる効果がある。
10a、10b 予測モード選択装置
11 特徴量算出部
12 類似度算出部
13 予測方向選択部
14a、14b 予測画像生成部
15 評価値算出部
16 予測モード判定部
21 画像パターン検出部
22 予測方向候補算出部
101 予測画像生成部
102 予測誤差算出部
103 直交変換/量子化部
104 エントロピー符号化部
105 逆量子化/逆直交変換部
106 加算部
107 フレームメモリ
11 特徴量算出部
12 類似度算出部
13 予測方向選択部
14a、14b 予測画像生成部
15 評価値算出部
16 予測モード判定部
21 画像パターン検出部
22 予測方向候補算出部
101 予測画像生成部
102 予測誤差算出部
103 直交変換/量子化部
104 エントロピー符号化部
105 逆量子化/逆直交変換部
106 加算部
107 フレームメモリ
Claims (6)
- 入力画像の処理対象ブロックとその隣接ブロックの画像データから特徴量を算出する特徴量算出部と、
この特徴量算出部が算出した特徴量に基づいて、前記処理対象ブロックの画像データを予測する複数の予測方向について、前記処理対象ブロック内部の基準点から各予測方向に位置する前記隣接ブロックの特徴量と前記処理対象ブロックの特徴量に基づいて、予測方向に対応する類似度を算出する類似度算出部と、
この類似度算出部が算出した前記複数の予測方向の類似度を比較して、類似度が高い方から所定個の類似度に対応する予測方向を選択する予測方向選択部と、
この予測方向選択部が選択した前記所定個の各予測方向に対応する前記処理対象ブロックの予測画像データを生成する予測画像生成部と、
この予測画像生成部が生成した前記所定個の予測方向に対応する予測画像データと前記処理対象ブロックの画像データに基づいて、予測モードを判定する評価値を算出する評価値算出部、
この評価値算出部が算出した評価値に基づいて、前記処理対象ブロックに対する予測モードを判定する予測モード判定部と
を備えた予測モード選択装置。 - 前記類似度算出部は、前記処理対象ブロック内部の基準点から各予測方向に位置する前記隣接ブロックが複数存在するとき、当該隣接ブロックの特徴量の平均値と前記処理対象ブロックの特徴量に基づいて、予測方向に対応する類似度を算出する
ことを特徴とする請求項1記載の予測モード選択装置。 - 前記特徴量算出部は、ブロック毎に複数種類の特徴量を算出し、
前記類似度算出部は、前記特徴量算出部が算出した前記隣接ブロックの特徴量と前記処理対象ブロックの特徴量の差の絶対値を前記複数種類の特徴量毎に算出し、この算出した前記複数種類の特徴量の差の絶対値を乗算した値を類似度とする
ことを特徴とする請求項1または請求項2記載の予測モード選択装置。 - 前記特徴量算出部は、前記入力画像の処理対象ブロックを複数の小ブロックに分割して特徴量をそれぞれ算出し、
前記類似度算出部は、前記特徴量算出部が算出した複数の小ブロックの特徴量の平均を前記入力画像の処理対象ブロックの特徴量とする
ことを特徴とする請求項1ないし請求項3のいずれかに記載の予測モード選択装置。 - 入力画像の処理対象ブロックの画素から画像パターンを検出する画像パターン検出部と、
前記処理対象ブロックの画像データを予測する複数の予測方向に合わせてあらかじめ設定された前記入力画像の処理対象ブロックの画素と前記隣接ブロックの隣接画素とに基づく評価値を比較して、評価値が低い方から所定個の評価値に対応する予測方向を算出する予測方向算出部と
を備え、
前記予測画像生成部は、前記画像パターン検出部が画像パターンを検出したとき、前記予測方向算出部が算出した所定個の予測方向を選択し、前記画像パターン検出部が画像パターンを検出しなかったとき、前記予測方向選択部が選択した所定個の予測方向を選択し、この選択された前記所定個の各予測方向に対応する前記処理対象ブロックの予測画像データを生成する
ことを特徴とする請求項1ないし請求項4のいずれかに記載の予測モード選択装置。 - 請求項1ないし請求項5のいずれかに記載の予測モード選択装置を備え、
この予測モード選択装置が前記処理対象ブロックに対して選択する予測モードに基づいて、参照画像から前記処理対象ブロックの予測画像データを生成する予測画像生成部と、
この予測画像生成部が生成した前記予測モードの予測画像データと前記処理対象ブロックの画像データから予測誤差画像データを算出する予測誤差算出部と、
この予測誤差算出部が算出した予測誤差画像データを直交変換してから量子化する直交変換/量子化部と、
この直交変換/量子化部が直交変換してから量子化した予測誤差画像データをエントロピー符号化するエントロピー符号化部と、
前記直交変換/量子化部が直交変換してから量子化した予測誤差画像データを逆量子化してから逆直交変換する逆量子化/逆直交変換部と、
この逆量子化/逆直交変換部が逆量子化してから逆直交変換した予測誤差画像データと前記予測画像生成部が生成した前記予測モードの予測画像データを足し合わせて参照画像を出力する加算部と、
この加算部が出力した参照画像を蓄積するフレームメモリと
を備えた画像符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008053426A JP2009212790A (ja) | 2008-03-04 | 2008-03-04 | 予測モード選択装置および画像符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008053426A JP2009212790A (ja) | 2008-03-04 | 2008-03-04 | 予測モード選択装置および画像符号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009212790A true JP2009212790A (ja) | 2009-09-17 |
Family
ID=41185520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008053426A Pending JP2009212790A (ja) | 2008-03-04 | 2008-03-04 | 予測モード選択装置および画像符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009212790A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013081100A (ja) * | 2011-10-04 | 2013-05-02 | Nippon Hoso Kyokai <Nhk> | イントラ予測装置、符号化装置、及びプログラム |
WO2015120823A1 (zh) * | 2014-02-16 | 2015-08-20 | 同济大学 | 使用多种形式的参考像素存储空间的图像压缩方法和装置 |
KR101827939B1 (ko) * | 2011-12-13 | 2018-02-12 | 주식회사 스카이미디어테크 | 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
KR101846250B1 (ko) * | 2011-12-14 | 2018-04-06 | 주식회사 스카이미디어테크 | 적중률이 높은 mpm을 통한 영상의 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
KR101934036B1 (ko) * | 2018-02-05 | 2018-12-31 | 주식회사 스카이미디어테크 | 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
KR20190125261A (ko) * | 2019-10-30 | 2019-11-06 | 주식회사 스카이미디어테크 | 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
KR20200015684A (ko) * | 2020-02-06 | 2020-02-12 | 주식회사 스카이미디어테크 | 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
KR20200077497A (ko) * | 2020-06-23 | 2020-06-30 | 주식회사 스카이미디어테크 | 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
KR20200143352A (ko) * | 2020-12-18 | 2020-12-23 | 주식회사 스카이미디어테크 | 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
-
2008
- 2008-03-04 JP JP2008053426A patent/JP2009212790A/ja active Pending
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013081100A (ja) * | 2011-10-04 | 2013-05-02 | Nippon Hoso Kyokai <Nhk> | イントラ予測装置、符号化装置、及びプログラム |
KR101827939B1 (ko) * | 2011-12-13 | 2018-02-12 | 주식회사 스카이미디어테크 | 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
KR101846250B1 (ko) * | 2011-12-14 | 2018-04-06 | 주식회사 스카이미디어테크 | 적중률이 높은 mpm을 통한 영상의 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
WO2015120823A1 (zh) * | 2014-02-16 | 2015-08-20 | 同济大学 | 使用多种形式的参考像素存储空间的图像压缩方法和装置 |
KR101934036B1 (ko) * | 2018-02-05 | 2018-12-31 | 주식회사 스카이미디어테크 | 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
KR102076781B1 (ko) * | 2019-10-30 | 2020-02-12 | 주식회사 스카이미디어테크 | 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
KR20190125261A (ko) * | 2019-10-30 | 2019-11-06 | 주식회사 스카이미디어테크 | 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
KR20200015684A (ko) * | 2020-02-06 | 2020-02-12 | 주식회사 스카이미디어테크 | 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
KR102127860B1 (ko) * | 2020-02-06 | 2020-06-29 | 주식회사 스카이미디어테크 | 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
KR20200077497A (ko) * | 2020-06-23 | 2020-06-30 | 주식회사 스카이미디어테크 | 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
KR102195204B1 (ko) * | 2020-06-23 | 2020-12-24 | 주식회사 스카이미디어테크 | 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
KR20200143352A (ko) * | 2020-12-18 | 2020-12-23 | 주식회사 스카이미디어테크 | 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
KR102244384B1 (ko) * | 2020-12-18 | 2021-04-26 | 주식회사 스카이미디어테크 | 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009212790A (ja) | 予測モード選択装置および画像符号化装置 | |
EP3684059B1 (en) | Decoding method for intra predicting a block by first predicting the pixels at the boundary | |
JP4711712B2 (ja) | 行ベクトルおよび列ベクトルを用いた動きベクトル検出 | |
JP4707118B2 (ja) | 動画像符号化装置および動画像復号装置のイントラ予測方式 | |
JP5306486B2 (ja) | 動きベクトル予測符号化方法,動きベクトル予測復号方法,動画像符号化装置,動画像復号装置およびそれらのプログラム | |
JP5078895B2 (ja) | 統合時空間予測法 | |
JP5367098B2 (ja) | 動きベクトル予測符号化方法,動きベクトル予測復号方法,動画像符号化装置,動画像復号装置およびそれらのプログラム | |
RU2628259C1 (ru) | Устройство кодирования изображений, устройство декодирования изображений, способ кодирования изображений и способ декодирования изображений | |
JP2006246431A (ja) | 画像符号化装置および画像符号化方法 | |
CN1984341A (zh) | 用于图像的帧内预测编码和解码的方法以及装置 | |
CN101426141A (zh) | 图像编码装置和编码方法,图像译码装置和译码方法 | |
JP5367097B2 (ja) | 動きベクトル予測符号化方法、動きベクトル予測復号方法、動画像符号化装置、動画像復号装置およびそれらのプログラム | |
JP2008109632A (ja) | 動きベクトル検出装置及びその方法 | |
TW201041406A (en) | Image predictive encoding device, image predictive encoding method, image predictive encoding program, image predictive decoding device, image predictive decoding method, and image predictive decoding program | |
CN108419082B (zh) | 一种运动估计方法及装置 | |
JP2008227670A (ja) | 画像符号化装置 | |
JP2005176073A (ja) | 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム | |
JP2006523069A (ja) | ビデオ符号器で適応動きベクトルの探索領域を決定する方法および装置 | |
CN101888546A (zh) | 一种运动估计的方法及装置 | |
JP2017195638A (ja) | 符合化及び復号化のための方法及び装置 | |
JP2006180298A (ja) | 画像符号化制御方法及びその装置 | |
JP5178616B2 (ja) | シーンチェンジ検出装置および映像記録装置 | |
JP4868539B2 (ja) | 動画像符号化装置および復号装置 | |
CN108337508B (zh) | 帧内预测装置和方法 | |
Wu et al. | Fast intra-coding for H. 264/AVC by using projection-based predicted block residuals |