JP5789172B2 - 画像処理装置及びプログラム - Google Patents

画像処理装置及びプログラム Download PDF

Info

Publication number
JP5789172B2
JP5789172B2 JP2011231113A JP2011231113A JP5789172B2 JP 5789172 B2 JP5789172 B2 JP 5789172B2 JP 2011231113 A JP2011231113 A JP 2011231113A JP 2011231113 A JP2011231113 A JP 2011231113A JP 5789172 B2 JP5789172 B2 JP 5789172B2
Authority
JP
Japan
Prior art keywords
unit
prediction
filter
group
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011231113A
Other languages
English (en)
Other versions
JP2013090253A (ja
Inventor
井口 和久
和久 井口
俊枝 三須
俊枝 三須
善明 鹿喰
善明 鹿喰
市ヶ谷 敦郎
敦郎 市ヶ谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2011231113A priority Critical patent/JP5789172B2/ja
Publication of JP2013090253A publication Critical patent/JP2013090253A/ja
Application granted granted Critical
Publication of JP5789172B2 publication Critical patent/JP5789172B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、複数の予測方向を用いて画面内予測を行う画像処理装置及びプログラムに関する。
近年マルチメディア化が進み、動画像を扱う機会が多くなってきている。画像データは情報量が大きく、画像の集合である動画像は、テレビ放送の主流であるハイビジョン(1920×1080)放送で1Gbit/secを超える情報量である。
そのため、動画像データは、H.264/AVC(Advanced Video Coding)や規格化作業中のHEVC(High Efficiency Video Coding)などに代表される符号化標準技術によって、情報量を圧縮して伝送・蓄積が行われている。
符号化標準技術であるH.264/AVCは、直交変換や画面間予測、画面内予測、算術符号化、デブロッキングフィルタなどのツールを利用して、動画像の1/100程度までの圧縮を実現している。ツールの一つである画面内予測は、処理対象ブロックに隣接する画素値を参照画素として、複数の予測モードから最適な予測モードを決定して画面内予測を行う。
また、H.264/AVCで、高画質化のために追加された技術に、8×8の画面内予測がある(非特許文献1)。
図1は、H.264/AVCの8×8の画面内予測を説明するための図である。図1に示す画素A〜Yは、参照画素を示し、文字が無い白丸の画素は、処理対象ブロックの画素を示す。ここで、画面内予測を行う前に、参照画素A〜Yに対して、[1/4,1/2,1/4]のローパスフィルタが適用される。ローパスフィルタは以下、LPFとも呼ぶ。
例えば、参照画素Cを参照するときは、B×0.25+C×0.5+D×0.25の画素値が用いられる。両端の参照画素AとYとについては、[1/4,3/4]のフィルタが用いられる。例えば、参照画素Aを参照するときは、B×0.25+A×0.75の画素値が用いられる。
また、規格化作業中であるHEVC方式でも、H.264/AVCの8×8の画面内予測で用いた参照画素のフィルタリングが、ブロックサイズに限らず画面内予測の前に行なわれることで規格化が進められている。
このHEVC方式において、着目画素の前後の画素値の差の絶対値が閾値以下の場合はフィルタリングを行い、閾値より大きい場合はフィルタリングを行わない、という参照画素のフィルタリング方法が提案されている(非特許文献2)。
提案されたフィルタリング方法では、例えば、図1に示すDの画素を参照する場合、abs(C−E)の値が閾値以下の場合はフィルタリングを行った画素値を用い、abs(C−E)の値が閾値を超える場合はDの値をそのまま用いる。
大久保榮監修,「改訂三版 H.264/AVC 教科書」,インプレス R&D,p.264−268,2009年1月1日 Jane Zhao,「On intra prediction(JCTVC-E437)」,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 5th Meeting: Geneva, CH, 16-23 March, 2011
ここで、画面内予測の参照画素にフィルタリングを行う目的は、参照画素に含まれるノイズを低減することである。フィルタリングを行わない場合、参照画素にノイズが含まれていると、画面内予測の予測方向にそのノイズが引き延ばされてしまう。この場合、処理対象ブロック(予測ブロック)には存在していない縞模様が画面内予測により生成されるため、画面内予測の効率が低下する。
また、画面内予測の予測方向にエッジが存在していた場合、LPFを適用することでエッジの値が変化するため、画面内予測の効率が低下する。これは、本来存在していたエッジとは異なるエッジが、画面内予測により生成されるからである。
このように、ノイズ削減効果と、エッジが存在していた場合に画面内予測の効率が低下することは表裏一体の関係となっている。
そのため、非特許文献2では、参照画素に隣接する画素値を用いて、ノイズとエッジとの判定を行うことで、画面内予測の効率を向上させていた。
しかしながら、非特許文献2では、参照画素ごとに、参照画素に隣接する画素値を用いた判定を行うため、計算量が増大してしまうという問題点があった。
そこで、本発明は、上記課題に鑑みてなされたものであり、計算量の増加を抑えつつ、画面内予測の効率を向上させることができる画像処理装置及びプログラムを提供することを目的とする。
本発明の一態様における画像処理装置は、複数の予測モードに対応する予測方向を用いて画面内予測を行う画像処理装置であって、参照される可能性に基づいて複数の参照画素を複数のグループに分類する分類部と、前記分類部により分類された各グループに対して異なるフィルタを決定するフィルタ決定部と、前記複数の予測モードの全てに対し、前記フィルタ決定部により決定されたフィルタを用いて、前記各グループに含まれる前記参照画素の画素値にフィルタリングを行うフィルタリング部と、前記フィルタリング部によるフィルタリング後の画素値を用いて、前記画面内予測の予測画像を生成する生成部と、を備える。
また、前記分類部は、参照される予測方向数の数に基づいて前記複数の参照画素を分類してもよい。
また、前記分類部は、処理対象ブロックに隣接するか否かで前記複数の参照画素を分類してもよい。
また、前記分類部は、前記処理対象ブロックに隣接する参照画素、又は前記処理対象ブロックに隣接しない画素をさらに複数のグループに分類してもよい。
また、前記フィルタ決定部は、前記グループ内の参照画素が参照される可能性が高いほど、通過帯域の広いローパスフィルタに決定してもよい。
また、前記フィルタ決定部は、参照される可能性が最も高い参照画素を含む第1グループに対して、ノイズ除去フィルタに決定し、前記第1グループ以外のグループに対して、該グループ内の参照画素が参照される可能性が高いほど、通過帯域の広いローパスフィルタに決定してもよい。
また、本発明の他の態様におけるプログラムは、複数の予測モードに対応する予測方向を用いて画面内予測を行う処理をコンピュータに実行させるためのプログラムであって、前記コンピュータに、参照される可能性に基づいて複数の参照画素を複数のグループに分類する分類ステップと、前記分類ステップにより分類された各グループに対して異なるフィルタを決定するフィルタ決定ステップと、前記複数の予測モードの全てに対し、前記フィルタ決定ステップにより決定されたフィルタを用いて、前記各グループに含まれる前記参照画素の画素値にフィルタリングを行うフィルタリングステップと、フィルタリング後の画素値を用いて、前記画面内予測の予測画像を生成する生成ステップとを実行させる。
本発明によれば、計算量の増加を抑えつつ、画面内予測の効率を向上させることができる。
H.264/AVCの8×8の画面内予測を説明するための図。 実施例1における画像符号化装置の概略構成の一例を示すブロック図。 イントラ予測部の構成の一例を示すブロック図。 8×8の画面内予測符号化の予測方向を示す図。 H.264/AVCにおける参照画素Yを参照する予測方向を示す図。 H.264/AVCにおける参照画素Uを参照する予測方向を示す図。 H.264/AVCにおける参照画素Qを参照する予測方向を示す図。 H.264/AVCにおける参照画素Mを参照する予測方向を示す図。 参照画素を2分類する一例を示す図。 参照画素を3分類する一例を示す図。 実験結果を示す図。 実施例1におけるが画面内予測処理の一例を示すフローチャート。 実施例2における画像符号化装置の構成の一例を示すブロック図。
以下、添付図面を参照しながら各実施例について詳細に説明する。
[実施例1]
<構成>
図2は、実施例1における画像符号化装置100の概略構成の一例を示すブロック図である。図2に示す例では、画像符号化装置100は、予測誤差信号生成部101、直交変換部102、量子化部103、エントロピー符号化部104、逆量子化部105、逆直交変換部106、復号画像生成部107、デブロッキングフィルタ部108、復号画像記憶部109、イントラ予測部110、インター予測部111、動きベクトル計算部112、符号化制御及びヘッダ生成部113及び予測画像選択部114を有する。各部についての概略を以下に説明する。
予測誤差信号生成部101は、入力された動画像データの符号化対象画像が、例えば16×16画素のブロックに分割されたブロックデータを取得する。
予測誤差信号生成部101は、そのブロックデータと、予測画像選択部114から出力される予測画像のブロックデータとにより、予測誤差信号を生成する。予測誤差信号生成部101は、生成された予測誤差信号を直交変換部102に出力する。
直交変換部102は、入力された予測誤差信号を直交変換処理する。直交変換部102は、直交変換処理によって水平及び垂直方向の周波数成分に分離された信号を量子化部103に出力する。
量子化部103は、直交変換部102からの出力信号を量子化する。量子化部103は、量子化することによって出力信号の符号量を低減し、この出力信号をエントロピー符号化部104及び逆量子化部105に出力する。
エントロピー符号化部104は、量子化部103からの出力信号をエントロピー符号化して出力する。エントロピー符号化とは、シンボルの出現頻度に応じて可変長の符号を割り当てる方式をいう。
逆量子化部105は、量子化部103からの出力信号を逆量子化してから逆直交変換部106に出力する。逆直交変換部106は、逆量子化部105からの出力信号を逆直交変換処理してから復号画像生成部107に出力する。これら逆量子化部105及び逆直交変換部106によって復号処理が行われることにより、符号化前の予測誤差信号と同程度の信号が得られる。
復号画像生成部107は、インター予測部111で動き補償された画像のブロックデータと、逆量子化部105及び逆直交変換部106により復号処理された予測誤差信号とを加算する。復号画像生成部107は、加算して生成した復号画像のブロックデータを、デブロッキングフィルタ部108に出力する。
デブロッキングフィルタ部108は、復号画像生成部107から出力された復号画像に対し、ブロック歪を低減するためのフィルタをかけ、復号画像記憶部109に出力する。
復号画像記憶部109は、入力した復号画像のブロックデータを新たな参照画像のデータとして記憶し、イントラ予測部110、インター予測部111及び動きベクトル計算部112に出力する。
イントラ予測部110は、符号化対象画像の処理対象ブロックに対して、すでに符号化された参照画素から予測画像を生成する。イントラ予測部110の詳細は、図2を用いて後述する。
インター予測部111は、復号画像記憶部109から取得した参照画像のデータを動きベクトル計算部112から提供される動きベクトルで動き補償する。これにより、動き補償された参照画像としてのブロックデータが生成される。
動きベクトル計算部112は、符号化対象画像におけるブロックデータと、復号画像記憶部109から取得する参照画像とを用いて、動きベクトルを求める。動きベクトルとは、ブロック単位で参照画像内から処理対象ブロックに最も類似している位置を探索するブロックマッチング技術を用いて求められるブロック単位の空間的なずれを示す値である。動きベクトル計算部112は、求めた動きベクトルをインター予測部111に出力する。
イントラ予測部110とインター予測部111から出力されたブロックデータは、予測画像選択部114に入力される。
予測画像選択手段114は、イントラ予測部110とインター予測部111から取得したブロックデータのうち、どちらか一方のブロックデータを予測画像として選択する。選択された予測画像は、予測誤差信号生成部101に出力される。
また、符号化制御及びヘッダ生成部113について、符号化の全体制御とヘッダ生成を行う。符号化制御及びヘッダ生成部113は、イントラ予測部110に対して、スライス分割有無の通知、デブロッキングフィルタ部108に対して、デブロッキングフィルタ有無の通知、動きベクトル計算部112に対して参照画像の制限通知などを行う。
符号化制御及びヘッダ生成部113は、その制御結果を用いて、例えばH.264/AVCのヘッダ情報を生成する。生成されたヘッダ情報は、エントロピー符号化部104に出力され、画像データ、動きベクトルデータとともにストリームとして出力される。
<イントラ予測部の構成>
次に、イントラ予測部110の構成について説明する。図3は、イントラ予測部110の構成の一例を示すブロック図である。図3に示すイントラ予測部110は、分類部201、フィルタ決定部202、フィルタリング部203、生成部204を有する。
分類部201は、画面内予測で用いる複数の参照画素を、その参照画素が参照される可能性に基づいて複数のグループに分類する。分類部201は、例えば、参照される予測方向の数や処理対象ブロックに隣接するか否かで、参照画素を分類する。参照画素の分類の詳細については、図4〜10を用いて後述する。
分類部201は、複数の参照画素を複数のグループに分類した場合、参照画素がどのグループに属するかを示す分類情報をフィルタ決定部202に出力する。
フィルタ決定部202は、分類情報を取得すると、分類された各グループに対して異なるフィルタを決定する。フィルタ決定手段202は、例えば、グループに含まれる参照画素が参照される可能性が高いほど、通過帯域の広いLPFに決定する。また、フィルタ決定部202は、ノイズ除去フィルタを、参照される可能性が最も高い参照画素を含むグループに決定してもよい。フィルタ決定部202の詳細についても後述する。
フィルタ決定部202は、どのグループにどのフィルタを決定したかを示すフィルタ情報をフィルタリング部203に出力する。
フィルタリング部203は、復号画像記憶部109から参照画素の画素値を取得する。また、フィルタリング部203は、フィルタ決定部202からフィルタ情報を取得し、どの参照画素にどのフィルタを用いるかを把握する。
フィルタリング部203は、フィルタ決定部202により決定されたフィルタを用いて、各グループに含まれる参照画素の画素値をフィルタリングする。フィルタリング部203は、フィルタリング後の画素値を生成部204に出力する。
生成部204は、フィルタリング部203から取得したフィルタリング後の画素値を用いて、画面内予測の予測画像を生成する。生成部204は、例えば、予測画像生成部205、予測モード決定部206を有する。
予測画像生成部205は、フィルタリング後の画素値を予測値として、画面内予測の予測方向に対応する予測モード毎に、予測画像を生成する。
予測モード決定部206は、予測モード毎の予測画像と、処理対象ブロックとの差が最も小さい予測モードを決定する。予測モード決定部206は、決定された予測モードの予測画像を、予測画像選択部114に出力する。
<参照画素の分類>
次に、分類部201による参照画素の分類について説明する。参照画素の例として、H.264/AVCの8×8のブロック(図1参照)を用いて説明するが、このブロックサイズに限らず、4×4、16×16などのブロックサイズでもよい。また、輝度及び色差いずれのブロックに対しても適用できる。また、正方形のブロックに限らず、例えば8×16などの長方形のブロックに対しても適用できる。
まず、H.264/AVCの場合の予測方向について説明する。図4は、8×8の画面内予測符号化の予測方向を示す図である。図4に示す例では、各予測モードに対応する予測方向を示している。図4に示す灰色丸が参照画素を示し、白丸が処理対象画素を示す。矢印が予測方向を示す。
例えば、予測モード0では、参照画素Pを、同じ列の画素(N0、N1、・・・、N7)の予測値とすることを示す。
以下では、図4に示す予測方向を用いるが、図4に示す予測方向に限られず、他の予測方向がある場合でも、以下に説明する分類方法を同様に適用することができる。
(予測方向の数に基づく分類)
分類部201は、例えば、参照される予測方向の数に基づいて参照画素を分類する。この分類方法は、参照される予測方向の数が多い場合、そのいずれかの方向にエッジが存在するとき、LPFにより画面内予測の効率が低下するという考えに基づく。
図5は、H.264/AVCにおける参照画素Yを参照する予測方向を示す図である。図5に示すように、参照画素Yは、図4に示す予測モード3の予測方向の場合に参照される。
図6は、H.264/AVCにおける参照画素Uを参照する予測方向を示す図である。図6に示すように、参照画素Uは、図4に示す予測モード3、7の予測方向の場合に参照される。
図7は、H.264/AVCにおける参照画素Qを参照する予測方向を示す図である。図7に示すように、参照画素Qは、図4に示す予測モード0、3、7の予測方向の場合に参照される。
図8は、H.264/AVCにおける参照画素Mを参照する予測方向を示す図である。図8に示すように、参照画素Mは、図4に示す予測モード0、3、4、5、6、7の予測方向の場合に参照される。
例えば、参照画素Mについては、図8に示す6方向のいずれかにエッジが存在する場合に、LPFを適用すると画面内予測の効果が低下する要因となる。
また、参照画素Uについては、図6に示す2方向のいずれかにエッジが存在する場合に、LPFを適用すると画面内予測の効果が低下する要因となるが、その他の予測方向では参照されないため、LPFの有無による影響が小さい。
ここで、画像中に存在するエッジの方向がランダムであると仮定すると、画面内予測の予測方向と、エッジの方向とが一致する確率は、参照画素Mの方が、参照画素Uよりも3(=6(参照画素Mの予測方向数)/2(参照画素Uの予測方向数))倍高いことになる。
よって、分類部201は、参照される予測方向の数に基づいて、参照画素を以下のように分類することができる。
グループ1:V,W,X,Y
グループ2:A,R,S,T,U
グループ3:H,I,Q
グループ4:B,C,D,F,J
グループ5:E,G,L,N,P
グループ6:K,M,O
グループ1は、参照される予測方向の数が1であり、グループ2は、参照される予測方向の数が2であり、グループ3は、参照される予測方向の数が3であり、グループ4は、参照される予測方向の数が4であり、グループ5は、参照される予測方向の数が5であり、グループ6は、参照される予測方向の数が6である。
また、分類部201は、グループ1〜6のうち、複数のグループをまとめて分類してもよい。例えば、分類部201は、グループ1と2とを1つのグループ、グループ3と4とを1つのグループ、グループ5と6とを1つのグループにしてもよい。
これにより、予測方向と一致する方向のエッジが存在する確率を考慮して、参照画素の分類を行うことができる。
なお、符号化標準技術のブロックサイズや予測方向によって、分類されるグループ数が異なるが、ブロックサイズやどんな予測方向があるかが決まれば、分類部201は、参照画素の分類を一意に行うことができる。
(隣接するか否かに基づく分類)
分類部201は、例えば、処理対象ブロックに隣接するか否かで参照画素を分類する。この分類方法は、処理対象ブロックに直接隣接する参照画素が、直接隣接しない参照画素よりも、参照される予測方向が多いという考えに基づく。
図9は、参照画素を2分類する一例を示す図である。図9に示す例では、分類部201は、処理対象ブロックに直接隣接するグループ2、直接隣接しないグループ1に分類する。
グループ1:処理対象ブロックに直接隣接しない参照画素
グループ2:処理対象ブロックに直接隣接する参照画素
図10は、参照画素を3分類する一例を示す図である。図10に示す例では、分類部201は、処理対象ブロックに隣接するグループ2とグループ3と、処理対象ブロックに直接隣接しないグループ1とに分類する。
グループ1:処理対象ブロックに直接隣接しない参照画素
グループ2:処理対象ブロックの左上付近に直接隣接する参照画素
グループ3:処理対象ブロックに直接隣接し、グループ2以外の参照画素
グループ2は、例えば、図1に示すH,I,Jの参照画素とする。分類部201は、処理対象ブロックに直接隣接する参照画素及び/又は処理対象ブロックに直接隣接しない参照画素を、さらに複数のグループに分類してもよい。
これにより、参照される可能性に基づいて、参照画素を複数のグループに簡易的に分類することができる。
分類部201は、予測方向の数に基づく分類、隣接するか否かに基づく分類のいずれかの分類方法で、参照画素を分類すればよい。また、分類部201は、符号化レートなどに基づいて、どちらの分類を行うかを選択して分類することも可能である。
<フィルタ決定>
次に、フィルタ決定部202によるフィルタ決定について説明する。フィルタ決定部202は、グループ内の参照画素が参照される可能性が高いほど、エッジ成分の変化が小さいフィルタに決定する。
(LPF)
フィルタ決定部202は、例えば、グループ内の参照画素が参照される可能性が高いほど、通過帯域の広いLPFになるようフィルタを決定する。フィルタ決定部202は、例えば、分類部201により分類されたグループの番号が小さいほど、通過帯域の狭いフィルタにするよう決定する。
例えば、分類部201は、予測方向の数に基づく分類を行ったとする。この場合、フィルタ決定部202は、グループ1と2に対し、[1/4,1/2,1/4]のLPFに決定し、グループ3と4に対し、[1/8,3/4,1/8]のLPFに決定し、グループ5と6に対し、[1/16,7/8,1/16]のLPFに決定する。
例えば、分類部201は、隣接するか否かに基づいて3つのグループに分類を行ったとする。この場合、フィルタ決定部202は、グループ1に対し、[1/4,1/2,1/4]のLPFに決定し、グループ2に対し、[1/8,3/4,1/8]のLPFに決定し、グループ3に対し、[1/16,7/8,1/16]のLPFに決定する。上記LPFは、あくまでも一例であり、タップ数や通過帯域については適宜変更してもよい。
つまり、参照される可能性が高い参照画素では、通過帯域の広いLPFを用いる。通過帯域の広いLPFは、通過帯域の狭いLPFと比較し、着目画素値の変化が小さい。そのため、参照される可能性が高い参照画素は、エッジが存在した場合でも予測効率の低下を小さくすることができる。
一方、参照される可能性が低い参照画素は、適用される予測方向と一致するエッジが存在する確率が低いため、通過帯域の狭いLPFを用いる。これにより、十分なノイズの低減効果を期待することができる。
(LPF+ノイズ除去フィルタ)
フィルタ決定部202は、例えば、参照される可能性が一番高い参照画素を含むグループに対し、ノイズ除去フィルタを決定し、その他のグループに対して、グループ内の参照画素が参照される可能性が高いほど、通過帯域の広いLPFになるようフィルタを決定する。
フィルタ決定部202は、例えば、分類部201により分類されたグループの番号が一番大きいグループに対してノイズ除去フィルタに決定し、その他のグループについてはグループの番号が小さいほど、通過帯域の狭いフィルタにするよう決定する。
ノイズ除去フィルタとは、例えば、メディアンフィルタ、移動平均フィルタ、εフィルタ、MTM(Modified Trimmed Mean)フィルタなどがある。例えば、ノイズ除去フィルタとして、フィルタのタップ数が少ないメディアンフィルタが計算量の観点から好適である。
例えば、分類部201は、予測方向の数に基づく分類を行ったとする。この場合、フィルタ決定部202は、グループ1と2に対し、[1/4,1/2,1/4]のLPFに決定し、グループ3と4に対し、[1/8,3/4,1/8]のLPFに決定し、グループ5と6に対し、3タップのメディアンフィルタに決定する。
例えば、分類部201は、隣接するか否かに基づいて3つのグループに分類を行ったとする。この場合、フィルタ決定部202は、グループ1に対し、[1/4,1/2,1/4]のLPFに決定し、グループ2に対し、[1/8,3/4,1/8]のLPFに決定し、グループ3に対し、3タップのメディアンフィルタに決定する。上記LPFは、あくまでも一例であり、タップ数や通過帯域については適宜変更してもよい。
一般的にノイズ除去フィルタは、LPFよりもエッジの値の変化が小さいため、通過帯域を広くしたLPFと同様の効果が得られる。また、ノイズ除去フィルタは、LPFよりも計算量は多くなる場合があるが、例えば3タップのメディアンフィルタを用いた場合にはLPFからの計算量の増加は少ない。フィルタ決定部202は、上述したように、参照される予測方向の数が多いほど通過帯域を広くし、参照される予測方向の数が小さいほど通過帯域を狭くしたフィルタのセットを複数種類用意しておく。そして、予め各種の絵柄に応じたそれぞれのフィルタセットの効果を確かめておくことで、入力動画像の種類が与えられれば、フィルタ決定部202は、使用するフィルタセットを決めることができる。また、フィルタ決定部202は、入力動画像の絵柄の種類の判別に応じて、適応的にフィルタセットを変えてもよい。
よって、実施例1では、参照画素毎のエッジ判定を行う必要がなく、参照画素の分類に応じたフィルタリングを行うことで、エッジを維持する効果と、ノイズを低減する効果との組み合わせにより、画面内予測の予測性能を向上させることが可能となる。
<実験結果>
次に、HEVCの規格化作業で用いられているソフトウェアエンコーダHM3.0と、HM3.0に実施例1の方式を実装した提案方式とで行った符号化実験について説明する。
実施例1の方式とは、処理対象ブロックに直接隣接するか否かにより2つのグループに分類し(図9参照)、グループ1に[1/4,1/2,1/4]のLPF、グループ2に[1/8,3/4,1/8]のLPFを適用する。
実験では、画像A〜Dに対し、それぞれ符号化を行い、HM3.0をアンカーとし、提案方式の性能をBD−RATEで表す。
画像A:街の風景
画像B:室内の人物の映像
画像C:走る馬
画像D:屋内の人物の映像
BD−RATEは、「G. Bjontegaard, "Calculation of average PSNR differences between RD-Curves," ITU-T SG16 Q.6 Document, VCEG-M33,April 2001」に提案された符号化性能を比較する指標である。BD−RATEの値が0の場合はアンカーと提案方式の性能は等しく、BD−RATEの値が小さいほどアンカーより提案方式の性能が優れている。
図11は、実験結果を示す図である。図11に示すように、提案方式では、HM3.0よりも符号化性能が向上していることが分かる。よって、実施例1では、計算量の増加を抑えつつ、画面内予測の予測性能を向上させることが可能となる。
<動作>
次に、実施例1における画像符号化装置100の動作について説明する。図12は、実施例1におけるが画面内予測処理の一例を示すフローチャートである。
図12に示すステップS101で、分類部201は、参照される可能性に基づいて参照画素を複数のグループに分類する。例えば、分類部201は、処理対象ブロックのブロックサイズなどに応じて分類方法を決めておき、この分類方法により分類を行えばよい。分類方法は、前述した通り、予測方向の数に基づく分類か、隣接するか否かに基づく分類かのいずれかを用いればよい。
ステップS102で、フィルタ決定部202は、分類部201により決定されたグループに応じて異なるフィルタを決定する。フィルタ決定部202は、例えば、グループ内の参照画素が参照される可能性が高いほど、通過帯域の広いLPFに決定する。
ステップS103で、フィルタリング部203は、フィルタ決定部202により決定されたフィルタを用いて、参照画素の画素値をフィルタリングする。
ステップS104で、生成部204は、複数の予測モードに対応する予測画像を生成し、最適な予測モードを決定する。生成部204は、決定された予測モードの予測画像を予測画像選択部114に出力する。
以上、実施例1によれば、計算量の増加を抑えつつ、画面内予測の予測効率を向上させることができる。
[実施例2]
図13は、実施例2における画像符号化装置300の構成の一例を示すブロック図である。画像符号化装置300は、上述した実施例1で説明した画像符号化処理をソフトウェアで実装した装置の一例である。
図13に示すように、画像符号化装置300は、制御部301、主記憶部302、補助記憶部303、ドライブ装置304、ネットワークI/F部306、入力部307、表示部308を有する。これら各構成は、バスを介して相互にデータ送受信可能に接続されている。
制御部301は、コンピュータの中で、各装置の制御やデータの演算、加工を行うCPUである。また、制御部301は、主記憶部302又は補助記憶部303に記憶されたフィルタ処理を含む画像符号化処理のプログラムを実行する演算装置である。制御部301は、入力部307や記憶装置からデータを受け取り、演算、加工した上で、表示部308や記憶装置などに出力する。
制御部301は、フィルタ処理を含む画像符号化処理のプログラムを実行することで、各実施例で説明したフィルタ処理を実現することができる。
主記憶部302は、ROM(Read Only Memory)やRAM(Random Access Memory)などである。主記憶部302は、制御部301が実行する基本ソフトウェアであるOS(Operating System)やアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。
補助記憶部303は、HDD(Hard Disk Drive)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。
ドライブ装置304は、記録媒体305、例えばフレキシブルディスクからプログラムを読み出し、記憶装置にインストールする。
また、記録媒体305に、所定のプログラムを格納し、この記録媒体305に格納されたプログラムはドライブ装置304を介して画像符号化装置300にインストールされる。インストールされた所定のプログラムは、画像符号化装置300により実行可能となる。
ネットワークI/F部306は、有線及び/又は無線回線などのデータ伝送路により構築されたLAN(Local Area Network)、WAN(Wide Area Network)などのネットワークを介して接続された通信機能を有する周辺機器と画像符号化装置300とのインターフェースである。
入力部307は、カーソルキー、数字入力及び各種機能キー等を備えたキーボード、表示部308の表示画面上でキーの選択等を行うためのマウスやスライスパット等を有する。また、入力部307は、ユーザが制御部301に操作指示を与えたり、データを入力したりするためのユーザインターフェースである。
表示部308は、CRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)等により構成され、制御部301から入力される表示データに応じた表示が行われる。
なお、図2に示す復号画像記憶部109は、例えば主記憶部302又は補助記憶部303により実現され、図2に示す復号画像記憶部109以外の構成は、例えば制御部301及びワークメモリとしての主記憶部302により実現されうる。
画像符号化装置300で実行されるプログラムは、実施例1で説明した各部を含むモジュール構成となっている。実際のハードウェアとしては、制御部301が補助記憶部303からプログラムを読み出して実行することにより上記各部のうち1又は複数の各部が主記憶部302上にロードされ、1又は複数の各部が主記憶部302上に生成されるようになっている。
このように、上述した実施例1で説明した画面内予測処理は、コンピュータに実行させるためのプログラムとして実現されてもよい。このプログラムをサーバ等からインストールしてコンピュータに実行させることで、前述したフィルタ処理を実現することができる。
また、このプログラムを記録媒体305に記録し、このプログラムが記録された記録媒体305をコンピュータや携帯端末に読み取らせて、前述したフィルタ処理を実現させることも可能である。なお、記録媒体305は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。また、上述した各実施例で説明したフィルタ処理は、1つ又は複数の集積回路に実装してもよい。
なお、実施例では、画像符号化装置を例にして説明したが、複数の予測モードを用いる画面内予測を行う画像復号装置でも同様に適用することができる。画像符号化装置及び画像復号装置をまとめて画像処理装置と呼ぶ。また、上記実施例では、H.264/AVCを例に説明したが、参照画素に対して複数の予測方向を用いて画面内予測を行う画像処理技術であれば適用できる。
以上、各実施例について詳述したが、特定の実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、上記変形例以外にも種々の変形及び変更が可能である。
100、300 画像符号化装置
101 予測画像生成部
102 直交変換部
103 量子化部
104 エントロピー符号化部
105 逆量子化部
106 逆直交変換部
107 復号画像生成部
108 デブロッキングフィルタ部
109 復号画像記憶部
110 イントラ予測部
111 インター予測部
112 動きベクトル計算部
113 符号化制御及びヘッダ生成部
114 予測画像選択部
201 分類部
202 フィルタ決定部
203 フィルタリング部
204 生成部
205 予測画像生成部
206 予測モード決定部
301 制御部
302 主記憶部
303 補助記憶部
304 ドライブ装置
306 ネットワークI/F部
307 入力部
308 表示部

Claims (7)

  1. 複数の予測モードに対応する予測方向を用いて画面内予測を行う画像処理装置であって、
    参照される可能性に基づいて複数の参照画素を複数のグループに分類する分類部と、
    前記分類部により分類された各グループに対して異なるフィルタを決定するフィルタ決定部と、
    前記複数の予測モードの全てに対し、前記フィルタ決定部により決定されたフィルタを用いて、前記各グループに含まれる前記参照画素の画素値にフィルタリングを行うフィルタリング部と、
    前記フィルタリング部によるフィルタリング後の画素値を用いて、前記画面内予測の予測画像を生成する生成部と、
    を備える画像処理装置。
  2. 前記分類部は、
    参照される予測方向数の数に基づいて前記複数の参照画素を分類する請求項1記載の画像処理装置。
  3. 前記分類部は、
    処理対象ブロックに隣接するか否かで前記複数の参照画素を分類する請求項1記載の画像処理装置。
  4. 前記分類部は、
    前記処理対象ブロックに隣接する参照画素、又は前記処理対象ブロックに隣接しない画素をさらに複数のグループに分類する請求項3記載の画像処理装置。
  5. 前記フィルタ決定部は、
    前記グループ内の参照画素が参照される可能性が高いほど、通過帯域の広いローパスフィルタに決定する請求項1乃至4いずれか一項に記載の画像処理装置。
  6. 前記フィルタ決定部は、
    参照される可能性が最も高い参照画素を含む第1グループに対して、ノイズ除去フィルタに決定し、前記第1グループ以外のグループに対して、該グループ内の参照画素が参照される可能性が高いほど、通過帯域の広いローパスフィルタに決定する請求項1乃至4いずれか一項に記載の画像処理装置。
  7. 複数の予測モードに対応する予測方向を用いて画面内予測を行う処理をコンピュータに実行させるためのプログラムであって、
    前記コンピュータに、
    参照される可能性に基づいて複数の参照画素を複数のグループに分類する分類ステップと、
    前記分類ステップにより分類された各グループに対して異なるフィルタを決定するフィルタ決定ステップと、
    前記複数の予測モードの全てに対し、前記フィルタ決定ステップにより決定されたフィルタを用いて、前記各グループに含まれる前記参照画素の画素値にフィルタリングを行うフィルタリングステップと、
    フィルタリング後の画素値を用いて、前記画面内予測の予測画像を生成する生成ステップとを実行させるためのプログラム。
JP2011231113A 2011-10-20 2011-10-20 画像処理装置及びプログラム Active JP5789172B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011231113A JP5789172B2 (ja) 2011-10-20 2011-10-20 画像処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011231113A JP5789172B2 (ja) 2011-10-20 2011-10-20 画像処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2013090253A JP2013090253A (ja) 2013-05-13
JP5789172B2 true JP5789172B2 (ja) 2015-10-07

Family

ID=48533725

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011231113A Active JP5789172B2 (ja) 2011-10-20 2011-10-20 画像処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5789172B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112714318B (zh) * 2020-12-09 2023-11-07 上海顺久电子科技有限公司 一种图像数据的压缩方法及其压缩装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010183162A (ja) * 2009-02-03 2010-08-19 Mitsubishi Electric Corp 動画像符号化装置
JP5597968B2 (ja) * 2009-07-01 2014-10-01 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
CA2784291A1 (en) * 2009-12-18 2011-06-23 Sharp Kabushiki Kaisha Image filter, encoding device, decoding device, and data structure
JP2011139208A (ja) * 2009-12-28 2011-07-14 Sony Corp 画像処理装置および方法

Also Published As

Publication number Publication date
JP2013090253A (ja) 2013-05-13

Similar Documents

Publication Publication Date Title
US11381844B2 (en) Method and apparatus for encoding/decoding images using a prediction method adopting in-loop filtering
TWI632805B (zh) 視訊解碼方法、視訊編碼方法、視訊解碼裝置、視訊編碼裝置以及非暫態的電腦可讀取儲存媒體
JP2023179782A (ja) フレーム内予測方法及び装置
JP5684407B2 (ja) ブロッキングアーチファクトを低減する方法、デブロッキングフィルタユニット、符号器、復号器、ユーザ機器、ネットワーク装置、コンピュータプログラム及びコンピュータプログラム記憶媒体
US20210360271A1 (en) Inter prediction in exponential partitioning
JP2023512898A (ja) ビデオフィルタリングにおけるオフセットの方法及び装置
CN113647104A (zh) 在以自适应区域数量进行的几何分区中的帧间预测
JP2014096638A (ja) 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム
JP2024506213A (ja) 符号化復号方法、装置及びそのデバイス
JP5789172B2 (ja) 画像処理装置及びプログラム
JP6200220B2 (ja) 画像処理装置、符号化装置、復号装置、及びプログラム
TWI803709B (zh) 圖像編碼裝置、圖像解碼裝置、其等之控制方法及程式
JP2013207402A (ja) 画像符号化装置及びプログラム
JP5937926B2 (ja) 画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム
TW202038612A (zh) 圖像編碼裝置、圖像編碼方法、圖像解碼裝置、圖像解碼方法
WO2013145174A1 (ja) 動画像符号化方法、動画像復号方法、動画像符号化装置及び動画像復号装置
KR20200004348A (ko) 타겟 영역 수정을 통해 비디오 신호를 처리하는 방법 및 장치
JP2013102305A (ja) 画像復号装置、画像復号方法、プログラム及び画像符号化装置
JP6101067B2 (ja) 画像処理装置及び画像処理プログラム
JP2014143515A (ja) 画像処理装置及び画像処理プログラム
JP6917718B2 (ja) 予測装置、符号化装置、復号装置、及びプログラム
JP2024125778A (ja) 画像符号化装置、画像符号化方法、およびプログラム
TW202209894A (zh) 適應性幾何分割的方法及系統
JP2023521701A (ja) ビデオコーディングのための方法および装置
JP2013098970A (ja) 画像復号装置、逆直交変換制御方法、プログラム及び画像符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140901

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150707

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150731

R150 Certificate of patent or registration of utility model

Ref document number: 5789172

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250