JP5770647B2 - 画像符号化方法,画像符号化装置,画像復号方法,画像復号装置およびそれらのプログラム - Google Patents

画像符号化方法,画像符号化装置,画像復号方法,画像復号装置およびそれらのプログラム Download PDF

Info

Publication number
JP5770647B2
JP5770647B2 JP2012007627A JP2012007627A JP5770647B2 JP 5770647 B2 JP5770647 B2 JP 5770647B2 JP 2012007627 A JP2012007627 A JP 2012007627A JP 2012007627 A JP2012007627 A JP 2012007627A JP 5770647 B2 JP5770647 B2 JP 5770647B2
Authority
JP
Japan
Prior art keywords
pattern
intensity
edge
undulation
class set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012007627A
Other languages
English (en)
Other versions
JP2013150084A (ja
Inventor
誠明 松村
誠明 松村
誠之 高村
誠之 高村
清水 淳
淳 清水
裕尚 如澤
裕尚 如澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012007627A priority Critical patent/JP5770647B2/ja
Publication of JP2013150084A publication Critical patent/JP2013150084A/ja
Application granted granted Critical
Publication of JP5770647B2 publication Critical patent/JP5770647B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は,画像を符号化する際に,画像撮影時のノイズや劣化画像の劣化を軽減する画像処理技術に関するものである。
“MPEG”や“VCEG”にて現在国際標準化活動が行われている次世代映像符号化標準方式の“High Efficiency Video Coding”の雛形(Test Model)である“HM”には,インループフィルタに符号化歪の除去を目的としたDeblocking Filter, Sample Adaptive Offset, Adaptive Loop Filter の計3種類のフィルタが搭載されている(非特許文献1参照)。中でもAdaptive Loop Filterは,符号化対象フレームを所定の領域に分類し,その分類された領域ごとに復号画像と原画像の二乗誤差を最小化するフィルタであり,符号化効率改善の寄与率が高い。Adaptive Loop Filterを,以下,ALFという。
ALFはタップ形状として2種類(クロス型とスター型)を持っており,二乗誤差最小化フィルタの係数として,クロス型は9個,スター型は10個が必要とされる。また,ALFはフィルタモードとして Region Adaptive(RA)とBlock Adaptive(BA)の2モードがある。それぞれの特徴を以下に記す。
[RAモード]:符号化対象フレームを空間方向に縦横4分割して計16個の領域に分割し,それぞれの領域ごとにタップの重みを算出する。
[BAモード]:符号化対象フレームを4×4ブロック単位に分割し,それぞれにおいてアクティビティと呼ばれる指標とエッジの特徴の計2つの指標を用いた分類を行う。アクティビティを指標とした分類では,ブロック内の起伏の強度を用いて5段階に分類する。エッジの特徴を指標とした分類では,エッジの向き(水平/垂直/それ以外)の方向により,Vertical, Horizontal, Other の3種類に分類する,それぞれ分類された領域ごとにタップの重みを算出する。
符号化装置では,符号化対象画像に対して前記2種類のタップ形状と2つのフィルタモードからなる組み合わせを実行した上で,符号化効率が高い手法が選択される。以下,アクティビティを指標とした分類をアクティビティ分類,エッジの特徴を指標とした分類をエッジ分類と呼ぶ。
従来手法におけるアクティビティ分類の導出手法は,水平エッジの強度と垂直エッジの強度を加算した値に対して,所定の閾値を用いて5段階に分類される。後述する本発明の実施例においても,アクティビティ分類の手法は従来手法と同等のものを用いるものとする。また,従来手法におけるエッジ分類の導出手法は,上記水平エッジの強度と垂直エッジの強度を比較し,強度の大小関係から3段階に分類される。
ALFでは,復号装置に二乗誤差最小化フィルタの係数を伝送するため,BAモードが選択された場合,クロス型では計135係数,スター型では計150係数の符号化/復号が必要になる。以下,領域ごとに算出される9個(クロス型)もしくは10個(スター型)の二乗誤差最小化フィルタの係数群を係数セットと呼ぶ。また,これら係数セットの数を減らす提案として,アクティビティ分類を5段階から4段階に削減し,エッジ分類を3段階から2段階に削減した計8個の係数セットに削減する手法(非特許文献2参照)が報告されている。
〔映像符号化におけるALF処理部の構成(従来手法)〕
図22は,従来手法における映像符号化装置のALF処理部の構成例を示す図である。ALF処理部500は,RAモード領域決定部501と,BAモード領域決定部502と,タップ形状およびRA/BA決定部503と,CU(Coding Unit) 適応モード決定部504とを備える。
図22の映像符号化装置におけるALF処理部500は,“復号画像”,“CU情報”,“原画像”を入力とし,複数パターンのALFを適用した後,最適なALFのパターンで符号化されたときの“ALFオーバーヘッド”と“出力画像”を出力する。
RAモード領域決定部501は,画面を空間方向に16分割して,各画素に割り当てる係数セットの番号を設定した後,その“画素ごとの係数セットの番号”を出力する。BAモード領域決定部502は,所定サイズのブロックごとに装置側で定められたアクティビティ分類の段階(5段階)とその導出手法・エッジ分類の段階(3段階)とその導出手法を用いて“画素ごとの係数セット番号”を出力する。各分類/導出の手法は,非特許文献1に記載の手法を用いる。
タップ形状およびRA/BA決定部503は,クロス型とスター型の2種類のタップとBA/RAそれぞれ4通りのALFを適用してRD最適化を行い,最適なタップとフィルタモードを決定し,“タップ形状”,“フィルタモード”,“画素ごとの係数セット番号”を出力する。CU適応モード決定部504では,CUごとにALFの適用/非適用を切り替える手法を試行し,同時に係数群の再構成を行いながらRD最適化を行い,その最適な手法を用いた際の“出力画像”と“ALFオーバーへッド”を出力する。
〔映像符号化におけるALF処理手順(従来手法)〕
図23は,図22に示す従来の映像符号化装置内のALF処理部500の処理フローチャートである。この処理手順では,“復号画像”,“CU情報”,“原画像”を入力とし,“ALFオーバーヘッド”と“出力画像”を出力する。機能は,最適なタップ形状,フィルタモード,フィルタ係数,CUごとのALF適応範囲を決定し,復号画像に対してALFを適用することである。
・ステップS1001:画面を16分割してRAモードの領域を決定する。各領域に該当する画素には適用される係数セットの番号が付与され,これら画素ごとの係数セット番号を出力する。
・ステップS1002:アクティビティ分類の段階/導出方法およびエッジ分類の段階/導出方法を用いてBAモードの領域を決定する。各領域に該当する画素には適用される係数セットの番号が付与され,これら画素ごとの係数セット番号を出力する。
・ステップS1003:タップ形状(クロス型/スター型)とフィルタモード(BA/RA )の組み合わせを用いて全パターンのALF出力画像からRD最適化を行い,最良のタップ形状とフィルタモードを導出する。
・ステップS1004:CUごとにALFの適用/非適用を切り替え,最適な分割をRD最適化によって決定する。
・ステップS1005:出力画像とALFオーバーヘッドを出力する。
〔映像復号におけるALF処理部の構成(従来手法)〕
図24は,従来手法における映像復号装置のALF処理部の構成例を示す図である。ALF処理部600は,RAモード領域決定部601と,BAモード領域決定部602と,CU適用領域決定部603と,ALF適用部604とを備える。
図24のALF処理部600は,“ALFオーバーヘッド”,“復号画像”,“CU情報”を入力し,ALF適用後の“出力画像”を出力する。
RAモード領域決定部601,BAモード領域決定部602は,図22におけるRAモード領域決定部501,BAモード領域決定部502と同等の機能を有する。CU適用領域決定部603は,“CUごとのALF適用フラグ群”,“CU情報”を入力とし,“画素ごとのALF適用情報”を出力する。ALF適用部604は,“復号画像”,“画素ごとの係数セット番号”,“画素ごとのALF適用情報”,“係数セット群”を入力とし,ALF適用後の“出力画像”を出力する。
〔映像復号におけるALF処理手順(従来手法)〕
図25は,図24に示す従来の映像復号装置内のALF処理部600の処理フローチャートである。この処理手順では,“復号画像”,“CU情報”,“ALFオーバーヘッド”を入力とし,“出力画像”を出力する。機能は符号化装置側で決定されたタップ形状,フィルタモード,フィルタ係数,CUごとのALF適応範囲を用いて復号画像に対してALFを適用することである。
・ステップS1101:復号画像とALFオーバーヘッドを取得する。
・ステップS1102:フィルタモードに応じた分岐を行い,RAモードであれば,ステップS1103を実行し,BAモードであればステップS1104を実行する。
・ステップS1103:画面を16分割してRAモードの領域を決定する。各領域に該当する画素には,適用される係数セットの番号が付与され,これら画素ごとの係数セット番号を出力する。
・ステップS1104:アクティビティ分類の段階/導出方法およびエッジ分類の段階/導出方法を用いてBAモードの領域を決定する。各領域に該当する画素には,適用される係数セットの番号が付与され,これら画素ごとの係数セット番号を出力する。
・ステップS1105:CUごとにALFの適用/非適用を切り替え,画素ごとのALF適用情報を出力する。
・ステップS1106:ALFを適用して出力画像を出力する。
Benjamin Bross, Woo-Jin Han, Jens-Rainer Ohm, Gary J.Sullivan, Thomas Wiegand, "WD4: Working Draft 4 of High-Efficiency Video Coding", JCTVC-F803_d6.doc Joint Collaborative Team on Video Coding(JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 6th Meeting: Torino, IT, 14-22 July, 2011, pp. 146-152. P.Lai, F.C.A.Fernandes, I.-K.Kim,"CE8 Subtest a, Tool 3: Block-based filter adaptation with 8 initial filter classes(HV8) ", Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 7th Meeting: Geneva, CH, 21-30 November, 2011.
BAモードにおける従来手法の問題点を以下に列挙する。
[問題点1]
すべてのアクティビティ分類に対して,等しくN段階(非特許文献1,2では,N=3,2)にエッジ分類されるため,アクティビティが低い領域では発生符号量に無駄が多い。
アクティビティが低い領域としては,周辺画素値に大きな変化が発生していない平坦な領域もしくはなだらかに変化している領域がこれに該当する。これらの領域に対してALFを適用しても周辺画素に変化がないため,フィルタ前後で大きな画素値変化は発生せず,アクティビティが高い領域と比較して大きな画質改善効果は期待できない。従来手法では,これらアクティビティが低い領域に対しても高いアクティビティの領域と同等に係数セットを割り当てているため,発生符号量の増加を誘発している。
[問題点2]
すべてのアクティビティ分類に対して等しくN段階にエッジ分類されるため,アクティビティが高い領域では十分な画質改善が行えない。
アクティビティが高い領域としては,明確なテクスチャエッジ周辺や歪が大きい領域がこれに該当する。これらの領域に対してはALF適用前後で大きな画素値変化があるため,画質の改善効果が高い。しかし,従来手法ではエッジ分類として3段階しか適用できず,例えばエッジ分類のOther には,左右斜め方向に相関が強いエッジの特徴を持つブロックも,ホワイトノイズのような特徴を持つブロックも割り当てられるため,エッジの特徴に応じた二乗誤差を十分に最小化するフィルタが設計できない。そのため,十分な画質改善が行えない。
[問題点3]
周辺画素値にほとんど変化がない画素に対しても常にALFが適用されるため,復号装置の演算に無駄が多い。
ALFの処理手順として,符号化対象画像の全体にALFを適用するモードと,発生符号量は著しく増加するものの,CU(Coding Unit) 単位でALFの適用/非適用を明示するモードが用意されている。前者の場合,上記問題点1に記載の通り,アクティビティが低い領域に対しては大きな画質改善効果は期待できないが,従来手法ではアクティビティがどんなに低い領域に対しても,必ず復号装置でALFの処理が行われるため,復号装置の演算に多くの無駄を含む。
ただし,上記問題点1〜3は,あらゆる映像に対して定性的に当てはまることではない。そのため,従来手法を包含し,かつ映像に合わせて柔軟に対応できる手法が求められる。
本発明は,上記課題を解決するため,フィルタ対象画素周辺の画素値と各画素に対応した重みの線形結合により入力画像と原画像の二乗誤差を最小化するフィルタを用いる画像符号化(または画像復号)において,入力画像をブロックに細分化し,ブロック内の起伏の強度に応じて複数のパターン(段階ともいう)に分類し,前記起伏の強度に応じた各パターンに対してさらにエッジの特徴に応じて1つ以上のパターン(段階)に分類し,前記起伏の強度に応じた各パターンおよび前記エッジの特徴に応じた各パターンそれぞれに対して二乗誤差を最小化するフィルタを生成する手段を持ち,前記起伏の強度に応じたパターンごとに,前記エッジの特徴に応じた分類の数を可変とすることを特徴とする。
また,上記発明において,前記起伏の強度が低いパターンに対しては前記エッジの特徴に応じたパターン数を強度が高いパターンと比較して削減することを特徴とする。
また,上記発明において,前記起伏の強度が低いパターンに対しては前記エッジの特徴に応じたパターン数を零に設定し,フィルタを適用しないことを特徴とする。
また,上記発明において,前記起伏の強度が高いパターンに対しては前記エッジの特徴に応じたパターン数を強度が低いパターンと比較して増やすことを特徴とする。
また,上記発明において,前記起伏の強度に応じたパターンごとに割り当てられる前記エッジの特徴に応じたパターンのすべての合計数が所定の上限値を超えないように制限することを特徴とする。
本発明では,例えば符号化/復号装置に共通でエッジ分類に新たに下記の4パターンを追加する。
(1)None:当該領域の画素群にはALFフィルタを適用しない(係数セットは不要)
(2)Single:エッジの特徴による分類を行わず,当該領域の全ブロックに対して平均的に二乗誤差を最小化することを目的とした係数セット
(3)Diagonal right:右斜め方向のエッジの特徴を持つブロックに対して二乗誤差を最小化することを目的とした係数セット
(4)Diagonal left :左斜め方向のエッジの特徴を持つブロックに対して二乗誤差を最小化することを目的とした係数セット
ここで,エッジ分類パターンを増やすだけでは,係数セットの数が増加するため符号量が増加する上,例えば上記の None や Single のように他のパターンとの重複を許容しないパターンも存在する。そこで,図1(B)のように分類手法が1つ以上のエッジ分類パターンを保持するクラスセット(ClassSet)と呼ぶ構造を与える。
図1は,エッジ分類手法における選択自由度の例を示しており,図1(A)が従来手法,図1(B)が本実施形態の例を示している。ClassSetは,前記 None や Single のような重複を排除したエッジ分類パターンを保持し,対象領域の各ブロックを保持するエッジ分類パターンの何れのパターンに割り当てるかを決定する分類手法(例えば従来技術における水平エッジと垂直エッジの強度の比較からなる3段階のエッジ分類の導出手法に相当する手法) を保持しているものとする。これを用い,アクティビティ分類の段階ごとに任意のClassSetを割り当て,エッジ分類手法の数とパターンを選択できる自由度を持たせる。そのため,従来手法を確実に包含する手法が構築可能である。アクティビティ分類の段階ごとのClassSetは,後述するように,符号化装置ではALF処理部1103における最適ClassSet決定部205(図4)にて最適化され,復号装置ではALFオーバーヘッドからALF処理部3083(図8)にて導出される。
アクティビティ分類の段階ごとに,例えばClassSet(A〜E)の中からどの手法を適用するかを符号化装置にて最適化し,適用したClassSetを明示する番号を符号化/復号することで実現する。図1(B)におけるClassSet(A〜E)の5パターンの分類は一例であり,より多くのエッジの特徴に対応したClassSetを追加してもよい。
本手法を導入することによる従来手法との大きな違いは,符号化装置のALF処理部1103における最適ClassSet決定部205および復号装置のALF処理部3083におけるエッジ分類の段階/導出手法決定部405等の部分であるが,適用したClassSetを明示する番号を符号化/復号するため,符号化装置ではRD最適化を行うタップ形状およびRA/BA決定部203およびCU適応モード決定部204にてこれら符号を考慮して最適化/ALFオーバーヘッドを生成する部分が従来手法と異なる。また,復号装置ではALFオーバーヘッドからClassSetを明示する番号を抽出する部分が従来手法と異なる。
ClassSetを明示する手法として,アクティビティの段階ごとに番号を付与する手法や,代表的な組み合わせをあらかじめ生成しておき,その組み合わせを明示する番号を付与する手法などが考えられる。後述する本発明の実施形態の説明では,アクティビティの段階ごとに番号を付与する手法についてのみ詳細を説明する。しかし,他の番号を付与する手法でも実施可能である。
ただし,本アプローチの導入により,係数セットの数が設計された上限値を上回る可能性がある。すなわち,アクティビティ分類の5段階すべてのClassSetに,図1のA〜Eまでの5パターンの選択/適用を許容したままRD最適化を行うと,アクティビティ分類の5段階すべてに対して4つの係数セットを保持する ClassSet Eが適用される可能性がある。このとき,係数セットは20個必要になり,従来手法の15個を上回る。そのため15個の係数セットまでしか許容できない復号装置の場合には,最悪値として20個まで許容するように再設計し,回路規模を拡大しなければならない。
この新たな課題は,符号化装置のALF処理部1103における最適ClassSet決定部205にて係数セット数の上限を設定し,上限を超えないようにClassSetを最適化する手順を導入することで解決できる。
本発明によれば,映像符号化におけるALF処理において,N段階に等しくエッジ分類されていた既存手法に対して,最適ClassSet決定部は,アクティビティ分類の段階ごとに複数のエッジ分類手法を切り替える自由度を与える。これにより,アクティビティが低い領域に対してはエッジ分類の数が少ないClassSetを割り当て,アクティビティが高い領域に対してはエッジ分類の数が多いClassSetを割り当てることで,上記問題点1,2の解決を図る。
また,従来手法にはなかったALFの処理を省略するClassSetを適用することで,上記問題点3の解決を図る。ただし,従来手法よりエッジ分類の多いClassSetが多用されると,係数セットの数が設計された上限値を上回る可能性がある。そのため,最適ClassSet決定部に係数セット数上限値を入力として与えることで,設計された範囲内の結果を出力することを保証する。
エッジ分類手法における選択自由度の例を示す図である。 本発明を適用した映像符号化装置の構成例を示す図である。 映像符号化装置の処理フローチャートである。 本実施形態の映像符号化におけるALF処理部の構成例を示す図である。 本実施形態の映像符号化におけるALF処理部の処理フローチャートである。 本発明を適用した映像復号装置の構成例を示す図である。 映像復号装置の処理フローチャートである。 本実施形態の映像復号におけるALF処理部の構成例を示す図である。 本実施形態の映像復号におけるALF処理部の処理フローチャートである。 本実施形態を用いて発生符号量の削減を実現する最適化の処理フローチャートである。 本実施形態を用いて発生符号量を削減する例を示す図である。 本実施形態を用いて画質を改善する最適化の処理フローチャートである。 本実施形態を用いて画質を改善する例を示す図である。 本実施形態を用いて復号装置の演算量を削減する最適化の処理フローチャートである。 本実施形態を用いて復号装置の演算量を削減する例を示す図である。 本実施形態を用いてハードウェアの回路規模肥大化を抑制する最適化の処理フローチャートである。 本実施形態を用いて発生符号量を削減した結果の数値例を示す図である。 本実施形態を用いて復号装置の演算量を削減した結果の数値例を示す図である。 本実施形態を用いて画質を改善した結果の数値例を示す図である。 映像符号化装置をコンピュータとソフトウェアプログラムとを用いて実現する場合のシステムの構成例を示す図である。 映像復号装置をコンピュータとソフトウェアプログラムとを用いて実現する場合のシステムの構成例を示す図である。 従来技術の映像符号化におけるALF処理部の構成例を示す図である。 従来技術の映像符号化におけるALF処理部の処理フローチャートである。 従来技術の映像復号におけるALF処理部の構成例を示す図である。 従来技術の映像復号におけるALF処理部の処理フローチャートである。
以下,図面を用いながら,本発明の実施の形態を説明する。
〔映像符号化装置の構成〕
図2は,本発明を適用した映像符号化装置の構成例を示す図である。本発明は,例えば図2に示すような映像符号化装置に適用されるが,これは一例であり,本発明は必ずしも図2に示すような装置構成のものに限定されるわけではない。本実施形態は,特にALF処理部1103の部分が従来技術と異なる部分であり,他の部分は従来の一般的な映像符号化装置の構成と同様である。
図2の映像符号化装置は,符号化対象シーケンスを入力し,各フレームをブロックに分割してブロックごとに符号化し,そのビットストリームを符号化ストリームとして出力する。
符号化対象ブロックは,入力信号として減算器101に入力される。減算器101は,符号化対象ブロックと,イントラ予測部102もしくはインター予測部103の予測ブロックとの差分を求め,それを予測残差信号とする。変換部104は,予測残差信号に対する直交変換(DCT)等を行い,変換係数を出力する。量子化部105は,変換係数を量子化し,量子化後変換係数を出力する。
逆量子化部106では,量子化部105の出力である量子化後変換係数に対して逆量子化が行われ,逆変換部107では,変換部104による変換の逆変換が行われる。逆変換後の値は,加算器108にて前記予測ブロックと加算合成され,復号画像記憶部109に格納される。復号画像記憶部109の画像は,イントラ予測部102にて使用される。
当該フレームのすべてのブロックに対して上記処理が終了すると,インループフィルタ処理部110にて復号画像の符号化歪を除去する画像処理フィルタが施され,フィルタ後の復号画像はフレームバッファ111に格納される。ここで,インループフィルタ処理部110は,デブロッキングフィルタ処理部(以下,DF処理部)1 101,Sample Adaptive Offset処理部(以下,SAO処理部)1102,ALF処理部1103を内包しており,それぞれ定められた画像処理フィルタを実行する。フレームバッファ111の画像は,インター予測部103にて使用される。
イントラ予測部102,インター予測部103が出力する予測情報や量子化部105が出力する量子化後変換係数,インループフィルタ処理部110のオーバーヘッドは,エントロピー符号化部112に入力され,エントロピー符号化部112は,それらを符号化して符号化ストリームを出力する。符号化情報記憶部113は,復号装置側でも参照可能な符号化済みの各種ブロックサイズや予測情報,量子化後の係数値,インループフィルタオーバーヘッドなど,各種値を格納する記憶部であり,符号化情報記憶部113の情報は,映像符号化装置内の様々な処理部で引用される。
〔映像符号化の処理手順〕
図3は,図2に示す映像符号化装置の処理フローチャートである。この処理手順における入力は,符号化対象シーケンスであり,出力は,符号化ストリームである。機能は,符号化対象シーケンスを符号化ストリームに変換することである。
・ステップS101:符号化対象シーケンスを符号化対象画像ごとに読み込む。
・ステップS102:符号化対象画像をブロックごとに読み込む。
・ステップS103:読み込んだ符号化対象ブロックと予測ブロックとの差分をとり,差分ブロックを生成する。
・ステップS104:差分ブロックに対して直交変換を適用する。
・ステップS105:直交変換後の係数値を量子化する。
・ステップS106:量子化後の係数値を逆量子化する。
・ステップS107:逆量子化後の係数値を逆直交変換する。
・ステップS108:逆直交変換後の予測残差とステップS103の予測ブロックとを加算合成し,復号画像記憶部109に格納する。
・ステップS109:すべてのブロックの処理が終了したかの判定を行い,未処理のブロックがある場合には,ステップS102へ戻り,次のブロックについて同様に処理を繰り返す。
・ステップS110:すべてのブロックの処理が終了したならば,復号画像に対してインループフィルタ(DF,SAO,ALF)を適用し,フレームバッファ111に格納する。
・ステップS111:予測情報や量子化後の係数値,インループフィルタオーバーヘッドなどをエントロピー符号化する。
・ステップS112:すべてのフレームの処理が終了したかの判定を行い,未処理のフレームがある場合には,ステップS101へ戻り,次のフレームについて同様に処理を繰り返す。
・ステップS113:符号化ストリームを出力する。
〔映像符号化装置におけるALF処理部の構成例〕
図4は,本実施形態における映像符号化装置のALF処理部1103の構成例を示す図である。本実施形態における映像符号化装置のALF処理部1103は,RAモード領域決定部201と,BAモード領域決定部202と,タップ形状およびRA/BA決定部203と,CU適応モード決定部204と,最適ClassSet決定部205と,エッジ分類の段階/導出手法決定部206とを備える。
図4のALF処理部1103は,“復号画像”,“CU情報”,“原画像”を入力し,複数パターンのALFを適用した後,最適なALFのパターンで符号化されたときの“ALFオーバーヘッド”と“出力画像”を出力する。なお,CUは,符号化を行うブロックのサイズに応じた符号化単位である。
RAモード領域決定部201およびBAモード領域決定部202は,図22において従来手法として説明したRAモード領域決定部501,BAモード領域決定部502と同等の機能を有する。
最適ClassSet決定部205は,最適化対象とする“ClassSet群”,“アクティビティ分類の段階/導出手法”,“係数セット数上限値”,“復号画像”,“原画像”を入力とし,合計の係数セット数が上限値を超えない範囲で最適化されたアクティビティ分類の段階ごとのClassSetを決定する。また,決定したアクティビティ分類の段階ごとの“最適ClassSet番号群”を出力する。ClassSet番号とは,この例では,AからEまでのどのClassSetかを示す番号である。
エッジ分類の段階/導出手法決定部206は,“最適ClassSet番号群”と“ClassSet群”とを入力とし,ClassSetが保持する“エッジ分類の段階/導出手法”を出力する。この導出手法とは,例えばエッジ分類の段階に対してエッジ分類をあらかじめ定められたどのような評価式を用いて行うかを示すものである。
タップ形状およびRA/BA決定部203およびCU適応モード決定部204は,入力される“アクティビティ分類の段階ごとの最適ClassSet番号”を符号化してRD最適化を行い,ALFオーバーヘッドを作成する以外は,図22におけるタップ形状およびRA/BA決定部503およびCU適応モード決定部504と同等の機能を有する。
〔映像符号化におけるALF処理手順(本実施形態)〕
図5は,図4に示す本実施形態における映像符号化装置内のALF処理部1103の処理フローチャートである。この処理手順における入力は,“復号画像”,“CU情報”,“原画像”であり,出力は,最適なALFのパターンで符号化されたときの“ALFオーバーヘッド”と“出力画像”である。
・ステップS201:画面を16分割してRAモードの領域を決定する。各領域に該当する画素には適用される係数セットの番号が付与され,これら画素ごとの係数セット番号を出力する。
・ステップS202:係数セット数上限値を超えない範囲でアクティビティ分類の段階ごとに最適なClassSet番号を決定する。
・ステップS203:ステップS202で決定されたClassSet番号から,各ClassSetに対してあらかじめ定められているエッジ分類の段階/導出手法を決定する。
・ステップS204:アクティビティ分類の段階/導出方法およびエッジ分類の段階/導出方法を用いてBAモードの領域を決定する。各領域に該当する画素には適用される係数セットの番号が付与され,これら画素ごとの係数セット番号を出力する。
・ステップS205:タップ形状(クロス型/スター型)とフィルタモード(BA/RA )の組み合わせを用いて全パターンのALF出力画像からRD最適化を行い,最良のタップ形状とフィルタモードを導出する。
・ステップS206:CUごとにALFの適用/非適用を切り替え,最適な分割をRD最適化によって決定する。
・ステップS207:出力画像とALFオーバーヘッドを出力する。
〔映像復号装置の構成〕
図6は,本発明が適用される復号装置の構成例を示す図である。本発明は,例えば図6に示すような映像復号装置に適用されるが,これは一例であり,本発明は必ずしも図3に示すような装置構成のものに限定されるわけではない。本実施形態は,特にALF処理部3083の部分が従来技術と異なる部分であり,他の部分は従来の一般的な映像復号装置の構成と同様である。
図6の映像復号装置は,符号化ストリームを入力する。入力された符号化ストリームから,エントロピー復号部301にてブロックごとの予測情報や量子化後変換係数,インループフィルタオーバーヘッドが復号される。復号された量子化後変換係数は逆量子化部302にて逆量子化が行われ,逆変換部303にて逆直交変換(IDCT)等が行われる。逆変換部303の出力信号は,加算器304にてイントラ予測部305もしくはインター予測部306の予測ブロックと加算合成され,復号画像記憶部307に格納される。復号画像記憶部307の画像はイントラ予測部305にて使用される。
当該フレームのすべてのブロックに対して上記処理が終了すると,インループフィルタ処理部308にて復号画像の符号化歪を除去する画像処理フィルタが施され,フィルタ後の復号画像はフレームバッファ309に格納される。ここで,インループフィルタ処理部308は,DF処理部3081,SAO処理部3082,ALF処理部3083を内包しており,それぞれ定められた画像処理フィルタを実行する。フレームバッファ309の画像は,インター予測部306にて使用される。符号化情報記憶部310は,各種ブロックサイズや予測情報,量子化後の係数値,インループフィルタオーバーヘッドなど,各種値を格納する記憶部であり,符号化情報記憶部310の情報は映像復号装置内の様々な処理部で引用される。
〔映像復号の処理手順〕
図7は,図6に示す映像復号装置の処理フローチャートである。この処理手順における入力は,符号化ストリームであり,出力は,復号シーケンスである。機能は,入力した符号化ストリームを復号シーケンスに変換することである。
・ステップS301:符号化ストリームを読み込む。
・ステップS302:符号化ストリームをエントロピー復号し,予測情報や量子化後の係数値,インループフィルタオーバーヘッド等の情報を復号する。
・ステップS303:量子化後の係数値を逆量子化する。
・ステップS304:逆量子化後の係数値を逆直交変換する。
・ステップS305:逆直交変換で得られた予測残差と予測ブロックとを加算合成し,復号画像記憶部307に格納する。
・ステップS306:復号画像に対してインループフィルタ(DF,SAO,ALF)を適用し,復号画像をフレームバッファ309に格納する。
・ステップS307:復号シーケンスを出力する。
〔映像復号装置におけるALF処理部の構成(本実施形態)〕
図8は,本実施形態における映像復号装置のALF処理部3083の構成例を示す図である。本実施形態における映像復号装置のALF処理部3083は,RAモード領域決定部401と,BAモード領域決定部402と,CU適用領域決定部403と,ALF適用部404と,エッジ分類の段階/導出手法決定部405とを備える。
図8のALF処理部3083は,“ALFオーバーヘッド”,“復号画像”,“CU情報”を入力し,ALF適用後の“出力画像”を出力する。
RAモード領域決定部401,BAモード領域決定部402,CU適用領域決定部403,ALF適用部404は,図24で説明した従来手法におけるRAモード領域決定部601,BAモード領域決定部602,CU適用領域決定部603,ALF適用部604と同等の機能を有し,エッジ分類の段階/導出手法決定部405は,図4におけるエッジ分類の段階/導出手法決定部206と同等の機能を有する。
〔映像復号におけるALF処理手順(本実施形態)〕
図9は,図8に示す本実施形態における映像復号装置内のALF処理部3083の処理フローチャートである。この処理手順では,“復号画像”,“CU情報”,“ALFオーバーヘッド”を入力とし,“出力画像”を出力する。機能は,符号化装置側で決定されたタップ形状,フィルタモード,フィルタ係数,CUごとのALF適応範囲を用いて復号画像に対してALFを適用することである。
・ステップS401:復号画像とALFオーバーヘッドを取得する。
・ステップS402:フィルタモードの分岐を行い,RAモードであればステップS403を実行し,BAモードであればステップS404,S405を実行する。
・ステップS403:画面を16分割してRAモードの領域を決定する。各領域に該当する画素には適用される係数セットの番号が付与され,これら画素ごとの係数セット番号を出力する。
・ステップS404:ClassSet番号からエッジ分類の段階/導出手法を決定する。
・ステップS405:アクティビティ分類の段階/導出方法およびClassSetに関連付けられたエッジ分類の段階/導出方法を用いてBAモードの領域を決定する。各領域に該当する画素には適用される係数セットの番号が付与され,これら画素ごとの係数セット番号を出力する。
・ステップS406:CUごとにALFの適用/非適用を切り替え,画素ごとのALF適用情報を出力する。
・ステップS407:ALFを適用して出力画像を出力する。
次に,最適ClassSet決定部205における処理により実現可能な処理の例を,実施例1〜4として説明する。なお,最適化対象とするClassSet群には,図1(B)に記載の ClassSet A〜Eの5パターンを与えるものとする。
〔実施例1:符号量削減の例〕
アクティビティが低い領域のエッジ分類の数を減らし,合計の係数セット数を削減することで,発生符号量の削減を実現する。
図10に,最適ClassSet決定部205の発生符号量の削減を実現する最適化の処理手順の例を示す。
例えば,上記発生符号量の削減を実現する最適化にて,図11(B)に示すように,アクティビティ分類における段階1,2のClassSetがBに,段階3のClassSetがCに,それ以外の段階のClassSetが従来手法と同等のDに設定されたと仮定する。このとき,従来手法では15個の係数セットを符号化する必要があったのに対し,10個の係数セットに削減することができる。各係数セットには,9個もしくは10個の係数が格納されているため,45個もしくは50個の係数を削減できる。ClassSet符号化のため,これによる符号量は増加するが,アクティビティ分類が5段階ならば,10〜15ビットの増加で抑えられるため,本例では,発生符号量の削減効果の方が大きくなる。
図10に従って,以上の発生符号量の削減を実現する最適ClassSet決定部205の処理手順を説明する。この処理手順では,“復号画像”,最適化対象とする“ClassSet群”,“係数セット数上限値”,“アクティビティ分類の段階/導出手法”を入力とし,ClassSetに関連付けられたアクティビティ分類の段階ごとの“エッジ分類の段階/導出手法”,“最適ClassSet番号群”を出力する。機能は,発生符号量を現状以下に削減するようにClassSetの組み合わせを最適化することである。
・ステップS501:アクティビティの段階,最適化対象とするClassSet群を読み込む。
・ステップS502:アクティビティ分類の各段階に対するループを行う。
・ステップS503:コスト最小値を十分に大きな値で初期化する。
・ステップS504:最適化対象とするClassSetの全パターンに対するループを行う。
・ステップS505,S506:アクティビティ分類の段階が3以下で,かつ当該ClassSetの係数セット数が3以下か否かの判定を行い,判定結果が“真”であれば,ステップS507を実行する。
・ステップS507:アクティビティ分類における当該段階の全ブロックに対して当該ClassSetを用いてRDコストを算出する。
・ステップS508:ステップS507にて算出したRDコストがコスト最小値より小さければ,ステップS509を実行する。
・ステップS509:コスト最小値をRDコストで上書きし,当該段階の最適ClassSetを更新する。
・ステップS510:算出されたアクティビティ分類の段階ごとの最適ClassSet番号を出力する。
〔実施例2:画質改善の例〕
アクティビティが高い領域のエッジ分類の数を増やし,二乗誤差を削減して画質を改善する。
図12に,最適ClassSet決定部205の画質を改善する最適化の処理手順の例を示す。例えば,上記画質を改善する最適化にて,図13(B)に示すように,アクティビティ分類における段階4,5のClassSetがEに,それ以外の段階のClassSetが従来手法と同等のDに設定されたと仮定する。このとき,段階4,5の領域に対しては従来手法よりもパターン数の多い複数パターンの係数セットが適用されるため,それぞれの特徴に応じた係数を構築できる。このため,従来手法より二乗誤差を削減でき,画質を改善できる。
図12に従って,以上の画質を改善する最適化を実現する最適ClassSet決定部205の処理手順を説明する。この処理手順では,“復号画像”,最適化対象とする“ClassSet群”,“係数セット数上限値”,“アクティビティ分類の段階/導出手法”を入力とし,ClassSetに関連付けられたアクティビティ分類の段階ごとの“エッジ分類の段階/導出手法”,“最適ClassSet番号群”を出力する。機能は,画質を改善するようにClassSetの組み合わせを最適化することである。
・ステップS601:アクティビティの段階,最適化対象とするClassSet群を読み込む。
・ステップS602:アクティビティ分類の各段階に対するループを行う。
・ステップS603:コスト最小値を十分に大きな値で初期化する。
・ステップS604:最適化対象とするClassSetの全パターンに対するループを行う。
・ステップS605,S606:アクティビティ分類の段階が3以上で,かつ当該ClassSetの係数セット数が3以上か否かの判定を行い,判定結果が“真”であれば,ステップS607を実行する。
・ステップS607:アクティビティ分類における当該段階の全ブロックに対して当該ClassSetを用いてRDコストを算出する。
・ステップS608:ステップS607にて算出したRDコストがコスト最小値より小さければ,ステップS609を実行する。
・ステップS609:コスト最小値をRDコストで上書きし,当該段階の最適ClassSetを更新する。
・ステップS610:算出されたアクティビティ分類の段階ごとの最適ClassSet番号を出力する。
ただし,本実施例に記載の方法のみを適用した場合,係数セットの合計数が従来手法より増加してしまう可能性がある。そのため,後述の実施例4の手法と組み合わせて使用することが望ましい。
〔実施例3:復号装置の処理量削減の例〕
アクティビティが低い領域のALF処理を省略し,復号装置の演算量を削減する。
図14に,最適ClassSet決定部205の復号装置の演算量を削減する最適化の処理手順の例を示す。例えば,上記復号装置の演算量を削減する最適化にて,図15(B)に示すように,アクティビティ分類における段階1のClassSetがAに,それ以外の段階のClassSetが従来手法と同等のDに設定されたと仮定する。このとき,段階1の領域に対してはALFが適用されないため,復号装置の演算量が削減できる。例えば,段階1に符号化対象フレームの約50%の画素が割り当てられていたと仮定すると,ALFのフィルタ部分の演算量を約50%削減できる。復号処理において,ALFの処理時間占有率は約15%前後のため,この場合,約7%程度復号装置の演算量を削減できる。
図14に従って,以上の復号装置の処理量を削減する最適化を実現する最適ClassSet決定部205の処理手順を説明する。この処理手順では,“復号画像”,最適化対象とする“ClassSet群”,“係数セット数上限値”,“アクティビティ分類の段階/導出手法”を入力とし,ClassSetに関連付けられたアクティビティ分類の段階ごとの“エッジ分類の段階/導出手法”,“最適ClassSet番号群”を出力する。機能は,復号装置の処理量を削減するようにClassSetの組み合わせを最適化することである。
・ステップS701:アクティビティの段階,最適化対象とするClassSet群を読み込む。
・ステップS702:アクティビティ分類の各段階に対するループを行う。
・ステップS703:コスト最小値を十分に大きな値で初期化する。
・ステップS704:最適化対象とするClassSetの全パターンに対するループを行う。
・ステップS705:アクティビティ分類における当該段階の全ブロックに対して当該ClassSetを用いてRDコストを算出する。
・ステップS706:ステップS705にて算出したRDコストがコスト最小値より小さければ,ステップS707を実行する。
・ステップS707:コスト最小値をRDコストで上書きし,当該段階の最適ClassSetを更新する。
・ステップS708:当該段階の全ブロックに対して,フィルタ前のRDコストを算出する。
・ステップS709:フィルタ前後の平均改善量が,設定される閾値より低ければステップS710を実行する。平均改善量は,例えば次式によって算出される。
平均改善量={(フィルタ前のRDコスト−コスト最小値)/フィルタ画素数}
・ステップS710:最適ClassSetを“None”に設定する。
・ステップS711:算出されたアクティビティ分類の段階ごとの最適ClassSet番号を出力する。
〔実施例4:ハードウェア回路規模肥大化抑制の例〕
係数セット数の上限を設定し,上限を超えないように最適化を行うことで,ハードウェアの回路規模肥大化を抑制する。
図16に,最適ClassSet決定部205のハードウェアの回路規模肥大化を抑制する最適化の処理手順の例を示す。例えば,上記ハードウェアの回路規模肥大化を抑制する最適化にて,アクティビティ分類の段階ごとに最適化対象とするすべてのClassSetを試験して各RDコストを算出し,係数セットの合計数が所定の数(従来手法では15)を超えない組み合わせを複数パターン生成する。それら組み合わせのRDコスト合計値を最小化した係数セットを導出することにより,復号装置に所定の回路規模を超えた係数セットの復号機能を実装させる必要がなくなるためハードウェアの回路規模肥大化を抑制することができる。
本手法を用いると,例えば復号装置の計算能力が劣り,係数セットを8個までしか許容できないハードウェア向けの映像コンテンツを符号化する場合には,上記と同様に8個を超えることがない範囲で最適化を行うことで,高い画質を提供することができる。
図16に従って,以上のハードウェア回路規模肥大化抑制する最適化を実現する最適ClassSet決定部205の処理手順を説明する。この処理手順では,“復号画像”,最適化対象とする“ClassSet群”,“係数セット数上限値”,“アクティビティ分類の段階/導出手法”を入力とし,ClassSetに関連付けられたアクティビティ分類の段階ごとの“エッジ分類の段階/導出手法”,“最適ClassSet番号群”を出力する。機能は,係数セット数上限値を超えない範囲でClassSetの組み合わせを最適化することである。
・ステップS801:アクティビティの段階,最適化対象とするClassSet群および係数セット数上限値を読み込む。
・ステップS802:アクティビティ分類の各段階に対するループを行う。
・ステップS803:最適化対象とするClassSetの全パターンに対するループを行う。
・ステップS804:アクティビティ分類における当該段階の全ブロックに対して当該ClassSetを用いてRDコストを算出する。
・ステップS805:RDコストを算出した全パターンの組み合わせの中から合計係数セット数が上限以下になる組み合わせと各RDコストの合計値を構築する。
・ステップS806:コスト最小値を十分に大きな値で初期化する。
・ステップS807:合計係数セット数が上限以下のすべての組み合わせに対するループ を行う。
・ステップS808:もし組み合わせのRDコスト合計値がコスト最小値より低い場合には,ステップS809を実行する。
・ステップS809:コスト最小値をRDコストで上書きし,当該段階の最適ClassSetを 更新する。
・ステップS810:算出されたアクティビティ分類の段階ごとの最適ClassSet番号を出力する。
〔実施例1〜3の効果〕
IntraスライスのGOP構造を用いてインループフィルタ処理部110におけるSAO処理部1102が出力したALF適用前の画像に対し,BAモードを用いたスター型のALFを適用して試験データを取得した。対象シーケンスは,FullHD解像度のMPEG標準シーケンス5つの各先頭60フレームを使用し,計300フレームのSSD削減量と予測発生符号量およびフィルタ処理時間の各平均を取得した。
各ALF係数は,コンテキスト適応算術符号の適用および係数セットの統合によって15個の係数セットの発生符号量は必要最低限に削減される。ただし,本発明の手法を用いてもコンテキスト適応算術符号の適用および係数セットの統合が可能であるため,基本性能の比較として,各ALF係数は固定長とし,係数セットは15セットすべてを用いるものとして比較を行う。各ALF係数の予想発生符号量は,固定長で10ビットとし,10係数を要するALFの単一係数セットに対して100ビットとする。つまり,従来の15係数セットを要する場合は,画像1枚当たり1500ビットと仮定する。また,5パターンのClassSetの切り替えにはClassSet A(None)か否かを1ビットのフラグで切り替え,その他4つのClassSetを2ビットで表記するものとする。
実施例1(図10,図11)に記載の手法における具体的な効果を示す数値を図17に,実施例2(図12,図13)に記載の手法における具体的な効果を示す数値を図18に,実施例3(図14,図15)に記載の手法における具体的な効果を示す数値を図19に記す。図17〜図19において,QPは量子化パラメータ,SSDは二乗誤差,GenBitは発生符号量,RD−costはレート歪み(RD)コスト,FilterTimeはフィルタ処理時間である。各行の上段のHM5.0は従来手法,下段のProposedは本発明を用いた手法の結果を表している。
発生符号量を削減する例では,図17に記載のように,若干SSDは増加するものの,ALFにおける発生符号量が約2/3に削減できていることが確認できる。図18の画質を改善する例では,300フレームの平均で見るとRDコストは若干の増加を招くものの,二乗誤差が削減できている様子が確認できる。また,復号装置の演算量を削減する例では,図19に示されるように,ClassSet A(None)を用いることで,フィルタ処理時間の削減が確認でき,特に低レートでは約1/2になっていることが確認できる。
〔ソフトウェアプログラムを用いた場合の構成例〕
以上説明した映像符号化および映像復号の処理は,コンピュータとソフトウェアプログラムとによっても実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも,ネットワークを通して提供することも可能である。
図20に,映像符号化装置をコンピュータとソフトウェアプログラムとによって構成する場合のハードウェア構成例を示す。本システムは,プログラムを実行するCPU50と,CPU50がアクセスするプログラムやデータが格納されるRAM等のメモリ51と,カメラ等からの符号化対象の映像信号を入力する映像信号入力部52(ディスク装置等による映像信号を記憶する記憶部でもよい)と,本手法により入力映像を符号化する処理をCPU50に実行させるソフトウェアプログラムである映像符号化プログラム54が格納されたプログラム記憶装置53と,CPU50がメモリ51にロードされた映像符号化プログラム54を実行することにより生成された符号化データを,例えばネットワークを介して出力する符号化データ出力部55(ディスク装置等による符号化データを記憶する記憶部でもよい)とが,バスで接続された構成になっている。
図21に,映像復号装置をコンピュータとソフトウェアプログラムとによって構成する場合のハードウェア構成例を示す。本システムは,プログラムを実行するCPU60と,CPU60がアクセスするプログラムやデータが格納されるRAM等のメモリ61と,映像符号化装置が本手法により符号化した符号化データを入力する符号化データ入力部62(ディスク装置等による多重化符号化データを記憶する記憶部でもよい)と,本手法により符号化データを復号する処理をCPU60に実行させるソフトウェアプログラムである映像復号プログラム64が格納されたプログラム記憶装置63と,CPU60がメモリ61にロードされた映像復号プログラム64を実行することにより,符号化データを復号して得られた復号映像を,再生装置などに出力する復号映像出力部65とが,バスで接続された構成になっている。
以上,図面を参照して本発明の実施の形態を説明してきたが,上記実施の形態は本発明の例示に過ぎず,本発明が上記実施の形態に限定されるものではないことは明らかである。したがって,本発明の精神および技術的範囲を逸脱しない範囲での構成要素の追加,省略,置換,その他の変更を行ってもよい。
1103,3083 ALF処理部
113,310 符号化情報記憶部
201,401 RAモード領域決定部
202,402 BAモード領域決定部
203 タップ形状およびRA/BA決定部
204 CU適応モード決定部
205 最適ClassSet決定部
206,405 エッジ分類の段階/導出手法決定部
403 CU適用領域決定部
404 ALF適用部

Claims (16)

  1. フィルタ対象画素周辺の画素値と各画素に対応した重みの線形結合により入力画像と原画像の二乗誤差を最小化するフィルタを用いる画像符号化方法であって,
    入力画像をブロックに細分化し,ブロック内の起伏の強度に応じて複数のパターンに分類し,前記起伏の強度に応じた各パターンに対してさらにエッジの特徴に応じて1つ以上のパターンに分類し,前記起伏の強度に応じた各パターンおよび前記エッジの特徴に応じた各パターンそれぞれに対して二乗誤差を最小化するフィルタを生成するにあたって,前記エッジの特徴に応じた分類の1または複数のパターンにそれぞれ関連付けられた複数のクラスセットの中から,所定の最適化方法に従って前記起伏の強度に応じた各パターンに対して割り当てるクラスセットを決定するクラスセット決定過程と,
    前記起伏の強度に応じた各パターンに対して割り当てられたクラスセットによって指定される前記エッジの特徴に応じた分類のパターンに対応する係数セットを用いてフィルタを生成し,前記入力画像のブロックに対してフィルタを適用するフィルタ処理過程と,
    前記起伏の強度に応じた各パターンに対して,どのクラスセットが割り当てられたかを示す情報を符号化する符号化過程とを有し,
    かつ,前記クラスセット決定過程において前記起伏の強度に応じたパターンに対して割り当てるクラスセットの一つとして,さらに前記エッジの特徴に応じたパターン数が零のクラスセットを有しており,
    前記クラスセット決定過程では,前記起伏の強度が低いパターンに対して,前記エッジの特徴に応じたパターン数が零のクラスセットを割り当てる
    ことを特徴とする画像符号化方法。
  2. フィルタ対象画素周辺の画素値と各画素に対応した重みの線形結合により入力画像と原画像の二乗誤差を最小化するフィルタを用いる画像符号化方法であって,
    入力画像をブロックに細分化し,ブロック内の起伏の強度に応じて複数のパターンに分類し,前記起伏の強度に応じた各パターンに対してさらにエッジの特徴に応じて1つ以上のパターンに分類し,前記起伏の強度に応じた各パターンおよび前記エッジの特徴に応じた各パターンそれぞれに対して二乗誤差を最小化するフィルタを生成するにあたって,前記エッジの特徴に応じた分類の1または複数のパターンにそれぞれ関連付けられた複数のクラスセットの中から,所定の最適化方法に従って前記起伏の強度に応じた各パターンに対して割り当てるクラスセットを決定するクラスセット決定過程と,
    前記起伏の強度に応じた各パターンに対して割り当てられたクラスセットによって指定される前記エッジの特徴に応じた分類のパターンに対応する係数セットを用いてフィルタを生成し,前記入力画像のブロックに対してフィルタを適用するフィルタ処理過程と,
    前記起伏の強度に応じた各パターンに対して,どのクラスセットが割り当てられたかを示す情報を符号化する符号化過程とを有し,
    かつ,前記クラスセット決定過程では,前記起伏の強度に応じた各パターンに割り当てられるクラスセットにそれぞれ対応する前記エッジの特徴に応じたパターンのすべてのパターン合計数が所定の上限値を超えないように制限した範囲内で,前記起伏の強度に応じた各パターンに対して割り当てるクラスセットを決定する
    ことを特徴とする画像符号化方法。
  3. 請求項1または請求項2に記載の画像符号化方法において,
    記起伏の強度が低いパターンに対して前記エッジの特徴に応じたパターン数前記起伏の強度が高いパターンと比較して削減する
    ことを特徴とする画像符号化方法。
  4. 請求項1,請求項2または請求項3に記載の画像符号化方法において,
    記起伏の強度が高いパターンに対して前記エッジの特徴に応じたパターン数前記起伏の強度が低いパターンと比較して増やす
    ことを特徴とする画像符号化方法。
  5. 請求項1から請求項4までのいずれか1項に記載の画像符号化方法において,
    前記クラスセットに関連付けられるパターンの一つとして,エッジの特徴による分類を行わず,当該領域の全ブロックに対して平均的に二乗誤差を最小化することを目的とした係数セットを割り当てることを示すパターン,または右斜め方向のエッジの特徴を持つブロックに対して二乗誤差を最小化することを目的とした係数セットを割り当てることを示すパターン,または左斜め方向のエッジの特徴を持つブロックに対して二乗誤差を最小化することを目的とした係数セットを割り当てることを示すパターンを有する
    ことを特徴とする画像符号化方法。
  6. フィルタ対象画素周辺の画素値と各画素に対応した重みの線形結合により入力画像と原画像の二乗誤差を最小化するフィルタを用いる画像符号化装置であって,
    入力画像をブロックに細分化し,ブロック内の起伏の強度に応じて複数のパターンに分類し,前記起伏の強度に応じた各パターンに対してさらにエッジの特徴に応じて1つ以上のパターンに分類し,前記起伏の強度に応じた各パターンおよび前記エッジの特徴に応じた各パターンそれぞれに対して二乗誤差を最小化するフィルタを生成するにあたって,前記エッジの特徴に応じた分類の1または複数のパターンにそれぞれ関連付けられた複数のクラスセットの中から,所定の最適化方法に従って前記起伏の強度に応じた各パターンに対して割り当てるクラスセットを決定するクラスセット決定手段と,
    前記起伏の強度に応じた各パターンに対して割り当てられたクラスセットによって指定される前記エッジの特徴に応じた分類のパターンに対応する係数セットを用いてフィルタを生成し,前記入力画像のブロックに対してフィルタを適用するフィルタ処理手段と,
    前記起伏の強度に応じた各パターンに対して,どのクラスセットが割り当てられたかを示す情報を符号化する符号化手段とを備え,
    かつ,前記クラスセット決定手段において前記起伏の強度に応じたパターンに対して割り当てるクラスセットの一つとして,さらに前記エッジの特徴に応じたパターン数が零のクラスセットを有しており,
    前記クラスセット決定手段は,前記起伏の強度が低いパターンに対して,前記エッジの特徴に応じたパターン数が零のクラスセットを割り当てる
    ことを特徴とする画像符号化装置。
  7. フィルタ対象画素周辺の画素値と各画素に対応した重みの線形結合により入力画像と原画像の二乗誤差を最小化するフィルタを用いる画像符号化装置であって,
    入力画像をブロックに細分化し,ブロック内の起伏の強度に応じて複数のパターンに分類し,前記起伏の強度に応じた各パターンに対してさらにエッジの特徴に応じて1つ以上のパターンに分類し,前記起伏の強度に応じた各パターンおよび前記エッジの特徴に応じた各パターンそれぞれに対して二乗誤差を最小化するフィルタを生成するにあたって,前記エッジの特徴に応じた分類の1または複数のパターンにそれぞれ関連付けられた複数のクラスセットの中から,所定の最適化方法に従って前記起伏の強度に応じた各パターンに対して割り当てるクラスセットを決定するクラスセット決定手段と,
    前記起伏の強度に応じた各パターンに対して割り当てられたクラスセットによって指定される前記エッジの特徴に応じた分類のパターンに対応する係数セットを用いてフィルタを生成し,前記入力画像のブロックに対してフィルタを適用するフィルタ処理手段と,
    前記起伏の強度に応じた各パターンに対して,どのクラスセットが割り当てられたかを示す情報を符号化する符号化手段とを備え,
    かつ,前記クラスセット決定手段は,前記起伏の強度に応じた各パターンに割り当てられるクラスセットにそれぞれ対応する前記エッジの特徴に応じたパターンのすべてのパターン合計数が所定の上限値を超えないように制限した範囲内で,前記起伏の強度に応じた各パターンに対して割り当てるクラスセットを決定する
    ことを特徴とする画像符号化装置。
  8. フィルタ対象画素周辺の画素値と各画素に対応した重みの線形結合により入力画像と原画像の二乗誤差を最小化するフィルタを用いる画像復号方法であって,
    入力画像をブロックに細分化し,ブロック内の起伏の強度に応じて複数のパターンに分類し,前記起伏の強度に応じた各パターンに対してさらにエッジの特徴に応じて1つ以上のパターンに分類し,前記起伏の強度に応じた各パターンおよび前記エッジの特徴に応じた各パターンそれぞれに対して二乗誤差を最小化するフィルタを生成するにあたって,前記エッジの特徴に応じた分類の1または複数のパターンにそれぞれ関連付けられた複数のクラスセットの中から,前記起伏の強度に応じた各パターンに対して割り当てるクラスセットを指定する情報を復号し,復号した情報に基づいて前記起伏の強度に応じた各パターンに対して割り当てるクラスセットを決定するクラスセット導出過程と,
    前記起伏の強度に応じた各パターンに対して割り当てられたクラスセットによって指定される前記エッジの特徴に応じた分類のパターンに対応する係数セットを用いてフィルタを生成し,前記入力画像のブロックに対してフィルタを適用するフィルタ処理過程とを有し,
    かつ,前記クラスセット導出過程において前記起伏の強度に応じたパターンに対して割り当てるクラスセットの一つとして,さらに前記エッジの特徴に応じたパターン数が零のクラスセットを有しており,
    前記クラスセット導出過程では,前記起伏の強度が低いパターンに対して,前記エッジの特徴に応じたパターン数が零のクラスセットを割り当てる
    ことを特徴とする画像復号方法。
  9. フィルタ対象画素周辺の画素値と各画素に対応した重みの線形結合により入力画像と原画像の二乗誤差を最小化するフィルタを用いる画像復号方法であって,
    入力画像をブロックに細分化し,ブロック内の起伏の強度に応じて複数のパターンに分類し,前記起伏の強度に応じた各パターンに対してさらにエッジの特徴に応じて1つ以上のパターンに分類し,前記起伏の強度に応じた各パターンおよび前記エッジの特徴に応じた各パターンそれぞれに対して二乗誤差を最小化するフィルタを生成するにあたって,前記エッジの特徴に応じた分類の1または複数のパターンにそれぞれ関連付けられた複数のクラスセットの中から,前記起伏の強度に応じた各パターンに対して割り当てるクラスセットを指定する情報を復号し,復号した情報に基づいて前記起伏の強度に応じた各パターンに対して割り当てるクラスセットを決定するクラスセット導出過程と,
    前記起伏の強度に応じた各パターンに対して割り当てられたクラスセットによって指定される前記エッジの特徴に応じた分類のパターンに対応する係数セットを用いてフィルタを生成し,前記入力画像のブロックに対してフィルタを適用するフィルタ処理過程とを有し,
    かつ,前記クラスセット導出過程では,前記起伏の強度に応じた各パターンに割り当てられるクラスセットにそれぞれ対応する前記エッジの特徴に応じたパターンのすべてのパターン合計数が所定の上限値を超えないように制限した範囲内で,前記起伏の強度に応じた各パターンに対して割り当てるクラスセットを決定する
    ことを特徴とする画像復号方法。
  10. 請求項8または請求項9に記載の画像復号方法において,
    記起伏の強度が低いパターンに対して前記エッジの特徴に応じたパターン数前記起伏の強度が高いパターンと比較して削減する
    ことを特徴とする画像復号方法。
  11. 請求項8,請求項9または請求項10に記載の画像復号方法において,
    記起伏の強度が高いパターンに対して前記エッジの特徴に応じたパターン数前記起伏の強度が低いパターンと比較して増やす
    ことを特徴とする画像復号方法。
  12. 請求項8から請求項11までのいずれか1項に記載の画像復号方法において,
    前記クラスセットに関連付けられるパターンの一つとして,エッジの特徴による分類を行わず,当該領域の全ブロックに対して平均的に二乗誤差を最小化することを目的とした係数セットを割り当てることを示すパターン,または右斜め方向のエッジの特徴を持つブロックに対して二乗誤差を最小化することを目的とした係数セットを割り当てることを示すパターン,または左斜め方向のエッジの特徴を持つブロックに対して二乗誤差を最小化することを目的とした係数セットを割り当てることを示すパターンを有する
    ことを特徴とする画像復号方法。
  13. フィルタ対象画素周辺の画素値と各画素に対応した重みの線形結合により入力画像と原画像の二乗誤差を最小化するフィルタを用いる画像復号装置であって,
    入力画像をブロックに細分化し,ブロック内の起伏の強度に応じて複数のパターンに分類し,前記起伏の強度に応じた各パターンに対してさらにエッジの特徴に応じて1つ以上のパターンに分類し,前記起伏の強度に応じた各パターンおよび前記エッジの特徴に応じた各パターンそれぞれに対して二乗誤差を最小化するフィルタを生成するにあたって,前記エッジの特徴に応じた分類の1または複数のパターンにそれぞれ関連付けられた複数のクラスセットの中から,前記起伏の強度に応じた各パターンに対して割り当てるクラスセットを指定する情報を復号し,復号した情報に基づいて前記起伏の強度に応じた各パターンに対して割り当てるクラスセットを決定するクラスセット導出手段と,
    前記起伏の強度に応じた各パターンに対して割り当てられたクラスセットによって指定される前記エッジの特徴に応じた分類のパターンに対応する係数セットを用いてフィルタを生成し,前記入力画像のブロックに対してフィルタを適用するフィルタ処理手段とを備え,
    かつ,前記クラスセット導出手段において前記起伏の強度に応じたパターンに対して割り当てるクラスセットの一つとして,さらに前記エッジの特徴に応じたパターン数が零のクラスセットを有しており,
    前記クラスセット導出手段は,前記起伏の強度が低いパターンに対して,前記エッジの特徴に応じたパターン数が零のクラスセットを割り当てる
    ことを特徴とする画像復号装置。
  14. フィルタ対象画素周辺の画素値と各画素に対応した重みの線形結合により入力画像と原画像の二乗誤差を最小化するフィルタを用いる画像復号装置であって,
    入力画像をブロックに細分化し,ブロック内の起伏の強度に応じて複数のパターンに分類し,前記起伏の強度に応じた各パターンに対してさらにエッジの特徴に応じて1つ以上のパターンに分類し,前記起伏の強度に応じた各パターンおよび前記エッジの特徴に応じた各パターンそれぞれに対して二乗誤差を最小化するフィルタを生成するにあたって,前記エッジの特徴に応じた分類の1または複数のパターンにそれぞれ関連付けられた複数のクラスセットの中から,前記起伏の強度に応じた各パターンに対して割り当てるクラスセットを指定する情報を復号し,復号した情報に基づいて前記起伏の強度に応じた各パターンに対して割り当てるクラスセットを決定するクラスセット導出手段と,
    前記起伏の強度に応じた各パターンに対して割り当てられたクラスセットによって指定される前記エッジの特徴に応じた分類のパターンに対応する係数セットを用いてフィルタを生成し,前記入力画像のブロックに対してフィルタを適用するフィルタ処理手段とを備え,
    かつ,前記クラスセット導出手段は,前記起伏の強度に応じた各パターンに割り当てられるクラスセットにそれぞれ対応する前記エッジの特徴に応じたパターンのすべてのパターン合計数が所定の上限値を超えないように制限した範囲内で,前記起伏の強度に応じた各パターンに対して割り当てるクラスセットを決定する
    ことを特徴とする画像復号装置。
  15. 請求項1から請求項までのいずれか1項に記載の画像符号化方法を,コンピュータに実行させるための画像符号化プログラム。
  16. 請求項8から請求項12までのいずれか1項に記載の画像復号方法を,コンピュータに実行させるための画像復号プログラム。
JP2012007627A 2012-01-18 2012-01-18 画像符号化方法,画像符号化装置,画像復号方法,画像復号装置およびそれらのプログラム Active JP5770647B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012007627A JP5770647B2 (ja) 2012-01-18 2012-01-18 画像符号化方法,画像符号化装置,画像復号方法,画像復号装置およびそれらのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012007627A JP5770647B2 (ja) 2012-01-18 2012-01-18 画像符号化方法,画像符号化装置,画像復号方法,画像復号装置およびそれらのプログラム

Publications (2)

Publication Number Publication Date
JP2013150084A JP2013150084A (ja) 2013-08-01
JP5770647B2 true JP5770647B2 (ja) 2015-08-26

Family

ID=49047199

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012007627A Active JP5770647B2 (ja) 2012-01-18 2012-01-18 画像符号化方法,画像符号化装置,画像復号方法,画像復号装置およびそれらのプログラム

Country Status (1)

Country Link
JP (1) JP5770647B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH711968A1 (de) * 2015-12-28 2017-06-30 C3 Casting Competence Center Gmbh Durchlauferhitzer.
WO2018105579A1 (ja) * 2016-12-09 2018-06-14 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
JP2021166319A (ja) * 2018-07-06 2021-10-14 ソニーグループ株式会社 符号化装置、符号化方法、復号装置、及び、復号方法
JP2022002353A (ja) * 2018-09-25 2022-01-06 ソニーグループ株式会社 符号化装置、符号化方法、復号装置、及び、復号方法
CN112740678A (zh) * 2018-09-25 2021-04-30 索尼公司 编码装置、编码方法、解码装置和解码方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102948151B (zh) * 2010-06-17 2016-08-03 夏普株式会社 图像滤波装置、解码装置及编码装置

Also Published As

Publication number Publication date
JP2013150084A (ja) 2013-08-01

Similar Documents

Publication Publication Date Title
US20190349587A1 (en) Image processing method, and device for same
KR20190016989A (ko) 영상 복호화 방법 및 장치
EP2755388B1 (en) Method, device, and program for encoding and decoding image
TW201921953A (zh) 在圖像或視頻編碼系統中處理圖像的方法和裝置
US10893267B2 (en) Method for processing image on basis of intra-prediction mode and apparatus therefor
KR20190029732A (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
EP3522538A1 (en) Image processing method and apparatus therefor
KR102138828B1 (ko) 영상 부호화 방법 및 장치
JP2023090929A (ja) ビデオ復号化方法、ビデオ復号化装置及び記憶媒体
JP5770647B2 (ja) 画像符号化方法,画像符号化装置,画像復号方法,画像復号装置およびそれらのプログラム
US10735728B2 (en) Method for processing image and apparatus therefor
KR20130045151A (ko) 복원 블록을 생성하는 방법 및 장치
CN113632479B (zh) 越界节点视频数据的处理方法及装置
KR20200000543A (ko) 지도 학습을 이용한 영상 개선 방법 및 장치
KR20140129417A (ko) 복수의 트랜스폼들을 이용한 영상 부호화/복호화 방법 및 장치
JP5868157B2 (ja) 画像処理方法/装置,映像符号化方法/装置,映像復号方法/装置およびそれらのプログラム
WO2014084674A2 (ko) 잔차 변환을 이용한 인트라 예측 방법 및 장치
WO2022140905A1 (zh) 预测方法、编码器、解码器以及存储介质
CN112806006B (zh) 使用由预定义准则确定的参考样本以编解码的方法和设备
KR20150105348A (ko) 트랜스폼을 이용한 영상 부호화/복호화 방법 및 장치
KR101475286B1 (ko) 인트라 예측 방법 및 장치, 그리고 영상 처리 장치
KR101688085B1 (ko) 고속 인트라 예측을 위한 영상 부호화 방법 및 장치
JP7109961B2 (ja) 画像復号装置、画像符号化装置、画像処理システム、画像復号方法及びプログラム
JP2014007713A (ja) デブロッキング処理方法、デブロッキング処理装置、プログラム、及び記録媒体
JP6396782B2 (ja) デブロッキング処理方法、デブロッキング処理装置、コンピュータプログラム及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140501

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150224

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150623

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150625

R150 Certificate of patent (=grant) or registration of utility model

Ref document number: 5770647

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150