JP2016208094A - 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム - Google Patents

動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム Download PDF

Info

Publication number
JP2016208094A
JP2016208094A JP2015083646A JP2015083646A JP2016208094A JP 2016208094 A JP2016208094 A JP 2016208094A JP 2015083646 A JP2015083646 A JP 2015083646A JP 2015083646 A JP2015083646 A JP 2015083646A JP 2016208094 A JP2016208094 A JP 2016208094A
Authority
JP
Japan
Prior art keywords
block
size
edge
determination unit
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015083646A
Other languages
English (en)
Inventor
旭穎 雷
Xu Ying Lei
旭穎 雷
智史 島田
Tomohito Shimada
智史 島田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015083646A priority Critical patent/JP2016208094A/ja
Publication of JP2016208094A publication Critical patent/JP2016208094A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】変換符号化で用いるブロックサイズを決定するための演算負荷を低減することができる動画像符号化装置を提供する。
【解決手段】動画像符号化装置40は、設定部401と、決定部402と、変換符号化部403とを含む。設定部401は、動画像内の変換符号化の対象ブロックに適用可能な複数のブロックサイズのうちで、第1のブロックサイズを適用して得られる第1のブロックのエッジ強度が所定の閾値よりも大きく、第1のブロックを分割して得られた第2のブロックサイズの複数の第2のブロックのエッジ方向の向きが所定の範囲内で類似している場合、第1のブロックサイズを対象ブロックに対して適用する候補に設定する。決定部402は、候補に設定されているブロックサイズのうちから対象ブロックに適用するブロックサイズを決定する。変換符号化部403は、決定部により決定されたブロックサイズを用いて対象ブロックを変換符号化する。
【選択図】図4

Description

本発明は、動画像符号化装置、動画像符号化方法、及び動画像符号化プログラムに関する。
画像データ、特に動画像データは、データ量が大きいことが多いため、例えば、データを動画像符号化装置から動画像復号装置へと伝送する際、又は記憶装置に格納する際などに、データ列を符号化して別のデータ列に変換することが行われている。それにより、例えば、データ量が圧縮されるため、受信側の動画像復号装置での動画像データのスムーズな閲覧などが可能である。
動画像を符号化する技術として、例えば、H.264、及びHigh Efficiency Video Coding(HEVC,H.265)等の技術が知られている。なお、符号化の対象画像は、以下の説明では、フレーム又はピクチャと呼ばれることがある。
動画像を符号化する場合に、画像を複数のブロックに分割し、ブロック単位で符号化が実行されることがある。例えば、HEVCでは、各ピクチャの符号化処理を、Coding Tree Unit(CTU:符号化ツリーユニット)と呼ばれる正方画素ブロックの単位で行う。CTUはMoving Picture Experts Group(MPEG)-2やH.264におけるマクロブロックに対応する処理単位であり、輝度信号ブロックと対応する色差信号ブロックとを含む。CTUのサイズはマクロブロックのように固定ではなく、シーケンスごとにエンコーダが選択・シグナリングする(最大64×64画素ブロック)。
動画像データの符号化において実行されるイントラ予測、インター予測、変換符号化、量子化、エントロピー符号化などの一連の符号化処理は、CTUを再帰的に4分木分割することによって得られるCoding Unit(CU)の単位で行われる。なお、変換符号化は、例えば、動画像データを、空間周波数領域のデータなどの他の座標軸に変換して符号化を実行することであってよい。また、CUは、Prediction Unit(PU、予測ユニット)とTransform Unit(TU、変換ユニット)にさらに分割できる。CUの符号化処理に際して、イントラ予測、及びインター予測については、CU内をPUに分割して行われる。予測差分信号に対する直交変換などの変換符号化と量子化とは、TU単位で行われる。TUもCTU内のCU分割と同様、CU内部で再帰的に4分木分割を行うことが可能である。
この様に、HEVCでは、CTU内を可変サイズのCU、PU、TUに分割して符号化を行うことで、入力画像の局所的な特性に対して符号化処理を適応化することができる。例えば、複雑な動きや絵柄が存在する領域ではブロックのサイズを小さくして動きベクトルやイントラ予測モードなどの予測パラメータに符号量を多く配分することで予測性能を高めることができる。また、平坦な絵柄や一様な動きの領域についてはブロックのサイズを大きくすることで予測パラメータの符号量を抑制することができる。例えば、この様にブロックサイズを選択することで、符号量を抑えつつ高画質化を図ることができる。
これに関し、計算量を削減しつつ、入力画像情報をより忠実に再現しつつ、モスキートノイズなどの量子化劣化を最小限にするための技術が知られている。(例えば、特許文献1)また、特許文献2、及び非特許文献1〜3にも関連する技術が記載されている。
特開2008−219205号公報 特開2007−110568号公報
High Efficiency Video Coding (HEVC) Range Extensions text specification: Draft 7、JCTVC-Q1005_v4, 2014年4月10日、[online]、[平成26年8月22日検索]、<URL:http://phenix.it-sudparis.eu/jct/index.php> H.265/HEVC教科書、第5章、第8章、インプレスジャパン、2013年10月21日発行 HM、[online]、[平成26年8月22日検索]、<URL:https://HEVC.hhi.fraunhofer.de/svn/svn_HEVCSoftware/tags/>
上述のHEVCのように、複数のブロックサイズの中から選択して符号化を行う場合、符号化に適したブロックサイズを選択するための処理が行われる。ブロックサイズの選択は、例えば、符号化コストの比較によって実行することが可能であり、ブロックサイズ(CU,TU,PU)のバリエーション毎に、符号化コストを算出することで、ピクチャの符号化に適したブロックサイズを選択することができる。しかしながら、この場合、ブロックサイズのバリエーション毎に符号化コストを演算しているため、処理負荷が大きく、リアルタイム処理が困難になる恐れがある。また、例えば、H.264において原画のエッジの強度に基づいて直交変換などの変換符号化に用いるブロックサイズを選択することで、ブロックサイズの決定にかかる演算量を削減する技術が知られている。例えば、原画のエッジ強度が小さい場合、原画が平坦であることが推定できるため、大きい直交変換サイズ(例えば、8×8画素)を選択することができる。しかしながら、原画のエッジの強度が小さくない場合に小さい直交変換サイズがよいのか否かについては分からない。この場合に、安易に判定処理を省略すると、最適な直交変換サイズが選択されなくなる恐れがある。本発明の1つの側面に係る目的は、変換符号化で用いるブロックサイズを決定するための演算負荷を低減する技術を提供することである。
本発明の一つの態様の動画像符号化装置は、設定部と、決定部と、変換符号化部とを含む。設定部は、動画像内の変換符号化の対象ブロックに適用可能な複数のブロックサイズのうちで、第1のブロックサイズを対象ブロックに適用して得られる第1のブロックサイズの第1のブロックのエッジ強度が所定の閾値よりも大きく、第1のブロックを分割して得られた第2のブロックサイズの複数の第2のブロックのエッジ方向の向きが所定の範囲内で類似している場合、第1のブロックサイズを対象ブロックに対して適用する候補に設定し、第2のブロックサイズを対象ブロックに対して適用する候補に設定しない。決定部は、候補に設定されているブロックサイズのうちから対象ブロックに適用するブロックサイズを決定する。変換符号化部は、決定部により決定されたブロックサイズを用いて対象ブロックを変換符号化する。
1つの側面によれば、変換符号化で用いるブロックサイズを決定するための演算負荷を低減することができる。
HEVCのブロック構造とブロックサイズの選択の一例を説明する図である。 TUのサイズの一例を示す図である。 イントラ予測における符号化モード判定処理の一例を示すフローチャートである。 第1の実施形態に係る動画像符号化装置の機能ブロック構成を例示する図である。 第1の実施形態に係る動画像符号化装置の機能ブロック構成の別な例を示す図である。 イントラTUモード判定部の機能ブロック構成を例示する図である。 第1の実施形態に係る符号化処理の動作フローを例示する図である。 第1の実施形態に係るイントラTUモードの判定処理の動作フローを例示する図である。 エッジの検出対象の画素と、その周辺の入力画素を例示する図である。 HEVCで規定されているイントラ予測方向を例示する図である。 エッジの方向と、対応するエッジの角度の範囲とを例示する図である。 処理対象のTUと、対応するエッジ方向とを例示する図である。 TU内の画像の絵柄が平坦である場合の差分画像を例示する図である。 処理対象のTUの1つ下の階層のTUのエッジ方向の差が大きい場合と、小さい場合とを例示する図である。 第1の実施形態に係る候補TUサイズを設定する処理の動作フローを例示する図である。 第1の実施形態に係るTUサイズの決定処理の動作フローを例示する図である。 第2の実施形態に係るイントラ予測方向判定部及びイントラTUモード判定部の機能ブロック構成を例示する図である。 第2の実施形態に係るイントラ予測方向の決定処理を例示する図である。 一実施形態に係る動画像符号化装置のハードウェア構成を例示する図である。
以下、図面を参照しながら、本発明のいくつかの実施形態について詳細に説明する。なお、複数の図面において対応する要素には同一の符号を付す。
図1は、HEVCのブロック構造とブロックサイズの選択の一例を説明する図である。HEVCでは、各ピクチャの符号化処理は、CTUと呼ばれる画素ブロックの単位で行われる。CTUは、MPEG-2やH.264におけるマクロブロックと対応する処理単位である。CTUは、輝度信号ブロックと対応する色差信号ブロックとを含む。CTUのサイズは、マクロブロックのように固定ではなく、シーケンス毎に動画像符号化装置が選択・シグナリングする。また、CTUサイズは、シーケンス単位では一定であり、例えば、16×16画素、32×32画素、又は64×64画素のいずれかのサイズに設定されてよい。
イントラ予測、インター予測、変換符号化、量子化、エントロピー符号化などの一連の符号化処理は、CTUを再帰的に四分木分割することによって得られるCUの単位で行われる。符号化単位となるCUのサイズは可変であり、例えば、8×8画素、16×16画素、32×32画素、64×64画素の4種類のサイズから選択することができる。1個のCTUが再帰的な4分木分割に基づいて可変サイズのCUに分割された後、各CUは、PUと、TU単位に個別に処理される。例えば、CUの符号化処理において、イントラ・インター予測についてはPUと呼ばれるブロック単位で行われる。CUは、複数のPUに分割することが可能であり、その分割形状は、例えば、図1に示すPU分割パターンから選択することができる。
また、予測差分信号の変換符号化・量子化処理は、TUと呼ばれるブロック単位で行われる。CUは、複数のTUに分割することが可能であり、TUもCTU内のCU分割と同様、TU内部で再帰的に4分木分割を行うことが可能である。TUのサイズは、例えば、4×4画素、8×8画素、16×16画素、32×32画素の4種類である。図1には、CTU、CU、PU、TUの関係が例示されている。
HEVCでは、この様に、CTU内を可変サイズのCU、PU、TUに分割して符号化を行うことができるため、入力画像の局所的な特性に対して符号化処理を適応化することが可能となる。例えば、複雑な動きや絵柄が存在する領域ではブロックのサイズを小さくして動きベクトルやイントラ予測モードなどの予測パラメータに符号量を多く配分することで予測性能を高める。また、例えば、平坦な絵柄や一様な動きの領域についてはブロックのサイズを大きくして予測パラメータの符号量を抑制する。例えば、この様な制御を行うことで、符号量を抑えつつ高画質化を図ることができる。
一方で、ブロックサイズのバリエーションが増加したことに伴い、符号化処理に適したブロックサイズを選択するために演算が行われる。例えば、HEVCの参照ソフト:HEVC Test Model(HM)では、以下のように、複数のブロックサイズの中から符号化処理に適したブロックサイズが選択されている。なお、ブロックサイズの選択は、CTU単位で行われる。
ブロックサイズの選択では、まず、符号化対象のCUに対して、PUモードが決定される。なお、PUモードの決定は、例えば、図1のPUの分割パターンの中から、適したPU形状を選択することであってよい。次に、符号化対象のCUにおけるTUのサイズが決定される。
図2は、TUのサイズの一例を示す図である。図2に示すように、TUは、階層:0から、指定されているTUの最大の階層である最大TU階層:MaxTUDepthまでに分割できる。例えば、図1の例では、TUの最大TU階層:MaxTUDepthは“2”である。なお、以下の説明では、ブロックのサイズが小さくなるほど、大きな数字がTUの階層に設定される場合を例示する。従って、例えば、階層:0は、符号化処理において選択可能なTUの最大サイズであってよく、また、最大TU階層:MaxTUDepthの階層は選択可能なTUの最小サイズであってよい。
HMでは、TUのサイズ:TUSizeの決定において、まず、階層:0から最大TU階層までのそれぞれの階層でのTUの符号化コスト:TUCostが算出される。次に、最大TU階層から階層:0までのTUの符号化コスト:TUCostを比較して、適したTUのサイズ:TUSizeが選択される。なお、以下では、TUのサイズ:TUSizeを決定することを、TUモードを決定するということがある。TUモードの決定では、例えば、最小の符号化コスト:TUCostを有する階層のTUのサイズが、TUのサイズ:TUSizeとして決定されてよい。
PUモードとTUモードとが決定された後、決定されたPUモードとTUモードとを用いて、符号化対象のCUの符号化コスト:CUCostが算出される。CUの符号化コスト:CUCostは、図1に示す例では、CUの階層:0からCUの最大階層:3までの各階層のCUの符号化コスト:CUCostが算出されてよい。次に、CUの最大階層:3から階層:0までの符号化コスト:CUCostを比較して、CUのサイズが決定されてよい。
なお、以上で述べたTUの符号化コスト、及びCUの符号化コストなどの算出は、例えば、予測誤差(例えば、原画素と予測画素との差分絶対値和:SAD)に基づいて行われてよい。符号化コストは、例えば、以下の式1により算出されてよい。
符号化コスト=SAD+λ×Bits ・・・式1
SAD:原画素と予測画素との差分絶対値和
Bits:発生する情報量
λ:ラグランジュ定数
なお、予測誤差は、SADに限定されるものではなく、例えば、差分画素をアダマール変換した後の絶対値和(SATD)などが用いられてもよい。例えば、TUモードの決定では、周波数領域の特性を考慮して符号化コストを算出するために、SATDを用いて以下の式2により符号化コストが計算されてよい。
符号化コスト=SATD+λ×Bits ・・・式2
SATD:差分画像をアダマール変換した後の係数の絶対値和
なお、式1及び式2において、λはラグランジュ乗数、Bitsは例えばCUサイズ、TUサイズなどの情報を符号化する際に発生する情報量である。
続いて、図3を参照して、HEVCのイントラ予測における符号化モードの判定処理について説明する。なお、符号化モードは、例えば、CUサイズ、TUサイズ、PUの分割形状とイントラ予測方向などの情報を含んでいてよい。図3は、イントラ予測における符号化モード判定処理の一例を示すフローチャートである。動画像符号化装置は、例えば、入力画像をCTU単位に分割した後、それぞれのCTUに対して図3の符号化モードの判定処理を行ってよい。
S301からS308までの処理は、選択可能なCUサイズのそれぞれに対して実行される繰り返し処理である。S302において動画像符号化装置は、処理対象のCUサイズのCUに対して、PUモードを決定する。なお、PUモードの決定では、例えば、PUの分割形状と、イントラ予測で用いるイントラ予測方向とが決定されてよい。また、イントラ予測方向としては、例えば、HEVCでは、35個の予測方向が規定されており、動画像符号化装置は、35個の予測方向のうちから最適な予測方向を決定してよい。ここで、最適な予測方向は、例えば、CUに対するイントラ予測において符号化コストが最小となる予測方向であってよい。なお、例えば、処理対象のブロックなどの現在の処理の対象を参照する場合に、以下では、“現”という表現を用いることがあり、例えば、処理対象のCUを現CU、処理対象のTUを現TUと呼ぶことがある。
続く、S303からS305までの処理は、選択可能なTUサイズのそれぞれに対して実行される繰り返し処理である。例えば、動画像符号化装置は、図2を参照して述べた、TUの階層:0から最大TU階層:MaxTUDepthまでの各TUの階層毎に、S303からS305の処理を繰り返してよい。S304において動画像符号化装置は、決定されたイントラ予測方向を用いて処理対象のTUの符号化コストを算出する。従って、S303からS305の繰り返し処理において動画像符号化装置は、階層:0から指定された最大TU階層:MaxTUDepthまでのTUの階層毎に、決定されたイントラ予測方向とPUモードに従って処理対象の階層の各TUの予測画像を生成する。そして、動画像符号化装置は、生成した予測画像と入力画像とを用いて、符号化コストを算出する。それにより、動画像符号化装置は、すべてのTUサイズにおける符号化コストを算出する。
続いて、S306において動画像符号化装置は、TUモードを決定する。TUモードの決定では、動画像符号化装置は、算出されたすべてのTUサイズにおける符号化コストを比較し、符号化コストが最も小さいTUサイズを、TUサイズとして決定する。なお、予測画像の生成は、例えば、非特許文献1〜3等に記載の方法を用いることができる。また、S307において動画像符号化装置は、得られたTUに対する符号化コストに基づいて、処理対象のCUサイズにおけるCUの符号化コストを算出する。従って、S301からS308までの繰り返し処理において、動画像符号化装置は、各CUサイズにおけるCUの符号化コストを算出する。
S309において動画像符号化装置は、CUモードを決定する。例えば、動画像符号化装置は、得られた各階層のCUの符号化コストを基に、最小の符号化コストとなるCUサイズを決定し、本動作フローは終了する。なお、動画像符号化装置は、以上の動作フローで決定されたイントラ予測方向、PU分割形状、TUサイズ、及びCUサイズを用いて、符号化対象CTUを符号化する処理を行ってよい。
以上で例示したように、HMではブロックサイズ(例えば、CU,TU,PU)のバリエーション毎に符号化コストを算出し、符号化コストの比較により符号化処理に用いるブロックサイズなどが決定される。そのため、最適なブロックサイズを高い精度で決定することができるが、一方で、この手法では、ブロックサイズを決定するための処理の負荷が大きく、リアルタイム処理が困難になる。
ブロックサイズを決定するための計算量を削減するための手法として、例えば、H.264において、ブロック内の画像のエッジの情報を用いて、直交変換サイズを選択する技術がある。なお、エッジとは、例えば、線画や均等色領域の境界であってよい。一例として、原画のエッジの強度が所定の閾値より小さい場合、その画像に大きな(8×8)直交変換サイズを選択し、また、それ以外の場合には小さな(4×4)の直交変換サイズを選択する。例えば、この様に直交変換サイズが選択される場合、8×8,4×4の両方の直交変換サイズについて符号化コストを算出しなくても、直交変換サイズを選択することができる。そのため、直交変換サイズの決定にかかる演算量が削減できる。
ここで、例えば、原画のエッジの強度が小さい場合、画像の絵柄が平坦であることが推測されるため、大きい直交変換サイズがよいことが推定される。そのため、原画のエッジの強度が小さい場合、大きな直交変換サイズを選択してよい。しかしながら、エッジ強度が大きい場合に小さい直交変換サイズが良いのか否かについては分からない。この場合に、安易に判定処理を省略すると、最適な直交変換サイズが選択されなくなる。また、HEVCは、H.264と比較して、16×16,32×32などの4×4よりも大きい変換符号化で適用可能なブロックサイズが増えている。そして、ブロックが大きくなると、絵柄が複雑になり、エッジの強度が閾値よりも大きいケースが多くなるため、さらに符号化効率が悪くなる。なお、例えば、H.264における直交変換サイズは、HEVCにおけるTUサイズと対応している。
そこで、第1の実施形態では動画像符号化装置は、イントラ予測における変換符号化で用いるブロックサイズを、各ブロックサイズにおけるブロックのエッジ情報を用いて決定することで、符号化コストの算出を省略し、演算負荷を低減する。以下、第1の実施形態を説明する。
<第1の実施形態>
図4は、第1の実施形態に係る動画像符号化装置40の機能ブロック構成を例示する図である。動画像符号化装置40は、例えば、制御部400及び記憶部410を含んでいる。制御部400は、例えば、設定部401、決定部402、及び変換符号化部403を含んでいてよい。また、制御部400は、例えば、図5を参照して後述するイントラ予測方向判定部501、イントラTUモード判定部502、CUモード判定部503、イントラ予測画像生成部504、差分画像生成部505を含んでいてよい。また、制御部400は、後述する直交変換・量子化部506、エントロピー符号化部507、逆直交変換・逆量子化部508、及び復号画像生成部509などを含んでいてよい。制御部400は、例えば、図6を参照して後述するエッジ情報抽出部601、エッジ方向決定部602、候補TUサイズ決定部603、TUサイズ判定部604を含んでいてよい。制御部400は、例えば、図17を参照して後述するエッジ情報抽出部1701、候補イントラ予測方向決定部1702、イントラ予測方向決定部1703を含んでいてよい。動画像符号化装置40の制御部400は、一実施形態においては、例えば、記憶部410を利用して動画像符号化プログラムを読み出して実行することで、これらの機能部として動作してよい。また、図4に示す設定部401、決定部402、及び変換符号化部403は、例えば、図5、図6、図17に示す機能ブロックの一部と対応していてよい。動画像符号化装置40の記憶部410は、例えば、動画像符号化プログラム及び動画像データなどの情報を記憶していてよい。記憶部410は、例えば、後述する復号画像記憶部510として機能してよい。制御部400に含まれる各機能部の詳細については後述する。
図5は、第1の実施形態に係る動画像符号化装置40の機能ブロック構成の別な例を示す図である。図5に示すように、動画像符号化装置40は、イントラ予測方向判定部501、イントラTUモード判定部502、CUモード判定部503、イントラ予測画像生成部504を含んでいる。また、動画像符号化装置40は、差分画像生成部505、直交変換・量子化部506、エントロピー符号化部507、逆直交変換・逆量子化部508、復号画像生成部509、及び復号画像記憶部510を含んでいる。
イントラ予測方向判定部501は、入力画像を用いて、符号化を行う対象のブロックに対して、複数のイントラ予測方向の中から最適な予測方向を選択し、イントラTUモード判定部502及びイントラ予測画像生成部504に出力する。イントラTUモード判定部502は、入力画像の輝度値データに基づいて、階層:0から指定された最大TU階層までの各TUサイズのTUのエッジの情報を抽出する。そして、イントラTUモード判定部502は、抽出されたエッジの情報に基づいて変換符号化に用いるTUサイズの候補となる候補TUサイズを決定する。イントラTUモード判定部502は、イントラ予測方向判定部501から入力されたイントラ予測方向を用いて、決定された候補TUサイズのTUの符号化コストを算出する。イントラTUモード判定部502は、算出された符号化コストのうちで最小の符号化コストを有するTUサイズを最適なTUサイズとして決定し、CUモード判定部503とイントラ予測画像生成部504とに出力する。CUモード判定部503は、イントラTUモード判定部502で算出したTUの符号化コストに基づいて得られた各CUサイズの符号化コストを比較する。そして、CUモード判定部503は、複数のCUサイズの中から最小の符号化コストを有する最適なCUサイズを選択して、イントラ予測画像生成部504に出力する。
イントラ予測画像生成部504には、イントラ予測方向判定部501からイントラ予測方向が入力される。また、イントラ予測画像生成部504には、イントラTUモード判定部502から決定されたTUサイズが入力される。イントラ予測画像生成部504には、CUモード判定部503から決定されたCUサイズが入力される。イントラ予測画像生成部504は、復号画像記憶部510に記憶された符号化対象のブロックの周辺の復号画素を参照し、入力されたイントラ予測方向、TUサイズ、及びCUサイズを用いて、符号化対象のブロックの予測画像を生成する。そして、イントラ予測画像生成部504は、生成した予測画像を差分画像生成部505及び復号画像生成部509に出力する。
差分画像生成部505は、イントラ予測画像生成部504から入力された符号化対象のブロックの予測画像と入力原画像との差分を求めて差分画像を生成し、直交変換・量子化部506へ出力する。直交変換・量子化部506は、差分画像生成部505から入力された差分画像を直交変換して得られた周波数信号を量子化し、得られた量子化信号を、エントロピー符号化部507及び逆直交変換・逆量子化部508に出力する。
エントロピー符号化部507は、入力された量子化信号をエントロピー符号化(可変長符号化)してストリームを出力する。エントロピー符号化とは、シンボルの出現頻度に応じて可変長の符号を割り当てる方式であってよい。
逆直交変換・逆量子化部508は、入力された量子化信号を逆量子化し、逆量子化した直交変換係数を逆直交変換処理してから復号画像生成部509に出力する。逆直交変換・逆量子化部508によって復号化処理が行われることにより、符号化前の差分画像と同程度の信号が得られる。
復号画像生成部509は、イントラ予測画像生成部504から入力された予測画像と、逆直交変換・逆量子化部508により復号処理された差分画像とを加算することにより、現符号化対象ブロックの画像データを再生し、復号画像記憶部510に出力する。復号画像記憶部510は、復号画像生成部509から入力された復号画像を記憶し、イントラ予測画像生成部504は、復号画像記憶部510に記憶された復号画像を読み出して利用してよい。
また、図6は、図5のイントラTUモード判定部502の機能ブロック構成を例示する図である。図6に示す例では、イントラTUモード判定部502は、例えば、エッジ情報抽出部601、エッジ方向決定部602、候補TUサイズ決定部603、及びTUサイズ判定部604を含む。
エッジ情報抽出部601は、入力画像の輝度値データに基づいて、符号化対象のブロックの全画素のエッジの情報を抽出し、エッジ方向決定部602に出力する。エッジの情報は、例えば、エッジの方向とエッジの強度などの情報を含んでよい。
エッジ方向決定部602は、エッジ情報抽出部601から入力された符号化対象のブロックに含まれる画素のエッジの情報を用いて、各階層のTU毎にエッジの情報を決定し、候補TUサイズ決定部603に出力する。なお、以降、このTUに対して決定されるエッジの情報を、エッジ情報と呼ぶことがある。エッジ情報は、例えば、TUに対して決定されるエッジの方向であるエッジ方向と、TUに対して決定されるエッジの強度であるエッジ強度とを含んでよい。候補TUサイズ決定部603は、エッジ方向決定部602が決定したTUに対するエッジ情報を用いて、各階層のTUサイズを評価するか否かを決定し、評価する対象のTUサイズを候補TUサイズとして、TUサイズ判定部604に出力する。
TUサイズ判定部604は、候補TUサイズ決定部603から入力された各候補TUサイズに対して、イントラ予測方向判定部501から入力された予測方向と入力画像を用いて予測画像を生成する。そして、TUサイズ判定部604は、各候補TUサイズの符号化コストを計算し、符号化コストが最小となるTUサイズを符号化対象のブロックの最適なTUサイズとして決定し、CUモード判定部503に出力する。
図7は、第1の実施形態に係る符号化処理の動作フローを例示する図である。動画像符号化装置40の制御部400は、例えば、入力画像をCTU単位に分割した後、それぞれのCTUに対して図7の符号化処理を行ってよい。
ステップ701(以降、ステップを“S”と記載し、例えば、S701と表記する)において、イントラ予測方向判定部501は、入力画像を用いてPUモードを決定する。PUモードの決定において、イントラ予測方向判定部501は、例えば、PUの分割形状と、イントラ予測で用いるイントラ予測方向とを決定してよい。そして、イントラ予測方向判定部501は、例えば、決定されたPUと、PUに対するイントラ予測方向を、イントラTUモード判定部502とイントラ予測画像生成部504とに出力する。
S702において、イントラTUモード判定部502は、S701で決定されたPUに対して、イントラ予測におけるTUモードの決定を行う。TUモードの決定では、例えば、変換符号化に用いるTUサイズが決定されてよい。イントラTUモード判定部502は、例えば、入力画像と、イントラ予測方向判定部501から入力されるイントラ予測方向とを用いて、階層:0から最大TU階層で指定される最大深度の階層までの複数のTUサイズの中から最適なTUサイズを決定する。そして、イントラTUモード判定部502は、決定したTUサイズをCUモード判定部503とイントラ予測画像生成部504とに出力する。なお、TUモードの判定方法についての更なる詳細は、図8〜図16を参照して後述する。
S703において、CUモード判定部503は、イントラTUモード判定部502で決定されたTUの符号化コストに基づいて得られた各CUサイズの符号化コストを比較し、複数のCUサイズの中から符号化に最適なCUサイズを決定する。そして、CUモード判定部503は、決定したCUサイズをイントラ予測画像生成部504に出力する。
S704において、イントラ予測画像生成部504は、入力された最適な符号化モードと復号画像記憶部510に記憶されている復号画像のデータとを用いて、符号化対象のブロックの予測画像を生成し、差分画像生成部505に出力する。なお、符号化モードは、例えば、CUサイズ、TUサイズ、PUの分割形状とイントラ予測方向などの情報を含んでよい。これらの情報は、イントラ予測方向判定部501、イントラTUモード判定部502、及びCUモード判定部503からイントラ予測画像生成部504にそれぞれ入力されてよい。
S705において、差分画像生成部505は、入力原画像とイントラ予測画像生成部504から入力された予測画像との差分を求め、得られた符号化対象ブロックの差分画像を直交変換・量子化部506に出力する。
S706において、直交変換・量子化部506は、差分画像生成部505から入力された差分画像を直交変換処理する。また、直交変換・量子化部506は、直交変換処理から得られた周波数信号の量子化を行い、エントロピー符号化部507に出力する。なお、S706の直交変換処理において、動画像符号化装置40の制御部400は、例えば、変換符号化部403として機能してよい。
S707において、エントロピー符号化部507は、直交変換・量子化部506から入力された量子化信号をエントロピー符号化(可変長符号化)してストリームを出力する。
S708において、逆直交変換・逆量子化部508は、直交変換・量子化部506から入力された量子化信号を逆量子化して、逆直交変換処理を行う。逆直交変換・逆量子化部508が復号化処理を行うことで、符号化対象のブロックの符号化前の差分画像と同程度の差分画像が得られる。逆直交変換・逆量子化部508は、この差分画像を復号画像生成部509に出力する。
S709において復号画像生成部509は、イントラ予測画像生成部504から入力された予測画像と、逆直交変換・逆量子化部508から入力された差分画像とを加算することで、符号化対象の現ブロックの画像データを再生し、復号画像記憶部510に出力する。復号画像記憶部510は、入力された復号画像を記憶する。そして、例えば、イントラ予測画像生成部504は、復号画像記憶部510に記憶された復号画像を読み出して利用してよい。S709の処理が完了すると、本動作フローは終了してよい。
図8は、第1の実施形態に係るイントラTUモードの判定処理の動作フローを例示する図である。図8の動作フローは、例えば、図7のS702に進むと開始してよい。なお、図8の動作フローはS701で決定されたPUのそれぞれに対して実行されてよい。
S801において、エッジ情報抽出部601は、入力画像の輝度値データに基づいて、PU内の全画素のエッジの方向とエッジの強度などのエッジ情報を検出する。
S802においてエッジ方向決定部602は、エッジ情報抽出部601から入力されたPU内の全画素のエッジ情報に基づいて、全TU階層に含まれる各TUのエッジ方向を決定する。
S803において候補TUサイズ決定部603は、決定された全TU階層の各TUのエッジ方向を用いて、符号化コストを計算して評価する対象とする候補TUサイズを決める。
S804においてTUサイズ判定部604は、候補TUサイズ決定部603で決められた候補TUサイズの符号化コストを算出し、符号化コストが最小値となるTUサイズを最適なTUサイズとして決定し、本動作フローは終了する。
以上のS801からS804のそれぞれの処理について、以下に更に詳細に説明する。S801の処理では、エッジ情報抽出部601は、処理対象のPU内の全画素のエッジの方向とエッジの強度などのエッジ情報を検出する。エッジ情報の検出は、例えば、以下のように実行されてよい。
まず、エッジ情報抽出部601は、処理対象のPU内の全画素についてエッジを検出する。エッジの検出は、ここではsobelオペレーションを用いる例を示すが、実施形態はこれに限定されるものではなく、その他の方法が使用されても良い。
以下の式3は、入力画素とSobelオペレータを例示している。
エッジ情報抽出部601は、例えば、図9の画素:eをエッジの検出対象の画素として、その周辺の8画素(画素:a〜d、及びf〜i)を入力画素として、式3に定義される加重マトリックスをかける。それにより、エッジ情報抽出部601は、画素のエッジの情報(エッジの方向、エッジの強度)の検出を行う。Sobelフィルタの結果、水平方向のエッジの強度(dy)と、垂直方向のエッジの強度(dx)が出力される。
dy = P*Y = -a - 2d - g + c + 2f + i
dx = P*X = -a - 2b - c + g + 2h + i
続いて、エッジ情報抽出部601は、得られた水平方向のエッジの強度(dy)と、垂直方向のエッジの強度(dx)とを用いて、エッジの検出対象の画素のエッジの強度(Amp)と、エッジの角度(Ang)とを算出する。なお、エッジの強度(Amp)は、以下の式4から算出されてよい。また、エッジの角度(Ang)は、以下の式5から算出されてよい。
次に、エッジ情報抽出部601は、得られたエッジの角度を用いて各画素のエッジの方向を特定する。例えば、動画像符号化方式がHEVCの場合には、HEVCで規定されている2〜34の33方向のイントラ予測方向(図10)のうちのいずれかの方向に、エッジの方向は特定されてよい。なお、HEVCでは、更に、方向0としてPlanar予測と、方向1としてDirect Current(DC)予測とが含まれている。
表1は、画素のエッジの方向を判別するための判別区間を例示している。
表1では、エッジの方向(Dir2〜Dir34)と、エッジの角度の範囲とが対応付けられている。エッジ情報抽出部601は、式5により得られたエッジの角度が表1のエッジの方向の判定区間のいずれのエッジの角度の範囲にあるかを判定することで、エッジの方向を特定してよい。例えば、式5により得られたエッジの角度が43°であった場合、その角度はDir2の42.1875°〜45°の角度範囲内にある。そのため、エッジ情報抽出部601は、エッジ方向をDir2と特定してよい。なお、上述の式5では、|Ang|<90°の範囲で角度範囲の判定を行っている。そして、tan()の値は、例えば、(-90°, -135°)の区間と、(45°, 90°)の区間で等しい。そのため、表1では、図11に示すように、例えば、(-90°, -135°)の区間を(45°, 90°)の区間に置き換え、予測方向Dir26〜Dir34の判別区間を(45°, 90°)の範囲に設定している。しかしながら、予測方向Dir26〜Dir34の判別区間は、実際には判別区間(-90°, -135°)と対応しており、例えば、図10に示す様にDir34とDir2との実際の角度差は180°近くある。そして、エッジ情報抽出部601は、例えば、以上の表1を用いて処理対象のPU内の全画素のエッジ情報(方向と強度)を検出し、エッジ方向決定部602に出力する。
S802の処理では、エッジ方向決定部602は、処理対象のPU内に含まれる画素のそれぞれに対して決定されたエッジ情報(例えば、方向と強度)に基づいて、処理対象のPU内の各TU階層におけるTUのそれぞれについてエッジ方向を決定する。各TU階層のTUのエッジ方向の決定は、エッジ情報抽出部601から入力された処理対象のPU内の画素のエッジ情報を用いて実行されてよい。ここでは、図12に示すように、MaxTUDepth=1の場合での、処理対象の現TUのエッジ方向:Edge0と、次の階層の4TUのそれぞれのエッジ方向:Edge1〜Edge4の決定を例として説明する。
エッジ方向決定部602は、例えば、最大TU階層:MaxTUDepthに設定されている最も深い階層である階層:1の4つのTU(図12のTU1〜TU4)のエッジ方向を決定する。例えば、エッジ方向決定部602は、TU1に含まれる全画素に対するエッジの強度を、S801で特定されたエッジの方向毎に集計して各エッジの方向(例えば、Dir2〜33)毎にエッジの強度和(Amp_TU (Dir))を求める。エッジの強度和は、例えば、各エッジの方向毎に、以下の式6により算出されてよい。なお、式6においてAmp_Pixel(Dir)は、TU1に含まれる全画素のうちで、エッジの方向が(Dir)で示される方向を向いている画素のエッジの強度であってよい。また、(Dir)は、例えば、Dir2〜33の方向のうちのいずれかの方向であってよい。
Amp_TU(Dir)=ΣAmp_Pixel(Dir) ・・・式6
そして、エッジ方向決定部602は、得られた各エッジの方向におけるエッジの強度和のうちで、エッジの強度和が最も高いエッジの方向を、TU1のエッジ方向:Edge1として決定してよい。また、エッジ方向決定部602は、TU1と同様にしてTU2〜TU4についても演算を行い、エッジ方向:Edge2〜Edge4を決定してよい。
続いて、エッジ方向決定部602は、エッジの方向毎に階層:0のTU0のエッジの強度和を算出し、エッジの強度和が最大となるエッジの方向をTU0のエッジ方向:Edge0として決定する。なお、エッジ方向決定部602は、例えば、以下の式7に示す様に、階層:1において式6により算出されたTU1〜TU4における各エッジの方向のエッジの強度和を加算することで、TU0のエッジの方向毎のエッジの強度和を算出してもよい。或いは、別の実施形態では、TU0のエッジの方向毎のエッジの強度和は、式6により算出されてもよい。
Amp_TU0(Dir)=Amp_TU1(Dir)+Amp_TU2(Dir)+Amp_TU3(Dir)+Amp_TU4(Dir) ・・・式7
なお、以上の例では、MaxTUDepth = 1の場合を例に説明を行ったが、MaxTUDepthが1よりも大きい場合についても同様に、エッジ方向決定部602は、各階層の各TUのエッジの強度和を算出することができる。例えば、エッジ方向決定部602は、入力された全画素のエッジの方向とエッジの強度とを用いて、最大TU階層:MaxTUDepthで指定される一番小さいTUサイズの階層の各TUの各エッジの方向毎のエッジの強度和を算出してよい。そして、エッジ方向決定部602は、得られた階層内の各エッジの方向でのエッジの強度和を用いて、式7により上の階層におけるTUの各エッジの方向毎のエッジの強度和を算出してもよい。即ち、例えば、或る階層におけるTUの各エッジの方向でのTUのエッジの強度和は、そのTUに含まれる下の階層のTUのエッジの強度和を、各エッジの方向毎に足し合わせることで得られてよい。そして、エッジ方向決定部602は、TU毎に得られる各エッジの方向毎のエッジの強度和のうちで、エッジの強度和が最も高いエッジの方向を、そのTUのエッジ方向として特定してよい。エッジ方向決定部602は、全てのTU階層の各TUに対して決定したエッジ方向を、候補TUサイズ決定部603に出力する。なお、エッジ方向決定部602は、例えば、TU内の全画素のエッジの強度和が所定の閾値Thよりも小さい場合、表1に示す様に、そのTUに対してはエッジ方向が無しと判定してよい。
S803の処理では、候補TUサイズ決定部603は、決定された全TU階層の各TUのエッジ方向を用いて、候補TUサイズを決める。候補TUサイズは、例えば、PUの変換符号化で用いるTUサイズとして決定される可能性のある候補となるTUサイズであってよい。
以下では、例えば、図12に例示するMaxTUDepth=1の場合に階層:0のTUのエッジ方向Edge0と、階層:1の4TUのエッジ方向Edge1〜Edge4とを用いて、階層:0及び階層:1を候補TUサイズとするかを判定する場合を例示する。
(ケース1)処理対象のTU内の全画素のエッジの強度和が所定の閾値よりも小さい
処理対象のTUの原画において、画素のエッジの強度和が所定の閾値よりも小さい(例えば、以下の式8が満たされる)場合、処理対象のTUの全画素が似ており、TU内の画像が平坦であると考えられる。なお、エッジの強度和の判定で用いる所定の閾値:Thは、TU内のエッジの強度和が閾値Thよりも低い場合に、TU内の画像が平坦であると推測できる値に設定されていてよく、TUサイズに応じて個別の値が設定されていてよい。また、以下の説明では、処理対象のTU内の全画素のエッジの強度和を、処理対象のTUのエッジ強度と呼ぶことがある。
ΣAmp < Th ・・・式8
ΣAmp:TU内の全画素のエッジの強度和
Th:所定の閾値
そして、例えば、この様な平坦な画像で符号化コストを計算した場合について述べる。なお、TUサイズは、周波数領域の特性を考慮して決定されることが好ましいため、符号化コストは、例えば、上述の式2のようにSATDを使って計算されてよい。
そして、例えば、TU内の画像の絵柄が平坦である場合、イントラ予測方向判定部501によりイントラ予測において決定されるイントラ予測方向はDC予測かPlanar予測となると推測される。この場合、得られた予測方向を使って生成される予測画像も平坦になるため、原画像と予測画像の差分画像もまた、図13に示すように平坦になる。従って、差分画像を直交変換した際の係数が低周波に集中することが予測され、DC以外の係数はほとんど0となることが推測される。ここで、直交変換の特性により、階層:0のTU0に対する係数の絶対値和:SATDと、階層:1の4つのTU(TU1〜TU4)に対する係数の絶対値和の合計(SATD+SATD+SATD+SATD)とはほぼ同じ値になることが予想される。一方で、TUをより細かく分割した場合、分割されたTUの数の分だけBits(TUサイズなどの情報など)を符号化するための符号化コストがかかり、符号化コストが大きくなってしまう。そのため、このような場合では、候補TUサイズ決定部603は、階層:0のTUサイズが最適なTUサイズであると推測でき、現TUサイズを候補TUサイズとして設定してよい。また、候補TUサイズ決定部603は、階層:1のTUサイズなどの現TUサイズよりも小さいTUサイズの評価を省略することができる。
つまり、例えば、処理対象の階層のTU内の全画素のエッジの強度和が所定の閾値よりも小さい場合、TU内の画像が平坦であると考えられるため、処理対象の階層のTUよりも深い階層のTUについての符号化コストの算出を省略することができる。
(ケース2)処理対象のTUの全画素のエッジの強度和が閾値より大きい
処理対象のTUのエッジの強度和が閾値より大きい場合、候補TUサイズ決定部603は、処理対象のTUより深い1つ下の階層のTUのエッジ方向に基づいて、処理対象のTUと1つ下の階層のTUの符号化コストを算出するか否かを判定する。
(ケース2−1)処理対象のTUより深い1つ下の階層の各TUのエッジ方向の差が大きい
候補TUサイズ決定部603は、処理対象のTUよりも深い1つ下の階層の各TUのエッジ方向の差が大きいか否かを判定する。図14は、処理対象のTUの1つ下の階層のTUのエッジ方向の差が大きい場合と、小さい場合とを例示する図である。図14(a)は、処理対象のTU(ここでは、TU0)より深い1つ下の階層のTU(ここでは、TU1〜TU4)のエッジ方向の差が大きい場合を例示しており、図示されるようにTU1〜TU4のエッジ方向はばらばらな方向を向いている。そして、候補TUサイズ決定部603は、例えば、このTU1〜TU4のエッジ方向の差が大きいか否かを判定してよい。
また、処理対象のTUの1つ下の階層の各TUのエッジ方向の差が大きいか否かの判定は、例えば以下のように実施されてよい。上述のように、第1の実施形態においては、エッジ方向は、イントラ予測方向に合わせて、33方向のうちのいずれかの方向に特定されている。そして、イントラ予測方向では、Dir2〜Dir34の角度範囲は図10に示す様に角度の大きさに従って順に並んでいる。そのため、例えば、エッジ方向に付したDir2の“2”や、Dir34の“34”の数字の差が大きいことは、それら2つの方向の角度差が大きいことを表している。そこで、第1の実施形態においては、候補TUサイズ決定部603は、エッジ方向を示す数字の差が大きいか否かによりTUのエッジ方向の差が大きいか否かを判定してよい。候補TUサイズ決定部603は、例えば、式9のように、処理対象のTUの1つ下の階層の各TUのエッジ方向の数字の最大値と最小値との差を求める。そして、候補TUサイズ決定部603は、最大値と最小値との差が閾値:Th2よりも大きければ、TUのエッジ方向の差が大きいと判定してよい。
Max(Dir)-Min(Dir) > Th2 ・・・式9
Max(Dir):エッジ方向の数字の最大値
Min(Dir):エッジ方向の数字の最小値
Th2:所定の閾値
そして、TUのエッジ方向の差が大きい場合、階層:0のTUに対して、ブロックの原画の絵柄が複雑であることが推測される。原画の絵柄が複雑であるため、イントラ予測方向判定部501によりイントラ予測において決定されたイントラ予測方向を使って生成される予測画像と原画との差分画像の絵柄も複雑になる。この場合、直交変換後の係数の集中性が悪くなり、非0係数の個数が多くなる。従って、SATDの値が大きくなり、符号化コストが大きくなる。また、非0係数の数が多いため、係数の符号化に必要な情報量も増加する。
一方で、階層:1の4TUに対して、それぞれのTU内ではエッジ方向に沿って画素間の相関が高い。また、決められたイントラ予測方向を使って生成した予測画像との差分画像も或る方向に沿って画素間の相関が高い。例えば、図14(a)のTU1に対して、イントラ予測方向がDC(平均予測)であれば、差分画像は原画と同じく垂直方向の相関が高くなる。また、イントラ予測方向が水平方向としたら、差分画像は斜め方向の相関が高くなる。この場合、直交変換後の係数は、或る周波数の周辺に集中しており、非0係数の個数が少ないと考えられる。従って、SATDの値が小さくなり、符号化コストが小さくなる。また、非0係数の数が少ないため、係数の符号化に必要な情報量が少なくなる。
この場合、階層:0の符号化コストは階層:1より大きくなると推測でき、階層:0が選ばれる可能性は低いと考えられるため、候補TUサイズ決定部603は、階層:0の符号化コストを算出せずに、階層:1のTUの評価に進むことができる。そして、候補TUサイズ決定部603は、階層:1のTUサイズを候補TUサイズとして設定してよい。なお、この場合に、例えば、TUの階層が図14(a)に例示するように2階層であれば、候補TUサイズ決定部603は、最適なTUサイズを階層:1のTUサイズに決定することができる。
つまり、処理対象のTUの1つ下の階層の4TUのエッジ方向の差が大きく、4TUのエッジ方向に、互いの向きが所定の値以上離れているエッジ方向が含まれている場合、処理対象のTUサイズは符号化において不適切であることが推測できる。従って、処理対象のTUサイズについては符号化コストを算出しなくてもよく、1つ下の階層のTUサイズの判定に進むことができる。
(ケース2−2)処理対象のTUより深い1つ下の階層の各TUのエッジ方向の差が小さい
候補TUサイズ決定部603は、処理対象のTUより深い1つ下の階層の4TUのエッジ方向の差が小さいか否かを判定する。図14(b)は、処理対象のTU(ここでは、TU0)より深い1つ下の階層のTU(ここでは、TU1〜TU4)のエッジ方向の差が小さい場合を例示しており、図示されるようにTU1〜TU4のエッジ方向は類似した方向を向いている。そして、候補TUサイズ決定部603は、例えば、式9で述べたMax(Dir)とMin(Dir)とを用いて差分を計算し、得られた差分が所定の閾値:Th3より小さい場合にエッジ方向間の差が小さいと判定してよい。
Max(Dir)-Min(Dir) < Th3 ・・・式10
Max(Dir):エッジ方向の数字の最大値
Min(Dir):エッジ方向の数字の最小値
Th3:所定の閾値
そして、各TUのエッジ方向の差が小さい場合、階層:0のTUに対して、原画はエッジ方向に沿って画素間の相関が高いことが推測される。そのため、イントラ予測方向判定部501により決定されたイントラ予測方向はエッジ方向と似ていると考えられる。この場合、原画と、イントラ予測方向判定部501によりイントラ予測において決定されたイントラ予測方向を使って生成された予測画像との差分画像は、平坦であるか、若しくはエッジ方向に沿って画素間の相関が高くなる。そのため、直交変換後の係数が低周波か、或る周波数の周辺に集中し、非0係数の個数が少ないと考えられる。
一方で、階層:1のTUに対して、TUをより細かく分割すると、分割されるTUの数の分だけBits(TUサイズなどの情報など)を符号化するための符号化コストがかかり、符号化コストが大きくなる。従って、この場合は、候補TUサイズ決定部603は、処理対象の現TUサイズが最適なTUサイズであることが推測できるため、現TUサイズを候補TUサイズとして設定してよい。また、候補TUサイズ決定部603は、階層:1のTUサイズなどの現TUサイズよりも小さいTUサイズの評価を省略することができる。
つまり、処理対象のTUの1つ下の階層の4TUのエッジ方向の差が小さく、エッジ方向の向きが所定の範囲内で類似している場合、処理対象の階層のTUよりも深い階層のTUについての符号化コストの算出を省略することができる。
(ケース2−3)その他の場合:(中間値)
処理対象のTUの1つ下の階層の4TUのエッジ方向の差が上述の閾値:Th2と閾値:Th3との間にある場合には階層:0と階層:1とでどちらの符号化コストが小さいかは、両方の符号化コストを算出することで決定することができる。
Th3 < Max(Dir)-Min(Dir) < Th2 ・・・式11
Max(Dir):エッジ方向の数字の最大値
Min(Dir):エッジ方向の数字の最小値
Th2:所定の閾値
Th3:所定の閾値
以上で述べたように、S803の処理では、候補TUサイズ決定部603は、ケース1、ケース2−1〜ケース2−3の判定に従って、TUのエッジ方向を用いて、候補TUサイズを設定してよい。以下では、図15を参照して、これらのケース1、ケース2−1〜ケース2−3の判定を用いた候補TUサイズを設定する処理の動作フローを例示する。図15の動作フローは、例えば、図8の動作フローにおいてS803に進むと開始してよい。また、図15の動作フローは、S701で決定されたPUのそれぞれに対して実行されてよい。
S1501において候補TUサイズ決定部603は、候補TUサイズに設定するか否かを判定する処理対象となるTUのTUサイズを、最も浅いTUの階層である階層:0に設定する。S1502において候補TUサイズ決定部603は、エッジ方向決定部602から入力されるTUのエッジ情報を用いて、処理対象のTUのエッジの強度和が所定の閾値:Thより大きいか否かを判定する。S1502において処理対象のTUのエッジの強度和が所定の閾値:Th以下である場合(S1502がNo)には、フローはS1505に進む。S1505において候補TUサイズ決定部603は、処理対象のTUのTUサイズを候補TUサイズに設定し、処理対象のTUよりも小さいTUサイズをすべて候補TUサイズには設定せずに、本動作フローを終了し、フローはS804へと進む。なお、候補TUサイズに設定されたTUサイズは、後述する図16の動作フローにおいて符号化コストの算出に用いられるTUサイズである。また、候補TUサイズに設定されなかったTUサイズは、後述する図16の動作フローにおいて符号化コストの算出に用いられないTUサイズである。
また、S1502において処理対象のTUのエッジの強度和が所定の閾値:Thより大きい場合(S1502がYes)、フローはS1503へと進む。S1503において、候補TUサイズ決定部603は、エッジ方向決定部602から入力された1つ下の階層の4TUのエッジ方向を用いて、エッジ方向間の差を算出する。S1504において候補TUサイズ決定部603は、S1503で算出されたエッジ方向の差が閾値:Th3よりも小さいか否かを判定する。エッジ方向の差が小さい場合(S1503がYes)、フローはS1505に進む。一方、S1503においてエッジ方向の差が閾値:Th3よりも小さくない場合(S1504がNo)、フローはS1506へと進む。
S1506において候補TUサイズ決定部603は、エッジ方向の差が閾値:Th2よりも大きいか否かを判定する。エッジ方向の差が閾値:Th2よりも大きい場合(S1506がYes)、フローはS1508に進む。S1508において候補TUサイズ決定部603は、処理対象のTUのTUサイズを候補TUサイズに設定せずに、処理対象のTUよりも1つ下の階層のTUのTUサイズを候補TUサイズとして設定し、フローはS1509に進む。一方、S1506においてエッジ方向の差が閾値:Th2よりも大きくない場合(S1506がNo)、フローはS1507へと進む。S1507において候補TUサイズ決定部603は、処理対象のTUのTUサイズと、1つ下の階層のTUのTUサイズとを候補TUサイズとして設定し、フローはS1509へと進む。
S1509において候補TUサイズ決定部603は、処理対象となるTUのTUサイズを1つ下の階層に移動させる。S1510において候補TUサイズ決定部603は、移動先の1つ下の階層は、最大TU階層:MaxTUDepthに指定されている値よりも小さいか否かを判定する。移動先の1つ下のTUの階層が最大TU階層:MaxTUDepthよりも小さい場合(S1510がYes)、フローはS1502へと戻り、移動先の1つ下の階層のTUサイズのTUを処理対象として、処理を繰り返す。なお、S1510においてYESと判定される場合、候補TUサイズ決定部603は、処理対象のTUから1つ下のTUの階層に移動する際に4分木分割により得られる4つのTUのそれぞれを処理対象のTUとして、S1502以降の処理を実行してよい。一方、S1510において移動先の1つ下の階層が最大TU階層:MaxTUDepthである場合(S1510がNo)、本動作フローは終了し、フローはS804へと進む。なお、S803及び図15の動作フローにおいて、動画像符号化装置40の制御部400は、例えば、設定部401として機能してよい。
S804の処理では、TUサイズ判定部604は、候補TUサイズ決定部603で設定された候補TUサイズのTUの符号化コストを算出し、算出された符号化コストを用いて、符号化コストが最小値となる最適なTUサイズを決定する。図16は、S804で実行される第1の実施形態に係るTUサイズの決定処理の動作フローを例示する図である。図16の動作フローは、図8のS804へと進むと開始してよい。また、図16の動作フローは、S701で決定されたPUのそれぞれに対して実行されてよい。
S1601においてTUサイズ判定部604は、処理対象のTUのサイズを最大TU階層:MaxTUDepthの階層のTUサイズ(即ち、最小のTUサイズ)に設定する。S1602において、TUサイズ判定部604は、候補TUサイズ決定部603から出力された結果に基づいて、処理対象の階層のTUのそれぞれについて、候補TUサイズに設定されているか否かを判定する。そして、判定対象のTUが候補TUサイズに設定されている場合(S1602がYes)、フローはS1603へと進む。S1603においてTUサイズ判定部604は、判定対象のTUの符号化コストを算出する。
一方、S1602において、判定対象のTUが候補TUサイズに設定されていない場合(S1602がNo)、フローはS1604へと進む。S1604においてTUサイズ判定部604は、判定対象のTUの符号化コストを算出せずに、符号化コストを所定の最大値に設定する。それにより、符号化コストが所定の最大値に設定された判定対象のTUは、符号化コストが高いため、後述するS1605の処理においてTUサイズとして決定されなくなる。S1605において、TUサイズ判定部604は、現階層のTUのそれぞれについて、現階層のTUの符号化コストを、そのTUに含まれる1つ下の階層の4つのTUの符号化コストの合計と比較する。そして、TUサイズ判定部604は、符号化コストの小さい方の階層の候補TUサイズをTUサイズとして決定する。なお、S1605において現階層が最大TU階層:MaxTUDepthの階層である場合には、1つ下の階層は存在しない。そのため、TUサイズ判定部604は、現階層の候補TUサイズをTUサイズとして決定してよい。S1606において、TUサイズ判定部604は、処理対象となるTUのTUサイズを1つ上の階層に移動させる。S1606においてTUサイズ判定部604は、移動先の1つ上の階層の数字が0より小さいか否かを判定する。移動先の1つ上のTUの階層の数字が0より小さくない場合(S1607がNo)、フローはS1602へと戻り、移動先の1つ上の階層のTUサイズのTUを処理対象として、処理を繰り返す。一方、移動先の1つ上のTUの階層の数字が0より小さい場合(S1607がYes)、本動作フローは終了し、図8の動作フローも終了し、フローはS703へと進む。なお、S804及び図16の動作フローにおいて、動画像符号化装置40の制御部400は、例えば、決定部402として機能してよい。
以上の図8から図16で述べたように、処理対象のTU内の全画素のエッジの強度和が所定の閾値よりも小さい場合、TU内の画像が平坦であると考えられる。そのため、第1の実施形態にでは動画像符号化装置40は、処理対象のTU内の全画素のエッジの強度和が所定の閾値よりも小さい場合、処理対象のTUよりも深い階層のTUのサイズを候補TUサイズに設定しない。従って、動画像符号化装置40は、処理対象の階層のTUよりも深い階層のTUについての符号化コストの算出を省略することができる。
また、処理対象のTU内の全画素のエッジの強度和が所定の閾値よりも大きく、また、処理対象のTUの1つ下の階層の4TUのエッジ方向の差が小さく、エッジ方向の向きが所定の範囲内で類似しているとする。この場合、直交変換後の係数が低周波か、或る周波数の周辺に集中しており、非0係数の個数が少ないと考えられる。そのため、第1の実施形態では動画像符号化装置40は、処理対象のTUのサイズを候補TUサイズに設定する。また、動画像符号化装置40は、処理対象のTUよりも深い階層のTUのサイズを候補TUサイズに設定しない。従って、動画像符号化装置40は、処理対象のTUよりも深い階層のTUのサイズの符号化コストの計算を省略することができる。
更に、処理対象のTU内の全画素のエッジの強度和が所定の閾値よりも大きく、また、処理対象のTUの1つ下の階層の4TUのエッジ方向の差が大きく、4TUのエッジ方向に互いの向きが所定の値以上離れているエッジ方向が含まれているとする。この場合、処理対象のTUの差分画像の絵柄が複雑であると考えられる。そのため、処理対象のTUの直交変換後の係数の集中性が悪くなり、非0係数の個数が多くなると考えられる。一方、この場合でも、処理対象のTUの1つ下の階層の4TUは、それぞれのTU内ではエッジ方向に沿って画素間の相関が高いため、1つ下の階層の4TUを直交変換した場合、係数が或る周波数の周辺に集中しており、非0係数の個数が少ないと考えられる。そのため、第1の実施形態では動画像符号化装置40は、処理対象のTUのサイズを候補TUサイズに設定しない。また、動画像符号化装置40は、処理対象のTUよりも深い階層のTUのサイズを候補TUサイズと設定するか否かの評価を続ける。それにより、処理対象のTUのサイズでの符号化コストの計算を省略することができる。
従って、第1の実施形態によれば、動画像符号化装置40はイントラ予測における変換符号化で用いるブロックサイズを決定するための演算負荷を低減することができる。
<第2の実施形態>
上述の第1の実施形態では、イントラTUモード判定部502に含まれるエッジ情報抽出部601がエッジ情報を特定する例が述べられている。しかしながら、実施形態はこれに限定されるものではない。例えば、イントラ予測方向判定部501が、イントラ予測方向を決定する際にエッジ情報を利用することがある。例えば、イントラ予測方向を決定する際に、35方向全ての符号化コストを計算すると演算量が多くなってしまう。そこで、まず、エッジの情報を検出して、おおよそのブロックの絵柄の方向を特定し、その絵柄の方向に基づいて符号化コストが最小となる可能性の高いイントラ予測方向の候補を選択する。そして、イントラ予測方向の候補について符号化コストを計算することで、イントラ予測方向を決定することがある。例えば、この場合には、イントラ予測方向判定部501が決定したエッジ情報を、イントラTUモード判定部502においても流用することができ、イントラTUモード判定部502がエッジ情報を特定する処理を省略することができる。以下、図17及び図18を参照して、第2の実施形態を説明する。
図17は、第2の実施形態に係るイントラ予測方向判定部501及びイントラTUモード判定部502の機能ブロック構成を例示する図である。図17(a)は、第2の実施形態に係るイントラ予測方向判定部501の機能ブロック構成を例示している。イントラ予測方向判定部501は、例えば、エッジ情報抽出部1701、候補イントラ予測方向決定部1702、及びイントラ予測方向決定部1703を含んでいる。
エッジ情報抽出部1701は、入力画像の輝度値データに基づいて、符号化対象のPU内の画素のエッジの方向及びエッジの強度などのエッジ情報を抽出し、候補イントラ予測方向決定部1702とイントラTUモード判定部502とに出力する。候補イントラ予測方向決定部1702は、入力されたPU内の画素のエッジ情報からエッジ方向を決定し、エッジ方向とその周辺の複数のイントラ予測方向を候補イントラ予測方向に決定し、イントラ予測方向決定部1703に出力する。イントラ予測方向決定部1703は、入力画像と候補イントラ予測方向決定部1702から入力された複数の予測方向に対して、PUの符号化コストを算出する。そして、イントラ予測方向決定部1703は、符号化コストが最小となる予測方向を、PUに対する最適な予測方向に決定し、イントラTUモード判定部502とイントラ予測画像生成部504とに出力する。
また、図17(b)は、第2の実施形態に係るイントラTUモード判定部502の機能ブロック構成を例示している。イントラTUモード判定部502は、例えば、エッジ方向決定部602、候補TUサイズ決定部603、及びTUサイズ判定部604を含んでいる。エッジ方向決定部602は、イントラ予測方向判定部501から入力された処理対象のPU内に含まれる画素のそれぞれに対して決定されたエッジ情報を用いて、各階層のTUのエッジ方向を決定し、候補TUサイズ決定部603に出力する。また、候補TUサイズ決定部603、及びTUサイズ判定部604は、例えば、第1の実施形態と同様に動作してよい。
図18は、イントラ予測方向判定部501に含まれる機能ブロックが実行する第2の実施形態に係るイントラ予測方向の決定処理を例示する図である。
S1801においてエッジ情報抽出部1701は、入力画像の輝度値データに基づいて、符号化対象のPU内の全画素のエッジの方向とエッジの強度などのエッジ情報を算出し、候補イントラ予測方向決定部1702とイントラTUモード判定部502に出力する。S1802において、候補イントラ予測方向決定部1702は、入力されたエッジ情報からエッジ方向を決定する。S1803において、候補イントラ予測方向決定部1702は、エッジ方向とその周辺の複数の予測方向を候補イントラ予測方向に決定し、イントラ予測方向決定部1703に出力する。S1804においてイントラ予測方向決定部1703は、入力画像と候補イントラ予測方向決定部1702から入力された複数の候補イントラ予測方向に対して、符号化コストを算出する。そして、イントラ予測方向決定部1703は、符号化コストが最小となる候補イントラ予測方向を最適なイントラ予測方向に決定し、イントラTUモード判定部502とイントラ予測画像生成部504とに出力し、本動作フローは終了する。
以上で述べたように、第2の実施形態ではイントラ予測方向判定部501に含まれるエッジ情報抽出部1701は、符号化対象のPU内の画素のエッジの方向とエッジの強度などのエッジ情報を算出する。そして、エッジ情報抽出部1701は、候補イントラ予測方向決定部1702とイントラTUモード判定部502にエッジ情報を出力する。
また、第2の実施形態では、イントラTUモード判定部502は、図8の動作フローと類似する動作フローを実行してよい。しかしながら、例えば、S801の処理については、イントラ予測方向判定部501から入力される符号化対象のPU内の全画素のエッジ情報を流用することで、省略することができる。従って、第2の実施形態によれば、第1の実施形態が奏する効果に加えて、イントラ予測方向判定部501から入力される符号化対象のPU内の全画素のエッジ情報をTUサイズの決定に流用するため、TUサイズの決定にかかる演算量を更に削減することができる。
また、以上でいくつかの実施形態を例示したが、実施形態はこれに限定されるものではない。例えば、上記の例では、HEVCによる動画像符号化を例として説明したが、実施形態はこれに限定されるものではない。例えば、H.264などの直交変換サイズが複数利用可能な他の動画像符号化方式でも、イントラ予測における適した直交変換サイズを決定するために、上述の実施形態を適用することで、符号化コストを計算する対象のブロックサイズの数を削減することができる。
また、例えば、上述の実施形態では、TUに対するエッジ強度として、TU内の全画素のエッジの強度和を用いる例を示したが、実施形態で利用可能なTUのエッジ強度はこれに限定されるものではない。別の実施形態では、TUのエッジの強度を表すことが可能な、例えばTU内の全画素の平均値などのその他の代表値を用いて、TU内の画像が平坦であるか否かの判定が実行されてもよい。
また、例えば、上述のエッジの強度和の判定で用いる所定の閾値:Thは、TU内のエッジの強度和が閾値Thよりも低い場合に、TU内の画像が平坦であると推測できる値に設定されていてよく、また、TUサイズに応じて個別の値が設定されていてよい。また、上述の閾値Th2は、処理対象のTUより深い1つ下の階層の各TUのエッジ方向の差が閾値Th2よりも大きい場合、処理対象のTUの原画の絵柄が複雑であり、処理対象のTUの直交変換後の非0係数の個数が多くなると推定できる値に設定されてよい。上述の閾値Th3は、処理対象のTUより深い1つ下の階層の各TUのエッジ方向の差が閾値Th3よりも小さい場合、処理対象のTUの原画がエッジ方向に沿って画素間の相関が高く、直交変換の後の非0係数の個数が少なくなると推定できる値に設定されてよい。
また、例えば、HEVCやH.264では、絵柄の複雑さに応じて量子化パラメータ(QP:Quatization Parameter)の値が設定される。QPは、例えば、動画像を変換符号化して得られた周波数信号に対して実行される量子化を制御するパラメータである。例えば、絵柄が複雑な場合には、動画像符号化装置40の制御部400は、QPを小さく設定して細かいブロックサイズが選ばれ易くする。また、例えば、絵柄が平坦である場合には、制御部400は、QPを大きく設定して大きなブロックサイズが選ばれ易くする。そのため、実施形態1及び実施形態2において、制御部400は、処理対象のTUのエッジの強度和の強さとエッジ方向の差の大きさの判定に使う閾値(例えば、閾値Th、Th2、Th3)を、この量子化パラメータの値に応じて変更してもよい。例えば、制御部400は、QPの値が大きくなると、大きなブロックサイズがより選ばれやすくなるように閾値により大きな値を設定してよい。また、制御部400は、例えばQPの値が小さくなると、小さなブロックサイズがより選ばれやすくなるように閾値により小さな値を設定してよい。この様に、QPに応じて閾値を変更することにより、どんなビットレートでも適切なTUサイズを選択することができるため、画質を向上させることができる。
また、例えば、図3、図7、図8、図15、図16、及び図18の動作フローは例示であり、実施形態はこれに限定されるものではない。例えば、図3、図7、図8、図15、図16、及び図18の動作フローは、可能な場合には、処理の順番が変更されてもよく、別に更なる処理を含んでいてもよく、又は、一部の処理が省略されてもよい。
また、一実施形態に係る動画像符号化装置40は、ハードウェア回路として実装することもでき、例えば、図19に示すような情報処理装置(コンピュータ)1900を用いて実現することもできる。情報処理装置1900は、プロセッサ1901、メモリ1902、入力装置1903、出力装置1904、記憶装置1905、媒体駆動装置1906、及びネットワーク接続装置1907を含み、これらの構成要素はバス1909により互いに接続されている。
メモリ1902は、例えば、Read Only Memory(ROM)、Random Access Memory(RAM)、フラッシュメモリ等の半導体メモリである。メモリ1902は、動画像符号化処理に用いられる動画像符号化プログラム及び例えば動画像データなどのデータを格納する。図4の記憶部410、並びに図5の復号画像記憶部510は、例えば、メモリ1902であってよい。
プロセッサ1901は、例えば、Central Processing Unit(CPU)であってよい。また、図4の制御部400は、例えば、プロセッサ1901であってよい。プロセッサ1901は、メモリ1902を利用して動画像符号化プログラムを実行することにより、例えば、図4の設定部401、決定部402、及び変換符号化部403として動作してよい。また、プロセッサ1901は、例えば、図5のイントラ予測方向判定部501、イントラTUモード判定部502、CUモード判定部503、イントラ予測画像生成部504として動作してよい。プロセッサ1901は、例えば、差分画像生成部505、直交変換・量子化部506、エントロピー符号化部507、逆直交変換・逆量子化部508、復号画像生成部509として動作してよい。プロセッサ1901は、例えば、図6のエッジ情報抽出部601、エッジ方向決定部602、候補TUサイズ決定部603、TUサイズ判定部604として動作してよい。プロセッサ1901は、例えば、図17のエッジ情報抽出部1701、候補イントラ予測方向決定部1702、イントラ予測方向決定部1703として動作してよい。
入力装置1903は、例えば、キーボード、ポインティングデバイス等であり、ユーザ又はオペレータからの指示や情報の入力に用いられる。出力装置1904は、例えば、表示装置、プリンタ、スピーカ等であり、ユーザ又はオペレータへの問い合わせや処理結果の出力に用いられる。
記憶装置1905は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク装置、テープ装置等である。記憶装置1905は、ハードディスクドライブであってもよい。情報処理装置1900は、記憶装置1905に動画像符号化プログラム及び例えば動画像データなどのデータを格納しておき、それらをメモリ1902にロードして使用することができる。
媒体駆動装置1906は、可搬型記録媒体1910を駆動し、その記録内容にアクセスする。可搬型記録媒体1910は、メモリデバイス、フレキシブルディスク、光ディスク、光磁気ディスク等である。可搬型記録媒体1910は、Compact Disk Read Only Memory(CD−ROM)、Digital Versatile Disk(DVD)、又はUniversal Serial Bus(USB)メモリであってもよい。ユーザ又はオペレータは、この可搬型記録媒体1910に動画像符号化プログラム及び例えば動画像データなどのデータを格納しておき、それらをメモリ1902にロードして使用することができる。
このように、動画像符号化プログラム及び例えば動画像データなどのデータを格納するコンピュータ読み取り可能な記録媒体は、メモリ1902、記憶装置1905、又は可搬型記録媒体1910のような、物理的な(非一時的な)記録媒体である。
ネットワーク接続装置1907は、Local Area Network(LAN)、インターネット等の通信ネットワークに接続され、通信に伴うデータ変換を行う通信インタフェースである。ネットワーク接続装置1907は、動画像復号装置に対して符号化ストリームを出力する出力インタフェースとして用いることもできる。情報処理装置1900は、動画像符号化プログラム及び例えば動画像データなどのデータを外部の装置からネットワーク接続装置1907を介して受信し、それらをメモリ1902にロードして使用することもできる。
なお、図19に示す情報処理装置1900のハードウェア構成は例示であり、実施形態はこれに限定されるものではない。例えば、情報処理装置1900は、用途や条件に応じて一部の構成要素が省略されていてもよい。例えば、ユーザ又はオペレータとのインタフェースが利用されない場合は、入力装置1903及び出力装置1904を省略してもよい。また、情報処理装置1900が可搬型記録媒体1910にアクセスしない場合は、媒体駆動装置1906を省略してもよい。
また、例えば、別の実施形態では、上述の動画像符号化装置40の制御部400の一部又は全部の機能はFPGA及びSoCなどによるハードウェアとして実装されてもよい。なお、FPGAは、Field Programmable Gate Arrayの略称である。SoCは、System-on-a-chipの略称である。
上述の実施形態を含むいくつかの実施形態は、上述の実施形態の各種変形形態及び代替形態を包含するものとして当業者には理解される。例えば、各種実施形態は、構成要素を変形して具体化されてよい。また、上述した実施形態に開示されている複数の構成要素を適宜組み合わせることにより、種々の実施形態が実施されてよい。更には、実施形態に示される全構成要素からいくつかの構成要素を削除して又は置換して、或いは実施形態に示される構成要素にいくつかの構成要素を追加して種々の実施形態が実施されてよい。
40 動画像符号化装置
400 制御部
401 設定部
402 決定部
403 変換符号化部
410 記憶部
501 イントラ予測方向判定部
502 イントラTUモード判定部
503 CUモード判定部
504 イントラ予測画像生成部
505 差分画像生成部
506 直交変換・量子化部
507 エントロピー符号化部
508 逆直交変換・逆量子化部
509 復号画像生成部
510 復号画像記憶部
601 エッジ情報抽出部
602 エッジ方向決定部
603 候補TUサイズ決定部
604 TUサイズ判定部
1701 エッジ情報抽出部
1702 候補イントラ予測方向決定部
1703 イントラ予測方向決定部
1900 情報処理装置
1901 プロセッサ
1902 メモリ
1903 入力装置
1904 出力装置
1905 記憶装置
1906 媒体駆動装置
1907 ネットワーク接続装置
1909 バス
1910 可搬型記録媒体

Claims (6)

  1. 動画像内の変換符号化の対象ブロックに適用可能な複数のブロックサイズのうちで、第1のブロックサイズを前記対象ブロックに適用して得られる前記第1のブロックサイズの第1のブロックのエッジ強度が所定の閾値よりも大きく、前記第1のブロックを分割して得られた第2のブロックサイズの複数の第2のブロックのエッジ方向の向きが所定の範囲内で類似している場合、前記第1のブロックサイズを前記対象ブロックに対して適用する候補に設定し、前記第2のブロックサイズを前記対象ブロックに対して適用する前記候補に設定しない設定部と、
    前記候補に設定されているブロックサイズのうちから前記対象ブロックに適用するブロックサイズを決定する決定部と、
    前記決定部により決定されたブロックサイズを用いて前記対象ブロックを変換符号化する変換符号化部と、
    を含む、動画像符号化装置。
  2. 前記設定部は、更に、前記第1のブロックの前記エッジ強度が前記所定の閾値よりも小さい場合、前記第1のブロックサイズを前記対象ブロックに対して適用する前記候補に設定し、前記第2のブロックサイズを前記対象ブロックに対して適用する前記候補に設定しない、ことを特徴とする請求項1に記載の動画像符号化装置。
  3. 前記設定部は、更に、前記第1のブロックの前記エッジ強度が前記所定の閾値よりも大きく、前記複数の第2のブロックのエッジ方向に、互いの向きが所定の値以上離れているエッジ方向が含まれている場合、前記第2のブロックサイズを前記対象ブロックに対して適用する前記候補に設定し、前記第1のブロックサイズを前記対象ブロックに対して適用する前記候補に設定しない、ことを特徴とする請求項1又は2に記載の動画像符号化装置。
  4. 前記所定の閾値、前記所定の範囲、及び前記所定の値は、前記変換符号化部が前記対象ブロックを変換符号化して得られた周波数信号に対して実行される量子化を制御する量子化パラメータの値に応じて設定される、ことを特徴とする請求項1から3のいずれか1項に記載の動画像符号化装置。
  5. 動画像内の変換符号化の対象ブロックに適用可能な複数のブロックサイズのうちで、第1のブロックサイズを前記対象ブロックに適用して得られる前記第1のブロックサイズの第1のブロックのエッジ強度が所定の閾値よりも大きく、前記第1のブロックを分割して得られた第2のブロックサイズの複数の第2のブロックのエッジ方向の向きが所定の範囲内で類似している場合、前記第2のブロックサイズを前記対象ブロックに対して適用する候補に設定せずに、前記第1のブロックサイズを前記対象ブロックに対して適用する前記候補に設定する工程と、
    前記候補に設定されているブロックサイズのうちから前記対象ブロックに適用するブロックサイズを決定する工程と、
    決定されたブロックサイズを用いて前記対象ブロックを変換符号化する工程と、
    を含む、コンピュータが実行する動画像符号化方法。
  6. 動画像内の変換符号化の対象ブロックに適用可能な複数のブロックサイズのうちで、第1のブロックサイズを前記対象ブロックに適用して得られる前記第1のブロックサイズの第1のブロックのエッジ強度が所定の閾値よりも大きく、前記第1のブロックを分割して得られた第2のブロックサイズの複数の第2のブロックのエッジ方向の向きが所定の範囲内で類似している場合、前記第2のブロックサイズを前記対象ブロックに対して適用する候補に設定せずに、前記第1のブロックサイズを前記対象ブロックに対して適用する前記候補に設定し、
    前記候補に設定されているブロックサイズのうちから前記対象ブロックに適用するブロックサイズを決定し、
    決定されたブロックサイズを用いて前記対象ブロックを変換符号化する、
    処理をコンピュータに実行させる動画像符号化プログラム。
JP2015083646A 2015-04-15 2015-04-15 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム Pending JP2016208094A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015083646A JP2016208094A (ja) 2015-04-15 2015-04-15 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015083646A JP2016208094A (ja) 2015-04-15 2015-04-15 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム

Publications (1)

Publication Number Publication Date
JP2016208094A true JP2016208094A (ja) 2016-12-08

Family

ID=57490392

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015083646A Pending JP2016208094A (ja) 2015-04-15 2015-04-15 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム

Country Status (1)

Country Link
JP (1) JP2016208094A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016213615A (ja) * 2015-05-01 2016-12-15 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
WO2021117091A1 (ja) * 2019-12-09 2021-06-17 日本電信電話株式会社 符号化方法、符号化装置、及びプログラム
CN113079377A (zh) * 2021-04-01 2021-07-06 中国科学技术大学 一种深度图像/视频压缩网络的训练方法
CN115348447A (zh) * 2017-07-06 2022-11-15 三星电子株式会社 图像编码方法和设备以及图像解码方法和设备
WO2023012934A1 (ja) * 2021-08-04 2023-02-09 日本電信電話株式会社 映像符号化装置、映像符号化方法、及び映像符号化プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016213615A (ja) * 2015-05-01 2016-12-15 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
CN115348447A (zh) * 2017-07-06 2022-11-15 三星电子株式会社 图像编码方法和设备以及图像解码方法和设备
WO2021117091A1 (ja) * 2019-12-09 2021-06-17 日本電信電話株式会社 符号化方法、符号化装置、及びプログラム
JPWO2021117091A1 (ja) * 2019-12-09 2021-06-17
JP7364936B2 (ja) 2019-12-09 2023-10-19 日本電信電話株式会社 符号化方法、符号化装置、及びプログラム
CN113079377A (zh) * 2021-04-01 2021-07-06 中国科学技术大学 一种深度图像/视频压缩网络的训练方法
WO2023012934A1 (ja) * 2021-08-04 2023-02-09 日本電信電話株式会社 映像符号化装置、映像符号化方法、及び映像符号化プログラム

Similar Documents

Publication Publication Date Title
KR102518242B1 (ko) 영상 정보 부호화 방법 및 복호화 방법
US11405605B2 (en) Encoding method and device therefor, and decoding method and device therefor
JP6953523B2 (ja) 画像の符号化/復号化方法及び装置
US11477451B2 (en) Methods and apparatuses for encoding and decoding video according to coding order
US10116942B2 (en) Method and apparatus for decoding a video using an intra prediction
KR20210058782A (ko) 영상의 부호화/복호화 방법 및 장치
US9936223B2 (en) Method and device for encoding video to improve intra prediction processing speed, and method and device for decoding video
JP2016208094A (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
JP2007074725A (ja) 映像のイントラ予測符号化及び復号化方法、並びに装置
KR102333153B1 (ko) 영상 정보 부호화 방법 및 복호화 방법
JP2007166617A (ja) 映像のイントラ予測符号化、復号化方法及び装置
JP2009111691A (ja) 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法
KR102484387B1 (ko) 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
KR20240078641A (ko) 영상 신호 부호화/복호화 방법 및 장치
KR20220098114A (ko) 영상 부호화 방법/장치, 영상 복호화 방법/장치 및 비트스트림을 저장한 기록 매체
KR102435493B1 (ko) 영상 신호 부호화/복호화 방법 및 장치
KR20240124260A (ko) 영상의 부호화/복호화 방법 및 장치
WO2017010073A1 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体
JP2015211386A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP6248783B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
WO2012118358A2 (ko) 변환 계수 스캔 방법 및 그 장치
JP6331972B2 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
WO2010100860A1 (ja) 動画像符号化方法及び動画像復号化方法
JP2012120086A (ja) 動画像符号化装置