JP2015179943A - 予測モードコスト計算方法及び予測モードコスト計算プログラム - Google Patents

予測モードコスト計算方法及び予測モードコスト計算プログラム Download PDF

Info

Publication number
JP2015179943A
JP2015179943A JP2014056237A JP2014056237A JP2015179943A JP 2015179943 A JP2015179943 A JP 2015179943A JP 2014056237 A JP2014056237 A JP 2014056237A JP 2014056237 A JP2014056237 A JP 2014056237A JP 2015179943 A JP2015179943 A JP 2015179943A
Authority
JP
Japan
Prior art keywords
prediction mode
prediction
residual power
small region
penalty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014056237A
Other languages
English (en)
Other versions
JP5749826B1 (ja
Inventor
隆一 谷田
Ryuichi Tanida
隆一 谷田
正樹 北原
Masaki Kitahara
正樹 北原
清水 淳
Atsushi Shimizu
淳 清水
尚紀 小野
Naoki Ono
尚紀 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014056237A priority Critical patent/JP5749826B1/ja
Application granted granted Critical
Publication of JP5749826B1 publication Critical patent/JP5749826B1/ja
Publication of JP2015179943A publication Critical patent/JP2015179943A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】映像符号化の予測モードおよびブロックサイズを選択する際に、視覚的な劣化をより低減させることができる予測モードコスト計算方法を提供する。
【解決手段】映像符号化の予測モード選択に用いる予測モードコスト計算方法であって、予測ブロックの残差を予め定められた小領域に分割し、分割した小領域毎に予測残差電力を算出する小領域予測残差電力算出ステップと、算出した小領域予測残差電力に基づいて定まる値に基づいてペナルティ値を算出するペナルティ算出ステップと、算出したペナルティ値を予測モードコストに加算して最終的な予測モードコストを求める予測モードコスト算出ステップとを有する。
【選択図】図1

Description

本発明は、予測モードコスト計算方法及び予測モードコスト計算プログラムに関する。
HEVC(High Efficiency Video Coding)などの映像符号化規格では、符号化対象画像を小領域に分割し、各分割領域(小領域)毎に予測モードおよび予測ブロックサイズを決定し、予測画像との残差を変換、符号化する方法が主流となっている。予測モードとしては、画面内情報から予測画像を生成するIntra予測と、既に符号化済みの別フレームから予測画像を生成するInter予測の2通りに大別される。
一方、予測ブロックサイズは、HEVCを例にとると、まずCUと呼ばれる4種類(64×64、32×32、16×16、8×8)のブロックサイズから選択でき、更にこのCUは、PUと呼ばれる8通りの分割パターン(分割せず・縦分割・横分割・縦3:1分割・縦1:3分割、横1:3分割、横3:1分割、田の字分割)によって更に分割することができる。
これらの予測モードおよび予測ブロックサイズの選択は、(1)式のコスト関数を用いて決定される方法が一般的である。
コスト=D+λ×R ・・・(1)
ここで、Dは歪みで、予測モードおよび予測ブロックサイズを選択した場合の予測残差電力を表す。例えば予測画像との残差の絶対値和であるSADや、残差の2乗和であるSSDを用いる方法が一般的である。λはラグランジュ定数で、量子化幅や予測モードから決定される定数である。Rは符号量で、例えばInter予測における動きベクトルの符号量などのヘッダ符号量が用いられる。
このようなコスト関数を用い、各予測モードおよび予測ブロックサイズについてコストを算出し、コストが最も小さい予測モードと予測ブロックサイズの組み合わせを選ぶことで、符号化効率の高い映像圧縮を行うことができる(例えば、非特許文献1参照)。
次に、従来技術によるコスト計算を行う装置の構成を説明する。図7は、従来技術によるコスト計算を行う装置の構成を示すブロック図である。コスト計算を行う装置は、減算器1、残差電力算出部2、ヘッダ符号量計算部3、ラムダ計算部4、乗算器5および加算6器から構成される。
減算器1は、原画像(符号化対象画像)と予測画像の減算を行って差分を出力する。ここでは原画像と予測画像との間の減算を行い、予測残差画像を生成する。残差電力算出部2は、予測残差画像に関する残差電力を算出する。これは例えば予測残差画像の全要素の絶対値和を求めるSADや、全要素の二乗和を求めるSSDなどが該当する。ヘッダ符号量計算部3は、予測モード情報と量子化パラメータとからヘッダ符号量を計算して出力する。ラムダ計算部4は、量子化パラメータから係数λを計算して出力する。乗算器5は、ヘッダ符号量Rと係数λを乗算して出力する。この出力はλ×Rに相当する。加算器6は、残差電力算出部2から出力する歪みDと、乗算器5から出力するλ×Rとを加算して出力する。この出力がコストとなる。
次に、図8を参照して、図7に示す装置がコストを計算する処理動作を説明する。図8は、図7に示す装置がコストを計算する処理動作を示すフローチャートである。この処理は、あるブロックサイズおよび予測モードに関するコストの算出を行うものである。処理が始まると、まず、減算器1は、原画像と予測画像の差分を求める。残差電力算出部2は、この差分からブロックサイズおよび予測モードに関する歪みDを計算する(ステップS51)。
次に、ヘッダ符号量計算部3は、予測モード情報と量子化パラメータとを入力して、ブロックサイズおよび予測モードに関するヘッダ符号量Rを計算する(ステップS52)。次に、ラムダ計算部4は、量子化パラメータを入力して、ラグランジュ定数λを計算する(ステップS53)。次に、乗算器5は、ヘッダ符号量計算部3とラムダ計算部4の出力を乗算し、λ×Rを出力する。そして、加算器6は、残差電力算出部2と乗算器5の出力を加算することにより、コスト(D+λ×R)を算出する(ステップS54)。
このように、選択可能なブロックサイズおよび予測モードに対して、前述した処理(図8の処理)に従ってコストを求め、その中で最もコストが小さかったブロックサイズおよび予測モードを対象ブロックのブロックサイズ、予測モードとして決定する。
また、前述のコスト関数((1)式)より符号化効率の高いブロックサイズ・予測画像を求める方法としてRD最適化手法と呼ばれる方法がある。これは、(1)式において歪みDに復号画像と原画像の差分電力、Rにヘッダ符号量とDCT係数符号量の和を用いるものである。図9は、RD最適化手法を用いてコストを計算する装置の構成を示すブロック図である。図9において、図7に示す装置と同一の部分には同一の符号を付し、その説明を省略する。RD最適化手法を用いてコストを計算する装置は、2つの減算器1、7、DCT部8、Q部9、IQ部10、IDCT部11、残差電力算出部2、DCT係数符号量計算部13、ヘッダ符号量計算部3、ラムダ計算部4、3つの加算器6、12、14および乗算器5から構成される。なお、ヘッダ符号量算出部3からの出力をヘッダ符号量R_Hと記載しているが、これはDCT係数符号量R_Tと区別するためのものである。
DCT部8は、入力信号にDCT(離散コサイン変換)を施してDCT係数を出力する。Q部9は入力されたDCT係数を与えられた量子化パラメータで量子化し、量子化されたDCT係数を出力する。IQ部10は、量子化されたDCT係数、および量子化パラメータを入力とし、量子化されたDCT係数を元に戻す。IDCT部11はDCT係数にIDCT(逆離散コサイン変換)を施し、予測残差の復号画像を出力する。DCT係数符号量計算部13は、量子化されたDCT係数を入力としてDCT係数符号量R_Tを算出して出力する。
次に、図10を参照して、図9に示す装置がRD最適化手法を用いてコスト計算を行う処理動作を説明する。図10は、図9に示す装置がRD最適化手法を用いてコスト計算を行う処理動作を示すフローチャートである。処理が始まると、まず減算器7は、原画像と予測画像の間の差分を取って予測残差を算出する(ステップS61)。DCT部8は、その予測残差に対してDCTを施す(ステップS62)。そして、Q部9は、DCT部8の出力に対して量子化を施す(ステップS63)。
次に、DCT係数符号量計算部13は、量子化されたDCT係数から、DCT係数符号量R_Tを計算する(ステップS64)。また、IQ部10は、量子化されたDCT係数に対して逆量子化を施す(ステップS65)。そして、IDCT部11は、IQ部10の出力に対して、IDCTを施す(ステップS66)。加算器12は、IDCT部11の出力と予測画像とを加算することで復号画像を生成する(ステップS67)。減算器1は、この復号画像と原画像の差分を求める。残差電力算出部2は、この差分から復号画像の歪みDを計算する(ステップS68)。この歪みDは差分の絶対値和であるSADもしくは差分の二乗和であるSSDなどが用いられる。
一方、ヘッダ符号量計算部3は、対象ブロックサイズと予測モードのヘッダ符号量R_Hを計算する(ステップS69)。加算器14は、ヘッダ符号量R_HとDCT係数符号量R_Tとを加算して符号量Rを算出する(ステップS70)。また、例えば設定された量子化パラメータの値から定数λを計算する(ステップS71)。そして、乗算器5は、定数λと符号量Rとを乗算する。加算器6は、乗算器5の出力(λ×R)と残差電力算出部2の出力(D)とを加算してコスト(D+λ×R)を算出する(ステップS72)。
このRD最適化手法はDCTやIDCTを行う必要があるため演算コストが増大するが、より正確な符号量R、予測残差Dが求まるため符号化性能の高いブロックサイズ・予測モードを選択することができる。
角野ほか,「H.264/AVC教科書」P.201〜206、インプレスR&D
前述したように、予測ブロックサイズに様々な大きさがあることで、動物体の輪郭に沿う形で領域を切り取り、動き補償を行ったり、領域毎に適切な予測モードを切り替えたりなどを行うことができるようになる。
しかしながら、従来法による予測ブロックサイズ決定処理には以下のような問題がある。すなわち、コストの大小だけで上述の予測モードと予測ブロックサイズの組み合わせを選択した場合、必ずしも動物体の輪郭に沿う形で予測ブロックサイズが決定される訳ではない。特に低いレートにおいて、動物体の輪郭より大きな予測ブロックサイズが選択されるケースがある。この結果、動物体と共にその背景も一部切り取られて動くような符号化映像が得られることになる。小さな予測ブロックを複数個扱うより、それらを一つに束ねた大きな予測ブロックを用いた方がヘッダコストは小さくて済む。これは、特に低レートでは大きなブロックサイズの方がコストが低いと判断されることによる。この結果、確かに符号化効率は高くなるものの、例えば歩いている人物の周囲に背景が纏わりつくように移動するような復号画像が生成され、視覚的な品質が著しく低下するという問題がある。
本発明は、このような事情に鑑みてなされたもので、映像符号化の予測モードおよびブロックサイズを選択する際に、視覚的な劣化をより低減させることができる予測モードコスト計算方法及び予測モードコスト計算プログラムを提供することを目的とする。
本発明は、映像符号化の予測モード選択に用いる予測モードコスト計算方法であって、予測ブロックの残差を予め定められた小領域に分割し、分割した前記小領域毎に予測残差電力を算出する小領域予測残差電力算出ステップと、算出した前記小領域予測残差電力に基づいて定まる値に基づいてペナルティ値を算出するペナルティ算出ステップと、算出した前記ペナルティ値を予測モードコストに加算して最終的な予測モードコストを求める予測モードコスト算出ステップとを有することを特徴とする。
本発明は、映像符号化の予測モード選択に用いる予測モードコスト計算方法であって、原画像と符号化対象ブロックを符号化・復号した復号ブロックの差分である歪みを予め定められた小領域に分割し、分割した前記小領域毎に歪みを算出する小領域歪み算出ステップと、算出した前記小領域歪みに基づいて定まる値に基づいてペナルティ値を算出するペナルティ算出ステップと、算出した前記ペナルティ値を予測モードコストに加算して最終的な予測モードコストを求める予測モードコスト算出ステップとを有することを特徴とする。
本発明は、前記小領域予測残差電力に基づいて定まる値、または前記小領域歪みに基づいて定まる値は、算出された前記小領域予測残差電力の最大値、または前記小領域歪みの最大値であることを特徴とする。
本発明は、前記小領域予測残差電力に基づいて定まる値、または前記小領域歪みに基づいて定まる値は、算出された前記小領域予測残差電力の分散値、または前記小領域歪みの分散値であることを特徴とする。
本発明は、前記ペナルティ算出ステップでは、前記小領域予測残差電力に基づいて定まる値、または前記小領域歪みに基づいて定まる値に対して、所定の係数を乗算して前記ペナルティを算出し、前記所定の係数は、予測モード情報あるいは量子化パラメータに基づいて予め定められたテーブルを参照して決定することを特徴とする。
本発明は、前記ペナルティ算出ステップでは、前記小領域予測残差電力に基づいて定まる値、または前記小領域歪みに基づいて定まる値に対して、所定の係数を乗算して前記ペナルティを算出し、前記所定の係数は、予測モード番号とブロックサイズと量子化パラメータの線形結合として算出して決定することを特徴とする。
本発明は、コンピュータに、前記予測モードコスト計算方法を実行させるための予測モードコスト計算プログラムである。
本発明によれば、映像符号化の予測モードおよびブロックサイズを選択する際に、視覚的な劣化をより低減させることができるという効果が得られる。
本発明の第1実施形態の構成を示すブロック図である。 図1に示す装置の処理動作を示すフローチャートである。 本発明の第2実施形態の構成を示すブロック図である。 図3に示す装置の処理動作を示すフローチャートである。 本発明の第3実施形態の構成を示すブロック図である。 図5に示す装置の処理動作を示すフローチャートである。 従来技術によるコスト計算を行う装置の構成を示すブロック図である。 図7に示す装置がコストを計算する処理動作を示すフローチャートである。 RD最適化手法を用いてコストを計算する装置の構成を示すブロック図である。 図9に示す装置がRD最適化手法を用いてコスト計算を行う処理動作を示すフローチャートである。
以下、本発明の実施形態による予測モードコスト計算装置を説明する。始めに、本発明の予測モードコスト計算装置の原理について説明する。本発明による予測モードコスト計算装置は、コスト関数の計算機能において、予測ブロックを更に細かい小領域に分けて領域毎に予測残差電力を算出し、小領域毎に求めた予測残差電力の総和を求め、求めた各小領域の予測残差電力からペナルティ値を求め、求めたペナルティ値を対象予測ブロックのコスト関数に加算するようにしている。
求めた各小領域の予測残差電力からペナルティを計算する機能は、例えば算出した各領域の予測残差電力のうち最大のものを検出する機能と、検出された最大の予測残差電力に係数を掛けてそれをペナルティとする機能でもよい。もしくは、各領域の予測残差電力について分散を取り、それに係数を掛けてペナルティとする機能でもよい。
また、係数は、予め定められた固定値を用いてもよい。この固定値は、予測ブロックのサイズ毎に異なる固定値を用いてもよい。もしくは、量子化ステップサイズ毎に異なる固定値を用いてもよい。もしくは、予測ブロックと予測モード毎に異なる固定値を用いてもよい。もしくは、予測ブロックが含む小領域の個数を、これら固定値に掛けて係数としてもよい。予測モードと量子化パラメータを元にテーブルを参照し係数を決定してもよい。もしくは、予測モードを示す定数M(例えばIntra=1、Inter=2)と、予測ブロックの面積Sと量子化パラメータQから、係数k=αM+βS+γQ(α、β、γは予め定めた定数)などのような線形結合で求めてもよい。
また、予測ブロックを更に細かい小領域に分けて領域毎に予測残差電力を算出する機能では、RD最適化手法を使用する際はDCTを施す前の予測残差から求めてもよい。
この構成によれば、あるブロックサイズ・予測モードにおいて予測残差電力の総和が低くても、一部の領域に残差電力が集中している場合には大きなペナルティが加算されるため、そのようなモードは選ばれにくくなる。例えば、大きな予測ブロックでその中に動領域の境界が含まれているようなケースがこれに当たる。一方、ブロックサイズ・予測モードが動領域に沿って分割されている場合には、残差電力が一部領域に集中する可能性が低くなるため、前のケースよりペナルティが小さくなり、選ばれやすくなる。
<第1実施形態>
次に、本発明の第1実施形態による予測モードコスト計算装置の構成を説明する。図1は第1実施形態の構成を示すブロック図である。この図において、図7に示す従来の装置と同一の部分には同一の符号を付し、その説明を省略する。この図に示す装置が従来の装置と異なる点は、残差電力算出部2と加算器6に代えて、領域毎残差電力算出部21、合計値計算部22、最大値検出部23、係数決定部24、乗算器25、加算器26が設けられている点である。
本実施形態は、RD最適化手法を用いずにコスト関数を計算するものである。なお、本実施形態のペナルティ算出法としては、算出した各領域の予測残差電力の中の最大値を検出し、それに対して予測モードと量子化パラメータを元にテーブル参照で求めた係数kを掛けることでペナルティを求めるものとする。
領域毎残差電力算出部21は、予測残差を予め定められた小領域に分割し、小領域毎の予測残差電力を算出してそれらを全て出力する。合計値計算部22は、領域毎残差電力算出部21から出力された小領域毎の予測残差電力を全て合算し、予測残差電力D(歪みD)を求めて出力する。最大値検出部23は、領域毎残差電力算出部21から出力された小領域毎の残差電力の中から最大のもの(小領域の予測残差電力最大値d_max)を選択して出力する。
係数決定部24は、予測モード情報と量子化パラメータから予め定められたテーブルを参照して係数kを決定して出力する。乗算器25は、小領域の予測残差電力最大値d_maxと係数kとを乗算してペナルティとして出力する。加算器26は、合計値計算部22の出力(歪みD)と、乗算器25の出力(ペナルティ)と、乗算器5の出力(λ×R)とを加算してコストとして出力する。
次に、図2を参照して、図1に示す装置の処理動作を説明する。図2は、図1に示す装置の処理動作を示すフローチャートである。処理が始まると、減算器1は、原画像と予測画像の差分を求めて予測残差として出力する。領域毎残差電力算出部21は、予測残差を予め定められた小領域毎に区分し、小領域毎の予測残差電力を計算する(ステップS1)。予測残差電力の算出法としては、例えば絶対値の総和であるSADなどがある。
次に、求めた小領域毎の予測残差電力の合計により全体の予測残差電力(歪みDに相当)を求める(ステップS2)。この全体の予測残差電力は、図8に示すステップS51によって求められる歪みDと等しくなる。
一方、最大値検出部23は、小領域毎に求めた予測残差電力の中で最大のもの(小領域の予測残差電力最大値d_max)を検出する(ステップS3)。
次に、係数決定部24は、予測モード情報と量子化パラメータとからテーブル参照により係数kを求める(ステップS4)。テーブルは予め与えられているものとする。そして、乗算器25は、小領域の予測残差電力最大値d_maxと係数kとを乗算しペナルティとして出力する(ステップS5)。
次に、ヘッダ符号量計算部3は、予測ブロックサイズおよび予測モードに関するヘッダ符号量Rを算出する(ステップS6)。また、ラムダ計算部4は、ラグランジュ定数λを求める(ステップS7)。このヘッダ符号量Rおよびラグランジュ定数λの算出は従来法と同様の方法を用いる。そして、乗算器5は、のヘッダ符号量Rとラグランジュ定数λとを乗算して出力する。
最後に、加算器26は、合計値計算部22の出力(歪みD)と、乗算器5の出力(λ×R)と、乗算器25の出力(ペナルティ)とを加算してコストを算出する(ステップS8)。この処理の結果、ペナルティが加味されたコストを算出することができる。
<第2実施形態>
次に、本発明の第2実施形態による予測モードコスト計算装置を説明する。図3は、第2実施形態の構成を示すブロック図である。この図において、図9に示す従来の装置と同一の部分には同一の符号を付し、その説明を省略する。この図に示す装置が従来の装置と異なる点は、残差電力算出部2と加算器6に代えて、領域毎残差電力算出部21、合計値計算部22、最大値検出部23、係数決定部24、乗算器25、加算器26が設けられている点である。
本実施形態は、RD最適化手法を用いてコスト関数を計算するものである。なお、本実施形態のペナルティ算出法としては、算出した各領域の予測残差電力の中の最大値を検出し、それに対して予測モードと量子化パラメータを元にテーブル参照で求めた係数kを掛けることでペナルティを求めるものとする。また、領域毎の予測残差電力は、原画像と復号画像との差分から算出するものとする。
領域毎残差電力算出部21は、予測残差を予め定められた小領域に分割し、小領域毎の予測残差電力を算出してそれらを全て出力する。合計値計算部22は、領域毎残差電力算出部21から出力された小領域毎の予測残差電力を全て合算し、予測残差電力D(歪みD)を求めて出力する。最大値検出部23は、領域毎残差電力算出部21から出力された小領域毎の残差電力の中から最大のもの(小領域の予測残差電力最大値d_max)を選択して出力する。
係数決定部24は、予測モード情報と量子化パラメータから予め定められたテーブルを参照して係数kを決定して出力する。乗算器25は、小領域の予測残差電力最大値d_maxと係数kとを乗算してペナルティとして出力する。加算器26は、合計値計算部22の出力(歪みD)と、乗算器25の出力(ペナルティ)と、乗算器5の出力(λ×R)とを加算してコストとして出力する。
次に、図4を参照して、図3に示す装置の処理動作を説明する。図4は、図3に示す装置の処理動作を示すフローチャートである。処理が始まると、まず減算器7は、原画像と予測画像の間の差分を取って予測残差を算出する(ステップS11)。DCT部8は、その予測残差に対してDCTを施す(ステップS12)。そして、Q部9は、DCT部8の出力に対して量子化を施す(ステップS13)。
次に、DCT係数符号量計算部13は、量子化されたDCT係数から、DCT係数符号量R_Tを計算する(ステップS14)。また、IQ部10は、量子化されたDCT係数に対して逆量子化を施す(ステップS15)。そして、IDCT部11は、IQ部10の出力に対して、IDCTを施す(ステップS16)。加算器12は、IDCT部11の出力と予測画像とを加算することで復号画像を生成する(ステップS17)。
次に、領域毎残差電力算出部21は、原画像と復号画像の間の歪み計算を予め定められた小領域毎に実施する(ステップS18)。歪みとしては、差分画像の全要素の絶対値和を求めたSADや、差分画像の全要素の二乗和を求めたSSDなどがある。次に、合計値計算部22は、小領域毎に求めた歪みの総和を求め、対象ブロック全体の歪みDを計算する(ステップS19)。この歪みDは、図10に示すステップS68において求まる歪みDと等しくなる。
次に、最大値検出部23は、小領域毎に求めた歪みの中で最大のもの(小領域の予測残差電力最大値d_max)を検出する(ステップS20)。また、係数決定部24は、予測モード情報と量子化パラメータからテーブル参照により係数kを求める(ステップS21)。テーブルは予め与えられているものとする。乗算器25は、小領域の予測残差電力最大値d_maxと係数kとを乗算してペナルティを算出する(ステップS22)。
一方、ヘッダ符号量計算部3は、対象ブロックサイズと予測モードのヘッダ符号量R_Hを計算する(ステップS23)。加算器14は、ヘッダ符号量R_HとDCT係数符号量R_Tとを加算して符号量Rを算出する(ステップS24)。また、例えば設定された量子化パラメータの値から定数λを計算する(ステップS25)。そして、乗算器5は、定数λと符号量Rとを乗算する。
最後に、加算器26は、合計値計算部22の出力(歪みD)と、乗算器5の出力(λ×R)と、乗算器25の出力(ペナルティ)とを加算してコストを算出する(ステップS26)。このような処理の結果、ペナルティが加味されたコストを算出することができる。
<第3実施形態>
次に、本発明の第3実施形態による予測モードコスト計算装置を説明する。図5は、第3実施形態の構成を示すブロック図である。この図において、図9に示す従来の装置と同一の部分には同一の符号を付し、その説明を省略する。この図に示す装置が従来の装置と異なる点は、加算器6に代えて、領域毎残差電力算出部21、最大値検出部23、係数決定部24、乗算器25、加算器26が設けられている点である。
本実施形態はRD最適化手法を用いてコスト関数を計算するものである。なお、本実施形態のペナルティ算出法としては、算出した各領域の予測残差電力の中の最大値を検出し、それに対して予測モードと量子化パラメータを元にテーブル参照で求めた係数kを掛けることでペナルティを求めるものとする。また、用いるテーブルは第2実施形態と同一でもよいし、異なるものでもよい。また、領域毎の予測残差電力は、原画像と予測画像との差分から算出するものとする。
領域毎残差電力算出部21は、予測残差を予め定められた小領域に分割し、小領域毎の予測残差電力を算出してそれらを全て出力する。最大値検出部23は、領域毎残差電力算出部21から出力された小領域毎の残差電力の中から最大のもの(小領域の予測残差電力最大値d_max)を選択して出力する。
係数決定部24は、予測モード情報と量子化パラメータから予め定められたテーブルを参照して係数kを決定して出力する。乗算器25は、小領域の予測残差電力最大値d_maxと係数kとを乗算してペナルティとして出力する。加算器26は、合計値計算部22の出力(歪みD)と、乗算器25の出力(ペナルティ)と、乗算器5の出力(λ×R)とを加算してコストとして出力する。
次に、図6を参照して、図5に示す装置の処理動作を説明する。図6は、図5に示す装置の処理動作を示すフローチャートである。処理が始まると、まず減算器7は、原画像と予測画像の差分によって予測残差を算出する(ステップS31)。続いて、領域毎残差電力算出部21は、予測残差を予め定められた小領域毎に分けて各々の予測残差電力を計算する(ステップS32)。予測残差電力としては、差分画像の全要素の絶対値和を求めたSADや、差分画像の全要素の二乗和を求めたSSDなどがある。
次に、最大値検出部23は、小領域毎に求めた歪みの中で最大のもの(小領域の予測残差電力最大値d_max)を検出する(ステップS33)。また、係数決定部24は、予測モード情報と量子化パラメータからテーブル参照により係数kを求める(ステップS34)。テーブルは予め与えられているものとする。乗算器25は、小領域の予測残差電力最大値d_maxと係数kとを乗算してペナルティを算出する(ステップS35)。
一方、DCT部8は、予測残差に対してDCTを施す(ステップS36)。そして、Q部9は、DCT部8の出力に対して量子化を施す(ステップS37)。続いて、DCT係数符号量計算部13は、量子化されたDCT係数から、DCT係数符号量R_Tを計算する(ステップS38)。また、IQ部10は、量子化されたDCT係数に対して逆量子化を施す(ステップS39)。そして、IDCT部11は、IQ部10の出力に対して、IDCTを施す(ステップS40)。加算器12は、IDCT部11の出力と予測画像とを加算することで復号画像を生成する(ステップS41)。
次に、減算器1は、この復号画像と原画像の差分を求める。残差電力算出部2は、この差分から復号画像の歪みDを計算する(ステップS42)。この歪みDは差分の絶対値和であるSADもしくは差分の二乗和であるSSDなどが用いられる。続いて、ヘッダ符号量計算部3は、対象ブロックサイズと予測モードのヘッダ符号量R_Hを計算する(ステップS43)。加算器14は、ヘッダ符号量R_HとDCT係数符号量R_Tとを加算して符号量Rを算出する(ステップS44)。また、例えば設定された量子化パラメータの値から定数λを計算する(ステップS45)。そして、乗算器5は、定数λと符号量Rとを乗算する。
最後に、加算器26は、合計値計算部22の出力(歪みD)と、乗算器5の出力(λ×R)と、乗算器25の出力(ペナルティ)とを加算してコストを算出する(ステップS46)。このような処理の結果、ペナルティが加味されたコストを算出することができる。
以上説明したように、予測ブロックを更に細かい領域に分けて領域毎に予測残差電力を算出し、この予測残差電力に基づいて定まる所定の値(例えば最大値)を利用したペナルティを通常の方法で算出されるコストに加算したものの大小関係に基づいて予測モードを選択するようにした。この構成により、通常の方法で算出されるコストの大小関係に基づき予測モードを選択した場合に動物体の輪郭に沿わない大きな予測ブロックサイズが選択されるという問題を解決することができ、画像品質の低下を抑制することができる。
すなわち、動領域境界に沿わない大きなブロックサイズ・予測モードが選ばれにくくなる一方、動領域境界に対して適切に分割されたブロックサイズ・予測モードは選択されやすくなるため、前述のような視覚的に著しく品質が劣化する問題を改善することができる。また、小さいブロックサイズ・予測モードでも残差電力の集中度合いが改善されない場合にはペナルティが大きくなるため選択されにくい。そのため不必要な分割(過分割)が起こりにくく、符号化効率に与える悪影響を最小限に留めることができる。
前述した実施形態における予測モードコスト計算装置をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、PLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されるものであってもよい。
以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものではないことは明らかである。したがって、本発明の技術思想及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行ってもよい。
映像符号化の予測モードおよびブロックサイズを選択する際に、視覚的な劣化をより低減させることが不可欠な用途に適用できる。
1・・・減算器、2・・・残差電力算出部、3・・・ヘッダ符号量計算部、4・・・ラムダ計算部、5・・・乗算器、6・・・加算器、7・・・減算器、8・・・DCT部、9・・・Q部、10・・・IQ部、11・・・IDCT部、12・・・加算器、13・・・DCT係数符号量計算部、14・・・加算器、21・・・領域毎残差電力算出部、22・・・合計値計算部、23・・・最大値検出部、24・・・係数決定部、25・・・乗算器、26・・・加算器、

Claims (7)

  1. 映像符号化の予測モード選択に用いる予測モードコスト計算方法であって、
    予測ブロックの残差を予め定められた小領域に分割し、分割した前記小領域毎に予測残差電力を算出する小領域予測残差電力算出ステップと、
    算出した前記小領域予測残差電力に基づいて定まる値に基づいてペナルティ値を算出するペナルティ算出ステップと、
    算出した前記ペナルティ値を予測モードコストに加算して最終的な予測モードコストを求める予測モードコスト算出ステップと
    を有することを特徴とする予測モードコスト計算方法。
  2. 映像符号化の予測モード選択に用いる予測モードコスト計算方法であって、
    原画像と符号化対象ブロックを符号化・復号した復号ブロックの差分である歪みを予め定められた小領域に分割し、分割した前記小領域毎に歪みを算出する小領域歪み算出ステップと、
    算出した前記小領域歪みに基づいて定まる値に基づいてペナルティ値を算出するペナルティ算出ステップと、
    算出した前記ペナルティ値を予測モードコストに加算して最終的な予測モードコストを求める予測モードコスト算出ステップと
    を有することを特徴とする予測モードコスト計算方法。
  3. 前記小領域予測残差電力に基づいて定まる値、または前記小領域歪みに基づいて定まる値は、算出された前記小領域予測残差電力の最大値、または前記小領域歪みの最大値であることを特徴とする請求項1または2に記載の予測モードコスト計算方法。
  4. 前記小領域予測残差電力に基づいて定まる値、または前記小領域歪みに基づいて定まる値は、算出された前記小領域予測残差電力の分散値、または前記小領域歪みの分散値であることを特徴とする請求項1または2に記載の予測モードコスト計算方法。
  5. 前記ペナルティ算出ステップでは、前記小領域予測残差電力に基づいて定まる値、または前記小領域歪みに基づいて定まる値に対して、所定の係数を乗算して前記ペナルティを算出し、
    前記所定の係数は、予測モード情報あるいは量子化パラメータに基づいて予め定められたテーブルを参照して決定することを特徴とする請求項1から4のいずれか1項に記載の予測モードコスト計算方法。
  6. 前記ペナルティ算出ステップでは、前記小領域予測残差電力に基づいて定まる値、または前記小領域歪みに基づいて定まる値に対して、所定の係数を乗算して前記ペナルティを算出し、
    前記所定の係数は、予測モード番号とブロックサイズと量子化パラメータの線形結合として算出して決定することを特徴とする請求項1から4のいずれか1項に記載の予測モードコスト計算方法。
  7. コンピュータに、請求項1から6のいずれか1項に記載の予測モードコスト計算方法を実行させるための予測モードコスト計算プログラム。
JP2014056237A 2014-03-19 2014-03-19 予測モードコスト計算方法及び予測モードコスト計算プログラム Active JP5749826B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014056237A JP5749826B1 (ja) 2014-03-19 2014-03-19 予測モードコスト計算方法及び予測モードコスト計算プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014056237A JP5749826B1 (ja) 2014-03-19 2014-03-19 予測モードコスト計算方法及び予測モードコスト計算プログラム

Publications (2)

Publication Number Publication Date
JP5749826B1 JP5749826B1 (ja) 2015-07-15
JP2015179943A true JP2015179943A (ja) 2015-10-08

Family

ID=53718528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014056237A Active JP5749826B1 (ja) 2014-03-19 2014-03-19 予測モードコスト計算方法及び予測モードコスト計算プログラム

Country Status (1)

Country Link
JP (1) JP5749826B1 (ja)

Also Published As

Publication number Publication date
JP5749826B1 (ja) 2015-07-15

Similar Documents

Publication Publication Date Title
US9179148B2 (en) Simplified bilateral intra smoothing filter
JP5502336B2 (ja) 映像信号符号化装置及び、映像信号符号化方法
Correa et al. Coding tree depth estimation for complexity reduction of HEVC
KR101375664B1 (ko) 영상의 디퓨전 특성을 이용한 영상 부호화/복호화 방법 및장치
US20120027092A1 (en) Image processing device, system and method
JP2008227670A (ja) 画像符号化装置
JP5613319B2 (ja) 映像符号化装置、映像符号化方法および映像符号化プログラム
JP2022539937A (ja) 画像成分予測方法、符号化器、復号化器、並びに記憶媒体
JPWO2008136164A1 (ja) 復号化回路、復号化方法及び画像再生装置
JP6194334B2 (ja) 映像符号化装置、映像符号化方法及び映像符号化プログラム
JP6259272B2 (ja) 映像符号化装置及び映像符号化プログラム
JP5711789B2 (ja) 画像符号化方法、画像符号化装置及び画像符号化プログラム
JP5749826B1 (ja) 予測モードコスト計算方法及び予測モードコスト計算プログラム
CN115442617A (zh) 一种基于视频编码的视频处理方法和装置
JP6564315B2 (ja) 符号化装置、復号装置、及びプログラム
JP5292355B2 (ja) 信号修正装置、符号化装置、復号装置及びプログラム
JP6696889B2 (ja) 画像符号化装置、画像符号化方法及びコンピュータプログラム
JP2006237765A (ja) 画像符号化装置
JP6200220B2 (ja) 画像処理装置、符号化装置、復号装置、及びプログラム
JP6106207B2 (ja) 符号量推定方法、符号量推定装置及び符号量推定プログラム
US10034011B2 (en) Video coding apparatus
JP6080726B2 (ja) 動画像符号化装置及び画面内予測モード決定方法及びプログラム
JP2010010768A (ja) 画像符号化装置及び画像符号化方法
JP6178698B2 (ja) 映像符号化装置
JP2020195096A (ja) 映像符号化装置及びプログラム、並びに、映像復号装置及びプログラム、並びに、映像処理システム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150512

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150514

R150 Certificate of patent or registration of utility model

Ref document number: 5749826

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150