JP2019004304A - 画像符号化装置、画像符号化方法、及び画像符号化プログラム - Google Patents

画像符号化装置、画像符号化方法、及び画像符号化プログラム Download PDF

Info

Publication number
JP2019004304A
JP2019004304A JP2017117227A JP2017117227A JP2019004304A JP 2019004304 A JP2019004304 A JP 2019004304A JP 2017117227 A JP2017117227 A JP 2017117227A JP 2017117227 A JP2017117227 A JP 2017117227A JP 2019004304 A JP2019004304 A JP 2019004304A
Authority
JP
Japan
Prior art keywords
block
encoding
target image
deterioration degree
encoding target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017117227A
Other languages
English (en)
Inventor
小林 大祐
Daisuke Kobayashi
大祐 小林
中村 健
Ken Nakamura
健 中村
裕江 岩崎
Hiroe Iwasaki
裕江 岩崎
充郎 池田
Mitsuro Ikeda
充郎 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017117227A priority Critical patent/JP2019004304A/ja
Publication of JP2019004304A publication Critical patent/JP2019004304A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】映像を構成する広色域と高いダイナミックレンジを有する画像の符号化を行う際に、演算量の増加を抑えつつ、色成分の符号化劣化を低減すること。
【解決手段】符号化対象画像データをブロックに分割し、ブロックごとの画素値に基づいて、ブロックごとの視覚的劣化度であるブロック視覚的劣化度を取得し、ブロック視覚的劣化度に基づいて、符号化対象画像データの視覚的劣化度である符号化対象画像視覚的劣化度を取得し、ブロック視覚的劣化度と、当該ブロック視覚的劣化度に対応するブロックを含む符号化対象画像データの符号化対象画像視覚的劣化度との大小関係を判定し、判定結果に基づいて、符号化対象画像データの符号化に用いられる符号化パラメータの値を調整し、調整後の符号化パラメータの値に基づいて符号化対象画像データを符号化する。
【選択図】図2

Description

本発明は、画像符号化装置、画像符号化方法、及び画像符号化プログラムに関する。
映像符号化技術は、国際標準動画像符号化方式であるMPEG(Moving Picture Expert Group)−2、MPEG−4、H.264/AVC(Advanced Video Coding)が広く用いられている。今後、次世代の映像符号化国際標準であるHEVC(High Efficiency Video Coding)/H.265が広く普及していくと見込まれている。
また、近年、HD(High Definition)という1920画素×1080ラインの映像の4倍の3840画素×2160ラインの解像度を有する4K映像や、さらにその4倍の解像度である7680画素×4320ラインの解像度を有する8K映像などの超高精細映像が扱われるようになっている。さらに、また、カメラやディスプレイにおけるダイナミックレンジ表現能力が向上していることにあわせて、色再現領域とダイナミックレンジが拡大された高ダイナミックレンジ(以下「HDR」(High Dynamic Range)という。)映像も扱われるようになってきている。
このような広い色域と高いダイナミックレンジを有するHDR映像の符号化を行う際には、色成分情報を正しく表現するように符号化処理を行わないと、従来のSDR(Standard Dynamic Range)映像信号に対する符号化と比較して、色相の符号化歪みがディスプレイ上で目立ちやすくなるという問題がある。
例えば、HEVC/H.265をはじめとする映像符号化規格では、符号化対象の符号化ブロック周辺の符号化済みブロック情報を用いながら符号化を行うため逐次処理が行われる。これらの映像符号化規格の手法をHDR映像に対して適用する場合、HDR映像では、画像領域によって色情報やダイナミックレンジ情報の特徴が異なるため、この特徴の違いにより符号化における逐次処理の際に色相の局所的劣化が発生しやすい。この色相の局所的劣化により、上記のようなディスプレイ上で目立ちやすい色相の符号化歪みが生じることになる。
このような色相の局所的劣化を軽減するために、アクティビティと称される局所的な画像の複雑度に応じて量子化パラメータを調整し、主観品質の向上を図るMPEG−2 TM5(Test Model 5)として知られる手法がある。
また、これまで、HDRの分野における技術開発は、JPEG(Joint Photographic Experts Group) XTなどの静止画像において多数行われているが、動画に関する技術開発はまだそれほど多く行われていない。特に、符号化の枠組みが違うのもあって、静止画の技術をそのまま動画に適用することは通常は行われない。また、JPEG XTで行われている技術開発についても、従来のSDRのJPEG画像との互換性を保ちながら、HDR化した場合のデータ量の増加に備えるスケーラブル化に関することが主である。
そのような中、HDRの分野の標準化における議論において、上記のような色相の符号化歪みへの対策として、(1)符号化前の前処理、及び(2)符号化制御の2手法によるアプローチが提案されている。(1)符号化前の前処理の手法は、復号後、ディスプレイに表示される際に、再構成されるRGB信号において歪みが低減されるように、前処理において、輝度信号値を補正する手法である。これに対して、(2)符号化制御の手法は、映像信号の輝度信号や色差信号に対する量子化パラメータを補正する手法である(例えば、非特許文献1参照)。
ここで、「色差」の用語について定義する。本明細書では、2通りの意味で、「色差」の用語を用いている。例えば、映像符号化装置の映像符号化部への入力映像方式であるYCbCr信号のうち、Y成分を輝度信号、Cb成分及びCr成分を色差信号という。この色差信号における「色差」とは、2つの色信号Cb,Crと、輝度信号Yの差分を示している。Y成分と、Cb成分と、Cr成分とに分解することで、人間の目が明るさに比べて色に対する分解能が低いという特性を利用して、色成分の情報を削減することが可能となる。以下、映像信号に関する文脈において用いる「色差」の用語は、上記のCbCrの色差信号における「色差」の意味である。
これに対して、知覚均等色空間であるLab色空間、またはL*a*b*色空間上での2つの色の違いを表す尺度についても「色差」という用語を用いている。この「色差」の用語は、ある基準色に対する対象色との色の視覚的な違いを数値化したものであり、一般に、色差ΔEとして表される。以下、色の違い、劣化の尺度や劣化の度合いの文脈において用いる「色差」の用語は、色差ΔEにおける「色差」の意味である。
Jonatan Samuelsson, Alexis Tourapis, Jacob Strom, and Chad Fogg, "Suggestion for new draft version of Conversion and Coding Practices for HDR/WCG Video", JCTVC-X0079, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11, 24th Meeting: Geneva CH, 26 May-1 June 2016.
しかしながら、上記のMPEG−2 TM−5の手法を適用する場合、HDR映像においては、従来のSDR映像の信号に比べて、映像信号と明るさのレベルの割り付け方が大きく異なっている。そのため、アクティビティを算出する際の絵柄の画素値によって、同じアクティビティ値に基づいて、量子化パラメータを調整しても、実際にディスプレイに表示される際、量子化誤差による符号化歪みがより強調されてしまうことがある。したがって、この手法を用いる場合、絵柄の特徴まで考慮した符号化制御や、更なる量子化誤差の低減が求められることになり、容易にHDR映像に適用できるようにはなっていないという問題がある。
また、上記のHDRの分野の標準化の議論における(1)符号化前の前処理の手法は、輝度信号値を補正するに留まり、色相の符号化歪みを積極的に改善する手法ではない。
また、(2)符号化制御の手法に関しては、例えば、非特許文献1では、以下のようなことが示されている。すなわち、「色差QP(Quantization Parameter)オフセットというパラメータにより、低いQPでは小さくマイナスの補正を行い、高いQPでは大きくマイナスの補正を行って調整を行う。」ということ、また、「平均輝度が高いブロックでは、低いブロックよりも低いQP値とする明暗での符号量配分の調整を行う。」ということである。しかしながら、非特許文献1に示される調整手法は、量子化幅や色差信号における色差の分布範囲を考慮した適切な量子化が必要ということが示されているだけであり、具体的な調整手法が示されているわけではない。
また、映像符号化の処理は、上記の逐次処理に加えて、リアルタイム、またはリアルタイムに近い時間、またはリアルタイムよりも早い時間で処理が行われなければならない。HDR映像では、HDR化によってSDRと比べて広い色域・広いダイナミックレンジを扱っていることによる映像情報量の増大により、更に、膨大な演算量と高速性が求められ、ソフトウェア処理の場合には高速なCPU(Central Processing Unit)が、ハードウェア処理の場合には規模の大きな演算器が要求される。そのため、HDR映像における符号化処理では、演算量の軽減を図ることも、解決が望まれている問題である。
上記事情に鑑み、本発明は、映像を構成する広色域と高いダイナミックレンジを有する画像の符号化を行う際に、演算量の増加を抑えつつ、色成分の符号化劣化を低減することができる技術の提供を目的としている。
本発明の一態様は、映像を構成する複数のフレームであって高ダイナミックレンジで広色域な画像を含むフレームの各々を符号化対象画像データとし、符号化対象画像の主観品質を平準化するように前記符号化対象画像データを符号化する画像符号化装置であって、前記符号化対象画像データをブロックに分割するブロック分割部と、前記ブロックごとの画素値に基づいて、前記ブロックごとの視覚的劣化度であるブロック視覚的劣化度を取得するブロック劣化度取得部と、前記ブロック視覚的劣化度に基づいて、前記符号化対象画像データの視覚的劣化度である符号化対象画像視覚的劣化度を取得する符号化対象画像劣化度取得部と、前記ブロック視覚的劣化度と、当該ブロック視覚的劣化度に対応する前記ブロックを含む前記符号化対象画像データの前記符号化対象画像視覚的劣化度との大小関係を判定する判定部と、前記判定部の判定結果に基づいて、前記符号化対象画像データの符号化に用いられる符号化パラメータの値を調整する調整部と、調整後の符号化パラメータの値に基づいて前記符号化対象画像データを符号化する符号化部と、を備える画像符号化装置である。
本発明の一態様は、上記の画像符号化装置であって、前記調整部は、判定された大小関係に基づき、前記ブロック視覚的劣化度を前記符号化対象画像視覚的劣化度に近づけるように前記符号化パラメータの値を調整する。
本発明の一態様は、上記の画像符号化装置であって、前記ブロック劣化度取得部は、前記ブロックごとの画素値を変換して得られる変換値であって前記画素値のばらつきが低彩度において強調される変換値を用いて、前記ブロックごとの視覚的劣化度であるブロック視覚的劣化度を取得する。
本発明の一態様は、上記の画像符号化装置であって、前記符号化パラメータは、量子化パラメータであり、前記調整部は、前記符号化対象画像データにおける前記ブロックの視覚的劣化を目立たなくさせる場合、前記ブロックに適用する前記量子化パラメータの値を減少させ、前記符号化対象画像データにおける前記ブロックの視覚的劣化が目立たせる場合、前記ブロックに適用する前記量子化パラメータの値を増加させる。
本発明の一態様は、上記の画像符号化装置であって、前記符号化対象画像データに予め定められている初期値としての量子化パラメータの値と、前記ブロックに含まれる前記画素値の輝度成分を平均して得られる平均輝度値とに関連付けられて量子化パラメータ調整オフセットを予め記憶する記憶部を備え、前記調整部は、前記符号化対象画像データの前記初期値としての量子化パラメータの値と、前記ブロックの前記平均輝度値とに対応する前記量子化パラメータ調整オフセットを前記記憶部から読み出し、読み出した前記量子化パラメータ調整オフセットにより当該ブロックに適用する前記量子化パラメータを増減させる。
本発明の一態様は、上記の画像符号化装置であって、前記符号化パラメータは、量子化パラメータであり、前記調整部は、前記判定結果と、前記符号化対象画像視覚的劣化度の値の大きさに対する、前記ブロック視覚的劣化度と前記符号化対象画像視覚的劣化度との差の値の大きさの割合とに応じて、前記符号化対象画像データの目標符号量を増減させ、前記符号化対象画像データの目標符号量にしたがって量子化パラメータを求める。
本発明の一態様は、映像を構成する複数のフレームであって高ダイナミックレンジで広色域な画像を含むフレームの各々を符号化対象画像データとし、符号化対象画像の主観品質を平準化するように前記符号化対象画像データを符号化する画像符号化方法であって、前記符号化対象画像データをブロックに分割するブロック分割ステップと、前記ブロックごとの画素値に基づいて、前記ブロックごとの視覚的劣化度であるブロック視覚的劣化度を取得するブロック劣化度取得ステップと、前記ブロック視覚的劣化度に基づいて、前記符号化対象画像データの視覚的劣化度である符号化対象画像視覚的劣化度を取得する符号化対象画像劣化度取得ステップと、前記ブロック視覚的劣化度と、当該ブロック視覚的劣化度に対応する前記ブロックを含む前記符号化対象画像データの前記符号化対象画像視覚的劣化度との大小関係を判定する判定ステップと、判定結果に基づいて、前記符号化対象画像データの符号化に用いられる符号化パラメータの値を調整する調整ステップと、調整後の符号化パラメータの値に基づいて前記符号化対象画像データを符号化する符号化ステップと、を有する画像符号化方法である。
本発明の一態様は、映像を構成する複数のフレームであって高ダイナミックレンジで広色域な画像を含むフレームの各々を符号化対象画像データとし、符号化対象画像の主観品質を平準化するように前記符号化対象画像データを符号化するコンピュータに、前記符号化対象画像データをブロックに分割するブロック分割ステップと、前記ブロックごとの画素値に基づいて、前記ブロックごとの視覚的劣化度であるブロック視覚的劣化度を取得するブロック劣化度取得ステップと、前記ブロック視覚的劣化度に基づいて、前記符号化対象画像データの視覚的劣化度である符号化対象画像視覚的劣化度を取得する符号化対象画像劣化度取得ステップと、前記ブロック視覚的劣化度と、当該ブロック視覚的劣化度に対応する前記ブロックを含む前記符号化対象画像データの前記符号化対象画像視覚的劣化度との大小関係を判定する判定ステップと、判定結果に基づいて、前記符号化対象画像データの符号化に用いられる符号化パラメータの値を調整する調整ステップと、調整後の符号化パラメータの値に基づいて前記符号化対象画像データを符号化する符号化ステップとを実行させるための画像符号化プログラムである。
本発明により、映像を構成する広色域と高いダイナミックレンジを有する画像の符号化を行う際に、演算量の増加を抑えつつ、色成分の符号化劣化を低減することが可能となる。
本発明の第1の実施形態における画像符号化装置の構成を示すブロック図である。 第1の実施形態の事前解析部と符号量制御部の構成を示すブロック図である。 第1の実施形態のΔQPテーブルの構成を示す図である。 第1の実施形態の事前解析部による処理の流れを示すフローチャートである。 第1の実施形態の符号量制御部による処理の流れを示すフローチャートである。 第1の実施形態における量子化パラメータの調整の一例を示す図(その1)である。 第1の実施形態における量子化パラメータの調整の一例を示す図(その2)である。 第1の実施形態における量子化パラメータの調整の一例を示す図(その3)である。 第1の実施形態の他の構成例によるΔQPテーブル(その1)の構成を示す図である。 第1の実施形態の他の構成例によるΔQPテーブル(その2)の構成を示す図である。 第1の実施形態の他の構成例による符号量制御部による処理の流れを示すフローチャート(その1)である。 第1の実施形態の他の構成例による符号量制御部による処理の流れを示すフローチャート(その2)である。 本発明の第2の実施形態における画像符号化装置の構成を示すブロック図である。 第2の実施形態の事前解析部と符号量制御部の構成を示すブロック図である。 第2の実施形態の符号量制御部による処理の流れを示すフローチャートである。
(第1の実施形態)
以下、本発明の実施形態について図面を参照して説明する。
図1は、本発明の第1の実施形態における画像符号化装置1の構成を示すブロック図である。画像符号化装置1は、事前解析部101、符号量制御部102、画像分割部103、予測残差信号生成部104、変換・量子化処理部105、逆量子化・逆変換処理部106、復号画像信号生成部107、イントラ予測処理部108、ループフィルタ処理部109、インター予測処理部110、スイッチ部111、及びエントロピー符号化部112を備える。
画像符号化装置1において、画像分割部103、予測残差信号生成部104、変換・量子化処理部105、逆量子化・逆変換処理部106、復号画像信号生成部107、イントラ予測処理部108、ループフィルタ処理部109、インター予測処理部110、スイッチ部111、及びエントロピー符号化部112の機能部は、H.264/AVCやH.265/HEVC等の画像符号化装置を構成する機能部である。
また、以下の説明おいて、「符号化ブロック」または「符号化対象ブロック」とは、MPEG−2やH.264/AVCでは、マクロブロックに相当し、H.265/HEVCでは、符号化ツリーユニット(CTU(Coding Tree Unit)に相当する。
画像符号化装置1において、入力映像信号は、例えば、HDR映像信号であり、入力映像信号を構成する複数のフレームの各々は、高ダイナミックレンジで広色域な画像データである。なお、以下の説明においてフレームのことをピクチャともいう。
事前解析部101は、フレームの1枚ずつを符号化対象画像データとして取り込み、各々の符号化対象画像データをブロックに分割し、分割したブロックごとの画素値に基づいて、ブロックごとの視覚的劣化度(以下「ブロック視覚的劣化度」という。)を算出する。また、事前解析部101は、算出したブロック視覚的劣化度に基づいて、符号化対象画像データの視覚的劣化度(以下「符号化対象画像視覚的劣化度」という。)を算出する。
符号量制御部102は、事前解析部101が算出したブロック視覚的劣化度と、符号化対象画像視覚的劣化度とに基づいて、画像分割部103が出力する符号化対象ブロックの各々に対して変換・量子化処理部105が適用する量子化パラメータを算出し、算出した量子化パラメータを変換・量子化処理部105に出力する。
画像分割部103は、事前解析部101が出力する符号化対象画像データと分割情報とを取り込み、取り込んだ分割情報に基づいて、符号化対象画像データを単位矩形の符号化ブロックに分割する。また、画像分割部103は、分割した符号化ブロックの各々を符号化対象ブロックとして出力する。予測残差信号生成部104は、画像分割部103が出力する符号化対象ブロックと、イントラ予測処理部108またはインター予測処理部110が出力する予測信号との差分である予測残差信号を算出して出力する。
変換・量子化処理部105は、予測残差信号に対して離散コサイン変換等の直交変換を行い、直交変換により得られた変換係数を、符号量制御部102から与えられる量子化パラメータに基づいて量子化し、量子化した変換係数を出力する。エントロピー符号化部112は、量子化された変換係数をエントロピー符号化して符号化ストリームとして出力する。
逆量子化・逆変換処理部106は、変換・量子化処理部105が量子化した変換係数を取り込み、逆量子化と逆直交変換を行って予測残差信号を出力する。復号画像信号生成部107は、逆量子化・逆変換処理部106が出力する予測残差信号と、イントラ予測処理部108またはインター予測処理部110が出力する予測信号とを加算して符号化対象ブロックの復号画像信号を生成する。
イントラ予測処理部108は、復号画像信号に基づいてフレーム内の予測信号を生成して出力する。ループフィルタ処理部109は、復号画像信号に対して符号化歪みを低減させるフィルタリング処理を行い、フィルタリング処理後の復号画像信号をインター予測処理部110に出力する。インター予測処理部110は、ループフィルタ処理部109が出力するフィルタリング後の復号画像信号を参照画像データとし、画像分割部103が出力する符号化対象ブロックのフレーム間の予測信号を生成して出力する。スイッチ部111は、イントラ予測処理部108が出力する予測信号と、インター予測処理部110が出力する予測信号とを切り替えて出力する。
図2は、事前解析部101と符号量制御部102の内部構成、及び事前解析部101と符号量制御部102の接続関係を示すブロック図である。事前解析部101は、ブロック分割部10、変換処理部11、ブロック劣化度算出部12、及び符号化対象画像劣化度算出部13を備える。符号量制御部102は、判定部20、調整部21、及び記憶部22を備える。
事前解析部101において、ブロック分割部10は、入力データとして符号化対象画像データを取り込み、取り込んだ符号化対象画像データを予め定められる任意のサイズの矩形ブロックサイズに分割して変換処理部11に出力する。
矩形ブロックのサイズは、マクロブロックやCTUのような符号化ブロックのサイズでもよいし、更に小さなサイズのサブブロック単位であってもよい。後述する視覚的劣化の大きい局所領域を含む最小のブロックサイズとなるようにブロックサイズを定めておく方が、よりよい効果が得られることになる。また、ブロック分割部10は、取り込んだ符号化対象画像データと、当該符号化対象画像データを分割した際のブロックサイズの情報である分割情報を画像分割部103に出力する。
変換処理部11は、ブロック分割部10が出力する矩形ブロック内のY成分、Cb成分、Cr成分として表される画素値の平均値を算出する。また、変換処理部11は、矩形ブロック内の各画素の画素値と、矩形ブロック内の画素値の平均値とを知覚均等色空間であるCIE1976L*a*b*色空間上の座標に変換してブロック劣化度算出部12に出力する。また、変換処理部11は、算出した輝度平均値、すなわちY成分の画素値の平均値を符号量制御部102の調整部21に出力する。
なお、L*a*b*色空間に変換するのは、SDRや各HDR方式に依存しないで処理をさせるためである。前述のように、HDRでは、映像信号レベル(画素値)と明るさの割り付けが異なる。しかしながら、一括りにHDRといっても、HLG(Hybrid Log-gamma)やPQ(perceptual quantization)など方式によって映像信号レベル(画素値)と明るさの割り付け方法が異なる。つまり、画素値が同じ値だけ変化しても、また、低彩度で変化するか高彩度で変化するかによっても、人間の目が認識する色の違いが異なる。L*a*b*色空間は、知覚均等色空間(値が同じだけ変化したとき、人間がそれを見たときに感じる変化も等しい)なため、これらの違いを吸収して後の処理を統一的に扱うことができる。なお、本実施形態では、L*a*b*色空間を用いた例を示したが、これに限らず、人間が見た色の違いを定量的に表現できる空間であればどのような空間であってもよい。
ブロック劣化度算出部12は、変換処理部11が出力するL*a*b*色空間上の座標で表される矩形ブロック内の各画素の画素値及び矩形ブロック内の画素値の平均値に基づいて、矩形ブロック内における想定劣化度、すなわちブロック視覚的劣化度を示す色差ΔE_blkを算出する。
符号化対象画像劣化度算出部13は、符号化対象画像データを構成する矩形ブロックに対して、ブロック劣化度算出部12が算出したブロック視覚的劣化度、すなわち色差ΔE_blkの平均値である色差ΔE_picを算出する。符号化対象画像劣化度算出部13は、算出した色差ΔE_picを符号化対象画像視覚的劣化度として出力する。
符号量制御部102において、判定部20は、矩形ブロックごとに、ブロック視覚的劣化度と、当該ブロックを含む符号化対象画像データの符号化対象画像視覚的劣化度との大小関係を判定する。調整部21は、判定部20の判定結果、矩形ブロックの平均輝度値Y、及び符号化対象画像データに予め定められているBaseQPと、に基づいて、記憶部22に記憶されているΔQPテーブル220を参照し、矩形ブロックごとに適用する量子化パラメータ調整オフセット(以下「ΔQP」という。)を選択する。
なお、BaseQPは、例えば、MPEG−2 TM5のステップ1の符号化制御によってピクチャ単位に定められる値であり、値が大きくなるほど符号化後の符号量が少なくなるが、粗い量子化が行われることになる。ここでは、Iピクチャ、Pピクチャ、Bピクチャのピクチャタイプ、ビットレートによってピクチャ単位で予め定められている値とする。例えば、MPEG−2 TM5のステップ1の符号化制御によって定められた、ピクチャ単位ごと、すなわち符号化対象画像データごとのBaseQPの値が記憶部22に記憶されており、調整部21が、処理の対象とする符号化対象画像データに対応するBaseQPを記憶部22から読み出すことによって取得する。このBaseQPが、量子化パラメータの初期値となる。
また、調整部21は、BaseQPと、選択したΔQPを用いて量子化パラメータを算出し、算出した量子化パラメータを変換・量子化処理部105に出力する。記憶部22は、図3に示すデータ構成のΔQPテーブル220と、前述した符号化対象画像データごとのBaseQPの値とを記憶している。ΔQPテーブル220は、図3に示すように、「BaseQP」の項目と、平均輝度値Yの値の範囲が、予め定められる複数の閾値TH_y1,TH_y2,・・・,TH_ynで区切られた項目を有する。図3に示すように、BaseQPと平均輝度値Yが定まると、それに対応したΔQPを選択することができることになる。
(事前解析部による処理)
次に、図4を参照しつつ事前解析部101による処理について説明する。事前解析部101のブロック分割部10は、符号化対象画像データを入力データとして取り込み、取り込んだ符号化対象画像データを予め定められるサイズの矩形ブロックサイズに分割する。ここで、以下の説明において、符号化対象画像データのサイズをF_WIDTH×F_HEIGHTとし、矩形ブロックサイズをB_WIDTH×B_HEIGHTとする。ブロック分割部10は、分割した矩形ブロックを変換処理部11に出力する(ステップS101)。
変換処理部11は、符号化対象画像データに含まれる全ての矩形ブロックに対してステップS102からステップS104の処理を繰り返す(ループLa1s〜ループLa1e)。ここで、符号化対象画像データに含まれる矩形ブロックは、N(Nは1以上の整数)個存在するものとし、各々の矩形ブロックについては、iをインデックスとして、i(i=0〜N−1)番目の矩形ブロックとして表すものとする。また、矩形ブロック内の各画素の各々については、jをインデックスとして、j番目の画素として表すものとする。jの値の範囲は、矩形ブロック内の画素数に依存し、例えば、矩形ブロックが16×16画素の場合、j=0〜255となる。
変換処理部11は、i番目の矩形ブロック内の各画素のY成分、Cb成分、Cr成分の画素値(Y_i_j,Cb_i_j,Cr_i_j)に基づいて、各成分の平均画素値(Y_i_ave,Cb_i_ave,Cr_i_ave)を算出する(ステップS102)。例えば、矩形ブロックが16×16画素のブロックである場合、画素値(Y_i_j,Cb_i_j,Cr_i_j)(ただし、j=0〜255)は、256個の各画素について存在し、平均画素値(Y_i_ave,Cb_i_ave,Cr_i_ave)(ただし、i=0〜N−1)は、256個の画素の画素値の平均値となる。なお、変換処理部11は、Y成分の平均画素値Y_i_aveを算出した際、算出したY成分の平均画素値Y_i_aveをi番目の矩形ブロックの平均輝度値Yとして符号量制御部102に出力する。
変換処理部11は、i番目の矩形ブロック内の各画素の画素値(Y_i_j,Cb_i_j,Cr_i_j)と、矩形ブロック内の画素平均値(Y_i_ave,Cb_i_ave,Cr_i_ave)を、知覚均等色空間であるL*a*b*色空間上の座標に変換する(ステップS103)。変換後の各画素の座標値を、(L*_i_j,a*_i_j,b*_i_j)とし、画素平均値に対応する座標値を(L*_i_ave,a*_i_ave,b*_i_ave)とする。
ブロック劣化度算出部12は、変換処理部11が出力するL*a*b*色空間上の座標値に基づいて、次式(1)により、i番目の矩形ブロックのブロック視覚的劣化度を示す色差ΔE_blk(i)を算出する(ステップS104)。
Figure 2019004304
なお、式(1)において、Σは各矩形ブロックに含まれる全ての画素についての和を示しており、例えば、i番目の矩形ブロックが16×16画素である場合、j=0〜255についての和を算出することになる。
ブロック劣化度算出部12は、全ての矩形ブロックについて、ステップS102からステップS104の処理を繰り返し行い、全ての矩形ブロックについて色差ΔE_blk(i)を算出する。符号化対象画像劣化度算出部13は、ブロック劣化度算出部12が算出した各矩形ブロックの色差ΔE_blk(i)に基づいて、次式(2)により、符号化対象画像視覚的劣化度である色差ΔE_picを算出する(ステップS105)。
Figure 2019004304
式(2)に示すように、色差ΔE_picは、符号化対象画像データ、すなわちピクチャに含まれる各矩形ブロックの色差ΔE_blk(i)を合計した値であり、以下、ピクチャの色差ΔE_picという。なお、式(2)において、Nは、上述したようにピクチャ内の矩形ブロック数であり、次式(3)によって算出される。
Figure 2019004304
変換処理部11は、算出した矩形ブロックごとの平均輝度値Yを符号量制御部102の調整部21に出力する。ブロック劣化度算出部12は、算出した矩形ブロックごとの色差ΔE_blk(i)を符号量制御部102の判定部20に出力し、符号化対象画像劣化度算出部13は、算出したピクチャの色差ΔE_picを符号量制御部102の判定部20に出力する。
(符号量制御部による処理)
次に、図5を参照しつつ符号量制御部102の処理について説明する。符号量制御部102の判定部20は、ブロック視覚的劣化度である矩形ブロックごとの色差ΔE_blk(i)と、符号化対象画像視覚的劣化度であるピクチャの色差ΔE_picとを取り込む(ステップS201)。ここでは、判定部20は、i=0番目の矩形ブロックから順に取り込み、ステップS202〜S208の処理を矩形ブロックごとに繰り返すものとする(ループLb1s〜ループLb1e)。
判定部20は、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも大きいか否かを判定する(ステップS202)。判定部20は、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも大きいと判定した場合(ステップS202−YES)、次に、ピクチャの色差ΔE_picから矩形ブロックの色差ΔE_blk(i)を減算した減算値を算出し、算出した減算値が、予め定められる閾値THLよりも大きいか否かを判定する(ステップS203)。
判定部20が、算出した減算値が、予め定められる閾値THL以下であると判定した場合(ステップS203−NO)、調整部21は、ΔQPに0を代入する(ステップS205)。一方、判定部20が、算出した減算値が、予め定められる閾値THLより大きいと判定した場合(ステップS203−YES)、調整部21は、記憶部22から当該ピクチャに対応するBaseQPを読み出す。
調整部21は、変換処理部11から取り込んだ、当該矩形ブロックの平均輝度値Yと、当該ピクチャに対応するBaseQPとに基づいて、記憶部22に記憶されている図3に示すΔQPテーブル220を参照する。調整部21は、平均輝度値Yが含まれる項目をΔQPテーブル220から検出し、検出した項目のうちBaseQPの値に対応するΔQPの値にプラス符号をつけて読み出し、読み出した正の値をΔQPとする(ステップS204)。例えば、図3において、BaseQP=40で、平均輝度値Yが、TH_y1以上であり、TH_y2未満である場合、調整部21は、「5」の値を読み出し、プラス符号を付加して、ΔQP=+5とする。
ステップS203では、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも大きい場合に、例えば、閾値THLに基づいて、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも主観品質に影響を与える程度に大きいか否かを判定している。また、ステップS204では、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも主観品質に影響を与える程度に大きい場合に、調整部21が、矩形ブロックの平均輝度値Yと、BaseQPとに応じて、ΔE_blk(i)の量子化パラメータ調整オフセットΔQPの値を大きくする方向に調整する。換言すると、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも主観品質に影響を与える程度に大きいため、ピクチャ全体の平均的な劣化と比較して、当該矩形ブロックの局所的な視覚的劣化は目立ちにくいことから、当該矩形ブロックに対して粗い量子化を行って、視覚的劣化を目立たせる代わりに、当該矩形ブロックに割り当てる符号量を減少させて節約していることになる。
一方、判定部20は、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)以下であると判定した場合(ステップS202−NO)、矩形ブロックの色差ΔE_blk(i)からピクチャの色差ΔE_picを減算した減算値を算出し、算出した減算値が、予め定められる閾値THSよりも大きいか否かを判定する(ステップS206)。
判定部20が、算出した減算値が、予め定められる閾値THS以下であると判定した場合(ステップS206−NO)、調整部21は、ΔQPに0を代入する(ステップS205)。一方、判定部20が、算出した減算値が、予め定められる閾値THSより大きいと判定した場合(ステップS206−YES)、調整部21は、記憶部22から当該ピクチャに対応するBaseQPを読み出す。
調整部21は、変換処理部11から取り込んだ、当該矩形ブロックの平均輝度値Yと、当該ピクチャに予め定められているBaseQPとに基づいて、記憶部22に記憶されている図3に示すΔQPテーブル220を参照する。調整部21は、平均輝度値Yが含まれる項目をΔQPテーブル220から検出し、検出した項目のうちBaseQPの値に対応するΔQPの値にマイナス符号をつけて読み出し、読み出した負の値をΔQPとする(ステップS207)。例えば、図3において、BaseQP=40で、平均輝度値Yが、TH_y2以上であり、TH_y3未満である場合、調整部21は、「6」の値を読み出し、マイナス符号を付加して、ΔQP=−6とする。
ステップS206では、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)以下である場合に、例えば、閾値THSに基づいて、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも主観品質に影響を与える程度に小さいか否かを判定している。また、ステップS207では、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも主観品質に影響を与える程度に小さい場合に、調整部21が、矩形ブロックの平均輝度値Yと、BaseQPとに応じて、ΔE_blk(i)の量子化パラメータ調整オフセットΔQPの値を小さくする方向に調整する。換言すると、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも主観品質に影響を与える程度に小さいため、ピクチャ全体の平均的な劣化と比較して、当該矩形ブロックの局所的な視覚的劣化が目立ちやすいことから、当該矩形ブロックに対して細かい量子化を行って、当該矩形ブロックに割り当てる符号量を増加させる代わりに、視覚的劣化を目立たなくさせている。
調整部21は、次式(4)により、QP_newとして当該矩形ブロックに対する量子化パラメータを算出し、算出した量子化パラメータを変換・量子化処理部105に出力する(ステップS208)。
Figure 2019004304
変換・量子化処理部105は、符号化対象ブロックに対して直交変換を行い、直交変換により得られた変換係数を、調整部21から受けた量子化パラメータに基づいて量子化する。
上記の第1の実施形態の構成により、矩形ブロックごとに、ピクチャの色差ΔE_picと、矩形ブロックの色差ΔE_blk(i)の差の大きさに応じてΔQPを適用して、量子化パラメータを調整した例を図6、図7に示す。図6(a)は、視覚的劣化度を示す凡例である。図6(b)、(c)、図7は、同一のピクチャの同一箇所を示しており、図6(b)は、矩形ブロックが64×64画素の場合、図6(c)は、矩形ブロックが32×32画素の場合、図7は、矩形ブロックが16×16画素の場合を示す。
図6(b)、(c)、図7において、BaseQPに対してΔQPをプラス方向に調整したブロックをΔQP↑またはΔQP↑↑、ΔQPをマイナス方向に調整したブロックをΔQP↓またはΔQP↓↓、ΔQPの調整を行わなかったブロックをΔQP→、と模式的に表している。ΔQPの値の大小関係は、ΔQP↑<ΔQP↑↑であり、ΔQP↓↓<ΔQP↓である。
上記の第1の実施形態の構成では、入力映像信号を構成する符号化対象画像データから矩形ブロックごとのブロック視覚的劣化度と、符号化対象画像データ全体の視覚的劣化度とに応じて符号化の際に発生しうる局所的な視覚的劣化を検出している。そのため、図6(b)、(c)、図7に示すように矩形ブロック単位に劣化の度合に応じて歪みを軽減するような局所的な量子化パラメータの調整を行うことができる。
これにより、例えば、図8(a)に示すような局所的な視覚的劣化を含むピクチャであっても、図8(b)に示すように全体に平準化させることで、歪みを目立たなくさせるような効果をもたらすことが可能となる。また、図6(b)と、図6(c)と、図7との比較から分かるように、矩形ブロックのサイズを大きくしすぎると、必要のない領域までΔQPを増減させてしまうことになり、また、矩形ブロックのサイズを小さくしすぎると演算量の増加を招いてしまう。したがって、視覚的劣化が発生している局所部分に応じた、適切な矩形ブロックのサイズとすることで、演算量の増加を抑えつつ、歪みを目立たなくさせることが可能となる。
上記の第1の実施形態における画像符号化装置1において、事前解析部101のブロック分割部10は、符号化対象画像データを矩形ブロックに分割し、変換処理部11は、矩形ブロックごとに、矩形ブロックに含まれる画素値の平均画素値を算出し、矩形ブロックの各画素値と、矩形ブロックの平均画素値とをL*a*b*色空間上の座標に変換する。ブロック劣化度算出部12は、矩形ブロックの各画素値及び平均画素値のL*a*b*色空間上の座標値に基づいて、矩形ブロックごとの視覚的劣化度であるブロック視覚的劣化度、すなわち色差ΔE_blk(i)を算出する。符号化対象画像劣化度算出部13は、ブロック視覚的劣化度に基づいて、符号化対象画像データの視覚的劣化度である符号化対象画像視覚的劣化度、すなわち色差ΔE_picを算出する。符号量制御部102の判定部20は、色差ΔE_blk(i)と、色差ΔE_picの大小関係を判定する。調整部21は、判定部20の判定結果に基づいて、符号化対象画像データに適用する量子化パラメータを算出する。これにより、事前解析部101が、符号化対象画像データ全体に対する視覚的な劣化が発生している箇所を符号化処理前に予め検出しておくことができる。そのため、符号化対象ブロック単位毎に以降の符号化処理を行う際、符号量制御部102が、局所的な視覚的な劣化を抑えた量子化パラメータを設定することができる。したがって、映像を構成する広色域と高いダイナミックレンジを有する画像の符号化を行う際に、演算量の増加を抑えつつ、色成分の符号化劣化を低減して主観品質の平準化を行うことができる。
画像符号化装置1では、映像信号がHDRやSDRであっても同一の尺度で解析が行えるように、映像信号形式であるYCbCr信号を、知覚均等色空間CIE1976L*a*b*色空間にマッピングし、L*a*b*色空間上で表現される尺度によって、劣化の算出、すなわち符号化歪みが目立ちやすい箇所の抽出を行っている。
上記の式(1)では、Y成分、Cb成分、Cr成分の画素値の分散計算をするのではなく、L*a*b*色空間上の座標値の分散、すなわち色差ΔE_blk(i)を算出している。単なる画素値の分散計算では、低彩度でも高彩度でも、値は同じになるが、視覚的劣化度を示す色差ΔE_blk(i)は、同じ画素値のばらつきでも、低彩度では値が大きく、高彩度では値が小さくなる。本質的には、視覚的劣化度を示す色差ΔE_blk(i)は、視覚的劣化が目立ちやすい彩度となる画素値では値が大きくなる。したがって、矩形ブロック内の画素値が主に低彩度の画素値で構成されているとき、僅かな画素値の変化によっても色差ΔE_blk(i)の値は大きくなる。これに対して、矩形ブロック内の画素値が主に高彩度の画素値で構成されているとき、色差ΔE_blk(i)の値は小さくなる。そのため、低彩度における画素値のばらつきを強調して表すことができる。
また、色差ΔE_blk(i)は、値が大きいほど、矩形ブロック内の平均画素値に対する各画素値による色の違いが大きいことを示しており、色差ΔE_blk(i)が大きいということは、符号化による予測誤差や量子化誤差による視覚的劣化が大きくなることを示すことになる。したがって、ピクチャの色差ΔE_picに対して矩形ブロックの色差ΔE_blk(i)が大きくなる矩形ブロックは、ピクチャ内で符号化歪みによる視覚的劣化が局所的に目立ちやすい箇所を示すことになる。逆に、矩形ブロックの色差ΔE_blk(i)がピクチャの色差ΔE_picに対して小さくなる矩形ブロックは、視覚的劣化が目立ちにくい箇所であることを示すことになる。
このような色差ΔEの値が示す特性を利用し、事前解析部101では、符号化対象画像データを入力データとし、視覚的な劣化が発生している箇所、すなわち符号化歪みが目立ちやすい箇所を抽出している。符号量制御部102では、視覚的な劣化が発生している箇所について、当該箇所を目立たなくさせる量子化パラメータを適用するようにしている。これにより、映像信号レベルと明るさの対応付けが従来とは異なるHDR映像信号において、符号化歪みによって画素値に微小変化が生じた場合であっても、符号化歪みをディスプレイ上で目立たなくさせることができる。
また、画像符号化装置1は、符号化対象画像データ、及び矩形ブロックの画素値情報から得られる事前解析結果を用いて、矩形ブロックにおける量子化誤差を小さくするための量子化パラメータ調整を行い、局所的に目立つ視覚的劣化を軽減する構成を有している。つまり、入力映像信号を元に事前解析部101の処理により得られる結果を用いて符号量制御部102が量子化パラメータを調整する手法であることから、既存の画像符号化装置の枠組みを大きく変更することなく、リアルタイム処理に適した逐次的な処理を可能としている。
また、画像符号化装置1によれば、画面全体に対する局所的な視覚的劣化度合をもとに選択した量子化パラメータ調整オフセット値に応じて、量子化パラメータを調整しているので、演算量を抑えながら局所的に目立つ視覚的劣化を軽減し、画面全体の主観品質を向上させることができる。
また、図4に示した事前解析部101による処理では、矩形ブロックの色差ΔE_blk(i)を式(1)により、矩形ブロックに含まれる画素ごとに逐次算出するようにしているが、本発明の構成は、当該実施の形態に限られない。例えば、画素値(Y,Cb,Cr)に対応する(L*,a*,b*)を、一定の刻みの画素値(Y,Cb,Cr)において予め変換テーブルとして生成して内部の記憶領域に記憶させておく。この場合、変換処理部11が、画素値(Y,Cb,Cr)が与えられた際、与えられた画素値(Y,Cb,Cr)の各々と、算出した平均画素値とに近い画素値(Y,Cb,Cr)と(L*,a*,b*)の組み合わせを変換テーブルから検出してL*a*b*色空間上の座標値に置き換えるようにしてもよい。これにより、演算量の削減を行うことができる。
また、予め生成する(Y,Cb,Cr)の画素値から(L*,a*,b*)の座標値への変換テーブルとして、伝達関数の異なる映像フォーマットごとの変換テーブルを予め生成して内部の記憶領域に記憶させておいてもよい。この場合、変換処理部11は、入力データの映像信号に適用される伝達関数に応じた変換テーブルを参照して(Y,Cb,Cr)の画素値から(L*,a*,b*)の座標値への変換を行うことになる。これにより、様々な映像フォーマットに適切な色差ΔE_blk(i)を算出することができるとともに、演算量の削減を行うことができる。ここで、伝達関数の異なる映像信号のフォーマットとしては、例えば、代表的なものとして、SDR方式、HLG(Hybrid Log Gamma)方式、PQ(Perceptual Quantization)方式(なお、PQ方式は、ST2084ともいう)があり、また、これらの方式以外の映像信号のフォーマットであってもよい。
また、ブロックサイズごとに、予め定められる特定色の複数の画像データ(Y1,Cb1,Cr1),(Y2,Cb2,Cr2),…,(Yn,Cbn,Crn)(ただし、nは、2以上の自然数)を生成し、これらに対応する色差ΔEを予め算出しておいてもよい。ここで、(Y1,Cb1,Cr1)は、ブロックサイズに応じた画素数を含む画像データであり、これについての色差ΔE_blkを算出し、算出した色差ΔE_blk_1とする。このようにして、(Y1,Cb1,Cr1),(Y2,Cb2,Cr2),…,(Yn,Cbn,Crn)のそれぞれに対応する色差ΔE_blk_1,ΔE_blk_2,…,ΔE_blk_nを予め算出しておく。
ただし、ΔE_blk_1>閾値1,ΔE_blk_2>閾値2>閾値1,…を満たすような関係となるように画像データ(Y1,Cb1,Cr1),(Y2,Cb2,Cr2),…,(Yn,Cbn,Crn)を生成させておく必要がある。(Y1,Cb1,Cr1),(Y2,Cb2,Cr2),…,(Yn,Cbn,Crn)と色差ΔE_blk_1,ΔE_blk_2,…,ΔE_blk_nを関連付けたテーブルを生成し、生成したテーブルを内部の記憶領域に記憶させておく。
変換処理部11は、矩形ブロックの画素値(Y,Cb,Cr)が与えられた際に、当該テーブルを参照して(Y1,Cb1,Cr1),(Y2,Cb2,Cr2),…,(Yn,Cbn,Crn)の中から矩形ブロックの画素値(Y,Cb,Cr)に最も近い画素値の組み合わせを選択し、選択した組み合わせに対応する色差ΔE_blkを、矩形ブロックの画素値(Y,Cb,Cr)の色差ΔE_blkとする。このようにすることで、更に演算量を削減することができる。
また、式(1)では、各画素の画素値のL*a*b*色空間上の座標値と、平均画素値のL*a*b*色空間上の座標値との間のユークリッド距離を算出するようにしているが、二乗や平方根計算が不要なマンハッタン距離を算出し、算出したマンハッタン距離を色差ΔE_blk(i)としてもよい。
また、上記の図4に示す処理では、矩形ブロック内の画素値の平均値(Y_i_ave,Cb_i_ave,Cr_i_ave)を算出し、この平均値に基づいて、矩形ブロックごとの色差ΔE_blk(i)やピクチャの色差ΔE_picを算出するようにしているが、本発明の構成は、当該実施の形態に限られない。例えば、平均値に替えて画素値の最大値、または最小値を用いてもよいし、ピクチャ全体の画素値の平均値を用いてもよいし、予め定められた位置の矩形ブロック内の代表画素値を用いるようにしてもよい。
また、上記の図4に示す処理では、CIE1976L*a*b*色空間上での各画素値と、平均画素値の距離を示す色差ΔEを算出するようにしているが、本発明の構成は、当該実施の形態に限られず、他の知覚均等な色空間での距離や他の特徴量を用いてもよい。
例えば、人間の目の特性を考慮した色差式CIE2000で得られる尺度ΔE00を用いても良いし、特定映像向け処理として、劣化を抑えたい肌色などの特定色が矩形ブロック内に含まれる画素数の割合に応じて視覚的劣化度を算出してもよい。
また、上記の第1の実施形態では、量子化パラメータ調整オフセットΔQPは、例えばMPEG−2 TM5のステップ1の符号化制御における代表的な量子化パラメータであるBaseQPとしているが、MPEG−2 TM5のステップ2やステップ3で求められるQP値を調整する値であってもよい。
また、上記の第1の実施形態では、BaseQPは、MPEG−2 TM5のステップ1の符号化制御により定められ、例えば、Iピクチャ、Pピクチャ、Bピクチャのピクチャタイプ、ビットレートによってピクチャ単位で予め定められている値としているが、ピクチャ単位に限られず、CTUライン単位に定められるようにしてもよい。
また、上記の第1の実施形態では、BaseQPは、ピクチャ単位で、予め記憶部22に記憶されているとしているが、本発明の構成は、当該実施の形態に限られない。例えば、符号化対象画像データに対して割り当てられたBaseQPの情報が、符号化対象画像データに付加されている場合、事前解析部101が、符号化対象画像データを取り込む際に符号化対象画像データに付加されているBaseQPの値を取り込んで、符号量制御部102に通知するようにしてもよい。
また、上記の第1の実施形態では、閾値THLと閾値THSは、異なる値であることを前提として示しているが、本発明の構成は、当該実施の形態に限られない。閾値THLと閾値THSは、同一の値であってもよい。また、図3に示すΔQPテーブル220は、ステップS204とステップS207の処理において共有するようにしているが、例えば、平均輝度値Yの範囲が異なっていたり、ΔQPの値の分布が異なっていたりする異なるテーブルをステップS204とステップS207の処理の各々に適用するようにしてもよい。なお、この場合、ステップS204で用いるテーブルのΔQPの値をプラス符号とし、ステップS207で用いるテーブルのΔQPの値をマイナス符号としておくことで、ステップS204とステップS207において符号を付与する処理を行う必要がなくなる。
(第1の実施形態の他の構成例)
上記の第1の実施形態の構成において、複数の段階のΔQPを選択できる構成にしてもよい。例えば、上記の第1の実施形態は、閾値THLと閾値THSを予め定められる固定値としていたが、複数の閾値を用いて、矩形ブロックの色差ΔE_blk(i)と、ピクチャの色差ΔE_picの差の大きさを分類し、主観品質に与える影響の度合いによって、複数の段階のΔQPを選択する構成にすることができる。
具体的には、記憶部22に記憶される図3に示すΔQPテーブル220を、図9に示すΔQPテーブル221と、図10に示すΔQPテーブル222に置き換える。また、図5のステップS203を図11に示すステップS2031〜S2035に置き換え、ステップS204をステップS204aに置き換える。また、図5のステップS206を図12に示すステップS2061〜S2065に置き換え、ステップS207をステップS207aに置き換える。ステップS203の処理においては、複数の閾値THL,THL,…,THLp_maxを適用し、ステップS206の処理においては、複数の閾値THS,THS,…,THSq_maxを適用する。なお、THL<THL<…<THLp_max及び、THS<THS<…<THSq_maxとする。
図9に示すΔQPテーブル221は、BaseQPの項目と、平均輝度値Yの値の範囲が、予め定められる複数の閾値TH_y1,TH_y2,・・・,TH_ynによって区切られた項目を有している。さらに、また、平均輝度値Yの値の範囲を示す複数の項目の各々が、ピクチャの色差ΔE_picからi番目の矩形ブロックの色差ΔE_blk(i)を減算した減算値の範囲が、予め定められる複数の閾値THL,THL,…,THLp_maxによって区切られた項目となっている。ここで、p_maxは、予め定められるpの最大値であり、図9のΔQPテーブル221のピクチャの色差ΔE_picから矩形ブロックの色差ΔE_blk(i)を減算した減算値の項目数は、p=1〜(p_max+1)となる。つまり、図9に示すように、BaseQPと平均輝度値Yと閾値THLを示すpの値が定まると、それに対応したΔQPを選択することができることになる。
また、図10に示すΔQPテーブル222は、BaseQPの項目と、平均輝度値Yの値の範囲が、予め定められる複数の閾値TH_y1,TH_y2,・・・,TH_ynによって区切られた項目を有している。さらに、また、平均輝度値Yの値の範囲を示す複数の項目の各々が、i番目の矩形ブロックの色差ΔE_blk(i)からピクチャの色差ΔE_picを減算した減算値の範囲が、予め定められる複数の閾値THS,THS,…,THSq_maxによって区切られた項目となっている。ここで、q_maxは、予め定められるqの最大値であり、図10のΔQPテーブル222のピクチャの矩形ブロックの色差ΔE_blk(i)から色差ΔE_picを減算した減算値の項目数は、q=1〜(q_max+1)となる。つまり、図10に示すように、BaseQPと平均輝度値Yと閾値THSを示すqの値が定まると、それに対応したΔQPを選択することができることになる。
図11に示す処理について説明する。ステップS202において判定部20が、YESの判定をした場合(ステップS202−YES)、判定部20はpに「1」を代入する(ステップS2031)。判定部20は、ピクチャの色差ΔE_picからi番目の矩形ブロックの色差ΔE_blk(i)を減算した減算値を算出し、算出した減算値が、予め定められる閾値THLよりも大きいか否かを判定する(ステップS2032)。
判定部20が、算出した減算値が、予め定められる閾値THL以下であると判定した場合(ステップS2032−NO)、判定部20は、pの値を調整部21に出力する(ステップS2034)。一方、判定部20が、算出した減算値が、予め定められる閾値THLより大きいと判定した場合(ステップS2032−YES)、判定部20は、pに1を加えた値をpに代入する(ステップS2033)。
判定部20は、pの値が、予め定められるpの最大値(p_max)より大きいか否かを判定する(ステップS2035)。判定部20は、p値が、予め定められるpの最大値(p_max)以下であると判定した場合(ステップS2035−NO)、ステップS2032以降の処理を繰り返す。
判定部20が、pの値が、予め定められるpの最大値(p_max)より大きいと判定した場合(ステップS2035−YES)、判定部20は、pの値を調整部21に出力する(ステップS2034)。
ステップS204aにおいて、調整部21は、記憶部22から当該ピクチャに対応するBaseQPを読み出す。調整部21は、変換処理部11から取り込んだ、当該矩形ブロックの平均輝度値Yと、当該ピクチャに対応するBaseQPと、判定部20が出力したpの値とに基づいて、記憶部22に記憶されている図9に示すΔQPテーブル221を参照して、対応するΔQPを読み出す。なお、図9のテーブルでは、ΔQPに予め符号が付与されているため、第1の実施形態のステップS204の処理のように、プラスの符号を付与しない。
ステップS2031〜S2035の処理では、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも大きい場合に、複数の閾値THLに基づいて、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも主観品質に影響を与える程度に大きいか否かを判定するとともに、その影響度合いを判定している。また、ステップS204aでは、調整部21が、矩形ブロックの平均輝度値Yと、符号化対象画像データのBaseQPと、pの値で示される閾値THLに応じて、ΔE_blk(i)の量子化パラメータ調整オフセットΔQPの値を大きくする方向に調整する。換言すると、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも主観品質に影響を与える程度に大きいため、ピクチャ全体の平均的な劣化と比較して、当該矩形ブロックの局所的な視覚的劣化は目立ちにくいことから、当該矩形ブロックに対して主観品質への影響度合いに応じた粗い量子化を行って、視覚的劣化を目立たせる代わりに、当該矩形ブロックに割り当てる符号量を減少させて節約していることになる。
同様に、図12に示す処理について説明する。ステップS202において判定部20が、NOの判定をした場合(ステップS202−NO)、判定部20はqに「1」を代入する(ステップS2061)。判定部20は、i番目の矩形ブロックの色差ΔE_blk(i)からピクチャの色差ΔE_picを減算した減算値を算出し、算出した減算値が、予め定められる閾値THSよりも大きいか否かを判定する(ステップS2062)。
判定部20が、算出した減算値が、予め定められる閾値THS以下であると判定した場合(ステップS2062−NO)、判定部20は、qの値を調整部21に出力する(ステップS2064)。一方、判定部20が、算出した減算値が、予め定められる閾値THSより大きいと判定した場合(ステップS2062−YES)、判定部20は、qに1を加えた値をqに代入する(ステップS2063)。
判定部20は、qの値が、予め定められるqの最大値(q_max)より大きいか否かを判定する(ステップS2065)。判定部20は、q値が、予め定められるqの最大値(q_max)以下であると判定した場合(ステップS2065−NO)、ステップS2062以降の処理を繰り返す。
判定部20が、qの値が、予め定められるqの最大値(q_max)より大きいと判定した場合(ステップS2065−YES)、判定部20は、qの値を調整部21に出力する(ステップS2064)。
ステップS207aにおいて、調整部21は、記憶部22から当該ピクチャに対応するBaseQPを読み出す。調整部21は、変換処理部11から取り込んだ、当該矩形ブロックの平均輝度値Yと、当該ピクチャに対応するBaseQPと、判定部20が出力したqの値とに基づいて、記憶部22に記憶されている図10に示すΔQPテーブル222を参照して、対応するΔQPを読み出す。なお、図10のテーブルでは、ΔQPに予め符号が付与されているため、第1の実施形態のステップS207の処理のように、マイナスの符号を付与しない。
ステップS2061〜S2065の処理では、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)以下である場合に、複数の閾値THSに基づいて、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも主観品質に影響を与える程度に小さい否かを判定するとともに、その影響度合いを判定している。また、ステップS207aでは、調整部21が、矩形ブロックの平均輝度値Yと、符号化対象画像データのBaseQP、qの値で示される閾値THSに応じて、ΔE_blk(i)の量子化パラメータ調整オフセットΔQPの値を小さくする方向に調整する。換言すると、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも主観品質に影響を与える程度に小さいため、ピクチャ全体の平均的な劣化と比較して、当該矩形ブロックの局所的な視覚的劣化が目立ちやすいことから、当該矩形ブロックに対して主観品質への影響度合いに応じた細かい量子化を行って、当該矩形ブロックに割り当てる符号量を増加させる代わりに、視覚的劣化を目立たなくさせている。
なお、図11及び図12では、図5の処理と異なり、ステップS205のΔQPに「0」を代入する処理を経由する処理の流れを設けていないが、その代わりに、図9では、p=1の列、すなわちΔE_pic−ΔE_blk(i)≦THLの列のΔQPの値を全て「0」としている。同様に、図10では、q=1の列、すなわちΔE_blk(i)−ΔE_pic≦THSの列のΔQPの値を全て「0」としている。これにより、最初の閾値であるTHLとTHS以下と判定された場合、ΔQPは、「0」となる。
また、上記の第1の実施形態の他の構成例において、閾値THLと閾値THSの各々の値は、異なる値であることを前提としているが、p=qの場合に、閾値THLと閾値THSとが同一の値であってもよい。
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。図13は、第2の実施形態における画像符号化装置1aの構成を示すブロック図である。第1の実施形態の画像符号化装置1と同一の構成については同一の符号を付し、以下、異なる構成について説明する。第2の実施形態の画像符号化装置1aは、事前解析部101a、符号量制御部102a、画像分割部103、予測残差信号生成部104、変換・量子化処理部105、逆量子化・逆変換処理部106、復号画像信号生成部107、イントラ予測処理部108、ループフィルタ処理部109、インター予測処理部110、スイッチ部111、及びエントロピー符号化部112aを備える。
エントロピー符号化部112aは、第1の実施形態のエントロピー符号化部112の構成に加えて、符号化対象画像データ内の符号化済みブロックの数と、符号化対象画像データ内の符号化済みブロックの発生符号量とを符号量制御部102aの調整部21aに出力する。
事前解析部101a及び符号量制御部102aの構成は、図14に示す構成となる。事前解析部101aは、ブロック分割部10a、変換処理部11a、ブロック劣化度算出部12、及び符号化対象画像劣化度算出部13を備える。ブロック分割部10aは、第1の実施形態のブロック分割部10の構成に加えて、符号化対象画像データ内の矩形ブロックの数を符号量制御部102aの調整部21aに出力する。変換処理部11aは、第1の実施形態の変換処理部11では、算出した平均輝度値Yを調整部21に出力する構成となっていたが、変換処理部11aは、平均輝度値Yを調整部21aに出力しない構成となる。
符号量制御部102aは、判定部20、調整部21a及び記憶部22aを備える。記憶部22aは、予め定められる符号化対象画像データの目標符号量の値を予め記憶する。符号化対象画像データの目標符号量は、例えば、符号化対象画像データのピクチャタイプやビットレートごとに予め定められる。
調整部21aは、ブロック分割部10aが出力する符号化対象画像データに含まれる矩形ブロックの数と、エントロピー符号化部112aが出力する符号化済みブロックの発生符号量及び符号化済みブロックの数と、記憶部22aに記憶されている符号化対象画像データの目標符号量とに基づいて、矩形ブロックの目標符号量を算出する。また、調整部21aは、判定部20の判定結果、及び矩形ブロックの色差ΔE_blk(i)とピクチャの色差ΔE_picの値の大きさに応じて矩形ブロックの目標符号量を増減させて調整する。また、調整部21aは、調整後の矩形ブロックの目標符号量に基づいて、当該矩形ブロックに適用する量子化パラメータを算出する。
(符号量制御部による処理)
次に、第2の実施形態における処理について図15に示すフローチャートを参照しつつ説明する。事前解析部101aは、第1の実施形態の事前解析部101と同様に入力データとして取り込んだ符号化対象画像データに対して、図4に処理を行い、ブロック劣化度算出部12が、矩形ブロックごとの色差ΔE_blk(i)を判定部20に出力し、符号化対象画像劣化度算出部13が、ピクチャの色差ΔE_picを判定部20に出力する。符号量制御部102aの判定部20は、ブロック視覚的劣化度である矩形ブロックごとの色差ΔE_blk(i)と、符号化対象画像視覚的劣化度であるピクチャの色差ΔE_picとを取り込む(ステップS301)。ここでは、判定部20は、i=0番目の矩形ブロックから順に取り込み、ステップS302〜S310の処理を矩形ブロックごとに繰り返すものとする(ループLc1s〜ループLc1e)。
判定部20は、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも大きいか否かを判定する(ステップS302)。判定部20は、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも大きいと判定した場合(ステップS302−YES)、次に、ピクチャの色差ΔE_picから矩形ブロックの色差ΔE_blk(i)を減算した減算値を算出し、算出した減算値が、予め定められる閾値THLよりも大きいか否かを判定する(ステップS303)。
判定部20が、ピクチャの色差ΔE_picから矩形ブロックの色差ΔE_blk(i)を減算した減算値が、予め定められる閾値THL以下であると判定した場合(ステップS303−NO)、調整部21aは、次式(5)に基づいて、i番目の矩形ブロックの目標符号量TBit_iを算出し、算出したTBit_iをi番目の矩形ブロックの調整後の目標符号量NBit_iとする(ステップS306)。
Figure 2019004304
式(5)において、TBit_frameは、記憶部22aに予め記憶されている符号化対象画像データの目標符号量であり、調整部21aが記憶部22aから読み出して取得する。N_frameは、ブロック分割部10aから与えられる符号化対象画像データに含まれる矩形ブロックの数である。Bit_doneは、符号化済みブロックの発生符号量であり、N_doneは、符号化済みブロックの数であり、Bit_doneとN_doneの値は、エントロピー符号化部112aから与えられる。なお、通常動作時には、式(5)が、一定の符号化ブロック周期で演算されて、符号化対象画像データごとの目標符号量に近づける処理が行われる。
一方、判定部20が、ピクチャの色差ΔE_picから矩形ブロックの色差ΔE_blk(i)を減算した減算値が、予め定められる閾値THLよりも大きいと判定した場合(ステップS303−YES)、調整部21aは、式(5)に基づいて、i番目の矩形ブロックの目標符号量TBit_iを算出する(ステップS304)。
調整部21aは、次式(6)により、調整後の矩形ブロックの目標符号量NBit_iを算出する(ステップS305)。
Figure 2019004304
式(6)においてαは、次式(7)によって求められるオフセット符号量である。
Figure 2019004304
式(7)においてaは、スケーリング係数であり、bは、オフセット定数である。なお、式(6)の意味するところは、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)より大きい場合であって、閾値THLによる判定により、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも主観品質に影響を与える程度に大きい場合、相対的に当該矩形ブロックの視覚的劣化が目立たないことから、当該矩形ブロックに対して、大きさに応じた粗い量子化を行って、視覚的劣化を目立たせる代わりに、当該矩形ブロックへの符号量の割り当てを少なくすることを意味している。
一方、判定部20は、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)以下であると判定した場合(ステップS302−NO)、矩形ブロックの色差ΔE_blk(i)からピクチャの色差ΔE_picを減算した減算値を算出し、算出した減算値が、予め定められる閾値THSよりも大きいか否かを判定する(ステップS307)。
判定部20が、矩形ブロックの色差ΔE_blk(i)からピクチャの色差ΔE_picを減算した減算値が、予め定められる閾値THS以下であると判定した場合(ステップS307−NO)、調整部21aは、次式(5)に基づいて、i番目の矩形ブロックの目標符号量TBit_iを算出し、算出したTBit_iをi番目の矩形ブロックの調整後の目標符号量NBit_iとする(ステップS306)。
判定部20が、矩形ブロックの色差ΔE_blk(i)からピクチャの色差ΔE_picを減算した減算値が、予め定められる閾値THSより大きいと判定した場合(ステップS307−YES)、調整部21aは、次式(5)に基づいて、i番目の矩形ブロックの目標符号量TBit_iを算出する(ステップS308)。調整部21aは、次式(8)により、調整後の矩形ブロックの目標符号量NBit_iを算出する(ステップS309)。
Figure 2019004304
式(8)においてβは、次式(9)によって求められるオフセット符号量である。
Figure 2019004304
式(9)においてaは、スケーリング係数であり、bは、オフセット定数である。なお、式(8)の意味するところは、ピクチャの色差ΔE_picが、矩形ブロックの視覚的劣化度である色差ΔE_blk(i)以下である場合であって、ピクチャの色差ΔE_picが、矩形ブロックの色差ΔE_blk(i)よりも主観品質に影響を与える程度に小さい場合、当該矩形ブロックでの視覚的劣化が大きくなると推定される。そのため、当該矩形ブロックに対して、小ささに応じた細かい量子化を行って、当該矩形ブロックに割り当てる符号量を増加させる代わりに、視覚的劣化を目立たなくさせている。
調整部21aは、調整後の矩形ブロックの目標符号量NBit_iに基づいて、i番目の矩形ブロックに適用する量子化パラメータを算出する(ステップS310)。
上記の式(7)及び式(9)のスケーリング係数a及びオフセット定数bは、予め定められる固定値であり、式(7)と式(9)において、同じ値が予め定められていてもよいし、別の値が予め定められていてもよい。
前述したように、ある輝度値、すなわちY成分における色差CbCrの微小変化に伴う視覚的劣化を、CIE1976L*a*b*色空間上での距離による色差ΔEで表す場合、色差ΔEは低彩度領域で大きく、高彩度領域では小さくなる。つまり、矩形ブロック内の画素値が主に低彩度の画素値で構成されているとき、僅かな画素値の変化によっても色差ΔE_blk(i)の値は大きくなる。これに対して、矩形ブロック内の画素値が主に高彩度の画素値で構成されているとき、色差ΔE_blk(i)の値は小さくなる。
また、色差ΔEは、低輝度では小さく、高輝度では大きくなる。式(7)及び式(9)のスケーリング係数a、オフセット定数bは、このような彩度や輝度の違いによる色差ΔEの影響を調整するためのものであり、例えば、実験的に予め複数の映像により求めた値を固定値として設定する。また、当該固定値に限られず、過去の符号化済みピクチャから得られた符号量と色差ΔEの比によりピクチャ単位に算出した値を用いてもよいし、過去の符号化済みピクチャの同位置の発生符号量と色差ΔEの比により矩形ブロック単位に算出した値を用いてもよい。
なお、上記の第2の実施形態において、閾値THLと閾値THSは、異なる値であってもよいし、同一の値であってもよい。また、第2の実施形態の閾値THLと、第1の実施形態の閾値THLは、異なる値であってもよいし、同一の値であってもよいし、第2の実施形態の閾値THSと、第1の実施形態の閾値THSは、異なる値であってもよいし、同一の値であってもよい。また、閾値THLと閾値THSの各々を複数の異なる閾値とし、図11及び図12で示した第1の実施形態の他の構成例のように、ピクチャの色差ΔE_picと、矩形ブロックの色差ΔE_blk(i)の差の値が、複数の異なる閾値によって区切られる範囲のいずれに属するかを判定するようにしてもよい。
例えば、複数の異なる閾値が、THL<THL<…及び、THS<THS<…となっている場合、これらの閾値によって区切られる範囲、例えば、「ΔE_pic−ΔE_blk(i)≦THL」,「THL<ΔE_pic−ΔE_blk(i)≦THL」,…といった範囲の各々に異なるスケーリング係数a、オフセット定数bを対応付けておくことで、ピクチャの色差ΔE_picと、矩形ブロックの色差ΔE_blk(i)の差の値の大きさに応じて、調整後の目標符号量NBit_iの値を増減させることができる。
なお、上記の第2の実施形態において、記憶部22aが、予め定められる符号化対象画像データの目標符号量の値を予め記憶するとしているが、本発明の構成は、当該実施の形態に限られない。例えば、ある符号化対象画像データの目標符号量を示す情報が、当該符号化対象画像データに付加されている場合、事前解析部101aが符号化対象画像データを取り込む際に、符号化対象画像データに付加されている目標符号量を示す情報を取り込んで、符号量制御部102aに通知するようにしてもよい。
上記の第2の実施形態の構成により、画像符号化装置1aにおいて、事前解析部101aのブロック分割部10aは、符号化対象画像データを矩形ブロックに分割し、変換処理部11aは、矩形ブロックごとに、矩形ブロックに含まれる画素値の平均画素値を算出し、矩形ブロックの各画素値と、矩形ブロックの平均画素値とをL*a*b*色空間上の座標に変換する。ブロック劣化度算出部12は、矩形ブロックの各画素値及び平均画素値のL*a*b*色空間上の座標値に基づいて、矩形ブロックごとの視覚的劣化度であるブロック視覚的劣化度、すなわち色差ΔE_blk(i)を算出する。符号化対象画像劣化度算出部13は、ブロック視覚的劣化度に基づいて、符号化対象画像データの視覚的劣化度である符号化対象画像視覚的劣化度、すなわち色差ΔE_picを算出する。符号量制御部102aの判定部20は、色差ΔE_blk(i)と、色差ΔE_picの大小関係を判定する。調整部21aは、判定部20の判定結果と、色差ΔE_picの大きさに対する、色差ΔE_blk(i)と色差ΔE_picの差の値の大きさの割合とに応じて、符号化対象画像データの目標符号量を増減させ、符号化対象画像データの目標符号量にしたがって量子化パラメータを求めて設定する。これにより、事前解析部101aが、符号化対象画像データ全体に対する視覚的な劣化が発生している箇所を符号化処理前に予め検出しておくことができる。そのため、符号化対象ブロック単位毎に以降の符号化処理を行う際、符号量制御部102aが、局所的な視覚的な劣化を抑えるように目標符号量を増減させ、増減させた目標符号量に基づいて量子化パラメータを算出して設定することができる。したがって、映像を構成する広色域と高いダイナミックレンジを有する画像の符号化を行う際に、演算量の増加を抑えつつ、色成分の符号化劣化を低減して主観品質の平準化を行うことが可能となる。
なお、上記の第1及び第2の実施形態において、図5のステップS202,S203,S206、図11のステップS2032,S2035、図12のステップS2062,S2065、図15のステップS302,S303,S307の判定処理は、いずれも、左辺の値が、右辺の値より大きいか否かを判定しているが、本発明の構成は、当該実施の形態に限られない。左辺の値が、右辺の値以上か否かを判定するようにしてもよい。
また、図5のステップS202、及び図15のステップS302の処理において、ΔE_picとΔE_blk(i)が同一値の場合について以下のような処理にしてもよい。図5及び図15の処理では、ΔE_picとΔE_blk(i)が同一値の場合、ステップS202及びステップS302において、NOの判定となる。NOの判定の場合、その後ステップS206、及びステップS307が行われる。
ステップS206の処理において、閾値THSが、0以上の値である場合、ステップS205の処理により、ΔQP=0となり、当該矩形ブロックには、量子化パラメータとしてBaseQPが割り当てられることになる。ステップS307の処理において、閾値THSが、0以上の値である場合、ステップS306の処理により、NBit=TBit_iとなる。
つまり、ΔE_picとΔE_blk(i)が同一値の場合、視覚的な劣化が互いに視覚的劣化が目立つこともないため、図5の処理において、ステップS202の処理を、三分岐とし、ΔE_pic>ΔE_blk(i)の場合、ステップS203に進め、ΔE_blk(i)>E_picの場合、ステップS206に進め、ΔE_pic=ΔE_blk(i)の場合、ステップS205に進めるようにしてもよい。
同様に、図15の処理においても、三分岐とし、ステップS302の処理を、ΔE_pic>ΔE_blk(i)の場合、ステップS303に進めて、ΔE_blk(i)>E_picの場合、ステップS307に進めて、ΔE_pic=ΔE_blk(i)の場合、ステップS306に進めるようにしてもよい。
上記の第1及び第2の実施形態において、調整部21は、量子化パラメータ調整オフセットΔQPにより量子化パラメータを増減させ、調整部21aは、矩形ブロックの目標符号量に応じて量子化パラメータを増減させるようにしているが、本発明の構成は、当該実施の形態に限られない、量子化パラメータ以外の符号化パラメータであってよく、例えば、CUサイズを符号化パラメータとし、判定部20及び20aの判定結果に応じてCUサイズを増減させるようにしてもよい。また、第1及び第2の実施形態の量子化パラメータを増減させる構成に加えて、その他の局所的な量子化パラメータの調整を行う構成、量子化パラメータ調整オフセットΔQPの調整を行う構成、または目標符号量を調整する構成と組み合わせて利用してもよい。
また、上記の第1及び第2の実施形態では、映像信号を構成する各フレームに閉じた処理として、フレームをあるサイズの矩形ブロックに分割して、(A)矩形ブロック単位にブロック視覚的劣化度を算出する。更に、当該矩形ブロック単位に算出したブロック視覚的劣化度から(B)フレーム全体、すなわち符号化対象画像データの符号化対象画像視覚的劣化度を算出し、ブロック視覚的劣化度と符号化対象画像視覚的劣化度とに応じて、量子化パラメータを増減させる調整を行っている。
前述したように、MPEG2 TM5の符号量制御手法は、「(Step1):I/P/Bピクチャ単位で目標符号量を決定、(Step2):実際にあるピクチャを符号化して得られた符号量を符号量制御のための仮想バッファにフィードバックして、当該符号化ブロックのの量子化パラメータを補正、(Step3):主観品質向上のために、画面内の複雑度(アクティビティ、分散)に応じて量子化パラメータを増減させる調整を行う。」という構成になっている。
しかし、あるピクチャにおいて、当該ピクチャの劣化度合いが大きいからといって、そのピクチャの大部分のブロックで量子化パラメータを減少させる処理を行ってしまうと、当該ピクチャにおける発生符号量が当初の目標符号量に比べて増大してしまう。発生符号量を増大させてしまうと、必然的に、他のピクチャに対して割り当てる符号量が減ってしまうことになり、以降のピクチャに対して十分な符号量を割り得ることができず、画質低下を招いてしまう可能性が高い。
これに対して、上記の第1及び第2の実施形態の構成では、あるピクチャに対して行う符号量を増減させる調整の影響が、残りのピクチャの符号量を定める際に伝播しないように、画面内、すなわち符号化対象画像データ内に閉じた量子化パラメータの調整を行っている。これにより、従来の目標符号量を割り当てる手法と組み合わせることができるというメリットがある。
また、上記の第1及び第2の実施形態の構成では、局所的に目立つ歪みは、全体としての主観品質も低下させてしまうことから、入力データである符号化対象画像データから得られた視覚的劣化度である色差ΔEに基づいて、局所的に目立つ歪みを符号化対象画像データ全体、すなわちピクチャ全体を平準化する。この平準化により、各ブロックの局所劣化度をピクチャ全体劣化度に近づけさせることで、ピクチャ全体としての歪みの目立ちやすさを抑え、全体としての主観品質向上を行うことを可能としている。
また、上記の第1及び第2の実施形態の構成において、比較の対象とするピクチャの単位は、1枚ずつに限られず、複数枚であってもよく、例えば、GOP(Group Of Picture:符号化における一般的なピクチャのグループ)といった単位に拡張してもよい。この場合、例えば、上記において、(B)フレーム全体、すなわち符号化対象画像データの符号化対象画像視覚的劣化度を定義していたのに加えて、(C)ピクチャグループ全体の劣化度というものを定義して、その中でピクチャ全体の劣化度を平準化させるようにしてもよい。すなわち、ピクチャグループ全体の劣化を平準化するように、1つのピクチャあたりの目標劣化度を調整して1つのピクチャあたりの劣化度を平準化させ、当該劣化度にあわせて局所ブロックの劣化度を平準化させるように量子化パラメータの調整を行うようにしてもよい。
上述した実施形態における画像符号化装置1,1aをコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、FPGA(Field Programmable Gate Array)等のプログラマブルロジックデバイスを用いて実現されるものであってもよい。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
10、10a…ブロック分割部,11、11a…変換処理部,12…ブロック劣化度算出部,13…符号化対象画像劣化度算出部,101、101a…事前解析部,102、102a…符号量制御部,103…画像分割部,104…予測残差信号生成部,105…変換・量子化処理部,106…逆量子化・逆変換処理部,107…復号画像信号生成部,108…イントラ予測処理部,109…ループフィルタ処理部,110…インター予測処理部,111…スイッチ部,112、112a…エントロピー符号化部,20…判定部,21、21a…調整部,22、22a…記憶部

Claims (8)

  1. 映像を構成する複数のフレームであって高ダイナミックレンジで広色域な画像を含むフレームの各々を符号化対象画像データとし、符号化対象画像の主観品質を平準化するように前記符号化対象画像データを符号化する画像符号化装置であって、
    前記符号化対象画像データをブロックに分割するブロック分割部と、
    前記ブロックごとの画素値に基づいて、前記ブロックごとの視覚的劣化度であるブロック視覚的劣化度を取得するブロック劣化度取得部と、
    前記ブロック視覚的劣化度に基づいて、前記符号化対象画像データの視覚的劣化度である符号化対象画像視覚的劣化度を取得する符号化対象画像劣化度取得部と、
    前記ブロック視覚的劣化度と、当該ブロック視覚的劣化度に対応する前記ブロックを含む前記符号化対象画像データの前記符号化対象画像視覚的劣化度との大小関係を判定する判定部と、
    前記判定部の判定結果に基づいて、前記符号化対象画像データの符号化に用いられる符号化パラメータの値を調整する調整部と、
    調整後の符号化パラメータの値に基づいて前記符号化対象画像データを符号化する符号化部と、
    を備える画像符号化装置。
  2. 前記調整部は、
    判定された大小関係に基づき、前記ブロック視覚的劣化度を前記符号化対象画像視覚的劣化度に近づけるように前記符号化パラメータの値を調整する、請求項1に記載の画像符号化装置。
  3. 前記ブロック劣化度取得部は、
    前記ブロックごとの画素値を変換して得られる変換値であって前記画素値のばらつきが低彩度において強調される変換値を用いて、前記ブロックごとの視覚的劣化度であるブロック視覚的劣化度を取得する、請求項1又は2に記載の画像符号化装置。
  4. 前記符号化パラメータは、量子化パラメータであり、
    前記調整部は、
    前記符号化対象画像データにおける前記ブロックの視覚的劣化を目立たなくさせる場合、前記ブロックに適用する前記量子化パラメータの値を減少させ、前記符号化対象画像データにおける前記ブロックの視覚的劣化が目立たせる場合、前記ブロックに適用する前記量子化パラメータの値を増加させる、請求項2又は3に記載の画像符号化装置。
  5. 前記符号化対象画像データに予め定められている初期値としての量子化パラメータの値と、前記ブロックに含まれる前記画素値の輝度成分を平均して得られる平均輝度値とに関連付けられて量子化パラメータ調整オフセットを予め記憶する記憶部を備え、
    前記調整部は、
    前記符号化対象画像データの前記初期値としての量子化パラメータの値と、前記ブロックの前記平均輝度値とに対応する前記量子化パラメータ調整オフセットを前記記憶部から読み出し、読み出した前記量子化パラメータ調整オフセットにより当該ブロックに適用する前記量子化パラメータを増減させる、請求項4に記載の画像符号化装置。
  6. 前記符号化パラメータは、量子化パラメータであり、
    前記調整部は、
    前記判定結果と、前記符号化対象画像視覚的劣化度の値の大きさに対する、前記ブロック視覚的劣化度と前記符号化対象画像視覚的劣化度との差の値の大きさの割合とに応じて、前記符号化対象画像データの目標符号量を増減させ、前記符号化対象画像データの目標符号量にしたがって量子化パラメータを求める、請求項1から4のいずれか一項に記載の画像符号化装置。
  7. 映像を構成する複数のフレームであって高ダイナミックレンジで広色域な画像を含むフレームの各々を符号化対象画像データとし、符号化対象画像の主観品質を平準化するように前記符号化対象画像データを符号化する画像符号化方法であって、
    前記符号化対象画像データをブロックに分割するブロック分割ステップと、
    前記ブロックごとの画素値に基づいて、前記ブロックごとの視覚的劣化度であるブロック視覚的劣化度を取得するブロック劣化度取得ステップと、
    前記ブロック視覚的劣化度に基づいて、前記符号化対象画像データの視覚的劣化度である符号化対象画像視覚的劣化度を取得する符号化対象画像劣化度取得ステップと、
    前記ブロック視覚的劣化度と、当該ブロック視覚的劣化度に対応する前記ブロックを含む前記符号化対象画像データの前記符号化対象画像視覚的劣化度との大小関係を判定する判定ステップと、
    判定結果に基づいて、前記符号化対象画像データの符号化に用いられる符号化パラメータの値を調整する調整ステップと、
    調整後の符号化パラメータの値に基づいて前記符号化対象画像データを符号化する符号化ステップと、
    を有する画像符号化方法。
  8. 映像を構成する複数のフレームであって高ダイナミックレンジで広色域な画像を含むフレームの各々を符号化対象画像データとし、符号化対象画像の主観品質を平準化するように前記符号化対象画像データを符号化するコンピュータに、
    前記符号化対象画像データをブロックに分割するブロック分割ステップと、
    前記ブロックごとの画素値に基づいて、前記ブロックごとの視覚的劣化度であるブロック視覚的劣化度を取得するブロック劣化度取得ステップと、
    前記ブロック視覚的劣化度に基づいて、前記符号化対象画像データの視覚的劣化度である符号化対象画像視覚的劣化度を取得する符号化対象画像劣化度取得ステップと、
    前記ブロック視覚的劣化度と、当該ブロック視覚的劣化度に対応する前記ブロックを含む前記符号化対象画像データの前記符号化対象画像視覚的劣化度との大小関係を判定する判定ステップと、
    判定結果に基づいて、前記符号化対象画像データの符号化に用いられる符号化パラメータの値を調整する調整ステップと、
    調整後の符号化パラメータの値に基づいて前記符号化対象画像データを符号化する符号化ステップと
    を実行させるための画像符号化プログラム。
JP2017117227A 2017-06-14 2017-06-14 画像符号化装置、画像符号化方法、及び画像符号化プログラム Pending JP2019004304A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017117227A JP2019004304A (ja) 2017-06-14 2017-06-14 画像符号化装置、画像符号化方法、及び画像符号化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017117227A JP2019004304A (ja) 2017-06-14 2017-06-14 画像符号化装置、画像符号化方法、及び画像符号化プログラム

Publications (1)

Publication Number Publication Date
JP2019004304A true JP2019004304A (ja) 2019-01-10

Family

ID=65006209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017117227A Pending JP2019004304A (ja) 2017-06-14 2017-06-14 画像符号化装置、画像符号化方法、及び画像符号化プログラム

Country Status (1)

Country Link
JP (1) JP2019004304A (ja)

Similar Documents

Publication Publication Date Title
JP5283628B2 (ja) 映像復号方法及び映像符号化方法
CN110301134B (zh) 整合的图像整形和视频编码
KR101893049B1 (ko) 비디오 코딩에서의 적응형 역양자화 방법 및 장치
WO2016164235A1 (en) In-loop block-based image reshaping in high dynamic range video coding
US11336904B2 (en) Video coding using a saliency map
JPH04196976A (ja) 画像符号化装置
US7676107B2 (en) Method and system for video classification
WO2015030967A1 (en) Methods and apparatuses for adjusting macroblock quantization parameters to improve visual quality for lossy video encoding
JP2006005650A (ja) 画像符号化装置及び方法
US10742986B2 (en) High dynamic range color conversion correction
JP5800362B2 (ja) 動画像送出装置、動画像受信装置、動画像伝送システム、動画像送出方法、動画像受信方法、およびプログラム
CN107094251B (zh) 一种基于空间位置自适应质量调整的视频、图像编解码方法及装置
JP4243218B2 (ja) 量子化制御装置、その方法及びそのプログラム、並びに、適応量子化符号化装置
US8369423B2 (en) Method and device for coding
JP2009055236A (ja) 映像符号化装置及び方法
JP2018019239A (ja) 撮像装置及びその制御方法及びプログラム
JP2007053620A (ja) 画像処理装置および画像処理方法
JP2019004304A (ja) 画像符号化装置、画像符号化方法、及び画像符号化プログラム
KR20130078569A (ko) 관심영역 기반의 화질 향상을 위한 스크린 콘텐츠 비디오 부호화/복호화 방법 및 그 장치
CN116248895B (zh) 虚拟现实全景漫游的视频云转码方法及系统
JP6200220B2 (ja) 画像処理装置、符号化装置、復号装置、及びプログラム
US10715772B2 (en) High dynamic range color conversion correction
CN116886917A (zh) 增益图编码方法、解码方法、装置、设备及介质
JP2015019319A (ja) 符号化装置、符号化方法及びプログラム
JP2024000443A (ja) 映像符号化装置及びプログラム