JP2014130427A - 画質推定装置、画質推定方法および画質推定プログラム - Google Patents
画質推定装置、画質推定方法および画質推定プログラム Download PDFInfo
- Publication number
- JP2014130427A JP2014130427A JP2012286871A JP2012286871A JP2014130427A JP 2014130427 A JP2014130427 A JP 2014130427A JP 2012286871 A JP2012286871 A JP 2012286871A JP 2012286871 A JP2012286871 A JP 2012286871A JP 2014130427 A JP2014130427 A JP 2014130427A
- Authority
- JP
- Japan
- Prior art keywords
- image
- learning
- image quality
- complexity
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Image Analysis (AREA)
Abstract
【課題】画像に固有の空間周波数特徴、時間周波数特徴の影響を考慮して、より良い精度で画質推定できる画質推定装置、画質推定方法および画質推定プログラムを提供する。
【解決手段】本発明に係る画質推定装置は、画像を構成する各画素から求まる複雑度に基づいて、学習用に予め劣化させた学習用画像を分類する第1画像分類部40と、第1画像分類部40により分類された学習用画像と、劣化前後の学習用画像の比較により学習用画像に与えられる画質評価値とを関連付け、当該関連付けを異なる学習用画像を用いて繰り返し、画質劣化度を分類毎に学習する学習部50と、複雑度に基づいて、検査画像を分類する第2画像分類部80と、学習部50による学習結果に基づいて、第2画像分類部80により分類された検査画像の画質劣化度を分類毎に推定する推定部90と、を有する。
【選択図】図1
【解決手段】本発明に係る画質推定装置は、画像を構成する各画素から求まる複雑度に基づいて、学習用に予め劣化させた学習用画像を分類する第1画像分類部40と、第1画像分類部40により分類された学習用画像と、劣化前後の学習用画像の比較により学習用画像に与えられる画質評価値とを関連付け、当該関連付けを異なる学習用画像を用いて繰り返し、画質劣化度を分類毎に学習する学習部50と、複雑度に基づいて、検査画像を分類する第2画像分類部80と、学習部50による学習結果に基づいて、第2画像分類部80により分類された検査画像の画質劣化度を分類毎に推定する推定部90と、を有する。
【選択図】図1
Description
本発明は、画像信号を符号化した際に生じる画質劣化の度合を推定する画質推定装置、画質推定方法および画質推定プログラムに関する。
画像信号の情報量は極めて多く、伝送や蓄積を効率的に行うために、これらを符号化(圧縮)する技術が用いられている。これに伴い、画像の符号化により画質が劣化する場合の画質評価技術も多数研究されている。
画質推定方式の一つとして、非特許文献1に開示されているようなNR(No Reference)方式という手法がある。
非特許文献1の推定方法では、学習用画像データベースにある学習用画像を周波数変換して、得られた変換係数の分布形状をパラメータ化して特徴ベクトルとする。そして、学習用画像に対して主観的に判断した画質劣化の評価値(以下、主観評価値という)を正解データとして、特徴ベクトルとの確率的な対応関係を学習する。ここでの学習の識別器には、たとえば、SVM(Support Vector Machine)が用いられる。そして、SVMにより学習された結果は、学習パラメータとして記憶される。また、検査画像に対して同様に特徴ベクトルを算出し、SVR(Support Vector Regression)により、画質を推定できる。
A.K.Moorthy and A.C.Bovik、‘‘A Two−stage Framework for Blind Image Quality Assessment’’、ICIP2010、pp.2481−2484、Sept.2010。
しかしながら、上記の非特許文献1に記載の発明では、画像に固有の空間周波数成分を考慮せずに、単に画像を周波数変換して得られた変換係数の分布形状を特徴ベクトルとしている。
ここで、高い空間周波数の成分を間引きする符号化方式を適用した画像の画質推定について考える。この場合、符号化前から高い空間周波数成分を含まない画像と、符号化により高い空間周波数成分が失われた画像とで、変換係数の分布形状に差がない可能性が十分に有り得る。
たとえば、SVMの学習結果として、符号化により高い空間周波数成分が失われた学習用画像の特徴ベクトルと主観評価値から学習した学習パラメータを記憶しているとする。このような場合、符号化前から高い空間周波数成分を含まない検査画像をSVRにより画質推定すると、画質劣化度を過大に推定してしまう恐れがある。これでは、画質推定誤差が大きい。
本発明は、上記従来技術の課題を解決するためになされたものであり、画像に固有の空間周波数特性、時間周波数特性の影響を考慮して、より良い精度で画質推定できる画質推定装置、画質推定方法および画質推定プログラムを提供することを目的とする。
上記の目的を達成するための本発明に係る画質推定装置は、第1画像分類部、学習部、第2画像分類部、推定部を有する。第1画像分類部は、画像を構成する各画素から求まる複雑度に基づいて、学習用に予め劣化させた学習用画像を分類する。学習部は、第1画像分類部により分類された学習用画像と、劣化前後の学習用画像の比較により学習用画像に与えられる画質評価値とを関連付け、当該関連付けを異なる学習用画像を用いて繰り返し、画質劣化度を分類毎に学習する。第2画像分類部は、上記複雑度に基づいて、検査画像を分類する。推定部は、学習部による学習結果に基づいて、第2画像分類部により分類された検査画像の画質劣化度を分類毎に推定する。
上記の目的を達成するための本発明に係る画質推定方法は、第1画像分類ステップ、学習ステップ、第2画像分類ステップ、推定ステップを有する。第1画像分類ステップは、画像を構成する各画素から求まる複雑度に基づいて、学習用に予め劣化させた学習用画像を分類する。学習ステップは、第1画像分類ステップにより分類された学習用画像と、劣化前後の学習用画像の比較により学習用画像に与えられる画質評価値とを関連付け、当該関連付けを異なる学習用画像を用いて繰り返し、画質劣化度を分類毎に学習する。第2画像分類ステップは、上記複雑度に基づいて、検査画像を分類する。推定ステップは、学習ステップによる学習結果に基づいて、第2画像分類ステップにより分類された検査画像の画質劣化度を分類毎に推定する。
上記の目的を達成するための本発明に係る画質推定プログラムは、上記画質推定方法を、コンピュータに実行させる。
本発明に係る画質推定装置、画質推定方法および画質推定プログラムによれば、画像を構成する各画素から求まる複雑度に基づいて分類された画像を、分類毎に画質劣化度の学習および推定を行うことにより、画像に固有の空間周波数特性、時間周波数特性の影響を考慮して、画質推定精度を向上できる。
本発明に係る画質推定装置、画質推定方法および画質推定プログラムは、画像を構成する各画素から求まる複雑度に基づいて画像を分類し、分類毎に画質劣化度の学習および推定を行う。画像に固有の空間周波数特性、時間周波数特性が含まれている画像を、空間周波数特性、時間周波数特性が類似する画像に分類して、分類毎に画質劣化度の学習および推定を行う。
以下、添付した図面を参照しながら、本発明の画質推定装置、画質推定方法および画質推定プログラムの実施形態を説明する。
<画質推定装置の構成>
図1は、本発明に係る画質推定装置の構成を示すブロック図である。図2は、図1の画質推定装置の学習部の構成を示すブロック図である。図3は、図1の画質推定装置の推定部の構成を示すブロック図である。
図1は、本発明に係る画質推定装置の構成を示すブロック図である。図2は、図1の画質推定装置の学習部の構成を示すブロック図である。図3は、図1の画質推定装置の推定部の構成を示すブロック図である。
本発明に係る画質推定装置は、図1に示すように、学習用画像データベース10、客観画質評価値算出部20、第1複雑度算出部30、第1画像分類部40、学習部50、学習結果記憶部60、第2複雑度算出部70、第2画像分類部80、推定部90を有する。学習用画像データベース10および学習結果記憶部60は、メモリやハードディスク等の記録装置によって達成される。また、客観画質評価値算出部20、第1複雑度算出部30、第1画像分類部40、学習部50、第2複雑度算出部70、第2画像分類部80、推定部90は、図示しないCPU(Central−Processing Unit)が、各種プログラムを読み込んで実行することにより達成される。ここで、プログラムとは、たとえば、画像データの画質を推定するための画質推定プログラムである。
学習用画像データベース10は、複数組の学習用画像を予め格納している。一組の学習用画像は、符号化(圧縮)により劣化していないオリジナルのままの無劣化画像と、当該無劣化画像を符号化により画質劣化させた劣化画像と、を含む。複数組の学習用画像は、動画像を構成する複数の連続したフレーム画像であって良い。たとえば、MPEG−2やH.264/AVCなどの動画像であってよい。この場合、複数の無劣化画像がフレームとして連続して無劣化動画像を構成し、複数の劣化画像がフレームとして連続して劣化動画像を構成する。以下では、無劣化動画像を構成する無劣化画像を無劣化フレーム画像といい、劣化動画像を構成する劣化画像を劣化フレーム画像という。また、無劣化画像という場合には無劣化フレーム画像を含み、劣化画像という場合には劣化フレーム画像を含む。無劣化フレーム画像と、当該無劣化フレーム画像を符号化により画質劣化させた劣化フレーム画像とが一組の学習用画像をなす。学習用画像データベース10には、このような動画像を複数格納することができる。
客観画質評価値算出部20は、学習用画像データベース10の一組の劣化前後の学習用画像の比較により、当該学習用画像にかかる画質劣化度を、客観的な画質評価値(以下、客観評価値という)として算出する。客観評価値は、画質評価指標として一般的なPSNR(Peak Signal−to−Noise Ratio)やSSIM(Structural SIMilarity)などを用いて算出できる。
第1複雑度算出部30は、客観画質評価値算出部20により客観評価値を算出した一組の学習用画像のうち、劣化画像を構成する各画素から、画像を分類する指標として、複雑度を算出する。複雑度が多段階ある場合、複雑度の段階毎に第1複雑度算出部30を用意する。
複雑度は、たとえば、画像に固有の空間周波数特性、時間周波数特性により決定できる。類似する空間周波数特性、時間周波数特性を有する画像を同段階の複雑度に分類できる。ここで、任意の範囲内の空間周波数特性値、時間周波数特性値を有する画像が、空間周波数特性、時間周波数特性が類似するとみなされる。複雑度の詳細については、後述する。
第1画像分類部40は、第1複雑度算出部30により算出した複雑度に基づいて、上記劣化画像を分類する。複雑度に基づく劣化画像の分類動作の詳細については、後述する。
学習部50は、客観評価値を正解値として与え、学習用画像として用意された劣化画像について画質劣化度を学習する。すなわち、学習部50は、学習用画像として用意された劣化画像の特徴を表す特徴ベクトルを算出する。そして、学習部50は、特徴ベクトルから劣化画像の画質劣化度を判定するための学習モデルを生成する。なお、学習モデルは、特徴ベクトルと、客観評価値(すなわち、劣化画像の画質劣化度)と、についての確率的な対応関係を決定する数理モデルであり、たとえば、教師あり学習の一つであるSVMを用いてもよい。もちろん、これに限らず、回帰関数や、ニューラルネットワーク等を用いてもよい。さらに、学習部50は、第1画像分類部40により分類された画像の分類数と、同数用意される。すなわち、分類毎に画質劣化度の学習を行う。
より詳細には、学習部50は、図2に示すように、周波数変換部51と、変換係数パラメータ化部52と、画質学習部53と、を有する。
周波数変換部51は、第1画像分類部40により分類された劣化画像に対して周波数変換を行う。周波数変換は、ウェーブレット変換、離散コサイン変換、またはフーリエ変換などを用いることができる。
変換係数パラメータ化部52は、周波数変換部51での周波数変換により得られた変換係数の分布形状をパラメータ化して、特徴ベクトルとする。
画質学習部53は、変換係数パラメータ化部52で得られた特徴ベクトルと、客観画質評価値算出部20で算出された上記客観評価値(画質劣化度)と、を関連付ける学習を行う。具体的には、画質学習部53は、変換係数パラメータ化部52で得られた特徴ベクトルから劣化画像の画質劣化度を判定するための学習モデルを生成する。たとえば、画質学習部53は、学習モデルとして、少なくとも一つ以上のパラメータ(変数)を持つ数理モデルを採用し、各特徴ベクトルを入力したときに正解値の客観評価値を出力するように数理モデルのパラメータ値を決定する。ここで決定されたパラメータ値は、学習結果パラメータとして学習結果記憶部60に記憶される。
学習結果記憶部60は、画質学習部53の学習結果、すなわち、上記一組の学習用画像の学習結果パラメータを記憶する。学習結果記憶部60は、学習部50と同数用意される。すなわち、画質劣化度の学習結果を分類毎に記憶する。
第2複雑度算出部70は、第1複雑度算出部30と同一の複雑度を検査画像から算出する。第2複雑度算出部70に入力される検査画像は、画質劣化度の検査対象となる画像である。したがって、検査画像は、学習用画像とは異なり、無劣化画像および劣化画像の対ではない。検査画像は、動画像を構成する複数の連続したフレーム画像であって良い。複雑度が多段階ある場合、複雑度の段階毎に第2複雑度算出部70を用意する。
第2画像分類部80は、第2複雑度算出部70により算出した複雑度に基づいて、検査画像を分類する。複雑度に基づく検査画像の分類動作の詳細については、後述する。
推定部90は、学習結果記憶部60に記憶されている学習結果に基づいて、第2画像分類部80により分類された検査画像にかかる画質劣化度を推定する。すなわち、推定部90は、学習部50によって生成された学習モデルに、分類された検査画像を入力し、得られた出力値を分類された検査画像の画質劣化度とする。なお、学習モデルに含まれるパラメータには、学習結果記憶部60に記憶された学習結果パラメータが用いられる。推定部90は、学習結果記憶部60と同数用意される。すなわち、推定部90は、分類毎に学習結果記憶部60に記憶されている学習結果に基づいて、画像劣化度を推定する。このため、第2画像分類部80により分類された検査画像は、その分類により、適切な推定部90に割り当てられる。
より詳細には、推定部90は、図3に示すように、周波数変換部91と、変換係数パラメータ化部92と、画質推定部93と、を有する。
周波数変換部91は、第2画像分類部80により分類された検査画像に対して周波数変換を行う。周波数変換には、学習部50と同様の変換、すなわち、ウェーブレット変換、離散コサイン変換、またはフーリエ変換などを用いることができる。周波数変換部91は、周波数変換部51と同一処理を行うため、周波数変換部51により代替処理することもできる。
変換係数パラメータ化部92は、周波数変換部91での周波数変換により得られた変換係数の分布形状をパラメータ化して、特徴ベクトルとする。変換係数パラメータ化部92は、変換係数パラメータ化部52と同一処理を行うため、変換係数パラメータ化部52により代替処理することもできる。
画質推定部93は、変換係数パラメータ化部92で得られた特徴ベクトルを、学習結果記憶部60に記憶された学習結果パラメータによって決定される学習モデルに入力して、分類毎に検査画像の画質劣化度を推定する。例えば、SVR手法を用いることができる。
<画質推定装置の動作>
次に、本発明に係る画質推定装置の動作について説明する。画質推定装置の動作は、たとえば、CPUが画質推定プログラムを実行することで達成できる。
次に、本発明に係る画質推定装置の動作について説明する。画質推定装置の動作は、たとえば、CPUが画質推定プログラムを実行することで達成できる。
図4は、本発明に係る画質推定装置の動作フローチャートである。図4に示す動作は、画質推定プログラムのトップクラスに位置するメインプログラムの処理手順を示している。
(ステップS100)
モード読取ステップとして、メインプログラムを実行するCPUは、画質推定プログラムの実行モードを読み取る。実行モードは、ユーザーがキーボード、マウス、タッチパネル等の入力装置を使って設定できる。実行モードには、学習モード、推定モードを含むが、必要に応じて他のモードを含むこともできる。
モード読取ステップとして、メインプログラムを実行するCPUは、画質推定プログラムの実行モードを読み取る。実行モードは、ユーザーがキーボード、マウス、タッチパネル等の入力装置を使って設定できる。実行モードには、学習モード、推定モードを含むが、必要に応じて他のモードを含むこともできる。
(ステップS200)
学習モード判断ステップとして、CPUにより、実行モードが学習モードであるか否かについて判断する。学習モードである場合は、ステップ300に移行する。学習モードではない場合は、ステップ400に移行する。
学習モード判断ステップとして、CPUにより、実行モードが学習モードであるか否かについて判断する。学習モードである場合は、ステップ300に移行する。学習モードではない場合は、ステップ400に移行する。
(ステップS300)
学習プロセスステップとして、客観画質評価値算出部20、第1複雑度算出部30、第1画像分類部40、学習部50により、学習用画像に対する画質劣化度の学習を行う。学習プロセスステップS300の詳細な処理は、図5のフローチャートを用いて後述する。
学習プロセスステップとして、客観画質評価値算出部20、第1複雑度算出部30、第1画像分類部40、学習部50により、学習用画像に対する画質劣化度の学習を行う。学習プロセスステップS300の詳細な処理は、図5のフローチャートを用いて後述する。
(ステップS400)
推定モード判断ステップとして、CPUにより、実行モードが推定モードであるか否かについて判断する。推定モードである場合は、ステップ500に移行する。推定モードではない場合は、ステップ600に移行する。
推定モード判断ステップとして、CPUにより、実行モードが推定モードであるか否かについて判断する。推定モードである場合は、ステップ500に移行する。推定モードではない場合は、ステップ600に移行する。
(ステップS500)
推定プロセスステップとして、第2複雑度算出部70、第2画像分類部80、推定部90により、検査画像に対する画質劣化度の推定を行う。推定プロセスステップS500の処理は、図6のフローチャートを用いて後述する。
推定プロセスステップとして、第2複雑度算出部70、第2画像分類部80、推定部90により、検査画像に対する画質劣化度の推定を行う。推定プロセスステップS500の処理は、図6のフローチャートを用いて後述する。
(ステップS600)
メインプログラム終了判断ステップとして、CPUにより、画質推定プログラムを終了させるか否かについて判断する。画質推定プログラムを終了させる場合は、ステップ700に移行する。画質推定プログラムを終了させない場合は、最初に戻って次の画質劣化度の学習または推定を行う。例えば、動画像を構成する複数組の学習用画像の学習または検査画像の推定を終えて、学習用データベース10に格納されている異なる動画像を構成する複数組の学習用画像の学習または検査画像の推定を行うことができる。
メインプログラム終了判断ステップとして、CPUにより、画質推定プログラムを終了させるか否かについて判断する。画質推定プログラムを終了させる場合は、ステップ700に移行する。画質推定プログラムを終了させない場合は、最初に戻って次の画質劣化度の学習または推定を行う。例えば、動画像を構成する複数組の学習用画像の学習または検査画像の推定を終えて、学習用データベース10に格納されている異なる動画像を構成する複数組の学習用画像の学習または検査画像の推定を行うことができる。
(ステップS700)
終了ステップとして、CPUにより、画質推定プログラムの終了処理を実行する。学習モードまたは推定モードにおいて、プログラム実行の中で使用された変数のアドレス空間の開放や、外部とのアクセスの切断などの処理を行うことができる。
終了ステップとして、CPUにより、画質推定プログラムの終了処理を実行する。学習モードまたは推定モードにおいて、プログラム実行の中で使用された変数のアドレス空間の開放や、外部とのアクセスの切断などの処理を行うことができる。
以上において、一つのCPUですべての処理を行う態様を想定して説明したが、実行モード毎に別のCPUで処理することもできる。この場合、CPU間の相互アクセス処理が必要となる。ただし、機能ごとに別のチップに搭載されるCPUを使用することにより、組合せの自由や機能のバージョンアップのし易さ、画質推定を必要とする終端機器で学習結果のみを利用して、学習プロセス自体は必要としないなどといった対応が柔軟にできる。
次に、学習プロセスステップS300、推定プロセスステップS500の詳細の処理を示すサブルーチンフローチャートについて説明する。
図5は、図4の学習プロセスのサブルーチンフローチャートである。
(ステップS310)
CPUは、学習用画像データベース10に予め格納されている複数組の学習用画像から、学習させる学習用画像の組数Lを取得する。画質劣化度を学習させる学習用画像の母数の数とジャンルが多いほど、より良い推定精度が得られるが、予め検査画像のジャンルが分かる場合や、必要な推定精度などに応じて、適宜選択しながら決めることができる。特に動画像を構成する複数の連続したフレーム画像の場合は、組数Lは全フレーム画像の枚数を指すこともできれば、一定の規則、たとえば、一定の時間間隔でサンプリングされたフレーム画像の枚数を指すこともできる。
CPUは、学習用画像データベース10に予め格納されている複数組の学習用画像から、学習させる学習用画像の組数Lを取得する。画質劣化度を学習させる学習用画像の母数の数とジャンルが多いほど、より良い推定精度が得られるが、予め検査画像のジャンルが分かる場合や、必要な推定精度などに応じて、適宜選択しながら決めることができる。特に動画像を構成する複数の連続したフレーム画像の場合は、組数Lは全フレーム画像の枚数を指すこともできれば、一定の規則、たとえば、一定の時間間隔でサンプリングされたフレーム画像の枚数を指すこともできる。
(ステップS320)
CPUは、L組の学習用画像のうち、一組の学習用画像を選択して、選択された学習用画像に対して第1複雑度算出部30により、画像を分類する指標としての複雑度を算出する。
CPUは、L組の学習用画像のうち、一組の学習用画像を選択して、選択された学習用画像に対して第1複雑度算出部30により、画像を分類する指標としての複雑度を算出する。
複雑度は、静止画像の場合は画面内複雑度をいう。画面内複雑度は、画像に固有の空間方向の複雑度である。画面内複雑度、たとえば、画像を構成する各画素の輝度または色から算出可能な、画像における輝度分散や輝度コントラスト、空間方向周波数分布、エッジ、フラット、テクスチャなどの画像構造の分布などを用いて求められる。一方、動画像の場合の複雑度は上記画面内複雑度以外に、画面間複雑度も含む。画面間複雑度は、複数の連続したフレーム画像に固有の時間方向の複雑度である。画面間複雑度は、たとえば、フレーム画像を構成する各画素の輝度または色から算出可能なフレーム間差分値、時間方向周波数分布などを用いて求められる。
後述の<実施形態1>で、複雑度として画面内複雑度の輝度分散値と画面間複雑度のフレーム間輝度差分値を算出する方法を詳細に説明する。
(ステップS330)
CPUは、第1複雑度算出部30により算出した複雑度に基づいて、上記劣化画像を分類する。後述の<実施形態1>で、上記画面内複雑度の輝度分散値と画面間複雑度のフレーム間輝度差分値に基づく画像の分類方法を詳細に説明する。
CPUは、第1複雑度算出部30により算出した複雑度に基づいて、上記劣化画像を分類する。後述の<実施形態1>で、上記画面内複雑度の輝度分散値と画面間複雑度のフレーム間輝度差分値に基づく画像の分類方法を詳細に説明する。
(ステップS340)
CPUは、第1画像分類部40により分類された学習用画像に対して学習部50により画質劣化度の学習を行う。周波数変換部51により、分類された劣化画像に対して周波数変換を行い、周波数変換により得られた変換係数の分布形状を変換係数パラメータ化部52によりパラメータ化して、特徴ベクトルとする。当該特徴ベクトルと、客観画質評価値算出部20で算出された当該学習用画像に与えられる客観評価値(画質劣化度)との関連付けを、画質学習部53によりSVMを用いて学習する。具体的には、変換係数パラメータ化部52で得られた特徴ベクトルから劣化画像の画質劣化度を判定するための学習モデルを生成する。例えば、画質学習部53は、学習モデルとして、少なくとも一つ以上のパラメータ(変数)を持つ数理モデルを採用し、各特徴ベクトルを入力したときに正解値の客観評価値を出力するように数理モデルのパラメータ値を決定する。
CPUは、第1画像分類部40により分類された学習用画像に対して学習部50により画質劣化度の学習を行う。周波数変換部51により、分類された劣化画像に対して周波数変換を行い、周波数変換により得られた変換係数の分布形状を変換係数パラメータ化部52によりパラメータ化して、特徴ベクトルとする。当該特徴ベクトルと、客観画質評価値算出部20で算出された当該学習用画像に与えられる客観評価値(画質劣化度)との関連付けを、画質学習部53によりSVMを用いて学習する。具体的には、変換係数パラメータ化部52で得られた特徴ベクトルから劣化画像の画質劣化度を判定するための学習モデルを生成する。例えば、画質学習部53は、学習モデルとして、少なくとも一つ以上のパラメータ(変数)を持つ数理モデルを採用し、各特徴ベクトルを入力したときに正解値の客観評価値を出力するように数理モデルのパラメータ値を決定する。
(ステップS350)
CPUは、分類された学習用画像の学習結果、すなわち、生成した学習モデルのパラメータ値を、学習結果パラメータとして学習結果記憶部60に記憶する。
CPUは、分類された学習用画像の学習結果、すなわち、生成した学習モデルのパラメータ値を、学習結果パラメータとして学習結果記憶部60に記憶する。
(ステップS360)
CPUは、ステップS310で取得されたL個のすべての組の学習用画像の画質劣化度の学習が終わったか否かについて判断する。すべての組の画質劣化度の学習が終わった場合、メインプログラムに移行する。継続して画質劣化度の学習をすべき組がある場合、ステップS320に移行して、他の組の学習用画像の画質劣化度の学習を行う。例えば、動画像の場合は、次のサンプリングされたフレーム画像の画質劣化度の学習を行う。
CPUは、ステップS310で取得されたL個のすべての組の学習用画像の画質劣化度の学習が終わったか否かについて判断する。すべての組の画質劣化度の学習が終わった場合、メインプログラムに移行する。継続して画質劣化度の学習をすべき組がある場合、ステップS320に移行して、他の組の学習用画像の画質劣化度の学習を行う。例えば、動画像の場合は、次のサンプリングされたフレーム画像の画質劣化度の学習を行う。
図6は、図4の推定プロセスのサブルーチンフローチャートである。
(ステップS510)
CPUは、画質推定の対象である検査画像の入力検知を行う。検査画像は、主として符号化された画像である。検査画像は、動画像を構成する複数の連続したフレーム画像の一フレーム画像であって良い。
CPUは、画質推定の対象である検査画像の入力検知を行う。検査画像は、主として符号化された画像である。検査画像は、動画像を構成する複数の連続したフレーム画像の一フレーム画像であって良い。
(ステップS520)
CPUは、検査画像に対して第2複雑度算出部70により第1複雑度算出部30と同様に複雑度を算出する。
CPUは、検査画像に対して第2複雑度算出部70により第1複雑度算出部30と同様に複雑度を算出する。
(ステップS530)
CPUは、検査画像に対して第2画像分類部80により画像分類処理を行う。画像分類は、第2複雑度算出部70により算出した複雑度に基づいて行う。
CPUは、検査画像に対して第2画像分類部80により画像分類処理を行う。画像分類は、第2複雑度算出部70により算出した複雑度に基づいて行う。
(ステップS540)
CPUは、分類された検査画像に対して推定部90により画質劣化度の推定を行う。周波数変換部91により、分類された検査画像に対して周波数変換を行い、周波数変換により得られた変換係数の分布形状を変換係数パラメータ化部92によりパラメータ化して、特徴ベクトルとする。当該特徴ベクトルと、学習結果記憶部60に記憶された学習結果パラメータによって決定される学習モデルに入力して、検査画像の画質劣化度を推定する。
CPUは、分類された検査画像に対して推定部90により画質劣化度の推定を行う。周波数変換部91により、分類された検査画像に対して周波数変換を行い、周波数変換により得られた変換係数の分布形状を変換係数パラメータ化部92によりパラメータ化して、特徴ベクトルとする。当該特徴ベクトルと、学習結果記憶部60に記憶された学習結果パラメータによって決定される学習モデルに入力して、検査画像の画質劣化度を推定する。
(ステップS550)
CPUは、画質推定部93による検査画像の画質劣化度の推定結果を出力する。検査画像が動画像を構成する複数の連続したフレーム画像である場合は、CPUは、全フレーム画像に対する画質推定結果を統合して、動画像に対する画質推定結果として出力することもできる。
CPUは、画質推定部93による検査画像の画質劣化度の推定結果を出力する。検査画像が動画像を構成する複数の連続したフレーム画像である場合は、CPUは、全フレーム画像に対する画質推定結果を統合して、動画像に対する画質推定結果として出力することもできる。
(ステップS560)
CPUは、画質推定処理を終了するか否かについて判断する。処理を終了する場合、メインプログラムに移行する。継続して画質劣化度の推定を実行する場合、ステップS510に移行して、次の検査画像の入力検知を行う。たとえば、動画像を構成する複数の連続したフレーム画像のうち、一フレーム画像に対する画質推定を終えたら、異なるフレーム画像に対する画質劣化度の推定を行うことができる。
CPUは、画質推定処理を終了するか否かについて判断する。処理を終了する場合、メインプログラムに移行する。継続して画質劣化度の推定を実行する場合、ステップS510に移行して、次の検査画像の入力検知を行う。たとえば、動画像を構成する複数の連続したフレーム画像のうち、一フレーム画像に対する画質推定を終えたら、異なるフレーム画像に対する画質劣化度の推定を行うことができる。
なお、上記した各フローチャートの各処理単位は、画質推定装置の理解を容易にするために、主な処理内容に応じて分割したものである。処理ステップの分類の仕方やその名称によって、本願発明が制限されることはない。画質推定装置で行われる処理は、さらに多くの処理ステップに分割することもできる。また、1つの処理ステップが、さらに多くの処理を実行してもよい。
次に、本発明に係る画質推定装置、画質推定方法および画質推定プログラムを<実施形態1>としてさらに詳細に説明する。
<実施形態1>
実施形態1の画質推定装置は、画面内複雑度の輝度分散値と画面間複雑度のフレーム間輝度差分値に基づいて学習用画像または検査画像を分類する方法を利用する。すなわち、本実施形態に用いる学習用画像または検査画像は、動画像を構成する複数の連続したフレーム画像である。
実施形態1の画質推定装置は、画面内複雑度の輝度分散値と画面間複雑度のフレーム間輝度差分値に基づいて学習用画像または検査画像を分類する方法を利用する。すなわち、本実施形態に用いる学習用画像または検査画像は、動画像を構成する複数の連続したフレーム画像である。
<実施形態1の画質推定装置の構成>
図7は、実施形態1に係る画質推定装置の構成を示すブロック図である。図7において、図1と同一の構成要素には図1と同一の符号を付している。
図7は、実施形態1に係る画質推定装置の構成を示すブロック図である。図7において、図1と同一の構成要素には図1と同一の符号を付している。
本実施形態では、図1の画質推定装置が、第1複雑度算出部30、学習部50、学習結果記憶部60、第2複雑度算出部70、推定部90をそれぞれ二つ有している場合を一例として説明する。
ただし、これは本実施形態の画像分類方法の説明を分かりやすく説明するために例示したものだけであって、第1複雑度算出部30、学習部50、学習結果記憶部60、第2複雑度算出部70、推定部90が二つ以上の場合も、当然本願発明の技術的範囲に属する。
本実施形態において、第1複雑度算出部30は、画面内複雑度の輝度分散値を算出する画面内複雑度算出部31と、画面間複雑度のフレーム間輝度差分値を算出する画面間複雑度算出部32を有する。
第1画像分類部40は、上記輝度分散値とフレーム間輝度差分値に基づいて学習用画像を二種類のカテゴリーに分類する。たとえば、第1画像分類部40は、符号化難易度が高い画像と低い画像に分類できる。分類された学習用画像のカテゴリーが符号化難易度の高い画像である場合、第1画像分類部40は、当該学習用画像を学習部50Aに出力する。一方、分類された学習用画像のカテゴリーが符号化難易度の低い画像である場合、第1画像分類部40は、当該学習用画像を学習部50Bに出力する。
学習部50Aは、第1画像分類部40により分類された符号化難易度の高い学習用画像と、当該学習用画像に対する客観画質評価値とを関連付け、当該関連付けを異なる符号化難易度の高い学習用画像を用いて繰り返し、画質劣化度を学習する。
学習部50Bは、第1画像分類部40により分類された符号化難易度の低い学習用画像と、当該学習用画像に対する客観画質評価値とを関連付け、当該関連付けを異なる符号化難易度の低い学習用画像を用いて繰り返し、画質劣化度を学習する。
学習結果記憶部60Aは、学習部50Aの学習結果を一つの学習パラメータとして記憶する。
学習結果記憶部60Bは、学習部50Bの学習結果を他の一つの学習パラメータとして記憶する。
第1複雑度算出部30と同様に、第2複雑度算出部70は、画面内複雑度の輝度分散値を算出する画面内複雑度算出部71と、画面間複雑度のフレーム間輝度差分値を算出する画面間複雑度算出部72を有する。
第2画像分類部80は、上記輝度分散値とフレーム間輝度差分値に基づいて検査画像を上記二種類のカテゴリーに分類する。分類された検査画像のカテゴリーが符号化難易度の高い画像である場合、第2画像分類部80は、当該検査画像を推定部90Aに出力する。一方、分類された検査画像のカテゴリーが符号化難易度の低い画像である場合、第2画像分類部80は、当該検査画像を推定部90Bに出力する。
推定部90Aは、学習部50Aによる学習結果に基づいて、第2画像分類部80により分類された符号化難易度の高い検査画像の画質劣化度を推定する。
推定部90Bは、学習部50Bによる学習結果に基づいて、第2画像分類部80により分類された符号化難易度の低い検査画像の画質劣化度を推定する。
<実施形態1の画質推定装置の動作>
次に、実施形態1の画質推定装置の動作について説明する。図4〜6における処理フローのうち、ステップS320およびステップS520における複雑度の算出方法、ステップS330およびステップS530における画像分類方法について主に説明する。他の処理ステップについては、図4〜6の処理フローと同様の動作を行う。この説明のために、図8および図9に示すフレーム画像の例を使用する。まず、図8および図9ついて簡単に説明する。
次に、実施形態1の画質推定装置の動作について説明する。図4〜6における処理フローのうち、ステップS320およびステップS520における複雑度の算出方法、ステップS330およびステップS530における画像分類方法について主に説明する。他の処理ステップについては、図4〜6の処理フローと同様の動作を行う。この説明のために、図8および図9に示すフレーム画像の例を使用する。まず、図8および図9ついて簡単に説明する。
図8は、動画像を構成するフレーム画像の例を示す図である。図8では、フレーム画像Aのうち、画面の一部に高周波数成分のA1、A2部分を含み、それ以外の部分に低周波数成分のA0部分を含む。一方、図9は、動画像を構成するフレーム画像の他の例を示す図である。図9では、フレーム画像Bのうち、画面の一部に低周波数成分のB1、B2部分を含み、それ以外の部分に高周波数成分のB0部分を含む。
フレーム画像A、Bは後述する複雑度の算出方法および画像分類方法を分かりやすく説明するために、比較用として用いた画像であって、フレーム画像A、Bが特別な関係を有するものではなく、同一の動画像を構成する二つのフレーム画像を意味するものではない。
図8に示すように、フレーム画像AのA1、A2部分は、比較的隣接する画素間の輝度変化が激しく、高い周波数特性を有する。それ以外のA0部分は、比較的隣接する画素間の輝度変化が緩く、低い周波数特性を有する。
一方、図9に示すように、フレーム画像BのB1、B2部分は、比較的隣接する画素間の輝度変化が緩く、低い周波数特性を有する。それ以外のB0部分は、比較的隣接する画素間の輝度変化が激しく、高い周波数特性を有する。
本実施形態の複雑度算出方法および画像分類方法の理解を容易にするために、画像分類の対象である学習用画像または検査画像は、すべてX×Yピクセルサイズ(N画素数)であるものとして説明する。
以下、(1)空間周波数特性を考慮した画面内複雑度に基づく画像分類方法、(2)時間周波数特性を考慮した画面間複雑度に基づく画像分類方法、(3)空間周波数特性および時間周波数特性の両方を考慮した画面内複雑度および画面間複雑度に基づく画像分類方法を、順番に開示する。
(1)空間周波数特性を考慮した画面内複雑度に基づく画像分類方法
まず、空間周波数特性を考慮した画面内複雑度に基づく画像分類方法を開示する。
まず、空間周波数特性を考慮した画面内複雑度に基づく画像分類方法を開示する。
画面内複雑度として、図8、9におけるフレーム画像A、Bの平均輝度分散値VA、VBを算出する。一定の時間間隔でサンプリングされたフレーム画像のうち、時刻t、画面内座標(x、y)における画素の輝度値をI(x、y、t)とした場合、フレーム画像A、Bの平均輝度分散値VA、VBは下記数式1により求められる。
さらに、上記平均輝度分散値Vは、下記数式2により正規化され、画面内複雑度Sと表すことができる。
ここで、Vupperは平均輝度分散値Vの上限値を決める閾値である。
以上のように、平均輝度分散値Vを正規化して画面内複雑度Sを算出する。そして、画面内複雑度Sを、予め定められた画像分類閾値Sthと比較して、その大小関係によりフレーム画像A、Bを符号化難易度の異なる二種類の画像カテゴリーに分類できる。
図8のフレーム画像Aの分類について考える。フレーム画像Aは、上述したように画面の一部A1、A2にのみ高周波数特性を有し、それ以外の部分A0に低周波数特性を有している。したがって、フレーム画像A全体の平均輝度分散値VAは比較的小さい値となり、正規化された画面内複雑度SAも比較的小さい値となる。たとえば、画面内複雑度の値SAがSA=0.15であるとする。この場合、画像分類閾値Sthが予めSth=0.5と定められているとすると、SA<Sthであるため、フレーム画像Aは符号化難易度の低い画像カテゴリーに分類される。
一方、図9のフレーム画像Bの分類について考える。フレーム画像Bは、上述したように画面の一部B1、B2にのみ低周波数特性を有し、それ以外の部分B0に高周波数特性を有している。したがって、フレーム画像B全体の平均輝度分散値VBは比較的大きい値となり、正規化された画面内複雑度SBも比較的大きい値となる。たとえば、画面内複雑度の値SBがSB=0.85であるとする。この場合、画像分類閾値Sthが予めSth=0.5と定められているとすると、SB>Sthであるため、フレーム画像Bは符号化難易度の高い画像カテゴリーに分類される。
以上のように、空間周波数特性が異なるフレーム画像A、Bの画面内の平均輝度分散値VA、VBを正規化して画面内複雑度SA、SBの値を算出する。得られた画面内複雑度SA、SBの値と画像分類閾値Sthの値とを比較して、フレーム画像A、Bを符号化難易度の異なる二種類の画像カテゴリーに分類できる。
このように、画面内複雑度に基づいて符号化難易度の異なる二種類の画像カテゴリーに分類されたフレーム画像A、Bを、分類別に画質劣化度の学習または推定を行うことにより、画像に固有の空間周波数分布の影響を考慮して、画質推定精度を向上できる。
(2)時間周波数特性を考慮した画面間複雑度に基づく画像分類方法
次に、時間周波数特性を考慮した画面間複雑度に基づく画像分類方法を開示する。当該方法の理解を容易にするために、図10〜図13を使用する。まず、図10〜図13について簡単に説明する。
(2)時間周波数特性を考慮した画面間複雑度に基づく画像分類方法
次に、時間周波数特性を考慮した画面間複雑度に基づく画像分類方法を開示する。当該方法の理解を容易にするために、図10〜図13を使用する。まず、図10〜図13について簡単に説明する。
図10は、図8の画像の1フレーム後のフレーム画像の一例を示す図である。図10に示すフレーム画像A’は、図8と同様に、画面の一部に高周波数成分のA1’、A2’部分を含み、それ以外の部分に低周波数成分のA0’部分を含む。また、図10のA1’部分は、図8のA1部分が次のフレームにおいて、大きく左下側に移動していることを示している。これに対し、図10のA2’部分は、図8のA2部分と同じ位置にあり、次のフレームにおいて移動していない。
図11は、図8の画像の1フレーム後のフレーム画像の他の一例を示す図である。図11に示すフレーム画像A’’は、図8と同様に、画面の一部に高周波数成分のA1’’、A2’’部分を含み、それ以外の部分に低周波数成分のA0’’部分を含む。また、図11のA1’’部分は、図8のA1部分が次のフレームにおいて、わずかに左上側に移動していることを示している。これに対し、図11のA2’’部分は、図8のA2部分と同じ位置にあり、次のフレームにおいて移動していない。
図12は、図9の画像の1フレーム後のフレーム画像の一例を示す図である。図12に示すフレーム画像B’は、図9と同様に、画面の一部に低周波数成分のB1’、B2’部分を含み、それ以外の部分に高周波数特性成分のB0’部分を含む。また、図12のB1’部分は、図9のB1部分が次のフレームにおいて、大きく右下側に移動していることを示している。これに対し、図12のB2’部分は、図9のB2部分と同じ位置にあり、次のフレームにおいて移動していない。
図13は、図9の画像の1フレーム後のフレーム画像の他の一例を示す図である。図13に示すフレーム画像B’’は、図9と同様に、画面の一部に低周波数成分のB1’’、B2’’部分を含み、それ以外の部分に高周波数成分のB0’’部分を含む。また、図13のB1’’部分は、図9のB1部分が次のフレームにおいて、わずかに右上側に移動していることを示している。これに対し、図13のB2’’部分は、図9のB2部分と同じ位置にあり、次のフレームにおいて移動していない。
画面間複雑度として、図10〜図13におけるフレーム画像A’、A’’、B’、B’’のフレーム間輝度差分絶対値の平均値FA’、FA’’、FB’、FB’’を算出する。一定の時間間隔でサンプリングされたフレーム画像のうち、時刻t、画面内座標(x、y)における画素の輝度値をI(x、y、t)とした場合、フレーム間輝度差分絶対値の平均値FA’、FA’’、FB’、FB’’は下記数式3により求められる。
さらに、上記フレーム間輝度差分絶対値の平均値Fは、下記数式4により正規化され、画面間複雑度Tと表すことができる。
ここで、Fupperはフレーム間輝度差分絶対値の平均値Fの上限値を決める閾値である。
以上のように、正規化された画面間複雑度Tを、予め定められた画像分類閾値Tthと比較して、その大小関係によりフレーム画像A’、A’’、B’、B’’を符号化難易度の異なる二種類の画像カテゴリーに分類できる。
図10のフレーム画像A’の分類について考える。フレーム画像A’は、上述したように図8のA1部分のみが次のフレームにおいて、大きく左下側に移動している。このため、フレーム画像A’のフレーム間輝度差分絶対値の平均値FA’は比較的大きい値となり、正規化された画面間複雑度TA’も比較的大きい値となる。たとえば、画面間複雑度の値TA’がTA’=0.8であるとする。この場合、画像分類閾値Tthが予めTth=0.5と定められているとすると、TA’>Tthであるため、フレーム画像A’は符号化難易度の高い画像カテゴリーに分類される。
一方、図11のフレーム画像A’’の分類について考える。フレーム画像A’’は、上述したように図8のA1部分のみが次のフレームにおいて、わずかに左上側に移動している。このため、画像A’’のフレーム間輝度差分絶対値の平均値FA’’は比較的小さい値となり、正規化された画面間複雑度TA’’も比較的小さい値となる。たとえば、画面間複雑度の値TA’’がTA’’=0.2であるとする。この場合、画像分類閾値Tthが予めTth=0.5と定められているとすると、TA’’<Tthであるため、フレーム画像A’’は符号化難易度の低い画像カテゴリーに分類される。
図12のフレーム画像B’の分類について考える。フレーム画像B’は、上述したように図9のB1部分のみが次のフレームにおいて、大きく右下側に移動している。このため、フレーム画像B’のフレーム間輝度差分絶対値の平均値FB’は比較的大きい値となり、正規化された画面間複雑度TB’も比較的大きい値となる。たとえば、画面間複雑度の値TB’がTB’=0.8であるとする。この場合、画像分類閾値Tthが予めTth=0.5と定められているとすると、TB’>Tthであるため、フレーム画像B’は符号化難易度の高い画像カテゴリーに分類される。
一方、図13のフレーム画像B’’の分類について考える。フレーム画像B’’は、上述したように図9のB1部分のみが次のフレームにおいて、わずかに右上側に移動している。このため、フレーム画像B’’のフレーム間輝度差分絶対値の平均値FB’’は比較的小さい値となり、正規化された画面間複雑度TB’’も比較的小さい値となる。たとえば、画面間複雑度の値TB’’がTB’’=0.2であるとする。この場合、画像分類閾値Tthが予めTth=0.5と定められているとすると、TB’’<Tthであるため、フレーム画像B’’は符号化難易度の低い画像カテゴリーに分類される。
以上のように、時間周波数特性を考慮した画像分類方法では、フレーム間の画像の変化が大きいほど、高い画面間複雑度に正規化される。フレーム間での画像の変化が小さいほど、低い画面間複雑度に正規化される。正規化された画面間複雑度TA’、TA’’、TB’、TB’’の値と画像分類閾値Tthの値を比較することにより、フレーム画像A’とA’’、B’とB’’を符号化難易度の異なる二種類の画像カテゴリーに分類できる。
このように、画面間複雑度に基づいて符号化難易度の異なる二種類の画像カテゴリーに分類されたフレーム画像A’とA’’、B’とB’’を、分類別に画質劣化度の学習または推定を行うことにより、画像に固有の時間周波数分布の影響を考慮して、画質推定精度を向上できる。
(3)空間周波数特性および時間周波数特性の両方を考慮した画面内複雑度および画面間複雑度に基づく画像分類方法
次に、空間周波数特性および時間周波数特性の両方を考慮した画面内複雑度および画面間複雑度に基づく画像分類方法を開示する。
(3)空間周波数特性および時間周波数特性の両方を考慮した画面内複雑度および画面間複雑度に基づく画像分類方法
次に、空間周波数特性および時間周波数特性の両方を考慮した画面内複雑度および画面間複雑度に基づく画像分類方法を開示する。
上述のような空間周波数特性のみを考慮して画面内複雑度に基づく画像分類方法、または時間周波数特性のみを考慮して画面間複雑度に基づく画像分類方法において、画質推定の精度に一定の限度を表す場合がある。下記の表1を用いて説明する。
表1では、図10〜13におけるフレーム画像A’、A’’、B’、B’’について、それぞれ上述した画面内複雑度と画面間複雑度を算出した。
ここで、画面内複雑度による画像分類閾値Sthが予めSth=0.5と、画面間複雑度による画像分類閾値Tthが予めTth=0.5と定められているとする。
フレーム画像A’とA’’を比較してみると、画面内複雑度はともに0.15であるが、画面間複雑度はフレーム画像A’が0.8で、フレーム画像A’’が0.2である。フレーム画像A’、A’’を、画面内複雑度に基づいて画像分類すると同じ符号化難易度の画像カテゴリーに分類されるが、画面間複雑度に基づいて画像分類すると異なる符号化難易度の画像カテゴリーに分類される。フレーム画像B’とB’’の関係についても同様である。
一方、フレーム画像A’とB’を比較してみると、画面間複雑度はともに0.8であるが、画面内複雑度はフレーム画像A’が0.15で、フレーム画像B’が0.85である。フレーム画像A’、B’を画面間複雑度に基づいて画像分類すると同じ符号化難易度の画像カテゴリーに分類されるが、画面内複雑度に基づいて画像分類すると異なる符号化難易度の画像カテゴリーに分類される。フレーム画像A’’とB’’の関係についても同様である。
このように、画面内複雑度のみによる画像分類では、画像に固有の時間周波数特性の影響が考慮されていない。また、画面間複雑度のみによる画像分類では、画像に固有の空間周波数特性の影響が考慮されていない。
画面内複雑度として、上述した平均輝度分散値Vを算出し、画面間複雑度として、上述したフレーム間輝度差分絶対値の平均値Fを算出する。
上記平均輝度分散値Vとフレーム間輝度差分絶対値の平均値Fを正規化して算出した画面内複雑度Sと画面間複雑度Tを用いて、下記数式5により符号化複雑度Cを算出する。
C=S*T … (数式5)
ここで、Cは単に画面内複雑度Sと画面間複雑度Tの積として表したが、たとえば、画面内における高周波特性の画素と低周波数特性の画素の割合、画面間における全画素数に対する輝度変化された画素数の割合などを考慮して、重みを付加することもできる。
ここで、Cは単に画面内複雑度Sと画面間複雑度Tの積として表したが、たとえば、画面内における高周波特性の画素と低周波数特性の画素の割合、画面間における全画素数に対する輝度変化された画素数の割合などを考慮して、重みを付加することもできる。
この符号化複雑度Cを、予め定められた画像分類閾値Cthと比較して、その大小関係によりフレーム画像A’、A’’、B’、B’’を符号化難易度の異なる二種類の画像カテゴリーに分類できる。
図10のフレーム画像A’の分類について考える。たとえば、符号化複雑度CA’が0.12(0.15*0.8)であるとする。この場合、画像分類閾値CthがCth=0.5と定められているとすると、CA’<Cthであるため、フレーム画像A’は符号化難易度の低い画像カテゴリーに分類される。
図11のフレーム画像A’’の分類について考える。たとえば、符号化複雑度CA’’が0.03(0.15*0.2)であるとする。この場合、画像分類閾値CthがCth=0.5と定められているとすると、CA’’<Cthであるため、フレーム画像A’’は符号化難易度の低い画像カテゴリーに分類される。
図12のフレーム画像B’の分類について考える。たとえば、符号化複雑度CB’が0.68(0.85*0.8)であるとする。この場合、画像分類閾値CthがCth=0.5と定められているとすると、CB’>Cthであるため、フレーム画像B’は符号化難易度の高い画像カテゴリーに分類される。
図13のフレーム画像B’’の分類について考える。たとえば、符号化複雑度CB’’が0.17(0.85*0.2)であるとする。この場合、画像分類閾値CthがCth=0.5と定められているとすると、CB’’<Cthであるため、フレーム画像B’’は符号化難易度の低い画像カテゴリーに分類される。
すなわち、空間周波数特性と時間周波数特性が異なるフレーム画像A’、A’’、B’、B’’の符号化複雑度CA’、CA’’、CB’、CB’’の値と画像分類閾値Cthの値を比較することにより、フレーム画像A’、A’’、B’、B’’を符号化難易度の異なる二種類の画像カテゴリーに分類できる。
このように、画面内複雑度および画面間複雑度に基づいて符号化難易度の異なる二種類の画像カテゴリーに分類されたフレーム画像A’、A’’、B’、B’’を、分類別に画質劣化度の学習または推定を行うことにより、画像に固有の空間周波数特性および時間周波数特性の両方の影響を考慮して、画質推定精度を向上できる。
また、画質推定装置10を動作させるプログラムは、USBメモリ、フロッピー(登録商標)ディスク、CD−ROM等のコンピュータ読み取り可能な記録媒体によって提供されてもよいし、インターネット等のネットワークを介してオンラインで提供されてもよい。この場合、コンピュータ読み取り可能な記録媒体に記録されたプログラムは、通常、メモリやストレージ等に転送され記憶される。また、このプログラムは、たとえば、単独のアプリケーションソフトとして提供されてもよいし、画質推定装置10の一機能としてその装置のソフトウェアに組み込んでもよい。
10 学習用画像データベース、
20 客観画質評価値算出部、
30 第1複雑度算出部、
31 第1画面内複雑度算出部、
32 第1画面間複雑度算出部、
40 第1画像分類部、
50 学習部、
60 学習結果記憶部、
70 第2複雑度算出部、
71 第2画面内複雑度算出部、
72 第2画面間複雑度算出部、
80 第2画像分類部、
90 推定部、
51 周波数変換部、
52 変換係数パラメータ化部、
53 画質学習部、
91 周波数変換部、
92 変換係数パラメータ化部、
93 画質推定部、
50A 第1学習部、
50B 第2学習部、
60A 第1学習結果記憶部、
60B 第2学習結果記憶部、
90A 第1推定部、
90B 第2推定部。
20 客観画質評価値算出部、
30 第1複雑度算出部、
31 第1画面内複雑度算出部、
32 第1画面間複雑度算出部、
40 第1画像分類部、
50 学習部、
60 学習結果記憶部、
70 第2複雑度算出部、
71 第2画面内複雑度算出部、
72 第2画面間複雑度算出部、
80 第2画像分類部、
90 推定部、
51 周波数変換部、
52 変換係数パラメータ化部、
53 画質学習部、
91 周波数変換部、
92 変換係数パラメータ化部、
93 画質推定部、
50A 第1学習部、
50B 第2学習部、
60A 第1学習結果記憶部、
60B 第2学習結果記憶部、
90A 第1推定部、
90B 第2推定部。
Claims (9)
- 画像を構成する各画素から求まる複雑度に基づいて、学習用に予め劣化させた学習用画像を分類する第1画像分類部と、
前記第1画像分類部により分類された前記学習用画像と、劣化前後の学習用画像の比較により前記学習用画像に与えられる画質評価値とを関連付け、当該関連付けを異なる学習用画像を用いて繰り返し、画質劣化度を分類毎に学習する学習部と、
前記複雑度に基づいて、検査画像を分類する第2画像分類部と、
前記学習部による学習結果に基づいて、前記第2画像分類部により分類された検査画像の画質劣化度を分類毎に推定する推定部と、
を有する画質推定装置。 - 前記複雑度は、輝度分散、輝度コントラスト、空間方向周波数分布、エッジ、フラット、テクスチャ、画像間差分値、時間方向周波数分布の少なくとも一つを用いて算出される請求項1に記載の画質推定装置。
- 前記検査画像は、動画像の1フレームを構成する画像であり、
前記複雑度は、前記検査画像のフレーム内の空間方向周波数分布および前記検査画像のフレーム間の時間方向周波数分布の積により算出される請求項1または請求項2に記載の画質推定装置。 - 前記画質評価値は、劣化前後の学習用画像に基づき、差分を算出することによって客観値として得られる請求項1〜3のいずれか一項に記載の画質推定装置。
- 画像を構成する各画素から求まる複雑度に基づいて、学習用に予め劣化させた学習用画像を分類する第1画像分類ステップと、
前記第1画像分類ステップにより分類された前記学習用画像と、劣化前後の学習用画像の比較により前記学習用画像に与えられる画質評価値とを関連付け、当該関連付けを異なる学習用画像を用いて繰り返し、画質劣化度を分類毎に学習する学習ステップと、
前記複雑度に基づいて、検査画像を分類する第2画像分類ステップと、
前記学習ステップによる学習結果に基づいて、前記第2画像分類ステップにより分類された検査画像の画質劣化度を分類毎に推定する推定ステップと、
を有する画質推定方法。 - 前記複雑度は、輝度分散、輝度コントラスト、空間方向周波数分布、エッジ、フラット、テクスチャ、画像間差分値、時間方向周波数分布の少なくとも一つを用いて算出される請求項1に記載の画質推定方法。
- 前記検査画像は、動画像の1フレームを構成する画像であり、
前記複雑度は、前記検査画像のフレーム内の空間方向周波数分布および前記検査画像のフレーム間の時間方向周波数分布の積により算出される請求項1または請求項2に記載の画質推定方法。 - 前記画質評価値は、劣化前後の学習用画像に基づき、差分を算出することによって客観値として得られる請求項5〜7のいずれか一項に記載の画質推定方法。
- 請求項5〜8のいずれか一項に記載の画質推定方法を、コンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012286871A JP2014130427A (ja) | 2012-12-28 | 2012-12-28 | 画質推定装置、画質推定方法および画質推定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012286871A JP2014130427A (ja) | 2012-12-28 | 2012-12-28 | 画質推定装置、画質推定方法および画質推定プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014130427A true JP2014130427A (ja) | 2014-07-10 |
Family
ID=51408780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012286871A Pending JP2014130427A (ja) | 2012-12-28 | 2012-12-28 | 画質推定装置、画質推定方法および画質推定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014130427A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104182768B (zh) * | 2014-09-11 | 2017-03-29 | 西安电子科技大学 | 逆合成孔径雷达图像的质量分类方法 |
WO2017145399A1 (ja) * | 2016-02-24 | 2017-08-31 | 三菱電機株式会社 | 画像処理装置、設計支援システム及びプログラム |
JP2018522448A (ja) * | 2015-05-11 | 2018-08-09 | ネットフリックス・インコーポレイテッドNetflix, Inc. | 知覚的ビデオ品質を予測する技術 |
CN112001854A (zh) * | 2020-07-14 | 2020-11-27 | 浙江大华技术股份有限公司 | 一种编码图像的修复方法及相关系统和装置 |
WO2022114927A1 (ko) * | 2020-11-30 | 2022-06-02 | 삼성전자 주식회사 | 영상의 ai 부호화 및 ai 복호화를 위한 장치, 및 방법 |
JP7543080B2 (ja) | 2020-10-21 | 2024-09-02 | セコム株式会社 | 学習済みモデル及びデータ処理装置 |
-
2012
- 2012-12-28 JP JP2012286871A patent/JP2014130427A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104182768B (zh) * | 2014-09-11 | 2017-03-29 | 西安电子科技大学 | 逆合成孔径雷达图像的质量分类方法 |
JP2018522448A (ja) * | 2015-05-11 | 2018-08-09 | ネットフリックス・インコーポレイテッドNetflix, Inc. | 知覚的ビデオ品質を予測する技術 |
US10475172B2 (en) | 2015-05-11 | 2019-11-12 | Netflix, Inc. | Techniques for predicting perceptual video quality |
WO2017145399A1 (ja) * | 2016-02-24 | 2017-08-31 | 三菱電機株式会社 | 画像処理装置、設計支援システム及びプログラム |
JP2017152897A (ja) * | 2016-02-24 | 2017-08-31 | 三菱電機ビルテクノサービス株式会社 | 画像処理装置、設計支援システム及びプログラム |
AU2016393988B2 (en) * | 2016-02-24 | 2019-05-30 | Mitsubishi Electric Corporation | Image processing apparatus, design support system, and program |
CN112001854A (zh) * | 2020-07-14 | 2020-11-27 | 浙江大华技术股份有限公司 | 一种编码图像的修复方法及相关系统和装置 |
JP7543080B2 (ja) | 2020-10-21 | 2024-09-02 | セコム株式会社 | 学習済みモデル及びデータ処理装置 |
WO2022114927A1 (ko) * | 2020-11-30 | 2022-06-02 | 삼성전자 주식회사 | 영상의 ai 부호화 및 ai 복호화를 위한 장치, 및 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Min et al. | Saliency-induced reduced-reference quality index for natural scene and screen content images | |
Li et al. | Blind image quality assessment using a general regression neural network | |
Wang et al. | Maximum differentiation (MAD) competition: A methodology for comparing computational models of perceptual quantities | |
JP2014130427A (ja) | 画質推定装置、画質推定方法および画質推定プログラム | |
US8908989B2 (en) | Recursive conditional means image denoising | |
Zhang et al. | Opinion-unaware blind quality assessment of multiply and singly distorted images via distortion parameter estimation | |
CN110443800B (zh) | 视频图像质量的评价方法 | |
WO2018058090A1 (en) | Method for no-reference image quality assessment | |
JP2014056442A (ja) | 画質推定装置、画質推定方法および画質推定プログラム | |
Silvestre-Blanes | Structural similarity image quality reliability: Determining parameters and window size | |
CN105007488A (zh) | 基于变换域和空间域的通用无参考图像质量评价方法 | |
Fu et al. | Blind image quality assessment for multiply distorted images via convolutional neural networks | |
Rohil et al. | An improved model for no-reference image quality assessment and a no-reference video quality assessment model based on frame analysis | |
JP2014131128A (ja) | 画質推定装置、画質推定方法および画質推定プログラム | |
Sang et al. | Blind image quality assessment using a reciprocal singular value curve | |
CN112132774A (zh) | 一种色调映射图像的质量评价方法 | |
Heydari et al. | A low complexity wavelet-based blind image quality evaluator | |
Yang et al. | No-reference image quality assessment based on sparse representation | |
Al‐Bandawi et al. | Blind image quality assessment based on Benford's law | |
Maity et al. | Background modeling and foreground extraction in video data using spatio-temporal region persistence features | |
CN117078670A (zh) | 一种云相框的生产控制系统 | |
CN108776958B (zh) | 混合降质图像的图像质量评价方法和装置 | |
Seghir et al. | Edge-region information measure based on deformed and displaced pixel for image quality assessment | |
CN116363641A (zh) | 一种图像处理方法、装置及电子设备 | |
CN103618904B (zh) | 基于像素的运动估计方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20150410 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20150410 |