JP5510688B2 - 画像のマルチレベル分解を利用して画質計測値を決定する方法およびシステム - Google Patents

画像のマルチレベル分解を利用して画質計測値を決定する方法およびシステム Download PDF

Info

Publication number
JP5510688B2
JP5510688B2 JP2012552211A JP2012552211A JP5510688B2 JP 5510688 B2 JP5510688 B2 JP 5510688B2 JP 2012552211 A JP2012552211 A JP 2012552211A JP 2012552211 A JP2012552211 A JP 2012552211A JP 5510688 B2 JP5510688 B2 JP 5510688B2
Authority
JP
Japan
Prior art keywords
image
level
subband
approximate
edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012552211A
Other languages
English (en)
Other versions
JP2013520037A (ja
JP2013520037A5 (ja
Inventor
レザザデ、ソローシュ
クーロン、ステファン
Original Assignee
エコール・ドゥ・テクノロジー・スュペリュール
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エコール・ドゥ・テクノロジー・スュペリュール filed Critical エコール・ドゥ・テクノロジー・スュペリュール
Publication of JP2013520037A publication Critical patent/JP2013520037A/ja
Publication of JP2013520037A5 publication Critical patent/JP2013520037A5/ja
Application granted granted Critical
Publication of JP5510688B2 publication Critical patent/JP5510688B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20064Wavelet transform [DWT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

本発明は、画質の評価に係り、特に、向上した認識性能を有する、より向上した画質の計測値またはメトリックを決定する方法およびシステムに係る。
画質評価は、画像のトランスコードおよび圧縮を含む様々なコンテキストにおいて重要である。テキスト、音声、静止画像、動画像、写真、ビデオクリップを含むリッチなマルチメディアコンテキストを、移動端末、携帯電話、コンピュータその他の電子デバイスからなる異機種環境にあるネットワークで配信する際に、画像のトランスコードは欠かせない機能である。画質は、原画像(参照画像とも称される)と、画像処理後の画像(変形画像(distorted image)とも称される)との間の類似度を計測することで評価することができる。このような品質評価は、例えば画像処理技術の高価を判断する際にも利用可能である。
画質の評価は、エンドユーザ、人間のクライアントが許容できる出力を提供するべく、マルチメディアアプリケーションを含む様々な画像およびビデオ処理アプリケーションを開発する際の重要な役割を担っている。画質は、人間の観察者が主観的に評価するのが一番である。しかし、品質の主観的評価は、時間がかかり、コストが高く、リアルタイムには行うことができない。従って、変形されていない原画像と変形された画像信号との間の差異を計測することができる客観的な計測値の定義が必要である。理想的には、このような客観的な計測値は、2種類の画像信号間の認識可能な差異と相関しているはずであり、主観的な品質と一次関数の関係にあるはずである。主観的な画質は、処理画像が人間の観察者の目にどう写るかに関しており、観察者の品質に対する意見が関与する。
通常、主観的な方法は参照画像の利用可能性に基づいて分類することができる。参照画像が利用可能な場合、品質計測値または品質メトリックは、完全参照(FR)評価計測値とみなされる。ピーク信号対雑音比(PSNR)は、FRの評価計測値としては最も古く、最も幅広く利用されており、いくつも魅力的な特徴を有している。つまり簡単であり、物理的な意味が明解であり、パラメータが不要であり、Z.WangおよびA.C.Bovikによる「平均平方誤差:好きではなければ無視せよ:最新の信号忠実度計測値」IEEE信号処理会報誌、26巻、1号、98−117ページ、2009年1月にも記載されているように色々な最適化コンテキストにおいてパフォーマンスがすばらしい。この計測値は以下のように定義されている。
Figure 0005510688
ここで、XおよびYは、参照画像(原画像)および変形画像をそれぞれ示しており、Xmaxは、参照画像Xの最大可能性のある画素値であり(最小画素値は0と想定される)、Nは、各画像中の画素数である。
しかし従来のPSNRは、画像忠実度についての人間の認識を十分反映はできず、つまり、いくらPSNR利得が大きくても、視覚品質の向上度合いが小さい場合もある。従って研究者たちは、他にもいくつも品質計測値を開発してきた。一般的には、画像信号のFR評価には、上昇型と下降型の2種類の方法がある(Z.WangおよびA.C.Bovikによる「現代の画質の評価」米国、Morgan&Claypool、2006を参照のこと)。
上昇型の方法では、品質の認識計測値は、目に見えるエラーを定量化することで最もよく推定される。人間の視覚システム(HVS)フィーチャに従ってエラーを量子化するために、このカテゴリーの技術は、HVSの異なる段階の機能的な特徴を、精神物理学的および生理学的実験両方により特徴づけてモデル化しようとする。この作業は通常、Z.WangおよびA.C.Bovikによる「現代の画質の評価」米国、Morgan&Claypool、2006、および、「画像処理の基本ガイド」、米国、Academic Press、2009、ch.21に記載されているように、前処理、周波数分析、対比感度分析、輝度マスキング、コントラストマスキング、および、エラープーリング等といった様々な段階を経て行われる。HVSに基づく品質評価技術の殆どは、空間周波数の各帯域を独立したチャネルで処理することを想定したマルチチャネルモデルを利用している。S.Dalyが「目に見える差異の予測器:画像忠実度の評価アルゴリズム」、Proc.SPIE、1616巻、1992年2月、2−15ページで述べているような、目に見える差異の予測器(VDP:visible difference predictor)モデルでは、画像を5つの空間レベルに分解してから、さらに6つの配向レベルにWatsonの大脳皮質変換(Watson's Cortex transform)の変形版を利用して分解する。そして、そのチャネルのコントラストから、閾値マップを計算する。「画像システム設計および評価のための視覚差別化モード」Visual models for Target Detection and Recognition、シンガポール:World Scientific,1995、207−220ページではSarnoffの視覚差別化モデルとも称されるLubinのモデルでは、画像をローパスフィルタして再度サンプリングした後で7つの解像度に分解している。
P.C TeoおよびD.J.Heegerの研究では、ステアリング可能なピラミッド変換を利用して画像を幾つかの空間周波数レベルに分解しており、ここで各空間周波数レベルは、さらに一式の(6つの)配向帯域に分割される。彼らが提示する方法は、「認識される画像の変形」Proc.IEEE.Int.Conf.画像処理、2巻、1994年11月、982−986ページに記載されている。D.M.ChandlerおよびS.S.Hemaniが「ウェーブレットに基づく、自然画像の視覚上の信号対雑音比」画像処理に対するIEEE処理、16巻、9号、2284−2298ページ、2007年9月で説明しているVSNRも、画像前処理の後に、離散ウェーブレット変換と9/7双直交フィルタとを利用して、参照画像と変形画像との間で、参照画像およびエラー両方を分解する、という別の高度なHVSに基づくメトリックである。この技術では、次に、コントラスト検知閾値を計算して、ウェーブレット分解が生成した各サブバンドの変形を検知する能力を評価する。多解像分解ではなくてフーリエ変換を利用する上昇型の方法を利用する公知な方法には、他にも、重み付けを加えた信号対雑音比(WSNR)などがあり、これは、N.Damera−Venkata、T.D.Kite、W.S.Geisler、B.L.Evans、および、A.C.Bovikが「劣化モデル(degradation model)に基づく画質評価」画像処理に対するIEEE処理、9巻、4号、636−650ページ、2000年4月、および、M.Miyahara、K.Kotani、V.R.Algaziが、「画像符号のための客観的画質スケール(PQS)」、通信に対するIEEE処理、46巻、9号、1215−1225ページ、1998年9月で説明している画質スケール(PQS)で説明している。上昇型の方法は、幾つか重要な制約を有しており、例えば、Z.WangおよびA.C.Bovikによる「現代の画質の評価」米国、Morgan&Claypool、2006、および、Z.Wang、A.Bovik、H.Sheikh、および、E.Simoncelliによる「画質評価:エラー可視性から構造的類似度へ」画像処理に対するIEEE処理、13巻、4号、600−612ページ、2000年4月で取り扱われている。
さらに、N.Damera−Venkata、T.D.Kite、W.S.Geisler、B.L.Evans、および、A.C.Bovikが「劣化モデル(degradation model)に基づく画質評価」画像処理に対するIEEE処理、9巻、4号、636−650ページ、2000年4月で説明しているWSNR、雑音品質計測値(NQM)および、D.M.ChandlerおよびS.S.Hemaniが「VSNR:ウェーブレットに基づく、自然画像の視覚上の信号対雑音比」画像処理に対するIEEE処理、16巻、9号、2284−2298ページ、2007年9月で説明しているVSNR等の、エラーに基づく技術は、人間の視覚システム(HVS)パラメータを計算するために高度な処理を必要とするために、少々複雑になる。
下降型の方法に基づく技術では、HVSの機能全体をブラックボックスととらえ、入出力の関係に注目する。従って、下降型の方法による技術では、HVSまたは視覚設定からの較正パラメータが不要である。このカテゴリーの2つの主要な戦略は、構造的方法および情報理論法を利用する。
構造的方法を利用する最も重要な方法は、Z.Wang、A.Bovik、H.Sheikh、および、E.Simoncelliによる「画質評価:エラー可視性から構造的類似度へ」画像処理に対するIEEE処理、13巻、4号、600−612ページ、2000年4月に記載されている構造的類似度(SSIM)インデックスである。H.R.Sheikh、M.F.Sabir、およびA.C.Bovikが「最近の全参照画質評価アルゴリズムの統計学的評価」、画像処理に対するIEEE処理、15巻、11号、3440−3451ページ、2006年11月で説明しているように、SSIMは、他の品質計測値に比して、許容できる計算上の複雑度の正確なスコアを提供する。SSIMは、近年注目されており、幅広い用途が考えられる。Z.Wang、A.Bovik、H.Sheikh、および、E.Simoncelliによる「画質評価:エラー可視性から構造的類似度へ」画像処理に対するIEEE処理、13巻、4号、600−612ページ、2000年4月に記載されているように、SSIM法の根底にある原理は、HVSが、視覚シーンから構造的情報を抽出するのに非常に適しているので、構造的類似度(または変形)の計測値が、認識される画質のよい近似を提供する、ということである。
Z.Wang、E.Simoncelli、およびA.C.Bovikによる「画質評価に対するマルチスケール構造的類似度」Proc.IEEE Asilomar Conf.Signals,Systems,Computers、2巻、2003年11月、1398−1402ページに記載されているマルチスケールSSIMは、ローパスフィルタとダウンサンプリングを繰り返すことで、5つの異なる解像度の画像の詳細を含めて、SSIM評価の制度を上げる試みを行っている。「構造的類似度メトリックを理解して簡略化する」Proc. IEEE International Conference on image processing、サンディエゴ、2008年10月、1188−1191ページ、および、D.M.RouseおよびS.S.Hemamiによる「画質評価について離散ウェーブレット変換に基づく構造的類似度への投資」Proc. IEEE International Conference on image processing、サンディエゴ、2008年10月、377−380ページでは、これを、異なるレベルのサブバンドを利用して離散ウェーブレット領域で計算することを提唱している。
Daubechiesの9/7ウェーブレットを利用する5レベル分解を、原画像および変形画像両方に適用してから、SSIMを対応するサブバンド間で計算する。最後に、類似度の計測値を、全てのSSIMの重み付けされた平均値を計算して求める。重みを決定するまでには、人間の目の様々な周波数帯域への感度を計測するために多くの実験が行われた。Z.Wang、および、E.Simoncelliは、「複素ウェーブレット領域の、変換(translation)に左右されない画像類似度」Proc. IEEE International Conference on Acoustics, Speech, Signal Processing、2巻、2005年3月、573−576ページで、並びに、M.P.Sampat、Z.Wang、S.Gupta、A.C.Bovik、およびM.K.Markeyが「複素ウェーブレットの構造的類似度:新たな画像類似度のインデックス」画像処理に対するIEEE処理、18巻、11号、2385−2401ページ、2009年11月で、複素ウェーブレット構造的類似度(CW−SSIM)を説明しており、これは、6スケール、16配向のステアリング可能ピラミッド分解特徴の複素数バージョンの利点を享受しており、僅かな幾何学的歪みに対応する計測値を提案している。
情報理論法では、視覚品質評価を、情報忠実度の課題と捉える。自然シーン統計学に基づく画質計測における情報忠実度計測値(IFC)は、H.R.Sheikh、A.C.Bovik、および、G.de Vecianaによる「自然シーン統計学を利用する画質評価の情報忠実度計測値」画像処理に対するIEEE処理、14巻、12号、2117−2128ページ、2005年12月で説明されている。IFCでは、画像ソースは、ガウススケール混合(GSM)を利用してモデル化され、画像変形プロセスは、エラーを起こしやすい通信チャネルとしてモデル化される。比較される画像間で共有される情報は、情報忠実度の統計学的計測値である相互情報を利用して定量化される。別の情報理論上の品質メトリックに、H.R.SheikhおよびA.C.Bovikが「視覚情報忠実度(VIF)インデックス」および「画像情報および視覚品質」画像処理に対するIEEE処理、15巻、2号、430−444ページ、2006年2月で提唱している「視覚情報忠実度(VIF)インデックス」がある。VIFインデックスの計算は、IFCのものと類似しているが、VIFインデックスの決定においては、画像変形プロセスおよび視覚認識プロセスを両方とも、エラーを起こしやすい通信チャネルとしてモデル化する点が異なっている。VIF計測値では、HVS変形チャネルは、加法性のホワイトガウスノイズでモデル化される。VIFインデックスは、H.R.Sheikh、M.F.Sabir、およびA.C.Bovikの「最近の全参照画質評価アルゴリズムの統計学的評価」、画像処理に対するIEEE処理、15巻、11号、3440−3451ページ、2006年11月に記載されている有名な画質評価アルゴリズムのパフォーマンス評価による、最も正確な画質計測値である。
既存の文献を検討すると、先行技術の方法のいくつもの欠点が明らかになる。これらの先行技術の方法のもつ制約には以下のようなものがある。
第1に、既存の評価技術は、品質計測値を正確に判断しようとすると、非常に複雑な計算をともなう。画像/動画処理アプリケーションのうち、例えば、「主観的なビデオ品質を利用するオフラインH.264/AVCビデオ符号化のための速度制御技術」、IEEE Transactions on Consumer Electronics, 54巻、3号、1465−1472ページ、2008年8月というタイトルの文献でS.L.P.Yasakethu、W.A.C.Fernando、S.Adedoyin、およびA.Konodozが説明しているビデオ符号化における各フレームから最良の定量化パラメータを特定する技術は、品質計測値(品質メトリック)を決定するためのより正確で複雑性の低い技術を利用する場合などには、より効率的ではあるだろう。
第2に、先行技術による方法で利用される上昇型の方法では、関連する技術が多解像度変換を利用して、多数の解像度(5以上)に入力画像を分解する必要がある。一方で、HVSは、まだ完全にわかっていない複雑なシステムであり、異なる帯域を最終的なメトリックに組み合わせることは難しい。Z.Wang、E.P.Simoncelli、および、A.C.Bovikが「画質評価のためのマルチスケール構造的類似度」Proc. IEEE Asilomar Conf. Signals, Systems, Computers, 2巻、2003年11月、1398−1402ページ、並びに、前述したC.−L.Yang、W.−R.Gao、およびL.−M.Poが「離散ウェーブレット変換に基づく、画質評価のための構造的類似度」Proc. IEEE Int. Conf. Image Processing, サンディエゴ、2008年10月、377−380ページ等に開示されている類似している下降型の方法では、異なるスケールまたはサブバンドについてのHVSの感度を決定するためには、数多くの実験が必要となる。さらにウェーブレットまたはフィルタを変更する場合には、計算される重みおよびパラメータが最適でなくなり、有効でさえなくなる場合もでてくる。
第3に、SSIM等の下降型の方法では、矩形のスライディングウィンドウにおいてローカルな統計学上の数字を集め、いつも非常に正確である場合ばかりではない。
第4に、前の段落で引用したC.−L.Yang、W.−R.Gao、およびL.−M.Poが「離散ウェーブレット変換に基づく、画質評価のための構造的類似度」Proc. IEEE Int. Conf. Image Processing, サンディエゴ、2008年10月、377−380ページで説明されている多数の分解レベルによって、主要な画像コンテンツを有する近似されたサブバンドのサイズが非常に小さくなるので、画像統計学の効果的な抽出の助けにならなくなる。
第5に、前のSSIM法では、画質計測値(または画質スコア全体)の決定にSSIM品質マップの平均値が利用されている。しかし、様々な画像領域の変形は、それぞれ異なる影響力をHVSに対して有する。
従って、先行技術の欠点をなくす、または、軽減させるような、画質の向上した計測値の開発が依然として望まれている。
本発明の目的の1つは、先行技術の欠点を軽減する、画質の計測値を決定するための向上した方法およびシステムの提供である。
本発明の一態様では、変形画像Y用の品質計測値を決定するための方法であって、画像Yと、画像Yと同じ行列数の画素を有し、変形されていない参照画像Xとの間の類似度を特徴付け、(a)レベル1、2、…i、i+1、…Nを含むNレベルの多解像度分解を画像Xに適用して、1からN−1までの範囲である各レベルiについて、レベルi+1で処理するために画像Xの中間サブバンドを生成して、レベルNについて、画像Xの主要コンテンツを含む近似サブバンドと、画像Xのエッジを含む詳細サブバンドとを生成する段階と、(b)1、2、…i、i+1、…Nを含むNレベルの多解像度分解を画像Yに適用して、1からN−1までの範囲である各レベルiについて、レベルi+1で処理するために画像Yの中間サブバンドを生成して、レベルNについて、画像Yの主要コンテンツを含む近似サブバンドと、画像Yのエッジを含む詳細サブバンドとを生成する段階と、(c)画質メトリック(IQM)を画像Xの近似サブバンドと画像Yの近似サブバンドとに適用して、画像Xの主要コンテンツと画像Yの主要コンテンツとの間の類似度を特徴付ける近似品質計測値を生成する段階と、(d)画像Xについての1からN−1までの範囲であるレベルiの中間サブバンドおよび画像Xの詳細サブバンドを集計して、画像Xのエッジを特徴付ける画像Xのエッジマップを生成する段階と、(e)画像Yについての1からN−1までの範囲であるレベルiの中間サブバンドおよび画像Yの詳細サブバンドを集計して、画像Yのエッジを特徴付ける画像Yのエッジマップを生成する段階と、(f)画像Xのエッジマップと画像Yのエッジマップとの間にIQMを適用して、画像Xのエッジと画像Yのエッジとの間の類似度を特徴付けるエッジ品質計測値を生成する段階と、(g)近似品質計測値とエッジ品質計測値とを処理して品質計測値を決定する段階とを備える方法が提供される。
上述した方法において、段階(d)はさらに、画像Xの1からN−1までの範囲である各レベルiについての中間サブバンドと詳細サブバンドとを、品質計測値の決定で達成される精度に基づいて選択する段階と、画像Xについて、選択された中間サブバンドおよび選択された詳細サブバンドのみを集計する段階とを有し、段階(e)はさらに、画像Yの各レベルiについての中間サブバンドと詳細サブバンドとを、品質計測値の決定で達成される精度に基づいて選択する段階と、画像Yについて、選択された中間サブバンドおよび選択された詳細サブバンドのみを集計する段階とを有する。
上述した方法において、画像Xについて中間サブバンドおよび詳細サブバンドを選択する段階はさらに、画像Xについて、実質的に同じ解像度を有する各レベルiについての選択された中間サブバンドと詳細サブバンドと選択する段階を有し、画像Yについて中間サブバンドおよび詳細サブバンドを選択する段階はさらに、画像Yについて、実質的に同じ解像度を有する各レベルiについての選択された中間サブバンドと詳細サブバンドと選択する段階を有する。
画像Xおよび画像Yの各レベルiについての中間サブバンドは、各画像において、レベルi−詳細サブバンドおよびレベルi−ウェーブレットパケット(WP)サブバンドを含み、レベルi−WPサブバンドは、レベルi−WP近似サブバンドおよびレベルi−WP詳細サブバンドを含み、レベルi−WP近似サブバンドはさらに、レベルi−水平WP近似サブバンドとレベルi−垂直WP近似サブバンドと、レベルi−対角WP近似サブバンドとを含む。
上述した方法ではさらに、段階(a)において、レベル1で、画像Xに多解像度分解を適用して、レベル2における処理用に、レベル1の中間サブバンドを生成する段階と、2からNまでの範囲であるレベルiで、レベルi−1で行われる多解像度分解で生成された中間サブバンドの1以上に多解像度分解を適用する段階とを実行すること、および、段階(b)において、レベル1で、画像Yに多解像度分解を適用して、レベル2における処理用に、レベル1の中間サブバンドを生成する段階と、
2からN−1までの範囲であるレベルiで、レベルi−1で行われる多解像度分解で生成された中間サブバンドの1以上に多解像度分解を適用する段階とを実行すること、の1以上を実行する。
本発明の一実施形態では、近似品質計測値は近似品質マップであり、エッジ品質計測値はエッジ品質マップであり、段階(g)はさらに、画像Xおよび画像Yの近似サブバンドおよびエッジマップの画素に対応する値を、それぞれの人間の視覚システムに対する重要度に応じて割り当てることを含む、コントラストマップを生成する段階と、コントラストマップを利用して近似品質マップに重み付けされたプーリングを実行して、近似品質スコアを生成する段階と、コントラストマップを利用してエッジ品質マップに重み付けされたプーリングを実行して、エッジ品質スコアを生成する段階と、似類似度スコアを、エッジ類似度スコアと組み合わせて、品質計測値を決定する段階とを有する。
方法はさらに、Nを、人間の視覚システムに対して実質的なピーク応答を生成する、近似サブバンドSの最小サイズの関数として決定する段階をさらに備える。
上述した方法において、段階(c)は、画像Xの近似サブバンドと画像Yの近似サブバンドとに構造的類似度(SSIM)IQMを適用して、近似SSIMマップSSIMを生成する段階を有し、段階(f)は、画像Xのエッジマップと画像Yのエッジマップとの間にSSIM IQMを適用して、エッジSSIMマップSSIMを生成する段階を有し、段階(g)は、SSIMとSSIMとを処理して、SSIMDWTスコアを品質計測値として決定する段階を含む、または、段階(c)は、画像Xの近似サブバンドと画像Yの近似サブバンドとに絶対差(AD)IQMを適用して、近似ADマップADを生成する段階を有し、段階(f)は、画像Xのエッジマップと画像Yのエッジマップとの間にAD IQMを適用して、エッジADマップADを生成する段階を有し、段階(g)は、ADとADとを処理して、ADDWTスコアを品質計測値として決定する段階を含む、または、段階(c)は、画像Xの近似サブバンドと画像Yの近似サブバンドとにピーク信号対雑音比(PSNR)IQMを適用して、PSNR近似品質スコアPSNRを生成する段階を有し、段階(f)は、画像Xのエッジマップと画像Yのエッジマップとの間にPSNR IQMを適用して、PSNRエッジ品質スコアPSNRを生成する段階を有し、段階(g)は、PSNRとPSNRとを処理して、PSNRDWTスコアを品質計測値として決定する段階を含む、または、段階(c)は、画像Xの近似サブバンドと画像Yの近似サブバンドとに視覚情報忠実度(VIF)IQMを適用して、VIF近似品質スコアVIFを生成する段階を有し、段階(f)は、画像Xのエッジマップと画像Yのエッジマップとの間にVIF IQMを適用して、VIFエッジ品質スコアVIFを生成する段階を有し、段階(g)は、VIFとVIFとを処理して、VIFDWTスコアを品質計測値として決定する段階を含む。
上述した方法はさらに、段階(a)および段階(b)は、Nレベルの離散ウェーブレット変換を適用する段階を有し、離散ウェーブレット変換は、ハール変換、ニューランド変換、またはDaubechiesフィルタを利用するウェーブレット変換であってよい。
本発明の別の態様では、変形画像Y用の品質計測値を決定するためのシステムであって、画像Yと、画像Yと同じ行列数の画素を有し、変形されていない参照画像Wとの間の類似度を特徴付け、プロセッサと、コンピュータ可読命令が格納されたコンピュータ可読格納媒体とを備え、コンピュータ可読命令はプロセッサにより実行されると、(a)1、2、…i、i+1、…Nを含むNレベルの多解像度分解を画像Xに適用して、1からN−1までの範囲である各レベルiについて、レベルi+1で処理するために画像Xの中間サブバンドを生成して、レベルNについて、画像Xの主要コンテンツを含む近似サブバンドと、画像Xのエッジを含む詳細サブバンドとを生成する第1の分解ユニットと、(b)1、2、…i、i+1、…Nを含むNレベルの多解像度分解を画像Yに適用して、1からN−1までの範囲である各レベルiについて、画像Yの中間サブバンドを生成して、レベルNについて、画像Yの主要コンテンツを含む近似サブバンドと、画像Yのエッジを含む詳細サブバンドとを生成する第2の分解ユニットと、(c)画質メトリック(IQM)を画像Xの近似サブバンドと画像Yの近似サブバンドとに適用して、画像Xの主要コンテンツと画像Yの主要コンテンツとの間の類似度を特徴付ける近似品質計測値を生成する近似品質計測ユニットと、(d)画像Xについての1からN−1までの範囲であるレベルiの中間サブバンドおよび画像Xの詳細サブバンドを集計して、画像Xのエッジを特徴付ける画像Xのエッジマップを生成する第1の集計ユニットと、(e)画像Yについての1からN−1までの範囲であるレベルiの中間サブバンドおよび画像Yの詳細サブバンドを集計して、画像Yのエッジを特徴付ける画像Yのエッジマップを生成する第2の集計ユニットと、(f)画像Xのエッジマップと画像Yのエッジマップとの間にIQMを適用して、画像Xのエッジと画像Yのエッジとの間の類似度を特徴付けるエッジ品質計測値を生成するエッジ品質計測ユニットと、(g)近似品質計測値とエッジ品質計測値とを処理して品質計測値を決定する品質計測ユニットとを形成するシステムが提供される。
上述したシステムにおいて、第1の集計ユニットはさらに、画像Xの1からN−1までの範囲である各レベルiについての中間サブバンドと詳細サブバンドとを、品質計測値の決定で達成される精度に基づいて選択する第1の選択ユニットと、画像Xについて、選択された中間サブバンドおよび選択された詳細サブバンドのみを集計する第1の選択的集計ユニットとを有し、第2の集計ユニットはさらに、画像Yの各レベルiについての中間サブバンドと詳細サブバンドとを、品質計測値の決定で達成される精度に基づいて選択する第2の選択ユニットと、画像Yについて、選択された中間サブバンドおよび選択された詳細サブバンドのみを集計する第2の選択的集計ユニットとを有する。
上述したシステムにおいて、第1の集計ユニットはさらに、画像Xについて、実質的に同じ解像度を有する各レベルiについての選択された中間サブバンドと詳細サブバンドと選択する計算手段を有し、第2の集計ユニットはさらに、画像Yについて、実質的に同じ解像度を有する各レベルiについての選択された中間サブバンドと詳細サブバンドと選択する計算手段を有する。
上述したシステムにおいて、画像Xおよび画像Yの各レベルiについての中間サブバンドは、各画像において、レベルi−詳細サブバンドおよびレベルi−ウェーブレットパケット(WP)サブバンドを含み、レベルi−WPサブバンドは、レベルi−WP近似サブバンドおよびレベルi−WP詳細サブバンドを含み、レベルi−WP近似サブバンドはさらに、レベルi−水平WP近似サブバンドとレベルi−垂直WP近似サブバンドと、レベルi−対角WP近似サブバンドとを含む。
システムはさらに、第1の分解ユニットにおいて、画像Xに多解像度分解を適用して、レベル2における処理用に、レベル1の中間サブバンドを生成する第1のレベル1分解ユニット、および、2からNまでの範囲であるレベルiで、レベルi−1で行われる多解像度分解で生成された中間サブバンドの1以上に多解像度分解を適用する第1のレベルi分解ユニット、並びに、第2の分解ユニットにおいて、画像Yに多解像度分解を適用して、レベル2における処理用に、レベル1の中間サブバンドを生成する第2のレベル1分解ユニット、および、2からN−1までの範囲であるレベルiで、レベルi−1で行われる多解像度分解で生成された中間サブバンドの1以上に多解像度分解を適用する第2のレベルi分解ユニット、の1以上が含まれる。
システムはさらに、Nを、人間の視覚システムに対して実質的なピーク応答を生成する、近似サブバンドSの最小サイズの関数として決定する計算手段をさらに備える。
上述したシステムにおいて、第1の分解ユニット(a)および第2の分解ユニット(b)は、Nレベルの離散ウェーブレット変換を適用する計算手段を有し、離散ウェーブレット変換は、ハール変換、ニューランド変換、またはDaubechiesフィルタを利用するウェーブレット変換であってよい。
本発明のまた別の態様では、コンピュータ可読プログラムコード命令が格納されたコンピュータ可読格納媒体であって、コンピュータ可読プログラムコード命令は、プロセッサにより実行されると、(a)1、2、…i、i+1、…Nを含むNレベルの多解像度分解を画像Xに適用して、1からN−1までの範囲である各レベルiについて、レベルi+1で処理するために画像Xの中間サブバンドを生成して、レベルNについて、画像Xの主要コンテンツを含む近似サブバンドと、画像Xのエッジを含む詳細サブバンドとを生成する段階と、(b)1、2、…i、i+1、…Nを含むNレベルの多解像度分解を画像Yに適用して、1からN−1までの範囲である各レベルiについて、レベルi+1で処理するために画像Yの中間サブバンドを生成して、レベルNについて、画像Yの主要コンテンツを含む近似サブバンドと、画像Yのエッジを含む詳細サブバンドとを生成する段階と、(c)画質メトリック(IQM)を画像Xの近似サブバンドと画像Yの近似サブバンドとに適用して、画像Xの主要コンテンツと画像Yの主要コンテンツとの間の類似度を特徴付ける近似品質計測値を生成する段階と、(d)画像Xについての1からN−1までの範囲であるレベルiの中間サブバンドおよび画像Xの詳細サブバンドを集計して、画像Xのエッジを特徴付ける画像Xのエッジマップを生成する段階と、(e)画像Yについての1からN−1までの範囲であるレベルiの中間サブバンドおよび画像Yの詳細サブバンドを集計して、画像Yのエッジを特徴付ける画像Yのエッジマップを生成する段階と、(f)画像Xのエッジマップと画像Yのエッジマップとの間にIQMを適用して、画像Xのエッジと画像Yのエッジとの間の類似度を特徴付けるエッジ品質計測値を生成する段階と、(g)近似品質計測値とエッジ品質計測値とを処理して品質計測値を決定する段階とを実行させるコンピュータ可読格納媒体が提供される。
このように、画像のマルチレベル分解を利用して画質の計測値を決定する、向上した方法およびシステムが適用された。
本発明のさらなる特徴および利点は、以下の実施形態の記載により明らかとなり、これはあくまで例示であり、以下のように簡単に説明される添付図面を参照して説明される。
本発明の実施形態のシステム100を表す。 図1aのレベル数ユニット102を詳細に示す。 図1aの第1の分解ユニット103を詳細に示す。 図1aの第2の分解ユニット104を詳細に示す。 図1aの第1の集計ユニット113を詳細に示す。 図1aの第2の集計ユニット114を詳細に示す。 SSIM IQMに対する別の実施形態について、図1aの近似品質計測ユニット105、品質計測ユニット108、および、エッジ品質計測ユニット109を詳細に示す。 AD IQMに基づく別の実施形態について、図1aの近似品質計測ユニット105、品質計測ユニット108、および、エッジ品質計測ユニット109を詳細に示す。 PSNR IQMに基づく別の実施形態について、図1aの近似品質計測ユニット105、品質計測ユニット108、および、エッジ品質計測ユニット109を詳細に示す。 VIF IQMに基づく別の実施形態について、図1aの近似品質計測ユニット105、品質計測ユニット108、および、エッジ品質計測ユニット109を詳細に示す。 本発明の別の実施形態であるシステム100aを示す。 図1kの第1の集計ユニット113aを詳細に示す。 図1kの第2の集計ユニット114aをより詳細に示す。 別の実施形態のための図1lの第1の選択的集計ユニット171を詳細に示す。 別の実施形態のための図1mの第2の選択的集計ユニット183を詳細に示す。 図1nの第1の合成ユニット197を詳細に示す。 図1oの第の合成ユニット206を詳細に示す。 図1kの第1の分解ユニット103aを詳細に示す。 図1kの第2の分解ユニット104aを詳細に示す。 品質の計測値を計算するために本発明の実施形態が利用する方法の上位の記載を提供するブロック図である。 品質の計測値を計算するためにシステム100の一般的な枠組で利用される方法の各ステップを示すフローチャートである。 一例における2レベルの分解された画像のための画像Xのサブバンドを示す。 一例における3レベルの分解された画像のための画像Xのサブバンドを示す。 原画像の一例を示す。 簡単に観察できるように[0,255]の間でスケーリングされたサンプル値を利用して計算された図3bの画像のコントラストマップを示す。 レベルごとに集計を実行する方法の各ステップを示すフローチャートを示す。 層間の集計を実行する方法の各ステップを示すフローチャートを示す。 品質の計測値のSSIMに基づく計算を利用して、別の実施形態で利用される方法の各ステップを示すフローチャートを示す。 様々な分解レベルのためのDMOSおよびSSIM予測値の間のLCCおよびSRCCを示す。 様々なβ値のためのDMOSおよびSSIMDWT予測値の間のRMSを示す。 VIFインデックスに基づく先行技術の方法のブロック図を示す。 品質の計測値のVIFに基づく計算を利用する別の実施形態で利用される方法の各ステップを示すフローチャートを示す。 様々な分解レベルのためのDMOSおよびVIF予測値の間のLCCおよびSRCCを示す。 様々なβ値のためのDMOSおよびVIFDWT予測値の間のRMSを示す。 品質の計測値のPSNRに基づく計算を利用する別の実施形態で利用される方法の各ステップを示すフローチャートを示す。 様々な分解レベルのためのDMOSおよびPSNRA予測値の間のLCCおよびSRCCを示す。 様々なβ値のためのDMOSおよびPSNRDWT予測値の間のRMSを示す。 ライブ画像データベースの様々なタイプの画像変形のためのSRCCおよびPSNR値を示すテーブルを示す。 品質の計測値のADに基づく計算を利用する別の実施形態で利用される方法の各ステップを示すフローチャートを示す。 様々な分解レベルのためのDMOSおよびADA予測値の間のLCCおよびSRCCを示す。 LIVEデータベースの様々なメトリックおよびDMOS値の間のLCCを示す。 LIVEデータベースの様々なメトリックおよびDMOS値の間のRMSを示す。 LIVEデータベースのメトリックおよびDMOS値の間のSRCCを示す。
<用語>
コントラストマップとは、画像または副画像のそれぞれ異なる領域に、自動的にそれぞれの視覚重要性に応じた重みを割り当てる重み付け関数のことである。差動平均意見スコア(DMOS)とは、参照画像と比したときの、変形画像の主観的な品質損失を示す。離散ウェーブレット変換とは、高周波成分から低周波成分を分離するために画像に行う変換のことである。エッジマップとは、画像のエッジの推定値を特徴付ける。ガウススライドウィンドウとは、単位合計(unit sum)の係数とガウス確率分布のセットのことである。線形相関係数(LCC)とは、線形またはピアソン相関係数であり、2つの量の間の相関関係を示す計測値である。これは、2つの変数の共分散を、それぞれの標準偏差の積で除算することで得られる。提案する方法によるLCCは、予測精度を示す。多解像度分解(multiresolution decomposition)とは、デジタル画像に利用されて、いくつかの副画像を生成する処理(または変換)のことである。副画像の1つが原画像の低周波主要コンテンツを表し、残りの他の副画像が原画像の詳細を表す。スピアマンの順位相関係数(SRCC)とは、2つの変数間の統計的依存性を示す計測値である。2つの変数の間の関係が、単調関数でどのくらいよく示されているかを表す。+1のSRCCは、変数それぞれが他の完全な単調関数であることを示す。サブバンドとは、ある画像のNレベルの多解像度分解中に、多種のサブバンドが生成される、というようなコンテキストで利用される用語である。1つの画像Xについてこれらサブバンドを説明する形で取り扱われる。このセクションで利用されるXおよびインデックス変数Lは、例にすぎず、本願の説明に出てくる他の変数名で置き換えることもできる。Nレベルの多解像度分解の最後に生成されるサブバンドは、次に紹介する近似サブバンドおよび詳細サブバンドと称される。Nレベルの分解の後に得られる、ある画像Xの近似サブバンドは、
Figure 0005510688
で表される。近似サブバンドは、画像の主要なコンテンツを含んでいる。ある画像Xの詳細サブバンドは、Nレベルの分解の後に得られ、水平サブバンド、垂直サブバンド、および対角サブバンドを含む。これらはそれぞれ、
Figure 0005510688
で表される。詳細サブバンドは画像の各エッジを含む。水平サブバンドは水平エッジを含み、垂直サブバンドは垂直エッジを含み、対角サブバンドは画像の対角エッジを含む。中間サブバンドとは、画像Xの分解の各レベルL(L=1からN−1)で生成され、レベルL−ウェーブレットパケット(WP)サブバンドと、レベルL−詳細サブバンドとを含む。これらを次に説明する。レベルL−WPサブバンドは、レベルL−WP近似サブバンドおよびレベルL−WP詳細サブバンドを含む。レベルL−WP近似サブバンドは、レベルL−水平WP近似サブバンド、レベルL−垂直WP近似サブバンド、および、レベルL−対角WP近似サブバンドを含む。これらはそれぞれ、以下で表される。
Figure 0005510688
レベルL−WP詳細サブバンドは、レベルL−WP水平サブバンド、レベルL−WP垂直サブバンド、およびレベルL−WP対角サブバンドを含む。これらはそれぞれ、以下で表される。
Figure 0005510688
レベルL−詳細サブバンドは、レベルL−水平サブバンド、レベルL−垂直サブバンド、および、レベルL−対角サブバンドを含む。これらはそれぞれ、以下で表される。
Figure 0005510688
本発明の実施形態は、画質の計測値を、離散ウェーブレット領域の先行技術と比して、より正確に、且つ、計算上の複雑性低く判断するための新規な一般的枠組を提示する。それぞれが特定の画質メトリック(IQM)に基づいている様々な品質計測値が、本発明の様々な実施形態で決定される。提案されている枠組は、以下のセクションで説明するように上昇型および下降型両方を含んでおり、構造的類似度(SSIM)インデックス、絶対差(AD)、ピーク信号対雑音比(PSNR)および可視情報忠実度(VIF)を含むIQMに適用することができる。
次に、本発明の実施形態のシステムを説明する。図1aおよび図1kという2つの実施形態を提示する。各実施形態は、これも記載する単位を有している。図1aおよび図1kに示す本発明の実施形態のシステムは、CPUおよびCPUが実行するコンピュータ可読命令を格納しているコンピュータ可読格納媒体(例えばメモリ、DVD、CD−ROM,フロッピー(登録商標)ディスク、フラッシュメモリ、磁気テープその他の格納媒体等)を含んだ汎用または専用コンピュータを含む。または、図1aおよび図1kのシステムが、ファームウェア、またはファームウェアおよびコンピュータ可読格納媒体を有する専用コンピュータの組み合わせで実装されてもよい。
図1aに示す実施形態を先に説明する。実施形態が提供する汎用枠組を先に説明して、それぞれが特定のIQMを利用してこの枠組を配置する様々な他の実施形態の説明を次に行う。
画質の計測値を判断するシステム100は、レベル数ユニット102と、第1の分解ユニット103と、第2の分解ユニット104と、近似品質計測ユニット105と、第1の詳細サブバンドユニット106と、第2の詳細サブバンドユニット107と、品質計測ユニット108と、エッジ品質計測ユニット109とを含む。レベル数ユニット102は、参照画像Xと変形画像Yとに適用するべき分解レベル数Nを決定する。分解レベル数Nは、人間の視覚システムに対して実質的なピークの応答を生成する近似サブバンドSの最小サイズの関数として得られる。次に、第1の分解ユニット103および第2の分解ユニット104がNの値を読み出し、これらユニットがNレベルのDWTを画像Xおよび画像Yにそれぞれ適用することで、画像Xおよび画像YのNレベルの分解を行う。各画像について、Nレベル分解により、レベルi+1での処理用の各レベルi(i=1からN−1)の中間サブバンドおよびレベルNの詳細サブバンドが生成される。第1の分解ユニット103および第2の分解ユニット104が実行する多解像度分解の後に生成される近似サブバンドは、近似品質計測ユニット105に供給される。第1の分解ユニット103および第2の分解ユニット104が実行する多解像度分解の後に生成される詳細サブバンドは、第1の詳細サブバンドユニット106および第2の詳細サブバンドユニット107が画像Xおよび画像Yそれぞれのエッジマップを生成するときに、入力として利用される。これらユニットの出力はエッジ品質計測ユニット109に接続されて、このユニットがエッジマップを処理して、品質計測ユニット108が、品質の計測値を決定するときに利用する出力を生成する。
一方でレベル数ユニット102は、レベル数110を決定する計算手段を含んでいる。第1の分解ユニット103および第2の分解ユニット104は、NレベルDWT(それぞれ111および112)を適用する計算手段を含んでいる。第1の詳細サブバンドユニット106は、第1の集計ユニット113を含み、第2の詳細サブバンドユニット107は、第2の集計ユニット114を含む。品質計測ユニット108は、第1のプーリングユニット115、第2のプーリングユニット118、コントラストマップユニット116、およびスコア合成ユニット117を含む。第1のプーリングユニット115よび第2のプーリングユニット118は、コントラストマップユニット116が生成したコントラストマップを利用して、近似品質計測ユニット105が生成した近似品質マップ、および、エッジ品質計測ユニット109が生成したエッジマップの重み付けプーリングを実行する。第1のプーリングユニット115および第2のプーリングユニット118の出力は、スコア合成ユニット17が品質計測値を生成するときに利用される。
本発明の別の実施形態におけるレベル数ユニット102の構造を図1bに示す。この構造は、見える距離と画像Yが表示されるデバイスの高さの比率を決定する最小サイズユニット120と、この比率を利用してNの値を決定する計算ユニット121とを含む。別の実施形態では、第1の分解ユニット103が(図1c参照)、第1レベル1分解ユニット124、第1レベルj分解ユニット125、および、精度に基づいて、選択する中間サブバンドを決定する第1のサブバンド選択ユニット126を含む。第1のサブバンド選択ユニット126は、第1レベル1分解ユニット124および第1レベルj分解ユニット125が利用する中間サブバンドを決定するために利用される。第1のサブバンド選択ユニット126はさらに、精度を達成するために必要な中間サブバンド数に基づいて、選択する中間サブバンドを決定する第1のサブバンド選択サブユニット127も含む。本願の後半で説明するように、別の選択プロセスを利用して、サブバンド集計中に、Nレベルの多解像度分解が生成するサブバンドノイズのいずれを利用するかを選択することもできる。多解像度分解を画像Xに行い、レベル2を生成するためにレベル1の中間サブバンドを生成する第1レベル1分解ユニット124の出力は、多解像度分解を、jが2からNであるところのレベルj−1で行うことで生成される、選択された中間サブバンドのみに行う第1レベルj分解ユニット125に供給される。同様に、第2の分解ユニット104は、精度に基づいて選択する中間サブバンドを決定する第2レベル1分解ユニット130および第2レベルj分解ユニット131および第2のサブバンド選択ユニット132を含む(図1d参照)。第2のサブバンド選択ユニット132は、第2レベル1分解ユニット130および第2レベルj分解ユニット131が利用する中間サブバンドを決定するために利用される。第2のサブバンド選択ユニット132はさらに、精度を達成するために必要な中間サブバンド数に基づいて、選択する中間サブバンドを決定する第2のサブバンド選択サブユニット133も含む。多解像度分解を画像Xに行い、レベル2で処理するためにレベル1の中間サブバンドを生成する第1レベル1分解ユニット130の出力は、多解像度分解を、jが2からNであるところのレベルj−1で行うことで生成される、選択された中間サブバンドのみに行う第1レベルj分解ユニット131に供給される。
第1の集計ユニット113のコンポーネントを図1eに示す。第1の集計ユニット113は、第1の詳細サブバンド集計ユニット135、並びに、第1レベルj集計ユニット136および、各レベルjで選択される中間サブバンドおよび、実質的に同じ解像度134の画像Xについて選択される詳細サブバンドを選択する計算手段を含む。第1レベルj集計ユニット136は、画像Xのレベルjのエッジマップを、前述した各レベルj(j=1からN−1)で生成される選択された中間サブバンドの二乗の関数として決定する。レベルjで生成される中間サブバンドの一部のみ(例えば、実質的に解像度が同じサブバンド)を、レベルjのエッジマップを生成するための集計目的に選択する。第1レベルj集計ユニット136の出力は、各レベルjで生成された1以上の選択される中間サブバンドと、レベルNで生成された画像Xの1以上の選択された詳細サブバンドとを集計する第1の詳細サブバンド集計ユニット135により処理される。各レベルjで選択される中間サブバンドおよび実質的に同じ解像度134を有する画像Xの選択される詳細サブバンドを選択する計算手段は、第1の詳細サブバンド集計ユニット135および第1レベルj集計ユニット136が、各レベルjの中間サブバンドおよび集計用に実質的に同じ解像度を持つ画像Xの詳細サブバンドを選択する際に利用する。ここで、jは単にインデックス変数であり、1とN−1との間の任意の整数値であってよいことに留意されたい。第1の詳細サブバンド集計ユニット135は、第1レベルN集計ユニット137および第1のエッジマップユニット138を含む。第1レベルN集計ユニット137は、画像XのレベルNのエッジマップを、レベルNで生成される画像Xの選択される詳細サブバンドの二乗の関数として決定して、第1のエッジマップユニット138は、画像Xのエッジマップを、レベルjのエッジマップと、第1レベルN集計ユニット137から受け取るレベルNのエッジマップとの重み付けされた合計として決定する。
第2の集計ユニット114のコンポーネントを図1fに示す。第2の集計ユニット114は、第2の詳細サブバンド集計ユニット141、並びに、第2レベルj集計ユニット141および、各レベルjで選択される中間サブバンドおよび、実質的に同じ解像度139の画像Yの選択される詳細サブバンドを選択する計算手段を含む。第2レベルj集計ユニット141は、画像Yの各レベルj(j=1からN−1)のエッジマップを、前述した各レベルjで生成される選択された中間サブバンドの二乗の関数として決定する。第2レベルj集計ユニット141の出力は、各レベルjで生成された1以上の選択される中間サブバンドと、レベルNで生成された画像Yの1以上の選択された詳細サブバンドとを集計する第2の詳細サブバンド集計ユニット140により処理される。各レベルjで選択される中間サブバンドおよび実質的に同じ解像度139を有する画像Yの選択される詳細サブバンドを選択する計算手段は、第2の詳細サブバンド集計ユニット140および第2レベルj集計ユニット141が、各レベルjの中間サブバンドおよび集計用に実質的に同じ解像度を持つ画像Yの詳細サブバンドを選択する際に利用する。ここでもまた、jは単にインデックス変数であり、1とN−1との間の任意の整数値であってよいことに留意されたい。第2の詳細サブバンド集計ユニット140は、第2レベルN集計ユニット142および第2エッジマップユニット143を含む。第2レベルN集計ユニット142は、画像YのレベルNのエッジマップを、レベルNで生成される画像Yの選択される詳細サブバンドの二乗の関数として決定して、第2エッジマップユニット143は、画像Yのエッジマップを、レベルjのエッジマップと、第2レベルN集計ユニット142から受け取るレベルNのエッジマップとの重み付けされた合計として決定する。
システム100が提供する一般的な枠組は、それぞれが品質計測値を決定するために特定のIQMを利用する別の実施形態でも利用される。SSIM IQMに基づく実施形態のシステムを図1gに示す。この実施形態の近似品質計測ユニット105は、近似SSIMユニット145を含み、品質計測ユニット108は、SSIMDWTスコアユニット146を含み、エッジ品質計測ユニット109は、エッジSSIMマップユニット147を含む。近似SSIMマップユニット145は、SSIM IQMを画像Xの近似サブバンドおよび画像Yの近似サブバンドに適用して近似SSIMマップを生成し、エッジSSIMマップユニット147は、画像Xのエッジマップおよび画像Yのエッジマップの間にSSIM IQMを利用して、エッジSSIMマップを生成する。近似SSIMマップユニット145およびエッジSSIMマップユニット147それぞれの出力はSSIMDWTスコアユニット146が、SSIMDWTスコアを品質計測値として決定するために利用する。
AD IQMに基づく実施形態のシステムを図1hに示す。本実施形態の近似品質計測ユニット105は、近似ADマップユニット150を含み、品質計測ユニット108はADDWTスコアユニット151を含み、エッジ品質計測ユニット109は、エッジADマップユニット152を含む。近似ADマップユニット150は、AD IQMを画像Xの近似サブバンドおよび画像Yの近似サブバンドに適用して、近似ADマップを生成し、エッジADマップユニット152は、画像Xのエッジマップと画像YのエッジマップとにAD IQMを適用して、エッジADマップを生成する。近似ADマップユニット150とエッジADマップユニット152の出力は、ADDWTスコアユニット151がADDWTスコアを品質計測値として決定するために利用する。
PSNR IQMに基づく実施形態のシステムを図1iに示す。この実施形態の近似品質計測ユニット105は、PSNR近似品質スコアユニット155を含み、品質計測ユニット108は、PSNRDWTスコアユニット156を含み、エッジ品質計測ユニット109は、PSNRエッジ品質スコア決定ユニット157を含む。PSNR近似品質スコアユニット155は、PSNR IQMを、画像Xの近似サブバンドおよび画像Yの近似サブバンドに利用して、PSNR近似品質スコアを生成して、PSNRエッジ品質スコア決定ユニット157は、画像Xのエッジマップと画像Yのエッジマップとの間にPSNR IQMを適用して、PSNRエッジ品質スコアを生成する。PSNR近似品質スコアユニット155およびPSNRエッジ品質スコア決定ユニット157の出力は、PSNRDWTスコアユニット156により処理され、PSNRDWTスコアが品質計測値として決定される。
VIF IQMに基づく実施形態のシステムを図1jに示す。この実施形態の近似品質計測ユニット105は、VIF近似品質スコアユニット160を含み、品質計測ユニット108は、VIFDWTスコアユニット161を含み、エッジ品質計測ユニット109は、VIFエッジ品質スコア決定ユニット162を含む。VIF近似品質スコアユニット160は、VIF IQMを、画像Xの近似サブバンドおよび画像Yの近似サブバンドに利用して、VIF近似品質スコアを生成して、VIFエッジ品質スコア決定ユニット162は、画像Xのエッジマップと画像Yのエッジマップとの間にVIF IQMを適用して、VIFエッジ品質スコアを生成する。VIF近似品質スコアユニット160およびVIFエッジ品質スコア決定ユニット162の出力は、VIFDWTスコアユニット161により処理されて、PSNRDWTスコアが品質計測値として決定される。
サブユニット100, 102, 103, 104, 105, 106, 107, 108, 109, 113, 114, 115, 116, 117, 118, 120, 121, 124, 125, 126, 127, 130, 131, 132, 133, 135, 136, 137, 138, 140, 141, 142, 143, 145, 146, 147, 150, 151, 152, 155, 156, 157, 160, 161および162は、ファームウェア、または、プロセッサにより実行されるべくコンピュータ可読格納媒体に格納されたコンピュータ可読命令を含んでよい。110、111、112、134、および139を含む全ての計算手段が、CPUが実行するコンピュータ可読格納媒体に格納される方法、処理、機能、またはサブルーチンを実行するコンピュータ可読コードを含む。
次に、図1kに示す汎用枠組のための代替的な実施形態について説明する。画質の計測値を決定するためのシステム100aは、N100aを決定する計算手段、第1の分解ユニット103a、第2の分解ユニット104a、近似品質計測ユニット105a、第1の集計ユニット113a、第2の集計ユニット114a、品質計測ユニット108a、およびエッジ品質計測ユニット109aを含む。ユニット103a、104a、105a、108a、109a、115a、116a、117a、118aは、システム100のユニット103、104、105、108、109、115、116、117、118に等しいので、さらなる説明は行わない。計算手段110a、111a、112a、134a、および139aも、前に説明したシステム100の計算手段110、111、112、134、および139に等しい。
図1lに示すように、画像Xを処理する第1の集計ユニット113aは、第1の選択ユニット170を含み、その出力が第1の選択集計ユニット171の入力に接続される。第1の選択ユニット170は、各レベルiの中間サブバンド(iは1からN−1の範囲であってよい)、および、画像Xの詳細サブバンドを、品質の計測値を決定するとき達成する必要のある精度に基づいて選択する。第1の選択集計ユニット171は、画像Xの選択された中間サブバンドおよび選択された詳細サブバンドのみを集計する。第1の集計ユニット113aはさらに、実質的に同じ解像度134aを有する画像Xの各レベルの選択された中間サブバンドおよび選択された詳細サブバンドを選択する計算手段を含む。134aは、前述した134に類似しており、集計用の実質的に同じ解像度を有する中間サブバンドおよび詳細サブバンドを選択するために利用される。第1の選択ユニット170はさらに、精度を達成するために必要な中間サブバンドおよび詳細サブバンドの数に基づいて画像Xの各レベルiの中間サブバンドおよび詳細サブバンドを選択する。別の実施形態では、第1の選択ユニットは、レベルi−WP近似サブバンドの1以上および画像Xの詳細サブバンドの1以上を選択する第1のウェーブレットパケット(WP)詳細選択サブユニット176を含む。第1のWP詳細サブバンド選択サブユニット176は、選択時に画像Xのレベルi詳細サブバンドの1以上を含めるために第1の詳細選択モジュール179を含む。
第1のレベルi−中間サブバンド集計ユニット173は、各レベルi(i=1からN−1)の画像Xのための各選択された中間サブバンドを二乗して、画像Xの各選択された中間サブバンドに所定の重みで実行された二乗処理の結果を乗算して、画像Xにレベルiでエッジマップを生成するために行われた合計の結果に平方根関数を適用する第1のレベルi計算ユニット177を含む。第1の詳細サブバンド集計ユニット174は、画像Xの選択された詳細サブバンドそれぞれを二乗して、画像Xの各選択された詳細サブバンドの所定の重みで、ステップで生成された二乗結果を乗算して、ステップで行われた乗算の積を合計して、画像XのレベルNのエッジマップを生成するステップで行われた合計結果に平方根関数を適用する第1の詳細サブバンド計算ユニット180を含む。第1のエッジマップ決定ユニット175は、画像Xの各レベルiのエッジマップを、レベルiの所定の重みで乗算して、画像XのレベルNのエッジマップを、レベルNの所定の重みで乗算して、乗算結果の積を合計するための第1の計算ユニット178を含む。
図1mに示すように、画像Yを処理する第2の集計ユニット114aは、第2の選択ユニット182を含み、その出力が第2の選択集計ユニット183の入力に接続される。第2の選択ユニット182は、各レベルiの中間サブバンド(iは1からN−1の範囲であってよい)、および、画像Yの詳細サブバンドを、品質の計測値を決定するとき達成する必要のある精度に基づいて選択する。第2の選択集計ユニット183は、画像Yの選択された中間サブバンドおよび選択された詳細サブバンドのみを集計する。第2の集計ユニット114aはさらに、実質的に同じ解像度139aを有する画像Yの各レベルの選択された中間サブバンドおよび選択された詳細サブバンドを選択する計算手段を含む。139aは、前述した139に類似しており、集計用の実質的に同じ解像度を有する中間サブバンドおよび詳細サブバンドを選択するために利用される。第2の選択ユニット182はさらに、精度を達成するために必要な中間サブバンドおよび詳細サブバンドの数に基づいて画像Yの各レベルiの中間サブバンドおよび詳細サブバンドを選択する第2の選択サブユニット184を含む。別の実施形態では、第2の選択ユニット182は、画像Yのレベルi−WP近似サブバンドの1以上および詳細サブバンドの1以上を選択する第2のWP詳細選択サブユニット188を含む。第2のWP詳細サブバンド選択サブユニット188は、選択時に画像Yのレベルi詳細サブバンドの1以上を含めるために第2の詳細選択モジュール191を含む。
第2のレベルi−中間サブバンド集計ユニット185は、各レベルiの画像Yのための各選択された中間サブバンドを二乗して、画像Yの各選択された中間サブバンドに所定の重みで実行された二乗処理の結果を乗算して、乗算結果の積を合計して、画像Yにレベルiのエッジマップを生成するために行われた合計の結果に平方根関数を適用する第2のレベルi計算ユニット189を含む。第2の詳細サブバンド集計ユニット186は、画像Yの選択された詳細サブバンドそれぞれを二乗して、画像Yの各選択された詳細サブバンドの所定の重みで行われた二乗結果を乗算して、行われた乗算の積を合計して、画像YのレベルNのエッジマップを生成するために行われた合計結果に平方根関数を適用する第2の詳細サブバンド計算ユニット192を含む。第2のエッジマップ決定ユニット187は、画像Yの各レベルiのエッジマップを、レベルiの所定の重みで乗算して、画像YのレベルNのエッジマップを、レベルNの所定の重みで乗算して、乗算結果の積を合計するための第2の計算ユニット190を含む。
第1の集計ユニット171の構造を図1nに示す。第1の選択集計ユニットは、第1の水平エッジマップユニット194、第1の垂直エッジマップユニット195、および第1の対角エッジマップユニット195および第1の合成ユニット197を含む。分解のレベルiで生成される中間サブバンドは、ウェーブレットパケット(WP)近似およびウェーブレットパケット詳細サブバンドを含む。これらユニット194、195、および196それぞれは、特定の種類のWP近似サブバンドおよびWP詳細サブバンドを処理する。これらサブバンドについては本書類の後半で詳述する。第1の水平エッジマップユニット194は、画像Xの各レベルi(i=1からN−1)のレベルi−水平WP近似サブバンドおよび画像Xの水平サブバンドを集計して画像Xの水平エッジマップを生成する。第1の垂直エッジマップユニット195は、画像Xの各レベルiのレベルi−垂直WP近似サブバンドおよび画像Xの垂直サブバンドを集計して画像Xの垂直エッジマップを生成する。第1の対角エッジマップユニット196は、画像Xの各レベルiのレベルi−対角WP近似サブバンドおよび画像Xの対角サブバンドを集計して画像Xの対角エッジマップを生成する。画像Xの水平、垂直、および対角エッジマップは、第1の合成ユニット197により集計される。
画像Xのレベルi−WP詳細サブバンドは、さらに、各画像について、レベルi−WP水平サブバンド、レベルi−WP垂直サブバンド、およびレベルi−WP対角サブバンドを含む。第1の水平エッジマップユニット194は、集計時に画像Xのレベルi−WP水平サブバンドを含む第1の水平サブユニット198を含む。第1の垂直エッジマップユニット195は、集計時に画像Xのレベルi−WP垂直サブバンドを含む第1の垂直サブユニット199を含む。第1の対角エッジマップユニット196は、集計時に画像Xのレベルi−WP対角サブバンドを含む第1の対角サブユニット200を含む。第1の合成ユニット197は、画像Xの水平エッジマップ、垂直エッジマップ、および対角エッジマップに平方根関数を適用して、平方根関数の適用結果を合計する第1の合成サブユニット201を含む。
第2の選択集計ユニット183の構造を図1oに示す。第2の選択集計ユニットは、第2の水平エッジマップユニット203、第2の垂直エッジマップユニット204、第2の対角エッジマップユニット205、および第2の合成ユニット206を含む。第2の水平エッジマップユニット203は、画像Yの各レベルi(i=1からN−1)のレベルi−水平WP近似サブバンドおよび画像Yの水平サブバンドを集計して画像Yの水平エッジマップを生成する。第2の垂直エッジマップユニット204は、画像Yの各レベルiのレベルi−垂直WP近似サブバンドおよび画像Yの垂直エッジマップを生成する画像Xの垂直サブバンドを集計する。第2の対角エッジマップユニット205は、画像Yの各レベルiのレベルi−対角WP近似サブバンドおよび画像Yの対角サブバンドを集計して画像Yの対角エッジマップを生成する。画像Yの水平、垂直、および対角エッジマップは、第2の合成ユニット206により集計される。
画像Xの場合同様に、画像Yのレベルi−WP詳細サブバンドはさらに、各画像について、レベルi−WP水平サブバンド、レベルi−WP垂直サブバンド、および、レベルi−WP対角サブバンドを含む。第2の水平エッジマップユニット203は、集計時に画像Yのレベルi−WP水平サブバンドを含む第2の水平サブユニット207を含む。第2の垂直エッジマップユニット204は、集計時に画像Yのレベルi−WP垂直サブバンドを含む第2の垂直サブユニット208を含む。第2の対角エッジマップユニット205は、集計時に画像Yのレベルi−WP対角サブバンドを含む第2の対角サブユニット209を含む。第2の合成ユニット197は、画像Yの水平エッジマップ、垂直エッジマップ、および対角エッジマップに平方根関数を適用して、平方根関数の適用結果を合計する第2の合成サブユニット210を含む。
別の実施形態では、第1の合成ユニット197および第2の合成ユニットが実施する集計中に、異なるセットの数学処理を実施する。この実施形態の第1の合成ユニットは、第3のサブユニット211(図1p参照)を含み、第2の合成ユニット206は、第4の合成サブユニット212(図1q参照)を含む。第3の合成サブユニット211は、画像Xの水平エッジマップ、垂直エッジマップ、および対角エッジマップを合計して、実行された合計結果に平方根関数を利用するために利用される。第4の合成サブユニット212は、画像Yの水平エッジマップ、垂直エッジマップ、および対角エッジマップを合計して、実行された合計結果に平方根関数を利用するために利用される。
図1rに示す第1の分解ユニット103aは、第1のレベル1分解ユニット214を含み、その出力が第1レベルi分解ユニット215で利用される。第1レベル1分解ユニット214は、多解像度分解を画像Xに生成して、レベル2での処理用にレベル1の中間サブバンドを生成して、第1レベルi分解ユニット215は、多解像度分解を、レベルi−1(iが2からNの範囲である)で実行される多解像度分解で生成される選択された中間サブバンドに適用する。
図1sに示す第2の分解ユニット104aは、第2のレベル1分解ユニット216を含み、その出力が第2レベルi分解ユニット217で利用される。第2レベル1分解ユニット216は、多解像度分解を画像Yに生成して、レベル2での処理用にレベル1の中間サブバンドを生成して、第2レベルi分解ユニット217は、多解像度分解を、レベルi−1(iが2からNの範囲である)で実行される多解像度分解で生成される選択された中間サブバンドに適用する。
システム100の一般的な枠組の場合同様、システム100aの一般的な枠組は、それぞれが特定の実施形態に結びつく様々なIQMとともに利用することができる。
参照番号103a, 104a, 105a, 108a, 109a, 113a, 114a, 115a, 116a, 117a, 118a, 170,171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 194, 195, 196, 197, 198, 199, 200, 201, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 214, 215, 216および217のユニットおよびサブユニットおよびモジュールを含むシステム100aの全てのコンポーネントが、ファームウェア、または、プロセッサが実行するコンピュータ可読格納媒体に格納されているコンピュータ可読命令を含む。参照番号110a、111a、112a、134a、および139aを付された計算手段は全て、CPUが実行するコンピュータ可読コードを含み、本願の方法、処理、機能、またはサブルーチンを実行するコンピュータ可読格納媒体を含む。
品質計測値を決定するための枠組が利用する技術の高位な記述が、図2aのダイアグラムに記載されている。処理は、NレベルDWTを参照画像(ボックス222)および変形画像(ボックス224)に行うことから始まる。DWTを利用して達成される多解像度分解によって、両画像についての近似サブバンドよび詳細サブバンドが生成される。両画像の近似サブバンドを処理して、近似品質計測値を計算する(ボックス232)。利用する品質計測値に応じて、この品質計測値は品質マップまたは品質スコアとなりうる。原画像および変形画像両方の詳細サブバンドを集計する(ボックス226およびボックス230)。次にこれらの集計を処理して、エッジ品質計測値を計算して、マッピングまたはスコアを行う(ボックス234)。決定されるマップまたはインデックスは、品質計測値の生成で利用されるIQMに従っており、これについては後に詳述する。一定のIQMについては(後述する)、コントラストマップを生成する必要がある(ボックス228)。コントラストマップを生成することには、人間の視覚システムに対するそれぞれの重要性に応じて、画像の近似サブバンドおよびエッジマップの画素に対応する値を割り当てることが含まれる。コントラストマップは、近似品質マップのプーリング(ボックス236)およびエッジ品質マップのプーリング(ボックス238)に利用される。次に2つのプーリング処理の結果を合成して、変形画質の計測値を生成する(ボックス240)。IQMでは、コントラストマップが利用されず、それぞれボックス232およびボックス234からの近似品質計測値およびエッジ品質計測値をボックス240で合成して、品質計測値を生成する。
本発明では2つの選択プロセスを利用する。1つ目は、レベルiで多解像度分解を実行されるレベルi−1の画像XまたはYに行われる多解像度分解により生成される中間サブバンドを選択するための、レベルiの分解(i=1..N−1)で利用される。2つ目は、集計される画像XまたはYの各レベルiの中間サブバンドおよび詳細サブバンドを選択するために利用される。これら選択は、精度と計算オーバヘッドとの間に効果的なトレードオフを生じさせるように実行される。選択プロセスは、精度を達成するために必要なサブバンド数に基づいていてよい。この実施形態の、枠組に利用される技術に基づく方法を、図2bを参照して説明する。開始後(ボックス252)、処理250はN(DWTのレベル数)を計算する(ボックス254)。Nは、画像Yの解像度(またはサイズ)、画像Yの見える距離、および、画像Yに利用される画質メトリック(IQM)の1以上を利用して計算することができる。処理250により、分解レベル数Nは、人間の視覚システムに対する実質的なピークの応答を生成する近似サブバンドSの最小サイズの関数として決定される。従って、Nの値は、対応する最大周波数が人間の視覚システムのピーク感度に近くなる近似サブバンド用の解像度(つまり、人間の視覚システムの空間周波数応答の最大値)を生じさせるように決定される。
Y.Wang、J.OstermannおよびY.−Q.Zhangが「ビデオ処理通信」、Prentice Hall、2001で述べているように、空間周波数応答は通常、角度(degree)ごとのサイクル(CPD)として表される空間周波数の関数である人間の対比感度の曲線である。このピークは2と4の間である。利用されるNの値は、本明細書の後の部分で説明するように利用する特定のIQMに対して特別に生成される。一定のIQMについてNは固定値であるが、エラーに基づくIQM(例えばPSNRまたは絶対差(AD))については、必要となる分解レベル数Nは、以下のようにして形成される。M.R.BolinおよびG.W.Meyerが「現実的な画像合成のための画像差メトリック」、Proc.SIE人間の視覚、Electron.Imag.3644巻、サンノゼ、1999年、106−120号で記載しているように、画像が高さhおよび距離dで見られると、以下が成り立つ。
Figure 0005510688
ここでfθは、サイクル/角度(cpd)の単位を有する角度周波数であり、fsは、空間周波数を示す。高さHの画像については、ナイキスト理論により式1bとなる。
Figure 0005510688
HVSは、約2−4cpdの周波数においてピーク応答を有することが知られている。従ってfθは3に固定される。画像がd=khの見える距離で評価された場合には、数1aおよび数1bを適用することで、以下の数1cとなる。
Figure 0005510688
従って、人間の目の評価について効果的な画像のサイズは、約344/kとなる。これは、Nレベルの分解の後に近似サブバンドの最小サイズが、344/kに略等しくなる必要があることを示唆している。従ってサイズH×Wのサイズの画像においては、Nが負の数ではないことを前提として、以下のようにして近似値を計算できる。
Figure 0005510688
Figure 0005510688
Nを決定した後で、ハールフィルタを利用してNレベルDWTを参照画像(画像X)および変形画像(画像Y)両方に実行する(ボックス256)。Nレベルの分解において、近似サブバンド
Figure 0005510688
および
Figure 0005510688
並びに詳細サブバンド数を取得する。説明を簡略化するために、ここでは、
Figure 0005510688
および
Figure 0005510688
を、XとYとして話をする。本発明の実施形態の方法では、様々な他のウェーブレットフィルタを容易に利用することができる。ハールフィルタを選択したのは、簡単でパフォーマンスが良好だからである。その簡単さによって、アルゴリズムには無視可能な計算上の負荷がかかる。アプリケーションが実行するシミュレーションに基づいて、ハールウェーブレットはさらに、他のウェーブレットベースよりも正確な品質計測値を提供することができる。この理由は、対称ハールフィルタが一般化された直線位相を有するので、知覚される画像構造を保存することができるからである。さらにハールフィルタはフィルタ長さが短いので、画像をフィルタリングしすぎてしまうことがない。
次のステップでは、処理250で、画像X、XAの近似サブバンドと、画像Y、Yの近似サブバンドとの間にIQMを適用して、近似品質計測値IQMを計算する(ボックス258)。次に画像Xおよび画像Yのエッジマップを生成する(ボックス260)。ここでは、エッジマップは単に画像のエッジ構造を反映したものであることに留意されたい。画像エッジの推定値は、詳細サブバンドの集計を利用して各画像に形成することができる。本発明の複数の実施形態で、詳細サブバンドの集計を実行する様々な方法が利用可能である。次に、これらの方法のうち、レベルごとの集計を実行する方法について説明する。本発明の他の実施形態である、層間集計(cross-layer aggregation)等の他のサブバンド集計方法では、画像Xおよび画像Yのエッジマップを利用することができ、これについては本発明の後の部分で説明する。
レベルごとの集計では、集計を各レベルi(i=1からN)で実行する。NレベルDWTを画像に適用する場合には、画像Xのエッジマップ(画像のエッジ推定値)を以下のように定義する。
Figure 0005510688
ここでXEはXのエッジマップであり、XE,Lは数2で定義される分解レベルLのエッジマップである。数2では、
Figure 0005510688
Figure 0005510688
Figure 0005510688
が、それぞれ画像Xについての分割レベルLで得られる水平、垂直、および対角詳細サブバンドを示す。近似サブバンドは、画像の主要コンテンツを含み、詳細サブバンドは、画像Xのエッジを含む。
Figure 0005510688
Figure 0005510688
Figure 0005510688
はそれぞれ、(N−L)−レベルDWTを
Figure 0005510688
Figure 0005510688
Figure 0005510688
に適用して得られるウェーブレットパケット近似サブバンドである。これらは、中間サブバンドに含まれており、レベルL−WP近似サブバンドと称される。パラメータμ、λ、ψは、数2で利用された様々なサブバンドに関連付けられる重みである。HVSは水平よび垂直サブバンドに感度が高く、対角サブバンドについて感度が低いので、水平および垂直サブバンドには重みを上げ、対角サブバンドには重みを下げる。μ=λ=4.5ψを本発明の実施形態では利用する。これにより、μ=λ=4.5およびψ=0.10のときに数3が満たされる。本発明の実施形態は、これら重みの他の様々な値も含む程度の柔軟性を有する。
Figure 0005510688
Figure 0005510688
Yのエッジマップは、Xと同様に定義される。一例として、図3a1のテーブル300が、N=2のときの画像Xのサブバンドを示している。選択されたサブバンドのみをエッジマップの生成に利用する。この図の二重線のボックス内にエッジマップの計算に係るサブバンドを示している。上述したように、エッジマップは、画像エッジの推定値として意図されている。従ってこれら全てを考えるのではなく、エッジマップの形成には最も情報の多いサブバンドを利用して、計算オーバヘッドを低減させる。出願人が実施したシミュレーションによれば、エッジマップの計算に全ての画像サブバンドを利用しても、品質の計測値の精度の上昇にあまり影響が出なかった。別の例では、図3a2のテーブル302が、N=3のときの画像Xのサブバンドを示している。選択されたサブバンドのみをエッジマップの生成に利用する。エッジマップの計算に関与するサブバンドは、この図の二重の実線内に示されている。Nが2以上の場合に拡張しても、図3a1および図3a2に示すサブバンド選択に利用される技術では、3Nのサブバンドが選択されるのみである。生成されたサブバンド全てをエッジマップ生成に利用すると、4−1サブバンドを利用する必要がある。Nが2以上である場合には、4−1は、3Nよりずっと大きくなる。従って、本発明の実施形態が利用する技術により、計算複雑性は大幅に低減される。
画像Xおよび画像Yのエッジマップを生成した後に、IQMをエッジマップXおよびYの間に適用する(ボックス262)。この結果得られる品質計測値は、エッジ品質計測値IQMと称される。利用されるIQMに応じたマップまたはスコアという用語については、本願の以下のセクションで説明する。次いで、処理250で、コントラストマップを生成する必要があるかをチェックする(ボックス264)。必要がある場合には処理はボックス264から「YES」へと抜けて、コントラストマップを生成する(ボックス266)。このコントラストマップは、複数のIQMの場合に必要である。絶対差(AD)および構造類似行列(SSIM)を含む一定のIQMが、それぞれ品質スコアを達成するためにプーリングされるべき中間品質マップを生成する。このステップでは、処理250は、近似およびエッジ品質マップのプーリングに利用されるコントラストマップを形成する。HVSは、エッジ付近の領域に感度が高いことが知られており、これは、Z.WangおよびA.C.Bovikの、「近代画質評価」米国、Morgan&Claypool、2006年に記載されている。従って、エッジ付近の品質マップにおける画素にはより重きを置く。加えて、Z.WangおよびX.Shangが「知覚画質評価のための空間プーリング戦略」Proc.IEEE Int.Conf.Image Process.、アトランタ、2006年10月、2945―2948ページで記載しているように、高エネルギー(または高分散)画像領域は、HVSをひきつける情報をより多く含む可能性が高い。従い、高エネルギー領域内の品質マップの画素にも、より高い重み付け(より高い重要度)を与える必要がある。これら事実に基づいて、エッジマップを計算された分散と組み合わせて、コントラストマップと称される関数を形成する。コントラストマップは、局所的なガウス二乗ウィンドウ内で計算されてよく、これは、全エッジマップXおよびYにおいて(画素ごと(pixel-by-pixel))に移動する。Z.Wang、A.Bovik、H.Sheikh、および、E.Simoncelliによる「画質評価:エラー可視性から構造的類似度へ」画像処理に対するIEEE処理、13巻、4号、600−612ページ、2000年4月で説明されているように、ガウススライディングウィンドウW={wk|k=1,2,…,K}で標準偏差が1.5のサンプルの場合、単位合計に正規化を利用する。係数Kの数は16に設定され、これはつまり、4×4のウィンドウが利用されることを意味する。ウィンドウサイズは大きすぎず、正確な局所統計量を生じさせることができる。コントラストマップは以下のよう定義される。
Figure 0005510688
Figure 0005510688
Figure 0005510688
ここで、xおよび
Figure 0005510688
は、スライディングウィンドウ内のxおよび
Figure 0005510688
の画像パッチを示している。ここでは、コントラストマップが、原画像の統計学的数値を利用して、品質マッププーリングのための重み付けされた関数を形成している点に留意されたい。図3cに示されている画像330は、図3bに示す画像320に示される典型的な画像のために数4により得られる、サイズを変更されたコントラストマップを示している。図3bおよび図3cから分かるように、コントラストマップは明らかに、HVSにとってのエッジおよび重要な画像構造を示している。コントラストマップにおけるより明るい(より高い)サンプル値は、HVSにとってより重要であり、画質を判定する際に重要な役割を果たす画像構造を示している。
次のステップでは、処理は、(4)に定義されるコントラストマップを利用して、近似品質マップIQMおよびエッジ品質マップIQMに重み付けプーリングを実行する(ボックス268)。
Figure 0005510688
Figure 0005510688
コントラストマップのXE,jおよび
Figure 0005510688
が、j番目の局所的ウィンドウの画像パッチを示しており、
Figure 0005510688
Figure 0005510688
E,jおよびyE,jという品質マップ内の用語が、j番目のウィンドウの位置における画像パッチ(または画素)を示している。Mは、品質マップの画素数であり、SおよびSは、それぞれ重み付けされたプーリング処理の後に達成される近似およびエッジ品質スコアを表している。
次に画像Yの品質の計測値を決定する(ボックス270)。このステップでは、近似およびエッジ品質スコアを線形に合成して(数9参照)、画像XおよびYの間の全品質スコアIQMDWTを得る。
Figure 0005510688
ここで、IQMDWTは、画像Xに対する画像Yの品質の計測値を表し、βは定数である。近似サブバンドが主要画像コンテンツを含むと、βを1に近づけ、近似品質スコア(SA)により高い重要度を与える必要がある。計測値を生成した後で処理250を終了する(ボックス272)。本発明の特定の実施形態で、コントラストマップを必要としないIQMを利用する場合には、処理250はボックス264から「No」へと進み、ボックス266および268を行わず、近似品質計測値およびエッジ品質計測値を組み合わせて、品質の計測値を決定して(ボックス270)、終了する(ボックス272)。
上述したように、本発明の別の実施形態では、集計を行う別の方法を利用しており、これについて次に説明する。
<エッジマップを生成する別の方法を利用する別の実施形態>
画像Xおよび画像Yのためのエッジマップの生成に利用される参照画像Xおよび変形画像Yの詳細サブバンドの集計を実行する際に利用される方法を、図3dおよび図3eを参照して説明する。集計を行う方法の各ステップを説明する前に、基礎となるコンセプトを説明する。
画像エッジの推定値は、詳細サブバンドの集計を利用して各画像について形成することができる。NレベルのDWTを画像に当てはめる場合には、画像Xのエッジマップは数6として定義される。
Figure 0005510688
ここで通常は、全てのLに対してω<=ωL+1となる。
ここでXはXのエッジマップであり、XE,Lは、数2で定義されるように計算される画像XのレベルLにおけるエッジマップである。重みωは、様々な重要度を、1からnの異なるレベルで実行される多解像度分解に関連付けるために利用される。一式の所定の重み付けを任意のレベルi(i=1からn)のうちの任意のものに利用することができる。数式で利用されるLの値は、レベルを示すiに等しい。
レベル1からN−1で生成された中間サブバンドおよび多解像度分解のレベルNで生成された詳細サブバンドを集計するには他の方法もある。この集計はレベルごとに行うこともできるし、またはレベルを超えて集計することもできる。しかし、この集計プロセス中には実質的に同じ解像度のサブバンドのみが合成される。前述したレベルごとの集計は、層を超えた集計と対照的なものとして一般化および提示される。層毎の方法では、選択された中間サブバンドの集計を、各レベルi(i=1からN−1)で行い、レベルiのエッジマップを生成し、選択された詳細サブバンドの集計については、レベルLで行い、レベルNのエッジマップを生成する。従って、数2は以下のように一般化される。
Figure 0005510688
ここで、幾つかのμ、λ、ψを、様々なLの値についてゼロに設定することもできる。μ、λ、ψL幾つかをゼロに設定することで、画像Xの幾つかの中間サブバンドおよび幾つかの詳細サブバンドを集計プロセスから取り除くことができる。従って、ゼロではない重みに対応する選択されたサブバンドのみを集計用に選択することができる。選択するサブバンドの数を増やすと、分解の結果の精度がより高くすることができる可能性がでてくる。しかしながら、このさらなる精度は、計算におけるオーバヘッドの増加というコストを伴う。本発明の実施形態の方法は、制度と計算の複雑さとの間を効果的にトレードオフすることができ、品質の計測値を決定する際に達成されるべき精度に基づいて、選択する中間サブバンドを決定することができる。利用する中間サブバンドの数により計算上のオーバヘッドが決定され、これは一定の精度について選択することができる。同様のプロセスを、画像Yの詳細サブバンドの集計にも利用することができる。
前段落で説明した中間および詳細サブバンドのレベルごとの集計を実行する方法の各ステップを、図3dを参照しながら説明する。この方法は、レベルNで生成された画像Xの選択された1以上の詳細サブバンドを集計して、画像XについてレベルNのエッジマップを生成して、各レベルi(i=1からN−1)で生成された選択された中間サブバンドの1以上を集計して、画像Xのレベルiのエッジマップを生成することを含む。集計プロセスは、レベルNのエッジマップを含むレベルi全てのエッジマップを集計した後に終了する。レベルiのエッジマップおよびレベルNのエッジマップは、数2aを適用することで決定することができ、画像Xのエッジマップは、画像XのレベルjのエッジマップとレベルNのエッジマップを数6aを利用した重み付けした合計として決定することができる。画像Yの中間サブバンド及び詳細サブバンドの集計についても同様のプロセスを行うことができる。開始すると(ボックス352)、処理350により、Lの値を1に設定する(ボックス354)。次に、レベル1からNまで複数のステップを繰り返す。Lの値は、この繰り返しプロセスの現在の分解レベルを表している。一式の所定の重みのセットω、μ、λ、ψを取得する(ボックス356)。次いで、レベルLの画像XおよびレベルLの画像Yのエッジマップを生成する(ボックス358およびボックス360)。Lの値を1増分して(ボックス362)、処理350で、LがN以下かをチェックする(ボックス364)。チェック結果が肯定的である場合には、処理350はボックス364から「Yes」に進み、ボックス356の入力にループバックして、次のレベルの処理を実行する。チェック結果が否定的である場合には、処理350は、ボックス364から「No」に進み、Nレベルの画像Xのエッジマップを集計して(ボックス366)、レベルNの画像Yのエッジマップを集計する(ボックス368)。集計の実行後に、処理350が終了する(ボックス369)。
層を超えた集計を実行する本発明の実施形態を次に説明する。レベルごとの方法と比べ、層を超えた方法は、複数のレベルでの集計を実行する。この方法では、画像Xおよび画像Yの水平エッジ、垂直エッジマップ、および対角エッジマップの生成は、次の段落で説明する3つの以下の実施形態における中間ステップとして実行することができる。画像Xのこれらエッジマップの生成を次に説明する。同様の数式セットは、画像Yのエッジマップの生成にも利用することができる。画像Xの各レベルiで生成される中間サブバンド(i=1からN−1)には、レベルi−詳細サブバンド、および、レベルi−ウェーブレットパケット(WP)サブバンドが含まれる。レベル−i詳細サブバンドには、レベルi−水平、レベルi−垂直、および、レベルi−対角サブバンドが含まれる。レベルi−ウェーブレットパケットサブバンドは、レベルi−ウェーブレットパケット近似サブバンドおよびレベルi−ウェーブレットパケット詳細サブバンドを含む。レベルi−ウェーブレットパケット近似サブバンドは、レベルi−水平WP近似サブバンド、レベルi−垂直WP近似サブバンド、および、レベルi−対角WP近似サブバンドを含む。
詳細サブバンドおよびウェーブレットパケット近似サブバンドに関する層を超えた集計は、以下の数10のセットに示されている。3つの式の合計(L=1からN−1)を実行する。Lの各値は、Nレベルの分解プロセスの特定のレベルiに対応している。数10のL=1に対応する用語は、L=1では第1レベルの分解(i=1)、および、L=2では第2レベルの分解(i=2)といった具合に対応している。従って以下の記載では、レベルLという用語をレベルiの代わりに利用する。
Figure 0005510688
Figure 0005510688
Figure 0005510688
これらは以下の3つの選択肢のいずれかとして集計することもできる。
オプション1:
Figure 0005510688
オプション2:
Figure 0005510688
オプション3:
Figure 0005510688
通常は、μ≦μL+1、λ≦λL+1、ψ≦ψL+1である。
ここで、k、l、mそれぞれの0、1、または複数の値について、μk=0、λl=0、ψm=0、とすることもできる。
数10a、数10b、および数10cの左側のX、X、およびXは、ぞれぞれ、画像Xの水平、垂直、および対角エッジマップである。これら3つの数のそれぞれ右側の項には、画像XのレベルL−WPパケット近似サブバンドおよび詳細サブバンドが含まれる。数10aの右側の第1項は、画像XのレベルL−水平WP近似サブバンド全ての二乗の重み付けされた合計であり、このLは1からN−1の範囲である。第2項は、最後の分解レベルの後に得られる画像Xの水平サブバンドの重み付けされた二乗値である。数10bの右側の第1項は、画像XのレベルL−垂直WP近似サブバンド全ての二乗の重み付けされた合計であり、このLは1からN−1の範囲である。第2項は、最後の分解レベルの後に得られる画像Xの垂直サブバンドの重み付けされた二乗値である。数10cの右側の第1項は、画像XのレベルL−対角WP近似サブバンド全ての二乗の重み付けされた合計であり、このLは1からN−1の範囲である。第2項は、最後の分解レベルの後に得られる画像Xの対角サブバンドの重み付けされた二乗値である。様々なエッジマップの計算に関わるサブバンドは、テーブル300およびテーブル302(図3a1および図3a2)の二重実線のボックス内に記載されている。所定の重みμ、λ、ψは、サブバンドそれぞれに様々な重要度をあてがうために用いることができる。
水平、垂直、および対角エッジマップを得た後には、これらエッジマップを集計する(合成する)3つの選択肢(選択肢1−選択肢3)がある。本発明の3つの異なる実施形態(それぞれが特別な選択肢を有する)を提供する。
数10および選択肢1−選択肢3に基づく集計を実行する際に利用される方法の各ステップを、図3eに示すフローチャート370を参照して説明する。開始されると(ボックス372)、処理370で、各レベルL=1からNに関する重みμ、λ、ψを得る(ボックス374)。次に、画像Xの水平エッジマップXを生成する(ボックス376)。この後に、画像Xの垂直エッジマップXを生成し(ボックス378)、画像Xの対角エッジマップXを生成する(ボックス380)。数10a、数10bおよび数10cは、3つのエッジマップそれぞれを生成する際に利用される。次に、画像Xの3つのエッジマップの集計を実行して(ボックス382)、画像XのエッジマップXEを生成する。この後に、画像Yの水平エッジマップYを生成して(ボックス384)、画像Yの垂直エッジマップYを生成し(ボックス386)、画像Yの対角エッジマップYを生成する(ボックス388)。そして処理370で、画像Yの3つのエッジマップを集計して(ボックス390)、画像YのエッジマップYを生成する(ボックス392)。3つの実施形態それぞれにおいて、3つの選択肢である選択肢1−選択肢3のいずれかを利用して、異なる方法でボックス390の集計が実行される点に留意されたい。
数10に示すように、中間サブバンドの中からウェーブレットパケット近似サブバンドのみを選択して集計を実行する。ウェーブレットパケット近似サブバンドのみを利用すると、計算の複雑性の低減には寄与するものの、集計プロセスをウェーブレットパケット近似サブバンド
Figure 0005510688
のみを含むものに限定する必要はない。レベルi−WP水平、レベルi−WP垂直、及びレベルi−WP対角サブバンドを含むウェーブレットパケット詳細サブバンドも集計プロセスに含めることができる。このようなウェーブレットパケット詳細サブバンドを含む本発明の更なる実施形態は、水平、垂直、および対角方向のさらなる詳細を含む必要がある場合に利用することができる。
これら実施形態では、集計プロセスは、数11の以下の形態をとることもできる。
Figure 0005510688
Figure 0005510688
Figure 0005510688
次に、これらを以下の3つの選択肢のいずれかのように集計することができる。
選択肢1a:
Figure 0005510688
選択肢2a:
Figure 0005510688
選択肢3a:
Figure 0005510688
通常は、μ≦μL+1、λ≦λL+1、ψ≦ψL+1、μ'≦μ'L+1、λ'≦λ'L+1、ψ'≦ψ'L+1である。
ここで、k、l、m、k'、l'、m'それぞれの0、1、または複数の値について、μk=0、λl=0、ψm=0、μ'k'=0、λ'l'=0、ψ'm'=0とすることもできる。
図3eに示す例に類似した方法を利用することもできる。差異は、数11a、数11b、および数11cが、画像Xおよび画像Yの水平、垂直、および対角エッジマップを計算するために利用される点である。レベルL−WP水平サブバンド(Lは1からN−1の範囲である)の貢献は、数11aの右側の最終項に示されている。同様に数11bの右側の最終項が、レベルL−WP垂直サブバンドの貢献を示しており、数11cの右側の最終項が、画像XのレベルL−WP対角サブバンドの貢献を示している。様々なエッジマップの計算に利用される、レベルL−WP水平、垂直、および対角サブバンド(Lは1からN−1の範囲である)は、図3a1および図3a2のテーブル300およびテーブル302の点線のボックス内に示されている。ここでも、水平、垂直、および対角エッジマップの集計には、3つの選択肢である選択肢1aから選択肢3aのいずれかを利用して他の実施形態を利用することもできる。
前述したように、前述した枠組とともに様々なIQMを利用することで、各IQMについて1つずつ、複数の実施形態が可能となる。これらIQMには、SSIM、VIF,SPNR、およびADが含まれる。これら実施形態それぞれについて次に説明する。
<SSIM IQMに基づく実施形態>
本実施形態は、SSIM IQMを利用する。本発明の本実施形態のSSIM−ベースの方法の各ステップを、図4を参照して説明する。開始後(ボックス402)、処理400はN(DWTのレベル数)を1に設定する(ボックス404)。画像近似サブバンドは本発明の実施形態の肝なので、Nは、近似品質スコアSSIM(計算は次の段落で述べる)の精度が最大化されるようなものを選択する。図5aに示すグラフ500のプロットは、異なるNの値についてのSSIMおよび差動平均意見スコア(DMOS)値の間の線形相関係数(LCC)およびスピアマンの順位相関係数(SRCC)を示している。このテストを実行するにあたり、H.R.Sheikh,Z.Wang、L.Cormack、およびA.C.Bovikによる「LIVE画質評価データベース・リリース2」(http://live.ece.utexas.edu/research/quality)が記載するLIVE画質評価データベース・リリース2の799全ての変形画像を、LLCおよびSRCCの計算に含めた。図5aに示すように、SSIMAは、N=1のときに最良のパフォーマンスを達成する。この理由は、2以上の分解レベルについて、近似サブバンドは非常に小さくなり、近似サブバンド内でいくつもの重要な画像構造が失われるからである。
ハールフィルタを利用してシングルレベル(=1)DWTを参照画像(画像X)および変形画像(画像Y)両方に実行する(ボックス406)。方法は、他の種類のウェーブレットフィルタを処理するよう適合させることもできる。次のステップでは、処理400はSSIM(画像Xおよび画像Yの近似サブバンド間のSSIM)を計算する(ボックス408)。各画像パッチXおよびYAについて(XおよびYの第1レベルの近似サブバンド範囲内で)、SSIMを、数12を利用して計算する。
Figure 0005510688
Z.Wang、A.Bovik、H.Sheikh、および、E.Simoncelliによる「画質評価:エラー可視性から構造的類似度へ」画像処理に対するIEEE処理、13巻、4号、600−612ページ、2000年4月に示されている方法に従って、SSIMマップを計算する。ウィンドウサイズを除く全てのパラメータをこの文書で提示されている通りとする。スライディング4×4ガウス・ウィンドウを処理400で利用する。
次に、処理400で、画像Xおよび画像Yのエッジマップを生成する(ボックス410)。エッジマップは、数13および数14を用いて画像ごとに生成される。
Figure 0005510688
Figure 0005510688
ここで(m,n)は、ウェーブレットサブバンド内の同じ位置を示している。数12および数13は、上述した数2および数3に基づいている点に留意されたい。利用した重み付けは、μ=0.45、λ=0.45、ψ=0.1であった。次のステップで、2つの画像間のエッジSSIMマップであるSSIMを、以下の数を利用して計算する(ボックス412)。
Figure 0005510688
Figure 0005510688
ここで、
Figure 0005510688
は、(XおよびYの)画像パッチxおよびy間の共分散であり、パラメータ
Figure 0005510688
Figure 0005510688
が、xおよびyそれぞれの分散であり、kは、小さな定数であり、Lは、動的な画素の範囲である(グレイスケール画像において255)。相関係数および分散を、Z.Wang、A.Bovik、H.Sheikh、および、E.Simoncelliによる「画質評価:エラー可視性から構造的類似度へ」画像処理に対するIEEE処理、13巻、4号、600−612ページ、2000年4月に示されている方法と同様の方法で計算する。実際のところ、エッジマップのみにより画像エッジ構造が形成されており、輝度情報は含まれないので、この文献で説明されているSSIMマップの輝度を比較している部分は、エッジSSIMマップの決定に際しては省くことができる。次にコントラストマップを、数4を利用して生成する(ボックス414)。コントラストマップは、数7および数8を利用してSSIMおよびSSIMの重み付けされたプーリングを行うときに利用される(ボックス416)。数7で利用するIQMおよび数8で利用するIQMが、それぞれ、SSIM(数12で計算される)およびSSIM(数15で計算される)である点に留意されたい。SSIMDWTスコアは、数9を利用して品質の計測値として決定される(ボックス418)。
Figure 0005510688
SSIMDWTおよびDMOS値の間の二乗平均平方根(RMSE)を、数17の異なるβ値について計算するとき、β=0.87という大域的最小点(global minimum)に到達する。βの値は、βが1に近い値であるべきである、という直感的な予測に合致している。図5bは、グラフ520を示しており、これは、βの異なる値のRMSEのプロットを表している。LLCは、βの小さな変動に対してあまり感度を有さない点に留意されたい。つまり、提案されているβ=0.87は、異なる画像データベースにおける画質の計測において、SSIMDWTの精度に対して大きな影響は持たない。
品質の計測値が生成されると、処理400を終了する(ボックス420)。
<VIF IQMに基づく実施形態>
VIFインデックスは、H.R.Sheikh、M.F.Sabir、およびA.C.Bovikが「最近の全参照画質評価アルゴリズムの統計学的評価」、画像処理に対するIEEE処理、15巻、11号、3440−3451ページ、2006年11月で記載しているような、有名な画質評価アルゴリズムのパフォーマンス評価において正確な画質メトリックの1つとして認められている。高レベルの精度は有しているものも、このIQMは、様々なアプリケーションでSSIM IQMと違ってあまり重きを置かれてこなかった。この理由はおそらく計算が複雑であるからであろう(H.R.SheikhおよびA.C.Bovikが「画像情報および視覚品質」画像処理に対するIEEE処理、15巻、2号、430−444ページ、2006年2月では、SSIMインデックスよりも6.5倍も計算時間がかかる、とされている)。VIF IQMの複雑性の大半の理由は、同じサブバンドの近隣の係数が線形相関しているような、過度に完全な(over-complete)ステアリング可能ピラミッド分解に起因していると思われる。この結果、ベクトルガウススケール混合GSM(vector Gaussian scale mixture)を正確な品質予測を行うために実行する。
このセクションでは、提案する枠組を利用して離散ウェーブレット領域のVIFを計算する方法の各ステップを説明する。この提案する方法は、元のVIFインデックスベースの方法よりも精度が高く、しかもVIF IQMより複雑性が低い。この方法は、VIF計算の画像をモデル化するためにベクトルGMSではなくて、実数のデカルト分離可能ウェーブレット(real Cartesian-separable wavelets)を利用して、スカラーGMSを利用する。以下に短く説明する。
スカラーGMSベースのVIF:スカラーGMSを、IFCの計算に利用するものとして説明するが、H.R.Sheikh、A.C.Bovik、および、G.de Vecianaによる「自然シーン統計学を利用する画質評価の情報忠実度計測値」画像処理に対するIEEE処理、14巻、12号、2117−2128ページ、2005年12月で説明がなされている。この処理は、ここではスカラーGMSを利用してVIFインデックス計算について繰り返される。図6aでは、ボックス602が、変形されていない原画像(信号)のGMSモデルを表しており、ボックス604が、画像の変形をチャネルの変形ととらえて、ボックス602から原画像信号に変形を追加して、変形画像信号をモデル化する。ボックス606および608は、HVSの関数を、加法性ホワイトガウスノイズとして示しており、それらの出力を、変形信号および原画像信号とそれぞれ認識する。図6aを考慮すると、C=(C,C,…,C)がCからのM個のエレメントを示しており、D=(D,D,…,D)を、Dからの対応するM個のエレメントとする。CおよびDはそれぞれ、参照信号および変形信号の無作為なフィールド(RF)を示している。H.R.Sheikh、A.C.Bovik、および、G.de Vecianaによる「自然シーン統計学を利用する画質評価の情報忠実度計測値」画像処理に対するIEEE処理、14巻、12号、2117−2128ページ、2005年12月で記載されているように、これらモデルは1つのサブバンドに対応している。Cは、互いに独立した2つの統計学的無作為フィールド(RF)の積である。
Figure 0005510688
ここでiは、RFの空間インデックスセットを表し、Sは、正のスカラーのRFであり、Uは、平均値がゼロで分散が
Figure 0005510688
である、ガウススカラーRFである。変形モデルは、信号減衰であり、加法性ガウスノイズであり、以下のように定義されている。
Figure 0005510688
ここでGは決定論的スカラー減衰フィールドであり、Vは静止加法性ゼロ平均値のガウスノイズRFであり、分散が
Figure 0005510688
である。図6aに示す、知覚される信号は、H.R.SheikhおよびA.C.Bovikが「画像情報および視覚品質」画像処理に対するIEEE処理、15巻、2号、430−444ページ、2006年2月で記載しており、以下のように定義される。
Figure 0005510688
ここでNおよびN'は、分散
Figure 0005510688
を有する静止ホワイトガウスノイズRFを表している。VIFインデックスについて本文献が概要を示しているようなステップをスカラーGSMを考慮する計算で利用すると、以下が得られる。
Figure 0005510688
GMSモデルでは、参照画像係数はゼロの平均値であると推定されている。従ってスカラーGMSモデルでは、
Figure 0005510688
の推定値を、局所化されたサンプルの分散推定により得ることができる。H.R.Sheikh、A.C.Bovik、および、G.de Vecianaによる「自然シーン統計学を利用する画質評価の情報忠実度計測値」画像処理に対するIEEE処理、14巻、12号、2117−2128ページ、2005年12月で記載されているように、分散
Figure 0005510688
は、一般性を失わない単位元(unity)であるとみなすことができる。従って数21を数22に単純化することができる。
Figure 0005510688
同様に、数23が得られる。
Figure 0005510688
最終VIFインデックスは数23により、H.R.SheikhおよびA.C.Bovikが「画像情報および視覚品質」画像処理に対するIEEE処理、15巻、2号、430−444ページ、2006年2月で記載している方法を用いるが、単一のサブバンドのみを考慮することで得られる。
Figure 0005510688
本実施形態におけるVIFベースの方法における各ステップを、図6bのフローチャート650を参照して説明する。開始すると(ボックス652)、処理650は、N=1に値を設定する(ボックス654)。SSIM IQMに基づいた実施形態の場合で既に記載したように、VIFベースの品質計測値の計算における分解レベルについて正しい数を先ず決定する必要がある。実験は、スカラーVIFについて前述した実験に類似した方法で行われる。図7aは、様々な分解レベルNのVIF(計算については次の段落参照)およびDMOS値の間のLLCおよびSRCCを表すグラフ700を示している。VIF予測の精度は、分解レベル数が増加すると低減する。従ってVIFの性能はN=1のときに最良である。これは、マルチレベル分解によって近似サブバンドの解像度は低下し、この結果、Nを超える値では、VIFが基づく画像の情報がそのサブバンドで失われてしまうからである。
次に、NレベルのDWTを画像Xおよび画像Yに行う(ボックス656)。次いで処理650で、VIF近似品質スコアVIFを、XおよびYという近似サブバンド間で計算する(つまりXおよびY)。簡略化目的からここではXA1およびYA1の代わりにXおよびYを利用することとする。
Figure 0005510688
Mは、近似サブバンド内のサンプル数であり、XA,iは、近似サブバンドXA内のi番目の画像パッチであり、
Figure 0005510688
はその分散である。ノイズ分散
Figure 0005510688
を、本発明のこの実施形態では5に設定する。パラメータgおよび
Figure 0005510688
は、H.R.Sheikh、A.C.Bovik、および、G.de Vecianaによる「自然シーン統計学を利用する画質評価の情報忠実度計測値」画像処理に対するIEEE処理、14巻、12号、2117−2128ページ、2005年12月に記載する方法で推定され、以下の数26および数27となる。
Figure 0005510688
Figure 0005510688
は、画像パッチxA,iおよびyA,i間の共分散であり、εは、
Figure 0005510688
がゼロでありε=10−20である場合の不安定性を避けるために非常に小さい定数とされている。
Figure 0005510688
全ての統計学数値(画像パッチの分散および共分散)は、局所的なガウス二乗ウィンドウ内で計算され、これは画素ごとに全近似サブバンドXおよびYで移動する。この場合に利用されるガウススライドウィンドウは、前に定義したものと全く同じである。ウェーブレット領域のサブバンドの解像度がより小さいことから、小さな3×3のスライドウィンドウでもほどほどに正確な局所統計量を抽出することができる。しかし最良のパフォーマンスを達成して、正確な局所統計量を抽出するために、ここではより大きなサイズ9×9のウィンドウを利用する。後のセクションで記載するシミュレーション結果は、VIFに基づく品質の計測値により、ここで記載する設定を有する正確なスコアを提供することができる。次のステップでは、処理650で、数2および数3を利用して、エッジマップXおよびYを生成する(ボックス660)。次に、エッジマップ間の類似度を反映した画像Xおよび画像Yのエッジマップ間のVIFエッジ品質スコアVIFを計算する(ボックス662)。最後に、品質の計測値を、数9を利用して計算する(ボックス664)。
Figure 0005510688
VIFDWTスコアは、「0、1」の範囲内の画像Yの品質の計測値である。品質の計測値を計算した後で処理650が終了する(ボックス666)。
図7bは、βの異なる値のVIFDWTおよびDOS値の間のRMSを示すグラフ720を示す。ここから分かるのは、RMSEがその大域的最小点にβ=0.81のとき到達する、ということである。このβの値は、SSIMDWTについて得られるものに近い。LCCはβの小さな変動にあまり高い感度を有さないことが有名である。従ってβについて得られた値は、VIFDWTを異なる画像データベースの画像に適用した場合であっても有効である。
<PSNR IQMに基づく実施形態>
この実施形態では、変形画質計測値を決定するためにPSNR IQMが利用される。従来のPSNRおよびその均等物である平均二乗誤差(MSE)を数29および数30で定義する。
Figure 0005510688
Figure 0005510688
XおよびYは、それぞれ参照画像よび変形画像を示す。Xmaxは、参照画像Xの可能な最大の画素値である。最小画素値はゼロと想定される。Nは、画像それぞれの画素数である。従来のPSNRは、デシベル(dB)単位で品質を計算するのが簡単なために、依然として人気があるが、この技術は、人間が感じる画像の忠実度を適切に反映することができない。N.Damera−Venkata、T.D.Kite、W.S.Geisler、B.L.Evans、および、A.C.Bovikが「劣化モデル(degradation model)に基づく画質評価」画像処理に対するIEEE処理、9巻、4号、636−650ページ、2000年4月で説明しているWSNRおよびNQM等、および、D.M.ChandlerおよびS.S.Hemaniが「ウェーブレットに基づく、自然画像の視覚上の信号対雑音比」画像処理に対するIEEE処理、16巻、9号、2284−2298ページ、2007年9月で説明しているVSNR等の、他の誤差に基づく技術は、人間の視覚システム(HVS)パラメータを計算するために高度な処理を踏むために、利用簡便さに劣る。このセクションでは、前述した本発明の実施形態が提供する枠組により離散ウェーブレット領域でPSNRベースの品質の計測値が正確に計算される様子を説明する。
本発明の本実施形態のSSIM−ベースの方法の各ステップを、図8を参照して説明する。開始後(ボックス802)、処理800はN(DWTのレベル数)を計算する(ボックス804)。図9aに示すグラフ900のプロットは、異なる分解レベルに対するPSNRおよびDMOS値の間のLCCおよびSRCCを示す。テストは、前のセクションで記載した方法に類似した方法で行われる。ここで、N=2およびN=3のときに最良または最良に近いパフォーマンスを達成していることが分かる。対応する画像データベースで利用可能な個々のタイプの変形に基づいて、Nのどちらの値(2または3)がより正確な品質の計測値を提供するかを判断することができる。参照番号960で示され、図9cに示されているテーブルIは、5つの異なるタイプの変形についてのSRCC値をリストしている。全てのデータ(変形画像)を考慮した場合に、PSNRのパフォーマンス(計算方法についてはこのセクションの後の部分で述べる)は、N=2で最良になっていることが観察される。従ってN=2が、適した分解モデルである。
N=2は、テストで利用される全画像データベースでうまく機能するものの、この実施形態では、様々な他の画像に適用することができるNを利用する必要がある。分解レベル数Nは、人間の視覚システムに対する実質的なピークの応答を生成する近似サブバンドSの最小サイズの関数として得られる。従って数1eがNの決定に利用される。
Nの値を計算した後で、NレベルのDWTを画像Xに適用して(ボックス806)、画像Yに適用する(ボックス808)。参照画像および変形画像両方に対するNレベルの離散ウェーブレット変換(DWT)は、ハールフィルタを利用して適用される。本方法では、他のウェーブレットフィルタにも対応可能である。Nレベルの分解では、近似サブバンド
Figure 0005510688
および
Figure 0005510688
ならびに、詳細サブバンド数を取得する。前述したように、ハールフィルタを選択したのは、計算がほどほどに簡単でパフォーマンスが良好だからである。その簡単さによって、本発明の実施形態の全ての方法には無視可能な計算上の負荷がかかる。シミュレーション結果が示すように、ハールウェーブレットは、他のウェーブレットベースよりもさらに正確な品質スコアを提供することができる。
次のステップで、処理800は、画像Xのエッジマップを生成して(ボックス810)、次に、画像Yのエッジマップを生成する(ボックス812)。次に、処理800は、画像Xおよび画像Yの近似サブバンド間にPSNR IQMを適用することで、PSNR近似品質スコアPSNRを計算する(ボックス814)。次に、PSNRエッジ品質スコアPSNRを、画像Xおよび画像Yのエッジマップ間にPSNR IQMを適用して計算する(ボックス816)。PSNRおよびPSNREは、数30および数31を利用して計算される。
Figure 0005510688
Figure 0005510688
次のステップで、処理800は、PSNRDWTスコアを品質計測値として決定して(ボックス818)、終了する(ボックス820)。PSNRDWTは、PSNR近似品質スコアとPSNRエッジ品質スコアを数9に基づいて組み合わせることで決定される。
Figure 0005510688
PSNRDWTは、1つの画像データベースの様々な画質の計測値を提供することに留意されたい。定数βの最適な値を見つけるために、SSIMDWTおよびVIFDWTに焦点を当てて説明した前のサブセクションで記載した実験に類似した実験を実行する。図9bは、数32で利用されるβの異なる値のPSNRDWTおよびDOS値の間のRMSを示すグラフ920を示す。ここから分かるのは、RMSEがその大域的最小点にβ=0.84のとき到達する、ということである。このβの値は、他のメトリックについて前に決定した値に非常に近い。このβの値が他のテストデータベースに対してもよく機能することは、この文書の後の部分で説明する。
<AD IQMに基づく実施形態>
本実施形態ではAD IQMを利用する。本発明の本実施形態のAD−ベースの方法の各ステップを、図10を参照して説明する。開始後(ボックス1002)、処理1000はNを決定する(ボックス1004)。前述したようにテストを画像データベースに行った。図11は、取得した異なる分解レベルについての近似ADマップ、AD(その生成に関しては次の段落で述べる)およびDMOS値の間のLCCおよびSRCCを示すグラフ1100を示している。PSNRに類似して、ADパフォーマンスはN=2のとき最良である。Nの一般値は、数1eにより計算することができる。
次に、NレベルのDWTを画像Xおよび画像Yに行う(ボックス1006)。以下のステップで、処理1000は、AD IQMを、XおよびYの近似サブバンドの間に適用して、近似ADマップADを生成する(ボックス1008)。
Figure 0005510688
ここで(m,n)は、近似サブバンドのサンプル位置を示す。次に画像Xおよび画像Yのエッジマップを生成する(ボックス1010)。次に、処理1000は、エッジマップXおよびY間にAD IQMを適用して、エッジADマップADを生成する(ボックス1012)。
Figure 0005510688
エッジADマップを生成した後で、処理1000は、コントラストマップを生成する(ボックス1014)。コントラストマップを、数4を利用して得て、次にADおよびADを、コントラストマップを利用してプーリングして、それぞれ近似品質スコアおよびエッジ品質スコアSおよびSを決定する(ボックス1016)。
Figure 0005510688
Figure 0005510688
本方法は、SおよびSを利用して、ADDWTスコアを品質の計測値として数37を利用して決定する(ボックス1018)。
Figure 0005510688
前のセクションでも説明したようにβは0.84に設定されている。品質の計測値を決定した後で処理1000を終了する(ボックス1020)。
<シミュレーション結果>
変形画像についての品質の計測値を決定する本発明の実施形態の方法のパフォーマンスは、H.R.Sheikh,Z.Wang、L.Cormack、およびA.C.Bovikによる「LIVE画質評価データベース・リリース2」(http://live.ece.utexas.edu/research/quality)が記載するLIVE画質評価データベース・リリース2の画像を利用して評価される。このデータベースは、5つの種類の変形(JPEG圧縮、JPEG2000圧縮、ガウスホワイトノイズ(GWM)、GBLur(Gaussian blurring:ガウス暈し)、および、レイリー高速フェージング(FF)チャネルモデル)を利用して29個のカラー元画像から得られた779個の変形画像を含んでいる。データベース用に再編成された主観的な品質データを全ての実験で利用することができる。
それぞれが前述した実施形態で計算されるような3つの異なるIQMベースの品質計測値を、データベースの画像に適用して、客観的なモデルのパフォーマンスを計測することができる。複数のメトリックをこのパフォーマンス評価に利用する。第1のメトリックは、非線形回帰後の、差動平均意見スコア(DMOS)と主観的モデル出力との間のピアソン相関係数(LCC)である。この相関係数は、予測精度の評価を行う。非線形回帰では、H.R.Sheikh、M.F.Sabir、およびA.C.Bovikが「最近の全参照画質評価アルゴリズムの統計学的評価」、画像処理に対するIEEE処理、15巻、11号、3440−3451ページ、2006年11月で定義されている5パラメータのロジスティック関数を利用する。第2のメトリックが、非線形回帰の後のDMOSおよび主観モデル出力間の二乗平均平方根誤差(RMSE)である。RMSは、予測の一貫性の計測値と捉えられる。第3のメトリックが、スピアマン順位相関係数(SRCC)であり、予測単調性の計測値を提供する。
本発明の実施形態のパフォーマンス評価を適切なコンテキストに利用するために、実施形態の方法を、先行技術で利用可能な他の画質メトリックと比較する。先行技術には、Z.Wang、A.Bovik、H.Sheikh、および、E.Simoncelliによる「画質評価:エラー可視性から構造的類似度へ」画像処理に対するIEEE処理、13巻、4号、600−612ページ、2000年4月で説明されている従来のPSNR,空間領域平均SSIM、および、Z.Wangのリサーチホームページ(http://live.ece.utexas.edu/research/quality)で説明されている画像に対してダウンサンプリングを実行するSSIMの自動スケールバージョン、および、N.Damera−Venkata、T.D.Kite、W.S.Geisler、B.L.Evans、および、A.C.Bovikが「劣化モデル(degradation model)に基づく画質評価」画像処理に対するIEEE処理、9巻、4号、636−650ページ、2000年4月で説明しているWSNRが含まれ、これらでは、画像が、J.L.MannosおよびD.J.Sakrisonが「画像の符号化に対する視覚忠実度基準のもつ効果」、IEEE Trans. Inf. Theory、IT−20巻、4号、525から536ページ、1974年7月、および、H.R.Sheikh,Z.Wang、L.Cormack、およびA.C.Bovikによる「LIVE画質評価データベース・リリース2」(http://live.ece.utexas.edu/research/quality)、および、Z.Wangのリサーチホームページ(http://live.ece.utexas.edu/research/quality)で説明されているCSFによりフィルタリングされる。
図12のテーブルII1200は、LIVEデータベースの異なるメトリックとDMOS値との間のLCCをリストにしており、表13のテーブルIII1220および図14のテーブルIV1240が、それぞれメトリックとDMOS値との間のRMSEおよびSRCCを示している。ここでは、SAについて0.9441から0.9573に平均SSIMAのSRCCが増加したことを示しており、これは1.32%の向上である。SSIMDWTのパフォーマンスは、全ての構造メトリックのなかで最良である。SNRベースのメトリックでは、PSNRのSRCCは0.9307であり、これは従来のPSNR(0.8756)よりも高く、WSNR(0.9240)よりも高い値となっており、一方で、その複雑性は従来のPSNRより低い。
本発明の実施形態は、以下を含む複数の利点を提供する。本発明の重要な寄与点は、ウェーブレット領域のコントラストマップを品質マップのプーリングに導入した点である。本発明の新規な観点によると、パラメータを決定するために実験を重点的に行う必要がなく、例えばSSIM品質マップをプーリングするために定義されるコントラストマップに基づき、異なるウェーブレットフィルタへの適合が可能となる。図面に示され、明細書で説明される実施形態の様々な変更例および変形例が、本発明の広義の範囲を逸脱せずに以下の請求項の範囲内で可能である。例えばハール変換のほかに、ニューランド変換等の他のウェーブレット変換またはDaubechiesフィルタを利用するウェーブレット変換を、参照画像および変形画像の多解像度分解で利用することができる。図2bの方法250を含む方法の様々なステップは、マルチコアCPUまたはマルチプロセッサシステムを利用して並列実行することができる。例えば、多解像度分解中に画像XおよびYの分解を並列実行することができる。これら並列計算により、品質の計測値を計算する際の計算時間を低減させることができる。
まとめると、本発明の一態様では、変形画像Y用の品質計測値を決定するための方法であって、画像Yと、画像Yと同じ行列数の画素を有し、変形されていない参照画像Wとの間の類似度を特徴付け、(a1)1、2、…i、i+1、…Nを含むNレベルの多解像度分解を画像Xに適用して、1からN−1までの範囲である各レベルiについて、レベルi+1で処理するために画像Xの中間サブバンドを生成して、レベルNについて、画像Xの主要コンテンツを含む近似サブバンドと、画像Xのエッジを含む詳細サブバンドとを生成する段階と、(b1)1、2、…i、i+1、…Nを含むNレベルの多解像度分解を画像Yに適用して、1からN−1までの範囲である各レベルiについて、レベルi+1で処理するために画像Yの中間サブバンドを生成して、レベルNについて、画像Yの主要コンテンツを含む近似サブバンドと、画像Yのエッジを含む詳細サブバンドとを生成する段階と、(c1)画質メトリック(IQM)を画像Xの近似サブバンドと画像Yの近似サブバンドとに適用して、画像Xの主要コンテンツと画像Yの主要コンテンツとの間の類似度を特徴付ける近似品質計測値を生成する段階と、(d1)画像Xについて、1からN−1までの範囲であるレベルiで中間サブバンドおよび画像Xの詳細サブバンドを集計して、画像Xのエッジを特徴付ける画像Xのエッジマップを生成する段階と、(e1)画像Yについて、1からN−1までの範囲であるレベルiの中間サブバンドおよび画像Yの詳細サブバンドを集計して、画像Yのエッジを特徴付ける画像Yのエッジマップを生成する段階と、(f1)画像Xのエッジマップと画像Yのエッジマップとの間にIQMを適用して、画像Xのエッジと画像Yのエッジとの間の類似度を特徴付けるエッジ品質計測値を生成する段階と、(g1)近似品質計測値とエッジ品質計測値とを処理して品質計測値を決定する段階とを備える方法が提供される。
上述した方法において、段階(d1)がさらに、画像Xの1からN−1までの範囲である各レベルiについての中間サブバンドと詳細サブバンドとを、品質計測値の決定で達成される精度に基づいて選択する段階(a2i)と、画像Xについて、選択された中間サブバンドおよび選択された詳細サブバンドのみを集計する段階(a2ii)とを有する段階(a2)を有し、段階(e1)がさらに、画像Yの各レベルiについての中間サブバンドと詳細サブバンドとを、品質計測値の決定で達成される精度に基づいて選択する段階(b2i)と、画像Yについて、選択された中間サブバンドおよび選択された詳細サブバンドのみを集計する段階(b2ii)とを有する段階(b2)を有する。前述した段階(a2i)および(b2i)は、画像Xおよび画像Yについて、各レベルiについて中間サブバンドと詳細サブバンドとを、精度を達成するために必要な中間サブバンドおよび詳細サブバンド数に基づいて選択する段階をさらに有する。
上述した方法において、段階(a2ii)において、(a4i)各レベルiにおいて、画像の選択された中間サブバンドを集計して、画像Xのレベルiでエッジマップを生成する段階と、(a4ii)画像Xの選択された詳細サブバンドを集計して、画像のレベルNのエッジマップを生成する段階と、(a4iii)画像Xの各レベルiのエッジマップと、画像XのレベルNのエッジマップとを集計する段階とが含まれる段階(a4)と、段階(b2ii)において、(b4i)各レベルiにおいて、画像の選択された中間サブバンドを集計して、画像Yのレベルiでエッジマップを生成する段階と、(b4ii)画像Yの選択された詳細サブバンドを集計して、画像のレベルNのエッジマップを生成する段階と、(b4iii)画像Yの各レベルiのエッジマップと、画像XのレベルNのエッジマップとを集計する段階とが含まれる段階(b4)とが含まれる。
上述した方法において、段階(a4iii)はさらに、(a5i)画像Xの各レベルiのエッジマップを、レベルiの所定の重みで乗算する段階と、(a5ii)画像XのレベルNのエッジマップを、レベルNの所定の重みで乗算する段階と、(a5iii)段階(a5i)の乗算結果と、段階(a5ii)の乗算結果とを合計する段階とをさらに含む段階と(a5)、段階(b4iii)はさらに、(b5i)画像Yの各レベルiのエッジマップを、レベルiの所定の重みで乗算する段階と、(b5ii)画像YのレベルNのエッジマップを、レベルNの所定の重みで乗算する段階と、(b5iii)段階(b5i)の乗算結果と、段階(b5ii)の乗算結果とを合計する段階とをさらに含む段階と(b5)がさらに含まれる。
上述した方法において、段階(a4i)はさらに、(a6i)画像Xについて各選択された中間サブバンドを二乗する段階と、(a6ii)画像Xについて各選択された中間サブバンドについて所定の重みで、段階(a6i)で実行した二乗結果を乗算する段階と、(a6iii)段階(a6ii)の乗算の結果得られた積を合計する段階と(a6iv)段階(a6iii)で実行された合計結果に平方根関数を利用して、画像Xのレベルiのエッジマップを生成する段階とをさらに含む段階と(a6)、段階(a4ii)はさらに、(b6i)画像Xについて各選択された詳細サブバンドを二乗する段階と、(b6ii)画像Xについて各選択された詳細サブバンドについて所定の重みで、段階(b6i)で実行した二乗結果を乗算する段階と、(b6iii)段階(b6ii)の乗算の結果得られた積を合計する段階とをさらに含む段階と、(b6iv)段階(b6iii)で実行された合計結果に平方根関数を利用して、画像XのレベルNのエッジマップを生成する段階とを含む段階と(b6)、段階(b4i)はさらに、(c6i)画像Yについて各選択された中間サブバンドを二乗する段階と、(c6ii)画像Yについて各選択された中間サブバンドについて所定の重みで、段階(c6i)で実行した二乗結果を乗算する段階と、(c6iii)段階(c6ii)の乗算の結果得られた積を合計する段階とをさらに含む段階と、(c6iv)段階(c6iii)で実行された合計結果に平方根関数を利用して、画像Yのレベルiのエッジマップを生成する段階とを含む段階と(c6)、段階(b4ii)はさらに、(d6i)画像Yについて各選択された詳細サブバンドを二乗する段階と、(d6ii)画像Yについて各選択された詳細サブバンドについて所定の重みで、段階(d6i)で実行した二乗結果を乗算する段階と、(d6iii)段階(d6ii)の乗算の結果得られた積を合計する段階とをさらに含む段階と、(d6iv)段階(d6iii)で実行された合計結果に平方根関数を利用して、画像YのレベルNのエッジマップを生成する段階とを含む段階と(d6)が含まれる。
画像Xおよび画像Yの各レベルiについての中間サブバンドは、各画像において、レベルi−詳細サブバンドおよびレベルi−ウェーブレットパケット(WP)サブバンドを含み、レベルi−WPサブバンドは、レベルi−WP近似サブバンドおよびレベルi−WP詳細サブバンドを含み、レベルi−WP近似サブバンドはさらに、レベルi−水平WP近似サブバンドとレベルi−垂直WP近似サブバンドと、レベルi−対角WP近似サブバンドとを含む。
上述した方法において、段階(a2i)はさらに、画像Xの1以上のレベルi−WP近似サブバンドと1以上の詳細サブバンドとを選択する段階をさらに有する段階と(a8)段階(b2i)はさらに、画像Yの1以上のレベルi−WP近似サブバンドと1以上の詳細サブバンドとを選択する段階をさらに有する段階と(b8)が含まれる。
上述した方法において、段階(a8)はさらに、選択において画像Xの1以上のレベルi−詳細サブバンドを含む段階をさらに有する段階と(a9)、段階(b8)はさらに、選択において画像Yの1以上のレベルi−詳細サブバンドを含む段階をさらに有する段階と(a9)が含まれる。上述した方法において、段階(a2ii)はさらに、(a10i)各レベルiで画像Xのレベルi−水平WP近似サブバンドと画像Xの水平サブバンドとを集計して、画像Xの水平エッジマップを生成する段階と、(a10ii)各レベルiで画像Xのレベルi−垂直WP近似サブバンドと画像Xの水平サブバンドとを集計して、画像Xの水平エッジマップを生成する段階と、(a10iii)各レベルiで画像Xのレベルi−対角WP近似サブバンドと画像Xの水平サブバンドとを集計して、画像Xの水平エッジマップを生成する段階と、(a10iv)画像Xの水平エッジマップ、垂直エッジマップ、および対角エッジマップを集計する段階とを含み(a10)、段階(b2ii)はさらに、(b10i)各レベルiで画像Yのレベルi−水平WP近似サブバンドと画像Yの水平サブバンドとを集計して、画像Yの水平エッジマップを生成する段階と、(b10ii)各レベルiで画像Yのレベルi−垂直WP近似サブバンドと画像Yの水平サブバンドとを集計して、画像Yの水平エッジマップを生成する段階と、(b10iii)各レベルiで画像Yのレベルi−対角WP近似サブバンドと画像Yの水平サブバンドとを集計して、画像Yの水平エッジマップを生成する段階と、(b10iv)画像Yの水平エッジマップ、垂直エッジマップ、および対角エッジマップを集計する段階とを含む(b10)。
上述した方法において、画像Xおよび画像Yのレベルi−WP詳細サブバンドはさらに、それぞれの画像について、レベルi−WP水平サブバンド、レベルi−WP垂直サブバンド、およびレベルi−WP対角サブバンドを含み、段階(a10i)は、集計時に画像Xのレベルi−WP水平サブバンドを含む段階を含み(a11)、段階(a10ii)は、集計時に画像Xのレベルi−WP垂直サブバンドを含む段階を含み(b11)、段階(a10iii)は、集計時に画像Xのレベルi−WP対角サブバンドを含む段階を含み(c11)、ブバンドを含み、
段階(b10i)は、集計時に画像Yのレベルi−WP水平サブバンドを含む段階を含み(d11)、段階(b10ii)は、集計時に画像Yのレベルi−WP垂直サブバンドを含む段階を含み(e11)、段階(b10iii)は、集計時に画像Yのレベルi−WP対角サブバンドを含む段階を含む(f11)。
上述した方法において、段階(a10iv)は、(a12)平方根関数を画像Xの水平エッジマップ、垂直エッジマップ、および対角エッジマップに適用する段階と、(12ii)平方根関数を適用した結果を合計する段階とを含み(a12)、段階(b10iv)は、(12)平方根関数を画像Yの水平エッジマップ、垂直エッジマップ、および対角エッジマップに適用する段階と、(b12ii)平方根関数を適用した結果を合計する段階とを含む(b12)。
上述した方法において、段階(a10iv)は、(a13i)画像Xの水平エッジマップ、垂直エッジマップ、および対角エッジマップを合計する段階と、(a13ii)平方根関数を段階(a13i)の合計結果に適用する段階とを含み(a13)、段階(b10iv)は、(b13i)画像Yの水平エッジマップ、垂直エッジマップ、および対角エッジマップを合計する段階と、(b13ii)平方根関数を段階(b13i)の合計結果に適用する段階とを含む(b13)。
段階(a)および段階(b)は、Nレベルの離散ウェーブレット変換を適用する段階を有し、離散ウェーブレット変換は、ハール変換、ニューランド変換、またはDaubechiesフィルタを利用するウェーブレット変換であってよい。
上述した方法は、段階(a1)で、(a17i)レベル1で、画像Xに多解像度分解を適用して、レベル2における処理用に、レベル1の中間サブバンドを生成する段階と、(a17ii)2からN−1までの範囲であるレベルiで、レベルi−1で行われる多解像度分解で生成された中間サブバンドの1以上に多解像度分解を適用する段階とを実行すること(a17)、および、段階(b1)において、(b17i)レベル1で、画像Yに多解像度分解を適用して、レベル2における処理用に、レベル1の中間サブバンドを生成する段階と、(b17ii)2からN−1までの範囲であるレベルiで、レベルi−1で行われる多解像度分解で生成された中間サブバンドの1以上に多解像度分解を適用する段階とを実行すること(b17)、の1以上を実行する。
本発明の実施形態では、近似品質計測値は近似品質マップであり、エッジ品質計測値はエッジ品質マップであり、段階(g1)はさらに、(a18)画像Xおよび画像Yの近似サブバンドおよびエッジマップの画素に対応する値を、それぞれの人間の視覚システムに対する重要度に応じて割り当てることを含む、コントラストマップを生成する段階と、(b18)コントラストマップを利用して近似品質マップに重み付けされたプーリングを実行して、近似品質スコアを生成する段階と、(c18)コントラストマップを利用してエッジ品質マップに重み付けされたプーリングを実行して、エッジ品質スコアを生成する段階と、(d18)段階(b18)の近似類似度スコアを、段階(c18)のエッジ類似度スコアと組み合わせて、品質計測値を決定する段階とを有する。
本発明の実施形態では、さらに、Nを、人間の視覚システムに対して実質的なピーク応答を生成する、近似サブバンドSの最小サイズの関数として決定する段階を備える。
上述した方法において、(a20)段階(c1)は、画像Xの近似サブバンドと画像Yの近似サブバンドとに構造的類似度(SSIM)IQMを適用して、近似SSIMマップSSIMを生成する段階を有し、(b20)段階(f1)は、画像Xのエッジマップと画像Yのエッジマップとの間にSSIM IQMを適用して、近似SSIMマップSSIMを生成する段階を有し、(c20)段階(g1)は、SSIMとSSIMとを処理して、SSIMDWTを品質計測値として決定する段階を含む。
または、(a21)段階(c1)は、画像Xの近似サブバンドと画像Yの近似サブバンドとに絶対差(AD)IQMを適用して、近似ADマップADを生成する段階を有し、(b21)段階(f1)は、AD IQMを画像Xのエッジマップと画像Yのエッジマップとの間に、エッジADマップADを生成する段階を有し、(c21)段階(g1)は、ADとADとを処理して、ADDWTスコアを品質計測値として決定する段階を含む。
また他の案として、(a22)段階(c1)は、近似サブバンドと画像Yの近似サブバンドとにピーク信号対雑音比(PSNR)IQMを適用して、PSNR近似品質スコアPSNRを生成する段階を有し、(b22)段階(f1)は、画像Xのエッジマップと画像Yのエッジマップとの間にPSNR IQMを適用して、PSNRエッジ品質スコアPSNRを生成する段階を有し、(c22)段階(g1)は、PSNRとPSNRとを処理して、PSNRDWTを品質計測値として決定する段階を含む。
また別にも、(a23)段階(c1)は、近似サブバンドと画像Yの近似サブバンドとに視覚情報忠実度(VIF)IQMを適用して、VIF近似品質スコアVIFを生成する段階を有し、(b23)段階(f1)は、画像Xのエッジマップと画像Yのエッジマップとの間にVIF IQMを適用して、VIFエッジ品質スコアVIFを生成する段階を有し、(c23)段階(g1)は、VIFとVIFとを処理して、VIFDWTを品質計測値として決定する段階を含む。
(a24)段階(a2)はさらに、画像Xについて、実質的に同じ解像度を有する各レベルiについての選択された中間サブバンドと詳細サブバンドと選択する段階を有し、(b24)段階(b2)はさらに、画像Yについて、実質的に同じ解像度を有する各レベルiについての選択された中間サブバンドと詳細サブバンドと選択する段階を有する。
本発明の別の態様では、変形画像用の品質計測値を決定するためのシステムであって、画像Yと、画像Yと同じ行列数の画素を有し、変形されていない参照画像Wとの間の類似度を特徴付け、システムは、プロセッサと、コンピュータ可読命令を格納したコンピュータ可読媒体とを備え、このコンピュータ可読媒体はプロセッサにより実行されると、(a25)1、2、…i、i+1、…Nを含むNレベルの多解像度分解を画像Xに適用して、1からN−1までの範囲である各レベルiについて、レベルi+1で処理するために画像Xの中間サブバンドを生成して、レベルNについて、画像Xの主要コンテンツを含む近似サブバンドと、画像Xのエッジを含む詳細サブバンドとを生成する第1の分解ユニットと、(b25)1、2、…i、i+1、…Nを含むNレベルの多解像度分解を画像Yに適用して、1からN−1までの範囲である各レベルiについて、画像Yの中間サブバンドを生成して、レベルNについて、画像Yの主要コンテンツを含む近似サブバンドと、画像Yのエッジを含む詳細サブバンドとを生成する第2の分解ユニットと、(c25)画質メトリック(IQM)を画像Xの近似サブバンドと画像Yの近似サブバンドとに適用して、画像Xの主要コンテンツと画像Yの主要コンテンツとの間の類似度を特徴付ける近似品質計測値を生成する近似品質計測ユニットと、(d25)画像Xについて、1からN−1までの範囲であるレベルiで中間サブバンドおよび画像Xの詳細サブバンドを集計して、画像Xのエッジを特徴付ける画像Xのエッジマップを生成する第1の集計ユニットと、(e25)画像Yについて、1からN−1までの範囲であるレベルiで中間サブバンドおよび画像Yの詳細サブバンドを集計して、画像Yのエッジを特徴付ける画像Yのエッジマップを生成する第2の集計ユニットと、(f25)画像Xのエッジマップと画像Yのエッジマップとの間にIQMを適用して、画像Xのエッジと画像Yのエッジとの間の類似度を特徴付けるエッジ品質計測値を生成するエッジ品質計測ユニットと、(g25)近似品質計測値とエッジ品質計測値とを処理して品質計測値を決定する品質計測ユニットとを実現する。
上述したシステムにおいて、(a26)第1の集計ユニット(d25)はさらに、(a26i)画像Xの1からN−1までの範囲である各レベルiについての中間サブバンドと詳細サブバンドとを、品質計測値の決定で達成される精度に基づいて選択する第1の選択ユニットと、(a26ii)画像Xについて、選択された中間サブバンドおよび選択された詳細サブバンドのみを集計する第1の選択的集計ユニットとを有し、(b26)第2の集計ユニット(e1)はさらに、(b26i)画像Yの各レベルiについての中間サブバンドと詳細サブバンドとを、品質計測値の決定で達成される精度に基づいて選択する第2の選択ユニットと、(b26ii)画像Yについて、選択された中間サブバンドおよび選択された詳細サブバンドのみを集計する第2の選択的集計ユニットとを有する。
上述したシステムにおいて、(a27)第1の集計ユニット(a26i)はさらに、画像Xについて、各レベルiについて中間サブバンドと詳細サブバンドとを、精度を達成するために必要な中間サブバンドおよび詳細サブバンド数に基づいて選択する第1の選択サブユニットをさらに有し、(b27)第1の集計ユニット(b26i)はさらに、画像Xについて、各レベルiについて中間サブバンドと詳細サブバンドとを、精度を達成するために必要な中間サブバンドおよび詳細サブバンド数に基づいて選択する第1の選択サブユニットをさらに有する。
上述したシステムにおいて、第1の選択的集計ユニット(a26ii)において、(a28i)画像Xの選択した中間サブバンドを各レベルiについて集計して、画像Xのレベルiのエッジマップを生成する第1のレベル−中間サブバンド集計ユニットと、(a28ii)画像Xの選択した詳細サブバンドを集計して、画像XのレベルNのエッジマップを生成する第1の詳細サブバンド集計ユニットと、(a28iii)画像Xの各レベルiのエッジマップを、画像XのレベルNのエッジマップと集計する第1のエッジマップ決定ユニットとを含み(a28)、第2の選択的集計ユニット(b26ii)において、(b28i)画像Yの選択した中間サブバンドを各レベルiについて集計して、画像Yのレベルiのエッジマップを生成する第2のレベル−中間サブバンド集計ユニットと、(b28ii)画像Yの選択した詳細サブバンドを集計して、画像YのレベルNのエッジマップを生成する第2の詳細サブバンド集計ユニットと、(b28iii)画像Yの各レベルiのエッジマップを、画像YのレベルNのエッジマップと集計する第2のエッジマップ決定ユニットとを含む(b28)。
上述したシステムにおいて、(a29)第1のエッジマップ決定ユニット(a28iii)はさらに、画像Xの各レベルiのエッジマップを、レベルiの所定の重みで乗算して、画像XのレベルNのエッジマップを、レベルNの所定の重みで乗算して、画像Xの各レベルのエッジマップを乗算した結果と、画像XのレベルNのエッジマップを乗算した結果とを合計する第1の計算ユニットを含み、(b29)第2のエッジマップ決定ユニット(b28iii)はさらに、画像Yの各レベルiのエッジマップを、レベルiの所定の重みで乗算して、画像YのレベルNのエッジマップを、レベルNの所定の重みで乗算して、画像Yの各レベルのエッジマップを乗算した結果と、画像YのレベルNのエッジマップを乗算した結果とを合計する第2の計算ユニットを含む。
上述したシステムでは、(a30)第1レベルのi−中間サブバンド集計ユニット(a28i)は、各レベルiで画像Xについて各選択された中間サブバンドを二乗して、画像Xについて各選択された中間サブバンドについて所定の重みで、二乗結果を乗算して、乗算の結果得られた積を合計して、平方根関数を合計結果に適用して、画像Xのレベルiのエッジマップを生成する第1レベルi計算ユニットを含み、(b30)第1詳細サブバンド集計ユニット(a28i)は、画像Xについて各選択された詳細サブバンドを二乗して、画像Xについて各選択された詳細サブバンドについて所定の重みで、二乗結果を乗算して、乗算の結果得られた積を合計して、平方根関数を合計結果に適用して、画像XのレベルNのエッジマップを生成する第1詳細サブバンド計算ユニットを含み、(c30)第2レベルのi−中間サブバンド集計ユニット(b28i)は、各レベルiで画像Yについて各選択された中間サブバンドを二乗して、画像Yについて各選択された中間サブバンドについて所定の重みで、二乗結果を乗算して、乗算の結果得られた積を合計して、平方根関数を合計結果に適用して、画像Yのレベルiのエッジマップを生成する第2レベルi計算ユニットを含み、(d30)第2詳細サブバンド集計ユニット(b28i)は、画像Yについて各選択された詳細サブバンドを二乗して、画像Yについて各選択された詳細サブバンドについて所定の重みで、二乗結果を乗算して、乗算の結果得られた積を合計して、平方根関数を合計結果に適用して、画像YのレベルNのエッジマップを生成する第2詳細サブバンド計算ユニットを含む。上述したシステムでは、画像Xおよび画像Yの各レベルiについての中間サブバンドは、各画像において、レベルi−詳細サブバンドおよびレベルi−ウェーブレットパケット(WP)サブバンドを含み、レベルi−WPサブバンドは、レベルi−WP近似サブバンドおよびレベルi−WP詳細サブバンドを含み、レベルi−WP近似サブバンドはさらに、レベルi−水平WP近似サブバンドとレベルi−垂直WP近似サブバンドと、レベルi−対角WP近似サブバンドとを含む。
上述したシステムでは、第1の選択ユニット(a26i)はさらに、画像Xの1以上のレベルi−WP近似サブバンドと1以上の詳細サブバンドとを選択する第1のWP−詳細選択サブユニットをさらに有し(a32)第2の選択ユニット(b26i)はさらに、画像Yの1以上のレベルi−WP近似サブバンドと1以上の詳細サブバンドとを選択する第2のWP−詳細選択サブユニットをさらに有する(b32)。
上述したシステムでは、(a33)第1のWP−詳細選択サブユニット(a32)はさらに、選択において画像Xの1以上のレベルi−詳細サブバンドを含む第1の詳細−選択モジュールを含み、(b33)第2のWP−詳細選択サブユニット(b32)はさらに、選択において画像Yの1以上のレベルi−詳細サブバンドを含む第2の詳細−選択モジュールを含む。
上述したシステムでは、第1の選択的集計ユニット(a26ii)はさらに、(a34i)各レベルiで画像Xのレベルi−水平WP近似サブバンドと画像Xの水平サブバンドとを集計して、画像Xの水平エッジマップを生成する第1の水平エッジマップユニットと、(a34ii)各レベルiで画像Xのレベルi−垂直WP近似サブバンドと画像Xの水平サブバンドとを集計して、画像Xの水平エッジマップを生成する第1の垂直エッジマップユニットと、(a34iii)各レベルiで画像Xのレベルi−対角WP近似サブバンドと画像Xの水平サブバンドとを集計して、画像Xの水平エッジマップを生成する第1の対角エッジマップユニットと、(a34iv)画像Xの水平エッジマップ、垂直エッジマップ、および対角エッジマップを集計する第1の合成ユニットとを含み(a34)、(b34)第2の選択的集計ユニット(b26ii)はさらに、(b34i)各レベルiで画像Yのレベルi−水平WP近似サブバンドと画像Yの水平サブバンドとを集計して、画像Yの水平エッジマップを生成する第2の水平エッジマップユニットと、(b34ii)各レベルiで画像Yのレベルi−垂直WP近似サブバンドと画像Yの水平サブバンドとを集計して、画像Yの水平エッジマップを生成する第2の垂直エッジマップユニットと、(b34iii)各レベルiで画像Yのレベルi−対角WP近似サブバンドと画像Yの水平サブバンドとを集計して、画像Yの水平エッジマップを生成する第2の対角エッジマップユニットと、(b34iv)画像Yの水平エッジマップ、垂直エッジマップ、および対角エッジマップを集計する第2の合成ユニットとを含む(b34)。
上述したシステムでは、画像Xおよび画像Yのレベルi−WP詳細サブバンドはさらに、それぞれの画像について、レベルi−WP水平サブバンド、レベルi−WP垂直サブバンド、およびレベルi−WP対角サブバンドを含み、第1の水平エッジマップユニット(a34i)は、集計時に画像Xのレベルi−WP水平サブバンドを含む第1の水平サブユニットを含み(a35)、第1の垂直エッジマップユニット(a34ii)は、集計時に画像Xのレベルi−WP垂直サブバンドを含む第1の垂直サブユニットを含み(b35)、第1の対角エッジマップユニット(a34iii)は、集計時に画像Xのレベルi−WP対角サブバンドを含む第1の対角サブユニットを含み(c35)、第2の水平エッジマップユニット(b34i)は、集計時に画像Yのレベルi−WP水平サブバンドを含む第2の水平サブユニットを含み(d35)、第2の垂直エッジマップユニット(b34ii)は、集計時に画像Yのレベルi−WP垂直サブバンドを含む第2の垂直サブユニットを含み(e35)、第2の対角エッジマップユニット(b34iii)は、集計時に画像Yのレベルi−WP対角サブバンドを含む第2の対角サブユニットを含む(f35)。
上述したシステムでは、(a36)第1の合成ユニット(a34iv)が、平方根関数を画像Xの水平エッジマップ、垂直エッジマップ、および対角エッジマップに適用して、平方根関数を適用した結果を合計する第1の合成サブユニットを含み、(b36)第1の合成ユニット(b34iv)が、平方根関数を画像Yの水平エッジマップ、垂直エッジマップ、および対角エッジマップに適用して、平方根関数を適用した結果を合計する第2の合成サブユニットを含む。
上述したシステムでは、(a37)第1の合成ユニット(a34iv)は、画像Xの水平エッジマップ、垂直エッジマップ、および対角エッジマップを合計して、平方根関数を合計結果に適用する第3の合成サブユニットを含み、(b37)第2の合成ユニット(b34iv)は、画像Yの水平エッジマップ、垂直エッジマップ、および対角エッジマップを合計して、平方根関数を合計結果に適用する第4の合成サブユニットを含む。
上述したシステムでは、第1の分解ユニット(a1)および第2の分解ユニット(b1)は、Nレベルの離散ウェーブレット変換を適用する計算手段を有する。
上述したシステムでは、離散ウェーブレット変換は、ハール変換であってよい。または、離散ウェーブレット変換は、ニューランド変換、またはDaubechiesフィルタを利用するウェーブレット変換であってもよい。
本発明の実施形態によるシステムは、(a41)第1の分解ユニット(a25)において、(a41i)レベル1で、画像Xに多解像度分解を適用して、レベル2における処理用に、レベル1の中間サブバンドを生成する第1のレベル1分解ユニット、および、(a41ii)2からN−1までの範囲であるレベルiで、レベルi−1で行われる多解像度分解で生成された中間サブバンドの1以上に多解像度分解を適用する第1のレベルi分解ユニット、ならびに、(b41)第2の分解ユニット(b25)において、(b41i)レベル1で、画像Yに多解像度分解を適用して、レベル2における処理用に、レベル1の中間サブバンドを生成する第2のレベル1分解ユニット、および、(b41ii)2からN−1までの範囲であるレベルiで、レベルi−1で行われる多解像度分解で生成された中間サブバンドの1以上に多解像度分解を適用する第2のレベルi分解ユニット、の1以上を含んでよい。
上述したシステムにおいては、近似品質計測値は近似品質マップであり、エッジ品質計測値はエッジ品質マップであり、品質計測ユニット(g25)はさらに、(a42)画像Xおよび画像Yの近似サブバンドおよびエッジマップの画素に対応する値を、それぞれの人間の視覚システムに対する重要度に応じて割り当てることを含む、コントラストマップを生成するコントラストマップユニットと、(b42)コントラストマップを利用して近似品質マップに重み付けされたプーリングを実行して、近似品質スコアを生成する第1のプーリングユニットと、(c42)コントラストマップを利用してエッジ品質マップに重み付けされたプーリングを実行して、エッジ品質スコアを生成する第2のプーリングユニットと、(d42)第1のプーリングユニット(b42)の近似類似度スコアを、第2のプーリングユニット(c42)のエッジ類似度スコアと組み合わせて、品質計測値を決定するスコア合成ユニットとを有する。

本発明のシステムは、さらに、Nを、人間の視覚システムに対して実質的なピーク応答を生成する、近似サブバンドSの最小サイズの関数として決定する計算手段も含んでよい。
本発明の実施形態のシステムでは、(a44)近似品質計測ユニット(c25)は、画像Xの近似サブバンドと画像Yの近似サブバンドとに構造的類似度(SSIM)IQMを適用して、近似SSIMマップSSIMを生成する近似SSIMマップユニットを有し、(b44)エッジ品質計測ユニット(f25)は、画像Xのエッジマップと画像Yのエッジマップとの間にSSIM IQMを適用して、近似SSIMマップSSIMを生成するエッジSSIMマップユニットを有し、(c44)品質計測ユニット(g25)は、SSIMとSSIMとを処理して、SSIMDWTを品質計測値として決定するSSIMDWTスコアユニットを含む。
上述したシステムではまた、(a45)近似品質計測ユニット(c25)は、画像Xの近似サブバンドと画像Yの近似サブバンドとに絶対差(AD)IQMを適用して、近似ADマップADを生成する近似ADマップユニットを有し、(b45)エッジ品質計測ユニット(f25)は、AD IQMを画像Xのエッジマップと画像Yのエッジマップとの間に、エッジADマップADを生成するエッジADマップユニットを有し、(c45)品質計測ユニット(g25)は、ADとADとを処理して、ADDWTスコアを品質計測値として決定するADDWTスコアユニットを含む。
または、(a46)近似品質計測ユニット(c25)は、近似サブバンドと画像Yの近似サブバンドとにピーク信号対雑音比(PSNR)IQMを適用して、PSNR近似品質スコアPSNRを生成するPSNR近似品質スコアユニットを有し、(b46)エッジ品質計測ユニット(f25)は、画像Xのエッジマップと画像Yのエッジマップとの間にPSNR IQMを適用して、PSNRエッジ品質スコアPSNRを生成するPSNRエッジ品質スコア決定ユニットを有し、(c46)品質計測ユニット(g25)は、PSNRとPSNRとを処理して、PSNRDWTを品質計測値として決定するPSNRDWTスコアユニットを含んでもよい。
また別の案としては、(a47)近似品質計測ユニット(c25)は、近似サブバンドと画像Yの近似サブバンドとに視覚情報忠実度(VIF)IQMを適用して、VIF近似品質スコアVIFを生成するVIF近似品質スコアユニットを有し、(b47)エッジ品質計測ユニット(f25)は、画像Xのエッジマップと画像Yのエッジマップとの間にVIF IQMを適用して、VIFエッジ品質スコアVIFを生成するVIFエッジ品質スコアユニットを有し、(c47)品質計測ユニット(g25)は、VIFとVIFとを処理して、VIFDWTを品質計測値として決定するVIFDWTスコアユニットを含む。
また別の案としては、(a48)第1の集計ユニット(a26)はさらに、画像Xについて、実質的に同じ解像度を有する各レベルiについての選択された中間サブバンドと詳細サブバンドと選択する計算手段を有し、(b48)第2の集計ユニット(b26)はさらに、画像Yについて、実質的に同じ解像度を有する各レベルiについての選択された中間サブバンドと詳細サブバンドと選択する計算手段を有する。
本発明のまた別の態様では、コンピュータ可読プログラムコード命令が格納されたコンピュータ可読格納媒体であって、コンピュータ可読プログラムコード命令は、プロセッサにより実行されると、(a49)1、2、…i、i+1、…Nを含むNレベルの多解像度分解を画像Xに適用して、1からN−1までの範囲である各レベルiについて、レベルi+1で処理するために画像Xの中間サブバンドを生成して、レベルNについて、画像Xの主要コンテンツを含む近似サブバンドと、画像Xのエッジを含む詳細サブバンドとを生成する段階と、(b49)1、2、…i、i+1、…Nを含むNレベルの多解像度分解を画像Yに適用して、1からN−1までの範囲である各レベルiについて、レベルi+1で処理するために画像Yの中間サブバンドを生成して、レベルNについて、画像Yの主要コンテンツを含む近似サブバンドと、画像Yのエッジを含む詳細サブバンドとを生成する段階と、(c49)画質メトリック(IQM)を画像Xの近似サブバンドと画像Yの近似サブバンドとに適用して、画像Xの主要コンテンツと画像Yの主要コンテンツとの間の類似度を特徴付ける近似品質計測値を生成する段階と、(d49)画像Xについて、1からN−1までの範囲であるレベルiで中間サブバンドおよび画像Xの詳細サブバンドを集計して、画像Xのエッジを特徴付ける画像Xのエッジマップを生成する段階と、(e49)画像Yについて、1からN−1までの範囲であるレベルiで中間サブバンドおよび画像Yの詳細サブバンドを集計して、画像Yのエッジを特徴付ける画像Yのエッジマップを生成する段階と、(f49)画像Xのエッジマップと画像Yのエッジマップとの間にIQMを適用して、画像Xのエッジと画像Yのエッジとの間の類似度を特徴付けるエッジ品質計測値を生成する段階と、(g49)近似品質計測値とエッジ品質計測値とを処理して品質計測値を決定する段階とを実行させるコンピュータ可読格納媒体が提供される。
本発明の実施形態を詳細に記載してきたが、当業者には、以下の請求項の範囲内で本実施形態に変形および変更を行うことが可能であることが明らかである。

Claims (17)

  1. 変形画像Y用の品質計測値を決定するための方法であって、前記画像Yと、前記画像Yと同じ行列数の画素を有し、変形されていない参照画像Xとの間の類似度を特徴付け、
    (a)レベル1、2、…i、i+1、…Nを含むNレベルの多解像度分解を画像Xに適用して、
    1からN−1までの範囲である各レベルiについて、レベルi+1で処理するために前記画像Xの中間サブバンドを生成して、
    レベルNについて、前記画像Xの主要コンテンツを含む近似サブバンドと、前記画像Xのエッジを含む詳細サブバンドとを生成する段階と、
    (b)1、2、…i、i+1、…Nを含むNレベルの多解像度分解を前記画像Yに適用して、
    1からN−1までの範囲である各レベルiについて、レベルi+1で処理するために前記画像Yの中間サブバンドを生成して、
    前記レベルNについて、前記画像Yの主要コンテンツを含む近似サブバンドと、前記画像Yのエッジを含む詳細サブバンドとを生成する段階と、
    (c)画質メトリック(IQM)を前記画像Xの前記近似サブバンドと前記画像Yの前記近似サブバンドとに適用して、前記画像Xの前記主要コンテンツと前記画像Yの前記主要コンテンツとの間の類似度を特徴付ける近似品質計測値を生成する段階と、
    (d)前記画像Xについての1からN−1までの範囲である前記レベルiの前記中間サブバンドおよび前記画像Xの前記詳細サブバンドを集計して、前記画像Xの前記エッジを特徴付ける前記画像Xのエッジマップを生成する段階と、
    (e)前記画像Yについての1からN−1までの範囲である前記レベルiの前記中間サブバンドおよび前記画像Yの前記詳細サブバンドを集計して、前記画像Yの前記エッジを特徴付ける前記画像Yのエッジマップを生成する段階と、
    (f)前記画像Xの前記エッジマップと前記画像Yの前記エッジマップとの間に前記IQMを適用して、前記画像Xの前記エッジと前記画像Yの前記エッジとの間の類似度を特徴付けるエッジ品質計測値を生成する段階と、
    (g)前記近似品質計測値と前記エッジ品質計測値とを処理して前記品質計測値を決定する段階と
    を備える方法。
  2. 前記段階(d)はさらに、
    前記画像Xの1からN−1までの範囲である各レベルiについての前記中間サブバンドと前記詳細サブバンドとを、前記品質計測値の決定で達成される精度に基づいて選択する段階と、
    前記画像Xについて、選択された中間サブバンドおよび選択された詳細サブバンドのみを集計する段階と
    を有し、
    前記段階(e)はさらに、
    前記画像Yの前記各レベルiについての前記中間サブバンドと前記詳細サブバンドとを、前記品質計測値の決定で達成される前記精度に基づいて選択する段階と、
    前記画像Yについて、選択された中間サブバンドおよび選択された詳細サブバンドのみを集計する段階と
    を有する請求項1に記載の方法。
  3. 前記画像Xについて前記中間サブバンドおよび前記詳細サブバンドを選択する段階はさらに、前記画像Xについて、じ解像度を有する前記各レベルiについての前記選択された中間サブバンドと前記詳細サブバンドと選択する段階を有し、
    前記画像Yについて前記中間サブバンドおよび前記詳細サブバンドを選択する段階はさらに、前記画像Yについて、じ解像度を有する前記各レベルiについての前記選択された中間サブバンドと前記詳細サブバンドと選択する段階を有する請求項2に記載の方法。
  4. 前記画像Xおよび前記画像Yの前記各レベルiについての前記中間サブバンドは、各画像において、レベルi−詳細サブバンドおよびレベルi−ウェーブレットパケット(WP)サブバンドを含み、
    前記レベルi−WPサブバンドは、レベルi−WP近似サブバンドおよびレベルi−WP詳細サブバンドを含み、
    前記レベルi−WP近似サブバンドはさらに、レベルi−水平WP近似サブバンドとレベルi−垂直WP近似サブバンドと、レベルi−対角WP近似サブバンドとを含む請求項2または3に記載の方法。
  5. 前記段階(a)において、
    レベル1で、前記画像Xに前記多解像度分解を適用して、レベル2における処理用に、レベル1の中間サブバンドを生成する段階と、
    2からNまでの範囲であるレベルiで、レベルi−1で行われる前記多解像度分解で生成された前記中間サブバンドの1以上に前記多解像度分解を適用する段階とを実行すること、および、
    前記段階(b)において、
    レベル1で、前記画像Yに前記多解像度分解を適用して、レベル2における処理用に、前記レベル1の中間サブバンドを生成する段階と、
    2からN−1までの範囲であるレベルiで、レベルi−1で行われる前記多解像度分解で生成された前記中間サブバンドの1以上に前記多解像度分解を適用する段階とを実行すること、の1以上を実行する請求項1から4のいずれか一項に記載の方法。
  6. 前記近似品質計測値は近似品質マップであり、前記エッジ品質計測値はエッジ品質マップであり、
    前記段階(g)はさらに、
    前記画像Xおよび前記画像Yの前記近似サブバンドおよび前記エッジマップの前記画素に対応する値を、それぞれの人間の視覚システムに対する重要度に応じて割り当てることを含む、コントラストマップを生成する段階と、
    前記コントラストマップを利用して前記近似品質マップに重み付けされたプーリングを実行して、近似品質スコアを生成する段階と、
    前記コントラストマップを利用して前記エッジ品質マップに重み付けされたプーリングを実行して、エッジ品質スコアを生成する段階と、
    前記近似品質スコアを、エッジ類似度スコアと組み合わせて、前記品質計測値を決定する段階とを有する請求項1から5のいずれか一項に記載の方法。
  7. Nを、人間の視覚システムに対してーク応答を生成する、近似サブバンドSの最小サイズの関数として決定する段階をさらに備える請求項1から6のいずれか一項に記載の方法。
  8. 前記段階(c)は、前記画像Xの前記近似サブバンドと前記画像Yの前記近似サブバンドとに構造的類似度(SSIM)IQMを適用して、近似SSIMマップSSIMを生成する段階を有し、
    前記段階(f)は、前記画像Xの前記エッジマップと前記画像Yの前記エッジマップとの間にSSIM IQMを適用して、エッジSSIMマップSSIMを生成する段階を有し、
    前記段階(g)は、前記SSIMと前記SSIMとを処理して、SSIMDWTスコアを前記品質計測値として決定する段階を含む、または、
    前記段階(c)は、前記画像Xの前記近似サブバンドと前記画像Yの前記近似サブバンドとに絶対差(AD)IQMを適用して、近似ADマップADを生成する段階を有し、
    前記段階(f)は、前記画像Xの前記エッジマップと前記画像Yの前記エッジマップとの間に前記AD IQMを適用して、エッジADマップADを生成する段階を有し、
    前記段階(g)は、前記ADと前記ADとを処理して、ADDWTスコアを前記品質計測値として決定する段階を含む、または、
    前記段階(c)は、前記画像Xの前記近似サブバンドと前記画像Yの前記近似サブバンドとにピーク信号対雑音比(PSNR)IQMを適用して、PSNR近似品質スコアPSNRを生成する段階を有し、
    前記段階(f)は、前記画像Xの前記エッジマップと前記画像Yの前記エッジマップとの間にPSNR IQMを適用して、PSNRエッジ品質スコアPSNRを生成する段階を有し、
    前記段階(g)は、前記PSNRと前記PSNRとを処理して、PSNRDWTスコアを前記品質計測値として決定する段階を含む、または、
    前記段階(c)は、前記画像Xの前記近似サブバンドと前記画像Yの前記近似サブバンドとに視覚情報忠実度(VIF)IQMを適用して、VIF近似品質スコアVIFを生成する段階を有し、
    前記段階(f)は、前記画像Xの前記エッジマップと前記画像Yの前記エッジマップとの間にVIF IQMを適用して、VIFエッジ品質スコアVIFを生成する段階を有し、
    前記段階(g)は、前記VIFと前記VIFとを処理して、VIFDWTスコアを前記品質計測値として決定する段階を含む請求項1から7のいずれか一項に記載の方法。
  9. 前記段階(a)および前記段階(b)は、Nレベルの離散ウェーブレット変換を適用する段階を有し、前記離散ウェーブレット変換は、ハール変換、ニューランド変換、またはDaubechiesフィルタを利用するウェーブレット変換であってよい請求項1から8のいずれか一項に記載の方法。
  10. 変形画像Y用の品質計測値を決定するためのシステムであって、前記画像Yと、前記画像Yと同じ行列数の画素を有し、変形されていない参照画像Wとの間の類似度を特徴付け、
    プロセッサと、コンピュータ可読命令が格納されたコンピュータ可読格納媒体とを備え、前記コンピュータ可読命令は前記プロセッサにより実行されると、
    (a)1、2、…i、i+1、…Nを含むNレベルの多解像度分解を画像Xに適用して、
    1からN−1までの範囲である各レベルiについて、レベルi+1で処理するために画像Xの中間サブバンドを生成して、
    レベルNについて、前記画像Xの主要コンテンツを含む近似サブバンドと、前記画像Xのエッジを含む詳細サブバンドとを生成する第1の分解ユニットと、
    (b)1、2、…i、i+1、…Nを含むNレベルの多解像度分解を前記画像Yに適用して、
    1からN−1までの範囲である各レベルiについて、前記画像Yの中間サブバンドを生成して、
    前記レベルNについて、前記画像Yの主要コンテンツを含む近似サブバンドと、前記画像Yのエッジを含む詳細サブバンドとを生成する第2の分解ユニットと、
    (c)画質メトリック(IQM)を前記画像Xの前記近似サブバンドと前記画像Yの前記近似サブバンドとに適用して、前記画像Xの前記主要コンテンツと前記画像Yの前記主要コンテンツとの間の類似度を特徴付ける近似品質計測値を生成する近似品質計測ユニットと、
    (d)前記画像Xについての1からN−1までの範囲である前記レベルiの前記中間サブバンドおよび前記画像Xの前記詳細サブバンドを集計して、前記画像Xの前記エッジを特徴付ける前記画像Xのエッジマップを生成する第1の集計ユニットと、
    (e)前記画像Yについての1からN−1までの範囲である前記レベルiの前記中間サブバンドおよび前記画像Yの前記詳細サブバンドを集計して、前記画像Yの前記エッジを特徴付ける前記画像Yのエッジマップを生成する第2の集計ユニットと、
    (f)前記画像Xの前記エッジマップと前記画像Yの前記エッジマップとの間に前記IQMを適用して、前記画像Xの前記エッジと前記画像Yの前記エッジとの間の類似度を特徴付けるエッジ品質計測値を生成するエッジ品質計測ユニットと、
    (g)前記近似品質計測値と前記エッジ品質計測値とを処理して前記品質計測値を決定する品質計測ユニットと
    を形成するシステム。
  11. 前記第1の集計ユニットはさらに、
    前記画像Xの1からN−1までの範囲である各レベルiについての前記中間サブバンドと前記詳細サブバンドとを、前記品質計測値の決定で達成される精度に基づいて選択する第1の選択ユニットと、
    前記画像Xについて、選択された中間サブバンドおよび選択された詳細サブバンドのみを集計する第1の選択的集計ユニットとを有し、
    前記第2の集計ユニットはさらに、
    前記画像Yの前記各レベルiについての前記中間サブバンドと前記詳細サブバンドとを、前記品質計測値の決定で達成される精度に基づいて選択する第2の選択ユニットと、
    前記画像Yについて、選択された中間サブバンドおよび選択された詳細サブバンドのみを集計する第2の選択的集計ユニットとを有する請求項10に記載のシステム。
  12. 前記第1の集計ユニットはさらに、前記画像Xについて、じ解像度を有する前記各レベルiについての前記選択された中間サブバンドと前記詳細サブバンドと選択する計算手段を有し、
    前記第2の集計ユニットはさらに、前記画像Yについて、じ解像度を有する前記各レベルiについての前記選択された中間サブバンドと前記詳細サブバンドと選択する計算手段を有する請求項11に記載のシステム。
  13. 前記画像Xおよび前記画像Yの前記各レベルiについての前記中間サブバンドは、各画像において、レベルi−詳細サブバンドおよびレベルi−ウェーブレットパケット(WP)サブバンドを含み、
    前記レベルi−WPサブバンドは、レベルi−WP近似サブバンドおよびレベルi−WP詳細サブバンドを含み、
    前記レベルi−WP近似サブバンドはさらに、レベルi−水平WP近似サブバンドとレベルi−垂直WP近似サブバンドと、レベルi−対角WP近似サブバンドとを含む請求項11または12に記載のシステム。
  14. 前記第1の分解ユニットにおいて、
    前記画像Xに前記多解像度分解を適用して、レベル2における処理用に、レベル1の中間サブバンドを生成する第1のレベル1分解ユニット、および、
    2からNまでの範囲であるレベルiで、レベルi−1で行われる前記多解像度分解で生成された前記中間サブバンドの1以上に前記多解像度分解を適用する第1のレベルi分解ユニット、並びに、
    前記第2の分解ユニットにおいて、
    前記画像Yに前記多解像度分解を適用して、レベル2における処理用に、レベル1の中間サブバンドを生成する第2のレベル1分解ユニット、および、
    2からN−1までの範囲である前記レベルiで、レベルi−1で行われる前記多解像度分解で生成された前記中間サブバンドの1以上に前記多解像度分解を適用する第2のレベルi分解ユニット、の1以上が含まれる請求項10から13のいずれか一項に記載のシステム。
  15. Nを、人間の視覚システムに対してーク応答を生成する、近似サブバンドSの最小サイズの関数として決定する計算手段をさらに備える請求項10から14のいずれか一項に記載のシステム。
  16. 前記第1の分解ユニット(a)および前記第2の分解ユニット(b)は、Nレベルの離散ウェーブレット変換を適用する計算手段を有し、前記離散ウェーブレット変換は、ハール変換、ニューランド変換、またはDaubechiesフィルタを利用するウェーブレット変換であってよい請求項10から15のいずれか一項に記載のシステム。
  17. コンピュータに、
    (a)1、2、…i、i+1、…Nを含むNレベルの多解像度分解を画像Xに適用して、
    1からN−1までの範囲である各レベルiについて、レベルi+1で処理するために画像Xの中間サブバンドを生成して、
    レベルNについて、前記画像Xの主要コンテンツを含む近似サブバンドと、前記画像Xのエッジを含む詳細サブバンドとを生成する段階と、
    (b)1、2、…i、i+1、…Nを含むNレベルの多解像度分解を画像Yに適用して、
    1からN−1までの範囲である各レベルiについて、レベルi+1で処理するために前記画像Yの中間サブバンドを生成して、
    前記レベルNについて、前記画像Yの主要コンテンツを含む近似サブバンドと、前記画像Yのエッジを含む詳細サブバンドとを生成する段階と、
    (c)画質メトリック(IQM)を前記画像Xの前記近似サブバンドと前記画像Yの前記近似サブバンドとに適用して、前記画像Xの前記主要コンテンツと前記画像Yの前記主要コンテンツとの間の類似度を特徴付ける近似品質計測値を生成する段階と、
    (d)前記画像Xについての1からN−1までの範囲である前記レベルiの前記中間サブバンドおよび前記画像Xの前記詳細サブバンドを集計して、前記画像Xの前記エッジを特徴付ける前記画像Xのエッジマップを生成する段階と、
    (e)前記画像Yについての1からN−1までの範囲である前記レベルiの前記中間サブバンドおよび前記画像Yの前記詳細サブバンドを集計して、前記画像Yの前記エッジを特徴付ける前記画像Yのエッジマップを生成する段階と、
    (f)前記画像Xの前記エッジマップと前記画像Yの前記エッジマップとの間に前記IQMを適用して、前記画像Xの前記エッジと前記画像Yの前記エッジとの間の類似度を特徴付けるエッジ品質計測値を生成する段階と、
    (g)前記近似品質計測値と前記エッジ品質計測値とを処理して前記品質計測値を決定する段階と
    を実行させるためのプログラム
JP2012552211A 2010-02-12 2010-10-27 画像のマルチレベル分解を利用して画質計測値を決定する方法およびシステム Active JP5510688B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US30427410P 2010-02-12 2010-02-12
US61/304,274 2010-02-12
US12/906,112 2010-10-17
US12/906,112 US8515182B2 (en) 2009-02-11 2010-10-17 Method and system for determining a quality measure for an image using multi-level decomposition of images
PCT/CA2010/001705 WO2011097697A1 (en) 2010-02-12 2010-10-27 Method and system for determining a quality measure for an image using multi-level decomposition of images

Publications (3)

Publication Number Publication Date
JP2013520037A JP2013520037A (ja) 2013-05-30
JP2013520037A5 JP2013520037A5 (ja) 2013-09-26
JP5510688B2 true JP5510688B2 (ja) 2014-06-04

Family

ID=44367076

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012552211A Active JP5510688B2 (ja) 2010-02-12 2010-10-27 画像のマルチレベル分解を利用して画質計測値を決定する方法およびシステム

Country Status (8)

Country Link
US (2) US8515182B2 (ja)
EP (1) EP2534639A4 (ja)
JP (1) JP5510688B2 (ja)
KR (1) KR101664913B1 (ja)
CN (1) CN102754126B (ja)
CA (1) CA2783879C (ja)
IL (1) IL220737A (ja)
WO (1) WO2011097697A1 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8515181B2 (en) 2009-02-11 2013-08-20 Ecole De Technologie Superieure Method and system for determining a quality measure for an image using a variable number of multi-level decompositions
US8326046B2 (en) * 2009-02-11 2012-12-04 Ecole De Technologie Superieure Method and system for determining structural similarity between images
US8515182B2 (en) 2009-02-11 2013-08-20 Ecole De Technologie Superieure Method and system for determining a quality measure for an image using multi-level decomposition of images
KR101092650B1 (ko) * 2010-01-12 2011-12-13 서강대학교산학협력단 양자화 코드를 이용한 화질 평가 방법 및 장치
US8792748B2 (en) 2010-10-12 2014-07-29 International Business Machines Corporation Deconvolution of digital images
US8983206B2 (en) * 2011-05-04 2015-03-17 Ecole de Techbologie Superieure Method and system for increasing robustness of visual quality metrics using spatial shifting
US8525883B2 (en) * 2011-09-02 2013-09-03 Sharp Laboratories Of America, Inc. Methods, systems and apparatus for automatic video quality assessment
JP5385487B1 (ja) * 2012-02-29 2014-01-08 独立行政法人科学技術振興機構 スーパーハイブリッド画像生成装置、スーパーハイブリッド画像生成方法、印刷媒体製造方法、電子媒体製造方法、および、プログラム
CN102930545A (zh) * 2012-11-07 2013-02-13 复旦大学 一种图像质量盲评估的统计测度方法
EP2979244B1 (en) * 2013-03-28 2018-02-21 Thomson Licensing Method and apparatus of creating a perceptual harmony map
CN103258326B (zh) * 2013-04-19 2016-03-30 复旦大学 一种图像质量盲评估的信息保真度方法
CN103218815B (zh) * 2013-04-19 2016-03-30 复旦大学 利用自然场景统计计算图像显著图的方法
US9350916B2 (en) 2013-05-28 2016-05-24 Apple Inc. Interleaving image processing and image capture operations
US9491360B2 (en) 2013-06-06 2016-11-08 Apple Inc. Reference frame selection for still image stabilization
US9262684B2 (en) 2013-06-06 2016-02-16 Apple Inc. Methods of image fusion for image stabilization
US9384552B2 (en) 2013-06-06 2016-07-05 Apple Inc. Image registration methods for still image stabilization
US20150071547A1 (en) 2013-09-09 2015-03-12 Apple Inc. Automated Selection Of Keeper Images From A Burst Photo Captured Set
CN103793912B (zh) * 2014-01-27 2016-08-17 武汉大学 一种基于解译能力等级的光学遥感影像图像质量评价方法
US20170249521A1 (en) * 2014-05-15 2017-08-31 Arris Enterprises, Inc. Automatic video comparison of the output of a video decoder
US11064204B2 (en) 2014-05-15 2021-07-13 Arris Enterprises Llc Automatic video comparison of the output of a video decoder
US20150334386A1 (en) * 2014-05-15 2015-11-19 Arris Enterprises, Inc. Automatic video comparison of the output of a video decoder
CN104899893B (zh) * 2015-07-01 2019-03-19 电子科技大学 基于视觉注意力的图像质量检测方法
CN105100789B (zh) * 2015-07-22 2018-05-15 天津科技大学 一种视频质量评价方法
US10499056B2 (en) * 2016-03-09 2019-12-03 Sony Corporation System and method for video processing based on quantization parameter
CN107578399B (zh) * 2017-07-25 2020-12-15 天津大学 基于边界特征分割的全参考图像质量评价方法
CN108765414B (zh) * 2018-06-14 2021-12-03 上海大学 基于小波分解和自然场景统计的无参考立体图像质量评价方法
CN109344629B (zh) * 2018-09-19 2021-04-23 湖北工程学院 图像加密隐藏方法及装置、图像解密方法及装置
US11205257B2 (en) * 2018-11-29 2021-12-21 Electronics And Telecommunications Research Institute Method and apparatus for measuring video quality based on detection of change in perceptually sensitive region
KR102401340B1 (ko) * 2018-11-29 2022-05-25 한국전자통신연구원 인지 민감 영역의 변화의 검출에 기반하는 비디오 화질 측정 방법 및 장치
US11120536B2 (en) 2018-12-12 2021-09-14 Samsung Electronics Co., Ltd Apparatus and method for determining image sharpness
KR102235723B1 (ko) * 2019-05-30 2021-04-01 주식회사 에이치엔티메디칼 X-ray 장치의 영상 품질 진단 방법
US11756197B2 (en) 2021-03-10 2023-09-12 GE Precision Healthcare LLC Systems and methods of processing magnetic resonance images using phase-sensitive structural similarity index measure

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6005978A (en) 1996-02-07 1999-12-21 Cognex Corporation Robust search for image features across image sequences exhibiting non-uniform changes in brightness
US5799112A (en) 1996-08-30 1998-08-25 Xerox Corporation Method and apparatus for wavelet-based universal halftone image unscreening
JP3213582B2 (ja) 1997-05-29 2001-10-02 シャープ株式会社 画像符号化装置及び画像復号装置
AUPP686598A0 (en) * 1998-10-30 1998-11-26 Canon Kabushiki Kaisha A method and apparatus for representing a digital image to provide a coded representation
JP3969688B2 (ja) * 1999-03-24 2007-09-05 株式会社リコー 両眼立体視画像評価装置、両眼立体視画像評価方法及び記録媒体
US6594391B1 (en) 1999-09-03 2003-07-15 Lucent Technologies Inc. Method and apparatus for texture analysis and replicability determination
US6549674B1 (en) * 2000-10-12 2003-04-15 Picsurf, Inc. Image compression based on tiled wavelet-like transform using edge and non-edge filters
US6909808B2 (en) 2002-03-08 2005-06-21 Anzus, Inc. Image compression to enhance optical correlation
US7308146B2 (en) * 2002-09-30 2007-12-11 Canon Kabushiki Kaisha Digital video compression
US7228006B2 (en) 2002-11-25 2007-06-05 Eastman Kodak Company Method and system for detecting a geometrically transformed copy of an image
JP2004348293A (ja) * 2003-05-20 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> 画像品質計算装置および方法、そのプログラム並びに記録媒体
US7512286B2 (en) * 2003-10-27 2009-03-31 Hewlett-Packard Development Company, L.P. Assessing image quality
US7483486B2 (en) 2004-07-02 2009-01-27 Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. Method and apparatus for encoding high dynamic range video
GB0427737D0 (en) 2004-12-17 2005-01-19 Univ Cambridge Tech Method of identifying features within a dataset
JP4763525B2 (ja) * 2006-06-21 2011-08-31 日本電信電話株式会社 映像整合方法
US20080134070A1 (en) 2006-11-09 2008-06-05 Koji Kobayashi Image processing apparatus and image processing method
WO2008105268A1 (ja) 2007-02-28 2008-09-04 Nikon Corporation 画像処理方法
JP4796019B2 (ja) * 2007-08-08 2011-10-19 日本電信電話株式会社 映像品質推定装置、方法、およびプログラム
JP4972004B2 (ja) * 2008-01-30 2012-07-11 国立大学法人東京工業大学 画像変換方法およびプログラム
JP4656190B2 (ja) * 2008-06-10 2011-03-23 ソニー株式会社 情報処理装置および方法
US8385971B2 (en) 2008-08-19 2013-02-26 Digimarc Corporation Methods and systems for content processing
US8805110B2 (en) 2008-08-19 2014-08-12 Digimarc Corporation Methods and systems for content processing
CN101378519B (zh) * 2008-09-28 2010-09-22 宁波大学 一种基于Contourlet变换的质降参考图像质量评价方法
US8213735B2 (en) 2008-10-10 2012-07-03 Accusoft Corporation Methods and apparatus for performing image binarization
US8326046B2 (en) 2009-02-11 2012-12-04 Ecole De Technologie Superieure Method and system for determining structural similarity between images
US8515182B2 (en) 2009-02-11 2013-08-20 Ecole De Technologie Superieure Method and system for determining a quality measure for an image using multi-level decomposition of images
US8515181B2 (en) 2009-02-11 2013-08-20 Ecole De Technologie Superieure Method and system for determining a quality measure for an image using a variable number of multi-level decompositions
CN101621709B (zh) * 2009-08-10 2011-01-05 浙江大学 一种全参考型图像客观质量评价方法

Also Published As

Publication number Publication date
IL220737A0 (en) 2012-08-30
WO2011097697A1 (en) 2011-08-18
EP2534639A4 (en) 2018-07-04
JP2013520037A (ja) 2013-05-30
IL220737A (en) 2016-03-31
US8515182B2 (en) 2013-08-20
CA2783879C (en) 2014-07-22
EP2534639A1 (en) 2012-12-19
US20110038548A1 (en) 2011-02-17
US20130294703A1 (en) 2013-11-07
CA2783879A1 (en) 2011-08-18
CN102754126B (zh) 2016-05-18
KR20120115407A (ko) 2012-10-17
CN102754126A (zh) 2012-10-24
KR101664913B1 (ko) 2016-10-11
US8660364B2 (en) 2014-02-25

Similar Documents

Publication Publication Date Title
JP5510688B2 (ja) 画像のマルチレベル分解を利用して画質計測値を決定する方法およびシステム
CA2784926C (en) Method and system for determining a quality measure for an image using a variable number of multi-level decompositions
Wang et al. Information content weighting for perceptual image quality assessment
Gao et al. Biologically inspired image quality assessment
Ciancio et al. No-reference blur assessment of digital pictures based on multifeature classifiers
JP5928753B2 (ja) 空間シフトを用いて視覚品質メトリックのロバスト性を向上させる方法およびシステム
US8532396B2 (en) Method and system for determining structural similarity between images
Chang et al. Perceptual image quality assessment by independent feature detector
Zhang et al. Joint image denoising using adaptive principal component analysis and self-similarity
US8908989B2 (en) Recursive conditional means image denoising
Li et al. No-reference blur index using blur comparisons
Liu et al. Reduced reference image quality assessment using regularity of phase congruency
Zhang et al. Image denoising via structure-constrained low-rank approximation
Lu et al. A no-reference image sharpness metric based on structural information using sparse representation
Fang et al. Reduced-reference quality assessment of image super-resolution by energy change and texture variation
Nizami et al. Natural scene statistics model independent no-reference image quality assessment using patch based discrete cosine transform
Tang et al. Training-free referenceless camera image blur assessment via hypercomplex singular value decomposition
Heydari et al. A low complexity wavelet-based blind image quality evaluator
Khan et al. No-reference image quality assessment using gradient magnitude and wiener filtered wavelet features
Banitalebi-Dehkordi et al. An image quality assessment algorithm based on saliency and sparsity
Saha et al. SVD filter based multiscale approach for image quality assessment
Liu et al. Blind omnidirectional image quality assessment with representative features and viewport oriented statistical features
Perry et al. Natural scene statistics for image denoising
Guo et al. Fovea based image quality assessment
Dhungel et al. Study of Multi-Scale temporal extension and Minkowski a MSSIM

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130725

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130725

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140311

R150 Certificate of patent or registration of utility model

Ref document number: 5510688

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250