JP6544543B2 - 畳み込みニューラルネットワークに基づいたフルリファレンス画像品質評価方法 - Google Patents

畳み込みニューラルネットワークに基づいたフルリファレンス画像品質評価方法 Download PDF

Info

Publication number
JP6544543B2
JP6544543B2 JP2017563173A JP2017563173A JP6544543B2 JP 6544543 B2 JP6544543 B2 JP 6544543B2 JP 2017563173 A JP2017563173 A JP 2017563173A JP 2017563173 A JP2017563173 A JP 2017563173A JP 6544543 B2 JP6544543 B2 JP 6544543B2
Authority
JP
Japan
Prior art keywords
image
reference image
distortion
similarity
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017563173A
Other languages
English (en)
Other versions
JP2018516412A5 (ja
JP2018516412A (ja
Inventor
シュン シュー
シュン シュー
ペン イェ
ペン イェ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JP2018516412A publication Critical patent/JP2018516412A/ja
Publication of JP2018516412A5 publication Critical patent/JP2018516412A5/ja
Application granted granted Critical
Publication of JP6544543B2 publication Critical patent/JP6544543B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • G06T7/001Industrial image inspection using an image reference approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/993Evaluation of the quality of the acquired pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/004Diagnosis, testing or measuring for television systems or their details for digital television systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

(関連出願の相互参照)
本出願は、2015年6月5日に提出された、名称「畳み込みニューラルネットワークに基づいたフルリファレンス画像品質評価方法」の米国特許出願第14/732,518号に基づく優先権を主張し、当該出願は、本明細書において本出願に全て記載されるように引用により本明細書に組み込まれる。
デジタル撮像デバイス及び通信技術の発展並びに普及に伴って、デジタル画像は、情報の表現及び伝達において益々重要になっている。デジタル画像は、その寿命の間に様々な段階で劣化する可能性があり、このような品質の劣化は、その後の段階で活用できなくなる恐れがある。従って、数多くの画像及びビデオ処理システムにおいて画像品質を維持及び監視することが重要であり、このような画像品質評価(IQA)の第1の目的は、観る人によって知覚されるような視覚的品質を予測することである。画像品質測度は、伝送速度のようなパラメータの関数として、また画像向上方法の最適パラメータを選択するため、知覚された歪みの依存性を評価するのに用いることができる。IQAを実行するために、主観テストを実験室設定にて実施することができるが、このようなテストは、コストと時間がかかり、リアルタイムの自動システムでは用いることはできない。従って、画像品質を自動的且つ効率的に測定する客観的IQAメトリックを構築し実現することが重要である。
フルリファレンスIQA(FR−IQA)モデルは、歪み画像と対応する初期のリファレンス画像の両方からの情報を利用して視覚的品質を推定する。平均二乗誤差(Mean Squared Error (MSE))又はピーク信号対雑音比(Peak Signal−to−Noise Ratio (PSNR))などの従来のFR−IQAメトリックは、空間領域において歪み画像とリファレンス画像との間のピクセル毎の差違を直接測定している。これらのタイプのメトリックは、信号忠実度を測定するが、多くの場合、特に雑音が加法性ではない場合には、人間の知覚との相関性が低くなる。
人間の知覚とより良好に一致する知覚による視覚的品質メトリック(PVQM)の構築に向けて、2つのタイプの手法、すなわち、ボトムアップとトップダウン手法がとられてきた。ボトムアップ手法は、コントラスト感度、輝度順応、種々のマスク効果などを含む関連の精神物理学的特性及び生理学的特性をシミュレートすることによって、人間の視覚システム(HVS)の視覚路における様々な処理段階をモデル化する試みである。しかしながら、これらの特性の知識が限定的なこと、並びに最終的な知覚への複合的な影響を考慮すると、HVSは複雑過ぎて、このようにして正確にモデル化することはできない。
より最近の研究への取り組みは、自然画像の統計的特性などの様々な情報源からの知識並びに画像歪みがHVSによって処理される方法に関するデータを組み込むことによって入出力関係をモデル化するトップダウン機構に向けられている。最新のほとんどのFR−IQAモデルは、このカテゴリーに分類され、更に、構造類似性(Structural SIMilarity (SSIM))インデックス及びその変形形態(マルチスケールSSIM(Multi−Scale SSIM (MS−SSIM))及び情報重み付けSSIM(Information Weighted SSIM (IW−SSIM))を含む)、特徴類似性( Feature SIMilarity (FSIM))インデックス及び勾配度類似性偏差(Gradient Magnitude Similarity Deviation (GMSD))などは、ある程度の成功を収めており、平均強度、強度の標準偏差、位相一致及び勾配度などの低レベル視覚的特徴が有効な品質指標であることを示唆している。しかしながら、これら低レベルのキューは、異なる歪みカテゴリー全体にわたり一様に良好には機能しない場合がある。その結果、対応するFR測度の性能は、異なるタイプの歪みにわたり大きく異なる可能性がある。
従って、異なるタイプの歪みにわたって人間の知覚とより良好に一致し、客観性があり、測定可能なデータによって決定され且つ効率的である改善された画像品質評価方法に対する要求がある。一部では、畳み込みニューラルネットワーク(ConvNet)を利用した学習ベースの手法を適用することに向けて取り組まれているが、これらは、リファレンス画像が品質推定に利用可能ではない状況、すなわちノンリファレンスIQA(No−Reference IQA (NR−IQA))に限られている。従って、リファレンス画像及び歪み画像の対応するペアが分析に利用可能である、FR−IQAに対するこのような方法の適用を研究し構築する必要性が依然としてある。
本実施形態は、一般に、リファレンス画像に対する歪み画像の画像品質を評価するためのシステム及び方法を提供することに関する。1つの実施形態において、本システムは、歪み画像及びリファレンス画像を入力として受け入れて画像品質のメトリックを出力として提供する畳み込みニューラルネットワークを備える。別の実施形態において、本方法は、歪み画像及びリファレンス画像を処理して画像品質のメトリックとして提供するよう構成された畳み込みニューラルネットワークに対して、歪み画像及びリファレンス画像を入力するステップを含む。
更に別の実施形態において、リファレンス画像に対する歪み画像の画像品質を評価するために畳み込みニューラルネットワークをトレーニングする方法が提供される。本方法は、畳み込みニューラルネットワークにおけるネットワークパラメータの現行のセットとしてネットワークパラメータの初期セットを選択するステップと、歪み画像及び対応するリファレンス画像から各々がなる画像の複数のペアの各々について、計算された類似性スコアメトリックScを提供するよう畳み込みニューラルネットワークを通じて画像のペアを処理するステップと、歪みスコアメトリックSとペアについての期待類似性スコアメトリックSpの比較に基づいて、ネットワークパラメータの現行のセットのうちの1又はそれよりも多いネットワークパラメータを調整するステップと、を含み、期待類似性スコアメトリックSpは、人間の知覚によって提供される。
本明細書で開示された特定の実施形態の性質及び利点の更なる理解は、本明細書の残りの部分及び添付図面を参照することによって実現することができる。
1つの実施形態によるリファレンス画像に対する歪み画像の画像品質を評価するシステムの利用を概略的に示す図である。 1つの実施形態によるリファレンス画像に対する歪み画像の画像品質を評価するシステムのアーキテクチャを示す図である。 リファレンス画像に対する歪み画像の画像品質を評価する階層システムの1つの実施態様を示す図である。 1つの実施形態によるリファレンス画像に対する歪み画像の画像品質を評価する方法のステップを示すフローチャートである。 1つの実施形態によるリファレンス画像に対する歪み画像の画像品質を評価するための畳み込みニューラルネットワークをトレーニングする方法を示す図である。 1つの実施形態によるリファレンス画像に対する歪み画像の画像品質を評価するための畳み込みニューラルネットワークをトレーニングする方法のステップを示すフローチャートである。
図1は、1つの実施形態によるリファレンス画像104に対する歪み画像102の画像品質を評価するシステム100の利用を概略的に示している。システム100は、トレーニングFR−IQAモデルを具現化する相互接続されたモジュール又は層のネットワークを含み、これは図2を参照して以下で更に説明される。歪み画像102及びリファレンス画像104の各々からの画像データがシステム100に提供され、該システムは、観る人によって知覚される可能性が高い歪み画像102の品質を示す出力メトリック106を生成する。
図2は、1つの実施形態によるリファレンス画像214に対する歪み画像212の画像品質を評価するのに用いることができるシステム200のアーキテクチャの概略図を示す。システム200は、複数の層201〜207を含む。システム200を2段階システムとみなすことが有用とすることができ、ここでは、第1段階が層201〜205からなり、第2段階である層206及び207にデータを全体的に提供する。この第2段階は、「標準」ニューラルネットワークと考えることができ、第1段階と第2段階の組み合わせにより、システム200が畳み込みニューラルネットワークとなる。
歪み画像212及びリファレンス画像214からの画像データが入力層201に提供され、該入力層201は、画像データの両方のセットを正規化して、正規化リファレンス画像及び正規化リファレンス画像を提供する機能を果たす。正規化歪み画像及び正規化リファレンス画像からの画像データは、畳み込み層202に提供され、該畳み込み層202は、N1個の複数のフィルタを用いて正規化歪み画像及び正規化リファレンス画像の各々を畳み込む機能を果たし、また、二乗活性化関数(activation function)を各画像の各ピクセルに適用して、特徴マップのN1個のペアをもたらす。特徴マップの各ペアは、1つのフィルタ処理された正規化歪み画像と1つの対応するフィルタ処理された正規化リファレンス画像とを含む。
特徴マップのN1個のペアからの画像データは、線形結合層203に提供され、該線形結合層203は、歪み画像212に対応するN1個の特徴マップのN2個の線形結合と、リファレンス画像214に対応する対応N1個の特徴マップのN2個の線形結合とを計算して、結合特徴マップのN2個のペアを提供する。結合特徴マップの各ペアは、フィルタ処理された正規化歪み画像の1つの組み合わせと、フィルタ処理された正規化リファレンス画像の対応する1つの組み合わせとを含む。
類似性計算層204は、線形結合層203から受け取った結合特徴マップのN2個のペアからのデータに作用して、N2個の類似性マップを計算する。各類似性マップは、結合特徴マップの1つのペアからのピクセルの対応するパッチによるデータに基づいて計算され、各類似性マップは、結合特徴マップのN2個のペアのうちの異なるものに対応する。
類似性マップからのデータは、プーリング層205に提供され、該プーリング層は、N2個の類似性マップの各々について平均プーリングを適用して、N2個の類似性入力値をもたらす。N2個の類似性入力値は、全結合層206に提供され、該全結合層206は、N2個の類似性入力値に作用して、M個の隠れノード値(ここでMは、N2よりも大きな整数)を提供する。M個の隠れノード値は、線形回帰層207によって単一の出力ノードにマップされる。出力ノードでの値は、システム200のトレーニングに基づいて、観る人によって知覚される可能性が高い歪み画像202の品質を示す画像品質のメトリックである。
ニューラルネットワーク200の複数のハイパーパラメータは、特定の画像評価アプリケーションに好適な固有の異なるアーキテクチャ又は実施態様を決定するよう選択することができる。1つのハイパーパラメータは、オリジナルの歪み画像及びリファレンス画像におけるピクセルのパッチサイズである。他のハイパーパラメータは、畳み込み層で使用されるフィルタのサイズ(ピクセルの数に関する)、畳み込み層で使用されるフィルタの数N1、畳み込み層で使用される活性化関数、線形結合層にて計算された線形結合の数N2、全結合層における隠れノードの数M、及び類似性計算層において類似性を計算するのに使用される式を含む。更に、一部の実施形態において、2以上の畳み込み層、2以上の線形結合層、及び2以上の全結合層が存在してもよく、使用されるそれぞれの数は、追加のハイパーパラメータである。
画像品質評価を実施するのに好適であることが分かっている畳み込みニューラルネットワークの1つの固有の実施態様が図3に例示され、32×32−7×7×10−1×1×10−800−1構造を示している。各層の詳細について以下で説明する。
入力層は、2つの32×32グレースケール画像パッチ、すなわち、歪み画像パッチIdis及びそのレファレンスパッチIrefからなる。両パッチは、線形変換関数f(x)=(x−128)/128*1.6により正規化される。
畳み込み層において、10個の7×7線形フィルタ
が歪み及び画像パッチに適用されて、歪み画像及びリファレンス画像それぞれに対してフィルタ処理された特徴マップ
及び
をもたらし、ここで、
及び、
である。他の実施形態において、対象の低レベル特徴の最小サイズに応じて、7×7よりも小さい又は大きいフィルタを用いてもよい。同様に、一部の実施形態において、関連する歪みの複雑さに応じて、10個よりも少ない又は多いフィルタを用いてもよい。この層では、二乗活性化関数が、各画像パッチの各ピクセルに適用される。
線形結合層において、畳み込み層によって生成されるフィルタ処理された特徴マップの線形結合が計算される。
類似性計算層において、対応する歪みパッチ及びリファレンスパッチからの結合特徴マップ間のポイント毎(すなわち、ピクセル毎)の方式で類似性が計算される。
ここで、Skは第kの類似性マップ、Cは小さい正定数である。
プーリング層において、平均プーリングが各類似性マップに適用される。プーリング層の出力を
とすると、
となる。プーリング層は、10次元プーリングされた類似性を入力として全結合層に提供する。10を超えるフィルタが畳み込み層で使用されて10を超えるフィルタ処理された特徴マップが生成されるなどの場合には、これに応じて、プーリングされた類似性入力に対しより多くの次元性が存在することになる。
全結合層において、類似性入力が800個の隠れノードに密に結合される。隠れノードに対する活性化関数として、正規化線形関数(Rectified Linear Unit (ReLU))(f(x)=max(x,0))が使用される。全結合層における重み付けを
とすると、全結合層の出力は、
となり、ここでbjはバイアス項である。一部の実施形態において、活性化関数は他の非線形動作を含むことができる点に留意されたい。
線形回帰層において、800個の隠れノードが単一の出力ノードにマップされる。線形回帰層の重み付けが、
で記述される場合、ネットワークの出力は、
+b
であり、ここでbはバイアス項である。
図4は、1つの実施形態によるリファレンス画像に対する歪み画像の画像品質を評価するための方法400のステップを示すフローチャートである。ステップ402において、歪み画像及びリファレンス画像(例えば、歪み及びリファレンスビデオストリームからの対応するフレームとすることができる)がトレーニング畳み込みニューラルネットワークへの入力として受けられる。ステップ404において、歪み画像及びリファレンス画像は、トレーニング畳み込みニューラルネットワークを通じて処理される。
図5は、1つの実施形態によるリファレンス画像に対する歪み画像の画像品質を評価するための畳み込みニューラルネットワークモデルをトレーニングする方法を示す。モデルについてネットワークパラメータの初期セットが選択され、観る人によって決定された、期待又は予測される類似性スコアメトリックを有する対応する歪み画像(502)及びリファレンス画像(504)のペアがネットワークへの入力として提供される。ネットワークによって提供される類似性スコアメトリックS’は、コストモジュール506において、予測されたスコアメトリックSと比較され、この比較に応じて、モデル500の1又はそれよりも多いパラメータが調整されてモデルを更新する。次いで、歪み画像及びリファレンス画像の第2のペアが、調整されたパラメータを用いてネットワーク500を通じて処理されて、生成された第2のメトリックとこの第2のペアで期待されるスコアメトリックとの間の比較が行われ、これに応じて更に調整を行うことができる。このプロセスは、最終のモデルパラメータが設定されて、モデルネットワークがトレーニングされたとみなされるまで、トレーニング画像ペアの利用可能なセットに対して必要に応じて繰り返される。
図6は、1つの実施形態によるリファレンス画像に対する歪み画像の画像品質を評価するための畳み込みニューラルネットワークをトレーニングする方法600のステップを示すフローチャートである。ステップ602において、歪み画像及びリファレンス画像のペア(利用可能な全T個のペアのうちのi番目のペア)が、パラメータの以前に選択されたセットによって特徴付けられるネットワークへの入力として受けられる。ステップ604において、歪み画像及びリファレンス画像がネットワークを通じて処理される。ステップ606において、畳み込みニューラルネットワークによって計算された出力類似性スコアScと、観る人によって知覚される、画像の当該ペアに対して予測された類似性スコアメトリックSpとの間の比較に応じて、ネットワークパラメータが目的関数を用いて調整される。ステップ608において、未だ処理されていないトレーニング画像の他のペアが利用可能であるかどうか判定される。利用可能である場合、このような1つのペアがステップ602及び604を通じて処理されて、ステップ606において、ネットワークパラメータが更に調整され、ステップ608において、全てのトレーニング画像ペアの処理が完了したかどうかの更なる判定が行われる。ステップ608において、全てのトレーニング画像の処理が完了したと判定されると、ニューラルネットワークがトレーニングされたとみなすことができる。場合によっては、トレーニング画像は、トレーニングを改善するために2回以上ネットワークに提供されてもよい。トレーニング画像が処理される順序はランダムであってもよい。
1つの実施形態において、例えば、方法600のステップ606でモデルパラメータがどのように調整されるかを正確に判定する際に、ネットワークをトレーニングするのに使用される目的関数は、標準のε−SVR(サポートベクトル回帰)で使用されるのと同じである。
が入力パッチのペアを表し、ynが計算されたw類似性スコアメトリック(グラウンドトルース品質スコアとも呼ばれる)を表し、
がネットワークパラメータWとの入力ペアについての予測類似性スコアメトリックを表すとすると、目的関数は次式で記述することができる。
この場合、Lεは次式で定義される。
ここでεは、調整可能な小さい正定数であり、nはトレーニングサンプルの数である。ネットワークは、確率的勾配降下法(SGD)を用いてバックプロパゲーションを実施することによってトレーニングすることができる。
正則化法を用いて、ニューラルネットワークの過学習を回避することができる。1つの実施形態において、正則化法は、目的関数の線形回帰層において重み付けのL2ノルムを付加するステップを含む。これは、例えばSVM(サポートベクタマシン)で使用されてきた正則化に広く使用されている方法である。詳細には、目的関数は、次式のように修正することができる。
ここで、λ1は小さい正定数である。
一部の実施形態において、線形結合層における入力ノード及び出力ノードの結合は制約されるので、ほとんどの出力ノードは、入力ノードの小さなセット(例えば、N1=10の場合、全ての10個の入力ノードではなく)とのみ結合される。この制約は、スパースバイナリマスクWmaskを付加することによって実装することができ、ここでWmask(k,i)=0の場合、
は強制的にゼロでなければならない。結合パターンは、ランダムに選ぶことができる。1つの特定の実施形態において有用であることが分かっているマスクは、以下で定義される。
本明細書で記載される実施形態は、様々な利点をもたらす。詳細には、本実施形態は、リファレンス画像及び歪み画像の対応するペアが利用可能である用途において、リアルタイムの自動システムで容易に実装され且つ異なるタイプの歪みにわたり人間の知覚とより良好に一致する結果をもたらすシステム及び方法を用いて画像品質を評価することを可能にする。本発明は、入力としてリファレンス画像及び歪み画像を受け入れて、出力として有意義な画像品質メトリックを提供する、自動画像品質評価の「エンドツーエンド」解決手段をもたらす。
本発明の詳細な説明では、その特定の実施形態に関して説明してきたが、これらの特定の実施形態は、単に例証に過ぎず、限定ではない。
特定の実施形態のルーチンを実行するために、C、C++、Java(登録商標)、アセンブル言語等を含むあらゆる好適なプログラム言語を使用できる。手続き形又はオブジェクト指向等の別のプログラミング手法を使用することができる。ルーチンは、単一の処理デバイス又は複数のプロセッサで実行することができる。しかしながら、ステップ、動作、又は計算は、特定の順番で提示されるが、この順番は、別の特定の実施形態では変更することができる。特定の実施形態において、本明細書では順次的に示される複数のステップは、同時に実行してもよい。
特定の実施形態は、命令実行システム、装置、システム、又はデバイスによって、又はこれに関連して使用するコンピュータ可読記憶媒体で実施することができる。特定の実施形態は、ソフトウェア又はハードウェアもしくはこれらの組み合わせにおける制御ロジックの形態で実施することができる。制御ロジックは、1又はそれよりも多いプロセッサで実行される場合、特定の実施形態で説明されたものを実行するように作動可能である。
特定の実施形態は、プログラムド汎用デジタルコンピュータ、特定用途向け集積回路、プログラム可能倫理デバイス、フィールドプログラマブルゲートアレイ、光学的、化学的、生物学的、量子力学的又はナノ加工システム、構成要素、及び機構を使用して実行できる。一般に、特定の実施形態の機能は、従来から公知の任意の手段で実現することができる。分散型、ネットワークシステム、構成要素及び/又は回路を使用することができる。データの通信又は伝送は、有線、無線、又は他の何れかの手段とすることができる。
また、図面に示される要素の1又はそれよりも多い要素は、特定の用途に有用であるように、より分離された又は統合された様式で、或いは場合によっては取り除かれるか又は動作不能にされた状態で実施できることは理解されるであろう。また、マシン可読媒体に格納されてコンピュータが上述の方法の何れかを実行可能にすることができるプログラム又はコードを実行することは、本発明の精神及び範囲に含まれる。
「プロセッサ」は、データ、信号、又は他の情報を処理する何らかの好適なハードウェア及び/又はソフトウェアシステム、機構又は構成要素を含む。プロセッサは、汎用中央処理装置、マルチ処理装置、特定機能を実現する専用回路、又は他のシステムを含むことができる。処理は、地理的位置に限定されるか又は時間的限界を有する必要はない。例えば、プロセッサは、「リアルタイム」、「オフライン」、「バッチモード」等での機能を実行することができる。処理の一部は、別の(又は同じ)処理システムによって別の時間及び場所で実行することができる。処理システムの実施例は、サーバ、クライアント、エンドユーザデバイス、ルータ、スイッチ、ネットワークストレージなどを含むことができる。コンピュータは、メモリと通信するあらゆるプロセッサとすることができる。メモリは、プロセッサにより実行する命令を格納するのに好適な、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、磁気又は光ディスク、又は他の有形媒体などの何れかの好適なプロセッサ可読記憶媒体とすることができる。
本明細書及び請求項を通して使用する場合、単数形態は、前後関係から明らかに別の意味を示さない限り、複数形態も含む。本明細書及び請求項を通して使用する場合、前後関係から明らかに別の意味を示さない限り、「における」の意味は「における」及び「上で」の意味を含む。
従って、本明細書において特定の実施形態を説明してきたが、許容範囲の変形例、種々の変更、及び代用例は前述の開示内容の対象であり、場合によっては、特定の実施形態の一部の特徴は、本発明の範囲及び精神を逸脱することなく、他の特徴を対応して使用することなく利用されることは理解される。従って、特定の状况又は内容を実質的な範囲及び精神に適合させるように、多くの変形を行うことができる。
104:リファレンス
102:歪み
100:FR−IQAモデル(トレーニング)

Claims (18)

  1. リファレンス画像に対する歪み画像の画像品質を評価するシステムであって、前記システムが、前記歪み画像及び前記リファレンス画像を入力として受け入れて画像品質のメトリックを出力として提供する畳み込みニューラルネットワークを備える、システム。
  2. 前記畳み込みニューラルネットワークが複数の層を含む、請求項1に記載のシステム。
  3. 前記複数の層が、
    前記歪み画像及び前記リファレンス画像の各々を構成する画像パッチに正規化関数を適用して、正規化歪み画像及び正規化リファレンス画像を提供するよう構成された入力層と、
    N1フィルタを用いて前記正規化歪み画像及び前記正規化リファレンス画像の各々を畳み込み、1つのフィルタ処理された正規化歪み画像と1つの対応するフィルタ処理された正規化リファレンス画像とを各々が含む特徴マップのN1(1よりも大きい整数)個のペアを提供するよう構成された畳み込み層と、
    を含む、請求項2に記載のシステム。
  4. 前記複数の層が更に、
    前記歪み画像及び前記リファレンス画像の各々から提供される前記N1個の特徴マップのN2個の線形結合を計算して、フィルタ処理された正規化歪み画像の1つの組み合わせと、フィルタ処理された正規化リファレンス画像の対応する1つの組み合わせとを各々が含む結合特徴マップのN2(1よりも大きい整数)個のペアを提供するよう構成された線形結合層と、
    前記結合特徴マップのN2個のペアのうちの異なるものからの対応するピクセルに各々が基づいたN2個の類似性マップを計算するよう構成された類似性計算層と、
    前記N2個の類似性マップの各々について平均プーリングを適用して、N2個の類似性入力値を提供するよう構成されたプーリング層と、
    を備える、請求項3に記載のシステム。
  5. 前記複数の層が更に、
    前記N2個の類似性入力値に作用して、M個(N2よりも大きい整数)の隠れノード値を提供するよう構成された全結合層と、
    前記M個の隠れノード値を単一の出力ノードにマップして、画像品質のメトリックを提供するよう構成された線形回帰層と、
    を含む、請求項4に記載のシステム。
  6. N1=N2であり、N1=10である、請求項5に記載のシステム。
  7. M=800である、請求項5に記載のシステム。
  8. 前記畳み込み層によって前記特徴マップのN1個のペアが前記複数の層の後続の層に提供される前に、前記特徴マップのN1個のペアの各ノードにおいて二乗活性化関数が適用される、請求項3に記載のシステム。
  9. リファレンス画像に対する歪み画像の画像品質を評価する方法であって、前記方法が、 前記歪み画像及び前記リファレンス画像を処理して画像品質のメトリックとして提供するよう構成された畳み込みニューラルネットワークに対して、前記歪み画像及び前記リファレンス画像を入力するステップを含む、方法。
  10. 前記畳み込みニューラルネットワークによって実行される処理が、
    前記歪み画像及び前記リファレンス画像の各々を構成する画像パッチに正規化関数を適用して、正規化歪み画像及び正規化リファレンス画像を提供するステップと、
    N1フィルタを用いて前記正規化歪み画像及び前記正規化リファレンス画像の各々を畳み込み、1つのフィルタ処理された正規化歪み画像と1つの対応するフィルタ処理された正規化リファレンス画像とを各々が含む特徴マップのN1(1よりも大きい整数)個のペアを提供するステップと、
    を含む、請求項9に記載の方法。
  11. 前記歪み画像及び前記リファレンス画像の各々から提供される前記N1個の特徴マップのN2個の線形結合を計算して、フィルタ処理された正規化歪み画像の1つの組み合わせと、フィルタ処理された正規化リファレンス画像の対応する1つの組み合わせとを各々が含む結合特徴マップのN2個のペアを提供するステップと、
    前記結合特徴マップのN2個のペアのうちの異なるものからの対応するピクセルに各々が基づいたN2個の類似性マップを計算するステップと、
    前記N2個の類似性マップの各々について平均プーリングを適用して、N2個の類似性入力値を提供するステップと、
    を更に含む、請求項10に記載の方法。
  12. 前記N2個の類似性入力値を全結合層に入力して、M個(N2よりも大きい整数)の隠れノード値を提供するステップと、
    回帰層を通じて前記M個の隠れノード値をマップして、画像品質のメトリックを提供するステップと、
    を更に含む、請求項11に記載の方法。
  13. M=800である、請求項12に記載の方法。
  14. リファレンス画像に対する歪み画像の画像品質を評価するために畳み込みニューラルネットワークをトレーニングする方法であって、前記方法が、
    前記畳み込みニューラルネットワークにおけるネットワークパラメータの現行のセットとしてネットワークパラメータの初期セットを選択するステップと、
    歪み画像及び対応するリファレンス画像から各々がなる画像の複数のペアの各々について、計算された類似性スコアメトリックScを提供するよう前記畳み込みニューラルネットワークを通じて前記画像のペアを処理するステップと、
    前記計算された類似性スコアメトリックScと前記ペアについての期待類似性スコアメトリックSpの比較に基づいて、前記ネットワークパラメータの現行のセットのうちの1又はそれよりも多い前記ネットワークパラメータを調整するステップと、
    を含み、前記期待類似性スコアメトリックSpが、人間の知覚によって提供される、方法。
  15. 前記画像の各ペアが、歪み画像パッチIdis及びそのレファレンスパッチIrefを含み、
    前記画像のペアを処理するステップが、前記画像のペアを前記畳み込みニューラルネットワークに通して、サポートベクトル回帰(SVR)目的関数を前記複数の画像パッチに適用することによって、結果として得られる歪みスコアメトリックSを前記期待類似性スコアメトリックSpと比較するステップを含む、請求項14に記載の方法。
  16. 前記SVR目的関数が
    式中Lεは次式で定義され、
    式中εは調整可能な小さい正定数であり、nはトレーニングサンプルの数である、請求項14に記載の方法。
  17. 確率的勾配降下法(SGD)を用いてバックプロパゲーションを実行するステップを更に含む、請求項14に記載の方法。
  18. 前記畳み込みニューラルネットワークを通じて前記画像のペアを処理するステップが、結合特徴マップを提供するよう、前記歪み画像及びリファレンス画像の各ペアから生成された特徴マップの線形結合を計算するステップを含み、
    前記線形結合を計算するステップが、スパースバイナリマスクを用いて、前記計算に対する特徴マップの入力と前記計算からの前記結合特徴マップの出力との間の結合を制約するステップを含む、請求項14に記載の方法。
JP2017563173A 2015-06-05 2016-06-03 畳み込みニューラルネットワークに基づいたフルリファレンス画像品質評価方法 Active JP6544543B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/732,518 US9741107B2 (en) 2015-06-05 2015-06-05 Full reference image quality assessment based on convolutional neural network
US14/732,518 2015-06-05
PCT/US2016/035868 WO2016197026A1 (en) 2015-06-05 2016-06-03 Full reference image quality assessment based on convolutional neural network

Publications (3)

Publication Number Publication Date
JP2018516412A JP2018516412A (ja) 2018-06-21
JP2018516412A5 JP2018516412A5 (ja) 2019-06-13
JP6544543B2 true JP6544543B2 (ja) 2019-07-17

Family

ID=57441857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017563173A Active JP6544543B2 (ja) 2015-06-05 2016-06-03 畳み込みニューラルネットワークに基づいたフルリファレンス画像品質評価方法

Country Status (6)

Country Link
US (1) US9741107B2 (ja)
EP (1) EP3292512B1 (ja)
JP (1) JP6544543B2 (ja)
KR (1) KR101967089B1 (ja)
CN (1) CN107636690B (ja)
WO (1) WO2016197026A1 (ja)

Families Citing this family (88)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11263432B2 (en) * 2015-02-06 2022-03-01 Veridium Ip Limited Systems and methods for performing fingerprint based user authentication using imagery captured using mobile devices
US9734567B2 (en) * 2015-06-24 2017-08-15 Samsung Electronics Co., Ltd. Label-free non-reference image quality assessment via deep neural network
US10410330B2 (en) * 2015-11-12 2019-09-10 University Of Virginia Patent Foundation System and method for comparison-based image quality assessment
US10356343B2 (en) * 2016-03-18 2019-07-16 Raytheon Company Methods and system for geometric distortion correction for space-based rolling-shutter framing sensors
US10043240B2 (en) 2016-04-14 2018-08-07 Microsoft Technology Licensing, Llc Optimal cropping of digital image based on professionalism score of subject
US9904871B2 (en) * 2016-04-14 2018-02-27 Microsoft Technologies Licensing, LLC Deep convolutional neural network prediction of image professionalism
US10043254B2 (en) 2016-04-14 2018-08-07 Microsoft Technology Licensing, Llc Optimal image transformation based on professionalism score of subject
WO2018033137A1 (zh) * 2016-08-19 2018-02-22 北京市商汤科技开发有限公司 在视频图像中展示业务对象的方法、装置和电子设备
US10360494B2 (en) * 2016-11-30 2019-07-23 Altumview Systems Inc. Convolutional neural network (CNN) system based on resolution-limited small-scale CNN modules
US10834406B2 (en) * 2016-12-12 2020-11-10 Netflix, Inc. Device-consistent techniques for predicting absolute perceptual video quality
US11113800B2 (en) * 2017-01-18 2021-09-07 Nvidia Corporation Filtering image data using a neural network
US11537869B2 (en) * 2017-02-17 2022-12-27 Twitter, Inc. Difference metric for machine learning-based processing systems
WO2018152741A1 (en) * 2017-02-23 2018-08-30 Nokia Technologies Oy Collaborative activation for deep learning field
CN106920215B (zh) * 2017-03-06 2020-03-27 长沙全度影像科技有限公司 一种全景图像配准效果的检测方法
CN108304755B (zh) * 2017-03-08 2021-05-18 腾讯科技(深圳)有限公司 用于图像处理的神经网络模型的训练方法和装置
CN107103331B (zh) * 2017-04-01 2020-06-16 中北大学 一种基于深度学习的图像融合方法
WO2018186991A1 (en) * 2017-04-04 2018-10-11 Board Of Regents, The University Of Texas System Assessing quality of images or videos using a two-stage quality assessment
US10699160B2 (en) 2017-08-23 2020-06-30 Samsung Electronics Co., Ltd. Neural network method and apparatus
CN107644415B (zh) * 2017-09-08 2019-02-22 众安信息技术服务有限公司 一种文本图像质量评估方法及设备
CN107705299B (zh) * 2017-09-25 2021-05-14 安徽睿极智能科技有限公司 基于多属性特征的图像质量分类方法
CN107679490B (zh) * 2017-09-29 2019-06-28 百度在线网络技术(北京)有限公司 用于检测图像质量的方法和装置
US10540589B2 (en) * 2017-10-24 2020-01-21 Deep North, Inc. Image quality assessment using similar scenes as reference
CN108171256A (zh) * 2017-11-27 2018-06-15 深圳市深网视界科技有限公司 人脸图像质评模型构建、筛选、识别方法及设备和介质
US10740659B2 (en) * 2017-12-14 2020-08-11 International Business Machines Corporation Fusing sparse kernels to approximate a full kernel of a convolutional neural network
CN108074239B (zh) * 2017-12-30 2021-12-17 中国传媒大学 一种基于先验感知质量特征图的无参考图像质量客观评价方法
CN108335289A (zh) * 2018-01-18 2018-07-27 天津大学 一种全参考融合的图像客观质量评价方法
US10721477B2 (en) * 2018-02-07 2020-07-21 Netflix, Inc. Techniques for predicting perceptual video quality based on complementary perceptual quality models
US10887602B2 (en) 2018-02-07 2021-01-05 Netflix, Inc. Techniques for modeling temporal distortions when predicting perceptual video quality
CN108389192A (zh) * 2018-02-11 2018-08-10 天津大学 基于卷积神经网络的立体图像舒适度评价方法
US11216698B2 (en) * 2018-02-16 2022-01-04 Spirent Communications, Inc. Training a non-reference video scoring system with full reference video scores
US10916003B2 (en) * 2018-03-20 2021-02-09 Uber Technologies, Inc. Image quality scorer machine
US11361416B2 (en) 2018-03-20 2022-06-14 Netflix, Inc. Quantifying encoding comparison metric uncertainty via bootstrapping
CN108259893B (zh) * 2018-03-22 2020-08-18 天津大学 基于双流卷积神经网络的虚拟现实视频质量评价方法
CN108875904A (zh) * 2018-04-04 2018-11-23 北京迈格威科技有限公司 图像处理方法、图像处理装置和计算机可读存储介质
US11436717B2 (en) 2018-04-04 2022-09-06 Panasonic Intellectual Property Management Co., Ltd. Image processing device and image processing method
CN108596890B (zh) * 2018-04-20 2020-06-16 浙江科技学院 一种基于视觉测量率自适应融合的全参考图像质量客观评价方法
CN108648180B (zh) * 2018-04-20 2020-11-17 浙江科技学院 一种基于视觉多重特征深度融合处理的全参考图像质量客观评价方法
CN108596902B (zh) * 2018-05-04 2020-09-08 北京大学 基于选通卷积神经网络的多任务全参考图像质量评价方法
US10628708B2 (en) * 2018-05-18 2020-04-21 Adobe Inc. Utilizing a deep neural network-based model to identify visually similar digital images based on user-selected visual attributes
CN108665460B (zh) * 2018-05-23 2020-07-03 浙江科技学院 基于组合神经网络和分类神经网络的图像质量评价方法
KR102184755B1 (ko) * 2018-05-31 2020-11-30 서울대학교 산학협력단 안면 특화 초 고화질 심층 신경망 학습 장치 및 방법
CN108986075A (zh) * 2018-06-13 2018-12-11 浙江大华技术股份有限公司 一种优选图像的判断方法及装置
CN109360183B (zh) * 2018-08-20 2021-05-11 中国电子进出口有限公司 一种基于卷积神经网络的人脸图像质量评估方法和系统
US11704791B2 (en) * 2018-08-30 2023-07-18 Topcon Corporation Multivariate and multi-resolution retinal image anomaly detection system
JP6925474B2 (ja) * 2018-08-31 2021-08-25 ソニーセミコンダクタソリューションズ株式会社 固体撮像装置、情報処理システム、固体撮像装置の動作方法及びプログラム
JP6697042B2 (ja) * 2018-08-31 2020-05-20 ソニーセミコンダクタソリューションズ株式会社 固体撮像システム、固体撮像方法及びプログラム
JP7075012B2 (ja) * 2018-09-05 2022-05-25 日本電信電話株式会社 画像処理装置、画像処理方法及び画像処理プログラム
US11055819B1 (en) * 2018-09-27 2021-07-06 Amazon Technologies, Inc. DualPath Deep BackProjection Network for super-resolution
CN111105357B (zh) * 2018-10-25 2023-05-02 杭州海康威视数字技术股份有限公司 一种失真图像的去失真方法、装置及电子设备
US11132586B2 (en) * 2018-10-29 2021-09-28 Nec Corporation Rolling shutter rectification in images/videos using convolutional neural networks with applications to SFM/SLAM with rolling shutter images/videos
CN109685772B (zh) * 2018-12-10 2022-06-14 福州大学 一种基于配准失真表示的无参照立体图像质量评估方法
US11557107B2 (en) 2019-01-02 2023-01-17 Bank Of America Corporation Intelligent recognition and extraction of numerical data from non-numerical graphical representations
CN109801273B (zh) * 2019-01-08 2022-11-01 华侨大学 一种基于极平面线性相似度的光场图像质量评价方法
US10325179B1 (en) * 2019-01-23 2019-06-18 StradVision, Inc. Learning method and learning device for pooling ROI by using masking parameters to be used for mobile devices or compact networks via hardware optimization, and testing method and testing device using the same
CN109871780B (zh) * 2019-01-28 2023-02-10 中国科学院重庆绿色智能技术研究院 一种人脸质量判决方法、系统及人脸识别方法、系统
US11308598B2 (en) * 2019-02-14 2022-04-19 Sharif University Of Technology Quality assessment of an image
US11405695B2 (en) 2019-04-08 2022-08-02 Spirent Communications, Inc. Training an encrypted video stream network scoring system with non-reference video scores
CN110033446B (zh) * 2019-04-10 2022-12-06 西安电子科技大学 基于孪生网络的增强图像质量评价方法
KR102420104B1 (ko) * 2019-05-16 2022-07-12 삼성전자주식회사 영상 처리 장치 및 그 동작방법
US11521011B2 (en) 2019-06-06 2022-12-06 Samsung Electronics Co., Ltd. Method and apparatus for training neural network model for enhancing image detail
CN110517237B (zh) * 2019-08-20 2022-12-06 西安电子科技大学 基于膨胀三维卷积神经网络的无参考视频质量评价方法
CN110766657B (zh) * 2019-09-20 2022-03-18 华中科技大学 一种激光干扰图像质量评价方法
US10877540B2 (en) * 2019-10-04 2020-12-29 Intel Corporation Content adaptive display power savings systems and methods
CN110796651A (zh) * 2019-10-29 2020-02-14 杭州阜博科技有限公司 图像质量的预测方法及装置、电子设备、存储介质
CN110751649B (zh) * 2019-10-29 2021-11-02 腾讯科技(深圳)有限公司 视频质量评估方法、装置、电子设备及存储介质
KR102395038B1 (ko) * 2019-11-20 2022-05-09 한국전자통신연구원 기계 학습 기반 특징과 지식 기반 특징을 이용한 비디오 화질 자동 측정 방법 및 이를 위한 장치
CN111127587B (zh) * 2019-12-16 2023-06-23 杭州电子科技大学 一种基于对抗生成网络的无参考图像质量地图生成方法
CN111192258A (zh) * 2020-01-02 2020-05-22 广州大学 一种图像质量评估方法及装置
CN111524123B (zh) 2020-04-23 2023-08-08 北京百度网讯科技有限公司 用于处理图像的方法和装置
CN111833326B (zh) * 2020-07-10 2022-02-11 深圳大学 图像质量评价方法、装置、计算机设备及存储介质
US11616959B2 (en) * 2020-07-24 2023-03-28 Ssimwave, Inc. Relationship modeling of encode quality and encode parameters based on source attributes
US11341682B2 (en) * 2020-08-13 2022-05-24 Argo AI, LLC Testing and validation of a camera under electromagnetic interference
KR20220043764A (ko) 2020-09-29 2022-04-05 삼성전자주식회사 비디오 품질 평가 방법 및 장치
CN112419242B (zh) * 2020-11-10 2023-09-15 西北大学 基于自注意力机制gan网络的无参考图像质量评价方法
CN112330650B (zh) * 2020-11-12 2024-06-28 李庆春 一种检索视频质量评价方法
CN112784698B (zh) * 2020-12-31 2024-07-02 杭州电子科技大学 基于深层次时空信息的无参考视频质量评价方法
CN112700425B (zh) * 2021-01-07 2024-04-26 云南电网有限责任公司电力科学研究院 一种用于电力设备x射线图像质量的判定方法
US11521639B1 (en) 2021-04-02 2022-12-06 Asapp, Inc. Speech sentiment analysis using a speech sentiment classifier pretrained with pseudo sentiment labels
WO2022217496A1 (zh) * 2021-04-14 2022-10-20 中国科学院深圳先进技术研究院 影像数据质量评估方法、装置、终端设备及可读存储介质
US20220415037A1 (en) * 2021-06-24 2022-12-29 Meta Platforms, Inc. Video corruption detection
US11763803B1 (en) 2021-07-28 2023-09-19 Asapp, Inc. System, method, and computer program for extracting utterances corresponding to a user problem statement in a conversation between a human agent and a user
CN113505854B (zh) * 2021-07-29 2023-08-15 济南博观智能科技有限公司 一种人脸图像质量评价模型构建方法、装置、设备及介质
KR20230073871A (ko) * 2021-11-19 2023-05-26 삼성전자주식회사 영상 처리 장치 및 그 동작 방법
US12067363B1 (en) 2022-02-24 2024-08-20 Asapp, Inc. System, method, and computer program for text sanitization
CN114332088B (zh) * 2022-03-11 2022-06-03 电子科技大学 一种基于运动估计的全参考视频质量评估方法
CN114638793B (zh) * 2022-04-19 2024-07-02 深圳闪回科技有限公司 一种屏幕老化程度检测方法及装置
CN117152092B (zh) * 2023-09-01 2024-05-28 国家广播电视总局广播电视规划院 全参考图像评价方法、装置、电子设备和计算机存储介质
CN118096770B (zh) * 2024-04-29 2024-06-28 江西财经大学 非视口依赖的抗畸变无参考全景图像质量评价方法与系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1695164A (zh) 2002-11-06 2005-11-09 新加坡科技研究局 生成用于评估图像或视频质量的质量导向重要性图的方法
EP1727088A1 (en) * 2005-05-25 2006-11-29 Thomson Licensing Method for assessing image quality
CN100588271C (zh) 2006-08-08 2010-02-03 安捷伦科技有限公司 基于分组度量和图像度量两者测量视频质量的系统和方法
WO2008115405A2 (en) * 2007-03-16 2008-09-25 Sti Medicals Systems, Llc A method of image quality assessment to procuce standardized imaging data
KR101092650B1 (ko) * 2010-01-12 2011-12-13 서강대학교산학협력단 양자화 코드를 이용한 화질 평가 방법 및 장치
RU2431889C1 (ru) * 2010-08-06 2011-10-20 Дмитрий Валерьевич Шмунк Способ суперразрешения изображений и нелинейный цифровой фильтр для его осуществления
CN102497576B (zh) * 2011-12-21 2013-11-20 浙江大学 基于Gabor特征互信息的全参考图像质量评价方法
US8942512B2 (en) * 2011-12-24 2015-01-27 Ecole De Technologie Superieure Methods and systems for processing a first image with reference to a second image
WO2013177779A1 (en) * 2012-05-31 2013-12-05 Thomson Licensing Image quality measurement based on local amplitude and phase spectra
WO2014094313A1 (en) 2012-12-21 2014-06-26 Thomson Licensing Video quality model, method for training a video quality model, and method for determining video quality using a video quality model

Also Published As

Publication number Publication date
EP3292512A1 (en) 2018-03-14
US9741107B2 (en) 2017-08-22
KR20180004208A (ko) 2018-01-10
US20160358321A1 (en) 2016-12-08
EP3292512B1 (en) 2021-01-20
KR101967089B1 (ko) 2019-04-08
JP2018516412A (ja) 2018-06-21
CN107636690B (zh) 2021-06-22
WO2016197026A1 (en) 2016-12-08
CN107636690A (zh) 2018-01-26
EP3292512A4 (en) 2019-01-02

Similar Documents

Publication Publication Date Title
JP6544543B2 (ja) 畳み込みニューラルネットワークに基づいたフルリファレンス画像品質評価方法
Sun et al. Blind quality assessment for in-the-wild images via hierarchical feature fusion and iterative mixed database training
Li et al. No-reference image quality assessment with deep convolutional neural networks
US11514694B2 (en) Teaching GAN (generative adversarial networks) to generate per-pixel annotation
JP2018101406A (ja) ニューラルネットワークにトレーニングデータを提供するための画像解析アルゴリズムの使用
JP2018516412A5 (ja)
CN113379071B (zh) 一种基于联邦学习的噪声标签修正方法
Fu et al. Blind image quality assessment for multiply distorted images via convolutional neural networks
Kundu et al. No-reference image quality assessment for high dynamic range images
CN111415304A (zh) 基于级联深度网络的水下视觉增强方法和装置
JP2022514580A (ja) 機械学習による光学補正
Athar et al. Degraded reference image quality assessment
Yi et al. No-reference quality assessment of underwater image enhancement
JP2022029262A (ja) 画像処理装置、画像処理方法、画像処理プログラム、および学習装置
Mao et al. Transfer learning for just noticeable difference estimation
Kalatehjari et al. A new reduced-reference image quality assessment based on the SVD signal projection
De et al. No-reference image contrast measure using image statistics and random forest
JP2018116672A (ja) 情報処理装置、情報処理方法およびプログラム
Gao et al. Image quality assessment using image description in information theory
Kim et al. Deep blind image quality assessment by learning sensitivity map
Barri et al. Data-driven modules for objective visual quality assessment focusing on benchmarking and SLAs
CN116953808B (zh) 一种地磁信号噪声压制方法及系统
US20240144432A1 (en) Image processing apparatus, image processing method, and storage medium
CN117951605B (zh) 扩散模型的量化方法、装置、计算机设备及存储介质
Yin Multipurpose image quality assessment for both human and computer vision systems via convolutional neural network

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190110

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20190308

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20190510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190522

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190604

R151 Written notification of patent or utility model registration

Ref document number: 6544543

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151