JP6544543B2 - 畳み込みニューラルネットワークに基づいたフルリファレンス画像品質評価方法 - Google Patents
畳み込みニューラルネットワークに基づいたフルリファレンス画像品質評価方法 Download PDFInfo
- Publication number
- JP6544543B2 JP6544543B2 JP2017563173A JP2017563173A JP6544543B2 JP 6544543 B2 JP6544543 B2 JP 6544543B2 JP 2017563173 A JP2017563173 A JP 2017563173A JP 2017563173 A JP2017563173 A JP 2017563173A JP 6544543 B2 JP6544543 B2 JP 6544543B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- reference image
- distortion
- similarity
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 41
- 238000013527 convolutional neural network Methods 0.000 title claims description 27
- 238000013441 quality evaluation Methods 0.000 title description 2
- 230000006870 function Effects 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 13
- 238000011176 pooling Methods 0.000 claims description 9
- 230000008447 perception Effects 0.000 claims description 8
- 238000013442 quality metrics Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000012417 linear regression Methods 0.000 claims description 5
- 230000008878 coupling Effects 0.000 claims description 3
- 238000010168 coupling process Methods 0.000 claims description 3
- 238000005859 coupling reaction Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims 4
- 238000013507 mapping Methods 0.000 claims 1
- 230000000007 visual effect Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000001303 quality assessment method Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
- G06T7/001—Industrial image inspection using an image reference approach
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
- G06V10/993—Evaluation of the quality of the acquired pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/194—References adjustable by an adaptive method, e.g. learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
- H04N17/004—Diagnosis, testing or measuring for television systems or their details for digital television systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
本出願は、2015年6月5日に提出された、名称「畳み込みニューラルネットワークに基づいたフルリファレンス画像品質評価方法」の米国特許出願第14/732,518号に基づく優先権を主張し、当該出願は、本明細書において本出願に全て記載されるように引用により本明細書に組み込まれる。
が歪み及び画像パッチに適用されて、歪み画像及びリファレンス画像それぞれに対してフィルタ処理された特徴マップ
をもたらし、ここで、
とすると、
であり、ここでbはバイアス項である。
が入力パッチのペアを表し、ynが計算されたw類似性スコアメトリック(グラウンドトルース品質スコアとも呼ばれる)を表し、
がネットワークパラメータWとの入力ペアについての予測類似性スコアメトリックを表すとすると、目的関数は次式で記述することができる。
は強制的にゼロでなければならない。結合パターンは、ランダムに選ぶことができる。1つの特定の実施形態において有用であることが分かっているマスクは、以下で定義される。
102:歪み
100:FR−IQAモデル(トレーニング)
Claims (18)
- リファレンス画像に対する歪み画像の画像品質を評価するシステムであって、前記システムが、前記歪み画像及び前記リファレンス画像を入力として受け入れて画像品質のメトリックを出力として提供する畳み込みニューラルネットワークを備える、システム。
- 前記畳み込みニューラルネットワークが複数の層を含む、請求項1に記載のシステム。
- 前記複数の層が、
前記歪み画像及び前記リファレンス画像の各々を構成する画像パッチに正規化関数を適用して、正規化歪み画像及び正規化リファレンス画像を提供するよう構成された入力層と、
N1フィルタを用いて前記正規化歪み画像及び前記正規化リファレンス画像の各々を畳み込み、1つのフィルタ処理された正規化歪み画像と1つの対応するフィルタ処理された正規化リファレンス画像とを各々が含む特徴マップのN1(1よりも大きい整数)個のペアを提供するよう構成された畳み込み層と、
を含む、請求項2に記載のシステム。 - 前記複数の層が更に、
前記歪み画像及び前記リファレンス画像の各々から提供される前記N1個の特徴マップのN2個の線形結合を計算して、フィルタ処理された正規化歪み画像の1つの組み合わせと、フィルタ処理された正規化リファレンス画像の対応する1つの組み合わせとを各々が含む結合特徴マップのN2(1よりも大きい整数)個のペアを提供するよう構成された線形結合層と、
前記結合特徴マップのN2個のペアのうちの異なるものからの対応するピクセルに各々が基づいたN2個の類似性マップを計算するよう構成された類似性計算層と、
前記N2個の類似性マップの各々について平均プーリングを適用して、N2個の類似性入力値を提供するよう構成されたプーリング層と、
を備える、請求項3に記載のシステム。 - 前記複数の層が更に、
前記N2個の類似性入力値に作用して、M個(N2よりも大きい整数)の隠れノード値を提供するよう構成された全結合層と、
前記M個の隠れノード値を単一の出力ノードにマップして、画像品質のメトリックを提供するよう構成された線形回帰層と、
を含む、請求項4に記載のシステム。 - N1=N2であり、N1=10である、請求項5に記載のシステム。
- M=800である、請求項5に記載のシステム。
- 前記畳み込み層によって前記特徴マップのN1個のペアが前記複数の層の後続の層に提供される前に、前記特徴マップのN1個のペアの各ノードにおいて二乗活性化関数が適用される、請求項3に記載のシステム。
- リファレンス画像に対する歪み画像の画像品質を評価する方法であって、前記方法が、 前記歪み画像及び前記リファレンス画像を処理して画像品質のメトリックとして提供するよう構成された畳み込みニューラルネットワークに対して、前記歪み画像及び前記リファレンス画像を入力するステップを含む、方法。
- 前記畳み込みニューラルネットワークによって実行される処理が、
前記歪み画像及び前記リファレンス画像の各々を構成する画像パッチに正規化関数を適用して、正規化歪み画像及び正規化リファレンス画像を提供するステップと、
N1フィルタを用いて前記正規化歪み画像及び前記正規化リファレンス画像の各々を畳み込み、1つのフィルタ処理された正規化歪み画像と1つの対応するフィルタ処理された正規化リファレンス画像とを各々が含む特徴マップのN1(1よりも大きい整数)個のペアを提供するステップと、
を含む、請求項9に記載の方法。 - 前記歪み画像及び前記リファレンス画像の各々から提供される前記N1個の特徴マップのN2個の線形結合を計算して、フィルタ処理された正規化歪み画像の1つの組み合わせと、フィルタ処理された正規化リファレンス画像の対応する1つの組み合わせとを各々が含む結合特徴マップのN2個のペアを提供するステップと、
前記結合特徴マップのN2個のペアのうちの異なるものからの対応するピクセルに各々が基づいたN2個の類似性マップを計算するステップと、
前記N2個の類似性マップの各々について平均プーリングを適用して、N2個の類似性入力値を提供するステップと、
を更に含む、請求項10に記載の方法。 - 前記N2個の類似性入力値を全結合層に入力して、M個(N2よりも大きい整数)の隠れノード値を提供するステップと、
回帰層を通じて前記M個の隠れノード値をマップして、画像品質のメトリックを提供するステップと、
を更に含む、請求項11に記載の方法。 - M=800である、請求項12に記載の方法。
- リファレンス画像に対する歪み画像の画像品質を評価するために畳み込みニューラルネットワークをトレーニングする方法であって、前記方法が、
前記畳み込みニューラルネットワークにおけるネットワークパラメータの現行のセットとしてネットワークパラメータの初期セットを選択するステップと、
歪み画像及び対応するリファレンス画像から各々がなる画像の複数のペアの各々について、計算された類似性スコアメトリックScを提供するよう前記畳み込みニューラルネットワークを通じて前記画像のペアを処理するステップと、
前記計算された類似性スコアメトリックScと前記ペアについての期待類似性スコアメトリックSpの比較に基づいて、前記ネットワークパラメータの現行のセットのうちの1又はそれよりも多い前記ネットワークパラメータを調整するステップと、
を含み、前記期待類似性スコアメトリックSpが、人間の知覚によって提供される、方法。 - 前記画像の各ペアが、歪み画像パッチIdis及びそのレファレンスパッチIrefを含み、
前記画像のペアを処理するステップが、前記画像のペアを前記畳み込みニューラルネットワークに通して、サポートベクトル回帰(SVR)目的関数を前記複数の画像パッチに適用することによって、結果として得られる歪みスコアメトリックSを前記期待類似性スコアメトリックSpと比較するステップを含む、請求項14に記載の方法。 - 前記SVR目的関数が
- 確率的勾配降下法(SGD)を用いてバックプロパゲーションを実行するステップを更に含む、請求項14に記載の方法。
- 前記畳み込みニューラルネットワークを通じて前記画像のペアを処理するステップが、結合特徴マップを提供するよう、前記歪み画像及びリファレンス画像の各ペアから生成された特徴マップの線形結合を計算するステップを含み、
前記線形結合を計算するステップが、スパースバイナリマスクを用いて、前記計算に対する特徴マップの入力と前記計算からの前記結合特徴マップの出力との間の結合を制約するステップを含む、請求項14に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/732,518 US9741107B2 (en) | 2015-06-05 | 2015-06-05 | Full reference image quality assessment based on convolutional neural network |
US14/732,518 | 2015-06-05 | ||
PCT/US2016/035868 WO2016197026A1 (en) | 2015-06-05 | 2016-06-03 | Full reference image quality assessment based on convolutional neural network |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018516412A JP2018516412A (ja) | 2018-06-21 |
JP2018516412A5 JP2018516412A5 (ja) | 2019-06-13 |
JP6544543B2 true JP6544543B2 (ja) | 2019-07-17 |
Family
ID=57441857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017563173A Active JP6544543B2 (ja) | 2015-06-05 | 2016-06-03 | 畳み込みニューラルネットワークに基づいたフルリファレンス画像品質評価方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9741107B2 (ja) |
EP (1) | EP3292512B1 (ja) |
JP (1) | JP6544543B2 (ja) |
KR (1) | KR101967089B1 (ja) |
CN (1) | CN107636690B (ja) |
WO (1) | WO2016197026A1 (ja) |
Families Citing this family (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11263432B2 (en) * | 2015-02-06 | 2022-03-01 | Veridium Ip Limited | Systems and methods for performing fingerprint based user authentication using imagery captured using mobile devices |
US9734567B2 (en) * | 2015-06-24 | 2017-08-15 | Samsung Electronics Co., Ltd. | Label-free non-reference image quality assessment via deep neural network |
US10410330B2 (en) * | 2015-11-12 | 2019-09-10 | University Of Virginia Patent Foundation | System and method for comparison-based image quality assessment |
US10356343B2 (en) * | 2016-03-18 | 2019-07-16 | Raytheon Company | Methods and system for geometric distortion correction for space-based rolling-shutter framing sensors |
US10043240B2 (en) | 2016-04-14 | 2018-08-07 | Microsoft Technology Licensing, Llc | Optimal cropping of digital image based on professionalism score of subject |
US9904871B2 (en) * | 2016-04-14 | 2018-02-27 | Microsoft Technologies Licensing, LLC | Deep convolutional neural network prediction of image professionalism |
US10043254B2 (en) | 2016-04-14 | 2018-08-07 | Microsoft Technology Licensing, Llc | Optimal image transformation based on professionalism score of subject |
WO2018033137A1 (zh) * | 2016-08-19 | 2018-02-22 | 北京市商汤科技开发有限公司 | 在视频图像中展示业务对象的方法、装置和电子设备 |
US10360494B2 (en) * | 2016-11-30 | 2019-07-23 | Altumview Systems Inc. | Convolutional neural network (CNN) system based on resolution-limited small-scale CNN modules |
US10834406B2 (en) * | 2016-12-12 | 2020-11-10 | Netflix, Inc. | Device-consistent techniques for predicting absolute perceptual video quality |
US11113800B2 (en) * | 2017-01-18 | 2021-09-07 | Nvidia Corporation | Filtering image data using a neural network |
US11537869B2 (en) * | 2017-02-17 | 2022-12-27 | Twitter, Inc. | Difference metric for machine learning-based processing systems |
WO2018152741A1 (en) * | 2017-02-23 | 2018-08-30 | Nokia Technologies Oy | Collaborative activation for deep learning field |
CN106920215B (zh) * | 2017-03-06 | 2020-03-27 | 长沙全度影像科技有限公司 | 一种全景图像配准效果的检测方法 |
CN108304755B (zh) * | 2017-03-08 | 2021-05-18 | 腾讯科技(深圳)有限公司 | 用于图像处理的神经网络模型的训练方法和装置 |
CN107103331B (zh) * | 2017-04-01 | 2020-06-16 | 中北大学 | 一种基于深度学习的图像融合方法 |
WO2018186991A1 (en) * | 2017-04-04 | 2018-10-11 | Board Of Regents, The University Of Texas System | Assessing quality of images or videos using a two-stage quality assessment |
US10699160B2 (en) | 2017-08-23 | 2020-06-30 | Samsung Electronics Co., Ltd. | Neural network method and apparatus |
CN107644415B (zh) * | 2017-09-08 | 2019-02-22 | 众安信息技术服务有限公司 | 一种文本图像质量评估方法及设备 |
CN107705299B (zh) * | 2017-09-25 | 2021-05-14 | 安徽睿极智能科技有限公司 | 基于多属性特征的图像质量分类方法 |
CN107679490B (zh) * | 2017-09-29 | 2019-06-28 | 百度在线网络技术(北京)有限公司 | 用于检测图像质量的方法和装置 |
US10540589B2 (en) * | 2017-10-24 | 2020-01-21 | Deep North, Inc. | Image quality assessment using similar scenes as reference |
CN108171256A (zh) * | 2017-11-27 | 2018-06-15 | 深圳市深网视界科技有限公司 | 人脸图像质评模型构建、筛选、识别方法及设备和介质 |
US10740659B2 (en) * | 2017-12-14 | 2020-08-11 | International Business Machines Corporation | Fusing sparse kernels to approximate a full kernel of a convolutional neural network |
CN108074239B (zh) * | 2017-12-30 | 2021-12-17 | 中国传媒大学 | 一种基于先验感知质量特征图的无参考图像质量客观评价方法 |
CN108335289A (zh) * | 2018-01-18 | 2018-07-27 | 天津大学 | 一种全参考融合的图像客观质量评价方法 |
US10721477B2 (en) * | 2018-02-07 | 2020-07-21 | Netflix, Inc. | Techniques for predicting perceptual video quality based on complementary perceptual quality models |
US10887602B2 (en) | 2018-02-07 | 2021-01-05 | Netflix, Inc. | Techniques for modeling temporal distortions when predicting perceptual video quality |
CN108389192A (zh) * | 2018-02-11 | 2018-08-10 | 天津大学 | 基于卷积神经网络的立体图像舒适度评价方法 |
US11216698B2 (en) * | 2018-02-16 | 2022-01-04 | Spirent Communications, Inc. | Training a non-reference video scoring system with full reference video scores |
US10916003B2 (en) * | 2018-03-20 | 2021-02-09 | Uber Technologies, Inc. | Image quality scorer machine |
US11361416B2 (en) | 2018-03-20 | 2022-06-14 | Netflix, Inc. | Quantifying encoding comparison metric uncertainty via bootstrapping |
CN108259893B (zh) * | 2018-03-22 | 2020-08-18 | 天津大学 | 基于双流卷积神经网络的虚拟现实视频质量评价方法 |
CN108875904A (zh) * | 2018-04-04 | 2018-11-23 | 北京迈格威科技有限公司 | 图像处理方法、图像处理装置和计算机可读存储介质 |
US11436717B2 (en) | 2018-04-04 | 2022-09-06 | Panasonic Intellectual Property Management Co., Ltd. | Image processing device and image processing method |
CN108596890B (zh) * | 2018-04-20 | 2020-06-16 | 浙江科技学院 | 一种基于视觉测量率自适应融合的全参考图像质量客观评价方法 |
CN108648180B (zh) * | 2018-04-20 | 2020-11-17 | 浙江科技学院 | 一种基于视觉多重特征深度融合处理的全参考图像质量客观评价方法 |
CN108596902B (zh) * | 2018-05-04 | 2020-09-08 | 北京大学 | 基于选通卷积神经网络的多任务全参考图像质量评价方法 |
US10628708B2 (en) * | 2018-05-18 | 2020-04-21 | Adobe Inc. | Utilizing a deep neural network-based model to identify visually similar digital images based on user-selected visual attributes |
CN108665460B (zh) * | 2018-05-23 | 2020-07-03 | 浙江科技学院 | 基于组合神经网络和分类神经网络的图像质量评价方法 |
KR102184755B1 (ko) * | 2018-05-31 | 2020-11-30 | 서울대학교 산학협력단 | 안면 특화 초 고화질 심층 신경망 학습 장치 및 방법 |
CN108986075A (zh) * | 2018-06-13 | 2018-12-11 | 浙江大华技术股份有限公司 | 一种优选图像的判断方法及装置 |
CN109360183B (zh) * | 2018-08-20 | 2021-05-11 | 中国电子进出口有限公司 | 一种基于卷积神经网络的人脸图像质量评估方法和系统 |
US11704791B2 (en) * | 2018-08-30 | 2023-07-18 | Topcon Corporation | Multivariate and multi-resolution retinal image anomaly detection system |
JP6925474B2 (ja) * | 2018-08-31 | 2021-08-25 | ソニーセミコンダクタソリューションズ株式会社 | 固体撮像装置、情報処理システム、固体撮像装置の動作方法及びプログラム |
JP6697042B2 (ja) * | 2018-08-31 | 2020-05-20 | ソニーセミコンダクタソリューションズ株式会社 | 固体撮像システム、固体撮像方法及びプログラム |
JP7075012B2 (ja) * | 2018-09-05 | 2022-05-25 | 日本電信電話株式会社 | 画像処理装置、画像処理方法及び画像処理プログラム |
US11055819B1 (en) * | 2018-09-27 | 2021-07-06 | Amazon Technologies, Inc. | DualPath Deep BackProjection Network for super-resolution |
CN111105357B (zh) * | 2018-10-25 | 2023-05-02 | 杭州海康威视数字技术股份有限公司 | 一种失真图像的去失真方法、装置及电子设备 |
US11132586B2 (en) * | 2018-10-29 | 2021-09-28 | Nec Corporation | Rolling shutter rectification in images/videos using convolutional neural networks with applications to SFM/SLAM with rolling shutter images/videos |
CN109685772B (zh) * | 2018-12-10 | 2022-06-14 | 福州大学 | 一种基于配准失真表示的无参照立体图像质量评估方法 |
US11557107B2 (en) | 2019-01-02 | 2023-01-17 | Bank Of America Corporation | Intelligent recognition and extraction of numerical data from non-numerical graphical representations |
CN109801273B (zh) * | 2019-01-08 | 2022-11-01 | 华侨大学 | 一种基于极平面线性相似度的光场图像质量评价方法 |
US10325179B1 (en) * | 2019-01-23 | 2019-06-18 | StradVision, Inc. | Learning method and learning device for pooling ROI by using masking parameters to be used for mobile devices or compact networks via hardware optimization, and testing method and testing device using the same |
CN109871780B (zh) * | 2019-01-28 | 2023-02-10 | 中国科学院重庆绿色智能技术研究院 | 一种人脸质量判决方法、系统及人脸识别方法、系统 |
US11308598B2 (en) * | 2019-02-14 | 2022-04-19 | Sharif University Of Technology | Quality assessment of an image |
US11405695B2 (en) | 2019-04-08 | 2022-08-02 | Spirent Communications, Inc. | Training an encrypted video stream network scoring system with non-reference video scores |
CN110033446B (zh) * | 2019-04-10 | 2022-12-06 | 西安电子科技大学 | 基于孪生网络的增强图像质量评价方法 |
KR102420104B1 (ko) * | 2019-05-16 | 2022-07-12 | 삼성전자주식회사 | 영상 처리 장치 및 그 동작방법 |
US11521011B2 (en) | 2019-06-06 | 2022-12-06 | Samsung Electronics Co., Ltd. | Method and apparatus for training neural network model for enhancing image detail |
CN110517237B (zh) * | 2019-08-20 | 2022-12-06 | 西安电子科技大学 | 基于膨胀三维卷积神经网络的无参考视频质量评价方法 |
CN110766657B (zh) * | 2019-09-20 | 2022-03-18 | 华中科技大学 | 一种激光干扰图像质量评价方法 |
US10877540B2 (en) * | 2019-10-04 | 2020-12-29 | Intel Corporation | Content adaptive display power savings systems and methods |
CN110796651A (zh) * | 2019-10-29 | 2020-02-14 | 杭州阜博科技有限公司 | 图像质量的预测方法及装置、电子设备、存储介质 |
CN110751649B (zh) * | 2019-10-29 | 2021-11-02 | 腾讯科技(深圳)有限公司 | 视频质量评估方法、装置、电子设备及存储介质 |
KR102395038B1 (ko) * | 2019-11-20 | 2022-05-09 | 한국전자통신연구원 | 기계 학습 기반 특징과 지식 기반 특징을 이용한 비디오 화질 자동 측정 방법 및 이를 위한 장치 |
CN111127587B (zh) * | 2019-12-16 | 2023-06-23 | 杭州电子科技大学 | 一种基于对抗生成网络的无参考图像质量地图生成方法 |
CN111192258A (zh) * | 2020-01-02 | 2020-05-22 | 广州大学 | 一种图像质量评估方法及装置 |
CN111524123B (zh) | 2020-04-23 | 2023-08-08 | 北京百度网讯科技有限公司 | 用于处理图像的方法和装置 |
CN111833326B (zh) * | 2020-07-10 | 2022-02-11 | 深圳大学 | 图像质量评价方法、装置、计算机设备及存储介质 |
US11616959B2 (en) * | 2020-07-24 | 2023-03-28 | Ssimwave, Inc. | Relationship modeling of encode quality and encode parameters based on source attributes |
US11341682B2 (en) * | 2020-08-13 | 2022-05-24 | Argo AI, LLC | Testing and validation of a camera under electromagnetic interference |
KR20220043764A (ko) | 2020-09-29 | 2022-04-05 | 삼성전자주식회사 | 비디오 품질 평가 방법 및 장치 |
CN112419242B (zh) * | 2020-11-10 | 2023-09-15 | 西北大学 | 基于自注意力机制gan网络的无参考图像质量评价方法 |
CN112330650B (zh) * | 2020-11-12 | 2024-06-28 | 李庆春 | 一种检索视频质量评价方法 |
CN112784698B (zh) * | 2020-12-31 | 2024-07-02 | 杭州电子科技大学 | 基于深层次时空信息的无参考视频质量评价方法 |
CN112700425B (zh) * | 2021-01-07 | 2024-04-26 | 云南电网有限责任公司电力科学研究院 | 一种用于电力设备x射线图像质量的判定方法 |
US11521639B1 (en) | 2021-04-02 | 2022-12-06 | Asapp, Inc. | Speech sentiment analysis using a speech sentiment classifier pretrained with pseudo sentiment labels |
WO2022217496A1 (zh) * | 2021-04-14 | 2022-10-20 | 中国科学院深圳先进技术研究院 | 影像数据质量评估方法、装置、终端设备及可读存储介质 |
US20220415037A1 (en) * | 2021-06-24 | 2022-12-29 | Meta Platforms, Inc. | Video corruption detection |
US11763803B1 (en) | 2021-07-28 | 2023-09-19 | Asapp, Inc. | System, method, and computer program for extracting utterances corresponding to a user problem statement in a conversation between a human agent and a user |
CN113505854B (zh) * | 2021-07-29 | 2023-08-15 | 济南博观智能科技有限公司 | 一种人脸图像质量评价模型构建方法、装置、设备及介质 |
KR20230073871A (ko) * | 2021-11-19 | 2023-05-26 | 삼성전자주식회사 | 영상 처리 장치 및 그 동작 방법 |
US12067363B1 (en) | 2022-02-24 | 2024-08-20 | Asapp, Inc. | System, method, and computer program for text sanitization |
CN114332088B (zh) * | 2022-03-11 | 2022-06-03 | 电子科技大学 | 一种基于运动估计的全参考视频质量评估方法 |
CN114638793B (zh) * | 2022-04-19 | 2024-07-02 | 深圳闪回科技有限公司 | 一种屏幕老化程度检测方法及装置 |
CN117152092B (zh) * | 2023-09-01 | 2024-05-28 | 国家广播电视总局广播电视规划院 | 全参考图像评价方法、装置、电子设备和计算机存储介质 |
CN118096770B (zh) * | 2024-04-29 | 2024-06-28 | 江西财经大学 | 非视口依赖的抗畸变无参考全景图像质量评价方法与系统 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1695164A (zh) | 2002-11-06 | 2005-11-09 | 新加坡科技研究局 | 生成用于评估图像或视频质量的质量导向重要性图的方法 |
EP1727088A1 (en) * | 2005-05-25 | 2006-11-29 | Thomson Licensing | Method for assessing image quality |
CN100588271C (zh) | 2006-08-08 | 2010-02-03 | 安捷伦科技有限公司 | 基于分组度量和图像度量两者测量视频质量的系统和方法 |
WO2008115405A2 (en) * | 2007-03-16 | 2008-09-25 | Sti Medicals Systems, Llc | A method of image quality assessment to procuce standardized imaging data |
KR101092650B1 (ko) * | 2010-01-12 | 2011-12-13 | 서강대학교산학협력단 | 양자화 코드를 이용한 화질 평가 방법 및 장치 |
RU2431889C1 (ru) * | 2010-08-06 | 2011-10-20 | Дмитрий Валерьевич Шмунк | Способ суперразрешения изображений и нелинейный цифровой фильтр для его осуществления |
CN102497576B (zh) * | 2011-12-21 | 2013-11-20 | 浙江大学 | 基于Gabor特征互信息的全参考图像质量评价方法 |
US8942512B2 (en) * | 2011-12-24 | 2015-01-27 | Ecole De Technologie Superieure | Methods and systems for processing a first image with reference to a second image |
WO2013177779A1 (en) * | 2012-05-31 | 2013-12-05 | Thomson Licensing | Image quality measurement based on local amplitude and phase spectra |
WO2014094313A1 (en) | 2012-12-21 | 2014-06-26 | Thomson Licensing | Video quality model, method for training a video quality model, and method for determining video quality using a video quality model |
-
2015
- 2015-06-05 US US14/732,518 patent/US9741107B2/en active Active
-
2016
- 2016-06-03 JP JP2017563173A patent/JP6544543B2/ja active Active
- 2016-06-03 KR KR1020177034859A patent/KR101967089B1/ko active IP Right Grant
- 2016-06-03 EP EP16804582.1A patent/EP3292512B1/en active Active
- 2016-06-03 CN CN201680032412.0A patent/CN107636690B/zh active Active
- 2016-06-03 WO PCT/US2016/035868 patent/WO2016197026A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
EP3292512A1 (en) | 2018-03-14 |
US9741107B2 (en) | 2017-08-22 |
KR20180004208A (ko) | 2018-01-10 |
US20160358321A1 (en) | 2016-12-08 |
EP3292512B1 (en) | 2021-01-20 |
KR101967089B1 (ko) | 2019-04-08 |
JP2018516412A (ja) | 2018-06-21 |
CN107636690B (zh) | 2021-06-22 |
WO2016197026A1 (en) | 2016-12-08 |
CN107636690A (zh) | 2018-01-26 |
EP3292512A4 (en) | 2019-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6544543B2 (ja) | 畳み込みニューラルネットワークに基づいたフルリファレンス画像品質評価方法 | |
Sun et al. | Blind quality assessment for in-the-wild images via hierarchical feature fusion and iterative mixed database training | |
Li et al. | No-reference image quality assessment with deep convolutional neural networks | |
US11514694B2 (en) | Teaching GAN (generative adversarial networks) to generate per-pixel annotation | |
JP2018101406A (ja) | ニューラルネットワークにトレーニングデータを提供するための画像解析アルゴリズムの使用 | |
JP2018516412A5 (ja) | ||
CN113379071B (zh) | 一种基于联邦学习的噪声标签修正方法 | |
Fu et al. | Blind image quality assessment for multiply distorted images via convolutional neural networks | |
Kundu et al. | No-reference image quality assessment for high dynamic range images | |
CN111415304A (zh) | 基于级联深度网络的水下视觉增强方法和装置 | |
JP2022514580A (ja) | 機械学習による光学補正 | |
Athar et al. | Degraded reference image quality assessment | |
Yi et al. | No-reference quality assessment of underwater image enhancement | |
JP2022029262A (ja) | 画像処理装置、画像処理方法、画像処理プログラム、および学習装置 | |
Mao et al. | Transfer learning for just noticeable difference estimation | |
Kalatehjari et al. | A new reduced-reference image quality assessment based on the SVD signal projection | |
De et al. | No-reference image contrast measure using image statistics and random forest | |
JP2018116672A (ja) | 情報処理装置、情報処理方法およびプログラム | |
Gao et al. | Image quality assessment using image description in information theory | |
Kim et al. | Deep blind image quality assessment by learning sensitivity map | |
Barri et al. | Data-driven modules for objective visual quality assessment focusing on benchmarking and SLAs | |
CN116953808B (zh) | 一种地磁信号噪声压制方法及系统 | |
US20240144432A1 (en) | Image processing apparatus, image processing method, and storage medium | |
CN117951605B (zh) | 扩散模型的量化方法、装置、计算机设备及存储介质 | |
Yin | Multipurpose image quality assessment for both human and computer vision systems via convolutional neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190110 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190308 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20190510 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190522 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190604 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6544543 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |