JP7415251B2 - 画像処理用の装置及び方法、並びにニューラルネットワークトをトレーニングするシステム - Google Patents
画像処理用の装置及び方法、並びにニューラルネットワークトをトレーニングするシステム Download PDFInfo
- Publication number
- JP7415251B2 JP7415251B2 JP2020529196A JP2020529196A JP7415251B2 JP 7415251 B2 JP7415251 B2 JP 7415251B2 JP 2020529196 A JP2020529196 A JP 2020529196A JP 2020529196 A JP2020529196 A JP 2020529196A JP 7415251 B2 JP7415251 B2 JP 7415251B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- feature image
- pixel
- pixels
- brightness
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims description 75
- 238000000034 method Methods 0.000 title claims description 60
- 238000012545 processing Methods 0.000 title description 26
- 238000013528 artificial neural network Methods 0.000 title description 10
- 230000000875 corresponding effect Effects 0.000 claims description 43
- 230000002596 correlated effect Effects 0.000 claims description 37
- 238000000605 extraction Methods 0.000 claims description 15
- 238000011176 pooling Methods 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 description 12
- 238000013135 deep learning Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000010606 normalization Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/094—Adversarial learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/20—Linear translation of whole images or parts thereof, e.g. panning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4007—Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
- G06T3/4076—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution using the original low-resolution images to iteratively correct the high-resolution images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
Description
本出願は、2018年9月30に出願された中国特許出願第201811155252.6号に基づく優先権と、2018年9月30に出願された中国特許出願第201811155326.6号に基づく優先権と、2018年9月30に出願された中国特許出願第201811155147.2号に基づく優先権と、2018年9月30に出願された中国特許出願第201811155930.9号に基づく優先権とを主張しており、その内容は、本明細書において出典明記により全体に組み込まれる。
Claims (16)
- 複数の相関性画像を生成する装置であって、
トレーニング画像を受信し、前記トレーニング画像から少なくとも1つ以上の特徴を抽出して、前記トレーニング画像に基づいて第1特徴画像を生成するように構成される特徴抽出ユニットと、
前記第1特徴画像を正規化し、第2特徴画像を生成するように構成される正規化器と、前記第2特徴画像に対して複数回の並進シフトを行って複数のシフトされた画像を生成し、前記複数のシフトされた画像の各々を前記第2特徴画像と相関させて複数の相関性画像を生成するように構成されるシフト相関ユニットとを含み、
前記シフト相関ユニットは、前記第2特徴画像のピクセルブロック内の一番左の又は一番右のa列のピクセルを削除し、前記ピクセルブロックの一番右の又は一番左の位置にa列のピクセルをそれぞれ追加することと、前記第2特徴画像のピクセルブロック内の最下位又は最上位のb行のピクセルを削除し、前記ピクセルブロックの最上位又は最下位の位置にb行のピクセルをそれぞれ追加することによって、前記第2特徴画像に対して前記複数回の並進シフトを行うように構成され、
0≦a<Yであり、0≦b<Xであり、a及びbはいずれも整数であり、Yは前記第2特徴画像のピクセルブロック内のピクセルの総列数であり、Xは前記第2特徴画像のピクセルブロック内のピクセルの総行数であり、
追加されたピクセルの各々は、0のピクセル値を有する、装置。 - 前記シフト相関ユニットは、前記複数のシフトされた画像の各々のピクセルブロック内の各ピクセルのピクセル値に前記第2特徴画像のピクセルブロック内の位置的に対応するピクセルのピクセル値を乗じることによって、前記複数のシフトされた画像の各々を前記第2特徴画像と相関させるように構成される、請求項1に記載の装置。
- 前記第1特徴画像は、輝度特徴画像であり、
前記特徴抽出ユニットは、
前記トレーニング画像から輝度情報を抽出して前記輝度特徴画像を生成するように構成される輝度検出器を含む請求項1又は請求項2に記載の装置。 - 前記輝度特徴画像を生成するために、前記輝度検出器は、次の式(1)によって前記輝度特徴画像における所与の位置でのピクセルの輝度値を確定するように構成され、
I=0.299R+0.587G+0.114B (1)
Iは、前記輝度値であり、
Rは、前記トレーニング画像における位置的に対応するピクセルの赤成分値であり、
Gは、前記トレーニング画像における位置的に対応するピクセルの緑成分値であり、
Bは、前記トレーニング画像における位置的に対応するピクセルの青成分値である、請求項3に記載の装置。 - 前記第2特徴画像は、第1サイズを有するピクセルブロックを含み、
前記複数のシフトされた画像の各々及び前記複数の相関性画像の各々は、前記第1サイズを有するピクセルブロックを含み、
前記複数のシフトされた画像の各々において、非ゼロピクセル値を有するピクセルは、前記第2特徴画像における同じ非ゼロピクセル値を持つ対応するピクセルを有する、請求項1から請求項5のいずれか一項に記載の装置。 - 複数の相関性画像を生成する方法であって、
前記方法は、
トレーニング画像に基づいて第1特徴画像を生成するステップと、
前記第1特徴画像を正規化し、第2特徴画像を生成するステップと、
前記第2特徴画像に対して複数回の並進シフトを行って複数のシフトされた画像を生成するステップと、
前記複数のシフトされた画像の各々を前記第2特徴画像と相関させて複数の相関性画像を生成するステップと
を含み、
前記複数回の並進シフトを行うステップは、
前記第2特徴画像のピクセルブロック内の一番左の又は一番右のa列のピクセルを削除し、前記ピクセルブロックの一番右の又は一番左の位置にa列のピクセルをそれぞれ追加するステップと、
前記第2特徴画像のピクセルブロック内の最下位又は最上位のb行のピクセルを削除し、前記ピクセルブロックの最上位又は最下位の位置にb行のピクセルをそれぞれ追加するステップと
を含み、
0≦a<Yであり、0≦b<Xであり、a及びbはいずれも整数であり、Yは前記第2特徴画像のピクセルブロック内のピクセルの総列数であり、Xは前記第2特徴画像のピクセルブロック内のピクセルの総行数であり、
追加されたピクセルの各々は、0のピクセル値を有する、方法。 - 前記複数のシフトされた画像の各々を前記第2特徴画像と相関させるステップは、前記複数のシフトされた画像の各々のピクセルブロック内の各ピクセルのピクセル値に前記第2特徴画像のピクセルブロック内の位置的に対応するピクセルのピクセル値を乗じるステップを含む、請求項7に記載の方法。
- a及びbの少なくとも一つは、前記複数回の並進シフトの実行中に少なくとも一回変化する、請求項7に記載の方法。
- X*Y回の並進シフトを行うステップを更に含み、
Yは前記第2特徴画像のピクセルブロック内のピクセルの総列数であり、Xは前記第2特徴画像のピクセルブロック内のピクセルの総行数である、請求項7から請求項9のいずれか一項に記載の方法。 - 前記第1特徴画像を生成する前に、前記トレーニング画像を受信するステップを更に含み、
前記第1特徴画像を生成するステップは、前記トレーニング画像の輝度情報に基づいて輝度特徴画像を生成するステップを含む、請求項7から請求項10のいずれか一項に記載の方法。 - 次の式(1)によって前記輝度特徴画像における所与の位置でのピクセルの輝度値を確定するステップを更に含み、
I=0.299R+0.587G+0.114B (1)
Iは、前記輝度値であり、
Rは、前記トレーニング画像における位置的に対応するピクセルの赤成分値であり、
Gは、前記トレーニング画像における位置的に対応するピクセルの緑成分値であり、
Bは、前記トレーニング画像における位置的に対応するピクセルの青成分値である、請求項11に記載の方法。 - 前記第1特徴画像は、第1サイズを有するピクセルブロックを含み、
前記複数のシフトされた画像の各々及び前記複数の相関性画像の各々は、前記第1サイズを有するピクセルブロックを含み、
前記複数のシフトされた画像の各々において、非ゼロピクセル値を有するピクセルは、前記第1特徴画像における同じ非ゼロピクセル値を持つ対応するピクセルを有する、請求項7から請求項13のいずれか一項に記載の方法。 - コンピュータに請求項7から14のいずれか一項に記載の方法をコンピュータに実行させる命令を記憶する非一時的なコンピュータ読み取り可能媒体。
- 敵対的生成ネットワークをトレーニングするシステムであって、
鑑別ネットワークマイクロプロセッサによりトレーニングされるように構成される生成ネットワークマイクロプロセッサと、前記敵対的生成ネットワークにカップリングされた鑑別ネットワークマイクロプロセッサとを含む敵対的生成ネットワークプロセッサを含み、前記鑑別ネットワークマイクロプロセッサは、
複数の請求項1から6のいずれか一項に記載の装置にカップリングされた複数の入力端と、
それぞれが前記複数の入力端のうちの一つにカップリングされた複数の分析モジュールと、
カスケードの各ステージが前記複数の分析モジュールのうちの一つ及び前記カスケードの前のステージにおけるプーリングモジュールにカップリングされたプーリングモジュールを含む前記カスケードにより、接続された複数のプーリングモジュールと、
前記カスケードの最後のステージにおけるプーリングモジュールにカップリングされた鑑別ネットワークと
を含むシステム。
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811155147.2 | 2018-09-30 | ||
CN201811155252.6A CN109255390B (zh) | 2018-09-30 | 2018-09-30 | 训练图像的预处理方法及模块、鉴别器、可读存储介质 |
CN201811155326.6 | 2018-09-30 | ||
CN201811155252.6 | 2018-09-30 | ||
CN201811155326.6A CN109345455B (zh) | 2018-09-30 | 2018-09-30 | 图像鉴别方法、鉴别器和计算机可读存储介质 |
CN201811155930.9 | 2018-09-30 | ||
CN201811155930.9A CN109345456B (zh) | 2018-09-30 | 2018-09-30 | 生成对抗网络训练方法、图像处理方法、设备及存储介质 |
CN201811155147.2A CN109360151B (zh) | 2018-09-30 | 2018-09-30 | 图像处理方法及系统、分辨率提升方法、可读存储介质 |
PCT/CN2019/083872 WO2020062846A1 (en) | 2018-09-30 | 2019-04-23 | Apparatus and method for image processing, and system for training neural network |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2022501663A JP2022501663A (ja) | 2022-01-06 |
JPWO2020062846A5 JPWO2020062846A5 (ja) | 2022-04-27 |
JP7415251B2 true JP7415251B2 (ja) | 2024-01-17 |
Family
ID=69950197
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020529196A Active JP7415251B2 (ja) | 2018-09-30 | 2019-04-23 | 画像処理用の装置及び方法、並びにニューラルネットワークトをトレーニングするシステム |
JP2020528242A Active JP7463643B2 (ja) | 2018-09-30 | 2019-06-20 | 画像処理用の装置、方法及びコンピュータ読み取り可能媒体、並びにニューラルネットワークトレーニングシステム |
JP2020528931A Active JP7446997B2 (ja) | 2018-09-30 | 2019-09-25 | 敵対的生成ネットワークのトレーニング方法、画像処理方法、デバイスおよび記憶媒体 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020528242A Active JP7463643B2 (ja) | 2018-09-30 | 2019-06-20 | 画像処理用の装置、方法及びコンピュータ読み取り可能媒体、並びにニューラルネットワークトレーニングシステム |
JP2020528931A Active JP7446997B2 (ja) | 2018-09-30 | 2019-09-25 | 敵対的生成ネットワークのトレーニング方法、画像処理方法、デバイスおよび記憶媒体 |
Country Status (9)
Country | Link |
---|---|
US (4) | US11615505B2 (ja) |
EP (4) | EP3857447A4 (ja) |
JP (3) | JP7415251B2 (ja) |
KR (2) | KR102661434B1 (ja) |
AU (1) | AU2019350918B2 (ja) |
BR (1) | BR112020022560A2 (ja) |
MX (1) | MX2020013580A (ja) |
RU (1) | RU2762144C1 (ja) |
WO (4) | WO2020062846A1 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3973459A1 (en) * | 2019-05-23 | 2022-03-30 | DeepMind Technologies Limited | Generative adversarial networks with temporal and spatial discriminators for efficient video generation |
JP7312026B2 (ja) * | 2019-06-12 | 2023-07-20 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
EP3788933A1 (en) * | 2019-09-05 | 2021-03-10 | BSH Hausgeräte GmbH | Method for controlling a home appliance |
EP4049235A4 (en) * | 2020-01-23 | 2023-01-11 | Samsung Electronics Co., Ltd. | ELECTRONIC DEVICE AND ELECTRONIC DEVICE CONTROL METHOD |
US11507831B2 (en) | 2020-02-24 | 2022-11-22 | Stmicroelectronics International N.V. | Pooling unit for deep learning acceleration |
CN111695605B (zh) * | 2020-05-20 | 2024-05-10 | 平安科技(深圳)有限公司 | 基于oct图像的图像识别方法、服务器及存储介质 |
EP3937120B1 (en) * | 2020-07-08 | 2023-12-20 | Sartorius Stedim Data Analytics AB | Computer-implemented method, computer program product and system for processing images |
US11887279B2 (en) * | 2020-08-25 | 2024-01-30 | Sharif University Of Technology | Machine learning-based denoising of an image |
US11455811B2 (en) * | 2020-08-28 | 2022-09-27 | Check it out Co., Ltd. | System and method for verifying authenticity of an anti-counterfeiting element, and method for building a machine learning model used to verify authenticity of an anti-counterfeiting element |
CN112132012B (zh) * | 2020-09-22 | 2022-04-26 | 中国科学院空天信息创新研究院 | 基于生成对抗网络的高分辨率sar船舶图像生成方法 |
CN114830168A (zh) * | 2020-11-16 | 2022-07-29 | 京东方科技集团股份有限公司 | 图像重建方法、电子设备和计算机可读存储介质 |
CN112419200B (zh) * | 2020-12-04 | 2024-01-19 | 宁波舜宇仪器有限公司 | 一种图像质量优化方法及显示方法 |
US11895330B2 (en) * | 2021-01-25 | 2024-02-06 | Lemon Inc. | Neural network-based video compression with bit allocation |
CN113012064B (zh) * | 2021-03-10 | 2023-12-12 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、设备及存储介质 |
CN112884673A (zh) * | 2021-03-11 | 2021-06-01 | 西安建筑科技大学 | 改进损失函数SinGAN的墓室壁画分块间缺失信息的重建方法 |
US20220405980A1 (en) * | 2021-06-17 | 2022-12-22 | Nvidia Corporation | Fused processing of a continuous mathematical operator |
CN113962360B (zh) * | 2021-10-09 | 2024-04-05 | 西安交通大学 | 一种基于gan网络的样本数据增强方法及系统 |
KR102548283B1 (ko) * | 2021-12-22 | 2023-06-27 | (주)뉴로컴즈 | 콘볼루션 신경망 컴퓨팅 장치 |
CN114331903B (zh) * | 2021-12-31 | 2023-05-12 | 电子科技大学 | 一种图像修复方法及存储介质 |
CN115063492B (zh) * | 2022-04-28 | 2023-08-08 | 宁波大学 | 一种抵抗jpeg压缩的对抗样本的生成方法 |
KR20240033619A (ko) | 2022-09-05 | 2024-03-12 | 삼성에스디에스 주식회사 | 문서 내 관심 영역 추출 방법 및 장치 |
CN115393242A (zh) * | 2022-09-30 | 2022-11-25 | 国网电力空间技术有限公司 | 一种基于gan的电网异物图像数据增强的方法和装置 |
CN115631178B (zh) * | 2022-11-03 | 2023-11-10 | 昆山润石智能科技有限公司 | 自动晶圆缺陷检测方法、系统、设备及存储介质 |
CN117196985A (zh) * | 2023-09-12 | 2023-12-08 | 军事科学院军事医学研究院军事兽医研究所 | 一种基于深度强化学习的视觉去雨雾方法 |
Family Cites Families (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5781196A (en) | 1990-10-19 | 1998-07-14 | Eidos Plc Of The Boat House | Video compression by extracting pixel changes exceeding thresholds |
US5754697A (en) | 1994-12-02 | 1998-05-19 | Fu; Chi-Yung | Selective document image data compression technique |
US6766067B2 (en) | 2001-04-20 | 2004-07-20 | Mitsubishi Electric Research Laboratories, Inc. | One-pass super-resolution images |
US7215831B2 (en) | 2001-04-26 | 2007-05-08 | Georgia Tech Research Corp. | Video enhancement using multiple frame techniques |
US7428019B2 (en) | 2001-12-26 | 2008-09-23 | Yeda Research And Development Co. Ltd. | System and method for increasing space or time resolution in video |
CN101593269B (zh) | 2008-05-29 | 2012-05-02 | 汉王科技股份有限公司 | 人脸识别装置及方法 |
KR20130001213A (ko) | 2010-01-28 | 2013-01-03 | 이섬 리서치 디벨러프먼트 컴파니 오브 더 히브루 유니버시티 오브 예루살렘 엘티디. | 입력 이미지로부터 증가된 픽셀 해상도의 출력 이미지를 생성하는 방법 및 시스템 |
CN101872472B (zh) | 2010-06-02 | 2012-03-28 | 中国科学院自动化研究所 | 一种基于样本学习的人脸图像超分辨率重建方法 |
US9378542B2 (en) | 2011-09-28 | 2016-06-28 | The United States Of America As Represented By The Secretary Of The Army | System and processor implemented method for improved image quality and generating an image of a target illuminated by quantum particles |
US8908962B2 (en) * | 2011-09-30 | 2014-12-09 | Ebay Inc. | Item recommendations using image feature data |
EP2662824A1 (en) | 2012-05-10 | 2013-11-13 | Thomson Licensing | Method and device for generating a super-resolution version of a low resolution input data structure |
US8675999B1 (en) | 2012-09-28 | 2014-03-18 | Hong Kong Applied Science And Technology Research Institute Co., Ltd. | Apparatus, system, and method for multi-patch based super-resolution from an image |
CN102915527A (zh) | 2012-10-15 | 2013-02-06 | 中山大学 | 基于形态学成分分析的人脸图像超分辨率重建方法 |
MX342466B (es) | 2012-11-27 | 2016-09-30 | Lg Electronics Inc | Aparato de transmision-recepcion de señal y metodo de transmision-recepcion de señal. |
CN103514580B (zh) | 2013-09-26 | 2016-06-08 | 香港应用科技研究院有限公司 | 用于获得视觉体验优化的超分辨率图像的方法和系统 |
EP2908285A1 (en) | 2014-02-13 | 2015-08-19 | Thomson Licensing | Method for performing super-resolution on single images and apparatus for performing super-resolution on single images |
CN104853059B (zh) | 2014-02-17 | 2018-12-18 | 台达电子工业股份有限公司 | 超分辨率图像处理方法及其装置 |
TWI492187B (zh) | 2014-02-17 | 2015-07-11 | Delta Electronics Inc | 超解析度影像處理方法及其裝置 |
CN103903236B (zh) * | 2014-03-10 | 2016-08-31 | 北京信息科技大学 | 人脸图像超分辨率重建的方法和装置 |
US9454807B2 (en) | 2014-03-25 | 2016-09-27 | Spreadtrum Communications (Shanghai) Co., Ltd. | Methods and systems for denoising images |
US9865036B1 (en) * | 2015-02-05 | 2018-01-09 | Pixelworks, Inc. | Image super resolution via spare representation of multi-class sequential and joint dictionaries |
KR102338372B1 (ko) * | 2015-09-30 | 2021-12-13 | 삼성전자주식회사 | 영상으로부터 객체를 분할하는 방법 및 장치 |
RU2694021C1 (ru) | 2015-12-14 | 2019-07-08 | Моушен Метрикс Интернешэнл Корп. | Способ и устройство идентификации частей фрагментированного материала в пределах изображения |
US10360477B2 (en) * | 2016-01-11 | 2019-07-23 | Kla-Tencor Corp. | Accelerating semiconductor-related computations using learning based models |
CN107315566B (zh) * | 2016-04-26 | 2020-11-03 | 中科寒武纪科技股份有限公司 | 一种用于执行向量循环移位运算的装置和方法 |
FR3050846B1 (fr) * | 2016-04-27 | 2019-05-03 | Commissariat A L'energie Atomique Et Aux Energies Alternatives | Dispositif et procede de distribution de donnees de convolution d'un reseau de neurones convolutionnel |
CN105976318A (zh) | 2016-04-28 | 2016-09-28 | 北京工业大学 | 一种图像超分辨率重建方法 |
CN105975931B (zh) | 2016-05-04 | 2019-06-14 | 浙江大学 | 一种基于多尺度池化的卷积神经网络人脸识别方法 |
CN105975968B (zh) * | 2016-05-06 | 2019-03-26 | 西安理工大学 | 一种基于Caffe框架的深度学习车牌字符识别方法 |
RU2635883C1 (ru) * | 2016-06-02 | 2017-11-16 | Самсунг Электроникс Ко., Лтд. | Способ и система обработки изображений для формирования изображений сверхвысокого разрешения |
US10319076B2 (en) | 2016-06-16 | 2019-06-11 | Facebook, Inc. | Producing higher-quality samples of natural images |
US11024009B2 (en) | 2016-09-15 | 2021-06-01 | Twitter, Inc. | Super resolution using a generative adversarial network |
JP2018063504A (ja) * | 2016-10-12 | 2018-04-19 | 株式会社リコー | 生成モデル学習方法、装置及びプログラム |
CN108074215B (zh) * | 2016-11-09 | 2020-04-14 | 京东方科技集团股份有限公司 | 图像升频系统及其训练方法、以及图像升频方法 |
KR20180057096A (ko) * | 2016-11-21 | 2018-05-30 | 삼성전자주식회사 | 표정 인식과 트레이닝을 수행하는 방법 및 장치 |
CN108229508B (zh) * | 2016-12-15 | 2022-01-04 | 富士通株式会社 | 用于训练图像处理装置的训练装置和训练方法 |
KR101854071B1 (ko) * | 2017-01-13 | 2018-05-03 | 고려대학교 산학협력단 | 딥러닝을 사용하여 관심 부위 이미지를 생성하는 방법 및 장치 |
US10482639B2 (en) | 2017-02-21 | 2019-11-19 | Adobe Inc. | Deep high-resolution style synthesis |
KR101947782B1 (ko) * | 2017-02-22 | 2019-02-13 | 한국과학기술원 | 열화상 영상 기반의 거리 추정 장치 및 방법. 그리고 이를 위한 신경망 학습 방법 |
JP2018139071A (ja) * | 2017-02-24 | 2018-09-06 | 株式会社リコー | 生成モデル学習方法、生成モデル学習装置およびプログラム |
KR102499396B1 (ko) * | 2017-03-03 | 2023-02-13 | 삼성전자 주식회사 | 뉴럴 네트워크 장치 및 뉴럴 네트워크 장치의 동작 방법 |
RU2652722C1 (ru) * | 2017-05-03 | 2018-04-28 | Самсунг Электроникс Ко., Лтд. | Обработка данных для сверхразрешения |
CN107133601B (zh) | 2017-05-13 | 2021-03-23 | 五邑大学 | 一种基于生成式对抗网络图像超分辨率技术的行人再识别方法 |
CN107154023B (zh) | 2017-05-17 | 2019-11-05 | 电子科技大学 | 基于生成对抗网络和亚像素卷积的人脸超分辨率重建方法 |
CN107369189A (zh) | 2017-07-21 | 2017-11-21 | 成都信息工程大学 | 基于特征损失的医学图像超分辨率重建方法 |
CN107527044B (zh) | 2017-09-18 | 2021-04-30 | 北京邮电大学 | 一种基于搜索的多张车牌清晰化方法及装置 |
WO2019061020A1 (zh) | 2017-09-26 | 2019-04-04 | 深圳市大疆创新科技有限公司 | 图像生成方法、图像生成装置和机器可读存储介质 |
US10552944B2 (en) * | 2017-10-13 | 2020-02-04 | Adobe Inc. | Image upscaling with controllable noise reduction using a neural network |
CN108122197B (zh) * | 2017-10-27 | 2021-05-04 | 江西高创保安服务技术有限公司 | 一种基于深度学习的图像超分辨率重建方法 |
CN107766860A (zh) | 2017-10-31 | 2018-03-06 | 武汉大学 | 基于级联卷积神经网络的自然场景图像文本检测方法 |
CN107767343B (zh) | 2017-11-09 | 2021-08-31 | 京东方科技集团股份有限公司 | 图像处理方法、处理装置和处理设备 |
CN108154499B (zh) | 2017-12-08 | 2021-10-08 | 东华大学 | 一种基于k-svd学习字典的机织物纹理瑕疵检测方法 |
CN108052940A (zh) | 2017-12-17 | 2018-05-18 | 南京理工大学 | 基于深度学习的sar遥感图像水面目标检测方法 |
CN107977932B (zh) | 2017-12-28 | 2021-04-23 | 北京工业大学 | 一种基于可鉴别属性约束生成对抗网络的人脸图像超分辨率重建方法 |
CN108268870B (zh) | 2018-01-29 | 2020-10-09 | 重庆师范大学 | 基于对抗学习的多尺度特征融合超声图像语义分割方法 |
CN108334848B (zh) | 2018-02-06 | 2020-12-25 | 哈尔滨工业大学 | 一种基于生成对抗网络的微小人脸识别方法 |
CN108416428B (zh) | 2018-02-28 | 2021-09-14 | 中国计量大学 | 一种基于卷积神经网络的机器人视觉定位方法 |
US11105942B2 (en) * | 2018-03-27 | 2021-08-31 | Schlumberger Technology Corporation | Generative adversarial network seismic data processor |
US10783622B2 (en) * | 2018-04-25 | 2020-09-22 | Adobe Inc. | Training and utilizing an image exposure transformation neural network to generate a long-exposure image from a single short-exposure image |
US11222415B2 (en) * | 2018-04-26 | 2022-01-11 | The Regents Of The University Of California | Systems and methods for deep learning microscopy |
CN108596830B (zh) | 2018-04-28 | 2022-04-22 | 国信优易数据股份有限公司 | 一种图像风格迁移模型训练方法以及图像风格迁移方法 |
KR102184755B1 (ko) * | 2018-05-31 | 2020-11-30 | 서울대학교 산학협력단 | 안면 특화 초 고화질 심층 신경망 학습 장치 및 방법 |
US11756160B2 (en) * | 2018-07-27 | 2023-09-12 | Washington University | ML-based methods for pseudo-CT and HR MR image estimation |
CN109345456B (zh) * | 2018-09-30 | 2021-01-19 | 京东方科技集团股份有限公司 | 生成对抗网络训练方法、图像处理方法、设备及存储介质 |
CN109360151B (zh) * | 2018-09-30 | 2021-03-05 | 京东方科技集团股份有限公司 | 图像处理方法及系统、分辨率提升方法、可读存储介质 |
CN109345455B (zh) * | 2018-09-30 | 2021-01-26 | 京东方科技集团股份有限公司 | 图像鉴别方法、鉴别器和计算机可读存储介质 |
CN109255390B (zh) * | 2018-09-30 | 2021-01-29 | 京东方科技集团股份有限公司 | 训练图像的预处理方法及模块、鉴别器、可读存储介质 |
-
2019
- 2019-04-23 JP JP2020529196A patent/JP7415251B2/ja active Active
- 2019-04-23 EP EP19850782.4A patent/EP3857447A4/en active Pending
- 2019-04-23 MX MX2020013580A patent/MX2020013580A/es unknown
- 2019-04-23 BR BR112020022560-6A patent/BR112020022560A2/pt unknown
- 2019-04-23 AU AU2019350918A patent/AU2019350918B2/en active Active
- 2019-04-23 WO PCT/CN2019/083872 patent/WO2020062846A1/en active Application Filing
- 2019-04-23 KR KR1020207037174A patent/KR102661434B1/ko active IP Right Grant
- 2019-04-23 RU RU2020136214A patent/RU2762144C1/ru active
- 2019-04-23 US US16/604,410 patent/US11615505B2/en active Active
- 2019-06-20 JP JP2020528242A patent/JP7463643B2/ja active Active
- 2019-06-20 EP EP19850757.6A patent/EP3857503A4/en not_active Withdrawn
- 2019-06-20 US US16/614,558 patent/US11348005B2/en active Active
- 2019-06-20 EP EP19850805.3A patent/EP3857504A4/en active Pending
- 2019-06-20 WO PCT/CN2019/092113 patent/WO2020062958A1/en active Application Filing
- 2019-06-20 WO PCT/CN2019/092042 patent/WO2020062957A1/en active Application Filing
- 2019-06-20 US US16/614,547 patent/US11361222B2/en active Active
- 2019-09-25 US US16/759,669 patent/US11449751B2/en active Active
- 2019-09-25 WO PCT/CN2019/107761 patent/WO2020063648A1/zh active Application Filing
- 2019-09-25 KR KR1020207014462A patent/KR102389173B1/ko active IP Right Grant
- 2019-09-25 EP EP19864756.2A patent/EP3859655A4/en active Pending
- 2019-09-25 JP JP2020528931A patent/JP7446997B2/ja active Active
Non-Patent Citations (1)
Title |
---|
Amir Khan,Implementation and Experiments on Face Detection System (FDS) Using Perceptual Quality Aware Features,Eastern Mediterranean University Institutional Repository (EMU I-REP),Eastern Mediterranean University,2017年02月,http://i-rep.emu.edu.tr:8080/xmlui/bitstream/handle/11129/4326/khanamir.pdf?sequence=1,他庁引用文献 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7415251B2 (ja) | 画像処理用の装置及び方法、並びにニューラルネットワークトをトレーニングするシステム | |
CN106934397B (zh) | 图像处理方法、装置及电子设备 | |
Bayar et al. | Design principles of convolutional neural networks for multimedia forensics | |
CN109325954B (zh) | 图像分割方法、装置及电子设备 | |
JPWO2020062846A5 (ja) | ||
WO2018153322A1 (zh) | 关键点检测方法、神经网络训练方法、装置和电子设备 | |
CN112132156B (zh) | 多深度特征融合的图像显著性目标检测方法及系统 | |
CN110020658B (zh) | 一种基于多任务深度学习的显著目标检测方法 | |
CN111985427A (zh) | 活体检测方法、设备及可读存储介质 | |
CN110688966B (zh) | 语义指导的行人重识别方法 | |
CN114913338A (zh) | 分割模型的训练方法及装置、图像识别方法及装置 | |
JP2010531507A (ja) | 高性能画像識別 | |
Belhedi et al. | Adaptive scene‐text binarisation on images captured by smartphones | |
Tang et al. | Single image rain removal model using pure rain dictionary learning | |
CN115147895A (zh) | 人脸鉴伪方法、装置及计算机程序产品 | |
CN114463379A (zh) | 一种视频关键点的动态捕捉方法及装置 | |
Pal et al. | Super-resolution of textual images using autoencoders for text identification | |
CN113706636A (zh) | 一种用于篡改图像识别的方法与装置 | |
Knoche et al. | Susceptibility to image resolution in face recognition and trainings strategies | |
Scott et al. | No-reference utility estimation with a convolutional neural network | |
Korde et al. | Splicing Detection Technique Based on the Key-Point | |
Cogranne et al. | A new edge detector based on parametric surface model: Regression surface descriptor | |
Azam et al. | Evaluation of Image Support Resolution Deep Learning Technique based on PSNR Value | |
AMMAR et al. | IQI-UNet: A Robust Gaussian Noise Removal in Image Quality Improvement]{IQI-UNet: A Robust Gaussian Noise Removal in Image Quality Improvement | |
Choksi et al. | Text Extraction from Natural Scene Images using Prewitt Edge Detection Method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220419 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220419 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20230329 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230627 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230927 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7415251 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |