JP7438108B2 - 画像処理方法、処理装置及び処理デバイス - Google Patents
画像処理方法、処理装置及び処理デバイス Download PDFInfo
- Publication number
- JP7438108B2 JP7438108B2 JP2020526028A JP2020526028A JP7438108B2 JP 7438108 B2 JP7438108 B2 JP 7438108B2 JP 2020526028 A JP2020526028 A JP 2020526028A JP 2020526028 A JP2020526028 A JP 2020526028A JP 7438108 B2 JP7438108 B2 JP 7438108B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- neural network
- training
- output
- resolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 94
- 238000003672 processing method Methods 0.000 title claims description 28
- 238000013528 artificial neural network Methods 0.000 claims description 315
- 238000012549 training Methods 0.000 claims description 231
- 230000006870 function Effects 0.000 claims description 65
- 238000006243 chemical reaction Methods 0.000 claims description 53
- 238000000034 method Methods 0.000 claims description 41
- 230000008569 process Effects 0.000 claims description 38
- 230000009466 transformation Effects 0.000 claims description 27
- 238000004458 analytical method Methods 0.000 claims description 22
- 230000015654 memory Effects 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000005070 sampling Methods 0.000 claims 4
- 238000010586 diagram Methods 0.000 description 17
- 230000000694 effects Effects 0.000 description 15
- 239000000284 extract Substances 0.000 description 8
- 230000000593 degrading effect Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 230000001537 neural effect Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000283070 Equus zebra Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000013442 quality metrics Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/60—Image enhancement or restoration using machine learning, e.g. neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/01—Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
- H04N7/0117—Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving conversion of the spatial resolution of the incoming video signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0428—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Computer Graphics (AREA)
- Signal Processing (AREA)
- Probability & Statistics with Applications (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
本願は、2017年11月9日に出願された、発明名称が「画像処理方法、処理装置及び処理デバイス」である中国特許出願(出願番号201711100015.5)の優先権を主張し、当該中国特許出願を全文引用によりここに援用する。
1304 超解像度ニューラルネットワークモジュール
1402 プロセッサ
1404 メモリ
Claims (17)
- 生成ニューラルネットワークによって、入力画像および第1のノイズ画像に基づき、前記入力画像に対して画像変換処理を行い、変換された第1の出力画像を出力することと、
超解像度ニューラルネットワークによって、第1の出力画像および第2のノイズ画像に基づき、前記第1の出力画像に対して高解像度変換処理を行い、第2の出力画像を出力することと、
前記生成ニューラルネットワークによって、第1のトレーニング画像および第1のトレーニングノイズ画像に基づき、第1のトレーニング出力画像を生成することと、
前記生成ニューラルネットワークによって、前記第1のトレーニング画像、および、前記第1のトレーニングノイズ画像と異なる第2のトレーニングノイズ画像に基づき、第2のトレーニング出力画像を生成することと、
第1のトレーニング画像、第1のトレーニング出力画像、及び第2のトレーニング出力画像に基づいて、前記生成ニューラルネットワークをトレーニングさせることと、を含み、
前記生成ニューラルネットワークをトレーニングさせることは、
前記第1のトレーニング出力画像を識別ニューラルネットワークに入力し、前記第1のトレーニング出力画像が変換特徴を有するか否かを識別する識別ラベルを出力することと、
前記第2のトレーニング出力画像を識別ニューラルネットワークに入力し、前記第2のトレーニング出力画像が変換特徴を有するか否かを識別する識別ラベルを出力することと、
第1の損失算出手段によって、前記第1のトレーニング画像、第1のトレーニング出力画像、第2のトレーニング出力画像、および該当する識別ラベルに基づき、前記生成ニューラルネットワークの損失値を算出し、前記生成ニューラルネットワークのパラメータを最適化することと、を含み、
前記第1の損失算出手段は、分析ネットワーク、第1の損失算出器、及び最適化器を含み、前記第1の損失算出手段によって前記生成ニューラルネットワークの損失値を算出することは、
分析ネットワークによって、前記第1のトレーニング画像、第1のトレーニング出力画像、第2のトレーニング出力画像のコンテンツ特徴を出力し、分析ネットワークによって、前記第1のトレーニング出力画像および第2のトレーニング出力画像のスタイル特徴を出力することと、
第1の損失算出器によって、分析ネットワークで抽出されたコンテンツ特徴、スタイル特徴、前記第1のトレーニング出力画像及び前記第2のトレーニング出力画像の識別ラベルに基づき、第1の損失関数に従って前記生成ニューラルネットワークの損失値を算出することと、
最適化器によって、前記生成ニューラルネットワークの損失値に基づき、前記生成ニューラルネットワークのパラメータを最適化することと、を含む
ことを特徴とする画像処理方法。 - 前記入力画像は、第1の色チャンネル、第2の色チャンネル、及び第3の色チャンネルを含み、
前記第1のノイズ画像は、N個(Nは1以上の正整数である)のチャンネルを含み、
前記生成ニューラルネットワークの入力は、第1のノイズ画像チャンネル、および入力画像の第1の色チャンネル、第2の色チャンネル、第3の色チャンネルを含み、
前記生成ニューラルネットワークの出力は、第1の色チャンネル、第2の色チャンネル、及び第3の色チャンネルを含む第1の出力画像である
ことを特徴とする請求項1に記載の画像処理方法。 - 前記生成ニューラルネットワークは、1つ以上のダウンサンプリングモジュールと、1つ以上の残差モジュールと、1つ以上のアップサンプリングモジュールとを含み、
前記ダウンサンプリングモジュールは、順次に接続される畳み込み層、ダウンサンプリング層、および実例標準化層を含み、
前記残差モジュールは、順次に接続される畳み込み層、および実例標準化層を含み、
前記アップサンプリングモジュールは、順次に接続されるアップサンプリング層、実例標準化層、及び畳み込み層を含み、
前記アップサンプリングモジュールの個数は、前記ダウンサンプリングモジュールの個数と同じである
ことを特徴とする請求項1または2に記載の画像処理方法。 - 前記第2のノイズ画像は、M個(Mは1以上の正整数である)のチャンネルを含み、
前記超解像度ニューラルネットワークの入力は、第2のノイズ画像チャンネル、および第1の出力画像の第1の色チャンネル、第2の色チャンネル、および第3の色チャンネルを含み、
前記超解像度ニューラルネットワークの出力は、第1の色チャンネル、第2の色チャンネル、および第3の色チャンネルを含む第2の出力画像である
ことを特徴とする請求項1~3のいずれか1項に記載の画像処理方法。 - 前記超解像度ニューラルネットワークは、順次に接続されるアップグレーディングモジュールおよび変換モジュールを含み、超解像度ニューラルネットワークによって高解像度変換処理を行うことは、
前記アップグレーディングモジュールによって、第1の出力画像および第2のノイズ画像に対してアップサンプリング処理を行い、輝度チャンネル、第1の色差チャンネルおよび第2の色差チャンネルを含む第1の中間画像を出力することと、
前記変換モジュールによって、アップグレーディングモジュールにより出力された第1の中間画像を、第1の色チャンネル、第2の色チャンネル、および第3の色チャンネルを含む第2の出力画像に変換することと、を含む
ことを特徴とする請求項1~4のいずれか1項に記載の画像処理方法。 - 前記アップグレーディングモジュールは、第1のサブネットワーク、第2のサブネットワーク、および第3のサブネットワークを含み、
各サブネットワークの入力は、いずれも第1の出力画像および第2のノイズ画像であり、
各サブネットワークは、同じ構成を有しており、同じ個数の畳み込み層およびアップグレーディング層を含む
ことを特徴とする請求項5に記載の画像処理方法。 - 前記第1の損失関数は、スタイル相違損失関数を含み、前記生成ニューラルネットワークの損失値を算出することは、前記第1の損失算出器によって、第1のトレーニング出力画像のスタイル特徴と第2のトレーニング出力画像のスタイル特徴に基づき、スタイル相違損失関数に従って前記生成ニューラルネットワークのスタイル損失値を算出することを含み、
前記第1の損失関数は、コンテンツ損失関数をさらに含み、前記生成ニューラルネットワークの損失値を算出することは、第1のトレーニング画像、第1のトレーニング出力画像、及び第2のトレーニング出力画像のコンテンツ特性に基づき、コンテンツ損失関数に従って前記生成ニューラルネットワークのコンテンツ損失値を算出することを含む
ことを特徴とする請求項1に記載の画像処理方法。 - 前記第1の出力画像を第1のサンプル画像として、前記第1のサンプル画像から低解像度の画像を、解像度が前記第1のサンプル画像より低の超解像度トレーニング画像として抽出することと、
超解像度ニューラルネットワークによって、超解像度トレーニング画像と超解像度トレーニングノイズ画像に基づき、解像度が前記第1のサンプル画像と同じ第2のサンプル画像を出力することと、
第1のサンプル画像および第2のサンプル画像に基づいて、前記超解像度ニューラルネットワークのコスト関数を低減することにより、超解像度ニューラルネットワークのパラメータを最適化することと、をさらに含む
ことを特徴とする請求項1~7のいずれか1項に記載の画像処理方法。 - 入力画像および第1のノイズ画像に基づき、前記入力画像に対して画像変換処理を行い、変換された第1の出力画像を出力するように配置される生成ニューラルネットワークモジュールと、
第1の出力画像および第2のノイズ画像に基づき、前記第1の出力画像に対して高解像度変換処理を行い、第2の出力画像を出力するように配置される超解像度ニューラルネットワークモジュールと、
前記生成ニューラルネットワークモジュールの出力画像に基づき、前記生成ニューラルネットワークモジュールをトレーニングさせるように配置されるトレーニングニューラルネットワークモジュールと、含み、
前記生成ニューラルネットワークモジュールは、さらに、第1のトレーニング画像および第1のトレーニングノイズ画像に基づき、変換された第1のトレーニング出力画像を出力し、前記生成ニューラルネットワークモジュールは、さらに、第1のトレーニング画像、および、前記第1のトレーニングノイズ画像と異なる第2のトレーニングノイズ画像に基づき、変換された第2のトレーニング出力画像を出力し、
前記トレーニングニューラルネットワークモジュールは、第1のトレーニング画像、第1のトレーニング出力画像、及び第2のトレーニング出力画像に基づき、前記生成ニューラルネットワークモジュールをトレーニングさせ、
前記トレーニングニューラルネットワークモジュールは、
前記第1のトレーニング出力画像および前記第2のトレーニング出力画像が変換特徴を有するか否かを識別する識別ラベルを出力するように配置される識別ニューラルネットワークモジュールと、
前記第1のトレーニング画像、第1のトレーニング出力画像、第2のトレーニング出力画像、および該当する識別ラベルに基づき、前記生成ニューラルネットワークモジュールの損失値を算出し、前記生成ニューラルネットワークモジュールのパラメータを最適化するように配置される第1の損失算出手段と、を含み、
前記第1の損失算出手段は、
前記第1のトレーニング画像、第1のトレーニング出力画像、第2のトレーニング出力画像のコンテンツ特徴を出力するように配置される分析ネットワークと、
分析ネットワークで抽出されたコンテンツ特徴、スタイル特徴、前記第1のトレーニング出力画像及び前記第2のトレーニング出力画像の識別ラベルに基づき、第1の損失関数に従って前記生成ニューラルネットワークモジュールの損失値を算出するように配置される第1の損失算出器と、
前記生成ニューラルネットワークモジュールの損失値に基づき、前記生成ニューラルネットワークモジュールのパラメータを最適化する最適化器と、を含む
ことを特徴とする画像処理装置。 - 前記入力画像は、第1の色チャンネル、第2の色チャンネル、及び第3の色チャンネルを含み、
前記生成ニューラルネットワークモジュールの入力は、第1のノイズ画像チャンネル、および入力画像の第1の色チャンネル、第2の色チャンネル、第3の色チャンネルを含み、
前記生成ニューラルネットワークモジュールの出力は、第1の色チャンネル、第2の色チャンネル、及び第3の色チャンネルを含む第1の出力画像である
ことを特徴とする請求項9に記載の画像処理装置。 - 前記生成ニューラルネットワークモジュールは、1つ以上のダウンサンプリングモジュールと、1つ以上の残差モジュールと、1つ以上のアップサンプリングモジュールとを含み、
前記ダウンサンプリングモジュールは、順次に接続される畳み込み層、ダウンサンプリング層、および実例標準化層を含み、
前記残差モジュールは、順次に接続される畳み込み層、および実例標準化層を含み、
前記アップサンプリングモジュールは、順次に接続されるアップサンプリング層、実例標準化層、及び畳み込み層を含み、
前記アップサンプリングモジュールの個数は、前記ダウンサンプリングモジュールの個数と同じである
ことを特徴とする請求項9または10に記載の画像処理装置。 - 前記超解像度ニューラルネットワークモジュールの入力は、第2のノイズ画像チャンネル、および第1の出力画像の第1の色チャンネル、第2の色チャンネル、および第3の色チャンネルを含み、
前記超解像度ニューラルネットワークモジュールの出力は、第1の色チャンネル、第2の色チャンネル、および第3の色チャンネルを含む第2の出力画像である
ことを特徴とする請求項9~11のいずれか1項に記載の画像処理装置。 - 前記超解像度ニューラルネットワークモジュールは、順次に接続されるアップグレーディングモジュールおよび変換モジュールを含み、
前記アップグレーディングモジュールは、第1の出力画像および第2のノイズ画像に対してアップサンプリング処理を行い、輝度チャンネル、第1の色差チャンネルおよび第2の色差チャンネルを含む第1の中間画像を出力するように配置され、
前記変換モジュールは、アップグレーディングモジュールにより出力された第1の中間画像を、第1の色チャンネル、第2の色チャンネル、および第3の色チャンネルを含む第2の出力画像に変換するように配置され、
前記アップグレーディングモジュールは、第1のサブネットワーク、第2のサブネットワーク、および第3のサブネットワークを含むように配置される
ことを特徴とする請求項9~12のいずれか1項に記載の画像処理装置。 - 前記第1のサブネットワーク、第2のサブネットワーク、および第3のサブネットワークの入力は、第1の出力画像および第2のノイズ画像であり、出力画像は、輝度チャンネル、第1の色差チャンネルおよび第2の色差チャンネルを含む3つのチャンネルを有し、
前記第1のサブネットワーク、第2のサブネットワーク、および第3のサブネットワークは、同じ構成を有しており、各サブネットワークは、順次に接続される1つ以上の畳み込み層および1つのアップグレーディング層を含む少なくとも1つのアップグレーディングサブモジュールを有する
ことを特徴とする請求項13に記載の画像処理装置。 - 前記第1の損失関数は、スタイル相違損失関数を含み、第1のトレーニング出力画像のスタイル特徴と第2のトレーニング出力画像のスタイル特徴に基づき、前記生成ニューラルネットワークモジュールのスタイル損失値を算出し、
前記第1の損失関数は、コンテンツ損失関数をさらに含み、第1のトレーニング画像、第1のトレーニング出力画像、及び第2のトレーニング出力画像のコンテンツ特性に基づき、前記生成ニューラルネットワークモジュールのコンテンツ損失値を算出する
ことを特徴とする請求項9に記載の画像処理装置。 - トレーニングニューラルネットワークモジュールは、さらに、超解像度ニューラルネットワークの出力に基づいて超解像度ニューラルネットワークモジュールをトレーニングさせるように配置され、
前記超解像度ニューラルネットワークモジュールは、前記第1の出力画像を第1のサンプル画像として前記第1のサンプル画像から抽出された低解像度の画像である超解像度トレーニング画像、および、取得された超解像度トレーニングノイズ画像に基づいて、第2のサンプル画像を出力し、
前記トレーニングニューラルネットワークモジュールは、
第1のサンプル画像および第2のサンプル画像に基づいて識別ラベルを出力するように配置される第2の識別ニューラルネットワークモジュールをさらに含み、
前記最適化器は、
前記超解像度ニューラルネットワークモジュールのコスト関数を低減することにより、前記超解像度ニューラルネットワークモジュールのパラメータを最適化する
ことを特徴とする請求項9または15に記載の画像処理装置。 - 1つ以上のプロセッサと、
1つ以上のメモリと、を含み、
前記メモリは、前記1つ以上のプロセッサによって実行されると、請求項1~8のいずれか1項に記載の画像処理方法を実行し、又は請求項9~16のいずれか1項に記載の画像処理装置を実現するコンピュータ読み取り可能なコードを記憶する
ことを特徴とする画像処理デバイス。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711100015.5 | 2017-11-09 | ||
CN201711100015.5A CN107767343B (zh) | 2017-11-09 | 2017-11-09 | 图像处理方法、处理装置和处理设备 |
PCT/CN2018/114848 WO2019091459A1 (zh) | 2017-11-09 | 2018-11-09 | 图像处理方法、处理装置和处理设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021502644A JP2021502644A (ja) | 2021-01-28 |
JP7438108B2 true JP7438108B2 (ja) | 2024-02-26 |
Family
ID=61272242
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020526028A Active JP7438108B2 (ja) | 2017-11-09 | 2018-11-09 | 画像処理方法、処理装置及び処理デバイス |
Country Status (5)
Country | Link |
---|---|
US (1) | US10430683B2 (ja) |
EP (1) | EP3709255A4 (ja) |
JP (1) | JP7438108B2 (ja) |
CN (1) | CN107767343B (ja) |
WO (1) | WO2019091459A1 (ja) |
Families Citing this family (84)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107767343B (zh) * | 2017-11-09 | 2021-08-31 | 京东方科技集团股份有限公司 | 图像处理方法、处理装置和处理设备 |
WO2019123544A1 (ja) * | 2017-12-19 | 2019-06-27 | オリンパス株式会社 | データ処理方法およびデータ処理装置 |
CN108288251A (zh) * | 2018-02-11 | 2018-07-17 | 深圳创维-Rgb电子有限公司 | 图像超分辨率方法、装置及计算机可读存储介质 |
US10599951B2 (en) * | 2018-03-28 | 2020-03-24 | Kla-Tencor Corp. | Training a neural network for defect detection in low resolution images |
CN111937392B (zh) * | 2018-04-17 | 2024-05-10 | 联发科技股份有限公司 | 视频编解码的神经网络方法和装置 |
CN110390234B (zh) * | 2018-04-23 | 2023-10-13 | 佳能株式会社 | 图像处理装置和方法及存储介质 |
CN110458754B (zh) * | 2018-05-07 | 2021-12-03 | Tcl科技集团股份有限公司 | 图像生成方法及终端设备 |
CN108595916B (zh) * | 2018-05-10 | 2020-10-20 | 浙江工业大学 | 基于生成对抗网络的基因表达全谱推断方法 |
CN108875787B (zh) * | 2018-05-23 | 2020-07-14 | 北京市商汤科技开发有限公司 | 一种图像识别方法及装置、计算机设备和存储介质 |
CN109801214B (zh) * | 2018-05-29 | 2023-08-29 | 京东方科技集团股份有限公司 | 图像重构装置及方法、设备、计算机可读存储介质 |
CN110555808B (zh) * | 2018-05-31 | 2022-05-31 | 杭州海康威视数字技术股份有限公司 | 一种图像处理方法、装置、设备及机器可读存储介质 |
KR102096388B1 (ko) * | 2018-06-05 | 2020-04-06 | 네이버 주식회사 | 모바일 환경에서 실시간 추론이 가능한 dnn 구성을 위한 최적화 기법 |
KR102543650B1 (ko) * | 2018-07-30 | 2023-06-15 | 주식회사 엔씨소프트 | 모션 합성 장치 및 모션 합성 방법 |
CN109064428B (zh) * | 2018-08-01 | 2021-04-13 | Oppo广东移动通信有限公司 | 一种图像去噪处理方法、终端设备及计算机可读存储介质 |
US10949951B2 (en) * | 2018-08-23 | 2021-03-16 | General Electric Company | Patient-specific deep learning image denoising methods and systems |
CA3112247A1 (en) * | 2018-09-13 | 2020-03-19 | Spectrum Optix Inc. | Photographic underexposure correction using a neural network |
US10949964B2 (en) | 2018-09-21 | 2021-03-16 | Kla Corporation | Super-resolution defect review image generation through generative adversarial networks |
CN110956575B (zh) | 2018-09-26 | 2022-04-12 | 京东方科技集团股份有限公司 | 转变图像风格的方法和装置、卷积神经网络处理器 |
US11055819B1 (en) * | 2018-09-27 | 2021-07-06 | Amazon Technologies, Inc. | DualPath Deep BackProjection Network for super-resolution |
US10713755B2 (en) * | 2018-09-27 | 2020-07-14 | Deepmind Technologies Limited | Image generation using subscaling and depth up-scaling |
CN109345456B (zh) * | 2018-09-30 | 2021-01-19 | 京东方科技集团股份有限公司 | 生成对抗网络训练方法、图像处理方法、设备及存储介质 |
KR102661434B1 (ko) | 2018-09-30 | 2024-04-29 | 보에 테크놀로지 그룹 컴퍼니 리미티드 | 이미지 처리를 위한 장치 및 방법, 및 신경 네트워크를 트레이닝하기 위한 시스템 |
WO2020073758A1 (en) * | 2018-10-10 | 2020-04-16 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Method and apparatus for training machine learning modle, apparatus for video style transfer |
CN109191382B (zh) * | 2018-10-18 | 2023-12-05 | 京东方科技集团股份有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
KR102708715B1 (ko) * | 2018-11-16 | 2024-09-24 | 삼성전자주식회사 | 영상 처리 장치 및 그 동작방법 |
US11388432B2 (en) * | 2018-12-10 | 2022-07-12 | Qualcomm Incorporated | Motion estimation through input perturbation |
CN109636727B (zh) * | 2018-12-17 | 2022-11-15 | 辽宁工程技术大学 | 一种超分辨率重建影像空间分辨率评价方法 |
CN109697470B (zh) * | 2018-12-27 | 2021-02-09 | 百度在线网络技术(北京)有限公司 | 一种识别模型的训练方法、装置、电子设备及存储介质 |
CN109766895A (zh) | 2019-01-03 | 2019-05-17 | 京东方科技集团股份有限公司 | 用于图像风格迁移的卷积神经网络的训练方法和图像风格迁移方法 |
CN109816612A (zh) | 2019-02-18 | 2019-05-28 | 京东方科技集团股份有限公司 | 图像增强方法和装置、计算机可读存储介质 |
CN109889800B (zh) * | 2019-02-28 | 2021-09-10 | 深圳市商汤科技有限公司 | 图像增强方法和装置、电子设备、存储介质 |
CN111724448A (zh) * | 2019-03-18 | 2020-09-29 | 华为技术有限公司 | 一种图像超分辨重建方法、装置和终端设备 |
JP7504120B2 (ja) * | 2019-03-18 | 2024-06-21 | グーグル エルエルシー | 高分解能なリアルタイムでのアーティスティックスタイル転送パイプライン |
CN111767979B (zh) * | 2019-04-02 | 2024-04-23 | 京东方科技集团股份有限公司 | 神经网络的训练方法、图像处理方法、图像处理装置 |
JP7269778B2 (ja) * | 2019-04-04 | 2023-05-09 | 富士フイルムヘルスケア株式会社 | 超音波撮像装置、および、画像処理装置 |
US10489936B1 (en) * | 2019-04-29 | 2019-11-26 | Deep Render Ltd. | System and method for lossy image and video compression utilizing a metanetwork |
KR102266903B1 (ko) * | 2019-05-16 | 2021-06-18 | 삼성전자주식회사 | 영상 처리 장치 및 그 동작방법 |
CN110163801B (zh) * | 2019-05-17 | 2021-07-20 | 深圳先进技术研究院 | 一种图像超分辨和着色方法、系统及电子设备 |
CN110120024B (zh) | 2019-05-20 | 2021-08-17 | 百度在线网络技术(北京)有限公司 | 图像处理的方法、装置、设备和存储介质 |
CN110458794B (zh) * | 2019-05-23 | 2023-05-12 | 上海离原工程自动化有限公司 | 用于轨道列车的配件质量检测方法及装置 |
CN110188776A (zh) * | 2019-05-30 | 2019-08-30 | 京东方科技集团股份有限公司 | 图像处理方法及装置、神经网络的训练方法、存储介质 |
JP7312026B2 (ja) * | 2019-06-12 | 2023-07-20 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
US11842283B2 (en) | 2019-06-17 | 2023-12-12 | Axell Corporation | Learning method, computer program, classifier, generator, and processing system |
JP7075674B2 (ja) * | 2019-06-17 | 2022-05-26 | 株式会社アクセル | 学習方法、コンピュータプログラム、分類器、生成器、及び処理システム |
CN110458906B (zh) * | 2019-06-26 | 2024-03-15 | 广州大鱼创福科技有限公司 | 一种基于深度颜色迁移的医学图像着色方法 |
CN110363288B (zh) * | 2019-07-15 | 2023-05-09 | 上海点积实业有限公司 | 一种神经网络的输入图像生成方法和系统 |
CN110378842A (zh) * | 2019-07-25 | 2019-10-25 | 厦门大学 | 一种图像纹理滤波方法、终端设备及存储介质 |
CN110428382B (zh) * | 2019-08-07 | 2023-04-18 | 杭州微帧信息科技有限公司 | 一种用于移动终端的高效视频增强方法、装置和存储介质 |
CN110533594B (zh) * | 2019-08-30 | 2023-04-07 | Oppo广东移动通信有限公司 | 模型训练方法、图像重建方法、存储介质及相关设备 |
US10943353B1 (en) | 2019-09-11 | 2021-03-09 | International Business Machines Corporation | Handling untrainable conditions in a network architecture search |
US11023783B2 (en) * | 2019-09-11 | 2021-06-01 | International Business Machines Corporation | Network architecture search with global optimization |
CN112529775A (zh) * | 2019-09-18 | 2021-03-19 | 华为技术有限公司 | 一种图像处理的方法和装置 |
CN111091532B (zh) * | 2019-10-30 | 2023-07-18 | 中国四维测绘技术有限公司 | 一种基于多层感知机的遥感影像色彩评价方法和系统 |
US20220092735A1 (en) * | 2019-11-21 | 2022-03-24 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
JP7231762B2 (ja) | 2019-11-29 | 2023-03-01 | オリンパス株式会社 | 画像処理方法、学習装置、画像処理装置及びプログラム |
CN111192206A (zh) * | 2019-12-03 | 2020-05-22 | 河海大学 | 一种提高图像清晰度的方法 |
CN111179166B (zh) * | 2019-12-09 | 2023-06-09 | 平安国际智慧城市科技股份有限公司 | 图像处理方法、装置、设备及计算机可读存储介质 |
CN111105375B (zh) * | 2019-12-17 | 2023-08-22 | 北京金山云网络技术有限公司 | 图像生成方法及其模型训练方法、装置及电子设备 |
CN111291866B (zh) * | 2020-01-22 | 2024-03-26 | 上海商汤临港智能科技有限公司 | 神经网络的生成、图像处理、智能行驶控制方法及装置 |
WO2021155301A1 (en) * | 2020-01-30 | 2021-08-05 | The Regents Of The University Of California | Synthetic human fingerprints |
WO2021163844A1 (en) * | 2020-02-17 | 2021-08-26 | Intel Corporation | Super resolution using convolutional neural network |
CN111402153B (zh) * | 2020-03-10 | 2023-06-13 | 上海富瀚微电子股份有限公司 | 一种图像处理方法及系统 |
CN111402142A (zh) * | 2020-03-25 | 2020-07-10 | 中国计量大学 | 基于深度递归卷积网络的单张图像超分辨率重建方法 |
JP7458857B2 (ja) * | 2020-04-01 | 2024-04-01 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
CN113762296A (zh) * | 2020-06-04 | 2021-12-07 | 阿里巴巴集团控股有限公司 | 图像处理方法、装置、电子设备及计算机存储介质 |
CN111710011B (zh) * | 2020-06-10 | 2021-06-25 | 广州梦映动漫网络科技有限公司 | 一种漫画生成方法、系统、电子设备及介质 |
US11436703B2 (en) * | 2020-06-12 | 2022-09-06 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptive artificial intelligence downscaling for upscaling during video telephone call |
CN111899185B (zh) * | 2020-06-18 | 2024-08-09 | 深圳先进技术研究院 | 图像降噪模型的训练方法、装置、电子设备和存储介质 |
CN111951177B (zh) * | 2020-07-07 | 2022-10-11 | 浙江大学 | 一种基于图像超分辨损失函数的红外图像细节增强方法 |
CN114173137A (zh) * | 2020-09-10 | 2022-03-11 | 北京金山云网络技术有限公司 | 视频编码方法、装置及电子设备 |
JP2022056769A (ja) | 2020-09-30 | 2022-04-11 | キヤノン株式会社 | 画像処理方法、プログラム、画像処理装置、学習済みモデルの製造方法、学習方法、学習装置、および、画像処理システム |
US20220108423A1 (en) * | 2020-10-02 | 2022-04-07 | Google Llc | Conditional Axial Transformer Layers for High-Fidelity Image Transformation |
CN112232485B (zh) * | 2020-10-15 | 2023-03-24 | 中科人工智能创新技术研究院(青岛)有限公司 | 漫画风格图像转换模型的训练方法、图像生成方法及装置 |
CN112330053A (zh) * | 2020-11-23 | 2021-02-05 | 香港中文大学(深圳) | 数据感知方法及装置 |
KR20220071011A (ko) | 2020-11-23 | 2022-05-31 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
KR102337412B1 (ko) * | 2021-03-17 | 2021-12-09 | 주식회사 에스아이에이 | 딥러닝 기반 초해상도 이미징 방법 |
KR20220129995A (ko) | 2021-03-17 | 2022-09-26 | 주식회사 에스아이에이 | 딥러닝 기반 초해상도 이미징 방법 |
CN113327219B (zh) * | 2021-06-21 | 2022-01-28 | 易成功(厦门)信息科技有限公司 | 基于多源数据融合的图像处理方法与系统 |
JPWO2023112172A1 (ja) * | 2021-12-14 | 2023-06-22 | ||
KR102406287B1 (ko) * | 2021-12-31 | 2022-06-08 | 주식회사 에스아이에이 | 협력 학습을 이용한 초해상도 이미징 방법 |
CN114528920B (zh) * | 2022-01-19 | 2023-08-18 | 西北大学 | 基于生成对抗网络的兵马俑色彩复原方法 |
CN114723608B (zh) * | 2022-04-14 | 2023-04-07 | 西安电子科技大学 | 基于流体粒子网络的图像超分辨率重建方法 |
KR20230156585A (ko) * | 2022-05-06 | 2023-11-14 | 에스케이텔레콤 주식회사 | 초해상도 신경망을 기반으로 한 화질개선 방법 및 장치 |
CN116016064B (zh) * | 2023-01-12 | 2024-06-28 | 西安电子科技大学 | 基于u型卷积去噪自编码器的通信信号降噪方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017091529A (ja) | 2015-11-09 | 2017-05-25 | トムソン ライセンシングThomson Licensing | ノイジーな画像をアップスケーリングする方法、及びノイジーな画像をアップスケーリングする装置 |
CN107122826A (zh) | 2017-05-08 | 2017-09-01 | 京东方科技集团股份有限公司 | 用于卷积神经网络的处理方法和系统、和存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9123138B2 (en) * | 2013-06-18 | 2015-09-01 | Adobe Systems Incorporated | Adaptive patch-based image upscaling |
CN106910161B (zh) * | 2017-01-24 | 2020-06-19 | 华南理工大学 | 一种基于深度卷积神经网络的单幅图像超分辨率重建方法 |
US10482639B2 (en) * | 2017-02-21 | 2019-11-19 | Adobe Inc. | Deep high-resolution style synthesis |
CN106991648B (zh) * | 2017-04-10 | 2024-01-02 | 中国石油大学(华东) | 一种基于小波变换和卷积神经网络的图像超分辨率重建方法 |
CN107180410A (zh) * | 2017-04-11 | 2017-09-19 | 中国农业大学 | 一种图像的风格化重建方法及装置 |
US10271008B2 (en) * | 2017-04-11 | 2019-04-23 | Advanced Micro Devices, Inc. | Enhanced resolution video and security via machine learning |
CN107301372A (zh) * | 2017-05-11 | 2017-10-27 | 中国科学院西安光学精密机械研究所 | 基于迁移学习的高光谱图像超分辨率方法 |
US10839577B2 (en) * | 2017-09-08 | 2020-11-17 | Apple Inc. | Creating augmented reality self-portraits using machine learning |
US10552944B2 (en) * | 2017-10-13 | 2020-02-04 | Adobe Inc. | Image upscaling with controllable noise reduction using a neural network |
CN107767343B (zh) * | 2017-11-09 | 2021-08-31 | 京东方科技集团股份有限公司 | 图像处理方法、处理装置和处理设备 |
-
2017
- 2017-11-09 CN CN201711100015.5A patent/CN107767343B/zh active Active
-
2018
- 2018-03-27 US US15/936,755 patent/US10430683B2/en active Active
- 2018-11-09 EP EP18876502.8A patent/EP3709255A4/en active Pending
- 2018-11-09 JP JP2020526028A patent/JP7438108B2/ja active Active
- 2018-11-09 WO PCT/CN2018/114848 patent/WO2019091459A1/zh unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017091529A (ja) | 2015-11-09 | 2017-05-25 | トムソン ライセンシングThomson Licensing | ノイジーな画像をアップスケーリングする方法、及びノイジーな画像をアップスケーリングする装置 |
CN107122826A (zh) | 2017-05-08 | 2017-09-01 | 京东方科技集团股份有限公司 | 用于卷积神经网络的处理方法和系统、和存储介质 |
Non-Patent Citations (2)
Title |
---|
Phillip Isola et al.,"Image-to-Image Translation with Conditional Adversarial Networks",2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),IEEE,2017年,pp.5967-5976 |
Xiaolong Wang et al.,"Generative Image Modeling using Style and Structure Adversarial Networks",[online],2016年07月26日,arXiv:1603.05631v2 [令和5年1月12日検索], インターネット<URL: https://arxiv.org/pdf/1603.05631.pdf> |
Also Published As
Publication number | Publication date |
---|---|
CN107767343A (zh) | 2018-03-06 |
JP2021502644A (ja) | 2021-01-28 |
EP3709255A1 (en) | 2020-09-16 |
EP3709255A4 (en) | 2021-07-28 |
WO2019091459A1 (zh) | 2019-05-16 |
CN107767343B (zh) | 2021-08-31 |
US10430683B2 (en) | 2019-10-01 |
US20190138838A1 (en) | 2019-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7438108B2 (ja) | 画像処理方法、処理装置及び処理デバイス | |
CN107767408B (zh) | 图像处理方法、处理装置和处理设备 | |
CN111767979B (zh) | 神经网络的训练方法、图像处理方法、图像处理装置 | |
US10706504B2 (en) | Image processing methods and image processing devices | |
US11908102B2 (en) | Image processing method and device, training method of neural network, and storage medium | |
US11954822B2 (en) | Image processing method and device, training method of neural network, image processing method based on combined neural network model, constructing method of combined neural network model, neural network processor, and storage medium | |
US11461639B2 (en) | Image processing method, image processing device, and training method of neural network | |
US11537873B2 (en) | Processing method and system for convolutional neural network, and storage medium | |
US11961203B2 (en) | Image processing device and operation method therefor | |
CN108765425A (zh) | 图像分割方法、装置、计算机设备和存储介质 | |
US11281938B2 (en) | Image processing method, processing apparatus and processing device | |
CN112991171B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN111724309B (zh) | 图像处理方法及装置、神经网络的训练方法、存储介质 | |
CN112132253B (zh) | 3d动作识别方法、装置、计算机可读存储介质及设备 | |
WO2022183325A1 (zh) | 视频块处理方法及装置、神经网络的训练方法和存储介质 | |
CN116051660A (zh) | 图像处理方法及装置、非瞬态计算机可读存储介质 | |
CN118247147A (zh) | 基于残差潜扩散模型的遥感超分辨率图像生成方法 | |
CN118212539A (zh) | 一种光谱退化约束的多尺度分组反馈高光谱重建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200512 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230123 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230413 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230724 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231019 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240115 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7438108 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |