JPWO2018216207A1 - 画像処理装置、画像処理方法、および画像処理プログラム - Google Patents
画像処理装置、画像処理方法、および画像処理プログラム Download PDFInfo
- Publication number
- JPWO2018216207A1 JPWO2018216207A1 JP2017549838A JP2017549838A JPWO2018216207A1 JP WO2018216207 A1 JPWO2018216207 A1 JP WO2018216207A1 JP 2017549838 A JP2017549838 A JP 2017549838A JP 2017549838 A JP2017549838 A JP 2017549838A JP WO2018216207 A1 JPWO2018216207 A1 JP WO2018216207A1
- Authority
- JP
- Japan
- Prior art keywords
- image
- feature
- residual
- input
- input image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 163
- 238000003672 processing method Methods 0.000 title claims description 10
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 238000013528 artificial neural network Methods 0.000 claims description 43
- 238000000034 method Methods 0.000 description 40
- 238000004364 calculation method Methods 0.000 description 34
- 230000008569 process Effects 0.000 description 25
- 239000010410 layer Substances 0.000 description 24
- 238000010801 machine learning Methods 0.000 description 23
- 230000006870 function Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 101100365548 Caenorhabditis elegans set-14 gene Proteins 0.000 description 1
- 244000241796 Christia obcordata Species 0.000 description 1
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
- Television Systems (AREA)
Abstract
Description
実施形態に係る画像処理装置10は、機械学習(より具体的には、深層学習)により画像の超解像を実行するコンピュータまたはコンピュータシステムである。
図2は画像処理装置10の一般的なハードウェア構成を示す。画像処理装置10は、オペレーティングシステムやアプリケーション・プログラムなどを実行するプロセッサ101と、ROMおよびRAMで構成される主記憶部102と、ハードディスクやフラッシュメモリなどで構成される補助記憶部103と、ネットワークカードまたは無線通信モジュールで構成される通信制御部104と、キーボードやマウスなどの入力装置105と、モニタなどの出力装置106とを備える。プロセッサ101の例としてCPUおよびGPUが挙げられるが、大量の積和演算を行う必要がある深層学習では一般に、並列計算を得意とするGPUが用いられる。
次に、図4〜図8を参照しながら、画像処理装置10の動作を説明するとともに本実施形態に係る画像処理方法について説明する。
f(ht(x))=wt+3*(max(0,wt+2*max(0,wt+1*ht(x))))
次に、図9を参照しながら、コンピュータを画像処理装置10として機能させるための画像処理プログラムP1を説明する。図9は画像処理プログラムP1の構成を示す図である。
以上説明したように、本発明の一側面に係る画像処理装置は、プロセッサを備える画像処理装置であって、プロセッサが、入力画像を取得するステップと、入力画像を畳み込み層により処理することで特徴残差を算出するステップと、入力画像に対して少なくとも一つの畳み込みを実行するステップと、畳み込まれた入力画像に特徴残差を適用することで出力特徴を生成するステップと、出力特徴に基づいて画像残差を生成するステップとを実行し、画像残差が入力画像に適用されることで、入力画像よりも解像度が高い高解像度画像が生成される。
・パターン1:00000
・パターン2:00100
・パターン3:11000
・パターン4:10001
・パターン5:01010
・パターン6:10101
・パターン7:11111
・確率的勾配降下法を用いたCNN
・モメンタム(momentum)=0.9
・重み減衰(weight decay)=10−4
・勾配刈り込み(gradient clipping)の閾値=1.0
・学習率(learning rate):初期値は1であり、10エポック毎に10分の1に変更。
・特徴スケーリングでの係数の初期値=0.1
以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。
Claims (6)
- プロセッサを備える画像処理装置であって、
前記プロセッサが、
入力画像を取得するステップと、
前記入力画像を畳み込み層により処理することで特徴残差を算出するステップと、
前記入力画像に対して少なくとも一つの畳み込みを実行するステップと、
前記畳み込まれた入力画像に前記特徴残差を適用することで出力特徴を生成するステップと、
前記出力特徴に基づいて画像残差を生成するステップとを実行し、
前記画像残差が前記入力画像に適用されることで、前記入力画像よりも解像度が高い高解像度画像が生成される、
画像処理装置。 - 前記プロセッサが、第1の処理ブロックおよび第2の処理ブロックを含むニューラルネットワークを用いて前記画像残差を生成し、
前記第1の処理ブロックが、
前記入力画像に基づく第1の入力特徴を第1の畳み込み層により処理することで第1の特徴残差を算出するステップと、
前記第1の入力特徴に前記第1の特徴残差を適用することで第1の出力特徴を生成するステップとを含み、
前記第2の処理ブロックが、
前記入力画像に基づく第2の入力特徴を第2の畳み込み層により処理することで第2の特徴残差を算出するステップと、
前記第2の入力特徴に対して前記少なくとも一つの畳み込みを実行するステップと、
前記畳み込まれた第2の入力特徴に前記第2の特徴残差を適用することで第2の出力特徴を生成するステップとを含む、
請求項1に記載の画像処理装置。 - 前記プロセッサが前記第1の処理ブロックおよび前記第2の処理ブロックを交互に実行する、
請求項2に記載の画像処理装置。 - 前記プロセッサが、前記出力特徴に対して特徴スケーリングを実行することで前記画像残差を生成する、
請求項1〜3のいずれか一項に記載の画像処理装置。 - プロセッサを備える画像処理装置により実行される画像処理方法であって、
入力画像を取得するステップと、
前記入力画像を畳み込み層により処理することで特徴残差を算出するステップと、
前記入力画像に対して少なくとも一つの畳み込みを実行するステップと、
前記畳み込まれた入力画像に前記特徴残差を適用することで出力特徴を生成するステップと、
前記出力特徴に基づいて画像残差を生成するステップと
を含み、
前記画像残差が前記入力画像に適用されることで、前記入力画像よりも解像度が高い高解像度画像が生成される、
画像処理方法。 - 入力画像を取得するステップと、
前記入力画像を畳み込み層により処理することで特徴残差を算出するステップと、
前記入力画像に対して少なくとも一つの畳み込みを実行するステップと、
前記畳み込まれた入力画像に前記特徴残差を適用することで出力特徴を生成するステップと、
前記出力特徴に基づいて画像残差を生成するステップと
をコンピュータに実行させ、
前記画像残差が前記入力画像に適用されることで、前記入力画像よりも解像度が高い高解像度画像が生成される、
画像処理プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2017/019738 WO2018216207A1 (ja) | 2017-05-26 | 2017-05-26 | 画像処理装置、画像処理方法、および画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6276901B1 JP6276901B1 (ja) | 2018-02-07 |
JPWO2018216207A1 true JPWO2018216207A1 (ja) | 2019-06-27 |
Family
ID=61158449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017549838A Active JP6276901B1 (ja) | 2017-05-26 | 2017-05-26 | 画像処理装置、画像処理方法、および画像処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10970819B2 (ja) |
JP (1) | JP6276901B1 (ja) |
WO (1) | WO2018216207A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10489887B2 (en) | 2017-04-10 | 2019-11-26 | Samsung Electronics Co., Ltd. | System and method for deep learning image super resolution |
WO2019142242A1 (ja) * | 2018-01-16 | 2019-07-25 | オリンパス株式会社 | データ処理システムおよびデータ処理方法 |
JP2019153057A (ja) * | 2018-03-02 | 2019-09-12 | 富士通株式会社 | 画像処理装置、学習装置、画像処理方法、学習方法、画像処理プログラムおよび学習プログラム |
KR101896406B1 (ko) * | 2018-03-13 | 2018-10-22 | 연세대학교 산학협력단 | 블랙박스 영상을 이용한 딥러닝 기반의 픽셀 단위 도로 크랙 검출 장치 및 그 방법, 그리고 이 방법을 실행시키기 위해 컴퓨터가 판독 가능한 기록매체에 저장된 컴퓨터 프로그램 |
US10540749B2 (en) * | 2018-03-29 | 2020-01-21 | Mitsubishi Electric Research Laboratories, Inc. | System and method for learning-based image super-resolution |
JP6601825B2 (ja) * | 2018-04-06 | 2019-11-06 | 株式会社EmbodyMe | 画像処理装置および2次元画像生成用プログラム |
KR102179436B1 (ko) * | 2018-04-24 | 2020-11-16 | 주식회사 지디에프랩 | 변화 매크로블록 추출 기법을 이용한 동영상 화질 개선 시스템 |
JP6570164B1 (ja) * | 2018-11-28 | 2019-09-04 | 株式会社ツバサファクトリー | コンピュータプログラム、画像処理方法、及び画像処理装置 |
JP7121678B2 (ja) * | 2019-03-15 | 2022-08-18 | Kddi株式会社 | 画像処理装置、プログラム及び学習方法 |
US11080824B2 (en) * | 2019-08-15 | 2021-08-03 | Disney Enterprises, Inc. | Techniques for upscaling images generated with undetermined downscaling kernels |
CN112446834A (zh) * | 2019-09-04 | 2021-03-05 | 华为技术有限公司 | 图像增强方法和装置 |
CN113096166B (zh) * | 2019-12-17 | 2023-08-18 | 上海美杰医疗科技有限公司 | 一种医学影像配准的方法和装置 |
KR102089230B1 (ko) * | 2019-12-30 | 2020-03-13 | 주식회사 애자일소다 | 영상을 이용한 차량의 속도 예측 장치 및 방법 |
WO2021157062A1 (ja) * | 2020-02-07 | 2021-08-12 | 日本電信電話株式会社 | 量子化ビット数拡張のための学習装置、信号推定装置、学習方法、信号推定方法、およびプログラム |
TWI733341B (zh) * | 2020-02-20 | 2021-07-11 | 瑞昱半導體股份有限公司 | 用於圖像放大與增強的方法與裝置 |
KR102634627B1 (ko) * | 2021-12-14 | 2024-02-08 | 주식회사 카이 | 라이브 스트리밍 방법 및 장치 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11423311B2 (en) * | 2015-06-04 | 2022-08-23 | Samsung Electronics Co., Ltd. | Automatic tuning of artificial neural networks |
US20170140260A1 (en) * | 2015-11-17 | 2017-05-18 | RCRDCLUB Corporation | Content filtering with convolutional neural networks |
KR102301232B1 (ko) * | 2017-05-31 | 2021-09-10 | 삼성전자주식회사 | 다채널 특징맵 영상을 처리하는 방법 및 장치 |
KR102419136B1 (ko) * | 2017-06-15 | 2022-07-08 | 삼성전자주식회사 | 다채널 특징맵을 이용하는 영상 처리 장치 및 방법 |
US10751548B2 (en) * | 2017-07-28 | 2020-08-25 | Elekta, Inc. | Automated image segmentation using DCNN such as for radiation therapy |
WO2019079180A1 (en) * | 2017-10-16 | 2019-04-25 | Illumina, Inc. | NEURONAL NETWORKS WITH DEEP CONVOLUTION OF VARIANT CLASSIFICATION |
-
2017
- 2017-05-26 JP JP2017549838A patent/JP6276901B1/ja active Active
- 2017-05-26 WO PCT/JP2017/019738 patent/WO2018216207A1/ja active Application Filing
- 2017-05-26 US US16/083,049 patent/US10970819B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP6276901B1 (ja) | 2018-02-07 |
WO2018216207A1 (ja) | 2018-11-29 |
US20200302576A1 (en) | 2020-09-24 |
US10970819B2 (en) | 2021-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6276901B1 (ja) | 画像処理装置、画像処理方法、および画像処理プログラム | |
US20240127043A1 (en) | Image processing system and medical information processing system | |
KR101871098B1 (ko) | 이미지 처리 방법 및 장치 | |
JP2021100247A (ja) | 歪んだドキュメント画像の矯正方法及び装置 | |
JP2018181187A (ja) | データ分析装置、データ分析方法、およびデータ分析プログラム | |
US10642622B2 (en) | Arithmetic processing device and control method of the arithmetic processing device | |
US11822900B2 (en) | Filter processing device and method of performing convolution operation at filter processing device | |
WO2018225133A1 (ja) | 画像処理装置、画像処理方法、および画像処理プログラム | |
CN111383742A (zh) | 一种医学成像模型的建立方法、装置、设备及存储介质 | |
JP2019023798A (ja) | 超解像装置およびプログラム | |
CN112836804A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
JP6583875B1 (ja) | 画像処理方法、画像処理システム及び画像処理プログラム | |
WO2018235357A1 (ja) | 演算装置、演算方法及びプログラム | |
JP2021034038A5 (ja) | ||
JP2022533264A (ja) | 自己回帰ビデオ生成ニューラルネットワーク | |
CN111105471A (zh) | 用于生成与成像有关的采样掩码的方法和装置 | |
JP5761988B2 (ja) | 画像処理装置、画像処理方法 | |
KR102126916B1 (ko) | 블러된 영상 복원을 위한 장치 및 방법 | |
JP7169768B2 (ja) | 画像処理装置、画像処理方法 | |
KR102537207B1 (ko) | 머신 러닝에 기반한 이미지 처리 방법 및 장치 | |
Viriyavisuthisakul et al. | A regularization-based generative adversarial network for single image super-resolution | |
JP6994572B2 (ja) | データ処理システムおよびデータ処理方法 | |
JP2016167736A (ja) | 画像変換装置、画像変換方法及び画像変換プログラム | |
Mateos et al. | Bayesian high resolution image reconstruction with incomplete multisensor low resolution systems | |
CN115170916B (zh) | 一种多尺度特征融合的图像重建方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170922 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20170922 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20171221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180112 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6276901 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R157 | Certificate of patent or utility model (correction) |
Free format text: JAPANESE INTERMEDIATE CODE: R157 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |