JP7105363B2 - 学習方法、学習システム、学習済みモデル、プログラム及び超解像画像生成装置 - Google Patents
学習方法、学習システム、学習済みモデル、プログラム及び超解像画像生成装置 Download PDFInfo
- Publication number
- JP7105363B2 JP7105363B2 JP2021502251A JP2021502251A JP7105363B2 JP 7105363 B2 JP7105363 B2 JP 7105363B2 JP 2021502251 A JP2021502251 A JP 2021502251A JP 2021502251 A JP2021502251 A JP 2021502251A JP 7105363 B2 JP7105363 B2 JP 7105363B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- learning
- resolution
- generator
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 77
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 238000012545 processing Methods 0.000 claims description 115
- 238000002591 computed tomography Methods 0.000 claims description 48
- 230000007246 mechanism Effects 0.000 claims description 36
- 238000005070 sampling Methods 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 17
- 238000010801 machine learning Methods 0.000 claims description 12
- 238000013527 convolutional neural network Methods 0.000 claims description 11
- 238000009499 grossing Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 41
- 238000004364 calculation method Methods 0.000 description 19
- 238000004891 communication Methods 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 230000000052 comparative effect Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 5
- 101100372582 Caenorhabditis elegans vha-1 gene Proteins 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 238000012014 optical coherence tomography Methods 0.000 description 3
- 238000002600 positron emission tomography Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 101100540263 Caenorhabditis elegans vha-4 gene Proteins 0.000 description 2
- 208000009119 Giant Axonal Neuropathy Diseases 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 201000003382 giant axonal neuropathy 1 Diseases 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000002595 magnetic resonance imaging Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 101150114553 vha-3 gene Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 238000012285 ultrasound imaging Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B6/00—Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment
- A61B6/02—Arrangements for diagnosis sequentially in different planes; Stereoscopic radiation diagnosis
- A61B6/03—Computed tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/04—Indexing scheme for image data processing or generation, in general involving 3D image data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Veterinary Medicine (AREA)
- Pathology (AREA)
- Heart & Thoracic Surgery (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Probability & Statistics with Applications (AREA)
- High Energy & Nuclear Physics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Optics & Photonics (AREA)
- Radiology & Medical Imaging (AREA)
- Image Processing (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Image Analysis (AREA)
Description
本発明の実施形態に係る超解像画像生成装置は、低解像度の画像データから仮想的な高解像度の画像データを生成する。「生成する」とは「推定する」という用語の概念を含む。ここでは画像データの具体例として、コンピュータ断層撮影(CT:Computed Tomography)装置を用いて取得されるCT画像のデータを対象とし、CT装置を用いて取得されたシックスライス(Thick slice)の画像データから仮想的なシンスライス(Thin slice)の画像データを生成する超解像画像生成装置を例示する。
図1は、シックスライス画像とVTS画像のそれぞれのデータのイメージ図である。図1の左図がシックスライス画像であり、右図がVTS画像である。VTS画像は、シックスライス画像に比べて高品質な再構築画像を生成することが可能である。図1においてZ軸方向は体軸方向である。
図6は、本発明の実施形態に係る超解像画像生成装置の例を示す機能ブロック図である。超解像画像生成装置10は、補間処理部12と、階層型ニューラルネットワークの学習済みモデルであるジェネレータ14と、加算部16と、を含む。「ニューラルネットワーク」とは、脳神経系の仕組みを模擬した情報処理の数理モデルである。ニューラルネットワークを用いた処理は、コンピュータを用いて実現することができる。ニューラルネットワークは、プログラムモジュールとして構成され得る。本明細書においてニューラルネットワークを単に「ネットワーク」と表記する場合がある。
次に、ジェネレータ14を生成するための学習方法について説明する。
図8は学習データ生成部30の構成例を示す機能ブロック図である。学習データ生成部30は、固定サイズ領域切出部31と、ダウンサンプル処理部32と、アップサンプル処理部34と、学習データ記憶部38と、を含む。
図10は、学習データを生成する処理の手順の例を示すフローチャートである。図10に示すフローチャートの各ステップは、学習データ生成部30として機能するプロセッサを含むコンピュータによって実行される。コンピュータは、CPU(Central Processing Unit)及びメモリを備える。コンピュータは、GPU(Graphics Processing Unit)を含んでもよい。
既述のとおり、本実施形態に係る超解像画像生成装置10に搭載されるジェネレータ14は、GANによる学習を実施して獲られる生成モデルである。以下、学習部40の構成と学習方法について詳述する。
セルフアテンション機構の内容は、非特許文献3に記載されている。ただし、非特許文献3では、ジェネレータとディスクリミネータの両方のネットワークにそれぞれセルフアテンション機構を追加しているのに対し、本実施形態ではジェネレータ42Gにはセルフアテンション機構を実装せず、ディスクリミネータ44Dに限定してセルフアテンション機構を実装している点で非特許文献3に記載の手法と異なる。
このようなセルフアテンション機構を含むディスクリミネータ44Dのネットワークにおいては、セルフアテンション機構のf(x)、g(x)、及びh(x)のパラメータも学習される。
図12は、ディスクリミネータ44Dに適用される識別ネットワークの例を示す概念図である。ディスクリミネータ44Dのネットワークは、深層ニューラルネットワークに分類される階層型ニューラルネットワークであり、複数の畳み込み層を含む。ディスクリミネータ44Dのネットワークは畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)によって構成される。
図13は、ジェネレータ42Gに適用される生成ネットワークの例を示す概念図である。ジェネレータ42Gのネットワークも畳み込みニューラルネットワークで構成される。ジェネレータ42Gは、エンコーダ部とデコーダ部とを組み合わせたエンコーダ-デコーダ構造を持つ構成が好ましい。図13では、U-Net構造と呼ばれるU字型のネットワークの例が示されている。「U-Net」の表記における「Net」は「ネットワーク(Network)」の簡易表記である。
図15は、学習時におけるディスクリミネータ44Dによる識別の動作を説明するための図である。図15において加算部46の図示は省略される。
図16は、学習部40における処理の手順の例を示すフローチャートである。図16に示すフローチャートの各ステップは、学習部40として機能するプロセッサを含むコンピュータによって実行される。
図17は、本実施形態の効果を示す画像の例である。図17には、セルフアテンション機構の導入の効果を示す画像例が示されている。図17の上段中央に示す画像VHA1は本実施形態に係る学習方法を適用した学習済みモデル(ジェネレータ14)を用いて生成された仮想高解像度画像の例である。図17の上段左に示す画像LI1はジェネレータ14への入力に用いた低解像画像の例である。図17の上段右に示す画像GT1は、入力の画像LI1に対応する正解画像(Ground truth)である。
上述した第1実施形態では、ディスクリミネータ44Dへの入力としてリアル高解像度画像RHと低解像度画像LQ1のペア、又はジェネレータ42Gに由来する仮想高解像度画像VHと低解像度画像LQ1のペアが与えられているが、ディスクリミネータ44Dに対する低解像度画像LQ1の入力は必須ではない。ディスクリミネータ44Dには、少なくともリアル高解像度画像RH、又は仮想高解像度画像VHが入力されればよい。
第1実施形態では図14のように、ジェネレータ42Gから(仮想的な)高周波成分画像VHFCを出力し、低解像度画像LQと高周波成分画像VHFCとを加算することによって仮想高解像度画像VHを得ている。これに対し、第2実施形態は、ジェネレータ42Gが仮想高解像度画像VHを出力する形態である。
図20は、第3実施形態に係る学習システム20による処理の流れを概略的に示す機能ブロック図である。図20において、図19に示す構成と共通又は類似する部分には同一の符号を付し、その詳細な説明は省略する。図20に示す第3実施形態は、ジェネレータ42Gへの入力がシックスライス画像LKであり、ジェネレータ42Gからの出力が仮想高解像度画像VHである。この場合、シックスライス画像LKとリアル高解像度画像RHのペアが学習データとなる。図20においてシックスライス画像LKは本開示における「第1画像」及び「第1学習用画像」の一例である。
図21は、第4実施形態に係る学習システム20による処理の流れを概略的に示す機能ブロック図である。図21において、図19に示す構成と共通又は類似する部分には同一の符号を付し、その詳細な説明は省略する。図21に示す第4実施形態に係る学習システム20は、ジェネレータ42Gにシックスライス画像LKを入力してジェネレータ42Gから高周波成分画像VHFCを出力させ、ディスクリミネータ44Dに高周波成分画像を入力して識別を行う。ディスクリミネータ44Dの入力に用いる学習用の高周波成分画像を作るために、学習データ生成部30は、高周波成分抽出部33を備えている。
図22は、学習システム20に用いられるコンピュータのハードウェア構成の例を示すブロック図である。コンピュータ500は、パーソナルコンピュータであってもよいし、ワークステーションであってもよく、また、サーバコンピュータであってもよい。コンピュータ500は、超解像画像生成装置10、画像保管部24、学習データ生成部30、及び学習部40のいずれか、又はこれらの複数の機能を備えた装置として用いることができる。
上述の各実施形態で説明した学習データ生成機能、学習機能、及び画像生成機能のうち少なくとも1つの処理機能の一部又は全部をコンピュータに実現させるプログラムを、光ディスク、磁気ディスク、若しくは、半導体メモリその他の有体物たる非一時的な情報記憶媒体であるコンピュータ可読媒体に記録し、この情報記憶媒体を通じてプログラムを提供することが可能である。
図6の補間処理部12、ジェネレータ14、及び加算部16、図7の画像保管部24、学習データ生成部30、学習部40、GAN41、ジェネレータ42G、ディスクリミネータ44D、誤差演算部50、及びオプティマイザ52、図8の固定サイズ領域切出部31、ダウンサンプル処理部32、アップサンプル処理部34、補間処理部35、及びガウシアンフィルタ処理部36、並びに図21の高周波成分抽出部33などの各種の処理を実行する処理部(processing unit)のハードウェア的な構造は、例えば、次に示すような各種のプロセッサ(processor)である。
ここではCT画像の超解像の生成モデルの学習方法を説明したが、本開示による生成モデルの学習方法は、CT画像に限らず、各種の3次元断層画像に適用することができる。例えば、MRI(Magnetic Resonance Imaging)装置により取得されるMR画像、PET(Positron Emission Tomography)装置により取得されるPET画像、OCT(Optical Coherence Tomography)装置により取得されるOCT画像、3次元超音波撮影装置により取得される3次元超音波画像等であってもよい。
12 補間処理部
14 ジェネレータ
16 加算部
20 学習システム
24 画像保管部
30 学習データ生成部
31 固定サイズ領域切出部
32 ダウンサンプル処理部
33 高周波成分抽出部
34 アップサンプル処理部
35 補間処理部
36 ガウシアンフィルタ処理部
38 学習データ記憶部
40 学習部
41 敵対的生成ネットワーク(GAN)
42G ジェネレータ
44D ディスクリミネータ
46 加算部
50 誤差演算部
52 オプティマイザ
70N 動作状態
70P 動作状態
500 コンピュータ
512 通信部
514 ストレージ
516 操作部
518 CPU
519 GPU
520 RAM
522 ROM
524 表示部
C01~C05 畳み込み層
C1~C10 畳み込み層
GT1 画像
GT2 画像
IM1~IM4 CT画像
IPT 補間画像
LI1~LI4 画像
LK、LK1 シックスライス画像
LQ、LQ1 低解像度画像
ORH、ORH1 リアル高解像度画像
RH、RH1 リアル高解像度画像
RHFC リアル高周波成分画像
SAFM セルフアテンション特徴マップ
SD スライス間隔
ST スライス厚
TCK シックスライス画像
VH、VH1 仮想高解像度画像
VHA1 画像
VHN2 画像
VHA3 画像
VHA4 画像
VHFC 高周波成分画像
VT 仮想シンスライス画像
S1~S5 学習データ生成処理のステップ
S11~S19 学習処理のステップ
Claims (20)
- 第1画像から前記第1画像よりも高解像の画像情報を含む第2画像を推定する生成モデルの機械学習を行う学習方法であって、
前記生成モデルであるジェネレータと、与えられたデータが学習用の正解画像のデータであるか前記ジェネレータからの出力に由来するデータであるかを識別する識別モデルであるディスクリミネータと、を含む敵対的生成ネットワークを用いることと、
前記第2画像よりも解像度が低い第1解像度情報を含む第1学習用画像と、前記第1学習用画像よりも解像度が高い第2解像度情報を含む第2学習用画像であって前記第1学習用画像に対応する前記正解画像となる前記第2学習用画像と、を学習データとして用いることと、
前記ジェネレータの入力には、前記第1学習用画像及び前記第2学習用画像のうち前記第1学習用画像のみを与えることと、
前記ジェネレータ及び前記ディスクリミネータのうち、前記ディスクリミネータのネットワークに限定してセルフアテンション機構を実装することと、
を含む学習方法。 - 前記ジェネレータ及び前記ディスクリミネータのそれぞれのネットワークは、畳み込みニューラルネットワークである、請求項1に記載の学習方法。
- 前記第1画像は3次元断層画像であり、
前記第2画像は少なくとも前記3次元断層画像のスライス厚方向の解像度が前記第1画像よりも高解像である、請求項1又は2に記載の学習方法。 - 前記第2学習用画像は、コンピュータ断層撮影装置を用いて取得された画像であり、
前記第1学習用画像は、前記第2学習用画像を基に画像処理によって生成された画像である、請求項1から3のいずれか一項に記載の学習方法。 - 前記第2学習用画像から前記第1学習用画像を生成する前記画像処理は、前記第2学習用画像をダウンサンプルする処理を含む、請求項4に記載の学習方法。
- 前記第2学習用画像から前記第1学習用画像を生成する前記画像処理は、前記ダウンサンプルの処理によって得られた画像に補間処理を施してアップサンプルする処理を含む、請求項5に記載の学習方法。
- 前記第2学習用画像から前記第1学習用画像を生成する前記画像処理は、ガウシアンフィルタを用いる平滑化処理を含む、請求項4から6のいずれか一項に記載の学習方法。
- 前記機械学習に使用する複数種類の前記学習データにおける前記第1学習用画像及び前記第2学習用画像の各々は同一サイズである、請求項1から7のいずれか一項に記載の学習方法。
- 前記第2画像は、高周波成分の情報を示す高周波成分画像であり、
前記ジェネレータは、入力された画像の解像度を高めるために必要な高周波成分を推定し、前記高周波成分の情報を示す高周波成分画像を出力する、請求項1から8のいずれか一項に記載の学習方法。 - 前記ジェネレータから出力された前記高周波成分画像と、前記ジェネレータに入力された前記画像とを加算すること、をさらに含み、
前記加算によって得られる仮想第2画像を前記ディスクリミネータの入力に与える、請求項9に記載の学習方法。 - 請求項1から10のいずれか一項に記載の学習方法をコンピュータに実行させるためのプログラム。
- 非一時的かつコンピュータ読取可能な記録媒体であって、前記記録媒体に格納された指令がコンピュータによって読み取られた場合に請求項11に記載のプログラムをコンピュータに実行させる記録媒体。
- 請求項1から10のいずれか一項に記載の学習方法を実施して学習された学習済みモデルであって、前記第1画像から前記第1画像よりも高解像の画像情報を含む第2画像を推定する機能をコンピュータに実現させるための前記生成モデルである学習済みモデル。
- 請求項1から10のいずれか一項に記載の学習方法を実施して学習された学習済みモデルである前記生成モデルを備え、入力される第3画像から前記第3画像よりも高解像の画像情報を含む第4画像を生成する超解像画像生成装置。
- 前記第3画像は、前記第1学習用画像と異なる画像サイズである、請求項14に記載の超解像画像生成装置。
- 前記第3画像に補間処理を行い、補間画像を生成する第1補間処理部と、
前記補間画像と前記生成モデルが生成する高周波成分とを加算する第1加算部と、を含み、
前記補間画像が前記生成モデルに入力され、
前記生成モデルが前記補間画像の解像度を高めるために必要な前記高周波成分を生成する、請求項14又は15に記載の超解像画像生成装置。 - 第1画像から前記第1画像よりも高解像の画像情報を含む第2画像を推定する生成モデルの機械学習を行う学習システムであって、
前記生成モデルであるジェネレータと、与えられたデータが学習用の正解画像のデータであるか前記ジェネレータからの出力に由来するデータであるかを識別する識別モデルであるディスクリミネータと、を含む敵対的生成ネットワークを備え、
前記ジェネレータ及び前記ディスクリミネータのうち、前記ディスクリミネータのネットワークに限定してセルフアテンション機構が実装されており、
前記第2画像よりも解像度が低い第1解像度情報を含む第1学習用画像と、前記第1学習用画像よりも解像度が高い第2解像度情報を含む第2学習用画像であって前記第1学習用画像に対応する前記正解画像となる前記第2学習用画像と、を学習データとして取り込み、
前記ジェネレータの入力に、前記第1学習用画像及び前記第2学習用画像のうち前記第1学習用画像のみが与えられ、前記敵対的生成ネットワークの学習が行われる、
学習システム。 - 前記学習データを生成する学習データ生成部をさらに備え、
前記学習データ生成部は、
前記第2解像度情報を含むオリジナルの元画像から固定サイズ領域を切り出す固定サイズ領域切出部と、
前記固定サイズ領域切出部によって切り出された前記固定サイズ領域の画像をダウンサンプルするダウンサンプル処理部と、
を含み、
前記固定サイズ領域切出部によって切り出された前記固定サイズ領域の画像を前記第2学習用画像とし、
前記第2学習用画像に対して前記ダウンサンプルの処理を行うことによって前記第1学習用画像を生成する、請求項17に記載の学習システム。 - 前記学習データ生成部は、さらに、
前記ダウンサンプルの処理によって得られた画像に補間処理を施す第2補間処理部と、
ガウシアンフィルタを用いて平滑化を行う平滑化処理部と、
を含む、請求項18に記載の学習システム。 - 前記ジェネレータは、入力された画像の解像度を高めるために必要な高周波成分を推定して前記高周波成分の情報を示す高周波成分画像を出力する構成であり、
前記ジェネレータから出力された前記高周波成分画像と前記ジェネレータに入力された前記画像とを加算する第2加算部をさらに備える、請求項17から19のいずれか一項に記載の学習システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019036374 | 2019-02-28 | ||
JP2019036374 | 2019-02-28 | ||
PCT/JP2020/007383 WO2020175446A1 (ja) | 2019-02-28 | 2020-02-25 | 学習方法、学習システム、学習済みモデル、プログラム及び超解像画像生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020175446A1 JPWO2020175446A1 (ja) | 2021-12-23 |
JP7105363B2 true JP7105363B2 (ja) | 2022-07-22 |
Family
ID=72238587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021502251A Active JP7105363B2 (ja) | 2019-02-28 | 2020-02-25 | 学習方法、学習システム、学習済みモデル、プログラム及び超解像画像生成装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20210374911A1 (ja) |
EP (1) | EP3932318A4 (ja) |
JP (1) | JP7105363B2 (ja) |
WO (1) | WO2020175446A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117456297A (zh) * | 2019-03-31 | 2024-01-26 | 华为技术有限公司 | 图像生成方法、神经网络的压缩方法及相关装置、设备 |
TW202215303A (zh) | 2020-10-02 | 2022-04-16 | 美商谷歌有限責任公司 | 使用基於自我注意之神經網路處理影像 |
JP7562369B2 (ja) | 2020-10-26 | 2024-10-07 | キヤノン株式会社 | 医用画像処理装置、医用画像処理方法及びプログラム |
JP7542478B2 (ja) | 2021-03-30 | 2024-08-30 | 富士フイルム株式会社 | 画像処理装置、学習装置、放射線画像撮影システム、画像処理方法、学習方法、画像処理プログラム、及び学習プログラム |
CN113343705B (zh) * | 2021-04-26 | 2022-07-05 | 山东师范大学 | 一种基于文本语义的细节保持图像生成方法及系统 |
US11803939B2 (en) * | 2021-04-28 | 2023-10-31 | Shanghai United Imaging Intelligence Co., Ltd. | Unsupervised interslice super-resolution for medical images |
DE102021214741B3 (de) | 2021-12-20 | 2023-02-23 | Siemens Healthcare Gmbh | Verfahren zum Generieren von synthetischen Röntgenbildern, Steuereinheit und Computerprogramm |
KR102428326B1 (ko) * | 2021-12-21 | 2022-08-02 | 서울시립대학교 산학협력단 | 인공지능 기반의 결함 탐지 방법 및 시스템 |
US20230336571A1 (en) * | 2022-04-19 | 2023-10-19 | Akamai Technologies, Inc. | Real-time detection and prevention of online new-account creation fraud and abuse |
CN114547017B (zh) * | 2022-04-27 | 2022-08-05 | 南京信息工程大学 | 一种基于深度学习的气象大数据融合方法 |
CN114693831B (zh) * | 2022-05-31 | 2022-09-02 | 深圳市海清视讯科技有限公司 | 一种图像处理方法、装置、设备和介质 |
WO2024186659A1 (en) * | 2023-03-06 | 2024-09-12 | Intuitive Surgical Operations, Inc. | Generation of high resolution medical images using a machine learning model |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180075581A1 (en) | 2016-09-15 | 2018-03-15 | Twitter, Inc. | Super resolution using a generative adversarial network |
US20180341836A1 (en) | 2017-05-24 | 2018-11-29 | General Electric Company | Neural network point cloud generation system |
US20190057488A1 (en) | 2017-08-17 | 2019-02-21 | Boe Technology Group Co., Ltd. | Image processing method and device |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3447721A1 (en) * | 2017-08-24 | 2019-02-27 | Agfa Nv | A method of generating an enhanced tomographic image of an object |
-
2020
- 2020-02-25 JP JP2021502251A patent/JP7105363B2/ja active Active
- 2020-02-25 WO PCT/JP2020/007383 patent/WO2020175446A1/ja unknown
- 2020-02-25 EP EP20762514.6A patent/EP3932318A4/en active Pending
-
2021
- 2021-08-12 US US17/400,142 patent/US20210374911A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180075581A1 (en) | 2016-09-15 | 2018-03-15 | Twitter, Inc. | Super resolution using a generative adversarial network |
US20180341836A1 (en) | 2017-05-24 | 2018-11-29 | General Electric Company | Neural network point cloud generation system |
US20190057488A1 (en) | 2017-08-17 | 2019-02-21 | Boe Technology Group Co., Ltd. | Image processing method and device |
Non-Patent Citations (2)
Title |
---|
LEDIG, Christian et al.,Photo-Realistic Single Image Super-Resolution Using a Geneartive Adversarial Network,arXiv,arXiv: 1609.04802v5 [cs.CV],2017年 |
PATHAK, Harsh, Nilesh, et al.,Efficient Super Resolution for Large-Scale Images Using Attentional GAN,2018 IEEE International Conference on Big Data (Big Data),2018年,pp.1777-1786 |
Also Published As
Publication number | Publication date |
---|---|
EP3932318A4 (en) | 2022-04-20 |
JPWO2020175446A1 (ja) | 2021-12-23 |
US20210374911A1 (en) | 2021-12-02 |
WO2020175446A1 (ja) | 2020-09-03 |
EP3932318A1 (en) | 2022-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7105363B2 (ja) | 学習方法、学習システム、学習済みモデル、プログラム及び超解像画像生成装置 | |
CN109978037B (zh) | 图像处理方法、模型训练方法、装置、和存储介质 | |
Ahmad et al. | A new generative adversarial network for medical images super resolution | |
Shi et al. | LRTV: MR image super-resolution with low-rank and total variation regularizations | |
Mardani et al. | Deep generative adversarial networks for compressed sensing automates MRI | |
US9892361B2 (en) | Method and system for cross-domain synthesis of medical images using contextual deep network | |
Olut et al. | Generative adversarial training for MRA image synthesis using multi-contrast MRI | |
Kudo et al. | Virtual thin slice: 3D conditional GAN-based super-resolution for CT slice interval | |
CN111368849B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN111369562B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
Wang et al. | Patch-free 3d medical image segmentation driven by super-resolution technique and self-supervised guidance | |
Lin et al. | Deep learning for low-field to high-field MR: image quality transfer with probabilistic decimation simulator | |
Hermann et al. | Accurate interactive visualization of large deformations and variability in biomedical image ensembles | |
Zhong et al. | Deep action learning enables robust 3D segmentation of body organs in various CT and MRI images | |
WO2022163402A1 (ja) | 学習済みモデルの生成方法、機械学習システム、プログラムおよび医療画像処理装置 | |
Su et al. | Attention u-net with dimension-hybridized fast data density functional theory for automatic brain tumor image segmentation | |
CN113313728B (zh) | 一种颅内动脉分割方法及系统 | |
WO2020175445A1 (ja) | 学習方法、学習装置、生成モデル及びプログラム | |
Von Zuben et al. | A multi-step machine learning approach for short axis MR images segmentation | |
CN116128895A (zh) | 医学图像分割方法、装置和计算机可读存储介质 | |
Zhong et al. | An intelligent MRI assisted diagnosis and treatment system for osteosarcoma based on super-resolution | |
JP7548296B2 (ja) | 管状フィーチャのセグメント化 | |
Mardani et al. | Deep generative adversarial networks for compressed sensing (GANCS) automates MRI | |
Patel et al. | Simulating Realistic MRI variations to Improve Deep Learning model and visual explanations using GradCAM | |
Hirahara et al. | Denoising and inpainting of sea surface temperature image with adversarial physical model loss |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210819 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210819 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220630 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220711 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7105363 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |