JP2023033234A - データ拡張方法、データ拡張装置及びプログラム - Google Patents
データ拡張方法、データ拡張装置及びプログラム Download PDFInfo
- Publication number
- JP2023033234A JP2023033234A JP2022134476A JP2022134476A JP2023033234A JP 2023033234 A JP2023033234 A JP 2023033234A JP 2022134476 A JP2022134476 A JP 2022134476A JP 2022134476 A JP2022134476 A JP 2022134476A JP 2023033234 A JP2023033234 A JP 2023033234A
- Authority
- JP
- Japan
- Prior art keywords
- data
- sub
- data set
- anatomical structure
- dataset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 103
- 238000013434 data augmentation Methods 0.000 title claims abstract description 44
- 210000003484 anatomy Anatomy 0.000 claims abstract description 189
- 238000006243 chemical reaction Methods 0.000 claims abstract description 43
- 238000000547 structure data Methods 0.000 claims description 101
- 210000004072 lung Anatomy 0.000 claims description 63
- 230000008569 process Effects 0.000 claims description 25
- 230000009466 transformation Effects 0.000 claims description 21
- 230000002194 synthesizing effect Effects 0.000 claims description 20
- 230000003902 lesion Effects 0.000 claims description 11
- 210000000056 organ Anatomy 0.000 claims description 9
- 230000001131 transforming effect Effects 0.000 claims description 6
- 230000037237 body shape Effects 0.000 claims description 5
- 201000010099 disease Diseases 0.000 claims description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 5
- 210000002216 heart Anatomy 0.000 claims description 3
- 210000004185 liver Anatomy 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 abstract description 10
- 238000003786 synthesis reaction Methods 0.000 abstract description 10
- 230000007786 learning performance Effects 0.000 abstract description 5
- 230000003416 augmentation Effects 0.000 abstract 2
- 238000012545 processing Methods 0.000 description 54
- 230000006870 function Effects 0.000 description 29
- 238000010586 diagram Methods 0.000 description 18
- 230000003190 augmentative effect Effects 0.000 description 15
- 238000009826 distribution Methods 0.000 description 9
- 238000010606 normalization Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 238000002591 computed tomography Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000000844 transformation Methods 0.000 description 4
- 238000013136 deep learning model Methods 0.000 description 3
- 238000002595 magnetic resonance imaging Methods 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 238000002600 positron emission tomography Methods 0.000 description 3
- 238000002603 single-photon emission computed tomography Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002685 pulmonary effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Abstract
【課題】学習性能を向上させることが可能な拡張データセットを生成すること。【解決手段】実施形態のデータ拡張方法は、解剖学的構造が描出された解剖学的構造データのデータ拡張方法であって、データセット取得ステップと、データセット分割ステップと、データセット変換ステップと、データセット合成ステップとを含む。データセット取得ステップは、解剖学的構造データセットを取得する。データセット分割ステップは、二つの前記解剖学的構造データを前記解剖学的構造に基づいてそれぞれサブデータセットに分割する。データセット変換ステップは、一の解剖学的構造データのサブデータセットを参照データセットとして、他の解剖学的構造データのサブデータセットに含まれるサブデータをデータセット変換して、変換データセットを生成する。データセット合成ステップは、生成された前記変換データセットとを合成して、拡張データセットを生成する。【選択図】図3
Description
本明細書及び図面に開示の実施形態は、データ拡張方法、データ拡張装置及びプログラムに関する。
現在、ディープラーニング又は機械学習は、多くの医療関連タスクにおいてうまく適用されている。しかしながら、このような技術は、オーバーフィッティング(過学習)を回避するために、ビッグデータの多様性と量に大きく依存している。
データ拡張(Data Augmentation)には、学習データセットの多様性と量を拡張して、より良いディープラーニングモデルを構築できるという一連の技術が含まれている。そのうち、有用な技術の1つは、画像をブレンド(合成)することである。図1は、従来の画像ブランディング法の概要を説明するためのフローチャートである。画像をブレンドする手順としては、図1に示す如く、おおまかに、サブ画像の取得、互いに重複する領域を有する複数の画像(重複画像)の生成、重複画像に対するレジストレーション、レジストレーションされた重複画像に対するファインレジストレーション、サブ画像のキャリブレーション、キャリブレーションされたサブ画像の融合、およびブレンディング画像としての融合された画像の出力となっている。しかし、実際の応用では、画像ブレンディング法にはいくつかの問題がある。
まず、医用画像の場合、医用画像にとって有意義な、複数の部分を含む解剖学的構造の特徴は考慮されていないため、解剖学的構造は新しい拡張データセットで破壊されやすい。例えば、図2に示すように、肺全体は、5つの肺葉からなる複数の部分を含む解剖学的構造となっている。各肺葉は、独立した器官であり、それぞれは特定のテクスチャ分布などを有し、肺全体のサブ部分の一つである。従来の画像ブレンディング法を適用すると、肺葉内の何らかの有用な特徴が失われてしまい、ディープラーニングモデル学習(訓練)により得られるのは解剖学的構造の特徴を失った結果であり、臨床的に実用に耐えない。
次に、新たな拡張データセットと元のデータセットとの間で類似した強度およびテクスチャ分布を持つことは難しい。現在、ほとんどの方法は、画像をランダムにブレンドすることであり、その結果、ブレンディング部分には、元の画像と拡張画像との間で、明確な強度およびテクスチャ分布などの関係がない。このようなブレンディング画像は、人間の視覚観察には奇妙に見え、ユーザは、その実用性の有無を確認することができない。実際に、このようなブレンディング画像は、実用性を持たないことが多い。
さらに、新たな拡張データセットには、十分な新たな有効な画像特徴が生成されていない。ブレンディング画像における画像特徴の多くは、元のデータから得られるものである。このように、新たに生成された有効な画像特徴が多ければ多いほど、ブレンディング画像は有意義である。ディープラーニング学習にとって、様々な有効な画像特徴は、モデルの汎化性能を向上させることができる。
このように、従来の上述したデータ拡張方法を実行する医用画像処理装置は、性能をより一層向上させる必要がある。
本明細書及び図面に開示の実施形態が解決しようとする課題の一つは、学習性能を向上させることが可能な拡張データセットを生成することである。ただし、本明細書及び図面に開示の実施形態により解決しようとする課題は上記課題に限られない。後述する実施形態に示す各構成による各効果に対応する課題を他の課題として位置付けることもできる。
実施形態のデータ拡張方法は、解剖学的構造が描出された解剖学的構造データのデータ拡張方法であって、データセット取得ステップと、データセット分割ステップと、データセット変換ステップと、データセット合成ステップとを含む。データセット取得ステップは、前記解剖学的構造に関連する解剖学的構造データセットを取得する。データセット分割ステップは、前記解剖学的構造を構成するサブ部分毎に、取得された前記解剖学的構造データセットに含まれる少なくとも二つの前記解剖学的構造データを前記解剖学的構造に基づいてそれぞれサブデータセットに分割する。データセット変換ステップは、前記少なくとも二つの前記解剖学的構造データのうち、一の解剖学的構造データのサブデータセットを参照データセットとして、他の解剖学的構造データのサブデータセットに含まれる少なくとも一つのサブデータをデータセット変換して、変換データセットを生成する。データセット合成ステップは、前記参照データセットに含まれる少なくとも一つの参照データと、生成された前記変換データセットとを合成して、拡張データセットを生成する。
以下で説明する実施形態に係るデータ拡張方法は、解剖学的構造が描出された解剖学的構造データのデータ拡張方法であって、前記解剖学的構造に関連する解剖学的構造データセットを取得するデータセット取得ステップと、前記解剖学的構造を構成するサブ部分毎に、取得された前記解剖学的構造データセットに含まれる少なくとも二つの前記解剖学的構造データを前記解剖学的構造に基づいてそれぞれサブデータセットに分割するデータセット分割ステップと、前記少なくとも二つの前記解剖学的構造データのうち、一の解剖学的構造データのサブデータセットを参照データセットとして、他の解剖学的構造データのサブデータセットに含まれる少なくとも一つのサブデータをデータセット変換して、変換データセットを生成するデータセット変換ステップと、前記参照データセットに含まれる少なくとも一つの参照データと、生成された前記変換データセットとを合成して、拡張データセットを生成するデータセット合成ステップと、を含む。
また、データ拡張方法は、所定の条件に基づいて、取得された前記解剖学的構造データセットに含まれる複数の解剖学的構造データのそれぞれが二つ以上のデータグループのうちのいずれかのデータグループに属するように、前記複数の解剖学的構造データをグループ化するデータセットグループ化ステップをさらに含み、前記データセット分割ステップにおいて、前記データグループ毎に、前記データグループに属する前記少なくとも二つの解剖学的構造データをそれぞれサブデータセットに分割し、前記データセット変換ステップにおいて、前記二つ以上のデータグループのうち、一のデータグループに属する前記一の解剖学的構造データのサブデータセットを前記参照データセットとして、他のデータグループに属する前記他の解剖学的構造データのサブデータセットに含まれる前記少なくとも一つのサブデータをデータセット変換して、前記変換データセットを生成してもよい。
また、データ拡張方法の前記データセット取得ステップにおいて、さらに、前記解剖学的構造データセットに対応するマーキングデータセットを取得し、前記マーキングデータセットは、前記サブ部分毎に、前記解剖学的構造データセットをマーキングしてもよい。
また、データ拡張方法の前記データセット分割ステップにおいて、前記マーキングデータセットに基づいて、前記少なくとも二つの解剖学的構造データセットをそれぞれサブデータセットに分割してもよい。
また、データ拡張方法の前記データセット取得ステップにおいて、さらに、前記解剖学的構造データセットに対応するマーキングデータセットを取得し、前記データセット分割ステップにおいて、前記マーキングデータセットに基づいて、前記データグループ毎に、前記データグループに属する前記少なくとも二つの解剖学的構造データをそれぞれサブデータセットに分割してもよい。
また、データ拡張方法において、前記サブデータセットは、前記サブ部分のサブデータと、隣接する前記サブ部分同士間の重複部分のデータとを含んでもよい。
また、データ拡張方法の前記データセット変換ステップにおいて、前記少なくとも二つの解剖学的構造データのうち、前記一の解剖学的構造データの第1のサブ部分のサブデータを含むサブデータセットを前記参照データセットとして、前記他の前記解剖学的構造データの前記サブデータセットにおける前記第1のサブ部分のサブデータを、正規化および/またはデータレジストレーションして、前記変換データセットを生成してもよい。
また、前記解剖学的構造は、前記第1のサブ部分と、前記第1のサブ部分に隣接する第2のサブ部分と、前記第1のサブ部分と前記第2のサブ部分との間に位置する第1の重複部分とを備え、データ拡張方法の前記データセット変換ステップにおいて、前記少なくとも二つの解剖学的構造データのうち、前記一の解剖学的構造データのサブデータセットにおける前記第1の重複部分のサブデータと、前記他の解剖学的構造データのサブデータセットにおける前記第1の重複部分のサブデータと、前記正規化および/または前記データレジストレーションされた前記第1のサブ部分のサブデータと、に基づいて、3次元変形演算を行い、変形場を算出し、前記変換データセットを生成してもよい。
また、データ拡張方法の前記データセット合成ステップにおいて、前記変形場に基づいて、前記少なくとも二つの解剖学的構造データのうち、前記一の解剖学的構造データのサブデータセットにおける前記第2のサブ部分のサブデータを変形して、当該第2のサブ部分のサブデータの変換データを生成し、前記他の解剖学的構造データのサブデータセットにおける前記第1のサブ部分のサブデータを3次元変形または2次元変形して、当該第1のサブ部分のサブデータの変換データを生成した後、生成された当該第2のサブ部分のサブデータの変換データ及び当該第1のサブ部分のサブデータの変換データを合成して、前記拡張データセットを生成してもよい。
また、データ拡張方法において、前記3次元変形または前記2次元変形は、剛性レジストレーション及び非剛性レジストレーションのいずれか又はそれらの組み合わせであってもよい。
また、データ拡張方法において、前記解剖学的構造データが二次元データである場合、前記データセットグループ化ステップにおいて、前記解剖学的構造データセットに含まれる前記少なくとも二つの解剖学的構造データが類似の解剖学的位置および構造を有するか否かを判断してもよい。
また、データ拡張方法において、前記所定の条件は、被検体の性別、年齢、体形、疾患情報、病変部位、臓器内の病変の割合、及び、類似する解剖学的構造のうちの少なくとも1つに関する条件であってもよい。
また、データ拡張方法において、前記解剖学的構造は、2つ以上の相対的に独立した隣り合うサブ部分を含んでもよい。
また、データ拡張方法において、前記解剖学的構造は、肺、心臓及び肝臓のうちの1つであってもよい。
また、以下で説明する実施形態に係るデータ拡張装置は、解剖学的構造が描出された解剖学的構造データのデータ拡張を実行するデータ拡張装置であって、前記解剖学的構造に関連する解剖学的構造データセットを取得する取得部と、前記解剖学的構造を構成するサブ部分毎に、取得された前記解剖学的構造データセットに含まれる少なくとも二つの前記解剖学的構造データを前記解剖学的構造に基づいてそれぞれサブデータセットに分割する分割部と、前記少なくとも二つの前記解剖学的構造データのうち、一の解剖学的構造データのサブデータセットを参照データセットとして、他の解剖学的構造データのサブデータセットに含まれる少なくとも一つのサブデータをデータセット変換して、変換データセットを生成する変換部と、前記参照データセットに含まれる少なくとも一つの参照データと、生成された前記変換データセットとを合成して、拡張データセットを生成する合成部と、を備える。
また、以下で説明する実施形態に係るプログラムは、解剖学的構造が描出された解剖学的構造データのデータ拡張方法をコンピュータに実行させるためのプログラムであって、前記解剖学的構造に関連する解剖学的構造データセットを取得する処理と、前記解剖学的構造を構成するサブ部分毎に、取得された前記解剖学的構造データセットに含まれる少なくとも二つの前記解剖学的構造データを前記解剖学的構造に基づいてそれぞれサブデータセットに分割する処理と、前記少なくとも二つの前記解剖学的構造データのうち、一の解剖学的構造データのサブデータセットを参照データセットとして、他の解剖学的構造データのサブデータセットに含まれる少なくとも一つのサブデータをデータセット変換して、変換データセットを生成する処理と、前記参照データセットに含まれる少なくとも一つの参照データと、生成された前記変換データセットとを合成して、拡張データセットを生成する処理と、を前記コンピュータに実行させるためのプログラムである。
以下、図面を参照しながら、データ拡張方法、データ拡張装置及びプログラムの各実施形態及び変形例について詳細に説明する。なお、実施形態は、内容に矛盾が生じない範囲で従来技術、他の実施形態又は変形例との組み合わせが可能である。同様に、変形例は、内容に矛盾が生じない範囲で従来技術、実施形態との組み合わせが可能である。また、以下の説明において、同様の構成要素には共通の符号を付与するとともに、重複する説明を省略する場合がある。
以下の説明では、解剖学的構造として肺を例として説明するが、これに限らず、心臓、肝臓であってもよい。また、後述する図2に示すように、肺は、複数の部分(サブ部分)を含む解剖学的構造として、5つのサブ部分である5つの肺葉からなり、各肺葉は1つの独立した器官であり、それぞれが特定の強度およびテクスチャ分布などを有する。このように、解剖学的構造は、2つ以上の相対的に独立した隣り合うサブ部分を含む。
(データ拡張方法の概要)
図3は、第1の実施形態に係るデータ拡張方法の概略フローチャートである。図3に示すように、データ拡張方法は、複数の部分(サブ部分)を含む解剖学的構造が描出された解剖学的構造データのデータ拡張方法であって、主にステップ100~ステップ500を含む。ここで、図3に示すデータ拡張方法は、一例に過ぎず、実際の状況に応じて、ステップ100~ステップ500を全て含むことなく、ステップ100~ステップ500のうちの一部のみを含んでもよい。例えば、ステップ200を含まなくてもよい。
図3は、第1の実施形態に係るデータ拡張方法の概略フローチャートである。図3に示すように、データ拡張方法は、複数の部分(サブ部分)を含む解剖学的構造が描出された解剖学的構造データのデータ拡張方法であって、主にステップ100~ステップ500を含む。ここで、図3に示すデータ拡張方法は、一例に過ぎず、実際の状況に応じて、ステップ100~ステップ500を全て含むことなく、ステップ100~ステップ500のうちの一部のみを含んでもよい。例えば、ステップ200を含まなくてもよい。
ステップ100は、データセット取得ステップである。ステップ100において、例えば、解剖学的構造に関連する解剖学的構造データセットを取得する。また、ステップ100において、解剖学的構造データセットに対応するマーキングデータセット(GTsと記す場合がある)を取得する場合もある。なお、解剖学的構造データセットは、解剖学的構造データの集合を意味し、マーキングデータセットGTsは、マーキングデータの集合を意味する。ここで、本明細書において、データセットは、データの集合を意味し、データセットに含まれるデータの数が複数である場合のみならず、データセットに含まれるデータの数が1つである場合もあり得る。以下で説明する他のデータセットについても同様である。
ここで、複数の部分を含む解剖学的構造データセット(以下、単に解剖学的構造データセットと呼ぶこともある)は、例えば、肺データセットであり、この解剖学的構造データセットは、具体的には、X線CT(Computed Tomography)装置、MRI(Magnetic Resonance Imaging)装置、超音波診断装置などの画像取得装置によって取得された画像データセットである。なお、この解剖学的構造データセットには、被検体の性別、年齢、体形、疾患情報、病変部位、臓器病変の割合等といった事前に収集された基本情報が含まれていてもよい。
また、マーキングデータセットGTsは、例えば医師等の操作者が解剖学的構造データセットをマーキングしたデータセットである。このマーキングデータセットGTsは、例えば、解剖学的構造データセットに対応する。マーキングデータセットGTsは、解剖学的構造を構成するサブ部分毎に、解剖学的構造データセットをマーキングしたものであり、解剖学的構造を構成するサブ部分によって異なるデータの集合である。ここで、マーカとしては、例えば、解剖学的構造の各サブ部分を区別するマーカや、病変部位であるか否かを区別するマーカ等であり得る。マーキングデータセットGTsは、予め取得されて記憶されているものであり得る。
例えば、ステップ100において、上述した画像取得装置から解剖学的構造データセットを取得してもよいし、予めメモリ等の記憶回路に解剖学的構造データセットが記憶されている場合、記憶回路から解剖学的構造データセットを取得してもよい。マーキングデータセットGTsについても同様である。
ステップ200は、データセットグループ化ステップである。ステップ200のデータセットグループ化ステップでは、所定の条件に基づいて、ステップ100で取得した解剖学的構造データセットに含まれる複数の解剖学的構造データのそれぞれが、二つ以上のデータグループのうちのいずれかのデータグループに属するように、複数の解剖学的構造データをグループ化する。ここで、所定の条件は、例えば、被検体の性別、年齢、体形、疾患情報、病変部位、臓器内の病変の割合、及び、類似する解剖学的構造等のうちの少なくとも1つに関する条件である。データセットグループ化ステップにより、解剖学的構造データセットから、次の処理に適したデータセットを選別することができる。
ステップ300は、データセット分割ステップである。ステップ300のデータセット分割ステップでは、例えば、ステップ100で取得された解剖学的構造データセットに含まれる少なくとも二つの解剖学的構造データまたはステップ200のデータセットグループ化ステップで取得された各データグループに属する少なくとも一つの解剖学的構造データ又は特定の一つのデータグループに属する少なくとも二つの解剖学的構造データを、解剖学的構造に基づいて、それぞれサブデータセットに分割する。すなわち、ステップ300のデータセット分割ステップでは、例えば、上述した二つ以上のデータグループのうち一つのデータグループに属する二つの解剖学的構造データ、又は、二つのデータグループのそれぞれに属する一つの解剖学的構造データをサブデータセットに分割することにより、二つのサブデータセットを取得する。ステップ300のデータセット分割ステップでは、マーキングデータセットGTsに基づいて分割することが好ましい。例えば、ステップ300のデータセット分割ステップでは、ステップ100で取得した解剖学的構造データセットに含まれる少なくとも二つの解剖学的構造データを、マーキングデータセットGTsに基づいて、解剖学的構造を構成するサブ部分ごとに、サブデータセットに分割してもよい。また、ステップ300のデータセット分割ステップでは、ステップ200のデータセットグループ化ステップで取得した各データグループに属する少なくとも一つの解剖学的構造データ又は特定の一つのデータグループに属する少なくとも二つの解剖学的構造データを、マーキングデータセットGTsに基づいて、解剖学的構造を構成するサブ部分ごとに、サブデータセットに分割してもよい。すなわち、ステップ300のデータセット分割ステップでは、例えば、マーキングデータセットGTsに基づいて、上述した二つ以上のデータグループのうち一つのデータグループに属する二つの解剖学的構造データ、又は、二つのデータグループのそれぞれに属する一つの解剖学的構造データをサブデータセットに分割することにより、二つのサブデータセットを取得してもよい。さらに、ステップ300のデータセット分割ステップでは、二つ以上の解剖学的構造データセットに含まれる少なくとも二つの解剖学的構造データ又は二つ以上のデータグループに属する少なくとも二つの解剖学的構造データを一つずつ分割(シリアルで分割)するか又か並列的に分割(パラレルで分割)して、サブデータセットを取得するようにしてもよい。ここで、サブデータセットは、解剖学的構造を構成する各サブ部分のデータ(サブデータ)と、隣接するサブ部分同士間の重複部分のデータとを含む。なお、隣接するサブ部分同士間の重複部分についてもサブ部分と称される場合があり、この重複部分のデータについても、サブデータと称される場合がある。
ステップ400は、データセット変換ステップである。ステップ400のデータセット変換ステップでは、指定されたプロトコルに従って解剖学的構造を構成するサブ部分のサブデータの集合であるサブデータセットに含まれる少なくとも一つのサブデータをデータセット変換し、変換データセットを生成する。ここで、指定されたプロトコルとは、効果的な拡張データセットを実際の必要に応じて選択するための評価基準または指示である。また、データセット変換は、正規化、データレジストレーション、3D変形等の様々な公知のデータ処理方法であり得る。例えば、このような処理の一例としては、複数の画像間での輝度の差が小さくなるように輝度を調整する処理等が挙げられる。また、正規化では、2つの画像間における強度分布、スケール、テクスチャ分布等が同一又は類似となるように、2つの画像のうち少なくとも一方に対して画像処理が施される。
例えば、ステップ400のデータセット変換ステップでは、ステップ300のデータセット分割ステップにより取得されたサブデータセットに含まれる少なくとも一つのサブデータをデータセット変換して、変換データセットを生成する。なお、サブデータセットに含まれるサブデータの数が一つである場合には、ステップ400のデータセット変換ステップでは、単に、一つのサブデータをデータ変換して、変換データを生成する。
例えば、ステップ400のデータセット変換ステップにおいて、2つ以上のデータグループのうちの1つのデータグループに属する解剖学的構造データをデータセット分割ステップにより分割して得られたサブデータセットを参照データセットとして、2つ以上のデータグループのうちのもう1つのデータグループに属する解剖学的構造データのサブデータセットのうちの少なくとも1つのサブデータをデータセット変換して、変換データセットを生成してもよい。例えば、ステップ400のデータセット変換ステップにおいて、ステップ300のデータセット分割ステップにおいて取得された二つのサブデータセットのうち、一のサブデータセットを参照データセットとして、他のサブデータセットに含まれる少なくとも一つのサブデータをデータセット変換して、変換データセットを生成してもよい。
また、ステップ200のデータセットグループ化ステップがデータ拡張方法のフローチャートに含まれていない場合、ステップ400のデータセット変換ステップにおいて、少なくとも二つの解剖学的構造データのうち、一の解剖学的構造データをデータセット分割ステップにより分割して得られたサブデータセットを参照データセットとして、他の解剖学的構造データのサブデータセットに含まれる少なくとも一つのサブデータをデータセット変換して、変換データセットを生成してもよい。
また、ステップ400のデータセット変換ステップにおいて、少なくとも二つの解剖学的構造データのうち、一の解剖学的構造データのサブデータセットにおける第1のサブ部分のサブデータを参照データとして、他の解剖学的構造データのサブデータセットにおける第1のサブ部分のサブデータを正規化および/またはデータレジストレーションして、変換データセットを生成するようにしてもよい。
さらに、解剖学的構造が、第1のサブ部分と、当該第1のサブ部分に隣接する第2のサブ部分と、当該第1のサブ部分と当該第2のサブ部分との間に位置する第1の重複部分とを備える場合に、ステップ400のデータセット変換ステップにおいて、少なくとも二つの解剖学的構造データのうち、一の解剖学的構造データのサブデータセットにおける第1の重複部分のサブデータと、他の解剖学的構造データのサブデータセットにおける第1の重複部分のサブデータと、正規化および/またはデータレジストレーションされた第1のサブ部分のサブデータと、に基づいて、3次元変形または2次元変形演算を行い、変形場を算出し、変換データセットを生成するようにしてもよい。
ステップ500は、データセット合成ステップである。ステップ500のデータセット合成ステップでは、参照データセットに含まれる少なくとも一つの参照データと、ステップ400のデータセット変換ステップで生成された変換データセットとを合成して、拡張データセットを生成する。なお、ステップ400のデータセット変換ステップにおいて、変換データセットではなく、上述した変換データが生成された場合、ステップ500のデータセット合成ステップでは、参照データセットに含まれる少なくとも一つの参照データと、ステップ400のデータセット変換ステップで生成された変換データとを合成して、拡張データを生成する。また、ステップ500のデータセット合成ステップにおいて、変形場に基づいて、少なくとも二つの解剖学的構造データのうち、一の解剖学的構造データのサブデータセットにおける第2のサブ部分のサブデータを変形して、当該第2のサブ部分のサブデータの変換データを生成し、他の解剖学的構造データのサブデータセットにおける第1のサブ部分のサブデータを変形して、当該第1のサブ部分のサブデータの変換データを生成した後、生成された当該第2のサブ部分のサブデータの変換データ及び当該第1のサブ部分のサブデータの変換データを合成して、拡張データセットを生成してもよい。なお、ここでの変形は、例えば、3次元変形又は2次元変形である。
(第1の実施形態)
以下、主に図2~図9を参照して、第1の実施形態に係るデータ拡張方法について説明する。第1の実施形態では、三次元の複数のサブ部分を含む解剖学的構造データのデータ拡張について説明する。
以下、主に図2~図9を参照して、第1の実施形態に係るデータ拡張方法について説明する。第1の実施形態では、三次元の複数のサブ部分を含む解剖学的構造データのデータ拡張について説明する。
本実施形態では、肺を例にしてデータ拡張をどのように実現するかについて説明する。図2は、第1の実施形態に係る肺の構造を示す概略図である。図2の(a)は、左肺野および右肺野全体の概略図であり、図2の(b)は、左肺野の概略図であり、図2の(c)は、右肺野の概略図である。図2に示すように、肺全体は、複数のサブ部分を含む解剖学的構造であって、5つの肺葉を組み合わせたものである。各肺葉は独立した器官である。同じ肺野(例えば、左肺野または右肺野)に隣接する肺葉間は、葉間裂(場合によっては、肺裂とも呼ばれる)と呼ばれる組織層によって分離されている。
図4は、第1の実施形態のデータ拡張方法を説明するための概略図である。図4は、2つの異なる被検体の肺の左肺野の3次元データセットに基づいてデータ拡張を行う例を示している。
図4に示す例では、左肺野に関するデータグループのうちの2枚の画像AとBについて、データセット分割を行い、左肺を3つの部分に分割して、左肺を構成する左上葉、左肺裂表面、左下葉との3つのサブ部分のサブデータセットを取得し、各サブデータセットに基づいて、図4における1~3に示すデータセット変換処理、および、図4における4に示すデータセット合成処理とを行って、拡張データセットを取得する。なお、画像A及び画像Bは、解剖学的構造データの一例である。
次に、図4~図9を組み合わせて、第1の実施形態に係るデータ拡張方法について詳細に説明する。
まず、図4に示すように、データグループは、ステップ200のデータセットグループ化ステップによって得られたデータグループである。
図5は、第1の実施形態のステップ200に係るデータセットグループ化処理の一例を説明するための図である。
図5に示すように、ステップ100により取得された解剖学的構造データセットについて、異なる状況(例えば、状況1、状況2、……状況n)に応じて、例えば、被検体の性別、年齢、体形、疾患情報、病変部位、臓器内の病変の割合、類似する解剖学的構造(2Dデータセットにについて)等の条件別の組み合わせで、データセットグループ化を行って、状況1、状況2、……状況nに、それぞれ対応するデータグループ1、データグループ2、……データグループnを取得する。
このように、ステップ100により取得された解剖学的構造データセットの全てが必ずしもユーザのニーズを満たすことができるとは限らないという現状について、拡張データセットの有効性と訓練モデルの正確性を向上させるために、異なる状況に対し、標的性のある異なるデータグループが適用される。これにより、特定の条件または要求に応じてデータセットグループ化した後にデータ拡張が行なわれ、標的化された、個性化されたデータ拡張を実現することができ、拡張データセットの有効性と訓練モデルの正確性を向上可能である。
図4に戻って、データグループにおける2枚の画像AおよびBについて、ステップ300に係るデータセット分割処理を行う。
図6は、第1の実施形態に係るデータセット分割処理の一例を説明するためのフローチャートである。図6に示すように、データセット分割時には、画像AとBに対して、まず、図6における301に示すように、マーキングデータセットGTsである肺葉GTに基づいて、左肺のデータセットを3つのサブ部分のサブデータセットに分割する。
そして、図6における302に示すように、各データの種類の相違に応じて、各サブデータセットをマーキングして記憶する。例えば、左肺のデータセットを3つのサブ部分のサブデータセットに分割して、それぞれ、LL(左下葉)、LU(左上葉)、およびF(左肺裂表面)とマーキングする。また、Rをマークして、当該サブ部分を参照データセットとすることを示し、Fをマークして、当該サブ部分を浮動データセットとすること示してもよい。また、この処理をループして行うことにより、データグループにおける各画像の全てのデータをマーキングして記憶することができる。
例えば、図4に示すように、画像Aは、参照データセット(サブデータセット)として、左上葉LURlobe、左肺裂表面LRfissure、左下葉LLRlobeを含む。また、左上葉LURlobe、左肺裂表面LRfissure、左下葉LLRlobeのそれぞれは、サブデータの一例でもあり、参照データの一例である。また、画像Bは、浮動データセット(サブデータセット)として、左上葉LUFlobe、左肺裂表面LFfissure、左下葉LLFlobeを含む。左上葉LUFlobe、左肺裂表面LFfissure、左下葉LLFlobeのそれぞれは、サブデータの一例でもある。
図4に戻ると、図6に示すデータセット分割処理の後、取得された各サブデータセットに基づいて、図4における1~3に示すデータセット変換処理と、図4における4に示すデータセット合成処理を行って、拡張データセットを取得する。
図7は、第1の実施形態に係るデータセット変換処理およびデータセット合成処理の一例の概要を説明するためのフローチャートである。図7に示すように、浮動データセットのデータストリームは破線で示され、参照データセットのデータストリームは実線で示されている。
データセット変換中、まず、図7の401に示すように、画像Aの左下葉LLRlobeと画像Bの左下葉LLFlobeとに基づいて正規化を行う。例えば、画像Bの左下葉LLFlobeを画像Aの左下葉LLRlobeに対して正規化して画像Bの正規化された左下葉LLFlobe’を得る。画像Bの正規化された左下葉LLFlobe’の強度分布、スケール、テクスチャ分布等は、画像Aの左下葉LLRlobeと基本的に同一又は類似している。このように、正規化処理を行うことにより、浮動データセットは、参照データセットと類似の特徴を得ることができる。また、正規化の他に、必要に応じて画像Bの左下葉LLFlobeを画像Aの左下葉LLRlobeに対してレジストレーションしてもよい。このようにして、異なる被験者間の解剖学的強度、構造、臓器サイズのデータ差異による、拡張データセットの有効性の低下を回避し、高い有効性のデータ拡張と高精度の学習済みモデル(学習モデル)を実現することができる。
次に、図7の402に示すように、画像Aの左下葉LLRlobe、画像Aの左肺裂表面LRfissure、画像Bの左肺裂表面LFfissureおよび画像Bの正規化された左下葉LLFlobe’に基づいて3次元変形(3D変形)を行う。例えば、LLRlobe、LLFlobe’、LFfissure及びLRfissureに基づいて、画像Bの左肺裂表面LFfissureを基準面となる画像Aの左肺裂表面LRfissureにフィッティングし、3次元変形場を生成する。変形場は、現在のオブジェクトから基準オブジェクトへの非線形変換を表す。
現在、変形場を生成するための有効な三次元変形アルゴリズムが多く存在しており、これらのアルゴリズムの1つの重要なステップは、2つの計算対象面上で1対の対応点セットを取得することである。図8は、第1の実施形態に係るデータセット変換処理における三次元変形の一例を説明するためのフローチャートである。
図8に示すように、まず、ステップ405に示すように、LLRlobe、LLFlobe’に基づいて、剛性レジストレーション(剛体変形)により変換行列Mを取得する。剛性レジストレーションはオブジェクトの形状を変更せず、LLRlobe、LLFlobe’に類似のサイズとパターンを有させることができる。このように、剛性レジストレーションによって、取得しようとする対応点セットを非線形変換の前に可能な限り接近させることができる。なお、非剛性レジストレーション、又は、剛性レジストレーション及び非剛性レジストレーションの組合せにより、変換行列を取得してもよい。
次に、ステップ406に示すように、変換行列Mを適用して、画像Bの左肺裂表面LFfissureを変換し、変換後の新たな左肺裂表面LFfissure’を生成する。
次に、ステップ407に示すように、画像Aの左肺裂表面LRfissure、画像Bの変換後の新たな左肺裂表面LFfissure’に基づいて、両表面における一対の対応点セットを変形制御点として抽出する。点セットを取得する方法は様々であり、例えば画像特徴点を利用することができる。
次に、ステップ408に示すように、ステップ407で取得した点セットに基づいて、変形場Fを推定する。変形場Fを推定する方法は、例えば、薄板スプライン補間(TPS)などの既存のアルゴリズムである。
図7に戻って、図7の403に示すように、画像Aの左上葉LURlobeと、画像Bの左下葉LLFlobeと、ステップ402で得られた変形場Fとに基づいて、画像合成が行われる。
図9は、第1の実施形態に係る合成処理の一例を説明するためのフローチャートである。図9のステップ409に示すように、画像Bの正規化された左下葉LLFlobe’に対して変換行列Mおよび変形場Fを適用してLLFlobe’’が取得される。例えば、以下の式(1)に基づいて、LLFlobe’’が取得される。
LLFlobe’’=F×M×LLFlobe’・・・(1)
LLFlobe’’=F×M×LLFlobe’・・・(1)
次に、ステップ410に示すように、上記変換処理されたLLFlobe’’および画像Aの左上葉LURlobeを合成し、新たな左肺野画像データである拡張データを生成する。
なお、図示は明確ではないが、合成処理中または合成処理後に、マーキングデータセットGTsを処理して、拡張されたマーキングデータセットGTsを生成する。
図7に戻って、図7の404に示すように、一般的な指標又はユーザからの要求により指定された指標等の特定のプロトコルに基づいて、生成された新しい拡張データに対してフィルタをかける。例えば、質又は量に関する指標に基づいて、新しい拡張データに正しい解剖学的構造があるか否かを確認(判定)する。一例を挙げて説明すると、新しい拡張データに肺全体が描出されているか否かを確認する。もし、新しい拡張データに肺全体が描出されていない場合、その拡張データを用いた学習の効果が疑わしく、また、その拡張データにより学習されたモデルは、臨床的に実用に耐えないように考えられる。このため、新しい拡張データに肺全体が描出されている場合のみ、拡張データセットに追加する拡張データとして採用する。すなわち、新しい拡張データに肺全体が描出されていない場合、拡張データセットに追加する拡張データとして採用しない。
他の例を挙げて説明すると、新しい拡張データに複数の肺葉により完全な肺が描出されているか否かを確認するために、肺葉の輪郭の組合せが連続的又は完全であるか否かを確認する。もし、肺葉の輪郭の組合せが連続的でなく完全でない場合、ディープラーニングモデルを学習する際に、肺葉のセグメンテーションのミスが生じてしまう場合がある。このため、新しい拡張データに描出された肺葉の輪郭の組合せが連続的又は完全である場合のみ、拡張データセットに追加する拡張データとして採用する。すなわち、新しい拡張データに描出された肺葉の輪郭の組合せが連続的でなく完全でない場合、拡張データセットに追加する拡張データとして採用しない。
上述したような方法により、新しい拡張データに対してフィルタをかけることにより、最終的に学習に用いられる拡張データの質を、より実際の臨床に耐えうる質に近づけさせることができるとともに、学習に一層適合させることができる。
そして、生成された拡張データを拡張データセットに追加する。そして、画像の組合せを変えて、上述した方法と同様の方法により、繰り返し拡張データを生成することにより拡張データセットに含まれる拡張データの数が増加する。
このように、第1の実施形態のデータ拡張方法によれば、前記のように、データセットグループ化処理、データセット分割処理、データセット変換処理およびデータセット合成処理を行うことにより、解剖学的構造の特徴を効果的に考慮し適用して、生成された拡張データ(拡張データセット)に元のデータセットと類似した強度およびテクスチャ分布を持たせることができ、データ学習性能をうまく向上させることができる。すなわち、学習性能を向上させることが可能な拡張データセットを生成することができる。また、解剖学的構造を構成するサブ部分の基本的な解剖学的情報を完全に保存することができ、同時に、合成画像に新たな有効な画像特徴を生成できるため、データの多様性を効果的に向上させることができる。また、少量の学習データセットにより解剖学的構造に合致する拡張データをより多く生成することができ、データ量を増加することができる。また、高精度な学習を実現して高精度で汎化性の高い学習済みモデルを得ることができ、学習済みモデルを学習させる装置の性能を向上させることができる。
(第2の実施形態)
次に、主に図2、図3、図10及び図11を参照して、第2の実施形態に係るデータ拡張方法について説明する。本実施形態では、同一の被検体の3次元の複数のサブ部分を含む解剖学的構造データのデータ拡張について説明する。
次に、主に図2、図3、図10及び図11を参照して、第2の実施形態に係るデータ拡張方法について説明する。本実施形態では、同一の被検体の3次元の複数のサブ部分を含む解剖学的構造データのデータ拡張について説明する。
図10は、第2の実施形態のデータ拡張方法を説明するための概略図である。図10には、同一の被検体の肺の左肺野の3次元データセットに基づいてデータ拡張を行った例が示されている。
図10に示す例では、同一の被検体についての左肺野のデータセットにおける2枚の画像AとBについて、データセット分割を行い、左肺を3つの部分に分割し、参照データセットとなる画像Aについて、左上葉LURlobe、左肺裂表面LRfissure、左下葉LLRlobeのサブデータセットを取得する。また、浮動データセットとなる画像Bについて、左上葉LUFlobe、左肺裂表面LFfissure、左下葉LLFlobeのサブデータセットを取得する。
その後、各サブデータセットに基づいて合成処理を行って、拡張データセットを取得する。
図11は、第2の実施形態に係る合成処理の一例を説明するための図である。図11に示すように、合成処理中、画像Bの左下葉LLFlobeと画像Aの左上葉LURlobeとを直接合成し、種々のデータセット変換を行うことなく、新たな左肺野画像データである拡張データセットを生成し、生成された拡張データを拡張データセットに追加することができる。
本実施形態のデータ拡張方法によれば、同一の被検体からのデータセットを適用する場合に、同一の被検体のデータセットがほぼ同一の解剖学的構造、サイズ及び位置を有するので、正規化やレジストレーション等の種々の変換を行うことなく、強度の細分化、スケールの調整等により属性を統一し、解剖学的構造を構成するサブ部分ごとにデータセットを分割した後、分割して得られた各サブデータセットを直接合成することで、簡単で、便利で、効率的にデータ拡張を実現することができる。
なお、本実施形態では、第1の実施形態のように正規化やレジストレーション等の種々の変換を行うことも可能であり、それにより、より精細な拡張データセットを得ることができる。
(第3の実施形態)
次に、主に図2、図3、図12を参照して、第3の実施形態に係るデータ拡張方法について説明する。本実施形態では、異なる被検体の2次元の複数のサブ部分を含む解剖学的構造データのデータ拡張について説明する。
次に、主に図2、図3、図12を参照して、第3の実施形態に係るデータ拡張方法について説明する。本実施形態では、異なる被検体の2次元の複数のサブ部分を含む解剖学的構造データのデータ拡張について説明する。
図12は、第3の実施形態のデータ拡張方法を説明するための概略図である。図12に、異なる被検体の肺の左肺野の2次元データセットに基づいてデータ拡張を行う例が示されている。
図12に示すように、図4に示す第1の実施形態におけるデータ拡張の処理とはほぼ同じであるが、相違点は、2次元データセットAおよびBについて、2枚の画像ができるだけ類似の解剖学的位置および構造を表示させる必要があるということである。何故ならば、画像Aが肺の周囲の2Dスライスであり、画像Bが肺門の2Dスライスである場合、2つの部分が異なる解剖学的構造を表すため、これら2つの部分を組み合わせるのは無意味で、且つ非常に困難であるためである。
したがって、2次元データを適用してデータ拡張を行う場合には、上述したステップ200に係るデータセットグループ化を行う必要がある。さらに、データセットグループ化過程中に、適用すべき2次元データセットが類似の解剖学的位置および構造を有するか否かを判断した方が好ましい。この場合、適用すべき2次元データセットが類似の解剖学的位置および構造を有する場合に、データ拡張の処理を進め、適用すべき2次元データセットが類似の解剖学的位置および構造の少なくとも一方を有さない場合に、データ拡張の処理を進めずに停止させてもよい。
上記に加えて、第3の実施形態のデータ拡張方法は、第2の実施形態のように同一の被検体のデータセットを適用してもよいし、第1の実施形態のように異なる被検体のデータセットを適用してもよい。従って、上述の第1の実施形態および第2の実施形態の技術的効果が相応に備えられている。
(第4の実施形態)
次に、上述したデータ拡張方法を実行する第4の実施形態に係るデータ拡張装置について説明する。図13は、第4の実施形態に係るデータ拡張装置100の構成の一例を示す図である。例えば、データ拡張装置100は、ネットワークを介してモダリティに対して通信可能に接続されている。
次に、上述したデータ拡張方法を実行する第4の実施形態に係るデータ拡張装置について説明する。図13は、第4の実施形態に係るデータ拡張装置100の構成の一例を示す図である。例えば、データ拡張装置100は、ネットワークを介してモダリティに対して通信可能に接続されている。
かかるモダリティは、例えば、X線CT装置、超音波診断装置、磁気共鳴イメージング(Magnetic Resonance Imaging:MRI)装置、PET(Positron Emission Tomography)装置又はSPECT(Single Photon Emission Computed Tomography)装置等の医用画像データを生成する医用画像生成装置である。例えば、モダリティは、被検体の解剖学的構造が描写された解剖学的構造データを生成する。かかる解剖学的構造データは、3次元の医用画像データ又は2次元の医用画像データである。解剖学的構造データは、例えば、CT画像データ、超音波画像データ、MR画像データ、PET画像データ及びSPECT画像データ等である。そして、モダリティは、生成した解剖学的構造データをネットワークを介してデータ拡張装置100に送信する。
データ拡張装置100は、ネットワークを介して接続されたモダリティから解剖学的構造データを取得し、解剖学的構造データに対して上述したデータ拡張方法を実行する。データ拡張装置100は、例えば、サーバやワークステーション等のコンピュータ機器によって実現される。
図13に示すように、データ拡張装置100は、ネットワーク(NetWork:NW)インタフェース101と、記憶回路102と、入力インタフェース103と、ディスプレイ104と、処理回路105とを備える。
NWインタフェース101は、データ拡張装置100と、データ拡張装置100にネットワークを介して接続された他の装置(モダリティ等)との間で送受信される各種データの伝送及び通信を制御する。例えば、NWインタフェース101は、処理回路105に接続されており、他の装置により送信されたデータ等を受信し、受信されたデータ等を処理回路105に送信する。具体的には、モダリティにより送信された解剖学的構造データを受信し、受信された解剖学的構造データを処理回路105に送信する。また、NWインタフェース101は、処理回路105により送信されたデータ等を受信し、受信されたデータ等を他の装置に送信する。例えば、NWインタフェース101は、ネットワークカードやネットワークアダプタ、NIC(Network Interface Controller)等によって実現される。
記憶回路102は、各種データ及び各種プログラムを記憶する。具体的には、記憶回路102は、処理回路105に接続されており、処理回路105による制御を受けて各種のデータを記憶する。例えば、記憶回路102は、処理回路105による制御を受けて、解剖学的構造データセットを記憶する。また、例えば、記憶回路102は、マーキングデータセットGTsを記憶していてもよい。また、記憶回路102は、処理回路105により実行される処理で用いられる各種のデータを一時的に記憶するワークメモリとしての機能も有する。例えば、記憶回路102は、RAM(Random Access Memory)、フラッシュメモリ等の半導体メモリ素子や、ハードディスク、光ディスク等によって実現される。
入力インタフェース103は、データ拡張装置100のユーザから各種指示及び各種情報の入力操作を受け付ける。具体的には、入力インタフェース103は、処理回路105に接続されており、ユーザから受け取った入力操作を電気信号へ変換して処理回路105に送信する。例えば、入力インタフェース103は、トラックボール、スイッチボタン、マウス、キーボード、操作面へ触れることで入力操作を行うタッチパッド、表示画面とタッチパッドとが一体化されたタッチスクリーン、光学センサを用いた非接触入力インタフェース、及び音声入力インタフェース等によって実現される。なお、本明細書において、入力インタフェース103は、マウス、キーボード等の物理的な操作部品を備えるものだけに限られない。例えば、データ拡張装置100とは別体に設けられた外部の入力機器から入力操作に対応する電気信号を受け取り、この電気信号を処理回路105へ送信する電気信号の処理回路も入力インタフェース103の例に含まれる。かかる処理回路は、例えば、プロセッサにより実現される。入力インタフェース103は、受付部の一例である。
ディスプレイ104は、各種の画像、各種の情報及び各種のデータを表示する。具体的には、ディスプレイ104は、処理回路105に接続されており、処理回路105から受信した各種の画像データに基づく画像、各種の情報及び各種のデータを表示する。例えば、ディスプレイ104は、液晶モニタやCRT(Cathode Ray Tube)モニタ、タッチパネル等によって実現される。ディスプレイ104は、表示部の一例である。
処理回路105は、データ拡張装置100の全体を制御する。例えば、処理回路105は、入力インタフェース103を介してユーザから受け付けた入力操作に応じて、各種処理を行う。例えば、処理回路105は、データ拡張方法に対応するデータ拡張処理を実行する。処理回路105は、例えば、プロセッサにより実現される。
また、処理回路105は、NWインタフェース101により送信された解剖学的構造データを受信すると、受信された解剖学的構造データを記憶回路102に記憶させる。このようにして、次々と記憶回路102には、解剖学的構造データが記憶されることにより、記憶回路102には解剖学的構造データセットが記憶される。
図13に示すように、処理回路105は、データセット取得機能105aと、データセットグループ化機能105bと、データセット分割機能105cと、データセット変換機能105dと、データセット合成機能105eとを備える。データセット取得機能105aは、取得部の一例である。データセットグループ化機能105bは、グループ化部の一例である。データセット分割機能105cは、分割部の一例である。データセット変換機能105dは、変換部の一例である。データセット合成機能105eは、合成部の一例である。
ここで、例えば、図13に示す処理回路105の構成要素であるデータセット取得機能105a、データセットグループ化機能105b、データセット分割機能105c、データセット変換機能105d及びデータセット合成機能105eの各処理機能は、コンピュータによって実行可能なプログラムの形態で記憶回路102に記憶されている。処理回路105は、各プログラムを記憶回路102から読み出し、読み出した各プログラムを実行することで各プログラムに対応する機能を実現する。換言すると、各プログラムを読み出した状態の処理回路105は、図13の処理回路105内に示された各機能を有することとなる。
データセット取得機能105aは、ステップ100のデータセット取得ステップにおける処理と同様の処理を実行する。データセットグループ化機能105bは、ステップ200のデータセットグループ化ステップにおける処理と同様の処理を実行する。データセット分割機能105cは、ステップ300のデータセット分割ステップにおける処理と同様の処理を実行する。データセット変換機能105dは、ステップ400のデータセット変換ステップと同様の機能を実行する。データセット合成機能105eは、ステップ500のデータセット合成ステップにおける処理と同様の処理を実行する。
以上、第4の実施形態に係るデータ拡張装置100について説明した。データ拡張装置100によれば、上述した実施形態と同様の効果を奏する。
(変形例)
以上、本発明の第1乃至第4の実施形態について肺を例に挙げて説明したが、これらに限らず、本発明のデータ拡張方法は、心臓、肝臓等の複数のサブ部分を含む解剖学的構造データのデータ拡張にも適用されうる。
以上、本発明の第1乃至第4の実施形態について肺を例に挙げて説明したが、これらに限らず、本発明のデータ拡張方法は、心臓、肝臓等の複数のサブ部分を含む解剖学的構造データのデータ拡張にも適用されうる。
また、本実施形態の実現形態は、データ拡張方法に限らず、データ拡張方法を実行する医用画像処理装置やデータ拡張方法を実行するためのプログラムが記録された記録媒体として実現してもよい。
また、前述した実現形態では、画像A及びBのそれぞれは一枚の画像である場合について説明したが、これに限られない。画像A及びBはそれぞれ一組の画像を代表することができる。
上述した説明で用いた「プロセッサ」という文言は、例えば、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、或いは、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、プログラマブル論理デバイス(例えば、単純プログラマブル論理デバイス(Simple Programmable Logic Device:SPLD)、複合プログラマブル論理デバイス(Complex Programmable Logic Device:CPLD)、及びフィールドプログラマブルゲートアレイ(Field Programmable Gate Array:FPGA))等の回路を意味する。プロセッサが例えばCPUである場合、プロセッサは、メモリに保存されたプログラムを読み出して実行することで、機能を実現する。一方、プロセッサが例えばASICである場合、メモリにプログラムを保存する代わりに、当該機能がプロセッサの回路内に論理回路として直接組まれる。なお、本実施形態の各プロセッサは、プロセッサごとに単一の回路として構成される場合に限らず、複数の独立した回路を組み合わせて一つのプロセッサとして構成し、その機能を実現するようにしてもよい。
ここで、プロセッサによって実行されるプログラムは、ROM(Read Only Memory)や記憶回路等に予め組み込まれて提供される。なお、このプログラムは、これらの装置にインストール可能な形式又は実行可能な形式のファイルでCD(Compact Disk)-ROM、FD(Flexible Disk)、CD-R(Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な非一過性の記憶媒体に記録されて提供されてもよい。また、このプログラムは、インターネット等のネットワークに接続されたコンピュータ上に格納され、ネットワーク経由でダウンロードされることによって提供又は配布されてもよい。例えば、このプログラムは、上述した各処理機能を含むモジュールで構成される。実際のハードウェアとしては、CPUが、ROM等の記憶媒体からプログラムを読み出して実行することにより、各モジュールが主記憶装置上にロードされて、主記憶装置上に生成される。
以上説明した少なくとも一つの実施形態又は変形例によれば、学習性能を向上させることが可能な拡張データセットを生成することができる。
いくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
100 データセット取得ステップ
200 データセットグループ化ステップ
300 データセット分割ステップ
400 データセット変換ステップ
500 データセット合成ステップ
200 データセットグループ化ステップ
300 データセット分割ステップ
400 データセット変換ステップ
500 データセット合成ステップ
Claims (16)
- 解剖学的構造が描出された解剖学的構造データのデータ拡張方法であって、
前記解剖学的構造に関連する解剖学的構造データセットを取得するデータセット取得ステップと、
前記解剖学的構造を構成するサブ部分毎に、取得された前記解剖学的構造データセットに含まれる少なくとも二つの前記解剖学的構造データを前記解剖学的構造に基づいてそれぞれサブデータセットに分割するデータセット分割ステップと、
前記少なくとも二つの前記解剖学的構造データのうち、一の解剖学的構造データのサブデータセットを参照データセットとして、他の解剖学的構造データのサブデータセットに含まれる少なくとも一つのサブデータをデータセット変換して、変換データセットを生成するデータセット変換ステップと、
前記参照データセットに含まれる少なくとも一つの参照データと、生成された前記変換データセットとを合成して、拡張データセットを生成するデータセット合成ステップと、
を含む、データ拡張方法。 - 所定の条件に基づいて、取得された前記解剖学的構造データセットに含まれる複数の解剖学的構造データのそれぞれが二つ以上のデータグループのうちのいずれかのデータグループに属するように、前記複数の解剖学的構造データをグループ化するデータセットグループ化ステップをさらに含み、
前記データセット分割ステップにおいて、前記二つ以上のデータグループのうち一つのデータグループに属する二つの解剖学的構造データ、又は、二つのデータグループのそれぞれに属する一つの解剖学的構造データをサブデータセットに分割することにより、二つのサブデータセットを取得し、
前記データセット変換ステップにおいて、前記二つのサブデータセットのうち、一のサブデータセットを前記参照データセットとして、他のサブデータセットに含まれる前記少なくとも一つのサブデータをデータセット変換して、前記変換データセットを生成する、
請求項1に記載のデータ拡張方法。 - 前記データセット取得ステップにおいて、さらに、前記解剖学的構造データセットに対応するマーキングデータセットを取得し、
前記マーキングデータセットは、前記サブ部分毎に、前記解剖学的構造データセットをマーキングする、
請求項1に記載のデータ拡張方法。 - 前記データセット分割ステップにおいて、前記マーキングデータセットに基づいて、前記少なくとも二つの解剖学的構造データセットをそれぞれサブデータセットに分割する、
請求項3に記載のデータ拡張方法。 - 前記データセット取得ステップにおいて、さらに、前記解剖学的構造データセットに対応するマーキングデータセットを取得し、
前記データセット分割ステップにおいて、前記マーキングデータセットに基づいて、前記二つ以上のデータグループのうち一つのデータグループに属する二つの解剖学的構造データ、又は、二つのデータグループのそれぞれに属する一つの解剖学的構造データをサブデータセットに分割する、
請求項2に記載のデータ拡張方法。 - 前記サブデータセットは、前記サブ部分のサブデータと、隣接する前記サブ部分同士間の重複部分のデータとを含む
請求項1に記載のデータ拡張方法。 - 前記データセット変換ステップにおいて、前記少なくとも二つの解剖学的構造データのうち、前記一の解剖学的構造データの、第1のサブ部分のサブデータを含むサブデータセットを前記参照データセットとして、前記他の前記解剖学的構造データの前記サブデータセットにおける前記第1のサブ部分のサブデータを、正規化および/またはデータレジストレーションして、前記変換データセットを生成する、
請求項6に記載のデータ拡張方法。 - 前記解剖学的構造は、前記第1のサブ部分と、前記第1のサブ部分に隣接する第2のサブ部分と、前記第1のサブ部分と前記第2のサブ部分との間に位置する第1の重複部分とを備え、
前記データセット変換ステップにおいて、前記少なくとも二つの解剖学的構造データのうち、前記一の解剖学的構造データのサブデータセットにおける前記第1の重複部分のサブデータと、前記他の解剖学的構造データのサブデータセットにおける前記第1の重複部分のサブデータと、前記正規化および/または前記データレジストレーションされた前記第1のサブ部分のサブデータと、に基づいて、3次元変形演算を行い、変形場を算出し、前記変換データセットを生成する、
請求項7に記載のデータ拡張方法。 - 前記データセット合成ステップにおいて、前記変形場に基づいて、前記少なくとも二つの解剖学的構造データのうち、前記一の解剖学的構造データのサブデータセットにおける前記第2のサブ部分のサブデータを変形して、当該第2のサブ部分のサブデータの変換データを生成し、前記他の解剖学的構造データのサブデータセットにおける前記第1のサブ部分のサブデータを変形して、当該第1のサブ部分のサブデータの変換データを生成した後、生成された当該第2のサブ部分のサブデータの変換データ及び当該第1のサブ部分のサブデータの変換データを合成して、前記拡張データセットを生成する、
請求項8に記載のデータ拡張方法。 - 前記変形は、剛性レジストレーション及び非剛性レジストレーションのいずれか又はそれらの組み合わせである、
請求項9に記載のデータ拡張方法。 - 前記解剖学的構造データが二次元データである場合、前記データセットグループ化ステップにおいて、前記解剖学的構造データセットに含まれる前記少なくとも二つの解剖学的構造データが類似の解剖学的位置および構造を有するか否かを判断する、
請求項2に記載のデータ拡張方法。 - 前記所定の条件は、被検体の性別、年齢、体形、疾患情報、病変部位、臓器内の病変の割合、及び、類似する解剖学的構造のうちの少なくとも1つに関する条件である、
請求項2に記載のデータ拡張方法。 - 前記解剖学的構造は、2つ以上の相対的に独立した隣り合うサブ部分を含む、
請求項1に記載のデータ拡張方法。 - 前記解剖学的構造は、肺、心臓及び肝臓のうちの1つである、
請求項1に記載のデータ拡張方法。 - 解剖学的構造が描出された解剖学的構造データのデータ拡張を実行するデータ拡張装置であって、
前記解剖学的構造に関連する解剖学的構造データセットを取得する取得部と、
前記解剖学的構造を構成するサブ部分毎に、取得された前記解剖学的構造データセットに含まれる少なくとも二つの前記解剖学的構造データを前記解剖学的構造に基づいてそれぞれサブデータセットに分割する分割部と、
前記少なくとも二つの前記解剖学的構造データのうち、一の解剖学的構造データのサブデータセットを参照データセットとして、他の解剖学的構造データのサブデータセットに含まれる少なくとも一つのサブデータをデータセット変換して、変換データセットを生成する変換部と、
前記参照データセットに含まれる少なくとも一つの参照データと、生成された前記変換データセットとを合成して、拡張データセットを生成する合成部と、
を備える、データ拡張装置。 - 解剖学的構造が描出された解剖学的構造データのデータ拡張方法をコンピュータに実行させるためのプログラムであって、
前記解剖学的構造に関連する解剖学的構造データセットを取得する処理と、
前記解剖学的構造を構成するサブ部分毎に、取得された前記解剖学的構造データセットに含まれる少なくとも二つの前記解剖学的構造データを前記解剖学的構造に基づいてそれぞれサブデータセットに分割する処理と、
前記少なくとも二つの前記解剖学的構造データのうち、一の解剖学的構造データのサブデータセットを参照データセットとして、他の解剖学的構造データのサブデータセットに含まれる少なくとも一つのサブデータをデータ変換して、変換データセットを生成する処理と、
前記参照データセットに含まれる少なくとも一つの参照データと、生成された前記変換データセットとを合成して、拡張データセットを生成する処理と、を前記コンピュータに実行させるためのプログラム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110979230.7 | 2021-08-25 | ||
CN202110979230 | 2021-08-25 | ||
CN202211011702.0A CN115731161A (zh) | 2021-08-25 | 2022-08-23 | 数据增强方法、使用数据增强方法的医用图像处理装置、存储介质 |
CN202211011702.0 | 2022-08-23 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023033234A true JP2023033234A (ja) | 2023-03-09 |
Family
ID=85292941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022134476A Pending JP2023033234A (ja) | 2021-08-25 | 2022-08-25 | データ拡張方法、データ拡張装置及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2023033234A (ja) |
CN (1) | CN115731161A (ja) |
-
2022
- 2022-08-23 CN CN202211011702.0A patent/CN115731161A/zh active Pending
- 2022-08-25 JP JP2022134476A patent/JP2023033234A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN115731161A (zh) | 2023-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6598452B2 (ja) | 医用画像処理装置及び医用画像処理方法 | |
US8787648B2 (en) | CT surrogate by auto-segmentation of magnetic resonance images | |
JP4879901B2 (ja) | 画像処理方法、画像処理プログラム、及び画像処理装置 | |
US20200058098A1 (en) | Image processing apparatus, image processing method, and image processing program | |
US20160287339A1 (en) | Method for manufacturing a three-dimensional anatomical structure | |
JP2023139022A (ja) | 医用画像処理方法、医用画像処理装置、医用画像処理システム及び医用画像処理プログラム | |
US20180064409A1 (en) | Simultaneously displaying medical images | |
JP7101809B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2018011637A (ja) | 画像処理装置および画像処理方法 | |
JP6747785B2 (ja) | 医用画像処理装置及び医用画像処理方法 | |
Alam et al. | Evaluation of medical image registration techniques based on nature and domain of the transformation | |
US20220108540A1 (en) | Devices, systems and methods for generating and providing image information | |
Grosland et al. | Automated hexahedral meshing of anatomic structures using deformable registration | |
US9558568B2 (en) | Visualization method for a human skeleton from a medical scan | |
JP4807819B2 (ja) | 画像処理装置 | |
US20190236783A1 (en) | Image processing apparatus, image processing method, and program | |
WO2022163513A1 (ja) | 学習済みモデルの生成方法、機械学習システム、プログラムおよび医療画像処理装置 | |
WO2022209298A1 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2023033234A (ja) | データ拡張方法、データ拡張装置及びプログラム | |
JP2023064029A (ja) | 医用画像処理装置、医用画像処理方法及びプログラム | |
US20210256741A1 (en) | Region correction apparatus, region correction method, and region correction program | |
JP2023027751A (ja) | 医用画像処理装置及び医用画像処理方法 | |
JP2013089123A (ja) | 個人モデルデータの生成方法、生成プログラム、および生成システム | |
US11776154B2 (en) | Method and device for medical imaging for representing a 3D volume containing at least one introduced foreign object | |
WO2021256096A1 (ja) | 領域修正装置、方法およびプログラム |