JP7336231B2 - 情報処理装置、情報処理方法およびプログラム - Google Patents

情報処理装置、情報処理方法およびプログラム Download PDF

Info

Publication number
JP7336231B2
JP7336231B2 JP2019064695A JP2019064695A JP7336231B2 JP 7336231 B2 JP7336231 B2 JP 7336231B2 JP 2019064695 A JP2019064695 A JP 2019064695A JP 2019064695 A JP2019064695 A JP 2019064695A JP 7336231 B2 JP7336231 B2 JP 7336231B2
Authority
JP
Japan
Prior art keywords
image data
data
learning image
learning
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019064695A
Other languages
English (en)
Other versions
JP2020166418A (ja
Inventor
孝太郎 梅澤
乃介 木辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019064695A priority Critical patent/JP7336231B2/ja
Publication of JP2020166418A publication Critical patent/JP2020166418A/ja
Application granted granted Critical
Publication of JP7336231B2 publication Critical patent/JP7336231B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、学習済みモデルに追加学習を行う情報処理装置、情報処理方法およびプログラムに関する。
機械学習の分野において、あるデータセットを学習済みのネットワークモデル(以下、学習済みモデル)に対して、別のデータセットを追加で学習させる追加学習を行うことがある。学習済みモデルに対して追加学習を行う際には、どのようなデータセットを追加学習させるかを決定するために、学習済みモデルがどのようなデータセットをどのように学習したかという情報が得られることが望ましい。特許文献1には、機械学習の結果として獲得された能力のそれぞれに対してどのような学習が行われたかを識別して管理する技術が記載されている。
また、学習済みモデルにデータを学習させる際に、当該モデルの汎化性能を向上させるために、データを水増しするデータ拡張を行うことがある。
特開2018-63553号公報
特許文献1に記載の技術によれば、学習済みモデルに対する追加学習の際に、既に学習済みのデータセットの学習を禁止する。しかしながら、学習済みのデータセットを異なるデータ拡張方法で拡張したデータセットに対しても追加学習を禁止していた。そのため、当該モデルの汎化性能の向上に有用な、異なるデータ拡張方法で拡張されたデータセットも除外されてしまっていた。
本発明はかかる課題を解決するためになされたものであり、学習済みモデルに対する追加学習の際に、異なるデータ拡張方法で拡張されたデータセットに対し、追加学習を許可することで、当該モデルの汎化性能を向上させる技術を提供することを目的とする。
上記課題を解決するため、本発明の一態様による情報処理装置は、学習済みモデルの生成に用いた第一の学習画像データと、追加学習を行うための第二の学習画像データとを比較し、且つ、第一の学習画像データの拡張方法と第二の学習画像データの拡張方法とを比較する比較部と、
比較部による比較の結果、第一の学習画像データと第二の学習画像データが一致し且つ、前記第一の学習画像データのデータ拡張方法と、前記第二の学習画像データの拡張法が異なる場合において前記追加学習への前記第二の学習画像データの入力を許可する処理部と、を有する。
本発明によれば、学習済みモデルに対する追加学習の際に、既に学習済みのデータセットであっても、データ拡張方法が異なれば追加学習を許可することで、当該モデルの汎化性能を向上させることができる。
第1の実施形態に係る情報処理装置の構成を示す図。 第1の実施形態に係る情報処理装置の各部をソフトウェアにより実現することのできるコンピュータの基本構成を示す図。 第1の実施形態に係る情報処理装置の処理手順を示すフロー図。 第2の実施形態に係る情報処理装置の処理手順を示すフロー図。
以下、本発明の実施の形態について、図面を用いて説明する。同一の構成要素には原則として同一の符号を付して、説明を省略する。
また以下では、X線コンピュータ断層撮像(X線CT)装置で撮影された腹部CT画像中に描出されている肺がんを例に挙げて、本発明について説明する。なお、本発明は肺がん以外の病変でも、他臓器でも、臓器以外の骨や筋肉などの構造物においても有効である。さらに本発明は、磁気共鳴画像撮像装置(MRI)装置、ポジトロン断層撮像(PET)装置、超音波撮像装置で撮像された画像や、カメラで撮影された通常の画像に対しても適用可能である。また、二次元画像データでも三次元画像データにも適用可能である。また、本発明の実施形態は以下の実施形態に限定されるものではない。
<第1の実施形態>
本実施形態における情報処理装置は、学習済みモデルの生成に用いたデータセット及び追加学習用のデータセットを比較した比較結果と、それぞれのデータ拡張方法を比較した比較結果とに基づいて、学習済みモデルに対する追加学習を許可するか禁止するかを判定する。なおデータセットは複数の画像から構成されている画像群である。
本実施形態では、胸部CT画像から肺がんを検出する場合について説明する。
図1を用いて本実施形態に係る情報処理装置の構成を説明する。図1は、情報処理装置全体の概略ブロック図である。本実施形態に係る情報処理装置は、追加学習用の学習画像データを入力する入力部2、学習済みモデルからデータセット名とデータ拡張方法を取得するデータ拡張方法取得部3を有する。さらに取得されたデータセット名とデータ拡張方法を比較する比較部4、比較部4により比較された比較結果に基づいて追加学習への入力を許可または禁止をする処理部5を有する。図1における入力画像データ1(第二の学習画像データ)、入力画像データ1(第二の学習画像データ)のデータセット名6、入力画像データ1(第二の学習画像データ)を追加学習する学習部11を有する。また、入力画像データ1とデータセット名6を記憶する記憶部12を有する。さらには、学習部11中にデータ拡張方法7、追加学習する学習済みモデル8、学習済みモデルのデータセット名9であり、学習済みモデルのデータ拡張方法10である。
以下、本実施形態に係る情報処理装置の各構成の詳細を説明する。
(入力部2)
入力部2は、追加学習用の学習画像データ(第二の学習画像データ)を入力する。学習画像データの入力方法としては、他の装置から送信された学習画像データを受信し、それをデータ拡張方法取得部3へ入力する。もしくは、操作者が不図示のGUIを介して追加学習したい学習画像データを指定することで入力してもよい。なお入力部へ送信される学習画像データは、同一の情報処理装置から与えられてもよい。例えば、学習用データセットと学習済みモデルを有する情報処理装置が、追加学習用に取得した学習画像データ(第二の学習画像データ)をデータ拡張方法取得部3への入力とすることができる。
追加学習用の学習画像データ(第二の学習画像データ)とは、学習済みモデルに学習させた学習画像データに対応し、本実施形態では三次元の胸部CT画像データである。画像の対象は三次元に限られず、二次元画像でもよい。さらに対象は病変でなくとも、臓器でも、骨や筋肉、他の生物等問わない。例えば、動物の二次元画像データから画像に写っている動物のカテゴリを判定する学習済みモデルの場合には、追加学習用の画像データは動物の二次元画像となる。
(データ拡張方法取得部3)
データ拡張方法取得部3は、学習済みモデル8から学習済みモデルの第一の学習画像データに対応するデータセット名9と学習済みモデルのデータ拡張方法10を取得し、記憶部12から入力画像データ1と対応するデータセット名6を取得し、学習部データ拡張方法7を取得する。そして、取得したデータセット名6、データ拡張方法7、学習済みモデルのデータセット名9、および学習済みモデルのデータ拡張方法10を、比較部4に送信する。
ここでデータ拡張方法とは、データを拡張して増やすための手段であり、例えば、拡大・縮小・回転・平行移動・反転・AFFINE変形・自由変形・ノイズ付加・mixup等がある。また、例えばデータ拡張方法が回転のみの場合には、「元画像から54°左回転した状態」のような回転状態を特定できる情報と、「回転以外のその他のデータ拡張は行っていない」という情報も含まれている。
また、学習済みモデルに対して、これまで学習したデータセット名とデータセット名に対応付けられたデータ拡張方法がリスト形式で記憶されていることが望ましい。そして、追加学習のために入力するデータセットに対しても、データセット名とデータセット名に対応付けられたデータ拡張方法がリスト形式で記憶されていることが望ましい。記憶部12はデータセット名とデータの拡張方法を対応付けて記憶していても、複数もしくは異なる記憶部を別途有していてもよい。
具体的には、ある二次元画像データセットのデータ拡張手法が拡大・縮小・回転・平行移動・反転の5種類であった場合には、例えば要素数が11の配列を用意し、拡大の有無・拡大率・縮小の有無・縮小率・左回転の有無・回転度数・平行移動の有無・X方向平行移動量・Y方向平行移動量・X軸反転の有無・Y軸反転の有無の情報を、データセットの他に配列として保持しておく。
なお、記憶(保存)の形式はリスト形式に限らず、ブロックチェーンやプログラム、メモリ中のデータ等として、データセット名とデータ拡張方法が対応付けられて記憶(保存)されていれば、どのような形式でもよい。
本実施形態では、がん領域のデータセットに対して、拡大・縮小・回転・平行移動・XYZ軸反転・AFFINE変形・自由変形・ノイズ付加・mixup等のバリエーションが保持されているものとする。例えばAFFINE変形に関してはAFFINE変換行列がデータセットと対応付けられて記憶(保存)されていることが望ましく、自由変形に関しては変形場等がデータセットと対応付けられて記憶(保存)されていることが望ましい。また、データセット中の個別のデータのそれぞれにデータ拡張方法を保持してもよい。例えば医用画像の場合は、DICOM画像ファイルのDICOMヘッダにデータ拡張方法を保持してもよい。
(比較部4)
比較部4は、データ拡張方法取得部3で取得した、学習済みモデルの第一の学習画像データに対応するデータセット名9と入力画像データ1(第二の学習画像データ)のデータセット名6を比較し、一致していたらさらにデータ拡張方法も比較をする。そして比較した比較結果を処理部5へ送信する。また、データセットを構成する画像および画像の画素値のいずれかに基づいた比較をしてもよい。すなわち、比較部4は第一の学習画像データおよび第二の学習画像データが一致しているか異なるかを、データセット名、データセットを構成する画像および画像の画素値のうち少なくとも一つに基づいて比較をする。
比較部4では、データ拡張方法の配列を比較する以外に、データ拡張の結果として、画像データ間に一致があるか否かの演算を行ってもよい。例えば、学習済みモデルが、二次元画像からなるデータセットの各画像を10°ずつ回転して学習していた場合で説明する。ここで、追加学習するデータセットとして、二次元画像からなる同一のデータセットを6°ずつ回転したものだとすると、30°毎に学習済みのデータセットを入力することになるため、一致するデータセットの入力を禁止することが好ましい。
(処理部5)
処理部5では、比較部4で比較された結果を基に第二の学習画像データの追加学習への入力を許可または禁止をする。つまり、学習済みモデルの第一の学習画像データに対応するデータセット名9と入力画像データ1のデータセット名6が一致し、かつ、データ拡張方法も一致している場合は入力を禁止し、それ以外の場合は入力を許可する処理をする。すなわち、処理部5は第一の学習画像データと第二の学習画像データとが一致し且つ第一の学習画像データのデータ拡張方法と、第二の学習画像データのデータ拡張方法とが一致している場合には、追加学習への第二の学習画像データの入力を禁止する。一方で、第一の学習画像データと第二の学習画像データが異なるもしくは、第一の学習画像データのデータ拡張方法と第二の学習画像データのデータ拡張方法が異なる場合には、追加学習への入力を許可する。
ここで、入力部2、データ拡張方法取得部3、比較部4、処理部5で用いられている演算回路は、専用に設計されたワークステーションであってもよい。また、それら演算回路の各構成は異なるハードウェアによって構成されてもよい。また、演算回路の少なくとも一部の構成は単一のハードウェアで構成されてもよい。つまり、入力部2、データ拡張方法取得部3、比較部4、処理部5は、CPUやGPU(GraphicsProcessing Unit)等のプロセッサ、FPGA(Field Programmable Gate Array)チップ等の演算回路で構成されることができる。これらのユニットは、単一のプロセッサや演算回路から構成されるだけでなく、複数のプロセッサや演算回路から構成されていてもよい。
図2は、入力部2、データ拡張方法取得部3、比較部4、処理部5で用いられている演算回路の具体的な構成例を示す。入力部2、データ拡張方法取得部3、比較部4、処理部5で用いられている演算回路は、CPU101、GPU102、RAM103、ROM104、外部記憶装置105から構成され、これらがシステムバス100で繋がっている。また、入力部2、データ拡張方法取得部3、比較部4、処理部5には、表示部(不図示)としての液晶ディスプレイ、入力手段(不図示)としてのマウス、キーボードが接続されていてもよい。
また、これらの入力部2、データ拡張方法取得部3、比較部4、処理部5は、オンプレミスなシステムとして存在していてもよいし、サーバなどのネットワークやクラウド上でプログラムとして存在して処理を実行してもよい。
なお、情報処理装置の各構成はそれぞれ別の装置として構成されてもよいし、一体となった1つの装置として構成されてもよい。また、情報処理装置の少なくとも一部の構成が一体となった1つの装置として構成されてもよい。
(判定フロー)
次に、図3のフローチャートを用いて、本実施形態における情報処理装置が行う全体の処理を説明する。図3は、本実施形態における情報処理装置が行う処理の一例を示すフローチャートである。本実施形態では、CPU101がRAM103に格納されている各部の機能を実現するプログラムを実行することにより図3に示す処理が実行される。
ステップS31において、入力部2は、操作者によって指定された学習画像データ(第二の学習画像データ)とデータ拡張方法を入力する。ステップS32において、データ拡張方法取得部3は、第二の学習画像データに対応するデータセット名6、データ拡張方法7、学習済みモデルの第一の学習画像データに対応するデータセット名9、およびデータ拡張方法10を取得する。ステップS33において、比較部4は、学習済みモデル(第一の学習画像データ)と入力画像データ(第二の学習画像データ)のデータセット名が一致するか否かを判定し、一致しない場合にはステップS35に処理を進め、一致する場合にはステップS34に処理を進める。ステップS34において、比較部4は、データ拡張方法が一致するか否かを判定し、一致しない場合にはステップS35に処理を進め、一致する場合にはステップS36に処理を進める。ステップS35において、処理部5は、追加学習用の画像データ(第二の学習画像データ)の入力を許可する。一方、ステップS36において、処理部5は、追加学習用の画像データ(第二の学習画像データ)の入力を禁止する。以下の表1はステップS34のデータ拡張方法の比較を模式的に示した表である。
Figure 0007336231000001
表1は、入力画像のデータセット名が一致した場合のステップS34の処理を示している。まず、データ拡張方法A、データ拡張方法B、データ拡張方法Cは、学習済みモデルのデータ拡張方法10であり、それぞれのデータ拡張方法に対応する。データ拡張方法は、拡大・縮小・回転・平行移動・XYZ軸反転・AFFINE変形・自由変形・ノイズ付加・mixup等のバリエーションが挙げられる。比較部4によりデータセット1を学習済みモデルのデータ拡張方法と比較すると、データ拡張方法A、B、Cのそれぞれについてデータ拡張方法が一致する。データ拡張方法が一致する場合には、比較部4はデータセット1を追加学習への学習画像データとしての入力を禁止する。次に比較部4はデータセット2について比較を行う。データセット2と、学習済みモデルのデータ拡張方法は、データ拡張方法Aにおいて一致し、データ拡張方法BとCにおいて一致しない。データ拡張方法が一致しない場合に、比較部4はデータセット2を追加学習への学習画像データとしての入力を許可する。データセット3は、データ拡張方法Bにおいて一致し、データ拡張方法AとCにおいて一致しない。ゆえに、比較部4は、データセット3の追加学習への学習画像データとしての入力を許可する。データセット4は、データ拡張方法A、B、Cのそれぞれにおいてデータ拡張方法が一致しない。ゆえに比較部4はデータセット4を追加学習への学習画像データとしての入力を許可する。なお複数のデータ拡張方法をデータセットに対して実施する場合には、データ拡張方法の実施の順序を記憶していてもよい。また、記憶したデータ拡張方法の順序が一致している場合に、データセットを追加学習への学習画像データとしての入力を禁止する構成でもよい。
本実施形態に係る情報処理装置によれば、学習済みモデルの生成に用いた第一の学習画像データと、追加学習を行うための第二の学習画像データとを比較し、且つ、第一の学習画像データの拡張方法と第二の学習画像データの拡張方法とを比較する比較部を有する。そして比較部4による比較の結果、第一の学習画像データと第二の学習画像データが一致している場合で且つ、第一の学習画像データのデータ拡張方法と、第二の学習画像データの拡張法が異なる場合において追加学習への第二の学習画像データの入力を許可する。
これにより、学習済みモデルに対する追加学習の際に、既に学習済みのデータセット(第二の学習画像データ)であっても、データ拡張方法が異なれば利用されるようになり、当該モデルの汎化性能を向上させることができる。
(第1の実施形態の変形例1)
上述した実施形態では、胸部CT画像から肺がんを検出する学習済みモデルについて説明したが、学習するデータセットは三次元画像データに限らず、一次元時系列の信号であったり、二次元画像データであったり、四次元以上のテンソルであったり、どのような形式でもよい。
(第1の実施形態の変形例2)
上述した実施形態では、肺がんを検出する学習済みモデルに限定して説明したが、肺がんに限らず、その他のがんやその他の疾患でもよい。
(第1の実施形態の変形例3)
上述した実施形態では、画像データとして医用画像を用いる場合について説明したが、医用画像に限らず、文字画像や自然画像でもよい。
(第1の実施形態の変形例4)
上述した実施形態では、データ拡張方法として回転の場合を説明したが、回転以外のデータ拡張方法でもよい。また、複数のデータ拡張方法を組み合わせて用いてもよい。複数のデータ拡張方法が組み合わされている場合は、すべてのデータ拡張方法でデータセットおよびデータ拡張方法が一致している場合のみ、入力を禁止することが望ましい。また、複数のデータ拡張方法を組み合わせた場合においては、適用されるデータ拡張方法によっては、データ拡張を行う順序によって生成される画像データが異なる。ゆえに、複数のデータ拡張方法をどのような順序で適用したかが別途保持されていてもよい。ただし、操作者の設定に応じて全てのデータ拡張方法で一致する場合以外においても、入力を禁止してもよい。
(第1の実施形態の変形例5)
上述した実施形態では、入力画像データ1のデータ拡張方法7を、学習部11から取得したが、入力画像データ1にデータセット名6と共にデータ拡張方法7が記憶(保存)されていてもよい。
(第1の実施形態の変形例6)
上述した実施形態では、同一のデータセットには同一のデータセット名が付与されている条件で記載されていたが、同一のデータセットに対して同一のデータセット名が付与されていない場合がある。
同一のデータセットに対して同一のデータセット名が付与されていない場合には、まず比較部4がデータセット名と、データ拡張方法が付与されているかを判定してもよい。比較部4の判定の結果、データセット名が付与されていないと判定された場合、もしくは、取得されたデータセット名が適切でない場合、処理部5は同一の学習画像データに対して、同一のデータセット名を生成していてもよい。なお、比較部4による判定や、処理部5によるデータセット名生成は、それぞれ判定部や、データセット名生成部として独立して存在していてもよい。
データセット名は、データセットを構成する画像名や、画素値を基にして作成されてもよい。もしくは画素値に対応する文字もしくは文字列に置換をしてデータセット名としてもよい。すなわち、処理部5は学習画像データを構成する画像の画素値もしくは、画素値に関連する文字列をデータセット名として生成する。また処理部5は、ハッシュ値等を計算することにより、学習画像データを構成する画像の画素値もしくは、画素値に関連するデータセット名を生成してもよい。同一の画像から構成される学習画像データにも関わらず異なるデータセット名が与えられた場合に、データ拡張方法取得部3は、処理部5により生成されたデータセット名をデータセット名とする。そして生成されたデータセット名を比較部4が比較することで、追加学習を禁止できる。なお、比較部4で比較をするデータセット名の代わりとして直接データセットを構成する画像が比較されても、それぞれの画像の画素値が比較されてもよい。
(第1の実施形態の変形例7)
上述した実施形態には、追加学習画像データとして入力をする第二の学習画像データに対応するデータセット名6とデータの拡張方法7、学習済みモデルのデータセット名9および学習済みモデルのデータ拡張方法10がすべて存在する場合について記載した。しかしながら追加学習をする場合の入力画像データにおいて、第二の学習画像データに対応するデータセット名6やデータ拡張方法7が欠損もしくは、適切に付与されていない場合がある。例えば本変形例7では、データ拡張方法取得部3が取得した入力画像データにおいてデータセット名6が適切に付与されていない場合と、データ拡張方法7が適切に付与されていない場合が挙げられる。さらにデータセット名6およびデータ拡張方法7の両者が適切に付与されていない場合も考えられる。以下ではそれぞれの場合に対応する方策を記載する。ここで比較部4により第二の学習画像データにおける、データセット名およびデータ拡張方法が付与されているかを判定してもよいし、判定をするための判定部が別途(不図示)設けられていてもよい。
まずは、比較部4によりデータセット名6が適切に付与されていないと判定された場合である。比較部4によってデータセットが適切に付与されていないと判定された場合においては、前述の変形例6に記載の処理部5によるデータセット名生成により、データセットを生成し付与してもよい。即ち、比較部4によって、第二の学習画像データにおけるデータセット名が付与されていないと判定された場合、処理部5により生成されたデータセット名を第二の学習画像データにおけるデータセット名とする。もしくは比較部4が学習済みのデータセット(第一の学習画像データ)と、入力画像データ(第二の画像データ)の画像または画像の画素値を比較し、画像データが一致していた場合に、一致していた学習済みのデータセットに付与されている名称をデータセット名として付与、もしくは更新する。即ち、比較部4によって、第二の学習画像データにおけるデータセット名が付与されていないと判定された場合、第一の学習画像データと画像もしくは、画像を構成する画素が一致するかを比較する。そして一致していた場合に一致した第一の学習画像データに対応するデータセット名を付与する。なお、学習画像データが完全に一致していなくとも、比較部4による比較の結果、類似度が一定以上(以降略一致と記載)の画像データに同一のデータセット名を付与し、追加学習を禁止する構成にしてもよい。
次に、比較部4によりデータ拡張方法7が適切に付与されていないと判定された場合である。比較部4により、データ拡張方法が適切に付与されていないと判定された場合においては、上述と同様に、学習済みのデータセットと入力画像データの画像または画像の画素を比較し、一致もしくは略一致していた場合に学習済みのデータセットに付与されているデータ拡張方法を付与してもよい。つまり、比較部4によって、第二の学習画像データにおけるデータ拡張方法が付与されていないと判定された場合、第一の学習画像データと画像もしくは、画像を構成する画素が一致するかを比較し、一致していた場合に一致した第一の画像データに対応するデータ拡張方法を付与する。比較部4による比較の結果、学習済みのデータセットと入力画像データのデータセットが一致もしくは、略一致しなかった場合には処理部5にて別途処理を行う。まず処理部5は入力画像データのデータセットにデータ拡張を適用し、比較部4はデータ拡張した画像データが、学習済みのデータセットに対し再度一致するかを比較する。つまり、比較部4によって、第二の学習画像データにおけるデータ拡張方法が付与されていないと判定された場合で且つ、第一の学習画像データと画像もしくは、画像を構成する画素が一致していない場合において、第二の学習画像データに対してデータ拡張をし、再度第一の学習画像データと比較する。比較部4による比較の結果一致していると判定された場合には、処理部5は第二の学習画像データを第一の学習画像データに一致させるために入力画像データを拡張したデータ拡張方法を逆算する形で、入力画像データにデータ拡張方法を付与させる。
最後に、追加学習に入力する入力画像データは存在するが、データセット名6もデータ拡張方法も不明である場合である。データセット名およびデータ拡張方法が不明である場合においては、上述のデータセット名6が適切に付与されていない場合の方策と、データ拡張方法7が適切に付与されていない場合の方策を組み合わせることにより解決される。すなわち、処理部5により入力画像データからデータセット名を作成し、それをクエリとして検索して、データセット名を得る。もしくは、比較部4が入力画像データのデータセットである第二の学習画像データと、学習済みのデータセットである第一の学習画像データを比較し、一致もしくは、略一致した場合に、学習済みのデータセットから、データセット名を取得する。
そして、データ拡張方法は比較部4が同様に入力画像データのデータセットと、学習済みデータセットを比較し、一致もしくは略一致した場合にデータ拡張方法を取得する。もしくは、入力画像データにデータ拡張方法を施し、学習済みデータセットと一致した場合には、一致するまでに行ったデータ拡張方法を逆算する形で、データ拡張方法を取得する。
これらの構成により、入力画像データにデータセット名6やデータ拡張方法7のいずれかが適切に付与されていない場合においても、それらを特定することができ、後段の処理と組み合わせることで学習済みモデルへの汎化性能を担保できる。なお本変形例を含む変形例は、後述の第二の実施形態においても適用され、また、適用の対象は実施形態のみに限られない。
<第2の実施形態>
第2の実施形態では、胸部CT画像から肺がんを検出する学習済みモデルに追加学習する際に、学習済みモデルからそれぞれの学習画像データに対応するデータ拡張方法を取得して比較し、データ拡張方法が同じ場合には、異なるデータ拡張方法を提示する。
以下、本実施形態に係る情報処理装置の各構成の詳細に関して、第1の実施形態と異なる部分を説明する。
(比較部4)
比較部4は、データ拡張方法取得部3で取得した、学習済みモデルで学習したデータセット名9と入力画像データのデータセット名6とを比較し、一致していたらデータ拡張方法でも比較を行う。そして比較結果を処理部5へ送信する。
(処理部5)
処理部5は、比較部4により比較された比較結果に基づいて、入力画像データ1の入力を許可するか禁止するかを判定する。学習済みモデルのデータセット名と入力画像データ1のデータセット名が一致し、かつ、データ拡張方法も一致している場合は入力を禁止して異なるデータ拡張方法を提示し、それ以外の場合は入力を許可する。
異なるデータ拡張方法の提示の方法としては、比較部4によって異なるデータ拡張方法を自動で算出して選択する。即ち、第一の学習画像データと第二の学習画像データとが一致し且つ第一の学習画像データのデータ拡張方法と、第二の学習画像データのデータ拡張方法とが一致している場合には、追加学習のため、第二の学習画像データのデータ拡張方法として、第一の学習画像データのデータ拡張方法とは異なるデータ拡張方法を算出する。さらに処理部5により選択されたデータ拡張方法を実施し、作成された入力画像データを用いて、学習済みモデル8の追加学習を行ってもよい。一方で、GUI(非図示)等を有し、操作者に一致したデータ拡張方法と、それとは異なるデータ拡張方法を提示する。そして操作者に掲示されたデータ拡張方法の中から、選択させてもよい。
処理部5における異なるデータ拡張方法の算出方法としては、予め複数あるデータ拡張方法(回転・平行移動・反転等)の取りうる範囲を設定しておき、一致したデータ拡張方法の条件との差異が大きくなるようにデータ拡張方法の条件になるように算出するのが望ましいが、ランダムで算出してもよい。つまり、回転を例に説明すると、回転角で取りうる範囲として0~360°を設定した場合、学習済みモデルのデータ拡張方法の回転角が0°、90°、180°、270°の4パターンだとする。当該パターンに対しては、前記4パターンを除いて最も遠い角度になるように、45°、135°、225°、315°を選択してもよい。また、ここで算出した値を、GUI(非図示)等で操作者に提示し、選択を促してもよい。
そして、算出されたデータ拡張方法を第二の学習画像データに実施し、作成された学習画像データを用いて、追加学習を行う。なおデータ拡張方法の算出により、算出された結果を提示してもよい。
(判定フロー)
次に、図4のフローチャートを用いて、本実施形態における情報処理装置が行う全体の処理を説明する。
ステップS41およびステップS42の処理は、第1の実施形態におけるステップS31およびステップS32の処理と同様なので、説明を省略する。ステップS43において、比較部4は、学習済みモデルと入力画像データのデータセット名が一致するか否かを判定し、一致しない場合にはステップS47に処理を進め、一致する場合にはステップS44に処理を進める。ステップS44において、比較部4は、データ拡張方法が一致するか否かを判定し、一致しない場合にはステップS47に処理を進め、一致する場合にはステップS45に処理を進める。ステップS45において、処理部5は、異なるデータ拡張方法を提示する。ステップS46において、処理部5は、操作者によって指定されたデータ拡張方法を取得して、ステップS47に処理を進める。ステップS47において、処理部5は、追加学習用の画像データの入力を許可する。
本実施形態に係る情報処理装置によれば、学習済みモデルと入力画像データに関し、データセットとデータ拡張方法が一致する場合に、学習済みモデルの追加学習において、一度学習したデータセットと異なるデータ拡張方法を提示することができる。
これにより、学習済みモデルに対する追加学習の際に、既に学習済みのデータセットであっても、データ拡張方法が異なれば追加学習を許可することで、当該モデルの汎化性能を向上させることができる。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (16)

  1. 学習済みモデルの生成に用いた第一の学習画像データと、追加学習を行うための第二の学習画像データとを比較し、且つ、前記第一の学習画像データのデータ拡張方法と前記第二の学習画像データのデータ拡張方法とを比較する比較部と、
    前記比較部による比較の結果、前記第一の学習画像データと前記第二の学習画像データが一致し且つ、前記第一の学習画像データのデータ拡張方法と、前記第二の学習画像データのデータ拡張方法が異なる場合において前記追加学習への前記第二の学習画像データの入力を許可する処理部と、
    を有する情報処理装置。
  2. 前記処理部は、前記第一の学習画像データと前記第二の学習画像データとが一致し且つ、前記第一の学習画像データのデータ拡張方法と、前記第二の学習画像データのデータ拡張方法とが一致している場合には、前記追加学習への前記第二の学習画像データの入力を禁止することを特徴とする請求項1に記載の情報処理装置。
  3. 前記処理部は、前記第一の学習画像データと前記第二の学習画像データとが一致し且つ、前記第一の学習画像データのデータ拡張方法と、前記第二の学習画像データのデータ拡張方法とが一致している場合には、前記追加学習のため、前記第二の学習画像データのデータ拡張方法として、前記第一の学習画像データのデータ拡張方法とは異なるデータ拡張方法を適用することを特徴とする請求項1に記載の情報処理装置。
  4. 前記比較部は、前記第一の学習画像データおよび前記第二の学習画像データが一致しているか異なるかを、データセット名、データセットを構成する画像データおよび前記画像データの画素値のうち少なくとも一つに基づいて比較することを特徴とする請求項1乃至3のいずれか一項に記載の情報処理装置。
  5. 前記比較部は、前記第二の学習画像データに対応する、データセット名およびデータ拡張方法の有無を判定することを特徴とする請求項4に記載の情報処理装置。
  6. 前記処理部は、同一画像データを有するデータセットに対して、同一のデータセット名を生成することを特徴とする請求項1に記載の情報処理装置。
  7. 前記処理部により生成される前記データセット名は、前記データセットを構成する画像データの画素値もしくは、画素値に関連する文字列に基づくことを特徴とする請求項6に記載の情報処理装置。
  8. 前記比較部によって、前記第二の学習画像データにおけるデータセット名が付与されていないと判定された場合、前記処理部により生成された前記データセット名を前記第二の学習画像データにおけるデータセット名とすることを特徴とする請求項6または7に記載の情報処理装置。
  9. 前記比較部によって、前記第二の学習画像データにおけるデータセット名が付与されていないと判定された場合に、前記比較部はさらに前記第一の学習画像データと画像もしくは、画像を構成する画素が一致するかを比較し、一致していた場合に一致した前記第一の学習画像データに対応するデータセット名を、前記第二の学習画像データに対して付与することを特徴とする請求項5に記載の情報処理装置。
  10. 前記比較部によって、前記第二の学習画像データにおけるデータ拡張方法が付与されていないと判定された場合に、前記比較部はさらに前記第一の学習画像データと画像もしくは、画像を構成する画素が一致するかを比較し、一致していた場合に一致した前記第一の学習画像データに対応するデータ拡張方法を、前記第二の学習画像データに対して付与することを特徴とする請求項5に記載の情報処理装置。
  11. 前記比較部によって、前記第二の学習画像データにおけるデータ拡張方法が付与されていないと判定された場合で且つ、前記第一の学習画像データと画像もしくは、画像を構成する画素が一致していない場合において、前記第二の学習画像データに対してデータ拡張方法を適用し、再度前記第一の学習画像データと比較することを特徴とする請求項5に記載の情報処理装置。
  12. 前記処理部は、前記異なるデータ拡張方法として、前記一致したデータ拡張方法の条件との差異が大きくなるデータ拡張方法を適用することを特徴とする請求項3に記載の情報処理装置。
  13. 前記データ拡張方法を前記第二の学習画像データに対して適用した結果を提示することを特徴とする請求項3または12に記載の情報処理装置。
  14. 前記処理部は、前記データ拡張方法によるデータ拡張を前記第二の学習画像データに適用することにより作成された学習画像データを用いて、追加学習を行うことを特徴とする請求項3または12に記載の情報処理装置。
  15. 学習済みモデルの生成に用いた第一の学習画像データと、追加学習を行うための第二の学習画像データとを比較し、且つ、前記第一の学習画像データのデータ拡張方法と前記第二の学習画像データのデータ拡張方法とを比較する比較ステップと、
    前記比較の結果、前記第一の学習画像データと前記第二の学習画像データが一致し且つ、前記第一の学習画像データのデータ拡張方法と、前記第二の学習画像データのデータ拡張方法が異なる場合において前記追加学習への前記第二の学習画像データの入力を許可する処理ステップと、
    を有する情報処理方法。
  16. 請求項15に記載の情報処理方法をコンピュータに実行させるためのプログラム。
JP2019064695A 2019-03-28 2019-03-28 情報処理装置、情報処理方法およびプログラム Active JP7336231B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019064695A JP7336231B2 (ja) 2019-03-28 2019-03-28 情報処理装置、情報処理方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019064695A JP7336231B2 (ja) 2019-03-28 2019-03-28 情報処理装置、情報処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2020166418A JP2020166418A (ja) 2020-10-08
JP7336231B2 true JP7336231B2 (ja) 2023-08-31

Family

ID=72716246

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019064695A Active JP7336231B2 (ja) 2019-03-28 2019-03-28 情報処理装置、情報処理方法およびプログラム

Country Status (1)

Country Link
JP (1) JP7336231B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7201270B1 (ja) 2021-10-28 2023-01-10 望 窪田 情報処理方法、プログラム及び情報処理装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018169672A (ja) 2017-03-29 2018-11-01 三菱電機インフォメーションシステムズ株式会社 教師画像を生成する方法、コンピュータおよびプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018169672A (ja) 2017-03-29 2018-11-01 三菱電機インフォメーションシステムズ株式会社 教師画像を生成する方法、コンピュータおよびプログラム

Also Published As

Publication number Publication date
JP2020166418A (ja) 2020-10-08

Similar Documents

Publication Publication Date Title
JP6878509B2 (ja) データ及びモデルを用いた画像再構成ならびに補正のためのシステム及び方法
Torosdagli et al. Deep geodesic learning for segmentation and anatomical landmarking
JP6947759B2 (ja) 解剖学的対象物を自動的に検出、位置特定、及びセマンティックセグメンテーションするシステム及び方法
JP6598452B2 (ja) 医用画像処理装置及び医用画像処理方法
US8121362B2 (en) Registration of medical images using learned-based matching functions
JP7221421B2 (ja) Ct画像の椎骨位置決め方法、装置、機器及び媒体
JP6316671B2 (ja) 医療画像処理装置および医用画像処理プログラム
US8861891B2 (en) Hierarchical atlas-based segmentation
US10803354B2 (en) Cross-modality image synthesis
JP6824845B2 (ja) 画像処理システム、装置、方法およびプログラム
JP6073632B2 (ja) 医用画像処理装置及び医用画像処理プログラム
JP7336231B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP6840481B2 (ja) 画像処理装置および画像処理方法
Iddrisu et al. 3D reconstructions of brain from MRI scans using neural radiance fields
CN110473241A (zh) 图像配准方法、存储介质及计算机设备
JP6967983B2 (ja) 画像処理装置、画像処理方法、及びプログラム
CN116664476A (zh) 确定医学图像数据中描绘的解剖异常的变化的方法和系统
WO2022163513A1 (ja) 学習済みモデルの生成方法、機械学習システム、プログラムおよび医療画像処理装置
US20230139458A1 (en) Image processing method and apparatus
CN116848549A (zh) 经由降维投影的图像结构的检测
US20240144472A1 (en) Medical image augmentation
US11972570B2 (en) Image processing apparatus, image processing method, and image processing program
US20230138451A1 (en) Image processing method and apparatus
US20230222675A1 (en) Image processing apparatus, operation method of image processing apparatus, operation program of image processing apparatus, and trained model
JP2023033234A (ja) データ拡張方法、データ拡張装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230405

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230502

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230718

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230821

R151 Written notification of patent or utility model registration

Ref document number: 7336231

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151