JP7843989B2

JP7843989B2 - 医用画像診断支援装置、医用画像診断支援方法およびプログラム

Info

Publication number: JP7843989B2
Application number: JP2021153427A
Authority: JP
Inventors: 純一古徳; 拓将 ▲辻▼
Original assignee: Teikyo University
Current assignee: Teikyo University
Priority date: 2021-09-21
Filing date: 2021-09-21
Publication date: 2026-04-13
Anticipated expiration: 2041-09-21
Also published as: JP2023045168A; CN118076296A; US20240378725A1; WO2023047963A1; EP4407554A1; EP4407554A4

Description

本発明は、医用画像診断支援装置、医用画像診断支援方法およびプログラムに関する。

従来から、医師による画像の診断を支援する画像診断支援装置が知られている（例えば特許文献１参照）。特許文献１に記載された技術では、畳み込みニューラルネットワーク（ＣＮＮ）が有する内視鏡画像の診断能力が使用される。詳細には、特許文献１に記載された技術では、病変推定部が、畳み込みニューラルネットワークを用い、内視鏡画像データにより表される内視鏡画像内に存在する病変の病変名および病変位置と、病変名および病変位置の確度とを推定する。また、特許文献１に記載された技術では、あらかじめ経験豊富な内視鏡医によってマーキング処理されたレファレンスデータ（教師データ）を用い、畳み込みニューラルネットワークの学習処理が行われる。
ところで、医療分野においては、ＡＩ（人工知能）のブラックボックス問題を考慮する必要がある。つまり、特許文献１に記載された画像診断支援装置のような画像診断支援用ＡＩのブラックボックス問題を考慮する必要がある。

特許第６６５７４８０号公報

そこで、本発明者等は、鋭意研究において、医用画像として胸部Ｘ線画像を用い、畳み込みニューラルネットワークと、畳み込みニューラルネットワークの注目領域を可視化するアテンションブランチネットワーク（ＡＢＮ）とによって、胸部Ｘ線画像から疾患の有無を分類する分類モデルを構成し、畳み込みニューラルネットワークの注目領域について検証した。その結果、本発明者等は、畳み込みニューラルネットワークが、胸部Ｘ線画像のうちの疾患の有無の分類に不必要な領域に注目してしまうおそれがあることを見い出した。
このように、胸部Ｘ線画像のうちの疾患の有無の分類に不必要な領域に注目してしまう医療用ＡＩでは、例えば専門医の信頼などのような、医療現場の信頼を得ることができないと本発明者等は考え、研究を更に進めた。

具体的には、本発明者等は、鋭意研究において、胸部Ｘ線画像のうちの疾患の有無の分類に必要な領域を示す事前情報をアテンションブランチネットワークに対して与えた。その結果、畳み込みニューラルネットワークが胸部Ｘ線画像のうちの疾患の有無の分類に不必要な領域に注目しないようにすることができたのである。

つまり、本発明は、畳み込みニューラルネットワークが医用画像のうちの疾患の有無の分類に不必要な領域に注目しないようにすることができる医用画像診断支援装置、医用画像診断支援方法およびプログラムを提供することを目的とする。

本発明の一態様は、医用画像の診断を支援する医用画像診断支援装置であって、前記医用画像から少なくとも疾患の有無を分類する分類モデルと、前記分類モデルを用いた予測を行う予測部と、前記予測部によって前記分類モデルが用いられる前に、前記分類モデルの教師あり学習を行う学習部とを備え、前記学習部によって行われる教師あり学習では、少なくとも疾患の有無が既知の学習用医用画像が教師データとして用いられ、前記分類モデルは、畳み込みニューラルネットワークと、前記畳み込みニューラルネットワークの注目領域を可視化するアテンションブランチネットワークとによって構成され、前記学習部によって前記分類モデルの教師あり学習が行われる段階で、前記アテンションブランチネットワークには、前記学習用医用画像のうちの疾患の有無の分類に必要な領域である分類用領域を示す事前情報が与えられる、医用画像診断支援装置である。

本発明の一態様の医用画像診断支援装置では、前記アテンションブランチネットワークは、前記医用画像の分類に必要な特徴量を抽出し、特徴量マップを生成する特徴抽出器と、クラスアクティベーションマッピングによるアテンションマップを生成するアテンションブランチと、パーセプションブランチとを備え、前記学習部によって前記分類モデルの教師あり学習が行われる段階では、前記アテンションブランチにより生成された前記アテンションマップは、前記特徴抽出器によって生成された前記特徴量マップに反映させられ、前記パーセプションブランチは、前記アテンションマップによって重み付けされた前記特徴量マップを、前記学習用医用画像の分類結果として出力し、前記アテンションブランチネットワークの損失関数は、前記アテンションブランチの学習誤差と、前記パーセプションブランチの学習誤差と、正則化項との総和であり、前記正則化項は、前記アテンションマップと重みマップとのアダマール積によって得られた行列のフロベニウスノルムであり、前記重みマップは、前記分類用領域に対応してもよい。

本発明の一態様の医用画像診断支援装置では、前記学習部によって前記分類モデルの教師あり学習が行われる段階では、前記アテンションブランチネットワークは、前記分類用領域の一部である第１部分のセグメンテーション画像に凸包処理を行うことによって作成された前記重みマップを受け付けてもよい。

本発明の一態様の医用画像診断支援装置では、前記学習部によって前記分類モデルの教師あり学習が行われる段階では、前記アテンションブランチネットワークは、前記分類用領域の一部である第１部分のセグメンテーション画像と、前記分類用領域の他の一部である第２部分のセグメンテーション画像とを組み合わせることによって作成された前記重みマップを受け付けてもよい。

本発明の一態様の医用画像診断支援装置では、前記第１部分のセグメンテーション画像および／または前記第１部分のセグメンテーション画像と前記分類用領域の他の一部である第２部分のセグメンテーション画像とを組み合わせたものは、Ｕ－Ｎｅｔを使用することによって生成されてもよい。

本発明の一態様の医用画像診断支援装置では、前記畳み込みニューラルネットワークとして、ＶＧＧ１６、ＲｅｓＮｅｔ５０およびＤｅｎｓｅＮｅｔ１２１のいずれかを用いてもよい。

本発明の一態様の医用画像診断支援装置では、前記アテンションブランチネットワークは、前記医用画像の分類に必要な特徴量を抽出し、特徴量マップを生成する特徴抽出器と、クラスアクティベーションマッピングによるアテンションマップを生成するアテンションブランチと、パーセプションブランチとを備え、前記アテンションブランチにより生成された前記アテンションマップは、前記特徴抽出器によって生成された前記特徴量マップに反映させられ、前記パーセプションブランチは、前記アテンションマップによって重み付けされた前記特徴量マップを、前記医用画像の分類結果として出力し、前記アテンションブランチネットワークの損失関数は、前記アテンションブランチの学習誤差と、前記パーセプションブランチの学習誤差と、正則化項との総和であり、前記正則化項は、前記アテンションマップと重みマップとのアダマール積によって得られた行列のフロベニウスノルムであり、前記重みマップは、前記予測用領域に対応してもよい。

本発明の一態様は、医用画像の診断を支援する医用画像診断支援方法であって、前記医用画像から少なくとも疾患の有無を分類する分類モデルを用いた予測を行う予測ステップと、前記予測ステップが実行される前に、前記分類モデルの教師あり学習を行う学習ステップとを備え、前記学習ステップにおいて行われる教師あり学習では、少なくとも疾患の有無が既知の学習用医用画像が教師データとして用いられ、前記分類モデルは、畳み込みニューラルネットワークと、前記畳み込みニューラルネットワークの注目領域を可視化するアテンションブランチネットワークとによって構成され、前記学習ステップでは、前記アテンションブランチネットワークには、前記学習用医用画像のうちの疾患の有無の分類に必要な領域である分類用領域を示す事前情報が与えられる、医用画像診断支援方法である。

本発明の一態様は、コンピュータに、医用画像から少なくとも疾患の有無を分類する分類モデルを用いた予測を行う予測ステップと、前記予測ステップが実行される前に、前記分類モデルの教師あり学習を行う学習ステップとを実行させるためのプログラムであって、前記学習ステップにおいて行われる教師あり学習では、少なくとも疾患の有無が既知の学習用医用画像が教師データとして用いられ、前記分類モデルは、畳み込みニューラルネットワークと、前記畳み込みニューラルネットワークの注目領域を可視化するアテンションブランチネットワークとによって構成され、前記学習ステップでは、前記アテンションブランチネットワークには、前記学習用医用画像のうちの疾患の有無の分類に必要な領域である分類用領域を示す事前情報が与えられる、プログラムである。

本発明によれば、畳み込みニューラルネットワークが医用画像のうちの疾患の有無の分類に不必要な領域に注目しないようにすることができる医用画像診断支援装置、医用画像診断支援方法およびプログラムを提供することができる。

第１実施形態の医用画像診断支援装置の構成の一例を示す図である。図１に示すアテンションブランチネットワークの構成の一例を示す図である。第１実施形態の医用画像診断支援装置の第１例における重みマップの作成手法を説明するための図である。第１実施形態の医用画像診断支援装置の第２例における重みマップの作成手法を説明するための図である。第１実施形態の医用画像診断支援装置における正則化項の計算過程を説明するための図である。第１実施形態の医用画像診断支援装置の畳み込みニューラルネットワークの注目領域などを説明するための図である。第１実施形態の医用画像診断支援装置において実行される処理の一例を示すフローチャートである。第２実施形態の医用画像診断支援装置の畳み込みニューラルネットワークの注目領域などを説明するための図である。

以下、図面を参照し、本発明の医用画像診断支援装置、医用画像診断支援方法およびプログラムの実施形態について説明する。

［第１実施形態］
図１は第１実施形態の医用画像診断支援装置１の構成の一例を示す図である。
図１に示す例では、第１実施形態の医用画像診断支援装置１が、例えば専門医などによる医用画像の診断を支援する。医用画像診断支援装置１による診断支援対象の医用画像には、例えば胸部Ｘ線画像などのようなＸ線画像、エコー画像、ＭＲＩ（Magnetic Resonance Imaging）画像、ＣＴ（computed tomography）画像、眼底画像などが含まれる。
医用画像診断支援装置１は、予測部１１と、学習部１２と、分類モデル１Ａとを備えている。分類モデル１Ａは、医用画像から疾患の有無を分類する。つまり、分類モデル１Ａは、疾患を有するか否の診断が必要な医用画像を、疾患を有する医用画像と、疾患を有さない医用画像とに分類する。予測部１１は分類モデル１Ａを用いた予測を行う。学習部１２は、予測部１１によって分類モデル１Ａが用いられる前に、分類モデル１Ａの教師あり学習を行う。学習部１２によって行われる教師あり学習では、疾患の有無が既知の学習用医用画像が教師データとして用いられる。
図１に示す例では、学習部１２が分類モデル１Ａの教師あり学習を行う学習段階において、疾患の有無が既知の学習用医用画像が、教師データとして医用画像診断支援装置１に入力される。つまり、分類モデル１Ａの教師あり学習に用いられる教師データは、学習用医用画像と、その学習用医用画像の撮像対象者がその学習用医用画像内に疾患を有するか否かを示す情報との組である。
予測部１１が分類モデル１Ａを用いることによって医用画像から疾患の有無を予測する予測段階においては、分類モデル１Ａによる分類対象の医用画像が医用画像診断支援装置１に入力され、分類モデル１Ａは、入力された医用画像を、疾患を有する医用画像と、疾患を有さない医用画像とに分類する。更に、分類モデル１Ａによる分類結果（つまり、各医用画像が疾患を有する画像であるか、あるいは、疾患を有さない画像であるかを示す情報）が、医用画像診断支援装置１から出力される。

上述したように、医療分野においては、ＡＩのブラックボックス問題を考慮する必要がある。詳細には、医療用ＡＩが医用画像のうちのどの領域に注目しているかを、医療用ＡＩを利用する専門医などが把握できるようにしなければ、専門医などが医療用ＡＩを信頼して利用しないおそれがある。
そこで、図１に示す例では、分類モデル１Ａが、畳み込みニューラルネットワーク１Ａ１と、畳み込みニューラルネットワーク１Ａ１の注目領域を可視化するアテンションブランチネットワーク１Ａ２とによって構成されている。アテンションブランチネットワーク１Ａ２は、視覚的説明による畳み込みニューラルネットワーク１Ａ１の注目領域の可視化と予測精度向上とを同時に実現した分類モデルである。アテンションブランチネットワーク１Ａ２の詳細については、例えば下記の文献に記載されている。
H. Fukui, T. Hirakawa, T. Yamashita, and H. Fujiyoshi, “Attention branch network: Learning of attention mechanism for visual explanation,” Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit., vol. 2019-June, pp. 10697-10706, 2019, doi: 10.1109/CVPR.2019.01096.

図２は図１に示すアテンションブランチネットワーク１Ａ２の構成の一例を示す図である。
図２に示す例では、アテンションブランチネットワーク１Ａ２が、特徴抽出器１Ａ２１と、アテンションブランチ１Ａ２２と、パーセプションブランチ１Ａ２３とを備えている。
例えば、学習部１２によって分類モデル１Ａの教師あり学習が行われる段階では、特徴抽出器１Ａ２１は、アテンションブランチネットワーク１Ａ２に入力された学習用医用画像から学習用医用画像の分類に必要な特徴量を抽出し、特徴量マップを生成する。
アテンションブランチ１Ａ２２は、特徴抽出器１Ａ２１によって生成された特徴量マップから、クラスアクティベーションマッピング（ＣＡＭ）によるアテンションマップを生成する。アテンションブランチネットワーク１Ａ２では、アテンションブランチ１Ａ２２により生成されたアテンションマップが、特徴抽出器１Ａ２１によって生成された特徴量マップに反映させられる（つまり、特徴量マップが、アテンションマップによって重み付けされる）。
パーセプションブランチ１Ａ２３は、アテンションマップによって重み付けされた特徴量マップの分類を行い、アテンションブランチネットワーク１Ａ２に入力された学習用医用画像の分類結果として出力する。

一般的なアテンションブランチネットワークにおいては、アテンションブランチネットワークの損失関数Ｌｏｓｓが下記の式（１）によって表される。式（１）において、ＣｒｏｓｓＥｎｔｒｏｐｙＬｏｓｓ_ａｔｔはアテンションブランチの学習誤差を示しており、ＣｒｏｓｓＥｎｔｒｏｐｙＬｏｓｓ_ｐｅｒはパーセプションブランチの学習誤差を示している。
つまり、一般的なアテンションブランチネットワークにおいては、アテンションブランチネットワークの損失関数Ｌｏｓｓが、アテンションブランチの学習誤差ＣｒｏｓｓＥｎｔｒｏｐｙＬｏｓｓ_ａｔｔとパーセプションブランチの学習誤差ＣｒｏｓｓＥｎｔｒｏｐｙＬｏｓｓ_ｐｅｒとの総和である。

本発明者等は、鋭意研究において、アテンションブランチネットワーク１Ａ２の損失関数Ｌｏｓｓとして、式（１）に示すアテンションブランチネットワークの損失関数Ｌｏｓｓを用いると、畳み込みニューラルネットワーク１Ａ１が、胸部Ｘ線画像のうちの疾患の有無の分類に不必要な領域に注目してしまうのに対し、アテンションブランチネットワーク１Ａ２の損失関数Ｌｏｓｓとして、下記の式（２）に示すアテンションブランチネットワーク１Ａ２の損失関数Ｌｏｓｓを用いることによって、畳み込みニューラルネットワーク１Ａ１が、胸部Ｘ線画像のうちの疾患の有無の分類に不必要な領域に注目しなくなることを見い出したのである。
詳細には、本発明者等は、研究において、アテンションブランチ１Ａ２２から出力されるアテンションマップが、学習用医用画像内における位置に対応した情報を持つことに注目した。更に、本発明者等は、畳み込みニューラルネットワーク１Ａ１が胸部Ｘ線画像のうちの肺野や心臓の領域に注目するように、かつ、畳み込みニューラルネットワーク１Ａ１が胸部Ｘ線画像のうちの肺野、心臓以外の領域に注目した場合に高い罰則が付くように、アテンションブランチネットワーク１Ａ２の損失関数Ｌｏｓｓに、正則化項（式（２）の右辺の第３項）を追加した。その結果、畳み込みニューラルネットワーク１Ａ１が、胸部Ｘ線画像のうちの疾患の有無の分類に不必要な領域に注目しなくなったのである。

つまり、式（２）に示すアテンションブランチネットワーク１Ａ２の損失関数Ｌｏｓｓは、アテンションブランチ１Ａ２２の学習誤差ＣｒｏｓｓＥｎｔｒｏｐｙＬｏｓｓ_ａｔｔと、パーセプションブランチ１Ａ２３の学習誤差ＣｒｏｓｓＥｎｔｒｏｐｙＬｏｓｓ_ｐｅｒと、正則化項との総和である。詳細には、正則化項は、アテンションブランチ１Ａ２２から出力されるアテンションマップＭと重みマップＷとのアダマール積（アテンションマップＭと重みマップＷとの成分ごとの積）によって得られた行列のフロベニウスノルムである。
式（２）において、正則化パラメータλは、学習の都度チューニングが必要なハイパーパラメータである。
重みマップＷは、畳み込みニューラルネットワーク１Ａ１に注目して欲しい領域（分類用領域）に対応する。つまり、重みマップＷは、医用画像診断支援装置１に入力される学習用医用画像のうちの疾患の有無の分類に必要な領域である分類用領域に対応する。

すなわち、図２に示す例では、医用画像診断支援装置１に入力される学習用医用画像のうちの疾患の有無の分類に必要な領域である分類用領域を示す事前情報が、アテンションブランチネットワーク１Ａ２に与えられる。
その結果、図１および図２に示す例では、畳み込みニューラルネットワーク１Ａ１が学習用医用画像のうちの疾患の有無の分類に不必要な領域に注目しないようにすることができる。つまり、畳み込みニューラルネットワーク１Ａ１が学習用医用画像のうちの疾患の有無の分類に不必要な領域に注目してしまうことに伴って、医用画像診断支援装置１が専門医などに信頼されなくなるおそれを抑制することができる。
図１および図２に示す例では、分類モデル１Ａが予後の分類（つまり、医用画像を、予後が良い医用画像と、予後が悪い医用画像とに分類すること）を行わないが、他の例では、分類モデル１Ａが予後の分類を行ってもよい。この例では、教師データとして、疾患の有無が既知であって、予後に関する情報が既知である学習用医用画像が用いられる。

図３は第１実施形態の医用画像診断支援装置１の第１例における重みマップＷの作成手法を説明するための図である。詳細には、図３（Ａ）は医用画像診断支援装置１に入力される学習用医用画像（入力画像）の一例を示しており、図３（Ｂ）は図３（Ａ）に示す学習用医用画像（胸部Ｘ線画像）のうちの疾患の有無の分類に必要な領域（分類用領域）の一部（肺野）のセグメンテーション画像を示しており、図３（Ｃ）は図３（Ｂ）に示すセグメンテーション画像から作成される重みマップＷを示している。
図３に示す例では、分類用領域（具体的には、図３（Ａ）に示す胸部Ｘ線画像のうちの疾患の有無の分類に必要な領域）の一部である第１部分（具体的には、肺野）のセグメンテーション画像（図３（Ｂ）参照）に凸包処理を行うことによって、図３（Ｃ）に示す重みマップＷが作成される。図３（Ｃ）に示す重みマップＷは、例えば医用画像診断支援装置１の管理者（例えば専門医など）によって作成される。学習部１２によって分類モデル１Ａの教師あり学習が行われる段階において、医用画像診断支援装置１のアテンションブランチネットワーク１Ａ２は、その重みマップＷの入力を受け付け、上述した正則化項を得るためにその重みマップＷを利用する（つまり、その重みマップＷが、アテンションブランチネットワーク１Ａ２に入力され、正則化項を得るために利用される）。
他の例では、医用画像診断支援装置１が、図３（Ｃ）に示す重みマップＷを作成するための機能を備えていてもよい。

図４は第１実施形態の医用画像診断支援装置１の第２例における重みマップＷの作成手法を説明するための図である。詳細には、図４（Ａ）は医用画像診断支援装置１に入力される学習用医用画像（入力画像）の一例を示しており、図４（Ｂ）は図４（Ａ）に示す学習用医用画像（胸部Ｘ線画像）のうちの疾患の有無の分類に必要な領域（分類用領域）の一部（肺野）のセグメンテーション画像と他の一部（心臓）のセグメンテーション画像とを組み合わせたものを示しており、図４（Ｃ）は図４（Ｂ）に示す肺野のセグメンテーション画像と心臓のセグメンテーション画像とを組み合わせたものから作成される重みマップＷを示している。
図４に示す例では、分類用領域（具体的には、図４（Ａ）に示す胸部Ｘ線画像のうちの疾患の有無の分類に必要な領域）の一部である第１部分（具体的には、肺野）のセグメンテーション画像と、分類用領域の他の一部である第２部分（具体的には、心臓）のセグメンテーション画像とを組み合わせたもの（図４（Ｂ）参照）を生成することによって、図４（Ｃ）に示す重みマップＷが作成される。学習部１２によって分類モデル１Ａの教師あり学習が行われる段階において、医用画像診断支援装置１のアテンションブランチネットワーク１Ａ２は、その重みマップＷの入力を受け付け、上述した正則化項を得るためにその重みマップＷを利用する（つまり、その重みマップＷが、アテンションブランチネットワーク１Ａ２に入力され、正則化項を得るために利用される）。
他の例では、医用画像診断支援装置１が、図４（Ｃ）に示す重みマップＷを作成するための機能を備えていてもよい。

詳細には、本発明者等は、研究において、Ｕ－Ｎｅｔを使用することによって、図３（Ｂ）に示すセグメンテーション画像（肺野のセグメンテーション画像）と、図４（Ｂ）に示すセグメンテーション画像（肺野のセグメンテーション画像と心臓のセグメンテーション画像とを組み合わせたもの）とを生成した。
Ｕ－Ｎｅｔについては、下記の文献に記載されている。
O. Ronneberger, P. Fischer, and T. Brox, “U-net: Convolutional networks for biomedical image segmentation,” Lect. Notes Comput. Sci. (including Subser. Lect. Notes Artif. Intell. Lect. Notes Bioinformatics), vol. 9351, pp. 234-241, 2015, doi: 10.1007/978-3-319-24574-4_28.

また、本発明者等は、研究において、肺野の教師データに、Montgomery Country-Chest X-ray databaseの胸部Ｘ線画像７０４例を使用した。Montgomery Country-Chest X-ray databaseの胸部Ｘ線画像７０４例については、下記の２つの文献に記載されている。
S. Candemir et al., “Lung segmentation in chest radiographs using anatomical atlases with nonrigid registration,” IEEE Trans. Med. Imaging, vol. 33, no. 2, pp. 577-590, 2014, doi: 10.1109/TMI.2013.2290491.
S. Jaeger et al., “Automatic Tuberculosis Screening Using Chest Radiographs,” IEEE Trans. Med. Imaging, vol. 33, no. 2, pp. 233-245, Feb. 2014, doi: 10.1109/TMI.2013.2284099.

また、本発明者等は、研究において、心臓の教師データに、JSRTの胸部Ｘ線画像２４７例を使用した。JSRTの胸部Ｘ線画像２４７例については、下記の２つの文献に記載されている。
P. (Project leader) T. U. of C. Junji Shiraishi et al., “Standard Digital Image Database:Chest Lung Nodules and Non-Nodules Created by the Japanese Society of Radiological Technology (JSRT) In cooperation with the Japanese Radiological Society (JRS),” 1997.
B. van Ginneken, M. B. Stegmann, and M. Loog, “Segmentation of anatomical structures in chest radiographs using supervised methods: A comparative study on a public database,” Med. Image Anal., vol. 10, no. 1, pp. 19-40, 2006, doi: 10.1016/j.media.2005.02.002.

図５は第１実施形態の医用画像診断支援装置１における正則化項の計算過程を説明するための図である。
第１実施形態の医用画像診断支援装置１では、上述した式（２）および図５に示すように、正則化項は、アテンションマップＭと重みマップＷとのアダマール積（アテンションマップＭと重みマップＷとの成分ごとの積）によって得られた行列のフロベニウスノルムとして計算される。

＜使用したデータ＞
本発明者等は、第１実施形態の医用画像診断支援装置１を検証する研究において、帝京大学医学部付属病院で撮像された胸部Ｘ線画像３０３２例を使用した。データの構成は、正常（つまり、その胸部Ｘ線画像の撮像対象者がその胸部Ｘ線画像内に疾患を有さない）が２００２例、異常（つまり、その胸部Ｘ線画像の撮像対象者がその胸部Ｘ線画像内に疾患を有する）が１０３０例から構成される。なお、異常例の中には、撮像体位が座位や臥位で撮像された画像も含まれている。画像サイズは分類モデルの推奨されている入力サイズに合わせて、胸部Ｘ線画像を２２４×２２４にリサイズした。

＜分類性能＞
本発明者等は、第１実施形態の医用画像診断支援装置１を検証する研究において、層化抽出法１０分割交差検証を用いて、帝京大学胸部Ｘ線データセットの学習および精度の評価を行った。分類モデルとして典型的な３種のＣＮＮ（ＶＧＧ１６、ＲｅｓＮｅｔ５０、ＤｅｎｓｅＮｅｔ１２１）をベースとしたアテンションブランチネットワークを構築することにより、第１実施形態の医用画像診断支援装置１の学習および精度の評価を行った。Accuracy（Balanced Accuracy）、Sensitivity、Specificity、ＡＵＣ（Area Under the Curve）の平均および標準偏差を下記の表１に示す。表１において、「Weightmap1」は肺野のセグメンテーション画像に凸包処理を施した重みマップＷ（図３（Ｃ）参照）を示しており、「weightmap2」は肺野のセグメンテーション画像と心臓のセグメンテーション画像とを組み合わせた重みマップＷ（図４（Ｃ）参照）を示している。

詳細には、表１の「VGG16」の行は、ＣＮＮとしてＶＧＧ１６が用いられ、かつ、ＡＢＮが適用されていない比較例の医用画像診断支援装置の評価結果を示している。表１の「VGG16+ABN」の行は、ＣＮＮとしてＶＧＧ１６が用いられ、かつ、ＡＢＮが適用されているものの、事前情報（重みマップＷ）がＡＢＮに与えられていない比較例の医用画像診断支援装置の評価結果を示している。表１の「VGG16+ABN+weightmap1」の行は、畳み込みニューラルネットワーク１Ａ１としてＶＧＧ１６が用いられ、かつ、図３（Ｃ）に示す重みマップＷ（事前情報）がアテンションブランチネットワーク１Ａ２に与えられている第１実施形態の医用画像診断支援装置１の第１例の評価結果を示している。表１の「VGG16+ABN+weightmap2」の行は、畳み込みニューラルネットワーク１Ａ１としてＶＧＧ１６が用いられ、かつ、図４（Ｃ）に示す重みマップＷ（事前情報）がアテンションブランチネットワーク１Ａ２に与えられている第１実施形態の医用画像診断支援装置１の第２例の評価結果を示している。
表１の「Resnet50」の行は、ＣＮＮとしてＲｅｓＮｅｔ５０が用いられ、かつ、ＡＢＮが適用されていない比較例の医用画像診断支援装置の評価結果を示している。表１の「Resnet50+ABN」の行は、ＣＮＮとしてＲｅｓＮｅｔ５０が用いられ、かつ、ＡＢＮが適用されているものの、事前情報（重みマップＷ）がＡＢＮに与えられていない比較例の医用画像診断支援装置の評価結果を示している。表１の「Resnet50+ABN+weightmap1」の行は、畳み込みニューラルネットワーク１Ａ１としてＲｅｓＮｅｔ５０が用いられ、かつ、図３（Ｃ）に示す重みマップＷ（事前情報）がアテンションブランチネットワーク１Ａ２に与えられている第１実施形態の医用画像診断支援装置１の第１例の評価結果を示している。表１の「Resnet50+ABN+weightmap2」の行は、畳み込みニューラルネットワーク１Ａ１としてＲｅｓＮｅｔ５０が用いられ、かつ、図４（Ｃ）に示す重みマップＷ（事前情報）がアテンションブランチネットワーク１Ａ２に与えられている第１実施形態の医用画像診断支援装置１の第２例の評価結果を示している。
表１の「Densenet121」の行は、ＣＮＮとしてＤｅｎｓｅＮｅｔ１２１が用いられ、かつ、ＡＢＮが適用されていない比較例の医用画像診断支援装置の評価結果を示している。表１の「Densenet121+ABN」の行は、ＣＮＮとしてＤｅｎｓｅＮｅｔ１２１が用いられ、かつ、ＡＢＮが適用されているものの、事前情報（重みマップＷ）がＡＢＮに与えられていない比較例の医用画像診断支援装置の評価結果を示している。表１の「Densenet121+ABN+weightmap1」の行は、畳み込みニューラルネットワーク１Ａ１としてＤｅｎｓｅＮｅｔ１２１が用いられ、かつ、図３（Ｃ）に示す重みマップＷ（事前情報）がアテンションブランチネットワーク１Ａ２に与えられている第１実施形態の医用画像診断支援装置１の第１例の評価結果を示している。表１の「Densenet121+ABN+weightmap2」の行は、畳み込みニューラルネットワーク１Ａ１としてＤｅｎｓｅＮｅｔ１２１が用いられ、かつ、図４（Ｃ）に示す重みマップＷ（事前情報）がアテンションブランチネットワーク１Ａ２に与えられている第１実施形態の医用画像診断支援装置１の第２例の評価結果を示している。

評価指標にはクラス間におけるデータ数の偏りを適切に評価するために、Balanced Accuracyを使用した。Balanced Accuracyは、下記の式（３）によって表される。式（３）において、ＴＰはTrue Positiveであり、ＴＮはTrue Negativeであり、ＦＰはFalse Positiveであり、ＦＮはFalse Negativeである。

表１の「VGG16+ABN+weightmap1」の行に示す例、表１の「VGG16+ABN+weightmap2」の行に示す例、表１の「Resnet50+ABN+weightmap1」の行に示す例、表１の「Resnet50+ABN+weightmap2」の行に示す例、表１の「Densenet121+ABN+weightmap1」の行に示す例、および、表１の「Densenet121+ABN+weightmap2」の行に示す例のいずれにおいても、第１実施形態の医用画像診断支援装置１の正則化項を付け加えたことに伴う性能低下は見られなかった。

また、本発明者等は、第１実施形態の医用画像診断支援装置１の学習および精度の評価を行う研究において、National Institute of Healthが公開している大規模胸部Ｘ線データセットＮＩＨ１４を用いた。表１の場合と同様に、分類モデルとして典型的な３種のＣＮＮ（ＶＧＧ１６、ＲｅｓＮｅｔ５０、ＤｅｎｓｅＮｅｔ１２１）をベースとしたアテンションブランチネットワークを構築することにより、第１実施形態の医用画像診断支援装置１の学習および精度の評価を行った。Accuracy、Sensitivity、Specificity、ＡＵＣの平均および標準偏差を下記の表２に示す。表２において、「Weightmap1」は肺野のセグメンテーション画像に凸包処理を施した重みマップＷ（図３（Ｃ）参照）を示しており、「weightmap2」は肺野のセグメンテーション画像と心臓のセグメンテーション画像とを組み合わせた重みマップＷ（図４（Ｃ）参照）を示している。
ＮＩＨ１４では、１枚の画像につき１４疾患（Atelectasis、 Cardiomegaly、Consolidation、Edema、Effusion、Emphysema、Fibrosis、Hernia、Infiltration、Mass、Nodule、Pleural Thickening、Pneumonia、Pneumothorax）の有無が［０，１］で付与されている。表２に示す結果は、１４疾患の平均値である。

詳細には、表２の「VGG16」の行は、ＣＮＮとしてＶＧＧ１６が用いられ、かつ、ＡＢＮが適用されていない比較例の医用画像診断支援装置の評価結果を示している。表２の「VGG16+ABN」の行は、ＣＮＮとしてＶＧＧ１６が用いられ、かつ、ＡＢＮが適用されているものの、事前情報（重みマップＷ）がＡＢＮに与えられていない比較例の医用画像診断支援装置の評価結果を示している。表２の「VGG16+ABN+weightmap1」の行は、畳み込みニューラルネットワーク１Ａ１としてＶＧＧ１６が用いられ、かつ、図３（Ｃ）に示す重みマップＷ（事前情報）がアテンションブランチネットワーク１Ａ２に与えられている第１実施形態の医用画像診断支援装置１の第１例の評価結果を示している。表２の「VGG16+ABN+weightmap2」の行は、畳み込みニューラルネットワーク１Ａ１としてＶＧＧ１６が用いられ、かつ、図４（Ｃ）に示す重みマップＷ（事前情報）がアテンションブランチネットワーク１Ａ２に与えられている第１実施形態の医用画像診断支援装置１の第２例の評価結果を示している。
表２の「Resnet50」の行は、ＣＮＮとしてＲｅｓＮｅｔ５０が用いられ、かつ、ＡＢＮが適用されていない比較例の医用画像診断支援装置の評価結果を示している。表２の「Resnet50+ABN」の行は、ＣＮＮとしてＲｅｓＮｅｔ５０が用いられ、かつ、ＡＢＮが適用されているものの、事前情報（重みマップＷ）がＡＢＮに与えられていない比較例の医用画像診断支援装置の評価結果を示している。表２の「Resnet50+ABN+weightmap1」の行は、畳み込みニューラルネットワーク１Ａ１としてＲｅｓＮｅｔ５０が用いられ、かつ、図３（Ｃ）に示す重みマップＷ（事前情報）がアテンションブランチネットワーク１Ａ２に与えられている第１実施形態の医用画像診断支援装置１の第１例の評価結果を示している。表２の「Resnet50+ABN+weightmap2」の行は、畳み込みニューラルネットワーク１Ａ１としてＲｅｓＮｅｔ５０が用いられ、かつ、図４（Ｃ）に示す重みマップＷ（事前情報）がアテンションブランチネットワーク１Ａ２に与えられている第１実施形態の医用画像診断支援装置１の第２例の評価結果を示している。
表２の「Densenet121」の行は、ＣＮＮとしてＤｅｎｓｅＮｅｔ１２１が用いられ、かつ、ＡＢＮが適用されていない比較例の医用画像診断支援装置の評価結果を示している。表２の「Densenet121+ABN」の行は、ＣＮＮとしてＤｅｎｓｅＮｅｔ１２１が用いられ、かつ、ＡＢＮが適用されているものの、事前情報（重みマップＷ）がＡＢＮに与えられていない比較例の医用画像診断支援装置の評価結果を示している。表２の「Densenet121+ABN+weightmap1」の行は、畳み込みニューラルネットワーク１Ａ１としてＤｅｎｓｅＮｅｔ１２１が用いられ、かつ、図３（Ｃ）に示す重みマップＷ（事前情報）がアテンションブランチネットワーク１Ａ２に与えられている第１実施形態の医用画像診断支援装置１の第１例の評価結果を示している。表２の「Densenet121+ABN+weightmap2」の行は、畳み込みニューラルネットワーク１Ａ１としてＤｅｎｓｅＮｅｔ１２１が用いられ、かつ、図４（Ｃ）に示す重みマップＷ（事前情報）がアテンションブランチネットワーク１Ａ２に与えられている第１実施形態の医用画像診断支援装置１の第２例の評価結果を示している。

表２の「VGG16+ABN+weightmap1」の行に示す例、表２の「VGG16+ABN+weightmap2」の行に示す例、表２の「Resnet50+ABN+weightmap1」の行に示す例、表２の「Resnet50+ABN+weightmap2」の行に示す例、表２の「Densenet121+ABN+weightmap1」の行に示す例、および、表２の「Densenet121+ABN+weightmap2」の行に示す例のいずれにおいても、第１実施形態の医用画像診断支援装置１の正則化項を付け加えたことに伴う性能低下は見られなかった。

＜判断根拠の可視化＞
図６は第１実施形態の医用画像診断支援装置１の畳み込みニューラルネットワーク１Ａ１の注目領域などを説明するための図である。詳細には、図６（Ａ）は第１実施形態の医用画像診断支援装置１およびＡＢＮに事前情報（重みマップ）が与えられていない比較例の医用画像診断支援装置に入力された医用画像（入力画像）を示しており、図６（Ｂ）はＡＢＮに事前情報（重みマップ）が与えられていない比較例の医用画像診断支援装置のＣＮＮの注目領域を示しており、図６（Ｃ）はアテンションブランチネットワーク１Ａ２に事前情報（重みマップＷ（詳細には、肺野のセグメンテーション画像と心臓のセグメンテーション画像とを組み合わせた重みマップＷ））が与えられた第１実施形態の医用画像診断支援装置１の畳み込みニューラルネットワーク１Ａ１の注目領域を示している。
図６に示す例では、第１実施形態の医用画像診断支援装置１およびＡＢＮに事前情報（重みマップ）が与えられていない比較例の医用画像診断支援装置に入力される学習用医用画像（入力画像）（図６（Ａ）参照）として、帝京大学胸部Ｘ線データセットが用いられた。

ＡＢＮに事前情報（重みマップ）が与えられていない比較例の医用画像診断支援装置では、図６（Ｂ）に示すように、ＡＢＮのアテンションマップは、ＣＮＮが入力画像の全体に注目していることを示した。詳細には、図６（Ｂ）の最も上側の例では、ＡＢＮのアテンションマップは、ＣＮＮが入力画像のうちの上側部分（肺野および心臓を含む部分）よりも下側部分（肺野および心臓を含まない部分）に強く注目していることを示した。図６（Ｂ）の上から２番目の例では、ＡＢＮのアテンションマップは、ＣＮＮが入力画像のうちの注目すべき部分（肺野および心臓を含む部分）と同等に注目すべきではない部分（肺野および心臓を含まない部分）にも注目していることを示した。図６（Ｂ）の最も下側の例では、ＡＢＮのアテンションマップは、ＣＮＮが入力画像のうちの心臓の部分にあまり注目していないことを示した。
それに対し、アテンションブランチネットワーク１Ａ２に事前情報（重みマップＷ）が与えられた第１実施形態の医用画像診断支援装置１では、図６（Ｃ）に示すように、アテンションブランチネットワーク１Ａ２のアテンションマップは、畳み込みニューラルネットワーク１Ａ１が入力画像のうちの肺野内に注目していることを示した。

図７は第１実施形態の医用画像診断支援装置１において実行される処理の一例を示すフローチャートである。
図７に示す例では、ステップＳ１において、学習部１２が、畳み込みニューラルネットワーク１Ａ１と、畳み込みニューラルネットワーク１Ａ１の注目領域を可視化するアテンションブランチネットワーク１Ａ２とによって構成される分類モデル１Ａの教師あり学習を行う。ステップＳ１において行われる教師あり学習では、疾患の有無が既知の学習用医用画像が教師データとして用いられる。ステップＳ１では、学習用医用画像のうちの疾患の有無の分類に必要な領域である分類用領域（重みマップＷ）を示す情報が、アテンションブランチネットワーク１Ａ２に与えられる。
次いで、ステップＳ２では、予測部１１が、学習済みの分類モデル１Ａを用いることによって、医用画像診断支援装置１に入力された医用画像から、疾患の有無を分類する。

図７に示す例では、ステップＳ１において重みマップＷを示す事前情報が、アテンションブランチネットワーク１Ａ２に与えられるが、他の例では、ステップＳ１のみならず、ステップＳ２においても、重みマップＷを示す事前情報が、アテンションブランチネットワーク１Ａ２に与えられてもよい。

［第２実施形態］
以下、本発明の医用画像診断支援装置、医用画像診断支援方法およびプログラムの第２実施形態について説明する。
第２実施形態の医用画像診断支援装置１は、後述する点を除き、上述した第１実施形態の医用画像診断支援装置１と同様に構成されている。従って、第２実施形態の医用画像診断支援装置１によれば、後述する点を除き、上述した第１実施形態の医用画像診断支援装置１と同様の効果を奏することができる。

第２実施形態の医用画像診断支援装置１は、図１に示す第１実施形態の医用画像診断支援装置１と同様に構成されている。つまり、第２実施形態の医用画像診断支援装置１は、予測部１１と、学習部１２と、分類モデル１Ａとを備えている。分類モデル１Ａは、畳み込みニューラルネットワーク１Ａ１と、畳み込みニューラルネットワーク１Ａ１の注目領域を可視化するアテンションブランチネットワーク１Ａ２とによって構成されている。

第２実施形態の医用画像診断支援装置１のアテンションブランチネットワーク１Ａ２は、図２に示す第１実施形態の医用画像診断支援装置１のアテンションブランチネットワーク１Ａ２と同様に構成されている。
つまり、第２実施形態の医用画像診断支援装置１のアテンションブランチネットワーク１Ａ２は、例えば学習部１２によって分類モデル１Ａの教師あり学習が行われる段階において学習用医用画像の分類に必要な特徴量を抽出し、特徴量マップを生成する特徴抽出器１Ａ２１と、アテンションブランチ１Ａ２２と、パーセプションブランチ１Ａ２３とを備えている。
詳細には、第２実施形態の医用画像診断支援装置１では、パーセプションブランチ１Ａ２３からの出力にＧｒａｄ－ＣＡＭを適用することによって、パーセプションブランチ１Ａ２３からの出力の可視化が行われる。

第２実施形態の医用画像診断支援装置１では、第１実施形態の医用画像診断支援装置１と同様に、アテンションブランチネットワーク１Ａ２の損失関数Ｌｏｓｓが、アテンションブランチ１Ａ２２の学習誤差ＣｒｏｓｓＥｎｔｒｏｐｙＬｏｓｓ_ａｔｔと、パーセプションブランチ１Ａ２３の学習誤差ＣｒｏｓｓＥｎｔｒｏｐｙＬｏｓｓ_ｐｅｒと、正則化項との総和である。
第２実施形態の医用画像診断支援装置１では、第１実施形態の医用画像診断支援装置１と同様に、正則化項が、アテンションブランチ１Ａ２２から出力されるアテンションマップＭと重みマップＷとのアダマール積によって得られた行列のフロベニウスノルムである。
第２実施形態の医用画像診断支援装置１では、第１実施形態の医用画像診断支援装置１と同様に、重みマップＷが、畳み込みニューラルネットワーク１Ａ１に注目して欲しい領域（分類用領域）に対応する。つまり、重みマップＷは、医用画像診断支援装置１に入力される学習用医用画像のうちの疾患の有無の分類に必要な領域である分類用領域に対応する。

図８は第２実施形態の医用画像診断支援装置１の畳み込みニューラルネットワーク１Ａ１の注目領域などを説明するための図（Ｇｒａｄ－ＣＡＭ）である。詳細には、図８（Ａ）は第２実施形態の医用画像診断支援装置１、ＡＢＮが適用されていない比較例の医用画像診断支援装置、および、ＡＢＮが適用されているもののＡＢＮに事前情報（重みマップ）が与えられていない比較例の医用画像診断支援装置に入力された医用画像（入力画像）を示しており、図８（Ｂ）はＡＢＮが適用されていない比較例の医用画像診断支援装置のＣＮＮの注目領域を示しており、図８（Ｃ）はＡＢＮが適用されているもののＡＢＮに事前情報（重みマップ）が与えられていない比較例の医用画像診断支援装置のＣＮＮの注目領域を示しており、図８（Ｄ）はアテンションブランチネットワーク１Ａ２に事前情報（重みマップＷ）が与えられた第２実施形態の医用画像診断支援装置１の畳み込みニューラルネットワーク１Ａ１の注目領域を示している。
図８に示す例では、第２実施形態の医用画像診断支援装置１、ＡＢＮが適用されていない比較例の医用画像診断支援装置、および、ＡＢＮが適用されているもののＡＢＮに事前情報（重みマップ）が与えられていない比較例の医用画像診断支援装置に入力される医用画像（入力画像）（図８（Ａ）参照）として、帝京大学胸部Ｘ線データセットが用いられた。

学習部１２によって分類モデル１Ａの教師あり学習が行われる段階でアテンションブランチネットワーク１Ａ２に事前情報（重みマップＷ）が与えられた第２実施形態の医用画像診断支援装置１では、図８（Ｄ）に示すように（図６（Ｃ）に示す第１実施形態の医用画像診断支援装置１と同様に）、アテンションブランチネットワーク１Ａ２のアテンションマップは、畳み込みニューラルネットワーク１Ａ１が入力画像のうちの肺野内に注目していることを示した。

＜適用例＞
上述した例では、第１および第２実施形態の医用画像診断支援装置１が胸部Ｘ線画像に適用されているが、他の例では、第１または第２実施形態の医用画像診断支援装置１が胸部Ｘ線画像以外のＸ線画像に適用されてもよい。
他の例では、第１または第２実施形態の医用画像診断支援装置１がエコー画像に適用されてもよい。具体的には、畳み込みニューラルネットワーク１Ａ１が心臓の壁に注目することによって、分類モデル１Ａが心筋梗塞の有無を分類することができる。また、畳み込みニューラルネットワーク１Ａ１が乳腺に注目することによって、分類モデル１Ａが乳癌の有無を分類することができる。
更に他の例では、第１または第２実施形態の医用画像診断支援装置１がＭＲＩ画像に適用されてもよい。具体的には、畳み込みニューラルネットワーク１Ａ１が頭蓋内の領域のみに注目することによって、分類モデル１Ａが脳梗塞の有無を分類することができる。また、畳み込みニューラルネットワーク１Ａ１が前立腺の領域のみに注目することによって、分類モデル１Ａが前立腺癌の有無を分類することができる。
更に他の例では、第１または第２実施形態の医用画像診断支援装置１がＣＴ画像に適用されてもよい。具体的には、畳み込みニューラルネットワーク１Ａ１が肺野の部位のみに注目することによって、分類モデル１Ａが肺炎、結節、腫瘍などの有無を分類することができる。また、畳み込みニューラルネットワーク１Ａ１が頭蓋内の領域のみに注目することによって、分類モデル１Ａが脳出血の有無を分類することができる。
更に他の例では、第１または第２実施形態の医用画像診断支援装置１が眼底画像に適用されてもよい。具体的には、畳み込みニューラルネットワーク１Ａ１が視神経乳頭に注目することによって、分類モデル１Ａが緑内障の有無を分類することができる。

以上、本発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更を加えることができる。上述した各実施形態および各例に記載の構成を組み合わせてもよい。

なお、上記の実施形態における医用画像診断支援装置１の全部または一部は、専用のハードウェアにより実現されるものであってもよく、また、メモリおよびマイクロプロセッサにより実現させるものであってもよい。
なお、医用画像診断支援装置１の全部または一部は、メモリおよびＣＰＵ（中央演算装置）により構成され、各システムが備える各部の機能を実現するためのプログラムをメモリにロードして実行することによりその機能を実現させるものであってもよい。
なお、医用画像診断支援装置１の全部または一部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、ＯＳや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ＷＷＷシステムを利用している場合であれば、ホームページ提供環境（あるいは表示環境）も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ－ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。

１…医用画像診断支援装置、１１…予測部、１２…学習部、１Ａ…分類モデル、１Ａ１…畳み込みニューラルネットワーク、１Ａ２…アテンションブランチネットワーク、１Ａ２１…特徴抽出器、１Ａ２２…アテンションブランチ、１Ａ２３…パーセプションブランチ

Claims

医用画像の診断を支援する医用画像診断支援装置であって、
前記医用画像から少なくとも疾患の有無を分類する分類モデルと、
前記分類モデルを用いた予測を行う予測部と、
前記予測部によって前記分類モデルが用いられる前に、前記分類モデルの教師あり学習を行う学習部とを備え、
前記学習部によって行われる教師あり学習では、少なくとも疾患の有無が既知の学習用医用画像が教師データとして用いられ、
前記分類モデルは、畳み込みニューラルネットワークと、前記畳み込みニューラルネットワークの注目領域を可視化するアテンションブランチネットワークとによって構成され、
前記学習部によって前記分類モデルの教師あり学習が行われる段階で、前記アテンションブランチネットワークには、前記学習用医用画像のうちの疾患の有無の分類に必要な領域である分類用領域を示す重みマップである事前情報が与えられる、
医用画像診断支援装置。
前記アテンションブランチネットワークは、
前記医用画像の分類に必要な特徴量を抽出し、特徴量マップを生成する特徴抽出器と、
クラスアクティベーションマッピングによるアテンションマップを生成するアテンションブランチと、
パーセプションブランチとを備え、
前記学習部によって前記分類モデルの教師あり学習が行われる段階では、
前記アテンションブランチにより生成された前記アテンションマップは、前記特徴抽出器によって生成された前記特徴量マップに反映させられ、
前記パーセプションブランチは、前記アテンションマップによって重み付けされた前記特徴量マップを、前記学習用医用画像の分類結果として出力し、
前記アテンションブランチネットワークの損失関数は、
前記アテンションブランチの学習誤差と、
前記パーセプションブランチの学習誤差と、
正則化項との総和であり、
前記正則化項は、前記アテンションマップと前記重みマップとのアダマール積によって得られた行列のフロベニウスノルムである、
請求項１に記載の医用画像診断支援装置。
前記学習部によって前記分類モデルの教師あり学習が行われる段階では、
前記アテンションブランチネットワークは、
前記分類用領域の一部である第１部分のセグメンテーション画像に凸包処理を行うことによって作成された前記重みマップを受け付ける、
請求項２に記載の医用画像診断支援装置。
前記学習部によって前記分類モデルの教師あり学習が行われる段階では、
前記アテンションブランチネットワークは、
前記分類用領域の一部である第１部分のセグメンテーション画像と、前記分類用領域の他の一部である第２部分のセグメンテーション画像とを組み合わせることによって作成された前記重みマップを受け付ける、
請求項２に記載の医用画像診断支援装置。
前記第１部分のセグメンテーション画像および／または前記第１部分のセグメンテーション画像と前記分類用領域の他の一部である第２部分のセグメンテーション画像とを組み合わせたものは、Ｕ－Ｎｅｔを使用することによって生成される、
請求項３または請求項４に記載の医用画像診断支援装置。
前記畳み込みニューラルネットワークとして、ＶＧＧ１６、ＲｅｓＮｅｔ５０およびＤｅｎｓｅＮｅｔ１２１のいずれかを用いる、
請求項１に記載の医用画像診断支援装置。
前記パーセプションブランチからの出力にＧｒａｄ－ＣＡＭを適用することによって、前記パーセプションブランチからの出力の可視化を行う、
請求項２に記載の医用画像診断支援装置。
医用画像の診断を支援する医用画像診断支援方法であって、
前記医用画像から少なくとも疾患の有無を分類する分類モデルを用いた予測を行う予測ステップと、
前記予測ステップが実行される前に、前記分類モデルの教師あり学習を行う学習ステップとを備え、
前記学習ステップにおいて行われる教師あり学習では、少なくとも疾患の有無が既知の学習用医用画像が教師データとして用いられ、
前記分類モデルは、畳み込みニューラルネットワークと、前記畳み込みニューラルネットワークの注目領域を可視化するアテンションブランチネットワークとによって構成され、
前記学習ステップでは、前記アテンションブランチネットワークには、前記学習用医用画像のうちの疾患の有無の分類に必要な領域である分類用領域を示す重みマップである事前情報が与えられる、
医用画像診断支援方法。
コンピュータに、
医用画像から少なくとも疾患の有無を分類する分類モデルを用いた予測を行う予測ステップと、
前記予測ステップが実行される前に、前記分類モデルの教師あり学習を行う学習ステップとを実行させるためのプログラムであって、
前記学習ステップにおいて行われる教師あり学習では、少なくとも疾患の有無が既知の学習用医用画像が教師データとして用いられ、
前記分類モデルは、畳み込みニューラルネットワークと、前記畳み込みニューラルネットワークの注目領域を可視化するアテンションブランチネットワークとによって構成され、
前記学習ステップでは、前記アテンションブランチネットワークには、前記学習用医用画像のうちの疾患の有無の分類に必要な領域である分類用領域を示す重みマップである事前情報が与えられる、
プログラム。