JP2022553906A - 疾患検出モデルを開発するためのシステム、方法、プログラム - Google Patents

疾患検出モデルを開発するためのシステム、方法、プログラム Download PDF

Info

Publication number
JP2022553906A
JP2022553906A JP2022520838A JP2022520838A JP2022553906A JP 2022553906 A JP2022553906 A JP 2022553906A JP 2022520838 A JP2022520838 A JP 2022520838A JP 2022520838 A JP2022520838 A JP 2022520838A JP 2022553906 A JP2022553906 A JP 2022553906A
Authority
JP
Japan
Prior art keywords
disease
detection model
convolutional
disease detection
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022520838A
Other languages
English (en)
Other versions
JPWO2021070108A5 (ja
Inventor
ブラマン、ナサニエル、メイソン
マーバスト、エサン、デガン
ベイマー、デイビッド、ジェイムス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2022553906A publication Critical patent/JP2022553906A/ja
Publication of JPWO2021070108A5 publication Critical patent/JPWO2021070108A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/08Detecting, measuring or recording devices for evaluating the respiratory organs
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/003Reconstruction from projections, e.g. tomography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1916Validation; Performance evaluation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B2576/00Medical imaging apparatus involving image processing or analysis
    • A61B2576/02Medical imaging apparatus involving image processing or analysis specially adapted for a particular organ or body part
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0002Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network
    • A61B5/0004Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network characterised by the type of physiological signal transmitted
    • A61B5/0013Medical image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30061Lung
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Physiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Surgery (AREA)
  • Quality & Reliability (AREA)
  • Pulmonology (AREA)
  • Fuzzy Systems (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)

Abstract

疾患検出モデルを開発するための方法、システムであって、画像スタディ学習と、読影レポートからマイニングされた関連付けられた疾患ラベルとを使用してモデルを訓練し、画像学習は3次元画像ボリュームの複数の2次元スライスのシーケンスを含み、モデルは畳み込みニューラル・ネットワーク層および畳み込み長短期記憶層を含む。モデルを訓練することは、畳み込みニューラル・ネットワーク層を使用して複数の2次元スライスのそれぞれから特徴のセットを個別に抽出し、畳み込み長短期記憶層を使用して複数の2次元スライスのそれぞれについて畳み込みニューラル・ネットワーク層によって抽出された特徴を順次処理し、疾患の確率を生成するために複数の2次元スライスのうちの順番が最後のものに関する畳み込み長短期記憶層からの出力を処理し、確率をラベルと比較することに基づいてモデルを更新する。

Description

本明細書に記載の実施形態は一般に、画像ボリューム内の疾患を検出するように、弱いが容易に入手可能なラベル(たとえば、特定の疾患のバイナリ診断結果)から効率的に学習するための深層学習フレームワークに関する。より詳細には、本明細書に記載の実施形態は、畳み込み長短期記憶(Conv-LSTM:convolutional long short-term memory)ユニットを使用して、画像ボリュームをスキャンし、スライス上およびスライス間の疾患の識別特性(signature)を記憶する検出モデルを提供し、この検出モデルは、アノテーションなしの画像ボリュームのセットに対する疾患のバイナリ・ラベルを使用して訓練される。
深層学習は、コンピュータ支援診断(CAD:computer aided diagnosis)などにおける医用イメージングの強化された自動分析に非常に有望であることを実証した。たとえば、十分に大きい規模の訓練データのプールが与えられると、畳み込みニューラル・ネットワーク(CNN:convolutional neural network)は、疾患検出において並外れた結果を達成することができる。しかしながら、放射線医学における深層学習ベースのCADプラットフォームの開発への障害のひとつは、大規模なアノテーション付き医用画像データセットが必要になることである。具体的には、コンピュータ断層撮影(CT:computed tomography)などの3次元(3D:three-dimensional)イメージング・モダリティの場合、放射線科医が深層モデルの訓練に十分な手動のアノテーションを提供することは非常に面倒であることが多い。したがって、アノテーション付きサンプルの大規模なデータ・セットを使用して疾患検出モデルを訓練することは、実際には実行不可能であることが多く、臨床現場に存在する形での、すなわち、豊富にあるがアノテーションのないイメージング・データを使用する深層学習フレームワークへの相当な需要がある。大規模なアノテーションなしのデータ・セットを疾患検出モデルの開発に活用できることに以外に、そのようなアプローチにより、新たな施設へのファイン・チューニングを、その施設で利用可能なイメージング・データを使用して簡単に行うことが可能になる。この能力は、深層学習システムを新たな施設にうまく配備するという知られている課題を考えると重要である。
たとえば、多くの肺疾患検出アプローチは、訓練と訓練後のモデルの評価との両方に関して、画像ボリューム上で関心領域(ROI:region of interest)の輪郭を手動で描くことに依存している。アノテーション付き画像セットの利用性が限られていることに関する上記の問題に対処するために、一部のアプローチは、弱くラベル付けされた(weakly labeled)イメージング・データを使用する。具体的には、一部のシステムは、ラベル付けされた疾患を含む3Dボリュームをランダムに選択された2次元(2D:two-dimensional)パッチへと自動的にサブサンプリングし、教師ありクラスタリングを実行してパッチを疾患陽性状態へとカテゴライズする。他のシステムは、マルチ・インスタンス学習(MIL:multiple instance learning)アプローチを使用して、陽性例の一部を含むイメージング・ボリュームからの例のグループにわたって肺疾患診断結果などの疾患診断結果を要約する。
しかしながら、これらのアプローチの大多数は、疾患を特徴付けるための、いわゆる「手作りの(hand-crafted)」定量的なイメージング特徴による分類に依存している。そのようなアプローチは、分類タスク用に選ばれた事前定義されたイメージング特徴のリストによって制限され、訓練データのプールが数千に増えてもわずかにしか改善されない。さらに、パッチ・アプローチは、画像ボリュームのごく一部分(たとえば、スキャンあたり50個の2Dパッチ・サブサンプル)しか使用しないので、学習に利用可能なイメージング・データが限られている。また、パッチはランダムなサンプルであり、疾患は肺などのROI全体に存在しない場合があるので、このアプローチは、全体的な疾患陽性状況に対応する健康なパッチを不可避的に含むことになる。疾患のある患者からのそのような健康なサンプルは、訓練およびテストの両方を混乱させる可能性がある。同様に、MILアプローチは、ボリュームからの複数のサンプルにわたって疾患状況を要約するが、それらのサンプル間の空間的関係およびそれらの相互作用に関するコンテキストがない。
したがって、当技術分野では、上述の問題に対処する必要がある。
第1の態様から見ると、本発明は、疾患検出モデルを開発するためのシステムであって、1つまたは複数の電子プロセッサを備え、1つまたは複数の電子プロセッサは、画像学習(image study)と、画像学習について生成された読影レポートからマイニングされた関連付けられた疾患ラベルとを使用して疾患検出モデルを訓練することであって、画像学習は3次元画像ボリュームの複数の2次元スライスのシーケンスを含み、疾患検出モデルは畳み込みニューラル・ネットワーク層および畳み込み長短期記憶層を含み、疾患検出モデルを訓練することは、畳み込みニューラル・ネットワーク層を使用して複数の2次元スライスのそれぞれから特徴のセットを個別に抽出することと、畳み込み長短期記憶層を使用して複数の2次元スライスのそれぞれについて畳み込みニューラル・ネットワーク層によって抽出された特徴のセットを順次処理することと、疾患の確率を生成するために複数の2次元スライスのうちの順番が最後のもの(sequentially last)に関する畳み込み長短期記憶層からの出力を処理することと、確率をラベルと比較することと、比較に基づいて疾患検出モデルを更新することと、を含む、訓練することと、疾患検出モデルが訓練された後に、新たな画像学習の疾患の確率を生成するために新たな画像学習に疾患検出モデルを適用することと、を行うように構成される、システムを提供する。
さらなる態様から見ると、本発明は、疾患検出モデルを開発するための方法であって、1つまたは複数の電子プロセッサを用いて、画像学習と、画像学習について生成された読影レポートからマイニングされた関連付けられた疾患ラベルとを使用して疾患検出モデルを訓練することであって、画像学習は3次元画像ボリュームの複数の2次元スライスのシーケンスを含み、疾患検出モデルは畳み込みニューラル・ネットワーク層および畳み込み長短期記憶層を含み、疾患検出モデルを訓練することは、畳み込みニューラル・ネットワーク層を使用して複数の2次元スライスのそれぞれから特徴のセットを個別に抽出することと、畳み込み長短期記憶層を使用して複数の2次元スライスのそれぞれについて畳み込みニューラル・ネットワーク層によって抽出された特徴のセットを順次処理することと、疾患の確率を生成するために複数の2次元スライスのうちの順番が最後のものに関する畳み込み長短期記憶層からの出力を処理することと、確率をラベルと比較することと、比較に基づいて疾患検出モデルを更新することと、を含む、訓練することと、疾患検出モデルが訓練された後に、新たな画像学習の疾患の確率を生成するために新たな画像学習に疾患検出モデルを適用することと、を含む、方法を提供する。
さらなる態様から見ると、本発明は、疾患検出モデルを開発するためのコンピュータ・プログラム製品であって、処理回路によって読み取り可能であり、処理回路によって実行するための、本発明のステップを実行するための方法を実行するための命令を記憶するコンピュータ可読記憶媒体を備える、コンピュータ・プログラム製品を提供する。
さらなる態様から見ると、本発明は、コンピュータ可読媒体に記憶され、デジタル・コンピュータの内部メモリにロード可能なコンピュータ・プログラムであって、上記プログラムがコンピュータ上で実行された場合に、本発明のステップを実行するためのソフトウェア・コード部分を含む、コンピュータ・プログラムを提供する。
さらなる態様から見ると、本発明は、1つまたは複数の電子プロセッサによって実行された場合に、機能のセットを実行する命令を記憶する非一時的コンピュータ可読媒体であって、機能のセットは、画像学習と、画像学習について生成された読影レポートからマイニングされた関連付けられた疾患ラベルとを使用して疾患検出モデルを訓練することであって、疾患ラベルは画像学習に関連付けられた患者が疾患と診断されたか否かのバイナリ・ラベルを含み、画像学習は3次元画像ボリュームの複数の2次元スライスのシーケンスを含み、疾患検出モデルは畳み込みニューラル・ネットワーク層および畳み込み長短期記憶層を含み、疾患検出モデルを訓練することは、畳み込みニューラル・ネットワーク層を使用して複数の2次元スライスのそれぞれから特徴のセットを個別に抽出することと、畳み込み長短期記憶層を使用して複数の2次元スライスのそれぞれについて畳み込みニューラル・ネットワーク層によって抽出された特徴のセットを順次処理することと、疾患の確率を生成するために複数の2次元スライスのうちの順番が最後のものに関する畳み込み長短期記憶層からの出力を処理することと、確率をラベルと比較することと、比較に基づいて疾患検出モデルを更新することと、を含む、訓練することと、疾患検出モデルが訓練された後に、新たな画像学習の疾患の確率を生成するために新たな画像学習に疾患検出モデルを適用することと、を含む、非一時的コンピュータ可読媒体を提供する。
このように、既存のアプローチに関するこれらの問題および他の問題に対処するために、本明細書に記載の実施形態は、3D画像を2D画像の時系列として扱うことによって、弱いが容易に手に入るアノテーション付きボリューメトリック医用画像を使用するための解決策を提供する。本出願で証明しているように、この解決策を使用して、低線量CT画像を用いた肺癌検診において肺気腫を検出することができる。息切れおよび癌リスクの上昇を伴う肺気腫は、肺容量の一部分のみの肺胞の破裂として現れることが多い。本明細書に記載の実施形態は、畳み込み長短期記憶(LSTM)およびMILを利用して、専門家による疾患領域へのアノテーションを必要とせずに、画像ボリュームを肺気腫に関して「スキャン」する深層学習フレームワークを提供する。アノテーションに関して、本明細書に記載の実施形態は、容易に利用可能な読影レポートから抽出できるバイナリ・ラベル(非疾患状態または疾患状態)しか使用しない。このアプローチを使用すると、偽陽性のリスクを最小限に抑えながら、肺気腫を識別するようにモデルを訓練することができる。肺気腫以外に、本明細書に記載の実施形態は、ボリューメトリック・イメージング・データの利用性が、手動で輪郭が描かれたグラウンド・トゥルースを提供するための放射線科医の許容量を上回り、読影レポートまたは他の情報源からラベルを容易にマイニングすることができる場合、他の疾患および異常(本明細書ではまとめて「疾患」と呼ぶ)の検出問題に適用可能である。
本明細書に記載のアプローチの利点の1つは、大規模なボリューメトリック臨床イメージング・データの利用性を活用して、放射線科医による労働集約的な手動のアノテーションを必要とせずに、CADシステムを訓練できることである。いくつかの実施形態では、これらのシステムは、放射線科医の診断結果の二次チェックとしてバックグラウンドで実行することができ(見落とされた可能性のある診断結果をシステムが検出した場合にのみ入力を必要とする)、偽陰性を20~50%削減することができる。本明細書に記載の実施形態は、上記の他のシステムの欠点にも対処する。具体的には、手作りの定量的なイメージング特徴を活用する上記のCADアプローチとは異なり、本明細書に記載の深層学習ベースのアプローチは、最適な画像パターンを発見して訓練セット内の疾患状態を判別するので、手動で定義されたイメージング特徴のプールによる制約を受けない。その結果、このアプローチのパフォーマンスは、訓練データのセットが大きくなるほど向上し続ける。したがって、このアプローチは、容易に手に入る、最小限にしかアノテーション付けされていないデータを使用して訓練することができ、そのデータの豊富さから利益を得る。本明細書に記載のアプローチはまた、上述のパッチング・アプローチに固有の、訓練パッチが誤ってラベル付けされるという問題を回避する。具体的には、本明細書に記載の実施形態は、健康状態と疾患状態との両方を含むサンプルを分析するが、ボリューム全体を一度に評価することにより、疾患陽性とラベル付けされた全てのサンプルが実際に疾患特徴(組織)を含むようになる。純粋なMILアプローチとは異なり、本明細書に記載の実施形態は、個々のスライスを連続したシーケンスと見なすので、スライス間の空間的関係を考慮し、イメージング・ボリュームがスキャンされたときの疾患状況の予測結果を更新する。
たとえば、いくつかの実施形態は、(1)積層された2D放射線画像からなる3Dイメージング・ボリュームを受け取り、(2)効率的な処理のためにボリュームを操作し、(3)ボリュームの2Dスライスを順次分析して疾患状態または他の異状が存在する予測確率を出力するニューラル・ネットワークアーキテクチャを通じて画像ボリュームを分析するように構成されるソフトウェアが備えられたコンピューティング・デバイスを含むシステムを提供する。このニューラル・ネットワークは、弱くしかラベル付けされていない(たとえば、ボリューム全体での1つまたは複数の疾患状態/異常のバイナリ診断ステータスしか有さない)多数のイメージング・ボリュームを使用して、そのボリューム内のその疾患の位置の指導なしで、疾患を識別するように訓練される。このニューラル・ネットワークは、(a)個々の2Dスライス上の画像パターンを学習および検出する2D畳み込み演算、(b)3Dボリュームをスライスごとにスキャンし、3Dボリューム全体にわたる空間パターンおよびそれらの変動を検出する畳み込み長短期記憶(LSTM)ユニット、(c)各スライスでの畳み込みLSTMスキャンに対応する疾患状況の0~1の予測結果を出力する分散したDense演算(distributed dense operation)、および任意選択により、(d)3Dボリュームを分析したときのネットワークの予測結果をボリューム全体に関する単一の予測結果へと要約するMILバッグ確率関数を含む。
たとえば、一実施形態は、疾患検出モデルを開発するためのシステムを提供する。このシステムは1つまたは複数の電子プロセッサを含む。1つまたは複数の電子プロセッサは、画像学習と、画像学習について生成された読影レポートからマイニングされた関連付けられた疾患ラベルとを使用して疾患検出モデルを訓練するように構成される。画像学習は3次元画像ボリュームの複数の2次元スライスのシーケンスを含み、疾患検出モデルは畳み込みニューラル・ネットワーク層および畳み込み長短期記憶層を含む。疾患検出モデルを訓練することは、畳み込みニューラル・ネットワーク層を使用して複数の2次元スライスのそれぞれから特徴のセットを個別に抽出することと、畳み込み長短期記憶層を使用して複数の2次元スライスのそれぞれについて畳み込みニューラル・ネットワーク層によって抽出された特徴のセットを順次処理することと、疾患の確率を生成するために複数の2次元スライスのうちの順番が最後のものに関する畳み込み長短期記憶層からの出力を処理することと、確率をラベルと比較することと、比較に基づいて疾患検出モデルを更新することと、を含む。1つまたは複数の電子プロセッサはまた、疾患検出モデルが訓練された後に、新たな画像学習の疾患の確率を生成するために新たな画像学習に疾患検出モデルを適用するように構成される。
他の実施形態は、疾患検出モデルを開発するための方法を提供する。この方法は、1つまたは複数の電子プロセッサを用いて、画像学習と、画像学習について生成された読影レポートからマイニングされた関連付けられた疾患ラベルとを使用して疾患検出モデルを訓練することを含む。画像学習は3次元画像ボリュームの複数の2次元スライスのシーケンスを含み、疾患検出モデルは畳み込みニューラル・ネットワーク層および畳み込み長短期記憶層を含む。疾患検出モデルを訓練することは、畳み込みニューラル・ネットワーク層を使用して複数の2次元スライスのそれぞれから特徴のセットを個別に抽出することと、畳み込み長短期記憶層を使用して複数の2次元スライスのそれぞれについて畳み込みニューラル・ネットワーク層によって抽出された特徴を順次処理することと、疾患の確率を生成するために複数の2次元スライスのうちの順番が最後のものに関する畳み込み長短期記憶層からの出力を処理することと、確率をラベルと比較することと、比較に基づいて疾患検出モデルを更新することと、を含む。この方法はまた、疾患検出モデルが訓練された後に、新たな画像学習の疾患の確率を生成するために新たな画像学習に疾患検出モデルを適用することを含む。
さらに他の実施形態は、1つまたは複数の電子プロセッサによって実行された場合に、機能のセットを実行する命令を記憶する非一時的コンピュータ可読媒体を提供する。機能のセットは、画像学習と、画像学習について生成された読影レポートからマイニングされた関連付けられた疾患ラベルとを使用して疾患検出モデルを訓練することを含む。疾患ラベルは画像学習に関連付けられた患者が疾患と診断されたか否かのバイナリ・ラベルを含み、画像学習は3次元画像ボリュームの複数の2次元スライスのシーケンスを含む。疾患検出モデルは畳み込みニューラル・ネットワーク層および畳み込み長短期記憶層を含む。疾患検出モデルを訓練することは、畳み込みニューラル・ネットワーク層を使用して複数の2次元スライスのそれぞれから特徴のセットを個別に抽出することと、畳み込み長短期記憶層を使用して複数の2次元スライスのそれぞれについて畳み込みニューラル・ネットワーク層によって抽出された特徴のセットを順次処理することと、疾患の確率を生成するために複数の2次元スライスのうちの順番が最後のものに関する畳み込み長短期記憶層からの出力を処理することと、確率をラベルと比較することと、比較に基づいて疾患検出モデルを更新することと、を含む。機能のセットはさらに、疾患検出モデルが訓練された後に、新たな画像学習の疾患の確率を生成するために新たな画像学習に疾患検出モデルを適用することを含む。
さらなる実施形態は、疾患検出モデルを開発するためのシステムを提供する。このシステムは1つまたは複数の電子プロセッサを備える。1つまたは複数の電子プロセッサは、画像学習と、画像学習について生成された読影レポートからマイニングされた関連付けられた疾患ラベルとを使用して疾患検出モデルを訓練するように構成される。画像学習は3次元画像ボリュームの複数の2次元スライスのシーケンスを含み、モデルは畳み込みニューラル・ネットワーク層および畳み込み長短期記憶層を含む。疾患検出モデルを訓練することは、畳み込みニューラル・ネットワーク層を使用して複数の2次元スライスのそれぞれから特徴のセットを個別に抽出することと、畳み込み長短期記憶層を使用して複数の2次元スライスのそれぞれについて畳み込みニューラル・ネットワーク層によって抽出された特徴のセットを順次処理することと、疾患の確率を生成するために複数の2次元スライスのうちのそれぞれに関する畳み込み長短期記憶層からの出力を処理することと、確率をラベルと比較することと、比較に基づいて疾患検出モデルを更新することと、を含む。1つまたは複数の電子プロセッサはまた、疾患検出モデルが訓練された後に、新たな画像学習の疾患の確率を生成するために新たな画像学習に疾患検出モデルを適用するように構成される。
追加の実施形態は、疾患検出モデルを開発するための方法を提供する。この方法は、1つまたは複数の電子プロセッサを用いて、画像学習と、画像学習について生成された読影レポートからマイニングされた関連付けられた疾患ラベルとを使用して疾患検出モデルを訓練することを含む。画像学習は3次元画像ボリュームの複数の2次元スライスのシーケンスを含み、疾患検出モデルは畳み込みニューラル・ネットワーク層および畳み込み長短期記憶層を含む。疾患検出モデルを訓練することは、畳み込みニューラル・ネットワーク層を使用して複数の2次元スライスのそれぞれから特徴のセットを個別に抽出することと、畳み込み長短期記憶層を使用して複数の2次元スライスのそれぞれについて畳み込みニューラル・ネットワーク層によって抽出された特徴のセットを順次処理することと、疾患の確率を生成するために複数の2次元スライスのうちのそれぞれに関する畳み込み長短期記憶層からの出力を処理することと、確率をラベルと比較することと、比較に基づいて疾患検出モデルを更新することと、を含む。この方法はまた、疾患検出モデルが訓練された後に、新たな画像学習の疾患の確率を生成するために新たな画像学習に疾患検出モデルを適用することを含む。
いくつかの実施形態はまた、1つまたは複数の電子プロセッサによって実行された場合に、機能のセットを実行する命令を記憶する非一時的コンピュータ可読媒体を提供する。機能のセットは、画像学習と、画像学習について生成された読影レポートからマイニングされた関連付けられた疾患ラベルとを使用して疾患検出モデルを訓練することを含む。疾患ラベルは画像学習に関連付けられた患者が疾患と診断されたか否かのバイナリ・ラベルを含み、画像学習は3次元画像ボリュームの複数の2次元スライスのシーケンスを含む。疾患検出モデルは畳み込みニューラル・ネットワーク層および畳み込み長短期記憶層を含む。疾患検出モデルを訓練することは、畳み込みニューラル・ネットワーク層を使用して複数の2次元スライスのそれぞれから特徴のセットを個別に抽出することと、畳み込み長短期記憶層を使用して複数の2次元スライスのそれぞれについて畳み込みニューラル・ネットワーク層によって抽出された特徴のセットを順次処理することと、疾患の確率を生成するために複数の2次元スライスのうちのそれぞれに関する畳み込み長短期記憶層からの出力を処理することと、確率をラベルと比較することと、比較に基づいて疾患検出モデルを更新することと、を含む。機能のセットはまた、疾患検出モデルが訓練された後に、新たな画像学習の疾患の確率を生成するために新たな画像学習に疾患検出モデルを適用することを含む。
実施形態の他の態様は、詳細な説明および添付の図面を考察することによって明らかになろう。
ここで、本発明を単なる例として、以下の図に示す好ましい実施形態を参照して説明する。
コンピュータ断層撮影(CT)画像上の様々な異常を検出するための深層学習モデルを訓練するために使用されるアノテーションの例を示す図である。 弱くアノテーション付けされたボリューム内の疾患検出のための畳み込み長短期記憶(Conv-LSTM)ネットワークを示す図である。 いくつかの実施形態による、疾患検出のための2次元(2D)畳み込みマルチ・インスタンス学習(MIL)ネットワークを示す図である。 受診者動作特性(ROC:receiver operating characteristic)曲線を使用したテスト・セットでの肺気腫検出に関する図2のConv-LSTMネットワークおよび図3の2D畳み込みMILネットワークのパフォーマンスを示す図である。 様々な訓練セット・サイズを用いた標準線量コンピュータ断層撮影(CT)への転移学習を通じた図2のConv-LSTMネットワークの肺気腫検出パフォーマンスを示す図である。 手動でアノテーション付けされた肺気腫のグラウンド・トゥルースと、図2のConv-LSTMネットワークに付随する視覚的注意マップとの間の空間的整合を示す図である。 いくつかの実施形態による、図2のConv-LSTMネットワークを実装するためのシステムを概略的に示す図である。 いくつかの実施形態による、MILと組み合わせられたConv-LSTMネットワークを示す図である。
以下の説明および添付の図面において、1つまたは複数の実施形態を説明および図示する。これらの実施形態は、本明細書に提供する特定の詳細に限定されず、様々な方法で変更され得る。さらに、本明細書に記載していない他の実施形態が存在し得る。また、1つの構成要素によって実行されるものとして本明細書に記載する機能は、複数の構成要素によって分散された方法で実行され得る。同じように、複数の構成要素によって実行される機能は、単一の構成要素によって統合および実行され得る。同様に、特定の機能を実行するものとして説明する構成要素は、本明細書に記載していない追加の機能も実行し得る。たとえば、特定の方法で「構成される(configured)」デバイスまたは構造は、少なくともその方法で構成されるが、リストしていない方法でも構成され得る。さらに、本明細書に記載のいくつかの実施形態は、非一時的コンピュータ可読媒体に記憶された命令を実行することによって、記載の機能を実行するように構成される1つまたは複数の電子プロセッサを含み得る。同様に、本明細書に記載の実施形態は、記載の機能を実行するために1つまたは複数の電子プロセッサによって実行可能な命令を記憶する非一時的コンピュータ可読媒体として実装され得る。本出願で使用する場合、「非一時的コンピュータ可読媒体(non-transitory computer-readable medium)」は、全てのコンピュータ可読媒体を含むが、一時的な伝搬信号からなるものではない。したがって、非一時的コンピュータ可読媒体には、たとえば、ハード・ディスク、CD-ROM、光学ストレージ・デバイス、磁気ストレージ・デバイス、ROM(読み取り専用メモリ:Read Only Memory)、RAM(ランダム・アクセス・メモリ:Random Access Memory)、レジスタ・メモリ、プロセッサ・キャッシュ、またはこれらの任意の組み合わせが含まれ得る。
また、本書で使用する表現および用語は、説明を目的としたものであり、限定するものと見なされるべきではない。たとえば、本明細書における「含む(including)」、「含む(containing)」、「含む(comprising)」、「有する(having)」、およびそれらの変形の使用は、その後に記載した項目およびその均等物ならびに追加の項目を包含することを意味する。「接続された(connected)」および「結合された(coupled)」という用語は広義に使用しており、直接的および間接的な接続および結合の両方を含む。さらに、「接続された」および「結合された」は、物理的または機械的な接続または結合に限定されず、直接または間接を問わず、電気的な接続または結合を含むことができる。また、電子通信および通知は、有線接続、無線接続、またはそれらの組み合わせを使用して実行され、様々なタイプのネットワーク、通信チャネル、および接続を介して直接的に、あるいは1つまたは複数の中間デバイス経由で伝送され得る。そのうえ、第1および第2、上および下などの関係語は、本明細書において、あるエンティティまたはアクションを他のエンティティまたはアクションから区別するためにのみ使用され、そのようなエンティティまたはアクションの間の実際のそのような関係または順序を必ずしも必要とするまたは示唆するものではない。
上述のように、放射線医学における深層学習ベースの診断は、大規模な手動でアノテーション付けされたイメージング・データセットを必要とする。しかしながら、臨床データの利用性に反して、専門家によるボリューメトリック・イメージングのアノテーションは非常に面倒である。具体的には、画像ボリューム上に手動で境界線を描くことは、放射線科医が深層モデルの訓練に必要な量を実行するには時間がかかりすぎることが多い。たとえば、図1は、コンピュータ断層撮影(CT)画像上の様々な異常を検出するための深層学習モデルを訓練するために使用されるアノテーションの例を示している。したがって、胸部CTなどの多くの場合、スキャンは頻繁に実行され、容易に利用可能であり得るが、関連する読影レポートの内容以外のラベル付けを含まない場合がある。そのため、これにより、モデルを訓練するときに大規模な臨床イメージング・データのセットを使用することに対して相当な障害がもたらされる。
肺気腫は、上述の通り、肺の中の肺胞の破裂によって引き起こされる呼吸器疾患であり、息切れおよび癌リスクを伴うとされている。肺気腫は、患者の肺のCT画像を通じて診断されることが多い。しかしながら、CT画像上での肺気腫の表示および位置は様々であるので(肺容積の一部分にしか現れない場合もある)、ラベルなしデータから肺気腫を検出するように深層モデルを訓練する上での課題となっている。たとえば、主に肺の外側の状態を評価するために患者が標準線量CTスキャンを受けた場合、肺気腫は、肺CT上で減衰の少ない領域に見えるのだが、偶発的な診断として見逃されることがある。
これらの課題に対処するために、一部の検出システムは、肺気腫および他の肺疾患を識別するために手作りの特徴または深層学習を用いたマルチ・インスタンス学習(MIL)アプローチを使用する。これらのMILアプローチは、精密でない大域的なラベルを有する訓練データを活用するために、弱いラベルを用いた教師あり学習戦略を使用する。MILアプローチでは、個々のラベルは不明であるが、ラベル付きの「バッグ」へとグループ化することができるサンプルのセットに分類器が適用される。次いで、バッグ全体に対するラベルおよび予測結果に基づいて、モデルの訓練および推論が実行される。たとえば、臨床的に陽性のCTボリュームは、各2Dスライスがサンプルを形成する陽性のバッグと見なすことができる。個々のスライス上の肺気腫の存在は不明であるが、患者が疾患陽性である場合は、バッグ内の1つまたは複数のスライスに肺気腫が存在するはずである。
MILは、モデルを訓練し、弱くアノテーション付けされた(weakly annotated)多数のサンプルにわたってその予測結果を要約するのに有効であり得るが、いくつかの不利な点もある。まず、MILはバッグ内のサンプル間の空間的なコンテキストを考慮していない。全てが肺気腫に見える一連の連続したスライスと比較して、ボリュームの至る所で孤立した陽性サンプルは、ノイズによる偽陽性を示す可能性がより高いが、この近さの意味が、MILの構成で考慮されている。第2に、MILは、サンプルレベルの予測結果をバッグに関する単一の予測結果へと要約するプーリング演算を必要とする。この要約は単純(ナイーブ)な方法(たとえば、サンプルの予測結果の平均または最大値)を使用して実行され、これは柔軟性がなく、MILモデルが疾患を検出するかまたは見逃すという単純な事例に影響を及ぼし、これは基礎となる分類器が強力であるか否かによらない。
したがって、本明細書に記載の実施形態は、画像ボリューム内の疾患/異常を検出するように、弱いが容易に入手可能なラベル付きの訓練データから効率的に学習するための深層学習フレームワークを提供する。具体的には、一実施形態は、畳み込み長短期記憶実装形態(LSTM)(Conv-LSTM)を含む。長短期記憶(LSTM)などのリカレント・ニューラル・ネットワーク・アプローチは、相関のあるサンプル間のパターンを解釈して要約することが可能であり、Conv-LSTMは、畳み込み演算を使用して空間パターンの変動を識別するLSTMの変形である。たとえば、Conv-LSTMは時空間パターンの検出に秀でている。Conv-LSTMを時系列の画像データに適用するのではなく、本明細書に記載の実施形態は、イメージング・ボリュームの一連の連続したスライスをスキャンするためにConv-LSTMを適用することによって、疾患のパターンを、その位置の手動のアノテーションなしで学習する。このアプローチにより、スライス上およびスライス間の疾患を検出し、ボリュームを通る複数の双方向のパスを通じてそのような検出結果を記憶し、全体的な疾患の存在を特徴付ける最終的な特徴のセットとして出力することが可能になる。このように、本明細書に記載の実施形態は、スライス間の空間的関係を考慮し、簡易的(reductive)であり得るプーリング・アプローチを必要とせずに、結果(findings)を簡潔に要約することによって、他のアプローチを上回る。開示した実験データを通じて以下に説明するように、Conv-LSTMアプローチは、疾患検出のための効果的かつ汎用的な解決策を提供し、弱くラベル付けされた画像ボリュームを訓練およびチューニングに効率的に利用することができる。
したがって、Conv-LSTM実装形態は、畳み込みConv-LSTMを使用して、専門家によるアノテーションなしで、イメージング・ボリュームを疾患に関して「スキャン」する。このアプローチにより、簡易的であり得るバッグ・プーリング演算なしで、2次元(2D)スライス上および2Dスライス間の疾患パターンを検出することが可能になる。具体的には、2D畳み込みMIL実装形態と同様に、この実装形態は、個々のスライス内のパターンを認識するための畳み込み演算を含む。しかしながら、この実装形態はまた、ネットワーク全体に複数の畳み込みLSTMユニットを含み、これらはボリュームのスライスをシーケンスと見なす。前の畳み込み層によって各スライスから個別に抽出された特徴は、1つずつ、ボリュームの中を第1の方向(たとえば、頭の先からつま先への順方向)に進む畳み込みLSTMに入力され、続いて、第2の反対の方向(たとえば、つま先から頭の先への逆方向)に進む畳み込みLSTMに入力され、その後にもう1セットの順方向-逆方向の畳み込みLSTM処理が続く。畳み込みLSTMは、前のスライスからの疾患に関連する画像パターンを「記憶(remember)」することに加え、疾患を示すスライス間の変化を識別する機能を有する。シーケンス内のアイテムごとに、畳み込みLSTMは、画像内および自身の内部メモリ内のパターンに基づいて特徴のセットを出力する。最後の畳み込みLSTMユニットでは、分析された最後のスライスに対応する特徴のセットがDense層に接続され、Dense層は、イメージング・ボリュームの複数回のスキャンにわたって蓄積された情報に基づいて疾患(肺気腫)の確率を出力する。
たとえば、図2は、一実施形態による、弱くアノテーション付けされた画像ボリューム内の疾患検出のためのConv-LSTMネットワーク100を示している。図2に示すように、ネットワーク100は4つのユニット102を含む。詳細には、図2には、1つの双方向のユニットのペア(計2つのユニット)を図示しており、ネットワーク100はそのようなペアを2つ含む。各ユニット102は2つの2D畳み込み層104を特徴とし、これらは3Dボリュームの各2Dスライスから個別に特徴を抽出する。2D畳み込み層104の各ペアの後に、最大値プーリング106およびConv-LSTM層108が続く。Conv-LSTM層108は、ボリュームをスライスごとに処理する。各2D畳み込み層104は、3×3のカーネル・サイズおよび正規化線形ユニット(ReLU:rectified linear unit)活性化を有し、続いてバッチ正規化が行われる。次いで、各スライスの畳み込み層からの出力はConv-LSTM層108によって順次処理され、Conv-LSTM層108は、いくつかの実施形態では、3×3のカーネル・サイズを使用するtanh活性化およびハード・シグモイド・リカレント活性化を有する。
ユニット102内の各層は、同数のフィルタを共有し、ボリュームを昇順または降順で処理する。たとえば、いくつかの実施形態では、4つのユニット102は、以下の次元および方向を有し、すなわち、第1のユニット102は32個のフィルタを画像ボリュームに昇順で適用し、第2のユニット102は32個のフィルタを画像ボリュームに降順で適用し、第3のユニット102は64個のフィルタを画像ボリュームに昇順で適用し、第4のユニット102は64個のフィルタを画像ボリュームに降順で適用する。ネットワーク100内の最後のConv-LSTM層108は単一の特徴のセットを出力し、これは、ネットワークがイメージング・ボリュームを複数回処理した後に得た結果を表す。次いで、シグモイド活性化を用いた全結合層(シグモイド活性化型Dense層110)は、肺気腫の確率などの疾患確率を算出する。いくつかの実施形態では、ガイド付きバックプロパゲーション(guided back-propagation)による視覚的注意(visual attention)を用いて、肺気腫の診断を示す領域が事後解析のためにさらに識別された。
当技術分野で知られているように、LSTMフレームワークは、様々な時間ステップで入力を処理し、短期記憶を表す隠れ状態と、長期記憶を表すセル・トラックとを含む。各時間ステップにおいて、LSTMは3つの動作を実行する。第1に、LSTMは、長期記憶から情報を消去する忘却動作を実行する。第2に、LSTMは、新たな情報を長期記憶に記憶する記憶動作を実行し、第3に、入力、隠れ状態(短期記憶)、および長期記憶を出力および新たな隠れ状態へと合成する更新および出力動作を実行する。Conv-LSTMは、LSTM動作を畳み込み型にすることにより、順次的な画像データで動作するようにLSTMを拡張する。
上記のように、Conv-LSTM実装形態のパフォーマンスを評価するために実験を行った。実験の一環として、Conv-LSTM実装形態のパフォーマンスを、2D畳み込みMIL構成および3次元(3D)畳み込みニューラル・ネットワーク(CNN)と比較した。図3は、いくつかの実施形態による2D畳み込みMILネットワークまたは構成200を示している。この構成200では、イメージング・ボリュームの各2Dスライスは個々に同一のネットワークを通過し、同一のネットワークは2D畳み込み演算を実行し、これには正規化が挿入されており(たとえば、バッチ正規化(「BN:batch normalization」)が各スライスに適用される)、また、モデルの次元を削減して訓練を容易にするプーリング演算を実行する。畳み込みネットワーク200は、ボリュームのスライスごとに、多数のネストされた畳み込み演算202から一連の画像特徴を出力する。次いで、Dense層204は、これらの特徴を、疾患(たとえば、肺気腫)が所与のスライスに存在する0~1の確率へと要約する。このネットワーク200を用いてボリューム全体を処理することにより、N個の疾患確率が生成され、ここで、Nはイメージング・ボリューム内のスライス数である。最後の層では、MIL要約関数は、スライス・レベルの確率をボリューム全体での単一の疾患確率へと要約する。
したがって、このネットワーク200では、画像ボリュームの各スライスは、MIL方式におけるバッグからのサンプルであり、純粋な畳み込み2Dネットワークによって処理される。ボリューム全体の確率を算出する手段として、いくつかの異なるアルゴリズム的なアプローチを使用することができ、たとえば、最大の個別スライス確率、陽性の診断結果を重視した(weighted toward)スライス確率の積、スライス全体の平均確率などがある。たとえば、いくつかの実施形態では、全体の確率Pは、個別の肺気腫確率pを有するN個のインスタンスから、以下の式の1つを使用して計算される。
平均プーリング:
Figure 2022553906000002
最大値プーリング:
P=max(p
積プーリング(Product Pooling):
Figure 2022553906000003
図示していないが、3D CNNは2D畳み込みMILネットワーク200の構造に類似した構造を有するが、単一のDense層を有し、最後の畳み込み層へのプーリング演算を有さない。
この実験では、全米肺検診試験(NLST:National Lunch Screen Trial)に登録された11,095人の重複しない参加者からの合計55,673個の非造影かつ低線量のCTボリュームを使用した。3年間の調査にわたって肺気腫と診断された5,056人の参加者が陽性サンプルとして含まれ、肺気腫と診断されなかった6,039人の参加者が陰性サンプルとして含まれていた。肺気腫陽性患者および陰性患者の分布のバランスが取れた、患者の80%をモデル訓練に使用した。モデル・パラメータを直接学習するために7,100人の患者からの39,387個のボリュームを使用し、ハイパー・パラメータを調整するために1,776人の患者からの9,755個のボリュームを使用した。残りの2,219人の患者(578人の肺気腫陽性者、1585人の肺気腫陰性者)は、各々が年1回のスキャンを3回受けて、合計6,511個のボリュームがあり、独立したテストのためにホールド・アウトした。ボリュームを9ミリメートルの平均スライス間隔に相当する128×128×35にサイズ変更した。
この実験では、Conv-LSTMのパフォーマンスを、弱くアノテーション付けされた画像ボリュームに適した従来の学習方式と比較することを試みた。全てのモデルを訓練するのに必要な時間およびリソースを削減するために、6,648人の重複しない患者からの8,794個の低線量CTボリュームからなる削減したパイロット・コホートをこの比較に利用した。訓練および検証には、それぞれ(3,166人の患者からの)4,197個のボリュームおよび(1,319人の患者からの)2,434個のボリュームを使用した。テストには、2,163人の患者(578人の肺気腫陽性者、1585人の肺気腫陰性者)からの2,163個のボリュームを使用した。各モデルを1e-3の学習率で50エポックで訓練した。
Conv-LSTM実装形態は、弱くしかアノテーション付けされていないイメージング・ボリュームで訓練された場合に、肺気腫を強力に識別し、0.83の受診者動作特性曲線下面積(AUC:an area under the receiver operating characteristic curve)を達成した。図4に示すように、この実装形態は全てのMIL構成および3D CNNを、これらのアーキテクチャよりもパラメータがそれぞれ110,000個および57,000個少なかったにも関わらず上回っていた(以下の表1参照)。
Figure 2022553906000004
他の手法と比較して肺気腫の検出において優れたパフォーマンスを実証したので、完全なNLSTコホートを使用して合計300エポックでConv-LSTM実装形態を再訓練した。各エポックは、約40,000個の訓練ボリュームのプールからランダムに選択した、バッチ・サイズ20の200ステップで構成した。訓練中に、x、y、およびz軸に沿ったランダムな反転を適用してデータをさらに増やし、過剰適合を防ぐために、最後のDense層のニューロン(neutron)に50%のドロップアウトを適用した。バイナリ・クロス・エントロピー損失およびADAMオプティマイザを使用して、初期学習率1e-4で、モデルを訓練した。連続した20エポックの後に検証損失が減少しなくなった場合、学習率を半分に減らした。2つのTesla P100 GPUを使用してモデルを訓練し、訓練時間は約27時間かかった。
完全な訓練コホートを使用して訓練した場合、Conv-LSTMのパフォーマンスはテスト・セット(n=6,511)でAUC=0.909まで向上した。検証コホート内で特定されたYoudenインデックスに対応する最適なカットオフでは、テストの感度は80.9%であり、特異度は86.3%であった(F1=0.836)。
合計3,361人のNLSTの患者は、患者が追跡された3年間に肺気腫の診断結果が変化していたので、前述の実験ではモデルの訓練および評価から除外した。これらのうち、926人の患者は1年目に肺気腫の陽性診断を受けたが、2年目または3年目(両方ではない)に陰性診断を受けた。肺気腫が慢性疾患であることを考えると、これらの評価結果は診断の見落としを表している可能性が高いので、偽陰性を削減するモデルの能力を評価する機会を与える。たとえば、モデルを動作点で適用することによって、放射線科医が見落とした高難易度のケースの間でのパフォーマンスを評価することができる。
臨床的偽陰性候補の間での感度は70.6%であり、テスト・セットで同じカットオフで観察された値(80.9%)に近かった。このように、Conv-LSTMモデルは、最高難易度の肺気腫の診断結果からなるコホートにおいて優れたパフォーマンスを維持した。肺気腫の存在の平均予測確率は0.63±0.370であったのに対し、テスト・コホートの肺気腫陽性患者および陰性患者では0.754±0.328および0.171±0.229であった。
肺組織研究コンソーシアム(LTRC:Lung Tissue Research Consortium)から、1,405人の患者について、仰臥位で呼気中に撮影された標準線量CTスキャンを入手した。訓練コホートおよび検証コホートは、それぞれ800人および200人の患者であった。405人の患者からのスキャンでモデルをテストした。肺気腫の境界線の手動のアノテーションもこのコホート内の一部の患者に関して利用可能であったが、訓練中には使用しなかった。代わりに、手動のアノテーションを、Conv-LSTMネットワークからの視覚的顕著性(saliency)マップとの比較に使用した。
また、Conv-LSTMモデルを使用して、標準線量CTの限られたコホートでの転移学習を通じて、新たな施設の未知のイメージング・データ向けのファイン・チューニングを容易に実行することができる。転移学習とは一般に、データセットまたはタスクで訓練されたモデルから開始し、訓練されたモデルに少しの調整を行って、第2のタイプのデータまたはタスクの間でモデルのパフォーマンスを最適化することを指す(典型的には、モデルの最初の訓練に使用したよりもはるかに小さいデータ・プールを利用する)。転移学習により、モデルが既存の訓練済みモデルから出発するので、より少量の訓練データを使用して、未知のデータで優れた結果を達成するモデルを開発することが可能になり得る。低線量CT(たとえば、NLSTのもの)が、肺癌(lunch cancer)検診のアプローチとして通常使用される。一方、標準線量CTは、複数の器官部位を含む、より多岐に渡る理由で指示され得る。これらの検査の主な目的は肺の評価でない場合があるので、自動化された肺気腫検出は、放射線科医が注視していない領域で疾患を偶発的に検出する大きな可能性がある。しかしながら、本明細書に記載のConv-LSTMモデルは、未経験の撮影プロトコル(標準線量CT)を用いたアノテーションなしのボリュームの限られたコホートから再訓練することができる。したがって、これらのモデルは、利用可能な臨床イメージングおよび診断情報の限られたデータセットでのシンプルな転移学習によって、施設間など、深層モデルを配備するときにこれまで遭遇したことのない変動の原因を考慮するための発展可能なメカニズムを提示する。このように、これらのモデルは、放射線科医の診断結果をチェックし、肺気腫などの疾患検出の見落としを検出するための正確で柔軟性のあるシステムとして機能し得る。
たとえば、図5は、様々なサイズの標準線量CT訓練コホートを使用した転移学習のパフォーマンスを示している。モデル(mode)を転移学習なしで標準線量CTに直接適用した場合、検証AUCは0.836であった。800人の訓練用患者全員を使用すると、最良の結果が得られた(検証AUCは0.916であった)が、わずか500人の患者で、0.90以上のAUCの優れたパフォーマンスを同様に出すことができた。
n=800でチューニングし、テスト・コホート(n=405)に適用した場合、AUCは0.945に向上した。検証で特定された動作点は84.4%の感度に対応し、特異度はテストで92.7%であった(F1=0.886)。視覚的注意マップの例は、手動の肺気腫のアノテーションとの優れた一致を示しており(図6参照)、診断の位置の特定を支援するために使用され得る。
したがって、上述のように、医用イメージングにおける深層学習アプリケーションへの課題は、モデル訓練用の大規模なアノテーション付き医用イメージング・データセットが必要なことである。本明細書に記載の方法およびシステムなど、弱くて容易に手に入るラベルを有するデータから効率的に学習することが可能な深層学習方式では、この制限が回避される。たとえば、本明細書に記載の方法およびシステムを使用すると、訓練に関してバイナリ診断ラベルにしか依存しない深層コンピュータ支援診断(CAD:computer-aided diagnosis)プラットフォームを、大規模な臨床イメージング・データセットを使用して迅速に開発し、利用可能なデータから新たな臨床コンテキストに容易に適合させることができる(たとえば、新たな施設または撮影プロトコルへのファイン・チューニング)。
具体的には、本明細書に記載の実施形態は、弱くしかアノテーション付けされていない画像ボリュームから疾患の識別特性を学習することが可能な畳み込みリカレント・フレームワークを提供する。MILなどの弱教師あり学習問題に対する従来のアプローチは、空間的に分散した画像サンプルの「バッグ」で動作するものであるが、サンプル間の空間的関係を考慮しておらず、制限的であり得るバッグ・プーリング演算によって阻害され得る。本明細書に記載の畳み込み長短期記憶(Conv-LSTM)実装形態は、スキャンされた領域の一部分における疾患の有無に関してボリュームを順次処理し、ボリューム全体での疾患の存在を特徴付ける単一の特徴セットを更新することにより、これらの欠点に対処する。上述のように、このアプローチを使用することにより、特に3D CNNおよび様々な構成のMIL(2D CNNと組み合わせた弱教師あり学習戦略)と比較して、肺気腫を検出するための強力なツールが提供される。具体的には、本明細書に記載の実装形態は、いくつかの実施形態では、イメージング・データの時間のかかるアノテーションも手動処理も必要とせず、これにより、弱くラベル付けされた画像ボリュームの広範な臨床データセットを使用することが可能になる。また、いくつかの実施形態では、図6に示すように、提案したネットワーク実装形態の視覚的注意マップは、モデル訓練中に手動のアノテーションを使用しなかったにも関わらず、肺気腫の存在箇所の輪郭が放射線科医によって手動で描かれた少数の標準線量CTスキャンについて、グラウンド・トゥルースと大いに重なった。たとえば、図6は、手動でアノテーション付けされた肺気腫のグラウンド・トゥルース(左、赤)と、本明細書に記載のConv-LSTMモデルによって生成された視覚的注意マップ(右)との間の空間的整合を示している。このように、これらのモデルは、ボリュームレベルのバイナリ訓練ラベルのみから訓練された場合でも、いくつかの異なる肺気腫の表示にわたって疾患パターンの位置を特定することができる。
本明細書に記載の機能は、1つまたは複数のサーバなどの1つまたは複数のコンピューティング・デバイスを介して実行できることを理解されたい。たとえば、図7は、いくつかの実施形態による、本明細書に記載のConv-LSTM実装形態を使用して弱くラベル付けされたボリューメトリック・イメージングから疾患検出モデルを訓練するためのシステム700を示している。図7に示すように、システム700は、サーバ705、画像リポジトリ715、およびレポート・リポジトリ718を含む。サーバ705、画像リポジトリ715、およびレポート・リポジトリ718は、1つまたは複数の有線または無線通信ネットワーク720を介して通信する。無線通信ネットワーク720の各部分は、インターネットなどのワイド・エリア・ネットワーク、Bluetooth(R)ネットワークまたはWi?Fi(R)などのローカル・エリア・ネットワーク、およびそれらの組み合わせまたは派生物を使用して実装され得る。システム700はより多いまたはより少ないサーバを含み得、図7に示す単一のサーバ705は純粋に例示目的のものであることは理解されたい。たとえば、いくつかの実施形態では、本明細書に記載の機能は、分散環境またはクラウド・コンピューティング環境において複数のサーバを介して実行される。また、いくつかの実施形態では、サーバ705は、複数の画像リポジトリまたは複数のレポート・リポジトリと通信し得る。さらに、いくつかの実施形態では、画像リポジトリはレポート・リポジトリと組み合わせられ、いくつかの実施形態では、これらのリポジトリのうちの1つまたは複数は、サーバ705と組み合わせられ得る。また、いくつかの実施形態では、システム700に示す構成要素は、1つまたは複数の中間デバイス(図示せず)を介して通信し得る。
いくつかの実施形態では、3次元画像ボリュームが画像リポジトリ715に記憶される。画像リポジトリ715は、たとえば、画像保存通信システム(PACS:picture archiving and communication system)、クラウド・ストレージ環境などであり得る。画像リポジトリ715に記憶される3次元画像ボリュームは、X線コンピュータ断層撮影(CT)スキャナ、磁気共鳴イメージング(MRI:magnetic resonance imaging)スキャナなどのイメージング・モダリティ(図示せず)によって生成される。いくつかの実施形態では、画像リポジトリ715はまた、イメージング・モダリティの一部として含まれ得る。上記のように、画像リポジトリに記憶されるイメージング・ボリュームはアノテーション付けされていない。
レポート・リポジトリ718は、画像リポジトリ715に記憶された画像ボリュームなどの画像学習(画像ボリューム)に関する読影レポートを記憶する。たとえば、レポート・リポジトリ718は、放射線科情報システム(RIS:radiology information system)、電子医療記録(EMR:electronic medical record)システム、病院情報システム(HIS:hospital information system)などを含み得る。また、いくつかの実施形態では、レポート・リポジトリ718は、PACSを含み、画像リポジトリと組み合わせられ得る。
図7に示すように、サーバ705は、電子プロセッサ750、メモリ755、および通信インターフェース760を含む。電子プロセッサ725、メモリ730、および通信インターフェース760は、無線で、有線通信チャネルもしくはバスを介して、またはそれらの組み合わせで通信する。サーバ705は、様々な構成において、図7に示した以外の追加の構成要素を含み得る。たとえば、いくつかの実施形態では、サーバ705は、複数の電子プロセッサ、複数のメモリ・モジュール、複数の通信インターフェース、またはそれらの組み合わせを含む。また、サーバ705によって実行されるものとして本明細書で説明した機能は、様々な地理的位置に配置された複数のコンピュータによって分散して実行されることを理解されたい。たとえば、サーバ705によって実行されるものとして本明細書で説明した機能は、クラウド・コンピューティング環境に含まれる複数のコンピュータによって実行され得る。
電子プロセッサ750は、マイクロプロセッサ、特定用途向け集積回路(ASIC:application-specific integrated circuit)などであり得る。電子プロセッサ750は一般に、本明細書に記載の機能を含む機能のセットを実行するためのソフトウェア命令を実行するように構成される。メモリ755は、非一時的コンピュータ可読媒体を含み、電子プロセッサ750によって実行可能な命令を含むデータを記憶する。通信インターフェース760は、たとえば、通信ネットワーク720、および任意選択により、1つまたは複数の追加の通信ネットワークまたは接続を介して通信するための、有線または無線の送受信器またはポートであり得る。
図7に示すように、サーバ705のメモリ755は、検出モデル765および訓練セット775を含む。いくつかの実施形態では、検出モデル765(またはその訓練)によって提供されるものとして本明細書で説明した機能は、様々な構成において、複数の別々のソフトウェア・アプリケーションなどを介して分散および結合されることを理解されたい。検出モデル765は上述のConv-LSTMモデルを含み、これは訓練セット775を介して訓練される。上述のように、訓練セットは、アノテーションなしの画像ボリューム(画像リポジトリ715から取り出しまたはアクセスされる)および関連するバイナリ・ラベル(レポート・リポジトリ718から取り出しまたはアクセスされる)を含む。検出モデル765が訓練データ775を用いて訓練された後、検出モデル765を使用して、上記の例に従って肺気腫などの疾患の予測結果を出力することができる。
いくつかの実施形態では、モデルがデータのプールを用いて訓練された後、モデルは動作するためにそのデータにアクセスする必要はない。たとえば、ネットワークを訓練する処理は基本的に、訓練データからタスクを実行するための演算のセットを学習することを含む。学習した演算のセット(ニューラル・ネットワークの「重み」と呼ばれることが多い)を記憶することにより、訓練データ自体を記憶せずに、タスクを繰り返すことができる。いくつかの実施形態では、ネットワークを使用するための2つの可能な実装形態があり、いくつかの実施形態では、これらの実装形態はいずれも、訓練セットを継続して記憶する必要がない。たとえば、1つの実装形態では、ネットワークは1つのソースによって提供される訓練セットで訓練することができる(1つまたは複数の施設からの訓練データを使用して訓練され得る)。次いで、訓練されたモデルは、同じソースまたは別のソース(たとえば、病院またはクラウド)のサーバで利用可能にすることができる。この実装形態では、患者データがサーバ上に保持される必要はない。
他の実装形態では、施設は独自の弱くラベル付けされたデータを使用して元の重みを最適化することによって、その施設に最適化されたパフォーマンスを実現し得る(上述の転移学習と呼ばれる処理)。この実装形態では、転移学習を実行するために、施設(病院など)によって訓練セットがサーバ上に提供され得る。しかしながら、転移学習を通じて新たな重みが学習された後は、訓練セットが(サーバ上の)メモリに保持される必要はない。
本明細書に記載のシステムおよび方法は、肺気腫さらには肺の疾患または異常に限定されず、専門家によるアノテーションが利用できない場合でも、バイナリ・ラベルが利用可能である(ボリューメトリック・イメージング・データおよび読影レポートの利用性が、手動のアノテーションを提供する放射線科医の許容量を上回る)場合には、様々なタイプのボリューメトリック画像データと共に使用できることも理解されたい。さらに、本明細書に記載の実装形態は、様々なスライス間隔で、さらには任意の数のスライスを有する画像ボリュームで使用することができる(使用される全てのスキャンが必ずしも同数のスライスを有する必要はない)。
また、様々な状況で、Conv-LSTMネットワークの他の実装形態を使用することができる。たとえば、いくつかの実施形態では、Conv-LSTMネットワークをMILと組み合わせることができる。このアプローチは、ネットワークが画像ボリュームをスキャンしたときにスライスごとに生成された予測結果に重み付けする。図8は、このConv-LSTMとMILとの組み合わせのネットワーク800の例を示している。ネットワーク800(ネットワーク100を介して実装されるConv-LSTMアプローチに類似)では、イメージング・ボリュームは、一連の畳み込み演算および畳み込みLSTM演算を通じて処理される。しかしながら、最後の畳み込みLSTMによって分析された最終シーケンスからの出力のみを取得するのではなく、各畳み込みLSTMユニットからの各スライスの出力がMILによって単一の予測結果に統合される。具体的には、同一のDense層を畳み込みLSTMの各順次出力に接続して、N個の疾患可能性の予測結果を提供することができ、2D畳み込みMIL実装形態の場合と同様に、たとえば、スライス確率の平均を計算することによって、ボリューム全体に対して全体的な疾患の確率を算出することができる。いくつかの実施形態では、図3およびMILネットワーク200に関して上述した式のいずれかを使用して、全体の確率を計算することができる。
Conv-LSTM実装形態と比較して、Conv-LSTM MIL実装形態は、検証セットでより優れたパフォーマンスを達成したので、状況によっては、最適な構成を表し得る。具体的には、ホールド・アウトしたテスト・セットでは、Conv-LSTM MIL実装形態は、AUCが0.8751であり、カットオフ1感度(50%感度)が53.32%であり、カットオフ1特異度(50%感度)が96.05%であり、カットオフ2感度(20%感度)が23.80%であり、カットオフ2特異度(20%感度)が99.52%であった。さらに、過去数年間の陽性診断にもかかわらず、肺気腫の診断が見落とされた可能性が高いスキャンのコホート(診断が特に困難であった可能性が高いスキャン)において、Conv-LSTM MIL実装形態は、各カットオフで42.76%および15.98%の感度を達成した。また、Conv-LSTM MILモデルを再訓練し、完全な検証セット(n=9,775)で評価した場合、モデルはAUCが0.8482であり、カットオフ1特異度(50%感度)が96.49%であり、カットオフ2特異度(20%感度)が99.57%であった。
いくつかの実施形態では、各疾患のバイナリ・ラベルが付与された訓練セットの構築の一環として、2つ以上の疾患が検出される(たとえば、複数のラベルを検出する)ことを理解されたい。この実装形態では、検出された各疾患を使用して、上述のように個別のモデルを生成し得る。さらに、いくつかの実施形態では、ネットワークが複数の疾患に関する予測結果のセットを出力するように、上述のネットワークが変更され得る。たとえば、(複数のラベルを使用して)肺気腫、癌、および肺炎を検出するモデルを開発することができる。この実装形態では、モデルはベクトル([p_emphysema,p_cancer,p_pneumonia])を出力することができる。したがって、この実装形態では、これら3つの疾患全てを同時に検出するようにネットワークを訓練することができる。
いくつかの実施形態の様々な特徴および利点を以下の特許請求の範囲に記載する。

Claims (19)

  1. 疾患検出モデルを開発するためのシステムであって、
    1つまたは複数の電子プロセッサ
    を備え、前記1つまたは複数の電子プロセッサは、
    画像スタディと、前記画像スタディについて生成された読影レポートからマイニングされた関連付けられた疾患ラベルとを使用して前記疾患検出モデルを訓練することであって、前記画像スタディは3次元画像ボリュームの複数の2次元スライスのシーケンスを含み、前記疾患検出モデルは畳み込みニューラル・ネットワーク層および畳み込み長短期記憶層を含み、前記疾患検出モデルを訓練することは、
    前記畳み込みニューラル・ネットワーク層を使用して前記複数の2次元スライスのそれぞれから特徴のセットを個別に抽出することと、
    前記畳み込み長短期記憶層を使用して前記複数の2次元スライスのそれぞれについて前記畳み込みニューラル・ネットワーク層によって抽出された前記特徴のセットを順次処理することと、
    前記疾患の確率を生成するために前記複数の2次元スライスのうちの順番が最後のものに関する前記畳み込み長短期記憶層からの出力を処理することと、
    前記確率を前記ラベルと比較することと、
    前記比較に基づいて前記疾患検出モデルを更新することと、
    を含む、前記訓練することと、
    前記疾患検出モデルが訓練された後に、新たな画像スタディの前記疾患の確率を生成するために前記新たな画像スタディに前記疾患検出モデルを適用することと、
    を行うように構成される、システム。
  2. 前記疾患ラベルは、前記画像スタディに関連付けられた患者が前記疾患と診断されたか否かのバイナリ・ラベルを含む、請求項1に記載のシステム。
  3. 前記疾患の前記確率は肺気腫の確率である、請求項1または2に記載のシステム。
  4. 前記複数の2次元スライスは、胸部を含む一連のコンピュータ断層撮影(CT)画像を含む、請求項1から3のいずれか一項に記載のシステム。
  5. 前記3次元画像ボリュームはアノテーションを含まない、請求項1から4のいずれか一項に記載のシステム。
  6. 前記畳み込み長短期記憶層を使用して前記複数の2次元スライスのそれぞれについて前記畳み込みニューラル・ネットワーク層によって抽出された前記特徴のセットを順次処理することは、前記3次元画像ボリュームにわたる空間パターンおよび変動を検出することを含む、請求項1から5のいずれか一項に記載のシステム。
  7. 前記疾患検出モデルは2つの双方向のユニットのペアを含み、各ユニットは前記畳み込み層および前記畳み込み長短期記憶層を含む、請求項1から6のいずれか一項に記載のシステム。
  8. 前記2つの双方向のユニットのペアは、前記複数の2次元スライスの昇順で前記3次元画像ボリュームに32個のフィルタを適用する第1のユニットと、前記複数の2次元スライスの降順で前記3次元画像ボリュームに32個のフィルタを適用する第2のユニットと、前記昇順で前記3次元画像ボリュームに64個のフィルタを適用する第3のユニットと、前記降順で前記3次元画像ボリュームに64個のフィルタを適用する第4のユニットと、を含む、請求項1から7のいずれか一項に記載のシステム。
  9. 前記1つまたは複数のプロセッサは、前記複数の2次元スライスのうちの前記順番が最後のものからシグモイド活性化型Dense層に単一の特徴のセットを出力することによって、前記疾患の確率を生成するために前記複数の2次元スライスのうちの前記順番が最後のものに関する前記畳み込み長短期記憶層からの前記出力を処理するように構成される、請求項1から8のいずれか一項に記載のシステム。
  10. 前記疾患検出モデルは、前記畳み込み長短期記憶層のための最大値プーリング層をさらに含む、請求項1から9のいずれか一項に記載のシステム。
  11. 疾患検出モデルを開発するための方法であって、
    1つまたは複数の電子プロセッサを用いて、画像スタディと、前記画像スタディについて生成された読影レポートからマイニングされた関連付けられた疾患ラベルとを使用して前記疾患検出モデルを訓練することであって、前記画像スタディは3次元画像ボリュームの複数の2次元スライスのシーケンスを含み、前記疾患検出モデルは畳み込みニューラル・ネットワーク層および畳み込み長短期記憶層を含み、前記疾患検出モデルを訓練することは、
    前記畳み込みニューラル・ネットワーク層を使用して前記複数の2次元スライスのそれぞれから特徴のセットを個別に抽出することと、
    前記畳み込み長短期記憶層を使用して前記複数の2次元スライスのそれぞれについて前記畳み込みニューラル・ネットワーク層によって抽出された前記特徴のセットを順次処理することと、
    前記疾患の確率を生成するために前記複数の2次元スライスのうちの順番が最後のものに関する前記畳み込み長短期記憶層からの出力を処理することと、
    前記確率を前記ラベルと比較することと、
    前記比較に基づいて前記疾患検出モデルを更新することと、
    を含む、前記訓練することと、
    前記疾患検出モデルが訓練された後に、新たな画像スタディの前記疾患の確率を生成するために前記新たな画像スタディに前記疾患検出モデルを適用することと、
    を含む、方法。
  12. 前記疾患ラベルは、前記画像スタディに関連付けられた患者が前記疾患と診断されたか否かのバイナリ・ラベルを含む、請求項11に記載の方法。
  13. 前記疾患の前記確率は肺気腫の確率である、請求項11または12に記載の方法。
  14. 前記複数の2次元スライスは、胸部を含む一連のコンピュータ断層撮影(CT)画像を含む、請求項11から13のいずれか一項に記載の方法。
  15. 前記3次元画像ボリュームはアノテーションを含まない、請求項11から14のいずれか一項に記載の方法。
  16. 前記疾患検出モデルは2つの双方向のユニットのペアを含み、各ユニットは前記畳み込み層および前記畳み込み長短期記憶層を含む、請求項11から15のいずれか一項に記載の方法。
  17. 前記疾患の確率を生成するために前記複数の2次元スライスのうちの前記順番が最後のものに関する前記畳み込み長短期記憶層からの前記出力を処理することは、前記複数の2次元スライスのうちの前記順番が最後のものからシグモイド活性化型Dense層に単一の特徴のセットを出力することを含む、請求項11から16のいずれか一項に記載の方法。
  18. 疾患検出モデルを開発するためのコンピュータ・プログラム製品であって、処理回路によって読み取り可能であり、前記処理回路によって実行するための、請求項11から17のいずれか一項に記載の方法を実行するための命令を記憶するコンピュータ可読記憶媒体を備える、コンピュータ・プログラム製品。
  19. コンピュータ可読媒体に記憶され、デジタル・コンピュータの内部メモリにロード可能なコンピュータ・プログラムであって、前記プログラムがコンピュータ上で実行された場合に、請求項11から17のいずれか一項に記載の方法を実行するためのソフトウェア・コード部分を含む、コンピュータ・プログラム。
JP2022520838A 2019-10-11 2020-10-08 疾患検出モデルを開発するためのシステム、方法、プログラム Pending JP2022553906A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/600,009 2019-10-11
US16/600,009 US11195273B2 (en) 2019-10-11 2019-10-11 Disease detection from weakly annotated volumetric medical images using convolutional long short-term memory
PCT/IB2020/059467 WO2021070108A1 (en) 2019-10-11 2020-10-08 Disease detection from weakly annotated volumetric medical images using convolutional long short-term memory

Publications (2)

Publication Number Publication Date
JP2022553906A true JP2022553906A (ja) 2022-12-27
JPWO2021070108A5 JPWO2021070108A5 (ja) 2023-10-03

Family

ID=75383038

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022520838A Pending JP2022553906A (ja) 2019-10-11 2020-10-08 疾患検出モデルを開発するためのシステム、方法、プログラム

Country Status (6)

Country Link
US (1) US11195273B2 (ja)
JP (1) JP2022553906A (ja)
CN (1) CN114503213B (ja)
DE (1) DE112020004049T5 (ja)
GB (1) GB2604503B (ja)
WO (1) WO2021070108A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11638569B2 (en) 2018-06-08 2023-05-02 Rutgers, The State University Of New Jersey Computer vision systems and methods for real-time needle detection, enhancement and localization in ultrasound
WO2020036968A1 (en) 2018-08-13 2020-02-20 Rutgers, The State University Of New Jersey Computer vision systems and methods for real-time localization of needles in ultrasound images
US11217350B2 (en) * 2019-06-27 2022-01-04 Retrace Labs Systems and method for artificial-intelligence-based dental image to text generation
US20210374384A1 (en) * 2020-06-02 2021-12-02 Nvidia Corporation Techniques to process layers of a three-dimensional image using one or more neural networks
EP3923183A1 (en) * 2020-06-11 2021-12-15 Tata Consultancy Services Limited Method and system for video analysis
CN113221277B (zh) * 2021-05-14 2022-12-09 西安交通大学 一种基于数字孪生模型的轴承性能退化评估方法及系统
CN113469229A (zh) * 2021-06-18 2021-10-01 中山大学孙逸仙纪念医院 一种基于深度学习的乳腺癌病灶自动标注方法及装置
CN113723210A (zh) * 2021-08-05 2021-11-30 中冶南方城市建设工程技术有限公司 一种应用于智慧园区给水管泄露边缘设备检测方法和系统
CN113966999A (zh) * 2021-10-28 2022-01-25 中山大学 一种索拉非尼耐药性预测方法、装置及可存储介质
US20230186463A1 (en) * 2021-12-09 2023-06-15 Merative Us L.P. Estimation of b-value in prostate magnetic resonance diffusion weighted images
US20240152747A1 (en) * 2022-11-08 2024-05-09 UnitX, Inc. Three-dimensional spatial-channel deep learning neural network

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9940709B2 (en) * 2013-10-12 2018-04-10 H. Lee Moffitt Cancer Center And Research Institute, Inc. Systems and methods for diagnosing tumors in a subject by performing a quantitative analysis of texture-based features of a tumor object in a radiological image
WO2017151757A1 (en) 2016-03-01 2017-09-08 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Recurrent neural feedback model for automated image annotation
US10354168B2 (en) * 2016-04-11 2019-07-16 A2Ia S.A.S. Systems and methods for recognizing characters in digitized documents
US9767557B1 (en) 2016-06-23 2017-09-19 Siemens Healthcare Gmbh Method and system for vascular disease detection using recurrent neural networks
CN106250707A (zh) 2016-08-12 2016-12-21 王双坤 一种基于深度学习算法处理头部结构像数据的方法
US10417788B2 (en) 2016-09-21 2019-09-17 Realize, Inc. Anomaly detection in volumetric medical images using sequential convolutional and recurrent neural networks
US10304198B2 (en) 2016-09-26 2019-05-28 Siemens Healthcare Gmbh Automatic medical image retrieval
CN107103187B (zh) 2017-04-10 2020-12-29 四川省肿瘤医院 基于深度学习的肺结节检测分级与管理的方法及系统
US20180310870A1 (en) * 2017-05-01 2018-11-01 The Charles Stark Draper Laboratory, Inc. Deep learning architecture for cognitive examination subscore trajectory prediction in alzheimer's disease
CN107392895A (zh) 2017-07-14 2017-11-24 深圳市唯特视科技有限公司 一种基于卷积循环网络的3d血管结构提取方法
US10595727B2 (en) 2018-01-25 2020-03-24 Siemens Healthcare Gmbh Machine learning-based segmentation for cardiac medical imaging
CN108281183A (zh) * 2018-01-30 2018-07-13 重庆大学 基于卷积神经网络和迁移学习的宫颈涂片图像诊断系统
CN108470359A (zh) 2018-02-11 2018-08-31 艾视医疗科技成都有限公司 一种糖尿病性视网膜眼底图像病变检测方法
CN108717869B (zh) * 2018-05-03 2021-08-13 中国石油大学(华东) 基于卷积神经网络的糖尿病视网膜并发症诊断辅助系统
CN109102491B (zh) 2018-06-28 2021-12-28 武汉楚精灵医疗科技有限公司 一种胃镜图像自动采集系统及方法
CN109147937A (zh) 2018-07-31 2019-01-04 中国科学院深圳先进技术研究院 基于图像的康复预测方法及相关产品
KR102135477B1 (ko) 2018-08-31 2020-07-17 엔에이치엔 주식회사 이미지 자동분류 방법 및 시스템
CN109410194B (zh) 2018-10-19 2022-03-29 山东省计算中心(国家超级计算济南中心) 一种基于深度学习的食管癌病理图像处理方法
CN109585020A (zh) * 2018-11-27 2019-04-05 华侨大学 一种运用卷积神经网络对疾病风险预测的模型
CN109635246B (zh) 2018-12-06 2021-07-13 西南交通大学 一种基于深度学习的多属性数据建模方法
CN110188936B (zh) 2019-05-23 2021-11-05 浙江大学 基于多因素空间选择深度学习算法的短时交通流预测方法

Also Published As

Publication number Publication date
WO2021070108A1 (en) 2021-04-15
CN114503213B (zh) 2024-03-08
US20210110532A1 (en) 2021-04-15
CN114503213A (zh) 2022-05-13
DE112020004049T5 (de) 2023-06-01
US11195273B2 (en) 2021-12-07
GB2604503B (en) 2023-12-20
GB2604503A (en) 2022-09-07

Similar Documents

Publication Publication Date Title
JP2022553906A (ja) 疾患検出モデルを開発するためのシステム、方法、プログラム
US10347010B2 (en) Anomaly detection in volumetric images using sequential convolutional and recurrent neural networks
Bello et al. Deep-learning cardiac motion analysis for human survival prediction
Goncharov et al. CT-Based COVID-19 triage: Deep multitask learning improves joint identification and severity quantification
Ghesu et al. Contrastive self-supervised learning from 100 million medical images with optional supervision
US10853449B1 (en) Report formatting for automated or assisted analysis of medical imaging data and medical diagnosis
Mondal et al. CO-IRv2: Optimized InceptionResNetV2 for COVID-19 detection from chest CT images
US20230237649A1 (en) Systems and Methods for Quantification of Liver Fibrosis with MRI and Deep Learning
US11417424B2 (en) Disease detection from weakly annotated volumetric medical images using convolutional long short-term memory and multiple instance learning
Hadjiiski et al. AAPM task group report 273: recommendations on best practices for AI and machine learning for computer‐aided diagnosis in medical imaging
Juneja et al. An approach for thoracic syndrome classification with convolutional neural networks
Khanna et al. Radiologist-level two novel and robust automated computer-aided prediction models for early detection of COVID-19 infection from chest X-ray images
US20220180514A1 (en) Methods of assessing lung disease in chest x-rays
Khan et al. Lung cancer nodules detection via an adaptive boosting algorithm based on self‐normalized multiview convolutional neural network
Mohammadi et al. Diagnosis/prognosis of covid-19 chest images via machine learning and hypersignal processing: Challenges, opportunities, and applications
Schabdach et al. A likelihood-free approach for characterizing heterogeneous diseases in large-scale studies
Suman et al. Attention based CNN-LSTM network for pulmonary embolism prediction on chest computed tomography pulmonary angiograms
US20220172370A1 (en) Method for detecting white matter lesions based on medical image
KR102507451B1 (ko) 흉부 이미지 판독 방법
Srujana et al. Supply chain based demand analysis of different deep learning methodologies for effective covid-19 detection
Rajaraman et al. Interpreting deep ensemble learning through radiologist annotations for COVID-19 detection in chest radiographs
Malik et al. Stacked deep model‐based classification of the multiclass brain hemorrhages in CT scans
Salama et al. An efficient quantification of COVID‐19 in chest CT images with improved semantic segmentation using U‐Net deep structure
Bala et al. Significance and usage of deep learning in health care systems: diagnosis of lung cancer
Tanaka et al. Superiority of supervised machine learning on reading chest x-rays in intensive care units

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220504

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220518

RD16 Notification of change of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7436

Effective date: 20220425

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20230710

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230925

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230925