JP2023055652A - 学習装置、学習方法、医用データ処理装置および医用データ処理方法 - Google Patents

学習装置、学習方法、医用データ処理装置および医用データ処理方法 Download PDF

Info

Publication number
JP2023055652A
JP2023055652A JP2022150882A JP2022150882A JP2023055652A JP 2023055652 A JP2023055652 A JP 2023055652A JP 2022150882 A JP2022150882 A JP 2022150882A JP 2022150882 A JP2022150882 A JP 2022150882A JP 2023055652 A JP2023055652 A JP 2023055652A
Authority
JP
Japan
Prior art keywords
data
medical data
medical
local
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022150882A
Other languages
English (en)
Inventor
アンタナス・カセナス
Kascenas Antanas
アリソン・オニール
O'neil Alison
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Medical Systems Corp
Original Assignee
Canon Medical Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Medical Systems Corp filed Critical Canon Medical Systems Corp
Publication of JP2023055652A publication Critical patent/JP2023055652A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/759Region-based matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10088Magnetic resonance imaging [MRI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30016Brain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/776Validation; Performance evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Image Analysis (AREA)

Abstract

【課題】健常データを用いて、異常を検知可能に、モデルを学習すること。【解決手段】本実施形態に係る学習装置は、受け取り部と、取得部と、生成部と、トレーニング部とを有する。受け取り部は、医用データを受け取る。取得部は、前記医用データからローカル領域とコンテキスト領域とを取得する。生成部は、前記ローカル領域および/または前記コンテキスト領域を用いて異常医用データを生成する。トレーニング部は、前記医用データと前記生成した異常医用データとを用いて、前記検査対象の異常医用データを特定するためにモデルをトレーニングする。【選択図】図2

Description

本明細書及び図面に開示の実施形態は、学習装置、学習方法、医用データ処理装置および医用データ処理方法に関する。例えば、本明細書に記載の実施形態は、概して、例えば、医用/画像データセットに対して機械学習モデルをトレーニングする及び使用するための、医用/画像データを処理する方法と装置に関する。
様々な撮像モダリティを使って得られる医用画像データを、診断、治療、トレーニングまたはその他の広範な様々な目的のために使用できる。また、医用画像データで例えばニューラルネットワークなどの機械学習モデルをトレーニングし、そのようなトレーニングされた機械学習モデルを広範な様々なタスクまたは目的のために使用することが知られている。
モデルをトレーニングするときに用いられる健常データのセットは、例えば病態を含むデータなどの異常データのセットに比べて、より広範に入手可能であるだろう。このため、病態を含まない医用および画像データから学習した後に、未見画像において腫瘍を検出するように学習できるシステムが必要である。
Jeremy Tan,Benjamin Hou1,Thomas Day,John Simpson,Daniel Rueckert,Bernhard Kainz、Detecting Outliers with Poisson Image Interpolation、MICCAI 2021、arXiv:2107.02622v1、[Online]、2021年7月6日、インターネット<URL:https://arxiv.org/abs/2107.02622> Chun-Liang Li,Kihyuk Sohn,Jinsung Yoon,Tomas Pfister、CutPaste: Self-Supervised Learning for Anomaly Detection and Localization、CVPR 2021、arXiv:2104.04015v1、[Online]、2021年4月8日、インターネット<URL:https://arxiv.org/abs/2104.04015>
本明細書及び図面に開示の実施形態が解決しようとする課題の一つは、健常データを用いて、異常を検知可能に、モデルを学習することにある。ただし、本明細書及び図面に開示の実施形態により解決しようとする課題は上記課題に限られない。後述する実施形態に示す各構成による各効果に対応する課題を他の課題として位置づけることもできる。
本実施形態に係る学習装置は、受け取り部と、取得部と、生成部と、トレーニング部とを有する。受け取り部は、医用データを受け取る。取得部は、前記医用データからローカル領域とコンテキスト領域とを取得する。生成部は、前記ローカル領域および/または前記コンテキスト領域を用いて異常医用データを生成する。トレーニング部は、前記医用データと前記生成した異常医用データとを用いて、前記検査対象の異常医用データを特定するためにモデルをトレーニングする。
図1は、実施形態に従った装置の概略図である。 図2は、実施形態のトレーニングおよびテスト処理のステップを示すフローチャートである。 図3は、人間の脳のMRI画像を示す図であり、当該MRI画像上にローカルおよびコンテキスト領域が重ねられている図である。 図4は、より大きくより複雑な異常を特定するために用いられる階層構造を示すフローチャートである。 図5は、実施形態に従った方法と、ラベル付けを有するセグメンテーション方法と、変分オートエンコーダと、デノイジングオートエンコーダと、の比較性能スコアを示す表である。 図6Aは、異常の検出に適用された3つの方法の性能を比較する人間の脳の一連のMRIデータスキャンである。 図6Bは、異常の検出に適用された3つの方法の性能を比較する人間の脳の一連のMRIデータスキャンである。 図6Cは、異常の検出に適用された3つの方法の性能を比較する人間の脳の一連のMRIデータスキャンである。 図6Dは、異常の検出に適用された3つの方法の性能を比較する人間の脳の一連のMRIデータスキャンである。 図6Eは、異常の検出に適用された3つの方法の性能を比較する人間の脳の一連のMRIデータスキャンである。 図6Fは、異常の検出に適用された3つの方法の性能を比較する人間の脳の一連のMRIデータスキャンである。 図6Gは、異常の検出に適用された3つの方法の性能を比較する人間の脳の一連のMRIデータスキャンである。 図6Hは、異常の検出に適用された3つの方法の性能を比較する人間の脳の一連のMRIデータスキャンである。 図6Iは、異常の検出に適用された3つの方法の性能を比較する人間の脳の一連のMRIデータスキャンである。 図6Jは、異常の検出に適用された3つの方法の性能を比較する人間の脳の一連のMRIデータスキャンである。 図6Kは、異常の検出に適用された3つの方法の性能を比較する人間の脳の一連のMRIデータスキャンである。 図6Lは、異常の検出に適用された3つの方法の性能を比較する人間の脳の一連のMRIデータスキャンである。 図7は、MRIデータの健常スキャンと、異常スキャンと、部分スキャンとを示す図である。 図8は、ローカルパッチ領域が強調された人間の脳のMRIデータのスライスを示す図である。
第1の態様において、異常医用/画像データを特定するためのモデルをトレーニングする装置が提供される。前記装置は、
医用/画像データ(医用データおよび/または画像データ)を受け取ることと、
前記医用/画像データからローカル領域とコンテキスト領域とを取得することと、
前記ローカル領域および/または前記コンテキスト領域を用いて異常医用/画像データ(異常医用データおよび/または異常画像データ)を生成することと、
前記医用/画像データと前記生成した異常医用/画像データを用いて、異常医用/画像データを特定するためにモデルをトレーニングすることと、
を行うように構成される処理回路を備える。
前記ローカル領域はパッチ領域を含んでよい。
異常医用/画像データの特定は、当該医用/画像データにおいて、異常医用/画像データが存在することを検出すること、および/または、例えば病態を表すまたは病態に関連する1つまたは複数の異常(anomaly:アノマリー)が存在することおよび/または位置を決定すること、を含んでよい。
前記処理回路は、個別のコンテキスト領域および/または個別のローカル領域を用いてそれぞれ生成される複数の異常医用/画像データセットを生成し、複数の健常および異常医用/画像データセットを用いて前記モデルをトレーニングするように構成されてよい。
前記医用/画像データは医用/画像データの複数のセットを含み、前記医用/画像データのセットの全てまたは少なくとも大多数は健常な解剖構造を示してよく、および/または、病態を含まないでよく、および/または、健常であってよい。
前記処理回路は、前記ローカル領域の医用/画像データを修正するおよび/または置換することによって、前記異常医用/画像データを生成してよい。
前記医用/画像データは医用/画像データの複数のセットを含んでよく、前記異常医用/画像データの生成は、前記医用/画像データのセットのうちの1つのセットのコンテキスト領域を、前記医用/画像データのセットのうちの他のセットのローカル領域に組み合わせることを含んでよい。
前記異常医用/画像データまたは不一致ペアの生成は、前記または各ローカル領域の医用/画像データを修正することを含んでよい。
前記修正は、空間変換または強度変換を前記または各ローカル領域の医用/画像データに適用することを含んでよい。
前記修正は、回転、サイズ変更、ぼかし、トリミングまたは位置座標の修正のうちの少なくとも1つを含んでよい。前記修正は、間違った位置座標を前記処理へ供給することを含んでよい。
前記修正および/または置換は、医用/画像データセットのまたは更なる医用/画像データセットの異なる領域から異なる医用/画像データを取得することと、前記異なる医用/画像データを前記ローカル領域において使用することと、を含んでよい。
異常医用/画像データの前記生成は、医用/画像データセットから異常医用/画像データを生成することと、前記医用/画像データセットから複数の異常医用/画像データセットを生成するために、前記コンテキスト領域および/または前記ローカル領域に複数の異なるサイズまたは他のスケールを使用することと、を含んでよい。
前記異常医用/画像データは複数の異常画像データセットを含んでよい。前記複数の異常画像データセットのうちの少なくとも一部は、前記複数の異常画像データセットのうちの少なくとも他の一部のコンテキスト領域および/またはローカル領域とは異なるサイズまたは他のスケールのコンテキスト領域および/またはローカル領域を有してよい。
前記コンテキスト領域は前記ローカル領域を少なくとも部分的に囲んでよい。前記コンテキスト領域は前記ローカル領域に連続および/または隣接してよく、および/または前記ローカル領域を囲んでよい。若しくは、前記コンテキスト領域は前記ローカル領域から離れるまたは分離してよい。前記ローカル領域と前記コンテキスト領域のそれぞれは、任意の所望の形状および/またはサイズを有してよい。
前記コンテキスト領域は前記医用/画像データにより表される領域よりも小さくてよい。
前記コンテキスト領域は複数のコンテキスト領域を含んでよい。
前記または各コンテキスト領域は、指定された解剖学的または他の特徴を含む領域、または他のセマンティック領域を含んでよい。
前記処理回路は、ローカル領域が周辺にある若しくは関連するコンテキスト領域と一致するかを判断するように、前記モデルをトレーニングするように構成されてよい。
前記処理回路は、アトラス座標または他のアトラスデータ、ラベル、解剖学的情報、グラウンドトゥルース、および/またはセグメンテーション情報のうちの少なくとも1つを、前記モデルのトレーニングへの追加入力として提供するように構成されてよい。
前記モデルは、少なくとも1つの畳み込みニューラルネットワーク(convolutional neural network:CNN)を含んでよい。
前記モデルのトレーニングは、限られたフィールドのCNNまたは他のモデルで特徴を学習することおよび/または抽出することを含んでよく、前記限られたフィールドは前記ローカル領域に対応する。
前記モデルのトレーニングは、線形または他のニューラルネットワーク層を用いて前記コンテキスト領域のためにローカル表現を取得することと、任意選択で平均化および/またはプーリング処理を前記コンテキスト領域にわたって行うことと、を含んでよい。
前記モデルのトレーニングは、ローカルおよび/またはコンテキスト領域の表現を取得するために膨張畳み込み(dilated convolution)処理を使用することを含んでよい。
前記モデルのトレーニングは、ローカルおよび/またはコンテキスト領域の表現を取得するために注意関数または処理を使用することを含んでよい。標的コンテキスト領域を学習するために、前記注意関数を、例えば残りの全ての画像にわたって集約する(aggregate)代わりに用いてよい。
前記モデルのトレーニングは異常が存在する確率の決定を含んでよく、前記確率の決定は、複数のボクセル、ピクセルまたは他の位置ごとに異常の確率を決定することと、任意選択で近隣または他の近くにあるボクセル、ピクセル、または他の位置における確率を用いて投票(voting)または他の結合(joint)処理を行うことと、を含む。
前記モデルのトレーニングは、アピアランス情報の前記ローカル表現を、ボクセル座標、ピクセル座標または他の空間情報のうちの少なくとも1つに連結させる、若しくは、組み合わせることを含んでよい。
前記モデルのトレーニングは、前記モデルを用いて、異常である可能性がある前記医用/画像データの医用/画像データセットを特定することと、前記特定された異常医用/画像データセットを前記モデルの後続のトレーニングから除外すること、および/または、前記生成された異常医用/画像データとともに前記モデルの後続のトレーニングに含ませることと、を含むインタラクティブなトレーニング処理を含んでよい。
異常画像/医用データの前記特定は、腫瘍、プラーク、閉塞、動脈瘤、虚血領域、狭窄した血管または他の管および/または炎症のうちの少なくとも1つを表す画像/医用データを特定することを含んでよい。
前記医用/画像データは、1D、2D、3D、または4Dデータを含んでよい。
前記医用/画像データは、
a)CT、MRI、蛍光透視法、超音波データ、または他のモダリティを用いて取得される医用撮像データ、
b)ECGデータまたは他の医用測定データ、
c)ボリューメトリックデータまたはスライスデータ、および/または
d)時系列データ
のうちの少なくとも1つを含んでよい。
独立して提供され得る更なる態様において、異常医用/画像データを特定する装置が提供される。前記装置は、
トレーニングされたモデルを医用/画像データセットに適用することであって、前記トレーニングされたモデルは、前記医用/画像データセットの少なくとも1つのローカル領域が前記医用/画像データセットの少なくとも1つのコンテキスト領域にマッチするかを判断するようにトレーニングされ、
前記医用/画像データセットが少なくとも1つの異常領域を含むかを、1つまたは複数のローカル領域と1つまたは複数のコンテキスト領域との前記マッチングに基づいて判断すること、
を行うように構成される処理回路を備える。
前記モデルは、クレームされるまたは本明細書で説明される装置により、および/または、クレームされるまたは本明細書で説明される方法を用いて、トレーニングされたモデルを含んでよい。
前記判断または推論処理は、
前記医用/画像データセットが少なくとも1つの異常領域を含む確率を決定することと、
ピクセル、ボクセル、または他のデータ要素が異常を表す確率を決定することと、
のうちの少なくとも1つを含んでよい。
前記医用/画像データセットの少なくとも1つのローカル領域が前記医用/画像データセットの少なくとも1つのコンテキスト領域にマッチするかの前記判断は、ローカル領域が、コンテキスト領域および/またはローカル領域の複数の異なるサイズまたは他のスケールにおいて、コンテキスト領域とマッチするかを判断することを含んでよい。
独立して提供され得る更なる態様において、異常医用/画像データを特定するためのモデルをトレーニングする方法が提供される。前記方法は、
医用/画像データを受け取ることと、
前記医用/画像データからローカル領域とコンテキスト領域とを取得することと、
前記ローカル領域および/または前記コンテキスト領域を用いて異常医用/画像データを生成することと、
前記医用/画像データと前記生成した異常医用/画像データを用いて、異常医用/画像データを特定するためにモデルをトレーニングすることと、
を備える。
独立して提供され得る更なる態様において、異常医用/画像データを特定する方法が提供される。前記方法は、
トレーニングされたモデルを医用/画像データセットに適用することであって、前記トレーニングされたモデルは、前記医用/画像データセットの少なくとも1つのローカル領域が前記医用/画像データセットの少なくとも1つのコンテキスト領域にマッチするかを判断するようにトレーニングされ、
前記医用/画像データセットが少なくとも1つの異常領域を含むかを、1つまたは複数のローカル領域と1つまたは複数のコンテキスト領域との前記マッチングに基づいて判断すること、
を備える。
独立して提供され得る更なる態様において、画像データ中の異常部位を判別するためのモデルをトレーニングする装置を提供する。前記装置は、
異常部位を含まない健常画像を取得することと、
前記健常画像をローカル領域とコンテキスト領域とに分割することと、
前記ローカル領域と前記コンテキスト領域とに基づいて異常画像を生成することと、
前記健常画像と前記異常画像とを識別するようにモデルをトレーニングすることと、
を行うように構成される処理回路を備える。
前記処理回路は、複数の前記健常画像を取得し、元画像が互いに異なる前記ローカル領域と前記コンテキスト領域とに基づいて前記異常画像を生成する、ように更に構成されてよい。
前記処理回路は、前記ローカル領域を変換し、変換された前記ローカル画像と前記コンテキスト画像とに基づいて前記異常画像を生成する、ように更に構成されてよい。
独立して提供され得る更なる態様において、医用画像処理装置を提供する。前記医用画像処理装置は、
トレーニングのために健常撮像データの母集団を受け取ることと、
画像パッチのためのローカル表現を学習することと、
周辺画像領域のためのコンテキスト表現を学習することと、
例えば異なる画像からパッチを選択して、前記周辺コンテキストと一致しないローカル表現を生成することと、
前記ローカルおよびコンテキスト表現が一致か不一致かを分類するように学習することと、
を行うように構成される処理回路を備える。
テスト時に、分類確率を異常検出スコアとして用いてよい。
前記ローカル表現はCNNを用いて学習されてよい。前記コンテキスト表現はCNNを用いて学習されてよい。前記コンテキスト表現は、前記ローカル表現と同じCNN用いて学習されてよい。
前記コンテキスト表現は、圧縮された表現を作成するために、グローバル平均プーリングを用いて集約されてよい。前記コンテキスト表現を、グローバルプーリングの前に学習された線形層を介して投影してよい。
前記ネットワークを3次元でトレーニングしてよい。前記ネットワークは、前記または初出の標的ボクセルのアトラス座標を入力として与えられてよい。
前記コンテキスト表現は、複数のより小さな(例えばセマンティック)領域に分割されてよい。前記コンテキスト表現は、膨張畳み込みを用いて作成されてよい。前記コンテキスト領域のために注意層を学習してよい。強度変換を、前記ローカル表現に入力される前記画像に適用して、ネガティブ例を生成してよい。回転、ぼかし、トリミング、サイズ変更などの空間変換を、前記ローカル表現の前記画像入力に適用して、ネガティブ例を生成してよい。誤りのアトラス座標を入力として与えて、ネガティブ例を生成してよい。
近隣ピクセルから加重投票を取得して、異常スコアを計算してよい。ラベル付けられていない異常データで2段階処理において前記システムをトレーニングしてよい。第1の段階で検出された異常を、第2の段階から除外してよい。ラベル付けられた異常なデータで前記システムをトレーニングしてよく、不一致ペアは現実の異常に対応してよい。
ある態様または実施形態における特徴を、任意の他の態様または実施形態における特徴に適宜組み合わせてよい。例えば、装置の特徴を方法の特徴として提供してもよいし、逆であってもよい。
ある実施形態は、異常医用/画像データを特定するためのモデルをトレーニングする装置を提供する。前記装置は、
医用/画像データを受け取ることと、
前記医用/画像データからローカル領域とコンテキスト領域とを取得することと、
前記ローカル領域および/または前記コンテキスト領域を用いて異常医用/画像データを生成することと、
前記医用/画像データと前記生成した異常医用/画像データを用いて、異常医用/画像データを特定するためにモデルをトレーニングすることと、
を行うように構成される処理回路を備える。
ある実施形態は、異常医用/画像データを特定する装置を提供する。前記装置は、
トレーニングされたモデルを医用/画像データセットに適用することであって、前記トレーニングされたモデルは、前記医用/画像データセットの少なくとも1つのローカル領域が前記医用/画像データセットの少なくとも1つのコンテキスト領域にマッチするかを判断するようにトレーニングされ、
前記医用/画像データセットが少なくとも1つの異常領域を含むかを、1つまたは複数のローカル領域と1つまたは複数のコンテキスト領域との前記マッチングに基づいて判断すること、
を行うように構成される処理回路を備える。
ある実施形態は、異常医用/画像データを特定するためのモデルをトレーニングする方法を提供する。前記方法は、
医用/画像データを受け取ることと、
前記医用/画像データからローカル領域とコンテキスト領域とを取得することと、
前記ローカル領域および/または前記コンテキスト領域を用いて異常医用/画像データを生成することと、
前記医用/画像データと前記生成した異常医用/画像データを用いて、異常医用/画像データを特定するためにモデルをトレーニングすることと、
を備える。
ある実施形態は、異常医用/画像データを特定する方法を提供する。前記方法は、
トレーニングされたモデルを医用/画像データセットに適用することであって、前記トレーニングされたモデルは、前記医用/画像データセットの少なくとも1つのローカル領域が前記医用/画像データセットの少なくとも1つのコンテキスト領域にマッチするかを判断するようにトレーニングされ、
前記医用/画像データセットが少なくとも1つの異常領域を含むかを、1つまたは複数のローカル領域と1つまたは複数のコンテキスト領域との前記マッチングに基づいて判断すること、
を備える。
実施形態に従ったデータ処理装置10が、図1に概略的に示される。本実施形態において、データ処理装置10は、医用データに含まれる医用撮像データを処理するように構成される。他の実施形態において、データ処理装置10は、任意の他の好適なデータを処理するように構成されてよい。データ処理装置10は、例えば、学習装置および/または医用データ処理装置として機能してもよい。
データ処理装置10は、本例ではパーソナルコンピュータ(PC)またはワークステーションであるコンピューティング装置12を備える。コンピューティング装置12は、ディスプレイスクリーン16または他の表示装置と、コンピュータキーボードやマウスなどの1つまたは複数の入力装置18とに接続される。
コンピューティング装置12は、データ記憶部106から画像データセットを取得するように構成される。画像データセットは、スキャナ108によって取得され、データ記憶部106に記憶されたデータを処理することにより生成される。
スキャナ108は、医用撮像データを生成するように構成され、医用撮像データは、任意の撮像モダリティにおける2次元、3次元、または、4次元のデータを備えてよい。例えば、スキャナ108は、磁気共鳴(magnetic resonance:MRまたはMRI)スキャナ、コンピュータ断層撮影(computed tomography:CT)スキャナ、コーンビームCTスキャナ、X線スキャナ、超音波スキャナ、陽電子放出断層撮影(positron emission tomography:PET)スキャナ、または、単一光子放射コンピュータ断層撮影(single photon emission computed tomography:SPECT)スキャナを備えてよい。医用撮像データは、追加的条件データを備えてよい、または、追加的条件データに関連付けられてよく、当該追加的条件データは例えば非撮像データを含んでよい。
コンピューティング装置12は、データ記憶部106の代わりに、または、データ記憶部106に加えて、1つまたは複数の更なるデータ記憶部(図示せず)から医用画像データまたは他のデータを受け取ってもよい。例えば、コンピューティング装置12は、医用画像保管伝送システム(Picture Archiving and Communication System:PACS)または他の情報システムの一部を形成してもよい1つまたは複数の遠隔のデータ記憶部(図示せず)から医用画像データを受け取ることができる。
すなわち、コンピューティング装置12は、例えば、医用データを受け取る。このとき、コンピューティング装置12は、受け取り部として機能する。医用データは、1乃至4次元のうち任意の次元に対応する医用に関するデータである。医用データは、医用画像データを含む。例えば、医用データが1次元のデータ(1Dデータ)である場合、当該医用データは、ECG(Electrocardiogram)などの被検体に関する各種波形のデータ(医用測定データ)に対応する。また、医用データが2次元のデータ(2Dデータ)である場合、当該医用データは、例えば、被検体の断面画像に対応する。また、医用データが3次元のデータ(3Dデータ)である場合、当該医用データは、例えば、被検体に関する各種ボリュームデータ(ボリューメトリックデータ)に対応する。また、医用データが4次元のデータ(4Dデータ)である場合、当該医用データは、例えば、時系列に沿ったボリュームデータに対応する。
以下、医用データは、画像データを含むように医用/画像データと表したり、説明の便宜上、単に画像データ(医用画像データ)などと称する。医用データは、複数のセット(複数の医用データセットなど)を含む。複数の医用データのセットの全てまたは少なくとも一部は、健常(normal)な解剖構造を示し、および/または、病態を含まず、および/または、健常である。
コンピューティング装置12は、自動的に、または、半自動で医用画像データ(広い概念としては医用データ)を処理するための処理リソースを提供する。コンピューティング装置12は、処理装置14を備える。処理装置14は、1つまたは複数のモデルをトレーニングするように構成されるモデルトレーニング回路100と、トレーニングされた1つまたは複数のモデルを適用して、異常データを特定する、または、例えば、ユーザへの出力または更なるモデルトレーニング処理をモデルトレーニング回路100に与えるための任意の他の望ましい処理結果を得る、ように構成されるデータ処理回路102と、ユーザまたは他の入力を得る、および/または、データ処理の結果を出力する、ように構成されるインターフェイス回路104と、を備える。
本実施形態において、回路100、102、104は、各々、実施形態の方法を実行するために実行可能であるコンピュータが読み出し可能な命令を有するコンピュータプログラムにより、コンピューティング装置12に実装される。しかし、他の実施形態では、種々の回路が、1つまたは複数の特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)またはフィールドプログラマブルゲートアレイ(Field Programmable Gate Array:FPGA)として実装されてよい。
また、コンピューティング装置12は、ハードドライブと、RAM、ROM、データバス、種々のデバイスドライバを含むオペレーティングシステム、および、グラフィックカードを含むハードウェア装置を含んだPCの他のコンポーネントとを有する。その様なコンポーネントは、明瞭化のために、図1には示されない。なお、コンピューティング装置12は、例えば、学習装置および/または医用データ処理装置として機能してもよい。
図1のデータ処理装置10は、図示および/または下に説明する方法を行うように構成される。本実施形態の特徴は、モデルトレーニング回路100が、健常な被検体のみを表すおよび/または通常データのみを含む、または、少数の病態または異常データセットを含む、トレーニングデータに基づいて、例えば可能性はあるが希少な病態から生じる異常を検出するように、モデルをトレーニングできる。なお、処理装置14は、例えば、学習装置および/または医用データ処理装置として機能してもよい。
図2は、図1の実施形態のモデルトレーニング回路100が1つの操作モードにおいて実施するトレーニング処理の概要を示すフローチャートである。本実施形態の装置は、異常画像またはその他のデータを特定するようにモデルをトレーニングし、入力画像またはその他のデータが異常を含むかを予測するために当該モデルを使用するように設けられる。モデルトレーニング回路100は、トレーニング部に対応する。すなわち、トレーニング部は、医用データと後述での説明で生成した異常医用データとを用いて、検査対象の異常医用データを特定するためにモデルをトレーニングする。
フローチャートは、医用画像データの1つのボクセルへの当該技術の応用を示す。他の実施形態では、2次元スライスまたはその他のデータ群が直ちに処理される。本実施形態では、人間の脳のボリューメトリックスキャンの磁気共鳴(MRI)データに当該処理が適用される。医用画像または他のデータは、全てが病態を含まないすなわち健常なデータであってよく、若しくは、病態すなわち異常を表す少量または少数のデータのみを含んでよい。
いくつかの実施形態では、ネットワークが潜在的な空間アトラスを学習できるように、アトラス座標が追加入力として与えられ、画像は当該アトラスに予め位置合わせされてよい。
トレーニング処理は、画像データに含まれるローカル特徴情報とコンテキスト(context)情報との分離から始まる。ローカル特徴情報はパッチレベル情報とも称され得る。コンテキスト情報は画像レベル情報とも称され得る。換言すれば、コンテキスト情報は、画像データ(より一般的には医用データ)において、ローカル情報に対応するローカル領域の周辺の情報、またはローカル領域の周囲の情報に対応する。すなわち、コンテキスト情報は、医用データにおいて、ローカル情報を含まない非ローカル領域(コンテキスト領域)における情報(ローカル領域の背景の情報)に対応する。
ローカル特徴情報について、ローカル画像20またはパッチが、対象とするピクセルに関して医用/画像データから得られる。ローカル画像またはパッチは、対象ピクセルの周囲および/または対象ピクセルを含む所定サイズおよび形状の領域であってよい。ローカル画像またはパッチデータは、対象ピクセルに対してローカルであるローカル特徴を学習するように、畳み込みニューラルネットワーク(convolutional neural network:CNN)を用いて処理される。浅いCNN24aまたは限られた受容野または解像度を有するCNNがローカル画像20に適用され、ローカル特徴情報26aが生じる。
コンテキスト情報について、コンテキスト画像が医用/画像データから得られ、浅いCNN24b受容野が画像22全体に、または、ローカル領域を除く他の選択されたコンテキスト領域に適用される。本実施形態では、コンテキスト領域にわたるコンテキスト情報26bは、ローカル特徴情報26aを線形投影しコンテキスト領域にわたって平均化することにより集約される。すなわち、処理装置14は、医用データからローカル領域とコンテキスト領域とを取得する。医用データからローカル領域とコンテキスト領域とを取得する処理装置14は、取得部に対応する。
ボクセル座標26cは、一致分類器200に入力される前に、コンテキストおよびローカル情報に連結される。
モデルトレーニングは、モデルを用いて異常である可能性がある医用画像データの医用画像データセットを特定し、特定された異常医用画像データセットを後続のモデルトレーニングから除外する、および/または、生成された異常医用/画像データとともに後続のモデルトレーニングに含める、インタラクティブなトレーニング処理を含んでよい。すなわち、医用データは、医用データの複数のセットを含み、トレーニング部は、当該複数のセットから、モデルを用いて異常である可能性がある医用データを特定することと、特定された医用データをモデルの後続のトレーニングから除外すること、および/または、特定された医用データを生成された異常データとともにモデルの後続のトレーニングに含ませることと、を含むトレーニング処理を実行する。
当該トレーニング処理の特徴は、一致分類器が少なくとも一部の異常データセットに、例えば、ローカルパッチまたは領域がその周辺のコンテキスト領域に一致しない少なくとも一部のデータセットに設けられることである。
具体的には、コンテキストとローカルとの一致確率を算出するために、一致ペアと不一致ペアを提示してモデルをトレーニングできる。これらの不一致ペアはネガティブペアと称されることがあり、ネガティブペア生成器28で生成され、異常データを表す。異常データを、ネガティブペア生成器28による修正前には健常であったトレーニングデータセットから、ネガティブペア生成器により異常データを生成してよい。
不一致ペアまたは他の異常データを生成するために、ネガティブペア生成器28は任意の好適な方法を用いてよい。例えば、ネガティブペア生成器28は、コンテキスト以外の情報を使用し、水増しフィギュア(augmented figure)の不一致ローカル特徴を抽出してよい、および/または、ランダムに選択され且つ大幅に水増しされた画像から不一致ローカル特徴を抽出してよい。コンテキスト以外のローカル表現が画像内または画像間のどこかから選択されるシャッフル方法を用いてよい。また、生成部は、ローカル領域の医用データの修正として、空間変換または強度変換をローカル領域の医用データに適用してもよい。例えば、非現実的な画素値の強度に変換する強度変換が、ローカル表現に適用されてもよい。回転、サイズ変更、ぼかし、および/またはトリミングなどのデータ水増し(オーグメンテイション:Augmentation)を用いて異常なローカル表現を合成する空間変換を用いてよい。
処理装置14は、ローカル領域および/またはコンテキスト領域を用いて異常医用データを生成する。異常医用データを生成する処理装置14は、生成部に対応する。具体的には、コンテキスト領域および/またはパッチ領域または他のローカル領域を用いて、異常データを生成してよい。すなわち、生成部は、個別のコンテキスト領域と個別のローカル領域とを用いて複数の異常医用データセットを生成する。このとき、トレーニング部は、複数の異常医用データセットを用いて、検査対象の異常医用データを特定するためにモデルをトレーニングする。
なお、生成部は、ローカル領域の医用データを修正および/または置換することによって、モデルのトレーニングに用いられる異常医用データを生成してもよい。例えば、パッチ領域または他のローカル領域および/またはコンテキスト領域内のデータを修正または置換して、異常データセットを生成してよい。いくつかの実施形態では、回転、サイズ変更、ぼかし、トリミングのうちの少なくとも1つにより、または、パッチ領域または他のローカル領域若しくはコンテキスト領域の位置座標を修正することで実現する。すなわち、生成部は、モデルのトレーニングに用いられる異常医用データの生成において、ローカル領域の医用データを修正する。いくつかの実施形態では、第1の医用/画像データセットのコンテキスト領域を、第2の医用/画像データセットのパッチまたは他のローカル領域に組み合わせることにより、この修正を行う。すなわち、生成部は、モデルのトレーニングに用いられる異常医用データの生成において、医用データのセットのうちの1つのセットのコンテキスト領域を、医用データのセットのうちの他のセットのローカル領域に組み合わせる。
また、上記修正および/または上記置換は、受け取り部により受け取った医用データの異なる領域から、または受け取り部により受け取った更なる医用データの異なる領域から、異なる医用データを取得することと、異なる医用データをローカル領域において使用することと、を含む。すなわち、他の実施形態では、当該修正は、異なる医用/画像データを、医用/画像データセットのまたは更なる医用/画像データセットの異なる領域から取得することと、パッチまたは他のローカル領域において当該異なる医用/画像データを使用すること、を含んでよい。また、異常医用/画像データの生成は、医用/画像データセットから異常医用/画像データを生成することと、当該医用/画像データセットから複数の異常医用/画像データセットを生成するためにコンテキスト領域および/またはパッチまたは他のローカル領域に複数の異なるサイズまたは他のスケールを使用すること、を含んでよい。
他の実施形態では、異常データセットの生成のために、第1の医用/画像データのパッチまたは他のローカル領域を、第2の医用/画像データのパッチまたは他のローカル領域として用いてよい。更に他の実施形態では、空間変換または強度変換を当該または各パッチまたは他のローカル領域の医用/画像データに適用して、異常医用/画像データを生成してよい。
他の実施形態では、不一致ペアまたは他の異常データを生成するために、任意の好適な他の方法を用いてよい。
図2の処理に戻り、一致分類器200はローカル特徴情報26aと、コンテキスト情報26bと、不一致ペアと、を入力として取る。追加して、入力画像のアトラス座標が一致分類器200に供給される。一致分類器200は、コンテキストおよびローカル情報の一致確率を全てのピクセルで出力する。出力された確率は、二値分類ロス202としてモデルのトレーニングに使用される。トレーニング処理を、ピクセル毎に、任意の所望する数の異常データセット、例えば、不一致パッチとコンテキスト領域を有するデータセットを含む、任意の数のトレーニングデータセットで実行できる。
図2の実施形態のトレーニング処理は、入力データセットに適用されると、当該入力データセットが異常データを含むかを、例えば当該データがその周辺領域または他のコンテキスト領域と一致しない領域を含むかに基づいて、例えばピクセル毎に判断することができるトレーニングされた分類器を生成する。
当該トレーニングされたモデルをテスト時に入力データセットへ適用することを、データ処理回路102を用いて実行できる。いくつかの実施形態では、データ処理回路102とモデルトレーニング回路100は同一回路である。
本発明の本実施形態におけるテスト処理では、一致分類器200の出力は出力された不一致の確率204を含み、異常の有無を推論する異常スコア(アノマリスコアとも称される)として用いられる。処理回路は、パッチ領域が周辺にある若しくは関連するコンテキスト領域に一致するかを判断するモデルをトレーニングするように構成される。すなわち、トレーニング部は、ローカル領域が周辺または関連するコンテキスト領域と一致するかを判断するように、モデルをトレーニングする。異常画像/医用データの特定は、医用/画像データが腫瘍、プラーク、閉塞、動脈瘤、虚血領域、狭窄した血管または他の管および/または炎症のうちの少なくとも1つを表すかを特定することを含んでよい。すなわち、本実施形態におけるテスト処理では、医用データセットの少なくとも1つのローカル領域が医用データセットの少なくとも1つのコンテキスト領域にマッチするかを判断するようにトレーニングされたモデルを医用データセットに適用し、医用データセットが少なくとも1つの異常領域を含むかを、1つまたは複数のローカル領域と1つまたは複数のコンテキスト領域とのマッチングに基づいて判断する。
図3は、人間の脳のMRI画像30を示す。潜在的ローカル領域およびコンテキスト領域が図3においてラベル付けられ、実施形態に従ってこれらの2つの領域の関係を示す。コンテキスト領域32はローカル領域34より大きく、ローカル領域34を完全に囲むように示される。他の実施形態では、コンテキスト領域32はローカル領域34と同じサイズで、ローカル領域34に隣接および/または連続してよい。いくつかの実施形態では、コンテキスト領域はローカル領域から離れる又は分離されてよい。本実施形態では当該領域を四角形で示すが、他の実施形態では任意の形状を想定できる。
コンテキスト領域32は、一般的にローカル領域より大きく、少なくとも部分的にローカル領域を囲う。コンテキスト領域32は医用/画像データにより表される領域よりも小さくてもよい。例えば、生成部は、モデルのトレーニングに用いられる異常医用データの生成において、医用データから複数の異常医用データを生成するために、コンテキスト領域および/またはローカル領域に複数の異なるサイズまたは他のスケールを使用する。具体的には、異常医用/画像データは複数の異常画像データセットを含んでよく、当該異常画像データセットの少なくとも一部は、当該異常画像データセットの少なくとも他の一部のコンテキスト領域および/またはローカル/パッチ領域に対して異なるサイズまたは他のスケールのコンテキスト領域32および/またはローカル/パッチ領域を有してよい。
例えばローカル領域34の表現とコンテキスト領域32の表現などの2つの入力を与えられたトレーニングされたモデル、例えば、トレーニングされた分類器または他のネットワークは、ローカル領域とコンテキスト領域とが一致するか否かを判断する二値分類タスクを解決する。
本実施形態では、ローカル表現は、限られた受容野CNNでローカル領域の画像データから学習されたおよび/または抽出されたローカル特徴を含む。コンテキスト表現は、学習された線形ニューラルネットワーク層を用いて投影され、その後コンテキスト領域にわたって(平均プーリング(mean pooling)を用いて)平均化され、例えばボクセル座標(x,y,z)などの空間情報に連結された、例えばローカル表現などのアピアランス情報を含む。他の実施形態では、ローカルおよびコンテキスト領域の任意の他の表現を分類器への入力として用いてよい。
画像データのパッチ領域と関連するコンテキスト領域とを用いる実施形態を説明した。代替となる実施形態または説明した実施形態の変形例では、例えばデータの任意の好適なサブセットなどの任意の好適なローカル領域を、パッチ領域の代わりに用いてよい。ある実施形態では、医用/画像データは、1D,2D,3Dまたは4Dのデータを含んでよい。医用撮像の複数の形態を処理できる。形態はCT、MRI、蛍光透視法、超音波、または他の撮像データモダリティを含むがこれらに限定されない。データは、ECGデータまたは任意の他の医用機器からのデータであってよい。他の実施形態では、データはボリューメトリック、一連の2次元スライス、または時系列であってよい。
図4は、より大きくより複雑な異常を特定するために用いられる処理の階層的構成を示すフローチャートを示す。浅い限られた受容野CNNは、より大きくより複雑な異常を特定するには、限定されすぎていることがある。当該処理の各ステージは、前のステージのCNNにより学習されたローカル情報をダウンスケールし、新しいCNNを適用してオリジナルの解像度に対して拡張された受容野からより複雑なローカル特徴を学習する。図4では、これを4つの連続するステージとして示し、各ステージは分類頭部40a~40dと称され、ローカルおよびパッチ領域のサイズが次の反復のたびに上昇する。他の実施形態では、反復数を多く又は少なくしてよい。コンテキスト情報は、現在のステージにおけるローカル情報を用いて新たに集約される。これにより、各ステージでの推論中のピクセル異常スコアとともにトレーニング中の分類ロスの算出が可能となる。ステージ40a~40dからの結果が、加重平均を使ってオリジナルの解像度へアップスケールされ、42で組み合わされる。
図5は、実施形態の方法と、ラベル付けを有するセグメンテーション方法と、変分オートエンコーダ(variational autoencoder:VAE)と、デノイジングオートエンコーダ(denoising autoencoder:DAE)と、を用いて得られた比較性能スコアを提示する。セグメンテーション方法は教師ありであり、残りの3つは教師なし方法である。
BraTS2021チャレンジ(BraTS 2021 challenge)からの脳腫瘍セグメンテーションデータテストを用いてテストが実施された。連続する4つのMRIデータは、各種機関および各種スキャナにおける患者毎に、ネイティブ(T1)と、造影後T1強調(T1Gd)と、T2強調(T2)と、T2フレアー(Fluid Attenuated Inversion Recovery :FLAIR)ボリュームを含む。腫瘍ピクセルを含まないデータのスライスがトレーニングに使用される。トレーニングに314人、検証に48人の患者がそれぞれ使用された。各方法の性能は、病態の既知の「グラウンドトゥルース」に対して評価された。
図6A~図6Lは一連の処理された人間の脳のMRIデータスキャンであり、異常検出に適用された図5の4つの方法の性能を比較する。図6Aから図6Lそれぞれにおいて、mod1,mod2,mod3,mod4とラベル付けられた4セットの画像が示される。グラウンドトゥルース画像は「GT」と、変分オートエンコーダは「変分AE」と、デノイジングオートエンコーダは「デノイジングAE」と、クレームされた方法は「コンテキスト/ローカルモデル」と、ラベル付けられている。
図6Aは、大きく明るく明白な腫瘍を示す。セグメンテーション精度に差があるが全ての方法で検出された。
図6Bは、単純な形状の、より小さいが明るい腫瘍を示す。全ての方法でよく検出された。
図6Cは、検出が困難な、規格外の形状の淡い腫瘍を示す。DAEおよびクレームされた方法で検出された。
図6Dは、検出が困難な、小さく淡い腫瘍を示す。クレームされた方法で検出された。
図6E、図6F、図6Gは、偽陽性に関する性能を評価するための、異常が存在しないスキャンを示す。デノイジングオートエンコーダと実施形態に従った方法では限られた偽陽性を検出し、変分オートエンコーダは多くの偽陽性を検出した。
図6Hは、異常が存在しないスキャンを示す。ここで、デノイジングオートエンコーダは偽陽性を検出しなかったが、クレームされた方法と変分オートエンコーダは偽陽性を検出した。
図6Iは脳腫瘍ではなく異常な病変を示す。これはクレームされた方法により検出された。
図6Jは、データ処理エラーにより欠けたmod1画像の左側を示す。変分オートエンコーダと実施形態に従った方法はこれを異常として検出したが、デノイジングオートエンコーダは検出しなかった。
図6Kは、異常を有し、おそらく位置合わせエラーにより不一致であるmod2画像を示す。
図6Lは大きな腫瘍と大きな異常な病変を示す。両者ともに変分オートエンコーダと実施形態に従った方法により検出されたが、デノイジングオートエンコーダにより検出されなかった。
図7は、人間の脳のMRIデータ70の健常スライスと、MRIデータ72の異常なスライスと、腫瘍以外の画像が削除されたMRIデータ74のスライスを示す。推論において、最後のスライスを「グラウンドトゥルース」と称する。
図8は、ローカルパッチ領域が強調された人間の脳のMRIデータ80のスライスまたはコンテキスト画像を示す。一致ローカルパッチ82と不一致ローカルパッチ84もまた示される。
いくつかの実施形態に従った教師なし異常検出(unsupervised anomaly detection:UAD)においてモデルをトレーニングする間は、健常画像データのみが使用可能であってよい。実施形態に従った医用撮像におけるUADは、外れ値の多くの可能性があるバリエーションに対する高価なセグメンテーションアノテーションを必要とせずに、モデルトレーニングに健常データのみを用いる異常のローカライジングを提供してよい。
いくつかの実施形態では、モデルのトレーニングは、パッチおよび/またはコンテキスト領域の表現を得るために注意関数または処理を使用することを含んでよい。注意関数を、例えば、標的となるコンテキスト領域を学習するために用いてよい。
医用画像データに関して実施形態を説明したが、任意の好適な医用データおよび/または任意の好適な画像データを処理するために実施形態を使用してよい。
特定の回路が本明細書において説明されているが、代替の実施形態において、これらの回路の内の1つまたは複数の機能を、1つの処理リソースまたは他のコンポーネントによって提供することができ、または、1つの回路によって提供される機能を、2つまたはそれより多くの処理リソースまたは他のコンポーネントを組み合わせることによって提供することができる。1つの回路への言及は、当該回路の機能を提供する複数のコンポーネントを包含し、そのようなコンポーネントがお互いに隔たっているか否かにかかわらない。複数の回路への言及は、それらの回路の機能を提供する1つのコンポーネントを包含する。
実施形態における技術的思想を学習方法で実現する場合、当該学習方法は、検査対象の異常医用/画像データを特定するためのモデルをトレーニングする方法であって、医用データを受け取ることと、医用データからローカル領域とコンテキスト領域とを取得することと、ローカル領域および/またはコンテキスト領域を用いて異常医用/画像データを生成することと、医用データと生成した異常医用データとを用いて、検査対象の異常医用データを特定するためにモデルをトレーニングする。学習方法により実行される各種処理の手順および効果は、実施形態と同様なため、説明は省略する。
実施形態における技術的思想を医用データ処理方法で実現する場合、当該医用データ処理方法は、医用データセットの少なくとも1つのローカル領域が医用データセットの少なくとも1つのコンテキスト領域にマッチするかを判断するようにトレーニングされたモデルを医用データセットに適用し、医用データセットが少なくとも1つの異常領域を含むかを、1つまたは複数のローカル領域と1つまたは複数のコンテキスト領域とのマッチングに基づいて判断する。医用データ処理方法により実行される各種処理の手順および効果は、実施形態と同様なため、説明は省略する。
以上説明した少なくとも一つの実施形態等によれば、健常データを用いて、異常を検知可能に、モデルを学習することができる。
所定の実施形態が説明されているが、これらの実施形態は、例示のためにのみ提示されており、発明の範囲を限定することは意図されない。実際は、本明細書において説明された新規な方法およびシステムは、様々な他の形態で具体化することができる。更に、本明細書において説明された方法およびシステムの形態における様々な省略、置き換え、および、変更が、発明の要旨を逸脱することなくなされてよい。添付の特許請求の範囲の請求項およびそれらに均等な範囲は、発明の範囲にはいるような形態および変更をカバーすると意図される。
いくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更、実施形態同士の組み合わせを行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
10 データ処理装置
12 コンピューティング装置
14 処理装置
16 ディスプレイスクリーン
18 入力装置
100 モデルトレーニング回路
102 データ処理回路
104 インターフェイス回路
106 データ記憶部
108 スキャナ

Claims (20)

  1. 検査対象の異常医用データを特定するためのモデルをトレーニングする学習装置であって、
    医用データを受け取る受け取り部と、
    前記医用データからローカル領域とコンテキスト領域とを取得する取得部と、
    前記ローカル領域および/または前記コンテキスト領域を用いて異常医用データを生成する生成部と、
    前記医用データと前記生成した異常医用データとを用いて、前記検査対象の異常医用データを特定するためにモデルをトレーニングするトレーニング部と、
    を備える学習装置。
  2. 前記生成部は、個別のコンテキスト領域と個別のローカル領域とを用いて複数の異常医用データセットを生成し、
    前記トレーニング部は、前記複数の異常医用データセットを用いて前記モデルをトレーニングする、
    請求項1に記載の学習装置。
  3. 前記医用データは、医用データの複数のセットを含み、
    前記医用データのセットの全てまたは少なくとも一部は、健常な解剖構造を示し、および/または、病態を含まず、および/または、健常である、
    請求項1に記載の学習装置。
  4. 前記生成部は、前記ローカル領域の医用データを修正および/または置換することによって、前記モデルのトレーニングに用いられる前記異常医用データを生成する、
    請求項1に記載の学習装置。
  5. 前記医用データは、医用データの複数のセットを含み、
    前記生成部は、前記モデルのトレーニングに用いられる前記異常医用データの生成において、前記医用データのセットのうちの1つのセットのコンテキスト領域を、前記医用データのセットのうちの他のセットのローカル領域に組み合わせる、
    請求項1に記載の学習装置。
  6. 前記生成部は、前記モデルのトレーニングに用いられる前記異常医用データの生成において、前記ローカル領域の医用データを修正する、
    請求項1に記載の学習装置。
  7. 前記生成部は、ローカル領域の医用データの修正として、空間変換または強度変換を前記ローカル領域の医用データに適用する、
    請求項6に記載の学習装置。
  8. 前記修正は、回転、サイズ変更、ぼかし、トリミングまたは位置座標の修正のうちの少なくとも1つを含む、
    請求項6に記載の学習装置。
  9. 前記修正および/または前記置換は、
    前記受け取り部により受け取った医用データの異なる領域から、または前記受け取り部により受け取った更なる医用データの異なる領域から、異なる医用データを取得することと、
    前記異なる医用データを前記ローカル領域において使用することと、
    を含む、
    請求項4に記載の学習装置。
  10. 前記コンテキスト領域は、前記ローカル領域を少なくとも部分的に囲い、および/または、
    前記コンテキスト領域は、前記医用データにより表される領域よりも小さい、
    請求項1に記載の学習装置。
  11. 前記生成部は、
    前記モデルのトレーニングに用いられる前記異常医用データの生成において、前記医用データから複数の前記異常医用データを生成するために、前記コンテキスト領域および/または前記ローカル領域に複数の異なるサイズまたは他のスケールを使用する、
    請求項1に記載の学習装置。
  12. 前記異常医用データは複数の異常データセットを含み、
    前記複数の異常データセットのうちの少なくとも一部は、前記複数の異常データセットのうちの少なくとも他の一部のコンテキスト領域および/またはローカル領域に対して、異なるサイズまたは他のスケールのコンテキスト領域および/またはローカル領域を有する、
    請求項1に記載の学習装置。
  13. 前記トレーニング部は、ローカル領域が周辺または関連するコンテキスト領域と一致するかを判断するように、前記モデルをトレーニングする、
    請求項1に記載の学習装置。
  14. 前記医用データは、医用データの複数のセットを含み、
    前記トレーニング部は、
    前記複数のセットから、前記モデルを用いて、異常である可能性がある医用データを特定することと、
    前記特定された医用データを前記モデルの後続のトレーニングから除外すること、および/または、前記特定された医用データを前記生成された異常データとともに前記モデルの後続のトレーニングに含ませることと、
    を含むトレーニング処理を実行する、
    請求項1に記載の学習装置。
  15. 異常医用データの特定は、腫瘍、プラーク、閉塞、動脈瘤、虚血領域、狭窄した血管または他の管および/または炎症のうちの少なくとも1つを表す医用データを特定することを含む、
    請求項1に記載の学習装置。
  16. 前記医用データは、1D、2D、3D、または4Dデータを含む、
    請求項1に記載の学習装置。
  17. 前記医用データは、
    CT、MRI、蛍光透視法、超音波データ、または他のモダリティを用いて取得される医用撮像データと、ECGデータまたは他の医用測定データと、ボリューメトリックデータまたはスライスデータと、時系列データとのうちの少なくとも1つを含む、
    請求項16に記載の学習装置。
  18. 医用データセットの少なくとも1つのローカル領域が前記医用データセットの少なくとも1つのコンテキスト領域にマッチするかを判断するようにトレーニングされたモデルを医用データセットに適用し、
    前記医用データセットが少なくとも1つの異常領域を含むかを、1つまたは複数のローカル領域と1つまたは複数のコンテキスト領域とのマッチングに基づいて判断する処理回路を備える医用データ処理装置。
  19. 検査対象の異常医用/画像データを特定するためのモデルをトレーニングする方法であって、
    医用データを受け取ることと、
    前記医用データからローカル領域とコンテキスト領域とを取得することと、
    前記ローカル領域および/または前記コンテキスト領域を用いて異常医用/画像データを生成することと、
    前記医用データと前記生成した異常医用データとを用いて、前記検査対象の異常医用データを特定するためにモデルをトレーニングすることと、
    を備える学習方法。
  20. 医用データセットの少なくとも1つのローカル領域が前記医用データセットの少なくとも1つのコンテキスト領域にマッチするかを判断するようにトレーニングされたモデルを医用データセットに適用し、
    前記医用データセットが少なくとも1つの異常領域を含むかを、1つまたは複数のローカル領域と1つまたは複数のコンテキスト領域とのマッチングに基づいて判断すること、
    を備える医用データ処理方法。
JP2022150882A 2021-10-06 2022-09-22 学習装置、学習方法、医用データ処理装置および医用データ処理方法 Pending JP2023055652A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US202163252757P 2021-10-06 2021-10-06
US63/252,757 2021-10-06
US17/880,725 US20230103692A1 (en) 2021-10-06 2022-08-04 Data processing apparatus and method
US17/880,725 2022-08-04

Publications (1)

Publication Number Publication Date
JP2023055652A true JP2023055652A (ja) 2023-04-18

Family

ID=85775178

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022150882A Pending JP2023055652A (ja) 2021-10-06 2022-09-22 学習装置、学習方法、医用データ処理装置および医用データ処理方法

Country Status (2)

Country Link
US (1) US20230103692A1 (ja)
JP (1) JP2023055652A (ja)

Also Published As

Publication number Publication date
US20230103692A1 (en) 2023-04-06

Similar Documents

Publication Publication Date Title
US10607114B2 (en) Trained generative network for lung segmentation in medical imaging
US11810302B2 (en) Automated organ risk segmentation machine learning methods and systems
CN112885453B (zh) 用于标识后续医学图像中的病理变化的方法和系统
US11227391B2 (en) Image processing apparatus, medical image diagnostic apparatus, and program
CN105765629B (zh) 病变的早期治疗反应评估
US20200184647A1 (en) Progressive and multi-path holistically nested networks for segmentation
Chen et al. Vertebrae identification and localization utilizing fully convolutional networks and a hidden Markov model
JP7325954B2 (ja) 医用画像処理装置、医用画像処理プログラム、学習装置及び学習プログラム
US11941812B2 (en) Diagnosis support apparatus and X-ray CT apparatus
JP2018011958A (ja) 医用画像処理装置及び医用画像処理プログラム
CN112770838A (zh) 使用自关注深度学习进行图像增强的系统和方法
WO2014052687A1 (en) Multi-bone segmentation for 3d computed tomography
EP3705047B1 (en) Artificial intelligence-based material decomposition in medical imaging
Wang et al. Medical image inpainting with edge and structure priors
Maity et al. Automatic lung parenchyma segmentation using a deep convolutional neural network from chest X-rays
JP6747785B2 (ja) 医用画像処理装置及び医用画像処理方法
US20220138936A1 (en) Systems and methods for calcium-free computed tomography angiography
Mangalagiri et al. Toward generating synthetic CT volumes using a 3D-conditional generative adversarial network
Kascenas et al. Anomaly detection via context and local feature matching
Balashova et al. 3D organ shape reconstruction from Topogram images
JP2023055652A (ja) 学習装置、学習方法、医用データ処理装置および医用データ処理方法
CN116420165A (zh) 通过具有和不具有形状先验的分割结果来检测解剖异常
Sarkar Deep Learning in Medical Imaging
Pal et al. Panoptic Segmentation and Labelling of Lumbar Spine Vertebrae using Modified Attention Unet
KR20200041772A (ko) 암 영역 상태 평가 장치 및 방법