JP7096406B2 - 多変量及び多解像度網膜画像異常検出システム - Google Patents

多変量及び多解像度網膜画像異常検出システム Download PDF

Info

Publication number
JP7096406B2
JP7096406B2 JP2021098040A JP2021098040A JP7096406B2 JP 7096406 B2 JP7096406 B2 JP 7096406B2 JP 2021098040 A JP2021098040 A JP 2021098040A JP 2021098040 A JP2021098040 A JP 2021098040A JP 7096406 B2 JP7096406 B2 JP 7096406B2
Authority
JP
Japan
Prior art keywords
image
score
trained
input
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021098040A
Other languages
English (en)
Other versions
JP2021151522A (ja
Inventor
チー・ヤン
ビスラット・ゼリハン
チャールズ・レイズマン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Topcon Corp
Original Assignee
Topcon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Topcon Corp filed Critical Topcon Corp
Publication of JP2021151522A publication Critical patent/JP2021151522A/ja
Application granted granted Critical
Publication of JP7096406B2 publication Critical patent/JP7096406B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/193Preprocessing; Feature extraction
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B3/00Apparatus for testing the eyes; Instruments for examining the eyes
    • A61B3/10Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions
    • A61B3/102Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions for optical coherence tomography [OCT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B3/00Apparatus for testing the eyes; Instruments for examining the eyes
    • A61B3/10Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions
    • A61B3/12Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions for looking at the eye fundus, e.g. ophthalmoscopes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30041Eye; Retina; Ophthalmic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Radiology & Medical Imaging (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Ophthalmology & Optometry (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Surgery (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Eye Examination Apparatus (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Description

(関連出願の相互参照)
本出願は、2018年8月30日に出願された「MULTIVARIATE AND MULTI-RESOLUTION RETINAL IMAGE ANOMALY DETECTION SYSTEM(多変量及び多解像度網膜像異常検出システム)」と題する米国仮特許出願第62/724,864号の優先権を主張し、その全体が参照により本明細書に援用される。
医療診断及び治療の最初のステップは、専門家に照会する前に異常な被検者と正常な被検者を識別し分離すること、並びに、可能性のある疾患タイプ及び治療計画を識別すること、又は専門家による更なる分析のための異常スキャンの必要性を示すことを含む。これらの識別を自動化するための様々なコンピューターベースのシステムが現在存在している。しかし、これらにはそれぞれ欠陥がある。
例えば、機械学習システムにおける様々な二項分類器は、1つの主要な疾患を正常な状態と区別する。しかし、このような分類器は、多くの場合、対象外のクラスの疾患データ、つまり分類器が検出するように訓練された疾患以外の疾患を含む入力、に対して、信頼度の低い応答を与える。更に、幾つかの非主要な疾患データはまれであるため、分類器を訓練するのに十分な量のデータを見つけ出すことは難しい。更にまた、異なる眼疾患は、正常な状態と比べて異なるタイプの構造的及び機能的な変化をもたらす可能性がある。したがって、2以上の眼疾患が1つの眼に共存する可能性がある。そのような場合、非常に大量の疾患訓練データなくして疾患タイプを正確に識別することは困難である。
加えて、異常検出システムは、訓練データ又は参照(基準)としてのみ正常眼データ(正常な眼からのデータ)を使用して異常眼のスクリーニングを行うことができる。すなわち、異常検出システムは、訓練データ又は参照(基準)として使用される正常データと一致しない場合に眼のデータを異常と識別することにより、異常眼のスクリーニングを行うことができる。このプロセスは、眼が正常か異常かを医師が直感的に判断する方法を模倣している。事前スクリーニングステップとして、これらのシステムは、データが異常であるとスクリーニングされた場合にそのデータを調べるように医師に注意を促すことができる(したがって、異常な構造変化を伴う全てのデータは除外される)が、複数の二項分類器を持つシステムは、特に訓練が施された疾患カテゴリに対してのみ機能する。
本明細書の開示の一例によれば、画像処理方法は、対象物の第1の画像を受け付け;訓練された機械学習システムを用いて、前記訓練された機械学習システムへの入力である前記第1の画像の特徴又は前記第1の画像に示された生理学的構造の特徴を抽出し;第1の訓練された分類器を用いて、前記第1の訓練された分類器への入力である前記抽出された特徴に基づいて第1の画像を分類し;前記分類に基づいて、前記第1の画像のラベル及び/又はスコアを決定する。
上記の例の様々な実施形態において、画像処理方法は、更に、前記対象物の第2の画像を受け付け;前記訓練された機械学習システムを用いて、前記訓練された機械学習システムへの入力である前記第2の画像の特徴又は前記第2の画像に示された生理学的構造の特徴を抽出し;第2の訓練された分類器を用いて、前記第2の訓練された分類器への入力である前記第2の画像の前記抽出された特徴に基づいて第2の画像を分類し、;前記分類に基づいて、前記第2の画像のラベル及び/又はスコアを決定する;前記第1の画像及び前記第2の画像は、前記対象物の共通の断面画像からのパッチである;前記第1の訓練された分類器は、前記第1の画像の前記抽出された特徴を含む前記第1の画像の領域に対応する正常画像を用いて訓練され、;前記第2の訓練された分類器は、前記第2の画像の前記抽出された特徴を含む前記第2の画像の領域に対応する正常画像を用いて訓練される;前記第1の画像及び前記第2の画像は、同じデータの少なくとも一部を含む;前記第1の画像及び前記第2の画像は、共通の3Dボリュームから得られたものである;前記第1の画像及び前記第2の画像は、同じデータのいずれも含まない;前記第1の画像と前記第2の画像は、異なるサイズ又は異なる解像度を有する;前記第1の画像及び前記第2の画像は、異なる3Dボリュームから得られたものである:画像処理方法は、更に、前記第1の画像の前記ラベル又は前記スコア及び前記第2の画像の前記ラベル又は前記スコアに基づいて、合成ラベル又は合成スコアを求める;画像処理方法は、更に、;第1の所定個数の画像のスコアを所定の閾値と比較することにより合成ラベルを求め;第2の所定個数の画像に統計演算を施すことにより合成スコアを求め、前記第1の所定個数の画像は、少なくとも前記第1の画像及び前記第2の画像を含み、且つ、前記第2の所定個数の画像は、少なくとも前記第1の画像及び前記第2の画像を含む;前記第1の所定個数の画像における第1の連続画像セットが閾値未満のスコアを有する場合、前記合成ラベルは異常を表し、前記合成スコアは、前記第2の所定個数の画像における第2の連続画像セットの最小スコアである;画像処理方法は、更に、前記第1の画像及び前記第2の画像のスコアの平均を求める;前記第1の画像は、深さ次元を有するBスキャン画像又は断面画像である;前記第1の画像は、光干渉断層画像である;前記ラベルは、前記対象物が正常か異常かを識別し、前記スコアは、前記正常又は前記異常の程度を示し、又は前記異常の種類を示す;前記第1の訓練された分類器は、二項分類器である;前記第1の訓練された分類器は、深層学習モデルである;前記第1の訓練された分類器は、正常データのみによって訓練される;前記第1の訓練された分類器は、1クラスのサポートベクターマシンである;前記訓練された機械学習システムは、畳み込みニューラルネットワークである;前記対象物は、眼科構造物である;及び/又は、前記第1の画像は、複数のパッチのうちの1つであり、前記複数のパッチのそれぞれは、前記対象物の共通の断面画像における別個の空間領域からのものであり、前記第1の訓練された分類器は、前記別個の空間領域の少なくとも2つからの訓練画像パッチを用いて訓練される。
第2の例によれば、画像処理方法は、対象物の第1の画像を受け付け、;前記第1の画像の領域をマスクし;第1の訓練された機械学習システムを使用して、前記第1の画像の前記領域を再構成し;前記第1の画像の前記再構成された領域と受信された前記第1の画像の対応領域との間の類似度を求め;求められた類似度に基づいて、前記第1の画像のラベル及び/又はスコアを求める。
第2の例の様々な実施形態において、画像処理方法は、前記対象物の第2の画像を受け付け、;前記第2の画像の領域をマスクし;第2の訓練された機械学習システムを使用して、前記第2の画像の前記領域を再構成し;前記第2の画像の前記再構成された領域と受信された前記第2の画像の対応領域との間の類似度を求め;求められた類似度に基づいて、前記第2の画像のラベル及び/又はスコアを求める;前記第1の訓練された機械学習システムは、前記第1の画像の前記領域に対応する正常画像を用いて訓練され、前記第2の訓練された機械学習システムは、前記第2の画像の前記領域に対応する正常画像を用いて訓練される;前記第1の画像及び前記第2の画像は、同じデータの少なくとも一部を含む;前記第1の画像及び前記第2の画像は、共通の3Dボリュームから得られたものである;前記第1の画像及び前記第2の画像は、同じデータのいずれも含まない;前記第1の画像と前記第2の画像は、異なるサイズ又は異なる解像度を有する;前記第1の画像及び前記第2の画像は、異なる3Dボリュームから得られたものである:画像処理方法は、更に、前記第1の画像の前記ラベル又は前記スコア及び前記第2の画像の前記ラベル又は前記スコアに基づいて、合成ラベル又は合成スコアを求める;画像処理方法は、更に、;第1の所定個数の画像のスコアを所定の閾値と比較することにより合成ラベルを求め;第2の所定個数の画像に統計演算を施すことにより合成スコアを求め、前記第1の所定個数の画像は、少なくとも前記第1の画像及び前記第2の画像を含み、且つ、前記第2の所定個数の画像は、少なくとも前記第1の画像及び前記第2の画像を含む;前記第1の所定個数の画像における第1の連続画像セットが閾値未満のスコアを有する場合、前記合成ラベルは異常を表し、前記合成スコアは、前記第2の所定個数の画像における第2の連続画像セットの最小スコアである;画像処理方法は、更に、前記第1の画像及び前記第2の画像のスコアの平均を求める;前記第1の画像は、深さ次元を有するBスキャン画像又は断面画像である;前記第1の画像は、光干渉断層画像である;前記ラベルは、前記対象物が正常か異常かを識別し、前記スコアは、前記正常又は前記異常の程度を示し、又は前記異常の種類を示す;前記第1の訓練された機械学習システムは、正常データのみによって訓練される;前記対象物は、眼科構造物である;前記第1の画像の前記領域は、網膜層に相当する;前記第1の訓練された機械学習システムは、深層畳み込み敵対的生成ネットワーク(DCGAN)である;及び/又は、前記類似度は、マルチスケール類似度測定(MS-SSIM)によって求められる。
第3の例によれば、画像処理方法は、対象物の第1の画像を受け付け;第1の訓練された機械学習システムを用いて、前記第1の訓練された機械学習システムへの入力である前記第1の画像の特徴又は前記第1の画像に示された生理学的構造の特徴を抽出し;第1の訓練された分類器を用いて、前記第1の訓練された分類器への入力である前記抽出された特徴に基づいて第1の画像を分類し;前記第1の画像の領域にマスキングを施し;第2の訓練された機械学習システムを用いて、前記第1の画像の前記領域を再構成し;前記第1の画像の前記再構成された領域と受信された前記第1の画像の対応する領域との間の類似度を求め;前記分類及び前記求められた類似度に基づいて、前記第1の画像のラベル及び/又はスコアを決定する。第3の例は、上記の第1及び第2の例の組み合わせであるため、その様々な実施形態は、第1及び第2の例に関する上記の特徴のいずれかを含むことができる。
本開示の例示的なシステム及び方法アーキテクチャを示す。
本開示の異常検出スクリーナシステム及び方法の例示的なアーキテクチャを示す。
本開示の異常検出スクリーナシステム及び方法の例示的な分類アーキテクチャを示す。
本開示の異常検出スクリーナシステム及び方法の他の例示的な分類アーキテクチャを示す。
本開示の異常検出スクリーナシステム及び方法の例示的な画像修復アーキテクチャを示す。
本開示の異常検出スクリーナシステム及び方法の他の例示的な画像修復アーキテクチャを示す。
本開示の異常検出スクリーナシステム及び方法の例示的なアンサンブル異常検出アーキテクチャを示す。
本開示のシステム及び方法による、個々の画像又は画像パッチスコアからボリュームラベル及び/又はスコアを求める例を示す。
本開示のシステム及び方法の検査中に検出された状態についてのスコアのヒストグラムを示す。 本開示のシステム及び方法の検査中に検出された状態についてのスコアのヒストグラムを示す。
本開示のシステム及び方法の検査中に決定されたスコア値のBスキャン画像及び対応するヒートマップを示す。 本開示のシステム及び方法の検査中に決定されたスコア値のBスキャン画像及び対応するヒートマップを示す。 本開示のシステム及び方法の検査中に決定されたスコア値のBスキャン画像及び対応するヒートマップを示す。
本開示のシステム及び方法の検査のための受信者操作特性(ROC)解析を示す。 本開示のシステム及び方法の検査のための受信者操作特性(ROC)解析を示す。
ノーマティブデータ(本明細書では正常データとも呼ばれる)は異常データ(病的データ)よりもはるかに容易に入手できるため、大量の正常データで異常検出システムのネットワークを訓練することはより容易である。更に、異常データの収集は、研究プロトコルにおける特定の包含/除外基準によって強く影響を受け及び/又はバイアスを受ける可能性があるが、健康/通常データの収集はそれほどのバイアスは受けない。このような訓練及びテストは、参照/正常データベースのデータセットを用いて実行でき、又は、多くの眼科クリニック及び/又は他のスクリーニング場(プライマリケア、薬局チェーンなど)の典型的なデータセットを用いて実行できる。
上記を考慮し、本開示は、機械学習技術に基づく画像(例えば、眼の光干渉断層法(OCT)画像)を用いた異常な(本明細書では「疾患」と相互交換可能に使用される)被検者と正常な被検者との識別及び分離並びに可能性のある疾患タイプの同定を対象としている。これらの機械学習技術は、例えば、畳み込みニューラルネットワーク(CNN)やサポートベクターマシン(SVMs)を含んでいてよく、訓練データは正常データのみを含んでいてよい。眼科への応用においては、そのような疾患は、次を含んできてよい:(多くの場合において重症度が視野検査で得た平均偏差(MD)スコアによって定義される)緑内障を含む様々な網膜の病態;糖尿病網膜症(DR)、及び、(早期(小さなドルーゼン)、中期(中程度の寸法のドルーゼン)、及び後期(湿性及び乾性萎縮性AMDのいずれか又は両方)を含む幾つかの段階を含む)加齢黄斑変性(AMD)。追加の状態には、網膜色素変性症(RP)、ぶどう膜炎、虚血、他の網膜症、及び脈絡膜の病態も含まれるが、これらに限定されない。
上記で示唆したように、他の画像解析システムは、眼底画像又は正面(en face)OCT画像(カメラのようなX/Y平面ビュー)に焦点を合わせており、それぞれのボリューム/眼に対して1つの画像(又は、少数の画像)のみが存在するため、訓練のために多数のボリューム/眼が要求される。対照的に、本開示は、Bスキャン(X/Z又はY/Z平面。ここで、Z次元は深さを表す。)又は導出されたスキャンビュー及び3Dスキャンの断面解析を用いる能力について説明する。3Dスキャンは、多くの場合、ボリュームごとに128から512枚(1024枚以上でもよい)のBスキャン(画像)を有するが、正面(en face)ベースの解析では、多くの場合、ボリュームが1つ又は少数の画像に縮小され、その結果、利用可能な情報の多くが失われる。したがって、多次元の画像データを保存及び利用することにより、片方の眼から、データが比較的少ない希少疾患のより多くの訓練データを取得することができる。更に、Bスキャン又は他の特徴豊富な2D画像の解析は、網膜専門家による病気の3D OCTボリュームのこれまでの見方に、より密接に対応している。
これらの画像/ボリュームを使用することにより、本明細書で説明されるシステム及び方法は、様々な形態で生じる構造変化を認識することが可能である。例えば、CNNへの入力は、AMD構造の変化が明瞭に現れるBスキャンビュー(完全なBスキャン又はより小さな部分)であってよく、又は、この入力は厚さマップであってよい。この厚さマップは、例えば、緑内障の検出をより簡単に行える網膜神経線維層(RNFL)の厚さマップであってよい。他の実施形態では、この入力は、テクスチャ情報であり得る。局所的又は大域的に生じる構造変化に対応できる多解像度システムについても説明される。
図1に示すように、本明細書で説明するシステムのアーキテクチャは、患者の眼100の画像、測定値102、患者情報104、及び/又は他の関連情報106をスクリーナ(screener)108への入力として取得する。そして、スクリーナ108は、その入力情報が異常110か正常112かの識別(同定)を出力する。異常110の場合、システムは、異常114のタイプ(例えば、緑内障、AMD、糖尿病網膜症、その他の疾患)の識別及び出力を更に行う。ここで、眼科スクリーニングの場合、入力画像100は、OCT画像、眼底画像、又はマルチモダリティ画像など、任意の網膜画像であってよい。測定値102は、例えば、厚さ、血流測定値、又は視力及び眼圧(IOP;緑内障に関連し得る)などの他の関連測定値など、画像から取得又は導出されたものを含み得る。更に、患者及び関連情報104、106は、例えば、年齢、性別、アルコール又は薬物の使用などを含んでいてよい。スクリーニング出力の識別110、112は、Bスキャンレベル及び/又はボリュームレベルで作成されてよい。
上記のシステムは、1つ又は複数のプロセッサ及びそれに付随するメモリを含む1つ又は複数のコンピュータによって実装することができる。入力画像100及び情報102、104、106は、入力/出力インターフェースデバイスによって提供され得る。特に、画像は、イメージングシステム(例えばOCTイメージングシステム)によって直接に入力され、ネットワークを介して提供され、移動可能なメモリ媒体を介して提供され、又はそれらに類似の手段で提供される。幾つかの実施形態では、上記のシステムは、イメージングシステム自体の一部として実装されてもよい。同様に、出力は、付随した又はネットワーク化されたディスプレイデバイスに提供され、メモリに保存され、又は有形媒体に印刷されてもよい。
図2は、本開示の異常検出スクリーナ108システム及び方法の例示的なアーキテクチャを示している。そこでは、上記のように、入力200は、OCT Bスキャン(例えば、深さ次元を含む断面画像)、及び/又は、測定マップ/グリッド、及び/又は、多解像度OCTA信号などの他の処理された指標(endpoint)であってよい。更に、入力200は、例えばOCTスキャンなど、任意のイメージング又はスキャンタイプに基づいていてよい。本開示は、網膜画像及び他の眼科画像に言及しているが、入力200は任意の対象物のものであってもよい。例えば、入力200は、中心窩を中心とした6mm×6mmの黄斑スキャン、ディスク中心を中心とした6mm×6mmのディスクスキャン、中心窩とディスク中心をカバーする12mm×9mmワイドスキャン、半径が異なる及び/又はディスク中心を中心とする偏心のタイプが異なる派生円スキャン、半径が異なる及び/又は中心窩を中心とする偏心のタイプが異なる派生楕円スキャンなどであってよい。部分的又は完全な3Dボリュームに異常検出プロセスを拡張することも可能である。
最初に、入力画像200に対して前処理202を施すことができる。前処理202は、異なる方式の処理を含んでいてよく、そのような処理として、例えば、内境界膜(ILM)又は他の境界による画像平坦化、ガウシアンを用いたスペックルノイズ除去及び画像/マップ平滑化、バイラテラル又は他の同様のフィルター、画像/マップ強度の正規化、厚さ比、入力画像200の画像パッチ(画像の一部、例えば断面Bスキャンなどの画像から抽出された部分又はクロッピングされた部分)への分割、画像サイズ変更などがある。画像パッチを使用する場合、任意的に、例えば画像セグメンテーション、部分抽出、画像クロッピングなどにより、1つの入力画像又はボリュームを複数の重複又は非重複部分に分解又は分割することが可能である。各部分は、更なる処理のための画像パッチを構成する。このようにして、それぞれの入力画像200全体は、各部分での異常検出のために複数の画像を効果的に提供することができる。前処理202は、画像シフト、フリッピング、強度強化、及び他の拡張方法(augmentation methods)によるデータ拡張(data augmentation)も含んでいてもよい。
実施形態に応じて、画像パッチは、異なるサイズや解像度を有していてもよいし、異なるタイプのものであってもよいし(例えば、ボリュームから得られる場合には、異なる平面からの断面画像又は投影画像)、異なる空間位置からのものであってもよい。別の言い方をすれば、パッチは、より大きな画像又はボリュームに施された任意の前処理の結果であってよい。画像パッチが異なる空間位置からのものである場合、それらは同じデータのいずれかを有しないかもしれない。しかし、幾つかの実施形態では、パッチが空間的に重複している可能性があり、したがって共通のデータを含む場合がある。
前処理202に続いて、処理された画像入力は、処理のために機械学習システム204(例えば、深層学習ベースのモデル)に供給される。機械学習ベースのモデルは、深層CNN又は深層畳み込み敵対的生成ネットワーク(DCGAN)であってよい。端的に言うと、CNN及びDCGANは、それぞれが複数のフィルターを含む複数の畳み込み層を含んで構成されている。これらのフィルターは、関連する特徴を抽出するために、入力データ(例えば、前処理された入力画像)とコンボリューションされる。幾つかの実施形態では、フィルタは、機械学習システムへの画像入力の小さなパッチ(例えば、フィルタのサイズに対応する)を検査し、パッチに対応するピクセル(例えば、パッチの中心ピクセル)の活性化値を算出するように構成される。そして、機械学習システムへの画像入力の全体にわたってフィルターを適用することにより、活性化マップを作成することができる。一連の畳み込み層を適用することにより、機械学習システムへの画像入力のエッジ、部分及びモデルを抽出することができる。機械学習システムのフィルターの特定のパラメーターは、訓練データを使用した訓練によって決定される。完全CNN(complete CNN)又はDCGANモデルは、これらに限定されないが、畳み込み層(例えば、特徴抽出を目的とする)、プーリング層(例えば、次元を低減するため、及び/又は訓練中の過剰適合を避けるために学習プロセスを正則化するため)、バッチ正規化(収束の高速化及び正則化)、活性化層(例えば、システムに非線形性を導入するため)、非プーリング/転置コンボリューション層(例えば、DCGANの機能マップのアップスケールするため)、及び、全結合層(例えば、CNNモデルにおける分類/意思決定を目的とする)を含む。以下の例で詳述するように、本開示の機械学習システムは、分類技術及び/又は画像修復/再構築技術に基づいて異常を検出することができる。双方の技術を共に使用する場合、本明細書ではそれをアンサンブル異常検出技術と呼ぶ。
第1のアプローチの例(分類)が図3に示されている。従来の技術と比較して、図3に示されている技術は、生画像ではなく抽出された特徴を分類器に入力するための特徴抽出機械学習システムを更に含む。したがって、正常データのみを用いて分類器を訓練することができる。より具体的には、上述のように、まず、入力画像300に前処理302を施すことができる。前処理302に続いて、深層学習モデルに基づいて入力画像300から特徴が抽出される304。この深層学習モデルは、例えば、事前に訓練された深層学習モデル(例えば、転移学習が用いられる)、又は、最初から(ゼロから)訓練された深層学習モデルである。転移学習により、様々なタスクのために事前訓練済みモデルを再利用することや、新しいタスクの開始点として事前訓練済みモデルを使用することが可能になる。事前に訓練されたモデルとしてCNNモデルがあり、例えばVGG、インセプションネットワークモデル(Inception V3を含む)、ResNet、AlexNet、及び、当業者に知られている他のモデルが含まれ得る。抽出された特徴は、特徴抽出機械学習システム304がどのように訓練されるかに依存するが、画像の明るさ、エッジの特徴、色、形状、地理的/生理学的領域などに関連し得る。これらの特徴は、異常を示すものであることが好ましい。
次いで、抽出された特徴が分類器306(例えば、1クラス分類器又は二項分類器)に入力され、分類器306を訓練するために使用される正常データから「外れ値」を識別するように訓練される。(正常訓練データからの対応する特徴と比較して)正常でないように見える特徴は、分類器306によって異常として識別され得る。したがって、特徴が抽出された画像(又はボリューム)は異常と判断される場合がある。画像が複数のパッチに分割される実施形態の場合、各パッチが特徴抽出システム304に入力され、その出力は、幾つかの実施形態ではアンサンブルが可能な複数の分類器306に供給されてもよい。アンサンブル分類器は並行して動作し、アンサンブル内の各コンポーネント分類器の出力に基づいて出力を生成する。例えば、アンサンブル分類器の出力は、アンサンブルを構成する分類器の平均であってよい。
一実施形態において、入力画像から4つのパッチが取得される場合、2つのパッチから抽出された特徴を処理するようにそれぞれ訓練された2つの分類器モデル306を使用し得る。これら2つの分類器モデル306のそれぞれは、それ自体がアンサンブル分類器であり、アンサンブルに入力される2つのパッチのそれぞれに対して成分分類器が訓練される。別の言い方をすれば、各分類器モデル306は、(異なるパッチにそれぞれ対応する)1つ又は複数の別々の空間位置からの画像で訓練されてもよい。このように、或る幾つかの空間位置に対して異なる分類器を特に訓練できるため、分類は、訓練データセットにおける特徴の空間的相違に対応する。他の実施形態において、分類器306に対するそのような訓練及びパッチのマッピングは、パッチのタイプ、個数、位置、サイズ、及び/又は解像度に基づいていてよい。換言すると、分類器306はそれぞれ、(例えば、そのタイプ、場所、サイズ、解像度など)特定のパッチに対応するデータで訓練されてもよい。したがって、特定の複数のパッチを特定の複数の分類器にマッピングし、これら特定の分類器を組み合わせて入力画像を分類することができる。
分類器306は、正常なサンプルのみによって訓練されてもよい。言い換えれば、分類器306は、(正常データのみを表す)正常眼のみからのデータ/画像で訓練されてもよい。分類器306は、任意のタイプであってよく、例えば、1クラスサポートベクターマシン(SVM)や1クラスランダムフォレストモデルなどの形式の1クラス分類器であってよい。他の実施形態では、分類器306は二項分類器であってよい。図3の例に示すように、分類器306が1クラス分類器である場合、1クラス分類器306の出力308は、処理された画像のラベル及びスコアである。ラベルは、例えば、「正常」又は「異常」を示し、スコアはそのラベルが示す程度又はレベルを示す。スコアの符号は、ラベルが正常か異常かを示してもよい(例えば、陰性:異常;陽性:正常)。出力は、入力画像のどの部分が出力ラベル及び/又はスコアに寄与したか(及びどの程度の寄与か)を示すヒートマップを含んでもよい。二項分類器が使用される場合、ラベルのみが出力される308。
次いで、スコアに応じて、特定の異常又は疾患を識別することができる。例えば、図9A及び図9Bに関連して以下で更に詳細に説明するように、AMDは、ドルーゼンよりも大きい大きさのスコアに関連付けられる。したがって、分類器306により出力されたラベル及び/又はスコアの更なる分析を行って、特定の異常を識別することができる。特定の異常の識別は、例えば、異常なラベルのスコアを、異なる複数の異常に関連付けられた閾値(例えば、上限及び下限)と比較することによって行われる。これらの閾値は、テストデータセットに基づく統計計算によって生成されてよい。一実施形態では、受信者操作特性(ROC)曲線を利用して、所望の用途に対して許容可能な真陽性率及び偽陽性率を提供する閾値を特定することができる。他の例において、閾値は、所望の用途に基づいて臨床医によって手作業で決定されてもよい。
オプションとして、分類器306への入力の前に、抽出された特徴に対して次元低減ステップ310を施すことができる。次元低減は、主成分分析(PCA)、独立成分分析(ICA)などであってよい。
分類アプローチの特定の非限定的な実施形態が図4に示されている。図4において、画像パッチ400(例えば、前処理により得られたもの)は、特徴抽出のためにInception V3の深層学習モデル402に入力される。Inception V3のモデル402によって抽出された特徴、抽出された特徴は、次いで、任意的な次元低減ステップの一部としてPCA解析404にかけられる。次いで、PCA解析が施された抽出特徴は、1クラスSVM406に入力され、それにより最終的なラベル及び/又はスコア408が出力される。
第2のアプローチの例である画像修復(画像の部分を再構成するプロセス)を図5に示す。図3及び図4に関連して論じたように、まず入力画像500に対して前処理502を施すことができる。この前処理502は、上述したように任意のタイプの前処理であってよい。次に、前処理が施された入力の領域がマスクされ504、マスクされたこれらの領域が機械学習システムによって再構築(修復)される506。画像の任意の領域をランダムにマスクすることができる。マスクされる領域は、例えば、(RNFL、内網状層(IPL)、網膜色素層(RPE)、及びその他の層などの)網膜層を含む画像内の眼の任意の構造領域である。一実施形態によれば、スライディングウィンドウを使用して、入力画像又は前処理画像500、502の一部をマスクする。ウィンドウは、例えば矩形のウィンドウなど、任意のサイズ又は形状をとることができる。マスクされた領域を再構築するための機械学習システムは、健康な患者を撮影して得られた画像を使用してゼロから訓練されてもよい。上記で説明したように、単一の入力画像が複数のパッチを有してよいため、複数のパッチを処理するように機械学習システムを訓練することや、異なるパッチに複数の機械学習システムを利用することができる。それから、再構成された画像、及び前処理された画像(又は、前処理されていない場合には入力画像500)が比較され、それらの類似度が測定される508。測定された類似度508に基づいて最終的なラベル及び/又はスコアが決定される510。換言すると、正常及び健康な眼の画像に基づいて画像の部分を再構成するように機械学習システムが訓練されている場合、マスクされていない入力画像又は前処理画像500、502と再構成された画像との間の高いレベルの類似度は、マスクされた部分が正常で健康であることを示す。逆に、低いレベルの類似度は、入力画像又は前処理された画像500、502が異常であることを示す。
画像修復アプローチの特定の例を図6に示す。図6において、入力画像及び/又は前処理された入力画像は画像パッチ600である。次に、これらのパッチの領域がマスクされ602、DCGANモデルにより再構成される604。DCGANモデルは、入力画像又はパッチをエンコード及びデコードする生成器ネットワークと、(例えば、生成器ネットワークにより)画像若しくはパッチを生成するか否か又は画像若しくはパッチのオリジナルであるか否かを識別する識別器ネットワークとを備える。識別器ネットワークは、生成器ネットワークが画像を現実的に(写実的に)修復/再構築するのに役立つ。再構成604に続いて、再構成された画像パッチが、マルチスケール類似度測定(Multiscale Structural Similarity;MS-SSIM)606技術を使用して、マスクされていないオリジナルの画像パッチと比較され、類似度測定606を行う。MS-SSIM測定の結果が非常に小さいかゼロに近い場合(類似度が小さいことを示す)、入力画像パッチ600が何らかのタイプの疾患/異常を表していると判断できる。上記のように、このスコアは、疾患の重症度又はタイプを意味し、類似度測定のための閾値を設定することにより「正常」又は「異常」のラベルを識別することもできる。
上述の第3のアプローチであるアンサンブル異常検出は、単一のシステムで分類アプローチと修復アプローチの両方を利用する。一例において、各アプローチは、異常を検出するために共通の入力に対して並行的に実行される。その場合、最終的なラベル及び/又はスコアは、2つのアプローチの集約であってよい。例えば、幾つかの実施形態では、一方又は両方のアプローチのいずれかが異常として分類される結果を出力した場合、最終ラベルは「異常」であってよい(「or」の組み合わせを考慮した場合)。一方、他の実施形態は、最終的なラベルとして使用される「異常」の結果を両方のアプローチが出力することを要求する(「and」の組み合わせを考慮した場合)。このアプローチの一例が図7に示されており、分類システム702及び修復システム704の双方に共通の入力画像700が入力される。1クラスの分類システム702及び修復システム704は、前述したタイプのものであり得る。次いで、各システム702、704の出力が論理演算器706を介して組み合わされ、入力画像700のラベル及び/又はスコア708が決定される。前述したように、「or」コンビネーションとしてラベル及び/又はスコアを出力するように設計されたシステムのためのOR演算器であってよく、又は、「and」コンビネーションとしてラベル及び/又はスコアを出力するように設計されたシステムのためのAND演算器であってよい。
図7は、入力画像700に対して共通の前処理710を実行可能な例を示しているが、代替として、各システム702、704に対して異なる前処理を実行してもよい。もちろん、他のマスキング、再構成、及び類似度測定技術を使用することができ、本開示の範囲内であると見なされる。更に、図7は、分類システム702と修復システム704を並行的に示しているが、これらのシステムは任意の順序で順次に処理を実行し得ることも想定される。
また、同じデータに対して複数の異常検出を同様に並列的に実行することができるが、解像度を違えて多解像度システムを構築することも可能であることに留意されたい。言い換えれば、(例えば、同じボリュームからの)同じ入力データに対して上記のプロセスを複数回実行できるが、プロセスの各反復では、異なるサイズ/次元/解像度の入力画像を使用するであろう。このプロセスは、異なる入力に対して実行されてもよく、それにより多変量システムが構築される。上記実施形態において、最終的な出力ラベル及び/又はスコアは、個々のBスキャン/画像パッチのラベル/スコアから多解像度及び多変量形式で収集することができる。これらの実施形態では、一人の患者の複数の異常(例えば、複数の健康状態)を識別することが可能である。例えば、異常(ドルーゼンなど)に起因する幾つかの小さな構造変化は、小さなサイズのパッチを解析することで最も効果的に特定できるが、他の異常は大きなサイズの画像を解析することによって最も効果的に特定することができる。同様に、異なる抽出された特徴、又は異なる生理学的領域の解析は、異なる異常を最適に示している可能性がある。
上記のアーキテクチャは、広範囲の入力タイプに対応するために柔軟であり、一般的な疾患異常検出に適用することができる。上記した従来の3DスキャンベースのBスキャン入力に加えて、入力は、緑内障の特徴に関連する画像又は測定に向けてカスタマイズすることができる。緑内障の特徴に関連する画像又は測定は、例えば、ディスク若しくは中心窩の周囲での派生的且つ同心的な円スキャン若しくは楕円スキャンであってよく、或いは、カスタマイズされた視神経乳頭のスキャン、又は、部分的若しくは完全な網膜神経線維層厚マップなどの様々な層厚測定マップ又は神経線維束に沿った非ラスタースキャン(つまり、従来の3Dスキャンではない)の集合であってよい。前処理、CNNモデル、DCGANモデル、MS-SSIM、1クラス分類器など、ここで説明した手順は、これら全ての状況に同様であり適用可能である。また、これらのカスタマイズを緑内障以外の疾患に適用してもよい。
図8は、ボリュームラベル及び/又はスコアが個々の画像又は画像パッチのスコアからどのように導出され得るかの例を示す。ここで、各画像又はパッチは、上述のスクリーナのアーキテクチャのうちの1つにしたがって決定されたラベル及び/又はスコア800を有し、例えば、分類器又は類似度測定技術によって出力されたスコアを有する。次いで、これらの画像の平均スコア802が求められ、この平均スコアは「Bスキャンレベルの」(又は、ローカルの(局所的な))スコアを表す。次いで、所定の閾値Th未満のスコアを有するX個の連続した(例えば、隣接した)Bスキャンが存在する場合、ボリューム(又は画像の合成セット)に「異常」ラベル804を付与することができる。X個の連続したスキャンは、任意の個数であってよい。例えば、一実施形態において、4つ以上の連続したBスキャンがゼロ閾値未満のスコアを有する場合に、ボリュームは異常としてラベル付けされる。それ以外の場合、ボリュームには「通常」というラベルが付与される。次いで、ボリューム(又は画像の合成セット)806のスコアが、任意の4つの連続したBスキャンのスコアの最小値として求められる。例えば、スコアがゼロよりも小さい4つの連続したBスキャンのセットが複数ある場合、これらセットの全てのうち最小のスコアがボリュームのスコアとして考慮される。これらのボリュームスコア806及びラベル804は、グローバルな(大域的な)スコア及びラベルを表す。もちろん、上記の閾値は制限/限定を意図したものではなく、任意の閾値基準を考慮することが可能である。同様に、上記した演算の代わりに、任意の統計演算(最小、最大、平均、中央値、標準偏差など)を使用することも可能である。上記のように、幾つかの実施形態においては、負の値が正常を表し、且つ正の値が異常を表すように、スコアの符号を逆にすることができる(したがって、ラベルを決定するための比較は、スコアが閾値未満であるかどうかではなく、スコアが閾値以上であるかどうかを考慮する。同様に、スコアは、重症度に関して任意の方式で変化してよい。例えば、重症度の変化に対して線形的又は指数関数的にスコアが増加及び減少してよい。
更に、更なる病理学的決定を行うために、異なる特徴抽出及び/又は分類器を用いて共通の画像又はボリュームに上述のプロセスを繰り返してもよい。例えば、プロセスの最初の反復を用いて、特定の異常(例えば、疾患の種類)が存在するかどうかを判断し、更なる反復を用いて、存在する当該種類の疾患における特定の病理を判断することができる。先の反復において機械学習システム(例えば、特徴抽出CNN、分類器、又は再構築モデルを含む)が異常を認識するように特に訓練されてよく、後の反復において機械学習システムがその特定の病理を認識するように別途に訓練されてよい。
上述のように、本明細書に記載のシステム及び方法の出力は、入力画像又は他のデータセットのラベル及び/又はスコアであってよい。追加的な出力として、処理及び前処理の結果として得られる任意の画像、並びに、処理及び前処理において蓄積されたデータを含んでよい。例えば、出力は、システム及び方法によって決定された対応するスコア及びラベルに最も寄与した個々の画像の領域又は画像ボリュームの領域を示すヒートマップ(又は対応するデータ)を含んでもよい。これらの出力は、例えばディスプレイを介してエンドユーザーに直接提供され、又は、後の読影及び/又は解析のために保存される。
<検査例>
図9~図11は、上記の方法論の検査の結果を示している。特に、この検査では、正常眼を表す2つの独立したデータセットと、網膜疾患を有する眼を表す1つのデータセットとを用いた。各セットは、6mm×6mmの3D OCTボリュームデータを含む。網膜疾患の症状には、とりわけ、ドルーゼン、硬性ドルーゼン、AMD、網膜上膜(網膜前膜;ERM)、黄斑浮腫、網膜症、及び中心性漿液性脈絡網膜症(CSC)が含まれていた。これらの図は1つの検査を表しているに過ぎず、異なる入力条件及び病理のタイプ、異なるスキャン領域(前眼部の領域を含む)を採用することが可能である。
図9に関してより具体的に説明する。図9Aは、1クラスSVM分類器によって決定された、ドルーゼンを示す特定のスコアを有する検査ボリューム内のBスキャンの個数を表すヒストグラムを示している。図9Bは、AMDスコアのヒストグラムを示している。これらから分かるように、ドルーゼンはより一般的であり(ドルーゼンを示すものとして識別されるBスキャンをより多くもたらし)、-0.02未満のスコアを示す傾向があるが、AMDは、約-0.02から-0.04のより強いスコアを生成する傾向がある。AMDの前駆症状として、ドルーゼンの存在は、構造変化がそれほど深刻ではないことを示し、したがって低いスコアを示す。これは、ドルーゼンがAMDよりも低いスコアに対応するという上記の議論と一致し、更には、AMDのスコアからドルーゼンのスコアを区別し、異常なラベルに関連する疾患を区別するために閾値を適用できるという上記の議論と一致する。例えば、最も一般的なスコア又はスコアの最大密度の範囲を特定することによって、Bスキャンのボリューム全体の重症度のレベルを特定するために、このようなヒストグラムを用いることができる。更に、上記のように、スコアの負の値を用いることで、それらを異常としてラベル付けすることができ、更に、スコアの絶対値が大きいほど、構造変化又は特定タイプの疾患の重症度が高いことを示す。
図10A~図10Cは、この検査における3つのBスキャンの例を示す。図10Aは、-0.033461623のスコアを有するBスキャン1000を示し、画像内のAMDを示している。図10Bは、ドルーゼンを含み、且つ、-0.022405657のスコアを有するBスキャン1010を示す。図10Cは、同じくドルーゼンを含むBスキャン1020を示すが、より低いスコアである-0.01064716を有する。図10A~10Cそれぞれにおける中央のパネルは、ヒートマップ1002、1012、1022が重畳されたBスキャンを示す。下部のパネルは、ヒートマップ1004、1014、1024そのものを示している。これらのヒートマップは、最終的な分類に最も寄与する各Bスキャンの領域(範囲)を示す。これらのヒートマップは、寄与の度合(程度)を示すためにカラーで作成することも可能である(例えば、寄与無し又は小さな寄与を示す青色から、最大寄与を示す赤色まで)。
最後に、図11は、ボリュームレベルでのスコアリング及びラベリング(ラベル付け)に基づく検査のROC解析を示す。ROC解析は、検査の品質又は性能の評価のために用いられる。例えば、ROC曲線は、識別閾値の変化に対応する二項分類器システムの診断能力を示すグラフプロット(graphical plot)である。様々な閾値設定において偽陽性率(FPR)に対して真陽性率(TPR)をプロットすることによってROC曲線を作成することができる。ROC曲線の下の面積(しばしば略してAUCと呼ばれる)は、診断能力の指標を表す。AUCが大きいほど、システムの品質と性能が高い。ROC曲線上の任意の点での感度は真陽性率として特定でき、且つ、ROC曲線上の任意の点での特異度は1から偽陽性率を減算した値として特定できる。
特に、図11Aは、ボリュームのスコアが4つの連続した個々のBスキャンのスコアの合計(和)に基づいたROC曲線を示す。図11Bは、ボリュームのスコアが全ての利用可能な個々のBスキャンのスコアの平均に基づいたROC曲線を示す。これらの解析において、陽性の同定は、本システム及び方法による網膜疾患の同定であった。図11Aの解析では、システムは特異度1に対して感度0.8916を呈し、特異度0.7722において感度0.9759に達した。これは、ROC曲線の下の面積0.9791に対応する。ボリューメトリックスコア(volumetric score)を求めるための平均演算について、図11Bは、特異度1に対して感度0.8675を示し、特異度0.7848で感度9.9759に達した。よって、図11Bの曲線下面積は0.9834であった。
上記で示唆したように、上記の方法を実行するためのシステムも本開示の範囲内において考慮される。そのようなシステムは、当該方法を実行するための1つ又は複数のプロセッサ(例えば、集積回路、ディスクリート回路などの形態)、ストレージ(例えば、ハードディスク、メモリ、RAMなど)、及び入出力インターフェイス(例えば、ディスプレイ、キーボード、マウスなど)を含むコンピュータを含んでいてよい。ストレージは、コンピューターと共にローカルに配置されてもよいし、又は、例えば集中型データベース(centralized database)にリモートで配置されてもよい。システムは、画像やその他の入力データを取得するために使用されるシステムと統合されてもよいし、分離されてもよい。例えば、上記コンピューターは光干渉断層撮影システムを制御するために使用されるコンピューターと同じであってもよい。
様々な特徴が以上に提示されているが、それらの特徴は単独で又はそれらの任意の組み合わせで使用できることを理解されたい。更に、特許請求の範囲に記載された例に係る当業者は変形及び修正を行い得ることを理解されたい。本明細書で説明した例は例示である。本開示は、当業者が、特許請求の範囲に示された要素に同様に対応する代替的な要素を有する代替的な設計を作成し使用することを可能にし得る。このように、意図する範囲は、特許請求の文字通りの文言と異ならない他の例、又はそれと非実質的に異なる他の例を含んでよい。したがって、本開示の範囲は、添付の特許請求の範囲に記載のように定義される。

Claims (8)

  1. 眼の画像を処理するシステムであって、
    前記眼の画像中の領域をマスクするマスキング部と、
    マスクされた領域を再構成するように訓練された機械学習システムを用いて、前記マスキング部によりマスクされた前記画像中の前記領域を再構成する再構成部と
    を含む、システム。
  2. 前記機械学習システムの訓練は、正常眼の画像を用いて行われる、請求項1のシステム。
  3. 前記再構成部により前記領域が再構成された前記画像と、前記マスキング部により前記領域がマスクされる前の前記画像とを比較して類似度を測定する測定部と、
    前記類似度に基づいて、前記画像のラベル及び/又はスコアを決定する決定部と
    を更に含む、請求項1又は2のシステム。
  4. 前記測定部は、マルチスケール類似度測定によって前記類似度を測定する、請求項3のシステム。
  5. 前記ラベルは、前記眼が正常か異常かを識別し、
    前記スコアは、前記正常又は前記異常の程度を示し、又は、前記異常の種類を示す、
    請求項3又は4のシステム。
  6. 前記機械学習システムは、深層畳み込み敵対的生成ネットワークである、請求項1~5のいずれかのシステム。
  7. 前記画像は、深さ次元を有するBスキャン画像又は断面画像である、請求項1~6のいずれかのシステム。
  8. 前記画像は、光干渉断層画像である、請求項1~7のいずれかのシステム。

JP2021098040A 2018-08-30 2021-06-11 多変量及び多解像度網膜画像異常検出システム Active JP7096406B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862724864P 2018-08-30 2018-08-30
US62/724,864 2018-08-30
US16/552,467 US11704791B2 (en) 2018-08-30 2019-08-27 Multivariate and multi-resolution retinal image anomaly detection system
US16/552,467 2019-08-27
JP2019156373A JP6899876B2 (ja) 2018-08-30 2019-08-29 多変量及び多解像度網膜画像異常検出システム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2019156373A Division JP6899876B2 (ja) 2018-08-30 2019-08-29 多変量及び多解像度網膜画像異常検出システム

Publications (2)

Publication Number Publication Date
JP2021151522A JP2021151522A (ja) 2021-09-30
JP7096406B2 true JP7096406B2 (ja) 2022-07-05

Family

ID=67810430

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019156373A Active JP6899876B2 (ja) 2018-08-30 2019-08-29 多変量及び多解像度網膜画像異常検出システム
JP2021098040A Active JP7096406B2 (ja) 2018-08-30 2021-06-11 多変量及び多解像度網膜画像異常検出システム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2019156373A Active JP6899876B2 (ja) 2018-08-30 2019-08-29 多変量及び多解像度網膜画像異常検出システム

Country Status (4)

Country Link
US (1) US11704791B2 (ja)
EP (1) EP3617943A1 (ja)
JP (2) JP6899876B2 (ja)
DE (1) DE19194538T1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10997717B2 (en) * 2019-01-31 2021-05-04 Siemens Healthcare Gmbh Method and system for generating a confidence score using deep learning model
KR20210115196A (ko) * 2020-03-12 2021-09-27 삼성에스디에스 주식회사 영상 기반의 안질환 진단 장치 및 방법
US11557026B2 (en) 2020-06-05 2023-01-17 Advanced Micro Devices, Inc. Automated artifact detection
CN111798437A (zh) * 2020-07-09 2020-10-20 兴义民族师范学院 一种基于ct影像的新型冠状病毒肺炎ai快速诊断方法
CN111950525B (zh) * 2020-08-31 2022-09-16 福州大学 一种基于破坏重建学习与GoogLeNet的细粒度图像分类方法
WO2022049901A1 (ja) * 2020-09-07 2022-03-10 富士フイルム株式会社 学習装置、学習方法、画像処理装置、内視鏡システム及びプログラム
WO2022072513A1 (en) * 2020-09-30 2022-04-07 Ai-Ris LLC Retinal imaging system
US11670072B2 (en) 2020-10-02 2023-06-06 Servicenow Canada Inc. Systems and computer-implemented methods for identifying anomalies in an object and training methods therefor
JP7416279B2 (ja) 2020-10-06 2024-01-17 富士通株式会社 訓練データ生成プログラム、訓練データ生成方法及び訓練データ生成装置
US11693925B2 (en) 2020-11-16 2023-07-04 International Business Machines Corporation Anomaly detection by ranking from algorithm
KR20220073209A (ko) * 2020-11-26 2022-06-03 조선대학교산학협력단 심전도 신호로부터 설명 가능한 히트맵 영상에 근거한 질병을 판별하는 시스템 및 판별 방법
US11727534B2 (en) 2020-12-08 2023-08-15 International Business Machines Corporation Normalizing OCT image data
CN112819076B (zh) * 2021-02-03 2022-06-17 中南大学 基于深度迁移学习的医学图像分类模型的训练方法及装置
US20220366316A1 (en) * 2021-05-12 2022-11-17 Capital One Services, Llc Ensemble machine learning for anomaly detection
CN113269134A (zh) * 2021-06-17 2021-08-17 中国空间技术研究院 一种异常广播识别模型及其构建方法和使用方法
CN113379729B (zh) * 2021-07-02 2023-07-25 四川启睿克科技有限公司 一种图像微小异常检测方法、装置及计算机可读存储介质
WO2023053854A1 (ja) * 2021-09-29 2023-04-06 京都府公立大学法人 診断補助装置及び診断補助プログラム
CN113962274B (zh) * 2021-11-18 2022-03-08 腾讯科技(深圳)有限公司 一种异常识别方法、装置、电子设备及存储介质
WO2023095250A1 (ja) * 2021-11-25 2023-06-01 株式会社日立国際電気 異常検知システム
CN114529772B (zh) * 2022-04-19 2022-07-15 广东唯仁医疗科技有限公司 Oct三维图像分类方法、系统、计算机装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009525517A (ja) 2006-01-31 2009-07-09 富士フイルム株式会社 眼鏡を自動的に検出し、削除する方法、及び装置
US20160358321A1 (en) 2015-06-05 2016-12-08 Sony Corporation Full reference image quality assessment based on convolutional neural network
US20170156582A1 (en) 2015-12-03 2017-06-08 The Cleveland Clinic Foundation Automated clinical evaluation of the eye
US20170357879A1 (en) 2017-08-01 2017-12-14 Retina-Ai Llc Systems and methods using weighted-ensemble supervised-learning for automatic detection of ophthalmic disease from images
US20180214087A1 (en) 2017-01-30 2018-08-02 Cognizant Technology Solutions India Pvt. Ltd. System and method for detecting retinopathy

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8885901B1 (en) * 2013-10-22 2014-11-11 Eyenuk, Inc. Systems and methods for automated enhancement of retinal images
US9349178B1 (en) * 2014-11-24 2016-05-24 Siemens Aktiengesellschaft Synthetic data-driven hemodynamic determination in medical imaging
JP6907563B2 (ja) * 2017-01-31 2021-07-21 株式会社ニデック 画像処理装置、および画像処理プログラム
US11049243B2 (en) * 2017-04-19 2021-06-29 Siemens Healthcare Gmbh Target detection in latent space
US10468142B1 (en) * 2018-07-27 2019-11-05 University Of Miami Artificial intelligence-based system and methods for corneal diagnosis

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009525517A (ja) 2006-01-31 2009-07-09 富士フイルム株式会社 眼鏡を自動的に検出し、削除する方法、及び装置
US20160358321A1 (en) 2015-06-05 2016-12-08 Sony Corporation Full reference image quality assessment based on convolutional neural network
US20170156582A1 (en) 2015-12-03 2017-06-08 The Cleveland Clinic Foundation Automated clinical evaluation of the eye
US20180214087A1 (en) 2017-01-30 2018-08-02 Cognizant Technology Solutions India Pvt. Ltd. System and method for detecting retinopathy
US20170357879A1 (en) 2017-08-01 2017-12-14 Retina-Ai Llc Systems and methods using weighted-ensemble supervised-learning for automatic detection of ophthalmic disease from images

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Dafydd Ravenscroft, et al.,Learning Feature Extractors for AMD Classification in OCT Using Convolutional Neural Networks,25th European Signal Processing Conference, 2017,IEEE,2017年,pp. 51-55
Thomas Schlegl, et al.,Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide Marker Discovery,Infomation Processing in Medical Imaging: 25th International Conference, IPMI 2017,2017年,https://doi.org/10.48550/arXiv.1703.05921

Also Published As

Publication number Publication date
EP3617943A1 (en) 2020-03-04
JP6899876B2 (ja) 2021-07-07
JP2020032190A (ja) 2020-03-05
JP2021151522A (ja) 2021-09-30
US11704791B2 (en) 2023-07-18
DE19194538T1 (de) 2020-06-04
US20200074622A1 (en) 2020-03-05

Similar Documents

Publication Publication Date Title
JP7096406B2 (ja) 多変量及び多解像度網膜画像異常検出システム
Bogunović et al. RETOUCH: The retinal OCT fluid detection and segmentation benchmark and challenge
Amin et al. A review on recent developments for detection of diabetic retinopathy
Li et al. Deep learning based early stage diabetic retinopathy detection using optical coherence tomography
Perdomo et al. Classification of diabetes-related retinal diseases using a deep learning approach in optical coherence tomography
Akram et al. Automated detection of dark and bright lesions in retinal images for early detection of diabetic retinopathy
Mookiah et al. Computer-aided diagnosis of diabetic retinopathy: A review
Cheng et al. Sparse dissimilarity-constrained coding for glaucoma screening
Ramani et al. Improved image processing techniques for optic disc segmentation in retinal fundus images
Xiong et al. An approach to evaluate blurriness in retinal images with vitreous opacity for cataract diagnosis
Raja et al. Clinically verified hybrid deep learning system for retinal ganglion cells aware grading of glaucomatous progression
Valizadeh et al. Presentation of a segmentation method for a diabetic retinopathy patient’s fundus region detection using a convolutional neural network
Panda et al. Describing the structural phenotype of the glaucomatous optic nerve head using artificial intelligence
US11883099B2 (en) Noninvasive techniques for identifying choroidal neovascularization in retinal scans
Hassan et al. CDC-Net: Cascaded decoupled convolutional network for lesion-assisted detection and grading of retinopathy using optical coherence tomography (OCT) scans
Xu et al. Predicting the glaucomatous central 10-degree visual field from optical coherence tomography using deep learning and tensor regression
Fraz et al. Computational methods for exudates detection and macular edema estimation in retinal images: a survey
Rodrigues et al. Retinal vessel segmentation using parallel grayscale skeletonization algorithm and mathematical morphology
US20160242639A1 (en) Clinic evaluation via outer retinal layer assessment
Girish et al. A benchmark study of automated intra-retinal cyst segmentation algorithms using optical coherence tomography b-scans
Priya et al. Detection and grading of diabetic retinopathy in retinal images using deep intelligent systems: a comprehensive review
Kaur et al. Diabetic retinopathy diagnosis through computer-aided fundus image analysis: a review
Sreng et al. Cotton wool spots detection in diabetic retinopathy based on adaptive thresholding and ant colony optimization coupling support vector machine
Yadav et al. Automatic Cataract Severity Detection and Grading Using Deep Learning
Fang et al. PALM: Open Fundus Photograph Dataset with Pathologic Myopia Recognition and Anatomical Structure Annotation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210615

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220531

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220623

R150 Certificate of patent or registration of utility model

Ref document number: 7096406

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150