JP2024501620A - 生物学的障害の動的免疫組織化学プロファイリングのためのシステム及び方法 - Google Patents

生物学的障害の動的免疫組織化学プロファイリングのためのシステム及び方法 Download PDF

Info

Publication number
JP2024501620A
JP2024501620A JP2023533607A JP2023533607A JP2024501620A JP 2024501620 A JP2024501620 A JP 2024501620A JP 2023533607 A JP2023533607 A JP 2023533607A JP 2023533607 A JP2023533607 A JP 2023533607A JP 2024501620 A JP2024501620 A JP 2024501620A
Authority
JP
Japan
Prior art keywords
disorder
disease
subject
trained model
fluorescence intensity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023533607A
Other languages
English (en)
Inventor
アローラ,マニッシュ
カーティン,ポール
オースティン,クリスティン
Original Assignee
アイカーン スクール オブ メディシン アット マウント サイナイ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アイカーン スクール オブ メディシン アット マウント サイナイ filed Critical アイカーン スクール オブ メディシン アット マウント サイナイ
Publication of JP2024501620A publication Critical patent/JP2024501620A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/645Specially adapted constructive features of fluorimeters
    • G01N21/6456Spatial resolved fluorescence measurements; Imaging
    • G01N21/6458Fluorescence microscopy
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • G01N33/582Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with fluorescent label
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • G01N33/6896Neurological disorders, e.g. Alzheimer's disease
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/46Assays involving biological materials from specific organisms or of a specific nature from animals; from humans from vertebrates
    • G01N2333/47Assays involving proteins of known structure or function as defined in the subgroups
    • G01N2333/4701Details
    • G01N2333/4737C-reactive protein
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/28Neurological disorders
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/30Psychoses; Psychiatry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/38Pediatrics

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Pathology (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Food Science & Technology (AREA)
  • Biotechnology (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Neurosurgery (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Neurology (AREA)
  • Optics & Photonics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)

Abstract

本開示は、疾患又は障害に関する対象の診断状態を予測するための方法及びシステムを提供する。この方法は、対象の歯、毛髪、又は爪試料を染色して、染色された歯試料を生成することと、染色された歯、毛髪、又は爪試料にわたって空間的に蛍光強度を分析することと、蛍光強度の分析に少なくとも部分的に基づいて、疾患又は障害に関する対象の診断状態を予測することと、を含み得る。【選択図】図3

Description

相互参照
本出願は、2020年12月4日に出願された米国仮特許出願第63/121,792号の利益を主張するものであり、参照により、その全体が本明細書に組み込まれる。
動的な生物学的反応は、ヒトにとって構造的及び機能的に重要な基本的な生物学的プロセスを示し得る。例えば、異常な又は正常ではない動的な生物学的反応は、疾患及び障害などの多くの生物学的状態と関連し得る。かかる生物学的状態の例としては、神経学的状態(例えば、自閉症スペクトラム障害、統合失調症、又は注意欠陥/多動性障害(ADHD))、神経変性状態(例えば、筋萎縮性側索硬化症(ALS)、アルツハイマー病、パーキンソン病、及びハンチントン病)、並びに癌(例えば、小児癌)が挙げられ得る。
上記の背景を考えると、生物学的状態の診断、特に非侵襲的診断のための正確な方法及びシステムの必要性が存在する。そのような診断は、生物学的状態の診断のための非侵襲的方法によって検出可能なバイオマーカーの正確なプロファイリングに基づき得る。本開示は、対象から非侵襲的に得られた生物学的試料からの動的な生物学的反応データの分析に基づいて、生物学的状態を正確に診断するための改善されたシステム及び方法を提供する。生物学的状態の正確な診断のためのそのような改善されたシステム及び方法は、生物学的試料の動的免疫組織化学プロファイリングと、疾患状態の評価を目的としたそのような動的プロファイルの人工知能データ分析との組み合わせに基づき得る。本開示は、例えば、生物学的状態の診断のための生物学的試料バイオマーカーを提供することによって、これらの必要性に対処する。生物学的試料は、増分成長と関連付けられるヒト生物学的試料を含む。そのような生物学的試料は、毛幹、歯、及び爪であり得る。本開示の非侵襲的バイオマーカーは、幼児、場合によっては、1歳未満の乳児の診断に使用することができる。
一態様では、本開示は、疾患又は障害に関する対象の診断状態を予測するための方法であって、(a)対象の歯試料を染色して、染色された歯試料を生成することと、(b)染色された歯試料にわたって空間的に蛍光強度を分析することと、(c)蛍光強度の分析に少なくとも部分的に基づいて、疾患又は障害に関する対象の診断状態を予測することと、を含む、方法を提供する。
いくつかの実施形態では、分析することは、基礎的な生物学的プロセスの時間的ダイナミクスを判定する。いくつかの実施形態では、分析することは、染色された歯試料の蛍光画像を取得することと、蛍光画像の蛍光強度を分析することと、を含む。いくつかの実施形態では、蛍光強度は空間的に変化する。いくつかの実施形態では、染色された歯試料の蛍光画像を取得することは、反転又は非反転共焦点顕微鏡を使用することを含む。いくつかの実施形態では、歯試料を染色することは、C反応性タンパク質免疫組織化学染色を使用することを含む。いくつかの実施形態では、方法は、歯試料を切片化することを更に含む。いくつかの実施形態では、歯試料を染色することは、(1)歯試料を切断すること、(2)歯試料を脱石灰化すること、(3)脱石灰化された試料を切片化すること、(4)一次及び二次抗体を用いて脱石灰化された歯の切片を染色すること、(5)共焦点顕微鏡を用いて空間抗体蛍光を測定すること、並びに/又は(6)蛍光強度の時間プロファイルを抽出することを含む。
いくつかの実施形態では、疾患又は障害は、自閉症スペクトラム障害(ASD)、注意欠陥/多動性障害(ADHD)、筋萎縮性側索硬化症(ALS)、統合失調症、過敏性腸疾患(IBD)、小児腎疾患、腎移植拒絶反応、小児癌、又はそれらの任意の組み合わせを含む。いくつかの実施形態では、疾患又は障害は、ASDを含む。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、対象は、成人である。いくつかの実施形態では、対象は約12歳~約5歳である。いくつかの実施形態では、対象は、約12、11、10、9、8、7、5、4、3、2、又は1歳未満である。いくつかの実施形態では、対象は、少なくとも約1、2、3、4、5、6、7、8、9、10、11、又は12歳である。
いくつかの実施形態では、分析することは、蛍光強度に少なくとも部分的に基づいて、炎症の時間プロファイルを生成することと、炎症の時間プロファイルを分析することと、を含む。いくつかの実施形態では、炎症の時間プロファイルの少なくとも一部分は、対象の出生前期間に対応する。
いくつかの実施形態では、疾患又は障害に関する対象の診断状態を予測することは、訓練されたモデルを使用して、蛍光強度を処理することを含む。いくつかの実施形態では、処理することは、蛍光強度から特徴を抽出すること(例えば、再発定量分析によって)と、訓練されたモデルを使用して特徴を分析することと、を含む。いくつかの実施形態では、訓練されたモデルは、ニューラルネットワークアルゴリズム、サポートベクトルマシンアルゴリズム、決定木アルゴリズム、教師なしクラスタリングアルゴリズム、教師ありクラスタリングアルゴリズム、回帰アルゴリズム、勾配ブーストアルゴリズム(例えば、勾配ブーストされた決定木などの機械学習アルゴリズムの勾配ブースト実装形態)、及びそれらの任意の組み合わせからなる群から選択される。いくつかの実施形態では、訓練されたモデルは、勾配ブーストされたアンサンブルモデルを含む。いくつかの実施形態では、訓練されたモデルは、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い平均対角線長(MDL)の数、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される1つ以上の特徴を処理するように構成される。いくつかの実施形態では、1つ以上の特徴は、試料の分析から導出される蛍光強度トレースに再発定量分析(RQA)を適用することによって抽出される。いくつかの実施形態では、訓練されたモデルは、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される2つ以上の特徴を処理するように構成される。
いくつかの実施形態では、方法は、好適なコホート集団(例えば、以下の実施例の節において提供されるものなど)にわたって疾患又は障害に関する診断状態を予測する際に少なくとも約70%、75%、80%、85%又は90%の感度を有するモデルを使用して、疾患又は障害に関する対象の診断状態を予測することを更に含む。
いくつかの実施形態では、方法は、好適なコホート集団にわたって疾患又は障害に関する診断状態を予測する際に最大約70%、75%、80%、85%又は90%の感度を有するモデルを使用して、疾患又は障害に関する対象の診断状態を予測することを更に含む。
いくつかの実施形態では、方法は、好適なコホート集団にわたって疾患又は障害に関する診断状態を予測する際に少なくとも約70%、75%、80%、85%又は90%の特異性を有するモデルを使用して、疾患又は障害に関する対象の診断状態を予測することを更に含む。
いくつかの実施形態では、方法は、好適なコホート集団にわたって疾患又は障害に関する診断状態を予測する際に最大約70%、75%、80%、85%又は90%の特異性を有するモデルを使用して、疾患又は障害に関する対象の診断状態を予測することを更に含む。
いくつかの実施形態では、方法は、好適なコホート集団にわたって疾患又は障害に関する診断状態を予測する際に少なくとも約70%、75%、80%、85%又は90%の陽性予測値を有するモデルを用いて、疾患又は障害に関する対象の診断状態を予測することを更に含む。
いくつかの実施形態では、方法は、好適なコホート集団にわたって疾患又は障害に関する診断状態を予測する際に最大約70%、75%、80%、85%又は90%の陽性予測値を有するモデルを用いて、疾患又は障害に関する対象の診断状態を予測することを更に含む。
いくつかの実施形態では、方法は、好適なコホート集団にわたって疾患又は障害に関する診断状態を予測する際に少なくとも約70%、75%、80%、85%又は90%の陰性予測値を有するモデルを用いて、疾患又は障害に関する対象の診断状態を予測することを更に含む。
いくつかの実施形態では、方法は、好適なコホート集団にわたって疾患又は障害に関する診断状態を予測する際に最大約70%、75%、80%、85%又は90%の陰性予測値を有するモデルを用いて、疾患又は障害に関する対象の診断状態を予測することを更に含む。
いくつかの実施形態では、本方法は、好適なコホート集団に対して、少なくとも約0.65、少なくとも約0.70、少なくとも約0.75、少なくとも約0.80、少なくとも約0.82、少なくとも約0.84、少なくとも約0.86、少なくとも約0.88、又は少なくとも約0.90の受信者動作特性曲線下面積(AUROC)を有する疾患又は障害に関する診断状態を予測するモデルを用いて、疾患又は障害に関する対象の診断状態を予測することを更に含む。
別の態様では、本開示は、1つ以上のプロセッサと、1つ以上のプロセッサによる実行のための1つ以上のプログラムを記憶するメモリと、を備えるデバイスを提供し、1つ以上のプログラムは、(a)対象のc反応性タンパク質と関連付けられる対象の生物学的試料上の基準線に沿った複数の位置における各それぞれの位置をサンプリングし、それによって、複数の蛍光強度測定値を取得することであって、複数の蛍光強度測定値における各蛍光強度測定値が、複数の位置における異なる位置に対応し、複数の位置における各位置が、c反応性タンパク質と関連付けられる対象の生物学的試料の異なる成長期間を表す、サンプリングすることと、(b)生物学的試料上の基準線にわたって各蛍光強度を分析し、それによって、第1のデータセットを取得することと、(c)対応する複数の蛍光強度測定値からそれぞれの第2のデータセットを導出することであって、特徴の対応するセットにおける各それぞれの特徴が、c反応性タンパク質蛍光強度のばらつきによって判定される、導出することと、(d)訓練されたモデルを使用して特徴を処理して、対象が、c反応性タンパク質と関連付けられる疾患又は障害を有する可能性を判定することと、を行うための命令を含む。いくつかの実施形態では、それぞれの第2のデータセットは、対応する複数の蛍光強度測定値に再発定量分析又は関連する方法を適用することによって導出される。
いくつかの実施形態では、複数の蛍光強度測定値は、反転又は非反転共焦点顕微鏡を用いて測定される。いくつかの実施形態では、生物学的試料は、歯試料を含む。いくつかの実施形態では、歯試料はC反応性タンパク質免疫組織化学染色を使用して染色される。いくつかの実施形態では、命令は、歯試料を切片化することを更に含む。いくつかの実施形態では、命令は、歯試料を脱石灰化することを更に含む。いくつかの実施形態では、疾患又は障害は、自閉症スペクトラム障害(ASD)、注意欠陥/多動性障害(ADHD)、筋萎縮性側索硬化症(ALS)、統合失調症、過敏性腸疾患(IBD)、小児腎疾患、腎移植拒絶反応、小児癌、又はそれらの任意の組み合わせを含む。いくつかの実施形態では、疾患又は障害は、ASDを含む。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、ヒトは約12歳~約5歳である。いくつかの実施形態では、対象は、約12、11、10、9、8、7、5、4、3、2、又は1歳未満である。いくつかの実施形態では、対象は、少なくとも約1、2、3、4、5、6、7、8、9、10、11、又は12歳である。いくつかの実施形態では、分析することは、複数の蛍光強度測定値に少なくとも部分的に基づいて、炎症の時間プロファイルを生成することと、炎症の時間プロファイルを分析することと、を含む。いくつかの実施形態では、炎症の時間プロファイルの少なくとも一部分は、対象の出生前期間に対応する。いくつかの実施形態では、疾患又は障害に関する対象の診断状態を予測することは、訓練されたモデルを使用して、複数の蛍光強度測定値を処理することを含む。いくつかの実施形態では、訓練されたモデルは、ニューラルネットワークアルゴリズム、サポートベクトルマシンアルゴリズム、決定木アルゴリズム、教師なしクラスタリングアルゴリズム、教師ありクラスタリングアルゴリズム、回帰アルゴリズム、勾配ブーストアルゴリズム、及びそれらの任意の組み合わせからなる群から選択される。いくつかの実施形態では、訓練されたモデルは、勾配ブーストされた決定木を含む。いくつかの実施形態では、訓練されたモデルは、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される1つ以上の特徴を処理するように構成される。いくつかの実施形態では、訓練されたモデルは、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間(TT)、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される2つ以上の特徴を処理するように構成される。
別の態様では、本開示は、非一時的コンピュータ可読記憶媒体及び非一時的コンピュータ可読記憶媒体に埋め込まれた1つ以上のコンピュータプログラムを提供し、1つ以上のコンピュータプログラムは、命令を含み、命令が、コンピュータシステムによって実行されるとき、コンピュータシステムに、(a)対象のc反応性タンパク質と関連付けられる対象の生物学的試料上の基準線に沿った複数の位置における各それぞれの位置をサンプリングし、それによって、複数の蛍光強度測定値を取得することであって、複数の蛍光強度測定値における各蛍光強度測定値が、複数の位置における異なる位置に対応し、複数の位置における各位置が、c反応性タンパク質と関連付けられる対象の生物学的試料の異なる成長期間を表す、サンプリングすることと、(b)生物学的試料上の基準線にわたって各蛍光強度を分析し、それによって、第1のデータセットを取得することと、(c)対応する複数の蛍光強度測定値からそれぞれの第2のデータセットを導出することであって、特徴の対応するセットにおける各それぞれの特徴が、c反応性タンパク質蛍光強度の連続した変動によって判定される、導出することと、(d)訓練されたモデルを使用して特徴を処理して、対象が、c反応性タンパク質と関連付けられる疾患又は障害を有する可能性を判定することと、を含む方法を行わせる。いくつかの実施形態では、それぞれの第2のデータセットは、対応する複数の蛍光強度測定値に再発定量分析又は関連する方法を適用することによって導出される。
いくつかの実施形態では、複数の蛍光強度測定値は、反転又は非反転共焦点顕微鏡を用いて測定される。いくつかの実施形態では、生物学的試料は、歯試料を含む。いくつかの実施形態では、歯試料はC反応性タンパク質免疫組織化学染色を使用して染色される。いくつかの実施形態では、方法は、歯試料を切片化することを更に含む。いくつかの実施形態では、方法は、歯試料を脱石灰化することを更に含む。いくつかの実施形態では、疾患又は障害は、自閉症スペクトラム障害(ASD)、注意欠陥/多動性障害(ADHD)、筋萎縮性側索硬化症(ALS)、統合失調症、過敏性腸疾患(IBD)、小児腎疾患、腎移植拒絶反応、小児癌、又はそれらの任意の組み合わせを含む。いくつかの実施形態では、疾患又は障害は、ASDを含む。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、対象は、5歳未満である。いくつかの実施形態では、対象は、1歳未満である。いくつかの実施形態では、分析することは、複数の蛍光強度測定値に少なくとも部分的に基づいて、炎症の時間プロファイルを生成することと、炎症の時間プロファイルを分析することと、を含む。いくつかの実施形態では、炎症の時間プロファイルの少なくとも一部分は、対象の出生前期間に対応する。いくつかの実施形態では、疾患又は障害に関する対象の診断状態を予測することは、訓練されたモデルを使用して、複数の蛍光強度測定値を処理することを含む。いくつかの実施形態では、訓練されたモデルは、ニューラルネットワークアルゴリズム、サポートベクトルマシンアルゴリズム、決定木アルゴリズム、教師なしクラスタリングアルゴリズム、教師ありクラスタリングアルゴリズム、回帰アルゴリズム、勾配ブーストアルゴリズム、及びそれらの任意の組み合わせからなる群から選択される。いくつかの実施形態では、訓練されたモデルは、勾配ブーストされた決定木を含む。いくつかの実施形態では、訓練されたモデルは、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される1つ以上の特徴を処理するように構成される。いくつかの実施形態では、訓練されたモデルは、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間(TT)、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される2つ以上の特徴を処理するように構成される。
別の態様では、本開示は、モデルを訓練するための方法であって、1つ以上のプロセッサと、1つ以上のプロセッサによって実行するための1つ以上のプログラムを記憶するメモリと、を有するコンピュータシステムにおいて、(a)複数の訓練対象における訓練対象の第1のサブセットが、c反応性タンパク質と関連付けられる第1の生物学的状態を有することに対応する第1の診断状態を有し、複数の訓練対象における訓練対象の第2のサブセットが、c反応性タンパク質と関連付けられる第1の生物学的状態を有しないことに対応する第2の診断状態を有する、複数の訓練対象における各それぞれの訓練対象について、(i)対象のc反応性タンパク質と関連付けられる対象の生物学的試料上の基準線に沿った複数の位置における各それぞれの位置をサンプリングし、それによって、複数の蛍光強度測定値を取得することであって、複数の蛍光強度測定値における各蛍光強度測定値が、複数の位置における異なる位置に対応し、複数の位置における各位置が、c反応性タンパク質と関連付けられる対象の生物学的試料の異なる成長期間を表す、サンプリングすることと、(ii)生物学的試料上の基準線にわたって各蛍光強度を分析し、それによって第1のデータセットを取得することと、(iii)対応する複数の蛍光強度測定値からそれぞれの第2のデータセットを導出することであって、特徴の対応するセットにおける各それぞれの特徴が、c反応性タンパク質蛍光強度におけるばらつきによって判定される、導出することと、(b)(i)複数の訓練対象における各訓練対象の各それぞれの第2のデータセットの特徴の対応するセット、及び(ii)第1の診断状態及び第2の診断状態の中から選択される、複数の訓練対象における各訓練対象の対応する診断状態を用いて、訓練されていないか又は部分的に訓練されていないモデルを訓練し、それによって、試験対象のc反応性タンパク質と関連付けられる生物学的試料から取得された特徴のセットにおける特徴の値に基づいて、試験対象がc反応性タンパク質と関連付けられる第1の生物学的状態を有するかどうかに関する指示を提供する訓練されたモデルを取得することと、を含む、方法を提供する。いくつかの実施形態では、それぞれの第2のデータセットは、対応する複数の蛍光強度測定値に再発定量分析又は関連する方法を適用することによって導出される。
いくつかの実施形態では、訓練されたモデルは、ニューラルネットワークアルゴリズム、サポートベクトルマシンアルゴリズム、決定木アルゴリズム、教師なしクラスタリングモデルアルゴリズム、教師ありクラスタリングモデルアルゴリズム、回帰モデル、勾配ブーストアルゴリズム(例えば、勾配ブーストされた決定木などの機械学習アルゴリズムの勾配ブースト実装形態)、又はそれらの任意の組み合わせである。いくつかの実施形態では、訓練されたモデルは、勾配ブーストされたアンサンブルモデルを含む。いくつかの実施形態では、訓練されたモデルは、多項式分布に対する転帰を予測する。いくつかの実施形態では、訓練されたモデルは二項分布に対する転帰を予測する。いくつかの実施形態では、c反応性タンパク質と関連付けられる第1の生物学的状態は、自閉症スペクトラム障害(ASD)、注意欠陥/多動性障害(ADHD)、筋萎縮性側索硬化症(ALS)、統合失調症、過敏性腸疾患(IBD)、小児腎疾患、腎臓移植拒絶反応、及び小児癌からなる群から選択される。
いくつかの実施形態では、c反応性タンパク質と関連付けられる第1の生物学的状態について試験対象を評価することは、c反応性タンパク質と関連付けられる第1の生物学的状態の存在と、c反応性タンパク質と関連付けられる第1の生物学的状態の非存在とを区別することを更に含む。いくつかの実施形態では、c反応性タンパク質と関連付けられる第1の生物学的状態について試験対象を評価することは、c反応性タンパク質と関連付けられる第1の生物学的状態と、c反応性タンパク質と関連付けられる第1の生物学的状態とは異なるc反応性タンパク質と関連付けられる第2の生物学的状態とを区別することを更に含む。いくつかの実施形態では、第1の生物学的状態は、自閉症スペクトラム障害であり、第2の生物学的状態は、定型発達であり、すなわち、神経発達障害の非存在である。いくつかの実施形態では、第1の生物学的状態は、自閉症スペクトラム障害であり、第2の生物学的状態は、注意欠陥/多動性障害である。いくつかの実施形態では、試験対象は、ヒトである。いくつかの実施形態では、ヒトは、約12歳~約5歳である。いくつかの実施形態では、対象は、約12、11、10、9、8、7、5、4、3、2、又は1歳未満である。いくつかの実施形態では、対象は、少なくとも約1、2、3、4、5、6、7、8、9、10、11、又は12歳である。いくつかの実施形態では、それぞれの訓練対象のc反応性タンパク質と関連付けられる対応する生物学的試料は、毛幹、歯、及び爪からなる群から選択される。いくつかの実施形態では、それぞれの訓練対象のc反応性タンパク質と関連付けられる対応する生物学的試料は、毛幹であり、基準線は、毛幹の長手方向に対応する。いくつかの実施形態では、それぞれの訓練対象のc反応性タンパク質と関連付けられる対応する生物学的試料は、歯であり、基準線は、歯の新生児線を含む、成長帯を横切る方向に対応する。いくつかの実施形態では、それぞれの訓練対象のc反応性タンパク質と関連付けられる対応する生物学的試料に沿った対応する複数の位置における第1の位置が、それぞれの訓練対象のc反応性タンパク質と関連付けられる対応する生物学的試料の先端に最も近い位置に対応するように、対応する複数の位置は配列される。いくつかの実施形態では、対応する複数の蛍光強度測定値における各トレースは、複数のデータポイントを含み、各データポイントは、複数の位置におけるそれぞれの位置のインスタンスである。いくつかの実施形態では、特徴の対応するセットは、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される。いくつかの実施形態では、特徴は、蛍光トレースの再発定量分析又は関連する計算分析から導出される。いくつかの実施形態では、対応する複数の位置は、少なくとも1000、1500、2000、2500、3000、3500、4000、4500、5000、6000、7000、8000、9000、10000、12000、14000、16000、18000、20000、又は20000を超える位置を含む。
本開示の別の態様は、1つ以上のコンピュータプロセッサによって実行されると、上記又は本明細書の他の場所の方法のいずれかを実施する、機械実行可能コードを含む非一時的コンピュータ可読媒体を提供する。
本開示の別の態様は、1つ以上のコンピュータプロセッサと、コンピュータプロセッサに結合されたコンピュータメモリと、を含むシステムを提供する。コンピュータメモリは、1つ以上のコンピュータプロセッサによって実行されると、上記又は本明細書の他の場所の方法のいずれかを実施する、機械実行可能コードを含む。
本開示の更なる態様及び利点は、以下の詳細な説明から当業者に容易に明らかになり、ここでは、本開示の例解的な実施形態のみが、図示及び説明される。理解されるように、本開示は、他の異なる実施形態が可能であり、そのいくつかの詳細は、全て本開示から逸脱することなく、様々な明白な点で修正が可能である。したがって、図面及び説明は、限定ではなく、本質的に例解的であるとみなされるべきである。
参照による組み込み
本明細書において言及される全ての刊行物、特許、及び特許出願は、各個々の刊行物、特許、又は特許出願が参照により組み込まれることが具体的かつ個別に示された場合と同じ程度に、参照により本明細書に組み込まれる。参照により組み込まれる刊行物及び特許又は特許出願が本明細書に含まれる開示と矛盾する範囲において、本明細書は、そのような矛盾する材料に取って代わり、かつ/又は優先することを意図する。
本発明の新規特徴は、添付の特許請求の範囲に詳細に記載される。本発明の原理が利用される例解的な実施形態を記載する以下の詳細な説明、及び付属の図面(本明細書では「図」とも呼ばれる)を参照することにより、本発明の特徴及び利点のより良好な理解が得られる。
本開示のコンピューティングデバイス100のブロック図の例を示す。 対象の毛髪試料(図2A)、歯試料(図2B)、及び爪試料(図2C)の例解図を示す。 生物学的状態について対象を評価するための方法300のフローチャートを示す。 本明細書で提供される方法を実施するようにプログラムされるか、又はそうでなければ構成されるコンピュータシステムを示す。 経時的な対象の毎日のC反応性タンパク質プロファイルの例を示し、y軸はCRP強度を示し、x軸は発達年齢を示す。 出生前及び幼児期(例えば、1歳まで)にサンプリングされたC反応性タンパク質プロファイルの再発定量分析から導出される特徴を利用して訓練されたモデルを用いて、様々な予測閾値で自閉症を診断するための方法の感度及び特異性を特徴付けるための受信者動作特性(ROC)曲線を示す。デバイスのパフォーマンスは、様々な分類閾値でのパフォーマンスの尺度を提供するROCプロットの曲線下面積(AUC)を計算することによって測定される。ここで、AUCは0.86であり、堅牢で正確な予測パフォーマンスを示す。
本発明の様々な実施形態が本明細書に示され、記載されているが、そのような実施形態が例としてのみ提供されることは、当業者には明白であろう。本発明から逸脱することなく、多数の変形、変更、及び置換がここで当業者に想起され得る。本明細書に記載される本発明の実施形態に対する様々な代替案が、使用され得ることは理解されるべきである。
動的な生物学的反応は、ヒトにとって構造的及び機能的に重要な基本的な生物学的プロセスを示し得る。例えば、異常な又は正常ではない動的な生物学的反応は、疾患及び障害などの多くの生物学的状態と関連し得る。かかる生物学的状態の例としては、神経学的状態(例えば、自閉症スペクトラム障害、統合失調症、又は注意欠陥/多動性障害(ADHD))、神経変性状態(例えば、筋萎縮性側索硬化症(ALS)、アルツハイマー病、パーキンソン病、及びハンチントン病)、並びに癌(例えば、小児癌)が挙げられ得る。
上記の背景を考えると、生物学的状態の診断、特に非侵襲的診断のための正確な方法及びシステムの必要性が存在する。そのような診断は、生物学的状態の診断のための非侵襲的方法によって検出可能なバイオマーカーの正確なプロファイリングに基づき得る。本開示は、対象から非侵襲的に得られた生物学的試料からの動的な生物学的反応データの分析に基づいて、生物学的状態を正確に診断するための改善されたシステム及び方法を提供する。生物学的状態の正確な診断のためのそのような改善されたシステム及び方法は、生物学的試料の動的免疫組織化学プロファイリングと、疾患状態の評価を目的としたそのような動的プロファイルの人工知能データ分析との組み合わせに基づき得る。本開示は、例えば、生物学的状態の診断のための生物学的試料バイオマーカーを提供することによって、これらの必要性に対処する。生物学的試料は、増分成長と関連付けられるヒト生物学的試料を含む。そのような生物学的試料は、毛幹、歯、及び爪であり得る。本開示の非侵襲的バイオマーカーは、幼児、場合によっては、1歳未満の乳児の診断に使用することができる。いくつかの場合には、子供は約12歳~約5歳であり得る。いくつかの実施形態では、子供は、約12、11、10、9、8、7、5、4、3、2、又は1歳未満である。いくつかの実施形態では、子供は、少なくとも約1、2、3、4、5、6、7、8、9、10、11、又は12歳であり得る。
一態様では、本開示は、疾患又は障害に関する対象の診断状態を予測するための方法であって、(a)対象の歯試料を染色して、染色された歯試料を生成することと、(b)染色された歯試料にわたって空間的に蛍光強度を分析することと、(c)蛍光強度の分析に少なくとも部分的に基づいて、疾患又は障害に関する対象の診断状態を予測することと、を含む、方法を提供する。
いくつかの実施形態では、分析することは、染色された歯試料の蛍光画像を取得することと、蛍光画像の蛍光強度を分析することと、を含む。いくつかの実施形態では、染色された歯試料の蛍光画像を取得することは、反転又は非反転共焦点顕微鏡を使用することを含む。いくつかの実施形態では、歯試料を染色することは、C反応性タンパク質免疫組織化学染色を使用することを含む。いくつかの実施形態では、方法は、歯試料を切片化することを更に含む。いくつかの実施形態では、歯試料を染色することは、歯試料を脱石灰化することを含む。
いくつかの実施形態では、本明細書に開示されるシステム及び方法は、C反応性タンパク質蛍光免疫組織化学染色を単独で、又は他の技術と組み合わせて使用し得る。そのような技術は、レーザアブレーション誘導結合プラズマ質量分析(LA-ICP-MS)、ラマン分光法、又はそれらの任意の組み合わせを含み得る。いくつかの実施形態では、技術を組み合わせることは、所与の技術のみの診断精度又は精度を改善し得る。いくつかの実施形態では、LA-ICP-MSの付加は、C反応性タンパク質蛍光免疫組織化学データの診断力を補完し得る所与の生物学的試料の複数の非侵襲的金属代謝バイオマーカーを提供し得る。いくつかの実施形態では、金属代謝バイオマーカーは、亜鉛、スズ、マグネシウム、銅、ヨウ化物、リチウム、アルミニウム、リン、硫黄、カルシウム、クロム、マンガン、鉄、コバルト、ニッケル、ヒ素、ストロンチウム、カドミウム、スズ、ヨウ素、バリウム、水銀、鉛、ビスマス、モリブデン、又はそれらの任意の組み合わせを含み得る。いくつかの実施形態では、ラマン分光法の付加は、C反応性タンパク質蛍光免疫組織化学データの診断力を補完するために、疾患又は外部ストレッサーによって誘発される生理学的変化を示す複数のスペクトラムを提供し得る。
いくつかの実施形態では、疾患又は障害は、自閉症スペクトラム障害(ASD)、注意欠陥/多動性障害(ADHD)、筋萎縮性側索硬化症(ALS)、統合失調症、過敏性腸疾患(IBD)、小児腎疾患、腎移植拒絶反応、小児癌、又はそれらの任意の組み合わせを含む。いくつかの実施形態では、疾患又は障害は、ASDを含む。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、対象は、成人である。いくつかの実施形態では、対象は、約12歳から約5歳であり得る。いくつかの実施形態では、対象は、約12、11、10、9、8、7、5、4、3、2、又は1歳未満であり得る。いくつかの実施形態では、対象は、少なくとも約1、2、3、4、5、6、7、8、9、10、11、又は12歳であり得る。
いくつかの実施形態では、分析することは、蛍光強度に少なくとも部分的に基づいて、炎症の時間プロファイルを生成することと、炎症の時間プロファイルを分析することと、を含む。いくつかの実施形態では、炎症の時間プロファイルの少なくとも一部分は、対象の出生前期間に対応する。
いくつかの実施形態では、疾患又は障害に関する対象の診断状態を予測することは、訓練されたモデルを使用して、蛍光強度を処理することを含む。いくつかの実施形態では、この訓練されたモデルは、複数のパラメータを含み、「パラメータ」という用語は、モデル内の1つ以上の入力、出力、及び/又は機能に影響を与える(例えば、修正、調整、及び/又は調整する)ことができる(例えば、モデルがリグレッサ又は分類器である場合)、モデル内の内部又は外部要素(例えば、重み及び/又はハイパーパラメータ)の任意の係数又は同様に任意の値を指す。例えば、いくつかの実施形態では、モデルのパラメータは、モデルの挙動、学習、及び/又はパフォーマンスを制御、修正、調整、及び/又は調整するために使用され得る任意の係数、重み、及び/又はハイパーパラメータを指す。いくつかの例では、パラメータは、モデルへの入力(例えば、特徴)の影響を増加又は減少させるために使用される。非限定的な例として、いくつかの実施形態では、パラメータは、ノード(例えば、ニューラルネットワーク)の影響を増加又は減少させるために使用され、ノードは、1つ以上の活性化関数を含む。モデルの特定の入力、出力、及び/又は機能へのパラメータの割り当ては、所与のモデルの任意の1つのパラダイムに限定されないが、所望のパフォーマンスのために任意の好適なモデルで使用され得る。いくつかの実施形態では、パラメータは、固定値を有する。いくつかの実施形態では、パラメータの値は、手動及び/又は自動的に調整可能である。いくつかの実施形態では、パラメータの値は、モデルの検証及び/又は訓練プロセスによって(例えば、エラー最小化及び/又は逆伝播方法によって)修正される。いくつかの実施形態では、本開示のモデルは、複数のパラメータを含む。いくつかの実施形態では、モデル(例えば、訓練されていないか、部分的に訓練されたか、又は完全に訓練されたモデル)と関連付けられる複数のパラメータは、n個のパラメータであり、n≧2、n≧5、n≧10、n≧25、n≧40、n≧50、n≧75、n≧100、n≧125、n≧150、n≧200、n≧225、n≧250、n≧350、n≧500、n≧600、n≧750、n≧1,000、n≧2,000、n≧4,000、n≧5,000、n≧7,500、n≧10,000、n≧20,000、n≧40,000、n≧75,000、n≧100,000、n≧200,000、n≧500,000、n≧1×10、n≧5×10、又はn≧1×10である。いくつかの実施形態では、nは、10,000~1×10、100,000~5×10、又は500,000~1×10である。
いくつかの実施形態では、訓練されたモデルを使用して蛍光強度を処理することは、蛍光強度から特徴を抽出すること(例えば、再発定量分析によって)と、訓練されたモデルを使用して特徴を分析することと、を含む。いくつかの実施形態では、訓練されたモデルは、ニューラルネットワークアルゴリズム、サポートベクトルマシンアルゴリズム、決定木アルゴリズム、教師なしクラスタリングアルゴリズム、教師ありクラスタリングアルゴリズム、回帰アルゴリズム、勾配ブーストアルゴリズム(例えば、勾配ブーストされた決定木などの機械学習アルゴリズムの勾配ブースト実装形態)、及びそれらの任意の組み合わせからなる群から選択される。いくつかの実施形態では、訓練されたモデルは、勾配ブーストされたアンサンブルモデルを含む。いくつかの実施形態では、訓練されたモデルは、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される1つ以上の特徴を処理するように構成される。いくつかの実施形態では、1つ以上の特徴は、試料の分析から導出される蛍光強度トレースに再発定量分析(RQA)を適用することによって抽出される。いくつかの実施形態では、訓練されたモデルは、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される2つ以上の特徴を処理するように構成される。
いくつかの実施形態では、方法は、少なくとも約80%の感度を伴って疾患又は障害に関する対象の診断状態を予測することを更に含む。いくつかの実施形態では、方法は、少なくとも約80%の特異性を伴って疾患又は障害に関する対象の診断状態を予測することを更に含む。いくつかの実施形態では、方法は、少なくとも約80%の陽性予測値を伴って疾患又は障害に関する対象の診断状態を予測することを更に含む。いくつかの実施形態では、方法は、少なくとも約80%の陰性予測値を伴って疾患又は障害に関する対象の診断状態を予測することを更に含む。いくつかの実施形態では、方法は、少なくとも約0.80の受信者動作特性曲線下面積(AUROC)を伴って疾患又は障害に関する対象の診断状態を予測することを更に含む。
別の態様では、本開示は、1つ以上のプロセッサと、1つ以上のプロセッサによる実行のための1つ以上のプログラムを記憶するメモリと、を備えるデバイスを提供し、1つ以上のプログラムは、(a)対象のc反応性タンパク質と関連付けられる対象の生物学的試料上の基準線に沿った複数の位置における各それぞれの位置をサンプリングし、それによって、複数の蛍光強度測定値を取得することであって、複数の蛍光強度測定値における各蛍光強度測定値が、複数の位置における異なる位置に対応し、複数の位置における各位置が、c反応性タンパク質と関連付けられる対象の生物学的試料の異なる成長期間を表す、サンプリングすることと、(b)生物学的試料上の基準線にわたって各蛍光強度を分析し、それによって、第1のデータセットを取得することと、(c)対応する複数の蛍光強度測定値からそれぞれの第2のデータセットを導出することであって、特徴の対応するセットにおける各それぞれの特徴が、c反応性タンパク質蛍光強度の連続した変動によって判定される、導出することと、(d)訓練されたモデルを使用して、特徴を処理して、対象が、c反応性タンパク質と関連付けられる疾患又は障害を有する可能性を判定することと、を行うための命令を含む。いくつかの実施形態では、それぞれの第2のデータセットは、対応する複数の蛍光強度測定値に再発定量分析又は関連する方法を適用することによって導出される。
別の態様では、本開示は、非一時的コンピュータ可読記憶媒体及び非一時的コンピュータ可読記憶媒体に埋め込まれた1つ以上のコンピュータプログラムを提供し、1つ以上のコンピュータプログラムは、命令を含み、命令が、コンピュータシステムによって実行されるとき、コンピュータシステムに、(a)対象のc反応性タンパク質と関連付けられる対象の生物学的試料上の基準線に沿った複数の位置における各それぞれの位置をサンプリングし、それによって、複数の蛍光強度測定値を取得することであって、複数の蛍光強度測定値における各蛍光強度測定値が、複数の位置における異なる位置に対応し、複数の位置における各位置が、c反応性タンパク質と関連付けられる対象の生物学的試料の異なる成長期間を表す、サンプリングすることと、(b)生物学的試料上の基準線にわたって各蛍光強度を分析し、それによって、第1のデータセットを取得することと、(c)対応する複数の蛍光強度測定値からそれぞれの第2のデータセットを導出することであって、特徴の対応するセットにおける各それぞれの特徴が、c反応性タンパク質蛍光強度の連続した変動によって判定される、導出することと、(d)訓練されたモデルを使用して特徴を処理して、対象が、c反応性タンパク質と関連付けられる疾患又は障害を有する可能性を判定することと、を含む方法を行わせる。いくつかの実施形態では、それぞれの第2のデータセットは、対応する複数の蛍光強度測定値に再発定量分析又は関連する方法を適用することによって導出される。
別の態様では、本開示は、モデルを訓練するための方法であって、1つ以上のプロセッサと、1つ以上のプロセッサによって実行するための1つ以上のプログラムを記憶するメモリと、を有するコンピュータシステムにおいて、(a)複数の訓練対象における訓練対象の第1のサブセットが、c反応性タンパク質と関連付けられる第1の生物学的状態を有することに対応する第1の診断状態を有し、複数の訓練対象における訓練対象の第2のサブセットが、c反応性タンパク質と関連付けられる第1の生物学的状態を有しないことに対応する第2の診断状態を有する、複数の訓練対象における各それぞれの訓練対象について、(i)対象のc反応性タンパク質と関連付けられる対象の生物学的試料上の基準線に沿った複数の位置における各それぞれの位置をサンプリングし、それによって、複数の蛍光強度測定値を取得することであって、複数の蛍光強度測定値における各蛍光強度測定値が、複数の位置における異なる位置に対応し、複数の位置における各位置が、c反応性タンパク質と関連付けられる対象の生物学的試料の異なる成長期間を表す、サンプリングすることと、(ii)生物学的試料上の基準線にわたって各蛍光強度を分析し、それによって第1のデータセットを取得することと、(iii)対応する複数の蛍光強度測定値からそれぞれの第2のデータセットを導出することであって、特徴の対応するセットにおける各それぞれの特徴が、c反応性タンパク質蛍光強度のばらつきによって判定される、導出することと、(b)(i)複数の訓練対象における各訓練対象の各それぞれの第2のデータセットの特徴の対応するセット、及び(ii)第1の診断状態及び第2の診断状態の中から選択される、複数の訓練対象における各訓練対象の対応する診断状態を用いて、訓練されていないか又は部分的に訓練されていないモデルを訓練し、それによって、試験対象のc反応性タンパク質と関連付けられる生物学的試料から取得された特徴のセットにおける特徴の値に基づいて、試験対象がc反応性タンパク質と関連付けられる第1の生物学的状態を有するかどうかに関する指示を提供する訓練されたモデルを取得することと、を含む、方法を提供する。いくつかの実施形態では、それぞれの第2のデータセットは、対応する複数の蛍光強度測定値に再発定量分析又は関連する方法を適用することによって導出される。
いくつかの実施形態では、訓練されたモデルは、ニューラルネットワークアルゴリズム、サポートベクトルマシンアルゴリズム、決定木アルゴリズム、教師なしクラスタリングモデルアルゴリズム、教師ありクラスタリングモデルアルゴリズム、回帰モデル、勾配ブーストアルゴリズム(例えば、勾配ブーストされた決定木などの機械学習アルゴリズムの勾配ブースト実装形態)、又はそれらの任意の組み合わせである。いくつかの実施形態では、訓練された機械学習モデルは、勾配ブーストされたアンサンブルモデルを含む。いくつかの実施形態では、訓練されたモデルは、多項式分布に対する転帰を予測する。いくつかの実施形態では、訓練されたモデルは二項分布に対する転帰を予測する。いくつかの実施形態では、c反応性タンパク質と関連付けられる第1の生物学的状態は、自閉症スペクトラム障害(ASD)、注意欠陥/多動性障害(ADHD)、筋萎縮性側索硬化症(ALS)、統合失調症、過敏性腸疾患(IBD)、小児腎疾患、腎臓移植拒絶反応、及び小児癌からなる群から選択される。
いくつかの実施形態では、c反応性タンパク質と関連付けられる第1の生物学的状態について試験対象を評価することは、c反応性タンパク質と関連付けられる第1の生物学的状態の存在と、c反応性タンパク質と関連付けられる第1の生物学的状態の非存在とを区別することを更に含む。いくつかの実施形態では、c反応性タンパク質と関連付けられる第1の生物学的状態について試験対象を評価することは、c反応性タンパク質と関連付けられる第1の生物学的状態と、c反応性タンパク質と関連付けられる第1の生物学的状態とは異なるc反応性タンパク質と関連付けられる第2の生物学的状態とを区別することを更に含む。いくつかの実施形態では、第1の生物学的状態は、自閉症スペクトラム障害であり、第2の生物学的状態は、定型発達であり、すなわち、神経発達障害の非存在である。いくつかの実施形態では、第1の生物学的状態は、自閉症スペクトラム障害であり、第2の生物学的状態は、注意欠陥/多動性障害である。いくつかの実施形態では、試験対象は、ヒトである。いくつかの実施形態では、ヒトは、約12歳~約5歳であり得る。いくつかの実施形態では、ヒトは、約12、11、10、9、8、7、5、4、3、2、又は1歳未満であり得る。いくつかの実施形態では、ヒトは、少なくとも約1、2、3、4、5、6、7、8、9、10、11、又は12歳であり得る。いくつかの実施形態では、それぞれの訓練対象のc反応性タンパク質と関連付けられる対応する生物学的試料は、毛幹、歯、及び爪からなる群から選択される。いくつかの実施形態では、それぞれの訓練対象のc反応性タンパク質と関連付けられる対応する生物学的試料は、毛幹であり、基準線は、毛幹の長手方向に対応する。いくつかの実施形態では、それぞれの訓練対象のc反応性タンパク質と関連付けられる対応する生物学的試料は、歯であり、基準線は、歯の新生児線を含む、成長帯を横切る方向に対応する。いくつかの実施形態では、それぞれの訓練対象のc反応性タンパク質と関連付けられる対応する生物学的試料に沿った対応する複数の位置における第1の位置が、それぞれの訓練対象のc反応性タンパク質と関連付けられる対応する生物学的試料の先端に最も近い位置に対応するように、対応する複数の位置は配列される。いくつかの実施形態では、対応する複数の蛍光強度測定値における各トレースは、複数のデータポイントを含み、各データポイントは、複数の位置におけるそれぞれの位置のインスタンスである。いくつかの実施形態では、特徴の対応するセットは、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される。いくつかの実施形態では、特徴は、蛍光トレースの再発定量分析又は関連する計算分析から導出される。いくつかの実施形態では、対応する複数の位置は、少なくとも1000、1500、2000、2500、3000、3500、4000、4500、5000、6000、7000、8000、9000、10000、12000、14000、16000、18000、20000、又は20000を超える位置を含む。
例示的なシステムの詳細は、本開示のコンピューティングデバイス100のブロック図の例を示す図1と併せて説明される。いくつかの実装形態では、デバイス100は、1つ以上のプロセッシングユニットCPU102(プロセッサとも称される)と、1つ以上のネットワークインターフェース104と、ユーザインターフェース106と、非永続的メモリ111と、永続的メモリ112と、これらのコンポーネントを相互接続するための1つ以上の通信バス114と、を含む。1つ以上の通信バス114は、システムコンポーネント間の通信を相互接続及び制御する回路(チップセットと呼ばれることもある)を任意選択で含む。非永続的メモリ111は、典型的には、DRAM、SRAM、DDR RAM、ROM、EEPROM、フラッシュメモリなどの高速ランダムアクセスメモリを含み、一方、永続的メモリ112は、典型的には、CD-ROM、デジタル汎用ディスク(DVD)、又は他の光学ストレージ、磁気カセット、磁気テープ、磁気ディスクストレージ、又は他の磁気ストレージデバイス、磁気ディスクストレージデバイス、光学ディスクストレージデバイス、フラッシュメモリデバイス、又は他の不揮発性固体ストレージデバイスを含む。永続的メモリ112は、任意選択で、CPU102から遠隔に位置する1つ以上のストレージデバイスを含む。永続的メモリ112、及び非永続的メモリ112内の不揮発性メモリデバイスは、非一時的コンピュータ可読記憶媒体を含む。いくつかの実装形態では、非永続的メモリ111又は代替的に非一時的コンピュータ可読記憶媒体は、場合によっては永続的メモリ112とともに、以下のプログラム、モジュール、及びデータ構造、又はそのサブセットを記憶し、すなわち、様々な基本システムサービスに対処し、かつハードウェア依存タスクを行うための手順を含む任意選択的なオペレーティングシステム116と、システム100を他のデバイス及び/又は通信ネットワーク104と接続するための任意選択的なネットワーク通信モジュール(又は命令)118と、生物学的状態について対象を評価するための訓練モデルのための任意選択的な分類器訓練モジュール120と、1つ以上の訓練対象124についての特徴データを含む、訓練対象からの生物学的試料についてのデータセットのための任意選択的なデータストア122であって、特徴データが、特徴126の各々と関連付けられるパラメータ、及び診断状態128(例えば、それぞれの訓練対象が生物学的状態を有すると診断されたか、又は生物学的状態を有すると診断されていないことの指示)を含む、データストア122と、生物学的状態を区別するモデルを検証するための任意選択的な分類器検証モジュール130と、検証対象からの生物学的試料についてのデータセットのための任意選択的なデータストア132と、例えば、分類器訓練モジュール120を使用して訓練されたように、生物学的状態を有する対象を分類するための任意選択的な患者分類モジュール134と、を記憶する。
様々な実装形態では、上記の識別された要素のうちの1つ以上は、先に言及したメモリデバイスのうちの1つ以上に記憶され、上記で説明した機能を実行するための命令のセットに対応する。上記の識別されたモジュール、データ、又はプログラム(例えば、命令のセット)は、別個のソフトウェアプログラム、手順、データセット、又はモジュールとして実装される必要はなく、したがって、これらのモジュール及びデータの様々なサブセットは、様々な実装形態で組み合わされ得るか、又は別様に再配置され得る。いくつかの実装形態では、非永続的メモリ111は、任意選択で、上記で識別されたモジュール及びデータ構造のサブセットを記憶する。更に、いくつかの実施形態では、メモリは、上で説明していない追加のモジュール及びデータ構造を記憶する。いくつかの実施形態では、上記の識別された要素のうちの1つ以上は、視覚化システム100のコンピュータシステム以外のコンピュータシステムに記憶され、このコンピュータシステムは、視覚化システム100によってアドレス指定可能であり、それによって、視覚化システム100は、必要なときにそのようなデータの全部又は一部分を取り出し得る。
いくつかの実施形態では、システム100は、化学分析を行うための1つ以上の分析デバイスに接続されるか、又はそれらの分析デバイスを含む。例えば、任意選択的なネットワーク通信モジュール(又は命令)118は、例えば、通信ネットワーク104を介して、システム100を1つ以上の分析デバイスと接続するように構成される。いくつかの実施形態では、1つ以上の分析デバイスは、レーザアブレーション誘導結合プラズマ質量分析計(LA-ICP-MS)、蛍光イメージセンサ、又はラマン分光分析計を含む。
図1は、「システム100」を描写するが、図は、本明細書に記載される実装の構造的な概略図ではなく、コンピュータシステムに存在し得る様々な特徴の機能的な説明としてより意図される。実際には、かつ当業者によって認識されるように、別個に示される項目は、組み合わされ得、いくつかの項目は、分離され得る。更に、図1は、非永続的メモリ111内のある特定のデータ及びモジュールを描写するが、これらのデータ及びモジュールのいくつか又は全ては、永続的メモリ112内に記憶され得る。
いくつかの実施形態では、本開示の方法は、生物学的試料(例えば、毛幹を含む1本の毛髪)を得ることを含む。対象は、ヒトであり得る。いくつかの実施形態では、対象は、5歳以下の小児(例えば、小児は、5歳、4歳、3歳、2歳、1歳、9ヶ月、6ヶ月、3ヶ月、又は1ヶ月以下の小児)である。いくつかの実施形態では、対象は、成人である。図2Aは、毛幹を含む対象の毛髪試料の例を示す。毛髪試料は、(例えば、はさみの助けを借りて)対象から単に切り取られ得る。毛髪試料を取得する方法は、非侵襲的であり得る。得られた毛髪試料は、1cmの最小長さを有し得る(例えば、毛髪試料は、長さが1cm、2cm、3cm、4cm、又は5cmである)。毛髪試料は、毛髪の任意の部分(例えば、先端又は先端と毛包との間の部分)を含み得る。特に、毛髪の毛包を含む毛髪試料については特別な要件はない。図2Bは、対象の歯試料の例を示す。図2Cは、対象の爪試料の例を示す。爪又は毛髪の例では、生物学的試料を取得することは、爪又は毛髪がサンプリングされ得るように対象を位置決めすることを指し得る。爪試料は、爪全体又は切り取った爪を含み得る。
いくつかの実施形態では、得られた生物学的試料は、生物学的試料を1つ以上の溶媒及び/又は界面活性剤を用いて洗浄及び乾燥することによって前処理されるなど、前処理される。生物学的試料が毛髪である場合には、毛髪試料は、TRITON X-100(登録商標)及び超純金属遊離水(例えば、MILLI-Q(登録商標)水)の溶液中で洗浄され、オーブン内で(例えば、60℃で)一晩乾燥され得る。前処理は、接着フィルム(例えば、両面テープ)を有するガラススライド(例えば、顕微鏡ガラススライド)上に毛幹を配置することによって、測定のために毛幹を準備することを更に含み得る。毛幹は、毛幹が実質的に真っ直ぐであるように位置決めされ得る。毛幹を含むガラススライドは、分析を行うために、測定システム(例えば、レーザアブレーション誘導結合プラズマ質量分析計(LA-ICP-MS)、蛍光イメージセンサ、又はラマン分光分析計)の中に、又はその付近に配置され得る。生物学的試料が歯又は爪である場合、生物学的試料の表面は、(例えば、界面活性剤、水、又は1つ以上の溶媒によって)洗浄され得る。いくつかの場合には、試料は、本明細書の他の箇所に記載される分析の実行に対して前、後、直前、又は時間枠の任意の組み合わせにおいて脱石灰化され得る。いくつかの場合には、試料を脱石灰化することは、(a)エチレンジアミン四酢酸(EDTA)の溶液に歯を浸漬させるステップであって、EDTAが、最大約5週間の間、約7.0~約7.4のpHを含み得る、浸漬させるステップと、(b)1週間おきに歯を計量するステップと、(c)歯プラトーの重量が変化したときに試料を取り出すステップと、を含む。試料は、分析を行うために、測定システム(例えば、レーザアブレーション誘導結合プラズマ質量分析計(LA-ICP-MS)、蛍光イメージセンサ、又はラマン分光分析計)の中に、又はその付近に配置され得る。
図3は、疾患又は障害に関する対象の診断状態を予測するための方法など、生物学的状態について対象を評価するための方法300のフローチャートを示す。方法300は、(動作302のように)対象の歯試料を染色して、染色された歯試料を生成することを含み得る。次に、方法300は、(動作304のように)染色された歯試料にわたって空間的に蛍光強度を分析することを含み得る。次に、方法300は、(動作306のように)蛍光強度の分析に少なくとも部分的に基づいて、疾患又は障害に関する対象の診断状態を予測することを含み得る。
いくつかの実施形態では、分析することは、染色された歯試料の蛍光画像を取得することと、蛍光画像の蛍光強度を分析することと、を含む。いくつかの実施形態では、染色された歯試料の蛍光画像を取得することは、反転又は非反転共焦点顕微鏡を使用することを含む。いくつかの実施形態では、歯試料を染色することは、C反応性タンパク質免疫組織化学染色を使用することを含む。いくつかの実施形態では、方法は、歯試料を切片化することを更に含む。いくつかの実施形態では、歯試料を染色することは、歯試料を脱石灰化することを含む。
いくつかの実施形態では、分析することは、蛍光強度に少なくとも部分的に基づいて、炎症の時間プロファイルを生成することと、炎症の時間プロファイルを分析することと、を含む。いくつかの実施形態では、炎症の時間プロファイルの少なくとも一部分は、対象の出生前期間に対応する。
測定データは、生物学的試料に沿った複数の位置で連続して生物学的試料から収集され得る。いくつかの実施形態では、生物学的試料の基準線に沿った複数の位置は、少なくとも100の位置(例えば、1000、1500、2000、2500、3000、3500、4000、4500、5000、6000、7000、8000、9000、10000、12000、14000、16000、18000、20000、又は20000を超える位置)を含む。いくつかの実施形態では、それぞれの位置は互いに隣接している。この方法によって、生物学的試料上の異なる位置に対応する各領域は、それによって、動的(例えば、時間変動)存在量測定と関連付けられ得る。いくつかの実施形態では、それぞれの位置は所定の距離だけ分離される。いくつかの実施形態では、サンプリングは、毛髪試料などの生物学的試料の先端に最も近いそれぞれの位置(例えば、対象の最も若い年齢に対応する位置)から開始する生物学的試料の基準線に沿って行われる。一般に、サンプリングの方向が既知である限り、サンプリングは、先端又は根に最も近いそれぞれの位置から開始して行うことができ、適切な訓練されたモデルが分析に使用される。
サンプリングは、データポイントのセットを生成し得る。データポイントの各セットは、生物学的試料に沿った複数の位置で測定された動的な生物学的反応を示す物質の測定値(例えば、存在量又は濃度)に対応し得る。生物学的試料の基準線上の各位置は、生物学的試料の特定の成長時間に対応し得る。
いくつかの実施形態では、歯の生物学的試料の例において、基準線は、240~510日の成長(例えば、歯の種類に応じた歯冠形成の期間)を含み得る。いくつかの実施形態では、基準線に沿った各位置は、約1~約0.5マイクロメートルに対応し得る。代替的に、又はそれに加えて、生物学的試料は、毛幹を含み得、ここで、基準線に沿った位置は、約5分の成長(例えば、1マイクロメートルの分解能及び1cm/月の毛髪成長の平均速度を使用して計算された毛髪成長の期間)に対応する。生物学的試料の基準線に沿った複数の位置を成長の対応する期間に相関させることによって、複数のトレースを含む第1のデータセットが取得される。各トレースは、生物学的試料から測定された動的な生物学的反応を示す物質の測定値(例えば、存在量又は濃度)の時間依存性存在量を含む。例えば、位置間の距離は、生物学的試料の推定される成長(例えば、生物学的時間)に対応し得る。例えば、存在量は、最大約8ミリメートル(mm)の距離に沿った歯試料について測定され得、この距離は、約240~510日の生物学的時間に対応する。代替的に、又はそれに加えて、存在量は、1.2cmの距離に沿った毛髪試料について測定され得、この距離は、約35日の生物学的時間に対応する。生物学的時間は、毛髪成長の平均速度(例えば、月に1cm)を使用することによって推定され得る。
いくつかの実施形態では、データ分析は、生物学的試料から測定された動的な生物学的反応を示す物質の時間依存性存在量(例えば、時間依存性濃度)に対応するトレースに対して行われ得る。これは、データをクリーンアップするためのカスタマイズされた動作(例えば、時間スパンにわたってデータを平滑化すること、及び/又は所定の閾値よりも高い若しくは低いデータポイントを削除すること)を含み得る。いくつかの実施形態では、データ分析は、隣接するポイント間の平均絶対差の少なくとも1倍、2倍、又は3倍の標準偏差である隣接するデータポイント間の平均絶対差を有するデータポイントをトレースから除去することを含む。
いくつかの実施形態では、データ分析は、内部標準に対して各トレースを正規化することを更に含む。例えば、環境曝露(例えば、食事)に伴って変動しない生物学的試料の開発/成長中に均等に組み込まれた試料中に検出された測定物質は、内部標準として働くことができる。
いくつかの実施形態では、データ分析は、時間依存性トレースに対して再発定量分析(RQA)を行い、トレースの動的周期的特性を説明する特徴のセットを取得することを更に含む。RQAは、時間依存性トレースの変動性を測定する。RQAは、決定論、エントロピー、平均対角線長(MDL)、層状性、エントロピー、トラッピング時間(TT)、再発時間(RT)、Vmax、及びLmaxを含む、所与の波形における周期的特性を記述する特徴の推定を含み、これらの特徴の各々が、添付の参考文献に記載されるように、信号ダイナミクスの様々な態様を捕捉する。RQAの方法及び特徴は、例えば、Webberら“Simpler Methods Do It Better:Success of Recurrence Quantification Analysis as a General Purpose Data Analysis Tool,”Physics Letters A 373,3753-3756(2009)及びMarwanら“Recurrence Plots for the Analysis of Complex Systems,”Physics Reports 438,237-239(2007)によって説明されており、これらの各々の内容は、参照によりそれらの全体が本明細書に組み込まれる。いくつかの実施形態では、時間依存性トレースは、フーリエ変換、ウェーブレット分析、及びコシノール分析などの他の分析方法を使用することによって分析される。そのような技術を適用して、周波数成分及びそれらと関連付けられる電力のスペクトル分析を含む同様のメトリックを導出することができる。これらのメトリック及び関連する派生的尺度は、予測分類の目的のために、生物学的試料から取得された時間依存性トレースを分析するために、RQAから導出される特徴の代わりに使用され得る。
RQAは、それぞれの取得されたトレースの動的時間構造を視覚化及び分析する再発プロットの構築を含む。そのような再発プロットは、所与の配列をその配列の時間差導出に対してプロットすることによって、連続測定における相動的プロセスを例解し得る。毛幹から測定された一次元トレースから、追加の次元が計算的に導出され、相図と称される高次元空間にトレースが埋め込まれ、ここで、tは、元のトレースの値を指し、次元(t+τ)及び(t+2τ)は、元の時系列を間隔τ遅延させることから導出される。その後、埋め込まれた相図上で後続の分析を行い、再発プロットを構築し、再発定量分析を実施する。再発プロットは、相図における各点に閾値関数を適用することによって、相図から導出され得る。通常、白又は黒の空間として表される正方形のバイナリ行列からなる対応する再発プロット上で、所与の点には、各時間間隔で1の値が割り当てられ、相図における別の点は、割り当てられた閾値境界の空間的限界を共有する。RQA法は、所与のシステムにおける状態間の遅延の間隔を調べるために再発プロットに適用され、黒い点は、システムが同じ状態を再訪するときの時間間隔を反映する。システムが状態の所与のパターンを連続的に繰り返す周期的なプロセスは、再発プロットにおいて黒い対角線として現れるが、安定性の期間は正方形構造として現れ、スプリアス反復は黒い点として現れ、一意のイベントは白いスペースとして現れる。
いくつかの実施形態では、再発プロットは、単一の物質又は2つの物質の組み合わせのトレースのために構築される(例えば、2つの物質の対話型周期パターンを視覚化するために構築される。これは、交差再発定量分析、又はジョイント再発定量分析と称され得る)。いくつかの実施形態では、再発プロットは、3つ以上の物質の組み合わせに対して構築される。
いくつかの実施形態では、データ分析は、再発プロットを分析して、再発プロットと関連付けられる特徴のセットを取得することを含む。「律動特徴」又は「動的特徴」と同義に称され得る特徴は、複数のトレースに存在する周期性、予測可能性、及び遷移性を記述する定量的尺度を提供する。特徴は、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、層状性、エントロピー、トラッピング時間(TT)、再発時間(RT)、Vmax、Lmax、及びそれらの任意の組み合わせを含むセットから選択される。
いくつかの実施形態では、データ分析は、取得された特徴のセットを訓練されたモデルに入力することを更に含む。いくつかの実施形態では、訓練されたモデルは、生物学的状態を有する対象の確率を取得するための予測計算アルゴリズムを含む。いくつかの実施形態では、予測計算アルゴリズムは、以下の計算を行う。
ここで、p(対象)は、対象が第1の生物学的状態を有する確率であり、eは、オイラー数であり、αは、β+…+βがゼロに等しいときに対象が生物学的状態を有する確率と関連付けられる計算されたパラメータであり、x、…、xは、特徴のセットにおける各特徴について導出される値に対応し、特徴のセットは、1からkまでの特徴を含み、β、…、βは、1からkまでの特徴を含む特徴のセットにおける各特徴と関連付けられる重みパラメータに対応する。
重みパラメータβ、…、βは、モデル訓練に基づいて定義され得る。確率p(対象)は、0~1の範囲の数として提供され得、ここで、1は、対象が生物学的状態を有する100%の確率に対応する。
いくつかの実施形態では、データ分析は、取得された確率p(対象)に閾値を適用することを含む。取得された確率p(対象)が閾値を上回る場合、対象は、生物学的状態を有すると評価される。取得された確率が閾値を下回る場合、対象は、生物学的状態を有していないと評価される。いくつかの実施形態では、閾値は、約0.3~0.6である(例えば、所定の閾値は、約0.3、0.35、0.4、0.45、0.5、0.55、又は0.6である)。確率的閾値に割り当てられる値は、受信者動作特性(ROC)チャートの使用を介してモデルの訓練中に既定、又は推定され得、使用される最適閾値は、最大曲線下面積(ROC-AUC)をもたらす値に対応する。いくつかの実施形態では、取得された確率は、関連するオッズ(例えば、OR=p/(1-p)のような確率から導出され得るオッズ比(OR))の観点から表される。例えば、評価は、対象が生物学的状態を有するオッズを評価することを含む。
いくつかの実施形態では、データ分析は、第1の生物学的状態を代替的状態、例えば、第2の生物学的状態から区別することを含む。いくつかの実施形態では、代替的状態は、どの既知の状態(例えば、定型発達状態(NT))とも関連付けられない。いくつかの実施形態では、第1の生物学的状態は自閉症スペクトラム障害(ASD)と関連付けられ、代替的状態は注意欠陥/多動性障害(ADHD)と関連付けられる。いくつかの実施形態では、代替的状態は、任意の他の神経発達状態、又は2つの神経発達状態の併存診断である。したがって、データ分析は、2つの神経発達状態を区別する(例えば、自閉症スペクトラム障害とADHDとを区別するか、又はASDと、ASD及びADHDの両方と診断される併存(CM)症例とを区別する)ことが可能であり得る。
患者の医師及び治療チームなどの医療提供者は、患者データ(例えば、動的な生物学的反応データ若しくは他の健康データ)、及び/又はそのようなデータから生成された予測若しくは評価にアクセスし得る。データ分析結果に基づいて、医療提供者は、臨床的決定又は転帰を判定し得る。
例えば、医師は、少なくとも部分的に、対象における予測される疾患又は障害に基づいて、患者が病院又は他の臨床現場において1つ以上の臨床試験を受けるように指示し得る。これらの指示は、特定の所定の基準(例えば、疾患又は障害の可能性についての最小閾値)が満たされるときに提供され得る。
そのような最小閾値は、例えば、少なくとも約5%の可能性、少なくとも約10%の可能性、少なくとも約20%の可能性、少なくとも約25%の可能性、少なくとも約30%の可能性、少なくとも約35%の可能性、少なくとも約40%の可能性、少なくとも約45%の可能性、少なくとも約50%の可能性、少なくとも約55%の可能性、少なくとも約60%の可能性、少なくとも約65%の可能性、少なくとも約70%の可能性、少なくとも約75%の可能性、少なくとも約80%の可能性、少なくとも約85%の可能性、少なくとも約90%の可能性、少なくとも約95%の可能性、少なくとも約96%の可能性、少なくとも約97%の可能性、少なくとも約98%の可能性、又は少なくとも約99%の可能性であり得る。
別の例として、医師は、治療有効量の治療薬(例えば、薬物)、臨床手順、又は患者に施される更なる臨床試験を、対象における予測される疾患又は障害に少なくとも部分的に基づいて処方し得る。例えば、医師は、患者における炎症の兆候に応じて抗炎症治療薬を処方し得る。
モデル
本開示の方法及びシステムは、様々な疾患又は障害のためのシグネチャを開発するために、人工知能技術の外部能力を利用又はアクセスし得る。これらのシグネチャは、疾患又は障害を正確に予測するために使用され得る(例えば、標準的な臨床ケアよりも数ヶ月又は数年早く)。そのような予測能力を使用して、医療提供者(例えば、医師)は、情報に基づいた正確なリスクベースの決定を行うことが可能であり得、それによって、患者に提供されるケア及びモニタリングの質を改善する。
本開示の方法及びシステムは、対象(患者)から取得した動的な生物学的反応データを分析して、対象が疾患又は障害を有する可能性を生成し得る。例えば、システムは、訓練された(例えば、予測)アルゴリズムを取得された動的な生物学的反応データに適用して、対象が疾患又は障害を有する可能性を生成し得る。訓練されたアルゴリズムは、取得された動的な生物学的反応データを処理して、対象が疾患又は障害を有する可能性を生成するように構成された、分類器又はリグレッサなどの人工知能ベースのモデルを含み得る。モデルは、患者の1つ以上のコホートからの臨床データセットを使用して、例えば、患者の臨床健康データ及び/又は動的な生物学的反応データを入力として使用し、患者の既知の臨床健康転帰(例えば、疾患又は障害)をモデルへの出力として使用して訓練され得る。
モデルは、1つ以上の機械学習アルゴリズムを含み得る。機械学習アルゴリズムの例としては、サポートベクトルマシン(SVM)、ナイーブベイズ分類、ランダムフォレスト、ニューラルネットワーク(例えば、ディープニューラルネットワーク(DNN)、再帰型ニューラルネットワーク(RNN)、ディープRNN、長短期記憶(LSTM)再帰型ニューラルネットワーク(RNN)、又はゲート付き再帰型ユニット(GRU)、又は他の教師あり学習アルゴリズム、又は分類及び回帰のための教師なし機械学習、統計的、又は深層学習アルゴリズムが挙げられ得る。モデルは、同様に、複数の予測モデルからなるアンサンブルモデルの推定を含み得、例えば、勾配ブースト決定木の構築において、勾配ブーストなどの技術を利用し得る。モデルは、患者データに対応する1つ以上の訓練データセットを使用して訓練され得る。
訓練データセットは、例えば、共通の臨床特性(特徴)及び臨床転帰(ラベル)を有する患者の1つ以上のコホートから生成され得る。訓練データセットは、特徴及び特徴に対応するラベルのセットを含み得る。特徴は、動的な生物学的反応データ、電子医療記録(EMR)から導出される患者の人口統計学的情報、及び医療観察を含むアルゴリズム入力に対応し得る。特徴は、例えば、動的な生物学的反応データの特定の範囲又はカテゴリなどの臨床特性を含み得る。特徴は、患者の年齢、患者の病歴、他の病状、現在又は過去の薬物、及び最後の観察からの時間などの患者情報を含み得る。例えば、所与の時点で所与の患者から収集された特徴のセットは、所与の時点での患者の健康状態又は状態を示し得るシグネチャとして集合的に働き得る。
例えば、動的な生物学的反応データ及び他の健康測定値の範囲は、連続測定値の複数の互いに素な連続範囲として表され得、動的な生物学的反応データ及び他の健康測定値のカテゴリは、測定値の複数の互いに素なセット(例えば、{「高」、「低」}、{「高」、「正常」}、{「低」、「正常」}、{「高」、「境界線高」、「正常」、「低」}など)として表され得る。臨床的特徴はまた、疾患又は障害の診断、以前に施した臨床治療(例えば、薬物、外科的治療、化学療法、放射線療法、免疫療法など)、行動要因、又は他の健康状態(例えば、高血圧(hypertension)若しくは高血圧(high blood pressure)、高血糖(hyperglycemia)若しくは高血糖(high blood glucose)、高コレステロール血症若しくは高血中コレステロール、アレルギー反応又は他の副作用の病歴など)などの、患者の健康歴を示す臨床ラベルを含み得る。
ラベルは、例えば、対象(例えば、患者)における疾患又は障害の存在、非存在、診断、又は予後などの臨床転帰を含み得る。臨床転帰は、患者における疾患又は障害の存在、非存在、診断、又は予後と関連付けられる時間的特徴を含み得る。例えば、時間的特徴は、患者が以前の臨床転帰(例えば、退院、薬物などの治療薬の投与、外科的手術などの臨床的処置を受けることなど)の後の特定の期間内に疾患又は障害が発生したことを示し得る。そのような期間は、例えば、約1時間、約2時間、約3時間、約4時間、約6時間、約8時間、約10時間、約12時間、約14時間、約16時間、約18時間、約20時間、約22時間、約24時間、約2日、約3日、約4日、約5日、約6日、約7日、約10日、約2週間、約3週間、約4週間、約1ヶ月、約2ヶ月、約3ヶ月、約4ヶ月、約6ヶ月、約8ヶ月、約10ヶ月、約1年、又は約1年を超え得る。
入力特徴は、データをビンに集約することによって、又は代替的にワンホットエンコーディングを使用することによって構造化され得る。入力はまた、固定された期間にわたって別々の動的な生物学的反応データ又は他の測定値間で計算された相互相関、及び離散導関数又は連続した測定値間の有限差など、先で言及した入力から導出された特徴値又はベクトルを含み得る。そのような期間は、例えば、約1時間、約2時間、約3時間、約4時間、約6時間、約8時間、約10時間、約12時間、約14時間、約16時間、約18時間、約20時間、約22時間、約24時間、約2日、約3日、約4日、約5日、約6日、約7日、約10日、約2週間、約3週間、約4週間、約1ヶ月、約2ヶ月、約3ヶ月、約4ヶ月、約6ヶ月、約8ヶ月、約10ヶ月、約1年、又は約1年を超え得る。
訓練記録は、観察のシーケンスから構築され得る。そのようなシーケンスは、データ処理を容易にするために固定された長さを含み得る。例えば、シーケンスは、ゼロパディングされ得るか、又は単一の患者の記録の独立したサブセットとして選択され得る。
モデルは、入力特徴を処理して、1つ以上の分類、1つ以上の予測、又はそれらの組み合わせを含む出力値を生成し得る。例えば、そのような分類又は予測は、健康/正常な健康状態(例えば、疾患又は障害の非存在)又は有害な健康状態(例えば、疾患又は障害の存在)のバイナリ分類、カテゴリラベルの群間の分類(例えば、「疾患又は障害なし」、「明らかな疾患又は障害」、及び「疾患又は障害の疑い」)、特定の疾患又は障害を発症する可能性(例えば、相対的な可能性又は確率)、疾患又は障害の存在を示すスコア、患者が経験する全身性炎症のレベルを示すスコア、患者の死亡確率を示す「リスク因子」、患者が疾患又は障害を発症したと予想される時間の予測、及び任意の数値的予測の信頼区間を含み得る。様々な機械学習技術は、機械学習技術の出力が、モデルの後続の層又はサブセクションへの入力特徴としても使用され得るようにカスケードされ得る。
(例えば、モデルの重み及び相関を判定することによって)モデルを訓練して、リアルタイムの分類又は予測を生成するために、モデルを、データセットを使用して訓練することができる。そのようなデータセットは、統計的に有意な分類又は予測を生成するのに十分な大きさであり得る。例えば、データセットは、動的な生物学的反応データ及び他の測定値、並びに病院又は他の臨床環境からの動的な生物学的反応データ及び他の測定値を含む、非識別データのデータベースを含み得る。
データセットは、訓練データセット、展開データセット、及び試験データセットなどのサブセット(例えば、離散又は重複)に分割され得る。例えば、データセットは、データセットの80%を含む訓練データセットと、データセットの20%を含む試験データセットとに分割され得る。訓練データセットは、データセットの約10%、約20%、約30%、約40%、約50%、約60%、約70%、約80%、又は約90%を含み得る。展開データセットは、データセットの約10%、約20%、約30%、約40%、約50%、約60%、約70%、約80%、又は約90%を含み得る。試験データセットは、データセットの約10%、約20%、約30%、約40%、約50%、約60%、約70%、約80%、又は約90%を含み得る。訓練セット(例えば、訓練データセット)は、サンプリングの独立性を確保するために、1つ以上の患者コホートに対応するデータのセットのランダムサンプリングによって選択され得る。代替的に、訓練セット(例えば、訓練データセット)は、サンプリングの独立性を確保するために、1つ以上の患者コホートに対応するデータのセットの比例サンプリングによって選択され得る。
モデル予測の精度を改善し、モデルの過学習を低減させるために、データセットを増強して、訓練セット内の試料の数を増加させ得る。例えば、データ増強は、訓練レコード内の観測の順序を再配置することを含み得る。欠落観測を有するデータセットに対応するために、欠落データを補完する方法、例えば、フォワードフィリング、バックフィリング、線形補間、及びマルチタスクガウスプロセスが使用され得る。交絡因子を除去するために、データセットは、フィルタリングされ得る。例えば、データベース内で、患者のサブセットは、除外され得る。
モデルは、ニューラルネットワーク、畳み込みニューラルネットワーク(CNN)、ディープニューラルネットワーク(DNN)、再帰型ニューラルネットワーク(RNN)、又はディープRNNなどの1つ以上のニューラルネットワークを含み得る。再帰型ニューラルネットワークは、長短期記憶(LSTM)ユニット又はゲート付き再帰型ユニット(GRU)であり得るユニットを含み得る。例えば、モデルは、バイタルサイン及び他の測定値、患者の病歴、及び/又は患者の人口統計などの入力特徴のセットを有するニューラルネットワークを含むアルゴリズムアーキテクチャを含み得る。ニューラルネットワーク技術、例えば、ドロップアウト又は正則化は、過学習を防止するために、モデルを訓練する間に使用され得る。ニューラルネットワークは、複数のサブネットワークを含み得、各サブネットワークは、異なるタイプの出力情報の分類又は予測を生成するように構成される(例えば、ニューラルネットワークの全体的な出力を形成するために組み合わされ得る)。モデルは、代替的に、ランダムフォレスト、分類及び回帰木、サポートベクトルマシン、判別分析、回帰技術、並びにそれらのアンサンブル及び勾配ブーストされたバリエーションを含む、統計的アルゴリズム又は関連するアルゴリズムを利用し得る。
モデルが疾患又は障害の分類又は予測を生成するとき、通知(例えば、アラート又はアラーム)が生成され、病院内の患者の治療チームの医師、看護師、又は他のメンバーなどの医療提供者に送信され得る。通知は、自動電話、ショートメッセージサービス(SMS)又はマルチメディアメッセージサービス(MMS)メッセージ、電子メール、又はダッシュボード内のアラートを介して送信され得る。通知は、疾患又は障害の予測、予測される疾患又は障害の可能性、疾患又は障害の予想される発症までの時間、可能性又は時間の信頼区間、又は疾患又は障害についての推奨される治療コースなどの出力情報を含み得る。
モデルのパフォーマンスを検証するために、異なるパフォーマンスメトリックが生成され得る。例えば、受信者動作曲線下面積(AUROC)を使用して、モデルの診断能力を判定し得る。例えば、モデルは、調整可能である分類閾値を使用し得、それによって、特異性及び感度が調整可能になり、受信者動作曲線(ROC)を使用して、特異性及び感度の異なる値に対応する異なる動作点を識別することができる。
データセットが十分に大きくないときなどのいくつかの場合には、異なる訓練データセット及び試験データセットにわたってモデルの堅牢性を評価するために交差検証が行われ得る。
感度、特異性、精度、陽性予測値(PPV)、陰性予測値(NPV)、AUPRC、AUROCなどのパフォーマンスメトリックを計算するために、以下の定義が使用され得る。「偽陽性」とは、陽性の転帰又は結果が誤って又は時期尚早に生成された(例えば、疾患若しくは障害の実際の発症の前に、又は発症なしに)転帰を指し得る。「真陽性」は、患者が疾患又は障害を有するとき(例えば、患者が疾患若しくは障害の症状を示すか、又は患者の記録が疾患若しくは障害を示す)、陽性の転帰又は結果が正しく生成された転帰を指し得る。「偽陰性」は、陰性の結果又は結果が生成されたが、患者が疾患又は障害を有する(例えば、患者が疾患若しくは障害の症状を示すか、又は患者の記録が疾患若しくは障害を示す)転帰を指し得る。「真陰性」とは、陰性の転帰又は結果が生成された転帰を指し得る(例えば、疾患若しくは障害の実際の発症の前、又は発症のない状態)。
モデルは、診断精度測定値に対応する最小所望の値を有するなど、精度又はパフォーマンスについての特定の所定の条件が満たされるまで訓練され得る。例えば、診断精度測定値は、対象における疾患又は障害の発生の可能性の予測に対応し得る。別の例として、診断精度測定値は、対象が以前に治療された疾患又は障害の悪化又は再発の可能性の予測に対応し得る。診断精度測定の例としては、疾患又は障害を検出又は予測する診断精度に対応する感度、特異性、陽性予測値(PPV)、陰性予測値(NPV)、精度、精度-再現率曲線下面積(AUPRC)、及び受信者動作特性(ROC)曲線下面積(AUC)(AUROC)が挙げられ得る。
例えば、そのような所定の状態は、疾患又は障害を予測する感度が、例えば、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の値を含む状態であり得る。
別の例として、そのような所定の状態は、疾患又は障害を予測する特異性が、例えば、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の値を含む状態であり得る。
別の例として、そのような所定の状態は、疾患又は障害を予測する陽性予測値(PPV)が、例えば、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の値を含む状態であり得る。
別の例として、そのような所定の状態は、疾患又は障害を予測する陰性予測値(NPV)が、例えば、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の値を含む状態であり得る。
別の例として、そのような所定の状態は、疾患又は障害を予測する受信者動作特性(ROC)曲線下面積(AUC)(AUROC)が、少なくとも約0.50、少なくとも約0.55、少なくとも約0.60、少なくとも約0.65、少なくとも約0.70、少なくとも約0.75、少なくとも約0.80、少なくとも約0.85、少なくとも約0.90、少なくとも約0.95、少なくとも約0.96、少なくとも約0.97、少なくとも約0.98、又は少なくとも約0.99の値を含む状態であり得る。
別の例として、そのような所定の状態は、疾患又は障害を予測する精度-再現率曲線下面積(AUPRC)が、少なくとも約0.10、少なくとも約0.15、少なくとも約0.20、少なくとも約0.25、少なくとも約0.30、少なくとも約0.35、少なくとも約0.40、少なくとも約0.45、少なくとも約0.50、少なくとも約0.55、少なくとも約0.60、少なくとも約0.65、少なくとも約0.70、少なくとも約0.75、少なくとも約0.80、少なくとも約0.85、少なくとも約0.90、少なくとも約0.95、少なくとも約0.96、少なくとも約0.97、少なくとも約0.98、又は少なくとも約0.99の値を含む状態であり得る。
いくつかの実施形態では、モデルは、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の感度を伴って疾患又は障害を予測するように訓練又は構成され得る。
いくつかの実施形態では、モデルは、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の特異性を伴って疾患又は障害を予測するように訓練又は構成され得る。
いくつかの実施形態では、モデルは、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の陽性予測値(PPV)を伴って疾患又は障害を予測するように訓練又は構成され得る。
いくつかの実施形態では、モデルは、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の陰性予測値(NPV)を伴って疾患又は障害を予測するように訓練又は構成され得る。
いくつかの実施形態では、訓練されたモデルは、少なくとも約0.50、少なくとも約0.55、少なくとも約0.60、少なくとも約0.65、少なくとも約0.70、少なくとも約0.75、少なくとも約0.80、少なくとも約0.85、少なくとも約0.90、少なくとも約0.95、少なくとも約0.96、少なくとも約0.97、少なくとも約0.98、又は少なくとも約0.99の受信者動作特性(ROC)曲線下面積(AUC)(AUROC)を伴って疾患又は障害を予測するように訓練又は構成され得る。
いくつかの実施形態では、モデルは、少なくとも約0.10、少なくとも約0.15、少なくとも約0.20、少なくとも約0.25、少なくとも約0.30、少なくとも約0.35、少なくとも約0.40、少なくとも約0.45、少なくとも約0.50、少なくとも約0.55、少なくとも約0.60、少なくとも約0.65、少なくとも約0.70、少なくとも約0.75、少なくとも約0.80、少なくとも約0.85、少なくとも約0.90、少なくとも約0.95、少なくとも約0.96、少なくとも約0.97、少なくとも約0.98、又は少なくとも約0.99の精度-再現率曲線下面積(AUPRC)を伴って疾患又は障害を予測するように訓練又は構成され得る。
訓練データセットは、訓練対象(例えば、ヒト)から収集され得る。各訓練は、生物学的状態を有すると診断されたか、又は生物学的状態を有すると診断されていないことを示す診断状態を有する。いくつかの実施形態では、訓練対象は、5歳以下(例えば、5歳、4歳、3歳、2歳、1歳、生後9ヶ月、6ヶ月、3ヶ月又は1ヶ月以下)の小児である。以下の訓練手順は、複数の訓練対象における各訓練対象について行われ得る。
いくつかの実施形態では、訓練データ(例えば、動的IHCデータ)は、訓練対象の生物学的試料から生成され得る。各生物学的試料について、訓練対象の生物学的試料上の基準線の複数の位置をサンプリングして、そこから測定値を生成し、それによって、複数の動的な生物学的反応試料を取得し得る。対応する複数の動的な生物学的反応試料における各動的な生物学的反応試料は、対応する複数の位置における異なる位置に対応し、対応する複数の位置における各位置は、対応する生物学的試料の異なる成長期間を表す。次に、生物学的試料の各それぞれの位置を(例えば、レーザアブレーション誘導結合プラズマ質量分析計(LA-ICP-MS)、蛍光イメージセンサ、又はラマン分光分析計を使用して)分析して、複数のトレースを取得する。対応する複数のトレースにおける各トレースは、対応する複数の動的な生物学的反応試料から経時的に集合的に判定される、対応する物質の存在量測定に対応する。
次に、特徴の対応するセットを測定するために、対応する複数のトレースに再発定量分析(RQA)又は関連する方法を適用して、それぞれの第2のデータセットが取得され得、特徴の対応するセットにおける各それぞれの特徴は、対応する複数のトレースにおける1つ以上の物質の存在量のばらつきによって判定される。
次に、(i)複数の訓練対象における各訓練対象の各それぞれの第2のデータセットの特徴の対応するセットと、(ii)第1の診断状態及び第2の診断状態の中から選択される、複数の訓練対象における各訓練対象の対応する診断状態と、を有する、訓練されていないか又は部分的に訓練されていないモデルが生成され得、それによって、訓練されたモデルが取得される。訓練されたモデルは、試験対象の生物学的試料から取得された特徴のセットの特徴の値に基づいて、試験対象が第1の生物学的状態を有するかどうかに関する指示を提供する。いくつかの実施形態では、訓練されたモデルは、ニューラルネットワークアルゴリズム、畳み込みニューラルネットワークアルゴリズム、サポートベクトルマシンアルゴリズム、決定木アルゴリズム、教師なしクラスタリングモデルアルゴリズム、教師ありクラスタリングモデルアルゴリズム、回帰モデル、又はそれらの任意の組み合わせ若しくは変形であり、特に、記載されたアルゴリズムの勾配ブースト実装、例えば、勾配ブーストされた決定木を含む。いくつかの実施形態では、訓練されたモデルは、多項式又は二項分布に対する転帰を予測する。いくつかの実施形態では、訓練されたモデルを使用して、試料が第1の生物学的状態を有する対象から導出されたか否かに関するバイナリ予測を行うことができ、又は、診断を有しない対象を、第1の生物学的状態、若しくは第1の生物学的状態とは異なる第2の生物学的状態を有する対象から区別する多項予測であり得る。
いくつかの実施形態では、モデルはニューラルネットワーク又は畳み込みニューラルネットワークである。Vincent et al.,2010,“Stacked denoising autoencoders:J Mach Learn Res 11,pp.3371-3408、Larochelle et al.,2009,“Exploring strategies for training deep neural networks,”J Mach Learn Res 10,pp.1-40、及びHassoun,1995,Fundamentals of Artificial Neural Networks,Massachusetts Institute of Technologyを参照されたい。これらは各々、参照により本明細書に組み込まれる。
SVMは、Cristianini and Shawe-Taylor,2000,“An Introduction to Support Vector Machines,”Cambridge University Press,Cambridge;the 5th Annual ACM Workshop on Computational Learning Theoryの議事録における、Boser et al.,1992,“A training algorithm for optimal margin classifiers”,ACM Press,Pittsburgh,Pa.,pp.142-152;Vapnik,1998,Statistical Learning Theory,Wiley,New York;Mount,2001,Bioinformatics:sequence and genome analysis,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.;Duda,Pattern Classification,Second Edition,2001,John Wiley & Sons,Inc.,pp.259,262-265;及びHastie,2001,The Elements of Statistical Learning,Springer,New York;及びFurey et al.,2000,Bioinformatics 16,906-914に記載されており、これらは各々、参照によりその全体が本明細書に組み込まれる。分類に使用される場合、SVMは、ラベル付けされたデータから、最大限に離れた超平面を使用して、バイナリラベル付けされたデータの所与のセットを分離する。線形分離が不可能な場合、SVMは、特徴空間への非線形マッピングを自動的に実現する「カーネル」の技術と組み合わせて機能することができる。特徴空間内のSVMによって見出される超平面は、入力空間内の非線形決定境界に対応する。
決定木は、参照により本明細書に組み込まれるDuda,2001,Pattern Classification,John Wiley & Sons,Inc.,New York,pp.395-396によって概説されている。決定木に基づく方法は、特徴空間を長方形のセットに分割し、各々に(定数のような)モデルを適合させる。いくつかの実施形態では、決定木は、ランダムフォレスト回帰である。使用され得る1つの特定のアルゴリズムは、分類及び回帰木(CART)である。他の特定の決定木アルゴリズムには、ID3、C4.5、MART、及びランダムフォレストが含まれるが、これらに限定されない。CART、ID3、及びC4.5は、参照により本明細書に組み込まれるDuda,2001,Pattern Classification,John Wiley & Sons,Inc.,New York,pp.396-408 and pp.411-412に記載されている。CART、MART、及びC4.5は、参照によりその全体が本明細書に組み込まれるHastie et al.,2001,The Elements of Statistical Learning,Springer-Verlag,New York,Chapter 9に記載されている。ランダムフォレストは、参照によりその全体が本明細書に組み込まれるBreiman,1999,“Random Forests-Random Features,”Technical Report 567,Statistics Department,U.C.Berkeley,September 1999に記載されている。
クラスタリング(例えば、教師なしクラスタリングモデルアルゴリズム及び教師ありクラスタリングモデルアルゴリズム)は、参照によりその全体が本明細書に組み込まれるDuda and Hart,Pattern Classification and Scene Analysis,1973,John Wiley & Sons,Inc.,New York(以下「Duda1973」)の211~256ページに記載されている。Duda1973の6.7節に記載されているように、クラスタリング問題は、データセット内の自然なグループを見つけることの1つとして説明される。自然なグループを識別するために、2つの問題が対処される。まず、2つの試料間の類似度(又は非類似度)を測定する方法が判定される。このメトリック(類似度尺度)は、あるクラスタにおける試料が他のクラスタにおける試料よりも互いに似ていることを保証するために使用される。第2に、類似度尺度を使用してデータをクラスタに分割するためのメカニズムが判定される。類似度尺度はDuda1973の6.7節で議論されており、クラスタリング調査を開始する1つの方法は、距離関数を定義し、訓練セット内の全ての試料ペア間の距離の行列を計算することである。距離が類似度の良好な尺度である場合、同じクラスタにおける参照エンティティ間の距離は、異なるクラスタにおける参照エンティティ間の距離よりも有意に短くなる。しかし、Duda1973の215ページに記載されているように、クラスタリングは距離メトリックの使用を必要としない。例えば、非メトリック類似度関数s(x,x’)を使用して、2つのベクトルxとx’とを比較することができる。従来、s(x,x’)は、x及びx’が何らかの形で「類似している」ときにその値が大きい対称関数である。非メトリック類似度関数s(x,x’)の例は、Duda1973の218ページに提供されている。データセット内の点間の「類似度」又は「非類似度」を測定するための方法が選択されると、クラスタリングでは、データの任意の分割のクラスタリング品質を測定する基準関数が必要になる。基準関数を極端化するデータセットの分割は、データをクラスタ化するために使用される。Duda1973の217ページを参照されたい。基準関数については、DUDA1973の6.8節で考察されている。最近では、Duda et al.,Pattern Classification,2nd edition,John Wiley & Sons,Inc.,New Yorkが出版された。537~563ページにクラスタリングについて詳細に記載されている。クラスタリング技術の詳細については、Kaufman and Rousseeuw,1990,Finding Groups in Data:An Introduction to Cluster Analysis,Wiley,New York,N.Y.、Everitt,1993,Cluster analysis(3d ed.),Wiley,New York,N.Y.、及びBacker,1995,Computer-Assisted Reasoning in Cluster Analysis,Prentice Hall,Upper Saddle River,New Jerseyに見出され得る。これらは各々、参照により本明細書に組み込まれる。本開示で使用することができる特定の例示的なクラスタリング技術には、階層的クラスタリング(最近傍アルゴリズム、最遠傍アルゴリズム、平均リンケージアルゴリズム、重心アルゴリズム、又は二乗和アルゴリズムを使用する凝集クラスタリング)、k平均法クラスタリング、ファジィk平均法クラスタリングアルゴリズム、及びJarvis-Patrickクラスタリングが含まれるが、これらに限定されない。いくつかの実施形態では、クラスタリングは、教師なしクラスタリングを含み、この場合、訓練セットがクラスタ化されるときに、どのクラスタが形成されるべきかについての先入観が課されない。
マルチカテゴリロジットモデルのような回帰モデルは、参照によりその全体が本明細書に組み込まれるAgresti,An Introduction to Categorical Data Analysis,1996,John Wiley & Sons,Inc.,New York,Chapter 8に記載されている。いくつかの実施形態では、このモデルは、参照によりその全体が本明細書に組み込まれる、Hastie et al.,2001,The Elements of Statistical Learning,Springer-Verlag,New Yorkに開示されるリグレッサを利用する。いくつかの実施形態では、勾配ブーストモデルは、例えば、本明細書で説明される分類アルゴリズムを目的として使用され、これらの勾配ブーストモデルは、Boehmke,Bradley;Greenwell,Brandon(2019).“Gradient Boosting”.Hands-On Machine Learning with R.Chapman & Hall.pp.221-245.ISBN 978-1-138-49568-5に記載されている。これは、参照によりその全体が本明細書に組み込まれる。いくつかの実施形態では、アンサンブルモデリング技術は、例えば、本明細書に記載の分類アルゴリズムを目的として使用され、これらのアンサンブルモデリング技術は、本明細書の分類モデルの実装形態に記載され、Zhou Zhihua(2012).Ensemble Methods:Foundations and Algorithms.Chapman and Hall/CRC.ISBN 978-1-439-83003-1で説明されている。これは、参照によりその全体が本明細書に組み込まれる。
いくつかの実施形態では、モデルは、データ分析を実行する命令を含む、1つ以上のプログラム(例えば、図1の非永続的メモリ111又は永続的メモリ112に記憶された1つ以上のプログラム)を実行するデバイスによって行われる。いくつかの実施形態では、データ分析は、少なくとも1つのプロセッサ(例えば、処理コア102)と、データ分析を実行する命令を含むメモリ(例えば、非永続的メモリ111又は永続的メモリ112に記憶された1つ以上のプログラム)と、を備えるシステムによって行われる。
コンピュータシステム
本開示は、本開示の方法を実施するようにプログラムされたコンピュータシステムを提供する。図4は、例えば、歯試料を染色することと、染色された歯試料の蛍光画像を取得することと、染色された歯試料にわたって蛍光強度を空間的に分析することと、炎症の時間プロファイルを生成することと、訓練されたモデルを使用してデータを処理することと、対象の疾患又は障害のリスクを判定することと、を行うようにプログラムされるか又は他の方法で構成されたコンピュータシステム401を示す。コンピュータシステム401は、例えば、歯試料を染色すること、染色された歯試料の蛍光画像を取得すること、染色された歯試料にわたって空間的に蛍光強度を分析すること、炎症の時間プロファイルを生成すること、時間プロファイルのダイナミクスを測定すること、訓練されたモデルを使用してプロセスデータを処理すること、及び疾患又は障害に関する対象の診断状態を予測することなど、本開示のセンサデータ分析の様々な態様を調節することができる。コンピュータシステム401は、ユーザの電子デバイス、又は電子デバイスに対して遠隔に置かれたコンピュータシステムであり得る。電子デバイスは、モバイル電子デバイスであり得る。
コンピュータシステム401は、中央処理ユニット(CPU、本明細書では「プロセッサ」及び「コンピュータプロセッサ」も含む)405を含み、中央処理ユニット405は、シングルコア又はマルチコアプロセッサ、又は並列処理のための複数のプロセッサであり得る。コンピュータシステム401はまた、メモリ又はメモリ位置410(例えば、ランダムアクセスメモリ、読み取り専用メモリ、フラッシュメモリ)と、電子記憶ユニット415(例えば、ハードディスク)と、1つ以上の他のシステムと通信するための通信インターフェース420(例えば、ネットワークアダプタ)と、キャッシュ、他のメモリ、データストレージ及び/又は電子ディスプレイアダプタなどの周辺デバイス425と、を含む。メモリ410、記憶ユニット415、インターフェース420、及び周辺デバイス425は、マザーボードなどの通信バス(実線)を通じてCPU405と通信している。記憶ユニット415は、データを記憶するためのデータ記憶ユニット(又はデータリポジトリ)であり得る。コンピュータシステム401は、通信インターフェース420の助けを借りて、コンピュータネットワーク(「ネットワーク」)430に動作可能に結合され得る。ネットワーク430は、インターネット、インターネット及び/若しくはエクストラネット、又はインターネットと通信しているイントラネット及び/若しくはエクストラネットであり得る。いくつかの場合には、ネットワーク430は、電気通信及び/又はデータネットワークである。ネットワーク430は、1つ以上のコンピュータサーバを含むことができ、コンピュータサーバは、クラウドコンピューティングなどの分散コンピューティングを可能にすることができる。ネットワーク430は、いくつかの場合には、コンピュータシステム401の助けを借りて、ピアツーピアネットワークを実装することができ、ピアツーピアネットワークは、コンピュータシステム401に結合されたデバイスがクライアント又はサーバとして動作することを可能にし得る。
CPU405は、一連の機械可読命令を実行することができ、機械可読命令は、プログラム又はソフトウェアで具現化され得る。命令は、メモリ410などのメモリ位置に記憶され得る。命令は、CPU405に指示することができ、CPU405は、その後、本開示の方法を実施するようにCPU405をプログラムするか、又は他の方法で構成することができる。CPU405によって行われる動作の例は、フェッチ、デコード、実行、及び書き戻しを含むことができる。
CPU405は、集積回路などの回路の一部分であり得る。システム401の1つ以上の他の構成要素は、回路に含まれ得る。いくつかの場合には、回路は特定用途向け集積回路(ASIC)である。
記憶ユニット415は、ドライバ、ライブラリ、及び保存されたプログラムなどのファイルを記憶することができる。記憶ユニット415は、ユーザデータ、例えば、ユーザプリファレンス及びユーザプログラムを記憶することができる。いくつかの場合には、コンピュータシステム401は、イントラネット又はインターネットを通じてコンピュータシステム401と通信しているリモートサーバ上に位置するなど、コンピュータシステム401の外部にある1つ以上の追加のデータ記憶ユニットを含むことができる。
コンピュータシステム401は、ネットワーク430を通じて1つ以上のリモートコンピュータシステムと通信することができる。例えば、コンピュータシステム401は、ユーザ(例えば、医療提供者)のリモートコンピュータシステムと通信することができる。リモートコンピュータシステムの例としては、パーソナルコンピュータ(例えば、ポータブルPC)、スレート又はタブレットPC(例えば、Apple(登録商標)iPad、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone、Android対応デバイス、Blackberry(登録商標))、又はパーソナルデジタルアシスタントが挙げられる。ユーザは、ネットワーク430を介してコンピュータシステム401にアクセスすることができる。
本明細書に記載される方法は、例えば、メモリ410又は電子記憶ユニット415上などの、コンピュータシステム401の電子記憶位置上に記憶された機械(例えば、コンピュータプロセッサ)実行可能コードによって実施され得る。機械実行可能コード又は機械可読コードは、ソフトウェアの形態で提供することができる。使用中、コードは、プロセッサ405によって実行され得る。いくつかの場合には、コードは、記憶ユニット415から取り出され、プロセッサ405による即時アクセスのためにメモリ410に記憶されることができる。いくつかの状況では、電子記憶ユニット415は排除され得、機械実行可能命令はメモリ410に記憶される。
コードは、コードを実行するように適合されたプロセッサを有するマシンとともに使用するように事前コンパイルされ、構成され得るか、又はランタイム中にコンパイルされ得る。コードは、事前コンパイルされた方法又はコンパイルされたままの方法でコードを実行するのを可能にするように選択することができるプログラミング言語で提供することができる。
コンピュータシステム401などの本明細書に提供されるシステム及び方法の態様は、プログラミングにおいて具体化され得る。技術の様々な態様は、典型的には、一種の機械可読媒体で搬送されるか又は具体化される機械(又はプロセッサ)実行可能コード及び/又は関連データの形態である「製品」又は「製造物品」と考えられ得る。機械実行可能コードは、メモリ(例えば、読み取り専用メモリ、ランダムアクセスメモリ、フラッシュメモリ)又はハードディスクなどの電子記憶ユニットに記憶され得る。「記憶」型媒体は、コンピュータ、プロセッサなどの有形メモリ、又は様々な半導体メモリ、テープドライブ、ディスクドライブなどの、有形メモリの関連モジュールのうちのいずれか若しくは全てを含むことができ、これらの媒体は、ソフトウェアプログラミングのためにいつでも非一時的な記憶を提供し得る。ソフトウェアの全部又は一部分は、インターネット又は様々な他の電気通信ネットワークを通じて通信され得る。そのような通信は、例えば、あるコンピュータ又はプロセッサから別のコンピュータ、例えば、管理サーバ又はホストコンピュータからアプリケーションサーバのコンピュータプラットフォームへのソフトウェアのロードを可能にし得る。したがって、ソフトウェア要素を担持し得る別のタイプの媒体は、ローカルデバイス間の物理的インターフェースを介し、有線及び光固定回線ネットワークを通じて様々なエアリンクを介して使用されるような光波、電波、及び電磁波を含む。有線又は無線リンク、光学リンクなどのそのような波を搬送する物理的要素も、ソフトウェアを担持する媒体とみなされ得る。本明細書で使用される場合、非一時的な有形の「記憶」媒体に限定されない限り、コンピュータ又は機械「可読媒体」などの用語は、実行のためにプロセッサに命令を提供することに関与する任意の媒体を指す。
したがって、コンピュータ実行可能コードなどの機械可読媒体は、有形記憶媒体、搬送波媒体、又は物理伝送媒体を含むがこれらに限定されない多くの形態をとり得る。不揮発性記憶媒体は、例えば、図面に示されるデータベースなどを実装するために使用され得る、任意のコンピュータなどにおける記憶デバイスのいずれかなどの光学又は磁気ディスクを含む。揮発性記憶媒体は、そのようなコンピュータプラットフォームのメインメモリなどの動的メモリを含む。有形伝送媒体には、同軸ケーブル、コンピュータシステム内のバスを構成するワイヤを含む銅線及び光ファイバーが含まれる。搬送波伝送媒体は、電気信号又は電磁信号、又は無線周波(RF)及び赤外線(IR)データ通信中に生成されるような音響波又は光波の形態をとり得る。したがって、コンピュータ可読媒体の一般的な形態としては、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVD、若しくはDVD-ROM、任意の他の光学媒体、パンチカード、紙テープ、穴のパターンを有する任意の他の物理的記憶媒体、RAM、ROM、PROM、EPROM、FLASH-EPROM、任意の他のメモリチップ若しくはカートリッジ、データ若しくは命令を運ぶ搬送波、そのような搬送波を運ぶケーブル若しくはリンク、又はコンピュータがプログラミングコード及び/若しくはデータを読み取り得る任意の他の媒体が挙げられる。これらの形態のコンピュータ可読媒体の多くは、実行のために1つ以上の命令の1つ以上のシーケンスをプロセッサに搬送することに関与し得る。
コンピュータシステム401は、例えば、蛍光画像データ、蛍光強度データ、炎症の時間プロファイル、及び機械学習分類を提供するためのユーザインターフェース(UI)440を含む電子ディスプレイ435を含むか、又はそれと通信することができる。UIの例としては、限定されないが、グラフィカルユーザインターフェース(GUI)及びウェブベースユーザインターフェースが挙げられる。
本開示の方法及びシステムは、1つ以上のアルゴリズムによって実施することができる。アルゴリズムは、中央処理ユニット405による実行時にソフトウェアによって実施することができる。アルゴリズムは、例えば、歯試料を染色し、染色された歯試料の蛍光画像を取得し、染色された歯試料にわたって空間的に蛍光強度を分析し、炎症の時間プロファイルを生成し、訓練されたモデルを使用してデータを処理し、対象の疾患又は障害のリスクを判定することができる。
本明細書の他の箇所に記載の方法は、実施形態に従った動作のステップ又はセットを示すが、当業者は、本明細書に記載の教示に基づいて多くの変形を認識するであろう。これらのステップは、異なる順序で完了され得る。ステップは、追加又は省略され得る。いくつかのステップは、サブステップを含み得る。多くのステップは、有益であれば何回でも繰り返され得る。
それぞれの方法又は動作のセットのうちの1つ以上のステップは、本明細書で説明されるような回路、例えば、フィールドプログラマブルゲートアレイのためのプロセッサ又はプログラマブルアレイロジックなどの論理回路のうちの1つ以上を用いて行われてよい。例えば、回路は、方法又は動作のセットのそれぞれのステップのうちの1つ以上を提供するようにプログラムされ得、プログラムは、コンピュータ可読メモリ上に記憶されたプログラム命令、又は例えば、プログラム可能アレイ論理又はフィールドプログラマブルゲートアレイなどの論理回路のプログラムされたステップを含み得る。
実施例1:疾患リスクを判定するための歯試料における動的分子プロファイル
本開示の方法及びシステムを使用して、歯試料における分子プロファイルを生成し、その後分析して、対象における疾患リスクを判定した。一般に、生物学的反応の時間的ダイナミクス(例えば、炎症)は、試料(例えば、歯試料)に刻印されていることが判明した。この時間的ダイナミクスを分析して、対象の疾患リスクを判定することができる。炎症のマーカーであるC反応性タンパク質(CRP)の動的分子プロファイルを生成した。歯のバイオマーカーを使用して、自閉症スペクトラム障害を有する第1のセット(37症例)及び自閉症スペクトラム障害を有しない第2のセット(77対照)の小児の2つのセットにおいて、胎児(出生前)発達及び幼児期を含む期間中に、CRP及び炎症の動的な時系列プロファイルが生成された。時系列CRPプロファイルを分析して、CRPシグナルのダイナミクスの新規特徴を明らかにし、それによって、自閉症症例を対照から正確に区別した。例えば、1歳前に存在していた炎症プロファイルは、症例と対照との間で大きな差異があった。これとは対照的に、自閉症の臨床診断は通常、3~4歳頃に判定される。
各小児対象から一次歯試料を取得した。歯試料を切片化し、脱石灰化し、免疫組織化学染色剤(例えば、デンタイン)を歯試料に塗布した。免疫組織化学染色によって、歯試料の成長リングに沿ってC反応タンパク質(炎症の分子マーカー)を効果的にマッピングし、出生前及び出生後の期間にわたる炎症の時間プロファイルを展開させた。時間プロファイルを本開示の機械学習アルゴリズムを使用して分析し、疾患リスク(例えば、自閉症)を判定するために非常に正確なモデルを訓練した。
図5は、y軸がCRP強度を示し、x軸が発達年齢を示す、経時的な対象の毎日のC反応性タンパク質プロファイルの例を示す。小児対象の発達年齢は、妊娠の第2期(例えば、対象が出生前段階にあった出生前140日に開始する)から生後約6ヶ月までの期間を含む。図5に示されるように、自閉症児の症例における炎症(CRP強度によって示される)プロファイルは、出生前に高いことが観察された。
図6A~6Bは、出生前及び幼児期(例えば、1歳まで)にサンプリングされたC反応性タンパク質プロファイルの再発定量分析から導出される特徴を利用して、様々な予測閾値において自閉症を診断するための方法の感度及び特異性を特徴付けるための受信者動作特性(ROC)曲線を示す。図6Aは、自閉症スペクトラム障害の対象を評価する開示された方法の精度を評価するための実験的受信者動作特性(ROC)曲線を示す。ROC曲線は、バイナリ分類器のパフォーマンスを評価するために使用することができる。ROC曲線は、特異性(真陰性率とも呼ばれる)に対する感度(真陽性率とも呼ばれる)としてプロットされる。完全な分類器は、100%感度及び100%特異性、並びに1.0の曲線下面積(AUC)を有し得る。図6Aに示されるように、動的C反応性タンパク質プロファイルに基づいて対象における自閉症の存在を判定するように構成された分類器は、0.86の受信者動作特性(ROC)曲線下面積(AUC)を有し、95%信頼区間(CI)が0.72~1.00であった。受信者動作特性(ROC)は、症例状態の予測される確率に適用される閾値が高くなるか又は低くなるにつれて、分類器の感度及び特異性値がどのように変化するかを示し、閾値が低くなると、例えば、より感度の高い分類がもたらされるが、それに応じて特異性が低くなる。図6Bに示されるように、特徴重要度の降順(例えば、数値的特徴重み付けによって示される)にランク付けされる分類器パフォーマンスに寄与する主な動的特徴は、層状性、エントロピー、TT、MDL、RT1、RT2、Vmax、決定論、及びLmaxを含む。例えば、層状性は、他のものよりも高い特徴重要性を有すると判定された。
したがって、本開示の方法及びシステムを使用したC反応性タンパク質プロファイルの分析から得られた特徴の分析では、小児対象から非侵襲的に取得された生物学的試料(例えば、歯試料)上で測定されたC反応性タンパク質シグネチャの分析から導出された特徴のみを使用して、AUCが0.86である自閉症の疾患リスクが首尾よく判定された。これらの結果は、初期の炎症反応のダイナミクスが後に疾患に関連付けられ、本開示の方法及びシステムを使用して正確に検出及びプロファイリングすることができることを実証する。
本発明の好ましい実施形態が本明細書に示され、記載されているが、そのような実施形態が例としてのみ提供されることは、当業者には明白であろう。本発明は、明細書内に提供される特定の実施例によって限定されることを意図するものではない。本発明は、前述の明細書を参照して説明されてきたが、本明細書における実施形態の説明及び例解は、限定的な意味で解釈されることを意図するものではない。本発明から逸脱することなく、多数の変形、変更、及び置換がここで当業者に想起されるであろう。更に、本発明の全ての態様は、様々な条件及び変数に依存する、本明細書に記載される特定の描写、構成又は相対的な割合に限定されないことを理解されたい。本明細書に記載される本発明の実施形態に対する様々な代替案が、本発明の実施において用いられ得ることは理解されるべきである。したがって、本発明は、そのような代替物、修正、変形、又は同等物も網羅することが企図される。以下の特許請求の範囲は、本発明の範囲を定義し、これらの特許請求の範囲及びそれらの等価物の範囲内の方法及び構造が、それらによって包含されることが意図される。
実施形態
実施形態1.疾患又は障害に関する対象の診断状態を予測するための方法であって、(a)対象の歯試料を染色して、染色された歯試料を生成することと、(b)染色された歯試料にわたって空間的に蛍光強度を分析することと、(c)蛍光強度の分析に少なくとも部分的に基づいて、疾患又は障害に関する対象の診断状態を予測することと、を含む、方法。
実施形態2.分析することが、染色された歯試料の蛍光画像を取得することと、蛍光画像の蛍光強度を分析することと、を含む、実施形態1に記載の方法。
実施形態3.染色された歯試料の蛍光画像を取得することが、反転又は非反転共焦点顕微鏡を使用することを含む、実施形態2に記載の方法。
実施形態4.歯試料を染色することが、C反応性タンパク質免疫組織化学染色を使用することを含む、実施形態1~3のいずれか1つに記載の方法。
実施形態5.歯試料を切片化することを更に含む、実施形態1~4のいずれか1つに記載の方法。
実施形態6.歯試料を染色することが、歯試料を脱石灰化することを含む、実施形態1~5のいずれか1つに記載の方法。
実施形態7.疾患又は障害が、自閉症スペクトラム障害(ASD)、注意欠陥/多動性障害(ADHD)、筋萎縮性側索硬化症(ALS)、統合失調症、過敏性腸疾患(IBD)、小児腎臓病、腎移植拒絶反応、小児癌、又はそれらの任意の組み合わせを含む、実施形態1~6のいずれか1つに記載の方法。
実施形態8.疾患又は障害が、自閉症スペクトラム障害を含む、実施形態1~6のいずれか1つに記載の方法。
実施形態9.対象が、ヒトである、実施形態1~8のいずれか1つに記載の方法。
実施形態10.対象が、12歳未満である、実施形態9に記載の方法。
実施形態11.対象が、1歳未満である、実施形態9に記載の方法。
実施形態12.分析することが、蛍光強度に少なくとも部分的に基づいて、炎症の時間プロファイルを生成することと、炎症の時間プロファイルを分析することと、を含む、実施形態1に記載の方法。
実施形態13.炎症の時間プロファイルの少なくとも一部分が、対象の出生前期間に対応する、実施形態12に記載の方法。
実施形態14.疾患又は障害に関する対象の診断状態を予測することが、訓練されたモデルを使用して、蛍光強度を処理することを含む、実施形態1に記載の方法。
実施形態15.訓練されたモデルが、ニューラルネットワークアルゴリズム、サポートベクトルマシンアルゴリズム、決定木アルゴリズム、教師なしクラスタリングアルゴリズム、教師ありクラスタリングアルゴリズム、回帰アルゴリズム、勾配ブーストアルゴリズム、及びそれらの任意の組み合わせからなる群から選択される、実施形態14に記載の方法。
実施形態16.訓練されたモデルが、勾配ブーストされた決定木を含む、実施形態14に記載の方法。
実施形態17.訓練されたモデルが、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される1つ以上の特徴を処理するように構成される、実施形態14に記載の方法。
実施形態18.訓練されたモデルが、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間(TT)、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される2つ以上の特徴を処理するように構成される、実施形態17に記載の方法。
実施形態19.訓練されたモデルが、少なくとも約80%の感度を伴って疾患又は障害に関する診断状態を予測する、実施形態18に記載の方法。
実施形態20.訓練されたモデルが、少なくとも約80%の特異性を伴って疾患又は障害に関する診断状態を予測する、実施形態18に記載の方法。
実施形態21.訓練されたモデルが、少なくとも約80%の陽性予測値を伴って疾患又は障害に関する診断状態を予測する、実施形態18に記載の方法。
実施形態22.訓練されたモデルが、少なくとも約80%の陰性予測値を伴って疾患又は障害に関する診断状態を予測する、実施形態18に記載の方法。
実施形態23.訓練されたモデルが、少なくとも約0.80の受信者動作特性曲線下面積(AUROC)を伴って疾患又は障害に関する診断状態を予測する、実施形態18に記載の方法。
実施形態24.1つ以上のプロセッサと、1つ以上のプロセッサによる実行のための1つ以上のプログラムを記憶するメモリとを備えるデバイスであって、1つ以上のプログラムが、(a)対象のc反応性タンパク質と関連付けられる対象の生物学的試料上の基準線に沿った複数の位置における各それぞれの位置をサンプリングし、それによって、複数の蛍光強度測定値を取得することであって、複数の蛍光強度測定値における各蛍光強度測定値が、複数の位置における異なる位置に対応し、複数の位置における各位置が、c反応性タンパク質と関連付けられる対象の生物学的試料の異なる成長期間を表す、サンプリングすることと、(b)生物学的試料上の基準線にわたって各蛍光強度を分析し、それによって第1のデータセットを取得することと、(c)対応する複数の蛍光強度測定値からそれぞれの第2のデータセットを導出することであって、特徴の対応するセットにおける各それぞれの特徴が、c反応性タンパク質蛍光強度の連続した変動によって判定される、導出することと、(d)訓練されたモデルを使用して、特徴を処理して、c反応性タンパク質と関連付けられる疾患又は障害に関する対象の診断状態を予測することと、を行うための命令を含む、デバイス。
実施形態25.複数の蛍光強度測定値が、反転又は非反転共焦点顕微鏡を用いて測定される、実施形態24に記載のデバイス。
実施形態26.生物学的試料が、歯試料を含む、実施形態24又は25に記載のデバイス。
実施形態27.歯試料が、C反応性タンパク質免疫組織化学染色を使用して染色される、実施形態24~26のいずれか1つに記載のデバイス。
実施形態28.命令が、歯試料を切片化することを更に含む、実施形態26に記載のデバイス。
実施形態29.命令が、歯試料を脱石灰化することを更に含む、実施形態26に記載のデバイス。
実施形態30.疾患又は障害が、自閉症スペクトラム障害(ASD)、注意欠陥/多動性障害(ADHD)、筋萎縮性側索硬化症(ALS)、統合失調症、過敏性腸疾患(IBD)、小児腎疾患、腎移植拒絶反応、小児癌、又はそれらの任意の組み合わせを含む、実施形態24~29のいずれか1つに記載のデバイス。
実施形態31.疾患又は障害が、自閉症スペクトラム障害ASDを含む、実施形態24~29のいずれか1つに記載のデバイス。
実施形態32.対象が、ヒトである、実施形態24~31のいずれか1つに記載のデバイス。
実施形態33.対象が、12歳未満である、実施形態24~32のいずれか1つに記載のデバイス。
実施形態34.対象が、1歳未満である、実施形態24~32のいずれか1つに記載のデバイス。
実施形態35.分析することが、複数の蛍光強度測定値に少なくとも部分的に基づいて、炎症の時間プロファイルを生成することと、炎症の時間プロファイルを分析することと、を含む、実施形態24~34のいずれか1つに記載のデバイス。
実施形態36.炎症の時間プロファイルの少なくとも一部分が、対象の出生前期間に対応する、実施形態35に記載のデバイス。
実施形態37.疾患又は障害に関する対象の診断状態を予測することが、訓練されたモデルを使用して、複数の蛍光強度測定値を処理することを含む、実施形態24~36のいずれか1つに記載のデバイス。
実施形態38.訓練されたモデルが、ニューラルネットワークアルゴリズム、サポートベクトルマシンアルゴリズム、決定木アルゴリズム、教師なしクラスタリングアルゴリズム、教師ありクラスタリングアルゴリズム、回帰アルゴリズム、勾配ブーストアルゴリズム、及びそれらの任意の組み合わせからなる群から選択される、実施形態37に記載のデバイス。
実施形態39.訓練されたモデルが、勾配ブーストされた決定木を含む、実施形態37に記載のデバイス。
実施形態40.訓練されたモデルが、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される1つ以上の特徴を処理するように構成される、実施形態37に記載のデバイス。
実施形態41.訓練されたモデルが、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間(TT)、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される2つ以上の特徴を処理するように構成される、実施形態37に記載のデバイス。
実施形態42.訓練されたモデルが、少なくとも約80%の感度を伴って疾患又は障害に関する診断状態を予測する、実施形態24~41のいずれか1つに記載のデバイス。
実施形態43.訓練されたモデルが、少なくとも約80%の特異性を伴って疾患又は障害に関する診断状態を予測する、実施形態24~41のいずれか1つに記載のデバイス。
実施形態44.訓練されたモデルが、少なくとも約80%の陽性予測値を伴って疾患又は障害に関する診断状態を予測する、実施形態24~41のいずれか1つに記載のデバイス。
実施形態45.訓練されたモデルが、少なくとも約80%の陰性予測値を伴って疾患又は障害に関する診断状態を予測する、実施形態24~41のいずれか1つに記載のデバイス。
実施形態46.訓練されたモデルが、少なくとも約0.80の受信者動作特性曲線下面積(AUROC)を伴って疾患又は障害に関する診断状態を予測する、実施形態24~41のいずれか1つに記載のデバイス。
実施形態47.非一時的コンピュータ可読記憶媒体及び非一時的コンピュータ可読記憶媒体に埋め込まれた1つ以上のコンピュータプログラムであって、1つ以上のコンピュータプログラムが、命令を含み、命令が、コンピュータシステムによって実行されるとき、コンピュータシステムに、(a)対象のc反応性タンパク質と関連付けられる対象の生物学的試料上の基準線に沿った複数の位置における各それぞれの位置をサンプリングし、それによって、複数の蛍光強度測定値を取得することであって、複数の蛍光強度測定値における各蛍光強度測定値が、複数の位置における異なる位置に対応し、複数の位置における各位置が、c反応性タンパク質と関連付けられる対象の生物学的試料の異なる成長期間を表す、サンプリングすることと、(b)生物学的試料上の基準線にわたって各蛍光強度を分析し、それによって、第1のデータセットを取得することと、(c)対応する複数の蛍光強度測定値からそれぞれの第2のデータセットを導出することであって、特徴の対応するセットにおける各それぞれの特徴が、c反応性タンパク質蛍光強度のばらつきによって判定される、導出することと、(d)訓練されたモデルを使用して特徴を処理して、c反応性タンパク質と関連付けられる疾患又は障害に関する対象の診断状態を予測することと、を含む方法を行わせる、非一時的コンピュータ可読記憶媒体及び該非一時的コンピュータ可読記憶媒体に埋め込まれた1つ以上のコンピュータプログラム。
実施形態48.複数の蛍光強度測定値が、反転又は非反転共焦点顕微鏡を用いて測定される、実施形態47に記載の非一時的コンピュータ可読記憶媒体。
実施形態49.生物学的試料が、歯試料を含む、請求項47又は48に記載の非一時的コンピュータ可読記憶媒体。
実施形態50.歯試料が、C反応性タンパク質免疫組織化学染色を使用して染色される、請求項49に記載の非一時的コンピュータ可読記憶媒体。
実施形態51.方法が、歯試料を切片化することを更に含む、請求項49に記載の非一時的コンピュータ可読記憶媒体。
実施形態52.方法が、歯試料を脱石灰化することを更に含む、実施形態47~51のいずれか1つに記載の非一時的コンピュータ可読記憶媒体。
実施形態53.疾患又は障害が、自閉症スペクトラム障害(ASD)、注意欠陥/多動性障害(ADHD)、筋萎縮性側索硬化症(ALS)、統合失調症、過敏性腸疾患(IBD)、小児腎疾患、腎移植拒絶反応、小児癌、又はそれらの任意の組み合わせを含む、実施形態47~52のいずれか1つに記載の非一時的コンピュータ可読記憶媒体。
実施形態54.疾患又は障害が、自閉症スペクトラム障害(ASD)を含む、実施形態47~52のいずれか1つに記載の非一時的コンピュータ可読記憶媒体。
実施形態55.対象が、ヒトである、実施形態47~54のいずれか1つに記載の非一時的コンピュータ可読記憶媒体。
実施形態56.対象が、12歳未満である、実施形態47~55のいずれか1つに記載の非一時的コンピュータ可読記憶媒体。
実施形態57.対象が、1歳未満である、実施形態47~55のいずれか1つに記載の非一時的コンピュータ可読記憶媒体。
実施形態58.分析することが、複数の蛍光強度測定値に少なくとも部分的に基づいて、炎症の時間プロファイルを生成することと、炎症の時間プロファイルを分析することと、を含む、実施形態47~57のいずれか1つに記載の非一時的コンピュータ可読記憶媒体。
実施形態59.炎症の時間プロファイルの少なくとも一部分が、対象の出生前期間に対応する、実施形態58に記載の非一時的コンピュータ可読記憶媒体。
実施形態60.疾患又は障害に関する対象の診断状態を予測することが、訓練されたモデルを使用して、複数の蛍光強度測定値を処理することを含む、実施形態47~59のいずれか1つに記載の非一時的コンピュータ可読記憶媒体。
実施形態61.訓練されたモデルが、ニューラルネットワークアルゴリズム、サポートベクトルマシンアルゴリズム、決定木アルゴリズム、教師なしクラスタリングアルゴリズム、教師ありクラスタリングアルゴリズム、回帰アルゴリズム、勾配ブーストアルゴリズム、及びそれらの任意の組み合わせからなる群から選択される、実施形態60に記載の非一時的コンピュータ可読記憶媒体。
実施形態62.訓練されたモデルが、勾配ブーストされた決定木を含む、実施形態60に記載の非一時的コンピュータ可読記憶媒体。
実施形態63.訓練されたモデルが、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される1つ以上の特徴を処理するように構成される、実施形態60に記載の非一時的コンピュータ可読記憶媒体。
実施形態64.訓練されたモデルが、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間(TT)、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される2つ以上の特徴を処理するように構成される、実施形態60に記載の非一時的コンピュータ可読記憶媒体。
実施形態65.訓練されたモデルが、少なくとも約80%の感度を伴って疾患又は障害に関する診断状態を予測する、実施形態47~64のいずれか1つに記載の非一時的コンピュータ可読記憶媒体。
実施形態66.訓練されたモデルが、少なくとも約80%の特異性を伴って疾患又は障害に関する診断状態を予測する、実施形態47~64のいずれか1つに記載の非一時的コンピュータ可読記憶媒体。
実施形態67.訓練されたモデルが、少なくとも約80%の陽性予測値を伴って疾患又は障害に関する診断状態を予測する、実施形態47に記載の非一時的コンピュータ可読記憶媒体。
実施形態68.訓練されたモデルが、少なくとも約80%の陰性予測値を伴って疾患又は障害に関する診断状態を予測する、実施形態47に記載の非一時的コンピュータ可読記憶媒体。
実施形態69.訓練されたモデルが、少なくとも約0.80の受信者動作特性曲線下面積(AUROC)を伴って疾患又は障害に関する診断状態を予測する、実施形態47に記載の非一時的コンピュータ可読記憶媒体。
実施形態70.モデルを訓練するための方法であって、1つ以上のプロセッサと、1つ以上のプロセッサによって実行するための1つ以上のプログラムを記憶するメモリと、を有するコンピュータシステムにおいて、(a)複数の訓練対象における訓練対象の第1のサブセットが、c反応性タンパク質と関連付けられる第1の生物学的状態を有することに対応する第1の診断状態を有し、複数の訓練対象における訓練対象の第2のサブセットが、c反応性タンパク質と関連付けられる第1の生物学的状態を有しないことに対応する第2の診断状態を有する、複数の訓練対象における各それぞれの訓練対象について、(i)対象のc反応性タンパク質と関連付けられる対象の生物学的試料上の基準線に沿った複数の位置における各それぞれの位置をサンプリングし、それによって、複数の蛍光強度測定値を取得することであって、複数の蛍光強度測定値における各蛍光強度測定値が、複数の位置における異なる位置に対応し、複数の位置における各位置が、c反応性タンパク質と関連付けられる対象の生物学的試料の異なる成長期間を表す、サンプリングすることと、(ii)生物学的試料上の基準線にわたって各蛍光強度を分析し、それによって第1のデータセットを取得することと、(iii)対応する複数の蛍光強度測定値からそれぞれの第2のデータセットを導出することであって、特徴の対応するセットにおける各それぞれの特徴が、c反応性タンパク質蛍光強度における連続した変動によって判定される、導出することと、(b)(i)複数の訓練対象における各訓練対象の各それぞれの第2のデータセットの特徴の対応するセット、及び(ii)第1の診断状態及び第2の診断状態の中から選択される、複数の訓練対象における各訓練対象の対応する診断状態を用いて、訓練されていないか又は部分的に訓練されていないモデルを訓練し、それによって、試験対象のc反応性タンパク質と関連付けられる生物学的試料から取得された特徴のセットにおける特徴の値に基づいて、試験対象がc反応性タンパク質と関連付けられる第1の生物学的状態を有するかどうかに関する指示を提供する訓練されたモデルを取得することと、を含む、方法。
実施形態71.訓練されたモデルが、ニューラルネットワークアルゴリズム、サポートベクトルマシンアルゴリズム、決定木アルゴリズム、教師なしクラスタリングモデルアルゴリズム、教師ありクラスタリングモデルアルゴリズム、回帰モデル、勾配ブーストアルゴリズム、又はそれらの任意の組み合わせである、実施形態70に記載の方法。
実施形態72.訓練されたモデルが、多項分類器である、実施形態70に記載の方法。
実施形態73.訓練されたモデルが、二項分類器である、実施形態70に記載の方法。
実施形態74.c反応性タンパク質と関連付けられる第1の生物学的状態が、自閉症スペクトラム障害(ASD)、注意欠陥/多動性障害(ADHD)、筋萎縮性側索硬化症(ALS)、統合失調症、過敏性腸疾患(IBD)、小児腎疾患、腎臓移植拒絶反応、及び小児癌からなる群から選択される、実施形態70~73のいずれか1つに記載の方法。
実施形態75.方法が、c反応性タンパク質と関連付けられる第1の生物学的状態と、金属代謝と関連付けられる第1の生物学的状態とは異なるc反応性タンパク質と関連付けられる第2の生物学的状態とを区別することによって、c反応性タンパク質と関連付けられる第1の生物学的状態について試験対象を評価することを更に含む、実施形態70に記載の方法。
実施形態76.第1の生物学的状態が、自閉症スペクトラム障害であり、第2の生物学的状態が、注意欠陥/多動性障害である、実施形態75に記載の方法。
実施形態77.試験対象が、ヒトである、実施形態70~76のいずれか1つに記載の方法。
実施形態78.ヒトが、12歳未満である、実施形態77に記載の方法。
実施形態79.ヒトが、1歳未満である、実施形態78に記載の方法。
実施形態80.それぞれの訓練対象のc反応性タンパク質と関連付けられる対応する生物学的試料が、毛幹、歯、及び爪からなる群から選択される、実施形態70~79のいずれか1つに記載の方法。
実施形態81.それぞれの訓練対象のc反応性タンパク質と関連付けられる対応する生物学的試料が、毛幹であり、基準線が、毛幹の長手方向に対応する、実施形態80に記載の方法。
実施形態82.それぞれの訓練対象のc反応性タンパク質と関連付けられる対応する生物学的試料が、歯であり、基準線が、歯の新生児線を含む、成長帯を横切る方向に対応する、実施形態70~79のいずれか1つに記載の方法。
実施形態83.それぞれの訓練対象のc反応性タンパク質と関連付けられる対応する生物学的試料に沿った対応する複数の位置における第1の位置が、それぞれの訓練対象のc反応性タンパク質と関連付けられる対応する生物学的試料の先端に最も近い位置に対応するように、対応する複数の位置が配列される、実施形態70~82のいずれか1つに記載の方法。
実施形態84.対応する複数の蛍光強度測定値における各トレースが、複数のデータポイントを含み、各データポイントが、複数の位置におけるそれぞれの位置のインスタンスである、実施形態70~79のいずれか1つに記載の方法。
実施形態85.特徴の対応するセットが、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される、実施形態70~84のいずれか1つに記載の方法。
実施形態86.対応する複数の位置が、少なくとも1000、1500、2000、2500、3000、3500、4000、4500、又は5000、6000、7000、8000、9000、10000、12000、14000、16000、18000、20000、又は20000を超える位置を含む、実施形態70~86のいずれか1つに記載の方法。

Claims (86)

  1. 疾患又は障害に関する対象の診断状態を予測するための方法であって、
    (a)前記対象の歯試料を染色して、染色された歯試料を生成することと、
    (b)前記染色された歯試料にわたって空間的に蛍光強度を分析することと、
    (c)前記蛍光強度の前記分析に少なくとも部分的に基づいて、前記疾患又は障害に関する対象の診断状態を予測することと、を含む、方法。
  2. 前記分析することが、前記染色された歯試料の蛍光画像を取得することと、前記蛍光画像の前記蛍光強度を分析することと、を含む、請求項1に記載の方法。
  3. 前記染色された歯試料の前記蛍光画像を取得することが、反転又は非反転共焦点顕微鏡を使用することを含む、請求項2に記載の方法。
  4. 前記歯試料を染色することが、C反応性タンパク質免疫組織化学染色を使用することを含む、請求項1~3のいずれか一項に記載の方法。
  5. 前記歯試料を切片化することを更に含む、請求項1~4のいずれか一項に記載の方法。
  6. 前記歯試料を染色することが、前記歯試料を脱石灰化することを含む、請求項1~5のいずれか一項に記載の方法。
  7. 前記疾患又は障害が、自閉症スペクトラム障害(ASD)、注意欠陥/多動性障害(ADHD)、筋萎縮性側索硬化症(ALS)、統合失調症、過敏性腸疾患(IBD)、小児腎疾患、腎移植拒絶反応、小児癌、又はそれらの任意の組み合わせを含む、請求項1~6のいずれか一項に記載の方法。
  8. 前記疾患又は障害が、自閉症スペクトラム障害を含む、請求項1~6のいずれか一項に記載の方法。
  9. 前記対象が、ヒトである、請求項1~8のいずれか一項に記載の方法。
  10. 前記対象が、12歳未満である、請求項9に記載の方法。
  11. 前記対象が、1歳未満である、請求項9に記載の方法。
  12. 前記分析することが、前記蛍光強度に少なくとも部分的に基づいて、炎症の時間プロファイルを生成することと、炎症の前記時間プロファイルを分析することと、を含む、請求項1~11のいずれか一項に記載の方法。
  13. 前記炎症の時間プロファイルの少なくとも一部分が、前記対象の出生前期間に対応する、請求項12に記載の方法。
  14. 前記疾患又は障害に関する対象の診断状態を予測することが、訓練されたモデルを使用して、前記蛍光強度を処理することを含む、請求項1~13のいずれか一項に記載の方法。
  15. 前記訓練されたモデルが、ニューラルネットワークアルゴリズム、サポートベクトルマシンアルゴリズム、決定木アルゴリズム、教師なしクラスタリングアルゴリズム、教師ありクラスタリングアルゴリズム、回帰アルゴリズム、勾配ブーストアルゴリズム、及びそれらの任意の組み合わせからなる群から選択される、請求項14に記載の方法。
  16. 前記訓練されたモデルが、勾配ブーストされた決定木を含む、請求項14に記載の方法。
  17. 前記訓練されたモデルが、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される1つ以上の特徴を処理するように構成される、請求項14に記載の方法。
  18. 前記訓練されたモデルが、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間(TT)、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される2つ以上の特徴を処理するように構成される、請求項17に記載の方法。
  19. 前記訓練されたモデルが、少なくとも約80%の感度を伴って前記疾患又は障害に関する診断状態を予測する、請求項18に記載の方法。
  20. 前記訓練されたモデルが、少なくとも約80%の特異性を伴って前記疾患又は障害に関する診断状態を予測する、請求項18に記載の方法。
  21. 前記訓練されたモデルが、少なくとも約80%の陽性予測値を伴って前記疾患又は障害に関する診断状態を予測する、請求項18に記載の方法。
  22. 前記訓練されたモデルが、少なくとも約80%の陰性予測値を伴って前記疾患又は障害に関する診断状態を予測する、請求項18に記載の方法。
  23. 前記訓練されたモデルが、少なくとも約0.80の受信者動作特性曲線下面積(AUROC)を伴って前記疾患又は障害に関する診断状態を予測する、請求項18に記載の方法。
  24. 1つ以上のプロセッサと、前記1つ以上のプロセッサによる実行のための1つ以上のプログラムを記憶するメモリとを備えるデバイスであって、前記1つ以上のプログラムが、
    (a)対象のc反応性タンパク質と関連付けられる前記対象の生物学的試料上の基準線に沿った複数の位置における各それぞれの位置をサンプリングし、それによって、複数の蛍光強度測定値を取得することであって、前記複数の蛍光強度測定値における各蛍光強度測定値が、前記複数の位置における異なる位置に対応し、前記複数の位置における各位置が、c反応性タンパク質と関連付けられる前記対象の前記生物学的試料の異なる成長期間を表す、サンプリングすることと、
    (b)前記生物学的試料上の基準線にわたって各蛍光強度を分析し、それによって第1のデータセットを取得することと、
    (c)前記対応する複数の蛍光強度測定値からそれぞれの第2のデータセットを導出することであって、特徴の対応するセットにおける各それぞれの特徴が、c反応性タンパク質蛍光強度の連続した変動によって判定される、導出することと、
    (d)訓練されたモデルを使用して、前記特徴を処理して、c反応性タンパク質と関連付けられる疾患又は障害に関する対象の診断状態を予測することと、を行うための命令を含む、デバイス。
  25. 前記複数の蛍光強度測定値が、反転又は非反転共焦点顕微鏡を用いて測定される、請求項24に記載のデバイス。
  26. 前記生物学的試料が、歯試料を含む、請求項24又は25に記載のデバイス。
  27. 前記歯試料が、C反応性タンパク質免疫組織化学染色を使用して染色される、請求項24~26のいずれか一項に記載のデバイス。
  28. 前記命令が、前記歯試料を切片化することを更に含む、請求項26に記載のデバイス。
  29. 前記命令が、前記歯試料を脱石灰化することを更に含む、請求項26に記載のデバイス。
  30. 前記疾患又は障害が、自閉症スペクトラム障害(ASD)、注意欠陥/多動性障害(ADHD)、筋萎縮性側索硬化症(ALS)、統合失調症、過敏性腸疾患(IBD)、小児腎疾患、腎移植拒絶反応、小児癌、又はそれらの任意の組み合わせを含む、請求項24~29のいずれか一項に記載のデバイス。
  31. 疾患又は障害が、自閉症スペクトラム障害ASDを含む、請求項24~29のいずれか一項に記載のデバイス。
  32. 前記対象が、ヒトである、請求項24~31のいずれか一項に記載のデバイス。
  33. 前記対象が、12歳未満である、請求項24~32のいずれか一項に記載のデバイス。
  34. 前記対象が、1歳未満である、請求項24~32のいずれか一項に記載のデバイス。
  35. 前記分析することが、前記複数の蛍光強度測定値に少なくとも部分的に基づいて、炎症の時間プロファイルを生成することと、前記炎症の時間プロファイルを分析することと、を含む、請求項24~34のいずれか一項に記載のデバイス。
  36. 前記炎症の時間プロファイルの少なくとも一部分が、前記対象の出生前期間に対応する、請求項35に記載のデバイス。
  37. 前記疾患又は障害に関する前記対象の診断状態を前記予測することが、前記訓練されたモデルを使用して、前記複数の蛍光強度測定値を処理することを含む、請求項24~36のいずれか一項に記載のデバイス。
  38. 前記訓練されたモデルが、ニューラルネットワークアルゴリズム、サポートベクトルマシンアルゴリズム、決定木アルゴリズム、教師なしクラスタリングアルゴリズム、教師ありクラスタリングアルゴリズム、回帰アルゴリズム、勾配ブーストアルゴリズム、及びそれらの任意の組み合わせからなる群から選択される、請求項37に記載のデバイス。
  39. 前記訓練されたモデルが、勾配ブーストされた決定木を含む、請求項37に記載のデバイス。
  40. 前記訓練されたモデルが、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される1つ以上の特徴を処理するように構成される、請求項37に記載のデバイス。
  41. 前記訓練されたモデルが、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間(TT)、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される2つ以上の特徴を処理するように構成される、請求項37に記載のデバイス。
  42. 前記訓練されたモデルが、少なくとも約80%の感度を伴って前記疾患又は障害に関する診断状態を予測する、請求項24~41のいずれか一項に記載のデバイス。
  43. 前記訓練されたモデルが、少なくとも約80%の特異性を伴って前記疾患又は障害に関する診断状態を予測する、請求項24~41のいずれか一項に記載のデバイス。
  44. 前記訓練されたモデルが、少なくとも約80%の陽性予測値を伴って前記疾患又は障害に関する診断状態を予測する、請求項24~41のいずれか一項に記載のデバイス。
  45. 前記訓練されたモデルが、少なくとも約80%の陰性予測値を伴って前記疾患又は障害に関する診断状態を予測する、請求項24~41のいずれか一項に記載のデバイス。
  46. 前記訓練されたモデルが、少なくとも約0.80の受信者動作特性曲線下面積(AUROC)を伴って前記疾患又は障害に関する診断状態を予測する、請求項24~41のいずれか一項に記載のデバイス。
  47. 非一時的コンピュータ可読記憶媒体及び前記非一時的コンピュータ可読記憶媒体に埋め込まれた1つ以上のコンピュータプログラムであって、前記1つ以上のコンピュータプログラムが、命令を含み、前記命令が、コンピュータシステムによって実行されるとき、前記コンピュータシステムに、
    (a)対象のc反応性タンパク質と関連付けられる前記対象の生物学的試料上の基準線に沿った複数の位置における各それぞれの位置をサンプリングし、それによって、複数の蛍光強度測定値を取得することであって、前記複数の蛍光強度測定値における各蛍光強度測定値が、前記複数の位置における異なる位置に対応し、前記複数の位置における各位置が、c反応性タンパク質と関連付けられる前記対象の前記生物学的試料の異なる成長期間を表す、サンプリングすることと、
    (b)前記生物学的試料上の基準線にわたって各蛍光強度を分析し、それによって第1のデータセットを取得することと、
    (c)前記対応する複数の蛍光強度測定値からそれぞれの第2のデータセットを導出することであって、特徴の対応するセットにおける各それぞれの特徴が、c反応性タンパク質蛍光強度のばらつきによって判定される、導出することと、
    (d)訓練されたモデルを使用して前記特徴を処理して、c反応性タンパク質と関連付けられる疾患又は障害に関する対象の診断状態を予測することと、を含む方法を行わせる、非一時的コンピュータ可読記憶媒体及び前記非一時的コンピュータ可読記憶媒体に埋め込まれた1つ以上のコンピュータプログラム。
  48. 前記複数の蛍光強度測定値が、反転又は非反転共焦点顕微鏡を用いて測定される、請求項47に記載の非一時的コンピュータ可読記憶媒体。
  49. 前記生物学的試料が、歯試料を含む、請求項47又は48に記載の非一時的コンピュータ可読記憶媒体。
  50. 前記歯試料が、C反応性タンパク質免疫組織化学染色を使用して染色される、請求項49に記載の非一時的コンピュータ可読記憶媒体。
  51. 前記方法が、前記歯試料を切片化することを更に含む、請求項49に記載の非一時的コンピュータ可読記憶媒体。
  52. 前記方法が、前記歯試料を脱石灰化することを更に含む、請求項47~51のいずれか一項に記載の非一時的コンピュータ可読記憶媒体。
  53. 前記疾患又は障害が、自閉症スペクトラム障害(ASD)、注意欠陥/多動性障害(ADHD)、筋萎縮性側索硬化症(ALS)、統合失調症、過敏性腸疾患(IBD)、小児腎臓病、腎臓移植拒絶反応、小児癌、又はそれらの任意の組み合わせを含む、請求項47~52のいずれか一項に記載の非一時的コンピュータ可読記憶媒体。
  54. 疾患又は障害が、自閉症スペクトラム障害(ASD)を含む、請求項47~52のいずれか一項に記載の非一時的コンピュータ可読記憶媒体。
  55. 前記対象が、ヒトである、請求項47~54のいずれか一項に記載の非一時的コンピュータ可読記憶媒体。
  56. 前記対象が、12歳未満である、請求項47~55のいずれか一項に記載の非一時的コンピュータ可読記憶媒体。
  57. 前記対象が、1歳未満である、請求項47~55のいずれか一項に記載の非一時的コンピュータ可読記憶媒体。
  58. 分析することが、前記複数の蛍光強度測定値に少なくとも部分的に基づいて、炎症の時間プロファイルを生成することと、前記炎症の時間プロファイルを分析することと、を含む、請求項47~57のいずれか一項に記載の非一時的コンピュータ可読記憶媒体。
  59. 前記炎症の時間プロファイルの少なくとも一部分が、前記対象の出生前期間に対応する、請求項58に記載の非一時的コンピュータ可読記憶媒体。
  60. 前記疾患又は障害に関する前記対象の診断状態を予測することが、前記訓練されたモデルを使用して、前記複数の蛍光強度測定値を処理することを含む、請求項47~59のいずれか一項に記載の非一時的コンピュータ可読記憶媒体。
  61. 前記訓練されたモデルが、ニューラルネットワークアルゴリズム、サポートベクトルマシンアルゴリズム、決定木アルゴリズム、教師なしクラスタリングアルゴリズム、教師ありクラスタリングアルゴリズム、回帰アルゴリズム、勾配ブーストアルゴリズム、及びそれらの任意の組み合わせからなる群から選択される、請求項60に記載の非一時的コンピュータ可読記憶媒体。
  62. 前記訓練されたモデルが、勾配ブーストされた決定木を含む、請求項60に記載の非一時的コンピュータ可読記憶媒体。
  63. 前記訓練されたモデルが、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される1つ以上の特徴を処理するように構成される、請求項60に記載の非一時的コンピュータ可読記憶媒体。
  64. 前記訓練されたモデルが、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間(TT)、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される2つ以上の特徴を処理するように構成される、請求項60に記載の非一時的コンピュータ可読記憶媒体。
  65. 前記訓練されたモデルが、少なくとも約80%の感度を伴って前記疾患又は障害に関する診断状態を予測する、請求項47~64のいずれか一項に記載の非一時的コンピュータ可読記憶媒体。
  66. 前記訓練されたモデルが、少なくとも約80%の特異性を伴って前記疾患又は障害に関する診断状態を予測する、請求項47~64のいずれか一項に記載の非一時的コンピュータ可読記憶媒体。
  67. 前記訓練されたモデルが、少なくとも約80%の陽性予測値を伴って前記疾患又は障害に関する診断状態を予測する、請求項47に記載の非一時的コンピュータ可読記憶媒体。
  68. 前記訓練されたモデルが、少なくとも約80%の陰性予測値を伴って前記疾患又は障害に関する診断状態を予測する、請求項47に記載の非一時的コンピュータ可読記憶媒体。
  69. 前記訓練されたモデルが、少なくとも約0.80の受信者動作特性曲線下面積(AUROC)を伴って前記疾患又は障害に関する診断状態を予測する、請求項47に記載の非一時的コンピュータ可読記憶媒体。
  70. モデルを訓練するための方法であって、
    1つ以上のプロセッサと、前記1つ以上のプロセッサによって実行するための1つ以上のプログラムを記憶するメモリと、を有するコンピュータシステムにおいて、
    (a)複数の訓練対象における訓練対象の第1のサブセットが、c反応性タンパク質と関連付けられる第1の生物学的状態を有することに対応する第1の診断状態を有し、前記複数の訓練対象における訓練対象の第2のサブセットが、c反応性タンパク質と関連付けられる前記第1の生物学的状態を有しないことに対応する第2の診断状態を有する、前記複数の訓練対象における各それぞれの訓練対象について、
    (i)前記対象のc反応性タンパク質と関連付けられる前記対象の生物学的試料上の基準線に沿った複数の位置における各それぞれの位置をサンプリングし、それによって、複数の蛍光強度測定値を取得することであって、前記複数の蛍光強度測定値における各蛍光強度測定値が、前記複数の位置における異なる位置に対応し、前記複数の位置における各位置が、c反応性タンパク質と関連付けられる前記対象の前記生物学的試料の異なる成長期間を表す、サンプリングすることと、
    (ii)前記生物学的試料上の前記基準線にわたって各蛍光強度を分析し、それによって第1のデータセットを取得することと、
    (iii)前記対応する複数の蛍光強度測定値からそれぞれの第2のデータセットを導出することであって、前記特徴の対応するセットにおける各それぞれの特徴が、c反応性タンパク質蛍光強度における連続した変動によって判定される、導出することと、
    (b)(i)前記複数の訓練対象における各訓練対象の各それぞれの第2のデータセットの特徴の対応するセット、及び(ii)前記第1の診断状態及び前記第2の診断状態の中から選択される、前記複数の訓練対象における各訓練対象の前記対応する診断状態を用いて、訓練されていないか又は部分的に訓練されていないモデルを訓練し、それによって、試験対象のc反応性タンパク質と関連付けられる生物学的試料から取得された特徴のセットにおける特徴の値に基づいて、前記試験対象がc反応性タンパク質と関連付けられる前記第1の生物学的状態を有するかどうかに関する指示を提供する訓練されたモデルを取得することと、を含む、方法。
  71. 前記訓練されたモデルが、ニューラルネットワークアルゴリズム、サポートベクトルマシンアルゴリズム、決定木アルゴリズム、教師なしクラスタリングモデルアルゴリズム、教師ありクラスタリングモデルアルゴリズム、回帰モデル、勾配ブーストアルゴリズム、又はそれらの任意の組み合わせである、請求項70に記載の方法。
  72. 前記訓練されたモデルが、多項分類器である、請求項70に記載の方法。
  73. 前記訓練されたモデルが、二項分類器である、請求項70に記載の方法。
  74. c反応性タンパク質と関連付けられる前記第1の生物学的状態が、自閉症スペクトラム障害(ASD)、注意欠陥/多動性障害(ADHD)、筋萎縮性側索硬化症(ALS)、統合失調症、過敏性腸疾患(IBD)、小児腎臓病、腎臓移植拒絶反応、及び小児癌からなる群から選択される、請求項70~73のいずれか一項に記載の方法。
  75. 前記方法が、c反応性タンパク質と関連付けられる前記第1の生物学的状態と、金属代謝と関連付けられる前記第1の生物学的状態とは異なるc反応性タンパク質と関連付けられる第2の生物学的状態とを区別することによって、c反応性タンパク質と関連付けられる前記第1の生物学的状態について前記試験対象を評価することを更に含む、請求項70に記載の方法。
  76. 前記第1の生物学的状態が、自閉症スペクトラム障害であり、前記第2の生物学的状態が、注意欠陥/多動性障害である、請求項75に記載の方法。
  77. 前記試験対象が、ヒトである、請求項70~76のいずれか一項に記載の方法。
  78. 前記ヒトが、12歳未満である、請求項77に記載の方法。
  79. 前記ヒトが、1歳未満である、請求項78に記載の方法。
  80. 前記それぞれの訓練対象のc反応性タンパク質と関連付けられる前記対応する生物学的試料が、毛幹、歯、及び爪からなる群から選択される、請求項70~79のいずれか一項に記載の方法。
  81. 前記それぞれの訓練対象のc反応性タンパク質と関連付けられる前記対応する生物学的試料が、前記毛幹であり、前記基準線が、前記毛幹の長手方向に対応する、請求項80に記載の方法。
  82. 前記それぞれの訓練対象のc反応性タンパク質と関連付けられる前記対応する生物学的試料が、前記歯であり、前記基準線が、前記歯の新生児線を含む、成長帯を横切る方向に対応する、請求項70~79のいずれか一項に記載の方法。
  83. 前記それぞれの訓練対象のc反応性タンパク質と関連付けられる前記対応する生物学的試料に沿った前記対応する複数の位置における第1の位置が、前記それぞれの訓練対象のc反応性タンパク質と関連付けられる前記対応する生物学的試料の先端に最も近い位置に対応するように、前記対応する複数の位置が配列される、請求項70~82のいずれか一項に記載の方法。
  84. 前記対応する複数の蛍光強度測定値における各トレースが、複数のデータポイントを含み、各データポイントが、前記複数の位置における前記それぞれの位置のインスタンスである、請求項70~79のいずれか一項に記載の方法。
  85. 前記特徴の対応するセットが、再発率、決定論、平均対角線長、最大対角線長、発散、対角線長におけるシャノンエントロピー、再発の傾向、層状性、トラッピング時間、最大垂直線長、垂直線長におけるシャノンエントロピー、平均再発時間、再発時間におけるシャノンエントロピー、最も可能性の高い再発の回数、平均対角線長(MDL)、再発時間(RT)、Vmax、決定論、Lmax、及びそれらの任意の組み合わせからなる群から選択される、請求項70~84のいずれか一項に記載の方法。
  86. 前記対応する複数の位置が、少なくとも1000、1500、2000、2500、3000、3500、4000、4500、又は5000、6000、7000、8000、9000、10000、12000、14000、16000、18000、20000、又は20000を超える位置を含む、請求項70~86のいずれか一項に記載の方法。
JP2023533607A 2020-12-04 2021-12-03 生物学的障害の動的免疫組織化学プロファイリングのためのシステム及び方法 Pending JP2024501620A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063121792P 2020-12-04 2020-12-04
US63/121,792 2020-12-04
PCT/US2021/061803 WO2022120164A1 (en) 2020-12-04 2021-12-03 Systems and methods for dynamic immunohistochemistry profiling of biological disorders

Publications (1)

Publication Number Publication Date
JP2024501620A true JP2024501620A (ja) 2024-01-15

Family

ID=79259454

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023533607A Pending JP2024501620A (ja) 2020-12-04 2021-12-03 生物学的障害の動的免疫組織化学プロファイリングのためのシステム及び方法

Country Status (9)

Country Link
US (1) US20240003813A1 (ja)
EP (1) EP4256345A1 (ja)
JP (1) JP2024501620A (ja)
KR (1) KR20240043724A (ja)
CN (1) CN117859064A (ja)
AU (1) AU2021391811A1 (ja)
CA (1) CA3201128A1 (ja)
MX (1) MX2023006475A (ja)
WO (1) WO2022120164A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023240117A1 (en) * 2022-06-08 2023-12-14 Icahn School Of Medicine At Mount Sinai Systems and methods for dynamic immunohistochemistry profiling of biological disorders and feature engineering thereof

Also Published As

Publication number Publication date
AU2021391811A1 (en) 2023-07-20
US20240003813A1 (en) 2024-01-04
WO2022120164A1 (en) 2022-06-09
KR20240043724A (ko) 2024-04-03
EP4256345A1 (en) 2023-10-11
MX2023006475A (es) 2023-08-21
CA3201128A1 (en) 2022-06-09
CN117859064A (zh) 2024-04-09

Similar Documents

Publication Publication Date Title
Van Smeden et al. Critical appraisal of artificial intelligence-based prediction models for cardiovascular disease
US20230120282A1 (en) Systems and methods for managing autoimmune conditions, disorders and diseases
US11521716B2 (en) Computer-implemented detection and statistical analysis of errors by healthcare providers
Zhou et al. The detection of age groups by dynamic gait outcomes using machine learning approaches
US20240112803A1 (en) Systems and Methods for Dynamic Raman Profiling of Biological Diseases and Disorders
Nishadi Predicting heart diseases in logistic regression of machine learning algorithms by Python Jupyterlab
JP2014083194A (ja) ネットワークエントロピーに基づく生体の状態遷移の予兆の検出を支援する検出装置、検出方法及び検出プログラム
JP5963198B2 (ja) 動的ネットワークバイオマーカーの検出装置、検出方法及び検出プログラム
JP2024501620A (ja) 生物学的障害の動的免疫組織化学プロファイリングのためのシステム及び方法
US20230368921A1 (en) Systems and methods for exposomic clinical applications
Bernardini et al. A clinical decision support system to stratify the temporal risk of diabetic retinopathy
Varghese et al. Machine Learning in the Parkinson’s disease smartwatch (PADS) dataset
WO2023240117A1 (en) Systems and methods for dynamic immunohistochemistry profiling of biological disorders and feature engineering thereof
TW202348982A (zh) 用於生物疾病及疾患之動態拉曼剖析之系統及方法以及其特徵工程方法
JP2016201123A (ja) 動的ネットワークバイオマーカーの検出装置、検出方法及び検出プログラム
Rayan Machine Learning for Smart Health Care
WO2023196463A1 (en) Systems and methods for space health exposomics
Kashyap et al. Revolutionizing healthcare with data science: early disease identification and prediction system
CN116615702A (zh) 用于暴露组学临床应用的系统和方法
Al-Qazzaz et al. Comparison of the Effectiveness of Various Classifiers for Breast Cancer Detection Using Data Mining Methods
Maheshwari et al. Brain Stroke Prediction Using the Artificial Intelligence
Upadhyay et al. Comprehensive Systematic Computation on Alzheimer's Disease Classification
Kanagaraj et al. Optimized supervised learning approach to predict Parkinson’s disease with minimal attributes using PPMI Datasets
Alam Optimizing Healthcare Insights: Unstructured Healthcare Data Analysis with Hybrid Models
Sufriyana et al. Human and machine learning of prognostic prediction for prelabor rupture of membranes and the time of delivery: a nationwide development, validation, and deployment using medical history