JP2022546058A - 振動分光法を使用して検体固定の持続時間および品質を評価するためのシステムおよび方法 - Google Patents

振動分光法を使用して検体固定の持続時間および品質を評価するためのシステムおよび方法 Download PDF

Info

Publication number
JP2022546058A
JP2022546058A JP2022513273A JP2022513273A JP2022546058A JP 2022546058 A JP2022546058 A JP 2022546058A JP 2022513273 A JP2022513273 A JP 2022513273A JP 2022513273 A JP2022513273 A JP 2022513273A JP 2022546058 A JP2022546058 A JP 2022546058A
Authority
JP
Japan
Prior art keywords
fixed
training
spectral data
test
fixation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022513273A
Other languages
English (en)
Inventor
バウアー,ダニエル
チャフィン,デビッド
Original Assignee
ベンタナ メディカル システムズ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ベンタナ メディカル システムズ, インコーポレイテッド filed Critical ベンタナ メディカル システムズ, インコーポレイテッド
Publication of JP2022546058A publication Critical patent/JP2022546058A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/1702Systems in which incident light is modified in accordance with the properties of the material investigated with opto-acoustic detection, e.g. for gases or analysing solids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3563Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/39Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using tunable lasers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/4833Physical analysis of biological material of solid biological material, e.g. tissue samples, cell cultures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • G01N1/30Staining; Impregnating ; Fixation; Dehydration; Multistep processes for preparing samples of tissue, cell or nucleic acid material and the like for analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/39Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using tunable lasers
    • G01N2021/396Type of laser source
    • G01N2021/399Diode laser
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/06Illumination; Optics
    • G01N2201/061Sources
    • G01N2201/06113Coherent sources; lasers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods
    • G01N2201/1293Using chemometrical methods resolving multicomponent spectra
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods
    • G01N2201/1296Using chemometrical methods using neural networks

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Optics & Photonics (AREA)
  • Theoretical Computer Science (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Hematology (AREA)
  • Evolutionary Computation (AREA)
  • Medicinal Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Urology & Nephrology (AREA)
  • Food Science & Technology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本開示は、訓練された固定推定エンジン(210)を使用して生物学的検体の固定持続時間を定量的に判定するための自動化システム(200)および方法に関する。いくつかの実施形態では、訓練された固定推定エンジン(210)は、ニューラルネットワークを含む。いくつかの実施形態では、訓練された固定推定エンジン(210)は、教師あり分類器を含む。【選択図】図3

Description

関連出願の相互参照
本出願は、2019年8月28日に出願された米国特許出願第62/892,678号の出願日の利益を主張し、その開示は、その全体が参照により本明細書に組み込まれる。
免疫組織化学的(IHC)スライド染色は、組織切片の細胞内のタンパク質を特定するために利用可能であるため、生体組織内の癌性細胞や免疫細胞など、異なる種類の細胞の研究に広く使用されている。したがって、IHC染色は、免疫反応研究のために、癌性組織における免疫細胞(T細胞やB細胞など)の別様に発現するバイオマーカーの分布と局在を理解するための研究に使用されることができる。例えば、腫瘍は、免疫細胞の浸潤物を含んでいることが多く、これは、腫瘍の発生を妨げたり、腫瘍の増殖を促進したりする場合がある。
原位置ハイブリッド形成(ISH)が使用されて、顕微鏡で見ると形態学的に悪性であるように見える細胞内に特異的に遺伝子を生じさせる癌の増幅などの遺伝的異常または状態の存在を探すことができる。原位置ハイブリッド形成(ISH)は、標的遺伝子配列または転写物に対してアンチセンスである標識DNAまたはRNAプローブ分子を使用して、細胞または組織試料内の標的核酸標的遺伝子を検出または局在化する。ISHは、スライドガラスに固定化された細胞または組織試料を、細胞または組織試料内の所与の標的遺伝子に特異的にハイブリッド形成することができる標識核酸プローブに曝露することによって実行される。複数の異なる核酸タグによって標識された複数の核酸プローブに細胞または組織試料を曝露することにより、いくつかの標的遺伝子が同時に分析されることができる。異なる発光波長を有する標識を利用することにより、単一の標的細胞または組織試料に対して単一のステップで同時多色分析が実行されることができる。
薄い組織切片は、組織試料に関する代表的な情報を得るために組織学において使用される。薄い切片の品質は、試料の切除が行われた組織領域全体を適切に表すために、いくつかの特徴を満たすべきである。ガイドラインは、組織の種類および使用によって異なることができるが、薄い切片のサイズは、一般に、2μm未満であるべきではない。典型的には、組織切片は、2から5μmの範囲で調製され、適切なさらなる処理を可能にするために、薄い切片の側方範囲にわたって厚さが50%を超えて変化してはならない。組織切片の質に影響を及ぼすさらなる要因は、適切な試料水分および切片化プロセス中に維持される温度を含むことができる。
ホルマリンは、半世紀にわたって組織学分野で使用されてきた。室温で使用される場合、ホルマリンは、組織切片に拡散し、タンパク質および核酸を架橋し、それによって代謝を停止させ、生体分子を保存し、パラフィンワックス浸潤のために組織を準備する。実際には、ホルマリン固定は、主に室温以上で行われる。いくつかのグループは、おそらく架橋速度を増加させるために、僅かに高温で固定を行う。熱が架橋速度を増加させるのと同様に、低温ホルマリンは、架橋速度を著しく低下させる。このため、組織学者は、通常、室温以上で組織固定を行う。いくつかのグループは、低温ホルムアルデヒドを使用しているが、組織を固定するためではなく、特殊な状況でのみ使用している。例えば、グループは、低温ホルマリンを使用して、脂質滴または他の特別な状況を検査する。
ホルマリンに曝露されているかまたは過剰に曝露されている組織では、いくつかの効果が観察される。組織試料を十分に長期間ホルマリンで処理しない場合、組織が標準的な組織処理に供された場合、組織形態は、典型的には非常に不良である。例えば、不適切に固定された組織では、組織が適切な架橋格子を形成する機会がないため、エタノールへのその後の曝露は、細胞構造を収縮させ、核を凝縮させる。ヘマトキシリンおよびエオシン(H&E)などで固定組織が染色されると、細胞と組織構造との間に多くの白い空間が観察され、核が凝縮し、細胞質が失われ、試料はピンク色に見え、ヘマトキシリン染色ではバランスがとれていない。ホルマリンにあまりにも長く曝露された組織は、典型的には、おそらく核酸および/またはタンパク質の変性および分解のために、その後の免疫組織化学プロセスにうまく機能しない。結果として、これらの組織に対する最適な抗原回収条件は適切に機能せず、したがって、組織試料は染色されているように見える。
適切な医学的診断および患者の安全性は、染色前に組織試料を適切に固定することを必要とする。したがって、組織試料の適切な固定のためのガイドラインが腫瘍学者および病理学者によって確立されている。例えば、米国臨床腫瘍学会(ASCO)によれば、HER2免疫組織化学分析のための中性緩衝ホルマリン溶液中での固定持続時間の現在のガイドラインは、少なくとも6時間、好ましくはそれ以上、最大72時間である。有意な分解が起こる前に生物学的分子および組織形態をより良好に保存するため、ならびに可能な限り迅速に医療従事者および患者に正確な試験結果を提供するために、組織試料を迅速に固定するプロセスを開発することが有利であろう。
生物学的検体、例えば組織試料の固定の変化は、下流の標識化および/または染色プロセスに影響を及ぼし、不確定な結果および/または誤診をもたらす可能性がある。有利には、開示されたシステムおよび方法は、組織試料の固定状態の判定を提供し、それによって固定された生物学的検体の質の判定を容易にする。いくつかの実施形態では、予測固定状態は、固定持続時間の定量的判定である。
本出願人らは、驚くべきことに、本開示のシステムおよび方法が、未知の時間量の固定プロセスに供された試験生物学的検体の固定状態の正確な予測を提供することを発見した。本出願人は、さらに、本開示の訓練された固定推定エンジンが、異なる組織タイプまたは固定推定エンジンが以前に訓練されていない組織タイプに適用される場合であっても、訓練された固定推定エンジンが固定状態の推定を高精度に行うことを可能にすることを提出する。さらに、本出願人は、現在開示されているシステムおよび方法が、未知の試験生物学的検体が定性的に「固定」であるか「固定されていない」であるかの推定だけでなく、未知の時間量の1つ以上の固定プロセスに供された試験生物学的検体の固定持続時間の定量的推定を提供することを提出する。これらのおよび他の特徴は、本明細書でさらに説明され、本明細書に添付される例および図に示される。
本開示の第1の態様は、少なくとも部分的に固定された試験生物学的検体の推定固定持続時間を定量的に判定するためのシステムであって、(i)1つ以上のプロセッサと、(ii)1つ以上のプロセッサに結合された1つ以上のメモリであって、1つ以上のメモリが、コンピュータ実行可能命令を記憶し、コンピュータ実行可能命令は、1つ以上のプロセッサによって実行されると、少なくとも部分的に固定された試験生物学的検体から試験スペクトルデータを取得することであって、試験スペクトルデータが、生物学的検体の少なくとも一部から導出される振動スペクトルデータを含む、試験スペクトルデータを取得することと、訓練された固定推定エンジンを使用して、取得された試験スペクトルデータから固定特徴を導出することと、導出された固定特徴に基づいて、少なくとも部分的に固定された生物学的検体の推定固定持続時間を定量的に判定することと、を含む動作をシステムに実行させる、1つ以上のメモリと、を備える、システムである。いくつかの実施形態では、振動スペクトルデータは、中間赤外(中間IR)スペクトルデータを含む。いくつかの実施形態では、振動スペクトルデータは、ラマンスペクトルデータを含む。いくつかの実施形態では、システムは、訓練された固定推定エンジンを使用して固定品質を推定するための動作をさらに含む。
いくつかの実施形態では、固定推定エンジンは、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練される。いくつかの実施形態では、固定推定エンジンは、1つ以上の訓練スペクトルデータセットを使用して訓練され、各訓練スペクトルデータセットは、複数の差動的に固定された訓練組織試料から導出された複数の訓練振動スペクトルを含み、各訓練振動スペクトルは、既知の固定持続時間のクラスラベルを含む。いくつかの実施形態では、既知の固定持続時間のクラスラベルは、機能的IHC試験によって検証される。いくつかの実施形態では、クラスラベルは、固定品質注釈をさらに含む。
いくつかの実施形態では、各訓練スペクトルデータセットは、以下によって導出される:(i)訓練生物学的検体を取得すること、(ii)取得された訓練生物学的検体を複数の訓練組織試料に分割すること、および(iii)複数の訓練組織試料の各訓練組織試料を異なる所定の時間量にわたって固定すること。いくつかの実施形態では、異なる所定の時間量は、約0時間から約24時間の範囲である。いくつかの実施形態では、異なる所定の時間量は、約0時間から約12時間の範囲である。
いくつかの実施形態では、試験スペクトルデータは、複数の正規化および補正された振動スペクトルから導出された平均振動スペクトルを含む。いくつかの実施形態では、複数の正規化および補正された振動スペクトルは、以下によって取得される:(i)試験生物学的検体内の複数の空間領域を識別すること、(ii)複数の識別された領域の各個々の領域から振動スペクトルを取得すること、(iii)各個々の領域からの取得された振動スペクトルを補正し、各個々の領域ごとに補正された振動スペクトルを提供すること、および(iv)各個々の領域からの補正された振動スペクトルを所定の大域最大値に振幅正規化し、各領域の振幅正規化振動スペクトルを提供すること。いくつかの実施形態では、各個々の領域から取得された振動スペクトルは、以下によって補正される:(i)取得された各振動スペクトルを大気効果について補償して、大気補正振動スペクトルを提供すること、および(ii)散乱について大気補正振動スペクトルを補償すること。いくつかの実施形態では、領域はランダムに選択される。
いくつかの実施形態では、訓練された固定状態推定エンジンは、次元縮小に基づく機械学習アルゴリズムを含む。いくつかの実施形態では、次元縮小は、潜在構造回帰モデルへの投影を含む。いくつかの実施形態では、次元縮小は、主成分分析、および任意に判別分析を含む。いくつかの実施形態では、訓練された固定状態推定エンジンは、ニューラルネットワークを含む。
いくつかの実施形態では、システムは、生物学的検体が、1つ以上の特異的結合実体による標識に適した固定状態を含むかどうかを評価するための動作をさらに含む。いくつかの実施形態では、システムは、生物学的検体固定と正に関連付けられた試験データ内の少なくとも1つのスペクトル帯域を識別するための動作をさらに含む。
いくつかの実施形態では、取得された試験スペクトルデータは、約3200から約3400cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約2800から約2900cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約1020から約1100cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約1520から約1580cm-1の範囲の波長の振動スペクトル情報を含む。
本開示の第2の態様は、少なくとも部分的に固定された試験生物学的検体の推定固定持続時間を判定するための命令を記憶する非一時的コンピュータ可読媒体であって、推定固定持続時間を判定することが、試験生物学的検体から試験スペクトルデータを取得することであって、取得された試験スペクトルデータが、生物学的検体の少なくとも一部から導出される振動スペクトルデータを含む、試験スペクトルデータを取得することと、訓練された固定推定エンジンを使用して取得された試験スペクトルデータから固定特徴を導出することであって、固定推定エンジンが、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練され、訓練スペクトルデータセットが、少なくとも既知の固定持続時間のクラスラベルを含む、、固定特徴を導出することと、導出された固定特徴に基づいて、少なくとも部分的に固定された生物学的検体の推定固定持続時間を定量的に判定することと、を含む、非一時的コンピュータ可読媒体である。いくつかの実施形態では、固定推定エンジンの訓練中に使用される既知の固定持続時間のクラスラベルは、機能的IHC試験によって検証される。いくつかの実施形態では、試験生物学的検体は染色されていない。いくつかの実施形態では、試験生物学的検体は、1つ以上のバイオマーカーの存在について染色される。
いくつかの実施形態では、各訓練スペクトルデータセットは、以下によって導出される:(i)訓練生物学的検体を取得すること、(ii)取得された訓練生物学的検体を複数の訓練組織試料に分割すること、および(iii)複数の訓練組織試料の各訓練組織試料を異なる所定の時間量にわたって固定すること。いくつかの実施形態では、訓練生物学的検体は、試験生物学的検体と同じ組織タイプを含む。いくつかの実施形態では、訓練生物学的検体は、試験生物学的検体とは異なる組織タイプを含む。いくつかの実施形態では、訓練された固定状態推定エンジンは、次元縮小に基づく機械学習アルゴリズムを含む。いくつかの実施形態では、次元縮小は、潜在構造回帰モデルへの投影を含む。いくつかの実施形態では、次元縮小は、主成分分析を含む。いくつかの実施形態では、訓練された固定状態推定エンジンは、ニューラルネットワークを含む。
いくつかの実施形態では、取得された試験スペクトルデータは、約3200から約3400cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約2800から約2900cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約1020から約1100cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約1520から約1580cm-1の範囲の波長の振動スペクトル情報を含む。
本開示の第3の態様は、少なくとも部分的に固定された試験生物学的検体の固定状態を予測するための方法であって、少なくとも部分的に固定された試験生物学的検体から試験スペクトルデータを取得することであって、試験スペクトルデータが、生物学的検体の少なくとも一部から導出される振動スペクトルデータを含む、試験スペクトルデータを取得することと、訓練された固定推定エンジンを使用して、取得された試験スペクトルデータから1つ以上の固定特徴を導出することと、導出された1つ以上の固定特徴に基づいて、少なくとも部分的に固定された生物学的検体の推定固定状態を判定することと、を含む、方法である。いくつかの実施形態では、判定された推定固定状態は、固定持続時間の定量的予測である。いくつかの実施形態では、判定された推定固定状態は、固定品質の定性的予測である。いくつかの実施形態では、方法は、生物学的検体が、1つ以上の特異的結合実体による標識に適した固定状態を含むかどうかを評価することをさらに含む。いくつかの実施形態では、方法は、生物学的検体固定と正に関連付けられた試験データ内の少なくとも1つのスペクトル帯域を識別することをさらに含む。
いくつかの実施形態では、固定推定エンジンは、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練される。いくつかの実施形態では、訓練スペクトルデータセットは、機能的IHC試験によって判定された既知の固定持続時間などの既知の固定持続時間のクラスラベルを含む。いくつかの実施形態では、訓練スペクトルデータセットは、固定品質のクラスラベルをさらに含む。
いくつかの実施形態では、少なくとも2つの訓練振動スペクトルは、複数の訓練生物学的検体の各個々の訓練生物学的検体から取得され、少なくとも2つの試料振動スペクトルは、個々の訓練生物学的検体の異なる部分から取得される。いくつかの実施形態では、個々の訓練生物学的検体の少なくとも2つの異なる部分は、それぞれ異なる所定の時間量にわたって1つ以上の固定剤で処理される。いくつかの実施形態では、異なる所定の時間量は、約0時間から約24時間の範囲である。いくつかの実施形態では、異なる所定の時間量は、約0時間から約12時間の範囲である。いくつかの実施形態では、少なくとも2つの訓練振動スペクトルは、それぞれ、複数の正規化および補正された訓練振動スペクトルから導出された平均振動スペクトルである。
いくつかの実施形態では、取得された試験スペクトルデータは、少なくともアミドIバンドの中間IRスペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約3200から約3400cm-1、約2800から約2900cm-1、約1020から約1100cm-1、および/または約1520から約1580cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、試験生物学的検体は染色されていない。いくつかの実施形態では、試験生物学的検体は、1つ以上のバイオマーカーの存在について染色される。
いくつかの実施形態では、訓練された固定状態推定エンジンは、次元縮小に基づく機械学習アルゴリズムを含む。いくつかの実施形態では、次元縮小は、潜在構造回帰モデルへの投影を含む。いくつかの実施形態では、次元縮小は、主成分分析を含む。いくつかの実施形態では、訓練された固定状態推定エンジンは、ニューラルネットワークを含む。
本開示の特徴の一般的な理解のために、図面を参照する。図面では、同一の要素を特定するために、全体を通して同様の参照符号が使用されている。
本開示の一実施形態にかかる、画像取得装置およびコンピュータシステムを含む代表的なデジタル病理システムを示している。 本開示の一実施形態にかかる、試験組織試料の固定持続時間を推定するためにシステムまたはデジタル病理ワークフロー内で利用されることができる様々なモジュールを示している。 本開示の一実施形態にかかる、訓練された固定推定エンジンを使用して試験生物学的検体の固定持続時間を推定する様々なステップを示すフローチャートを記載している。 本開示の一実施形態にかかる訓練生物学的検体の振動スペクトルを取得する様々なステップを示すフローチャートを記載している。 本開示の一実施形態にかかる訓練生物学的検体の振動スペクトルを取得する様々なステップを示すフローチャートを記載している。 本開示の一実施形態にかかる訓練生物学的検体の振動スペクトルを取得する様々なステップを示すフローチャートを記載している。 本開示の一実施形態にかかる、試験生物学的検体の平均振動スペクトルを取得する様々なステップを示すフローチャートを記載している。 本開示の一実施形態にかかる、試験生物学的検体および訓練生物学的検体を含む、生物学的検体から導出される取得されたスペクトルを補正、正規化、および平均化する様々なステップを示すフローチャートを記載している。 コラーゲンの典型的なFR-IRおよびラマンスペクトルを示している。 組織試料の赤外線およびラマン特性周波数を示す表を提供している。 組織試料の赤外線およびラマン特性周波数を示す表を提供している。 105個の個々の扁桃組織片が中性緩衝ホルマリン中で0時間(例えば、未固定/エタノール固定)から24時間(完全固定)の間の様々な時間量にわたって室温ホルマリン中で別様に固定された実験計画のグラフィカル図を提供している。試料は、エタノールおよびキシレンで同等に処理され、パラフィンに包埋された。各組織ブロックからの1つのスライドは、BCL2、ki-67およびFOXP3について染色され、各ブロックからの2つの切片は、中間IR顕微鏡を用いて分光学的にイメージングされた。 バイオマーカー定量化のための明視野IHCイメージングおよび画像処理の概要を提供している。図9Aは、全スライドスキャンにおけるイメージングおよび画像分割アルゴリズムを示している。最上行:3つの抗原のそれぞれに対するスライドスキャン全体の元の明視野レンディション。中央行:画像セグメンテーションアルゴリズムの結果、暗灰色領域は、デジタル分析(間質、結合組織など)から除外され、薄灰色領域は、分析に含められた。最下行:バイオマーカー発現レベルのホットスポットレンダリング。暗灰色=高発現密度、非常に暗い灰色=低発現密度、黒色=陰性/組織なし。 バイオマーカー定量化のための明視野IHCイメージングおよび画像処理の概要を提供している。図9Bは、元の画像(左列)およびセグメント化された画像(右列)を含む20Xにおける3つ全ての抗原に対する染色の例を提供している。 中間IR収集の概要を提供している。図10Aは、Bruker Hyperion 3000中間IR顕微鏡で取得された組織試料の明視野画像を提供している。 中間IR収集の概要を提供している。図10Bは、色付き円によって示された分光撮像された試料の領域を示している。 中間IR収集の概要を提供している。図10Cは、色付き円によって示された分光撮像された試料の領域を示している。 中間IR収集の概要を提供している。図10Dは、組織内で撮像された全ての点の元の中間IRスペクトルを提供している。各線は、図10Bおよび図10Cにおける1つの円のスペクトルを表している。 中間IR収集の概要を提供している。図10Eは、大気補正後の中間IRスペクトルを提供している。 中間IR収集の概要を提供している。図10Fは、散乱の影響を緩和するためのベースライン補正後の中間IRスペクトルを提供している。 中間IR収集の概要を提供している。図10Gは、振幅正規化後の中間IRスペクトルを提供している。 中間IR収集の概要を提供している。図10Hは、組織試料全体の平均中間IRスペクトルを表す、空間的に平均化された中間IRスペクトルを提供している。 BCL2(図11A)、ki-67(図11B)およびFOXP3(図11C)のIHC発現の定量的分析を記載している。 BCL2(図11A)、ki-67(図11B)およびFOXP3(図11C)のIHC発現の定量的分析を記載している。 BCL2(図11A)、ki-67(図11B)およびFOXP3(図11C)のIHC発現の定量的分析を記載している。 3つ全てのバイオマーカーに対するIHC発現対固定時間のプロットを示しており、ここで、平均発現は、正規化されたスケールでプロットされ、そのため、各バイオマーカー対固定時間の相対的変化が観察されることができる。バーは、両側順位和検定によって判定されるように、p<0.05の有意なレベルを表している。 全ての固定時間に対する平均中間IR吸収を提供しており、アミドIバンドのおおよその位置が示されている。 アミドIバンドの中間IR吸収を提供している。実線は、平均吸収を表し、エラーバーは、全ての組織のプラス/マイナス標準偏差を表している。 アミドIバンドの変形の定量的図を提供しており、バンドのピーク位置は、半値全幅(「FWHM」)に対してプロットされている。 ピーク位置に対するアミド1バンドの平均シフトおよび固定時間=0のFWHMを提供している。 BCL2(図13A)、ki-67(図13B)、およびFOXP3(図13C)の絶対アミドIシフト対IHC発現のプロットを示している。 BCL2(図13A)、ki-67(図13B)、およびFOXP3(図13C)の絶対アミドIシフト対IHC発現のプロットを示している。 BCL2(図13A)、ki-67(図13B)、およびFOXP3(図13C)の絶対アミドIシフト対IHC発現のプロットを示している。 K倍交差検証を示している。 潜在構造回帰アルゴリズムへの投影の訓練および検証のフローチャートを記載している。 訓練データ(左)および保持盲検組織試料(右)に対する固定予測モデルの結果を提供している。 訓練セットおよび盲検スペクトルからのスペクトルの累積分布関数(CDF)を提供している。開発されたモデルは、未知試料の固定時間を平均1.4時間まで予測することができた。 固定時間の正の予測子を表す正の係数および固定時間の負の予測子を表す負の係数を有する開発されたPLSRモデルからの重みを記載している。 試料がホルマリンで固定されている時間に基づいて差を示した4つのバンドの中間IRスペクトルを記載している。 予測モデル内の成分の数を増やすことによって説明されるXおよびY変数の分散パーセントのグラフを提供している。 成分数が増加する交差検証ホールドアウトデータセットからのモデルの平均二乗予測誤差(MSPE)のグラフを提供している。最初の約20個の成分は、モデルの予測精度を大幅に向上させ、20個を超える成分を追加すると、改善予測力はほとんどない。 訓練セットおよびホールドアウト検証データに対するモデルの性能を示すグラフを提供している。予測誤差は、中間IRスペクトルにおける回収の真のシグネチャを識別した十分に訓練されたモデルを示す双方のタイプのデータについて同一である。 訓練組織(左ボックス)および検証組織(右ボックス)の双方について実験的固定時間対モデル予測時間を表示することによって、モデルの性能のボックスおよびウィスカのグラフを提供している。
反対に明確に示されない限り、複数のステップまたは行為を含む本明細書において特許請求の範囲に記載される任意の方法において、方法のステップまたは行為の順序は、必ずしも方法のステップまたは行為が記載される順序に限定されないことも理解されたい。
本明細書における「一実施形態、」、「実施形態、」、「例示的な実施形態」などへの言及は、記載された実施形態が特定の特徴、構造、または特性を含むことができることを示すが、全ての実施形態は、その特定の特徴、構造、または特性を必ずしも含んでも含まなくてもよい。さらに、そのような句は、必ずしも同じ実施形態を指すとは限らない。さらに、特定の特徴、構造、または特性が実施形態に関連して記載されている場合、明示的に記載されているか否かにかかわらず、他の実施形態に関連してそのような特徴、構造、または特性に影響を及ぼすことは、当業者の知識の範囲内であると考えられる。
本明細書で使用される場合、単数形「a」、「an」、および「the」は、文脈が別途明確に指示しない限り、複数の指示対象を含む。同様に、「または」という単語は、文脈が別途明確に指示しない限り、「および」を含むことを意図している。「含む」という用語は、「AまたはBを含む」がA、B、またはAおよびBを含むことを意味するように、包括的に定義される。
本明細書および特許請求の範囲で使用される場合、「または」は、上記で定義された「および/または」と同じ意味を有することを理解されたい。例えば、リスト内の項目を区切る場合、「または」または「および/または」は、包括的であると解釈されるものとする。例えば、要素の数またはリストの少なくとも1つを含むが、複数、および必要に応じて追加のリストに記載されていない項目を含むと解釈される。「のうちの1つのみ」または「のうちの正確に1つ」、または特許請求の範囲で使用される場合、「からなる」など、反対に明確に示される用語のみは、数または要素のリストのうちの正確に1つの要素を含むことを指す。一般に、本明細書で使用される「または」という用語は、「いずれか」、「のうちの1つ」、「のうちの1つのみ」または「のうちの正確に1つ」など、排他権の用語が先行する場合にのみ、排他的な代替案(例えば、「一方または他方であるが双方ではない」)を示すものとしてのみ解釈されるものとする。「から本質的に構成される」は、特許請求の範囲で使用される場合、特許法の分野で使用される通常の意味を有するものとする。
「備える(comprising)」、「含む(including)」、「有する(having)」などの用語は、交換可能に使用され、同じ意味を有する。同様に、「備える(comprises)」、「含む(includes)」、「有する(has)」などは、交換可能に使用され、同じ意味を有する。具体的には、各用語は、「備える」という一般的な米国特許法の定義と一致して定義されているため、「少なくとも以下」を意味するオープンな用語として解釈され、また、追加の特徴、限定事項、態様などを除外しないように解釈される。したがって、例えば、「構成要素a、b、およびcを有する装置」は、装置が少なくとも構成要素a、b、およびcを含むことを意味する。同様に、句:「ステップa、b、およびcを含む方法」は、その方法が少なくともステップa、b、およびcを含むことを意味する。さらに、ステップおよびプロセスは、ここにおいて特定の順序で概説されることができるが、当業者は、順序付けのステップおよびプロセスが変化し得ることを認識するであろう。
本明細書の明細書および特許請求の範囲で使用される場合、1つ以上の要素のリストに関連する「少なくとも1つ」という句は、要素のリストの任意の1つ以上の要素から選択される少なくとも1つの要素を意味すると理解されるべきであるが、必ずしも要素のリスト内に具体的にリスト化されているありとあらゆる要素の少なくとも1つを含まなくてもなく、要素のリスト内の要素の任意の組み合わせを除外するものではない。この定義はまた、「少なくとも1つ」という句が参照する要素のリスト内で具体的に特定される要素以外の要素が、具体的に特定されるそれらの要素に関連するかどうかにかかわらず、必要に応じて存在することができることを可能にする。したがって、非限定的な例として、「AおよびBの少なくとも1つ」(または、同等に、「AまたはBの少なくとも1つ」、または同等に「Aおよび/またはBの少なくとも1つ」)は、一実施形態では、少なくとも1つ、必要に応じて2つ以上のAを含み、Bが存在しない(および必要に応じて、B以外の要素を含む)を指すことができ、別の実施形態では、少なくとも1つ、必要に応じて2つ以上のBを含み、Aが存在しない(および必要に応じて、A以外の要素を含む)を指すことができ、さらに別の実施形態では、少なくとも1つ、必要に応じて2つ以上のAを含み、少なくとも1つ、必要に応じて2つ以上のBを含む(および必要に応じて、他の要素を含む)を指すことができるなどである。
本明細書で使用される場合、「生物学的検体」、「試料」、または「組織試料」などの用語は、ウイルスを含む任意の生物から得られる生体分子(タンパク質、ペプチド、核酸、脂質、炭水化物、またはそれらの組み合わせなど)を含む任意の試料を指す。生物の他の例は、哺乳類(人間、猫、犬、馬、牛、および豚などの獣医動物、ならびにマウス、ラット、霊長類などの実験動物など)、昆虫、環形動物、クモ形類動物、有袋類、爬虫類、両生類、細菌、および菌類などを含む。生物学的検体は、組織試料(組織切片や組織の針生検など)、細胞試料(Pap塗抹検体もしくは血液塗抹検体などの細胞学的塗抹検体、またはマイクロダイセクションによって得られた細胞の試料など)、または細胞分画、断片または細胞小器官(細胞を溶解し、遠心分離などによってそれらの成分を分離することによって得られる)を含む。生物学的検体の他の例は、血液、血清、尿、精液、糞便、脳脊髄液、間質液、粘膜、涙、汗、膿、生検組織(例えば、外科的生検または針生検によって得られる)、乳頭吸引物、耳垢、乳、膣液、唾液、ぬぐい液(頬スワブなど)、または最初の生物学的検体に由来する生体分子を含む任意の材料を含む。特定の実施形態では、本明細書で使用される「生物学的検体」という用語は、被験者から得られた腫瘍またはその一部から調製された試料(均質化または液化された試料など)を指す。
本明細書で使用される場合、「バイオマーカー」または「マーカー」という用語は、何らかの生物学的状態または症状の測定可能な指標を指す。特に、バイオマーカーは、特異的に染色することができ、細胞の生物学的特徴、例えば細胞の細胞タイプまたは生理学的状態を示すタンパク質またはペプチド、例えば表面タンパク質とすることができる。免疫細胞マーカーは、哺乳動物の免疫応答に関する特徴を選択的に示すバイオマーカーである。バイオマーカーを使用して、身体が疾患または症状の処置にどれだけ良好に応答するか、または被験者が疾患または症状にかかりやすいかを判定することができる。癌の文脈において、バイオマーカーは、体内の癌の存在を示す生体物質を指す。バイオマーカーは、腫瘍によって分泌される分子、または癌の存在に対する身体の特異的応答とすることができる。遺伝子バイオマーカー、エピジェネティックバイオマーカー、プロテオミクスバイオマーカー、グリコームバイオマーカーおよびイメージングバイオマーカーは、癌の診断、予後診断および疫学のために使用されることができる。そのようなバイオマーカーは、血液または血清などの非侵襲的に収集された生体流体でアッセイされることができる。AFP(肝臓癌)、BCR-ABL(慢性骨髄性白血病)、BRCA1/BRCA2(乳癌/卵巣癌)、BRAF V600E(黒色腫/結腸直腸癌)、CA-125(卵巣癌)、CA19.9(膵臓癌)、CEA(結腸直腸癌)、EGFR(非小細胞肺癌)、HER-2(乳癌)、KIT(消化管間質腫瘍)、PSA(前立腺特異的抗原)、S100(黒色腫)などを含むがこれらに限定されないいくつかの遺伝子およびタンパク質ベースのバイオマーカーが既に患者ケアに使用されている。バイオマーカーは、診断薬(初期癌を同定するため)および/または予後診断薬(癌がどの程度侵攻性であるかを予測するため、および/または被験者が特定の処置にどのように応答するかおよび/または癌がどの程度再発する可能性があるかを予測するため)として有用とすることができる。
本明細書で使用される場合、「細胞」という用語は、原核細胞または真核細胞を指す。細胞は、接着性または非接着性細胞、例えば接着性原核細胞、接着性真核細胞、非接着性原核細胞または非接着性真核細胞とすることができる。細胞は、酵母細胞、細菌細胞、藻類細胞、真菌細胞、またはそれらの任意の組み合わせとすることができる。細胞は、哺乳動物細胞とすることができる。細胞は、被験者から取得された初代細胞とすることができる。細胞は、細胞株または不死化細胞とすることができる。細胞は、ヒトまたはげっ歯類などの哺乳動物から取得されることができる。細胞は、癌または腫瘍細胞とすることができる。細胞は、上皮細胞とすることができる。細胞は、赤血球または白血球とすることができる。細胞は、T細胞、B細胞、ナチュラルキラー(NK)細胞、マクロファージ、樹状細胞などの免疫細胞とすることができる。細胞は、ニューロン細胞、グリア細胞、アストロサイト、ニューロン支持細胞、シュワン細胞などとすることができる。細胞は、内皮細胞とすることができる。細胞は、線維芽細胞またはケラチノサイトとすることができる。細胞は、周皮細胞、肝細胞、幹細胞、前駆細胞などとすることができる。細胞は、循環癌または腫瘍細胞または転移性細胞とすることができる。細胞は、CD8+T細胞またはCD4+T細胞などのマーカー特異的細胞とすることができる。細胞は、ニューロンとすることができる。ニューロンは、中枢ニューロン、末梢ニューロン、感覚ニューロン、介在ニューロン、ニューロン内ニューロン、運動ニューロン、多極ニューロン、双極ニューロン、または擬似単極ニューロンとすることができる。細胞は、シュワン細胞などのニューロン支持細胞とすることができる。細胞は、血液脳関門系の細胞のうちの1つとすることができる。細胞は、神経細胞株などの細胞株とすることができる。細胞は、被験者の脳から得られた細胞などの初代細胞とすることができる。細胞は、組織生検、細胞診検体、血液試料、細針吸引物(FNA)試料、またはそれらの任意の組み合わせなど、被験者から単離されることができる細胞の集団とすることができる。細胞は、尿、乳、汗、リンパ液、血液、痰、羊水、房水、硝子体液、胆汁、脳脊髄液、乳び、糜粥、滲出液、内リンパ、外リンパ、胃酸、粘液、心膜液、腹水、胸水、膿、粘液、唾液、皮脂、漿液、粘液、痰、涙、嘔吐物、または他の体液などの体液から取得されることができる。細胞は、癌性細胞、非癌性細胞、腫瘍細胞、非腫瘍細胞、健康な細胞、またはそれらの任意の組み合わせを含むことができる。
本明細書で使用される場合、「細胞学的試料」という用語は、試料の細胞が部分的または完全に脱凝集している細胞試料を指し、その結果、試料は、細胞試料が取得された被験者に存在したときの細胞の空間的関係をもはや反映しない。細胞学的試料の例は、組織擦過物(子宮頸部擦過物など)、細針吸引物、被験者の洗浄によって取得された試料などを含む。
本明細書で使用される場合、「固定」という用語は、細胞試料の分子的および/または形態学的詳細が保存されるプロセスを指す。一般に、以下の3種類の固定プロセスがある:(1)熱固定、(2)灌流、および(3)浸漬。熱固定では、試料は、十分な時間熱源に曝露されて加熱死滅し、試料をスライドに接着させる。灌流は、化学固定剤を器官全体または生物全体に分配するための血管系の使用を含む。浸漬は、ある体積の化学固定剤に試料を浸漬し、固定剤を試料全体に拡散させることを可能にすることを含む。化学的固定は、細胞試料全体にわたる化学物質の拡散または灌流を含み、固定試薬は、構造(化学的および構造的の双方)を生細胞試料の構造に可能な限り近く保存する反応を引き起こす。化学固定剤は、動作モードに基づいて以下の2つの広いクラスに分類されることができる:架橋固定剤および非架橋固定剤。架橋固定剤、典型的にはアルデヒドは、組織試料中に存在するタンパク質および核酸などの内因性生体分子間に共有化学結合を形成する。ホルムアルデヒドは、組織学において最も一般に使用される架橋固定剤である。ホルムアルデヒドは、固定のために様々な濃度で使用されることができるが、主に10%中性緩衝ホルマリン(NBF)として使用され、これは、リン酸緩衝生理食塩水水溶液中の約3.7%ホルムアルデヒドである。パラホルムアルデヒドは、加熱されると解重合してホルマリンを提供するホルムアルデヒドの重合形態である。グルタルアルデヒドは、ホルムアルデヒドと同様に作用するが、膜を横切る拡散速度がより遅いより大きな分子である。グルタルアルデヒド固定は、より堅固または強固に連結された固定生成物を提供し、迅速且つ不可逆的な変化を引き起こし、4℃で迅速且つ良好に固定し、良好な全体的な細胞質および核の詳細を提供するが、免疫組織化学染色には理想的ではない。いくつかの固定プロトコルは、ホルムアルデヒドおよびグルタルアルデヒドの組み合わせを使用する。グリオキサールおよびアクロレインは、あまり一般に使用されていないアルデヒドである。変性固定剤(典型的にはアルコールまたはアセトン)は、細胞試料中の水を置換することによって作用し、タンパク質内の疎水性および水素結合を不安定化する。これは、そうでなければ水溶性タンパク質を水不溶性にして沈殿させ、これはほとんど不可逆的である。
本明細書で使用される場合、「免疫組織化学」という用語は、抗原と抗体などの特異的結合剤との相互作用を検出することによって、試料中の抗原の存在または分布を判定する方法を指す。試料は、抗体-抗原結合を可能にする条件下で抗体と接触される。抗体-抗原結合は、抗体にコンジュゲートされた検出可能な標識(直接検出)によって、または一次抗体に特異的に結合する二次抗体にコンジュゲートされた検出可能な標識(間接検出)によって検出されることができる。いくつかの例では、間接的な検出は、抗原の検出可能性をさらに高めるのに役立つ三次以上の抗体を含むことができる。検出可能な標識の例は、酵素、フルオロフォアおよびハプテンを含み、これらは、酵素の場合、発色性または蛍光発生性基質とともに使用されることができる。
本明細書で使用される場合、「マルチチャネル画像」または「マルチプレックス画像」という用語は、核、細胞、および組織構造などの異なる生物学的構造が、それぞれが異なるスペクトルバンドで蛍光を発するか、さもなければ検出可能であり、したがってマルチチャネル画像のチャネルの1つを構成する特定の蛍光色素、量子ドット、色原体などによって同時に染色される生体組織試料から得られるデジタル画像を包含する。
本明細書で使用される場合、「スライド」という用語は、生体試料が分析のために配置される任意の適切な寸法の任意の基材(例えば、全体的または部分的に、ガラス、石英、プラスチック、シリコンなどから作製された基材)、より具体的には、標準の3インチ×1インチの顕微鏡スライドまたは標準の75mm×25mmの顕微鏡スライドなどの「顕微鏡スライド」を指す。スライド上に配置されることができる生体試料の例は、限定されるものではないが、細胞学的塗抹試料、薄い組織切片(生検からのものなど)、および生体試料の配列、例えば、組織配列、細胞配列、DNA配列、RNA配列、タンパク質配列、またはそれらの任意の組み合わせを含む。したがって、一実施形態では、組織切片、DNA試料、RNA試料、および/またはタンパク質は、スライド上の特定の位置に配置される。いくつかの実施形態では、スライドという用語は、SELDIおよびMALDIチップ、ならびにシリコンウェーハを指すことができる。
本明細書で使用される場合、「特異的結合実体」という用語は、特異的結合対のメンバーを指す。特異的結合対は、他の分子への結合を実質的に排除して互いに結合することを特徴とする分子の対である(例えば、特異的結合対は、組織試料中の他の分子との結合対の2つのメンバーのいずれかの結合定数よりも少なくとも10-1大きい、10-1大きいまたは10-1大きい結合定数を有することができる)。特異的結合部分の特定の例は、特異的結合タンパク質(例えば、抗体、レクチン、ストレプトアビジンなどのアビジン、およびプロテインA)を含む。特異的結合部分はまた、そのような特異的結合タンパク質によって特異的に結合される分子(またはその部分)を含むことができる。
本明細書で使用される場合、「スペクトルデータ」という用語は、分光計などを用いて、生物学的検体またはその任意の部分から取得された生の画像スペクトルデータを包含する。
本明細書で使用される場合、「スペクトル」という用語は、電磁放射の特定の波長または波数範囲「において」または内で取得された情報(吸収、透過、反射)を指す。波数範囲は、4000cm-1ほど大きくてもよく、0.01cm-1ほど狭くてもよい。いわゆる「単一レーザ波長」での測定は、典型的には、小さなスペクトル範囲(例えば、レーザ線幅)をカバーし、したがって、用語「スペクトル」が本原稿を通して使用されるときはいつでも含まれることに留意されたい。例えば、量子カスケードレーザの固定波長設定での透過測定は、本明細書では、本出願全体を通してスペクトルという用語に含まれるものとする。
本明細書で使用される場合、「実質的に」という用語は、関心対象の特徴または特性の全体的またはほぼ全体的な程度または度合いを呈する定性的な条件を意味する。いくつかの実施形態では、「実質的に」は、約5%以内を意味する。いくつかの実施形態では、「実質的に」は、約10%以内を意味する。いくつかの実施形態では、「実質的に」は、約15%以内を意味する。いくつかの実施形態では、「実質的に」は、約20%以内を意味する。
本明細書中で使用される場合、用語「組織試料」または「組織検体」(本明細書中では交換可能に使用される)とは、試料が取得された被験者内に存在したときの細胞間の断面空間的関係を保存する細胞試料のことを指すものとする。「組織試料」は、初代組織試料(例えば、被験者によって産生された細胞および組織)および異種移植片(例えば、被験者に移植された外来細胞試料)の双方を包含するものとする。
概要
固定品質、したがって固定持続時間は、下流の分析方法に影響を及ぼすことができると考えられる。例えば、現在の臨床診療では、組織形態の保存と抗原性の喪失との間の妥協点を達成するために、組織固定持続時間を制御することが重要である。実際に、固定持続時間が短すぎるか長すぎると、下流の試料処理に悪影響を及ぼすことがある。したがって、下流処理の前に、例えば試料を1つ以上のマスキング解除剤と接触させる前に、または1つ以上の特異的結合実体と接触させる前に、試料の固定持続時間の正確な予測が依然として必要とされている。
本開示は、1つ以上の固定剤によって処理された組織試料の固定持続時間を定量的に推定するためのシステムおよび方法を記載する。例えば、本開示は、生物学的検体が固定プロセスに供された時間、例えば約0時間、約1時間、約2時間、約4時間、約12時間、約16時間、約24時間、約48時間などを予測するためのシステムおよび方法を提供する。本開示はまた、グラウンドトゥルースデータに基づいて固定持続時間の定量的判定を可能にするために固定推定エンジンを訓練するためのシステムおよび方法を記載する。いくつかの実施形態では、本開示はまた、生物学的検体の固定品質の定性的推定値を提供するためのシステムおよび方法を提供する。
本開示の少なくともいくつかの実施形態は、既知の期間、推定された期間、または未知の期間のいずれかの固定プロセスに少なくとも供された生物学的検体から取得されたスペクトルデータを分析するためのコンピュータシステムおよび方法に関する。例えば、固定推定エンジンを訓練するために取得されたスペクトルデータの場合、訓練された生物学的検体の固定持続時間は既知とすることができる(および/または本明細書に記載の機能的IHC試験によって検証されることができる)。別の例として、また、被験者の生物学的検体(例えば、試験生物学的検体)から導出される試験スペクトルの場合、固定持続時間は、未知であるか、またはおおよそ推定されることができる。本開示によれば、訓練された固定推定エンジンが使用されて、固定持続時間が未知であるか、またはおおよそ推定されただけである試験生物学的検体の固定持続時間の定量的推定値を提供することができる。さらに、訓練された固定推定エンジンが使用されて、未知の時間量の1つ以上の固定プロセスに供された試験生物学的検体の固定持続時間を検証することができる。例えば、受け取った試験生物学的検体が、検体が10時間固定されたという表記を含む場合、本開示のシステムおよび方法が使用されて、記載された固定持続時間を検証することができる。このようにして、試料の評価は、試料が下流処理および/または分析の準備ができているかどうか、例えば、試験生物学的検体が特定の特異的結合実体による標識に適した固定状態にあるかどうかを判定するために行われることができる。
振動スペクトルデータ、例えば中間赤外(中間IR)スペクトルデータまたはラマンスペクトルデータを取得し、生物学的検体(試験生物学的検体および訓練生物学的検体を含む)を分析するためのシステム200が図1および図2に示されている。システムは、生物学的検体(またはその任意の部分)の振動スペクトルを取得するように構成されたものなどのスペクトル取得装置12と、コンピュータ14とを含むことができ、それによってスペクトル取得装置12とコンピュータとは、ともに通信可能に結合されることができる(例えば、直接的に、またはネットワーク20を介して間接的に)。コンピュータシステム14は、デスクトップコンピュータ、ラップトップコンピュータ、タブレットなど、デジタル電子回路、ファームウェア、ハードウェア、メモリ201、コンピュータ記憶媒体(240)、コンピュータプログラムまたは命令セット(例えば、プログラムがメモリまたは記憶媒体内に記憶されている場合)、1つ以上のプロセッサ(209)(プログラムされたプロセッサを含む)、および任意の他のハードウェア、ソフトウェア、またはファームウェアモジュールまたはそれらの組み合わせ(本明細書でさらに説明されるような)を含むことができる。例えば、図1に示すシステム14は、表示装置16およびエンクロージャ18を有するコンピュータを含むことができる。コンピュータシステムは、取得されたスペクトルデータを、メモリ、サーバ、または別のネットワーク接続されたデバイスなどにローカルに記憶することができる。
振動分光法は、電磁放射線の吸収または放射による遷移に関係する。これらの遷移は、102から104cm-1の範囲に現れ、任意の所与の試料中の分子を構成する核の振動に由来すると考えられる。分子内の化学結合は、多くの方法で振動することができると考えられており、それぞれの振動は、振動モードと呼ばれる。分子振動には、伸縮および屈曲の2種類がある。伸縮振動は、原子間距離の増加または減少に伴う結合軸に沿った移動を特徴とするが、屈曲振動は、分子の残りの部分に対する結合角の変化からなる。振動エネルギーに基づく2つの広く使用されている分光技術は、ラマン分光法および赤外分光法である。双方の方法は、相補的な情報を与え、任意の分子内で原子がその分子のいくつかの明確な明確に定義された周波数特性で振動するという事実に基づいている。試料は、入射放射線のビームが照射されると、分子内に存在する化学結合の振動の周波数に特徴的な周波数でエネルギーを吸収する。化学結合の振動によるエネルギーのこの吸収は、赤外線スペクトルをもたらす。
IRおよびラマン分光法は、分子の振動エネルギーを測定するが、双方の方法は、異なる選択ルール、例えば吸収プロセスおよび散乱効果に依存する。それらのコントラスト機構は異なり、各方法論は、それぞれの長所と短所を有するが、各モダリティから得られたスペクトルは、相関があることが多い(例えば、図7Aおよび図7Bを参照)。
IR分光法は、電磁放射の吸収に基づくのに対して、ラマン分光法は、電磁放射の非弾性散乱に依存する。赤外分光法は、吸収技術から反射技術および分散技術まで、広範囲の波数に拡張され、試料分子中に存在する異なる結合が定性的および定量的目的の双方に使用するのに適した多数の一般的且つ特徴的なバンドを提供する近赤外領域、中間赤外領域および遠赤外領域を含む多数の分析ツールを提供する。試料にはIR分光法におけるIR光が照射され、電気双極子モーメントによって誘起される振動を検出する。
ラマン分光法は、散乱現象であり、入射放射周波数と散乱放射周波数との間の差に起因して生じる。これは、散乱光を利用して分子振動に関する知識を獲得し、分子の構造、対称性、電子環境、および結合に関する情報を提供することができる。ラマン分光法では、試料は、レーザ源からの単色の可視光または近IR光によって照射され、電気分極率変化中のその振動が判定される。
本開示のシステムでは、任意のスペクトル取得装置が利用されることができる。中間赤外スペクトルを取得するのに使用するのに適したスペクトル取得装置またはそのような装置の構成要素の例は、米国特許出願公開第2018/0109078a号明細書および米国特許出願公開第2016/0091704号明細書、ならびに米国特許第10,041,832号明細書、米国特許第8,036,252号明細書、米国特許第9,046,650号明細書、米国特許第6,972,409号明細書、および米国特許第7,280,576号に記載されており、これらの特許の開示は、その全体が参照により本明細書に組み込まれる。
試料の代表的な中間IRスペクトルを生成するのに適した任意の方法が使用されることができる。フーリエ変換赤外分光法およびその生物医学的用途は、例えば、P.Lasch,J.Kneipp(Eds.)Biomedical Vibrational Spectroscopy’’ 2008(John Wiley&Sons)に記載されている。しかしながら、より最近では、波長可変量子カスケードレーザは、それらの高いスペクトル出力密度のために生物学的検体の迅速な分光法および顕微鏡法を可能にした(N.Krogerら、in:Biomedical Vibrational Spectroscopy VI:Advances in Research and Industry,edited by A.Mahadevan-Jansen,W.Petrich,Proc.of SPIE Vol.8939,89390Z;N.Krogerら、J.Biomed.Opt.19(2014)111607;N.Kroger-Luiら、Analyst 140(2015)2086)。これらの刊行物のそれぞれの内容は、その全体が参照により本明細書に組み込まれる。この研究は、調査がはるかに速く(例えば、18時間の代わりに5分)、液体窒素冷却を必要とせず、大幅に低コストで画像当たりより多くのピクセルを提供するという点で、(前述の赤外線顕微鏡のセットアップと比較して)適用性に対する大きなブレークスルーを構成すると考えられている。未染色組織の品質評価の文脈におけるQCLベースの顕微鏡法の特定の利点の1つは、例えば640×480ピクセルのマイクロボロメータアレイ検出器によって可能にされる(FT-IRイメージングと比較して)より大きな視野である。
いくつかの実施形態では、スペクトルは、広い波長範囲、1つ以上の狭い波長範囲にわたって、もしくは単一の波長のみ、またはそれらの組み合わせでさえも取得されることができる。例えば、アミドIバンドおよびアミドIIバンドのスペクトルが取得されることができる。別の例として、スペクトルは、約3200から約3400cm-1、約2800から約2900cm-1、約1020から約1100cm-1、および/または約1520から約1580cm-1の範囲の波長にわたって取得されてもよい。いくつかの実施形態では、スペクトルは、約3200から約3400cm-1の範囲の波長にわたって取得されることができる。いくつかの実施形態では、スペクトルは、約2800から約2900cm-1の範囲の波長にわたって取得されることができる。いくつかの実施形態では、スペクトルは、約1020から約1100cm-1の範囲の波長にわたって取得されることができる。いくつかの実施形態では、スペクトルは、約1520から約1580cm-1の範囲の波長にわたって取得されることができる。スペクトル範囲を狭めることは、通常、特に量子カスケードレーザを使用する場合、取得速度の点で有利である。特定の一実施形態では、単一の波長可変レーザは、次々にそれぞれの波長に調整される。あるいは、特定の周波数での測定に必要なレーザをオンおよびオフに切り替えることによって波長選択が行われるように、固定周波数の非同調レーザのセットが使用されることができる。
スペクトルは、例えば、透過または反射測定を使用して取得されることができる。透過測定のために、フッ化バリウム、フッ化カルシウム、シリコン、薄いポリマー膜、またはセレン化亜鉛が、通常、基材として使用される。反射測定のために、金または銀メッキされた基材、ならびに標準的な顕微鏡ガラススライド、または中間IR反射コーティング(例えば、多層誘電体コーティングまたは薄スライバコーティング)によってコーティングされたガラススライドが一般的である。さらに、ナノアンテナのような構造化表面などの、表面増強(例えば、SEIRS)を使用するための手段が実装されてもよい。
当業者であれば、他のコンピュータ装置またはシステムを利用することができ、本明細書に記載のコンピュータシステムが追加の構成要素、例えば顕微鏡、イメージング装置、スキャナ、他のイメージングシステム、自動スライド調製装置などに通信可能に結合されることができることを理解するであろう。これらの追加の構成要素のいくつか、および利用できる様々なコンピュータ、ネットワークなどは、本明細書でさらに説明される。
例えば、いくつかの実施形態では、システム200は、イメージング装置をさらに含んでもよく、イメージング装置から取り込まれた画像は、ローカルまたはサーバ上などにバイナリ形式で記憶されてもよい。デジタル画像はまた、ピクセルの行列に分割されることもできる。ピクセルは、ビット深度によって定義される1以上のビットのデジタル値を含むことができる。一般に、イメージング装置(メモリに記憶された事前にスキャンされた画像を含む他の画像ソース)は、限定されるものではないが、1つ以上の画像撮像装置を含むことができる。画像撮像装置には、限定されるものではないが、カメラ(例えば、アナログカメラ、デジタルカメラなど)、光学系(例えば、1つ以上のレンズ、センサフォーカスレンズ群、顕微鏡対物レンズなど)、イメージングセンサ(例えば、電荷結合素子(CCD)、相補的金属酸化物半導体(CMOS)イメージセンサなど)、写真フィルムなどを含む。デジタル実施形態では、画像撮像装置は、オンザフライフォーカシングを証明するために協働する複数のレンズを含むことができる。イメージセンサ、例えば、CCDセンサは、検体のデジタル画像を撮像することができる。いくつかの実施形態では、画像化装置は、明視野イメージングシステム、マルチスペクトルイメージング(MSI)システム、または蛍光顕微鏡法システムである。デジタル化された組織データは、例えば、VENTANA MEDICAL SYSTEMS,Inc.(アリゾナ州トゥーソン)によるVENTANA DP200スキャナなどの画像スキャンシステムまたは他の適切なイメージング装置によって生成されることができる。さらなるイメージング装置およびシステムは、本明細書でさらに説明される。当業者は、イメージング装置によって取得されたデジタルカラー画像が、従来、基本色ピクセルから構成されることを理解するであろう。各色付きピクセルは、それぞれが同じビット数を含む3つのデジタルコンポーネントでコード化されることができ、各コンポーネントは、「RGB」コンポーネントという用語によっても示される、一般に赤、緑、または青の原色に対応する。
図2は、本開示のシステム200およびシステム内で利用される様々なモジュールの概要を提供している。いくつかの実施形態では、システム200は、1つ以上のプロセッサ209および1つ以上のメモリ201を有するコンピュータ装置またはコンピュータ実装方法を使用し、1つ以上のメモリ201は、1つ以上のプロセッサに本明細書に記載の特定の命令を実行させるために、1つ以上のプロセッサによる実行のための非一時的なコンピュータ可読命令を記憶する。
いくつかの実施形態では、上述したように、システムは、取得された生物学的検体(例えば、図3のステップ310を参照)またはその任意の部分(例えば、図3のステップ320を参照)の中間IRスペクトルまたはラマンスペクトルなどの振動スペクトルを取得するためのスペクトル取得モジュール202を含む。いくつかの実施形態では、システム200は、取得されたスペクトルデータを処理するように適合されたスペクトル処理モジュール212をさらに含む。いくつかの実施形態では、スペクトル処理モジュール212は、取得されたスペクトル(例えば、図6のステップ620から620を参照)を補正および/または正規化するため、または取得された透過スペクトルを吸収スペクトルに変換するためなどに、スペクトルデータを前処理するように構成される。他の実施形態では、スペクトル処理モジュール212は、単一の生物学的検体から導出される複数の取得されたスペクトルを平均化するように構成される。さらに他の実施形態では、スペクトル処理モジュールは、取得されたスペクトルの一次導関数または二次導関数を計算するように構成される。
いくつかの実施形態では、システム200は、訓練スペクトルデータを受信し、受信した訓練スペクトルデータを使用して固定推定エンジン210を訓練するように適合された(例えば、図7のステップ710から730を参照)訓練モジュール211をさらに含む。いくつかの実施形態では、システム200は、試験スペクトルデータ内の固定特徴を検出し(例えば、図3のステップ340を参照)、検出された固定特徴に基づいて固定持続時間の推定値を提供する(例えば、図3のステップ350を参照)ように訓練された固定推定エンジン210を含む。
いくつかの実施形態では、訓練された固定推定エンジン210は、1つ以上の機械学習アルゴリズムを含む。いくつかの実施形態では、1つ以上の機械学習アルゴリズムは、本明細書でさらに説明するように次元縮小に基づく。いくつかの実施形態では、次元縮小は、判別分析を伴う主成分分析などの主成分分析を利用した。他の実施形態では、次元縮小は、潜在構造回帰への投影である。いくつかの実施形態では、マスキング解除状態推定エンジン210は、ニューラルネットワークを含む。他の実施形態では、固定推定エンジンは、教師あり分類器を含む。いくつかの実施形態では、固定推定エンジンは、ニューラルネットワークを含む。
当業者はまた、追加のモジュールがワークフローまたはシステム200に組み込まれることができることを理解するであろう。いくつかの実施形態では、画像取得モジュールが実行されて、生物学的検体またはその任意の部分のデジタル画像を取得する。他の実施形態では、細胞が検出、分類、および/またはスコア付けされることができるように自動化アルゴリズムが実行されることができる(例えば、その開示が参照によりその全体が本明細書に組み込まれる米国特許出願公開第2017/0372117号明細書を参照)。
分光取得モジュールおよび取得された分光データ
図2を参照すると、いくつかの実施形態では、システム200は、生物学的検体の少なくとも一部の振動スペクトル(例えば、上述したもののいずれかなどのスペクトルイメージング装置12を使用して)を取り込むためにスペクトル取得モジュール202を実行する。いくつかの実施形態では、生物学的検体は、染色されておらず、例えば、生物学的検体は、バイオマーカーの存在を示す染色を含まない。他の実施形態では、生物学的検体はまた、1つ以上の染色、例えば一次染色、または1つ以上のバイオマーカーの存在を示す染色を含むことができる。スペクトル取得モジュール202を使用してスペクトルが取得されると、それらは、記憶モジュール240(例えば、ローカル記憶モジュールまたはネットワーク記憶モジュール)に記憶されることができる。
いくつかの実施形態では、振動スペクトルは、生物学的検体の一部から取得されることができる(本明細書でさらに説明するように、これは、検体が訓練生物学的検体であるか試験生物学的検体であるかに関係なく)。そのような場合、スペクトル取得モジュール202は、例えばランダムサンプリングによって、または試料全体をカバーするグリッドにわたって規則的な間隔でサンプリングすることによって、試料の所定の部分から振動スペクトルを取得するようにプログラムされてもよい。これは、試料の特定の領域のみが分析に関連する場合にも有用とすることができる。例えば、関心領域は、特定の種類の組織、または別の関心領域と比較して特定の種類の細胞の比較的高い集団を含むことができる。例えば、扁桃組織を含むが結合組織を含まない関心領域が選択されることができる。そのような場合、スペクトル取得モジュール202は、例えば関心領域のランダムサンプリングによって、または関心領域全体をカバーするグリッドにわたって規則的な間隔でサンプリングすることによって、関心領域の所定の部分から振動スペクトルを収集するようにプログラムされてもよい。試料が1つ以上の染色を含む実施形態では、染色を含まないか、または他の領域よりも比較的少ない染色を含む関心領域から振動スペクトルが取得されることができる。
いくつかの実施形態では、生物学的検体の少なくとも2つの領域がサンプリングされ、少なくとも2つの領域のそれぞれについて振動スペクトルが取得される(また、これは、検体が訓練生物学的検体であるか試験生物学的検体であるかに関係なく)。他の実施形態では、生物学的検体の少なくとも10個の領域がサンプリングされ、少なくとも10個の領域のそれぞれについて振動スペクトルが取得される。さらに他の実施形態では、生物学的検体の少なくとも30個の領域がサンプリングされ、少なくとも30個の領域のそれぞれについて振動スペクトルが取得される。さらなる実施形態では、生物学的検体の少なくとも60個の領域がサンプリングされ、少なくとも60個の領域のそれぞれについて振動スペクトルが取得される。またさらなる実施形態では、生物学的検体の少なくとも90個の領域がサンプリングされ、少なくとも90個の領域のそれぞれについて振動スペクトルが取得される。なおさらなる実施形態では、生物学的検体の約30個の領域と約150個の領域との間がサンプリングされ、各領域について振動スペクトルが取得される。
いくつかの実施形態では、生物学的検体の領域ごとに単一の振動スペクトルが取得される。他の実施形態では、生物学的検体の領域ごとに少なくとも2つの振動スペクトルが取得される。さらに他の実施形態では、生物学的検体の領域ごとに少なくとも3つの振動スペクトルが取得される。
いくつかの実施形態では、記憶モジュール240に記憶される取得スペクトルまたは取得スペクトルデータ(本明細書では互換的に使用される)は、「訓練スペクトルデータ」を含む。いくつかの実施形態では、訓練スペクトルデータは、訓練生物学的検体から導出され、訓練生物学的検体は、組織学的検体、細胞学的検体、またはそれらの任意の組み合わせとすることができる。いくつかの実施形態では、訓練スペクトルデータは、本明細書に記載の訓練モジュール211の使用などによって、固定推定エンジン210を訓練するために使用される。いくつかの実施形態では、訓練スペクトルデータは、固定持続時間および/または固定品質などのクラスラベルを含む。
いくつかの実施形態では、訓練生物学的検体は、別様に固定される。差次固定とは、単一の訓練生物学的検体を複数の部分(例えば、第1の訓練組織試料、第2の訓練組織試料、および第nの訓練組織試料)に分割し(例えば、図4Aを参照)、複数の部分のそれぞれに異なる固定処理を施す(例えば、図4Bを参照)処理である。例えば、単一の扁桃組織試料が10個以上の部分に分割され、各部分を所定の時間にわたって固定されることができる。いくつかの実施形態では、試料は、3つ以上の部分に区分されることができ、各部分は、異なる時間量にわたって固定されることができ、したがって3つの別様に固定された訓練試料を提供することができる。他の実施形態では、試料は、5つ以上の部分に区分されることができ、各部分は、異なる時間量にわたって固定されることができ、したがって5つの別様に固定された訓練試料を提供することができる。さらに他の実施形態では、試料は、7つ以上の部分に区分されることができ、各部分は、異なる時間量にわたって固定されることができ、したがって、7つの別様に固定された訓練試料を提供することができる。さらなる実施形態では、試料は、9つ以上の部分に区分されることができ、各部分は、異なる時間量にわたって固定されることができ、したがって、9つの別様に固定された訓練試料を提供することができる。このプロセスは図4Aに示される。例として、単一の扁桃組織試料は、7つの部分に分割されることができ、各部分は、所定の時間量、例えば0時間、約1時間、約2時間、約4時間、約6時間、約12時間、約24時間などの間、別様に固定されることができる。
いくつかの実施形態では、任意の訓練生物学的検体(またはその一部)は、任意の所定の時間量、例えば約1時間、約2時間、約4時間、約6時間、約12時間などの間、固定されることができ、訓練生物学的検体から取得された訓練スペクトルは、固定推定エンジン210を訓練する際のグラウンドトゥルースとして機能することができる。この点に関して、複数の訓練生物学的検体は、それぞれ、異なる程度など、部分的に固定されてもよく(例えば、試料が「完全に固定」または「十分に固定」と見なされるのに十分な持続時間、固定剤によって処理されない)、これらの部分的に固定された検体は、「完全に固定」または「十分に固定」と判定された生物学的検体の訓練とともに、固定推定エンジン210を訓練するために使用されてもよい。さらに、固定されていない試料(例えば、0時間の固定)もまた、訓練モジュール211に供給されることができる。
いくつかの実施形態では、所定の時間量の間少なくとも部分的に固定された訓練生物学的検体は、複数のバイオマーカーの機能的IHC染色を使用して定量的に検証され、例えば、検体の固定条件は、IHC分析によって確認されている。いくつかの実施形態では、機能的染色強度が各訓練試料について評価されることができるように、訓練試料のそれぞれは、1つ以上のバイオマーカーの存在について染色される。いくつかの実施形態では、各訓練試料は、単一のバイオマーカーの存在について染色され、次いで、試料の画像は、イメージング装置を使用して取り込まれ、(染色強度および/または陽性率などについて)分析される。他の実施形態では、各訓練試料は、2つ以上のバイオマーカーの存在について染色され、次いで、試料の画像は、イメージング装置を使用して取り込まれ、(2つ以上のバイオマーカーのそれぞれの染色強度および/または陽性率が独立して分析されるように)分析される。例えば、異なる部分的に固定された検体は、異なる程度に固定されることができ、この異なる固定は、異なる既知の時間(例えば、6時間、12時間、24時間など。)に1つ以上のバイオマーカー(例えば、BLC2、FOXP3など)の存在について染色することによって検証されることができる。
別様固定および別様固定された試料からのスペクトルデータの取得のプロセスは、図4Cおよび図8にさらに示されている。上記のように、まず、1つ以上の訓練生物学的検体が取得される(ステップ410)。次いで、1つ以上の訓練生物学的検体のそれぞれは、少なくとも二部分に分割される(ステップ420)。このようにして、1つ以上の訓練生物学的検体のそれぞれは、少なくとも2つの「訓練試料」を提供する。これらの訓練試料のそれぞれは、別様に固定されることができ、例えば、それぞれが異なる所定の時間量にわたって固定されることができる(ステップ430)。
少なくとも2つの訓練試料の別様固定に続いて、少なくとも2つの訓練試料のそれぞれにおける複数の領域が識別される(ステップ440)。次に、複数の識別された領域のうちの識別された領域のそれぞれについて、少なくとも1つの振動スペクトルが取得される(ステップ450)。いくつかの実施形態では、各識別された領域(または以下にさらに説明するようなそのさらなる処理された変形)から取得された各振動スペクトルの平均が計算されて、その訓練試料の平均振動スペクトルを提供する(ステップ460)。ステップ400から460は、複数の異なる訓練生物学的検体について繰り返されてもよい(点線470を参照)。いくつかの実施形態では、記憶モジュール240などに、全ての訓練生物学的検体からの全ての訓練試料からの平均化された振動スペクトル「訓練スペクトルデータ」が記憶される(ステップ480)。このようにして、訓練スペクトルデータは、固定推定エンジン210の訓練のために訓練モジュール211によって記憶モジュール240から取得されることができる。全ての訓練試料からの平均振動スペクトルを記憶することに加えて、記憶モジュール240はまた、平均振動スペクトルに関連する任意のクラスラベル、例えば既知の固定持続時間、定性的固定推定値などを記憶するように適合される。
例として、別様に固定された検体からのFFPEブロックは、振動に適合するスライド上に区分されることができる。次いで、スライド上の試料を粗にマッピングするために、可視低倍率対物レンズを使用して切片全体がイメージングされることができる(例えば、図10Aを参照)。次に、試料全体の複数の空間領域は、テルル化カドミウム水銀検出器単一点検出器(v=900~4000cm-1、Δv=8cm-1、平均=16)を使用する振動顕微鏡(例えば、Bruker Hyperion 3000)などのスペクトル取得装置12を使用して分光的にイメージングされるように選択されることができる。これは、図10Bおよび図10Cに示されている。
上述したプロセスは、複数の異なる訓練生物学的検体について繰り返されてもよく、複数の異なる訓練生物学的検体のそれぞれは、同じ組織タイプのものであってもよいし、異なる組織タイプのものであってもよい。本明細書の実施例1は、訓練生物学的検体を調製する方法、および固定推定エンジン210の訓練に使用するためのスペクトルデータの取得をさらに説明する。さらに、上述したプロセスは、異なる固定剤試薬または異なる固定プロセスについて繰り返されてもよい。
いくつかの実施形態では、記憶モジュール240に記憶された取得スペクトルデータは、「試験スペクトルデータ」を含む。いくつかの実施形態では、試験スペクトルデータは、被験者(例えば、ヒト患者)から導出される検体などの試験生物学的検体から導出され、試験生物学的検体は、組織学的検体、細胞学的検体、またはそれらの任意の組み合わせとすることができる。
図5を参照すると、試験生物学的検体が取得されることができ(ステップ510)、次いで、試験生物学的検体内の複数の空間領域が識別されることができる(ステップ520)。各識別された領域について少なくとも1つの振動スペクトルが取得されることができる(ステップ530)。次いで、全ての領域からの取得された振動スペクトルが補正され、正規化され、平均化されて、試験生物学的検体の平均振動スペクトル(「試験スペクトルデータ」)を提供することができる。本明細書でさらに説明するように、試験スペクトルデータは、少なくとも試験生物学的検体の固定持続時間を推定することができるように、訓練された固定推定エンジン210に供給されることができる。次いで、推定された固定持続時間は、下流プロセスまたは下流の意思決定において使用されて、例えば、検体が適切に固定されているかどうかを判定し、検体がさらなる固定を必要とするかどうかを判定し、または固定の程度が特定のIHCまたはISHアッセイに十分であるかどうかを判定することができる。
上述したように、スペクトルデータが訓練生物学的検体または試験生物学的検体から取得されるかどうかにかかわらず、例えば試料の空間的不均一性を説明するために、各生物学的検体について複数の振動スペクトルが取得される。いくつかの実施形態では、スペクトル処理モジュール212は、取得された各振動透過スペクトルを振動吸収スペクトルに変換するために最初に利用される。いくつかの実施形態では、透過スペクトルおよび吸光度スペクトルは、式吸光度=ln(ブランク透過/組織を通る透過)を介して直接関連しており、したがって、取得された透過スペクトルは、吸収スペクトルに変換されることができる。
振動スペクトルの全てが透過から吸光度に変換されると、いくつかの実施形態では、(スペクトル処理モジュール212を使用するなどして)様々な領域の全てからの取得されたスペクトルがともに平均化され、それは、例えば固定持続時間を訓練または推定するための下流分析に使用される平均化された振動スペクトルである。いくつかの実施形態では、図6を参照すると、複数の空間領域のそれぞれから取得された振動スペクトルは、それらの平均化の前に最初に正規化および/または補正される。いくつかの実施形態では、各領域からの振動スペクトルは、補正された振動スペクトルを提供するために個別に補正される(ステップ620)。例えば、補正は、大気効果について各取得振動スペクトルを補正すること(ステップ630)と、次いで散乱について各大気補正振動スペクトルを補正すること(ステップ640)とを含むことができる。次に、各補正振動スペクトルは、所定の最大値に正規化された振幅である(ステップ650)。続いて、振幅正規化スペクトルの集合が平均化される(ステップ660)。
このプロセスは、図10Dから図10Hに示されている。例として、各点の生の中間IRスペクトルが図10Dに表示されている。これらのスペクトルは、全ての中間IR周波数にわたって透過光を測定し、組織が吸収している光の量の測定値を得るために組織を含まないスライドの透過で割ることによって計算された。収集されたスペクトルは、大気効果について補償され(図10E)、次いで、64のベースライン点および約8回の反復による凹状ゴムバンド補正を使用して組織内の散乱を補償するためにベースライン補正された(図10F)。次いで、各スペクトルは、最大値(図10G)に対して振幅正規化され、次いで、所与の組織からの全てのスペクトルをともに平均化することによって各組織からの平均スペクトルが計算されて、各試料のスライドの高品質の代表スペクトルを計算した(図H)。
固定推定エンジン
本開示のシステムおよび方法は、機械学習技術を使用してスペクトルデータをマイニングする。訓練モードの固定推定エンジンの場合、固定推定エンジンは、取得および処理された複数の訓練スペクトルから特徴(例えば、固定特徴)を学習し、それらの学習された特徴を訓練スペクトルに関連するクラスラベルと相関させることができる(例えば、既知の固定持続時間、1つ以上のバイオマーカーによる既知の機能的染色など)。訓練された固定推定エンジン(例えば、訓練スペクトルデータおよび関連するクラスラベルを使用して既に訓練されている固定推定エンジン)の場合、訓練された固定エンジンは、試験生物学的検体から特徴(例えば、固定特徴)を導出し、学習されたデータセットに基づいて、導出された固定特徴に基づいて試験生物学的検体の固定状態を予測することができる。
機械学習は、一般に、明示的にプログラムされることなく学習する能力をコンピュータに提供する一種の人工知能(AI)として定義されることができる。機械学習は、新たなデータにさらされたときに成長および変化することを自らに教えることができるコンピュータプログラムの開発に焦点を合わせている。換言すれば、機械学習は、コンピュータに明示的にプログラムされることなく学習する能力を与えるコンピュータ科学のサブフィールドとして定義されることができる。機械学習は、データから学習し、データ上で予測を行うことができるアルゴリズムの研究および構築を探求し、そのようなアルゴリズムは、試料入力からモデルを構築することによって、データ駆動予測または決定を行うことによって厳密に静的なプログラム命令に従うことを克服する。本明細書に記載の機械学習は、本明細書に完全に記載されているかのように参照により組み込まれる、Sugiyama、Morgan Kaufmann、2016,534ページ;「Discriminative,Generative,and Imitative Learning」、Jebara,MIT Thesis,2002,212ページ;および「Principles of Data Mining(Adaptive Computation and Machine Learning)」、Handら、MIT Press,2001,578ページに記載されているようにさらに実行されることができる。本明細書に記載の実施形態は、これらの参考文献に記載されているようにさらに構成されることができる。
いくつかの実施形態では、固定推定エンジン210は、試験生物学的検体から導出される試験スペクトルの固定状態を予測するタスクのために「教師あり学習」を使用する。教師あり学習は、例示的な入出力対に基づいて入力を出力にマッピングする関数を学習する機械学習タスクである。これは、訓練例のセット(ここでは訓練スペクトル)からなるラベル付き訓練データ(ここで、固定時間は、訓練スペクトルデータに関連付けられたラベルである)から関数を推論する。教師あり学習では、各例は、入力オブジェクト(典型的にはベクトル)と所望の出力値(教師信号とも呼ばれる)とからなるペアである。教師あり学習アルゴリズムは、訓練データを分析し、新たな例をマッピングするために使用されることができる推論関数を生成する。最適なシナリオは、アルゴリズムが見えないインスタンスのクラスラベルを正しく判定することを可能にする。
固定推定エンジン210は、当業者に知られている任意のタイプの機械学習アルゴリズムを含むことができる。適切な機械学習アルゴリズムは、回帰アルゴリズム、類似性ベースのアルゴリズム、特徴選択アルゴリズム、正則化方法ベースのアルゴリズム、決定木アルゴリズム、ベイジアンモデル、カーネルベースのアルゴリズム(例えば、サポートベクターマシン)、クラスタリングベースの方法、人工ニューラルネットワーク、深層学習ネットワーク、アンサンブル方法、遺伝的アルゴリズム、および次元縮小方法を含む。適切な次元縮小方法の例は、主成分分析(主成分分析、および判別分析など)、潜在構造回帰への投影、およびt分布確率的近傍埋め込み(t-SNE)を含む。
いくつかの実施形態では、マスキング解除状態推定エンジン210は、主成分分析を利用する。主成分分析(PCA)の主なアイデアは、データセットに存在する変動を最大限まで保持しながら、互いに相関する多くの変数からなるデータセットの次元を縮小することである。同じことが、変数を新たな変数のセットに変換することによって行われ、これらは、主成分(または単に、PC)として知られており、元の変数に存在する変動の保持がそれらが順序を下って移動するにつれて減少するように直交して並べられる。このようにして、第1の主成分は、元の成分に存在していた最大の変動を保持する。主成分は、共分散行列の固有ベクトルであるため、直交する。主成分分析、およびそれを使用する方法は、米国特許出願公開第2005/0123202号明細書ならびに米国特許第6,894,639号明細書および米国特許第8,565,488号明細書に記載されており、これらの開示は、その全体が参照により本明細書に組み込まれる。PCAおよび線形判別分析は、Khanら、「Principal Component Analysis-Linear Discriminant Analysis Feature Extractor for Pattern Recognition」、IJCSI International Journal of Computer Sciences Issues,Vol.8,Issue 6,No.2,Nov.2011によってさらに記載されており、それらの開示は、その全体が参照により本明細書に組み込まれる。
t-SNEアルゴリズムは、二次元または三次元の低次元空間に視覚化のための高次元データを埋め込むのによく適した非線形次元縮小技術である。具体的には、それは、類似オブジェクトが近くの点でモデル化され、非類似オブジェクトが遠くの点でモデル化される確率が高くなるように、各高次元オブジェクトを二次元または三次元の点によってモデル化する。t-SNEアルゴリズムは、2つの主要な段階を含む。第一に、t-SNEは、類似のオブジェクトがピッキングされる確率が高く、非類似のポイントがピッキングされる確率が非常に低いように、高次元オブジェクトのペアにわたる確率分布を構築する。第二に、t-SNEは、低次元マップ内の点にわたって同様の確率分布を定義し、マップ内の点の位置に関して2つの分布間のKullback-Leibler発散を最小化する。t-SNEアルゴリズムは、米国特許出願公開第2018/0046755号明細書、米国特許出願公開第2014/0336942号明細書、および米国特許出願公開第2018/0166077号明細書にさらに記載されており、これらの開示は、参照によりその全体が本明細書に組み込まれる。
PLSRは、主成分分析(PCA)と多重線形回帰との特徴を組み合わせて一般化する最近の技術である。その目的は、独立変数または予測子のセットから従属変数のセットを予測することである。この予測は、予測器から、最良の予測力を有する潜在変数と呼ばれる直交因子のセットを抽出することによって達成される。これらの潜在変数を使用して、PCAディスプレイに似たディスプレイを作成することができる。PLS回帰モデルから得られた予測の品質は、ブートストラップおよびジャックナイフなどの交差検証技術によって評価される。PLS回帰には2つの主な変形がある:最も一般的なものは、従属変数と独立変数の役割を分離する。第2のものは、従属変数および独立変数に同じ役割を与える。PLSRは、Abdi、「Partial Least Squares Regression and Projection on Latent Structure Regression(PLS Regression)」、WIREs Computational Statistics,John Wiley&Sons,Inc.,2010によってさらに記載されており、その開示は、その全体が参照により本明細書に組み込まれる。
いくつかの実施形態では、固定推定エンジン210は、強化学習を利用する。強化学習(RL)は、エージェントがその前の行動を評価するために次の時間ステップにおいて遅延報酬を受け取る機械学習方法の一種である。換言すれば、RLは、累積報酬の概念を最大化するためにソフトウェアエージェントが環境内でどのように行動を起こすべきかに関するモデルなし機械学習パラダイムである。典型的には、RL設定は、2つの構成要素、エージェント、および環境から構成される。環境とは、エージェントが作用しているオブジェクトを指し、エージェントは、RLアルゴリズムを表す。環境は、エージェントに状態を送信することによって開始し、次いで、エージェントは、その知識に基づいてその状態に応答してアクションを実行する。その後、環境は、次の状態と報酬のペアをエージェントに送り返す。エージェントは、その最後の行動を評価するために、環境によって返された報酬でその知識を更新する。ループは、環境が端末状態を送信するまで継続し、これはエピソードまで終了する。強化学習アルゴリズムは、米国特許第10,279,474号明細書および米国特許第7,395,252号明細書にさらに記載されており、これらの開示は、その全体が参照により本明細書に組み込まれる。
いくつかの実施形態では、固定推定エンジン210は、サポートベクターマシン「SVM」を含む。一般に、SVMは、非線形入力データセットが非線形の場合のカーネルを介して高次元線形特徴空間に変換される統計的学習理論に基づく分類技術である。サポートベクターマシンは、カーネル関数Kによって、2つの異なるクラスを表す訓練データEのセットを高次元空間に投影する。この変換されたデータ空間において、非線形データは、クラス分離を最大化するようにクラスを分離するためにフラットラインを生成することができるように変換される(識別超平面)。次いで、試験データは、Kを介して高次元空間に投影され、試験データ(以下に列挙される特徴またはメトリックなど)は、それらが超平面に対してどこに位置するかに基づいて分類される。カーネル関数Kは、データを高次元空間に射影する方法を定義する。
いくつかの実施形態では、固定推定エンジン210は、ニューラルネットワークを含む。いくつかの実施形態では、ニューラルネットワークは、深層学習ネットワークとして構成される。一般的に言えば、「深層学習」は、データ内の高レベル抽象化をモデル化しようと試みるアルゴリズムのセットに基づく機械学習の一分野である。深層学習は、データの表現を学習することに基づく機械学習方法の広範なファミリの一部である。観察は、ピクセルごとの強度値のベクトルなどの多くの方法で、またはエッジのセット、特定の形状の領域などとしてより抽象的な方法で表すことができる。いくつかの表現は、学習タスクを単純化する点で他の表現よりも優れている。深層学習の約束の1つは、ハンドクラフトされた特徴を、教師なしまたは半教師あり特徴学習および階層的特徴抽出のための効率的なアルゴリズムに置き換えることである。
いくつかの実施形態では、ニューラルネットワークは、生成的ネットワークである。「生成的」ネットワークは、一般に、本質的に確率的であるモデルとして定義されることができる。換言すれば、「生成的」ネットワークは、フォワードシミュレーションまたはルールベースの手法を実行するものではない。代わりに、生成的ネットワークは、適切な訓練データのセット(例えば、複数の訓練スペクトルデータセット)に基づいて学習されることができる(そのパラメータが学習されることができるという点で)。いくつかの実施形態では、ニューラルネットワークは、深層生成的ネットワークとして構成される。例えば、ネットワークは、ネットワークが複数のアルゴリズムまたは変換を実行する複数の層を含むことができるという点で、深層学習アーキテクチャを有するように構成されることができる。
いくつかの実施形態では、ニューラルネットワークは、オートエンコーダを含む。オートエンコーダニューラルネットワークは、目標値を入力に等しくなるように設定する、バックプロパゲーションを適用する教師なし学習アルゴリズムである(本明細書のさらなる説明を参照)。オートエンコーダの目的は、信号「ノイズ」を無視するようにネットワークを訓練することによって、典型的には次元縮小のために、データセットの表現(符号化)を学習することである。縮小側とともに、再構成側が学習され、オートエンコーダは、縮小された符号化からその元の入力に可能な限り近い表現を生成しようと試みる。オートエンコーダに関する追加情報は、http://ufldl.stanford.edu/tutorial/unsupervised/Autoencoders/に見出すことができ、その開示は、その全体が参照により本明細書に組み込まれる。
いくつかの実施形態では、ニューラルネットワークは、世界を訓練するために供給されたデータに従って世界をモデル化する重みのセットを有する深層ニューラルネットワークとすることができる。ニューラルネットワークは、典型的には複数の層からなり、信号経路は、層の間を前後に横切る。この目的のために、任意のニューラルネットワークが実装されることができる。適切なニューラルネットワークは、LeNet、AlexNet、ZFnet、GoogLeNet、VGGNet、VGG16、DenseNet、およびResNetを含む。いくつかの実施形態では、その開示が参照により本明細書に組み込まれる、Longら、「Fully Convolutional Networks for Semantic Segmentation」、Computer Vision and Pattern Recognition(CVPR),2015 IEEE Conference,June 20015(INSPEC Accession Number:15524435)に記載されているような、完全畳み込みニューラルネットワークが利用される。
いくつかの実施形態では、ニューラルネットワークは、AlexNetとして構成される。例えば、分類ネットワーク構造は、AlexNetとすることができる。「分類ネットワーク」という用語は、本明細書では、1つ以上の完全接続層を含むCNNを指すために使用される。一般に、AlexNetは、いくつかの畳み込み層(例えば、5つ)と、それに続く、データを分類するように組み合わせて構成および訓練されたいくつかの完全接続層(例えば、3つ)とを含む。
他の実施形態では、ニューラルネットワークは、GoogleNetとして構成される。GoogleNetアーキテクチャは、(特に本明細書に記載のいくつかの他のニューラルネットワークと比較して)比較的多数の層を含むことができるが、層のいくつかは、並列に動作することができ、互いに並列に機能する層のグループは、一般に、開始モジュールと呼ばれる。他の層が順次動作してもよい。したがって、GoogleNetは、層の全てが順次構造に配置されているわけではないという点で、本明細書に記載の他のニューラルネットワークとは異なる。GoogleNetとして構成されたニューラルネットワークの例は、参照により本明細書に完全に記載されているかのように組み込まれる、Szegedyらによる「Going Deeper with Convolutions」、CVPR 2015に記載されている。
他の実施形態では、ニューラルネットワークは、VGGネットワークとして構成される。例えば、分類ネットワーク構造は、VGGとすることができる。VGGネットワークは、アーキテクチャの他のパラメータを固定しながら畳み込み層の数を増加させることによって作成された。畳み込み層を追加して深さを増加させることは、全ての層において実質的に小さい畳み込みフィルタを使用することによって可能になる。
他の実施形態では、ニューラルネットワークは、深残差ネットワークとして構成される。例えば、分類ネットワーク構造は、深残差ネットまたはResNetとすることができる。本明細書に記載の他のいくつかのネットワークと同様に、深残差ネットワークは、畳み込み層と、それに続く完全接続層とを含むことができ、それらは、組み合わせて、検出および/または分類のために構成および訓練される。深残差ネットワークでは、層は、参照されていない関数を学習する代わりに、層入力を参照して残差関数を学習するように構成される。特に、いくつかの積層された各層が所望の基礎となるマッピングに直接適合することを望む代わりに、これらの層は、ショートカット接続を有するフィードフォワードニューラルネットワークによって実現される残差マッピングに明示的に適合することができる。ショートカット接続は、1つ以上の層をスキップする接続である。深残差ネットは、畳み込み層を含むプレーンニューラルネットワーク構造を取り、ショートカット接続を挿入することによって作成されることができ、それによってプレーンニューラルネットワークを取り、それを残差学習の相手にする。深残差ネットの例は、あたかも本明細書に完全に記載されているかのように参照により組み込まれる、Heらによる「Deep Residual Learning for Image Recognition」、NIPS 2015に記載されている。本明細書に記載のニューラルネットワークは、この参考文献に記載されているようにさらに構成されることができる。
固定推定エンジンの訓練
いくつかの実施形態では、固定推定エンジン210は、訓練モードで動作するように適合される。いくつかの実施形態では、訓練モジュール211は、固定推定エンジン210と通信しており、訓練スペクトルデータを受信し、訓練スペクトルデータを固定推定エンジン210に供給するように構成されている。いくつかの実施形態では、訓練モジュール211は、任意の適切な訓練アルゴリズム、例えば、k倍交差検証、バックプロパゲーションなどに従って、訓練スペクトルデータを固定推定エンジン210に提供し、固定推定エンジン210をその訓練モードで動作させるように動作することができる。いくつかの実施形態では、訓練アルゴリズムは、(本明細書に記載されるような)既知の訓練スペクトルデータのセットを利用する。いくつかの実施形態では、訓練モジュール211は、固定推定エンジン210と通信しており、訓練スペクトルデータ(または訓練吸光度スペクトルデータのさらなる処理された変形、例えば、訓練スペクトルデータの一次または二次導関数、訓練スペクトルデータ内の個々の帯域の大きさ、訓練スペクトルデータ内の帯域の積分、訓練スペクトルデータ内の2つ以上の帯域強度の比、訓練スペクトルデータの二次および三次導関数からの比など)を受信し、訓練スペクトルデータを固定推定エンジン210に供給するように構成されている。いくつかの実施形態では、訓練モジュール211はまた、訓練スペクトルデータに関連付けられたクラスラベルを供給するように適合される。
いくつかの実施形態では、訓練アルゴリズムは、(本明細書に記載されるような)既知の訓練スペクトルデータのセットおよび(例えば、固定条件、固定品質など)既知の出力クラスラベルの対応するセットを利用し、入力訓練スペクトルデータの処理が所望の対応するクラスラベルを提供するように、固定推定エンジン210内の内部接続を変更するように構成される。
マスキング解除状態推定エンジン210は、当業者に知られている任意の方法に従って訓練されることができる。例えば、米国特許出願公開第2018/0268255号明細書、米国特許出願公開第2019/0102675号明細書、米国特許出願公開第2015/0356461号明細書、米国特許出願公開第2016/0132786号明細書、米国特許出願公開第2018/0240010号明細書、および米国特許出願公開第2019/0108344号明細書に開示されている訓練方法のいずれかであり、これらの開示は、その全体が参照により本明細書に組み込まれる。
いくつかの実施形態では、固定推定エンジン210は、交差検証法を使用して訓練される。交差検証は、分類器を開発するときにモデル選択および/またはパラメータ調整を支援するために使用されることができる技術である。交差検証は、ラベル付き事例のセットからの事例の1つ以上のサブセットを試験セットとして使用する。例えば、k倍交差検証では、ラベル付き事例のセットは、k個の「折り畳み」に等しく分割され、例えば、K倍交差検証は、機械学習モデルを評価するために使用される再サンプリング手順である。一連の訓練-試験サイクルが実行され、各サイクルにおいて異なる折り畳みが試験セットとして使用され、残りの折り畳みが訓練セットとして使用されるように、k個の折り畳みを反復する。各折り畳みは、ある時点で試験セットとして使用されるため、ラベル付きケースのセット内のランダムでない選択されたケースは、交差検証にバイアスをかけるように見える。例えば、5倍交差検証(k=5)のシナリオでは、データセットは、5つの折り畳みに分割される。第1の反復では、第1の折り畳みが使用されてモデルを試験し、残りが使用されてモデルを訓練する。第2の反復では、第2の折り畳みが試験セットとして使用され、残りは訓練セットとして機能する。このプロセスは、5つの折り畳みの各折り畳みが試験セットとして使用されるまで繰り返される。k倍交差検証を実施する方法は、米国特許出願公開第2014/0279734号明細書および米国特許出願公開第2005/0234753号明細書にさらに記載されており、その開示は、その全体が参照により本明細書に組み込まれる。図14Aおよび図14Bは、k倍交差検証を利用して固定推定エンジン210を訓練するプロセスを示している。
固定推定エンジン210がニューラルネットワークを含む実施形態では、固定推定エンジン210を訓練するためのバックプロパゲーションアルゴリズムは、ネットワークノード間の接続にいくつかのランダムな初期値が与えられる反復プロセスであり、ネットワークは、入力ベクトルのセット(訓練スペクトルデータセット)の対応する出力ベクトルを計算するように動作する。出力ベクトルは、訓練スペクトルデータセットの所望の出力と比較され、所望の出力と実際の出力との間の誤差が計算される。計算された誤差は、出力ノードから入力ノードにバックプロパゲーションされ、誤差を低減するためにネットワーク接続重みの値を修正するために使用される。そのような各反復の後、訓練モジュール211は、訓練セット全体の総誤差を計算することができ、次いで、訓練モジュール211は、別の反復でプロセスを繰り返すことができる。固定推定エンジン210の訓練は、総誤差が最小値に到達したときに完了する。所定の反復回数の後に総誤差の最小値に到達しない場合、および総誤差が一定でない場合、訓練モジュール211は、訓練プロセスが収束しないと考えることができる。
固定推定エンジン210を、(上述した)所定の期間にわたって別様に固定された訓練生物学的検体から導出される取得スペクトルデータによって訓練する文脈において、各取得された訓練スペクトルは、既知の固定持続時間に関連付けられる。いくつかの実施形態では、利用される訓練スペクトルデータは、上述したように、複数のバイオマーカーの機能的IHC染色を使用して検証され、例えば、訓練生物学的検体の固定持続時間は、1つ以上のバイオマーカーの実際の染色データと相関する。実際に、異なる部分的に固定された検体は、異なる程度に固定されることができ、この異なる固定は、異なる既知の時間(例えば、約6時間、約12時間、約24時間など)に1つ以上のバイオマーカー(例えば、BLC2、FOXP3など)の存在について染色することによって検証されることができる。本明細書の実施例に記載されるように、バイオマーカーの保存は、固定の持続時間に応じて変化し、試料が「完全に」固定されると、例えば6時間を超える期間固定されると変化する(図11A~図11Dも参照)。例として、12時間の既知の固定持続時間を有する訓練スペクトルデータセットが訓練モジュール211などに提供されることができ、この特定の訓練スペクトルデータセットは、1つ以上のバイオマーカーによる機能的IHC染色によって検証された。さらなる例として、0時間、1時間、2時間、4時間、6時間などの他の既知の固定持続時間を有する追加の訓練スペクトルデータセットが提供されることができ、各特定の訓練スペクトルデータセットは、1つ以上のバイオマーカーによる機能的IHC染色によって再び検証された。このようにして、それらの異なる所定の固定持続時間のそれぞれについて高品質を有する固定を表す訓練スペクトルデータが提供される。いくつかの実施形態では、訓練モジュール211に提供される訓練スペクトルデータセットは、訓練吸光度スペクトルを含むだけでなく、訓練吸光度スペクトルの計算された一次および/または二次導関数および/または訓練吸光度スペクトルデータの他のさらなる処理された変形も含む。
いくつかの実施形態では、取得された訓練スペクトルデータはまた、「固定品質」に関連付けられてもよい。本明細書で使用される場合、「固定品質」は、固定の程度および/または均一性を指す。例として、訓練モジュール211に提供される特定の訓練スペクトルは、機能的IHC試験によって検証された関連する既知の固定持続時間(例えば12時間)および関連する固定品質(例えば、「良好な固定品質」、「固定不良」、「不十分な固定」、「適切に固定」など)を含むことができる。例えば、0時間または1時間固定された試料には、「不十分な固定」というラベルが関連付けられ、12時間または24時間固定された試料には、「適切に固定」というラベルが関連付けられることができる。
このようにして、固定推定エンジン210は、固定持続時間に関連する固定特徴を検出するだけでなく、固定の品質も検出するように訓練されることができる。例えば、訓練データセットが病理学者に提供されてもよく、これらの訓練データセットは、固定の品質の定性的評価を含むように病理学者によって注釈付けされてもよい。このようにして、訓練された固定推定エンジン210は、固定持続時間の定量的推定だけでなく、固定品質の定性的評価も提供することができる。この点に関して、十分且つ適切に固定された検体だけでなく、不十分且つ不適切に固定された検体の固定特徴も学習するように固定推定エンジン210を訓練することも可能である。
固定推定エンジン210の訓練が完了すると、システム200は、試験スペクトルデータから固定特徴を検出し、次いで、検出された固定特徴に基づいて試験生物学的検体の固定持続時間を推定するように動作する準備が整う。いくつかの実施形態では、固定推定エンジン210は、入力データの変動に適応するように定期的に再訓練されることができる。
試験スペクトルの固定持続時間の推定
固定推定エンジン210が上述したように適切に訓練されると、それは、試験スペクトル内の固定特徴を検出し、検出された固定特徴に基づいて、固定持続時間を定量的に推定するために使用されることができる。いくつかの実施形態では、固定推定エンジン210がどのように訓練されるかに応じて、訓練された固定推定エンジン210はまた、出力として固定品質の定性的評価を提供することもできる。
いくつかの実施形態では、図3を参照すると、試験生物学的検体が取得され(ステップ310)(例えば、特定の疾患を有する疑いがあるか、または特定の疾患を有することが知られている被験者から)、次いで、その試験生物学的検体から試験スペクトルデータが取得される(ステップ320)(図5も参照)。いくつかの実施形態では、試験スペクトルデータは、吸光度スペクトル、吸光度スペクトルの一次および/または二次導関数、訓練スペクトルデータ内の個々の帯域の大きさ、訓練スペクトルデータ内の帯域の積分、訓練スペクトルデータ内の2つ以上の帯域強度の比、訓練スペクトルデータの二次および三次導関数からの比などを含む。
試験スペクトルデータが取得されて処理されると、訓練された固定推定エンジン210を使用して、試験スペクトルデータ内で固定特徴が検出されることができる(ステップ340)。例えば、検出されることができる固定特徴は、ピーク振幅、ピーク位置、ピーク比、スペクトル値の和(特定のスペクトル範囲にわたる積分など)、勾配の1つ以上の変化(一次導関数)または曲率の変化(二次導関数)などである。検出された固定特徴に基づいて、固定持続時間の推定値が計算されることができる(ステップ350)。固定推定エンジン210が固定品質を検出および/または分類するように訓練される実施形態では、固定推定エンジン210はまた、固定品質の推定を提供することができる。
いくつかの実施形態では、訓練された固定推定エンジン210はまた、固定持続時間の推定に使用するのに特に適した、取得されたスペクトル内の1つ以上の帯域および/または波長範囲の識別を出力として提供することができる。
本明細書の実施例1は、固定推定エンジンを訓練し、試験生物学的検体を取得し、試験生物学的検体を処理し、固定持続時間を予測する際に訓練された固定推定エンジンを使用するステップの例を提供する。
実施例1-訓練された固定推定エンジンを使用した固定持続時間の予測
以下に提供される実施例は、本明細書に記載される方法の例示である。
序文
現代の組織学は、組織の生体構造を架橋することによって分子分解の機構を停止することによって組織の生体構造を保存するホルムアルデヒド固定の100年以上前のコーナーストン技術に基づいて構築されている。試料がどの程度完全に固定されるかは、検出されたタンパク質発現および極端な場合には患者の診断に有意に影響を及ぼすことができる。例えば、ASCO/CAPガイドラインは、試料を6~72時間固定することを要求している。現在、臨床診療における組織固定は、実験室特異的であり、非常に多様である。しかしながら、その重要性にもかかわらず、固定品質を測定する分析方法は存在しない。
中間赤外分光法(中間IR)は、組織内の個々の分子の振動状態をプローブする強力な光学技術であり、タンパク質の立体配座状態に非常に敏感である。内因性および外因性材料の存在およびさらには立体配座状態は、生物学的検体の中間IR吸収プロファイルの変化を通じて明らかになるため、この極端な感度は、中間IR分光法を顕微鏡用途に理想的に適合させる。振動分光法は、例えば健常組織と癌性組織とを区別するための診断用途にも使用されている。
固定の正確なメカニズムは、完全には理解されていないが、組織の生体構造内で起こる化学変化と配座変化の複雑な相乗効果である可能性が高い。これらの理由から、生物学的検体の分子組成の変化が中間IRスペクトルの変化に現れるかどうかを調べるための対策が講じられた。最終的な目標は、中間IRスペクトル、およびおそらくその中に含まれる固定シグネチャを使用して、組織試料の固定持続時間および品質を正確に判定するために使用されることができる計測を開発することであった。そのような新規な能力は、標準化された客観的な計測によって組織試料の固定状態を評価する能力を可能にするであろう。
方法および材料
A.実験のデザイン:
中間IR分光法を介して固定状態を追跡することができるかどうかを明確に研究するために、大規模制御研究が設計された。105個の個々の扁桃片を室温の10%中性緩衝ホルマリン(10% NBF)(図8を参照)中で約0、約1、約2、約4、約6、約12、または約24時間のいずれかで別様に固定した。各固定時間内に約12から約16個の扁桃試料を分析した。ホルマリンで固定した後、エタノールの濃度を増加させながら脱水によって全ての組織を日常的に処理し、キシレンで清澄化し、最後にパラフィンワックスに包埋した。
試料は、全て同等に処理されたため、試料間の唯一の違いは、ホルマリン中の時間量、例えば化学固定時間であった。しかしながら、全ての試料がエタノール中で固定されていると考えられることに留意することが重要であるが、エタノールのみでの固定は、日常的な組織学における標準的な実施ではない。制御された化学固定時間に加えて、組織をタンパク質BCL2、ki-67、およびFOXP3に対する抗体で染色した。これは、機能的染色に対する固定時間と固定品質との間の相関の判定を可能にした。本明細書にさらに記載されるように、開発されたデジタル定量プログラムで明視野画像を分析することによって、バイオマーカー発現を定量的に判定した。中間IRスペクトルの試料内変動を説明するために、各パラフィンブロックを二連で切断し、次いで210枚全てのスライドを中間IR顕微鏡でイメージングした。
B.IHC染色手順
免疫組織化学アッセイを、製造元の指示に従って、Ventana Discovery XT自動染色機器で行った。スライドを、EZ PREP溶液(Ventana Medical Systems Inc.)を使用して90℃で脱パラフィンし、全ての試薬およびインキュベーション時間を添付文書に記載されているように選択した。OptiView DAB検出キット(Ventana Medical Systems Inc.)を使用してスライドを展開し、ヘマトキシリンで対比染色した。
C.明視野イメージングおよびイメージング処理
組織切片を、約10%のNBFにおいて種々の時間にわたって別様に固定された組織検体から得られたホルマリン固定パラフィン包埋(FFPE)組織から取得した。4ミクロン切片をBCL2、ki-67およびFOXP3に対する3つの抗体で個々に染色し、DAB染色で発色させた。次いで、染色した全てのスライドを、Ventana HT Scannerでイメージングした。各染色の発現レベルを定量的に判定するために、最初にスライド上の組織をセグメント化し、次いで関心のない組織の領域(例えば、結合組織、間質)を判定する画像分析アルゴリズムを開発した。次いで、組織の活性領域を分析して、所与のタンパク質バイオマーカーについて組織が陽性であるか陰性であるかを判定した。メトリックを陽性率の定量的読み出しに形式化し、所与の抗原に対して陽性であった組織の活性領域の割合を表した。スライドスキャン全体の明視野イメージング技術の概要が図9Aに示されている。図9Bは、3つのマーカーのそれぞれの染色の代表的な領域、および画像分析アルゴリズムが各20X視野をどのように分類したかを示している。
D.中間IRイメージング取得およびデータ処理
別様に固定された扁桃からの同じFFPEブロックを、中間IR適合スライド(Kevley Technologies、low-e MirrIRスライド)上に切片化した。次いで、スライド上の試料を粗にマッピングするために、可視低倍率対物レンズを使用して組織切片全体をイメージングした(図10A)。次に、試料全体の多くの領域を選択して、テルル化カドミウム水銀検出器単一点検出器(v=900~4000cm-1、Δv=8cm-1、平均=16)を使用して中間IR顕微鏡(例えば、Bruker Hyperion 3000)で分光的にイメージングした。中間IRスペクトルの空間的不均一性を緩和するために、各組織全体に位置する約100個の領域をイメージングした(図10A~図10C)。
各点の生の中間IRスペクトルが図10Dに示されている。これらのスペクトルは、全ての中間IR周波数にわたって透過光を測定し、組織が吸収している光の量の測定値を得るために組織を含まないスライドの透過で割ることによって計算された。収集されたスペクトルは、大気効果について補償され(図10E)、次いで、64のベースライン点および約8回の反復による凹状ゴムバンド補正を使用して組織内の散乱を補償するためにベースライン補正された(図10F)。次いで、各スペクトルは、最大値(図10G)に対して振幅正規化され、次いで、所与の組織からの全てのスペクトルをともに平均化することによって各組織からの平均スペクトルが計算されて、各試料のスライドの高品質の代表スペクトルを計算した(図10H)。組織の前処理をBruker Optics Optics Opusソフトウェアで行った。
結果
A.IHC明視野イメージングによる固定完了の評価
このセクションは、3つのバイオマーカーの発現レベル対固定時間の定量的評価を提示し、固定の品質に対するゴールドスタンダード基準として機能する。各固定時間について、12~16個の組織ブロックを各バイオマーカーについて染色し、スライド全体にわたる発現を本明細書に記載の画像分析プログラムで定量化した。BCL2、ki-67、およびFOXP3について、固定時間に対する箱およびひげのプロットの形態の要約結果がそれぞれ図11A~図11Cに表示されている。BCL2およびFOXP3は、それらの発現レベルが固定時間とともに単調に増加することからわかるように、特に不安定であり、不適切な固定を受けやすいことが見出された。一方、ki-67は、生物学的検体をNBF中で少なくとも1時間固定する限り、不適切な固定に対して比較的ロバストであることがわかった。最後に、これらの3つの図が、3つ全てのバイオマーカーについて24時間での最大発現に正規化されたスケールで、各バイオマーカーの平均発現レベル対固定時間を示している図11Dに要約されている。
B.アミドI中間IRバンドおよびIHCの結果に対する固定時間の影響
中間IRスペクトルのアミドIバンドは、タンパク質吸収体の存在だけでなく、タンパク質の立体配座状態(例えば、ベータシート/アルファ-ヘリックス/ランダムコイル)にも非常に敏感であることが文献で十分に確立されている。このため、このスペクトル領域の中間IR吸収を明示的に分析して、固定時間、したがって試料の固定品質と相関する変形を探した。所与の固定時間における全ての試料の平均中間IR吸収が、アミドIバンドのおおよその位置を示して図12Aに表示されている。計算のノイズを最小限に抑えるために、Savitzky-Golay微分を使用して、アミドIバンドの各組織の吸収スペクトルの一次導関数を計算した。平均一次導関数プラスまたはマイナス標準偏差が、斜線領域で示されているように、図12Bにプロットされている。
興味深いことに、固定時間が増加するにつれて、右への明確なシフトがあり、振幅は減少する傾向があり、ピークは広がる傾向がある。バンド変形のこれらのパラメータは、バンドの半値全幅(FWHM)およびピーク位置によって十分に特徴付けられ、これは、全ての中間IRスライドについて図12Cにプロットされている。この図では、固定されていない(例えば、0時間)または完全に固定された(例えば、24時間)試料は、非常に緊密にクラスター化されており、アミドI変形メトリックの再現性の高さを示しているが、他の試料は、より多くのスペクトルに分類される。右下の0時間の試料クラスターとしての固定時間とアミドI変形との間に強い相関があり、固定が起こるにつれて、ピーク位置は、より高い波数にシフトし、FWHMはより広くなる。この観察は、全ての固定時間についての0時間位置からの平均シフトをプロットしている図12Dに取り込まれる。約1時間および約2時間の固定後にバンドの比較的小さなシフトが観察され、約4時間で大きなジャンプが観察されるが、試料が約24時間で完全固定までずっと固定を完了すると、バンドは変形し続けることがわかる。
一次アミドIバンドの分析は、生物学的検体の固定時間とアミドIタンパク質バンドの変形との間の直接的な相関を明らかにした。次に、この発見を3つの異なる癌バイオマーカーのIHC発現と比較して、アミドIシフトも機能的染色データと相関するかどうかを判定した。これを達成するために、0時間の試料からの平均中間IRシフトを、図13A~図13CにおけるBCL2、ki-67およびFOXP3について陽性である各組織のパーセントに対してプロットする。結果は、中間IRアミドIバンドの変形がIHC発現と高度に相関することを確認する。固定時間に感受性であることが見出された2つのマーカー(BCL2およびFOXP3)は、アミドIシフトとIHC発現との間の非常に線形な関係を示す。したがって、予想されるように、ki-67染色は、固定時間/品質と相関しないが、アミドIの変形は相関するため、ロバストなki-67染色からのIHC染色は、アミドIの変形と相関しない。
このセクションは、アミドIバンドの安定した規則的な変形をもたらすホルマリン固定中に生じる組織の生化学的変化があることを確認する。この所見は、固定時間経過実験によって、ならびに中間IRデータを、試料の固定が臨床環境で行われていることによく似た固定依存性バイオマーカーからの関数染色結果と比較することによって確認された。しかしながら、部分的に固定された試料のデータには大きな広がりがあり(例えば、約1~約12時間の固定)、アミドIバンドのシフトのみに基づくメトリックを使用して、固定の程度は、不適切に固定された試料(約1621cm-1未満のアミドIピーク位置および約25cm-1未満のアミドIのFWHM値)および適切に固定された組織試料(約1623cm-1よりも大きいアミドIピーク位置および約35cm-1よりも大きいアミドIのFWHM値)に対して非常に粗に判定されることしかできないこともわかる。固定対非固定のこの粗コース指定であっても、これらの2つの領域の間の試料を正確にまたは大きな信頼度で分類することができないため、精度が低下する。さらに、アミドIメトリックでは、約4、約6、約12、および約24時間のNBF固定を区別することは不可能である。診断試験から、約6~約72時間の固定を必要とするASCO/CAPによる現在のHER2前分析ガイドラインの問題によって示されるように、4時間はしばしば不十分な固定時間であることが知られている。これらの理由から、固定時間を判定するより高感度の方法が必要であった。
C.固定時間を予測する定量的機械学習モデル
固定時間、したがって組織生物学的検体の質を判定するより正確な方法を開発するために、潜在構造回帰(PLSR)アルゴリズムへの投影に基づいて機械学習モデルを開発した。アルゴリズムを訓練するために、別様に固定されたブロックからの210枚のスライド全てをデータベースに入れ、データセットから25%(例えば、52個の組織)を除去して検証セットとして機能させた。試料の残りの75%を使用して、5倍交差検証を使用してモデルを訓練した。最終的なモデルは、各成分によって説明される分散パーセントならびに平均二乗予測誤差(MSPE)に基づいて有効な成分の数を選択することによって調整された。次いで、最終モデルを保持された盲検データセットに適用して、盲検組織スペクトルに対するモデルの精度を判定した。モデル開発の概略フローチャートが図14Bに表示されている。
開発されたモデルを使用して、訓練セットスペクトルならびに盲検ホールドアウトスペクトルを含む210個全ての中間IR組織の固定時間を予測した。結果は、図15Aにプロットされている。図からわかるように、全ての予測された固定時間は、実際のまたは実験的な固定時間に近いと正確に予測される。全ての固定時間にわたって、モデルは、約1.4時間以内に盲検組織の固定時間を予測することができた。これらの驚くべき結果は、機械学習モデルがホルマリン固定の真の分子フィンガープリントを採掘し、それを使用して未知試料の固定時間を平均1.4時間まで正確に予測できることを示している。訓練の固定時間予測のための累積分布関数および検証/ホールドアウトデータが図15Bに表示されている。図から、訓練データセットおよび盲検データセットがほぼ同一のCDF関数を有することがわかるが、これは、モデルが訓練データセット内のノイズまたはスペクトルの基礎となる構造に単に過剰適合していないことを示している。
この手法の1つの大きな利点は、中間IR吸収スペクトルにおいて検出される固定の分子フィンガープリントを調べるためにアルゴリズムを使用することができることである。モデル係数は、図16Aにプロットされており、0よりも有意に大きい値は、NBF固定と正に相関する周波数を表し、0よりも小さい値は、固定と負に関連する波数を表す。予想されるように、1630cm-1付近のアミドIバンドから大きな寄与があるが、いくつかの他の重要なバンドもアルゴリズムの全体的な生産力に寄与する。これらのバンドの数は、波長範囲にわたる中間IRスペクトルに差があることを実証するために図16Bにポッティングされており、これらの差は、人間が固定時間を予測するために分析および使用することが不可能であるにもかかわらず、開発されたモデルは、固定時間の正確な評価を行うために波長範囲全体にわたる情報を使用している。
考察
PCT公開第2017/072320号パンフレット(その開示は、その全体が参照により本明細書に組み込まれる)は、細胞試料の品質状態(固定状態など)を評価する方法を記載している。そこで、試料の中間IRスペクトルが取得され、分類または定量化アルゴリズムがMIRスペクトルに適用されて、品質状態を示す特徴を識別し、および/または試料を分類する。次いで、品質状態が使用されて、試料が分析方法に適しているかどうか、および/または修復処理(さらなる固定など)が適切であるかどうかを判定することができる。
PCT公開第2017/072320号パンフレットは、主成分分析を使用することによって試料が適切に固定されているか固定されていないかを判定するために、中間IR分光法を一般的に使用することができることを実証した。この実施例および本開示は、一般に、試料の実際の固定時間が、個々の組織検体の平均中間IRスペクトルの機械学習モデルに基づいて、未知の組織試料について平均約1.4時間と正確に判定することができることを、100を超える異なる組織片を用いた大規模研究において検証するために、その以前の研究を拡張する。この所見は、BCL2、ki-67およびFOXP3に対する機能的IHC染色の定量的分析によってさらに検証され、これにより、この実験における組織検体の固定の品質を確認した。本開示は、適切な予測機械学習モデルと組み合わせた中間IR分光法を使用して、組織試料の質を評価するための客観的且つ標準化された方法論が可能であることを確立する。
PCT公開第2017/072320号パンフレットは、固定に基づいて中間IRスペクトルの差を見る能力を開示したが、本開示の機能は、複数の振動スペクトルのマイニングに基づいて予測モデルを構築し、定量的精度で実際の固定時間を予測する。PCT公開第2017/072320号パンフレットは、主に、固定されていない組織と完全に固定された組織とを区別するためにのみ使用されることができる(例えば、約0時間対約24時間)ため、これは重要な区別である。ますます不安定になる生体分子(RNA、メチル化状態、リン酸化など)に対してより多くの組織診断アッセイが開発されるにつれて、正確な診断を確実にするために、固定および組織の質に関連するさらにより厳格な品質保証測定が必要になることが想定される。本開示のシステムおよび方法は、この現時点で満たされていない将来の診断の必要性に対処する。
これは、少なくとも約6時間の固定を必要とするHER2 ASCO/CAP固定ガイドラインを見ることによって明確に示されることができると考えられる。したがって、方法は、固定持続時間の予測において著しくより正確であり、本質的に定量的対定性的であり、別の重要な利点を提供する。さらに、これは、固定推定エンジンが多数の組織試料で訓練されているため、適切な予測アルゴリズムと組み合わせた場合に、中間IR信号が固定持続時間を正確に予測することができるというはるかに強力な主張である。実際に、固定推定エンジンは、例えば複数のバイオマーカーの機能的IHC染色を使用して、定量的に検証されたデータについて訓練された。訓練された固定推定エンジンは、訓練された固定推定エンジンが検証訓練セットとして機能することをこれまで見たことがない盲検生物学的検体に作用することが検証された。本明細書で開示されるシステムおよび方法は、使用されるアルゴリズムから関心のある波長が容易に判定されることができるため、この技術の実装をより容易にし、より実用的にし、より安価にすると考えられる。この能力は、重要な波長の正確な識別を可能にし、その結果、それらの波長のみが計算に含まれ、計算時間を高速化する。本開示のシステムおよび方法はまた、ホルマリン固定中に組織検体内で生じる複雑で現在不可解な化学プロセスのより深い研究を可能にすることができる。
実施例2-固定推定エンジンの訓練
一実施形態では、中間IR顕微鏡から取得されたスペクトルを使用して、投影対潜在構造(部分最小二乗回帰でもある)PLSRモデルが訓練される。中間IRスペクトルは、組織全体の約100箇所で収集されるため、平均スペクトルは、組織の平均を表す。全てのスペクトルが大気補正されてCO汚染を除去し、10回の反復および64のベースライン点で凹状ゴムバンド補正を使用してベースライン補正され、次いでスペクトルが振幅正規化された。最後に、各組織からの全てのスペクトルがともに平均化された。次に、PLSR回帰モデルは、データを5つの部分に分割することによって訓練され、これは、5つおきのスペクトルがデータセットから引き出され、モデルの検証のためにのみ使用されたことを意味する。次いで、組織のスペクトルの約80%が使用されて、(一次、二次などの導関数スペクトルとは対照的に)2倍交差検証および生の吸収スペクトルを使用してPLSRモデルを訓練した。いくつかのモデルでは、約2750から約2800および約3700から約4000のスペクトル領域は切り出されなかったが、他のモデルでは、特に微分スペクトルを用いて、その領域が切り出されるかまたは0に設定されることができる。
初期モデルは、訓練セットを分析し、どのスペクトル特徴が各それぞれの組織の既知の固定持続時間と相関するかを判定することによって訓練された。次いで、開発されたモデル使用して既知の試料の固定持続時間を逆投影することによって、訓練セットの精度を調べた。次に、モデルが較正されて、未知の組織または盲検組織で機能する一般化可能なモデルを得た。これは、訓練セットの交差検証中に計算されたモデルの平均二乗予測誤差(MSPE)を分析し、スペクトルの真の固定シグネチャを正確に特徴付けるために必要な成分の数を判定することによって行われた。さらに、応答変数(例えば、この例では「Y」または固定持続時間)および予測変数(例えば、波長による吸収)において説明される分散のパーセントが、モデルにおける成分の数に対してプロットされた(図17Aおよび図17Bを参照)。
適切な数の成分が選択されると、モデルが再訓練され、訓練セットおよび盲検ホールドアウトスペクトルの双方で評価された。この例では、最初の20個の成分を使用してモデルが構築され、その性能が評価された。これは、訓練および検証訓練セットの固定持続時間の誤差(実験的固定持続時間対モデル予測固定持続時間の絶対偏差)を分析することによって行われた。モデルが可能な限り正確であり、盲検データとして一般化可能であることを確実にするために、訓練および検証の累積分布関数(CDF)が分析され、ほぼ同等でなければならない。CDFは、誤差が訓練および予測スペクトル(検証)スペクトルについて同一であったため、モデルが十分に訓練されたことを示す(図17Cを参照)。また、箱ひげプロット(図17Dを参照)から、外れ値の数が非常に少なく、十分に訓練されたモデルの別の重要な成分であることがわかる。モデルの訓練に関与する多数の変数のために、モデルを訓練するプロセスは、訓練経路に沿って任意の変数またはプロセスを調整することがモデルの精度に影響を与えるため、本質的に反復的である。
他のシステム構成要素
本開示のシステム200は、組織検体に対して1つ以上の調製プロセスを実行することができる検体処理装置に結び付けられることができる。調製プロセスは、限定されるものではないが、検体の脱パラフィン、検体のコンディショニング(例えば、細胞コンディショニング)、検体の染色、抗原回収の実行、免疫組織化学染色(標識を含む)または他の反応の実行、および/または原位置ハイブリッド形成(例えば、SISH、FISHなど)染色(標識を含む)または他の反応の実行、ならびに顕微鏡検査、微量分析、質量分析法、または他の分析方法のための検体を調製するための他のプロセスを含むことができる。
処理装置は、検体に固定剤を塗布することができる。固定剤は、架橋剤(例えば、ホルムアルデヒド、パラホルムアルデヒド、およびグルタルアルデヒドなどのアルデヒド、ならびに非アルデヒド架橋剤)、酸化剤(例えば、四酸化オスミウムおよびクロム酸などの金属イオンおよび複合体)、タンパク質変性剤(例えば、酢酸、メタノール、エタノール)、メカニズム不明の固定剤(例えば、塩化水銀、アセトン、およびピクリン酸)、配合試薬(例えば、カルノイ固定剤、メタカーン、ブアン液、B5固定剤)、ロスマンの液体、およびゲンドレの液体、マイクロ波、およびその他の固定剤(例えば、容積固定および蒸気固定を除外)を含むことができる。
検体がパラフィンに埋め込まれた試料である場合、試料は、適切な脱パラフィン液を使用して脱パラフィン化されることができる。パラフィンを除去した後、任意の数の物質が連続して検体に塗布されることができる。物質は、前処理(例えば、タンパク質架橋を逆転させる、細胞の酸を露出させるなど)、変性、ハイブリッド形成、洗浄(例えば、厳密洗浄)、検出(例えば、視覚的またはマーカー分子のプローブへの連結)、増幅(例えば、タンパク質、遺伝子などの増幅)、逆染色、カバースリップなどのためのものとすることができる。
検体処理装置は、検体に幅広い物質を塗布することができる。物質は、これらに限定されるものではないが、染色剤、プローブ、試薬、リンス、および/またはコンディショナを含む。物質は、流体(例えば、気体、液体、または気体/液体混合物)などとすることができる。液体は、溶媒(例えば、極性溶媒、非極性溶媒など)、溶液(例えば、水溶液または他のタイプの溶液)などとすることができる。試薬は、染色剤、湿潤剤、抗体(例えば、モノクローナル抗体、ポリクローナル抗体など)、抗原回収液(例えば、水性または非水性ベースの抗原回収溶液、抗原回収緩衝液など)を含むことができるが、これらに限定されない。プローブは、検出可能な標識またはレポータ分子に付着した、単離された核酸または単離された合成オリゴヌクレオチドとすることができる。標識は、放射性同位元素、酵素基質、補因子、リガンド、化学発光または蛍光剤、ハプテン、および酵素を含むことができる。本明細書で使用される場合、「流体」という用語は、水、溶媒、緩衝液、溶液(例えば、極性溶媒、非極性溶媒)、および/または混合物を含む任意の液体または液体組成物を指す。流体は、水性または非水性であってもよい。流体の非限定的な例は、洗浄液、すすぎ溶液、酸性溶液、アルカリ性溶液、移送溶液、および炭化水素(例えば、アルカン、イソアルカンおよび芳香族化合物、例えばキシレン)を含む。いくつかの実施形態では、洗浄液は、スライドの検体を有する表面上への洗浄液の拡散を容易にするための界面活性剤を含む。いくつかの実施形態では、酸性溶液は、脱イオン水、酸(例えば、酢酸)、および溶媒を含む。いくつかの実施形態では、アルカリ溶液は、脱イオン水、塩基、および溶媒を含む。いくつかの実施形態では、移送溶液は、1つ以上のグリコールエーテル、例えば1つ以上のプロピレン系グリコールエーテル(例えば、プロピレングリコールエーテル、ジ(プロピレングリコール)エーテルおよびトリ(プロピレングリコール)エーテル、エチレン系グリコールエーテル(例えば、エチレングリコールエーテル、ジ(エチレングリコール)エーテルおよびトリ(エチレングリコール)エーテル)およびそれらの官能性類似体を含む。緩衝剤の非限定的な例は、クエン酸、リン酸二水素カリウム、ホウ酸、ジエチルバルビツール酸、ピペラジン-N,N’-ビス(2-エタンスルホン酸)、ジメチルアルシン酸、2-(N-モルホリノ)エタンスルホン酸、トリス(ヒドロキシメチル)メチルアミン(TRIS)、2-(N-モルホリノ)エタンスルホン酸(TAPS)、N,N-ビス(2-ヒドロキシエチル)グリシン(ビシン)、N-トリス(ヒドロキシメチル)メチルグリシン(トリシン)、4-2-ヒドロキシエチル-1-ピペラジンエタンスルホン酸(HEPES)、2-{[トリス(ヒドロキシメチル)メチル]アミノ}エタンスルホン酸(TES)、およびそれらの組み合わせを含む。いくつかの実施形態では、マスキング解除剤は水である。他の実施形態では、緩衝液は、トリス(ヒドロキシメチル)メチルアミン(TRIS)、2-(N-モルホリノ)エタンスルホン酸(TAPS)、N,N-ビス(2-ヒドロキシエチル)グリシン(ビシン)、N-トリス(ヒドロキシメチル)メチルグリシン(トリシン)、4-2-ヒドロキシエチル-1-ピペラジンエタンスルホン酸(HEPES)、2-{[トリス(ヒドロキシメチル)メチル]アミノ}エタンスルホン酸(TES)、またはそれらの組み合わせから構成されることができる。追加の洗浄溶液、移送溶液、酸性溶液、およびアルカリ性溶液は、米国特許出願公開第2016/0282374号明細書に記載されており、その開示は、参照によりその全体が本明細書に組み込まれる。
染色は、組織化学染色モジュールまたは別個のプラットフォーム(例えば、自動化されたIHC/ISHスライド染色装置など)を用いて行われることができる。自動化IHC/ISHスライド染色装置は、典型的には、少なくとも、染色プロトコルで用いられる様々な試薬の貯蔵容器、試薬をスライド上に分配するための貯蔵容器と流体連通した、試薬分配ユニット、スライドから、使用済みの試薬と他の廃棄物を取り除くための、廃棄物除去システム、および、試薬分配ユニットと廃棄物除去システムの作用を調製する制御システムを含む。染色ステップの実施に加えて、多くの自動スライド染色装置はまた、スライドベーキング(試料をスライドに接着させるため)、脱脂(脱パラフィン化ともいう)、抗原回収、対比染色、脱水および透明化、カバーガラス被覆など、染色に付随するステップも行うことができる(または、そのような付随的なステップを実施する別のシステムと互換性がある)。参照によりその全体が本明細書に組み込まれる、Prichard,Overview of Automated Immunohistochemistry,Arch Pathol Lab Med.,Vol.138,pp.1578-1582(2014)は、intelliPATH(Biocare Medical)、WAVE(Celerus Diagnostics)、DAKO OMNISおよびDAKO AUTOSTAINER LINK 48(Agilent Technologies)、BENCHMARK(Ventana Medical Systems,Inc.)、Leica BOND、ならびにLab Vision Autostainer(Thermo Scientific)自動スライド染色装置を含む自動化IHC/ISHスライド染色装置およびそれらの様々な特徴のいくつかの具体的な例を記載している。Ventana Medical Systems,Inc.は、米国特許第5,650,327号明細書、米国特許第5,654,200号明細書、米国特許第6,296,809号明細書、米国特許第6,352,861号明細書、米国特許第6,827,901号明細書および米国特許第6,943,029号明細書、ならびに米国特許出願公開第20030211630号明細書および米国特許出願公開第20040052685号明細書を含む、自動分析を実行するシステムおよび方法を開示する複数の米国特許の譲受人であり、これらのそれぞれは、参照によりその全体が本明細書に組み込まれる。本明細書中で使用される場合、用語「試薬」とは、別の実体と共有結合的または非共有結合的に反応すること、別の実体と結合すること、別の実体と相互作用すること、または別の実体にハイブリダイズすることができる1つ以上の作用物質を含む溶液または懸濁液を指す。そのような作用物質の非限定的な例は、特異的結合実体、抗体(一次抗体、二次抗体、または抗体コンジュゲート)、核酸プローブ、オリゴヌクレオチド配列、検出プローブ、反応性官能基または保護された官能基を有する化学部分、色素分子または染色分子の酵素、溶液または懸濁液を含む。
市販の染色ユニットは、通常、以下のいずれかの原理で動作する:(1)オープン個別スライド染色(open individual slide staining)、ここでは、スライドを水平に配置し、組織試料を含むスライドの表面に試薬を水たまりとして分配する(DAKO AUTOSTAINER Link 48(Agilent Technologies)およびintelliPATH(Biocare Medical)染色装置などで実施される);(2)液体オーバーレイ技術、ここでは、試薬は、試料上に堆積した不活性流体層で覆われるか、それを通って試料に対して分配される(VENTANA BenchMarkおよびDISCOVERY染色装置などで実施される);(3)毛細管ギャップ染色、ここでは、スライド表面を別の表面(別のスライドまたはカバープレートなど)の近くに配置して狭いギャップを作り、これを通って、毛細管力が吸引され、液体試薬が試料と接触し続ける(DAKO TECHMATE、Leica BOND、およびDAKO OMNIS染色装置で使用される染色原理など)。毛細管ギャップ染色を何回か繰り返しても、ギャップ内の流体は混ざらない(例えばDAKO TECHMATEおよびLeica BONDなどにおいて)。ダイナミックギャップ染色と呼ばれる毛細管ギャップ染色のバリエーションでは、毛細管力を利用してスライドに試料を塗布し、その後インキュベーション中に平行表面を互いに対して並進させて試薬を撹拌して試薬混合を行う(例えばDAKO OMNISスライド染色装置(Agilent)に実装されている)。並進ギャップ染色では、並進可能なヘッドがスライドの上に配置される。ヘッドの下面は、スライドの並進中にスライド上の液体から液体のメニスカスが形成されるのを可能にするのに十分な小ささの第1のギャップ分だけ、スライドから間隔が空いている。スライドの幅よりも小さい横寸法を有する混合延長部が、並進可能なヘッドの下面から延在して、混合延長部とスライドとの間の第1のギャップよりも小さい第2のギャップを画定する。ヘッドの並進中、混合延長部の横寸法は、スライド上の液体中に、概ね第2のギャップから第1のギャップに至る方向に横の移動を生じさせるのに十分である。国際公開第2011-139978号パンフレットを参照されたい。最近、スライド上に試薬を付着させるためにインクジェット技術を使用することが提案された。国際公開第2016-170008号パンフレットを参照されたい。染色技術のこの一覧は包括的なものであることを意図しておらず、バイオマーカー染色を実施するための、あらゆる完全または半自動化システムが、組織化学染色プラットフォームに組み込まれることができる。
形態学的に染色された試料も所望される場合、自動化されたH&E染色プラットフォームが使用されることができる。H&E染色を実施するための自動システムは、典型的には、2つの染色原理:バッチ染色(「dip ’n dunk」とも呼ばれる)または個別スライド染色のうちの1つで動作する。バッチ染色装置は、一般に、多くのスライドを同時に浸す試薬バットまたは槽を使用する。一方、個別スライド染色装置は、試薬を各スライドに直接塗布し、同じアリコートの試薬を2枚のスライドで共有することはない。市販のH&E染色装置の例は、RocheのVENTANA SYMPHONY(個別スライド染色装置)およびVENTANA HE 600(個別スライド染色装置)シリーズH&E染色装置;Agilent TechnologiesのDako CoverStainer(バッチ染色装置);Leica Biosystems Nussloch GmbHのLeica ST4020 Small Linear Stainer(バッチ染色装置)、Leica ST5020 Multistainer(バッチ染色装置)、およびLeica ST5010 Autostainer XLシリーズ(バッチ染色装置)H&E染色装置を含む。
検体が染色された後、染色された試料が顕微鏡において手動で分析されることができ、および/または染色された試料のデジタル画像がアーカイブおよび/またはデジタル分析のために取得されることができる。デジタル画像は、20倍、40倍、または他の倍率で染色されたスライドを走査して高解像度全スライドデジタル画像を生成することができるスライドスキャナなどの走査プラットフォームを介して取り込まれることができる。基本的なレベルでは、典型的なスライドスキャナは、少なくとも以下を含む:(1)レンズ対物レンズを備えた顕微鏡、(2)光源(染料に応じて、ハロゲン、発光ダイオード、白色光、および/またはマルチスペクトル光源など)、(3)スライドガラスを移動させるもしくは光学素子をスライドの周りに移動させるまたはその双方のロボット工学、(4)画像取り込み用の1つ以上のデジタルカメラ、(5)ロボット工学を制御し、デジタルスライドを操作、管理、および表示するためのコンピュータおよび関連ソフトウェア。スライド上の複数の異なるX-Y位置(場合によっては複数のZ面)のデジタルデータが、カメラの電荷結合素子(CCD)によって取り込まれ、これらの画像が合わさって、スキャンした面全体の合成画像を形成する。これを実現するための一般的な方法は、以下を含む:
(1)スライドステージまたは光学系を非常に小さな増分で移動させて正方形の画像フレームを取り込み、この画像フレームが隣接する正方形と僅かに重なり合っている、タイルベースのスキャニング。その後、取り込まれた正方形が自動的に互いに照合され、合成画像を作成する。
(2)取得中にスライドステージが単一軸で移動して多数の合成画像「ストリップ」を取り込む線ベースのスキャニング。その後、画像ストリップは、互いに照合され、より大きな合成画像を形成することができる。
様々なスキャナ(蛍光および明視野の双方)の詳細な概要は、Farahani et al.,Whole slide imaging in pathology:advantages,limitations,and emerging perspectives,Pathology and Laboratory Medicine Int’l,Vol.7,p.23-33(2015年6月)に見ることができ、その内容は参照によりその全体が組み込まれる。市販のスライドスキャナの例は、以下を含む:3DHistech PANNORAMIC SCAN II;DigiPath PATHSCOPE;Hamamatsu NANOZOOMER RS,HT,およびXR;Huron TISSUESCOPE 4000,4000XT,およびHS;Leica SCANSCOPE AT,AT2,CS,FL,およびSCN400;Mikroscan D2;Olympus VS120-SL;Omnyx VL4,およびVL120;PerkinElmer LAMINA;Philips ULTRA-FAST SCANNER;Sakura Finetek VISIONTEK;Unic PRECICE 500,およびPRECICE 600x;VENTANA ISCAN COREOおよびISCAN HT;およびZeiss AXIO SCAN.Z1。他の例示的なシステムおよび特徴は、例えば国際公開第2011-049608号パンフレット、またはIMAGING SYSTEMS,CASSETTES,AND METHODS OF USING THE SAMEと題された2011年9月9日出願の米国特許出願第61/533,114号に見出すことができ、それらの内容は、その全体が参照により組み込まれる。
いくつかの実施形態では、任意のイメージングは、米国特許第10,317,666号明細書および第10,313,606号明細書に開示されているシステムのいずれかを使用して達成されることができ、それらの開示は、その全体が参照により本明細書に組み込まれる。イメージング装置は、Ventana Medical Systems,Inc.によって販売されているiScan Coreo(商標)明視野スキャナまたはDP 200スキャナなどの明視野イメージャであってもよい。
場合によっては、画像は、画像分析システムで分析されてもよい。画像分析システムは、本明細書に記載される技術および動作を実行することができる、デスクトップコンピュータ、ノートパソコン、タブレット、スマートフォン、サーバ、特定用途向けコンピュータ装置または任意の他のタイプの電子装置など、1つ以上のコンピュータ装置を含むことができる。いくつかの実施形態では、画像分析システムは、単一の装置として実装されてもよい。他の実施形態では、画像分析システムは、本明細書で論じられる様々な機能性をともに実現する2つ以上の装置の組み合わせとして実装されてもよい。例えば、画像分析システムは、1つ以上のローカルエリアネットワークおよび/またはワイドエリアネットワーク(インターネットなど)を介して互いに通信可能に接続された、1つ以上のサーバコンピュータと1つ以上のクライアントコンピュータとを含むことができる。画像分析システムは、典型的には、少なくともメモリ、プロセッサ、およびディスプレイを含む。メモリは、ランダムアクセスメモリ(RAM)、電気的消去可能プログラマブル読み出し専用メモリ(EEPROM)などの読み出し専用メモリ、フラッシュメモリ、ハードドライブ、ソリッドステートドライブ、光ディスクなど、任意のタイプの揮発性または不揮発性メモリの任意の組み合わせを含むことができる。メモリは、単一の装置に含めることができ、2つ以上の装置にわたって分散させることもできることが理解される。プロセッサは、中央処理装置(CPU)、グラフィック処理装置(GPU)、専用信号または画像プロセッサ、フィールドプログラマブルゲートアレイ(FPGA)、テンソル処理装置(TPU)などの任意のタイプの1つ以上のプロセッサを含むことができる。プロセッサは、単一の装置に含まれてもよく、2つ以上の装置にわたって分散されてもよいことが理解される。ディスプレイは、LCD、LED、OLED、TFT、プラズマなど、任意の適切な技術を使用して実装されることができる。いくつかの実装形態では、ディスプレイは、タッチ感知ディスプレイ(タッチスクリーン)であってもよい。画像分析システムはまた、典型的には、プロセッサ上で実行可能な命令セットを備えるメモリ上に記憶されたソフトウェアシステムを含み、命令は、物体識別、染色強度定量化などの様々な画像分析タスクを含む。本明細書に開示のモジュールを実装するのに有用な、例示的な市販のソフトウェアパッケージは、VENTANA VIRTUOSO;Definiens TISSUE STUDIO、DEVELOPER XD、およびIMAGE MINER;ならびにVisopharm BIOTOPIX、ONCOTOPIX、およびSTEREOTOPIXソフトウェアパッケージを含む。
検体が処理された後、ユーザは、検体を含むスライドをイメージング装置に搬送することができる。いくつかの実施形態では、イメージング装置は、明視野イメージャスライドスキャナである。1つの明視野イメージャは、Ventana Medical Systems,Inc.によって販売されているiScan Coreo明視野スキャナである。自動化された実施形態では、イメージング装置は、IMAGING SYSTEM AND TECHNIQUESと題された、国際特許出願第PCT/US2010/002772号(国際公開第2011/049608号パンフレット)に開示された、または2011年9月9日に出願され、IMAGING SYSTEMS,CASSETTES,AND METHODS OF USING THE SAMEと題された米国特許出願第61/533,114号に開示されたデジタル病理装置である。国際特許出願第PCT/US2010/002772号および米国特許出願第61/533,114号は、参照によりそれらの全体が組み込まれる。
本明細書に記載の主題および動作の実施形態は、デジタル電子回路、または本明細書に開示される構造およびそれらの構造的均等物を含むコンピュータソフトウェア、ファームウェア、またはハードウェア、またはそれらの1つ以上の組み合わせで実装されることができる。本明細書に記載の主題の実施形態は、1つ以上のコンピュータプログラム、例えば、データ処理装置による実行のために、またはデータ処理装置の動作を制御するためにコンピュータ記憶媒体上に符号化されたコンピュータプログラム命令の1つ以上のモジュールとして実装されることができる。本明細書で説明されるモジュールのいずれも、プロセッサによって実行されるロジックを含むことができる。本明細書で使用される「ロジック」は、プロセッサの動作に影響を与えるために適用されることができる命令信号および/またはデータの形態を有する任意の情報を指す。ソフトウェアはロジックの例である。
コンピュータ記憶媒体は、コンピュータ可読記憶装置、コンピュータ可読記憶基板、ランダムまたはシリアルアクセスメモリアレイまたは装置、あるいはそれらの1つ以上の組み合わせとすることができるか、またはそれらに含まれることができる。さらに、コンピュータ記憶媒体は伝搬信号ではないが、コンピュータ記憶媒体は、人工的に生成された伝搬信号に符号化されたコンピュータプログラム命令のソースまたは宛先とすることができる。コンピュータ記憶媒体はまた、1つ以上の別個の物理的構成要素または媒体(例えば、複数のCD、ディスク、または他の記憶装置)とすることができるか、またはそれらに含まれることができる。本明細書に記載されている動作は、1つ以上のコンピュータ可読記憶装置に記憶されているか、または他のソースから受信されたデータに対してデータ処理装置によって実行される動作として実装されることができる。
「プログラムされたプロセッサ」という用語は、データを処理するためのあらゆる種類の装置、装置、およびマシンを包含し、例えば、プログラム可能なマイクロプロセッサ、コンピュータ、チップ上のシステム、または前述の複数のもの、またはそれらの組み合わせを含む。装置は、FPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)などの特別な目的のロジック回路を含むことができる。装置はまた、ハードウェアに加えて、当該コンピュータプログラムの実行環境を作成するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、クロスプラットフォームランタイム環境、仮想マシン、またはそれらの1つ以上の組み合わせを構成するコードを含むことができる。装置および実行環境は、ウェブサービス、分散コンピューティング、グリッドコンピューティングインフラストラクチャなど、様々な異なるコンピューティングモデルインフラストラクチャを実現することができる。
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとも呼ばれる)は、コンパイルまたは解釈された言語、宣言言語または手続き型言語を含む、あらゆる形式のプログラミング言語で記述されることができ、スタンドアロンプログラムとして、またはモジュール、コンポーネント、サブルーチン、オブジェクト、またはコンピューティング環境での使用に適したその他のユニットとして含む、あらゆる形式で展開されることができる。コンピュータプログラムは、ファイルシステム内のファイルに対応することができるが、対応する必要はない。プログラムは、他のプログラムまたはデータを保持するファイルの一部(例えば、マークアップ言語ドキュメントに保存された1つ以上のスクリプト)、当該プログラム専用の単一ファイル、または複数の調整されたファイル(例えば、1つ以上のモジュール、サブプログラム、またはコードの一部を記憶するファイル)に記憶されることができる。コンピュータプログラムは、1台のコンピュータ、または1つのサイトに配置されているか、複数のサイトに分散され、通信ネットワークによって相互接続されている複数のコンピュータで実行されるように展開されることができる。
本明細書に記載のプロセスおよびロジックフローは、1つ以上のコンピュータプログラムを実行する1つ以上のプログラム可能なプロセッサによって実行され、入力データを操作して出力を生成することによってアクションを実行することができる。プロセスおよびロジックフローは、FPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)などの特殊用途のロジック回路によって実行されることもでき、装置は、それらとして実装されることもできる。
コンピュータプログラムの実行に適したプロセッサは、例として、汎用および特殊目的の双方のマイクロプロセッサ、および任意の種類のデジタルコンピュータの任意の1つ以上のプロセッサを含む。一般に、プロセッサは、読み取り専用メモリまたはランダムアクセスメモリ、あるいはその双方から命令とデータを受信する。コンピュータの本質的な要素は、命令に従ってアクションを実行するためのプロセッサと、命令およびデータを記憶するための1つ以上のメモリ装置である。一般に、コンピュータはまた、データを記憶するための1つ以上の大容量記憶装置、例えば、磁気ディスク、光磁気ディスク、または光ディスクを含むか、またはデータを受信するか、データを転送するか、またはその双方に動作可能に結合される。しかしながら、コンピュータは、そのような装置を必要とするわけではない。さらに、コンピュータは、ほんの数例を挙げると、別の装置、例えば、携帯電話、携帯情報端末(PDA)、モバイルオーディオまたはビデオプレーヤ、ゲームコンソール、全地球測位システム(GPS)受信機、またはポータブル記憶装置(例えば、ユニバーサルシリアルバス(USB)フラッシュドライブ)に組み込まれることができる。コンピュータプログラムの命令およびデータを記憶するのに適した装置は、例として半導体メモリ装置、例えば、EPROM、EEPROM、およびフラッシュメモリ装置を含む、全ての形態の不揮発性メモリ、メディアおよびメモリ装置、磁気ディスク、例えば、内蔵ハードディスクまたはリムーバブルディスク、光磁気ディスク、およびCD-ROMおよびDVD-ROMディスクを含む。プロセッサおよびメモリは、特別な目的のロジック回路によって補完され、またはこれに組み込まれることができる。
ユーザとの相互作用を提供するために、本明細書に記載の主題の実施形態は、ディスプレイ装置、例えば、LCD(液晶ディスプレイ)、LED(発光ダイオード)ディスプレイ、またはOLED(有機発光ダイオード)ディスプレイ、ユーザに情報を表示するためのディスプレイ、およびユーザがコンピュータに入力を提供することができる、キーボードおよびポインティング装置、例えば、マウスまたはトラックボールを有するコンピュータ上に実装されることができる。いくつかの実装形態では、タッチスクリーンが使用されて、情報を表示し、ユーザからの入力を受け取ることができる。他の種類の装置が使用されて、ユーザとの対話を提供することもできる。例えば、ユーザに提供されるフィードバックは、視覚的フィードバック、聴覚的フィードバック、または触覚的フィードバックなど、任意の形態の感覚的フィードバックとすることができる。また、ユーザからの入力は、音響、音声、または触覚入力を含む任意の形式で受信されることができる。さらに、コンピュータは、例えば、Webブラウザから受信した要求に応答して、ユーザのクライアント装置上のWebブラウザにWebページを送信することによるなど、ユーザが使用する装置との間でドキュメントを送受信することにより、ユーザと対話することができる。
本明細書に記載される主題の実施形態は、例えば、データサーバとしてのバックエンドコンポーネントを含むか、またはアプリケーションサーバなどのミドルウェアコンポーネントを含むか、または、例えば、ユーザがこの明細書に記載されている主題の実装と対話することができるグラフィカルユーザインタフェースまたはWebブラウザを有するクライアントコンピュータなどのフロントエンドコンポーネント、または1つ以上のそのようなバックエンド、ミドルウェア、またはフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムに実装されることができる。システムのコンポーネントは、デジタルデータ通信の任意の形式または媒体、例えば通信ネットワークによって相互接続されることができる。通信ネットワークの例は、ローカルエリアネットワーク(「LAN」)およびワイドエリアネットワーク(「WAN」)、ネットワーク間(例えば、インターネット)、およびピアツーピアネットワーク(例えば、アドホックピア-ピアツーピアネットワーク)を含む。例えば、図1のネットワーク20は、1つ以上のローカルエリアネットワークを含むことができる。
コンピューティングシステムは、任意の数のクライアントおよびサーバを含むことができる。クライアントおよびサーバは、通常、互いにリモートであり、通常、通信ネットワークを介して相互作用する。クライアントおよびサーバの関係は、それぞれのコンピュータ上で実行され且つクライアント-サーバの関係を互いに有するコンピュータプログラムによって発生する。いくつかの実施形態では、サーバは、(例えば、データを表示し、クライアント装置と対話するユーザからのユーザ入力を受信する目的で)データ(例えば、HTMLページ)をクライアント装置に送信する。クライアント装置で生成されたデータ(例えば、ユーザの操作の結果)は、サーバにおいてクライアント装置から受信されることができる。
バイオマーカーの例
本明細書で述べるように、固定推定エンジンは、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練される。いくつかの実施形態では、既知の固定持続時間のクラスラベルは、機能的IHC試験によって検証される。以下に特定されるのは、その発現が機能的IHC染色によって判定されることができるバイオマーカーの非限定的な例である。特定のマーカーは、特定の細胞の性質である一方、他のマーカーは、特定の疾患または症状に関連付けられたものとして特定される。既知の予後マーカーの例は、例えば、ガラクトシルトランスフェラーゼII、ニューロン特異的エノラーゼ、プロトンATPアーゼ-2および酸性ホスファターゼなどの酵素マーカーを含む。ホルモンまたはホルモン受容体マーカーは、ヒト絨毛性ゴナドトロピン(HCG)、副腎皮質刺激ホルモン、癌胎児性抗原(CEA)、前立腺特異抗原(PSA)、エストロゲン受容体、プロゲステロン受容体、アンドロゲン受容体、gC1q-R/p33補体受容体、IL-2受容体、p75ニューロトロフィン受容体、PTH受容体、甲状腺ホルモン受容体およびインスリン受容体を含む。
リンパ系マーカーは、アルファ-1-抗キモトリプシン、アルファ-1-抗トリプシン、B細胞マーカー、bcl-2、bcl-6、Bリンパ球抗原36kD、BM1(骨髄系マーカー)、BM2(骨髄系マーカー)、ガレクチン-3、グランザイムB、HLAクラスI抗原、HLAクラスII(DP)抗原、HLAクラスII(DQ)抗原、HLAクラスII(DR)抗原、ヒト好中球デフェンシン、免疫グロブリンA、免疫グロブリンD、免疫グロブリンG、免疫グロブリンM、カッパ軽鎖、カッパ軽鎖、ラムダ軽鎖、リンパ球/組織球抗原、マクロファージマーカー、ムラミダーゼ(リゾチーム)、p80未分化リンパ腫キナーゼ、形質細胞マーカー、分泌白血球プロテアーゼ阻害剤、T細胞抗原受容体(JOVI 1)、T細胞抗原受容体(JOVI 3)、ターミドヌクレオチジルトランスフェラーゼ、非クラスター化B細胞マーカーを含む。
腫瘍マーカーは、アルファフェトプロテイン、アポリポタンパク質D、BAG-1(RAP46タンパク質)、CA19-9(シアリルルイス)、CA50(癌腫関連ムチン抗原)、CA125(卵巣癌抗原)、CA242(腫瘍関連ムチン抗原)、クロモグラニンA、クラステリン(アポリポタンパク質J)、上皮膜抗原、上皮関連抗原、上皮特異的抗原、上皮成長因子受容体、エストロゲン受容体(ER)、肉眼的嚢胞性疾患流体タンパク質-15、肝細胞特異的抗原、HER2、ヘレグリン、ヒト胃ムチン、ヒト乳脂肪球、MAGE-1、マトリックスメタロプロテイナーゼ、メランA、メラノーママーカー(HMB45)、メソテリン、メタロチオネイン、微小フタル転写因子(MITF)、Muc-1コア糖タンパク質、Muc-1糖タンパク質、Muc-2糖タンパク質、Muc-5AC糖タンパク質、Muc-6糖タンパク質、ミエロペルオキシダーゼ、Myf-3(横紋筋肉腫マーカー)、Myf-4(横紋筋肉腫マーカー)、MyoD1(横紋筋肉腫マーカー)、ミオグロビン、nm23タンパク質、胎盤アルカリホスファターゼ、プレアルブミン、プロゲステロン受容体、前立腺特異的抗原、前立腺酸性ホスファターゼ、前立腺インヒビンペプチド、PTEN、腎細胞癌マーカー、小腸粘液性抗原、テトラネクチン、甲状腺転写因子-1、マトリックスメタロプロテイナーゼ1の組織阻害剤、マトリックスメタロプロテイナーゼ2の組織阻害剤、チロシナーゼ、チロシナーゼ関連タンパク質-1、ビリン、フォンウィルブランド因子、CD34、CD34、クラスII、CD51 Ab-1、CD63、CD69、Chk1、Chk2、クラスピンC-met、COX6C、CREB、サイクリンD1、サイトケラチン、サイトケラチン8、DAPI、デスミン、DHP(1-6ジフェニル-1,3,5-ヘキサトリエン)、E-カドヘリン、EEA1、EGFR、EGFRvIII、EMA(上皮膜抗原)、ER、ERB3、ERCC1、ERK、E-セレクチン、FAK、フィブロネクチン、FOXP3、ガンマ-H2AX、GB3、GFAP、ジャイアンチン、GM130、Golgin 97、GRB2、GRP78BiP、GSK3ベータ、HER-2、ヒストン3、ヒストン3_K14-エース[抗アセチル-ヒストンH3(Lys 14)]、ヒストン3_K18-エース[ヒストンH3-アセチルLys 18)、ヒストン3_K27-TriMe、[ヒストンH3(トリメチルK27)]、ヒストン3_K4-diMe[アンチジメチル-ヒストンH3(Lys 4)]、ヒストン3_K9-エース[アセチル-ヒストンH3(Lys 9)]、ヒストン3_K9-triMe[ヒストン3-トリメチルLys9]、ヒストン3_S10-Phos[抗Phospho ヒストンH3(Ser 10)、有糸分裂マーカー]、ヒストン4、ヒストンH2A.X-5139-Phos[Phospho ヒストンH2A.X(Ser139)抗体]、ヒストンH2B、ヒストンH3_DiMethyl K4、ヒストンH4_TriMethyl K20-Chip grad、HSP70、ウロキナーゼ、VEGF R1、ICAM-1、IGF-1、IGF-1R、IGF-1レセプタベータ、IGF-II、IGF-IIR、IKB-Alpha IKKE、IL6、IL8、インテグリンアルファVベータ3、インテグリンアルファVベータ6、インテグリンアルファV/CD51、インテグリンB5、インテグリンB6、インテグリンB8、インテグリンベータ1(CD 29)、インテグリンベータ3、インテグリンベータ5インテグリンB6、IRS-1、Jagged 1、抗プロテインキナーゼC Beta2、LAMP-1、ライトチェーンAb-4(カクテル)、ラムダ軽鎖、カッパ軽鎖、M6P、Mach 2、MAPKAPK-2、MEK 1、MEK 1/2(Ps222)、MEK 2、MEK1/2(47E6)、MEK1/2ブロッキングペプチド、MET/HGFR、MGMT、ミトコンドリア抗原、Mitotracker Green FM、MMP-2、MMP9、E-カドヘリン、mTOR、ATPase、N-カドヘリン、ネフリン、NFKB、NFKB p105/p50、NF-KB P65、ノッチ1、ノッチ2、ノッチ3、OxPhos複合体IV、p130Cas、p38 MAPK、p44/42MAPK抗体、P504S、P53、P70、P70 S6K、パンカドヘリン、パキシリン、P-カドヘリン、PDI、pEGFR、ホスホAKT、ホスホCREB、ホスホEGF受容体、ホスホGSK3ベータ、ホスホH3、ホスホHSP-70、ホスホMAPKAPK-2、PHospho MEK1/2、phospho p38 MAPキナーゼ、Phospho p44/42 MAPK、Phospho p53、Phospho PKC、Phospho S6リボソームタンパク質、Phospho Src、Phospho-Akt、Phospho-Bad、Phospho-IKB-a、Phospho-mTOR、Phospho-NF-カッパB P65、Phospho-p38、Phospho-p44/42 MAPK、Phospho-p70 S6キナーゼ、Phospho-Rb、Phospho-Smad2、PIM1,PIM2,PKCβ,ポドカリキシン、PR、PTEN、R1、Rb 4H1、R-カドヘリン、リボヌクレオチドレダクターゼ、RRM1、RRM11、SLC7A5、NDRG、HTF9C、HTF9C、CEACAM、p33、S6リボソームタンパク質、Src、サバイビン、シナポポディン、シンデカン4、タリン、テンシン、チミジル酸シンターゼ、ツベリン、VCAM-1、VEGF、ビメンチン、凝集素、YES、ZAP-70およびZEBを含む。
細胞周期関連マーカーは、アポトーシスプロテアーゼ作動因子-1、bcl-w、bcl-x、ブロモデオキシウリジン、CAK(cdk作動キナーゼ)、細胞アポトーシス感受性タンパク質(CAS)、カスパーゼ2、カスパーゼ8、CPP32(カスパーゼ-3)、CPP32(カスパーゼ-3)、サイクリン依存性キナーゼ、サイクリンA、サイクリンB1、サイクリンD1、サイクリンD2、サイクリンD3、サイクリンE、サイクリンG、DNA断片化因子(N末端)、Fas(CD95)、Fas関連デスドメインタンパク質、Fasリガンド、Fen-1、IPO-38、Mc1-1、ミニ染色体維持タンパク質、ミスマッチ修復タンパク質(MSH2)、ポリ(ADP-リボース)ポリメラーゼ、増殖細胞核抗原、p16タンパク質、p27タンパク質、p34cdc2、p57タンパク質(Kip2)、p105タンパク質、Stat1α、トポイソメラーゼI、トポイソメラーゼIIα、トポイソメラーゼIIIα、トポイソメラーゼIIβを含む。
神経組織マーカーおよび腫瘍マーカーは、αBクリスタリン、α-インターネキシン、αシヌクレイン、アミロイド前駆体タンパク質、βアミロイド、カルビンジン、コリンアセチルトランスフェラーゼ、興奮性アミノ酸輸送体1、GAP43、グリア原線維酸性タンパク質、グルタミン酸受容体2、ミエリン塩基性タンパク質、神経成長因子受容体(gp75)、神経芽細胞腫マーカー、神経線維68 kD、神経線維160 kD、神経線維200 kD、ニューロン特異的エノラーゼ、ニコチン性アセチルコリン受容体アルファ4、ニコチン性アセチルコリン受容体ベータ2、ペリフェリン、タンパク質遺伝子産物9、S-100タンパク質、セロトニン、SNAP-25、シナプシンI、シナプトフィシン、タウ、トリプトファンヒドロキシラーゼ、チロシンヒドロキシラーゼ、ユビキチンを含む。
クラスター分化マーカーは、CD1a、CD1b、CD1c、CD1d、CD1e、CD2、CD3delta、CD3epsilon、CD3gamma、CD4、CD5、CD6、CD7、CD8alpha、CD8beta、CD9、CD10、CD11a、CD11b、CD11c、CDw12、CD13、CD14、CD15、CD15s、CD16a、CD16b、CDw17、CD18、CD19、CD20、CD21、CD22、CD23、CD24、CD25、CD26、CD27、CD28、CD29、CD30、CD31、CD32、CD33、CD34、CD35、CD36、CD37、CD38、CD39、CD40、CD41、CD42a、CD42b、CD42c、CD42d、CD43、CD44、CD44R、CD45、CD46、CD47、CD48、CD49a、CD49b、CD49c、CD49d、CD49e、CD49f、CD50、CD51、CD52、CD53、CD54、CD55、CD56、CD57、CD58、CD59、CDw60、CD61、CD62E、CD62L、CD62P、CD63、CD64、CD65、CD65s、CD66a、CD66b、CD66c、CD66d、CD66e、CD66f、CD68、CD69、CD70、CD71、CD72、CD73、CD74、CDw75、CDw76、CD77、CD79a、CD79b、CD80、CD81、CD82、CD83、CD84、CD85、CD86、CD87、CD88、CD89、CD90、CD91、CDw92、CDw93、CD94、CD95、CD96、CD97、CD98、CD99、CD100、CD101、CD102、CD103、CD104、CD105、CD106、CD107a、CD107b、CDw108、CD109、CD114、CD115、CD116、CD117、CDw119、CD120a、CD120b、CD121a、CDw121b、CD122、CD123、CD124、CDw125、CD126、CD127、CDw128a、CDw128b、CD130、CDw131、CD132、CD134、CD135、CDw136、CDw137、CD138、CD139、CD140a、CD140b、CD141、CD142、CD143、CD144、CDw145、CD146、CD147、CD148、CDw149、CDw150、CD151、CD152、CD153、CD154、CD155、CD156、CD157、CD158a、CD158b、CD161、CD162,CD163,CD164,CD165,CD166,およびTCRゼータを含む。
他の細胞マーカーは、セントロメアタンパク質-F(CENP-F)、ジアンチン、インボルクリン、ラミンA&C[XB 10]、LAP-70、ムチン、核孔複合体タンパク質、p180層状体タンパク質、ran、r、カテプシンD、Ps2タンパク質、Her2-neu、P53、S100、上皮マーカー抗原(EMA)、TdT、MB2、MB3、PCNAおよびKi67を含む。
代替実施形態
本開示の第1の代替的な態様は、少なくとも部分的に固定された試験生物学的検体の推定固定持続時間を定量的に判定するための方法であって、少なくとも部分的に固定された試験生物学的検体から試験スペクトルデータを取得することであって、試験スペクトルデータが、生物学的検体の少なくとも一部から導出される振動スペクトルデータを含む、試験スペクトルデータを取得することと、訓練された固定推定エンジンを使用して、取得された試験スペクトルデータから固定特徴を導出することと、導出された固定特徴に基づいて、少なくとも部分的に固定された生物学的検体の推定固定持続時間を定量的に判定することと、を含む、方法である。いくつかの実施形態では、振動スペクトルデータは、中間赤外(中間IR)スペクトルデータを含む。いくつかの実施形態では、振動スペクトルデータは、ラマンスペクトルデータを含む。いくつかの実施形態では、システムは、訓練された固定推定エンジンを使用して固定品質を推定するための動作をさらに含む。
いくつかの実施形態では、固定推定エンジンは、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練される。いくつかの実施形態では、固定推定エンジンは、1つ以上の訓練スペクトルデータセットを使用して訓練され、各訓練スペクトルデータセットは、複数の差動的に固定された訓練組織試料から導出された複数の訓練振動スペクトルを含み、各訓練振動スペクトルは、既知の固定持続時間のクラスラベルを含む。いくつかの実施形態では、既知の固定持続時間のクラスラベルは、機能的IHC試験によって検証される。いくつかの実施形態では、クラスラベルは、固定品質注釈をさらに含む。
いくつかの実施形態では、各訓練スペクトルデータセットは、以下によって導出される:(i)訓練生物学的検体を取得すること、(ii)取得された訓練生物学的検体を複数の訓練組織試料に分割すること、および(iii)複数の訓練組織試料の各訓練組織試料を異なる所定の時間量にわたって固定すること。いくつかの実施形態では、異なる所定の時間量は、約0時間から約24時間の範囲である。いくつかの実施形態では、異なる所定の時間量は、約0時間から約12時間の範囲である。
いくつかの実施形態では、試験スペクトルデータは、複数の正規化および補正された振動スペクトルから導出された平均振動スペクトルを含む。いくつかの実施形態では、複数の正規化および補正された振動スペクトルは、以下によって取得される:(i)前記試験生物学的検体内の複数の空間領域を識別すること、(ii)前記複数の識別された領域の各個々の領域から振動スペクトルを取得すること、(iii)各個々の領域からの前記取得された振動スペクトルを補正し、各個々の領域ごとに補正された振動スペクトルを提供すること、および(iv)各個々の領域からの前記補正された振動スペクトルを所定の大域最大値に振幅正規化し、各領域の振幅正規化振動スペクトルを提供すること。いくつかの実施形態では、各個々の領域から取得された振動スペクトルは、以下によって補正される:(i)取得された各振動スペクトルを大気効果について補償して、大気補正振動スペクトルを提供すること、および(ii)散乱について大気補正振動スペクトルを補償すること。いくつかの実施形態では、領域はランダムに選択される。
いくつかの実施形態では、訓練された固定状態推定エンジンは、次元縮小に基づく機械学習アルゴリズムを含む。いくつかの実施形態では、次元縮小は、潜在構造回帰モデルへの投影を含む。いくつかの実施形態では、次元縮小は、主成分分析、および任意に判別分析を含む。いくつかの実施形態では、訓練された固定状態推定エンジンは、ニューラルネットワークを含む。
いくつかの実施形態では、方法は、生物学的検体が、1つ以上の特異的結合実体による標識に適した固定状態を含むかどうかを評価することをさらに含む。いくつかの実施形態では、方法は、生物学的検体固定と正に関連付けられた試験データ内の少なくとも1つのスペクトル帯域を識別することをさらに含む。
本開示の第2の代替的な態様では、少なくとも部分的に固定された試験生物学的検体の推定固定持続時間を判定するためのシステムであって、(i)1つ以上のプロセッサと、(ii)1つ以上のプロセッサに結合された1つ以上のメモリであって、1つ以上のメモリが、コンピュータ実行可能命令を記憶し、コンピュータ実行可能命令は、1つ以上のプロセッサによって実行されると、試験生物学的検体から試験スペクトルデータを取得することであって、試験スペクトルデータが、生物学的検体の少なくとも一部から導出される振動スペクトルデータを含む、試験スペクトルデータを取得することと、訓練された固定推定エンジンを使用して取得された試験スペクトルデータから固定特徴を導出することであって、固定推定エンジンが、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練され、訓練スペクトルデータセットが、少なくとも既知の固定持続時間のクラスラベルを含む、、固定特徴を導出することと、導出された固定特徴に基づいて、少なくとも部分的に固定された生物学的検体の推定固定期間を定量的に判定することと、を含む動作をシステムに実行させる、1つ以上のメモリと、を備える、システムである。いくつかの実施形態では、固定推定エンジンの訓練中に使用される既知の固定持続時間のクラスラベルは、機能的IHC試験によって検証される。いくつかの実施形態では、試験生物学的検体は染色されていない。いくつかの実施形態では、試験生物学的検体は、1つ以上のバイオマーカーの存在について染色される。
いくつかの実施形態では、各訓練スペクトルデータセットは、以下によって導出される:(i)訓練生物学的検体を取得すること、(ii)取得された訓練生物学的検体を複数の訓練組織試料に分割すること、および(iii)複数の訓練組織試料の各訓練組織試料を異なる所定の時間量にわたって固定すること。いくつかの実施形態では、訓練生物学的検体は、試験生物学的検体と同じ組織タイプを含む。いくつかの実施形態では、訓練生物学的検体は、試験生物学的検体とは異なる組織タイプを含む。いくつかの実施形態では、訓練された固定状態推定エンジンは、次元縮小に基づく機械学習アルゴリズムを含む。いくつかの実施形態では、次元縮小は、潜在構造回帰モデルへの投影を含む。いくつかの実施形態では、次元縮小は、主成分分析を含む。いくつかの実施形態では、訓練された固定状態推定エンジンは、ニューラルネットワークを含む。
本開示の第3の代替的な態様は、少なくとも部分的に固定された試験生物学的検体の固定状態を予測するためのシステムであって、(i)1つ以上のプロセッサと、(ii)1つ以上のプロセッサに結合された1つ以上のメモリであって、1つ以上のメモリが、コンピュータ実行可能命令を記憶し、コンピュータ実行可能命令は、1つ以上のプロセッサによって実行されると、少なくとも部分的に固定された試験生物学的検体から試験スペクトルデータを取得することであって、試験スペクトルデータが、生物学的検体の少なくとも一部から導出される振動スペクトルデータを含む、試験スペクトルデータを取得することと、訓練された固定推定エンジンを使用して、取得された試験スペクトルデータから1つ以上の固定特徴を導出することと、導出された1つ以上の固定特徴に基づいて、少なくとも部分的に固定された生物学的検体の推定固定状態を定量的に判定することと、を含む動作をシステムに実行させる、1つ以上のメモリと、を備える、システムである。いくつかの実施形態では、固定状態は、固定持続時間である。いくつかの実施形態では、固定状態は、固定品質の定性的推定値である。いくつかの実施形態では、方法は、生物学的検体が、1つ以上の特異的結合実体による標識に適した固定状態を含むかどうかを評価することをさらに含む。いくつかの実施形態では、方法は、生物学的検体固定と正に関連付けられた試験データ内の少なくとも1つのスペクトル帯域を識別することをさらに含む。
いくつかの実施形態では、固定推定エンジンは、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練される。いくつかの実施形態では、訓練スペクトルデータセットは、機能的IHC試験によって判定された既知の固定持続時間などの既知の固定持続時間のクラスラベルを含む。いくつかの実施形態では、訓練スペクトルデータセットは、固定品質のクラスラベルをさらに含む。
いくつかの実施形態では、少なくとも2つの訓練振動スペクトルは、複数の訓練生物学的検体の各個々の訓練生物学的検体から取得され、少なくとも2つの試料振動スペクトルは、個々の訓練生物学的検体の異なる部分から取得される。いくつかの実施形態では、個々の訓練生物学的検体の少なくとも2つの異なる部分は、それぞれ異なる所定の時間量にわたって1つ以上の固定剤で処理される。いくつかの実施形態では、異なる所定の時間量は、約0時間から約24時間の範囲である。いくつかの実施形態では、異なる所定の時間量は、約0時間から約12時間の範囲である。いくつかの実施形態では、少なくとも2つの訓練振動スペクトルは、それぞれ、複数の正規化および補正された訓練振動スペクトルから導出された平均振動スペクトルである。
いくつかの実施形態では、試験スペクトルデータは、少なくともアミドIバンドの中間IRスペクトル情報を含む。いくつかの実施形態では、試験スペクトルデータは、約3200から約3400cm-1、約2800から約2900cm-1、約1020から約1100cm-1、および/または約1520から約1580cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、試験生物学的検体は染色されていない。いくつかの実施形態では、試験生物学的検体は、1つ以上のバイオマーカーの存在について染色される。
いくつかの実施形態では、訓練された固定状態推定エンジンは、次元縮小に基づく機械学習アルゴリズムを含む。いくつかの実施形態では、次元縮小は、潜在構造回帰モデルへの投影を含む。いくつかの実施形態では、次元縮小は、主成分分析を含む。いくつかの実施形態では、訓練された固定状態推定エンジンは、ニューラルネットワークを含む。
本明細書中で言及されるおよび/または出願データシートにおいてリスト化される全ての米国特許、米国特許出願公開、米国特許出願、外国特許、外国特許出願、および非特許刊行物は、参照によりそれらの全体が本明細書に組み込まれる。実施形態の態様は、必要に応じて、様々な特許、出願、および刊行物の概念を使用してさらに別の実施形態を提供するように変更されることができる。
本開示は、いくつかの例示的な実施形態を参照して説明されてきたが、本開示の原理の精神および範囲内に含まれるであろう多くの他の変更および実施形態が当業者によって考案されることができることを理解されたい。より具体的には、合理的な変形および変更は、本開示の精神から逸脱することなく、前述の開示、図面、および添付の特許請求の範囲内の主題の組み合わせ構成の構成部品および/または配置において可能である。構成部品および/または配置の変形および変更に加えて、代替の使用法も当業者にとって明らかであろう。

Claims (50)

  1. 少なくとも部分的に固定された試験生物学的検体の推定固定持続時間を定量的に判定するためのシステム(200)であって、(i)1つ以上のプロセッサ(209)と、(ii)前記1つ以上のプロセッサ(209)に結合された1つ以上のメモリ(201)であって、前記1つ以上のメモリ(201)がコンピュータ実行可能命令を記憶し、前記コンピュータ実行可能命令は、前記1つ以上のプロセッサ(209)によって実行されると、前記システム(200)に、
    a.少なくとも部分的に固定された前記試験生物学的検体から試験スペクトルデータを取得することであって、前記取得された試験スペクトルデータが、前記生物学的検体の少なくとも一部から導出された振動スペクトルデータを含む、試験スペクトルデータを取得することと、
    b.訓練された固定推定エンジン(210)を使用して、前記取得された試験スペクトルデータから固定特徴を導出することと、
    c.前記導出された固定特徴に基づいて、前記少なくとも部分的に固定された生物学的検体の前記推定固定持続時間を定量的に判定することと、を含む動作を実行させる、1つ以上のメモリと、を備える、システム。
  2. 前記訓練された固定推定エンジン(210)を使用して固定品質を推定するための動作をさらに含む、請求項1に記載のシステム。
  3. 前記固定推定エンジン(210)が、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練される、請求項1または2に記載のシステム。
  4. 前記固定推定エンジン(210)が、1つ以上の訓練スペクトルデータセットを使用して訓練され、各訓練スペクトルデータセットが、複数の別様に固定された訓練組織試料から導出された複数の訓練振動スペクトルを含み、各訓練振動スペクトルが、既知の固定持続時間のクラスラベルを含む、請求項1または2に記載のシステム。
  5. 既知の固定持続時間の前記クラスラベルが、機能的IHC試験によって検証される、請求項4に記載のシステム。
  6. 前記クラスラベルが、固定品質注釈をさらに含む、請求項4または5に記載のシステム。
  7. 各訓練スペクトルデータセットが、(i)訓練生物学的検体を取得すること、(ii)取得された前記訓練生物学的検体を複数の訓練組織試料に分割すること、および(iii)前記複数の訓練組織試料の各訓練組織試料を異なる所定の時間量にわたって固定すること、によって導出される、請求項4から6のいずれか一項に記載のシステム。
  8. 前記異なる所定の時間量が、約0時間から約24時間の範囲である、請求項7に記載のシステム。
  9. 前記異なる所定の時間量が、約0時間から約12時間の範囲である、請求項7に記載のシステム。
  10. 前記取得された試験スペクトルデータが、複数の正規化および補正された振動スペクトルから導出された平均振動スペクトルを含む、請求項1から9のいずれか一項に記載のシステム。
  11. 前記複数の正規化および補正された振動スペクトルが、(i)前記試験生物学的検体内の複数の空間領域を識別すること、(ii)前記複数の識別された領域の各個々の領域から振動スペクトルを取得すること、(iii)各個々の領域からの前記取得された振動スペクトルを補正し、各個々の領域ごとに補正された振動スペクトルを提供すること、および(iv)各個々の領域からの前記補正された振動スペクトルを所定の大域最大値に振幅正規化し、各領域の振幅正規化振動スペクトルを提供すること、によって取得される、請求項10に記載のシステム。
  12. 各個々の領域からの前記取得された振動スペクトルが、(i)取得された各振動スペクトルを大気効果について補償して、大気補正振動スペクトルを提供すること、および(ii)散乱について前記大気補正振動スペクトルを補償すること、によって補正される、請求項11に記載のシステム。
  13. 前記領域がランダムに選択される、請求項11に記載のシステム。
  14. 前記訓練された固定状態推定エンジン(210)が、次元縮小に基づく機械学習アルゴリズムを含む、請求項1から13のいずれか一項に記載のシステム。
  15. 前記次元縮小が、潜在構造回帰モデルへの投影を含む、請求項14に記載のシステム。
  16. 前記次元縮小が、主成分分析、および任意に判別分析を含む、請求項14に記載のシステム。
  17. 前記訓練された固定状態推定エンジン(210)がニューラルネットワークを含む、請求項1から13のいずれか一項に記載のシステム。
  18. 少なくとも部分的に固定された試験生物学的検体の推定固定持続時間を判定するための命令を記憶する非一時的コンピュータ可読媒体であって、前記推定固定持続時間を判定することが、
    (a)前記試験生物学的検体から試験スペクトルデータを取得することであって、前記取得された試験スペクトルデータが、前記生物学的検体の少なくとも一部から導出された振動スペクトルデータを含む、試験スペクトルデータを取得することと、
    (b)訓練された固定推定エンジンを使用して、前記取得された試験スペクトルデータから固定特徴を導出することであって、前記固定推定エンジンが、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練され、前記訓練スペクトルデータセットが、少なくとも既知の固定持続時間のクラスラベルを含む、固定特徴を導出することと、
    (c)前記導出された固定特徴に基づいて、前記少なくとも部分的に固定された生物学的検体の推定固定持続時間を定量的に判定することと、を含む、非一時的コンピュータ可読媒体。
  19. 既知の固定持続時間の前記クラスラベルが、機能的IHC試験によって検証される、請求項18に記載の非一時的コンピュータ可読媒体。
  20. 前記クラスラベルが、固定品質注釈をさらに含む、請求項18または19に記載の非一時的コンピュータ可読媒体。
  21. 前記訓練された固定推定エンジンを使用して固定品質を推定するための動作をさらに含む、請求項20に記載の非一時的コンピュータ可読媒体。
  22. 各訓練スペクトルデータセットが、(i)訓練生物学的検体を取得すること、(ii)取得された前記訓練生物学的検体を複数の訓練組織試料に分割すること、および(iii)前記複数の訓練組織試料の各訓練組織試料を異なる所定の時間量にわたって固定すること、によって導出される、請求項18から21のいずれか一項に記載の非一時的コンピュータ可読媒体。
  23. 前記訓練生物学的検体が、前記試験生物学的検体と同じ組織タイプを含む、請求項18から22のいずれか一項に記載の非一時的コンピュータ可読媒体。
  24. 前記訓練生物学的検体が、前記試験生物学的検体とは異なる組織タイプを含む、請求項18から23のいずれか一項に記載の非一時的コンピュータ可読媒体。
  25. 前記訓練された固定状態推定エンジンが、次元縮小に基づく機械学習アルゴリズムを含む、請求項18から24のいずれか一項に記載の非一時的コンピュータ可読媒体。
  26. 前記次元縮小が、潜在構造回帰モデルへの投影を含む、請求項25に記載の非一時的コンピュータ可読媒体。
  27. 前記次元縮小が、主成分分析を含む、請求項25に記載の非一時的コンピュータ可読媒体。
  28. 前記訓練された固定状態推定エンジンがニューラルネットワークを含む、請求項18から24のいずれか一項に記載の非一時的コンピュータ可読媒体。
  29. 少なくとも部分的に固定された試験生物学的検体の固定状態を予測する方法であって、
    (a)少なくとも部分的に固定された前記試験生物学的検体(320)から試験スペクトルデータを取得することであって、前記取得された試験スペクトルデータが、前記生物学的検体の少なくとも一部から導出された振動スペクトルデータを含む、試験スペクトルデータを取得することと、
    (b)訓練された固定推定エンジンを使用して、前記取得された試験スペクトルデータから固定特徴(340)を導出することであって、前記固定推定エンジンが、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練される、固定特徴を導出することと、
    (c)前記導出された固定特徴に基づいて、前記少なくとも部分的に固定された生物学的検体の推定固定状態(350)を定量的に判定することと、を含む、方法。
  30. 前記訓練スペクトルデータセットが、既知の固定持続時間のクラスラベルを含む、請求項29に記載の方法。
  31. 前記訓練スペクトルデータセットが、既知の固定品質の注釈を含むクラスラベルをさらに含む、請求項30に記載の方法。
  32. 前記訓練された固定推定エンジンを使用して固定品質を推定することをさらに含む、請求項31に記載の方法。
  33. 少なくとも2つの訓練振動スペクトルが、複数の前記訓練生物学的検体の各個々の訓練生物学的検体から取得され、前記少なくとも2つの試料振動スペクトルが、前記個々の訓練生物学的検体の異なる部分から取得される、請求項29から32のいずれか一項に記載の方法。
  34. 前記個々の訓練生物学的検体の少なくとも2つの前記異なる部分が、それぞれ異なる所定の時間量にわたって固定剤で処理される、請求項33に記載の方法。
  35. 前記異なる所定の時間量が、約0時間から約24時間の範囲である、請求項34に記載の方法。
  36. 前記異なる所定の時間量が、約0時間から約12時間の範囲である、請求項35に記載の方法。
  37. 前記少なくとも2つの訓練振動スペクトルが、それぞれ、複数の正規化および補正された訓練振動スペクトルから導出された平均振動スペクトルである、請求項33に記載の方法。
  38. 前記生物学的検体が、1つ以上の特異的結合実体による標識に適した固定状態を含むかどうかを評価することをさらに含む、請求項29から37のいずれか一項に記載の方法。
  39. 生物学的検体固定と正に関連付けられた試験データ内の少なくとも1つのスペクトル帯域を識別することをさらに含む、請求項29から38のいずれか一項に記載の方法。
  40. 前記取得された試験スペクトルデータが、少なくともアミドIバンドの中間IRスペクトル情報を含む、請求項29から39のいずれか一項に記載の方法。
  41. 前記取得された試験スペクトルデータが、約3200から約3400cm-1、約2800から約2900cm-1、約1020から約1100cm-1、および/または約1520から約1580cm-1の範囲の波長の振動スペクトル情報を含む、請求項29から40のいずれか一項に記載の方法。
  42. 前記試験生物学的検体が染色されていない、請求項29から41のいずれか一項に記載の方法。
  43. 前記訓練された固定状態推定エンジンが、次元縮小に基づく機械学習アルゴリズムを含む、請求項29から42のいずれか一項に記載の方法。
  44. 前記次元縮小が、潜在構造回帰モデルへの投影を含む、請求項43に記載の方法。
  45. 前記次元縮小が、主成分分析を含む、請求項43に記載の方法。
  46. 前記訓練された固定状態推定エンジンがニューラルネットワークを含む、請求項29から42のいずれか一項に記載の方法。
  47. 前記固定推定エンジンが、中間IRスペクトルデータを使用して訓練される、請求項29から46のいずれか一項に記載の方法。
  48. 前記固定推定エンジンが、ラマンスペクトルデータを使用して訓練される、請求項29から46のいずれか一項に記載の方法。
  49. 前記試験生物学的検体が、1つ以上のバイオマーカーの存在について染色される、請求項29から48のいずれか一項に記載の方法。
  50. 前記1つ以上のバイオマーカーが癌バイオマーカーを含む、請求項49に記載の方法。
JP2022513273A 2019-08-28 2020-08-26 振動分光法を使用して検体固定の持続時間および品質を評価するためのシステムおよび方法 Pending JP2022546058A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962892678P 2019-08-28 2019-08-28
US62/892,678 2019-08-28
PCT/EP2020/073787 WO2021037875A1 (en) 2019-08-28 2020-08-26 Systems and methods for assessing specimen fixation duration and quality using vibrational spectroscopy

Publications (1)

Publication Number Publication Date
JP2022546058A true JP2022546058A (ja) 2022-11-02

Family

ID=72517209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022513273A Pending JP2022546058A (ja) 2019-08-28 2020-08-26 振動分光法を使用して検体固定の持続時間および品質を評価するためのシステムおよび方法

Country Status (5)

Country Link
US (1) US20220136971A1 (ja)
EP (1) EP4022287A1 (ja)
JP (1) JP2022546058A (ja)
CN (1) CN114341989A (ja)
WO (1) WO2021037875A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11694810B2 (en) * 2020-02-12 2023-07-04 MDI Health Technologies Ltd Systems and methods for computing risk of predicted medical outcomes in patients treated with multiple medications

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5595707A (en) 1990-03-02 1997-01-21 Ventana Medical Systems, Inc. Automated biological reaction apparatus
US6894639B1 (en) 1991-12-18 2005-05-17 Raytheon Company Generalized hebbian learning for principal component analysis and automatic target recognition, systems and method
US20030211630A1 (en) 1998-02-27 2003-11-13 Ventana Medical Systems, Inc. Automated molecular pathology apparatus having independent slide heaters
US6582962B1 (en) 1998-02-27 2003-06-24 Ventana Medical Systems, Inc. Automated molecular pathology apparatus having independent slide heaters
DE69942975D1 (de) 1998-02-27 2011-01-05 Ventana Med Syst Inc Automatisierter molekularer pathologieapparat mit unabhängigen objektträgerwärmern
US6693280B2 (en) 2001-08-03 2004-02-17 Sensir Technologies, L.L.C. Mid-infrared spectrometer attachment to light microscopes
US7280576B2 (en) 2001-09-11 2007-10-09 Qinetiq Limited Type II mid-infrared quantum well laser
WO2005020044A1 (en) 2003-08-26 2005-03-03 The Trustees Of Columbia University In The City Of New York Innervated stochastic controller for real time business decision-making support
KR100543707B1 (ko) 2003-12-04 2006-01-20 삼성전자주식회사 서브그룹별 pca 학습을 이용한 얼굴인식방법 및 장치
US8170841B2 (en) 2004-04-16 2012-05-01 Knowledgebase Marketing, Inc. Predictive model validation
US7519253B2 (en) 2005-11-18 2009-04-14 Omni Sciences, Inc. Broadband or mid-infrared fiber light sources
US8036252B2 (en) 2008-06-03 2011-10-11 The Regents Of The University Of Michigan Mid-infrared fiber laser using cascaded Raman wavelength shifting
KR101423896B1 (ko) 2009-10-19 2014-07-28 벤타나 메디컬 시스템즈, 인코포레이티드 슬라이드 캐싱을 위한 디바이스 및 방법
WO2011139978A1 (en) 2010-05-04 2011-11-10 Ventana Medical Systems, Inc. Moving meniscus rinsing and mixing in cell staining
JP5455787B2 (ja) 2010-05-27 2014-03-26 パナソニック株式会社 動作解析装置および動作解析方法
US20140336942A1 (en) 2012-12-10 2014-11-13 The Trustees Of Columbia University In The City Of New York Analyzing High Dimensional Single Cell Data Using the T-Distributed Stochastic Neighbor Embedding Algorithm
US9046650B2 (en) 2013-03-12 2015-06-02 The Massachusetts Institute Of Technology Methods and apparatus for mid-infrared sensing
US20140279734A1 (en) 2013-03-15 2014-09-18 Hewlett-Packard Development Company, L.P. Performing Cross-Validation Using Non-Randomly Selected Cases
WO2015086534A1 (en) 2013-12-13 2015-06-18 Ventana Medical Systems, Inc. Staining reagents and other liquids for histological processing of biological specimens and associated technology
GB201409202D0 (en) 2014-05-23 2014-07-09 Ffei Ltd Improvements in imaging microscope samples
GB201409203D0 (en) 2014-05-23 2014-07-09 Ffei Ltd Improvements in digitising slides
US10289962B2 (en) 2014-06-06 2019-05-14 Google Llc Training distilled machine learning models
US11300773B2 (en) 2014-09-29 2022-04-12 Agilent Technologies, Inc. Mid-infrared scanning system
EP3218843B1 (en) 2014-11-10 2024-04-24 Ventana Medical Systems, Inc. Classifying nuclei in histology images
US20160132786A1 (en) 2014-11-12 2016-05-12 Alexandru Balan Partitioning data for training machine-learning classifiers
EP3075496B1 (en) 2015-04-02 2022-05-04 Honda Research Institute Europe GmbH Method for improving operation of a robot
EP3286543B1 (en) 2015-04-20 2023-03-29 Ventana Medical Systems, Inc. Inkjet deposition of reagents for histological samples
CA3001763C (en) 2015-10-28 2020-10-27 Ventana Medical Systems, Inc. Methods and systems for analyzing tissue quality using mid-infrared spectroscopy
CA2945462C (en) 2016-10-14 2023-06-13 Universite Laval Mid-infrared laser system, mid-infrared optical amplifier, and method of operating a mid-infrared laser system
JP6787770B2 (ja) 2016-12-14 2020-11-18 東京都公立大学法人 言語記憶方法及び言語対話システム
US10963783B2 (en) 2017-02-19 2021-03-30 Intel Corporation Technologies for optimized machine learning training
US10692000B2 (en) 2017-03-20 2020-06-23 Sap Se Training machine learning models
US20190102675A1 (en) 2017-09-29 2019-04-04 Coupa Software Incorporated Generating and training machine learning systems using stored training datasets
US10853493B2 (en) 2017-10-09 2020-12-01 Raytheon Bbn Technologies Corp Enhanced vector-based identification of circuit trojans

Also Published As

Publication number Publication date
EP4022287A1 (en) 2022-07-06
US20220136971A1 (en) 2022-05-05
WO2021037875A1 (en) 2021-03-04
CN114341989A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
US10628658B2 (en) Classifying nuclei in histology images
US11430131B2 (en) Foreground segmentation and nucleus ranking for scoring dual ISH images
US11922681B2 (en) Systems and methods for identifying cell clusters within images of stained biological samples
US11842483B2 (en) Systems for cell shape estimation
Swiderska-Chadaj et al. Impact of rescanning and normalization on convolutional neural network performance in multi-center, whole-slide classification of prostate cancer
US10621412B2 (en) Dot detection, color classification of dots and counting of color classified dots
JP2022084796A (ja) 画像処理のための自動アッセイ評価および正規化
US20220146418A1 (en) Label-free assessment of biomarker expression with vibrational spectroscopy
US20220223230A1 (en) Assessing antigen retrieval and target retrieval progression with vibrational spectroscopy
US20220136971A1 (en) Systems and methods for assessing specimen fixation duration and quality using vibrational spectroscopy
US20240077456A1 (en) Real-time prediction of tissue fixation time

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230828

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240229

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240604