JP2022546430A - 振動分光法によるバイオマーカー発現の無標識評価 - Google Patents

振動分光法によるバイオマーカー発現の無標識評価 Download PDF

Info

Publication number
JP2022546430A
JP2022546430A JP2022513240A JP2022513240A JP2022546430A JP 2022546430 A JP2022546430 A JP 2022546430A JP 2022513240 A JP2022513240 A JP 2022513240A JP 2022513240 A JP2022513240 A JP 2022513240A JP 2022546430 A JP2022546430 A JP 2022546430A
Authority
JP
Japan
Prior art keywords
training
biomarkers
biological specimen
test
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022513240A
Other languages
English (en)
Inventor
バウアー,ダニエル
Original Assignee
ベンタナ メディカル システムズ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ベンタナ メディカル システムズ, インコーポレイテッド filed Critical ベンタナ メディカル システムズ, インコーポレイテッド
Publication of JP2022546430A publication Critical patent/JP2022546430A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3577Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/695Preprocessing, e.g. image segmentation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods
    • G01N2201/1296Using chemometrical methods using neural networks

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biochemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本開示は、生物学的検体の試料中の1つ以上のバイオマーカーの発現を予測するための自動化されたシステムおよび方法に関する。いくつかの実施形態では、試料は、未知の固定状態を有する試料、または試料が対象とした固定期間が未知の試料である。いくつかの実施形態では、予測される発現は、1つ以上のバイオマーカーの陽性率の定量的推定である。他の実施形態では、予測される発現は、1つ以上のバイオマーカーの染色強度の定量的推定である。いくつかの実施形態では、システムおよび方法は、複数の訓練試料によって訓練された訓練されたバイオマーカー発現推定エンジンを利用し、訓練されたバイオマーカー発現推定エンジンは、試料からバイオマーカー発現特徴を導出するように適合される。いくつかの実施形態では、訓練されたバイオマーカー発現推定エンジンは、潜在構造回帰モデルへの投影に基づく機械学習アルゴリズムを備える。いくつかの実施形態では、訓練されたバイオマーカー発現推定エンジンは、ニューラルネットワークを含む。【選択図】図2

Description

関連出願の相互参照
本出願は、2019年8月28日に出願された米国特許出願第62/892,680号の出願日の利益を主張し、その開示は、その全体が参照により本明細書に組み込まれる。
疾患生物から採取された組織または細胞試料の解釈に基づく疾患の診断は、過去数年にわたって劇的に拡大してきた。伝統的な組織学的染色技術および免疫組織化学(IHC)アッセイに加えて、現在、インサイチュハイブリダイゼーション(ISH)およびインサイチュポリメラーゼ連鎖反応などのインサイチュ技術が、ヒトにおける疾患状態の診断を助け、組織切片における遺伝子発現部位を解明するために使用されている。したがって、細胞形態だけでなく、細胞および組織内の特定の分子(例えば、DNA、RNAおよびタンパク質)の存在も評価することができる様々な技術が存在する。これらの技術のそれぞれは、試料細胞または組織が、試料をアルデヒド(ホルムアルデヒド、グルタルアルデヒドなど)、ホルマリン置換物、アルコール(エタノール、メタノール、イソプロパノールなど)などの化学物質で固定すること、または試料をパラフィン、セロイジン、寒天、ポリマー、樹脂、極低温媒体もしくは様々なプラスチック埋め込み媒体(エポキシ樹脂およびアクリルなど)などの不活性材料に埋め込むことを含むことができる準備手順を経ることを必要とする。他の試料組織または細胞調製物は、凍結(凍結組織切片)または細針による吸引(細針吸引(FNA))などの物理的操作を必要とする。
続いて、試料細胞または組織は、固体媒体、典型的にはパラフィンワックスに包埋されて、1つ以上の十分に保存された二次元切片が取得されることを可能にする。典型的には、これらの切片は、3~7μmの厚さであり、ガラス顕微鏡スライド上に置かれる。次いで、スライドが洗浄され、特定のプロトコルで染色され、顕微鏡下で観察するために準備されるか、またはイメージングのためにプレシードする。次いで、訓練された病理学者は、染色された試料を分析して、例えば、疾患の結果としての組織形態およびそのような形態の変化、1つ以上のバイオマーカーの発現などを確認する。
病理学者は、組織の特徴付けおよび疾患の診断を助けるために分子技術をますます使用している。免疫組織化学的(IHC)試料染色は、組織切片の細胞内のタンパク質を特定するために利用可能であるため、生体組織内の癌性細胞や免疫細胞など、異なる種類の細胞の研究に広く使用されている。したがって、IHC染色は、免疫反応研究のために、癌性組織における免疫細胞(T細胞やB細胞など)の差次的に発現するバイオマーカーの分布と局在を理解するための研究に使用されることができる。例えば、腫瘍は、免疫細胞の浸潤物を含んでいることが多く、これは、腫瘍の発生を妨げたり、腫瘍の増殖を促進したりする場合がある。
インサイチュハイブリッド形成(ISH)が使用されて、顕微鏡で見ると形態学的に悪性であるように見える細胞内に特異的に遺伝子を生じさせる癌の増幅などの遺伝的異常または状態の存在を探すことができる。インサイチュハイブリッド形成(ISH)は、標的遺伝子配列または転写物に対してアンチセンスである標識DNAまたはRNAプローブ分子を使用して、細胞または組織試料内の標的核酸標的遺伝子を検出または局在化する。ISHは、スライドガラスに固定化された細胞または組織試料を、細胞または組織試料内の所与の標的遺伝子に特異的にハイブリッド形成することができる標識核酸プローブに曝露することによって実行される。複数の異なる核酸タグによって標識された複数の核酸プローブに細胞または組織試料を曝露することにより、いくつかの標的遺伝子を同時に分析することができる。異なる発光波長を有する標識を利用することにより、単一の標的細胞または組織試料に対して単一のステップで同時多色分析が実行されることができる。
組織学および細胞学試料の分析、したがって疾患の認識は、空間パターン認識を必要とする手動プロセスである。例えば、病理学者は、任意の組織病理学または細胞学試料におけるパターンを認識し、細胞の詳細を評価しなければならない。これらの視覚的合図によって、病理学者は、試料から診断情報を確認し、例えば、癌の証拠についての試料を評価し、および/またはその重症度を特徴付けることができる。病理学における様々な問題の原因は、染色検体の手動検査の性質に起因することができると考えられる。さらに、試料の質および試料の調製は、病理学者が試料を正確に評価する能力に影響を及ぼすことができると考えられる。同様に、IHCおよびISH染色は、正確な診断を行うためにオペレータの技能ならびに実験条件および方法に依存する。さらに悪いことに、境界的な症例および疾患の模倣薬は問題であり、したがって試料を評価する際の潜在的な問題にさらに寄与する。組織または細胞試料またはその調製方法または保存方法にかかわらず、技術者および病理学者の目標は、データの正確な解釈を可能にする正確で読み取り可能で再現可能な結果を得ることである。
疾患およびその空間パターンを自動的に検出する堅牢な手段が非常に望ましい。上記のように、臨床病理技術は、生物医学試料における形態学的パターンを明らかにするために組織学的または細胞学的染色を使用する。多くの場合、目的のバイオマーカーごとに別々の組織切片が得られ、これは費用と時間がかかる。一方、振動分光イメージングは、単一の組織切片から複数のバイオマーカーに関する情報を提供することができると考えられる。
本開示は、生物学的検体に由来する試料中の1つ以上のバイオマーカー(例えば陽性率、染色強度)の発現を推定するためのシステムおよび方法を記載する。いくつかの実施形態では、本開示は、生物学的検体中のバイオマーカーの完全に無標識の分子分析を可能にするシステムおよび方法を提供する。いくつかの実施形態では、試料中の1つ以上のバイオマーカーの発現の推定は、生物学的検体から取得された振動スペクトルデータに存在するバイオマーカー発現特徴の同定に基づく。いくつかの実施形態では、生物学的検体から取得された振動スペクトルデータ内に存在するバイオマーカー発現特徴は、訓練されたバイオマーカー発現推定エンジンを使用して識別される。1つ以上のバイオマーカー(陽性率など;染色強度)の推定発現は、それらの識別されたバイオマーカー発現特徴に基づいて計算されることができる。したがって、本開示のシステムおよび方法は、(例えば、IHCアッセイまたはISHアッセイにおける染色を必要とせずに、生物学的検体における1つ以上のバイオマーカーの発現の予測など)「標識なし」診断を可能にすることができる。現在開示されているシステムおよび方法は、「標識なし」診断を提供するために単独で使用されることができるが、試料のさらなる分析を提供するために、例えばホルマリン固定パラフィン包埋組織(FFPET)試料の同じまたは連続切片で、1つ以上のIHCおよび/またはISHアッセイと組み合わせて、またはそれと併せて使用されることもできることを理解されたい。
いくつかの実施形態では、生物学的検体は染色されていない。これらの実施形態では、本開示のシステムおよび方法は、固定期間が未知であるか、またはマスキング解除状態が未知である試料などの、染色されていない試料におけるバイオマーカー発現推定を可能にする。他の実施形態では、生物学的検体は、1つ以上のバイオマーカー、例えば、1つのバイオマーカー、2つのバイオマーカー、3つのバイオマーカー、または4つ以上のバイオマーカーの存在について染色される。
本開示はまた、グラウンドトゥルースデータ、例えば、1つ以上のクラス標識を含む訓練振動スペクトルデータに基づいて、生物学的検体中の1つ以上のバイオマーカーの発現の無標識定量的推定を可能にするためにバイオマーカー発現推定エンジンを訓練するためのシステムおよび方法を記載する。いくつかの実施形態では、訓練振動スペクトルデータは、差次的に調製された生物学的検体、例えば、差次的に固定および/または差次的にマスキングされていない生物学的検体を含む。このようにして、バイオマーカー発現推定エンジンは、異なる程度(例えば、可変的に固定された試料;可変的にマスクされていない試料)に調製された(例えば、固定および/またはマスクされていない)生物学的検体中の1つ以上のバイオマーカーの発現を推定するように訓練されることができる。本明細書に記載されるように、試料調製は、バイオマーカー発現に影響を及ぼすことができ、バイオマーカー発現を推定するための本明細書に記載されるシステムおよび方法は、この変動性を考慮に入れる。これらおよび他の実施形態は、本明細書でより詳細に説明される。
本開示の態様は、試験生物学的検体における1つ以上のバイオマーカーの発現を予測するためのシステムであって、(i)1つ以上のプロセッサと、(ii)1つ以上のプロセッサに結合された1つ以上のメモリであって、1つ以上のメモリが、1つ以上のプロセッサによって実行されると、試験生物学的検体から試験スペクトルデータを取得することであって、取得された試験スペクトルデータが、生物学的検体の少なくとも一部に由来する振動スペクトルデータを含む、取得することと、訓練されたバイオマーカー発現推定エンジンを使用して、取得された試験スペクトルデータからバイオマーカー発現特徴を導出することと、導出されたバイオマーカー発現特徴に基づいて、試験生物学的検体の1つ以上のバイオマーカーの発現を予測することと、を含む動作をシステムに実行させるコンピュータ実行可能命令を記憶する、1つ以上のメモリと、を備える、システムである。いくつかの実施形態では、試験生物学的検体は染色されていない。いくつかの実施形態では、試験生物学的検体は、1つ以上のバイオマーカーの存在について染色される。
いくつかの実施形態では、予測されるバイオマーカー発現は、予測される陽性率または予測される染色強度のうちの1つを含む。いくつかの実施形態では、予測されるバイオマーカー発現は、予測される陽性率および予測される染色強度の双方を含む。いくつかの実施形態では、試験生物学的検体の固定状態(例えば、固定品質、固定期間)は未知である。いくつかの実施形態では、マスキング解除状態(例えば、マスキング解除品質)は未知である。
いくつかの実施形態では、バイオマーカー発現推定エンジンは、1つ以上の訓練スペクトルデータセットを使用して訓練され、各訓練スペクトルデータセットは、複数の訓練組織試料に由来する複数の訓練振動スペクトルを含み、各訓練組織試料は、1つ以上のバイオマーカーの存在について染色され、各訓練振動スペクトルは、1つ以上のクラス標識を含む。いくつかの実施形態では、1つ以上のクラス標識は、1つ以上のバイオマーカーについての既知のバイオマーカー発現レベルを含む。いくつかの実施形態では、既知のバイオマーカー発現レベルは、1つ以上のバイオマーカーについての既知の陽性率および1つ以上のバイオマーカーについての既知の染色強度のうちの少なくとも1つを含む。いくつかの実施形態では、システムは、既知のマスキング解除期間、既知のマスキング解除温度、マスキング解除状態の定性的評価、既知の固定期間、および固定状態の定性的評価からなる群から選択される1つ以上の追加のクラス標識をさらに含む。
いくつかの実施形態では、訓練スペクトルデータセットは、以下によって導出される:(i)訓練生物学的検体を取得すること;(ii)取得された訓練生物学的検体を複数の訓練組織試料に分割すること;(iii)複数の訓練組織試料のそれぞれを、1つ以上のバイオマーカーの存在について染色すること;および(iv)1つ以上のバイオマーカーの発現を定量的に評価すること。いくつかの実施形態では、各訓練組織試料は、染色の前に差次的に調製される。いくつかの実施形態では、複数の訓練組織試料の各訓練組織試料は、差次的にマスキング解除されるか、差次的に固定されるか、または差次的にマスキング解除されて差次的に固定される。いくつかの実施形態では、訓練組織試料中の1つ以上のバイオマーカーの定量的評価は、1つ以上のバイオマーカーの染色強度を決定することを含む。いくつかの実施形態では、訓練組織試料中の1つ以上のバイオマーカーの定量的評価は、1つ以上のバイオマーカーの陽性率を決定することを含む。いくつかの実施形態では、定量的評価は、病理学者によって行われる。いくつかの実施形態では、定量的評価は、1つ以上の画像分析アルゴリズムを使用して行われる。いくつかの実施形態では、複数の訓練組織試料は、免疫組織化学アッセイで染色される。いくつかの実施形態では、複数の訓練組織試料は、インサイチュハイブリダイゼーションアッセイで染色される。いくつかの実施形態では、複数の訓練組織試料は、多重アッセイで染色される。
いくつかの実施形態では、試験スペクトルデータは、複数の正規化および補正振動スペクトルから導出された平均振動スペクトルを含む。いくつかの実施形態では、複数の正規化および補正された振動スペクトルは、以下によって取得される:(i)試験生物学的検体内の複数の空間領域を特定すること、;(ii)複数の特定された領域の各個々の領域から振動スペクトルを取得すること;(iii)個々の領域ごとに補正された振動スペクトルを提供するために、個々の領域ごとに取得された振動スペクトルを補正すること;および(iv)各個々の領域からの補正された振動スペクトルを所定の大域最大値に振幅正規化して、各領域の振幅正規化振動スペクトルを提供すること。いくつかの実施形態では、各個々の領域から取得された振動スペクトルは、以下によって補正される:(i)取得された各振動スペクトルを大気効果について補償して、大気補正振動スペクトルを提供すること;および(ii)散乱のために大気補正振動スペクトルを補償すること。
いくつかの実施形態では、訓練されたバイオマーカー発現推定エンジンは、次元縮小に基づく機械学習アルゴリズムを含む。いくつかの実施形態では、次元縮小は、潜在構造回帰モデルへの投影を含む。いくつかの実施形態では、次元縮小は、主成分分析および判別分析を含む。いくつかの実施形態では、訓練されたバイオマーカー発現推定エンジンは、ニューラルネットワークを含む。
いくつかの実施形態では、システムは、試験生物学的検体の不十分なマスキング解除および/または不十分な固定のために1つ以上のバイオマーカーの予測発現を補正するための動作をさらに含む。例えば、訓練されたバイオマーカー発現推定エンジンの使用によって取得された試験生物学的検体中の1つ以上のバイオマーカーの予測発現は、以下によって補正されることができる:(i)バイオマーカー固定感度曲線を取得すること;(ii)試験生物学的試料の実際の固定時間を推定すること;および(iii)取得された固定感度曲線を用いて、試験生物学的検体について取得された予測バイオマーカー発現量を固定補償発現量に補正すること。
いくつかの実施形態では、システムは、試験生物学的検体の実際のバイオマーカー発現を試験生物学的検体の1つ以上のバイオマーカーの予測発現と比較するための動作をさらに含む。いくつかの実施形態では、取得された試験スペクトルデータは、少なくともアミドIバンドの振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約3200から約3400cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約2800から約2900cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約1020から約1100cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約1520から約1580cm-1の範囲の波長の振動スペクトル情報を含む。
本開示の第2の態様は、処理された試験生物学的検体中の1つ以上のバイオマーカーの発現を予測するための命令を記憶する非一時的コンピュータ可読媒体であって、命令が、試験生物学的検体から試験スペクトルデータを取得することであって、試験スペクトルデータが、生物学的検体の少なくとも一部に由来する振動スペクトルデータを含む、試験スペクトルデータを取得することと、訓練されたバイオマーカー発現推定エンジンを使用して、取得された試験スペクトルデータからバイオマーカー発現特徴を導出することであって、バイオマーカー発現推定エンジンが、複数の差次的に調製された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練され、訓練スペクトルデータセットが、1つ以上のバイオマーカーについての既知のバイオマーカー発現のクラス標識を含む、導出することと、導出されたバイオマーカー発現特徴に基づいて、試験生物学的検体の1つ以上のバイオマーカーの発現を予測することと、を含む、非一時的コンピュータ可読媒体である。いくつかの実施形態では、試験生物学的検体は、未知の固定状態および/または未知のマスキング解除状態を有する。いくつかの実施形態では、1つ以上のバイオマーカーの予測発現は、予測された陽性率または予測された染色強度のうちの1つを含む。いくつかの実施形態では、1つ以上のバイオマーカーの予測発現は、予測された陽性率および予測された染色強度の双方を含む。いくつかの実施形態では、1つ以上のバイオマーカーの予測発現は定量的である。いくつかの実施形態では、試験生物学的検体は染色されていない。いくつかの実施形態では、試験生物学的検体は、1つ以上のバイオマーカーの存在について染色される。
いくつかの実施形態では、各訓練スペクトルデータセットは、以下によって導出される:(i)訓練生物学的検体を取得すること;(ii)取得された訓練生物学的検体を複数の訓練組織試料に分割すること;(iii)複数の訓練組織試料の各訓練組織試料を、異なる調製条件のもとで調製すること;(iv)1つ以上のバイオマーカーの存在について複数の訓練組織試料のそれぞれを染色すること;および(v)1つ以上のバイオマーカーの発現を定量的に評価すること。いくつかの実施形態では、異なる調製条件は、異なるマスキング解除条件を含む。いくつかの実施形態では、異なる調製条件は、異なる固定期間を含む。いくつかの実施形態では、訓練生物学的検体は、試験生物学的検体と同じ組織タイプを含む。いくつかの実施形態では、訓練生物学的検体は、試験生物学的検体とは異なる組織タイプを含む。
いくつかの実施形態では、取得された試験スペクトルデータは、少なくともアミドIバンドの振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約3200から約3400cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約2800から約2900cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約1020から約1100cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約1520から約1580cm-1の範囲の波長の振動スペクトル情報を含む。
本開示の第3の態様は、試験生物学的検体中の1つ以上のバイオマーカーの発現を予測する方法であって、試験生物学的検体から試験スペクトルデータを取得することであって、試験スペクトルデータが、生物学的検体の少なくとも一部に由来する振動スペクトルデータを含む、試験スペクトルデータを取得することと、訓練されたバイオマーカー発現推定エンジンを使用して、取得された試験スペクトルデータからバイオマーカー発現特徴を導出することであって、バイオマーカー発現推定エンジンが、複数の差次的に調製された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練され、訓練スペクトルデータセットが、1つ以上のバイオマーカーについての既知のバイオマーカー発現のクラス標識を含む、導出することと、導出されたバイオマーカー発現特徴に基づいて、試験生物学的検体の1つ以上のバイオマーカーの発現を予測することと、を含む、方法である。
いくつかの実施形態では、予測されるバイオマーカー発現は、予測される陽性率または予測される染色強度のうちの1つを含む。いくつかの実施形態では、予測されるバイオマーカー発現は、予測される陽性率および予測される染色強度の双方を含む。いくつかの実施形態では、1つ以上のバイオマーカーは、少なくとも1つの癌バイオマーカーを含む。いくつかの実施形態では、試験生物学的検体は、未知の固定状態および/または未知のマスキング解除状態を有する。いくつかの実施形態では、試験生物学的検体は染色されていない。いくつかの実施形態では、試験生物学的検体は、1つ以上のバイオマーカーの存在について染色される。
いくつかの実施形態では、各訓練スペクトルデータセットは、以下によって導出される:(i)訓練生物学的検体を取得すること;(ii)取得された訓練生物学的検体を複数の訓練組織試料に分割すること;および(iii)異なる調製条件下で複数の訓練組織試料の各訓練組織試料を調製すること。いくつかの実施形態では、方法は、1つ以上のバイオマーカーの存在について複数の訓練組織試料のそれぞれを染色することと、1つ以上のバイオマーカーについての既知の陽性率および/または既知の染色強度を定量的に評価することと、をさらに含む。
いくつかの実施形態では、訓練されたバイオマーカー発現推定エンジンは、次元縮小に基づく機械学習アルゴリズムを含む。いくつかの実施形態では、次元縮小は、潜在構造回帰モデルへの投影を含む。いくつかの実施形態では、訓練されたバイオマーカー発現推定エンジンは、ニューラルネットワークを含む。いくつかの実施形態では、方法は、試験生物学的検体の不十分なマスキング解除および/または不十分な固定のために1つ以上のバイオマーカーの予測発現を補償することをさらに含む。例えば、訓練されたバイオマーカー発現推定エンジンの使用によって取得された試験生物学的検体中の1つ以上のバイオマーカーの予測発現は、以下によって補正されることができる:(i)バイオマーカー固定感度曲線を取得すること;(ii)試験生物学的試料の実際の固定時間を推定すること;および(iii)取得された固定感度曲線を用いて、試験生物学的検体について取得された予測バイオマーカー発現量を固定補償発現量に補正すること。
いくつかの実施形態では、取得された試験スペクトルデータは、少なくともアミドIバンドの振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約3200から約3400cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約2800から約2900cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約1020から約1100cm-1の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約1520から約1580cm-1の範囲の波長の振動スペクトル情報を含む。
本開示の特徴の一般的な理解のために、図面を参照する。図面では、同一の要素を特定するために、全体を通して同様の参照符号が使用されている。
本開示の一実施形態にかかる、画像取得装置およびコンピュータシステムを含む代表的なデジタル病理学システムを示している。 本開示の一実施形態にかかる、試験生物学的試料のマスキング解除状態を定量的または定性的に予測するために、システムまたはデジタル病理ワークフロー内で利用されることができる様々なモジュールを記載している。 本開示の一実施形態にかかる、訓練されたバイオマーカー発現推定エンジンを使用して、染色されていない試験生物学的検体内の1つ以上のバイオマーカーの発現を推定する様々なステップを示すフローチャートを記載している。 本開示の一実施形態にかかる、2つの異なる訓練生物学的検体から複数の訓練組織試料、例えば、差次的調製(例えば、差分固定および/または差分マスキング)のための訓練試料1、2、3、4、5、および6を取得するプロセスを示している。いくつかの実施形態では、訓練組織試料1、2、および3は、第1の訓練スペクトルデータセットが取得されることができる訓練組織試料の第1のセットに属することができる一方で、訓練組織試料4、5、および6は、第2の訓練データセットが取得されることができる訓練組織試料の第2のセットに属することができる。 本開示の一実施形態にかかる、2つの異なる訓練生物学的検体から取得された複数の訓練組織試料の異なる調製を示し、2つの異なる訓練スペクトルデータセットの準備をさらに示している。 本開示の一実施形態にかかる複数の訓練組織試料の調製を示している。 本開示の一実施形態にかかる複数の訓練組織試料の調製を示している。 本開示の一実施形態にかかる複数の訓練組織試料の調製を示している。 本開示の一実施形態にかかる複数の訓練組織試料の調製を示している。 本開示の一実施形態にかかる複数の訓練組織試料の調製を示している。 本開示の一実施形態にかかる、訓練生物学的検体の振動スペクトルを取得する様々なステップを示すフローチャートを記載している。 本開示の一実施形態にかかる、試験生物学的検体の平均振動スペクトルを取得する様々なステップを示すフローチャートを記載している。 本開示の一実施形態にかかる、試験生物学的検体および訓練生物学的検体を含む、生物学的検体に由来する取得されたスペクトルを補正、正規化、および平均化する様々なステップを示すフローチャートを記載している。 BCL2(図9A)、ki-67(図9B)およびFOXP3(図9C)のIHC発現(陽性率)の定量的分析を記載している。 BCL2(図9A)、ki-67(図9B)およびFOXP3(図9C)のIHC発現(陽性率)の定量的分析を記載している。 BCL2(図9A)、ki-67(図9B)およびFOXP3(図9C)のIHC発現(陽性率)の定量的分析を記載している。 3つ全てのバイオマーカーのIHC発現対固定時間のプロットを示しており、ここで、平均発現が正規化されたスケールでプロットされているため、各バイオマーカー対固定時間の相対的変化が観察されることができる。バーは、両側順位和検定によって決定されるp<0.05の有意なレベルを表している。 Ki-67に対して生じた抗血清で標識された扁桃組織の例を提供している。扁桃組織のみ画像分析が行われた(左画像の丸部分)。時折、高いバックグラウンドを示したが、他の切片には存在しなかった結合組織が除外された。 識別された複数の領域を有する例示的な組織切片の可視画像を提供している。図は、可視画像内の示された領域から収集され、平均化され、処理され、正規化された振動スペクトルの例をさらに提供している。 中間IR吸収スペクトルを提供し、具体的には、取得された中間IRスペクトル内のタンパク質バンドを示している。 アミドIバンドの一次導関数対バンドのFWHMのピーク位置を記載し、これは、回収されていないスペクトルが他の回収された組織とは有意に異なるスペクトルを有することを明確にしている。 バイオマーカー発現推定エンジン、具体的にはPLSR機械学習アルゴリズムを訓練する例を記載している。最初に、モデルは、既知の分類を有する入力振動スペクトルで訓練され、各波長が応答(例えば、マスキング解除時間)に対してどの程度相関する(または反相関する)かにおおよそ対応する各波長に重みを割り当てるモデルが開発される。最後に、モデルは、それがマスキング解除時間をどれだけ正確に予測するかを評価するために訓練された振動スペクトルデータに適用される。 コラーゲンの典型的なFR-IRおよびラマンスペクトルを示している。 訓練されたバイオマーカー発現推定エンジン(取得された中程度のIRスペクトルを使用して訓練された)がC4d染色を予測することができる、PLSRモデルに基づくバイオマーカー発現推定エンジンを示している。盲検スペクトル間の予測精度は、C4d陽性細胞の0.4%であった。 訓練されたバイオマーカー発現推定エンジン(取得された中程度のIRスペクトルを使用して訓練された)がKi-67染色を予測することができる、PLSRモデルに基づくバイオマーカー発現推定エンジンを示している。盲検スペクトル間の予測精度は、Ki-67陽性細胞の0.8%であった。 時間-温度経過において中IRによってイメージングされた4つの組織の写真を提供している。バイオマーカー発現推定エンジンは、(図の右側および図の下部に沿って)3つの組織検体を含む丸で囲まれた領域に提供された組織で訓練された。バイオマーカー発現推定エンジンの予測力は、1つの組織検体のみを含む「より小さい」丸で囲まれた領域内の組織によって評価された(図の左側)。 訓練されたバイオマーカー発現推定エンジンの予測精度を、盲検化された扁桃試料中の全ての時間および温度にわたって示している。全ての試験時間および試験温度にわたって、訓練されたバイオマーカー発現推定エンジンは、機能的C4d染色強度を約10%よりも良好に予測することができた。時間と温度の交点の値は、予測されたC4d染色強度と実際のC4d染色強度との間のパーセント誤差を示す。 生物学的試料の赤外およびラマン特性周波数を示す表を提供している。 生物学的試料の赤外およびラマン特性周波数を示す表を提供している。 BCL2のIHC発現(染色強度)の定量的分析を記載している。 FOXP3のIHC発現(染色強度)の定量的分析を記載している。 ki-67のIHC発現(染色強度)の定量的分析を記載している。 固定実験のためのBCL2バイオマーカーについての推定DAB染色対予測DAB染色を示している。特に、図23Aは、0時間(例えば、不十分に/不適切に固定される)から24時間(例えば、完全に/適切に固定される)の範囲の様々な時間にわたって室温NBF中で固定された組織試料についての、専らBCL2陽性細胞におけるBCL2濃度の箱ひげプロットを提供している。実験タンパク質濃度は、明視野画像を画像分析アルゴリズムで分析することによって決定された。予測濃度は、PLSRベースのアルゴリズムで訓練された訓練されたバイオマーカー発現推定エンジンから予測される推定BCL2濃度を表す。左側のボックス(「訓練」)は、MID-IRスペクトルの訓練セットからなされたBCL2予測を表し、右側のボックス(「ホールドアウト」)は、モデルが以前に「見られた」ことがない盲検スペクトル、例えば検証スペクトルに対して行われたBCL2予測を表す。結果は、PLSR予測モデルが、差次的に固定された組織(完全に固定されていない)のBCL2濃度を正確に予測することができることを示している。 図23Aに表示されたBLC2バイオマーカーについての推定および予測されたDAB染色の累積分布関数をプロットしている。横軸は、明視野画像の分析からの実際のタンパク質濃度と、組織およびPLSRベースの予測エンジンからのMID-IRスペクトルを使用して計算されたMID-IR予測タンパク質濃度との間の差であると定義されたモデルの誤差の絶対値である。訓練セット(「訓練」)についてのモデルの予測誤差は、予測/検証データについての予測誤差と同様であり、MID-IRスペクトルのノイズに過度に適合しない十分に訓練されたモデルを示す。 0時間(例えば、不十分に/不適切に固定される)から24時間(例えば、完全に/適切に固定される)の範囲の様々な時間にわたって室温NBF中で固定された組織試料についての、専らFOXP3陽性細胞におけるFOXP3濃度の箱ひげプロットを提供している。実験タンパク質濃度は、明視野画像を画像分析プログラムで分析することによって決定された。予測濃度は、PLSRベースのアルゴリズムで訓練された訓練されたバイオマーカー発現推定エンジンから予測される推定FOXP3濃度を表す。左側のボックス(「点線ボックス」)は、訓練セットMID-IRスペクトルから作成されたFOXP3予測を表し、右側のボックス(「対角線を有するボックス」)は、モデルがこれまで見られたことのない盲検スペクトル、例えば検証スペクトルに対して行われたFOXP3予測を表す。結果は、PLSR予測モデルが、差次的に固定された組織(完全に固定されていない)のFOXP3濃度を正確に予測することができることを示す。 図24Aに示されるFOXP3バイオマーカーについての推定および予測されたDAB染色の累積分布関数をプロットしている。横軸は、明視野画像の分析からの実際のタンパク質濃度と、組織およびPLSRベースの予測エンジンからのMID-IRスペクトルを使用して計算されたMID-IR予測タンパク質濃度との間の差であると定義されたモデルの誤差の絶対値である。訓練セット(実線)のモデルの予測誤差は、予測/検証データのものと同様であり、MID-IRスペクトルのノイズに過度に適合しない十分に訓練されたモデルを示す。 0時間(例えば、不十分に/不適切に固定される)から24時間(例えば、完全に/適切に固定される)の範囲の様々な時間にわたって室温NBF中で固定された組織試料についての、専らki-67陽性細胞におけるki-67濃度の箱ひげ図を提供している。実験タンパク質濃度は、明視野画像を画像分析プログラムで分析することによって決定された。予測濃度は、PLSRベースのアルゴリズムで訓練された訓練済バイオマーカー発現推定エンジンから予測された推定ki-67濃度を表す。左側のボックス(「点線ボックス」)は、訓練セットMID-IRスペクトルから作成されたki-67予測を表し、右側のボックス(「対角線を有するボックス」)は、モデルがこれまで見られたことのない盲検スペクトル、例えば検証スペクトルに対して行われたki-67予測を表す。結果は、PLSR予測モデルが、差次的に固定された組織(完全に固定されていない)のki-67濃度を正確に予測することができることを示す。 図25Aに表示されたki-67バイオマーカーの推定および予測されたDAB染色の累積分布関数をプロットしている。横軸は、明視野画像の分析からの実際のタンパク質濃度と、組織およびPLSRベースの予測エンジンからのMID-IRスペクトルを使用して計算されたMID-IR予測タンパク質濃度との間の差であると定義されたモデルの誤差の絶対値である。訓練セット(実線)のモデルの予測誤差は、予測/検証データのものと同様であり、MID-IRスペクトルのノイズに過度に適合しない十分に訓練されたモデルを示す。 0時間(例えば、不十分に/不適切に固定される)から24時間(例えば、完全に/適切に固定される)の範囲の様々な時間にわたって室温NBF中で固定された組織試料についての、FOXP3に対して陽性である組織のパーセントの箱ひげプロットを提供している。実験タンパク質濃度は、明視野画像を画像分析プログラムで分析することによって決定された。予測濃度は、PLSRベースのアルゴリズムで訓練された訓練されたバイオマーカー発現推定エンジンから予測される推定FOXP3濃度を表す。左側のボックス(「点線ボックス」)は、訓練セットMID-IRスペクトルから作成されたFOXP3予測を表し、右側のボックス(「対角線を有するボックス」)は、モデルがこれまで見られたことのない盲検スペクトル、例えば検証スペクトルに対して行われたFOXP3予測を表す。結果は、PLSR予測モデルが、差次的に固定された組織(完全に固定されていない)のFOXP3濃度を正確に予測することができることを示す。 図26Aに示されるFOXP3バイオマーカーについての組織陽性の推定および予測されたパーセントについての累積分布関数をプロットしている。横軸は、明視野画像の分析からの実際のタンパク質濃度と、組織およびPLSRベースの予測エンジンからのMID-IRスペクトルを使用して計算されたMID-IR予測タンパク質濃度との間の差であると定義されたモデルの誤差の絶対値である。訓練セット(実線)のモデルの予測誤差は、予測/検証データのものと同様であり、MID-IRスペクトルのノイズに過度に適合しない十分に訓練されたモデルを示す。 0時間(例えば、不十分に/不適切に固定される)から24時間(例えば、完全に/適切に固定される)の範囲の様々な時間にわたって室温NBF中で固定された組織試料についての、BCL2に対して陽性の組織のパーセントの箱ひげプロットを提供している。実験タンパク質濃度は、明視野画像を画像分析プログラムで分析することによって決定された。予測濃度は、PLSRベースのアルゴリズムで訓練された訓練されたバイオマーカー発現推定エンジンから予測される推定BCL2濃度を表す。左側のボックス(「点線ボックス」)は、訓練セットMID-IRスペクトルから作成されたBCL2予測を表し、右側のボックス(「対角線を有するボックス」)は、モデルがこれまで見られたことのない盲検スペクトル、例えば検証スペクトルに対して行われたBCL2予測を表す。結果は、PLSR予測モデルが、差次的に固定された組織(完全に固定されていない)のBCL2濃度を正確に予測することができることを示す。 図27Aに示されるBCL2バイオマーカーについての組織陽性の推定および予測パーセントについての累積分布関数をプロットしている。横軸は、明視野画像の分析からの実際のタンパク質濃度と、組織およびPLSRベースの予測エンジンからのMID-IRスペクトルを使用して計算されたMID-IR予測タンパク質濃度との間の差であると定義されたモデルの誤差の絶対値である。訓練セット(実線)のモデルの予測誤差は、予測/検証データのものと同様であり、MID-IRスペクトルのノイズに過度に適合しない十分に訓練されたモデルを示す。 室温NBF中で0時間(例えば、不十分に/不適切に固定される)から24時間(例えば、完全に/適切に固定される)の範囲の様々な時間にわたって固定された組織試料についての、ki-67陽性組織のパーセントの箱ひげプロットである。実験タンパク質濃度は、明視野画像を画像分析プログラムで分析することによって決定された。予測濃度は、PLSRベースのアルゴリズムで訓練された訓練された予測エンジンから予測された推定ki-67濃度を表す。左側のボックス(「点線ボックス」)は、訓練セットMID-IRスペクトルから作成されたki-67予測を表し、右側のボックス(「対角線を有するボックス」)は、モデルがこれまで見られたことのない盲検スペクトル、例えば検証スペクトルに対して行われたki-67予測を表す。結果は、PLSR予測モデルが、差次的に固定された組織(完全に固定されていない)のki-67濃度を正確に予測することができることを示す。 図25Aに示されるki-67バイオマーカーについての組織陽性の推定および予測されたパーセントについての累積分布関数をプロットしている。横軸は、明視野画像の分析からの実際のタンパク質濃度と、組織およびPLSRベースの予測エンジンからのMID-IRスペクトルを使用して計算されたMID-IR予測タンパク質濃度との間の差であると定義されたモデルの誤差の絶対値である。訓練セット(実線)のモデルの予測誤差は、予測/検証データのものと同様であり、MID-IRスペクトルのノイズに過度に適合しない十分に訓練されたモデルを示す。 9.6℃、110℃、120℃、130℃または140℃のいずれかの温度で30分間回収された組織試料のC4d染色結果を提供している。左側のグラフは、PLSRに基づく訓練されたバイオマーカー発現推定エンジンを使用して、抗原回収温度にかかわらず、および120℃の変曲点にもかかわらず、盲検スペクトルによる訓練が全ての組織のC4d陽性率の予測を容易にすることができることを実証している。右側のグラフは、DAB画像分析アルゴリズムから、染色強度(上部、曲線、ひし形)および陽性率(下部、曲線、正方形)の双方が、130℃まで回収温度とともに増加する一方で、検出されたC4dの量が減少することを実証している。 25℃、70℃、80℃、90℃、100℃、105℃または110℃のいずれかの温度で60分間回収された組織試料のKi-67染色結果を提供している。左側のグラフは、染色強度(ひし形)および陽性率(四角)の双方が回収温度とともに増加するが、DAB画像分析アルゴリズムからのデータに基づいて100℃付近で飽和することを実証している。右側のグラフは、MID-IRスペクトルを使用して、抗原回収温度にかかわらず、またPCDAに基づく訓練されたバイオマーカー発現推定エンジンを使用したより高い回収温度での飽和にもかかわらず、全ての組織のki-67陽性率染色を決定することができることを実証している。 本開示の一実施形態にかかる、取得された予測バイオマーカー発現レベルを補正するステップを示すフローチャートを記載している。 本開示の一実施形態にかかる、取得された予測バイオマーカー発現レベルを補正するステップを示すフローチャートを記載している。
反対に明確に示されない限り、複数のステップまたは行為を含む本明細書において特許請求の範囲に記載される任意の方法において、方法のステップまたは行為の順序は、必ずしも方法のステップまたは行為が記載される順序に限定されないことも理解されたい。
本明細書における「一実施形態(one embodiment)」、「実施形態(an embodiment)」、「例示的な実施形態(an illustrative embodiment)」などへの言及は、記載された実施形態が特定の特徴、構造、または特性を含むことができることを示すが、全ての実施形態がその特定の特徴、構造、または特性を必ずしも含んでも含まなくてもよい。さらに、そのような語句は、必ずしも同じ実施形態を指すとは限らない。さらに、特定の特徴、構造、または特性が実施形態に関連して記載されている場合、明示的に記載されているか否かにかかわらず、他の実施形態に関連してそのような特徴、構造、または特性に影響を及ぼすことは当業者の知識の範囲内であると考えられる。
本明細書で使用される場合、単数形「a」、「an」、および「the」は、文脈が別途明確に指示しない限り、複数の指示対象を含む。同様に、「または」という単語は、文脈が別途明確に指示しない限り、「および」を含むことを意図している。「含む」という用語は、「AまたはBを含む」がA、B、またはAおよびBを含むことを意味するように、包括的に定義される。
本明細書および特許請求の範囲で使用される場合、「または」は、上記で定義された「および/または」と同じ意味を有することを理解されたい。例えば、リスト内の項目を区切る場合、「または」または「および/または」は、包括的であると解釈されるものとする。すなわち、要素の数またはリストの少なくとも1つを含むが、複数、および必要に応じて追加のリストに記載されていない項目を含むと解釈される。「のうちの1つのみ」または「のうちの正確に1つ」、または特許請求の範囲で使用される場合、「からなる」など、反対に明確に示される用語のみは、数または要素のリストのうちの正確に1つの要素を含むことを指す。一般に、本明細書で使用される「または」という用語は、「いずれか」、「のうちの1つ」、「のうちの1つのみ」または「のうちの正確に1つ」など、排他的な用語が先行する場合にのみ、排他的な代替案(例えば、「一方または他方であるが双方ではない」)を示すものとしてのみ解釈されるものとする。「から本質的に構成される」は、特許請求の範囲で使用される場合、特許法の分野で使用される通常の意味を有するものとする。
「備える(comprising)」、「含む(including)」、「有する(having)」などの用語は、交換可能に使用され、同じ意味を有する。同様に、「備える(comprises)」、「含む(includes)」、「有する(has)」などは、交換可能に使用され、同じ意味を有する。具体的には、各用語は、「含む、備える(comprising)」という一般的な米国特許法の定義と一致して定義されているため、「少なくとも以下」を意味するオープンな用語として解釈され、また、追加の特徴、制限、態様などを除外しないように解釈される。したがって、例えば、「構成要素a、b、およびcを有する装置」は、装置が少なくとも構成要素a、b、およびcを含むことを意味する。同様に、文言:「ステップa、b、およびcを含む方法」は、その方法が少なくともステップa、b、およびcを含むことを意味する。さらに、ステップおよびプロセスは、ここにおいて特定の順序で概説され得るが、当業者は、順序付けのステップおよびプロセスが変化し得ることを認識するであろう。
本明細書の明細書および特許請求の範囲で使用される場合、1つ以上の要素のリストに関連する「少なくとも1つ」という句は、要素のリストの任意の1つ以上の要素から選択される少なくとも1つの要素を意味すると理解されるべきであるが、必ずしも要素のリスト内に具体的にリスト化されているありとあらゆる要素の少なくとも1つを含まなくてもなく、要素のリスト内の要素の任意の組み合わせを除外するものではない。この定義はまた、「少なくとも1つ」という句が参照する要素のリスト内で具体的に特定される要素以外の要素が、具体的に特定されるそれらの要素に関連するかどうかにかかわらず、必要に応じて存在することができることを可能にする。したがって、非限定的な例として、「AおよびBの少なくとも1つ」(または、同等に、「AまたはBの少なくとも1つ」、または同等に「Aおよび/またはBの少なくとも1つ」)は、一実施形態では、少なくとも1つ、必要に応じて2つ以上のAを含み、Bが存在しない(および必要に応じて、B以外の要素を含む)を指すことができ、別の実施形態では、少なくとも1つ、必要に応じて2つ以上のBを含み、Aが存在しない(および必要に応じて、A以外の要素を含む)を指すことができ、さらに別の実施形態では、少なくとも1つ、必要に応じて2つ以上のAを含み、少なくとも1つ、必要に応じて2つ以上のBを含む(および必要に応じて、他の要素を含む)を指すことができるなどである。
本明細書で使用される場合、「抗原」という用語は、抗体、抗体類似体(例えばアプタマー)、または抗体断片が結合する物質を指す。抗原は内因性であってもよく、それによって、正常もしくは異常な細胞代謝の結果として、またはウイルスもしくは細胞内細菌感染のために細胞内で生成される。内因性抗原は、異種(非相同)、自己およびイディオタイプまたは同種(相同)抗原を含む。抗原はまた、腫瘍特異的抗原とすることができるか、または腫瘍細胞によって提示されることができる。この場合、それらは、腫瘍特異的抗原(TSA)と呼ばれ、一般に腫瘍特異的変異に起因する。抗原はまた、腫瘍細胞および正常細胞によって提示される腫瘍関連抗原(TAA)とすることができる。抗原はまた、CD抗原も含み、これは白血球によって発現されるいくつかの細胞表面マーカーのいずれかを指し、細胞系統または発達段階を区別するために使用されることができる。そのようなマーカーは、特異的モノクローナル抗体によって同定されることができ、それらの分化クラスターによって番号付けされる。
本明細書で使用される場合、「生物学的検体」、「試料」、または「組織試料」という用語は、ウイルスを含む任意の生物から得られる生体分子(タンパク質、ペプチド、核酸、脂質、炭水化物、またはそれらの組み合わせなど)を含む任意の試料を指す。生物の他の例は、哺乳類(人間、猫、犬、馬、牛、および豚などの獣医動物、ならびにマウス、ラット、霊長類などの実験動物など)、昆虫、環形動物、クモ形類動物、有袋類、爬虫類、両生類、細菌、および菌類などを含む。生物学的検体は、組織試料(組織切片や組織の針生検など)、細胞試料(Pap塗抹検体もしくは血液塗抹検体などの細胞学的塗抹検体、またはマイクロダイセクションによって得られた細胞の試料など)、または細胞分画、断片または細胞小器官(細胞を溶解し、遠心分離などによってそれらの成分を分離することによって得られる)を含む。生物学的検体の他の例は、血液、血清、尿、精液、糞便、脳脊髄液、間質液、粘膜、涙、汗、膿、生検組織(例えば、外科的生検または針生検によって得られる)、乳頭吸引物、耳垢、乳、膣液、唾液、ぬぐい液(頬スワブなど)、または最初の生物学的検体に由来する生体分子を含む任意の材料を含む。特定の実施形態では、本明細書で使用される「生物学的検体」という用語は、対象から得られた腫瘍またはその一部から調製された試料(均質化または液化された試料など)を指す。
本明細書で使用される場合、「バイオマーカー」または「マーカー」という用語は、何らかの生物学的状態または状態の測定可能な指標を指す。特に、バイオマーカーは、特異的に染色されることができ、細胞の生物学的特徴、例えば細胞の細胞型または生理学的状態を示す、核酸、脂質、炭水化物、またはタンパク質もしくはペプチド、例えば表面タンパク質とすることができる。バイオマーカーが使用されて、身体が疾患または症状の処置にどの程度よく応答するか、または対象が疾患または症状にかかりやすいかを決定することができる。免疫細胞マーカーは、哺乳動物の免疫応答に関する特徴を選択的に示すバイオマーカーである。癌の文脈において、バイオマーカーは、体内の癌の存在を示す生体物質を指す。バイオマーカーは、腫瘍によって分泌される分子、または癌の存在に対する身体の特異的応答とすることができる。遺伝子バイオマーカー、エピジェネティックバイオマーカー、プロテオミクスバイオマーカー、グリコームバイオマーカーおよびイメージングバイオマーカーは、癌の診断、予後診断および疫学のために使用されることができる。そのようなバイオマーカーは、血液または血清などの非侵襲的に収集された生体流体でアッセイされることができる。AFP(肝臓癌)、BCR-ABL(慢性骨髄性白血病)、BRCA1/BRCA2(乳癌/卵巣癌)、BRAF V600E(黒色腫/結腸直腸癌)、CA-125(卵巣癌)、CA19.9(膵臓癌)、CEA(結腸直腸癌)、EGFR(非小細胞肺癌)、HER-2(乳癌)、KIT(消化管間質腫瘍)、PSA(前立腺特異的抗原)、S100(黒色腫)などを含むがこれらに限定されないいくつかの遺伝子およびタンパク質ベースのバイオマーカーが既に患者ケアに使用されている。バイオマーカーは、診断薬(初期癌を同定するため)および/または予後診断薬(癌がどの程度侵攻性であるかを予測するため、および/または対象が特定の処置にどのように応答するかおよび/または癌がどの程度再発する可能性があるかを予測するため)として有用とすることができる。
本明細書で使用される場合、「細胞学的試料」という用語は、試料が細胞試料が得られた対象に存在したときの細胞の空間的関係をもはや反映しないように、試料の細胞が部分的または完全に脱凝集している細胞試料を指す。細胞学的試料の例は、組織擦過物(子宮頸部擦過物など)、細針吸引物、対象の洗浄によって得られた試料などを含む。
本明細書で使用される場合、「免疫組織化学」という用語は、抗原と抗体などの特異的結合剤との相互作用を検出することによって、試料中の抗原の存在または分布を決定する方法を指す。試料は、抗体-抗原結合を可能にする条件下で抗体と接触される。抗体-抗原結合は、抗体にコンジュゲートされた検出可能な標識(直接検出)によって、または一次抗体に特異的に結合する二次抗体にコンジュゲートされた検出可能な標識(間接検出)によって検出されることができる。いくつかの例では、間接検出は、抗原の検出可能性をさらに高めるのに役立つ三次以上の抗体を含むことができる。検出可能な標識の例は、酵素、フルオロフォアおよびハプテンを含み、これらは、酵素の場合、発色性または蛍光発生性基質と共に使用されることができる。
本明細書で使用される場合、「陽性率」という用語は、陽性染色細胞の数を、陰性染色細胞の数と組み合わせた陽性染色細胞の数で割ったものを指す。
本明細書で使用される場合、「スライド」という用語は、生物学的検体が分析のために配置される任意の適切な寸法の任意の基材(例えば、全体的または部分的に、ガラス、石英、プラスチック、シリコンなどから作製された基材)、より具体的には、標準の3インチ×1インチの顕微鏡スライドまたは標準の75mm×25mmの顕微鏡スライドなどの「顕微鏡スライド」を指す。スライド上に配置されることができる生物学的検体の例は、限定されるものではないが、細胞学的塗抹検体、薄い組織切片(生検からのものなど)、および生物学的検体の配列、例えば、組織配列、細胞配列、DNA配列、RNA配列、タンパク質配列、またはそれらの任意の組み合わせを含む。したがって、一実施形態では、組織切片、DNA試料、RNA試料、および/またはタンパク質は、スライド上の特定の位置に配置される。いくつかの実施形態では、スライドという用語は、SELDIおよびMALDIチップ、ならびにシリコンウェーハを指すことができる。
本明細書で使用される場合、「特異的結合実体」という用語は、特異的結合対のメンバーを指す。特異的結合対は、他の分子への結合を実質的に排除して互いに結合することを特徴とする分子の対である(例えば、特異的結合対は、生物学的試料中の他の分子との結合対の2つのメンバーのいずれかの結合定数よりも少なくとも10-1大きい、10-1大きいまたは10-1大きい結合定数を有することができる)。特異的結合部分の特定の例は、特異的結合タンパク質(例えば、抗体、レクチン、ストレプトアビジンなどのアビジン、およびプロテインA)を含む。特異的結合部分はまた、そのような特異的結合タンパク質によって特異的に結合される分子(またはその部分)を含むことができる。
本明細書で使用される場合、「スペクトルデータ」という用語は、分光計などを用いて、生物学的検体またはその任意の部分から取得された生の画像スペクトルデータを包含する。
本明細書で使用される場合、「スペクトル」という用語は、電磁放射の特定の波長または波数範囲「において」またはその範囲内で得られた情報(吸収、透過、反射)を指す。波数範囲は、4000cm-1ほど大きくてもよく、0.01cm-1ほど狭くてもよい。いわゆる「シングルレーザ波長」での測定は、典型的には、小さなスペクトル範囲(例えば、レーザ線幅)をカバーし、したがって、用語「スペクトル」が本原稿を通して使用されるときはいつでも含まれることに留意されたい。例えば、量子カスケードレーザの固定波長設定での透過測定は、本明細書では、本出願全体を通してスペクトルという用語に含まれるものとする。
本明細書で使用される場合、本明細書で使用される「染色」、「染色している」などの用語は、一般に、生物学的検体中の特定の分子(脂質、タンパク質、または核酸など)または特定の構造(正常または悪性の細胞、細胞質ゾル、核、ゴルジ装置、または細胞骨格など)の存在、位置、および/または量(濃度など)を検出および/または区別する生物学的検体の任意の処理を指す。例えば、染色は、特定の分子または特定の細胞構造と生物学的検体の周囲の部分との間のコントラストを提供することができ、染色の強度は、検体中の特定の分子の量の尺度を提供することができる。染色は、明視野顕微鏡だけでなく、位相差顕微鏡、電子顕微鏡、および蛍光顕微鏡などの他の観察ツールを使用して、分子、細胞構造、および生物の観察を支援するために使用されることができる。システムによって実行されるいくつかの染色は、細胞の輪郭を視覚化するために使用されることができる。システムによって実行される他の染色は、他の細胞成分の染色なしで、または比較的少ない染色で、染色される特定の細胞成分(分子または構造など)に依存することができる。システムによって実行される染色方法のタイプの例は、これらに限定されるものではないが、組織化学的方法、免疫組織化学的方法、および核酸分子間のハイブリッド形成反応などの分子間の反応(非共有結合相互作用を含む)に基づく他の方法を含む。特定の染色法は、これらに限定されるものではないが、一次染色法(例えば、H&E染色、Pap染色など)、酵素結合免疫組織化学的方法、および蛍光原位置ハイブリッド形成(FISH)などの原位置RNAおよびDNAハイブリッド形成法を含む。
本明細書で使用される場合、「標的」という用語は、存在、位置、および/または濃度が判定される、または判定されることができる任意の分子を指す。標的分子の例は、タンパク質、エピトープ、核酸配列、およびタンパク質に共有結合したハプテンなどのハプテンを含む。標的分子は通常、特異的な結合分子と検出可能な標識との、1つ以上の抱合体を用いて検出される。
本明細書で使用される場合、「組織試料」という用語は、試料が得られた対象内に存在した細胞間の断面の空間的関係を保存する細胞試料を指すものとする。「組織試料」は、初代組織試料(例えば、対象によって産生された細胞および組織)および異種移植片(例えば、対象に埋め込まれた外来細胞試料)の双方を包含するものとする。
本明細書で使用される場合、「マスク解除」または「マスキング解除」という用語は、抗原または標的を回収すること、および/または固定組織内の抗原、アミノ酸、ペプチド、タンパク質、核酸、および/または他の標的の検出を改善することを指す。例えば、そうでなければ検出されない可能性がある抗原部位は、例えば、マスキング解除中に抗原を取り囲むタンパク質架橋の一部を破壊することによって明らかにされることができると考えられる。いくつかの実施形態では、抗原および/または他の標的は、1つ以上のマスキング解除剤(以下に定義される)、熱および/または圧力の適用によってマスキング解除される。いくつかの実施形態では、1つ以上のマスキング解除剤のみが検体に適用されて、マスキング解除を達成する。他の実施形態では、マスキング解除を達成するために熱のみが加えられる。いくつかの実施形態では、マスキング解除は、水および追加の熱の存在下でのみ行われてもよい。マスキング解除動作の例は、米国特許出願公開第2009/01700152号明細書に記載されており、その開示は、その全体が参照により本明細書に組み込まれる。
概要
いくつかの実施形態では、本開示は、診断、例えばIHCおよび/またはISHアッセイなどの生物学的検体の染色の非存在下でのバイオマーカー発現の予測を可能にする「標識なし」システムおよび方法に関する。いくつかの実施形態では、本明細書に開示されるシステムおよび方法は、訓練されたバイオマーカー発現推定エンジンを利用して、生物学的検体から取得された振動スペクトルデータを評価し、振動スペクトルデータの評価に基づいて、1つ以上のバイオマーカーの発現の推定値を出力として提供する。
いくつかの実施形態では、開示されたシステムおよび方法の出力は、1つ以上のバイオマーカーの染色強度の定量的推定値、または1つ以上のバイオマーカーの陽性率の定量的推定値である。いくつかの実施形態では、1つ以上のバイオマーカーの染色強度および/または陽性率の定量的推定値は、未知の条件に従って調製された生物学的検体について提供されることができ、例えば、生物学的検体の固定期間および/またはマスキング解除状態が未知である。
全体として、出願人は、開示されたシステムおよび方法が、機械学習アルゴリズムの使用を介して、染色されていない生物学的検体における1つ以上のバイオマーカーの発現の迅速且つ正確な予測を可能にし、最終的にIHCおよび/またはISHアッセイ結果および患者ケアの改善を促進することを提出する。システムおよび方法はまた、いくつかの実施形態では染色アッセイが必要とされないため、時間および費用を節約すると考えられる。同時に、またいくつかの実施形態では、1つ以上のバイオマーカーの発現の評価は、試料調製またはIHCおよび/またはISH分析の不一致によって影響されない。これらおよび他の実施形態は、本明細書でさらに説明される。
システム
本開示の少なくともいくつかの実施形態は、生物学的検体から取得された振動スペクトルデータを分析するためのコンピュータシステムに関する。いくつかの実施形態では、試験生物学的検体は、1つ以上のバイオマーカーの存在について染色される。いくつかの実施形態では、試験生物学的検体は染色されていない。
いくつかの実施形態では、試験生物学的検体は、未知の固定状態および/またはマスキング解除状態を有する。本開示によれば、訓練されたバイオマーカー発現推定エンジンが使用されて、生物学的検体(例えば、染色されていない試験生物学的検体)内の1つ以上のバイオマーカーの発現の定量的推定値を提供することができる。いくつかの実施形態では、本開示のシステムは、試験生物学的検体(例えば、染色されていない試験生物学的検体)からの試験振動スペクトルデータを入力として受信することができ、陽性率または染色強度を含む1つ以上のバイオマーカーの発現の定量的推定値を出力として提供することができる。いくつかの実施形態では、バイオマーカー発現推定エンジンがどのように訓練されたかに応じて、訓練されたバイオマーカー発現推定エンジンは、バイオマーカー発現の推定に加えて、固定状態および/またはマスキング解除状態の一方または双方の定量的または定性的推定も出力として提供することができる。
いくつかの実施形態では、出力は、生成されたレポートの形態とすることができる。他の実施形態では、出力は、試験生物学的検体の画像に重ね合わされたオーバーレイであってもよい。さらに他の実施形態では、任意の出力は、システム(例えば、記憶システム240)に結合されたメモリに記憶されることができ、その出力は、試験生物学的検体および/または他の患者データに関連付けられることができる。
スペクトルデータ、例えば振動スペクトルデータを取得し、生物学的検体(試験生物学的検体および訓練生物学的検体を含む)を分析するためのシステム200が図1および図2に示される。システムは、生物学的検体(またはその任意の部分)の振動スペクトル(例えば、中IRスペクトルまたはラマンスペクトル)を取得するように構成されたものなどのスペクトル取得装置12と、コンピュータ14とを含むことができ、それによってスペクトル取得装置12とコンピュータとは、互いに通信可能に結合されることができる(例えば、直接的に、またはネットワーク20を介して間接的に)。コンピュータシステム14は、デスクトップコンピュータ、ラップトップコンピュータ、タブレットなど、デジタル電子回路、ファームウェア、ハードウェア、メモリ201、コンピュータ記憶媒体(240)、コンピュータプログラムまたは一連の命令(例えば、メモリまたは記憶媒体内にプログラムが記憶される)、1つ以上のプロセッサ(209)(プログラムされたプロセッサを含む)、および(本明細書でさらに記載されるような)任意の他のハードウェア、ソフトウェア、ファームウェアモジュールまたはそれらの組み合わせを含むことができる。例えば、図1に示されるシステム14は、ディスプレイ装置16およびエンクロージャ18を備えたコンピュータを備えることができる。コンピュータシステムは、取得されたスペクトルデータを、メモリ、サーバ、または別のネットワーク接続された装置などにローカルに記憶することができる。
振動分光法は、電磁放射線の吸収または放出による遷移に関係する。これらの遷移は、102から104cm-1の範囲に現れ、任意の所与の試料中の分子を構成する核の振動に由来すると考えられる。分子内の化学結合は、多くの方法で振動することができると考えられており、それぞれの振動は、振動モードと呼ばれる。分子振動には、伸縮と屈曲の2種類がある。伸縮振動は、原子間距離の増加または減少に伴う結合軸に沿った移動を特徴とするが、屈曲振動は、分子の残りの部分に対する結合角の変化からなる。振動エネルギーに基づく2つの広く使用されている分光技術は、ラマン分光法および赤外分光法である。レーザ光の非弾性散乱を利用する中赤外(MIR)吸収分光法およびラマン分光法の双方が、標的体積中の分子の比振動エネルギーレベルを探る。2つの技術は相補的であり、振動選択則に基づいて異なる振動モードを調査し、任意の分子内で原子がその分子のいくつかの明確な明確に定義された周波数特性で振動するという事実に基づいている。試料は、入射放射線のビームが照射されると、分子内に存在する化学結合の振動の周波数に特徴的な周波数でエネルギーを吸収する。化学結合の振動によるエネルギーのこの吸収は、赤外線スペクトルをもたらす。
IRおよびラマン分光法は分子の振動エネルギーを測定するが、双方の方法は異なる選択規則、例えば吸収プロセスおよび散乱効果に依存する。それらのコントラスト機構は異なり、各方法論はそれぞれの長所と短所を有するが、各モダリティから得られたスペクトルは相関することが多い(例えば、図14および図19を参照)。
赤外分光法は、電磁放射の吸収に基づくのに対して、ラマン分光法は、電磁放射の非弾性散乱に依存する。赤外分光法は、吸収技術から反射技術および分散技術まで、広範囲の波数に拡張され、試料分子中に存在する異なる結合が定性的および定量的目的の双方に使用するのに適した多数の一般的且つ特徴的なバンドを提供する近赤外領域、中赤外領域および遠赤外領域を含む多数の分析ツールを提供する。試料には、IR分光法でIR光が照射され、電気双極子モーメントによって誘起される振動を検出する。
ラマン分光法は散乱現象であり、入射放射周波数と散乱放射周波数との間の差に起因して生じる。これは、散乱光を利用して分子振動に関する知識を獲得し、分子の構造、対称性、電子環境、および結合に関する情報を提供することができる。ラマン分光法では、試料は、レーザ源からの単色の可視光または近IR光によって照射され、電気分極率変化中のその振動が決定される。
本開示のシステムでは、任意の振動スペクトル取得装置が利用されることができる。中赤外スペクトルの取得に使用するのに適したスペクトル取得装置またはそのような装置の構成要素の例は、米国特許出願公開第2018/0109078号明細書および米国特許出願公開第2016/0091704号明細書、ならびに米国特許第10,041,832号明細書、米国特許第8,036,252号明細書、米国特許第9,046,650号明細書、米国特許第6,972,409号明細書、および米国特許第7,280,576号明細書に記載されており、これらの特許の開示は、その全体が参照により本明細書に組み込まれる。
生物学的検体の代表的な中赤外スペクトルを生成するのに適した任意の方法が使用されることができる。フーリエ変換赤外分光法およびその生物医学的用途は、例えば、P.Lasch,J.Kneipp(Eds.)Biomedical Vibrational Spectroscopy’’ 2008(John Wiley&Sons)に記載されている。しかしながら、より最近では、波長可変量子カスケードレーザは、それらの高いスペクトル出力密度のために生物医学検体の迅速な分光法および顕微鏡法を可能にした(N.Krogerら、:Biomedical Vibrational Spectroscopy VI:Advances in Research and Industry,edited by A.Mahadevan-Jansen,W.Petrich,Proc.of SPIE Vol.8939,89390Z;N.Krogerら、J.Biomed.Opt.19(2014)111607;N.Kroger-Luiら、Analyst 140(2015)2086を参照)。これらの刊行物のそれぞれの内容は、その全体が参照により本明細書に組み込まれる。この研究は、調査がはるかに速く(例えば、18時間の代わりに5分)、液体窒素冷却を必要とせず、実質的に低コストで画像当たりより多くのピクセルを提供するという点で、(前述の赤外線顕微鏡のセットアップと比較して)適用性に対する進歩を構成すると考えられる。未染色組織の品質評価の文脈におけるQCLベースの顕微鏡法の特定の利点の1つは、例えば640×480ピクセルのマイクロボロメータアレイ検出器によって可能にされる(FT-IR撮像と比較して)より大きな視野である。
いくつかの実施形態では、スペクトルは、広い波長範囲、1つ以上の狭い波長範囲にわたって、または単一の波長のみ、またはそれらの組み合わせでさえも取得されることができる。例えば、アミドIバンドおよびアミドIIバンドのスペクトルが取得されることができる。別の例として、スペクトルは、約3200から約3400cm-1、約2800から約2900cm-1、約1020から約1100cm-1、および/または約1520から約1580cm-1の範囲の波長にわたって取得されてもよい。いくつかの実施形態では、スペクトルは、約3200から約3400cm-1の範囲の波長にわたって取得されることができる。いくつかの実施形態では、スペクトルは、約2800から約2900cm-1の範囲の波長にわたって取得されることができる。いくつかの実施形態では、スペクトルは、約1020から約1100cm-1の範囲の波長にわたって取得されることができる。いくつかの実施形態では、スペクトルは、約1520から約1580cm-1の範囲の波長にわたって取得されることができる。スペクトル範囲を狭めることは、通常、特に量子カスケードレーザを使用する場合、取得速度の点で有利であると考えられる。いくつかの実施形態では、単一の波長可変レーザは、次々にそれぞれの波長に調整される。あるいは、特定の周波数での測定に必要なレーザをオンおよびオフに切り替えることによって波長選択が行われるように、固定周波数の非同調レーザのセットが使用されることができる。
スペクトルは、例えば、透過または反射測定を使用して取得されることができる。透過測定のために、フッ化バリウム、フッ化カルシウム、シリコン、薄いポリマー膜、またはセレン化亜鉛が、通常、基材として使用される。反射測定のために、金または銀メッキされた基板、ならびに標準的な顕微鏡ガラススライド、または中間IR反射コーティング(例えば、多層誘電体コーティングまたは薄スライバコーティング)でコーティングされたガラススライドが一般的である。さらに、ナノアンテナのような構造化表面のような、表面増強(例えば、配列)を使用するための手段が実装されてもよい。
いくつかの実施形態では、他のコンピュータ装置またはシステムが利用されることができ、本明細書に記載のコンピュータシステムは、追加の構成要素、例えば顕微鏡、イメージング装置、スキャナ、他のイメージングシステム、自動スライド調製装置などに通信可能に結合されることができる。これらの追加の構成要素のいくつか、および利用できる様々なコンピュータ、ネットワークなどは、本明細書でさらに説明される。
例えば、いくつかの実施形態では、システム200は、イメージング装置をさらに含んでもよく、イメージング装置から取り込まれた任意の画像は、ローカルまたはサーバ上などのバイナリ形式で記憶されてもよい。いくつかの実施形態では、取り込まれた画像は、バイオマーカー発現推定値および/または記憶サブシステム240などの任意の患者データと共に記憶されてもよい。取り込まれたデジタル画像は、ピクセルのマトリックスに分割されることもできる。ピクセルは、ビット深度によって定義される1以上のビットのデジタル値を含むことができる。一般に、イメージング装置(またはメモリに記憶された事前走査画像を含む他の画像ソース)は、1つ以上の画像撮像装置を含むことができるが、これに限定されない。画像撮像装置は、限定されるものではないが、カメラ(例えば、アナログカメラ、デジタルカメラなど)、光学系(例えば、1つまたは複数のレンズ、センサフォーカスレンズ群、顕微鏡対物レンズなど)、画像化センサ(例えば、電荷結合素子(CCD)、相補的金属酸化物半導体(CMOS)イメージセンサなど)、写真フィルムなどを含む。デジタル実施形態では、画像撮像装置は、オンザフライフォーカシングを証明するために協働する複数のレンズを含むことができる。イメージセンサ、例えば、CCDセンサは、検体のデジタル画像を撮像することができる。
いくつかの実施形態では、イメージング装置は、明視野イメージングシステム、マルチスペクトルイメージング(MSI)システムまたは蛍光顕微鏡システムである。デジタル化された組織データは、例えば、VENTANA MEDICAL SYSTEMS,Inc.(アリゾナ州トゥーソン)によるVENTANA DP200スキャナなどの画像スキャンシステムまたは他の適切なイメージング装置によって生成されることができる。さらなるイメージング装置およびシステムは、本明細書でさらに説明される。いくつかの実施形態では、イメージング装置によって取得されたデジタルカラー画像は、従来、基本カラー画素から構成される。各色付きピクセルは、それぞれが同じビット数を含む3つのデジタルコンポーネントでコード化されることができ、各コンポーネントは、「RGB」コンポーネントという用語によっても示される、一般に赤、緑、または青の原色に対応する。
図2は、本開示のシステム200およびシステム内で利用される様々なモジュールの概要を提供する。いくつかの実施形態では、システム200は、1つ以上のプロセッサ209および1つ以上のメモリ201を有するコンピュータ装置またはコンピュータ実装方法を使用し、1つ以上のメモリ201は、1つ以上のプロセッサに本明細書に記載の特定の命令を実行させるために、1つ以上のプロセッサによる実行のための非一時的コンピュータ可読命令を記憶する。
いくつかの実施形態では、上述したように、システムは、得られた生物学的検体(例えば、図3のステップ310を参照)またはその任意の部分(例えば、図3のステップ320を参照)の中間IRスペクトルまたはラマンスペクトルなどの振動スペクトルを取得するためのスペクトル取得モジュール202を含む。いくつかの実施形態では、システム200は、取得された振動スペクトルデータを処理するように適合されたスペクトル処理モジュール212をさらに含む。いくつかの実施形態では、スペクトル処理モジュール212は、スペクトルデータを前処理するように構成される。いくつかの実施形態では、スペクトル処理モジュール212は、取得された振動スペクトルを補正および/または正規化するか、または取得された透過スペクトルを吸収スペクトルに変換する。他の実施形態では、スペクトル処理モジュール212は、単一の生物学的検体から取得された複数の振動スペクトルを平均化するように構成される。さらに他の実施形態では、スペクトル処理モジュール212は、取得された振動スペクトルの一次導関数、二次導関数などを計算するなどのために、取得された振動スペクトルをさらに処理するように構成される。
いくつかの実施形態では、システム200は、訓練振動スペクトルデータを受信し、受信した訓練振動スペクトルデータを使用してバイオマーカー発現推定エンジン210を訓練するように適合された訓練モジュール211をさらに含む。
いくつかの実施形態では、システム200は、試験振動スペクトルデータ(例えば、図3のステップ340を参照)内のバイオマーカー発現特徴を検出し、検出されたバイオマーカー発現特徴(例えば、図3のステップ350を参照)に基づいて生物学的検体のバイオマーカー発現(例えば、染色強度または陽性率)の推定値を提供するように訓練されたバイオマーカー発現推定エンジン210を含む。いくつかの実施形態では、バイオマーカー発現推定エンジン210は、1つ以上の機械学習アルゴリズムを含む。いくつかの実施形態では、1つ以上の機械学習アルゴリズムは、本明細書でさらに説明するように次元縮小に基づく。いくつかの実施形態では、次元縮小は、判別分析を伴う主成分分析などの主成分分析を利用した。他の実施形態では、次元縮小は、潜在構造回帰への投影である。いくつかの実施形態では、バイオマーカー発現推定エンジン210は、ニューラルネットワークを含む。他の実施形態では、バイオマーカー発現推定エンジン210は、サポートベクターマシンなどの分類器を含む。
いくつかの実施形態では、追加のモジュールがワークフローまたはシステム200に組み込まれることができる。いくつかの実施形態では、画像取得モジュールが実行されて、生物学的検体またはその任意の部分のデジタル画像を取得する。他の実施形態では、細胞が検出、分類、および/またはスコア付けされることができるように、自動画像分析アルゴリズムが実行されることができる(例えば、その開示が参照によりその全体が本明細書に組み込まれる米国特許出願公開第2017/0372117号明細書を参照)。他の適切な画像分析アルゴリズムは、国際公開第2019/121564号、国際公開第2019/110583号、国際公開第2019/110567号、国際公開第2019/110561号、国際公開第2019/025533号、国際公開第2019/025515号および国際公開第2018/122056号に記載されており、これらの開示は、その全体が参照により本明細書に組み込まれる。
分光取得モジュールおよび取得された分光データ
図2を参照すると、いくつかの実施形態では、システム200は、スペクトル取得モジュール202を実行して、生物学的検体(例えば、試験生物学的検体または訓練生物学的検体)の少なくとも一部から振動スペクトルを取得する(例えば、上述したもののいずれかなどのスペクトルイメージング装置12を使用して)。他の実施形態では、(本明細書にさらに記載される)試験生物学的検体は染色されておらず、例えば、1つ以上のバイオマーカーの存在を示す染色を含まない。いくつかの実施形態では、および(本明細書にさらに記載される)生物学的検体を訓練するために、生物学的検体は、1つ以上のバイオマーカーの存在について染色される。スペクトル取得モジュール202を使用して振動スペクトルが取得されると、取得された振動スペクトルは、記憶モジュール240(例えば、ローカル記憶モジュールまたはネットワーク記憶モジュール)に記憶されることができる。
いくつかの実施形態では、振動スペクトルは、生物学的検体の一部から取得されることができる(本明細書でさらに説明するように、これは、検体が訓練生物学的検体であるか試験生物学的検体であるかに関係しない)。そのような場合、スペクトル取得モジュール202は、例えばランダムサンプリングによって、または試料全体をカバーするグリッドにわたって規則的な間隔でサンプリングすることによって、試料の所定の部分から振動スペクトルを取得するようにプログラムされてもよい。これは、試料の特定の領域のみが分析に関連する場合にも有用とすることができる。
例えば、関心領域は、特定の種類の組織、または別の関心領域と比較して特定の種類の細胞の比較的高い集団を含むことができる。例えば、扁桃組織を含むが結合組織を含まない関心領域が選択されることができる。そのような場合、スペクトル取得モジュール202は、例えばランダムサンプリングによって、または試料全体をカバーするグリッドにわたって規則的な間隔でサンプリングすることによって、試料の所定の部分から振動スペクトルを取得するようにプログラムされてもよい。試料が1つ以上の染色を含む実施形態では、染色を含まないか、または他の領域よりも比較的少ない染色を含む関心領域から振動スペクトルが取得されることができる。
いくつかの実施形態では、生物学的検体の少なくとも2つの領域がサンプリングされ、少なくとも2つの領域のそれぞれについて振動スペクトルが取得される(また、これは、検体が訓練生物学的検体であるか試験生物学的検体であるかに関係しない)。他の実施形態では、生物学的検体の少なくとも10個の領域がサンプリングされ、少なくとも10個の領域のそれぞれについて振動スペクトルが取得される。さらに他の実施形態では、生物学的検体の少なくとも30個の領域がサンプリングされ、少なくとも30個の領域のそれぞれについて振動スペクトルが取得される。さらなる実施形態では、生物学的検体の少なくとも60個の領域がサンプリングされ、少なくとも60個の領域のそれぞれについて振動スペクトルが取得される。またさらなる実施形態では、生物学的検体の少なくとも90個の領域がサンプリングされ、少なくとも90個の領域のそれぞれについて振動スペクトルが取得される。なおさらなる実施形態では、生物学的検体の約30個の領域と約150個の領域との間がサンプリングされ、各領域について振動スペクトルが取得される。
いくつかの実施形態では、生物学的検体の領域ごとに単一の振動スペクトルが取得される。他の実施形態では、生物学的検体の領域ごとに少なくとも2つの振動スペクトルが取得される。さらに他の実施形態では、生物学的検体の領域ごとに少なくとも3つの振動スペクトルが取得される。
いくつかの実施形態では、記憶モジュール240に記憶される取得振動スペクトルまたは取得振動スペクトルデータ(本明細書では互換的に使用される)は、「訓練スペクトルデータ」を含む。いくつかの実施形態では、訓練スペクトルデータは、訓練生物学的検体から導出され、訓練生物学的検体は、組織学的検体、細胞学的検体、またはそれらの任意の組み合わせとすることができる。
いくつかの実施形態では、訓練スペクトルデータは、本明細書に記載の訓練モジュール211の使用などによって、バイオマーカー発現エンジン210を訓練するために使用される。いくつかの実施形態では、訓練スペクトルデータは、バイオマーカー発現レベル(例えば陽性率、染色強度)、マスキング解除状態(例えば、マスキング解除時間、マスキング解除期間、「未回収」、「完全に回収」、および「部分的に回収」などの相対マスキング解除品質情報)、固定状態(例えば、固定期間、「部分的に固定」、「完全に固定」、「適切に固定」、「不適切に固定」などの相対的な固定品質)などのクラス標識を含む。いくつかの実施形態では、訓練スペクトルデータは、複数のクラス標識を含む。いくつかの実施形態では、クラス標識は、組織タイプの識別、任意の染色アッセイで利用される特異的結合剤、組織調製情報、患者情報などを含む。
いくつかの実施形態では、バイオマーカー発現推定エンジンを訓練するために、複数の訓練振動スペクトルデータセットが使用される。いくつかの実施形態では、各訓練スペクトルデータセットは、複数の訓練組織試料(例えば、第1の訓練組織試料、第2の訓練組織試料、およびnの訓練組織試料)などの複数の部分に分割された単一の訓練生物学的検体から導出されてもよく(図4Aを参照)、各訓練組織試料は、異なって調製されてもよい。例えば、以下にさらに説明するように、各訓練組織試料は、別個に調製されてもよく、例えば、異なるように染色されてもよく、異なるように固定されてもよく、および/または異なるようにマスクされなくてもよい(図4Bを参照)。これに関して、単一の訓練生物学的検体は、異なる状態および/または組織調製状態の連続体を表す複数の別個に調製された試料を生じることができる。もちろん、異なる各訓練振動スペクトルデータセットは、異なる対象または患者に由来してもよく、異なる組織タイプ(例えば、扁桃組織対乳房組織)に由来してもよく、および/または異なる特異的結合実体(例えば、CD8マーカーを認識する特異的結合実体対CD3バイオマーカーを認識する特異的結合実体;第1の製造者からのCD8を認識する特異的結合実体対第2の製造者からのCD8を認識する特異的結合実体)によって処置されてもよい。
いくつかの実施形態では、訓練生物学的検体およびそれに由来する訓練組織試料のそれぞれは、バイオマーカー発現(例えば陽性率および/または染色強度)が訓練試料ごとに(例えば、訓練された病理学者によって、または1つ以上の画像分析アルゴリズムを使用して)評価されることができるように、1つ以上のバイオマーカーの存在について染色される。例えば、各個々の訓練試料は、BCL2、C4d、ki-67、FOXP3などの1つ以上によって染色されることができる。検出および分類に適した他のバイオマーカーは、本明細書に記載されている。
いくつかの実施形態では、各訓練組織試料は、単一のバイオマーカーの存在について染色され、次いで、訓練組織試料の画像が、イメージングデバイスを使用して取り込まれて分析される(各個々の訓練組織試料中のバイオマーカーの染色強度および/または陽性率が決定されることができるように)。他の実施形態では、各訓練組織試料は、2つ以上のバイオマーカーの存在について染色され、次いで、訓練組織試料の画像は、イメージング装置を使用して取り込まれて分析される(ここでも、2つ以上のバイオマーカーのそれぞれの染色強度および/または陽性率が独立して分析されるように)。2つ以上のバイオマーカーの存在について染色されたそれらの訓練組織試料について、それらの訓練組織試料の取り込まれた画像は、最初に非混合とすることができ、次いで、各非混合画像チャネル画像は、染色強度および/または陽性率が特定の非混合画像チャネル画像に存在する染色信号を評価されることができるように評価されることができる。混合解除方法は、国際公開第2019/110583号に記載されており、その開示は、その全体が参照により本明細書に組み込まれる。
いくつかの実施形態では、試料固定および試料内の標的(例えば、タンパク質および/または核酸標的)のマスキング解除のステップを含む、任意の訓練組織検体の調製は、バイオマーカー発現に影響を及ぼすことができる。本明細書の実施例1は、3つの異なるバイオマーカー、すなわち、LLC2、ki-67、およびFOXP3の発現に対する固定時間の影響、特に、測定された陽性率に対する固定時間の影響を示す(図9A~図9Dも参照)。同様に、図20~図22は、これらの同じ3つのバイオマーカーの染色強度に対する固定時間の影響を示している。
本明細書の実施例2は、同様に、ki-67バイオマーカーまたはC4dバイオマーカーの発現に対するマスキング解除の質の影響を示す。実施例2にさらに記載されるように、異なるバイオマーカーは、マスキング解除処理の増加に対して異なる応答を示すことができることが示された。例えば、染色強度および標識された細胞の数におけるC4dから、その後の強度および陽性度が低下する時点までである。逆に、ki67は、さもなければ生物学的検体を損傷するであろうマスキング解除条件下であっても、飽和が生じるまで適用されたマスキング解除プロセスの期間を通じて強度および陽性の増加を続ける(例えば、図15のドットおよび関連する組織画像を参照)。
上記を考慮すると、いくつかの実施形態では、訓練振動スペクトルデータセットは、以下に説明するように、別個に固定および/または別個にマスキング解除された訓練組織試料を含むことができる。このようにして、バイオマーカー発現推定エンジンは、異なる固定および/またはマスキング解除状態の連続体にまたがる訓練スペクトルデータによって訓練されることができ、その結果、バイオマーカー発現推定エンジンは、試験生物学的検体の実際の固定および/またはマスキング解除状態に関係なく、および/または試験生物学的検体の固定および/またはマスキング解除状態が既知であるか未知であるかに関係なく、染色されていない試験生物学的検体内の1つ以上のバイオマーカーの発現を決定することができる。
いくつかの実施形態では、訓練生物学的検体は差次的に固定される。差次的固定は、複数の訓練組織試料の各訓練組織試料(上記のようにそれぞれ単一の訓練生物学的検体に由来する)が異なる固定プロセスを受けるプロセスである。いくつかの実施形態では、任意の訓練組織試料は、任意の所定の時間、例えば、1時間、2時間、4時間、6時間、12時間などの間固定されてもよい。この点に関して、複数の訓練組織試料は、それぞれ、異なる程度などに部分的に固定されてもよい(例えば、試料が「完全に固定」または「十分に固定」と見なされるのに十分な期間、固定剤で処理されない)。さらに、訓練組織試料のセットは、固定されていない組織試料(例えば、0時間の固定)を含むことができる。
いくつかの実施形態では、訓練生物学的検体は、差次的にマスキングされていない。差次的固定は、複数の訓練組織試料の各訓練組織試料(それぞれ、上記のように単一の訓練生物学的検体に由来する)が、異なるマスキング解除条件、例えば、異なるマスキング解除試薬、異なるマスキング解除期間、異なるマスキング解除温度、および/または異なるマスキング解除圧力に供されるプロセスである。例えば、いくつかの実施形態では、単一の訓練生物学的検体に由来する複数の訓練試料は、それぞれ同じ温度で、異なる期間にわたってマスキングされない。例えば、単一の訓練生物学的検体に由来する各訓練組織試料は、同じ温度(例えば98.6℃)でマスキング解除されることができるが、マスキング解除の期間は変化することができる(5分、30分、60分など)。
別の例として、および他の実施形態では、単一の訓練生物学的検体に由来する複数の訓練組織試料は、それぞれ同じ期間、異なる温度でマスキングされない。例えば、各訓練組織試料は、同じ期間(例えば10分)であるが、マスキング解除の温度が変化する場合(98.6℃、110℃、120℃、130℃など)、マスキング解除されることができる。いくつかの実施形態では、マスキング解除時間および温度の双方を変えることができる。上述した実施形態のように、第1の組の訓練組織試料は、第1の温度であるが異なる期間でマスキング解除され、第1のセットの訓練組織試料を提供することができる。第2のセットおよび第3のセットの訓練組織試料は、それぞれ第2の温度および第3の温度で、また異なる期間にわたってマスキング解除されることができ、第2および第3のセットの訓練組織試料を提供する。
いくつかの実施形態では、単一の訓練生物学的試料は、複数の訓練組織試料に分割されることができ、複数の訓練組織試料の各個々の訓練組織試料は、(i)同じ所定の期間(例えば12時間)固定されることができるが、(ii)差次的にマスキング解除されることができる。いくつかの実施形態では、個々の組織試料は、それぞれ、「十分な」または「完全な」固定を提供する期間固定されることができる。これが図5Aに示される。
例として、再び図5Aを参照すると、「所定の固定1」は、12時間の固定期間とすることができる。「染色剤1」は、訓練組織試料に適用された1つ以上の染色を指すことができる。一方、「マスキング解除条件1、2、3、および4」は、それぞれ、10分間の期間を有することができるが、マスキング解除温度は、それぞれ変化し、例えば、それぞれ98.6℃、110℃、120℃、130℃である。図5Aは、訓練スペクトルデータの単一のセットの作成および取得を示しているが、複数の追加の訓練スペクトルデータセットを同様に作成および取得することができるが、固定期間、マスキング解除条件、適用される染色、組織の種類などのいずれかが変化する。
さらに他の実施形態では、単一の訓練生物学的試料は、訓練組織試料の2つのセットに分割されてもよく、訓練組織試料の各異なるセットは、複数の個々の訓練組織試料を含む。この特定の例に続いて、第1のセットの訓練組織試料は、それぞれ、「十分に固定」と見なされる試料を提供する期間にわたって固定されることができる。次いで、第1のセットの訓練組織試料内の個々の訓練組織試料のそれぞれが、差次的にマスキング解除されることができる。同様に、第2のセットの訓練組織試料は、それぞれ、「固定が不十分」と見なされる試料を提供する期間にわたって固定されることができる。次いで、第2のセットの訓練組織試料内の個々の訓練組織試料のそれぞれが、差次的にマスキング解除されることができる。これが図5Bに示される。
他の実施形態では、単一の訓練生物学的試料は、複数の訓練組織試料に分割されることができ、複数の訓練組織試料の各個々の訓練組織試料は、(i)差次的に固定(例えば12時間)されることができるが、(ii)同じマスキング解除条件下でマスキング解除されることができる。これが図5Cに示される。いくつかの実施形態では、マスキング解除条件は、固定の期間、ならびに利用される組織の種類およびマスキング解除試薬を考慮すると、試料「十分に」をマスキング解除されると見なされる条件とすることができる。
いくつかの実施形態では、固定プロセスの長さは、任意のマスキング解除プロセス(例えば、より長い期間にわたって固定された試料には、より長いマスキング解除時間が必要とされることができる)で利用される条件における決定要因とすることができる。したがって、なおさらなる実施形態では、単一の訓練生物学的試料は、複数の訓練組織試料セットに分割されてもよく、各異なるセットの訓練組織試料は、複数の個々の訓練組織試料を含み、訓練組織試料の各異なるセットは、異なる期間にわたって固定される。
所定の期間にわたって固定された各異なる訓練組織試料セット内で、各個々の訓練組織試料は、図5Dに示すように、差次的にマスキング解除されることができる。このようにして、これらの差次的に固定された訓練組織試料のそれぞれは、各試料「十分に」をマスキング解除される所定の時間量および所定の条件下でマスキング解除されることができる。換言すれば、各差次的に固定された試料は、特定の時間量および設定条件下でマスキング解除されて、その特定の訓練組織試料「十分に」をマスキング解除されることができる。次いで、各訓練組織試料は、1つ以上のバイオマーカーの存在について染色されることができる。
図5Eは、未知の時間量にわたって固定された訓練生物学的検体から1つ以上の訓練スペクトルデータセットを取得するプロセスを示すフローチャートを記載している。ここで、訓練生物学的検体が分割され、差次的にマスキング解除され、1つ以上のバイオマーカーの存在について染色される。次いで、得られた染色された訓練組織試料がイメージングされ、細胞を検出および/または分類され、次いで、各訓練組織試料について振動スペクトルが取得される。結果として得られるデータ(例えば、画像、クラス標識、振動分光データなど)セットは、後の検索のためにサーバまたは他の記憶装置に記憶されてもよい。これらの方法は、実施例3にさらに記載されている。出願人は、未知の固定時間を有する生物学的検体を訓練することさえも、バイオマーカー発現推定エンジンを訓練するのに有益であることを発見した。実際、図15および図16に示され、実施例3に記載されるように、バイオマーカー発現推定エンジンは、未知の固定期間を有する訓練生物学的検体に由来する訓練スペクトルデータセットのみで訓練され、試験生物学的検体中の1つ以上のバイオマーカーの高精度な推定を可能にする。
1つ以上のバイオマーカーの存在について染色された差次的に調製された試料からスペクトルデータを取得するプロセスが図6に示されている。上記のように、まず、1つ以上の訓練生物学的検体が取得される(ステップ410)。次いで、1つ以上の訓練生物学的検体のそれぞれは、少なくとも2つの部分に分割される(ステップ420)。このようにして、1つ以上の訓練生物学的検体のそれぞれは、少なくとも2つの「訓練組織試料」を提供する。これらの訓練組織試料のそれぞれは、別個に調製されてもよく、例えば、それぞれが別個に固定および/または別個にマスキング解除されてもよい(ステップ430)。少なくとも2つの訓練組織試料の差次的調製後、少なくとも2つの訓練組織試料のそれぞれは、タンパク質および/または核酸バイオマーカーを含む1つ以上のバイオマーカーの存在について染色される(ステップ435)。染色に続いて、少なくとも2つの差次的に調製され、染色された訓練組織試料のそれぞれにおける複数の領域が識別される(ステップ440)。
次に、複数の識別された領域のうちの識別された領域のそれぞれについて、少なくとも1つの振動スペクトルが取得される(ステップ450)。各識別された領域(または以下にさらに説明されるようなそのさらなる処理された変形)から取得された各振動スペクトルの平均が計算されて、その訓練試料の平均振動スペクトルを提供する(ステップ460)。ステップ400から460は、複数の異なる訓練生物学的検体について繰り返されてもよい(点線470を参照)。いくつかの実施形態では、記憶モジュール240などに、全ての訓練生物学的検体からの全ての訓練組織試料からの平均振動スペクトル「訓練スペクトルデータセット」が記憶される(ステップ480)。このようにして、訓練スペクトルデータまたは訓練スペクトルデータセットは、バイオマーカー発現推定エンジン210の訓練のために訓練モジュール211によって記憶モジュール240から取得されることができる。全ての訓練試料からの平均振動スペクトルを記憶することに加えて、記憶モジュール240はまた、平均振動スペクトルに関連する任意のクラス標識(例えば、1つ以上のバイオマーカーの実際に測定された発現(病理学者によって評価されるか、または1つ以上の画像分析アルゴリズムを使用して決定される)、マスキング解除状態、固定状態など)を記憶するように適合される。
訓練生物学的検体を調製し、そのような検体からスペクトルデータを取得するための上述したプロセスは、複数の異なる訓練生物学的検体について繰り返されてもよく(ステップ470を参照)、複数の異なる訓練生物学的検体のそれぞれは、同じ組織タイプであってもよく、または異なる組織タイプ(例えば、扁桃組織または乳房組織)であってもよい。本明細書の実施例セクションでは、バイオマーカー発現推定エンジン210の訓練に使用するための訓練生物学的検体の調製方法およびスペクトルデータの取得をさらに説明する。
いくつかの実施形態では、記憶モジュール240に記憶された取得スペクトルデータは、「試験スペクトルデータ」を含む。いくつかの実施形態では、試験スペクトルデータは、対象(例えば、ヒト患者)に由来する検体などの試験生物学的検体に由来し、試験生物学的検体は、組織学的検体、細胞学的検体、またはそれらの任意の組み合わせとすることができる。いくつかの実施形態では、試験スペクトルデータは、染色されていない試験片に由来する。他の実施形態では、試験スペクトルデータは、1つ以上のバイオマーカーの存在について染色された生物学的検体に由来する。
図7を参照すると、試験生物学的検体が取得されることができ(ステップ510)、次いで、試験生物学的検体内の複数の空間領域が識別されることができる(ステップ520)。各識別された領域について少なくとも1つの振動スペクトルが取得されることができる(ステップ530)。次いで、全ての領域から取得した振動スペクトルが補正され、正規化され、平均化され、試験生物学的検体の平均振動スペクトル(「試験スペクトルデータ」)を提供することができる。本明細書にさらに説明するように、試験スペクトルデータは、訓練されたバイオマーカー発現推定エンジン210に供給され、試験生物学的検体内の1つ以上のバイオマーカーの発現を予測することができる。次いで、1つ以上のバイオマーカーの予測発現は、下流プロセスまたは下流の意思決定、例えば試料のスコアリングに使用されることができ、スコア化された試料が使用されて処置選択肢を導くことができる。いくつかの実施形態では、試験生物学的検体は、未知の時間量の間固定され、および/または未知の条件下でマスキングされていない。
上述したように、スペクトルデータが訓練または試験生物学的検体から取得されるかどうかにかかわらず、例えば試料の空間的不均一性を説明するために、各生物学的検体について複数の振動スペクトルが取得される。いくつかの実施形態では、スペクトル処理モジュール212は、取得された各振動透過スペクトルを振動吸収スペクトルに変換するために最初に利用される。いくつかの実施形態では、透過スペクトルおよび吸光度スペクトルは、式吸光度=ln(ブランク透過/組織を通る透過)を介して直接関連しており、したがって、取得された透過スペクトルは、吸収スペクトルに変換されることができる。
振動スペクトルの全てが透過から吸光度に変換されると、いくつかの実施形態では、スペクトル処理モジュール212は、様々な領域の全てから取得されたスペクトルの全てを平均化し、それは下流分析、例えばバイオマーカー発現の訓練または予測に使用される平均化された振動スペクトルである。いくつかの実施形態では、図8を参照すると、複数の空間領域のそれぞれから取得された振動スペクトルは、それらの平均化の前に最初に正規化および/または補正される。いくつかの実施形態では、各領域からの振動スペクトルは、補正された振動スペクトルを提供するために個別に補正される(ステップ620)。例えば、補正は、大気効果について各取得振動スペクトルを補正すること(ステップ630)と、次いで散乱について各大気補正振動スペクトルを補正すること(ステップ640)とを含むことができる。次いで、各補正された振動スペクトルは、検体の厚さおよび組織密度の差を緩和するために、例えば最大値2に正規化される(ステップ650)。続いて、振幅正規化スペクトルの集合が平均化される(ステップ660)。
バイオマーカー発現推定エンジン
本開示のシステムおよび方法は、機械学習技術を使用してスペクトルデータをマイニングする。訓練モードのバイオマーカー発現推定エンジンの場合、バイオマーカー発現推定エンジンは、複数の取得および処理された訓練振動スペクトル(記憶モジュール240内に記憶された訓練振動スペクトルなど)から特徴を学習し、それらの学習された特徴を訓練スペクトルに関連するクラス標識(例えば、1つ以上のバイオマーカーの既知のバイオマーカー発現、既知のマスキング解除温度、既知のマスキング解除持続時間、組織の質など)と相関させることができる。訓練されたバイオマーカー発現推定エンジンの場合、訓練されたバイオマーカー発現エンジンは、染色されていない試験生物学的検体からバイオマーカー発現特徴を導出し、学習されたデータセットに基づいて、導出されたバイオマーカー発現特徴に基づいて染色されていない試験生物学的検体内の1つ以上のバイオマーカーの発現を予測することができる。
機械学習は、一般に、明示的にプログラムされることなく学習する能力をコンピュータに提供する一種の人工知能(AI)として定義されることができる。機械学習は、新たなデータにさらされたときに成長および変化することを自らに教えることができるコンピュータプログラムの開発に焦点を合わせている。換言すれば、機械学習は、コンピュータに明示的にプログラムされることなく学習する能力を与えるコンピュータ科学のサブフィールドとして定義されることができる。
機械学習は、データから学習し、データ上で予測を行うことができるアルゴリズムの研究および構築を探求し、そのようなアルゴリズムは、試料入力からモデルを構築することによって、データ駆動予測または決定を行うことによって厳密に静的なプログラム命令にしたがうことを克服する。本明細書に記載の機械学習は、Sugiyama、Morgan Kaufmannによる 「Introduction to Statistical Machine Learning」、2016、534ページ;「Discriminative,Generative,and Imitative Learning」、Jebara,MIT Thesis、2002、212ページ;および「Principles of Data Mining(Adaptive Computation and Machine Learning)」、Handら、MIT Press、2001、578ページに記載されているようにさらに実行されることができ、これらは、本明細書に完全に記載されているかのように参照により組み込まれる。本明細書に記載の実施形態は、これらの参考文献に記載されているようにさらに構成されることができる。
いくつかの実施形態では、バイオマーカー発現推定エンジン210は、試験生物学的検体に由来する試験スペクトルのバイオマーカー発現を予測するタスクのために「教師あり学習」を使用する。教師あり学習は、例示的な入出力対に基づいて入力を出力にマッピングする関数を学習する機械学習タスクである。これは、訓練例のセット(ここでは訓練スペクトル)からなる標識付き訓練データ(ここで、バイオマーカー発現は、訓練スペクトルデータに関連する標識である)から関数を推論する。教師あり学習では、各例は、入力オブジェクト(典型的にはベクトル)と所望の出力値(監視信号とも呼ばれる)とからなるペアである。教師あり学習アルゴリズムは、訓練データを分析し、新たな例をマッピングするために使用されることができる推測関数を生成する。最適なシナリオは、アルゴリズムが見えないインスタンスのクラス標識を正しく決定することを可能にする。
バイオマーカー発現推定エンジン210は、当業者に知られている任意の種類の機械学習アルゴリズムを含むことができる。適切な機械学習アルゴリズムは、回帰アルゴリズム、類似度ベースのアルゴリズム、特徴選択アルゴリズム、正則化方法ベースのアルゴリズム、決定木アルゴリズム、ベイジアンモデル、カーネルベースのアルゴリズム(例えば、サポートベクターマシン)、クラスタリングベースの方法、人工ニューラルネットワーク、深層学習ネットワーク、アンサンブル方法、および次元縮小方法を含む。適切な次元縮小方法の例は、主成分分析(主成分分析および判別分析など)および潜在構造回帰への投影を含む。
いくつかの実施形態では、バイオマーカー発現推定エンジン210は、主成分分析を利用する。主成分分析(PCA)の主なアイデアは、データセットに存在する変動を最大限まで保持しながら、互いに相関する多くの変数からなるデータセットの次元を縮小することである。同じことが、変数を新たな変数のセットに変換することによって行われ、これらは、主成分(または単に、PC)として知られており、元の変数に存在する変動の保持が、それらが順序を下って移動するにつれて減少するように直交して並べられる。このようにして、第1の主成分は、元の成分に存在していた最大の変動を保持する。主成分は、共分散行列の固有ベクトルであるため、直交する。主成分分析およびそれを使用する方法は、米国特許出願公開第2005/0123202号明細書ならびに米国特許第6,894,639号明細書および米国特許第8,565,488号明細書に記載されており、これらの開示は、その全体が参照により本明細書に組み込まれる。PCAおよび線形判別分析は、Khanら、「Principal Component Analysis-Linear Discriminant Analysis Feature Extractor for Pattern Recognition」、IJCSI International Journal of Computer Sciences Issues,Vol.8,Issue 6,No.2,2011年11月によってさらに記載されており、その開示はその全体が参照により本明細書に組み込まれる。
いくつかの実施形態では、バイオマーカー発現推定エンジン210は、潜在構造回帰(PLSR)への投影を利用する。PLSRは、PCAと多重線形回帰との特徴を組み合わせて一般化する技術である。その目的は、独立変数または予測子のセットから従属変数のセットを予測することである。この予測は、予測器から、最良の予測力を有する潜在変数と呼ばれる直交因子のセットを抽出することによって達成される。これらの潜在変数を使用して、PCAディスプレイに似たディスプレイを作成することができる。PLS回帰モデルから得られた予測の品質は、ブートストラップおよびジャックナイフなどの交差検証技術で評価される。PLS回帰には2つの主な変形がある。最も一般的なものは、従属変数と独立変数の役割を分離する。第2のものは、従属変数および独立変数に同じ役割を与える。PLSRは、Abdi、「Partial Least Squares Regression and Projection on Latent Structure Regression(PLS Regression)」、WIREs Computational Statistics,John Wiley&Sons,Inc.,2010によってさらに記載されており、その開示は、その全体が参照により本明細書に組み込まれる。本明細書で提供される実施例セクションは、PLSRに基づく訓練されたバイオマーカー発現推定エンジンを説明し、PLSRベースの訓練されたバイオマーカー発現推定エンジン210を使用して、バイオマーカー発現レベルの少なくとも定量的な推定値を提供することができることを示す。
いくつかの実施形態では、バイオマーカー発現推定エンジン210は、T分布確率的近隣埋め込み(t-SNE)を利用する。T-SNEは、2次元または3次元の低次元空間に視覚化のための高次元データを埋め込むのに適した非線形次元縮小技術である。具体的には、類似オブジェクトが近くのポイントでモデル化され、非類似オブジェクトが遠くのポイントでモデル化される確率が高くなるように、各高次元オブジェクトを2次元または3次元のポイントでモデル化する。
t-SNEアルゴリズムは、2つの主要な段階を含む。第一に、t-SNEは、類似のオブジェクトがピッキングされる確率が高く、非類似のポイントがピッキングされる確率が非常に低いように、高次元オブジェクトのペアにわたる確率分布を構築する。第二に、t-SNEは、低次元マップ内のポイントにわたって同様の確率分布を定義し、マップ内のポイントの位置に関して2つの分布間のKullback-Leibler発散を最小化する。元のアルゴリズムは、その類似度メトリックのベースとしてオブジェクト間のユークリッド距離を使用するが、これは適切に変更されるべきであることに留意されたい。T-SNEは、国際公開第2019/084697号および米国特許出願公開第2018/0356949号明細書および米国特許出願公開第2018/0340890号明細書にさらに記載されており、これらの開示は、その全体が参照により本明細書に組み込まれる。
いくつかの実施形態では、バイオマーカー発現推定エンジン210は、強化学習を利用する。強化学習(RL)は、エージェントがその前の行動を評価するために次の時間ステップにおいて遅延報酬を受け取る機械学習方法の一種である。換言すれば、RLは、累積報酬の概念を最大化するためにソフトウェアエージェントが環境内でどのように行動を起こすべきかに関するモデルなし機械学習パラダイムである。典型的には、RL設定は、2つの構成要素、エージェント、および環境から構成される。環境は、エージェントが作用しているオブジェクトを指し、エージェントは、RLアルゴリズムを表す。環境は、エージェントに状態を送信することによって開始し、次いで、エージェントは、その知識に基づいてその状態に応答してアクションを実行する。その後、環境は、次の状態と報酬のペアをエージェントに送り返す。エージェントは、その最後の行動を評価するために、環境によって返された報酬でその知識を更新する。ループは、環境が終端状態を送信するまで継続し、これはエピソードまで終了する。強化学習アルゴリズムは、米国特許第10,279,474号明細書および米国特許第7,395,252号明細書にさらに記載されており、これらの開示は、その全体が参照により本明細書に組み込まれる。
いくつかの実施形態では、機械学習アルゴリズムは、サポートベクターマシン(「SVM」)である。一般に、SVMは、非線形入力データセットが非線形の場合のカーネルを介して高次元線形特徴空間に変換される統計的学習理論に基づく分類技術である。サポートベクターマシンは、カーネル関数Kによって、2つの異なるクラスを表す訓練データEのセットを高次元空間に投影する。この変換されたデータ空間において、非線形データは、クラス分離を最大化するようにクラスを分離するためにフラットラインを生成することができるように変換される(識別超平面)。次いで、試験データは、Kを介して高次元空間に投影され、試験データ(以下に列挙される特徴またはメトリックなど)は、それらが超平面に対してどこに位置するかに基づいて分類される。カーネル関数Kは、データを高次元空間に射影する方法を定義する。
いくつかの実施形態では、バイオマーカー発現推定エンジン210は、ニューラルネットワークを含む。いくつかの実施形態では、ニューラルネットワークは、深層学習ネットワークとして構成される。一般的に言えば、「深層学習」は、データ内の高レベル抽象化をモデル化しようと試みるアルゴリズムのセットに基づく機械学習の分野である。深層学習は、データの表現を学習することに基づく機械学習方法の広範なファミリの一部である。観測は、ピクセルごとの強度値のベクトルなどの多くの方法で、またはエッジのセット、特定の形状の領域などとしてより抽象的な方法で表されることができる。いくつかの表現は、学習タスクを単純化する点で他の表現よりも優れている。深層学習の約束の1つは、ハンドクラフトされた特徴を、教師なしまたは半教師付き特徴学習および階層的特徴抽出のための効率的なアルゴリズムに置き換えることである。
いくつかの実施形態では、ニューラルネットワークは、生成的ネットワークである。「生成的」 ネットワークは、一般に、本質的に確率的であるモデルとして定義されることができる。換言すれば、「生成的」 ネットワークは、フォワードシミュレーションまたはルールベースの手法を実行するものではない。代わりに、生成的ネットワークは、適切な訓練データのセット(例えば、複数の訓練スペクトルデータセット)に基づいて学習されることができる(そのパラメータを学習することができるという点で)。いくつかの実施形態では、ニューラルネットワークは、深層生成的ネットワークとして構成される。例えば、ネットワークは、ネットワークが複数のアルゴリズムまたは変換を実行する複数の層を含むことができるという点で、深層学習アーキテクチャを有するように構成されることができる。
いくつかの実施形態では、ニューラルネットワークは、オートエンコーダを含む。オートエンコーダニューラルネットワークは、逆伝播を適用する教師なし学習アルゴリズムであり、目標値を入力と等しくなるように設定する。オートエンコーダの目的は、信号「ノイズ」を無視するようにネットワークを訓練することによって、典型的には次元縮小のために、データセットの表現(符号化)を学習することである。縮小側と共に、再構成側が学習され、オートエンコーダは、縮小された符号化からその元の入力に可能な限り近い表現を生成しようと試みる。オートエンコーダに関する追加情報は、http://ufldl.stanford.edu/tutorial/unsupervised/Autoencoders/に見出すことができ、その開示は、その全体が参照により本明細書に組み込まれる。
いくつかの実施形態では、ニューラルネットワークは、世界を訓練するために供給されたデータに従って世界をモデル化する重みのセットを有する深層ニューラルネットワークであってもよい。ニューラルネットワークは、典型的には複数の層からなり、信号経路は、層の間を前後に横切る。この目的のために、任意のニューラルネットワークが実装されることができる。適切なニューラルネットワークは、LeNet、AlexNet、ZFnet、GoogLeNet、VGGNet、VGG16、DenseNet、およびResNetを含む。いくつかの実施形態では、Longら、「Fully Convolutional Networks for Semantic Segmentation」、Computer Vision and Pattern Recognition(CVPR),2015 IEEE Conference,2015年6月(INSPEC受託番号:15524435)に記載されているような、完全畳み込みニューラルネットワークが利用され、その開示は、参照により本明細書に組み込まれる。
いくつかの実施形態では、ニューラルネットワークは、AlexNetとして構成される。例えば、分類ネットワーク構造は、AlexNetとすることができる。「分類ネットワーク」という用語は、本明細書では、1つ以上の完全接続層を含むCNNを指すために使用される。一般に、AlexNetは、いくつかの畳み込み層(例えば、5つ)と、それに続く、データを分類するように組み合わせて構成および訓練されたいくつかの完全接続層(例えば、3つ)とを含む。
他の実施形態では、ニューラルネットワークは、GoogleNetとして構成される。GoogleNetアーキテクチャは、(特に本明細書に記載のいくつかの他のニューラルネットワークと比較して)比較的多数の層を含むことができるが、層のいくつかは、並列に動作することができ、互いに並列に機能する層のグループは、一般に、開始モジュールと呼ばれる。他の層が順次動作してもよい。したがって、GoogleNetは、層の全てが順次構造に配置されているわけではないという点で、本明細書に記載の他のニューラルネットワークとは異なる。GoogleNetとして構成されたニューラルネットワークの例は、参照により本明細書に完全に記載されているかのように組み込まれる、Szegedyらによる「Going Deeper with Convolutions」、CVPR 2015に記載されている。
他の実施形態では、ニューラルネットワークは、VGGネットワークとして構成される。例えば、分類ネットワーク構造は、VGGとすることができる。VGGネットワークは、アーキテクチャの他のパラメータを固定しながら畳み込み層の数を増加させることによって作成された。畳み込み層を追加して深さを増加させることは、全ての層において実質的に小さい畳み込みフィルタを使用することによって可能になる。
他の実施形態では、ニューラルネットワークは、深層残差ネットワークとして構成される。例えば、分類ネットワーク構造は、Deep Residual NetまたはResNetとすることができる。本明細書に記載の他のいくつかのネットワークと同様に、深層残差ネットワークは、畳み込み層と、それに続く完全接続層とを含むことができ、それらは組み合わせて、検出および/または分類のために構成および訓練される。深層残差ネットワークでは、層は、参照されていない関数を学習する代わりに、層入力を参照して残差関数を学習するように構成される。特に、いくつかの積層された各層が所望の基礎となるマッピングに直接適合することを望む代わりに、これらの層は、ショートカット接続を有するフィードフォワードニューラルネットワークによって実現される残差マッピングに明示的に適合することが可能にされる。ショートカット接続は、1つ以上の層をスキップする接続である。
深層残差ネットは、畳み込み層を含むプレーンニューラルネットワーク構造を取り、ショートカット接続を挿入することによって作成されることができ、それによってプレーンニューラルネットワークを取り、それを残差学習の相手にする。深層残差ネットの例は、参照により本明細書に完全に記載されているかのように組み込まれる、Heらによる「Deep Residual Learning for Image Recognition」、NIPS 2015に記載されている。本明細書に記載のニューラルネットワークは、この参考文献に記載されているようにさらに構成されることができる。
バイオマーカー発現推定エンジン
いくつかの実施形態では、バイオマーカー発現推定エンジン210は、訓練モードで動作するように適合される。いくつかの実施形態では、訓練モジュール211は、任意の適切な訓練アルゴリズムに従って、訓練スペクトルデータをバイオマーカー発現推定エンジン210に提供し、バイオマーカー発現推定エンジン210をその訓練モードで動作させるように動作することができる。いくつかの実施形態では、訓練モジュール211は、バイオマーカー発現推定エンジン210と通信しており、訓練スペクトルデータ(または訓練吸光度スペクトルデータのさらなる処理された変形、例えば、訓練スペクトルデータの一次または二次導関数、訓練スペクトルデータ内の個々の帯域の大きさ、訓練スペクトルデータ内の帯域の積分、訓練スペクトルデータ内の2つ以上の帯域強度の比、訓練スペクトルデータの二次および三次導関数からの比など)を受信し、訓練スペクトルデータをバイオマーカー発現推定エンジン210に供給するように構成される。
いくつかの実施形態では、訓練モジュール211はまた、実際のバイオマーカー発現値(例えば、陽性率、染色強度)を含む訓練スペクトルデータに関連するクラス標識を供給するように適合される。いくつかの実施形態では、訓練スペクトルデータに関連するクラス標識は、実際のバイオマーカー発現値(訓練された病理学者によって確認されたもの、または1つ以上の画像分析アルゴリズムを使用して計算されたものなど)、ならびに染色前の試料調製に関する情報(例えば、固定状態、マスキング解除状態)を含むことができる。
いくつかの実施形態では、訓練アルゴリズムは、(本明細書に記載されるような)既知の訓練振動スペクトルデータのセットおよび(例えば、バイオマーカー発現レベルなどの)既知の出力クラス標識の対応するセットを利用し、入力訓練スペクトルデータの処理が所望の対応するクラス標識を提供するように、バイオマーカー発現推定エンジン210内の内部接続を変化させるように構成される。
バイオマーカー発現推定エンジン210は、当業者に公知の任意の方法に従って訓練されることができる。標識の追加の例は、米国特許出願公開第2015/0268255号、同第2019/0102675号、同第2015/0356461号、同第2013/0132786、同第2013/0240010号、同第2014/0134616号、および同第2019/0108344号に開示されており、それらの開示は、参照によりその全体がここに組み込まれる。
いくつかの実施形態では、バイオマーカー発現推定エンジン210は、交差検証法を使用して訓練される。交差検証は、分類器を開発するときにモデル選択および/またはパラメータ調整を支援するために使用されることができる技術である。交差検証は、標識付き事例のセットからの事例の1つ以上のサブセットを試験セットとして使用する。例えば、k倍交差検証では、標識付き事例のセットは、k個の「折り畳み」に等しく分割され、例えば、K倍交差検証は、機械学習モデルを評価するために使用される再サンプリング手順である。一連の訓練-試験サイクルが実行され、各サイクルにおいて異なる折り畳みが試験セットとして使用され、残りの折り畳みが訓練セットとして使用されるように、k個の折り畳みを反復する。各折り畳みがある時点で試験セットとして使用されるため、標識付きケースのセット内のランダムでない選択されたケースは、交差検証にバイアスをかけるように見える。例えば、5倍交差検証(k=5)のシナリオでは、データセットは5倍に分割される。第1の反復では、第1の折り畳みが使用されてモデルを試験し、残りが使用されてモデルを訓練する。第2の反復では、第2の倍数が試験セットとして使用され、残りは訓練セットとして機能する。このプロセスは、5つの折り畳みの各折り畳みが試験セットとして使用されるまで繰り返される。閾値処理の追加の方法は、国際公開第2014/0279734号および国際公開第2005/0234753号に記載されており、それらの開示は、参照によりその全体が本明細書に組み込まれる。
PLSRに基づく機械学習アルゴリズムを利用するバイオマーカー発現推定エンジン210との関連において、図13は、PLSRモデルが訓練スペクトル内のバイオマーカー発現特徴について振動スペクトルをマイニングするように訓練されることを示している。いくつかの実施形態では、PLSRモデルはまた、異なる種類の組織および/または異なる種類の分子(タンパク質、核酸)に対するこれらの特徴の変化を認識するように訓練される。いくつかの実施形態では、PLSRアルゴリズムは、振動スペクトルデータ(例えば、吸収スペクトル、一次導関数、二次導関数)を取得し、どの特徴(波長)が応答変数(バイオマーカー発現など)を最も予測するかを決定するために使用されるモデルを作成する。いくつかの実施形態では、生成されたモデルは、性能評価および最適化のために同じ未知の振動スペクトルデータを使用して、性能についてさらに評価されることができる。
主成分分析に基づく機械学習アルゴリズムを利用するバイオマーカー発現推定エンジン210との関連において、PCAは、PCA変換行列を生成するためにデフォルト試料サイズの初期訓練データセットに対して実行される。第2のPCAは、初期訓練データセットおよび試験データセットを含む結合データセットに対して実行される。その後、初期訓練データセット内の試料数がインクリメントされて、拡張訓練データセットが生成される。拡張訓練データセットのPCAが実行されて、拡張訓練データセットのPCA数が初期訓練データセットと同じであるかどうかが判定される。そうである場合、初期試験データセットと拡張試験データセットとの間の誤差は、最終的な解誤差を推定するためにPCA信号およびPCA変換行列に基づいて評価される。結合データセットのPCA行列は、試験データセット推定値を生成するために第1のPCAからの変換行列を使用して初期訓練データセット領域(例えば、スペクトル領域)に変換し戻される。この方法は、PCA数が収束して最終的な誤差目標が達成されるまで、訓練行列のサイズを拡張して反復する。誤差目標に到達すると、識別されたサイズの訓練データセットは、指定された入力パラメータ範囲に含まれる訓練目標機能情報を適切に表す。次いで、機械学習システム(例えば、バイオマーカー発現推定エンジン210)は、識別されたサイズの訓練行列で訓練されることができる。閾値処理の追加の方法は、国際公開第2017/8,452,718号および国際公開第2018/7,734,087号に記載されており、それらの開示は、参照によりその全体が本明細書に組み込まれる。
バイオマーカー発現推定エンジン210がニューラルネットワークを含む実施形態では、バイオマーカー発現推定エンジン210を訓練するために逆伝播アルゴリズムが使用されることができる。逆伝播は、ネットワークノード間の接続にいくつかのランダムな初期値が与えられ、ネットワークが入力ベクトルのセット(訓練スペクトルデータセット)の対応する出力ベクトルを計算するように操作される反復プロセスである。出力ベクトルは、訓練スペクトルデータセットの所望の出力と比較され、所望の出力と実際の出力との間の誤差が計算される。計算された誤差は、出力ノードから入力ノードに逆伝播され、誤差を低減するためにネットワーク接続重みの値を修正するために使用される。そのような各反復の後、訓練モジュール211は、訓練セット全体の総誤差を計算することができ、次いで、訓練モジュール211は、別の反復でプロセスを繰り返すことができる。バイオマーカー発現推定エンジン210の訓練は、総誤差が最小値に到達すると完了する。所定の反復回数の後に総誤差の最小値に到達しない場合、および総誤差が一定でない場合、訓練モジュール211は、訓練プロセスが収束しないと考えることができる。
上述したような複数の差次的に調製された染色された訓練組織試料から導出された取得スペクトルデータを用いた訓練の文脈では、各取得された訓練スペクトルは、1つ以上のバイオマーカー(ここで、1つ以上のバイオマーカーの既知の発現レベルは、本明細書中に記載されるようなクラス標識として役立つ)の既知の発現レベルと関連付けられる。いくつかの実施形態では、また、複数の差次的に調製された染色された訓練組織試料から導出された取得スペクトルデータを用いた訓練の文脈では、各取得訓練スペクトルは、(i)1つ以上のバイオマーカーの既知の発現レベル、および(ii)既知の試料調製条件および/または試料調製状態(例えば、固定期間、固定品質、マスキング解除条件、マスキング解除状態)に関連付けられることができる。例えば、図4Bに示される2つの訓練スペクトルデータセット(セット1および2を示す点線ボックスを参照)は、1つ以上のバイオマーカーの既知の発現レベルおよび任意の追加のクラス標識とともに、バイオマーカー発現推定エンジン210の訓練のために訓練モジュール211に提供されることができる。
バイオマーカー発現推定エンジン210の訓練が完了すると、システム200は、試験スペクトルデータ内のバイオマーカー発現特徴を検出し、検出されたバイオマーカー発現特徴に基づいて、染色されていない試験生物学的検体内の1つ以上のバイオマーカーの発現レベルを推定するように動作する準備が整う。いくつかの実施形態では、バイオマーカー発現推定エンジン210は、入力データの変動に適応するように定期的に再訓練されることができる。
バイオマーカー発現の推定
上述したようにバイオマーカー発現推定エンジン210が適切に訓練されると、それが使用されて、染色されていない試験生物学的検体から取得された試験スペクトルデータなどの試験振動スペクトルデータ内のバイオマーカー発現特徴を検出し、検出されたバイオマーカー発現特徴に基づいて、染色されていない試験生物学的検体における1つ以上のバイオマーカーの発現を予測することができる。いくつかの実施形態では、図3を参照すると、染色されていない試験生物学的検体が取得され(ステップ310)(例えば、特定の疾患を有する疑いがあるか、または特定の疾患を有することが知られている対象から)、次いで、その染色されていない試験生物学的検体から試験振動スペクトルデータが取得される(ステップ320)(図7も参照)。いくつかの実施形態では、試験振動スペクトルデータは、吸光度スペクトル、吸光度スペクトルの一次および/または二次導関数、訓練スペクトルデータ内の個々の帯域の大きさ、訓練スペクトルデータ内の帯域の積分、訓練スペクトルデータ内の2つ以上の帯域強度の比、訓練スペクトルデータの二次および三次導関数からの比などを含む。
上述した試験スペクトルデータおよび/またはその変形が取得されて処理されると、訓練されたバイオマーカー発現推定エンジン210を使用して、試験スペクトルデータからバイオマーカー発現特徴が導出されることができる(ステップ340)。いくつかの実施形態では、導出されたバイオマーカー発現特徴は、各波数が回収状態の予測にどの程度関連するかのマッピングを含む。0に近い値はほとんど有意性がない。いくつかの実施形態では、検出されることができるバイオマーカー発現特徴は、ピーク振幅、ピーク位置、ピーク比、スペクトル値の和(特定のスペクトル範囲にわたる積分など)、勾配の1つ以上の変化(一次微分)または曲率の変化(二次微分)などを含む。導出されたバイオマーカー発現特徴に基づいて、1つ以上のバイオマーカーの発現の推定値が計算されることができる(ステップ350)。いくつかの実施形態では、1つ以上のバイオマーカーの推定発現は、1つ以上のバイオマーカーの染色強度の定量的推定および/または1つ以上のバイオマーカーの陽性率の定量的推定を含み、1つ以上のバイオマーカーの発現の「標識なし」スコアリングを可能にする。
図23A、図24Aおよび図25Aは、それぞれ、BCL2陽性細胞、FOXP3陽性細胞およびki-67陽性細胞の予測された染色強度レベルに対する、BCL2陽性細胞(図23A)、FOXP3陽性細胞(図24A)およびki-67陽性細胞(図25A)の測定された(実験的な)染色強度レベルを示している。各例において、MID-IRスペクトルを使用して3つのバイオマーカーのそれぞれの染色強度を予測することができた別個のモデルが訓練された(実施例4を参照)。この例では、一次導関数スペクトルが使用され、スペクトルの2つの領域1750~2800cm-1および3700~4000cm-1が0に設定されたが、理想的な性能を達成するためには各モデルで異なる数の成分が必要であった。
図23A、図24Aおよび図25Aのデータから分かるように、本開示の方法は、固定時間にわたって発現強度が有意に変化するにもかかわらず、3つ全てのタンパク質のバイオマーカー強度を予測することができる。図23A、図24Aおよび図25Aは、それぞれ、様々な固定期間での1つ以上のバイオマーカーの発現レベル(例えば、DABの染色強度などの染色強度レベル)に関するデータで訓練されたバイオマーカー発現推定エンジン210を使用して、1つ以上のバイオマーカーの発現レベルを定量的に予測することができ、これを高精度で行うことができることを示している。図23B、図24B、および図25Bは、上述したバイオマーカーのそれぞれについての推定および予測されたDAB染色の累積分布関数(CDF)を示している。
図26A、図27Aおよび図28Aは、それぞれ、FOXP3(図27A)、BCL2(図27A)およびki-67(図28A)陽性細胞の測定された(実験的)発現レベル対FOXP3、BLC2およびki-67陽性細胞の予測発現レベル(陽性率)を示している。図26A、図27Aおよび図28Aは、それぞれ、様々な固定期間での1つ以上のバイオマーカーの発現レベルに関するデータで訓練されたバイオマーカー発現推定エンジン210を使用して、1つ以上のバイオマーカーの発現レベルを定量的に予測することができ、これを高精度で行うことができることを示している。図26B、図27Bおよび図28Bは、上述したバイオマーカーのそれぞれについての組織陽性の推定および予測されたパーセントについての累積分布関数(CDF)を示している。
図15および図16は、訓練されたバイオマーカー発現推定エンジン210を使用して、未知の固定時間を有する組織試料中の2つの異なるバイオマーカーの発現を決定することによって達成された結果を示している。図15および図16は、本明細書中に記載されるシステムおよび方法を使用した2つの異なるバイオマーカー(cd4およびlife-67)の予測された陽性率を、未知の期間にわたって固定された差次的にマスキングされていない試験生物学的検体についての既知の陽性率値(例えば、組織染色および検出および分類アルゴリズムによる分析の後に導出されるなどの実験的に導出された値)と比較して示している。少なくともこれらの図に示すように、バイオマーカー発現推定エンジン210は、差次的にマスキングされていない検体(および、試料の固定状態が未知であった場合)にわたるバイオマーカー発現情報を正確に予測することができる。
図18は、本開示のシステムおよび方法の予測力をさらに示している。実際に、図18は、未知の固定期間の盲検扁桃試料における全ての時間および温度にわたる訓練されたバイオマーカー発現推定エンジンの予測精度を示している。全ての試験時間および試験温度にわたって、訓練されたバイオマーカー発現推定エンジンは、機能的C4d染色強度を約10%よりも良好に予測することができた。時間と温度の交点の値は、予測されたC4d染色強度と実際のC4d染色強度との間のパーセント誤差を示す。
この例では、3つの別個のPLSR予測エンジンが訓練された。第1のモデルでは、組織が様々な温度(98。6℃、110℃、120℃、130℃、140℃)でそれぞれ約5分間取得された。いくつかの組織が訓練セットとして処理された。これは、MID-IR顕微鏡でイメージングされ、そのデータセットでPLSRモデルが訓練されたことを意味する。次いで、盲検組織がMID-IR顕微鏡でイメージングされ、訓練されたバイオマーカー発現推定エンジンが使用されて、その組織が染色すると予想されるC4d染色の量を計算した。モデルの予測値は、明視野DAB画像をデジタル分析することから計算される平均染色強度と比較され、パーセント誤差が、100*(MID-IR予測染色-明視野のグラウンドトゥルース染色)/明視野のグラウンドトゥルース染色として標準的な方法で計算された。
次いで、同じ抗原回収温度であるが、30分および60分の回収時間を使用して、このプロセスが繰り返された。したがって、この実施例では、3つの別個のエンジンが訓練されて検証された。上記を考慮して、いくつかの実施形態では、データは、検体からの取得されたMID-IRスペクトルのみに基づいて、試料の回収時間および温度に関係なくバイオマーカー染色を決定することができる全体的予測モデルを訓練するために使用されることができる。
バイオマーカー発現推定エンジン210がバイオマーカー発現レベルおよび試料調製状態(例えば、固定状態および/またはマスキング解除状態)を含むクラス標識で訓練される実施形態では、訓練されたバイオマーカー発現推定エンジン210は、(i)試験片の調製状態に基づく試験片の1つ以上のバイオマーカーの発現レベル(例えば、固定期間)と、(ii)異なる条件下で調製された同じ試験片の1つ以上のバイオマーカーの予想発現レベル(例えば、異なる期間にわたって固定された試料)との間の予測差を出力としてさらに提供することができる。これは、試験生物学的検体が十分な期間固定されなかったおよび/または適切にマスキング解除されなかった場合に有用とすることができ、したがって、関心対象のバイオマーカーの固定期間および/またはマスキング解除状態が「不十分」と見なされることができると考えられる。いくつかの実施形態では、予測差は、固定期間および/またはマスキング解除状態に基づいて1つ以上のバイオマーカーの発現レベルが増加または減少するように使用されることができ、固定レベルの増加または減少またはマスキング解除状態の変化は下流スコアリングに使用されることができる。
図30Aを参照すると、いくつかの実施形態では、システムは、試験生物学的検体の不十分なマスキング解除および/または不十分な固定のために1つ以上のバイオマーカーの予測発現を補正するための動作をさらに含む。例えば、バイオマーカー固定感度曲線が取得されることができる(ステップ910)。適切なバイオマーカー固定感度曲線の例が図9Dに示されている。そこでは、グラフは、3つの異なるバイオマーカー対固定時間の正規化された陽性率を示し、より具体的には、平均発現が正規化されたスケールにプロットされているため、各バイオマーカー対固定時間の相対的変化を観察することができ、この例のように、得られた予測バイオマーカー発現レベルを補正する際のバイオマーカー固定感度曲線として使用される。
次に、試験生物学的検体の固定時間が取得される(ステップ911)。続いて、本開示の訓練されたバイオマーカー発現推定エンジンが使用されて、試験生物学的検体の予測バイオマーカー発現レベルを取得する(912)。いくつかの実施形態では、試験生物学的検体は、染色されていない試験生物学的検体である。ステップ913において、試験生物学的検体について取得された予測バイオマーカー発現レベルは、取得された固定感度曲線を使用して固定補償発現レベルを提供するように補正される。図30Bは、実際のバイオマーカー発現レベルが測定され(ステップ914)、次いで、取得された固定感度曲線を使用して補償される(ステップ915)代替方法を示している。
いくつかの実施形態では、本開示のシステムは、1つ以上の発現スコア(Hスコアなど)が出力として受信された予測バイオマーカー発現データに基づいて推定されることができるように、1つ以上のスコアリングモジュールを含むことができる。その開示はその全体が参照により本明細書に組み込まれる、米国特許出願公開第2015/0347702号明細書に開示されているスコアリング方法のいずれかは、バイオマーカー発現スコアを決定するために利用されることができ、バイオマーカー発現値は、本明細書に記載の訓練されたバイオマーカー発現推定エンジン210を使用して推定される。
いくつかの実施形態では、出力として提供される情報は、さらに下流のプロセスで使用されてもよく、試験生物学的検体を1つ以上の特異的結合実体で処理すべきかどうかに関する決定を下すために使用されてもよい。
実施例1
3つの異なるバイオマーカー(BCL2、FOXP3、およびki67)の発現対固定時間の比較が本明細書で提供される。各固定時間の組織ブロックが各バイオマーカーについて染色され、スライド全体にわたる発現が画像分析アルゴリズムで定量化された(例えば、各染色の発現レベルを定量的に決定するように適合されたもの、例えば、スライド上の組織を最初にセグメント化し、次いで、関心のない組織の領域を決定する自動化されたアルゴリズムなど;次いで、アルゴリズムは、所与のタンパク質バイオマーカーについて組織が陽性であるか陰性であるかを自動的に判定する)。BCL2、ki-67、およびFOXP3について、固定時間に対する箱および箱ひげプロットの形態の要約結果がそれぞれ図9A、図9B、および図9Cに表示される。BCL2およびFOXP3は、それらの発現レベルが固定時間とともに単調に増加することから分かるように、特に不安定であり、不適切な固定を受けやすいことが見出された。
一方、ki-67は、生物学的検体をNBF中で少なくとも1時間固定する限り、不適切な固定に対して比較的堅牢であることが見出された。最後に、これらの3つの図が図9Dに要約され、図9Dは、3つ全てのバイオマーカーについて24時間での最大発現に正規化されたスケールで、各バイオマーカーの平均発現レベル対固定時間を示している。
図20、図21および図22を参照すると、染色組織/細胞のバイオマーカー発現レベルがデジタル的に分析され、各バイオマーカーの相対濃度が定量化されたところ、結果は、以下に示され、より長く固定された組織がより強く/より暗く染色する傾向があることを示す。箱ひげプロット対固定時間が再び示される。上記と同様に、BCL2およびFOXP3は、それらの発現レベルが固定時間とともに単調に増加することから分かるように、特に不安定であり、不適切な固定を受けやすいことが見出された。一方、Ki-67は、不適切な固定に対して比較的堅牢であることが見出された。
実施例2
反射赤外研究用のMirrIR顕微鏡スライド(オハイオ州チェスターランドのKevley Technologies社)が中間IRスペクトル測定に使用された。ホルマリン固定パラフィン包埋(FFPE)扁桃組織の4ミクロン連続切片を前処理したMirrIRスライド上に置いた。扁桃組織の脱パラフィン化を、OP2100-025に従って手動で行った。簡単に述べると、キシレンステップ後、スライドを、降順のグレードのエタノールを通して水和させ、次いで、VENTANA細胞調整1(CC1)溶液中で急速抗原回収(RAR)試験床に移した。
抗原回収は、ヒーターをオンにする前に30psiに予め加圧したRARチャンバ内のCC1溶液中で行われた。任意の所与の実験の総加熱時間は、90秒間の上昇時間および2分間の冷却時間を含んだ。抗原回収ステップの後、スライドを脱イオン水で穏やかに洗浄し、室温で風乾した。無傷の扁桃組織を有する乾燥スライドを中間IR測定に使用した。個々の抗原回収実験の説明は、LN #3685(Bohuslav Dvorak)、52~59ページおよび64~69ページに記載されている。
免疫反応性データを全ての試料について収集し、処理を中間IR分光法で分析した。簡単に述べると、脱パラフィンおよび抗原回収を手動で行うハイブリッド手順を用いて試料を処理した。脱パラフィン(depar)をキシレンを使用して行い、続いてOP2100-025に従って段階的アルコール系列を通して再水和した。次いで、試料をCC1(カタログ番号:950-124)に入れた。抗原回収後、過酸化物阻害剤から対比染色までのその後の処理ステップのために、試料を反応緩衝液(カタログ番号950-300)中でBenchMark UTLRA装置に移した。
ここに提示される研究では、扁桃試料をKi-67(30-9)またはC4d(SP91)に対して生じた抗血清で標識した。これらのマーカーは、増加する抗原回収処理に対して異なる応答を示すために選択した。Ki-67は、染色強度および標識された細胞の数が増加し、その後、強度および陽性が減少することが見出された。
逆に、C4dは、そうでなければ試料に損傷を与える抗原回収条件を介して強度および陽性が増加し続けることが発見された。C4dは、現在の回収方法で処理した場合には性能が低いが、高温抗原回収で処理した場合には明らかな免疫反応性を示すため、さらに選択した(この挙動は、急速抗原回収からの染色品質の改善と題されたD081973の補遺に詳細に記載されている)。
実施例3-訓練されたバイオマーカー発現推定エンジンを使用したバイオマーカー発現の推定
要約
この実験は、組織学的組織切片における分子の振動状態を調べるために中赤外(中間IR)分光法を利用した。この研究では、差次的に回収された扁桃組織に起因する中間IRスペクトルの変化を研究し、バイオマーカー発現推定エンジンを訓練するために使用した。中間IRスペクトルの特定されたシフトは、Ki-67およびC4dタンパク質の免疫組織化学(IHC)染色と相関していた。
序文
中赤外分光法(MID-IR)は、組織内の個々の分子の振動状態をプローブする強力な光学技術であり、タンパク質の立体配座状態に非常に敏感である。内因性および外因性材料の存在およびさらには立体配座状態は、生物学的検体の中間IR吸収プロファイルの変化を通じて明らかになるため、この極端な感度は、中間IR分光法を顕微鏡用途に理想的に適合させる。振動分光法は、例えば健康な組織と癌性組織とを区別するための診断用途にも使用されている。
方法および材料
取得手順
反射赤外研究用のMirrIR顕微鏡スライド(オハイオ州チェスターランドのKevley Technologies社)が中間IRスペクトル測定に使用された。ホルマリン固定パラフィン包埋(FFPE)扁桃組織の4ミクロン連続切片を前処理したMirrIRスライド上に置いた。扁桃組織の脱パラフィン化を、OP2100-025に従って手動で行った。簡単に述べると、キシレンステップ後、スライドを、降順のグレードのエタノールを通して水和させ、次いで、VENTANA細胞調整1(CC1)溶液中で急速抗原回収(RAR)試験床に移した。
抗原回収ステップは、ヒーターをオンにする前に30psiに予め加圧したRARチャンバ内のCC1溶液中で行われた。任意の所与の実験の総加熱時間は、90秒間の上昇時間および2分間の冷却時間を含んだ。抗原回収ステップの後、スライドを脱イオン水で穏やかに洗浄し、室温で風乾した。無傷の扁桃組織を有する乾燥スライドを中間IR測定に使用した。個々の抗原回収実験の説明は、LN #3685(Bohuslav Dvorak)、52~59ページおよび64~69ページに記載されている。
IHC染色および定量
免疫反応性データを全ての試料について収集し、処理を中間IR分光法で分析した。これらの試料は、D081973急速抗原回収産物およびプロセス可能性報告に詳細に記載されている方法を用いて作製した。簡単に述べると、脱パラフィンおよび抗原回収を手動で行うハイブリッド手順を用いて試料を処理した。脱パラフィン(depar)をキシレンを使用して行い、続いてOP2100-025に従って段階的アルコール系列を通して再水和した。次いで、試料をCC1(カタログ番号:950-124)に入れた。
RAR試験床(品番:101430300)を使用して、この報告に記載される時間および温度設定で抗原回収を行った。抗原回収後、過酸化物阻害剤から対比染色までのその後の処理ステップのために、試料を反応緩衝液(カタログ番号950-300)中でBenchMark UTLRA装置に移した。
Leica Aperio AT2(独国ヌスロッホのLeica Biosystems)スライドスキャナを用いて試料スライドをスキャンし、Aperio Imagescopeソフトウェアと共に供給される「正画素数v9」アルゴリズムを用いて免疫反応性の強度および染色された組織の割合を定量した。各組織について、染色が予想される扁桃組織を含むように関心領域(ROI)を選択した。図10に示すように、いくつかの染色処理で高いバックグラウンドを示したが、他の染色処理では欠けていた結合組織を除外した。
この定量化方法は、試料間で再現可能であり、実験内で比較することができる強度単位を生成する。しかしながら、強度測定値、または病理学者のスコアに報告された陽性画素の割合をマッピングまたは一致させる試みは行われなかった。
中間IRデータの収集
中間IRスペクトルは、付属の光干渉計(Vertex 70)を備えたフーリエ変換赤外(FTIR)顕微鏡(Bruker Hyperioni 3000、マサチューセッツ州ビレリカのBruker Optics)で収集した。扁桃腺ブロックからの連続切片を4マイクロメートルの厚さで中間IR反射スライド(Kevley Technologies、MirrIR)上に切片化し、差次的に回収し、中間IR顕微鏡でイメージングした。
異なる実験条件下で回収した扁桃組織切片をFTIR顕微鏡に置き、視野(FOV)をラスタスキャンすることによって組織切片全体を可視対物レンズでイメージングした。BrukerソフトウェアOPUSを使用して、水銀-カドミウム-テルル(MCT)検出器を使用して中間IRスペクトルを収集した組織の領域をランダムに選択した。典型的には、各組織試料から20~80個のスペクトルを収集した。吸収スペクトルを4cm-1の分解能で収集し、選択した各ROIを64回サンプリングし、これらのスペクトルを一緒に平均して所与の位置の最終スペクトルを得た。例示的な組織画像、サンプリングパターン、および単一のROIについて得られた平均スペクトルが図11において以下に示される。全てのスペクトルは、約200μm×200μmのFOVを生成する15×IR対物レンズを用いて収集された。
中間IRデータの前処理
収集したスペクトルを前処理してアーチファクトを除去し、スペクトルのフォーマットを標準化し、組織の中間IR吸収を単離した。顕微鏡は、中間IR透過を直接測定する。透過スペクトルを吸収スペクトルに変換するために、参照透過スペクトルを試料の外側の空間位置で収集し、組織を通して収集されたスペクトルを分割するために使用した。この計算は、組織によって減衰(吸収および散乱)された光の量を提供する。次いで、主に水蒸気および二酸化炭素からの大気吸収を、OPUSソフトウェアのアルゴリズムを使用して除去した。次いで、ベースライン補正を使用して、凹状ゴムバンド補正(8反復、64ベースラインポイント)を使用して組織散乱を補正した。得られたスペクトルは、試料組織による吸収を表す。最後に、全てのスペクトルを最大値2に正規化して、切片厚および組織密度の差を緩和した。
実験設計および結果
一定の抗原回収温度における抗原回収時間の変動
この実験では、抗原回復を98.6℃で0、10、30、60、または120分間のいずれかで扁桃組織に対して行った。各処理を2つ組の試料に対して行った。中間IRスペクトルは、抗原回復処理と緩やかに相関した、アミドIバンドと呼ばれる一次タンパク質バンドの顕著なシフトを示す。このアミドIシフトの例が図12Aに示されている。アミドIバンドのピーク波長対半値全幅(FWHM)の定量化は、抗原回収処理を未回収と、部分的、完全および過剰回収(図12B)とに経時的に区別することを可能にする。
主成分分析、アミドIバンドの積分、散乱を補正するためのいくつかのバンドへの正規化、ならびにメチルおよびメチレンピークの定量化を含む複数の他の測定基準を、このプロジェクトを通して評価した。残念なことに、これらの他の測定基準のいずれも、組織の抗原回収状態の層別化のレベルを改善することができなかった。最後に、教師あり機械学習モデルを確立して、1つ以上のバイオマーカーの発現レベルを示す中間IRスペクトルの明白でないシグネチャを利用した。
スペクトルのこれらの小さな差は、潜在構造回帰(PLSR)法への投影を使用して識別された。このアルゴリズムは、中間IR信号(例えば、吸収スペクトル、一次微分、二次微分)を取得し、どの特徴(波長)が応答変数(抗原回収状況、標的回収状況など)を最も予測するかを決定するために使用されるモデルを作成する。次いで、生成されたモデルを、性能評価および最適化のために同じ未知の中間IRデータを使用して性能について評価した。図13は、PLSRモデルがどのようにして抗原回収シグネチャのための中間IRスペクトルを取得するように訓練されるかを示している。この実験では、モデルの精度は3分であった。
これらの研究は、教師あり機械学習モデルがデータを取得し、扁桃試料中のバイオマーカー発現レベルを決定するために使用されることができるモデルを開発することができることを実証している。モデルが真のバイオマーカー発現シグネチャを認識していることをさらに検証するために、アルゴリズムが訓練されていない一連のスペクトルをモデルに与えて、盲検予測をどれだけうまく行うことができるかを判定した。さらに、PLSRモデルは、固定時間が未知の試料について、Ki-67およびC4dタンパク質(図15および図16参照)のIHC染色強度と中間IRスペクトルの差を相関させることができることが実証されている。
抗原回収時間および温度の変動
この研究では、機械学習モデルと組み合わせた中間IRスペクトルを調査して、固定時間が未知であり、マスキング解除条件が変化した試料の1つ以上のバイオマーカー(例えば陽性率;染色強度)の発現を推定するために使用されることができるかどうかを判定した。4つの別個の扁桃組織を有する5つの多組織スライドを98.6℃から140℃の温度で5分間回収した。
3つの扁桃組織(図17、3つの組織検体を含む丸で囲まれた部分)からの中間IRスペクトルを使用して、PLSRモデルを訓練した。次いで、このモデルが使用されて、「未知」扁桃組織における抗原回復条件を推論した(図17、単一の組織検体のみを含む丸で囲んだ部分)。図11からの結果は、少なくとも扁桃腺組織において、PLSRと結合した中間IRスペクトルが、全ての時間および温度にわたって、未知の試料が回収される程度および未知の試料がC4dについて染色する程度を正確に定量することができることを実証している。時間および温度が抗原回収に影響を及ぼす2つの最も重要な変数であるため、これは極めて重要である。
実施例4-予測歪み領域または強度モデルの訓練
PLSRモデルは、機能的染色データを使用して訓練されることができる。この場合、入力データ(スペクトル)が選択され、キュレートされるプロセスは、固定時間を予測するためにモデルを訓練することと同様である。しかしながら、訓練は異なる。この場合、全てのスライドが明視野スキャナでイメージングされ、デジタル病理アルゴリズムに供給される。有意なタンパク質発現データを得るために、組織の全ての非染色領域(間質、結合組織、孔、重なり合う組織/ひだ)が分析領域のために除去される。タンパク質について陽性であると判定された細胞を識別し、所与のバイオマーカーについて陽性である活性組織の領域をデジタルで定量する。次いで、スライドは、組織の陽性率によって特徴付けられ、これは、実際に染色している潜在的に染色する組織領域の割合を意味する。このプロセスは、全ての組織について繰り返される。次いで、モデルは、以下の2つのプロセスのうちの1つに従って訓練されることができる:
(a)所与の固定時間に対する平均バイオマーカー発現。所与の固定時間からの全ての組織は、目的のタンパク質の平均発現をもたらすように訓練される。所与の固定時間の全ての組織が同じ出力(固定時間/品質)について訓練されるため、固定時間の訓練モデルと同様である。長所および短所:ノイズが少なく、平均性能に最適化されたモデルであり、少ないデータで訓練されることができる。
(b)各組織のバイオマーカー発現を個別に使用してモデルが訓練されることができる。例えば、同じ固定時間の2つの組織が異なるバイオマーカー発現を有する場合、それらのスペクトルが個別にマイニングされて、差次的染色を最もよく説明するスペクトル特徴を見つける。利点:より強力で一般化可能なモデル、個々の性能に最適化されたモデルは、大きな訓練セットを必要とした。
機能的染色を決定するための代替方法は、現在染色している細胞間のバイオマーカーの強度を定量することであろう。これは、バイオマーカーについて陽性である細胞/組織の領域を同定し、DAB発現をスペクトル的に混合解除してタンパク質濃度に比例する数を得ることによって行われる(あるいは、単に検出器からの生の強度読み取り値を使用して)。強度のこの最終測定値は、組織が所与のタンパク質をどれだけ強く染色するかを予測するために使用されることができるモデルを訓練するために使用されることができる。さらに、病理学者の読み取り値に基づいて染色陽性または強度を予測するようにモデルが訓練されることができる。
バイオマーカーの例
以下に特定されるのは、本開示の検体処理アセンブリ、システム、および方法を使用してマスキング解除されることができるバイオマーカーの非限定的な例である。特定のマーカーは、特定の細胞の性質である一方、他のマーカーは、特定の疾患または状態に関連付けられたものとして特定される。既知の予後マーカーの例は、例えば、ガラクトシルトランスフェラーゼII、ニューロン特異的エノラーゼ、プロトンATPアーゼ-2および酸性ホスファターゼなどの酵素マーカーを含む。ホルモンまたはホルモン受容体マーカーは、ヒト絨毛性ゴナドトロピン(HCG)、副腎皮質刺激ホルモン、癌胎児性抗原(CEA)、前立腺特異抗原(PSA)、エストロゲン受容体、プロゲステロン受容体、アンドロゲン受容体、gC1q-R/p33補体受容体、IL-2受容体、p75ニューロトロフィン受容体、PTH受容体、甲状腺ホルモン受容体およびインスリン受容体を含む。
リンパ系マーカーは、アルファ-1-抗キモトリプシン、アルファ-1-抗トリプシン、B細胞マーカー、bcl-2、bcl-6、Bリンパ球抗原36kD、BM1(骨髄系マーカー)、BM2(骨髄系マーカー)、ガレクチン-3、グランザイムB、HLAクラスI抗原、HLAクラスII(DP)抗原、HLAクラスII(DQ)抗原、HLAクラスII(DR)抗原、ヒト好中球デフェンシン、免疫グロブリンA、免疫グロブリンD、免疫グロブリンG、免疫グロブリンM、カッパ軽鎖、カッパ軽鎖、ラムダ軽鎖、リンパ球/組織球抗原、マクロファージマーカー、ムラミダーゼ(リゾチーム)、p80未分化リンパ腫キナーゼ、形質細胞マーカー、分泌白血球プロテアーゼ阻害剤、T細胞抗原受容体(JOVI 1)、T細胞抗原受容体(JOVI 3)、ターミドヌクレオチジルトランスフェラーゼ、非クラスター化B細胞マーカーを含む。
腫瘍マーカーは、アルファフェトプロテイン、アポリポタンパク質D、BAG-1(RAP46タンパク質)、CA19-9(シアリルルイス)、CA50(癌腫関連ムチン抗原)、CA125(卵巣癌抗原)、CA242(腫瘍関連ムチン抗原)、クロモグラニンA、クラステリン(アポリポタンパク質J)、上皮膜抗原、上皮関連抗原、上皮特異的抗原、上皮成長因子受容体、エストロゲン受容体(ER)、肉眼的嚢胞性疾患流体タンパク質-15、肝細胞特異的抗原、HER2、ヘレグリン、ヒト胃ムチン、ヒト乳脂肪球、MAGE-1、マトリックスメタロプロテイナーゼ、メランA、メラノーママーカー(HMB45)、メソテリン、メタロチオネイン、微小フタル転写因子(MITF)、Muc-1コア糖タンパク質、Muc-1糖タンパク質、Muc-2糖タンパク質、Muc-5AC糖タンパク質、Muc-6糖タンパク質、ミエロペルオキシダーゼ、Myf-3(横紋筋肉腫マーカー)、Myf-4(横紋筋肉腫マーカー)、MyoD1(横紋筋肉腫マーカー)、ミオグロビン、nm23タンパク質、胎盤アルカリホスファターゼ、プレアルブミン、プロゲステロン受容体、前立腺特異的抗原、前立腺酸性ホスファターゼ、前立腺インヒビンペプチド、PTEN、腎細胞癌マーカー、小腸粘液性抗原、テトラネクチン、甲状腺転写因子-1、マトリックスメタロプロテイナーゼ1の組織阻害剤、マトリックスメタロプロテイナーゼ2の組織阻害剤、チロシナーゼ、チロシナーゼ関連タンパク質-1、ビリン、フォンウィルブランド因子、CD34、CD34、クラスII、CD51 Ab-1、CD63、CD69、Chk1、Chk2、クラスピンC-met、COX6C、CREB、サイクリンD1、サイトケラチン、サイトケラチン8、DAPI、デスミン、DHP(1-6ジフェニル-1,3,5-ヘキサトリエン)、E-カドヘリン、EEA1、EGFR、EGFRvIII、EMA(上皮膜抗原)、ER、ERB3、ERCC1、ERK、E-セレクチン、FAK、フィブロネクチン、FOXP3、ガンマ-H2AX、GB3、GFAP、ジャイアンチン、GM130、Golgin 97、GRB2、GRP78BiP、GSK3ベータ、HER-2、ヒストン3、ヒストン3_K14-エース[抗アセチル-ヒストンH3(Lys 14)]、ヒストン3_K18-エース[ヒストンH3-アセチルLys 18)、ヒストン3_K27-TriMe、[ヒストンH3(トリメチルK27)]、ヒストン3_K4-diMe[アンチジメチル-ヒストンH3(Lys 4)]、ヒストン3_K9-エース[アセチル-ヒストンH3(Lys 9)]、ヒストン3_K9-triMe[ヒストン3-トリメチルLys9]、ヒストン3_S10-Phos[抗Phospho ヒストンH3(Ser 10)、有糸分裂マーカー]、ヒストン4、ヒストンH2A.X-5139-Phos[Phospho ヒストンH2A.X(Ser139)抗体]、ヒストンH2B、ヒストンH3_DiMethyl K4、ヒストンH4_TriMethyl K20-Chip grad、HSP70、ウロキナーゼ、VEGF R1、ICAM-1、IGF-1、IGF-1R、IGF-1レセプタベータ、IGF-II、IGF-IIR、IKB-Alpha IKKE、IL6、IL8、インテグリンアルファVベータ3、インテグリンアルファVベータ6、インテグリンアルファV/CD51、インテグリンB5、インテグリンB6、インテグリンB8、インテグリンベータ1(CD 29)、インテグリンベータ3、インテグリンベータ5インテグリンB6、IRS-1、Jagged 1、抗プロテインキナーゼC Beta2、LAMP-1、ライトチェーンAb-4(カクテル)、ラムダ軽鎖、カッパ軽鎖、M6P、Mach 2、MAPKAPK-2、MEK 1、MEK 1/2(Ps222)、MEK 2、MEK1/2(47E6)、MEK1/2ブロッキングペプチド、MET/HGFR、MGMT、ミトコンドリア抗原、Mitotracker Green FM、MMP-2、MMP9、E-カドヘリン、mTOR、ATPase、N-カドヘリン、ネフリン、NFKB、NFKB p105/p50、NF-KB P65、ノッチ1、ノッチ2、ノッチ3、OxPhos複合体IV、p130Cas、p38 MAPK、p44/42MAPK抗体、P504S、P53、P70、P70 S6K、パンカドヘリン、パキシリン、P-カドヘリン、PDI、pEGFR、ホスホAKT、ホスホCREB、ホスホEGF受容体、ホスホGSK3ベータ、ホスホH3、ホスホHSP-70、ホスホMAPKAPK-2、PHospho MEK1/2、phospho p38 MAPキナーゼ、Phospho p44/42 MAPK、Phospho p53、Phospho PKC、Phospho S6リボソームタンパク質、Phospho Src、Phospho-Akt、Phospho-Bad、Phospho-IKB-a、Phospho-mTOR、Phospho-NF-カッパB P65、Phospho-p38、Phospho-p44/42 MAPK、Phospho-p70 S6キナーゼ、Phospho-Rb、Phospho-Smad2、PIM1,PIM2,PKCβ,ポドカリキシン、PR、PTEN、R1、Rb 4H1、R-カドヘリン、リボヌクレオチドレダクターゼ、RRM1、RRM11、SLC7A5、NDRG、HTF9C、HTF9C、CEACAM、p33、S6リボソームタンパク質、Src、サバイビン、シナポポディン、シンデカン4、タリン、テンシン、チミジル酸シンターゼ、ツベリン、VCAM-1、VEGF、ビメンチン、凝集素、YES、ZAP-70およびZEBを含む。
細胞周期関連マーカーは、アポトーシスプロテアーゼ作動因子-1、bcl-w、bcl-x、ブロモデオキシウリジン、CAK(cdk作動キナーゼ)、細胞アポトーシス感受性タンパク質(CAS)、カスパーゼ2、カスパーゼ8、CPP 32(カスパーゼ-3)、CPP 32(カスパーゼ-3)、サイクリン依存性キナーゼ、サイクリンA、サイクリンB1、サイクリンD1、サイクリンD2、サイクリンD3、サイクリンE、サイクリンG、DNA断片化因子(N末端)、Fas(CD95)、Fas関連デスドメインタンパク質、Fasリガンド、Fen-1、IPO-38、Mc1-1、ミニ染色体維持タンパク質、ミスマッチ修復タンパク質(MSH2)、ポリ(ADP-リボース)ポリメラーゼ、増殖細胞核抗原、p16タンパク質、p27タンパク質、p34cdc2、p57タンパク質(Kip2)、p105タンパク質、Stat1α、トポイソメラーゼI、トポイソメラーゼIIα、トポイソメラーゼIIIα、トポイソメラーゼIIβを含む。
神経組織マーカーおよび腫瘍マーカーは、αBクリスタリン、α-インターネキシン、αシヌクレイン、アミロイド前駆体タンパク質、βアミロイド、カルビンジン、コリンアセチルトランスフェラーゼ、興奮性アミノ酸輸送体1、GAP43、グリア原線維酸性タンパク質、グルタミン酸受容体2、ミエリン塩基性タンパク質、神経成長因子受容体(gp75)、神経芽細胞腫マーカー、神経線維68 kD、神経線維160 kD、神経線維200 kD、ニューロン特異的エノラーゼ、ニコチン性アセチルコリン受容体アルファ4、ニコチン性アセチルコリン受容体ベータ2、ペリフェリン、タンパク質遺伝子産物9、S-100タンパク質、セロトニン、SNAP-25、シナプシンI、シナプトフィシン、タウ、トリプトファンヒドロキシラーゼ、チロシンヒドロキシラーゼ、ユビキチンを含む。
クラスター分化マーカーは、CD1a、CD1b、CD1c、CD1d、CD1e、CD2、CD3delta、CD3epsilon、CD3gamma、CD4、CD5、CD6、CD7、CD8alpha、CD8beta、CD9、CD10、CD11a、CD11b、CD11c、CDw12、CD13、CD14、CD15、CD15s、CD16a、CD16b、CDw17、CD18、CD19、CD20、CD21、CD22、CD23、CD24、CD25、CD26、CD27、CD28、CD29、CD30、CD31、CD32、CD33、CD34、CD35、CD36、CD37、CD38、CD39、CD40、CD41、CD42a、CD42b、CD42c、CD42d、CD43、CD44、CD44R、CD45、CD46、CD47、CD48、CD49a、CD49b、CD49c、CD49d、CD49e、CD49f、CD50、CD51、CD52、CD53、CD54、CD55、CD56、CD57、CD58、CD59、CDw60、CD61、CD62E、CD62L、CD62P、CD63、CD64、CD65、CD65s、CD66a、CD66b、CD66c、CD66d、CD66e、CD66f、CD68、CD69、CD70、CD71、CD72、CD73、CD74、CDw75、CDw76、CD77、CD79a、CD79b、CD80、CD81、CD82、CD83、CD84、CD85、CD86、CD87、CD88、CD89、CD90、CD91、CDw92、CDw93、CD94、CD95、CD96、CD97、CD98、CD99、CD100、CD101、CD102、CD103、CD104、CD105、CD106、CD107a、CD107b、CDw108、CD109、CD114、CD115、CD116、CD117、CDw119、CD120a、CD120b、CD121a、CDw121b、CD122、CD123、CD124、CDw125、CD126、CD127、CDw128a、CDw128b、CD130、CDw131、CD132、CD134、CD135、CDw136、CDw137、CD138、CD139、CD140a、CD140b、CD141、CD142、CD143、CD144、CDw145、CD146、CD147、CD148、CDw149、CDw150、CD151、CD152、CD153、CD154、CD155、CD156、CD157、CD158a、CD158b、CD161、CD162,CD163,CD164,CD165,CD166,およびTCRゼータを含む。
他の細胞マーカーは、セントロメアタンパク質-F(CENP-F)、ジアンチン、インボルクリン、ラミンA&C[XB 10]、LAP-70、ムチン、核孔複合体タンパク質、p180層状体タンパク質、ran、r、カテプシンD、Ps2タンパク質、Her2-neu、P53、S100、上皮マーカー抗原(EMA)、TdT、MB2、MB3、PCNAおよびKi67を含む。
組織染色
本開示の訓練生物学的検体は、特定のバイオマーカーまたは様々な種類の細胞もしくは細胞区画と直接反応する色素または染色剤、組織化学物質、核酸プローブまたは免疫組織化学物質などの任意の試薬またはバイオマーカーラベルを使用して染色されることができる。そのような組織化学品は、透過型顕微鏡検査法により検出可能な発色団、又は、蛍光顕微鏡検査法により検出可能な発蛍光団であってよい。一般的に、細胞を含む試料は、対象の化学グループに直接反応する、又はそれらと結合する、少なくとも1つの組織化学品を含む溶液を用いて培養され得る。いくつかの組織化学品は、典型的には、染色を可能にする色止め料又は金属を用いて共に培養される。細胞を含む試料は、対象のコンポーネントを染色する少なくとも1つの組織化学品と、対比染色剤として作用し、対象のコンポーネントの外側の領域に結合する別の組織化学品と、の混合物を用いて培養され得る。代替的に、複数のプローブの混合物が、染色において使用され得、これが、特定のプローブの位置を特定する方法を提供する。本開示の訓練生物学的検体は、目的の細胞成分である酵素のための適切な基質および酵素活性部位に着色沈殿物を生じる適切な試薬と共インキュベートされることができる。
免疫組織化学は、最も高感度で特異的な組織化学技術の1つである。本開示の任意の訓練生物学的検体は、特異的結合剤を含む標識結合組成物と組み合わせられることができる。フルオロフォア、または光を吸収するかまたは蛍光を発する生成物を生成する酵素などの様々な標識が使用されることができる。単一の結合事象に関して強い信号を提供する多種多様な標識が知られている。染色に使用される複数のプローブは、2つ以上の識別可能な蛍光標識で標識されることができる。これらの色の違いは、特定のプローブの位置を識別する方法を提供する。フルオロフォアとタンパク質、例えば抗体とのコンジュゲートを調製する方法は、文献に広く記載されており、ここでの例示を必要としない。
研究に使用され、限られた症例では様々な疾患の診断に使用される適切な免疫組織化学染色の例には、例えば、抗エストロゲン受容体抗体(乳癌)、抗プロゲステロン受容体抗体(乳癌)、抗p 53抗体(多発性癌)、抗Her-2/neu抗体(多発性癌)、抗EGFR抗体(上皮成長因子、複数の癌)、抗カテプシンD抗体(乳癌および他の癌)、抗Bcl-2抗体(アポトーシス細胞)、抗E-カドヘリン抗体、抗CA 125抗体(卵巣癌および他の癌)、抗CA 15-3抗体(乳癌)、抗CA 19-9抗体(結腸癌)、抗c-erbB-2抗体、抗P-糖タンパク質(MDR、多剤耐性)、抗CEA抗体(癌胎児性抗原)、抗網膜芽細胞腫タンパク質(Rb)抗体、抗rasネオタンパク質(p 21)抗体、抗X(CD 15とも呼ばれる抗Ki-67抗体、抗増殖抗体(細胞増殖)、抗PCNA(多発性癌)抗体、抗CD 3抗体(T細胞)、抗CD 4抗体(ヘルパーT細胞)、抗CD 5抗体(T細胞)、抗CD 7抗体(胸腺細胞、未成熟T細胞、NKキラー細胞)、抗CD 8抗体(サプレッサーT細胞)、抗CD 9/p 24抗体(ALL)、抗CD 10(CALLAとも呼ばれる)抗体(一般的な急性リンパ芽球性白血病)、抗CD 11 c抗体(単球、顆粒球、AML)、抗CD 13抗体(骨髄単球性細胞、AML)、抗CD 14抗体(成熟単球、顆粒球)、抗CD 15抗体(ホジキン病)、抗CD 19抗体(B細胞)、抗CD 20抗体(B細胞)、抗CD 22抗体(B細胞)、抗CD 23抗体(活性化B細胞、CLL)、抗CD 30抗体(活性化T細胞およびB細胞、ホジキン病)、抗CD 31抗体(血管新生マーカー)、抗CD 33抗体(骨髄系細胞、AML)、抗CD 34抗体(内皮幹細胞、間質腫瘍)、抗CD 35抗体(樹状細胞)、抗CD 38抗体(上皮成長因子、複数の癌)、抗CD 41抗体(MDR、多剤耐性)、抗LCA/CD 45抗体(白血球共通抗原)、抗CD 45 RO抗体(胸腺細胞、未成熟T細胞、NKキラー細胞)、抗CD 45 RA抗体(B細胞)、抗CD 39、CD 100抗体、抗CD 95/Fas抗体(アポトーシス)、抗CD 99抗体(単球、顆粒球、AML)、抗CD 106抗体(骨髄単球性細胞、AML)、抗ユビキチン抗体(アルツハイマー病)、抗CD 71(トランスフェリン受容体)抗体、抗c-myc(癌タンパク質およびハプテン)抗体、抗サイトケラチン(トランスフェリン受容体)抗体、抗ビメンチン(内皮細胞)抗体(BおよびT細胞)、抗HPVタンパク質(ヒトパピローマウイルス)抗体、抗カッパ軽鎖抗体(B細胞)、抗ラムダ軽鎖抗体(B細胞)、抗メラノソーム(HMB 45)抗体(黒色腫)、抗前立腺特異抗原(PSA)抗体(前立腺癌)、抗S-100抗体(成熟単球、顆粒球)、抗タウ抗原抗体(アルツハイマー病)、抗フィブリン抗体(上皮細胞)、抗ケラチン抗体、抗サイトケラチン抗体(腫瘍)、抗アルファ-カテニン(細胞膜)、抗Tn抗原抗体(活性化B細胞、CLL);抗-1,8-ANS(1-アニリノナフタレン-8-スルホン酸)抗体;抗C 4抗体;抗2 C 4 CASPグレード抗体;抗2 C 4 CASP抗体;抗HER-2抗体;抗アルファBクリスタリン抗体;抗αガラクトシダーゼA抗体;抗α-カテニン抗体;抗ヒトVEGF R 1(Flt-1)抗体;抗インテグリンB 5抗体;抗インテグリンベータ6抗体;抗ホスホ-SRC抗体;抗バッグ抗体;抗BCL-2抗体;抗BCL-6抗体;抗βカタニン抗体;抗βカテニン抗体;抗インテグリンαVβ3抗体;抗c ErbB-2 Ab-12抗体;抗カルネキシン抗体;抗カルレティキュリン抗体;抗カルレティキュリン抗体;抗CAM 5.2(抗サイトケラチン低モル。重量)抗体;抗カルジオチン(R 2 G)抗体;抗カテプシンD抗体;ガラクトシダーゼαに対するニワトリのポリクローナル抗体;抗c-Met抗体;抗CREB抗体;抗COX 6 C抗体;抗サイクリンD 1 Ab-4抗体;抗サイトケラチン抗体;抗デスミン抗体;抗DHP(1-6ジフェニルー1,3,5-ヘキサトリエン)抗体;DSB-X Biotinヤギ抗ニワトリ抗体;抗E-カドヘリン抗体;抗EEA 1抗体;抗EGFR抗体;抗EMA(上皮膜抗原)抗体;抗ER(エストロゲン受容体)抗体;抗ERB 3抗体;抗ERCC 1 ERK(Pan ERK)抗体;抗E-セレクチン抗体;抗FAK抗体;抗フィブロネクチン抗体;FITC-ヤギ抗マウスIgM抗体;抗FOXP 3抗体;抗GB 3抗体;抗GFAP(グリア線維性酸性タンパク質)抗体;抗Giantin抗体;抗GM 130抗体;抗ヤギ抗hMet抗体;抗Golgin 97抗体;抗GRB 2抗体;抗GRP 78 BiP抗体;抗GSK-3β抗体;抗肝細胞抗体;抗HER-2抗体;抗HER-3抗体;抗ヒストン3抗体;抗ヒストン4抗体;抗ヒストンH 2 A X抗体;抗ヒストンH 2 B抗体;抗HSP 70抗体;抗ICAM-1抗体;抗IGF-1抗体;抗IGF-1受容体抗体;抗IGF-1受容体ベータ抗体;抗IGF-II抗体;抗IKB-α抗体;抗IL 6抗体;抗IL 8抗体;抗インテグリンベータ3抗体;抗インテグリンベータ5抗体;抗インテグリンb 8抗体;抗Jagged 1抗体;抗プロテインキナーゼCベータ2抗体;抗LAMP-1抗体;抗M 6 P(マンノース6リン酸受容体)抗体;抗MAPKAPK-2抗体;抗MEK 1抗体;抗MEK 2抗体;抗ミトコンドリア抗原抗体;抗ミトコンドリアマーカー抗体;抗マイトトラッカーグリーンFM抗体;抗MMP-2抗体;抗MMP 9抗体;抗Na+/K ATPアーゼ抗体;抗Na+/K ATPase Alpha 1抗体;抗Na+/K ATPase Alpha 3抗体;抗N-カドヘリン抗体;抗ネフリン抗体;抗NF-KB p 50抗体;抗NF-KB P 65抗体;抗Notch 1抗体;抗OxPhos複合体IV-Alexa 488複合体抗体;抗p 130 Cas抗体;抗P 38 MAPK抗体;抗p 44/42 MAPK抗体;抗P 504 Sクローン13 H 4抗体;抗P 53抗体;抗P 70 S 6 K抗体;抗P 70ホスホキナーゼブロッキングペプチド抗体;抗Pan Cadherin抗体;抗パキシリン抗体;抗P-カドヘリン抗体;抗PDI抗体;抗ホスホAKT抗体;抗ホスホCREB抗体;抗ホスホGSK-3-ベータ抗体;抗ホスホGSK-3β抗体;抗ホスホH 3抗体;抗ホスホMAPKAPK-2抗体;抗ホスホMEK抗体;抗ホスホp 44/42 MAPK抗体;抗ホスホp 53抗体;抗ホスホ-NF-KB p 65抗体;抗ホスホ-p 70 S 6キナーゼ抗体;抗ホスホPKC(Pan)抗体;抗ホスホS 6リボソームタンパク質抗体;抗ホスホSrc抗体;抗リンパッド抗体;抗ホスホ-HSP 27抗体;抗ホスホ-IKB-a抗体;抗ホスホ-p 44/42 MAPK抗体;抗ホスホ-p 70 S 6キナーゼ抗体;抗ホスホ-Rb(Ser 807/811)(網膜芽細胞腫)抗体;抗Phosopho HSP-7抗体;抗Phsoff-p 38抗体;抗Pim-1抗体;抗Pim-2抗体;抗PKCβ抗体;抗PKCβ11抗体;抗ポドカリキシン抗体;抗PR抗体;抗PTEN抗体;抗R 1抗体;抗Rb 4 H 1(網膜芽細胞腫)抗体;抗R-カドヘリン抗体;抗RRM 1抗体;抗S 6リボソームタンパク質抗体;抗S-100抗体;抗シナプトポジン抗体;抗シナプトポジン抗体;抗シンデカン4抗体;抗タリン抗体;抗テンシン抗体;抗ツベルリン抗体;抗ウロキナーゼ抗体;抗VCAM-1抗体;抗VEGF抗体;抗ビメンチン抗体;抗ZAP-70抗体;および抗ZEB。
一次抗体にコンジュゲートさせることができるフルオロフォアとしては、限定されないが、フルオレセイン、ローダミン、テキサスレッド、Cy 2、Cy 3、Cy 5、VECTORレッド、ELF(商標)(酵素標識蛍光)、Cy 0、Cy 0.5、Cy 1、Cy 1.5、Cy 3、Cy 3.5、Cy 5、Cy 7、Fluor X、カルセイン、カルセイン-AM、CRYPTOFLUOR(商標)’S、オレンジ(42 kDa)、タンゲリン(35 kDa)、金(31 kDa)、レッド(42 kDa)、クリムソン(40 kDa)、BHMP、BHDMAP、Br-オレゴン、ルシファーイエロー、Alexa色素ファミリー、N-[6-(7-ニトロベンゼン-2-オキサ-1,3-ジアゾール-4-イル)-アミノ]カプロイル](NBD)、BODIPY(商標)、ボロンジピロメテンジフルオリドフッ化物、オレゴングリーン、MITTRACKER(商標)レッド、DiOC 7(3)、DiIC 18、フィコエリトリン、フィコビリタンパク質BPE(240 kDa)RPE(240 kDa)CPC(264 kDa)APC(104 kDa)、Spectrum Blue、Spectrum Aqua、Spectrum Green、Spectrum Gold、Spectrum Orange、Spectrum Red、NADH、NADPH、FAD、Infra-Red(IR)Dyes、Cyclic GDP-Ribose(cGDPR)、Calcofluor White、リサミン、ウンベリフェロン、チロシンおよびトリプトファン。多種多様な他の蛍光プローブは、Handbook of Fluorescent Probes and Research Products 8 th Edから入手可能であり、および/またはHandbook of Fluorescent Probes and Research Products 8 th Edに広く記載されている。(2001)、Molecular Probes、Eugene、Oregから入手可能。、ならびに他の多くの製造業者を含む。
シグナルのさらなる増幅は、特異的結合剤、例えば抗体および抗抗体の組み合わせを使用することによって達成することができ、ここで、抗抗体は、標的抗体プローブの保存領域に結合し、特に、抗体は異なる種に由来する。あるいは、ビオチン-ストレプトアビジンなどの特異的結合リガンド-受容体対を使用してもよく、一次抗体は対の一方のメンバーにコンジュゲートされ、他方のメンバーは検出可能なプローブで標識される。したがって、第1の結合メンバーが細胞成分に結合し、二次結合を提供するように働く結合メンバーのサンドイッチを効果的に構築し、二次結合メンバーは標識を含んでも含まなくてもよく、三次結合メンバーが標識を提供する三次結合をさらに提供してもよい。
二次抗体、アビジン、ストレプトアビジンまたはビオチンは、それぞれ独立して、検出可能な部分で標識されており、これは、実質的に不溶性の呈色反応生成物、蛍光色素(染色)、発光色素または非蛍光色素を有する基質の比色反応を指示する酵素であり得る。これらの選択肢のそれぞれに関する例を以下に列挙する。
原則として、(i)一次抗体に結合体化され得るか、または一次抗体に間接的に結合し得る(例えば、コンジュゲート化アビジン、ストレプトアビジン、ビオチン、二次抗体を介して)、および(ii)可溶性基質を使用して不溶性生成物(沈殿物)を提供する任意の酵素を使用することができる。使用される酵素は、例えば、アルカリホスファターゼ、西洋ワサビペルオキシダーゼ、β-ガラクトシダーゼおよび/またはグルコースオキシダーゼであり得る。基質は、それぞれアルカリホスファターゼ、西洋ワサビペルオキシダーゼ、ベータであり得る。-ガラクトシダーゼまたはグルコースオキシダーゼ基質。
アルカリホスファターゼ(AP)基質としては、AP-Blue基質(青色沈殿物、Zymedカタログp。61)が挙げられるが、これらに限定されない。AP-オレンジ基板(オレンジ色、沈殿物、Zymed)、AP-Red基板(赤色、赤色沈殿物、Zymed)、5-ブロモ、4-クロロ、3-インドリホスフェート(BCIP基質、ターコイズ沈殿物)、5-ブロモ、4-クロロ、3-インドリルホスフェート/ニトロブルーテトラゾリウム/ヨードニトロテトラゾリウム(BCIP/INT基板、黄褐色沈殿物、Biomeda)、5-ブロモ、4-クロロ、3-インドリホスフェート/ニトロブルーテトラゾリウム(BCIP/NBT基板、青/紫)、5-ブロモ、4-クロロ、3-インドリルホスフェート/ニトロブルーテトラゾリウム/ヨードニトロニトロニトロテトラゾリウム(BCIP/NBT/INT)、褐色沈殿物、DAKO、ファーストレッド(Red)、マゼンタ-ホス(マゼンタ)、ナフトールAS-BI-ホスフェート(NABP)/ファーストレッドTR(Red)、ナフトールAS-BI-ホスフェート(NABP)/ニューフクシン(Red)、ナフトールAS-MX-ホスフェート(NAMP)/ニューフクシン(Red)、新しいフクシンAP基質(赤色)、p-ニトロフェニルホスフェート(PNPP、黄色、水溶性)、VECTOR(商標)ブラック(黒色)、VECTOR(商標)ブルー(青色)、VECTOR(商標)レッド(赤色)、Vegaレッド(ラズベリー赤色)。
西洋ワサビペルオキシダーゼ(HRP、略してPO)基質としては、2,2’アジノ-ジ-3-エチルベンズチアゾリンスルホネート(ABTS、緑色、水溶性)、アミノエチルカルバゾール、3-アミノ、9-エチルカルバゾールAEC(3 A 9 EC、赤)が挙げられるが、これらに限定されない。α-ナフトールピロニン(赤)、4-クロロ-1-ナフトール(4 C 1 N、青色、青黒色)、3,3’-ジアミノベンジジン四塩酸塩(DAB、褐色)、オルトジアニシジン(緑)、o-フェニレンジアミン(OPD、褐色、水溶性)、TACS Blue(青)、TACS Red(赤)、3,3’、5,5’テトラメチルベンジジン(TMB、緑色または緑色/青色)、TRUE BLUETM(青)、VECTOR(商標)VIP(紫)、VECTOR(商標)SG(滑らかな青灰色)、およびZymed Blue HRP基質(鮮やかな青)。
グルコースオキシダーゼ(GO)基質としては、ニトロブルーテトラゾリウム(NBT、紫色沈殿)、テトラニトロブルーテトラゾリウム(TNBT、黒色沈殿物)、2-(4-ヨードフェニル)-5-(4-ニトロフェニル)-3-フェニルテトラゾリウムクロリド(INT、赤色または橙色の沈殿物)、テトラゾリウムブルー(青)、ニトロテトラゾリウムバイオレット(紫)および3-(4,5-ジメチルチアゾール-2-イル)-2,5-ジフェニルテトラゾリウムブロミド(MTT、紫色)が挙げられるが、これらに限定されない。全てのテトラゾリウム基質は、共基質としてグルコースを必要とする。グルコースが酸化され、テトラゾリウム塩が還元され、色沈殿物を形成する不溶性ホルマザンを形成する。
β-ガラクトシダーゼ基質としては、5-ブロモ-4-クロロ-3-インドイルβ-D-ガラクトピラノシド(X-gal、青色沈殿)が挙げられるが、これらに限定されない。列挙した各基質に関連する沈殿物は、固有の検出可能なスペクトルシグネチャ(成分)を有する。
酵素はまた、限定されないがルシフェリンおよびATPまたはセレンテラジンおよびCaなどの第2の基質の発光または第2の反応を指示することができる実質的に不溶性の反応生成物を有する、限定されないがルシフェラーゼおよびエクオリンなどの基質の発光反応を触媒することを対象とすることができる。2+、発光生成物を有する。
核酸バイオマーカーは、in-situハイブリダイゼーション(ISH)を使用して検出され得る。一般に、核酸配列プローブは、蛍光プローブまたは検出可能な部分で標識されたビオチン/アビジンなどのリガンド:受容体対の1つのメンバーのいずれかで合成および標識される。例示的なプローブおよび部分は、前のセクションに記載されている。配列プローブは、細胞内の標的ヌクレオチド配列に相補的である。標的ヌクレオチド配列を含む各細胞または細胞区画は、標識プローブに結合することができる。
分析に使用されるプローブは、DNAまたはRNAオリゴヌクレオチドまたはポリヌクレオチドのいずれかとすることができ、天然に存在するヌクレオチドだけでなく、ジオキシゲニンdCTP、ビオチンdcTP 7-アザグアノシン、アジドチミジン、イノシンまたはウリジンなどのそれらの類似体を含むことができる。他の有用なプローブは、ペプチドプローブおよびその類似体、分枝遺伝子DNA、ペプチド模倣物、ペプチド核酸および/または抗体を含む。プローブは、標的核酸配列とプローブとの間で安定且つ特異的な結合が起こるように、目的の標的核酸配列に対して十分な相補性を有するべきである。安定なハイブリダイゼーションに必要な相同性の程度は、ハイブリダイゼーションのストリンジェンシーによって異なる。ISH、ハイブリダイゼーションおよびプローブ選択のための従来の方法論は、Leitchら、In Situ Hybridization:a practical guide,Oxford BIOS Scientific Publishers,Microscopy Handbooks v.27(1994);およびSambrook,J.、Fritsch,E.F.、Maniatis,T.、Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press(1989)に記載されている。
他のシステム構成要素
本開示のシステム200は、組織検体に対して1つまたは複数の調製プロセスを実行することができる検体処理装置に結び付けられることができる。調製プロセスは、限定されるものではないが、検体の脱パラフィン、検体のコンディショニング(例えば、細胞コンディショニング)、検体の染色、抗原検索の実行、免疫組織化学染色(標識を含む)または他の反応の実行、および/またはインサイチュハイブリッド形成(例えば、SISH、FISHなど)染色(標識を含む)または他の反応の実行、ならびに顕微鏡検査、微量分析、質量分析法、または他の分析方法のための検体を調製するための他のプロセスを含むことができる。
処理装置は、検体に固定液を塗布することができる。固定剤は、架橋剤(例えば、ホルムアルデヒド、パラホルムアルデヒド、およびグルタルアルデヒドなどのアルデヒド、ならびに非アルデヒド架橋剤)、酸化剤(例えば、四酸化オスミウムおよびクロム酸などの金属イオンおよび複合体)、タンパク質変性剤(例えば、酢酸、メタノール、エタノール)、メカニズム不明の固定剤(例えば、塩化水銀、アセトン、およびピクリン酸)、配合試薬(例えば、カルノイ固定剤、メタカーン、ブアン液、B5固定剤)、ロスマンの液体、およびゲンドレの液体、マイクロ波、およびその他の固定剤(例えば、容積固定および蒸気固定を除外)を含むことができる。
検体がパラフィンに埋め込まれた試料である場合、試料は、適切な脱パラフィン液を使用して脱パラフィン化されることができる。パラフィンを除去した後、任意の数の物質を連続して検体に塗布することができる。物質は、前処理(例えば、タンパク質架橋を逆転させる、核酸を露出させるなど)、変性、ハイブリッド形成、洗浄(例えば、厳密洗浄)、検出(例えば、視覚的またはマーカ分子のプローブへの連結)、増幅(例えば、タンパク質、遺伝子などの増幅)、逆染色、カバースリップなどのためのものとすることができる。
検体処理装置は、検体に幅広い物質を塗布することができる。物質は、これらに限定されるものではないが、染色剤、プローブ、試薬、リンス、および/またはコンディショナを含む。物質は、流体(例えば、気体、液体、または気体/液体混合物)などとすることができる。液体は、溶媒(例えば、極性溶媒、非極性溶媒など)、溶液(例えば、水溶液または他のタイプの溶液)などとすることができる。試薬には、染色剤、湿潤剤、抗体(例えば、モノクローナル抗体、ポリクローナル抗体など)、抗原回収液(例えば、水性または非水性ベースの抗原回収溶液、抗原回収緩衝液など)が含まれ得るが、これらに限定されない。プローブは、検出可能な標識またはレポータ分子に付着した、単離された核酸または単離された合成オリゴヌクレオチドとすることができる。標識は、放射性同位元素、酵素基質、補因子、リガンド、化学発光または蛍光剤、ハプテン、および酵素を含むことができる。
検体が処理された後、ユーザは、検体を含むスライドを画像化装置に輸送することができる。いくつかの実施形態では、画像化装置は、明視野イメージャスライドスキャナである。明視野イメージャの1つは、Ventana Medical Systems,Inc.によって販売されているiScan HTおよびDP200(Griffin)明視野スキャナである。自動化された実施形態では、画像化装置は、「IMAGING SYSTEM AND TECHNIQUES」と題された、国際特許出願第PCT/US2010/002772(特許公開第WO/2011/049608号)号に開示された、または2011年9月9日に出願され、「IMAGING SYSTEMS,CASSETTES,AND METHODS OF USING THE SAME」と題された米国特許出願第61/533,114号に開示されたデジタル病理装置である。国際特許出願第PCT/US2010/002772号および米国特許出願第61/533,114号は、参照によりそれらの全体が組み込まれる。
本明細書に記載の主題および動作の実施形態は、デジタル電子回路、または本明細書に開示される構造およびそれらの構造的均等物を含むコンピュータソフトウェア、ファームウェア、またはハードウェア、またはそれらの1つ以上の組み合わせで実装されることができる。本明細書に記載の主題の実施形態は、1つ以上のコンピュータプログラム、すなわち、データ処理装置による実行のために、またはデータ処理装置の動作を制御するためにコンピュータ記憶媒体上に符号化されたコンピュータプログラム命令の1つ以上のモジュールとして実装されることができる。本明細書で説明されるモジュールのいずれも、プロセッサによって実行されるロジックを含むことができる。本明細書で使用される「ロジック」は、プロセッサの動作に影響を与えるために適用されることができる命令信号および/またはデータの形態を有する任意の情報を指す。ソフトウェアはロジックの例である。
コンピュータ記憶媒体は、コンピュータ可読記憶装置、コンピュータ可読記憶基板、ランダムまたはシリアルアクセスメモリアレイまたは装置、あるいはそれらの1つ以上の組み合わせとすることができるか、またはそれらに含まれることができる。さらに、コンピュータ記憶媒体は伝搬信号ではないが、コンピュータ記憶媒体は、人工的に生成された伝搬信号に符号化されたコンピュータプログラム命令のソースまたは宛先とすることができる。コンピュータ記憶媒体はまた、1つ以上の別個の物理的コンポーネントまたは媒体(例えば、複数のCD、ディスク、または他の記憶装置)とすることができるか、またはそれらに含まれることができる。本明細書に記載されている動作は、1つ以上のコンピュータ可読記憶装置に記憶されているか、または他のソースから受信されたデータに対してデータ処理装置によって実行される動作として実装されることができる。
「プログラムされたプロセッサ」という用語は、データを処理するためのあらゆる種類の装置、装置、およびマシンを包含し、例えば、プログラム可能なマイクロプロセッサ、コンピュータ、チップ上のシステム、または前述の複数のもの、またはそれらの組み合わせを含む。装置は、FPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)などの特別な目的のロジック回路を含むことができる。装置はまた、ハードウェアに加えて、当該コンピュータプログラムの実行環境を作成するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、クロスプラットフォームランタイム環境、仮想マシン、またはそれらの1つ以上の組み合わせを構成するコードを含むことができる。装置および実行環境は、ウェブサービス、分散コンピューティング、グリッドコンピューティングインフラストラクチャなど、様々な異なるコンピューティングモデルインフラストラクチャを実現することができる。
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとも呼ばれる)は、コンパイルまたは解釈された言語、宣言言語または手続き型言語を含む、あらゆる形式のプログラミング言語で記述されることができ、スタンドアロンプログラムとして、またはモジュール、コンポーネント、サブルーチン、オブジェクト、またはコンピューティング環境での使用に適したその他のユニットとして含む、あらゆる形式で展開されることができる。コンピュータプログラムは、ファイルシステム内のファイルに対応することができるが、対応する必要はない。プログラムは、他のプログラムまたはデータを保持するファイルの一部(例えば、マークアップ言語ドキュメントに保存された1つ以上のスクリプト)、当該プログラム専用の単一ファイル、または複数の調整されたファイル(例えば、1つ以上のモジュール、サブプログラム、またはコードの一部を記憶するファイル)に記憶されることができる。コンピュータプログラムは、1台のコンピュータ、または1つのサイトに配置されているか、複数のサイトに分散され、通信ネットワークによって相互接続されている複数のコンピュータで実行されるように展開されることができる。
本明細書に記載のプロセスおよびロジックフローは、1つ以上のコンピュータプログラムを実行する1つ以上のプログラム可能なプロセッサによって実行され、入力データを操作して出力を生成することによってアクションを実行することができる。プロセスおよびロジックフローは、FPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)などの特殊用途のロジック回路によって実行されることもでき、装置は、それらとして実装されることもできる。
コンピュータプログラムの実行に適したプロセッサは、例として、汎用および特殊目的の双方のマイクロプロセッサ、および任意の種類のデジタルコンピュータの任意の1つ以上のプロセッサを含む。一般に、プロセッサは、読み取り専用メモリまたはランダムアクセスメモリ、あるいはその双方から命令とデータを受信する。コンピュータの本質的な要素は、命令に従ってアクションを実行するためのプロセッサと、命令およびデータを記憶するための1つ以上のメモリ装置である。一般に、コンピュータはまた、データを記憶するための1つ以上の大容量記憶装置、例えば、磁気ディスク、光磁気ディスク、または光ディスクを含むか、またはデータを受信するか、データを転送するか、またはその双方に動作可能に結合される。しかしながら、コンピュータは、そのような装置を必要とするわけではない。さらに、コンピュータは、ほんの数例を挙げると、別の装置、例えば、携帯電話、携帯情報端末(PDA)、モバイルオーディオまたはビデオプレーヤ、ゲームコンソール、全地球測位システム(GPS)受信機、またはポータブル記憶装置(例えば、ユニバーサルシリアルバス(USB)フラッシュドライブ)に組み込まれることができる。コンピュータプログラムの命令およびデータを記憶するのに適した装置は、例として半導体メモリ装置、例えば、EPROM、EEPROM、およびフラッシュメモリ装置を含む、全ての形態の不揮発性メモリ、メディアおよびメモリ装置、磁気ディスク、例えば、内蔵ハードディスクまたはリムーバブルディスク、光磁気ディスク、およびCD-ROMおよびDVD-ROMディスクを含む。プロセッサおよびメモリは、特別な目的のロジック回路によって補完され、またはこれに組み込まれることができる。
ユーザとの相互作用を提供するために、本明細書に記載の主題の実施形態は、ディスプレイ装置、例えば、LDC(液晶ディスプレイ)、LED(発光ダイオード)ディスプレイ、またはOLED(有機発光ダイオード)ディスプレイ、ユーザに情報を表示するためのディスプレイ、およびユーザがコンピュータに入力を提供することができる、キーボードおよびポインティング装置、例えば、マウスまたはトラックボールを有するコンピュータ上に実装されることができる。いくつかの実装形態では、タッチスクリーンが使用されて、情報を表示し、ユーザからの入力を受け取ることができる。他の種類の装置が使用されて、ユーザとの対話を提供することもできる。例えば、ユーザに提供されるフィードバックは、視覚的フィードバック、聴覚的フィードバック、または触覚的フィードバックなど、任意の形態の感覚的フィードバックとすることができる。また、ユーザからの入力は、音響、音声、または触覚入力を含む任意の形式で受信されることができる。さらに、コンピュータは、例えば、Webブラウザから受信した要求に応答して、ユーザのクライアント装置上のWebブラウザにWebページを送信することによるなど、ユーザが使用する装置との間でドキュメントを送受信することにより、ユーザと対話することができる。
本明細書に記載される主題の実施形態は、例えば、データサーバとしてのバックエンドコンポーネントを含むか、またはアプリケーションサーバなどのミドルウェアコンポーネントを含むか、または、例えば、ユーザがこの明細書に記載されている主題の実装と対話することができるグラフィカルユーザインタフェースまたはWebブラウザを有するクライアントコンピュータなどのフロントエンドコンポーネント、または1つ以上のそのようなバックエンド、ミドルウェア、またはフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムに実装されることができる。システムのコンポーネントは、デジタルデータ通信の任意の形式または媒体、例えば通信ネットワークによって相互接続されることができる。通信ネットワークの例は、ローカルエリアネットワーク(「LAN」)およびワイドエリアネットワーク(「WAN」)、ネットワーク間(例えば、インターネット)、およびピアツーピアネットワーク(例えば、アドホックピア-ピアツーピアネットワーク)を含む。例えば、図1のネットワーク20は、1つ以上のローカルエリアネットワークを含むことができる。
コンピューティングシステムは、任意の数のクライアントおよびサーバを含むことができる。クライアントおよびサーバは、通常、互いにリモートであり、通常、通信ネットワークを介して相互作用する。クライアントおよびサーバの関係は、それぞれのコンピュータ上で実行され且つクライアント-サーバの関係を互いに有するコンピュータプログラムによって発生する。いくつかの実施形態では、サーバは、(例えば、データを表示し、クライアント装置と対話するユーザからのユーザ入力を受信する目的で)データ(例えば、HTMLページ)をクライアント装置に送信する。クライアント装置で生成されたデータ(例えば、ユーザの操作の結果)は、サーバにおいてクライアント装置から受信されることができる。
代替実施形態
本開示の別の態様は、染色されていない試験生物学的検体から試験スペクトルデータを取得することを含む、未知の時間量にわたって固定されて処理された染色されていない試験生物学的検体における1つ以上のバイオマーカーの発現を予測する方法であって、試験スペクトルデータが、生物学的検体の少なくとも一部に由来する振動スペクトルデータを含み、訓練されたバイオマーカー発現推定エンジンを使用して、取得された試験スペクトルデータからバイオマーカー発現特徴を導出することと、バイオマーカー発現特徴に基づいて、試験生物学的検体の1つ以上のバイオマーカーの発現を予測することと、を含む、方法である。いくつかの実施形態では、予測されるバイオマーカー発現は、予測される陽性率または予測される染色強度のうちの1つを含む。いくつかの実施形態では、予測されるバイオマーカー発現は、予測される陽性率および予測される染色強度の双方を含む。いくつかの実施形態では、染色されていない試験生物学的検体の固定状態は未知である。
いくつかの実施形態では、バイオマーカー発現推定エンジンは、1つ以上の訓練スペクトルデータセットを使用して訓練され、各訓練スペクトルデータセットは、1つ以上のバイオマーカーの存在について染色された複数の訓練組織試料に由来する複数の訓練振動スペクトルを含み、各訓練振動スペクトルは、1つ以上のクラス標識を含む。いくつかの実施形態では、1つ以上のクラス標識は、1つ以上のバイオマーカーについての既知のバイオマーカー発現レベルを含む。いくつかの実施形態では、既知のバイオマーカー発現レベルは、1つ以上のバイオマーカーについての既知の陽性率および1つ以上のバイオマーカーについての既知の染色強度のうちの少なくとも1つを含む。いくつかの実施形態では、システムは、既知のマスキング解除期間、既知のマスキング解除温度、マスキング解除状態の定性的評価、既知の固定期間、および固定状態の定性的評価からなる群から選択される1つ以上のクラス標識をさらに含む。
いくつかの実施形態では、訓練スペクトルデータセットは、以下によって導出される:(i)訓練生物学的検体を取得すること;(ii)取得された訓練生物学的検体を複数の訓練組織試料に分割すること;(iii)取得された複数の訓練組織試料のそれぞれを、1つ以上のバイオマーカーの存在について染色すること;および(iv)1つ以上のバイオマーカーの発現を定量的に評価すること。いくつかの実施形態では、複数の訓練組織試料の各訓練組織試料は、差次的にマスキング解除されるか、差次的に固定されるか、または差次的にマスキング解除されて差次的に固定される。いくつかの実施形態では、1つ以上のバイオマーカーの定量的評価は、1つ以上のバイオマーカーの染色強度を決定することを含む。いくつかの実施形態では、1つ以上のバイオマーカーの定量的評価は、1つ以上のバイオマーカーの陽性率を決定することを含む。いくつかの実施形態では、定量的評価は、病理学者によって行われる。いくつかの実施形態では、定量的評価は、1つ以上の画像分析アルゴリズムを使用して行われる。いくつかの実施形態では、複数の訓練組織試料は、免疫組織化学アッセイで染色される。いくつかの実施形態では、複数の訓練組織試料は、インサイチュハイブリダイゼーションアッセイで染色される。
いくつかの実施形態では、試験スペクトルデータは、複数の正規化および補正振動スペクトルから導出された平均振動スペクトルを含む。いくつかの実施形態では、複数の正規化および補正された振動スペクトルは、以下によって取得される:(i)試験生物学的検体内の複数の空間領域を特定すること、;(ii)複数の特定された領域の各個々の領域から振動スペクトルを取得すること;(iii)個々の領域ごとに補正された振動スペクトルを提供するために、個々の領域ごとに取得された振動スペクトルを補正すること;および(iv)各個々の領域からの補正された振動スペクトルを所定の大域最大値に振幅正規化して、各領域の振幅正規化振動スペクトルを提供すること。いくつかの実施形態では、各個々の領域から取得された振動スペクトルは、以下によって補正される:(i)取得された各振動スペクトルを大気効果について補償して、大気補正振動スペクトルを提供すること;および(ii)散乱のために大気補正振動スペクトルを補償すること。
いくつかの実施形態では、訓練されたバイオマーカー発現推定エンジンは、次元縮小に基づく機械学習アルゴリズムを含む。いくつかの実施形態では、次元縮小は、潜在構造回帰モデルへの投影を含む。いくつかの実施形態では、次元縮小は、主成分分析および判別分析を含む。いくつかの実施形態では、訓練されたバイオマーカー発現推定エンジンは、ニューラルネットワークを含む。
いくつかの実施形態では、方法は、試験生物学的検体の実際のバイオマーカー発現を、試験生物学的検体の1つ以上のバイオマーカーの予測発現と比較することをさらに含む。いくつかの実施形態では、方法は、試験生物学的検体の不十分なマスキング解除および/または不十分な固定のために1つ以上のバイオマーカーの予測発現をさらに含む。いくつかの実施形態では、試験スペクトルデータは、少なくともアミドIバンドの振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約3200から約3400cm-1、約2800から約2900cm-1、約1020から約1100cm-1、および/または約1520から約1580cm-1の範囲の波長の振動スペクトル情報を含む。
本開示の別の態様は、試験生物学的検体から試験スペクトルデータを取得する、未知の時間量にわたって固定されて処理された試験生物学的検体における1つ以上のバイオマーカーの発現を予測する方法であって、試験スペクトルデータが、生物学的検体の少なくとも一部に由来する振動スペクトルデータを含み、訓練されたバイオマーカー発現推定エンジンを使用して、取得された試験スペクトルデータからバイオマーカー発現特徴を導出することと、バイオマーカー発現特徴に基づいて、試験生物学的検体の1つ以上のバイオマーカーの発現を予測することと、を含む、方法である。いくつかの実施形態では、予測されるバイオマーカー発現は、予測される陽性率または予測される染色強度のうちの1つを含む。いくつかの実施形態では、予測されるバイオマーカー発現は、予測される陽性率および予測される染色強度の双方を含む。いくつかの実施形態では、試験生物学的検体の固定状態は未知である。いくつかの実施形態では、試験生物学的検体は、上記列挙されたバイオマーカーのいずれかを含む、1つ以上のバイオマーカーの存在について染色される。他の実施形態では、試験生物学的検体は染色されない。
本開示の別の態様は、染色されていない試験生物学的検体における1つ以上のバイオマーカーの発現を予測するためのシステムであって、(i)1つ以上のプロセッサと、(ii)1つ以上のプロセッサに結合された1つ以上のメモリであって、1つ以上のプロセッサによって実行されると、試験生物学的検体から試験スペクトルデータを取得することであって、試験スペクトルデータが、生物学的検体の少なくとも一部に由来する振動スペクトルデータを含む、試験スペクトルデータを取得することと、訓練されたバイオマーカー発現推定エンジンを使用して、取得された試験スペクトルデータからバイオマーカー発現特徴を導出することであって、バイオマーカー発現推定エンジンが、複数の差次的に調製された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練され、訓練スペクトルデータセットが、1つ以上のバイオマーカーについての既知のバイオマーカー発現のクラス標識を含む、導出することと、導出されたバイオマーカー発現特徴に基づいて、染色されていない生物学的検体における1つ以上のバイオマーカーの発現を予測することと、を含む動作をシステムに実行させるコンピュータ実行可能命令を記憶する、1つ以上のメモリと、を備える、システムである。
いくつかの実施形態では、予測されるバイオマーカー発現は、予測される陽性率または予測される染色強度のうちの1つを含む。いくつかの実施形態では、予測されるバイオマーカー発現は、予測される陽性率および予測される染色強度の双方を含む。いくつかの実施形態では、1つ以上のバイオマーカーは、少なくとも1つの癌バイオマーカーを含む。
いくつかの実施形態では、各訓練スペクトルデータセットは、以下によって導出される:(i)訓練生物学的検体を取得すること;(ii)取得された訓練生物学的検体を複数の訓練組織試料に分割すること;および(iii)異なる調製条件下で複数の訓練組織試料の各訓練組織試料を調製すること。いくつかの実施形態では、方法は、1つ以上のバイオマーカーの存在について取得された複数の訓練組織試料のそれぞれを染色することと、1つ以上のバイオマーカーについての既知の陽性率および/または既知の染色強度を定量的に評価することと、をさらに含む。いくつかの実施形態では、訓練されたバイオマーカー発現推定エンジンは、次元縮小に基づく機械学習アルゴリズムを含む。いくつかの実施形態では、次元縮小は、潜在構造回帰モデルへの投影を含む。いくつかの実施形態では、訓練されたバイオマーカー発現推定エンジンは、ニューラルネットワークを含む。いくつかの実施形態では、方法は、試験生物学的検体の不十分なマスキング解除および/または不十分な固定のために1つ以上のバイオマーカーの予測発現を補償することをさらに含む。
本開示の別の態様は、試験生物学的検体における1つ以上のバイオマーカーの発現を予測するためのシステムであって、(i)1つ以上のプロセッサと、(ii)1つ以上のプロセッサに結合された1つ以上のメモリであって、1つ以上のプロセッサによって実行されると、試験生物学的検体から試験スペクトルデータを取得することであって、試験スペクトルデータが、生物学的検体の少なくとも一部に由来する振動スペクトルデータを含む、試験スペクトルデータを取得することと、訓練されたバイオマーカー発現推定エンジンを使用して、取得された試験スペクトルデータからバイオマーカー発現特徴を導出することであって、バイオマーカー発現推定エンジンが、複数の差次的に調製された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練され、訓練スペクトルデータセットが、1つ以上のバイオマーカーについての既知のバイオマーカー発現のクラス標識を含む、バイオマーカー発現特徴を導出することと、導出されたバイオマーカー発現特徴に基づいて、生物学的検体における1つ以上のバイオマーカーの発現を予測することと、を含む動作をシステムに実行させるコンピュータ実行可能命令を記憶する、1つ以上のメモリと、を備える、システムである。いくつかの実施形態では、試験生物学的検体は、上記列挙されたバイオマーカーのいずれかを含む、1つ以上のバイオマーカーの存在について染色される。他の実施形態では、試験生物学的検体は染色されない。
本明細書中で言及されるおよび/または出願データシートにおいてリスト化される全ての米国特許、米国特許出願公開、米国特許出願、外国特許、外国特許出願、および非特許刊行物は、参照によりそれらの全体が本明細書に組み込まれる。実施形態の態様は、必要に応じて、様々な特許、出願、および刊行物の概念を使用してさらに別の実施形態を提供するように変更されることができる。
本開示は、いくつかの例示的な実施形態を参照して説明されてきたが、本開示の原理の精神および範囲内に含まれるであろう多くの他の変更および実施形態が当業者によって考案されることができることを理解されたい。より具体的には、合理的な変形および変更は、本開示の精神から逸脱することなく、前述の開示、図面、および添付の特許請求の範囲内の主題の組み合わせ構成の構成部品および/または配置において可能である。構成部品および/または配置の変形および変更に加えて、代替の使用法も当業者にとって明らかであろう。

Claims (52)

  1. 試験生物学的検体における1つ以上のバイオマーカーの発現を予測するためのシステム(200)であって、(i)1つ以上のプロセッサ(209)と、(ii)前記1つ以上のプロセッサ(209)に結合された1つ以上のメモリ(201)とを備え、前記1つ以上のメモリ(201)はコンピュータ実行可能命令を記憶し、前記コンピュータ実行可能命令は、前記1つ以上のプロセッサ(209)によって実行されると、前記システム(200)に、
    a.前記試験生物学的検体から試験スペクトルデータを取得させることであって、取得された前記試験スペクトルデータが、前記生物学的検体の少なくとも一部に由来する振動スペクトルデータを含む、試験スペクトルデータを取得すること、
    b.訓練されたバイオマーカー発現推定エンジン(210)を使用して、取得された前記試験スペクトルデータからバイオマーカー発現特徴を導出すること、および、
    c.前記導出されたバイオマーカー発現特徴に基づいて、前記試験生物学的検体の前記1つ以上のバイオマーカーの発現を予測すること、を含む動作を実行させる、システム(200)。
  2. 前記1つ以上のバイオマーカーの予測発現が、予測された陽性率または予測された染色強度のうちの1つを含む、請求項1に記載のシステム。
  3. 前記1つ以上のバイオマーカーの予測発現が、予測された陽性率および予測された染色強度の双方を含む、請求項1に記載のシステム。
  4. 前記試験生物学的検体の固定状態が未知である、請求項1から3のいずれか一項に記載のシステム。
  5. 前記バイオマーカー発現推定エンジンが、1つ以上の訓練スペクトルデータセットを使用して訓練され、各訓練スペクトルデータセットが、1つ以上のバイオマーカーの存在について染色された複数の訓練組織試料に由来する複数の訓練振動スペクトルを含み、各訓練振動スペクトルが、1つ以上のクラス標識を含む、請求項1から4のいずれか一項に記載のシステム。
  6. 前記1つ以上のクラス標識が、1つ以上のバイオマーカーについての既知のバイオマーカー発現レベルを含む、請求項5に記載のシステム。
  7. 前記既知のバイオマーカー発現レベルが、1つ以上のバイオマーカーについての既知の陽性率および1つ以上のバイオマーカーについての既知の染色強度のうちの少なくとも1つを含む、請求項6に記載のシステム。
  8. 既知のマスキング解除期間、既知のマスキング解除温度、マスキング解除状態の定性的評価、既知の固定期間、および固定状態の定性的評価からなる群から選択される1つ以上のクラス標識をさらに含む、請求項6に記載のシステム。
  9. 各訓練スペクトルデータセットが、(i)訓練生物学的検体を取得することと、(ii)取得された前記訓練生物学的検体を複数の訓練組織試料に分割することと、(iii)前記複数の訓練組織試料を、1つ以上のバイオマーカーの存在について染色することと、(iv)前記複数の訓練組織試料の各訓練組織試料の前記1つ以上のバイオマーカーの発現を定量的に評価することと、によって導出される、請求項5から8のいずれか一項に記載のシステム。
  10. 前記複数の訓練組織試料の各訓練組織試料が、差次的にマスキング解除されるか、差次的に固定されるか、または差次的にマスキング解除され且つ差次的に固定される、請求項9に記載のシステム。
  11. 前記1つ以上のバイオマーカーの定量的評価が、前記1つ以上のバイオマーカーの染色強度を決定することを含む、請求項9に記載のシステム。
  12. 前記1つ以上のバイオマーカーの定量的評価が、前記1つ以上のバイオマーカーの陽性率を決定することを含む、請求項9に記載のシステム。
  13. 前記1つ以上のバイオマーカーの定量的評価が病理学者によって行われる、請求項9に記載のシステム。
  14. 前記1つ以上のバイオマーカーの定量的評価が、1つ以上の画像分析アルゴリズムを使用して行われる、請求項9に記載のシステム。
  15. 前記複数の訓練組織試料が免疫組織化学アッセイで染色される、請求項9に記載のシステム。
  16. 前記複数の訓練組織試料が、それぞれ、インサイチュハイブリダイゼーションアッセイで染色される、請求項9に記載のシステム。
  17. 取得された前記試験スペクトルデータが、複数の正規化および補正された振動スペクトルから導出された平均振動スペクトルを含む、請求項1~16のいずれか一項に記載のシステム。
  18. 前記複数の正規化および補正された振動スペクトルが、(i)前記試験生物学的検体内の複数の空間領域を特定することと、(ii)前記複数の特定された領域の各個々の領域から振動スペクトルを取得することと、(iii)個々の領域ごとに補正された振動スペクトルを提供するために、個々の領域ごとに取得された前記振動スペクトルを補正することと、(iv)各個々の領域からの前記補正された振動スペクトルを所定の大域最大値に振幅正規化して、各領域の振幅正規化振動スペクトルを提供することと、によって取得される、請求項17に記載のシステム。
  19. 各個々の領域からの取得された前記振動スペクトルが、(i)取得された各振動スペクトルを大気効果について補償して、大気補正振動スペクトルを提供することと、(ii)散乱のために前記大気補正振動スペクトルを補償することと、によって補正される、請求項18に記載のシステム。
  20. 前記訓練されたバイオマーカー発現推定エンジンが、次元縮小に基づく機械学習アルゴリズムを含む、請求項1から19のいずれか一項に記載のシステム。
  21. 前記次元縮小が、潜在構造回帰モデルへの投影を含む、請求項20に記載のシステム。
  22. 前記次元縮小が、主成分分析および判別分析を含む、請求項20に記載のシステム。
  23. 前記訓練されたバイオマーカー発現推定エンジンがニューラルネットワークを含む、請求項1~19のいずれか一項に記載のシステム。
  24. 前記試験生物学的検体の実際のバイオマーカー発現を、前記試験生物学的検体の前記1つ以上のバイオマーカーの予測発現と比較するための動作をさらに含む、請求項1から23のいずれか一項に記載のシステム。
  25. 前記試験生物学的検体の不十分なマスキング解除および/または不十分な固定のために、前記1つ以上のバイオマーカーの予測発現を補償するための動作をさらに含む、請求項1から24のいずれか一項に記載のシステム。
  26. 取得された前記試験スペクトルデータが、少なくともアミドIバンドの振動スペクトル情報を含む、請求項1から25のいずれか一項に記載のシステム。
  27. 取得された前記試験スペクトルデータが、約3200から約3400cm-1、約2800から約2900cm-1、約1020から約1100cm-1、および/または約1520から約1580cm-1の範囲の波長の振動スペクトル情報を含む、請求項1から26のいずれか一項に記載のシステム。
  28. 前記試験生物学的検体が染色されていない、請求項1に記載のシステム。
  29. 前記試験生物学的検体が、1つ以上のバイオマーカーの存在について染色される、請求項1に記載のシステム。
  30. 未知の固定状態および/または未知のマスキング解除状態を有する、処理された試験生物学的検体における1つ以上のバイオマーカーの発現を予測するための命令を記憶する非一時的コンピュータ可読媒体であって、前記命令が、
    (a)前記試験生物学的検体から試験スペクトルデータを取得することであって、取得された前記試験スペクトルデータが、前記生物学的検体の少なくとも一部に由来する振動スペクトルデータを含む、試験スペクトルデータを取得することと、
    (b)訓練されたバイオマーカー発現推定エンジン(210)を使用して、取得された前記試験スペクトルデータからバイオマーカー発現特徴を導出することであって、前記バイオマーカー発現推定エンジンが、複数の差次的に調製された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練され、前記訓練スペクトルデータセットが、1つ以上のバイオマーカーについての既知のバイオマーカー発現のクラス標識を含む、バイオマーカー発現特徴を導出することと、
    (c)前記導出されたバイオマーカー発現特徴に基づいて、前記試験生物学的検体の前記1つ以上のバイオマーカーの発現を予測することと、を含む、非一時的コンピュータ可読媒体。
  31. 前記1つ以上のバイオマーカーの予測発現が、予測された陽性率または予測された染色強度のうちの1つを含む、請求項30に記載の非一時的コンピュータ可読媒体。
  32. 前記1つ以上のバイオマーカーの予測発現が、予測された陽性率および予測された染色強度の双方を含む、請求項30または31に記載の非一時的コンピュータ可読媒体。
  33. 各訓練スペクトルデータセットが、(i)訓練生物学的検体を取得することと、(ii)取得された前記訓練生物学的検体を複数の訓練組織試料に分割することと、(iii)前記複数の訓練組織試料の各訓練組織試料を、異なる調製条件のもとで調製することと、(iv)1つ以上のバイオマーカーの存在について前記複数の訓練組織試料の各訓練組織試料を染色することと、(v)前記訓練組織試料のそれぞれにおいて前記1つ以上のバイオマーカーの発現を定量的に評価することと、によって導出される、請求項30から32のいずれか一項に記載の非一時的コンピュータ可読媒体。
  34. 前記異なる調製条件が異なるマスキング解除条件を含む、請求項33に記載の非一時的コンピュータ可読媒体。
  35. 前記異なる調製条件が異なる固定期間を含む、請求項33に記載の非一時的コンピュータ可読媒体。
  36. 前記訓練生物学的検体が、前記試験生物学的検体と同じ組織タイプを含む、請求項30から35のいずれか一項に記載の非一時的コンピュータ可読媒体。
  37. 前記訓練生物学的検体が、前記試験生物学的検体とは異なる組織タイプを含む、請求項30から35のいずれか一項に記載の非一時的コンピュータ可読媒体。
  38. 前記試験生物学的検体が染色されていない、請求項30から37のいずれか一項に記載の非一時的コンピュータ可読媒体。
  39. 前記試験生物学的検体が、1つ以上のバイオマーカーの存在について染色される、請求項30から37のいずれか一項に記載の非一時的コンピュータ可読媒体。
  40. 未知の時間量にわたって固定された試験生物学的検体における1つ以上のバイオマーカーの発現を予測する方法であって、
    a.前記試験生物学的検体から試験スペクトルデータを取得することであって、取得された前記試験スペクトルデータが、前記生物学的検体の少なくとも一部に由来する振動スペクトルデータを含む、試験スペクトルデータを取得すること(320)と、
    b.訓練されたバイオマーカー発現推定エンジン(210)を使用して、取得された前記試験スペクトルデータからバイオマーカー発現特徴を導出すること(340)であって、前記バイオマーカー発現推定エンジンが、複数の差次的に調製された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練され、前記訓練スペクトルデータセットが、1つ以上のバイオマーカーについての既知のバイオマーカー発現のクラス標識を含む、バイオマーカー発現特徴を導出することと、
    c.前記導出されたバイオマーカー発現特徴に基づいて、前記試験生物学的検体の前記1つ以上のバイオマーカーの発現を予測すること(350)と、を含む、方法。
  41. 前記1つ以上のバイオマーカーの予測発現が、予測された陽性率または予測された染色強度のうちの1つを含む、請求項40に記載の方法。
  42. 前記1つ以上のバイオマーカーの予測発現が、予測された陽性率および予測された染色強度の双方を含む、請求項40または41に記載の方法。
  43. 各訓練スペクトルデータセットが、(i)訓練生物学的検体を取得することと、(ii)取得された前記訓練生物学的検体を複数の訓練組織試料に分割することと、(iii)異なる調製条件下で前記複数の訓練組織試料の各訓練組織試料を調製することと、によって導出される、請求項40から41のいずれか一項に記載の方法。
  44. 前記複数の訓練組織試料のそれぞれを、前記1つ以上のバイオマーカーの存在について染色することと、前記1つ以上のバイオマーカーについての既知の陽性率および/または既知の染色強度を定量的に評価することと、を含む、請求項43に記載の方法。
  45. 前記訓練されたバイオマーカー発現推定エンジンが、次元縮小に基づく機械学習アルゴリズムを含む、請求項40から44のいずれか一項に記載の方法。
  46. 前記次元縮小が、潜在構造回帰モデルへの投影を含む、請求項45に記載の方法。
  47. 前記訓練されたバイオマーカー発現推定エンジンがニューラルネットワークを含む、請求項40から44のいずれか一項に記載の方法。
  48. 前記試験生物学的検体の不十分なマスキング解除および/または不十分な固定のために、前記1つ以上のバイオマーカーの前記予測発現を補償することをさらに含む、請求項40から47のいずれか一項に記載の方法。
  49. 前記1つ以上のバイオマーカーが少なくとも1つの癌バイオマーカーを含む、請求項40から48のいずれか一項に記載の方法。
  50. 前記試験生物学的検体が染色されていない、請求項40から49のいずれか一項に記載の方法。
  51. 前記試験生物学的検体が、1つ以上のバイオマーカーの存在について染色される、請求項40から49のいずれか一項に記載の方法。
  52. 取得された前記試験スペクトルデータが、約3200から約3400cm-1、約2800から約2900cm-1、約1020から約1100cm-1、および/または約1520から約1580cm-1の範囲の波長の振動スペクトル情報を含む、請求項40から51のいずれか一項に記載の方法。

JP2022513240A 2019-08-28 2020-08-26 振動分光法によるバイオマーカー発現の無標識評価 Pending JP2022546430A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962892680P 2019-08-28 2019-08-28
US62/892680 2019-08-28
PCT/EP2020/073784 WO2021037872A1 (en) 2019-08-28 2020-08-26 Label-free assessment of biomarker expression with vibrational spectroscopy

Publications (1)

Publication Number Publication Date
JP2022546430A true JP2022546430A (ja) 2022-11-04

Family

ID=72292506

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022513240A Pending JP2022546430A (ja) 2019-08-28 2020-08-26 振動分光法によるバイオマーカー発現の無標識評価

Country Status (5)

Country Link
US (1) US20220146418A1 (ja)
EP (1) EP4022286A1 (ja)
JP (1) JP2022546430A (ja)
CN (1) CN114270174A (ja)
WO (1) WO2021037872A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220101276A1 (en) * 2020-09-30 2022-03-31 X Development Llc Techniques for predicting the spectra of materials using molecular metadata
WO2022225845A1 (en) * 2021-04-18 2022-10-27 Mary Hitchcock Memorial Hospital, For Itself And On Behalf Of Dartmouth-Hitchcock Clinic System and method for automation of surgical pathology processes using artificial intelligence
WO2023224859A1 (en) * 2022-05-16 2023-11-23 The Regents Of The University Of California Neural network enabled disease spectroscopy
CN116188947B (zh) * 2023-04-28 2023-07-14 珠海横琴圣澳云智科技有限公司 基于领域知识的半监督信号点检测方法及装置
CN117668476A (zh) * 2023-12-07 2024-03-08 电子科技大学 一种基于近红外光谱和迁移学习的土壤碳酸盐预测方法

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6894639B1 (en) 1991-12-18 2005-05-17 Raytheon Company Generalized hebbian learning for principal component analysis and automatic target recognition, systems and method
US6693280B2 (en) 2001-08-03 2004-02-17 Sensir Technologies, L.L.C. Mid-infrared spectrometer attachment to light microscopes
US7280576B2 (en) 2001-09-11 2007-10-09 Qinetiq Limited Type II mid-infrared quantum well laser
WO2005020044A1 (en) 2003-08-26 2005-03-03 The Trustees Of Columbia University In The City Of New York Innervated stochastic controller for real time business decision-making support
KR100543707B1 (ko) 2003-12-04 2006-01-20 삼성전자주식회사 서브그룹별 pca 학습을 이용한 얼굴인식방법 및 장치
US8170841B2 (en) 2004-04-16 2012-05-01 Knowledgebase Marketing, Inc. Predictive model validation
US7519253B2 (en) 2005-11-18 2009-04-14 Omni Sciences, Inc. Broadband or mid-infrared fiber light sources
US20090170152A1 (en) 2007-06-01 2009-07-02 Ventana Medical Systems, Inc. Tissue Conditioning Protocols
US8036252B2 (en) 2008-06-03 2011-10-11 The Regents Of The University Of Michigan Mid-infrared fiber laser using cascaded Raman wavelength shifting
CA2842723C (en) 2009-10-19 2016-02-16 Ventana Medical Systems, Inc. Imaging system and techniques
JP5455787B2 (ja) 2010-05-27 2014-03-26 パナソニック株式会社 動作解析装置および動作解析方法
US8452718B2 (en) 2010-06-10 2013-05-28 Tokyo Electron Limited Determination of training set size for a machine learning system
EP2585811A4 (en) * 2010-06-25 2017-12-20 Cireca Theranostics, LLC Method for analyzing biological specimens by spectral imaging
EP2939026B1 (en) 2012-12-28 2017-07-05 Ventana Medical Systems, Inc. Image analysis for breast cancer prognosis
US9046650B2 (en) 2013-03-12 2015-06-02 The Massachusetts Institute Of Technology Methods and apparatus for mid-infrared sensing
US9786050B2 (en) * 2013-03-15 2017-10-10 The Board Of Trustees Of The University Of Illinois Stain-free histopathology by chemical imaging
US20140279734A1 (en) 2013-03-15 2014-09-18 Hewlett-Packard Development Company, L.P. Performing Cross-Validation Using Non-Randomly Selected Cases
US10289962B2 (en) 2014-06-06 2019-05-14 Google Llc Training distilled machine learning models
US11300773B2 (en) 2014-09-29 2022-04-12 Agilent Technologies, Inc. Mid-infrared scanning system
EP3218843B1 (en) 2014-11-10 2024-04-24 Ventana Medical Systems, Inc. Classifying nuclei in histology images
US20160132786A1 (en) 2014-11-12 2016-05-12 Alexandru Balan Partitioning data for training machine-learning classifiers
EP3075496B1 (en) 2015-04-02 2022-05-04 Honda Research Institute Europe GmbH Method for improving operation of a robot
WO2018227277A1 (en) 2017-06-12 2018-12-20 Royal Bank Of Canada System and method for adaptive data visualization
CA2945462C (en) 2016-10-14 2023-06-13 Universite Laval Mid-infrared laser system, mid-infrared optical amplifier, and method of operating a mid-infrared laser system
WO2018122056A1 (en) 2016-12-30 2018-07-05 Ventana Medical Systems, Inc. Automated system and method for creating and executing a scoring guide to assist in the analysis of tissue specimen
US10963783B2 (en) 2017-02-19 2021-03-30 Intel Corporation Technologies for optimized machine learning training
US10692000B2 (en) 2017-03-20 2020-06-23 Sap Se Training machine learning models
CN110462372B (zh) 2017-05-25 2022-06-14 佛罗乔有限责任公司 大型多参数数据集的可视化、比较分析和自动差异检测
WO2019025515A1 (en) 2017-08-04 2019-02-07 Ventana Medical Systems, Inc. SYSTEM AND METHOD FOR COLOR DECONVOLUTION OF A SLIDE TO HELP ANALYZE A TISSUE SPECIMEN
CN117174263A (zh) 2017-08-04 2023-12-05 文塔纳医疗系统公司 用于图像处理的自动测定评估和归一化
US20190102675A1 (en) 2017-09-29 2019-04-04 Coupa Software Incorporated Generating and training machine learning systems using stored training datasets
US10853493B2 (en) 2017-10-09 2020-12-01 Raytheon Bbn Technologies Corp Enhanced vector-based identification of circuit trojans
US11636288B2 (en) 2017-11-06 2023-04-25 University Health Network Platform, device and process for annotation and classification of tissue specimens using convolutional neural network
CN111448584B (zh) 2017-12-05 2023-09-26 文塔纳医疗系统公司 计算肿瘤空间和标记间异质性的方法
JP7197584B2 (ja) 2017-12-06 2022-12-27 ベンタナ メディカル システムズ, インコーポレイテッド デジタル病理学分析結果の格納および読み出し方法
JP7250793B2 (ja) 2017-12-07 2023-04-03 ベンタナ メディカル システムズ, インコーポレイテッド 生体画像における連帯的細胞および領域分類のための深層学習システムならびに方法
WO2019121564A2 (en) 2017-12-24 2019-06-27 Ventana Medical Systems, Inc. Computational pathology approach for retrospective analysis of tissue-based companion diagnostic driven clinical trial studies

Also Published As

Publication number Publication date
EP4022286A1 (en) 2022-07-06
CN114270174A (zh) 2022-04-01
US20220146418A1 (en) 2022-05-12
WO2021037872A1 (en) 2021-03-04

Similar Documents

Publication Publication Date Title
US20220146418A1 (en) Label-free assessment of biomarker expression with vibrational spectroscopy
US10628658B2 (en) Classifying nuclei in histology images
US11842483B2 (en) Systems for cell shape estimation
US9858469B2 (en) Modular image analysis system and method
US8335360B2 (en) Compartment segregation by pixel characterization using image data clustering
US9240043B2 (en) Reproducible quantification of biomarker expression
JP7520107B2 (ja) 振動分光法を使用して検体固定の持続時間および品質を評価するためのシステムおよび方法
Bird et al. Infrared micro-spectral imaging: distinction of tissue types in axillary lymph node histology
US20220223230A1 (en) Assessing antigen retrieval and target retrieval progression with vibrational spectroscopy
Gustavson et al. Development of an unsupervised pixel-based clustering algorithm for compartmentalization of immunohistochemical expression using Automated QUantitative Analysis
JP2024519770A (ja) 組織固定時間のリアルタイム予測

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230828

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240229

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240604

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240806