JP2022546058A

JP2022546058A - 振動分光法を使用して検体固定の持続時間および品質を評価するためのシステムおよび方法

Info

Publication number: JP2022546058A
Application number: JP2022513273A
Authority: JP
Inventors: バウアー，ダニエル; チャフィン，デビッド
Original assignee: ベンタナメディカルシステムズ，インコーポレイテッド
Priority date: 2019-08-28
Filing date: 2020-08-26
Publication date: 2022-11-02
Also published as: EP4022287A1; US20220136971A1; WO2021037875A1; CN114341989A

Abstract

本開示は、訓練された固定推定エンジン（２１０）を使用して生物学的検体の固定持続時間を定量的に判定するための自動化システム（２００）および方法に関する。いくつかの実施形態では、訓練された固定推定エンジン（２１０）は、ニューラルネットワークを含む。いくつかの実施形態では、訓練された固定推定エンジン（２１０）は、教師あり分類器を含む。【選択図】図３

Description

関連出願の相互参照

本出願は、２０１９年８月２８日に出願された米国特許出願第６２／８９２，６７８号の出願日の利益を主張し、その開示は、その全体が参照により本明細書に組み込まれる。

免疫組織化学的（ＩＨＣ）スライド染色は、組織切片の細胞内のタンパク質を特定するために利用可能であるため、生体組織内の癌性細胞や免疫細胞など、異なる種類の細胞の研究に広く使用されている。したがって、ＩＨＣ染色は、免疫反応研究のために、癌性組織における免疫細胞（Ｔ細胞やＢ細胞など）の別様に発現するバイオマーカーの分布と局在を理解するための研究に使用されることができる。例えば、腫瘍は、免疫細胞の浸潤物を含んでいることが多く、これは、腫瘍の発生を妨げたり、腫瘍の増殖を促進したりする場合がある。

原位置ハイブリッド形成（ＩＳＨ）が使用されて、顕微鏡で見ると形態学的に悪性であるように見える細胞内に特異的に遺伝子を生じさせる癌の増幅などの遺伝的異常または状態の存在を探すことができる。原位置ハイブリッド形成（ＩＳＨ）は、標的遺伝子配列または転写物に対してアンチセンスである標識ＤＮＡまたはＲＮＡプローブ分子を使用して、細胞または組織試料内の標的核酸標的遺伝子を検出または局在化する。ＩＳＨは、スライドガラスに固定化された細胞または組織試料を、細胞または組織試料内の所与の標的遺伝子に特異的にハイブリッド形成することができる標識核酸プローブに曝露することによって実行される。複数の異なる核酸タグによって標識された複数の核酸プローブに細胞または組織試料を曝露することにより、いくつかの標的遺伝子が同時に分析されることができる。異なる発光波長を有する標識を利用することにより、単一の標的細胞または組織試料に対して単一のステップで同時多色分析が実行されることができる。

薄い組織切片は、組織試料に関する代表的な情報を得るために組織学において使用される。薄い切片の品質は、試料の切除が行われた組織領域全体を適切に表すために、いくつかの特徴を満たすべきである。ガイドラインは、組織の種類および使用によって異なることができるが、薄い切片のサイズは、一般に、２μｍ未満であるべきではない。典型的には、組織切片は、２から５μｍの範囲で調製され、適切なさらなる処理を可能にするために、薄い切片の側方範囲にわたって厚さが５０％を超えて変化してはならない。組織切片の質に影響を及ぼすさらなる要因は、適切な試料水分および切片化プロセス中に維持される温度を含むことができる。

ホルマリンは、半世紀にわたって組織学分野で使用されてきた。室温で使用される場合、ホルマリンは、組織切片に拡散し、タンパク質および核酸を架橋し、それによって代謝を停止させ、生体分子を保存し、パラフィンワックス浸潤のために組織を準備する。実際には、ホルマリン固定は、主に室温以上で行われる。いくつかのグループは、おそらく架橋速度を増加させるために、僅かに高温で固定を行う。熱が架橋速度を増加させるのと同様に、低温ホルマリンは、架橋速度を著しく低下させる。このため、組織学者は、通常、室温以上で組織固定を行う。いくつかのグループは、低温ホルムアルデヒドを使用しているが、組織を固定するためではなく、特殊な状況でのみ使用している。例えば、グループは、低温ホルマリンを使用して、脂質滴または他の特別な状況を検査する。

ホルマリンに曝露されているかまたは過剰に曝露されている組織では、いくつかの効果が観察される。組織試料を十分に長期間ホルマリンで処理しない場合、組織が標準的な組織処理に供された場合、組織形態は、典型的には非常に不良である。例えば、不適切に固定された組織では、組織が適切な架橋格子を形成する機会がないため、エタノールへのその後の曝露は、細胞構造を収縮させ、核を凝縮させる。ヘマトキシリンおよびエオシン（Ｈ＆Ｅ）などで固定組織が染色されると、細胞と組織構造との間に多くの白い空間が観察され、核が凝縮し、細胞質が失われ、試料はピンク色に見え、ヘマトキシリン染色ではバランスがとれていない。ホルマリンにあまりにも長く曝露された組織は、典型的には、おそらく核酸および／またはタンパク質の変性および分解のために、その後の免疫組織化学プロセスにうまく機能しない。結果として、これらの組織に対する最適な抗原回収条件は適切に機能せず、したがって、組織試料は染色されているように見える。

適切な医学的診断および患者の安全性は、染色前に組織試料を適切に固定することを必要とする。したがって、組織試料の適切な固定のためのガイドラインが腫瘍学者および病理学者によって確立されている。例えば、米国臨床腫瘍学会（ＡＳＣＯ）によれば、ＨＥＲ２免疫組織化学分析のための中性緩衝ホルマリン溶液中での固定持続時間の現在のガイドラインは、少なくとも６時間、好ましくはそれ以上、最大７２時間である。有意な分解が起こる前に生物学的分子および組織形態をより良好に保存するため、ならびに可能な限り迅速に医療従事者および患者に正確な試験結果を提供するために、組織試料を迅速に固定するプロセスを開発することが有利であろう。

生物学的検体、例えば組織試料の固定の変化は、下流の標識化および／または染色プロセスに影響を及ぼし、不確定な結果および／または誤診をもたらす可能性がある。有利には、開示されたシステムおよび方法は、組織試料の固定状態の判定を提供し、それによって固定された生物学的検体の質の判定を容易にする。いくつかの実施形態では、予測固定状態は、固定持続時間の定量的判定である。

本出願人らは、驚くべきことに、本開示のシステムおよび方法が、未知の時間量の固定プロセスに供された試験生物学的検体の固定状態の正確な予測を提供することを発見した。本出願人は、さらに、本開示の訓練された固定推定エンジンが、異なる組織タイプまたは固定推定エンジンが以前に訓練されていない組織タイプに適用される場合であっても、訓練された固定推定エンジンが固定状態の推定を高精度に行うことを可能にすることを提出する。さらに、本出願人は、現在開示されているシステムおよび方法が、未知の試験生物学的検体が定性的に「固定」であるか「固定されていない」であるかの推定だけでなく、未知の時間量の１つ以上の固定プロセスに供された試験生物学的検体の固定持続時間の定量的推定を提供することを提出する。これらのおよび他の特徴は、本明細書でさらに説明され、本明細書に添付される例および図に示される。

本開示の第１の態様は、少なくとも部分的に固定された試験生物学的検体の推定固定持続時間を定量的に判定するためのシステムであって、（ｉ）１つ以上のプロセッサと、（ｉｉ）１つ以上のプロセッサに結合された１つ以上のメモリであって、１つ以上のメモリが、コンピュータ実行可能命令を記憶し、コンピュータ実行可能命令は、１つ以上のプロセッサによって実行されると、少なくとも部分的に固定された試験生物学的検体から試験スペクトルデータを取得することであって、試験スペクトルデータが、生物学的検体の少なくとも一部から導出される振動スペクトルデータを含む、試験スペクトルデータを取得することと、訓練された固定推定エンジンを使用して、取得された試験スペクトルデータから固定特徴を導出することと、導出された固定特徴に基づいて、少なくとも部分的に固定された生物学的検体の推定固定持続時間を定量的に判定することと、を含む動作をシステムに実行させる、１つ以上のメモリと、を備える、システムである。いくつかの実施形態では、振動スペクトルデータは、中間赤外（中間ＩＲ）スペクトルデータを含む。いくつかの実施形態では、振動スペクトルデータは、ラマンスペクトルデータを含む。いくつかの実施形態では、システムは、訓練された固定推定エンジンを使用して固定品質を推定するための動作をさらに含む。

いくつかの実施形態では、固定推定エンジンは、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練される。いくつかの実施形態では、固定推定エンジンは、１つ以上の訓練スペクトルデータセットを使用して訓練され、各訓練スペクトルデータセットは、複数の差動的に固定された訓練組織試料から導出された複数の訓練振動スペクトルを含み、各訓練振動スペクトルは、既知の固定持続時間のクラスラベルを含む。いくつかの実施形態では、既知の固定持続時間のクラスラベルは、機能的ＩＨＣ試験によって検証される。いくつかの実施形態では、クラスラベルは、固定品質注釈をさらに含む。

いくつかの実施形態では、各訓練スペクトルデータセットは、以下によって導出される：（ｉ）訓練生物学的検体を取得すること、（ｉｉ）取得された訓練生物学的検体を複数の訓練組織試料に分割すること、および（ｉｉｉ）複数の訓練組織試料の各訓練組織試料を異なる所定の時間量にわたって固定すること。いくつかの実施形態では、異なる所定の時間量は、約０時間から約２４時間の範囲である。いくつかの実施形態では、異なる所定の時間量は、約０時間から約１２時間の範囲である。

いくつかの実施形態では、試験スペクトルデータは、複数の正規化および補正された振動スペクトルから導出された平均振動スペクトルを含む。いくつかの実施形態では、複数の正規化および補正された振動スペクトルは、以下によって取得される：（ｉ）試験生物学的検体内の複数の空間領域を識別すること、（ｉｉ）複数の識別された領域の各個々の領域から振動スペクトルを取得すること、（ｉｉｉ）各個々の領域からの取得された振動スペクトルを補正し、各個々の領域ごとに補正された振動スペクトルを提供すること、および（ｉｖ）各個々の領域からの補正された振動スペクトルを所定の大域最大値に振幅正規化し、各領域の振幅正規化振動スペクトルを提供すること。いくつかの実施形態では、各個々の領域から取得された振動スペクトルは、以下によって補正される：（ｉ）取得された各振動スペクトルを大気効果について補償して、大気補正振動スペクトルを提供すること、および（ｉｉ）散乱について大気補正振動スペクトルを補償すること。いくつかの実施形態では、領域はランダムに選択される。

いくつかの実施形態では、訓練された固定状態推定エンジンは、次元縮小に基づく機械学習アルゴリズムを含む。いくつかの実施形態では、次元縮小は、潜在構造回帰モデルへの投影を含む。いくつかの実施形態では、次元縮小は、主成分分析、および任意に判別分析を含む。いくつかの実施形態では、訓練された固定状態推定エンジンは、ニューラルネットワークを含む。

いくつかの実施形態では、システムは、生物学的検体が、１つ以上の特異的結合実体による標識に適した固定状態を含むかどうかを評価するための動作をさらに含む。いくつかの実施形態では、システムは、生物学的検体固定と正に関連付けられた試験データ内の少なくとも１つのスペクトル帯域を識別するための動作をさらに含む。

いくつかの実施形態では、取得された試験スペクトルデータは、約３２００から約３４００ｃｍ^－１の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約２８００から約２９００ｃｍ^－１の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約１０２０から約１１００ｃｍ^－１の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約１５２０から約１５８０ｃｍ^－１の範囲の波長の振動スペクトル情報を含む。

本開示の第２の態様は、少なくとも部分的に固定された試験生物学的検体の推定固定持続時間を判定するための命令を記憶する非一時的コンピュータ可読媒体であって、推定固定持続時間を判定することが、試験生物学的検体から試験スペクトルデータを取得することであって、取得された試験スペクトルデータが、生物学的検体の少なくとも一部から導出される振動スペクトルデータを含む、試験スペクトルデータを取得することと、訓練された固定推定エンジンを使用して取得された試験スペクトルデータから固定特徴を導出することであって、固定推定エンジンが、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練され、訓練スペクトルデータセットが、少なくとも既知の固定持続時間のクラスラベルを含む、、固定特徴を導出することと、導出された固定特徴に基づいて、少なくとも部分的に固定された生物学的検体の推定固定持続時間を定量的に判定することと、を含む、非一時的コンピュータ可読媒体である。いくつかの実施形態では、固定推定エンジンの訓練中に使用される既知の固定持続時間のクラスラベルは、機能的ＩＨＣ試験によって検証される。いくつかの実施形態では、試験生物学的検体は染色されていない。いくつかの実施形態では、試験生物学的検体は、１つ以上のバイオマーカーの存在について染色される。

いくつかの実施形態では、各訓練スペクトルデータセットは、以下によって導出される：（ｉ）訓練生物学的検体を取得すること、（ｉｉ）取得された訓練生物学的検体を複数の訓練組織試料に分割すること、および（ｉｉｉ）複数の訓練組織試料の各訓練組織試料を異なる所定の時間量にわたって固定すること。いくつかの実施形態では、訓練生物学的検体は、試験生物学的検体と同じ組織タイプを含む。いくつかの実施形態では、訓練生物学的検体は、試験生物学的検体とは異なる組織タイプを含む。いくつかの実施形態では、訓練された固定状態推定エンジンは、次元縮小に基づく機械学習アルゴリズムを含む。いくつかの実施形態では、次元縮小は、潜在構造回帰モデルへの投影を含む。いくつかの実施形態では、次元縮小は、主成分分析を含む。いくつかの実施形態では、訓練された固定状態推定エンジンは、ニューラルネットワークを含む。

本開示の第３の態様は、少なくとも部分的に固定された試験生物学的検体の固定状態を予測するための方法であって、少なくとも部分的に固定された試験生物学的検体から試験スペクトルデータを取得することであって、試験スペクトルデータが、生物学的検体の少なくとも一部から導出される振動スペクトルデータを含む、試験スペクトルデータを取得することと、訓練された固定推定エンジンを使用して、取得された試験スペクトルデータから１つ以上の固定特徴を導出することと、導出された１つ以上の固定特徴に基づいて、少なくとも部分的に固定された生物学的検体の推定固定状態を判定することと、を含む、方法である。いくつかの実施形態では、判定された推定固定状態は、固定持続時間の定量的予測である。いくつかの実施形態では、判定された推定固定状態は、固定品質の定性的予測である。いくつかの実施形態では、方法は、生物学的検体が、１つ以上の特異的結合実体による標識に適した固定状態を含むかどうかを評価することをさらに含む。いくつかの実施形態では、方法は、生物学的検体固定と正に関連付けられた試験データ内の少なくとも１つのスペクトル帯域を識別することをさらに含む。

いくつかの実施形態では、固定推定エンジンは、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練される。いくつかの実施形態では、訓練スペクトルデータセットは、機能的ＩＨＣ試験によって判定された既知の固定持続時間などの既知の固定持続時間のクラスラベルを含む。いくつかの実施形態では、訓練スペクトルデータセットは、固定品質のクラスラベルをさらに含む。

いくつかの実施形態では、少なくとも２つの訓練振動スペクトルは、複数の訓練生物学的検体の各個々の訓練生物学的検体から取得され、少なくとも２つの試料振動スペクトルは、個々の訓練生物学的検体の異なる部分から取得される。いくつかの実施形態では、個々の訓練生物学的検体の少なくとも２つの異なる部分は、それぞれ異なる所定の時間量にわたって１つ以上の固定剤で処理される。いくつかの実施形態では、異なる所定の時間量は、約０時間から約２４時間の範囲である。いくつかの実施形態では、異なる所定の時間量は、約０時間から約１２時間の範囲である。いくつかの実施形態では、少なくとも２つの訓練振動スペクトルは、それぞれ、複数の正規化および補正された訓練振動スペクトルから導出された平均振動スペクトルである。

いくつかの実施形態では、取得された試験スペクトルデータは、少なくともアミドＩバンドの中間ＩＲスペクトル情報を含む。いくつかの実施形態では、取得された試験スペクトルデータは、約３２００から約３４００ｃｍ^－１、約２８００から約２９００ｃｍ^－１、約１０２０から約１１００ｃｍ^－１、および／または約１５２０から約１５８０ｃｍ^－１の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、試験生物学的検体は染色されていない。いくつかの実施形態では、試験生物学的検体は、１つ以上のバイオマーカーの存在について染色される。

いくつかの実施形態では、訓練された固定状態推定エンジンは、次元縮小に基づく機械学習アルゴリズムを含む。いくつかの実施形態では、次元縮小は、潜在構造回帰モデルへの投影を含む。いくつかの実施形態では、次元縮小は、主成分分析を含む。いくつかの実施形態では、訓練された固定状態推定エンジンは、ニューラルネットワークを含む。

本開示の特徴の一般的な理解のために、図面を参照する。図面では、同一の要素を特定するために、全体を通して同様の参照符号が使用されている。

本開示の一実施形態にかかる、画像取得装置およびコンピュータシステムを含む代表的なデジタル病理システムを示している。本開示の一実施形態にかかる、試験組織試料の固定持続時間を推定するためにシステムまたはデジタル病理ワークフロー内で利用されることができる様々なモジュールを示している。本開示の一実施形態にかかる、訓練された固定推定エンジンを使用して試験生物学的検体の固定持続時間を推定する様々なステップを示すフローチャートを記載している。本開示の一実施形態にかかる訓練生物学的検体の振動スペクトルを取得する様々なステップを示すフローチャートを記載している。本開示の一実施形態にかかる訓練生物学的検体の振動スペクトルを取得する様々なステップを示すフローチャートを記載している。本開示の一実施形態にかかる訓練生物学的検体の振動スペクトルを取得する様々なステップを示すフローチャートを記載している。本開示の一実施形態にかかる、試験生物学的検体の平均振動スペクトルを取得する様々なステップを示すフローチャートを記載している。本開示の一実施形態にかかる、試験生物学的検体および訓練生物学的検体を含む、生物学的検体から導出される取得されたスペクトルを補正、正規化、および平均化する様々なステップを示すフローチャートを記載している。コラーゲンの典型的なＦＲ－ＩＲおよびラマンスペクトルを示している。組織試料の赤外線およびラマン特性周波数を示す表を提供している。組織試料の赤外線およびラマン特性周波数を示す表を提供している。１０５個の個々の扁桃組織片が中性緩衝ホルマリン中で０時間（例えば、未固定／エタノール固定）から２４時間（完全固定）の間の様々な時間量にわたって室温ホルマリン中で別様に固定された実験計画のグラフィカル図を提供している。試料は、エタノールおよびキシレンで同等に処理され、パラフィンに包埋された。各組織ブロックからの１つのスライドは、ＢＣＬ２、ｋｉ－６７およびＦＯＸＰ３について染色され、各ブロックからの２つの切片は、中間ＩＲ顕微鏡を用いて分光学的にイメージングされた。バイオマーカー定量化のための明視野ＩＨＣイメージングおよび画像処理の概要を提供している。図９Ａは、全スライドスキャンにおけるイメージングおよび画像分割アルゴリズムを示している。最上行：３つの抗原のそれぞれに対するスライドスキャン全体の元の明視野レンディション。中央行：画像セグメンテーションアルゴリズムの結果、暗灰色領域は、デジタル分析（間質、結合組織など）から除外され、薄灰色領域は、分析に含められた。最下行：バイオマーカー発現レベルのホットスポットレンダリング。暗灰色＝高発現密度、非常に暗い灰色＝低発現密度、黒色＝陰性／組織なし。バイオマーカー定量化のための明視野ＩＨＣイメージングおよび画像処理の概要を提供している。図９Ｂは、元の画像（左列）およびセグメント化された画像（右列）を含む２０Ｘにおける３つ全ての抗原に対する染色の例を提供している。中間ＩＲ収集の概要を提供している。図１０Ａは、ＢｒｕｋｅｒＨｙｐｅｒｉｏｎ３０００中間ＩＲ顕微鏡で取得された組織試料の明視野画像を提供している。中間ＩＲ収集の概要を提供している。図１０Ｂは、色付き円によって示された分光撮像された試料の領域を示している。中間ＩＲ収集の概要を提供している。図１０Ｃは、色付き円によって示された分光撮像された試料の領域を示している。中間ＩＲ収集の概要を提供している。図１０Ｄは、組織内で撮像された全ての点の元の中間ＩＲスペクトルを提供している。各線は、図１０Ｂおよび図１０Ｃにおける１つの円のスペクトルを表している。中間ＩＲ収集の概要を提供している。図１０Ｅは、大気補正後の中間ＩＲスペクトルを提供している。中間ＩＲ収集の概要を提供している。図１０Ｆは、散乱の影響を緩和するためのベースライン補正後の中間ＩＲスペクトルを提供している。中間ＩＲ収集の概要を提供している。図１０Ｇは、振幅正規化後の中間ＩＲスペクトルを提供している。中間ＩＲ収集の概要を提供している。図１０Ｈは、組織試料全体の平均中間ＩＲスペクトルを表す、空間的に平均化された中間ＩＲスペクトルを提供している。ＢＣＬ２（図１１Ａ）、ｋｉ－６７（図１１Ｂ）およびＦＯＸＰ３（図１１Ｃ）のＩＨＣ発現の定量的分析を記載している。ＢＣＬ２（図１１Ａ）、ｋｉ－６７（図１１Ｂ）およびＦＯＸＰ３（図１１Ｃ）のＩＨＣ発現の定量的分析を記載している。ＢＣＬ２（図１１Ａ）、ｋｉ－６７（図１１Ｂ）およびＦＯＸＰ３（図１１Ｃ）のＩＨＣ発現の定量的分析を記載している。３つ全てのバイオマーカーに対するＩＨＣ発現対固定時間のプロットを示しており、ここで、平均発現は、正規化されたスケールでプロットされ、そのため、各バイオマーカー対固定時間の相対的変化が観察されることができる。バーは、両側順位和検定によって判定されるように、ｐ＜０．０５の有意なレベルを表している。全ての固定時間に対する平均中間ＩＲ吸収を提供しており、アミドＩバンドのおおよその位置が示されている。アミドＩバンドの中間ＩＲ吸収を提供している。実線は、平均吸収を表し、エラーバーは、全ての組織のプラス／マイナス標準偏差を表している。アミドＩバンドの変形の定量的図を提供しており、バンドのピーク位置は、半値全幅（「ＦＷＨＭ」）に対してプロットされている。ピーク位置に対するアミド１バンドの平均シフトおよび固定時間＝０のＦＷＨＭを提供している。ＢＣＬ２（図１３Ａ）、ｋｉ－６７（図１３Ｂ）、およびＦＯＸＰ３（図１３Ｃ）の絶対アミドＩシフト対ＩＨＣ発現のプロットを示している。ＢＣＬ２（図１３Ａ）、ｋｉ－６７（図１３Ｂ）、およびＦＯＸＰ３（図１３Ｃ）の絶対アミドＩシフト対ＩＨＣ発現のプロットを示している。ＢＣＬ２（図１３Ａ）、ｋｉ－６７（図１３Ｂ）、およびＦＯＸＰ３（図１３Ｃ）の絶対アミドＩシフト対ＩＨＣ発現のプロットを示している。Ｋ倍交差検証を示している。潜在構造回帰アルゴリズムへの投影の訓練および検証のフローチャートを記載している。訓練データ（左）および保持盲検組織試料（右）に対する固定予測モデルの結果を提供している。訓練セットおよび盲検スペクトルからのスペクトルの累積分布関数（ＣＤＦ）を提供している。開発されたモデルは、未知試料の固定時間を平均１．４時間まで予測することができた。固定時間の正の予測子を表す正の係数および固定時間の負の予測子を表す負の係数を有する開発されたＰＬＳＲモデルからの重みを記載している。試料がホルマリンで固定されている時間に基づいて差を示した４つのバンドの中間ＩＲスペクトルを記載している。予測モデル内の成分の数を増やすことによって説明されるＸおよびＹ変数の分散パーセントのグラフを提供している。成分数が増加する交差検証ホールドアウトデータセットからのモデルの平均二乗予測誤差（ＭＳＰＥ）のグラフを提供している。最初の約２０個の成分は、モデルの予測精度を大幅に向上させ、２０個を超える成分を追加すると、改善予測力はほとんどない。訓練セットおよびホールドアウト検証データに対するモデルの性能を示すグラフを提供している。予測誤差は、中間ＩＲスペクトルにおける回収の真のシグネチャを識別した十分に訓練されたモデルを示す双方のタイプのデータについて同一である。訓練組織（左ボックス）および検証組織（右ボックス）の双方について実験的固定時間対モデル予測時間を表示することによって、モデルの性能のボックスおよびウィスカのグラフを提供している。

反対に明確に示されない限り、複数のステップまたは行為を含む本明細書において特許請求の範囲に記載される任意の方法において、方法のステップまたは行為の順序は、必ずしも方法のステップまたは行為が記載される順序に限定されないことも理解されたい。

本明細書における「一実施形態、」、「実施形態、」、「例示的な実施形態」などへの言及は、記載された実施形態が特定の特徴、構造、または特性を含むことができることを示すが、全ての実施形態は、その特定の特徴、構造、または特性を必ずしも含んでも含まなくてもよい。さらに、そのような句は、必ずしも同じ実施形態を指すとは限らない。さらに、特定の特徴、構造、または特性が実施形態に関連して記載されている場合、明示的に記載されているか否かにかかわらず、他の実施形態に関連してそのような特徴、構造、または特性に影響を及ぼすことは、当業者の知識の範囲内であると考えられる。

本明細書で使用される場合、単数形「ａ」、「ａｎ」、および「ｔｈｅ」は、文脈が別途明確に指示しない限り、複数の指示対象を含む。同様に、「または」という単語は、文脈が別途明確に指示しない限り、「および」を含むことを意図している。「含む」という用語は、「ＡまたはＢを含む」がＡ、Ｂ、またはＡおよびＢを含むことを意味するように、包括的に定義される。

本明細書および特許請求の範囲で使用される場合、「または」は、上記で定義された「および／または」と同じ意味を有することを理解されたい。例えば、リスト内の項目を区切る場合、「または」または「および／または」は、包括的であると解釈されるものとする。例えば、要素の数またはリストの少なくとも１つを含むが、複数、および必要に応じて追加のリストに記載されていない項目を含むと解釈される。「のうちの１つのみ」または「のうちの正確に１つ」、または特許請求の範囲で使用される場合、「からなる」など、反対に明確に示される用語のみは、数または要素のリストのうちの正確に１つの要素を含むことを指す。一般に、本明細書で使用される「または」という用語は、「いずれか」、「のうちの１つ」、「のうちの１つのみ」または「のうちの正確に１つ」など、排他権の用語が先行する場合にのみ、排他的な代替案（例えば、「一方または他方であるが双方ではない」）を示すものとしてのみ解釈されるものとする。「から本質的に構成される」は、特許請求の範囲で使用される場合、特許法の分野で使用される通常の意味を有するものとする。

「備える（ｃｏｍｐｒｉｓｉｎｇ）」、「含む（ｉｎｃｌｕｄｉｎｇ）」、「有する（ｈａｖｉｎｇ）」などの用語は、交換可能に使用され、同じ意味を有する。同様に、「備える（ｃｏｍｐｒｉｓｅｓ）」、「含む（ｉｎｃｌｕｄｅｓ）」、「有する（ｈａｓ）」などは、交換可能に使用され、同じ意味を有する。具体的には、各用語は、「備える」という一般的な米国特許法の定義と一致して定義されているため、「少なくとも以下」を意味するオープンな用語として解釈され、また、追加の特徴、限定事項、態様などを除外しないように解釈される。したがって、例えば、「構成要素ａ、ｂ、およびｃを有する装置」は、装置が少なくとも構成要素ａ、ｂ、およびｃを含むことを意味する。同様に、句：「ステップａ、ｂ、およびｃを含む方法」は、その方法が少なくともステップａ、ｂ、およびｃを含むことを意味する。さらに、ステップおよびプロセスは、ここにおいて特定の順序で概説されることができるが、当業者は、順序付けのステップおよびプロセスが変化し得ることを認識するであろう。

本明細書の明細書および特許請求の範囲で使用される場合、１つ以上の要素のリストに関連する「少なくとも１つ」という句は、要素のリストの任意の１つ以上の要素から選択される少なくとも１つの要素を意味すると理解されるべきであるが、必ずしも要素のリスト内に具体的にリスト化されているありとあらゆる要素の少なくとも１つを含まなくてもなく、要素のリスト内の要素の任意の組み合わせを除外するものではない。この定義はまた、「少なくとも１つ」という句が参照する要素のリスト内で具体的に特定される要素以外の要素が、具体的に特定されるそれらの要素に関連するかどうかにかかわらず、必要に応じて存在することができることを可能にする。したがって、非限定的な例として、「ＡおよびＢの少なくとも１つ」（または、同等に、「ＡまたはＢの少なくとも１つ」、または同等に「Ａおよび／またはＢの少なくとも１つ」）は、一実施形態では、少なくとも１つ、必要に応じて２つ以上のＡを含み、Ｂが存在しない（および必要に応じて、Ｂ以外の要素を含む）を指すことができ、別の実施形態では、少なくとも１つ、必要に応じて２つ以上のＢを含み、Ａが存在しない（および必要に応じて、Ａ以外の要素を含む）を指すことができ、さらに別の実施形態では、少なくとも１つ、必要に応じて２つ以上のＡを含み、少なくとも１つ、必要に応じて２つ以上のＢを含む（および必要に応じて、他の要素を含む）を指すことができるなどである。

本明細書で使用される場合、「生物学的検体」、「試料」、または「組織試料」などの用語は、ウイルスを含む任意の生物から得られる生体分子（タンパク質、ペプチド、核酸、脂質、炭水化物、またはそれらの組み合わせなど）を含む任意の試料を指す。生物の他の例は、哺乳類（人間、猫、犬、馬、牛、および豚などの獣医動物、ならびにマウス、ラット、霊長類などの実験動物など）、昆虫、環形動物、クモ形類動物、有袋類、爬虫類、両生類、細菌、および菌類などを含む。生物学的検体は、組織試料（組織切片や組織の針生検など）、細胞試料（Ｐａｐ塗抹検体もしくは血液塗抹検体などの細胞学的塗抹検体、またはマイクロダイセクションによって得られた細胞の試料など）、または細胞分画、断片または細胞小器官（細胞を溶解し、遠心分離などによってそれらの成分を分離することによって得られる）を含む。生物学的検体の他の例は、血液、血清、尿、精液、糞便、脳脊髄液、間質液、粘膜、涙、汗、膿、生検組織（例えば、外科的生検または針生検によって得られる）、乳頭吸引物、耳垢、乳、膣液、唾液、ぬぐい液（頬スワブなど）、または最初の生物学的検体に由来する生体分子を含む任意の材料を含む。特定の実施形態では、本明細書で使用される「生物学的検体」という用語は、被験者から得られた腫瘍またはその一部から調製された試料（均質化または液化された試料など）を指す。

本明細書で使用される場合、「バイオマーカー」または「マーカー」という用語は、何らかの生物学的状態または症状の測定可能な指標を指す。特に、バイオマーカーは、特異的に染色することができ、細胞の生物学的特徴、例えば細胞の細胞タイプまたは生理学的状態を示すタンパク質またはペプチド、例えば表面タンパク質とすることができる。免疫細胞マーカーは、哺乳動物の免疫応答に関する特徴を選択的に示すバイオマーカーである。バイオマーカーを使用して、身体が疾患または症状の処置にどれだけ良好に応答するか、または被験者が疾患または症状にかかりやすいかを判定することができる。癌の文脈において、バイオマーカーは、体内の癌の存在を示す生体物質を指す。バイオマーカーは、腫瘍によって分泌される分子、または癌の存在に対する身体の特異的応答とすることができる。遺伝子バイオマーカー、エピジェネティックバイオマーカー、プロテオミクスバイオマーカー、グリコームバイオマーカーおよびイメージングバイオマーカーは、癌の診断、予後診断および疫学のために使用されることができる。そのようなバイオマーカーは、血液または血清などの非侵襲的に収集された生体流体でアッセイされることができる。ＡＦＰ（肝臓癌）、ＢＣＲ－ＡＢＬ（慢性骨髄性白血病）、ＢＲＣＡ１／ＢＲＣＡ２（乳癌／卵巣癌）、ＢＲＡＦＶ６００Ｅ（黒色腫／結腸直腸癌）、ＣＡ－１２５（卵巣癌）、ＣＡ１９．９（膵臓癌）、ＣＥＡ（結腸直腸癌）、ＥＧＦＲ（非小細胞肺癌）、ＨＥＲ－２（乳癌）、ＫＩＴ（消化管間質腫瘍）、ＰＳＡ（前立腺特異的抗原）、Ｓ１００（黒色腫）などを含むがこれらに限定されないいくつかの遺伝子およびタンパク質ベースのバイオマーカーが既に患者ケアに使用されている。バイオマーカーは、診断薬（初期癌を同定するため）および／または予後診断薬（癌がどの程度侵攻性であるかを予測するため、および／または被験者が特定の処置にどのように応答するかおよび／または癌がどの程度再発する可能性があるかを予測するため）として有用とすることができる。

本明細書で使用される場合、「細胞」という用語は、原核細胞または真核細胞を指す。細胞は、接着性または非接着性細胞、例えば接着性原核細胞、接着性真核細胞、非接着性原核細胞または非接着性真核細胞とすることができる。細胞は、酵母細胞、細菌細胞、藻類細胞、真菌細胞、またはそれらの任意の組み合わせとすることができる。細胞は、哺乳動物細胞とすることができる。細胞は、被験者から取得された初代細胞とすることができる。細胞は、細胞株または不死化細胞とすることができる。細胞は、ヒトまたはげっ歯類などの哺乳動物から取得されることができる。細胞は、癌または腫瘍細胞とすることができる。細胞は、上皮細胞とすることができる。細胞は、赤血球または白血球とすることができる。細胞は、Ｔ細胞、Ｂ細胞、ナチュラルキラー（ＮＫ）細胞、マクロファージ、樹状細胞などの免疫細胞とすることができる。細胞は、ニューロン細胞、グリア細胞、アストロサイト、ニューロン支持細胞、シュワン細胞などとすることができる。細胞は、内皮細胞とすることができる。細胞は、線維芽細胞またはケラチノサイトとすることができる。細胞は、周皮細胞、肝細胞、幹細胞、前駆細胞などとすることができる。細胞は、循環癌または腫瘍細胞または転移性細胞とすることができる。細胞は、ＣＤ８＋Ｔ細胞またはＣＤ４＋Ｔ細胞などのマーカー特異的細胞とすることができる。細胞は、ニューロンとすることができる。ニューロンは、中枢ニューロン、末梢ニューロン、感覚ニューロン、介在ニューロン、ニューロン内ニューロン、運動ニューロン、多極ニューロン、双極ニューロン、または擬似単極ニューロンとすることができる。細胞は、シュワン細胞などのニューロン支持細胞とすることができる。細胞は、血液脳関門系の細胞のうちの１つとすることができる。細胞は、神経細胞株などの細胞株とすることができる。細胞は、被験者の脳から得られた細胞などの初代細胞とすることができる。細胞は、組織生検、細胞診検体、血液試料、細針吸引物（ＦＮＡ）試料、またはそれらの任意の組み合わせなど、被験者から単離されることができる細胞の集団とすることができる。細胞は、尿、乳、汗、リンパ液、血液、痰、羊水、房水、硝子体液、胆汁、脳脊髄液、乳び、糜粥、滲出液、内リンパ、外リンパ、胃酸、粘液、心膜液、腹水、胸水、膿、粘液、唾液、皮脂、漿液、粘液、痰、涙、嘔吐物、または他の体液などの体液から取得されることができる。細胞は、癌性細胞、非癌性細胞、腫瘍細胞、非腫瘍細胞、健康な細胞、またはそれらの任意の組み合わせを含むことができる。

本明細書で使用される場合、「細胞学的試料」という用語は、試料の細胞が部分的または完全に脱凝集している細胞試料を指し、その結果、試料は、細胞試料が取得された被験者に存在したときの細胞の空間的関係をもはや反映しない。細胞学的試料の例は、組織擦過物（子宮頸部擦過物など）、細針吸引物、被験者の洗浄によって取得された試料などを含む。

本明細書で使用される場合、「固定」という用語は、細胞試料の分子的および／または形態学的詳細が保存されるプロセスを指す。一般に、以下の３種類の固定プロセスがある：（１）熱固定、（２）灌流、および（３）浸漬。熱固定では、試料は、十分な時間熱源に曝露されて加熱死滅し、試料をスライドに接着させる。灌流は、化学固定剤を器官全体または生物全体に分配するための血管系の使用を含む。浸漬は、ある体積の化学固定剤に試料を浸漬し、固定剤を試料全体に拡散させることを可能にすることを含む。化学的固定は、細胞試料全体にわたる化学物質の拡散または灌流を含み、固定試薬は、構造（化学的および構造的の双方）を生細胞試料の構造に可能な限り近く保存する反応を引き起こす。化学固定剤は、動作モードに基づいて以下の２つの広いクラスに分類されることができる：架橋固定剤および非架橋固定剤。架橋固定剤、典型的にはアルデヒドは、組織試料中に存在するタンパク質および核酸などの内因性生体分子間に共有化学結合を形成する。ホルムアルデヒドは、組織学において最も一般に使用される架橋固定剤である。ホルムアルデヒドは、固定のために様々な濃度で使用されることができるが、主に１０％中性緩衝ホルマリン（ＮＢＦ）として使用され、これは、リン酸緩衝生理食塩水水溶液中の約３．７％ホルムアルデヒドである。パラホルムアルデヒドは、加熱されると解重合してホルマリンを提供するホルムアルデヒドの重合形態である。グルタルアルデヒドは、ホルムアルデヒドと同様に作用するが、膜を横切る拡散速度がより遅いより大きな分子である。グルタルアルデヒド固定は、より堅固または強固に連結された固定生成物を提供し、迅速且つ不可逆的な変化を引き起こし、４℃で迅速且つ良好に固定し、良好な全体的な細胞質および核の詳細を提供するが、免疫組織化学染色には理想的ではない。いくつかの固定プロトコルは、ホルムアルデヒドおよびグルタルアルデヒドの組み合わせを使用する。グリオキサールおよびアクロレインは、あまり一般に使用されていないアルデヒドである。変性固定剤（典型的にはアルコールまたはアセトン）は、細胞試料中の水を置換することによって作用し、タンパク質内の疎水性および水素結合を不安定化する。これは、そうでなければ水溶性タンパク質を水不溶性にして沈殿させ、これはほとんど不可逆的である。

本明細書で使用される場合、「免疫組織化学」という用語は、抗原と抗体などの特異的結合剤との相互作用を検出することによって、試料中の抗原の存在または分布を判定する方法を指す。試料は、抗体－抗原結合を可能にする条件下で抗体と接触される。抗体－抗原結合は、抗体にコンジュゲートされた検出可能な標識（直接検出）によって、または一次抗体に特異的に結合する二次抗体にコンジュゲートされた検出可能な標識（間接検出）によって検出されることができる。いくつかの例では、間接的な検出は、抗原の検出可能性をさらに高めるのに役立つ三次以上の抗体を含むことができる。検出可能な標識の例は、酵素、フルオロフォアおよびハプテンを含み、これらは、酵素の場合、発色性または蛍光発生性基質とともに使用されることができる。

本明細書で使用される場合、「マルチチャネル画像」または「マルチプレックス画像」という用語は、核、細胞、および組織構造などの異なる生物学的構造が、それぞれが異なるスペクトルバンドで蛍光を発するか、さもなければ検出可能であり、したがってマルチチャネル画像のチャネルの１つを構成する特定の蛍光色素、量子ドット、色原体などによって同時に染色される生体組織試料から得られるデジタル画像を包含する。

本明細書で使用される場合、「スライド」という用語は、生体試料が分析のために配置される任意の適切な寸法の任意の基材（例えば、全体的または部分的に、ガラス、石英、プラスチック、シリコンなどから作製された基材）、より具体的には、標準の３インチ×１インチの顕微鏡スライドまたは標準の７５ｍｍ×２５ｍｍの顕微鏡スライドなどの「顕微鏡スライド」を指す。スライド上に配置されることができる生体試料の例は、限定されるものではないが、細胞学的塗抹試料、薄い組織切片（生検からのものなど）、および生体試料の配列、例えば、組織配列、細胞配列、ＤＮＡ配列、ＲＮＡ配列、タンパク質配列、またはそれらの任意の組み合わせを含む。したがって、一実施形態では、組織切片、ＤＮＡ試料、ＲＮＡ試料、および／またはタンパク質は、スライド上の特定の位置に配置される。いくつかの実施形態では、スライドという用語は、ＳＥＬＤＩおよびＭＡＬＤＩチップ、ならびにシリコンウェーハを指すことができる。

本明細書で使用される場合、「特異的結合実体」という用語は、特異的結合対のメンバーを指す。特異的結合対は、他の分子への結合を実質的に排除して互いに結合することを特徴とする分子の対である（例えば、特異的結合対は、組織試料中の他の分子との結合対の２つのメンバーのいずれかの結合定数よりも少なくとも１０^３Ｍ^－１大きい、１０^４Ｍ^－１大きいまたは１０^５Ｍ^－１大きい結合定数を有することができる）。特異的結合部分の特定の例は、特異的結合タンパク質（例えば、抗体、レクチン、ストレプトアビジンなどのアビジン、およびプロテインＡ）を含む。特異的結合部分はまた、そのような特異的結合タンパク質によって特異的に結合される分子（またはその部分）を含むことができる。

本明細書で使用される場合、「スペクトルデータ」という用語は、分光計などを用いて、生物学的検体またはその任意の部分から取得された生の画像スペクトルデータを包含する。

本明細書で使用される場合、「スペクトル」という用語は、電磁放射の特定の波長または波数範囲「において」または内で取得された情報（吸収、透過、反射）を指す。波数範囲は、４０００ｃｍ－１ほど大きくてもよく、０．０１ｃｍ－１ほど狭くてもよい。いわゆる「単一レーザ波長」での測定は、典型的には、小さなスペクトル範囲（例えば、レーザ線幅）をカバーし、したがって、用語「スペクトル」が本原稿を通して使用されるときはいつでも含まれることに留意されたい。例えば、量子カスケードレーザの固定波長設定での透過測定は、本明細書では、本出願全体を通してスペクトルという用語に含まれるものとする。

本明細書で使用される場合、「実質的に」という用語は、関心対象の特徴または特性の全体的またはほぼ全体的な程度または度合いを呈する定性的な条件を意味する。いくつかの実施形態では、「実質的に」は、約５％以内を意味する。いくつかの実施形態では、「実質的に」は、約１０％以内を意味する。いくつかの実施形態では、「実質的に」は、約１５％以内を意味する。いくつかの実施形態では、「実質的に」は、約２０％以内を意味する。

本明細書中で使用される場合、用語「組織試料」または「組織検体」（本明細書中では交換可能に使用される）とは、試料が取得された被験者内に存在したときの細胞間の断面空間的関係を保存する細胞試料のことを指すものとする。「組織試料」は、初代組織試料（例えば、被験者によって産生された細胞および組織）および異種移植片（例えば、被験者に移植された外来細胞試料）の双方を包含するものとする。

概要

固定品質、したがって固定持続時間は、下流の分析方法に影響を及ぼすことができると考えられる。例えば、現在の臨床診療では、組織形態の保存と抗原性の喪失との間の妥協点を達成するために、組織固定持続時間を制御することが重要である。実際に、固定持続時間が短すぎるか長すぎると、下流の試料処理に悪影響を及ぼすことがある。したがって、下流処理の前に、例えば試料を１つ以上のマスキング解除剤と接触させる前に、または１つ以上の特異的結合実体と接触させる前に、試料の固定持続時間の正確な予測が依然として必要とされている。

本開示は、１つ以上の固定剤によって処理された組織試料の固定持続時間を定量的に推定するためのシステムおよび方法を記載する。例えば、本開示は、生物学的検体が固定プロセスに供された時間、例えば約０時間、約１時間、約２時間、約４時間、約１２時間、約１６時間、約２４時間、約４８時間などを予測するためのシステムおよび方法を提供する。本開示はまた、グラウンドトゥルースデータに基づいて固定持続時間の定量的判定を可能にするために固定推定エンジンを訓練するためのシステムおよび方法を記載する。いくつかの実施形態では、本開示はまた、生物学的検体の固定品質の定性的推定値を提供するためのシステムおよび方法を提供する。

本開示の少なくともいくつかの実施形態は、既知の期間、推定された期間、または未知の期間のいずれかの固定プロセスに少なくとも供された生物学的検体から取得されたスペクトルデータを分析するためのコンピュータシステムおよび方法に関する。例えば、固定推定エンジンを訓練するために取得されたスペクトルデータの場合、訓練された生物学的検体の固定持続時間は既知とすることができる（および／または本明細書に記載の機能的ＩＨＣ試験によって検証されることができる）。別の例として、また、被験者の生物学的検体（例えば、試験生物学的検体）から導出される試験スペクトルの場合、固定持続時間は、未知であるか、またはおおよそ推定されることができる。本開示によれば、訓練された固定推定エンジンが使用されて、固定持続時間が未知であるか、またはおおよそ推定されただけである試験生物学的検体の固定持続時間の定量的推定値を提供することができる。さらに、訓練された固定推定エンジンが使用されて、未知の時間量の１つ以上の固定プロセスに供された試験生物学的検体の固定持続時間を検証することができる。例えば、受け取った試験生物学的検体が、検体が１０時間固定されたという表記を含む場合、本開示のシステムおよび方法が使用されて、記載された固定持続時間を検証することができる。このようにして、試料の評価は、試料が下流処理および／または分析の準備ができているかどうか、例えば、試験生物学的検体が特定の特異的結合実体による標識に適した固定状態にあるかどうかを判定するために行われることができる。

振動スペクトルデータ、例えば中間赤外（中間ＩＲ）スペクトルデータまたはラマンスペクトルデータを取得し、生物学的検体（試験生物学的検体および訓練生物学的検体を含む）を分析するためのシステム２００が図１および図２に示されている。システムは、生物学的検体（またはその任意の部分）の振動スペクトルを取得するように構成されたものなどのスペクトル取得装置１２と、コンピュータ１４とを含むことができ、それによってスペクトル取得装置１２とコンピュータとは、ともに通信可能に結合されることができる（例えば、直接的に、またはネットワーク２０を介して間接的に）。コンピュータシステム１４は、デスクトップコンピュータ、ラップトップコンピュータ、タブレットなど、デジタル電子回路、ファームウェア、ハードウェア、メモリ２０１、コンピュータ記憶媒体（２４０）、コンピュータプログラムまたは命令セット（例えば、プログラムがメモリまたは記憶媒体内に記憶されている場合）、１つ以上のプロセッサ（２０９）（プログラムされたプロセッサを含む）、および任意の他のハードウェア、ソフトウェア、またはファームウェアモジュールまたはそれらの組み合わせ（本明細書でさらに説明されるような）を含むことができる。例えば、図１に示すシステム１４は、表示装置１６およびエンクロージャ１８を有するコンピュータを含むことができる。コンピュータシステムは、取得されたスペクトルデータを、メモリ、サーバ、または別のネットワーク接続されたデバイスなどにローカルに記憶することができる。

振動分光法は、電磁放射線の吸収または放射による遷移に関係する。これらの遷移は、１０２から１０４ｃｍ^－１の範囲に現れ、任意の所与の試料中の分子を構成する核の振動に由来すると考えられる。分子内の化学結合は、多くの方法で振動することができると考えられており、それぞれの振動は、振動モードと呼ばれる。分子振動には、伸縮および屈曲の２種類がある。伸縮振動は、原子間距離の増加または減少に伴う結合軸に沿った移動を特徴とするが、屈曲振動は、分子の残りの部分に対する結合角の変化からなる。振動エネルギーに基づく２つの広く使用されている分光技術は、ラマン分光法および赤外分光法である。双方の方法は、相補的な情報を与え、任意の分子内で原子がその分子のいくつかの明確な明確に定義された周波数特性で振動するという事実に基づいている。試料は、入射放射線のビームが照射されると、分子内に存在する化学結合の振動の周波数に特徴的な周波数でエネルギーを吸収する。化学結合の振動によるエネルギーのこの吸収は、赤外線スペクトルをもたらす。

ＩＲおよびラマン分光法は、分子の振動エネルギーを測定するが、双方の方法は、異なる選択ルール、例えば吸収プロセスおよび散乱効果に依存する。それらのコントラスト機構は異なり、各方法論は、それぞれの長所と短所を有するが、各モダリティから得られたスペクトルは、相関があることが多い（例えば、図７Ａおよび図７Ｂを参照）。

ＩＲ分光法は、電磁放射の吸収に基づくのに対して、ラマン分光法は、電磁放射の非弾性散乱に依存する。赤外分光法は、吸収技術から反射技術および分散技術まで、広範囲の波数に拡張され、試料分子中に存在する異なる結合が定性的および定量的目的の双方に使用するのに適した多数の一般的且つ特徴的なバンドを提供する近赤外領域、中間赤外領域および遠赤外領域を含む多数の分析ツールを提供する。試料にはＩＲ分光法におけるＩＲ光が照射され、電気双極子モーメントによって誘起される振動を検出する。

ラマン分光法は、散乱現象であり、入射放射周波数と散乱放射周波数との間の差に起因して生じる。これは、散乱光を利用して分子振動に関する知識を獲得し、分子の構造、対称性、電子環境、および結合に関する情報を提供することができる。ラマン分光法では、試料は、レーザ源からの単色の可視光または近ＩＲ光によって照射され、電気分極率変化中のその振動が判定される。

本開示のシステムでは、任意のスペクトル取得装置が利用されることができる。中間赤外スペクトルを取得するのに使用するのに適したスペクトル取得装置またはそのような装置の構成要素の例は、米国特許出願公開第２０１８／０１０９０７８ａ号明細書および米国特許出願公開第２０１６／００９１７０４号明細書、ならびに米国特許第１０，０４１，８３２号明細書、米国特許第８，０３６，２５２号明細書、米国特許第９，０４６，６５０号明細書、米国特許第６，９７２，４０９号明細書、および米国特許第７，２８０，５７６号に記載されており、これらの特許の開示は、その全体が参照により本明細書に組み込まれる。

試料の代表的な中間ＩＲスペクトルを生成するのに適した任意の方法が使用されることができる。フーリエ変換赤外分光法およびその生物医学的用途は、例えば、Ｐ．Ｌａｓｃｈ，Ｊ．Ｋｎｅｉｐｐ（Ｅｄｓ．）ＢｉｏｍｅｄｉｃａｌＶｉｂｒａｔｉｏｎａｌＳｐｅｃｔｒｏｓｃｏｐｙ’’ ２００８（ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ）に記載されている。しかしながら、より最近では、波長可変量子カスケードレーザは、それらの高いスペクトル出力密度のために生物学的検体の迅速な分光法および顕微鏡法を可能にした（Ｎ．Ｋｒoｇｅｒら、ｉｎ：ＢｉｏｍｅｄｉｃａｌＶｉｂｒａｔｉｏｎａｌＳｐｅｃｔｒｏｓｃｏｐｙＶＩ：ＡｄｖａｎｃｅｓｉｎＲｅｓｅａｒｃｈａｎｄＩｎｄｕｓｔｒｙ，ｅｄｉｔｅｄｂｙＡ．Ｍａｈａｄｅｖａｎ－Ｊａｎｓｅｎ，Ｗ．Ｐｅｔｒｉｃｈ，Ｐｒｏｃ．ｏｆＳＰＩＥＶｏｌ．８９３９，８９３９０Ｚ；Ｎ．Ｋｒoｇｅｒら、Ｊ．Ｂｉｏｍｅｄ．Ｏｐｔ．１９（２０１４）１１１６０７；Ｎ．Ｋｒoｇｅｒ－Ｌｕｉら、Ａｎａｌｙｓｔ１４０（２０１５）２０８６）。これらの刊行物のそれぞれの内容は、その全体が参照により本明細書に組み込まれる。この研究は、調査がはるかに速く（例えば、１８時間の代わりに５分）、液体窒素冷却を必要とせず、大幅に低コストで画像当たりより多くのピクセルを提供するという点で、（前述の赤外線顕微鏡のセットアップと比較して）適用性に対する大きなブレークスルーを構成すると考えられている。未染色組織の品質評価の文脈におけるＱＣＬベースの顕微鏡法の特定の利点の１つは、例えば６４０×４８０ピクセルのマイクロボロメータアレイ検出器によって可能にされる（ＦＴ－ＩＲイメージングと比較して）より大きな視野である。

いくつかの実施形態では、スペクトルは、広い波長範囲、１つ以上の狭い波長範囲にわたって、もしくは単一の波長のみ、またはそれらの組み合わせでさえも取得されることができる。例えば、アミドＩバンドおよびアミドＩＩバンドのスペクトルが取得されることができる。別の例として、スペクトルは、約３２００から約３４００ｃｍ^－１、約２８００から約２９００ｃｍ^－１、約１０２０から約１１００ｃｍ^－１、および／または約１５２０から約１５８０ｃｍ^－１の範囲の波長にわたって取得されてもよい。いくつかの実施形態では、スペクトルは、約３２００から約３４００ｃｍ^－１の範囲の波長にわたって取得されることができる。いくつかの実施形態では、スペクトルは、約２８００から約２９００ｃｍ^－１の範囲の波長にわたって取得されることができる。いくつかの実施形態では、スペクトルは、約１０２０から約１１００ｃｍ^－１の範囲の波長にわたって取得されることができる。いくつかの実施形態では、スペクトルは、約１５２０から約１５８０ｃｍ^－１の範囲の波長にわたって取得されることができる。スペクトル範囲を狭めることは、通常、特に量子カスケードレーザを使用する場合、取得速度の点で有利である。特定の一実施形態では、単一の波長可変レーザは、次々にそれぞれの波長に調整される。あるいは、特定の周波数での測定に必要なレーザをオンおよびオフに切り替えることによって波長選択が行われるように、固定周波数の非同調レーザのセットが使用されることができる。

スペクトルは、例えば、透過または反射測定を使用して取得されることができる。透過測定のために、フッ化バリウム、フッ化カルシウム、シリコン、薄いポリマー膜、またはセレン化亜鉛が、通常、基材として使用される。反射測定のために、金または銀メッキされた基材、ならびに標準的な顕微鏡ガラススライド、または中間ＩＲ反射コーティング（例えば、多層誘電体コーティングまたは薄スライバコーティング）によってコーティングされたガラススライドが一般的である。さらに、ナノアンテナのような構造化表面などの、表面増強（例えば、ＳＥＩＲＳ）を使用するための手段が実装されてもよい。

当業者であれば、他のコンピュータ装置またはシステムを利用することができ、本明細書に記載のコンピュータシステムが追加の構成要素、例えば顕微鏡、イメージング装置、スキャナ、他のイメージングシステム、自動スライド調製装置などに通信可能に結合されることができることを理解するであろう。これらの追加の構成要素のいくつか、および利用できる様々なコンピュータ、ネットワークなどは、本明細書でさらに説明される。

例えば、いくつかの実施形態では、システム２００は、イメージング装置をさらに含んでもよく、イメージング装置から取り込まれた画像は、ローカルまたはサーバ上などにバイナリ形式で記憶されてもよい。デジタル画像はまた、ピクセルの行列に分割されることもできる。ピクセルは、ビット深度によって定義される１以上のビットのデジタル値を含むことができる。一般に、イメージング装置（メモリに記憶された事前にスキャンされた画像を含む他の画像ソース）は、限定されるものではないが、１つ以上の画像撮像装置を含むことができる。画像撮像装置には、限定されるものではないが、カメラ（例えば、アナログカメラ、デジタルカメラなど）、光学系（例えば、１つ以上のレンズ、センサフォーカスレンズ群、顕微鏡対物レンズなど）、イメージングセンサ（例えば、電荷結合素子（ＣＣＤ）、相補的金属酸化物半導体（ＣＭＯＳ）イメージセンサなど）、写真フィルムなどを含む。デジタル実施形態では、画像撮像装置は、オンザフライフォーカシングを証明するために協働する複数のレンズを含むことができる。イメージセンサ、例えば、ＣＣＤセンサは、検体のデジタル画像を撮像することができる。いくつかの実施形態では、画像化装置は、明視野イメージングシステム、マルチスペクトルイメージング（ＭＳＩ）システム、または蛍光顕微鏡法システムである。デジタル化された組織データは、例えば、ＶＥＮＴＡＮＡＭＥＤＩＣＡＬＳＹＳＴＥＭＳ，Ｉｎｃ．（アリゾナ州トゥーソン）によるＶＥＮＴＡＮＡＤＰ２００スキャナなどの画像スキャンシステムまたは他の適切なイメージング装置によって生成されることができる。さらなるイメージング装置およびシステムは、本明細書でさらに説明される。当業者は、イメージング装置によって取得されたデジタルカラー画像が、従来、基本色ピクセルから構成されることを理解するであろう。各色付きピクセルは、それぞれが同じビット数を含む３つのデジタルコンポーネントでコード化されることができ、各コンポーネントは、「ＲＧＢ」コンポーネントという用語によっても示される、一般に赤、緑、または青の原色に対応する。

図２は、本開示のシステム２００およびシステム内で利用される様々なモジュールの概要を提供している。いくつかの実施形態では、システム２００は、１つ以上のプロセッサ２０９および１つ以上のメモリ２０１を有するコンピュータ装置またはコンピュータ実装方法を使用し、１つ以上のメモリ２０１は、１つ以上のプロセッサに本明細書に記載の特定の命令を実行させるために、１つ以上のプロセッサによる実行のための非一時的なコンピュータ可読命令を記憶する。

いくつかの実施形態では、上述したように、システムは、取得された生物学的検体（例えば、図３のステップ３１０を参照）またはその任意の部分（例えば、図３のステップ３２０を参照）の中間ＩＲスペクトルまたはラマンスペクトルなどの振動スペクトルを取得するためのスペクトル取得モジュール２０２を含む。いくつかの実施形態では、システム２００は、取得されたスペクトルデータを処理するように適合されたスペクトル処理モジュール２１２をさらに含む。いくつかの実施形態では、スペクトル処理モジュール２１２は、取得されたスペクトル（例えば、図６のステップ６２０から６２０を参照）を補正および／または正規化するため、または取得された透過スペクトルを吸収スペクトルに変換するためなどに、スペクトルデータを前処理するように構成される。他の実施形態では、スペクトル処理モジュール２１２は、単一の生物学的検体から導出される複数の取得されたスペクトルを平均化するように構成される。さらに他の実施形態では、スペクトル処理モジュールは、取得されたスペクトルの一次導関数または二次導関数を計算するように構成される。

いくつかの実施形態では、システム２００は、訓練スペクトルデータを受信し、受信した訓練スペクトルデータを使用して固定推定エンジン２１０を訓練するように適合された（例えば、図７のステップ７１０から７３０を参照）訓練モジュール２１１をさらに含む。いくつかの実施形態では、システム２００は、試験スペクトルデータ内の固定特徴を検出し（例えば、図３のステップ３４０を参照）、検出された固定特徴に基づいて固定持続時間の推定値を提供する（例えば、図３のステップ３５０を参照）ように訓練された固定推定エンジン２１０を含む。

いくつかの実施形態では、訓練された固定推定エンジン２１０は、１つ以上の機械学習アルゴリズムを含む。いくつかの実施形態では、１つ以上の機械学習アルゴリズムは、本明細書でさらに説明するように次元縮小に基づく。いくつかの実施形態では、次元縮小は、判別分析を伴う主成分分析などの主成分分析を利用した。他の実施形態では、次元縮小は、潜在構造回帰への投影である。いくつかの実施形態では、マスキング解除状態推定エンジン２１０は、ニューラルネットワークを含む。他の実施形態では、固定推定エンジンは、教師あり分類器を含む。いくつかの実施形態では、固定推定エンジンは、ニューラルネットワークを含む。

当業者はまた、追加のモジュールがワークフローまたはシステム２００に組み込まれることができることを理解するであろう。いくつかの実施形態では、画像取得モジュールが実行されて、生物学的検体またはその任意の部分のデジタル画像を取得する。他の実施形態では、細胞が検出、分類、および／またはスコア付けされることができるように自動化アルゴリズムが実行されることができる（例えば、その開示が参照によりその全体が本明細書に組み込まれる米国特許出願公開第２０１７／０３７２１１７号明細書を参照）。

分光取得モジュールおよび取得された分光データ

図２を参照すると、いくつかの実施形態では、システム２００は、生物学的検体の少なくとも一部の振動スペクトル（例えば、上述したもののいずれかなどのスペクトルイメージング装置１２を使用して）を取り込むためにスペクトル取得モジュール２０２を実行する。いくつかの実施形態では、生物学的検体は、染色されておらず、例えば、生物学的検体は、バイオマーカーの存在を示す染色を含まない。他の実施形態では、生物学的検体はまた、１つ以上の染色、例えば一次染色、または１つ以上のバイオマーカーの存在を示す染色を含むことができる。スペクトル取得モジュール２０２を使用してスペクトルが取得されると、それらは、記憶モジュール２４０（例えば、ローカル記憶モジュールまたはネットワーク記憶モジュール）に記憶されることができる。

いくつかの実施形態では、振動スペクトルは、生物学的検体の一部から取得されることができる（本明細書でさらに説明するように、これは、検体が訓練生物学的検体であるか試験生物学的検体であるかに関係なく）。そのような場合、スペクトル取得モジュール２０２は、例えばランダムサンプリングによって、または試料全体をカバーするグリッドにわたって規則的な間隔でサンプリングすることによって、試料の所定の部分から振動スペクトルを取得するようにプログラムされてもよい。これは、試料の特定の領域のみが分析に関連する場合にも有用とすることができる。例えば、関心領域は、特定の種類の組織、または別の関心領域と比較して特定の種類の細胞の比較的高い集団を含むことができる。例えば、扁桃組織を含むが結合組織を含まない関心領域が選択されることができる。そのような場合、スペクトル取得モジュール２０２は、例えば関心領域のランダムサンプリングによって、または関心領域全体をカバーするグリッドにわたって規則的な間隔でサンプリングすることによって、関心領域の所定の部分から振動スペクトルを収集するようにプログラムされてもよい。試料が１つ以上の染色を含む実施形態では、染色を含まないか、または他の領域よりも比較的少ない染色を含む関心領域から振動スペクトルが取得されることができる。

いくつかの実施形態では、生物学的検体の少なくとも２つの領域がサンプリングされ、少なくとも２つの領域のそれぞれについて振動スペクトルが取得される（また、これは、検体が訓練生物学的検体であるか試験生物学的検体であるかに関係なく）。他の実施形態では、生物学的検体の少なくとも１０個の領域がサンプリングされ、少なくとも１０個の領域のそれぞれについて振動スペクトルが取得される。さらに他の実施形態では、生物学的検体の少なくとも３０個の領域がサンプリングされ、少なくとも３０個の領域のそれぞれについて振動スペクトルが取得される。さらなる実施形態では、生物学的検体の少なくとも６０個の領域がサンプリングされ、少なくとも６０個の領域のそれぞれについて振動スペクトルが取得される。またさらなる実施形態では、生物学的検体の少なくとも９０個の領域がサンプリングされ、少なくとも９０個の領域のそれぞれについて振動スペクトルが取得される。なおさらなる実施形態では、生物学的検体の約３０個の領域と約１５０個の領域との間がサンプリングされ、各領域について振動スペクトルが取得される。

いくつかの実施形態では、生物学的検体の領域ごとに単一の振動スペクトルが取得される。他の実施形態では、生物学的検体の領域ごとに少なくとも２つの振動スペクトルが取得される。さらに他の実施形態では、生物学的検体の領域ごとに少なくとも３つの振動スペクトルが取得される。

いくつかの実施形態では、記憶モジュール２４０に記憶される取得スペクトルまたは取得スペクトルデータ（本明細書では互換的に使用される）は、「訓練スペクトルデータ」を含む。いくつかの実施形態では、訓練スペクトルデータは、訓練生物学的検体から導出され、訓練生物学的検体は、組織学的検体、細胞学的検体、またはそれらの任意の組み合わせとすることができる。いくつかの実施形態では、訓練スペクトルデータは、本明細書に記載の訓練モジュール２１１の使用などによって、固定推定エンジン２１０を訓練するために使用される。いくつかの実施形態では、訓練スペクトルデータは、固定持続時間および／または固定品質などのクラスラベルを含む。

いくつかの実施形態では、訓練生物学的検体は、別様に固定される。差次固定とは、単一の訓練生物学的検体を複数の部分（例えば、第１の訓練組織試料、第２の訓練組織試料、および第ｎの訓練組織試料）に分割し（例えば、図４Ａを参照）、複数の部分のそれぞれに異なる固定処理を施す（例えば、図４Ｂを参照）処理である。例えば、単一の扁桃組織試料が１０個以上の部分に分割され、各部分を所定の時間にわたって固定されることができる。いくつかの実施形態では、試料は、３つ以上の部分に区分されることができ、各部分は、異なる時間量にわたって固定されることができ、したがって３つの別様に固定された訓練試料を提供することができる。他の実施形態では、試料は、５つ以上の部分に区分されることができ、各部分は、異なる時間量にわたって固定されることができ、したがって５つの別様に固定された訓練試料を提供することができる。さらに他の実施形態では、試料は、７つ以上の部分に区分されることができ、各部分は、異なる時間量にわたって固定されることができ、したがって、７つの別様に固定された訓練試料を提供することができる。さらなる実施形態では、試料は、９つ以上の部分に区分されることができ、各部分は、異なる時間量にわたって固定されることができ、したがって、９つの別様に固定された訓練試料を提供することができる。このプロセスは図４Ａに示される。例として、単一の扁桃組織試料は、７つの部分に分割されることができ、各部分は、所定の時間量、例えば０時間、約１時間、約２時間、約４時間、約６時間、約１２時間、約２４時間などの間、別様に固定されることができる。

いくつかの実施形態では、任意の訓練生物学的検体（またはその一部）は、任意の所定の時間量、例えば約１時間、約２時間、約４時間、約６時間、約１２時間などの間、固定されることができ、訓練生物学的検体から取得された訓練スペクトルは、固定推定エンジン２１０を訓練する際のグラウンドトゥルースとして機能することができる。この点に関して、複数の訓練生物学的検体は、それぞれ、異なる程度など、部分的に固定されてもよく（例えば、試料が「完全に固定」または「十分に固定」と見なされるのに十分な持続時間、固定剤によって処理されない）、これらの部分的に固定された検体は、「完全に固定」または「十分に固定」と判定された生物学的検体の訓練とともに、固定推定エンジン２１０を訓練するために使用されてもよい。さらに、固定されていない試料（例えば、０時間の固定）もまた、訓練モジュール２１１に供給されることができる。

いくつかの実施形態では、所定の時間量の間少なくとも部分的に固定された訓練生物学的検体は、複数のバイオマーカーの機能的ＩＨＣ染色を使用して定量的に検証され、例えば、検体の固定条件は、ＩＨＣ分析によって確認されている。いくつかの実施形態では、機能的染色強度が各訓練試料について評価されることができるように、訓練試料のそれぞれは、１つ以上のバイオマーカーの存在について染色される。いくつかの実施形態では、各訓練試料は、単一のバイオマーカーの存在について染色され、次いで、試料の画像は、イメージング装置を使用して取り込まれ、（染色強度および／または陽性率などについて）分析される。他の実施形態では、各訓練試料は、２つ以上のバイオマーカーの存在について染色され、次いで、試料の画像は、イメージング装置を使用して取り込まれ、（２つ以上のバイオマーカーのそれぞれの染色強度および／または陽性率が独立して分析されるように）分析される。例えば、異なる部分的に固定された検体は、異なる程度に固定されることができ、この異なる固定は、異なる既知の時間（例えば、６時間、１２時間、２４時間など。）に１つ以上のバイオマーカー（例えば、ＢＬＣ２、ＦＯＸＰ３など）の存在について染色することによって検証されることができる。

別様固定および別様固定された試料からのスペクトルデータの取得のプロセスは、図４Ｃおよび図８にさらに示されている。上記のように、まず、１つ以上の訓練生物学的検体が取得される（ステップ４１０）。次いで、１つ以上の訓練生物学的検体のそれぞれは、少なくとも二部分に分割される（ステップ４２０）。このようにして、１つ以上の訓練生物学的検体のそれぞれは、少なくとも２つの「訓練試料」を提供する。これらの訓練試料のそれぞれは、別様に固定されることができ、例えば、それぞれが異なる所定の時間量にわたって固定されることができる（ステップ４３０）。

少なくとも２つの訓練試料の別様固定に続いて、少なくとも２つの訓練試料のそれぞれにおける複数の領域が識別される（ステップ４４０）。次に、複数の識別された領域のうちの識別された領域のそれぞれについて、少なくとも１つの振動スペクトルが取得される（ステップ４５０）。いくつかの実施形態では、各識別された領域（または以下にさらに説明するようなそのさらなる処理された変形）から取得された各振動スペクトルの平均が計算されて、その訓練試料の平均振動スペクトルを提供する（ステップ４６０）。ステップ４００から４６０は、複数の異なる訓練生物学的検体について繰り返されてもよい（点線４７０を参照）。いくつかの実施形態では、記憶モジュール２４０などに、全ての訓練生物学的検体からの全ての訓練試料からの平均化された振動スペクトル「訓練スペクトルデータ」が記憶される（ステップ４８０）。このようにして、訓練スペクトルデータは、固定推定エンジン２１０の訓練のために訓練モジュール２１１によって記憶モジュール２４０から取得されることができる。全ての訓練試料からの平均振動スペクトルを記憶することに加えて、記憶モジュール２４０はまた、平均振動スペクトルに関連する任意のクラスラベル、例えば既知の固定持続時間、定性的固定推定値などを記憶するように適合される。

例として、別様に固定された検体からのＦＦＰＥブロックは、振動に適合するスライド上に区分されることができる。次いで、スライド上の試料を粗にマッピングするために、可視低倍率対物レンズを使用して切片全体がイメージングされることができる（例えば、図１０Ａを参照）。次に、試料全体の複数の空間領域は、テルル化カドミウム水銀検出器単一点検出器（ｖ＝９００～４０００ｃｍ－１、Δｖ＝８ｃｍ－１、平均＝１６）を使用する振動顕微鏡（例えば、ＢｒｕｋｅｒＨｙｐｅｒｉｏｎ３０００）などのスペクトル取得装置１２を使用して分光的にイメージングされるように選択されることができる。これは、図１０Ｂおよび図１０Ｃに示されている。

上述したプロセスは、複数の異なる訓練生物学的検体について繰り返されてもよく、複数の異なる訓練生物学的検体のそれぞれは、同じ組織タイプのものであってもよいし、異なる組織タイプのものであってもよい。本明細書の実施例１は、訓練生物学的検体を調製する方法、および固定推定エンジン２１０の訓練に使用するためのスペクトルデータの取得をさらに説明する。さらに、上述したプロセスは、異なる固定剤試薬または異なる固定プロセスについて繰り返されてもよい。

いくつかの実施形態では、記憶モジュール２４０に記憶された取得スペクトルデータは、「試験スペクトルデータ」を含む。いくつかの実施形態では、試験スペクトルデータは、被験者（例えば、ヒト患者）から導出される検体などの試験生物学的検体から導出され、試験生物学的検体は、組織学的検体、細胞学的検体、またはそれらの任意の組み合わせとすることができる。

図５を参照すると、試験生物学的検体が取得されることができ（ステップ５１０）、次いで、試験生物学的検体内の複数の空間領域が識別されることができる（ステップ５２０）。各識別された領域について少なくとも１つの振動スペクトルが取得されることができる（ステップ５３０）。次いで、全ての領域からの取得された振動スペクトルが補正され、正規化され、平均化されて、試験生物学的検体の平均振動スペクトル（「試験スペクトルデータ」）を提供することができる。本明細書でさらに説明するように、試験スペクトルデータは、少なくとも試験生物学的検体の固定持続時間を推定することができるように、訓練された固定推定エンジン２１０に供給されることができる。次いで、推定された固定持続時間は、下流プロセスまたは下流の意思決定において使用されて、例えば、検体が適切に固定されているかどうかを判定し、検体がさらなる固定を必要とするかどうかを判定し、または固定の程度が特定のＩＨＣまたはＩＳＨアッセイに十分であるかどうかを判定することができる。

上述したように、スペクトルデータが訓練生物学的検体または試験生物学的検体から取得されるかどうかにかかわらず、例えば試料の空間的不均一性を説明するために、各生物学的検体について複数の振動スペクトルが取得される。いくつかの実施形態では、スペクトル処理モジュール２１２は、取得された各振動透過スペクトルを振動吸収スペクトルに変換するために最初に利用される。いくつかの実施形態では、透過スペクトルおよび吸光度スペクトルは、式吸光度＝ｌｎ（ブランク透過／組織を通る透過）を介して直接関連しており、したがって、取得された透過スペクトルは、吸収スペクトルに変換されることができる。

振動スペクトルの全てが透過から吸光度に変換されると、いくつかの実施形態では、（スペクトル処理モジュール２１２を使用するなどして）様々な領域の全てからの取得されたスペクトルがともに平均化され、それは、例えば固定持続時間を訓練または推定するための下流分析に使用される平均化された振動スペクトルである。いくつかの実施形態では、図６を参照すると、複数の空間領域のそれぞれから取得された振動スペクトルは、それらの平均化の前に最初に正規化および／または補正される。いくつかの実施形態では、各領域からの振動スペクトルは、補正された振動スペクトルを提供するために個別に補正される（ステップ６２０）。例えば、補正は、大気効果について各取得振動スペクトルを補正すること（ステップ６３０）と、次いで散乱について各大気補正振動スペクトルを補正すること（ステップ６４０）とを含むことができる。次に、各補正振動スペクトルは、所定の最大値に正規化された振幅である（ステップ６５０）。続いて、振幅正規化スペクトルの集合が平均化される（ステップ６６０）。

このプロセスは、図１０Ｄから図１０Ｈに示されている。例として、各点の生の中間ＩＲスペクトルが図１０Ｄに表示されている。これらのスペクトルは、全ての中間ＩＲ周波数にわたって透過光を測定し、組織が吸収している光の量の測定値を得るために組織を含まないスライドの透過で割ることによって計算された。収集されたスペクトルは、大気効果について補償され（図１０Ｅ）、次いで、６４のベースライン点および約８回の反復による凹状ゴムバンド補正を使用して組織内の散乱を補償するためにベースライン補正された（図１０Ｆ）。次いで、各スペクトルは、最大値（図１０Ｇ）に対して振幅正規化され、次いで、所与の組織からの全てのスペクトルをともに平均化することによって各組織からの平均スペクトルが計算されて、各試料のスライドの高品質の代表スペクトルを計算した（図Ｈ）。

固定推定エンジン

本開示のシステムおよび方法は、機械学習技術を使用してスペクトルデータをマイニングする。訓練モードの固定推定エンジンの場合、固定推定エンジンは、取得および処理された複数の訓練スペクトルから特徴（例えば、固定特徴）を学習し、それらの学習された特徴を訓練スペクトルに関連するクラスラベルと相関させることができる（例えば、既知の固定持続時間、１つ以上のバイオマーカーによる既知の機能的染色など）。訓練された固定推定エンジン（例えば、訓練スペクトルデータおよび関連するクラスラベルを使用して既に訓練されている固定推定エンジン）の場合、訓練された固定エンジンは、試験生物学的検体から特徴（例えば、固定特徴）を導出し、学習されたデータセットに基づいて、導出された固定特徴に基づいて試験生物学的検体の固定状態を予測することができる。

機械学習は、一般に、明示的にプログラムされることなく学習する能力をコンピュータに提供する一種の人工知能（ＡＩ）として定義されることができる。機械学習は、新たなデータにさらされたときに成長および変化することを自らに教えることができるコンピュータプログラムの開発に焦点を合わせている。換言すれば、機械学習は、コンピュータに明示的にプログラムされることなく学習する能力を与えるコンピュータ科学のサブフィールドとして定義されることができる。機械学習は、データから学習し、データ上で予測を行うことができるアルゴリズムの研究および構築を探求し、そのようなアルゴリズムは、試料入力からモデルを構築することによって、データ駆動予測または決定を行うことによって厳密に静的なプログラム命令に従うことを克服する。本明細書に記載の機械学習は、本明細書に完全に記載されているかのように参照により組み込まれる、Ｓｕｇｉｙａｍａ、ＭｏｒｇａｎＫａｕｆｍａｎｎ、２０１６，５３４ページ；「Ｄｉｓｃｒｉｍｉｎａｔｉｖｅ，Ｇｅｎｅｒａｔｉｖｅ，ａｎｄＩｍｉｔａｔｉｖｅＬｅａｒｎｉｎｇ」、Ｊｅｂａｒａ，ＭＩＴＴｈｅｓｉｓ，２００２，２１２ページ；および「ＰｒｉｎｃｉｐｌｅｓｏｆＤａｔａＭｉｎｉｎｇ（ＡｄａｐｔｉｖｅＣｏｍｐｕｔａｔｉｏｎａｎｄＭａｃｈｉｎｅＬｅａｒｎｉｎｇ）」、Ｈａｎｄら、ＭＩＴＰｒｅｓｓ，２００１，５７８ページに記載されているようにさらに実行されることができる。本明細書に記載の実施形態は、これらの参考文献に記載されているようにさらに構成されることができる。

いくつかの実施形態では、固定推定エンジン２１０は、試験生物学的検体から導出される試験スペクトルの固定状態を予測するタスクのために「教師あり学習」を使用する。教師あり学習は、例示的な入出力対に基づいて入力を出力にマッピングする関数を学習する機械学習タスクである。これは、訓練例のセット（ここでは訓練スペクトル）からなるラベル付き訓練データ（ここで、固定時間は、訓練スペクトルデータに関連付けられたラベルである）から関数を推論する。教師あり学習では、各例は、入力オブジェクト（典型的にはベクトル）と所望の出力値（教師信号とも呼ばれる）とからなるペアである。教師あり学習アルゴリズムは、訓練データを分析し、新たな例をマッピングするために使用されることができる推論関数を生成する。最適なシナリオは、アルゴリズムが見えないインスタンスのクラスラベルを正しく判定することを可能にする。

固定推定エンジン２１０は、当業者に知られている任意のタイプの機械学習アルゴリズムを含むことができる。適切な機械学習アルゴリズムは、回帰アルゴリズム、類似性ベースのアルゴリズム、特徴選択アルゴリズム、正則化方法ベースのアルゴリズム、決定木アルゴリズム、ベイジアンモデル、カーネルベースのアルゴリズム（例えば、サポートベクターマシン）、クラスタリングベースの方法、人工ニューラルネットワーク、深層学習ネットワーク、アンサンブル方法、遺伝的アルゴリズム、および次元縮小方法を含む。適切な次元縮小方法の例は、主成分分析（主成分分析、および判別分析など）、潜在構造回帰への投影、およびｔ分布確率的近傍埋め込み（ｔ－ＳＮＥ）を含む。

いくつかの実施形態では、マスキング解除状態推定エンジン２１０は、主成分分析を利用する。主成分分析（ＰＣＡ）の主なアイデアは、データセットに存在する変動を最大限まで保持しながら、互いに相関する多くの変数からなるデータセットの次元を縮小することである。同じことが、変数を新たな変数のセットに変換することによって行われ、これらは、主成分（または単に、ＰＣ）として知られており、元の変数に存在する変動の保持がそれらが順序を下って移動するにつれて減少するように直交して並べられる。このようにして、第１の主成分は、元の成分に存在していた最大の変動を保持する。主成分は、共分散行列の固有ベクトルであるため、直交する。主成分分析、およびそれを使用する方法は、米国特許出願公開第２００５／０１２３２０２号明細書ならびに米国特許第６，８９４，６３９号明細書および米国特許第８，５６５，４８８号明細書に記載されており、これらの開示は、その全体が参照により本明細書に組み込まれる。ＰＣＡおよび線形判別分析は、Ｋｈａｎら、「ＰｒｉｎｃｉｐａｌＣｏｍｐｏｎｅｎｔＡｎａｌｙｓｉｓ－ＬｉｎｅａｒＤｉｓｃｒｉｍｉｎａｎｔＡｎａｌｙｓｉｓＦｅａｔｕｒｅＥｘｔｒａｃｔｏｒｆｏｒＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ」、ＩＪＣＳＩＩｎｔｅｒｎａｔｉｏｎａｌＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅｓＩｓｓｕｅｓ，Ｖｏｌ．８，Ｉｓｓｕｅ６，Ｎｏ．２，Ｎｏｖ．２０１１によってさらに記載されており、それらの開示は、その全体が参照により本明細書に組み込まれる。

ｔ－ＳＮＥアルゴリズムは、二次元または三次元の低次元空間に視覚化のための高次元データを埋め込むのによく適した非線形次元縮小技術である。具体的には、それは、類似オブジェクトが近くの点でモデル化され、非類似オブジェクトが遠くの点でモデル化される確率が高くなるように、各高次元オブジェクトを二次元または三次元の点によってモデル化する。ｔ－ＳＮＥアルゴリズムは、２つの主要な段階を含む。第一に、ｔ－ＳＮＥは、類似のオブジェクトがピッキングされる確率が高く、非類似のポイントがピッキングされる確率が非常に低いように、高次元オブジェクトのペアにわたる確率分布を構築する。第二に、ｔ－ＳＮＥは、低次元マップ内の点にわたって同様の確率分布を定義し、マップ内の点の位置に関して２つの分布間のＫｕｌｌｂａｃｋ－Ｌｅｉｂｌｅｒ発散を最小化する。ｔ－ＳＮＥアルゴリズムは、米国特許出願公開第２０１８／００４６７５５号明細書、米国特許出願公開第２０１４／０３３６９４２号明細書、および米国特許出願公開第２０１８／０１６６０７７号明細書にさらに記載されており、これらの開示は、参照によりその全体が本明細書に組み込まれる。

ＰＬＳＲは、主成分分析（ＰＣＡ）と多重線形回帰との特徴を組み合わせて一般化する最近の技術である。その目的は、独立変数または予測子のセットから従属変数のセットを予測することである。この予測は、予測器から、最良の予測力を有する潜在変数と呼ばれる直交因子のセットを抽出することによって達成される。これらの潜在変数を使用して、ＰＣＡディスプレイに似たディスプレイを作成することができる。ＰＬＳ回帰モデルから得られた予測の品質は、ブートストラップおよびジャックナイフなどの交差検証技術によって評価される。ＰＬＳ回帰には２つの主な変形がある：最も一般的なものは、従属変数と独立変数の役割を分離する。第２のものは、従属変数および独立変数に同じ役割を与える。ＰＬＳＲは、Ａｂｄｉ、「ＰａｒｔｉａｌＬｅａｓｔＳｑｕａｒｅｓＲｅｇｒｅｓｓｉｏｎａｎｄＰｒｏｊｅｃｔｉｏｎｏｎＬａｔｅｎｔＳｔｒｕｃｔｕｒｅＲｅｇｒｅｓｓｉｏｎ（ＰＬＳＲｅｇｒｅｓｓｉｏｎ）」、ＷＩＲＥｓＣｏｍｐｕｔａｔｉｏｎａｌＳｔａｔｉｓｔｉｃｓ，ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，Ｉｎｃ．，２０１０によってさらに記載されており、その開示は、その全体が参照により本明細書に組み込まれる。

いくつかの実施形態では、固定推定エンジン２１０は、強化学習を利用する。強化学習（ＲＬ）は、エージェントがその前の行動を評価するために次の時間ステップにおいて遅延報酬を受け取る機械学習方法の一種である。換言すれば、ＲＬは、累積報酬の概念を最大化するためにソフトウェアエージェントが環境内でどのように行動を起こすべきかに関するモデルなし機械学習パラダイムである。典型的には、ＲＬ設定は、２つの構成要素、エージェント、および環境から構成される。環境とは、エージェントが作用しているオブジェクトを指し、エージェントは、ＲＬアルゴリズムを表す。環境は、エージェントに状態を送信することによって開始し、次いで、エージェントは、その知識に基づいてその状態に応答してアクションを実行する。その後、環境は、次の状態と報酬のペアをエージェントに送り返す。エージェントは、その最後の行動を評価するために、環境によって返された報酬でその知識を更新する。ループは、環境が端末状態を送信するまで継続し、これはエピソードまで終了する。強化学習アルゴリズムは、米国特許第１０，２７９，４７４号明細書および米国特許第７，３９５，２５２号明細書にさらに記載されており、これらの開示は、その全体が参照により本明細書に組み込まれる。

いくつかの実施形態では、固定推定エンジン２１０は、サポートベクターマシン「ＳＶＭ」を含む。一般に、ＳＶＭは、非線形入力データセットが非線形の場合のカーネルを介して高次元線形特徴空間に変換される統計的学習理論に基づく分類技術である。サポートベクターマシンは、カーネル関数Ｋによって、２つの異なるクラスを表す訓練データＥのセットを高次元空間に投影する。この変換されたデータ空間において、非線形データは、クラス分離を最大化するようにクラスを分離するためにフラットラインを生成することができるように変換される（識別超平面）。次いで、試験データは、Ｋを介して高次元空間に投影され、試験データ（以下に列挙される特徴またはメトリックなど）は、それらが超平面に対してどこに位置するかに基づいて分類される。カーネル関数Ｋは、データを高次元空間に射影する方法を定義する。

いくつかの実施形態では、固定推定エンジン２１０は、ニューラルネットワークを含む。いくつかの実施形態では、ニューラルネットワークは、深層学習ネットワークとして構成される。一般的に言えば、「深層学習」は、データ内の高レベル抽象化をモデル化しようと試みるアルゴリズムのセットに基づく機械学習の一分野である。深層学習は、データの表現を学習することに基づく機械学習方法の広範なファミリの一部である。観察は、ピクセルごとの強度値のベクトルなどの多くの方法で、またはエッジのセット、特定の形状の領域などとしてより抽象的な方法で表すことができる。いくつかの表現は、学習タスクを単純化する点で他の表現よりも優れている。深層学習の約束の１つは、ハンドクラフトされた特徴を、教師なしまたは半教師あり特徴学習および階層的特徴抽出のための効率的なアルゴリズムに置き換えることである。

いくつかの実施形態では、ニューラルネットワークは、生成的ネットワークである。「生成的」ネットワークは、一般に、本質的に確率的であるモデルとして定義されることができる。換言すれば、「生成的」ネットワークは、フォワードシミュレーションまたはルールベースの手法を実行するものではない。代わりに、生成的ネットワークは、適切な訓練データのセット（例えば、複数の訓練スペクトルデータセット）に基づいて学習されることができる（そのパラメータが学習されることができるという点で）。いくつかの実施形態では、ニューラルネットワークは、深層生成的ネットワークとして構成される。例えば、ネットワークは、ネットワークが複数のアルゴリズムまたは変換を実行する複数の層を含むことができるという点で、深層学習アーキテクチャを有するように構成されることができる。

いくつかの実施形態では、ニューラルネットワークは、オートエンコーダを含む。オートエンコーダニューラルネットワークは、目標値を入力に等しくなるように設定する、バックプロパゲーションを適用する教師なし学習アルゴリズムである（本明細書のさらなる説明を参照）。オートエンコーダの目的は、信号「ノイズ」を無視するようにネットワークを訓練することによって、典型的には次元縮小のために、データセットの表現（符号化）を学習することである。縮小側とともに、再構成側が学習され、オートエンコーダは、縮小された符号化からその元の入力に可能な限り近い表現を生成しようと試みる。オートエンコーダに関する追加情報は、ｈｔｔｐ：／／ｕｆｌｄｌ．ｓｔａｎｆｏｒｄ．ｅｄｕ／ｔｕｔｏｒｉａｌ／ｕｎｓｕｐｅｒｖｉｓｅｄ／Ａｕｔｏｅｎｃｏｄｅｒｓ／に見出すことができ、その開示は、その全体が参照により本明細書に組み込まれる。

いくつかの実施形態では、ニューラルネットワークは、世界を訓練するために供給されたデータに従って世界をモデル化する重みのセットを有する深層ニューラルネットワークとすることができる。ニューラルネットワークは、典型的には複数の層からなり、信号経路は、層の間を前後に横切る。この目的のために、任意のニューラルネットワークが実装されることができる。適切なニューラルネットワークは、ＬｅＮｅｔ、ＡｌｅｘＮｅｔ、ＺＦｎｅｔ、ＧｏｏｇＬｅＮｅｔ、ＶＧＧＮｅｔ、ＶＧＧ１６、ＤｅｎｓｅＮｅｔ、およびＲｅｓＮｅｔを含む。いくつかの実施形態では、その開示が参照により本明細書に組み込まれる、Ｌｏｎｇら、「ＦｕｌｌｙＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｔｗｏｒｋｓｆｏｒＳｅｍａｎｔｉｃＳｅｇｍｅｎｔａｔｉｏｎ」、ＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ（ＣＶＰＲ），２０１５ＩＥＥＥＣｏｎｆｅｒｅｎｃｅ，Ｊｕｎｅ２００１５（ＩＮＳＰＥＣＡｃｃｅｓｓｉｏｎＮｕｍｂｅｒ：１５５２４４３５）に記載されているような、完全畳み込みニューラルネットワークが利用される。

いくつかの実施形態では、ニューラルネットワークは、ＡｌｅｘＮｅｔとして構成される。例えば、分類ネットワーク構造は、ＡｌｅｘＮｅｔとすることができる。「分類ネットワーク」という用語は、本明細書では、１つ以上の完全接続層を含むＣＮＮを指すために使用される。一般に、ＡｌｅｘＮｅｔは、いくつかの畳み込み層（例えば、５つ）と、それに続く、データを分類するように組み合わせて構成および訓練されたいくつかの完全接続層（例えば、３つ）とを含む。

他の実施形態では、ニューラルネットワークは、ＧｏｏｇｌｅＮｅｔとして構成される。ＧｏｏｇｌｅＮｅｔアーキテクチャは、（特に本明細書に記載のいくつかの他のニューラルネットワークと比較して）比較的多数の層を含むことができるが、層のいくつかは、並列に動作することができ、互いに並列に機能する層のグループは、一般に、開始モジュールと呼ばれる。他の層が順次動作してもよい。したがって、ＧｏｏｇｌｅＮｅｔは、層の全てが順次構造に配置されているわけではないという点で、本明細書に記載の他のニューラルネットワークとは異なる。ＧｏｏｇｌｅＮｅｔとして構成されたニューラルネットワークの例は、参照により本明細書に完全に記載されているかのように組み込まれる、Ｓｚｅｇｅｄｙらによる「ＧｏｉｎｇＤｅｅｐｅｒｗｉｔｈＣｏｎｖｏｌｕｔｉｏｎｓ」、ＣＶＰＲ２０１５に記載されている。

他の実施形態では、ニューラルネットワークは、ＶＧＧネットワークとして構成される。例えば、分類ネットワーク構造は、ＶＧＧとすることができる。ＶＧＧネットワークは、アーキテクチャの他のパラメータを固定しながら畳み込み層の数を増加させることによって作成された。畳み込み層を追加して深さを増加させることは、全ての層において実質的に小さい畳み込みフィルタを使用することによって可能になる。

他の実施形態では、ニューラルネットワークは、深残差ネットワークとして構成される。例えば、分類ネットワーク構造は、深残差ネットまたはＲｅｓＮｅｔとすることができる。本明細書に記載の他のいくつかのネットワークと同様に、深残差ネットワークは、畳み込み層と、それに続く完全接続層とを含むことができ、それらは、組み合わせて、検出および／または分類のために構成および訓練される。深残差ネットワークでは、層は、参照されていない関数を学習する代わりに、層入力を参照して残差関数を学習するように構成される。特に、いくつかの積層された各層が所望の基礎となるマッピングに直接適合することを望む代わりに、これらの層は、ショートカット接続を有するフィードフォワードニューラルネットワークによって実現される残差マッピングに明示的に適合することができる。ショートカット接続は、１つ以上の層をスキップする接続である。深残差ネットは、畳み込み層を含むプレーンニューラルネットワーク構造を取り、ショートカット接続を挿入することによって作成されることができ、それによってプレーンニューラルネットワークを取り、それを残差学習の相手にする。深残差ネットの例は、あたかも本明細書に完全に記載されているかのように参照により組み込まれる、Ｈｅらによる「ＤｅｅｐＲｅｓｉｄｕａｌＬｅａｒｎｉｎｇｆｏｒＩｍａｇｅＲｅｃｏｇｎｉｔｉｏｎ」、ＮＩＰＳ２０１５に記載されている。本明細書に記載のニューラルネットワークは、この参考文献に記載されているようにさらに構成されることができる。

固定推定エンジンの訓練

いくつかの実施形態では、固定推定エンジン２１０は、訓練モードで動作するように適合される。いくつかの実施形態では、訓練モジュール２１１は、固定推定エンジン２１０と通信しており、訓練スペクトルデータを受信し、訓練スペクトルデータを固定推定エンジン２１０に供給するように構成されている。いくつかの実施形態では、訓練モジュール２１１は、任意の適切な訓練アルゴリズム、例えば、ｋ倍交差検証、バックプロパゲーションなどに従って、訓練スペクトルデータを固定推定エンジン２１０に提供し、固定推定エンジン２１０をその訓練モードで動作させるように動作することができる。いくつかの実施形態では、訓練アルゴリズムは、（本明細書に記載されるような）既知の訓練スペクトルデータのセットを利用する。いくつかの実施形態では、訓練モジュール２１１は、固定推定エンジン２１０と通信しており、訓練スペクトルデータ（または訓練吸光度スペクトルデータのさらなる処理された変形、例えば、訓練スペクトルデータの一次または二次導関数、訓練スペクトルデータ内の個々の帯域の大きさ、訓練スペクトルデータ内の帯域の積分、訓練スペクトルデータ内の２つ以上の帯域強度の比、訓練スペクトルデータの二次および三次導関数からの比など）を受信し、訓練スペクトルデータを固定推定エンジン２１０に供給するように構成されている。いくつかの実施形態では、訓練モジュール２１１はまた、訓練スペクトルデータに関連付けられたクラスラベルを供給するように適合される。

いくつかの実施形態では、訓練アルゴリズムは、（本明細書に記載されるような）既知の訓練スペクトルデータのセットおよび（例えば、固定条件、固定品質など）既知の出力クラスラベルの対応するセットを利用し、入力訓練スペクトルデータの処理が所望の対応するクラスラベルを提供するように、固定推定エンジン２１０内の内部接続を変更するように構成される。

マスキング解除状態推定エンジン２１０は、当業者に知られている任意の方法に従って訓練されることができる。例えば、米国特許出願公開第２０１８／０２６８２５５号明細書、米国特許出願公開第２０１９／０１０２６７５号明細書、米国特許出願公開第２０１５／０３５６４６１号明細書、米国特許出願公開第２０１６／０１３２７８６号明細書、米国特許出願公開第２０１８／０２４００１０号明細書、および米国特許出願公開第２０１９／０１０８３４４号明細書に開示されている訓練方法のいずれかであり、これらの開示は、その全体が参照により本明細書に組み込まれる。

いくつかの実施形態では、固定推定エンジン２１０は、交差検証法を使用して訓練される。交差検証は、分類器を開発するときにモデル選択および／またはパラメータ調整を支援するために使用されることができる技術である。交差検証は、ラベル付き事例のセットからの事例の１つ以上のサブセットを試験セットとして使用する。例えば、ｋ倍交差検証では、ラベル付き事例のセットは、ｋ個の「折り畳み」に等しく分割され、例えば、Ｋ倍交差検証は、機械学習モデルを評価するために使用される再サンプリング手順である。一連の訓練－試験サイクルが実行され、各サイクルにおいて異なる折り畳みが試験セットとして使用され、残りの折り畳みが訓練セットとして使用されるように、ｋ個の折り畳みを反復する。各折り畳みは、ある時点で試験セットとして使用されるため、ラベル付きケースのセット内のランダムでない選択されたケースは、交差検証にバイアスをかけるように見える。例えば、５倍交差検証（ｋ＝５）のシナリオでは、データセットは、５つの折り畳みに分割される。第１の反復では、第１の折り畳みが使用されてモデルを試験し、残りが使用されてモデルを訓練する。第２の反復では、第２の折り畳みが試験セットとして使用され、残りは訓練セットとして機能する。このプロセスは、５つの折り畳みの各折り畳みが試験セットとして使用されるまで繰り返される。ｋ倍交差検証を実施する方法は、米国特許出願公開第２０１４／０２７９７３４号明細書および米国特許出願公開第２００５／０２３４７５３号明細書にさらに記載されており、その開示は、その全体が参照により本明細書に組み込まれる。図１４Ａおよび図１４Ｂは、ｋ倍交差検証を利用して固定推定エンジン２１０を訓練するプロセスを示している。

固定推定エンジン２１０がニューラルネットワークを含む実施形態では、固定推定エンジン２１０を訓練するためのバックプロパゲーションアルゴリズムは、ネットワークノード間の接続にいくつかのランダムな初期値が与えられる反復プロセスであり、ネットワークは、入力ベクトルのセット（訓練スペクトルデータセット）の対応する出力ベクトルを計算するように動作する。出力ベクトルは、訓練スペクトルデータセットの所望の出力と比較され、所望の出力と実際の出力との間の誤差が計算される。計算された誤差は、出力ノードから入力ノードにバックプロパゲーションされ、誤差を低減するためにネットワーク接続重みの値を修正するために使用される。そのような各反復の後、訓練モジュール２１１は、訓練セット全体の総誤差を計算することができ、次いで、訓練モジュール２１１は、別の反復でプロセスを繰り返すことができる。固定推定エンジン２１０の訓練は、総誤差が最小値に到達したときに完了する。所定の反復回数の後に総誤差の最小値に到達しない場合、および総誤差が一定でない場合、訓練モジュール２１１は、訓練プロセスが収束しないと考えることができる。

固定推定エンジン２１０を、（上述した）所定の期間にわたって別様に固定された訓練生物学的検体から導出される取得スペクトルデータによって訓練する文脈において、各取得された訓練スペクトルは、既知の固定持続時間に関連付けられる。いくつかの実施形態では、利用される訓練スペクトルデータは、上述したように、複数のバイオマーカーの機能的ＩＨＣ染色を使用して検証され、例えば、訓練生物学的検体の固定持続時間は、１つ以上のバイオマーカーの実際の染色データと相関する。実際に、異なる部分的に固定された検体は、異なる程度に固定されることができ、この異なる固定は、異なる既知の時間（例えば、約６時間、約１２時間、約２４時間など）に１つ以上のバイオマーカー（例えば、ＢＬＣ２、ＦＯＸＰ３など）の存在について染色することによって検証されることができる。本明細書の実施例に記載されるように、バイオマーカーの保存は、固定の持続時間に応じて変化し、試料が「完全に」固定されると、例えば６時間を超える期間固定されると変化する（図１１Ａ～図１１Ｄも参照）。例として、１２時間の既知の固定持続時間を有する訓練スペクトルデータセットが訓練モジュール２１１などに提供されることができ、この特定の訓練スペクトルデータセットは、１つ以上のバイオマーカーによる機能的ＩＨＣ染色によって検証された。さらなる例として、０時間、１時間、２時間、４時間、６時間などの他の既知の固定持続時間を有する追加の訓練スペクトルデータセットが提供されることができ、各特定の訓練スペクトルデータセットは、１つ以上のバイオマーカーによる機能的ＩＨＣ染色によって再び検証された。このようにして、それらの異なる所定の固定持続時間のそれぞれについて高品質を有する固定を表す訓練スペクトルデータが提供される。いくつかの実施形態では、訓練モジュール２１１に提供される訓練スペクトルデータセットは、訓練吸光度スペクトルを含むだけでなく、訓練吸光度スペクトルの計算された一次および／または二次導関数および／または訓練吸光度スペクトルデータの他のさらなる処理された変形も含む。

いくつかの実施形態では、取得された訓練スペクトルデータはまた、「固定品質」に関連付けられてもよい。本明細書で使用される場合、「固定品質」は、固定の程度および／または均一性を指す。例として、訓練モジュール２１１に提供される特定の訓練スペクトルは、機能的ＩＨＣ試験によって検証された関連する既知の固定持続時間（例えば１２時間）および関連する固定品質（例えば、「良好な固定品質」、「固定不良」、「不十分な固定」、「適切に固定」など）を含むことができる。例えば、０時間または１時間固定された試料には、「不十分な固定」というラベルが関連付けられ、１２時間または２４時間固定された試料には、「適切に固定」というラベルが関連付けられることができる。

このようにして、固定推定エンジン２１０は、固定持続時間に関連する固定特徴を検出するだけでなく、固定の品質も検出するように訓練されることができる。例えば、訓練データセットが病理学者に提供されてもよく、これらの訓練データセットは、固定の品質の定性的評価を含むように病理学者によって注釈付けされてもよい。このようにして、訓練された固定推定エンジン２１０は、固定持続時間の定量的推定だけでなく、固定品質の定性的評価も提供することができる。この点に関して、十分且つ適切に固定された検体だけでなく、不十分且つ不適切に固定された検体の固定特徴も学習するように固定推定エンジン２１０を訓練することも可能である。

固定推定エンジン２１０の訓練が完了すると、システム２００は、試験スペクトルデータから固定特徴を検出し、次いで、検出された固定特徴に基づいて試験生物学的検体の固定持続時間を推定するように動作する準備が整う。いくつかの実施形態では、固定推定エンジン２１０は、入力データの変動に適応するように定期的に再訓練されることができる。

試験スペクトルの固定持続時間の推定

固定推定エンジン２１０が上述したように適切に訓練されると、それは、試験スペクトル内の固定特徴を検出し、検出された固定特徴に基づいて、固定持続時間を定量的に推定するために使用されることができる。いくつかの実施形態では、固定推定エンジン２１０がどのように訓練されるかに応じて、訓練された固定推定エンジン２１０はまた、出力として固定品質の定性的評価を提供することもできる。

いくつかの実施形態では、図３を参照すると、試験生物学的検体が取得され（ステップ３１０）（例えば、特定の疾患を有する疑いがあるか、または特定の疾患を有することが知られている被験者から）、次いで、その試験生物学的検体から試験スペクトルデータが取得される（ステップ３２０）（図５も参照）。いくつかの実施形態では、試験スペクトルデータは、吸光度スペクトル、吸光度スペクトルの一次および／または二次導関数、訓練スペクトルデータ内の個々の帯域の大きさ、訓練スペクトルデータ内の帯域の積分、訓練スペクトルデータ内の２つ以上の帯域強度の比、訓練スペクトルデータの二次および三次導関数からの比などを含む。

試験スペクトルデータが取得されて処理されると、訓練された固定推定エンジン２１０を使用して、試験スペクトルデータ内で固定特徴が検出されることができる（ステップ３４０）。例えば、検出されることができる固定特徴は、ピーク振幅、ピーク位置、ピーク比、スペクトル値の和（特定のスペクトル範囲にわたる積分など）、勾配の１つ以上の変化（一次導関数）または曲率の変化（二次導関数）などである。検出された固定特徴に基づいて、固定持続時間の推定値が計算されることができる（ステップ３５０）。固定推定エンジン２１０が固定品質を検出および／または分類するように訓練される実施形態では、固定推定エンジン２１０はまた、固定品質の推定を提供することができる。

いくつかの実施形態では、訓練された固定推定エンジン２１０はまた、固定持続時間の推定に使用するのに特に適した、取得されたスペクトル内の１つ以上の帯域および／または波長範囲の識別を出力として提供することができる。

本明細書の実施例１は、固定推定エンジンを訓練し、試験生物学的検体を取得し、試験生物学的検体を処理し、固定持続時間を予測する際に訓練された固定推定エンジンを使用するステップの例を提供する。

実施例１－訓練された固定推定エンジンを使用した固定持続時間の予測

以下に提供される実施例は、本明細書に記載される方法の例示である。

序文

現代の組織学は、組織の生体構造を架橋することによって分子分解の機構を停止することによって組織の生体構造を保存するホルムアルデヒド固定の１００年以上前のコーナーストン技術に基づいて構築されている。試料がどの程度完全に固定されるかは、検出されたタンパク質発現および極端な場合には患者の診断に有意に影響を及ぼすことができる。例えば、ＡＳＣＯ／ＣＡＰガイドラインは、試料を６～７２時間固定することを要求している。現在、臨床診療における組織固定は、実験室特異的であり、非常に多様である。しかしながら、その重要性にもかかわらず、固定品質を測定する分析方法は存在しない。

中間赤外分光法（中間ＩＲ）は、組織内の個々の分子の振動状態をプローブする強力な光学技術であり、タンパク質の立体配座状態に非常に敏感である。内因性および外因性材料の存在およびさらには立体配座状態は、生物学的検体の中間ＩＲ吸収プロファイルの変化を通じて明らかになるため、この極端な感度は、中間ＩＲ分光法を顕微鏡用途に理想的に適合させる。振動分光法は、例えば健常組織と癌性組織とを区別するための診断用途にも使用されている。

固定の正確なメカニズムは、完全には理解されていないが、組織の生体構造内で起こる化学変化と配座変化の複雑な相乗効果である可能性が高い。これらの理由から、生物学的検体の分子組成の変化が中間ＩＲスペクトルの変化に現れるかどうかを調べるための対策が講じられた。最終的な目標は、中間ＩＲスペクトル、およびおそらくその中に含まれる固定シグネチャを使用して、組織試料の固定持続時間および品質を正確に判定するために使用されることができる計測を開発することであった。そのような新規な能力は、標準化された客観的な計測によって組織試料の固定状態を評価する能力を可能にするであろう。

方法および材料

Ａ．実験のデザイン：

中間ＩＲ分光法を介して固定状態を追跡することができるかどうかを明確に研究するために、大規模制御研究が設計された。１０５個の個々の扁桃片を室温の１０％中性緩衝ホルマリン（１０％ＮＢＦ）（図８を参照）中で約０、約１、約２、約４、約６、約１２、または約２４時間のいずれかで別様に固定した。各固定時間内に約１２から約１６個の扁桃試料を分析した。ホルマリンで固定した後、エタノールの濃度を増加させながら脱水によって全ての組織を日常的に処理し、キシレンで清澄化し、最後にパラフィンワックスに包埋した。

試料は、全て同等に処理されたため、試料間の唯一の違いは、ホルマリン中の時間量、例えば化学固定時間であった。しかしながら、全ての試料がエタノール中で固定されていると考えられることに留意することが重要であるが、エタノールのみでの固定は、日常的な組織学における標準的な実施ではない。制御された化学固定時間に加えて、組織をタンパク質ＢＣＬ２、ｋｉ－６７、およびＦＯＸＰ３に対する抗体で染色した。これは、機能的染色に対する固定時間と固定品質との間の相関の判定を可能にした。本明細書にさらに記載されるように、開発されたデジタル定量プログラムで明視野画像を分析することによって、バイオマーカー発現を定量的に判定した。中間ＩＲスペクトルの試料内変動を説明するために、各パラフィンブロックを二連で切断し、次いで２１０枚全てのスライドを中間ＩＲ顕微鏡でイメージングした。

Ｂ．ＩＨＣ染色手順

免疫組織化学アッセイを、製造元の指示に従って、ＶｅｎｔａｎａＤｉｓｃｏｖｅｒｙＸＴ自動染色機器で行った。スライドを、ＥＺＰＲＥＰ溶液（ＶｅｎｔａｎａＭｅｄｉｃａｌＳｙｓｔｅｍｓＩｎｃ．）を使用して９０℃で脱パラフィンし、全ての試薬およびインキュベーション時間を添付文書に記載されているように選択した。ＯｐｔｉＶｉｅｗＤＡＢ検出キット（ＶｅｎｔａｎａＭｅｄｉｃａｌＳｙｓｔｅｍｓＩｎｃ．）を使用してスライドを展開し、ヘマトキシリンで対比染色した。

Ｃ．明視野イメージングおよびイメージング処理

組織切片を、約１０％のＮＢＦにおいて種々の時間にわたって別様に固定された組織検体から得られたホルマリン固定パラフィン包埋（ＦＦＰＥ）組織から取得した。４ミクロン切片をＢＣＬ２、ｋｉ－６７およびＦＯＸＰ３に対する３つの抗体で個々に染色し、ＤＡＢ染色で発色させた。次いで、染色した全てのスライドを、ＶｅｎｔａｎａＨＴＳｃａｎｎｅｒでイメージングした。各染色の発現レベルを定量的に判定するために、最初にスライド上の組織をセグメント化し、次いで関心のない組織の領域（例えば、結合組織、間質）を判定する画像分析アルゴリズムを開発した。次いで、組織の活性領域を分析して、所与のタンパク質バイオマーカーについて組織が陽性であるか陰性であるかを判定した。メトリックを陽性率の定量的読み出しに形式化し、所与の抗原に対して陽性であった組織の活性領域の割合を表した。スライドスキャン全体の明視野イメージング技術の概要が図９Ａに示されている。図９Ｂは、３つのマーカーのそれぞれの染色の代表的な領域、および画像分析アルゴリズムが各２０Ｘ視野をどのように分類したかを示している。

Ｄ．中間ＩＲイメージング取得およびデータ処理

別様に固定された扁桃からの同じＦＦＰＥブロックを、中間ＩＲ適合スライド（ＫｅｖｌｅｙＴｅｃｈｎｏｌｏｇｉｅｓ、ｌｏｗ－ｅＭｉｒｒＩＲスライド）上に切片化した。次いで、スライド上の試料を粗にマッピングするために、可視低倍率対物レンズを使用して組織切片全体をイメージングした（図１０Ａ）。次に、試料全体の多くの領域を選択して、テルル化カドミウム水銀検出器単一点検出器（ｖ＝９００～４０００ｃｍ－１、Δｖ＝８ｃｍ－１、平均＝１６）を使用して中間ＩＲ顕微鏡（例えば、ＢｒｕｋｅｒＨｙｐｅｒｉｏｎ３０００）で分光的にイメージングした。中間ＩＲスペクトルの空間的不均一性を緩和するために、各組織全体に位置する約１００個の領域をイメージングした（図１０Ａ～図１０Ｃ）。

各点の生の中間ＩＲスペクトルが図１０Ｄに示されている。これらのスペクトルは、全ての中間ＩＲ周波数にわたって透過光を測定し、組織が吸収している光の量の測定値を得るために組織を含まないスライドの透過で割ることによって計算された。収集されたスペクトルは、大気効果について補償され（図１０Ｅ）、次いで、６４のベースライン点および約８回の反復による凹状ゴムバンド補正を使用して組織内の散乱を補償するためにベースライン補正された（図１０Ｆ）。次いで、各スペクトルは、最大値（図１０Ｇ）に対して振幅正規化され、次いで、所与の組織からの全てのスペクトルをともに平均化することによって各組織からの平均スペクトルが計算されて、各試料のスライドの高品質の代表スペクトルを計算した（図１０Ｈ）。組織の前処理をＢｒｕｋｅｒＯｐｔｉｃｓＯｐｔｉｃｓＯｐｕｓソフトウェアで行った。

結果

Ａ．ＩＨＣ明視野イメージングによる固定完了の評価

このセクションは、３つのバイオマーカーの発現レベル対固定時間の定量的評価を提示し、固定の品質に対するゴールドスタンダード基準として機能する。各固定時間について、１２～１６個の組織ブロックを各バイオマーカーについて染色し、スライド全体にわたる発現を本明細書に記載の画像分析プログラムで定量化した。ＢＣＬ２、ｋｉ－６７、およびＦＯＸＰ３について、固定時間に対する箱およびひげのプロットの形態の要約結果がそれぞれ図１１Ａ～図１１Ｃに表示されている。ＢＣＬ２およびＦＯＸＰ３は、それらの発現レベルが固定時間とともに単調に増加することからわかるように、特に不安定であり、不適切な固定を受けやすいことが見出された。一方、ｋｉ－６７は、生物学的検体をＮＢＦ中で少なくとも１時間固定する限り、不適切な固定に対して比較的ロバストであることがわかった。最後に、これらの３つの図が、３つ全てのバイオマーカーについて２４時間での最大発現に正規化されたスケールで、各バイオマーカーの平均発現レベル対固定時間を示している図１１Ｄに要約されている。

Ｂ．アミドＩ中間ＩＲバンドおよびＩＨＣの結果に対する固定時間の影響

中間ＩＲスペクトルのアミドＩバンドは、タンパク質吸収体の存在だけでなく、タンパク質の立体配座状態（例えば、ベータシート／アルファ－ヘリックス／ランダムコイル）にも非常に敏感であることが文献で十分に確立されている。このため、このスペクトル領域の中間ＩＲ吸収を明示的に分析して、固定時間、したがって試料の固定品質と相関する変形を探した。所与の固定時間における全ての試料の平均中間ＩＲ吸収が、アミドＩバンドのおおよその位置を示して図１２Ａに表示されている。計算のノイズを最小限に抑えるために、Ｓａｖｉｔｚｋｙ－Ｇｏｌａｙ微分を使用して、アミドＩバンドの各組織の吸収スペクトルの一次導関数を計算した。平均一次導関数プラスまたはマイナス標準偏差が、斜線領域で示されているように、図１２Ｂにプロットされている。

興味深いことに、固定時間が増加するにつれて、右への明確なシフトがあり、振幅は減少する傾向があり、ピークは広がる傾向がある。バンド変形のこれらのパラメータは、バンドの半値全幅（ＦＷＨＭ）およびピーク位置によって十分に特徴付けられ、これは、全ての中間ＩＲスライドについて図１２Ｃにプロットされている。この図では、固定されていない（例えば、０時間）または完全に固定された（例えば、２４時間）試料は、非常に緊密にクラスター化されており、アミドＩ変形メトリックの再現性の高さを示しているが、他の試料は、より多くのスペクトルに分類される。右下の０時間の試料クラスターとしての固定時間とアミドＩ変形との間に強い相関があり、固定が起こるにつれて、ピーク位置は、より高い波数にシフトし、ＦＷＨＭはより広くなる。この観察は、全ての固定時間についての０時間位置からの平均シフトをプロットしている図１２Ｄに取り込まれる。約１時間および約２時間の固定後にバンドの比較的小さなシフトが観察され、約４時間で大きなジャンプが観察されるが、試料が約２４時間で完全固定までずっと固定を完了すると、バンドは変形し続けることがわかる。

一次アミドＩバンドの分析は、生物学的検体の固定時間とアミドＩタンパク質バンドの変形との間の直接的な相関を明らかにした。次に、この発見を３つの異なる癌バイオマーカーのＩＨＣ発現と比較して、アミドＩシフトも機能的染色データと相関するかどうかを判定した。これを達成するために、０時間の試料からの平均中間ＩＲシフトを、図１３Ａ～図１３ＣにおけるＢＣＬ２、ｋｉ－６７およびＦＯＸＰ３について陽性である各組織のパーセントに対してプロットする。結果は、中間ＩＲアミドＩバンドの変形がＩＨＣ発現と高度に相関することを確認する。固定時間に感受性であることが見出された２つのマーカー（ＢＣＬ２およびＦＯＸＰ３）は、アミドＩシフトとＩＨＣ発現との間の非常に線形な関係を示す。したがって、予想されるように、ｋｉ－６７染色は、固定時間／品質と相関しないが、アミドＩの変形は相関するため、ロバストなｋｉ－６７染色からのＩＨＣ染色は、アミドＩの変形と相関しない。

このセクションは、アミドＩバンドの安定した規則的な変形をもたらすホルマリン固定中に生じる組織の生化学的変化があることを確認する。この所見は、固定時間経過実験によって、ならびに中間ＩＲデータを、試料の固定が臨床環境で行われていることによく似た固定依存性バイオマーカーからの関数染色結果と比較することによって確認された。しかしながら、部分的に固定された試料のデータには大きな広がりがあり（例えば、約１～約１２時間の固定）、アミドＩバンドのシフトのみに基づくメトリックを使用して、固定の程度は、不適切に固定された試料（約１６２１ｃｍ－１未満のアミドＩピーク位置および約２５ｃｍ－１未満のアミドＩのＦＷＨＭ値）および適切に固定された組織試料（約１６２３ｃｍ－１よりも大きいアミドＩピーク位置および約３５ｃｍ－１よりも大きいアミドＩのＦＷＨＭ値）に対して非常に粗に判定されることしかできないこともわかる。固定対非固定のこの粗コース指定であっても、これらの２つの領域の間の試料を正確にまたは大きな信頼度で分類することができないため、精度が低下する。さらに、アミドＩメトリックでは、約４、約６、約１２、および約２４時間のＮＢＦ固定を区別することは不可能である。診断試験から、約６～約７２時間の固定を必要とするＡＳＣＯ／ＣＡＰによる現在のＨＥＲ２前分析ガイドラインの問題によって示されるように、４時間はしばしば不十分な固定時間であることが知られている。これらの理由から、固定時間を判定するより高感度の方法が必要であった。

Ｃ．固定時間を予測する定量的機械学習モデル

固定時間、したがって組織生物学的検体の質を判定するより正確な方法を開発するために、潜在構造回帰（ＰＬＳＲ）アルゴリズムへの投影に基づいて機械学習モデルを開発した。アルゴリズムを訓練するために、別様に固定されたブロックからの２１０枚のスライド全てをデータベースに入れ、データセットから２５％（例えば、５２個の組織）を除去して検証セットとして機能させた。試料の残りの７５％を使用して、５倍交差検証を使用してモデルを訓練した。最終的なモデルは、各成分によって説明される分散パーセントならびに平均二乗予測誤差（ＭＳＰＥ）に基づいて有効な成分の数を選択することによって調整された。次いで、最終モデルを保持された盲検データセットに適用して、盲検組織スペクトルに対するモデルの精度を判定した。モデル開発の概略フローチャートが図１４Ｂに表示されている。

開発されたモデルを使用して、訓練セットスペクトルならびに盲検ホールドアウトスペクトルを含む２１０個全ての中間ＩＲ組織の固定時間を予測した。結果は、図１５Ａにプロットされている。図からわかるように、全ての予測された固定時間は、実際のまたは実験的な固定時間に近いと正確に予測される。全ての固定時間にわたって、モデルは、約１．４時間以内に盲検組織の固定時間を予測することができた。これらの驚くべき結果は、機械学習モデルがホルマリン固定の真の分子フィンガープリントを採掘し、それを使用して未知試料の固定時間を平均１．４時間まで正確に予測できることを示している。訓練の固定時間予測のための累積分布関数および検証／ホールドアウトデータが図１５Ｂに表示されている。図から、訓練データセットおよび盲検データセットがほぼ同一のＣＤＦ関数を有することがわかるが、これは、モデルが訓練データセット内のノイズまたはスペクトルの基礎となる構造に単に過剰適合していないことを示している。

この手法の１つの大きな利点は、中間ＩＲ吸収スペクトルにおいて検出される固定の分子フィンガープリントを調べるためにアルゴリズムを使用することができることである。モデル係数は、図１６Ａにプロットされており、０よりも有意に大きい値は、ＮＢＦ固定と正に相関する周波数を表し、０よりも小さい値は、固定と負に関連する波数を表す。予想されるように、１６３０ｃｍ^－１付近のアミドＩバンドから大きな寄与があるが、いくつかの他の重要なバンドもアルゴリズムの全体的な生産力に寄与する。これらのバンドの数は、波長範囲にわたる中間ＩＲスペクトルに差があることを実証するために図１６Ｂにポッティングされており、これらの差は、人間が固定時間を予測するために分析および使用することが不可能であるにもかかわらず、開発されたモデルは、固定時間の正確な評価を行うために波長範囲全体にわたる情報を使用している。

考察

ＰＣＴ公開第２０１７／０７２３２０号パンフレット（その開示は、その全体が参照により本明細書に組み込まれる）は、細胞試料の品質状態（固定状態など）を評価する方法を記載している。そこで、試料の中間ＩＲスペクトルが取得され、分類または定量化アルゴリズムがＭＩＲスペクトルに適用されて、品質状態を示す特徴を識別し、および／または試料を分類する。次いで、品質状態が使用されて、試料が分析方法に適しているかどうか、および／または修復処理（さらなる固定など）が適切であるかどうかを判定することができる。

ＰＣＴ公開第２０１７／０７２３２０号パンフレットは、主成分分析を使用することによって試料が適切に固定されているか固定されていないかを判定するために、中間ＩＲ分光法を一般的に使用することができることを実証した。この実施例および本開示は、一般に、試料の実際の固定時間が、個々の組織検体の平均中間ＩＲスペクトルの機械学習モデルに基づいて、未知の組織試料について平均約１．４時間と正確に判定することができることを、１００を超える異なる組織片を用いた大規模研究において検証するために、その以前の研究を拡張する。この所見は、ＢＣＬ２、ｋｉ－６７およびＦＯＸＰ３に対する機能的ＩＨＣ染色の定量的分析によってさらに検証され、これにより、この実験における組織検体の固定の品質を確認した。本開示は、適切な予測機械学習モデルと組み合わせた中間ＩＲ分光法を使用して、組織試料の質を評価するための客観的且つ標準化された方法論が可能であることを確立する。

ＰＣＴ公開第２０１７／０７２３２０号パンフレットは、固定に基づいて中間ＩＲスペクトルの差を見る能力を開示したが、本開示の機能は、複数の振動スペクトルのマイニングに基づいて予測モデルを構築し、定量的精度で実際の固定時間を予測する。ＰＣＴ公開第２０１７／０７２３２０号パンフレットは、主に、固定されていない組織と完全に固定された組織とを区別するためにのみ使用されることができる（例えば、約０時間対約２４時間）ため、これは重要な区別である。ますます不安定になる生体分子（ＲＮＡ、メチル化状態、リン酸化など）に対してより多くの組織診断アッセイが開発されるにつれて、正確な診断を確実にするために、固定および組織の質に関連するさらにより厳格な品質保証測定が必要になることが想定される。本開示のシステムおよび方法は、この現時点で満たされていない将来の診断の必要性に対処する。

これは、少なくとも約６時間の固定を必要とするＨＥＲ２ＡＳＣＯ／ＣＡＰ固定ガイドラインを見ることによって明確に示されることができると考えられる。したがって、方法は、固定持続時間の予測において著しくより正確であり、本質的に定量的対定性的であり、別の重要な利点を提供する。さらに、これは、固定推定エンジンが多数の組織試料で訓練されているため、適切な予測アルゴリズムと組み合わせた場合に、中間ＩＲ信号が固定持続時間を正確に予測することができるというはるかに強力な主張である。実際に、固定推定エンジンは、例えば複数のバイオマーカーの機能的ＩＨＣ染色を使用して、定量的に検証されたデータについて訓練された。訓練された固定推定エンジンは、訓練された固定推定エンジンが検証訓練セットとして機能することをこれまで見たことがない盲検生物学的検体に作用することが検証された。本明細書で開示されるシステムおよび方法は、使用されるアルゴリズムから関心のある波長が容易に判定されることができるため、この技術の実装をより容易にし、より実用的にし、より安価にすると考えられる。この能力は、重要な波長の正確な識別を可能にし、その結果、それらの波長のみが計算に含まれ、計算時間を高速化する。本開示のシステムおよび方法はまた、ホルマリン固定中に組織検体内で生じる複雑で現在不可解な化学プロセスのより深い研究を可能にすることができる。

実施例２－固定推定エンジンの訓練

一実施形態では、中間ＩＲ顕微鏡から取得されたスペクトルを使用して、投影対潜在構造（部分最小二乗回帰でもある）ＰＬＳＲモデルが訓練される。中間ＩＲスペクトルは、組織全体の約１００箇所で収集されるため、平均スペクトルは、組織の平均を表す。全てのスペクトルが大気補正されてＣＯ_２汚染を除去し、１０回の反復および６４のベースライン点で凹状ゴムバンド補正を使用してベースライン補正され、次いでスペクトルが振幅正規化された。最後に、各組織からの全てのスペクトルがともに平均化された。次に、ＰＬＳＲ回帰モデルは、データを５つの部分に分割することによって訓練され、これは、５つおきのスペクトルがデータセットから引き出され、モデルの検証のためにのみ使用されたことを意味する。次いで、組織のスペクトルの約８０％が使用されて、（一次、二次などの導関数スペクトルとは対照的に）２倍交差検証および生の吸収スペクトルを使用してＰＬＳＲモデルを訓練した。いくつかのモデルでは、約２７５０から約２８００および約３７００から約４０００のスペクトル領域は切り出されなかったが、他のモデルでは、特に微分スペクトルを用いて、その領域が切り出されるかまたは０に設定されることができる。

初期モデルは、訓練セットを分析し、どのスペクトル特徴が各それぞれの組織の既知の固定持続時間と相関するかを判定することによって訓練された。次いで、開発されたモデル使用して既知の試料の固定持続時間を逆投影することによって、訓練セットの精度を調べた。次に、モデルが較正されて、未知の組織または盲検組織で機能する一般化可能なモデルを得た。これは、訓練セットの交差検証中に計算されたモデルの平均二乗予測誤差（ＭＳＰＥ）を分析し、スペクトルの真の固定シグネチャを正確に特徴付けるために必要な成分の数を判定することによって行われた。さらに、応答変数（例えば、この例では「Ｙ」または固定持続時間）および予測変数（例えば、波長による吸収）において説明される分散のパーセントが、モデルにおける成分の数に対してプロットされた（図１７Ａおよび図１７Ｂを参照）。

適切な数の成分が選択されると、モデルが再訓練され、訓練セットおよび盲検ホールドアウトスペクトルの双方で評価された。この例では、最初の２０個の成分を使用してモデルが構築され、その性能が評価された。これは、訓練および検証訓練セットの固定持続時間の誤差（実験的固定持続時間対モデル予測固定持続時間の絶対偏差）を分析することによって行われた。モデルが可能な限り正確であり、盲検データとして一般化可能であることを確実にするために、訓練および検証の累積分布関数（ＣＤＦ）が分析され、ほぼ同等でなければならない。ＣＤＦは、誤差が訓練および予測スペクトル（検証）スペクトルについて同一であったため、モデルが十分に訓練されたことを示す（図１７Ｃを参照）。また、箱ひげプロット（図１７Ｄを参照）から、外れ値の数が非常に少なく、十分に訓練されたモデルの別の重要な成分であることがわかる。モデルの訓練に関与する多数の変数のために、モデルを訓練するプロセスは、訓練経路に沿って任意の変数またはプロセスを調整することがモデルの精度に影響を与えるため、本質的に反復的である。

他のシステム構成要素

本開示のシステム２００は、組織検体に対して１つ以上の調製プロセスを実行することができる検体処理装置に結び付けられることができる。調製プロセスは、限定されるものではないが、検体の脱パラフィン、検体のコンディショニング（例えば、細胞コンディショニング）、検体の染色、抗原回収の実行、免疫組織化学染色（標識を含む）または他の反応の実行、および／または原位置ハイブリッド形成（例えば、ＳＩＳＨ、ＦＩＳＨなど）染色（標識を含む）または他の反応の実行、ならびに顕微鏡検査、微量分析、質量分析法、または他の分析方法のための検体を調製するための他のプロセスを含むことができる。

処理装置は、検体に固定剤を塗布することができる。固定剤は、架橋剤（例えば、ホルムアルデヒド、パラホルムアルデヒド、およびグルタルアルデヒドなどのアルデヒド、ならびに非アルデヒド架橋剤）、酸化剤（例えば、四酸化オスミウムおよびクロム酸などの金属イオンおよび複合体）、タンパク質変性剤（例えば、酢酸、メタノール、エタノール）、メカニズム不明の固定剤（例えば、塩化水銀、アセトン、およびピクリン酸）、配合試薬（例えば、カルノイ固定剤、メタカーン、ブアン液、Ｂ５固定剤）、ロスマンの液体、およびゲンドレの液体、マイクロ波、およびその他の固定剤（例えば、容積固定および蒸気固定を除外）を含むことができる。

検体がパラフィンに埋め込まれた試料である場合、試料は、適切な脱パラフィン液を使用して脱パラフィン化されることができる。パラフィンを除去した後、任意の数の物質が連続して検体に塗布されることができる。物質は、前処理（例えば、タンパク質架橋を逆転させる、細胞の酸を露出させるなど）、変性、ハイブリッド形成、洗浄（例えば、厳密洗浄）、検出（例えば、視覚的またはマーカー分子のプローブへの連結）、増幅（例えば、タンパク質、遺伝子などの増幅）、逆染色、カバースリップなどのためのものとすることができる。

検体処理装置は、検体に幅広い物質を塗布することができる。物質は、これらに限定されるものではないが、染色剤、プローブ、試薬、リンス、および／またはコンディショナを含む。物質は、流体（例えば、気体、液体、または気体／液体混合物）などとすることができる。液体は、溶媒（例えば、極性溶媒、非極性溶媒など）、溶液（例えば、水溶液または他のタイプの溶液）などとすることができる。試薬は、染色剤、湿潤剤、抗体（例えば、モノクローナル抗体、ポリクローナル抗体など）、抗原回収液（例えば、水性または非水性ベースの抗原回収溶液、抗原回収緩衝液など）を含むことができるが、これらに限定されない。プローブは、検出可能な標識またはレポータ分子に付着した、単離された核酸または単離された合成オリゴヌクレオチドとすることができる。標識は、放射性同位元素、酵素基質、補因子、リガンド、化学発光または蛍光剤、ハプテン、および酵素を含むことができる。本明細書で使用される場合、「流体」という用語は、水、溶媒、緩衝液、溶液（例えば、極性溶媒、非極性溶媒）、および／または混合物を含む任意の液体または液体組成物を指す。流体は、水性または非水性であってもよい。流体の非限定的な例は、洗浄液、すすぎ溶液、酸性溶液、アルカリ性溶液、移送溶液、および炭化水素（例えば、アルカン、イソアルカンおよび芳香族化合物、例えばキシレン）を含む。いくつかの実施形態では、洗浄液は、スライドの検体を有する表面上への洗浄液の拡散を容易にするための界面活性剤を含む。いくつかの実施形態では、酸性溶液は、脱イオン水、酸（例えば、酢酸）、および溶媒を含む。いくつかの実施形態では、アルカリ溶液は、脱イオン水、塩基、および溶媒を含む。いくつかの実施形態では、移送溶液は、１つ以上のグリコールエーテル、例えば１つ以上のプロピレン系グリコールエーテル（例えば、プロピレングリコールエーテル、ジ（プロピレングリコール）エーテルおよびトリ（プロピレングリコール）エーテル、エチレン系グリコールエーテル（例えば、エチレングリコールエーテル、ジ（エチレングリコール）エーテルおよびトリ（エチレングリコール）エーテル）およびそれらの官能性類似体を含む。緩衝剤の非限定的な例は、クエン酸、リン酸二水素カリウム、ホウ酸、ジエチルバルビツール酸、ピペラジン－Ｎ，Ｎ’－ビス（２－エタンスルホン酸）、ジメチルアルシン酸、２－（Ｎ－モルホリノ）エタンスルホン酸、トリス（ヒドロキシメチル）メチルアミン（ＴＲＩＳ）、２－（Ｎ－モルホリノ）エタンスルホン酸（ＴＡＰＳ）、Ｎ，Ｎ－ビス（２－ヒドロキシエチル）グリシン（ビシン）、Ｎ－トリス（ヒドロキシメチル）メチルグリシン（トリシン）、４－２－ヒドロキシエチル－１－ピペラジンエタンスルホン酸（ＨＥＰＥＳ）、２－｛［トリス（ヒドロキシメチル）メチル］アミノ｝エタンスルホン酸（ＴＥＳ）、およびそれらの組み合わせを含む。いくつかの実施形態では、マスキング解除剤は水である。他の実施形態では、緩衝液は、トリス（ヒドロキシメチル）メチルアミン（ＴＲＩＳ）、２－（Ｎ－モルホリノ）エタンスルホン酸（ＴＡＰＳ）、Ｎ，Ｎ－ビス（２－ヒドロキシエチル）グリシン（ビシン）、Ｎ－トリス（ヒドロキシメチル）メチルグリシン（トリシン）、４－２－ヒドロキシエチル－１－ピペラジンエタンスルホン酸（ＨＥＰＥＳ）、２－｛［トリス（ヒドロキシメチル）メチル］アミノ｝エタンスルホン酸（ＴＥＳ）、またはそれらの組み合わせから構成されることができる。追加の洗浄溶液、移送溶液、酸性溶液、およびアルカリ性溶液は、米国特許出願公開第２０１６／０２８２３７４号明細書に記載されており、その開示は、参照によりその全体が本明細書に組み込まれる。

染色は、組織化学染色モジュールまたは別個のプラットフォーム（例えば、自動化されたＩＨＣ／ＩＳＨスライド染色装置など）を用いて行われることができる。自動化ＩＨＣ／ＩＳＨスライド染色装置は、典型的には、少なくとも、染色プロトコルで用いられる様々な試薬の貯蔵容器、試薬をスライド上に分配するための貯蔵容器と流体連通した、試薬分配ユニット、スライドから、使用済みの試薬と他の廃棄物を取り除くための、廃棄物除去システム、および、試薬分配ユニットと廃棄物除去システムの作用を調製する制御システムを含む。染色ステップの実施に加えて、多くの自動スライド染色装置はまた、スライドベーキング（試料をスライドに接着させるため）、脱脂（脱パラフィン化ともいう）、抗原回収、対比染色、脱水および透明化、カバーガラス被覆など、染色に付随するステップも行うことができる（または、そのような付随的なステップを実施する別のシステムと互換性がある）。参照によりその全体が本明細書に組み込まれる、Ｐｒｉｃｈａｒｄ，ＯｖｅｒｖｉｅｗｏｆＡｕｔｏｍａｔｅｄＩｍｍｕｎｏｈｉｓｔｏｃｈｅｍｉｓｔｒｙ，ＡｒｃｈＰａｔｈｏｌＬａｂＭｅｄ．，Ｖｏｌ．１３８，ｐｐ．１５７８－１５８２（２０１４）は、ｉｎｔｅｌｌｉＰＡＴＨ（ＢｉｏｃａｒｅＭｅｄｉｃａｌ）、ＷＡＶＥ（ＣｅｌｅｒｕｓＤｉａｇｎｏｓｔｉｃｓ）、ＤＡＫＯＯＭＮＩＳおよびＤＡＫＯＡＵＴＯＳＴＡＩＮＥＲＬＩＮＫ４８（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ）、ＢＥＮＣＨＭＡＲＫ（ＶｅｎｔａｎａＭｅｄｉｃａｌＳｙｓｔｅｍｓ，Ｉｎｃ．）、ＬｅｉｃａＢＯＮＤ、ならびにＬａｂＶｉｓｉｏｎＡｕｔｏｓｔａｉｎｅｒ（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）自動スライド染色装置を含む自動化ＩＨＣ／ＩＳＨスライド染色装置およびそれらの様々な特徴のいくつかの具体的な例を記載している。ＶｅｎｔａｎａＭｅｄｉｃａｌＳｙｓｔｅｍｓ，Ｉｎｃ．は、米国特許第５，６５０，３２７号明細書、米国特許第５，６５４，２００号明細書、米国特許第６，２９６，８０９号明細書、米国特許第６，３５２，８６１号明細書、米国特許第６，８２７，９０１号明細書および米国特許第６，９４３，０２９号明細書、ならびに米国特許出願公開第２００３０２１１６３０号明細書および米国特許出願公開第２００４００５２６８５号明細書を含む、自動分析を実行するシステムおよび方法を開示する複数の米国特許の譲受人であり、これらのそれぞれは、参照によりその全体が本明細書に組み込まれる。本明細書中で使用される場合、用語「試薬」とは、別の実体と共有結合的または非共有結合的に反応すること、別の実体と結合すること、別の実体と相互作用すること、または別の実体にハイブリダイズすることができる１つ以上の作用物質を含む溶液または懸濁液を指す。そのような作用物質の非限定的な例は、特異的結合実体、抗体（一次抗体、二次抗体、または抗体コンジュゲート）、核酸プローブ、オリゴヌクレオチド配列、検出プローブ、反応性官能基または保護された官能基を有する化学部分、色素分子または染色分子の酵素、溶液または懸濁液を含む。

市販の染色ユニットは、通常、以下のいずれかの原理で動作する：（１）オープン個別スライド染色（ｏｐｅｎｉｎｄｉｖｉｄｕａｌｓｌｉｄｅｓｔａｉｎｉｎｇ）、ここでは、スライドを水平に配置し、組織試料を含むスライドの表面に試薬を水たまりとして分配する（ＤＡＫＯＡＵＴＯＳＴＡＩＮＥＲＬｉｎｋ４８（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ）およびｉｎｔｅｌｌｉＰＡＴＨ（ＢｉｏｃａｒｅＭｅｄｉｃａｌ）染色装置などで実施される）；（２）液体オーバーレイ技術、ここでは、試薬は、試料上に堆積した不活性流体層で覆われるか、それを通って試料に対して分配される（ＶＥＮＴＡＮＡＢｅｎｃｈＭａｒｋおよびＤＩＳＣＯＶＥＲＹ染色装置などで実施される）；（３）毛細管ギャップ染色、ここでは、スライド表面を別の表面（別のスライドまたはカバープレートなど）の近くに配置して狭いギャップを作り、これを通って、毛細管力が吸引され、液体試薬が試料と接触し続ける（ＤＡＫＯＴＥＣＨＭＡＴＥ、ＬｅｉｃａＢＯＮＤ、およびＤＡＫＯＯＭＮＩＳ染色装置で使用される染色原理など）。毛細管ギャップ染色を何回か繰り返しても、ギャップ内の流体は混ざらない（例えばＤＡＫＯＴＥＣＨＭＡＴＥおよびＬｅｉｃａＢＯＮＤなどにおいて）。ダイナミックギャップ染色と呼ばれる毛細管ギャップ染色のバリエーションでは、毛細管力を利用してスライドに試料を塗布し、その後インキュベーション中に平行表面を互いに対して並進させて試薬を撹拌して試薬混合を行う（例えばＤＡＫＯＯＭＮＩＳスライド染色装置（Ａｇｉｌｅｎｔ）に実装されている）。並進ギャップ染色では、並進可能なヘッドがスライドの上に配置される。ヘッドの下面は、スライドの並進中にスライド上の液体から液体のメニスカスが形成されるのを可能にするのに十分な小ささの第１のギャップ分だけ、スライドから間隔が空いている。スライドの幅よりも小さい横寸法を有する混合延長部が、並進可能なヘッドの下面から延在して、混合延長部とスライドとの間の第１のギャップよりも小さい第２のギャップを画定する。ヘッドの並進中、混合延長部の横寸法は、スライド上の液体中に、概ね第２のギャップから第１のギャップに至る方向に横の移動を生じさせるのに十分である。国際公開第２０１１－１３９９７８号パンフレットを参照されたい。最近、スライド上に試薬を付着させるためにインクジェット技術を使用することが提案された。国際公開第２０１６－１７０００８号パンフレットを参照されたい。染色技術のこの一覧は包括的なものであることを意図しておらず、バイオマーカー染色を実施するための、あらゆる完全または半自動化システムが、組織化学染色プラットフォームに組み込まれることができる。

形態学的に染色された試料も所望される場合、自動化されたＨ＆Ｅ染色プラットフォームが使用されることができる。Ｈ＆Ｅ染色を実施するための自動システムは、典型的には、２つの染色原理：バッチ染色（「ｄｉｐ ’ｎｄｕｎｋ」とも呼ばれる）または個別スライド染色のうちの１つで動作する。バッチ染色装置は、一般に、多くのスライドを同時に浸す試薬バットまたは槽を使用する。一方、個別スライド染色装置は、試薬を各スライドに直接塗布し、同じアリコートの試薬を２枚のスライドで共有することはない。市販のＨ＆Ｅ染色装置の例は、ＲｏｃｈｅのＶＥＮＴＡＮＡＳＹＭＰＨＯＮＹ（個別スライド染色装置）およびＶＥＮＴＡＮＡＨＥ６００（個別スライド染色装置）シリーズＨ＆Ｅ染色装置；ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓのＤａｋｏＣｏｖｅｒＳｔａｉｎｅｒ（バッチ染色装置）；ＬｅｉｃａＢｉｏｓｙｓｔｅｍｓＮｕｓｓｌｏｃｈＧｍｂＨのＬｅｉｃａＳＴ４０２０ＳｍａｌｌＬｉｎｅａｒＳｔａｉｎｅｒ（バッチ染色装置）、ＬｅｉｃａＳＴ５０２０Ｍｕｌｔｉｓｔａｉｎｅｒ（バッチ染色装置）、およびＬｅｉｃａＳＴ５０１０ＡｕｔｏｓｔａｉｎｅｒＸＬシリーズ（バッチ染色装置）Ｈ＆Ｅ染色装置を含む。

検体が染色された後、染色された試料が顕微鏡において手動で分析されることができ、および／または染色された試料のデジタル画像がアーカイブおよび／またはデジタル分析のために取得されることができる。デジタル画像は、２０倍、４０倍、または他の倍率で染色されたスライドを走査して高解像度全スライドデジタル画像を生成することができるスライドスキャナなどの走査プラットフォームを介して取り込まれることができる。基本的なレベルでは、典型的なスライドスキャナは、少なくとも以下を含む：（１）レンズ対物レンズを備えた顕微鏡、（２）光源（染料に応じて、ハロゲン、発光ダイオード、白色光、および／またはマルチスペクトル光源など）、（３）スライドガラスを移動させるもしくは光学素子をスライドの周りに移動させるまたはその双方のロボット工学、（４）画像取り込み用の１つ以上のデジタルカメラ、（５）ロボット工学を制御し、デジタルスライドを操作、管理、および表示するためのコンピュータおよび関連ソフトウェア。スライド上の複数の異なるＸ－Ｙ位置（場合によっては複数のＺ面）のデジタルデータが、カメラの電荷結合素子（ＣＣＤ）によって取り込まれ、これらの画像が合わさって、スキャンした面全体の合成画像を形成する。これを実現するための一般的な方法は、以下を含む：

（１）スライドステージまたは光学系を非常に小さな増分で移動させて正方形の画像フレームを取り込み、この画像フレームが隣接する正方形と僅かに重なり合っている、タイルベースのスキャニング。その後、取り込まれた正方形が自動的に互いに照合され、合成画像を作成する。

（２）取得中にスライドステージが単一軸で移動して多数の合成画像「ストリップ」を取り込む線ベースのスキャニング。その後、画像ストリップは、互いに照合され、より大きな合成画像を形成することができる。

様々なスキャナ（蛍光および明視野の双方）の詳細な概要は、Ｆａｒａｈａｎｉｅｔａｌ．，Ｗｈｏｌｅｓｌｉｄｅｉｍａｇｉｎｇｉｎｐａｔｈｏｌｏｇｙ：ａｄｖａｎｔａｇｅｓ，ｌｉｍｉｔａｔｉｏｎｓ，ａｎｄｅｍｅｒｇｉｎｇｐｅｒｓｐｅｃｔｉｖｅｓ，ＰａｔｈｏｌｏｇｙａｎｄＬａｂｏｒａｔｏｒｙＭｅｄｉｃｉｎｅＩｎｔ’ｌ，Ｖｏｌ．７，ｐ．２３－３３（２０１５年６月）に見ることができ、その内容は参照によりその全体が組み込まれる。市販のスライドスキャナの例は、以下を含む：３ＤＨｉｓｔｅｃｈＰＡＮＮＯＲＡＭＩＣＳＣＡＮＩＩ；ＤｉｇｉＰａｔｈＰＡＴＨＳＣＯＰＥ；ＨａｍａｍａｔｓｕＮＡＮＯＺＯＯＭＥＲＲＳ，ＨＴ，およびＸＲ；ＨｕｒｏｎＴＩＳＳＵＥＳＣＯＰＥ４０００，４０００ＸＴ，およびＨＳ；ＬｅｉｃａＳＣＡＮＳＣＯＰＥＡＴ，ＡＴ２，ＣＳ，ＦＬ，およびＳＣＮ４００；ＭｉｋｒｏｓｃａｎＤ２；ＯｌｙｍｐｕｓＶＳ１２０－ＳＬ；ＯｍｎｙｘＶＬ４，およびＶＬ１２０；ＰｅｒｋｉｎＥｌｍｅｒＬＡＭＩＮＡ；ＰｈｉｌｉｐｓＵＬＴＲＡ－ＦＡＳＴＳＣＡＮＮＥＲ；ＳａｋｕｒａＦｉｎｅｔｅｋＶＩＳＩＯＮＴＥＫ；ＵｎｉｃＰＲＥＣＩＣＥ５００，およびＰＲＥＣＩＣＥ６００ｘ；ＶＥＮＴＡＮＡＩＳＣＡＮＣＯＲＥＯおよびＩＳＣＡＮＨＴ；およびＺｅｉｓｓＡＸＩＯＳＣＡＮ．Ｚ１。他の例示的なシステムおよび特徴は、例えば国際公開第２０１１－０４９６０８号パンフレット、またはＩＭＡＧＩＮＧＳＹＳＴＥＭＳ，ＣＡＳＳＥＴＴＥＳ，ＡＮＤＭＥＴＨＯＤＳＯＦＵＳＩＮＧＴＨＥＳＡＭＥと題された２０１１年９月９日出願の米国特許出願第６１／５３３，１１４号に見出すことができ、それらの内容は、その全体が参照により組み込まれる。

いくつかの実施形態では、任意のイメージングは、米国特許第１０，３１７，６６６号明細書および第１０，３１３，６０６号明細書に開示されているシステムのいずれかを使用して達成されることができ、それらの開示は、その全体が参照により本明細書に組み込まれる。イメージング装置は、ＶｅｎｔａｎａＭｅｄｉｃａｌＳｙｓｔｅｍｓ，Ｉｎｃ．によって販売されているｉＳｃａｎＣｏｒｅｏ（商標）明視野スキャナまたはＤＰ２００スキャナなどの明視野イメージャであってもよい。

場合によっては、画像は、画像分析システムで分析されてもよい。画像分析システムは、本明細書に記載される技術および動作を実行することができる、デスクトップコンピュータ、ノートパソコン、タブレット、スマートフォン、サーバ、特定用途向けコンピュータ装置または任意の他のタイプの電子装置など、１つ以上のコンピュータ装置を含むことができる。いくつかの実施形態では、画像分析システムは、単一の装置として実装されてもよい。他の実施形態では、画像分析システムは、本明細書で論じられる様々な機能性をともに実現する２つ以上の装置の組み合わせとして実装されてもよい。例えば、画像分析システムは、１つ以上のローカルエリアネットワークおよび／またはワイドエリアネットワーク（インターネットなど）を介して互いに通信可能に接続された、１つ以上のサーバコンピュータと１つ以上のクライアントコンピュータとを含むことができる。画像分析システムは、典型的には、少なくともメモリ、プロセッサ、およびディスプレイを含む。メモリは、ランダムアクセスメモリ（ＲＡＭ）、電気的消去可能プログラマブル読み出し専用メモリ（ＥＥＰＲＯＭ）などの読み出し専用メモリ、フラッシュメモリ、ハードドライブ、ソリッドステートドライブ、光ディスクなど、任意のタイプの揮発性または不揮発性メモリの任意の組み合わせを含むことができる。メモリは、単一の装置に含めることができ、２つ以上の装置にわたって分散させることもできることが理解される。プロセッサは、中央処理装置（ＣＰＵ）、グラフィック処理装置（ＧＰＵ）、専用信号または画像プロセッサ、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、テンソル処理装置（ＴＰＵ）などの任意のタイプの１つ以上のプロセッサを含むことができる。プロセッサは、単一の装置に含まれてもよく、２つ以上の装置にわたって分散されてもよいことが理解される。ディスプレイは、ＬＣＤ、ＬＥＤ、ＯＬＥＤ、ＴＦＴ、プラズマなど、任意の適切な技術を使用して実装されることができる。いくつかの実装形態では、ディスプレイは、タッチ感知ディスプレイ（タッチスクリーン）であってもよい。画像分析システムはまた、典型的には、プロセッサ上で実行可能な命令セットを備えるメモリ上に記憶されたソフトウェアシステムを含み、命令は、物体識別、染色強度定量化などの様々な画像分析タスクを含む。本明細書に開示のモジュールを実装するのに有用な、例示的な市販のソフトウェアパッケージは、ＶＥＮＴＡＮＡＶＩＲＴＵＯＳＯ；ＤｅｆｉｎｉｅｎｓＴＩＳＳＵＥＳＴＵＤＩＯ、ＤＥＶＥＬＯＰＥＲＸＤ、およびＩＭＡＧＥＭＩＮＥＲ；ならびにＶｉｓｏｐｈａｒｍＢＩＯＴＯＰＩＸ、ＯＮＣＯＴＯＰＩＸ、およびＳＴＥＲＥＯＴＯＰＩＸソフトウェアパッケージを含む。

検体が処理された後、ユーザは、検体を含むスライドをイメージング装置に搬送することができる。いくつかの実施形態では、イメージング装置は、明視野イメージャスライドスキャナである。１つの明視野イメージャは、ＶｅｎｔａｎａＭｅｄｉｃａｌＳｙｓｔｅｍｓ，Ｉｎｃ．によって販売されているｉＳｃａｎＣｏｒｅｏ明視野スキャナである。自動化された実施形態では、イメージング装置は、ＩＭＡＧＩＮＧＳＹＳＴＥＭＡＮＤＴＥＣＨＮＩＱＵＥＳと題された、国際特許出願第ＰＣＴ／ＵＳ２０１０／００２７７２号（国際公開第２０１１／０４９６０８号パンフレット）に開示された、または２０１１年９月９日に出願され、ＩＭＡＧＩＮＧＳＹＳＴＥＭＳ，ＣＡＳＳＥＴＴＥＳ，ＡＮＤＭＥＴＨＯＤＳＯＦＵＳＩＮＧＴＨＥＳＡＭＥと題された米国特許出願第６１／５３３，１１４号に開示されたデジタル病理装置である。国際特許出願第ＰＣＴ／ＵＳ２０１０／００２７７２号および米国特許出願第６１／５３３，１１４号は、参照によりそれらの全体が組み込まれる。

本明細書に記載の主題および動作の実施形態は、デジタル電子回路、または本明細書に開示される構造およびそれらの構造的均等物を含むコンピュータソフトウェア、ファームウェア、またはハードウェア、またはそれらの１つ以上の組み合わせで実装されることができる。本明細書に記載の主題の実施形態は、１つ以上のコンピュータプログラム、例えば、データ処理装置による実行のために、またはデータ処理装置の動作を制御するためにコンピュータ記憶媒体上に符号化されたコンピュータプログラム命令の１つ以上のモジュールとして実装されることができる。本明細書で説明されるモジュールのいずれも、プロセッサによって実行されるロジックを含むことができる。本明細書で使用される「ロジック」は、プロセッサの動作に影響を与えるために適用されることができる命令信号および／またはデータの形態を有する任意の情報を指す。ソフトウェアはロジックの例である。

コンピュータ記憶媒体は、コンピュータ可読記憶装置、コンピュータ可読記憶基板、ランダムまたはシリアルアクセスメモリアレイまたは装置、あるいはそれらの１つ以上の組み合わせとすることができるか、またはそれらに含まれることができる。さらに、コンピュータ記憶媒体は伝搬信号ではないが、コンピュータ記憶媒体は、人工的に生成された伝搬信号に符号化されたコンピュータプログラム命令のソースまたは宛先とすることができる。コンピュータ記憶媒体はまた、１つ以上の別個の物理的構成要素または媒体（例えば、複数のＣＤ、ディスク、または他の記憶装置）とすることができるか、またはそれらに含まれることができる。本明細書に記載されている動作は、１つ以上のコンピュータ可読記憶装置に記憶されているか、または他のソースから受信されたデータに対してデータ処理装置によって実行される動作として実装されることができる。

「プログラムされたプロセッサ」という用語は、データを処理するためのあらゆる種類の装置、装置、およびマシンを包含し、例えば、プログラム可能なマイクロプロセッサ、コンピュータ、チップ上のシステム、または前述の複数のもの、またはそれらの組み合わせを含む。装置は、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）またはＡＳＩＣ（特定用途向け集積回路）などの特別な目的のロジック回路を含むことができる。装置はまた、ハードウェアに加えて、当該コンピュータプログラムの実行環境を作成するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、クロスプラットフォームランタイム環境、仮想マシン、またはそれらの１つ以上の組み合わせを構成するコードを含むことができる。装置および実行環境は、ウェブサービス、分散コンピューティング、グリッドコンピューティングインフラストラクチャなど、様々な異なるコンピューティングモデルインフラストラクチャを実現することができる。

コンピュータプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとも呼ばれる）は、コンパイルまたは解釈された言語、宣言言語または手続き型言語を含む、あらゆる形式のプログラミング言語で記述されることができ、スタンドアロンプログラムとして、またはモジュール、コンポーネント、サブルーチン、オブジェクト、またはコンピューティング環境での使用に適したその他のユニットとして含む、あらゆる形式で展開されることができる。コンピュータプログラムは、ファイルシステム内のファイルに対応することができるが、対応する必要はない。プログラムは、他のプログラムまたはデータを保持するファイルの一部（例えば、マークアップ言語ドキュメントに保存された１つ以上のスクリプト）、当該プログラム専用の単一ファイル、または複数の調整されたファイル（例えば、１つ以上のモジュール、サブプログラム、またはコードの一部を記憶するファイル）に記憶されることができる。コンピュータプログラムは、１台のコンピュータ、または１つのサイトに配置されているか、複数のサイトに分散され、通信ネットワークによって相互接続されている複数のコンピュータで実行されるように展開されることができる。

本明細書に記載のプロセスおよびロジックフローは、１つ以上のコンピュータプログラムを実行する１つ以上のプログラム可能なプロセッサによって実行され、入力データを操作して出力を生成することによってアクションを実行することができる。プロセスおよびロジックフローは、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）またはＡＳＩＣ（特定用途向け集積回路）などの特殊用途のロジック回路によって実行されることもでき、装置は、それらとして実装されることもできる。

コンピュータプログラムの実行に適したプロセッサは、例として、汎用および特殊目的の双方のマイクロプロセッサ、および任意の種類のデジタルコンピュータの任意の１つ以上のプロセッサを含む。一般に、プロセッサは、読み取り専用メモリまたはランダムアクセスメモリ、あるいはその双方から命令とデータを受信する。コンピュータの本質的な要素は、命令に従ってアクションを実行するためのプロセッサと、命令およびデータを記憶するための１つ以上のメモリ装置である。一般に、コンピュータはまた、データを記憶するための１つ以上の大容量記憶装置、例えば、磁気ディスク、光磁気ディスク、または光ディスクを含むか、またはデータを受信するか、データを転送するか、またはその双方に動作可能に結合される。しかしながら、コンピュータは、そのような装置を必要とするわけではない。さらに、コンピュータは、ほんの数例を挙げると、別の装置、例えば、携帯電話、携帯情報端末（ＰＤＡ）、モバイルオーディオまたはビデオプレーヤ、ゲームコンソール、全地球測位システム（ＧＰＳ）受信機、またはポータブル記憶装置（例えば、ユニバーサルシリアルバス（ＵＳＢ）フラッシュドライブ）に組み込まれることができる。コンピュータプログラムの命令およびデータを記憶するのに適した装置は、例として半導体メモリ装置、例えば、ＥＰＲＯＭ、ＥＥＰＲＯＭ、およびフラッシュメモリ装置を含む、全ての形態の不揮発性メモリ、メディアおよびメモリ装置、磁気ディスク、例えば、内蔵ハードディスクまたはリムーバブルディスク、光磁気ディスク、およびＣＤ－ＲＯＭおよびＤＶＤ－ＲＯＭディスクを含む。プロセッサおよびメモリは、特別な目的のロジック回路によって補完され、またはこれに組み込まれることができる。

ユーザとの相互作用を提供するために、本明細書に記載の主題の実施形態は、ディスプレイ装置、例えば、ＬＣＤ（液晶ディスプレイ）、ＬＥＤ（発光ダイオード）ディスプレイ、またはＯＬＥＤ（有機発光ダイオード）ディスプレイ、ユーザに情報を表示するためのディスプレイ、およびユーザがコンピュータに入力を提供することができる、キーボードおよびポインティング装置、例えば、マウスまたはトラックボールを有するコンピュータ上に実装されることができる。いくつかの実装形態では、タッチスクリーンが使用されて、情報を表示し、ユーザからの入力を受け取ることができる。他の種類の装置が使用されて、ユーザとの対話を提供することもできる。例えば、ユーザに提供されるフィードバックは、視覚的フィードバック、聴覚的フィードバック、または触覚的フィードバックなど、任意の形態の感覚的フィードバックとすることができる。また、ユーザからの入力は、音響、音声、または触覚入力を含む任意の形式で受信されることができる。さらに、コンピュータは、例えば、Ｗｅｂブラウザから受信した要求に応答して、ユーザのクライアント装置上のＷｅｂブラウザにＷｅｂページを送信することによるなど、ユーザが使用する装置との間でドキュメントを送受信することにより、ユーザと対話することができる。

本明細書に記載される主題の実施形態は、例えば、データサーバとしてのバックエンドコンポーネントを含むか、またはアプリケーションサーバなどのミドルウェアコンポーネントを含むか、または、例えば、ユーザがこの明細書に記載されている主題の実装と対話することができるグラフィカルユーザインタフェースまたはＷｅｂブラウザを有するクライアントコンピュータなどのフロントエンドコンポーネント、または１つ以上のそのようなバックエンド、ミドルウェア、またはフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムに実装されることができる。システムのコンポーネントは、デジタルデータ通信の任意の形式または媒体、例えば通信ネットワークによって相互接続されることができる。通信ネットワークの例は、ローカルエリアネットワーク（「ＬＡＮ」）およびワイドエリアネットワーク（「ＷＡＮ」）、ネットワーク間（例えば、インターネット）、およびピアツーピアネットワーク（例えば、アドホックピア－ピアツーピアネットワーク）を含む。例えば、図１のネットワーク２０は、１つ以上のローカルエリアネットワークを含むことができる。

コンピューティングシステムは、任意の数のクライアントおよびサーバを含むことができる。クライアントおよびサーバは、通常、互いにリモートであり、通常、通信ネットワークを介して相互作用する。クライアントおよびサーバの関係は、それぞれのコンピュータ上で実行され且つクライアント－サーバの関係を互いに有するコンピュータプログラムによって発生する。いくつかの実施形態では、サーバは、（例えば、データを表示し、クライアント装置と対話するユーザからのユーザ入力を受信する目的で）データ（例えば、ＨＴＭＬページ）をクライアント装置に送信する。クライアント装置で生成されたデータ（例えば、ユーザの操作の結果）は、サーバにおいてクライアント装置から受信されることができる。

バイオマーカーの例

本明細書で述べるように、固定推定エンジンは、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練される。いくつかの実施形態では、既知の固定持続時間のクラスラベルは、機能的ＩＨＣ試験によって検証される。以下に特定されるのは、その発現が機能的ＩＨＣ染色によって判定されることができるバイオマーカーの非限定的な例である。特定のマーカーは、特定の細胞の性質である一方、他のマーカーは、特定の疾患または症状に関連付けられたものとして特定される。既知の予後マーカーの例は、例えば、ガラクトシルトランスフェラーゼＩＩ、ニューロン特異的エノラーゼ、プロトンＡＴＰアーゼ－２および酸性ホスファターゼなどの酵素マーカーを含む。ホルモンまたはホルモン受容体マーカーは、ヒト絨毛性ゴナドトロピン（ＨＣＧ）、副腎皮質刺激ホルモン、癌胎児性抗原（ＣＥＡ）、前立腺特異抗原（ＰＳＡ）、エストロゲン受容体、プロゲステロン受容体、アンドロゲン受容体、ｇＣ１ｑ－Ｒ／ｐ３３補体受容体、ＩＬ－２受容体、ｐ７５ニューロトロフィン受容体、ＰＴＨ受容体、甲状腺ホルモン受容体およびインスリン受容体を含む。

リンパ系マーカーは、アルファ－１－抗キモトリプシン、アルファ－１－抗トリプシン、Ｂ細胞マーカー、ｂｃｌ－２、ｂｃｌ－６、Ｂリンパ球抗原３６ｋＤ、ＢＭ１（骨髄系マーカー）、ＢＭ２（骨髄系マーカー）、ガレクチン－３、グランザイムＢ、ＨＬＡクラスＩ抗原、ＨＬＡクラスＩＩ（ＤＰ）抗原、ＨＬＡクラスＩＩ（ＤＱ）抗原、ＨＬＡクラスＩＩ（ＤＲ）抗原、ヒト好中球デフェンシン、免疫グロブリンＡ、免疫グロブリンＤ、免疫グロブリンＧ、免疫グロブリンＭ、カッパ軽鎖、カッパ軽鎖、ラムダ軽鎖、リンパ球／組織球抗原、マクロファージマーカー、ムラミダーゼ（リゾチーム）、ｐ８０未分化リンパ腫キナーゼ、形質細胞マーカー、分泌白血球プロテアーゼ阻害剤、Ｔ細胞抗原受容体（ＪＯＶＩ１）、Ｔ細胞抗原受容体（ＪＯＶＩ３）、ターミドヌクレオチジルトランスフェラーゼ、非クラスター化Ｂ細胞マーカーを含む。

腫瘍マーカーは、アルファフェトプロテイン、アポリポタンパク質Ｄ、ＢＡＧ－１（ＲＡＰ４６タンパク質）、ＣＡ１９－９（シアリルルイス）、ＣＡ５０（癌腫関連ムチン抗原）、ＣＡ１２５（卵巣癌抗原）、ＣＡ２４２（腫瘍関連ムチン抗原）、クロモグラニンＡ、クラステリン（アポリポタンパク質Ｊ）、上皮膜抗原、上皮関連抗原、上皮特異的抗原、上皮成長因子受容体、エストロゲン受容体（ＥＲ）、肉眼的嚢胞性疾患流体タンパク質－１５、肝細胞特異的抗原、ＨＥＲ２、ヘレグリン、ヒト胃ムチン、ヒト乳脂肪球、ＭＡＧＥ－１、マトリックスメタロプロテイナーゼ、メランＡ、メラノーママーカー（ＨＭＢ４５）、メソテリン、メタロチオネイン、微小フタル転写因子（ＭＩＴＦ）、Ｍｕｃ－１コア糖タンパク質、Ｍｕｃ－１糖タンパク質、Ｍｕｃ－２糖タンパク質、Ｍｕｃ－５ＡＣ糖タンパク質、Ｍｕｃ－６糖タンパク質、ミエロペルオキシダーゼ、Ｍｙｆ－３（横紋筋肉腫マーカー）、Ｍｙｆ－４（横紋筋肉腫マーカー）、ＭｙｏＤ１（横紋筋肉腫マーカー）、ミオグロビン、ｎｍ２３タンパク質、胎盤アルカリホスファターゼ、プレアルブミン、プロゲステロン受容体、前立腺特異的抗原、前立腺酸性ホスファターゼ、前立腺インヒビンペプチド、ＰＴＥＮ、腎細胞癌マーカー、小腸粘液性抗原、テトラネクチン、甲状腺転写因子－１、マトリックスメタロプロテイナーゼ１の組織阻害剤、マトリックスメタロプロテイナーゼ２の組織阻害剤、チロシナーゼ、チロシナーゼ関連タンパク質－１、ビリン、フォンウィルブランド因子、ＣＤ３４、ＣＤ３４、クラスＩＩ、ＣＤ５１Ａｂ－１、ＣＤ６３、ＣＤ６９、Ｃｈｋ１、Ｃｈｋ２、クラスピンＣ－ｍｅｔ、ＣＯＸ６Ｃ、ＣＲＥＢ、サイクリンＤ１、サイトケラチン、サイトケラチン８、ＤＡＰＩ、デスミン、ＤＨＰ（１－６ジフェニル－１，３，５－ヘキサトリエン）、Ｅ－カドヘリン、ＥＥＡ１、ＥＧＦＲ、ＥＧＦＲｖＩＩＩ、ＥＭＡ（上皮膜抗原）、ＥＲ、ＥＲＢ３、ＥＲＣＣ１、ＥＲＫ、Ｅ－セレクチン、ＦＡＫ、フィブロネクチン、ＦＯＸＰ３、ガンマ－Ｈ２ＡＸ、ＧＢ３、ＧＦＡＰ、ジャイアンチン、ＧＭ１３０、Ｇｏｌｇｉｎ９７、ＧＲＢ２、ＧＲＰ７８ＢｉＰ、ＧＳＫ３ベータ、ＨＥＲ－２、ヒストン３、ヒストン３＿Ｋ１４－エース［抗アセチル－ヒストンＨ３（Ｌｙｓ１４）］、ヒストン３＿Ｋ１８－エース［ヒストンＨ３－アセチルＬｙｓ１８）、ヒストン３＿Ｋ２７－ＴｒｉＭｅ、［ヒストンＨ３（トリメチルＫ２７）］、ヒストン３＿Ｋ４－ｄｉＭｅ［アンチジメチル－ヒストンＨ３（Ｌｙｓ４）］、ヒストン３＿Ｋ９－エース［アセチル－ヒストンＨ３（Ｌｙｓ９）］、ヒストン３＿Ｋ９－ｔｒｉＭｅ［ヒストン３－トリメチルＬｙｓ９］、ヒストン３＿Ｓ１０－Ｐｈｏｓ［抗ＰｈｏｓｐｈｏヒストンＨ３（Ｓｅｒ１０）、有糸分裂マーカー］、ヒストン４、ヒストンＨ２Ａ．Ｘ－５１３９－Ｐｈｏｓ［ＰｈｏｓｐｈｏヒストンＨ２Ａ．Ｘ（Ｓｅｒ１３９）抗体］、ヒストンＨ２Ｂ、ヒストンＨ３＿ＤｉＭｅｔｈｙｌＫ４、ヒストンＨ４＿ＴｒｉＭｅｔｈｙｌＫ２０－Ｃｈｉｐｇｒａｄ、ＨＳＰ７０、ウロキナーゼ、ＶＥＧＦＲ１、ＩＣＡＭ－１、ＩＧＦ－１、ＩＧＦ－１Ｒ、ＩＧＦ－１レセプタベータ、ＩＧＦ－ＩＩ、ＩＧＦ－ＩＩＲ、ＩＫＢ－ＡｌｐｈａＩＫＫＥ、ＩＬ６、ＩＬ８、インテグリンアルファＶベータ３、インテグリンアルファＶベータ６、インテグリンアルファＶ／ＣＤ５１、インテグリンＢ５、インテグリンＢ６、インテグリンＢ８、インテグリンベータ１（ＣＤ２９）、インテグリンベータ３、インテグリンベータ５インテグリンＢ６、ＩＲＳ－１、Ｊａｇｇｅｄ１、抗プロテインキナーゼＣＢｅｔａ２、ＬＡＭＰ－１、ライトチェーンＡｂ－４（カクテル）、ラムダ軽鎖、カッパ軽鎖、Ｍ６Ｐ、Ｍａｃｈ２、ＭＡＰＫＡＰＫ－２、ＭＥＫ１、ＭＥＫ１／２（Ｐｓ２２２）、ＭＥＫ２、ＭＥＫ１／２（４７Ｅ６）、ＭＥＫ１／２ブロッキングペプチド、ＭＥＴ／ＨＧＦＲ、ＭＧＭＴ、ミトコンドリア抗原、ＭｉｔｏｔｒａｃｋｅｒＧｒｅｅｎＦＭ、ＭＭＰ－２、ＭＭＰ９、Ｅ－カドヘリン、ｍＴＯＲ、ＡＴＰａｓｅ、Ｎ－カドヘリン、ネフリン、ＮＦＫＢ、ＮＦＫＢｐ１０５／ｐ５０、ＮＦ－ＫＢＰ６５、ノッチ１、ノッチ２、ノッチ３、ＯｘＰｈｏｓ複合体ＩＶ、ｐ１３０Ｃａｓ、ｐ３８ＭＡＰＫ、ｐ４４／４２ＭＡＰＫ抗体、Ｐ５０４Ｓ、Ｐ５３、Ｐ７０、Ｐ７０Ｓ６Ｋ、パンカドヘリン、パキシリン、Ｐ－カドヘリン、ＰＤＩ、ｐＥＧＦＲ、ホスホＡＫＴ、ホスホＣＲＥＢ、ホスホＥＧＦ受容体、ホスホＧＳＫ３ベータ、ホスホＨ３、ホスホＨＳＰ－７０、ホスホＭＡＰＫＡＰＫ－２、ＰＨｏｓｐｈｏＭＥＫ１／２、ｐｈｏｓｐｈｏｐ３８ＭＡＰキナーゼ、Ｐｈｏｓｐｈｏｐ４４／４２ＭＡＰＫ、Ｐｈｏｓｐｈｏｐ５３、ＰｈｏｓｐｈｏＰＫＣ、ＰｈｏｓｐｈｏＳ６リボソームタンパク質、ＰｈｏｓｐｈｏＳｒｃ、Ｐｈｏｓｐｈｏ－Ａｋｔ、Ｐｈｏｓｐｈｏ－Ｂａｄ、Ｐｈｏｓｐｈｏ－ＩＫＢ－ａ、Ｐｈｏｓｐｈｏ－ｍＴＯＲ、Ｐｈｏｓｐｈｏ－ＮＦ－カッパＢＰ６５、Ｐｈｏｓｐｈｏ－ｐ３８、Ｐｈｏｓｐｈｏ－ｐ４４／４２ＭＡＰＫ、Ｐｈｏｓｐｈｏ－ｐ７０Ｓ６キナーゼ、Ｐｈｏｓｐｈｏ－Ｒｂ、Ｐｈｏｓｐｈｏ－Ｓｍａｄ２、ＰＩＭ１，ＰＩＭ２，ＰＫＣβ，ポドカリキシン、ＰＲ、ＰＴＥＮ、Ｒ１、Ｒｂ４Ｈ１、Ｒ－カドヘリン、リボヌクレオチドレダクターゼ、ＲＲＭ１、ＲＲＭ１１、ＳＬＣ７Ａ５、ＮＤＲＧ、ＨＴＦ９Ｃ、ＨＴＦ９Ｃ、ＣＥＡＣＡＭ、ｐ３３、Ｓ６リボソームタンパク質、Ｓｒｃ、サバイビン、シナポポディン、シンデカン４、タリン、テンシン、チミジル酸シンターゼ、ツベリン、ＶＣＡＭ－１、ＶＥＧＦ、ビメンチン、凝集素、ＹＥＳ、ＺＡＰ－７０およびＺＥＢを含む。

細胞周期関連マーカーは、アポトーシスプロテアーゼ作動因子－１、ｂｃｌ－ｗ、ｂｃｌ－ｘ、ブロモデオキシウリジン、ＣＡＫ（ｃｄｋ作動キナーゼ）、細胞アポトーシス感受性タンパク質（ＣＡＳ）、カスパーゼ２、カスパーゼ８、ＣＰＰ３２（カスパーゼ－３）、ＣＰＰ３２（カスパーゼ－３）、サイクリン依存性キナーゼ、サイクリンＡ、サイクリンＢ１、サイクリンＤ１、サイクリンＤ２、サイクリンＤ３、サイクリンＥ、サイクリンＧ、ＤＮＡ断片化因子（Ｎ末端）、Ｆａｓ（ＣＤ９５）、Ｆａｓ関連デスドメインタンパク質、Ｆａｓリガンド、Ｆｅｎ－１、ＩＰＯ－３８、Ｍｃ１－１、ミニ染色体維持タンパク質、ミスマッチ修復タンパク質（ＭＳＨ２）、ポリ（ＡＤＰ－リボース）ポリメラーゼ、増殖細胞核抗原、ｐ１６タンパク質、ｐ２７タンパク質、ｐ３４ｃｄｃ２、ｐ５７タンパク質（Ｋｉｐ２）、ｐ１０５タンパク質、Ｓｔａｔ１α、トポイソメラーゼＩ、トポイソメラーゼＩＩα、トポイソメラーゼＩＩＩα、トポイソメラーゼＩＩβを含む。

神経組織マーカーおよび腫瘍マーカーは、αＢクリスタリン、α－インターネキシン、αシヌクレイン、アミロイド前駆体タンパク質、βアミロイド、カルビンジン、コリンアセチルトランスフェラーゼ、興奮性アミノ酸輸送体１、ＧＡＰ４３、グリア原線維酸性タンパク質、グルタミン酸受容体２、ミエリン塩基性タンパク質、神経成長因子受容体（ｇｐ７５）、神経芽細胞腫マーカー、神経線維６８ｋＤ、神経線維１６０ｋＤ、神経線維２００ｋＤ、ニューロン特異的エノラーゼ、ニコチン性アセチルコリン受容体アルファ４、ニコチン性アセチルコリン受容体ベータ２、ペリフェリン、タンパク質遺伝子産物９、Ｓ－１００タンパク質、セロトニン、ＳＮＡＰ－２５、シナプシンＩ、シナプトフィシン、タウ、トリプトファンヒドロキシラーゼ、チロシンヒドロキシラーゼ、ユビキチンを含む。

クラスター分化マーカーは、ＣＤ１ａ、ＣＤ１ｂ、ＣＤ１ｃ、ＣＤ１ｄ、ＣＤ１ｅ、ＣＤ２、ＣＤ３ｄｅｌｔａ、ＣＤ３ｅｐｓｉｌｏｎ、ＣＤ３ｇａｍｍａ、ＣＤ４、ＣＤ５、ＣＤ６、ＣＤ７、ＣＤ８ａｌｐｈａ、ＣＤ８ｂｅｔａ、ＣＤ９、ＣＤ１０、ＣＤ１１ａ、ＣＤ１１ｂ、ＣＤ１１ｃ、ＣＤｗ１２、ＣＤ１３、ＣＤ１４、ＣＤ１５、ＣＤ１５ｓ、ＣＤ１６ａ、ＣＤ１６ｂ、ＣＤｗ１７、ＣＤ１８、ＣＤ１９、ＣＤ２０、ＣＤ２１、ＣＤ２２、ＣＤ２３、ＣＤ２４、ＣＤ２５、ＣＤ２６、ＣＤ２７、ＣＤ２８、ＣＤ２９、ＣＤ３０、ＣＤ３１、ＣＤ３２、ＣＤ３３、ＣＤ３４、ＣＤ３５、ＣＤ３６、ＣＤ３７、ＣＤ３８、ＣＤ３９、ＣＤ４０、ＣＤ４１、ＣＤ４２ａ、ＣＤ４２ｂ、ＣＤ４２ｃ、ＣＤ４２ｄ、ＣＤ４３、ＣＤ４４、ＣＤ４４Ｒ、ＣＤ４５、ＣＤ４６、ＣＤ４７、ＣＤ４８、ＣＤ４９ａ、ＣＤ４９ｂ、ＣＤ４９ｃ、ＣＤ４９ｄ、ＣＤ４９ｅ、ＣＤ４９ｆ、ＣＤ５０、ＣＤ５１、ＣＤ５２、ＣＤ５３、ＣＤ５４、ＣＤ５５、ＣＤ５６、ＣＤ５７、ＣＤ５８、ＣＤ５９、ＣＤｗ６０、ＣＤ６１、ＣＤ６２Ｅ、ＣＤ６２Ｌ、ＣＤ６２Ｐ、ＣＤ６３、ＣＤ６４、ＣＤ６５、ＣＤ６５ｓ、ＣＤ６６ａ、ＣＤ６６ｂ、ＣＤ６６ｃ、ＣＤ６６ｄ、ＣＤ６６ｅ、ＣＤ６６ｆ、ＣＤ６８、ＣＤ６９、ＣＤ７０、ＣＤ７１、ＣＤ７２、ＣＤ７３、ＣＤ７４、ＣＤｗ７５、ＣＤｗ７６、ＣＤ７７、ＣＤ７９ａ、ＣＤ７９ｂ、ＣＤ８０、ＣＤ８１、ＣＤ８２、ＣＤ８３、ＣＤ８４、ＣＤ８５、ＣＤ８６、ＣＤ８７、ＣＤ８８、ＣＤ８９、ＣＤ９０、ＣＤ９１、ＣＤｗ９２、ＣＤｗ９３、ＣＤ９４、ＣＤ９５、ＣＤ９６、ＣＤ９７、ＣＤ９８、ＣＤ９９、ＣＤ１００、ＣＤ１０１、ＣＤ１０２、ＣＤ１０３、ＣＤ１０４、ＣＤ１０５、ＣＤ１０６、ＣＤ１０７ａ、ＣＤ１０７ｂ、ＣＤｗ１０８、ＣＤ１０９、ＣＤ１１４、ＣＤ１１５、ＣＤ１１６、ＣＤ１１７、ＣＤｗ１１９、ＣＤ１２０ａ、ＣＤ１２０ｂ、ＣＤ１２１ａ、ＣＤｗ１２１ｂ、ＣＤ１２２、ＣＤ１２３、ＣＤ１２４、ＣＤｗ１２５、ＣＤ１２６、ＣＤ１２７、ＣＤｗ１２８ａ、ＣＤｗ１２８ｂ、ＣＤ１３０、ＣＤｗ１３１、ＣＤ１３２、ＣＤ１３４、ＣＤ１３５、ＣＤｗ１３６、ＣＤｗ１３７、ＣＤ１３８、ＣＤ１３９、ＣＤ１４０ａ、ＣＤ１４０ｂ、ＣＤ１４１、ＣＤ１４２、ＣＤ１４３、ＣＤ１４４、ＣＤｗ１４５、ＣＤ１４６、ＣＤ１４７、ＣＤ１４８、ＣＤｗ１４９、ＣＤｗ１５０、ＣＤ１５１、ＣＤ１５２、ＣＤ１５３、ＣＤ１５４、ＣＤ１５５、ＣＤ１５６、ＣＤ１５７、ＣＤ１５８ａ、ＣＤ１５８ｂ、ＣＤ１６１、ＣＤ１６２，ＣＤ１６３，ＣＤ１６４，ＣＤ１６５，ＣＤ１６６，およびＴＣＲゼータを含む。

他の細胞マーカーは、セントロメアタンパク質－Ｆ（ＣＥＮＰ－Ｆ）、ジアンチン、インボルクリン、ラミンＡ＆Ｃ［ＸＢ１０］、ＬＡＰ－７０、ムチン、核孔複合体タンパク質、ｐ１８０層状体タンパク質、ｒａｎ、ｒ、カテプシンＤ、Ｐｓ２タンパク質、Ｈｅｒ２－ｎｅｕ、Ｐ５３、Ｓ１００、上皮マーカー抗原（ＥＭＡ）、ＴｄＴ、ＭＢ２、ＭＢ３、ＰＣＮＡおよびＫｉ６７を含む。

代替実施形態

本開示の第１の代替的な態様は、少なくとも部分的に固定された試験生物学的検体の推定固定持続時間を定量的に判定するための方法であって、少なくとも部分的に固定された試験生物学的検体から試験スペクトルデータを取得することであって、試験スペクトルデータが、生物学的検体の少なくとも一部から導出される振動スペクトルデータを含む、試験スペクトルデータを取得することと、訓練された固定推定エンジンを使用して、取得された試験スペクトルデータから固定特徴を導出することと、導出された固定特徴に基づいて、少なくとも部分的に固定された生物学的検体の推定固定持続時間を定量的に判定することと、を含む、方法である。いくつかの実施形態では、振動スペクトルデータは、中間赤外（中間ＩＲ）スペクトルデータを含む。いくつかの実施形態では、振動スペクトルデータは、ラマンスペクトルデータを含む。いくつかの実施形態では、システムは、訓練された固定推定エンジンを使用して固定品質を推定するための動作をさらに含む。

いくつかの実施形態では、試験スペクトルデータは、複数の正規化および補正された振動スペクトルから導出された平均振動スペクトルを含む。いくつかの実施形態では、複数の正規化および補正された振動スペクトルは、以下によって取得される：（ｉ）前記試験生物学的検体内の複数の空間領域を識別すること、（ｉｉ）前記複数の識別された領域の各個々の領域から振動スペクトルを取得すること、（ｉｉｉ）各個々の領域からの前記取得された振動スペクトルを補正し、各個々の領域ごとに補正された振動スペクトルを提供すること、および（ｉｖ）各個々の領域からの前記補正された振動スペクトルを所定の大域最大値に振幅正規化し、各領域の振幅正規化振動スペクトルを提供すること。いくつかの実施形態では、各個々の領域から取得された振動スペクトルは、以下によって補正される：（ｉ）取得された各振動スペクトルを大気効果について補償して、大気補正振動スペクトルを提供すること、および（ｉｉ）散乱について大気補正振動スペクトルを補償すること。いくつかの実施形態では、領域はランダムに選択される。

いくつかの実施形態では、方法は、生物学的検体が、１つ以上の特異的結合実体による標識に適した固定状態を含むかどうかを評価することをさらに含む。いくつかの実施形態では、方法は、生物学的検体固定と正に関連付けられた試験データ内の少なくとも１つのスペクトル帯域を識別することをさらに含む。

本開示の第２の代替的な態様では、少なくとも部分的に固定された試験生物学的検体の推定固定持続時間を判定するためのシステムであって、（ｉ）１つ以上のプロセッサと、（ｉｉ）１つ以上のプロセッサに結合された１つ以上のメモリであって、１つ以上のメモリが、コンピュータ実行可能命令を記憶し、コンピュータ実行可能命令は、１つ以上のプロセッサによって実行されると、試験生物学的検体から試験スペクトルデータを取得することであって、試験スペクトルデータが、生物学的検体の少なくとも一部から導出される振動スペクトルデータを含む、試験スペクトルデータを取得することと、訓練された固定推定エンジンを使用して取得された試験スペクトルデータから固定特徴を導出することであって、固定推定エンジンが、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練され、訓練スペクトルデータセットが、少なくとも既知の固定持続時間のクラスラベルを含む、、固定特徴を導出することと、導出された固定特徴に基づいて、少なくとも部分的に固定された生物学的検体の推定固定期間を定量的に判定することと、を含む動作をシステムに実行させる、１つ以上のメモリと、を備える、システムである。いくつかの実施形態では、固定推定エンジンの訓練中に使用される既知の固定持続時間のクラスラベルは、機能的ＩＨＣ試験によって検証される。いくつかの実施形態では、試験生物学的検体は染色されていない。いくつかの実施形態では、試験生物学的検体は、１つ以上のバイオマーカーの存在について染色される。

本開示の第３の代替的な態様は、少なくとも部分的に固定された試験生物学的検体の固定状態を予測するためのシステムであって、（ｉ）１つ以上のプロセッサと、（ｉｉ）１つ以上のプロセッサに結合された１つ以上のメモリであって、１つ以上のメモリが、コンピュータ実行可能命令を記憶し、コンピュータ実行可能命令は、１つ以上のプロセッサによって実行されると、少なくとも部分的に固定された試験生物学的検体から試験スペクトルデータを取得することであって、試験スペクトルデータが、生物学的検体の少なくとも一部から導出される振動スペクトルデータを含む、試験スペクトルデータを取得することと、訓練された固定推定エンジンを使用して、取得された試験スペクトルデータから１つ以上の固定特徴を導出することと、導出された１つ以上の固定特徴に基づいて、少なくとも部分的に固定された生物学的検体の推定固定状態を定量的に判定することと、を含む動作をシステムに実行させる、１つ以上のメモリと、を備える、システムである。いくつかの実施形態では、固定状態は、固定持続時間である。いくつかの実施形態では、固定状態は、固定品質の定性的推定値である。いくつかの実施形態では、方法は、生物学的検体が、１つ以上の特異的結合実体による標識に適した固定状態を含むかどうかを評価することをさらに含む。いくつかの実施形態では、方法は、生物学的検体固定と正に関連付けられた試験データ内の少なくとも１つのスペクトル帯域を識別することをさらに含む。

いくつかの実施形態では、試験スペクトルデータは、少なくともアミドＩバンドの中間ＩＲスペクトル情報を含む。いくつかの実施形態では、試験スペクトルデータは、約３２００から約３４００ｃｍ^－１、約２８００から約２９００ｃｍ^－１、約１０２０から約１１００ｃｍ^－１、および／または約１５２０から約１５８０ｃｍ^－１の範囲の波長の振動スペクトル情報を含む。いくつかの実施形態では、試験生物学的検体は染色されていない。いくつかの実施形態では、試験生物学的検体は、１つ以上のバイオマーカーの存在について染色される。

本明細書中で言及されるおよび／または出願データシートにおいてリスト化される全ての米国特許、米国特許出願公開、米国特許出願、外国特許、外国特許出願、および非特許刊行物は、参照によりそれらの全体が本明細書に組み込まれる。実施形態の態様は、必要に応じて、様々な特許、出願、および刊行物の概念を使用してさらに別の実施形態を提供するように変更されることができる。

本開示は、いくつかの例示的な実施形態を参照して説明されてきたが、本開示の原理の精神および範囲内に含まれるであろう多くの他の変更および実施形態が当業者によって考案されることができることを理解されたい。より具体的には、合理的な変形および変更は、本開示の精神から逸脱することなく、前述の開示、図面、および添付の特許請求の範囲内の主題の組み合わせ構成の構成部品および／または配置において可能である。構成部品および／または配置の変形および変更に加えて、代替の使用法も当業者にとって明らかであろう。

Claims

少なくとも部分的に固定された試験生物学的検体の推定固定持続時間を定量的に判定するためのシステム（２００）であって、（ｉ）１つ以上のプロセッサ（２０９）と、（ｉｉ）前記１つ以上のプロセッサ（２０９）に結合された１つ以上のメモリ（２０１）であって、前記１つ以上のメモリ（２０１）がコンピュータ実行可能命令を記憶し、前記コンピュータ実行可能命令は、前記１つ以上のプロセッサ（２０９）によって実行されると、前記システム（２００）に、
ａ．少なくとも部分的に固定された前記試験生物学的検体から試験スペクトルデータを取得することであって、前記取得された試験スペクトルデータが、前記生物学的検体の少なくとも一部から導出された振動スペクトルデータを含む、試験スペクトルデータを取得することと、
ｂ．訓練された固定推定エンジン（２１０）を使用して、前記取得された試験スペクトルデータから固定特徴を導出することと、
ｃ．前記導出された固定特徴に基づいて、前記少なくとも部分的に固定された生物学的検体の前記推定固定持続時間を定量的に判定することと、を含む動作を実行させる、１つ以上のメモリと、を備える、システム。
前記訓練された固定推定エンジン（２１０）を使用して固定品質を推定するための動作をさらに含む、請求項１に記載のシステム。
前記固定推定エンジン（２１０）が、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練される、請求項１または２に記載のシステム。
前記固定推定エンジン（２１０）が、１つ以上の訓練スペクトルデータセットを使用して訓練され、各訓練スペクトルデータセットが、複数の別様に固定された訓練組織試料から導出された複数の訓練振動スペクトルを含み、各訓練振動スペクトルが、既知の固定持続時間のクラスラベルを含む、請求項１または２に記載のシステム。
既知の固定持続時間の前記クラスラベルが、機能的ＩＨＣ試験によって検証される、請求項４に記載のシステム。
前記クラスラベルが、固定品質注釈をさらに含む、請求項４または５に記載のシステム。
各訓練スペクトルデータセットが、（ｉ）訓練生物学的検体を取得すること、（ｉｉ）取得された前記訓練生物学的検体を複数の訓練組織試料に分割すること、および（ｉｉｉ）前記複数の訓練組織試料の各訓練組織試料を異なる所定の時間量にわたって固定すること、によって導出される、請求項４から６のいずれか一項に記載のシステム。
前記異なる所定の時間量が、約０時間から約２４時間の範囲である、請求項７に記載のシステム。
前記異なる所定の時間量が、約０時間から約１２時間の範囲である、請求項７に記載のシステム。
前記取得された試験スペクトルデータが、複数の正規化および補正された振動スペクトルから導出された平均振動スペクトルを含む、請求項１から９のいずれか一項に記載のシステム。
前記複数の正規化および補正された振動スペクトルが、（ｉ）前記試験生物学的検体内の複数の空間領域を識別すること、（ｉｉ）前記複数の識別された領域の各個々の領域から振動スペクトルを取得すること、（ｉｉｉ）各個々の領域からの前記取得された振動スペクトルを補正し、各個々の領域ごとに補正された振動スペクトルを提供すること、および（ｉｖ）各個々の領域からの前記補正された振動スペクトルを所定の大域最大値に振幅正規化し、各領域の振幅正規化振動スペクトルを提供すること、によって取得される、請求項１０に記載のシステム。
各個々の領域からの前記取得された振動スペクトルが、（ｉ）取得された各振動スペクトルを大気効果について補償して、大気補正振動スペクトルを提供すること、および（ｉｉ）散乱について前記大気補正振動スペクトルを補償すること、によって補正される、請求項１１に記載のシステム。
前記領域がランダムに選択される、請求項１１に記載のシステム。
前記訓練された固定状態推定エンジン（２１０）が、次元縮小に基づく機械学習アルゴリズムを含む、請求項１から１３のいずれか一項に記載のシステム。
前記次元縮小が、潜在構造回帰モデルへの投影を含む、請求項１４に記載のシステム。
前記次元縮小が、主成分分析、および任意に判別分析を含む、請求項１４に記載のシステム。
前記訓練された固定状態推定エンジン（２１０）がニューラルネットワークを含む、請求項１から１３のいずれか一項に記載のシステム。
少なくとも部分的に固定された試験生物学的検体の推定固定持続時間を判定するための命令を記憶する非一時的コンピュータ可読媒体であって、前記推定固定持続時間を判定することが、
（ａ）前記試験生物学的検体から試験スペクトルデータを取得することであって、前記取得された試験スペクトルデータが、前記生物学的検体の少なくとも一部から導出された振動スペクトルデータを含む、試験スペクトルデータを取得することと、
（ｂ）訓練された固定推定エンジンを使用して、前記取得された試験スペクトルデータから固定特徴を導出することであって、前記固定推定エンジンが、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練され、前記訓練スペクトルデータセットが、少なくとも既知の固定持続時間のクラスラベルを含む、固定特徴を導出することと、
（ｃ）前記導出された固定特徴に基づいて、前記少なくとも部分的に固定された生物学的検体の推定固定持続時間を定量的に判定することと、を含む、非一時的コンピュータ可読媒体。
既知の固定持続時間の前記クラスラベルが、機能的ＩＨＣ試験によって検証される、請求項１８に記載の非一時的コンピュータ可読媒体。
前記クラスラベルが、固定品質注釈をさらに含む、請求項１８または１９に記載の非一時的コンピュータ可読媒体。
前記訓練された固定推定エンジンを使用して固定品質を推定するための動作をさらに含む、請求項２０に記載の非一時的コンピュータ可読媒体。
各訓練スペクトルデータセットが、（ｉ）訓練生物学的検体を取得すること、（ｉｉ）取得された前記訓練生物学的検体を複数の訓練組織試料に分割すること、および（ｉｉｉ）前記複数の訓練組織試料の各訓練組織試料を異なる所定の時間量にわたって固定すること、によって導出される、請求項１８から２１のいずれか一項に記載の非一時的コンピュータ可読媒体。
前記訓練生物学的検体が、前記試験生物学的検体と同じ組織タイプを含む、請求項１８から２２のいずれか一項に記載の非一時的コンピュータ可読媒体。
前記訓練生物学的検体が、前記試験生物学的検体とは異なる組織タイプを含む、請求項１８から２３のいずれか一項に記載の非一時的コンピュータ可読媒体。
前記訓練された固定状態推定エンジンが、次元縮小に基づく機械学習アルゴリズムを含む、請求項１８から２４のいずれか一項に記載の非一時的コンピュータ可読媒体。
前記次元縮小が、潜在構造回帰モデルへの投影を含む、請求項２５に記載の非一時的コンピュータ可読媒体。
前記次元縮小が、主成分分析を含む、請求項２５に記載の非一時的コンピュータ可読媒体。
前記訓練された固定状態推定エンジンがニューラルネットワークを含む、請求項１８から２４のいずれか一項に記載の非一時的コンピュータ可読媒体。
少なくとも部分的に固定された試験生物学的検体の固定状態を予測する方法であって、
（ａ）少なくとも部分的に固定された前記試験生物学的検体（３２０）から試験スペクトルデータを取得することであって、前記取得された試験スペクトルデータが、前記生物学的検体の少なくとも一部から導出された振動スペクトルデータを含む、試験スペクトルデータを取得することと、
（ｂ）訓練された固定推定エンジンを使用して、前記取得された試験スペクトルデータから固定特徴（３４０）を導出することであって、前記固定推定エンジンが、複数の別様に固定された訓練生物学的検体から取得された訓練スペクトルデータセットを使用して訓練される、固定特徴を導出することと、
（ｃ）前記導出された固定特徴に基づいて、前記少なくとも部分的に固定された生物学的検体の推定固定状態（３５０）を定量的に判定することと、を含む、方法。
前記訓練スペクトルデータセットが、既知の固定持続時間のクラスラベルを含む、請求項２９に記載の方法。
前記訓練スペクトルデータセットが、既知の固定品質の注釈を含むクラスラベルをさらに含む、請求項３０に記載の方法。
前記訓練された固定推定エンジンを使用して固定品質を推定することをさらに含む、請求項３１に記載の方法。
少なくとも２つの訓練振動スペクトルが、複数の前記訓練生物学的検体の各個々の訓練生物学的検体から取得され、前記少なくとも２つの試料振動スペクトルが、前記個々の訓練生物学的検体の異なる部分から取得される、請求項２９から３２のいずれか一項に記載の方法。
前記個々の訓練生物学的検体の少なくとも２つの前記異なる部分が、それぞれ異なる所定の時間量にわたって固定剤で処理される、請求項３３に記載の方法。
前記異なる所定の時間量が、約０時間から約２４時間の範囲である、請求項３４に記載の方法。
前記異なる所定の時間量が、約０時間から約１２時間の範囲である、請求項３５に記載の方法。
前記少なくとも２つの訓練振動スペクトルが、それぞれ、複数の正規化および補正された訓練振動スペクトルから導出された平均振動スペクトルである、請求項３３に記載の方法。
前記生物学的検体が、１つ以上の特異的結合実体による標識に適した固定状態を含むかどうかを評価することをさらに含む、請求項２９から３７のいずれか一項に記載の方法。
生物学的検体固定と正に関連付けられた試験データ内の少なくとも１つのスペクトル帯域を識別することをさらに含む、請求項２９から３８のいずれか一項に記載の方法。
前記取得された試験スペクトルデータが、少なくともアミドＩバンドの中間ＩＲスペクトル情報を含む、請求項２９から３９のいずれか一項に記載の方法。
前記取得された試験スペクトルデータが、約３２００から約３４００ｃｍ^－１、約２８００から約２９００ｃｍ^－１、約１０２０から約１１００ｃｍ^－１、および／または約１５２０から約１５８０ｃｍ^－１の範囲の波長の振動スペクトル情報を含む、請求項２９から４０のいずれか一項に記載の方法。
前記試験生物学的検体が染色されていない、請求項２９から４１のいずれか一項に記載の方法。
前記訓練された固定状態推定エンジンが、次元縮小に基づく機械学習アルゴリズムを含む、請求項２９から４２のいずれか一項に記載の方法。
前記次元縮小が、潜在構造回帰モデルへの投影を含む、請求項４３に記載の方法。
前記次元縮小が、主成分分析を含む、請求項４３に記載の方法。
前記訓練された固定状態推定エンジンがニューラルネットワークを含む、請求項２９から４２のいずれか一項に記載の方法。
前記固定推定エンジンが、中間ＩＲスペクトルデータを使用して訓練される、請求項２９から４６のいずれか一項に記載の方法。
前記固定推定エンジンが、ラマンスペクトルデータを使用して訓練される、請求項２９から４６のいずれか一項に記載の方法。
前記試験生物学的検体が、１つ以上のバイオマーカーの存在について染色される、請求項２９から４８のいずれか一項に記載の方法。
前記１つ以上のバイオマーカーが癌バイオマーカーを含む、請求項４９に記載の方法。