JP2023536695A - マイクロウェルプレートで実行アーティファクトを分析及び検出するための技法 - Google Patents

マイクロウェルプレートで実行アーティファクトを分析及び検出するための技法 Download PDF

Info

Publication number
JP2023536695A
JP2023536695A JP2023504097A JP2023504097A JP2023536695A JP 2023536695 A JP2023536695 A JP 2023536695A JP 2023504097 A JP2023504097 A JP 2023504097A JP 2023504097 A JP2023504097 A JP 2023504097A JP 2023536695 A JP2023536695 A JP 2023536695A
Authority
JP
Japan
Prior art keywords
label
features
heatmap
spatial
machine learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023504097A
Other languages
English (en)
Inventor
マーク フェーダー フォゲルソン,ベンジャミン
マクリーン,ピーター
ハク,イムラン
サンダース,マリッサ
フィッシュ,エリック
べイカー,チャールズ
ヴェラ,フワン セバスティアン ロドリゲス
Original Assignee
リカージョン ファーマシューティカルズ インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US16/940,320 external-priority patent/US11361438B2/en
Priority claimed from US16/940,325 external-priority patent/US20220027795A1/en
Application filed by リカージョン ファーマシューティカルズ インコーポレイテッド filed Critical リカージョン ファーマシューティカルズ インコーポレイテッド
Publication of JP2023536695A publication Critical patent/JP2023536695A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/431Frequency domain transformation; Autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/52Scale-space analysis, e.g. wavelet analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06V10/7753Incorporation of unlabelled data, e.g. multiple instance learning [MIL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30072Microarray; Biochip, DNA array; Well plate

Abstract

様々な実施形態において、実験分析アプリケーションは、マイクロウェルプレートを含む実験において実行アーティファクトを検出する。実験分析アプリケーションは、マイクロウェルプレートに関連付けられた1つまたは複数のヒートマップに基づいて、空間的特徴の1つまたは複数のセットを計算する。実験分析アプリケーションは、次いで空間的特徴のセット(複数可)を集約して特徴ベクトルを生成する。実験分析アプリケーションは、特徴ベクトルを訓練された分類器に入力する。それに応じて、訓練された分類器は、マイクロウェルプレートが第1の実行アーティファクトに関連付けられていることを示すラベルを生成する。

Description

関連出願の相互参照
この出願は、2020年7月27日に出願された米国特許出願係属番号第16/940,320号の利益を主張するものであり、また2020年7月27日に出願された米国特許出願係属番号第16/940,325号の利益を主張するものである。これらの関連出願の主題は、参照により本明細書に組み込まれる。
様々な実施形態は、一般に、コンピュータサイエンス及び生化学的分析に関し、より具体的には、マイクロウェルプレートでの実行アーティファクトを分析及び検出するための技法に関する。
ハイスループットスクリーニングは、研究者が1日あたり数万、または数十万さえもの化学的、生物学的、遺伝的、及び/または薬理検査を行うことを可能にする自動化プロセスである。典型的な実験では、統合システムがマイクロウェルプレートのセットを使用して試験を自動的に実施しており、各プレートには2次元(「2D」)グリッドのウェルが含まれている。統合されたシステムは、試験用の様々な化合物のサンプルを、ターゲットのサンプルと共に様々なウェルに分注する。化合物とターゲット間のいずれかの反応が発生するまでのインキュベーション期間の後、様々な測定がウェルで実行され、結果が測定値の2D配列として、実験データセットに保存される。
ハイスループットスクリーニングに関連する1つの課題は、実験データセットに、実験自体の実行に起因する「実行アーティファクト」と呼ばれる特定のエラーが含まれ得る。例えば、分注ノズルが部分的に詰まっていて、そのノズルに割り当てられた特定のウェルにターゲットのサンプルを適切に分注できない場合、それらの特定のウェルで実行された測定では、ターゲットと、ウェルに対応する化合物との間の実際の反応または「完全な」反応を捉えないであろう。特定のウェルで実行された測定から得られた測定値は不正確であり、実際の反応または「完全な」反応を反映していないため、これらの測定値は、実験データセットの全体的な質を低下させる実行アーティファクトと見なされる。一般に、質の劣悪な実験データセットを使用しながらターゲットに対する様々な化合物の有効性について有効な結論を導き出すことは、はるかに困難である。したがって、実験データセットの実行アーティファクトを特定して軽減するために、様々な試みが行われてきた。
実行アーティファクトを識別する1つのアプローチでは、人間のレビュー担当者が「ヒートマップ」(測定値の様々な配列、または測定値の様々な配列の視覚的表現)を分析して、実行アーティファクトを示す測定値の異常なパターンを検出しようとする。異常なパターンを特定すると、レビュー担当者は通常、関連するプレートに注釈を付けて、疑わしい実行アーティファクト(複数可)のタイプと重大度を示す。注釈が付けられた情報に基づいて、プレートに関連付けられた測定値を実験データセットから除外できる及び/または再検討し得る。さらに、一部のタイプの実行アーティファクトでは、アーティファクトの根本原因を判定して修正する試みが行われる。
上記のアプローチの欠点の1つは、ヒートマップを手動式に分析すると、時間がかかり、エラーが発生しやすいことである。多くの場合、レビュー担当者は、分析プロセスに利用できる時間内に、実験に関連するすべてのヒートマップを適切に精査することができない。利用可能な時間で分析プロセスを完了するために、レビュー担当者は通常、限られた数のヒートマップのみを分析する、及び/またはヒートマップの大まかな分析を実行する。その結果、ヒートマップに反映された実行上の異常が見落とされ得る、または誤解され得る。
もう1つの欠点は、実行アーティファクトの識別が主観的なプロセスであることである。したがって、同様の視覚パターンを示すヒートマップであっても、特定された実行アーティファクトの数及び/またはタイプは、レビュー担当者によって異なり得る。さらに、手動式のレビュープロセスは、実行アーティファクトを一貫して特定するものではないため、実行アーティファクトの経時的な傾向を検出することは、不可能ではないにしても非常に困難である。その結果、実行アーティファクトを減らすための実験プロセス及び/または機器を改善する機会が失われる可能性がある。
上記のことが示すように、当技術分野で必要とされるのは、マイクロウェルプレートを含む実験で実行アーティファクトを分析及び検出するためのより効果的な技術である。
本発明の一実施形態は、マイクロウェルプレートを含む実験において実行アーティファクトを検出するための方法を設定する。この方法は、第1のマイクロウェルプレートに関連付けられた1つまたは複数のヒートマップに基づいて空間的特徴の1つまたは複数のセットを計算すること、第1の特徴ベクトルを生成するために、空間的特徴の1つまたは複数のセットを集約すること、及び第1の特徴ベクトルを訓練された分類器に入力することであって、それに応じて、第1のマイクロウェルプレートが第1の実行アーティファクトに関連付けられていることを示す第1のラベルを生成する、入力することを含む。
従来技術と比較した開示の技術の少なくとも1つの技術的利点は、開示されている技術を使用して、マイクロウェルプレートを伴う実験で実行アーティファクトをより正確かつ一貫して分析及び検出できることである。とりわけ、開示されている技術により、各マイクロウェルプレートは、マイクロウェルプレートに対して生成されたヒートマップで検出された空間パターンに基づいて、自動的に分類される。したがって、ヒートマップに反映された実行上の異常が見落とされたり誤解されたりする可能性は、従来技術のアプローチに比べて減少する。さらに、マイクロウェルプレートは実行アーティファクトに関して一貫した客観的な方法で分類されるため、経時的な実行アーティファクトの傾向を効果的に検出及び使用して、実験のプロセス及び/または装置を改善することができる。これらの技術的な利点は、従来技術のアプローチに対して1つまたは複数の技術的な改善をもたらす。
多様な実施形態の上段にて列挙された特徴が詳細に理解できるように、上記で簡潔に要約された本発明の概念のより具体的な説明は、多様な実施形態を参照することによって行われ得、特定の実施形態のそれぞれは添付図で示される。しかし、添付の図面が本発明の概念の典型的な実施形態だけを示し、ひいては、決して範囲を限定するものと見なされるべきではなく、他にも同等に効果的な実施形態があるということに留意されたい。
様々な実施形態の1つ以上の態様を実装するように構成されているシステムの概念の図である。 様々な実施形態による、図1の特徴エンジンのより詳細な図である。 様々な実施形態による、図1の出力エンジンのより詳細な図である。 様々な実施形態による、マイクロウェルプレートを含む実験において実行アーティファクトを検出するように分類器をトレーニングするための方法ステップの流れ図である。 様々な実施形態による、訓練された分類器を使用するマイクロウェルプレートを含む実験において実行アーティファクトを検出するための方法ステップの流れ図である。
以下の説明では、多様な実施形態のさらに十分な理解をもたらすために多数の具体的な詳細を説明する。しかし、本発明の概念がこれらの具体的な詳細の1つ以上なしに実践され得ることは、当業者にとって明らかである。
開示された技術は、マイクロウェルプレートを使用して実施された実験における実行の異常を自動的に検出するために使用することができる。トレーニング段階では、トレーニングアプリケーションは、ヒートマップセットに基づいて訓練された分類器を生成し、各ヒートマップセットは、異なるマイクロウェルプレートに関連付けられた1つ以上のヒートマップを明示する。例えば、所与のマイクロウェルプレートのヒートマップセットには、細胞数ヒートマップと任意の数の強度ヒートマップを含めることができ、各強度ヒートマップは異なる蛍光色素に関連付けられる。細胞数ヒートマップは、実験中に使用されるマイクロウェルプレートの各ウェルの細胞数を明示できる。所与の強度ヒートマップは、関連する蛍光色素を介して励起された場合に使用される各ウェルの平均強度を明示できる。
重要なことに、マイクロウェルプレートに関連する実行アーティファクトは、多くの場合、関連するヒートマップの1つ以上に低周波の空間パターンとして現れる。このため、各ヒートマップに対して、トレーニングアプリケーションはヒートマップにウェーブレット変換を適用して、一連の低周波空間パターンを判定する。マイクロウェルプレートのそれぞれについて、トレーニングアプリケーションは、関連する低周波空間パターンのセットに基づいて特徴ベクトルを生成する。
トレーニングアプリケーションは、クラスタリングアルゴリズムを実行して、特徴ベクトルをクラスタに分割する。各クラスタ内の特徴ベクトルは、他のクラスタの特徴ベクトルよりも互いに類似している。トレーニングアプリケーションは、グラフィカルユーザインターフェース(「GUI」)を介してオーバーライドできるクラスタごとに異なるラベルを生成する。例えば、トレーニングアプリケーションは、マイクロウェルプレートに関連付けられているクラスタのラベル「L1」を自動的に生成でき、このクラスタでは、下から4番目の行は、マイクロウェルプレートの他の行に比べて細胞数が少なく、強度の値も低くなっている。ラベル「L1」は、GUIを介してラベル「行の不履行」に更新できる。特徴ベクトル及び関連付けられたラベルに基づいて、トレーニングアプリケーションは分類器をトレーニングして、特徴ベクトルを、予測ラベルと、関連付けられたラベル信頼度にマッピングする。
その後、推論段階で、実験分析アプリケーションは、訓練された分類器を使用して、マイクロウェルプレートのセット用のヒートマップセットに基づいて、マイクロウェルプレートのセットを介して実施される実験に関連する実行の異常を検出及び評価する。実験分析アプリケーションは、マイクロウェルプレートのセット用のヒートマップセットに基づいて、実験全体を表す平均的なヒートマップセットを生成する。実験アプリケーションは、実験に関連付けられた各ヒートマップセット(平均的なヒートマップセットを含む)を訓練された分類器に入力して、予測ラベルとラベル信頼度を生成する。
マイクロウェルプレートのセットに含まれる各マイクロウェルプレートについて、実験分析アプリケーションは、予測ラベルに関連付けられたクラスタに対してマイクロウェルプレートがどの程度外れているかを示す異常スコアを計算する。実験全体について、実験分析アプリケーションは、実験全体の予測ラベルと等しい予測ラベルを有する実験に関連付けられたマイクロウェルプレートのパーセンテージを明示する、整合するプレートの割合を計算する。次に、実験分析アプリケーションは、任意の数の予測ラベル、ラベルの信頼度、異常スコア、及び整合するプレートの割合を、任意の組み合わせで、任意の数のソフトウェアアプリケーション及び/またはディスプレイに、GUIを介して与える。このように、実験分析アプリケーションは、実験全体と、関連するマイクロウェルプレートのそれぞれを、実行アーティファクトに関して一貫した客観的な方法で、分類する。
システムの概要
図1は、様々な実施形態の1つ以上の態様を実装するように構成されているシステムの概念の図である。説明の目的で、同様の対象物の複数のインスタンスは、対象物を識別する参照番号と、必要に応じてインスタンスを識別する括弧内の英数字(複数可)で示される。示されるように、システム100は、非限定的に、計算インスタンス110(1)及び110(2)、表示デバイス108(1)及び108(2)、ラベル付けされていないトレーニングデータセット102、及び実験データセット106を含む。
いくつかの実施形態では、システム100は、非限定的に、任意の数の計算インスタンス110、任意の数の表示デバイス108、任意の数のラベル付けされていないトレーニングデータセット102、及び任意の数の実験データセット106を任意の組み合わせで含むことができる。システム100の構成要素は、任意の数の共有された地理的位置及び/または任意の数の異なる地理的位置に分散させる、及び/または1つまたは複数のクラウドコンピューティング環境(つまり、カプセル化された共有リソース、ソフトウェア、データなど)に任意の組み合わせで実装され得る。
示されるように、計算インスタンス110(1)は、プロセッサ112(1)及びメモリ116(1)を含むが、これらに限定されず、計算インスタンス110(2)は、プロセッサ112(2)及びメモリ116(2)を含むが、これらに限定されない。計算インスタンス110(1)及び110(2)はまた、本明細書では個別に「計算インスタンス110」と称し、集合的に「計算インスタンス110」と呼ぶ。プロセッサ112(1)及び112(2)はまた、本明細書では個別に「プロセッサ112」と称し、集合的に「プロセッサ112」と呼ぶ。メモリ116(1)及び116(2)はまた、本明細書では個別に「メモリ116」と称し、集合的に「メモリ116」と呼ぶ。計算インスタンス110のそれぞれは、クラウドコンピューティング環境で実装されてもよく、任意の他の分散コンピューティング環境の一部として実装されても、スタンドアロン方式で実装されてもよい。
プロセッサ112は、命令を実行できる任意の命令実行システム、装置、またはデバイスであり得る。例えば、プロセッサ112は、中央処理装置、グラフィックス処理装置、コントローラ、マイクロコントローラ、ステートマシン、またはそれらの任意の組み合わせを含むことができる。計算インスタンス110のメモリ116は、計算インスタンス110のプロセッサ112による使用のために、ソフトウェアアプリケーション及びデータなどのコンテンツを格納する。いくつかの実施形態では、任意の数の計算インスタンス110のそれぞれが、任意の数のプロセッサ112及び任意の数のメモリ116を任意の組み合わせで含むことができる。
計算インスタンス110のそれぞれは、クラウドコンピューティング環境で実装されてもよく、任意の他の分散コンピューティング環境の一部として実装されても、スタンドアロン方式で実装されてもよい。特に、任意の数の計算インスタンス110(1つを含む)が、任意の技術的に実行可能な方法で、マルチプロセッシング環境を提供することができる。
メモリ116は、ランダムアクセスメモリ、読み取り専用メモリ、フロッピーディスク、ハードディスク、またはローカルまたはリモートの任意の他の形態のデジタル記憶装置など、容易に利用可能なメモリの1つまたは複数とすることができる。いくつかの実施形態では、記憶装置(図示せず)は、メモリ116を補足または置換することができる。記憶装置は、プロセッサ112にアクセス可能な任意の数及びタイプの外部メモリを含むことができる。例えば、非限定的に、記憶装置は、セキュアデジタルカード、外部フラッシュメモリ、ポータブルコンパクトディスク読み取り専用メモリ、光記憶装置、磁気記憶装置、または上記の任意の適切な組み合わせを含むことができる。
一部の実施形態では、計算インスタンス110は、任意の数(ゼロを含む)及び/またはタイプの入力デバイス、出力デバイス、及び/または入力/出力デバイスに、任意の組み合わせで関連付けることができる。入力デバイスは、ユーザからの入力を受け取ることができる任意のデバイスである。入力デバイスのいくつかの例には、キーボード、マウス、トラックパッド、マイク、ビデオカメラなどがあるが、これらに限定されない。出力デバイスは、ユーザに出力を与えることができる任意のデバイスである。出力デバイスのいくつかの例には、表示デバイス108、ヘッドホン、スピーカーなどがあるが、これらに限定されない。入力/出力デバイスは、タッチスクリーンなど、ユーザからの入力の受信とユーザへの出力の両方が可能な任意のデバイスである。
示されるように、いくつかの実施形態では、計算インスタンス110(1)は表示デバイス108(1)に関連付けられ、計算インスタンス110(2)は表示デバイス108(2)に関連付けられる。表示デバイス108(1)及び108(2)はまた、本明細書では個別に「表示デバイス108」、また集合的に「表示デバイス108」と呼ぶ。表示デバイス108は、画像を表示できる任意の装置及び/またはその他の種類の視覚コンテンツとすることができる。表示デバイス108のいくつかの例には、液晶ディスプレイ、発光ダイオードディスプレイ、プロジェクションディスプレイ、プラズマディスプレイパネルなどがあるが、これらに限定されない。いくつかの実施形態では、表示デバイス108は、ビジュアルコンテンツの表示と入力(例えば、ユーザからの)の受信ができるタッチスクリーンである。
いくつかの実施形態では、計算インスタンス110は、任意の数及び/または種類の他のデバイス(例えば、他の計算インスタンス110、入力デバイス、出力デバイス、入力/出力デバイスなど)をユーザデバイスに統合することができる。ユーザデバイスの一部の例には、デスクトップコンピュータ、ラップトップ、スマートフォン、スマートテレビ、ゲームコンソール、タブレットなどが、非限定的に含まれる。
一般に、計算インスタンス110のそれぞれは、1つまたは複数のアプリケーションを実装するように構成される。説明のみを目的として、各アプリケーションは、単一の計算インスタンス110のメモリ116に存在し、単一の計算インスタンス110のプロセッサ112で実行されるものとして記載されている。しかし、いくつかの実施形態では、各アプリケーションの機能は、任意の数の計算インスタンス110のメモリ116に存在し、任意の数の計算インスタンス110のプロセッサ112で、任意の組み合わせで実行される任意の数の他のアプリケーションにわたって分散され得る。さらに、任意の数のアプリケーションの機能を単一のアプリケーションに統合できる。
いくつかの実施形態では、任意の数のアプリケーション及び/またはアプリケーションの一部は、1つまたは複数の非一時的コンピュータ可読媒体に格納される。本明細書で使用される「非一時的」という用語は、データストレージの持続性に対する限界(例えば、RAM対ROM)とは対照的な、メディア自体の限界(つまり、信号ではなく触知可能なもの)である。非一時的コンピュータ可読媒体は、本明細書では「コンピュータ可読媒体」とも呼ばれる。例えば、いくつかの実施形態では、メモリ116(1)はコンピュータ可読媒体であり、任意の数のアプリケーション及び/またはアプリケーションの一部は、メモリ116(1)に格納される。同じまたは他の実施形態で、メモリ116(2)はコンピュータ可読媒体であり、任意の数のアプリケーション及び/またはアプリケーションの一部は、メモリ116(2)に格納される。
いくつかの実施形態では、任意の数のアプリケーション及び/またはアプリケーションの一部は、メモリ116(1)及び/またはメモリ116(2)に格納される前に、1つまたは複数のコンピュータ可読媒体に格納される。例えば、いくつかの実施形態では、任意の数のアプリケーション及び/またはアプリケーションの一部はマシン(サーバーマシンなど)に保存され、任意の数のアプリケーション及び/またはアプリケーションの一部がマシンからメモリ116(1)及び/またはメモリ116(2)にダウンロードされる。同じまたは他の実施形態において、任意の数のアプリケーション及び/またはアプリケーションの一部は、何らかの形式のポータブルコンピュータ可読媒体に保存され、任意の数のアプリケーション及び/またはアプリケーションの一部は、ポータブルコンピュータ可読媒体からメモリ116(1)及び/またはメモリ116(2)にダウンロードされる。ポータブルコンピュータ可読媒体の一部の例は、デジタルビデオディスク、メモリディスク、メモリスティックなどを含むが、これらに限定されない。
いくつかの実施形態では、本開示の態様は、コンピュータ可読プログラムコーデックが具現化された1つまたは複数のコンピュータ可読媒体で具現化されたコンピュータプログラム製品の形態をとることができる。1つ以上のコンピュータ可読媒体の任意の組み合わせを利用し得る。各コンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体であり得る。コンピュータ可読記憶媒体は、例えば、限定ではないが、電子、磁気、光、電磁気、赤外線、もしくは半導体システム、装置、もしくはデバイス、または任意の前述の好適な組み合わせであり得る。コンピュータ可読記憶媒体のさらなる具体例(包括的ではない列挙)は、以下、1つ以上の通信回線を有する電気的接続、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ、読み取り専用メモリ、消去可能プログラマブルROM、またはフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ、光学記憶デバイス、磁気記憶デバイス、または前述の任意の好適な組み合わせを含むであろう。本文書の文脈において、コンピュータ可読記憶媒体は、命令実行システム、装置、もしくはデバイスによる使用のため、またはそれらと接続してプログラムを含むまたは記憶することができる任意の有形媒体であり得る。
計算インスタンス110は、ハイスループットスクリーニングを使用して実行されるマイクロウェルプレートを含む実験における実行アーティファクトの根本原因の分析を検出し、促進するように構成される。本明細書で前述しているように、典型的な実験では、統合システムがマイクロウェルプレートのセットを使用して自動的に試験を実施する。本明細書で言及されるように、マイクロウェルプレートは、非限定的に、各々が限定された容積を保持することができる2Dグリッドのウェルを含む任意のプレートであり得る。マイクロウェルプレートはまた、一般にマイクロプレート、マルチウェルプレート、及びマルチウェル培養プレートとも呼ばれる。
各実験には、任意の数の化学的、生物学的、遺伝的、及び/または薬理学的試験が含まれるが、これらに限定されず、各試験は異なるウェルの中で実施される。典型的な実験では、ウェルへの試験の割り当ては、各マイクロウェルプレート内でランダム化される。試験が完了した後、ウェルに対して様々な測定が実行され、結果が測定値の2D配列として実験のデータセットに保存される。試験の割り当てはランダム化されているため、各2D配列内の測定値の分布は、表向きランダムである。
ハイスループットスクリーニングに関連する1つの課題は、実験データセットに、実験自体に起因する「実行アーティファクト」と知られる特定のエラーが含まれ得る。実行アーティファクトの根本原因の一部に、機器の問題、キャリブレーションの問題、環境の変化などがあるが、これらに限定されない。当業者が認識するように、これらのタイプの状況は、測定値の2D配列の1つまたは複数における低周波数の空間パターンとして現れることが多い。一般的な問題として、関連する実験データセットの質が実行アーティファクトによって大幅に低下している場合、実験に関して有効な結論を引き出すことは、はるかにより困難である。したがって、実験データセットの実行アーティファクトを特定して軽減するために、様々な試みが行われてきた。
実行アーティファクトを識別するためのレビューベースのアプローチでは、人間のレビュー担当者がヒートマップを視覚的に分析して、実行アーティファクトを示す測定値の異常なパターンを検出しようとする。そのようなレビューに基づいたアプローチの欠点の1つは、手動式でヒートマップを分析すると時間がかかり、エラーが発生しやすいことである。その結果、ヒートマップに反映された実行上の異常が見落とされたり、誤解されたりする可能性がある。もう1つの欠点は、実行アーティファクトの識別が主観的なプロセスであることである。したがって、同様の視覚パターンを示すヒートマップであっても、特定された実行アーティファクトのタイプ及び/または数は、レビュー担当者によって異なり得る。
空間情報に基づく実行アーティファクトの自動識別
上記の問題に対処するために、計算インスタンス110(1)は、トレーニングアプリケーション120を含むが、これに限定されない。以下に説明するように、トレーニングアプリケーション120は、マイクロウェルプレートに関連付けられた特徴ベクトル138を、マイクロウェルプレートに関連付けられる実行アーティファクトのタイプ及び/または重大度を示す予測ラベル186に自動的にマッピングする、訓練された分類器170を生成する。いくつかの実施形態では、訓練された分類器170は、予測ラベル186が正確である可能性に相関するラベル信頼度188も生成する。
説明のみを目的として、「特徴ベクトル138」は、特定のインスタンスがいずれかの図に示されているかどうかに関係なく、特徴ベクトル138の任意のインスタンスを指す。「予測ラベル186」は、特定のインスタンスがいずれかの図に示されているかどうかに関係なく、予測ラベル186の任意のインスタンスを指す。「ラベル信頼度188」は、特定のインスタンスがいずれかの図に示されているかどうかに関係なく、ラベル信頼度188の任意のインスタンスを指す。
トレーニングアプリケーション120は、計算インスタンス110(1)のメモリ116(1)に存在し、計算インスタンス110(1)のプロセッサ112(1)で実行する。いくつかの実施形態では、トレーニングアプリケーション120は、ラベル付けされていないトレーニングデータセット102に基づいて、訓練された分類器170を生成する。図示のように、ラベル付けされていないトレーニングデータセット102は、ヒートマップセット104(1)~104(H)を含むが、これに限定されず、それにおいてHは任意の正の整数であり得る。ヒートマップセット104(1)~104(H)のそれぞれは、異なるマイクロウェルプレートに関連付けられ、Hマイクロウェルプレートは、以前に実施された任意の数の実験に関連付けることができる。説明のみを目的として、「ヒートマップセット104」は、ヒートマップセット104(ヒートマップセット104(1)~104(H)のそれぞれを含む)のいずれかのインスタンスを、特定のインスタンスがいずれかの図に示されているかどうかに関係なく、指している。
ヒートマップセット104は、非限定的に、F個のヒートマップ(図1には図示せず)を含み、それにおいてFは1以上の整数である。各ヒートマップは、測定値の2D配列または測定値の2D配列の視覚的表現であり、各測定値は関連するマイクロウェルプレートに含まれる異なるウェルに対応する。本明細書で言及される場合、「測定値」は、任意の関連するマイクロウェルプレートで実行される測定の数値及び/またはタイプに基づいて、導き出すことができる。一般に、ヒートマップに含まれる測定値の空間的な位置は、関連するマイクロウェルプレートに含まれるウェルの2Dグリッド内の対応するウェルの空間的な位置に相関する。いくつかの実施形態では、各ヒートマップは、任意の技術的に実現可能な方法において、いずれかの値の数及び/またはタイプを明示することができる。
いくつかの実施形態では、各ヒートマップは測定値配列に置き換えられ、ヒートマップセット104は測定値配列のセットに置き換えられる。各測定値配列は、任意の数の測定値を含むが、これに限定されない。所与の測定値配列に含まれる各測定値について、測定値配列は、任意の技術的に実現可能な方法で、関連するマイクロウェルプレートの対応するウェルを示す。いくつかの他の実施形態では、ヒートマップセット104は、任意の数の測定値に置き換えられ、測定値のそれぞれについて、測定値のタイプ及び関連するマイクロウェルプレートの対応するウェルが、任意の技術的に実現可能な方法で示される。本明細書に記載の技術は、適宜修正される。
実行アーティファクトの周知であるタイプの1つは、マイクロウェルプレートの周囲にあるウェルに関連する「エッジアーティファクト」である。マイクロウェルプレートの周囲に配置されたウェル内で実施されたいずれかの試験の結果は、通常、物理的及び環境的変動(蒸発など)によって損なわれる。このため、いくつかの実施形態では、試験はマイクロウェルプレートの外周にあるウェルの中では実施されない。したがって、マイクロウェルプレートに含まれるウェルの2Dグリッドのサイズは、関連するヒートマップのサイズよりも大きくなる。例えば、いくつかの実施形態では、各マイクロウェルプレートは、非限定的に、32×48グリッドのウェルを含み、ヒートマップのそれぞれは、30×46という配列の測定値である。
ヒートマップセット104に含まれる各ヒートマップは、関連するマイクロウェルプレートで実行される異なるタイプの測定に対応する。例えば、いくつかの実施形態では、各ヒートマップセット104は、細胞数に対応するヒートマップと、6つの異なる画像化チャネルに対応する6つのヒートマップとを含むが、これらに限定されない。各ヒートマップは、任意の技術的に実現可能な方法で生成できる。例えば、いくつかの実施形態では、画像化チャネルに対応するヒートマップは、画像化チャネルに関連する蛍光色素を介して励起されたときの各ウェルの平均強度を特定する。
トレーニングアプリケーション120は、任意の技術的に実現可能な方法で、ラベル付けされていないトレーニングデータセット102を取得する。例えば、また非限定的に、トレーニングアプリケーション120は、ラベル付けされていないトレーニングデータセット102をメモリ116から読み取る、ラベル付けされていないトレーニングデータセット102を入力として受け取る、などを行うことができる。いくつかの実施形態では、トレーニングアプリケーション120は、非限定的に、ラベル付けされていないトレーニングデータセット102に、任意の数(ゼロを含む)及び/またはタイプの前処理操作を行う。前処理操作のタイプのいくつかの例には、未定義の測定値の補間、極端な測定値のクリッピング、及びヒートマップセット104(1)~104(H)の中及び/または全体の正規化が、非限定的に含まれる。
示されるように、トレーニングアプリケーション120は、非限定的に、特徴エンジン130(1)~130(H)(Hは、ラベル付けされていないトレーニングデータセット102に含まれるヒートマップセット104の総数である)、クラスタリングエンジン140、ラベル付けエンジン150、及びトレーニングエンジン160を含む。特徴エンジン130(1)~130(H)は、単一の特徴エンジン130(明示的には示されていない)の異なるインスタンスである。説明のみを目的として、本明細書で使用される「特徴エンジン130」は、特定のインスタンスがいずれかの図に示されているかどうかに関係なく、特徴エンジン130の任意のインスタンスを指す。
図示のように、トレーニングアプリケーション120は、ヒートマップセット104(1)~104(H)を特徴エンジン130(1)~130(H)にそれぞれ入力する。これに応答して、特徴エンジン130(1)~130(H)は、特徴ベクトル138(1)~138(H)をそれぞれ出力する。いくつかの実施形態では、トレーニングアプリケーション120は、特徴エンジン130のH個未満のインスタンスを含み、トレーニングアプリケーション120は、ヒートマップセット104(1)~104(H)を特徴エンジン130の任意の数のインスタンスに順次、同時に、またはそれらを任意に組み合わせて入力する。例えば、いくつかの実施形態では、トレーニングアプリケーション120は、ヒートマップセット104(1)~104(H)を特徴エンジン130の単一のインスタンスに順次入力する。それに応答して、特徴エンジン130の単一のインスタンスは、特徴ベクトル138(1)~138(H)を順次出力する。
特徴ベクトル138(1)~138(H)は、非限定的に、それぞれ、ヒートマップセット104(1)~104(H)に関連する空間パターンに関連する任意の量及び/またはタイプの情報を明示する。したがって、特徴ベクトル138(1)~138(H)はそれぞれ、非限定的に、異なるマイクロウェルプレートに関連する空間パターンを表す。いくつかの実施形態では、特徴ベクトル138(1)~138(H)のそれぞれは、非限定的に、任意の数の空間的特徴及び/または任意の数の他のタイプの機能を、任意の組み合わせで含む。
特徴エンジン130は、ヒートマップセット104に関連付けられた特徴ベクトル138を生成するために、ヒートマップセット104に対して任意の数及び/またはタイプの操作を実行することができる。いくつかの実施形態では、図2に関連して以下でより詳細に説明するように、特徴エンジン130は、ヒートマップセット104に含まれるヒートマップのそれぞれにウェーブレット変換を適用して、マルチレベルウェーブレット分解を生成する。次いで、特徴エンジン130は、マルチレベルウェーブレット分解の2つの最低レベルから特徴を抽出し、抽出された特徴を連結して特徴ベクトル138を生成する。
当業者が認識するように、ウェーブレット変換はヒートマップの特定の部分にわたって局所空間情報を抽出し、マルチレベルウェーブレット分解の2つの最低レベルは低周波空間パターンを表す。さらに、本明細書で前述したように、実験に関連する環境の変化は、1つまたは複数のヒートマップにおける低周波の空間パターンとして現れることがよくある。したがって、ウェーブレット変換に基づいて生成される特徴ベクトル138は、対応するマイクロウェルプレートに関連する実行アーティファクトのタイプ及び重大度に相関する。
図示のように、クラスタリングエンジン140は、特徴ベクトル138(1)~138(H)に基づいてクラスタセット148を生成する。クラスタセット148は、非限定的に、任意の数及び/またはタイプのクラスタ(図1には示されていない)を含む。特徴ベクトル138(1)~138(H)は、特徴ベクトル138(1)~133(H)間の類似性に基づいてクラスタ間に分配される。各クラスタは、非限定的に、他のクラスタに含まれる特徴ベクトル138よりも互いに類似している1つまたは複数の特徴ベクトル138を明示する。各クラスタは、クラスタに含まれる特徴ベクトル138が導出されたマイクロウェルプレートに関連付けられる。クラスタリングエンジン140は、クラスタセット148を生成するために、任意の技術的に実現可能な方法で、特徴ベクトル138(1)~138(H)に基づいた任意の数及び/またはタイプのクラスタリングアルゴリズムを実行することができる。
いくつかの実施形態では、クラスタリングエンジン140は、特徴ベクトル138(1)~138(H)及び経験的に判定されたクラスタの総数に基づいて凝集クラスタリングアルゴリズムを実行する。いくつかの実施形態では、クラスタリングエンジン140は、特徴ベクトル138(1)~138(H)及び距離の閾値に基づいて凝集クラスタリングアルゴリズムを実行する。いくつかの他の実施形態では、クラスタリングエンジン140は、重心ベースのクラスタリングアルゴリズム(例えば、k平均法アルゴリズム)、密度ベースのクラスタリングアルゴリズム、または分布ベースのクラスタリングアルゴリズムを実行する。
ラベル付けエンジン150は、クラスタセット148及びラベル付けされていないトレーニングデータセット102に基づいて、ラベルデータセット156及びラベル付けされたトレーニングデータセット158を生成する。図3に関連してより詳細に説明するように、いくつかの実施形態では、クラスタセット148に含まれるクラスタのそれぞれについて、ラベルデータセット156は、ラベル付けされたクラスタを非限定的に含む。ラベル付けされた各クラスタには、クラスタ、クラスタラベル、及び任意選択で平均ヒートマップセットが、非限定的に含まれる。クラスタラベルは、クラスタを一意に識別するラベルを明示する。ラベル付けエンジン150は、任意の技術的に実行可能な方法でクラスタラベルを判定することができる。例えば、いくつかの実施形態では、ラベル付けエンジン150は、最初のクラスタラベルをデフォルトの整数(例えば1)に設定し、その後、後続のクラスタラベルごとに整数を増大させる。
図3に関連してより詳細に説明するように、クラスタの平均ヒートマップセットは、クラスタの全体的な表現であり、Fの平均ヒートマップを含むが、これらに限定されず、それにおいてFは、ヒートマップセット104(1)~104(H)の各々に含まれるヒートマップの数である。ラベル付けエンジン150は、任意の技術的に実現可能な方法で、クラスタの平均ヒートマップセットを計算することができる。例えば、いくつかの実施形態では、ラベル付けエンジン150は、クラスタに割り当てられたヒートマップセット104に含まれる対応するヒートマップのトリミングされた平均に等しいクラスタの平均ヒートマップのそれぞれを設定する。いくつかの実施形態では、平均ヒートマップは、平均測定値配列に置き換えられる。
いくつかの実施形態では、ラベル付けエンジン150は、ラベルデータセット156に基づいて、ラベル付けされたトレーニングデータセット158を生成する。ラベル付けされたトレーニングデータセット158は、特徴ベクトル138(1)~138(H)と、特徴ベクトル138(1)~138(H)のそれぞれについてのラベル(図示せず)とを含むが、これらに限定されない。所与の特徴ベクトル138のラベルは、特徴ベクトル138を含むクラスタのクラスタラベルである。
いくつかの実施形態では、破線の矢印で示されるように、ラベル付けエンジン150は、表示デバイス108(1)を介してラベルGUI152を表示する。ラベル付けエンジン150は、任意の技術的に実現可能な方法で、任意の量及び/またはタイプのデータを表示するための任意のタイプの表示を、ラベルGUI152を介して生成することができる。いくつかの実施形態では、ラベル付けエンジン150は、ラベルGUI152を介して、ラベルデータセット156、ラベル付けされたトレーニングデータセット158及び/またはラベル付けされていないトレーニングデータセット102の任意の部分(一部または全部を含む)を、任意の組み合わせで任意の時点表示することができる。例えば、いくつかの実施形態では、ラベル付けエンジン150は、ラベル付けされたトレーニングデータセット158を生成する前に、クラスタセット148、任意の数のヒートマップセット104(1)~104(H)、及び/または任意の数のクラスタに対する平均ヒートマップセットの視覚的表現を表示する。
ラベル付けエンジン150は、任意かの技術的に実現可能な方法で、クラスタセット148の任意のタイプの視覚的表現を生成することができる。いくつかの実施形態では、ラベル付けエンジン150は、特徴ベクトル138(1)~138(H)に基づいてt分布確率的近傍埋め込み(「t-SNE」)アルゴリズムを実行して、変換された出力を生成する。次いで、ラベル付けエンジン150は、変換された出力の散布図を表示し、特徴ベクトル138(1)~138(H)を表す点は、関連するクラスタラベルに基づいて着色される。
いくつかの実施形態では、ラベル付けエンジン150は、ラベルGUI152を介して受け取った入力に基づいて、ラベルデータセット156を修正する。ラベル付けエンジン150がラベルデータセット156に対して行うことができる修正のいくつかの例には、同じタイプの実行アーティファクトを表すクラスタをマージすること、クラスタ間でヒートマップセット104(及び関連するマイクロウェルプレート)を再分配すること、クラスタレベルを修正することなどが、非限定的に含まれる。特に、クラスタラベルを更新して、空間パターンのタイプ、実行アーティファクトのタイプ、実行アーティファクトの重大度などを識別することができる。クラスタリングエンジン140がラベルデータセット156を修正した後、ラベル付けエンジン150はラベル付けされたトレーニングデータセット158を修正及び/または再生成して、ラベルデータセット156へ修正を反映させる。
同じまたは他の実施形態では、ラベル付けエンジン150は、クラスタリングエンジン140に、技術的に実現可能な方法で、任意の数及び/またはタイプの基準に基づいて、クラスタセット148を反復的に修正させることができる。例えば、いくつかの実施形態では、ラベル付けエンジン150は、クラスタリングエンジン140に、ユーザのフィードバックに基づいて、クラスタリングアルゴリズムに関連するパラメータ(例えば、クラスタの総数、距離の閾値など)を修正させることができる。クラスタリングエンジン140がクラスタセット148を再生成した後、ラベル付けエンジン150は、ラベルデータセット156及び/またはラベル付けされたトレーニングデータセット158を修正及び/または再生成する。
いくつかの実施形態では、ラベルデータセット156は、非限定的に、クラスタ、クラスタラベル、及び平均ヒートマップセットの代わりに、またはこれらに加えて、訓練された分類器170を介して識別された、ラベル付けされていないトレーニングデータセット102、クラスタセット148、ラベル付けされたトレーニングデータセット158、及び/または実行アーティファクトに関連する任意の量の情報を含み得る。同じまたは他の実施形態では、ラベル付けエンジン150は、ラベルGUI152を介して、ラベル付けされていないトレーニングデータセット102、クラスタセット148、及び/またはいずれかの技術的に実現可能な方法でラベル付けされたトレーニングデータセット158から得られた任意の量の情報を表示する。
示されるように、トレーニングエンジン160は、ラベル付けされたトレーニングデータセット158に基づいて、訓練された分類器170を生成する。より正確には、トレーニングエンジン160は、異なる特徴ベクトル138を異なる予測ラベル186にマッピングするように分類子をトレーニングし、それにおいて予測ラベル186のそれぞれは、ラベルデータセット156に含まれるクラスタラベルの1つに等しくなる。いくつかの実施形態では、トレーニングエンジン160はまた、予測ラベル186のそれぞれについてラベル信頼度188を計算するように分類子をトレーニングし、ラベル信頼度188は、予測ラベル186が正確である可能性と相関する。
当業者が認識するように、クラスタリングアルゴリズムの結果に基づいて分類子をトレーニングするプロセスは「帰納的クラスタリング」と呼ばれ、任意の量及びタイプの関連付けられる動作は、本明細書では「帰納的クラスタリング動作」と呼ばれる。トレーニングエンジン160は、ラベル付けされたトレーニングデータセット158に基づいて、任意のタイプの訓練された分類器170を生成するための任意の数及び/またはタイプの教師付き機械学習アルゴリズムを実行することができる。いくつかの実施形態では、訓練された分類器170は、トレーニングされたランダムフォレスト、トレーニングされたニューラルネットワーク、トレーニングされた判定木、トレーニングされたサポートベクターマシン、または他のいずれかの技術的に実行可能な訓練された機械学習モデルである。
いくつかの実施形態では、トレーニングアプリケーション120は、任意の数及び/またはタイプの教師なし機械学習操作、教師付き機械学習操作、半教師付き機械学習操作、及び/または強化学習操作をいずれかの組み合わせで実行して、入力された特徴ベクトル138を予測ラベル186に一緒にマッピングする、任意の数及び/またはタイプのトレーニングされたモデルを生成することができる。例えば、いくつかの実施形態では、ラベル付けされていないトレーニングデータセット102は、手動式にラベル付けされたトレーニングデータセットに置き換えられ、クラスタリングエンジン140及びラベル付けエンジン150はシステム100から省かれる。
好都合なことに、ラベルデータセット156に含まれるクラスタラベルのそれぞれは、任意の数(0を含む)及び/またはタイプの実行上の異常に関連付けられ、予測ラベル186の各々は、実行上の異常に対して、関連付けられる特徴ベクトル138を分類する。したがって、訓練された分類器170は、クラスタセット148に関連付けられる任意の数及び/またはタイプの実行上の異常に対し、入力された特徴ベクトル138に関連付けられるマイクロウェルプレートを自動的に分類する。
いくつかの実施形態では、ヒートマップセット104に関連付けられた特徴ベクトル138は、実行アーティファクトの識別に関連するヒートマップセット104に関連する任意の量及びタイプの空間的な情報をそれぞれが表す、任意の数及び/またはタイプの特徴のセットに、置き換えることができる。トレーニングエンジン160は、特徴ベクトル138の代わりに特徴のセットを非限定的に含むラベル付けされたトレーニングデータセット158に基づいて、訓練された分類器170を生成する。
いくつかの実施形態では、トレーニングアプリケーション120は、訓練された分類器170、ラベルデータセット156、及び任意選択で、ラベル付けされていないトレーニングデータセット102を実験分析アプリケーション180に送信する。いくつかの実施形態では、トレーニングアプリケーション120は、実験分析アプリケーション180の代わりにまたはそれに加えて、訓練された分類器170、ラベルデータセット156、及びラベル付けされていないトレーニングデータセット102のいずれかを、任意の組み合わせで、任意の数及び/またはタイプのソフトウェアアプリケーションに送信する。同じまたは他の実施形態では、トレーニングアプリケーション120は、訓練された分類器170、ラベルデータセット156、及びラベル付けされていないトレーニングデータセット102のいずれかを、実験分析アプリケーション180及び/または任意の数の他のソフトウェアアプリケーションによってアクセス可能な任意のメモリに任意の組み合わせで格納する。
いくつかの実施形態では、トレーニングアプリケーション120は、ラベルデータセット156に基づいて参照ガイドを生成し、任意選択で、実験分析アプリケーション180及び/または任意の数及び/またはタイプの他のソフトウェアアプリケーションに参照ガイドを提示する。例えば、いくつかの実施形態では、トレーニングアプリケーション120は、ラベルデータセット156に含まれる平均ヒートマップセット及びクラスタラベルに基づいて参照ガイドを生成する。
実験分析アプリケーション180は、訓練された分類器170を使用して、実験データセット106に含まれる実行アーティファクトを検出し、検出された実行アーティファクトの根本原因の分析を促進する。いくつかの実施形態では、実験分析アプリケーション180はまた、ラベルデータセット156、及び任意選択で、ラベル付けされていないトレーニングデータセット102を使用して、検出された実行アーティファクトの根本原因の分析を促進する。説明のみを目的として、トレーニングアプリケーション120と実験分析アプリケーション180の両方に含まれる同様の対象物ごとに、実験分析アプリケーション180に含まれるインスタンスを特定する括弧内の英数字(複数可)にプライムマークが付けられる。さらに、トレーニングアプリケーション120にも含まれる実験分析アプリケーション180に含まれる各対象物の機能は、トレーニングアプリケーション120のコンテキストで対象物について説明された機能と同じである。
実験データセット106は、マイクロウェルプレートのセットを介して行われる単一の実験の結果を表す。実験データセット106は、ヒートマップセット104(1’)~104(E’)を含むが、これに限定されず、Eは任意の正の整数であり得る。ヒートマップセット104(1’)~104(E’)のそれぞれは、実験に関連する異なるマイクロウェルプレートを表す。斜体で示されているように、ヒートマップセット104(1’)~104(E’)は、それぞれ1~Eで示されるマイクロウェルプレートに関連付けられている。本明細書で前述したように、ヒートマップセット104は、非限定的に、F個のヒートマップ(図1には図示せず)を含み、それにおいてFは1以上の整数である。
説明のみを目的として、実験分析アプリケーション180は、単一の実験データセット106の文脈で本明細書に記載されている。いくつかの実施形態では、実験分析アプリケーション180の任意の数(1つを含む)のインスタンスが、任意の数の実験データセット106に含まれる実行アーティファクトを、順次、同時に、またはそれらの任意の組み合わせで検出する。
実験分析アプリケーション180は、計算インスタンス110(2)のメモリ116(2)に存在し、計算インスタンス110(2)のプロセッサ112(2)で実行する。いくつかの実施形態では、実験分析アプリケーション180の任意の数のインスタンスが、任意の数の計算インスタンス110のメモリ116に存在し、計算インスタンス110のプロセッサで実行することができる。示されるように、実験分析アプリケーション180は、入力エンジン182、特徴エンジン130(0’)~130(E’)、訓練された分類器170(0’)~170(E’)、及び出力エンジン190を含むが、それらに限定されない。
入力エンジン182は、いずれかの技術的に実現可能な方法で、実験データセット106を取得する。いくつかの実施形態では、入力エンジン182は、非限定的に、任意の数(ゼロを含む)及び/またはタイプの実験データセット106に対する前処理操作を実行する。入力エンジン182が実行できる前処理操作のタイプのいくつかの例は、未定義の測定値の補間、極端な測定値のクリッピング、及びヒートマップセット104(1’)~104(E’)内及び/または全体の正規化を含み得るが、これらに限定されない。
実験データセット106を取得し、任意選択で前処理した後、入力エンジン182は、ヒートマップセット104(1’)~104(E’)に基づいてヒートマップセット104(0’)を生成する。ヒートマップセット104(0’)は、実験データセット106に関連付けられた、存在しない「平均」のマイクロウェルプレートを表す。入力エンジン182は、いずれかの技術的に実行可能な方法でヒートマップセット104(0’)を生成することができる。例えば、いくつかの実施形態では、入力エンジン182は、ヒートマップセット104(0’)に含まれるF個のヒートマップのそれぞれを、ヒートマップセット104(1’)~104(E’)に含まれる対応するヒートマップの平均に等しく設定する。いくつかの他の実施形態では、入力エンジン182は、ヒートマップセット104(0’)に含まれるF個のヒートマップのそれぞれを、ヒートマップセット104(1’)~104(E’)に含まれる対応するヒートマップのトリミングされた平均に等しく設定する。いくつかの実施形態では、入力エンジン182はヒートマップセット104(0’)を計算せず、本明細書に記載の技術はそれに応じて修正される。
図示のように、実験分析アプリケーション180は、ヒートマップセット104(0’)~104(E’)を特徴エンジン130(0’)~130(E’)にそれぞれ入力する。これに応じて、特徴エンジン130(0’)~130(E)は、特徴ベクトル138(0’)~138(E’)をそれぞれ出力する。いくつかの実施形態では、実験分析アプリケーション180は、特徴エンジン130のE個未満のインスタンスを含み、実験分析アプリケーション180は、ヒートマップセット104(0’)~104(E’)を特徴エンジン130の任意の数のインスタンスに順次、同時に、またはそれらを任意に組み合わせて入力する。
実験分析アプリケーション180は、特徴ベクトル138(0’)~138(E’)を訓練された分類器170(0’)~170(E’)にそれぞれ入力する。これに応答して、訓練された分類器170(0’)~170(E’)は、予測ラベル186(0)~186(E)をそれぞれ出力する。いくつかの実施形態では、訓練された分類器170(0’)~170(E’)はまた、ラベル信頼度188(0)~188(E)をそれぞれ出力する。
いくつかの実施形態では、実験分析アプリケーション180は、訓練された分類器170のE個未満のインスタンスを含み、実験分析アプリケーション180は、ヒートマップセット104(0’)~104(E’)を特徴エンジン130の任意の数のインスタンスに順次、同時に、またはそれらを任意に組み合わせて入力する。同じまたは他の実施形態では、実験分析アプリケーション180は、いずれかの技術的に実行可能な方法で、任意の数の特徴ベクトル138に基づいて、任意の数の予測ラベル186、及び任意選択で任意の数のラベル信頼度188を生成するように、訓練された分類器170を構成することができる。
いくつかの実施形態では、トレーニングアプリケーション120は、訓練された分類器170の代わりに、任意のタイプの訓練された機械学習モデルを生成する。トレーニングアプリケーション120は、いずれかの技術的に実行可能な方法で、ラベル付けされたトレーニングデータセット158に基づいて、訓練された機械学習モデルを生成することができる。続いて、実験分析アプリケーション180は、訓練された機械学習モデルに基づいて、いずれかの技術的に実現可能な方法で、予測ラベル186(0)~186(E)を生成する。例えば、いくつかの実施形態では、実験分析アプリケーション180は、特徴ベクトル138(0’)~138(E’)を、訓練された機械学習モデルの任意の数のインスタンスに入力する。これに応じて、訓練された機械学習モデルのインスタンス(複数可)は、予測ラベル186(0)~186(E)を、また任意選択でラベル信頼度188(0)-188(E)を出力する。
予測ラベル186(0)~188(E)のそれぞれは、クラスタラベルの1つであり、任意の数の他の予測ラベル186とは異なり得る。予測ラベル186(0)は、実験データセット106に関連する実験全体の推定上の分類であり、ラベル信頼度188(0)は、予測ラベル186(0)が実験全体に適用される可能性に相関する。予測ラベル186(1)~186(E)は、それぞれマイクロウェルプレート1~Eの推定上の分類である。ラベル信頼度188(1)~188(E)は、予測ラベル186(1)~186(E)がそれぞれマイクロウェルプレート1~Eに適用される可能性に相関する。
図3に関連してより詳細に説明されるように、出力エンジン190は、予測ラベル186(0)~186(E)、ラベル信頼度188(0)~188(E)、ラベルデータセット156、及び(任意選択で)ラベル付けされていないトレーニングデータセット102に基づいて、実験の概要196とプレートの概要198(1)~198(E)を生成する。実験の概要196は、実行アーティファクトまたはその欠如に関連する、実験全体に関する任意の量の情報を提示する。プレートの概要198(1)~198(E)は、実行アーティファクトまたはその欠如に関連する、マイクロウェルプレート1~Eに関する任意の量の情報をそれぞれ提示する。
いくつかの実施形態では、実験の概要196は、予測ラベル186(0)、ラベル信頼度188(0)、及び整合するプレートの割合(図1には図示せず)を含むが、これらに限定されない。出力エンジン190は、予測ラベル186(0)に等しい予測ラベル186(1)~186(E)のパーセンテージに等しい整合するプレートの割合を設定する。いくつかの実施形態では、整合するプレートの割合は、実験データセット106に関連付けられたマイクロウェルプレートのうち何枚が予測ラベル186(0)にも関連付けられているかを示す、整合するプレート数に置き換えられる。
同じまたは他の実施形態において、1からEの間の整数xに対するプレートの概要198(x)は、予測ラベル186(x)、ラベル信頼度188(x)、及びマイクロウェルプレートxに対する異常スコアを含むが、これらに限定されない。マイクロウェルプレートxの異常スコアは、予測ラベル186(x)に関連付けられたクラスタに対して、マイクロウェルプレートxがどの程度離れているかを示す。出力エンジン190は、いずれかの技術的に実行可能な方法で異常スコアを計算することができる。
例えば、いくつかの実施形態では、出力エンジン190は、特徴エンジン130を使用して、予測ラベル186(x)に関連付けられたクラスタの平均ヒートマップセットに関連付けられた特徴ベクトル138を計算する。次に、出力エンジン190は、特徴ベクトル138(x’)と、平均ヒートマップセットに関連付けられた特徴ベクトル138との間の非類似度を計算する。いくつかの実施形態では、異常スコアは、予測ラベル186(x)に関連付けられたクラスタに関してマイクロウェルプレートxがどの程度類似しているかを示す、マイクロウェルプレートxの類似性スコアに置き換えられる。
一部の実施形態では、破線の矢印で示されるように、出力エンジン190は、表示デバイス108(2)を介して分析GUI192を表示する。出力エンジン190は、いずれかの技術的に実現可能な方法で、任意の量及び/またはタイプのデータを表示するための任意のタイプの表示を、解析GUI192を介して生成することができる。いくつかの実施形態では、出力エンジン190は、解析GUI192を介して、実験の概要196、プレートの概要198(1)~198(E)、ラベルデータセット156、及び/またはラベル付けされていないトレーニングデータセット102を任意の組み合わせで任意の時点で使用できる。例えば、出力エンジン190は、解析GUI192を介して、予測ラベル186(1)~186(E’)がヒートマップセット104(1’)~104(E’)にそれぞれ割り当てられることを示すことができる。いくつかの実施形態では、出力エンジン190は、クラスタセット148、任意の数のヒートマップセット104(1)~104(H)、及び/またはいずれかの技術的に実現可能な方法で任意の数のクラスタのための平均ヒートマップセットの視覚的表現を表示する。
いくつかの実施形態では、出力エンジン190は、トレーニングアプリケーション120に、解析GUI192を介して受け取った入力に基づいて、クラスタセット148、ラベルデータセット156、ラベル付けされたトレーニングデータセット158、及び/または訓練された分類器170を、反復的に修正及び/または再生成させる。出力エンジン190が、分析GUI192を介して受け取った入力に基づいてトレーニングアプリケーション120に実施させることができる修正のいくつかの例は、非限定的に、クラスタをマージすること、クラスタ間でヒートマップセット(及び関連するマイクロウェルプレート)を再分配すること、クラスタラベルを修正すること、などを含む。
有利なことに、訓練された分類器170は、ヒートマップセット104(1’)~104(E’)を自動的かつ客観的に分類するので、訓練された分類器170を使用して、実験データセット106に関連する実験における実行アーティファクトを、効率的かつ正確に識別することができる。さらに、異常スコアは、各マイクロウェルプレートが重大な実行アーティファクトがないクラスタに属しているか、既知の実行アーティファクトがあるマイクロウェルプレートのクラスタに属しているか、新しいタイプの実行アーティファクトまたはその他の異常に関連付けられているかについての洞察を提示する。したがって、異常スコアは根本原因の分析を促進する。
さらに、実験の概要196及びプレートの概要198(1)~198(E)は、実行の異常に関する客観的な情報を提示するので、実験の概要196及びプレートの概要198(1)~198(E)は、実行の異常に関連する傾向を経時的に、また実験全体で効率的に検出するべく使用することができる。検出された傾向に基づいて、ユーザは、将来の実験データセット106に含まれる実行上の異常の数を減らすために、実験のプロセス及び/または装置に修正を加えることができる。
本明細書で説明する技術は、限定的ではなく例示的であり、本発明のより広い精神及び範囲から逸脱することなく変更できることに留意されたい。記載された実施形態の範囲及び精神から逸脱することのない、トレーニングアプリケーション120、特徴エンジン130、クラスタリングエンジン140、ラベル付けエンジン150、訓練された分類器170、実験分析アプリケーション180、入力エンジン182、及び出力エンジン190によって得られる機能の多くの修正及び変形は、当業者にとって明白である。
本明細書に示されるシステム100は例示であり、変形及び修正が可能であることが理解されよう。例えば、いくつかの実施形態では、本明細書に記載のラベル付けエンジン150によって得られる機能は、クラスタリングエンジン140に統合される。同じまたは他の実施形態において、トレーニングアプリケーション120によって得られる機能及び実験分析アプリケーション180によって得られる機能は、単一のアプリケーションに統合される。さらに、図1の様々な構成要素の間の接続トポロジーは、必要に応じて修正することができる。
図2は、様々な実施形態による、図1の特徴エンジン130のより詳細な図である。示されるように、特徴エンジン130は、ヒートマップセット104に基づいて特徴ベクトル138を生成する。説明のみを目的として、ヒートマップセット104は、30×46の使用されるウェルを有するマイクロウェルプレートの7つの異なるタイプの測定に関連する測定値を反映している。その結果、ヒートマップセット104は、非限定的に、合計9660個の測定値(図示せず)を含む。
示されるように、ヒートマップセット104は、非限定的に、ヒートマップ210(0)~210(6)を含む。説明のみを目的とし、斜体で示されているように、ヒートマップ210(0)は、1380個の使用されるウェルの細胞数を特定する1380個の測定値を非限定的に含む2D配列である。ヒートマップ210(1)~210(6)のそれぞれは、異なる画像化チャネルの1380の使用されるウェルの強度を特定する1380の測定値を、非限定的に含む2D配列である。他の実施形態では、ヒートマップセット104は、非限定的に、任意の数のヒートマップ210を含むことができ、ヒートマップ210のそれぞれは、任意のタイプの測定に対応することができる。
特徴エンジン130は、空間情報エクストラクタ220(0)~220(6)及び集約エンジン280を非限定的に含む。空間情報エクストラクタ220(0)~220(6)は、それぞれヒートマップ210(0)~210(6)に基づいて、空間的特徴セット270(0)~270(6)をそれぞれ生成する。いくつかの実施形態では、特徴エンジン130は、空間情報エクストラクタ220の任意の数のインスタンスを含むことができ、空間情報エクストラクタ220のインスタンスは、ヒートマップ210(0)~210(6)にそれぞれ基づいて、同時に、順次、またはそれらの任意の組み合わせで、空間的特徴セット270(0)~270(6)を生成することができる。同じまたは他の実施形態では、空間的特徴セット270(0)~270(H)のそれぞれは、非限定的に、任意の数の空間的特徴及び/または任意の数の他のタイプの特徴を、任意の組み合わせで含む。空間的特徴セット270(0)~270(6)のそれぞれはまた、本明細書では「空間的特徴のセット」とも呼ばれる。
示されるように、空間情報エクストラクタ220(0)は、非限定的に、プリプロセッサ230(0)、ウェーブレット変換240(0)、マルチレベルウェーブレット分解250(0)、及び特徴エクストラクタ260(0)を含む。一般に、空間情報エクストラクタ220(y)は、0から6までの整数yに対して、非限定的に、プリプロセッサ230(y)、ウェーブレット変換240(y)、マルチレベルウェーブレット分解250(y)、及び特徴エクストラクタ260(y)を含む。プリプロセッサ230は、プリプロセッサ230が任意選択であることを示すために破線のボックスを使用して示されている。
プリプロセッサ230(y)は、ヒートマップ210(y)の任意の数及び/またはタイプの前処理操作を実行する。プリプロセッサ230(y)が実行できる前処理操作のタイプのいくつかの例には、未定義の測定値の補間、極端な測定値のクリッピング、及びヒートマップ210(y)内での正規化を非限定的に含む。いくつかの実施形態では、プリプロセッサ230(y)は、空間情報エクストラクタ220(y)から省かれる。同じまたは他の実施形態では、特徴エンジン130、トレーニングアプリケーション120、及び/または入力エンジン182は、ヒートマップセット104での任意の数及び/またはタイプの処理操作を実行できる。
プリプロセッサ230(y)がヒートマップ210(y)の前処理をした後、空間情報エクストラクタ220(y)はウェーブレット変換240(y)をヒートマップ210(y)に適用して、マルチレベルウェーブレット分解250(y)を生成する。空間情報エクストラクタ220(y)は、任意の技術的に実現可能な方法で、任意のタイプのウェーブレット変換240(y)をヒートマップ210(y)に適用することができる。例えば、いくつかの実施形態では、空間情報エクストラクタ220(y)は、ウェーブレット変換モジュールに含まれる2D離散ウェーブレット変換関数への関数の呼び出しを実行する。関数の呼び出しを介して、空間情報エクストラクタ220(y)は、カスケードフィルタバンクアルゴリズムを使用してハーウェーブレット変換を計算する前に、リフレクトパディングを使用してヒートマップ210(y)を外挿するように2D離散ウェーブレット変換関数を構成する。関数の呼び出しは、近似、水平の詳細、垂直の詳細、及び対角の詳細な係数を含むがこれらに限定されないマルチレベルウェーブレット分解250(y)を返す。
特徴エクストラクタ260(y)は、マルチレベルウェーブレット分解250(y)に基づいて空間的特徴セット270(y)を生成する。特徴エクストラクタ260(y)は、いずれかの技術的に実行可能な方法で、空間的特徴セット270(y)を生成することができる。いくつかの実施形態では、特徴エクストラクタ260(y)は、マルチレベルウェーブレット分解250から任意の数及び/またはタイプの特徴を抽出し、次いで抽出された特徴に対して任意の数及び/またはタイプの後処理操作を実行して、空間的特徴セット270(y)を生成する。
例えば、いくつかの実施形態では、特徴エクストラクタ260(y)は、マルチレベルウェーブレット分解250(y)の2つの最低レベルから特徴を抽出し、空間的特徴セット270(y)を生成する。いくつかの実施形態では、特徴エクストラクタ260(y)は、マルチレベルウェーブレット分解250(y)の2つの最低レベルから特徴を抽出し、次いで抽出された特徴のそれぞれを正規化して、空間的特徴セット270(y)を生成する。他の実施形態では、特徴エクストラクタ260(y)は、マルチレベルウェーブレット分解250(y)の3つの最低レベルから特徴のセットを抽出し、主成分分析を使用して特徴のセットを圧縮し、得られた圧縮された特徴のセットに等しい空間的特徴セット270(y)を設定する。特徴のセットは、本明細書では「特徴セット」とも呼ばれる。
図示のように、集約エンジン280は、空間的特徴セット270(0)~270(6)に基づいて特徴ベクトル138を生成する。集約エンジン280は、いずれかの技術的に実現可能な方法で、特徴ベクトル138を生成することができる。例えば、いくつかの実施形態では、集約エンジン280は、空間的特徴セット270(0)~270(6)を連結して、特徴ベクトル138を生成する。特徴ベクトル138は、本明細書では「特徴のセット」とも呼ばれる。
実行アーティファクトの根本原因分析の促進
図3は、様々な実施形態による、図1の出力エンジン190のより詳細な図である。図示のように、出力エンジン190は、非限定的に、実験の概要196及びプレートの概要198(1)~198(E)を含み、Eは任意の正の整数であり得る。出力エンジン190は、予測ラベル186(0)~186(E)、ラベル信頼度188(0)~188(E)、ラベルデータセット156、及び(任意選択で)ラベル付けされていないトレーニングデータセット102に基づいて、実験の概要196とプレートの概要198(1)~198(E)を生成する。
ラベルデータセット156は、非限定的に、ラベル付けされたクラスタ340(1)~340(C)を含み、Cは任意の正の整数であり得る。示されるように、ラベル付きクラスタ340(C)は、非限定的に、クラスタ330(C)、クラスタラベル342(C)、及び平均ヒートマップセット344(C)を含む。より一般的には、zが1からCまでの整数であるラベル付きクラスタ340(z)は、非限定的に、クラスタ330(z)、クラスタラベル342(z)、及び平均ヒートマップセット344(z)を含む。クラスタ330(z)は、いずれかの技術的に実現可能な方法でクラスタ330(z)に割り当てられる特徴ベクトル138を明示する。斜体で示すように、いくつかの実施形態では、クラスタ330(z)は、クラスタ330(z)に割り当てられた特徴ベクトル138のリストを明示する。説明のみを目的として、クラスタ330(1)~330(C)は、本明細書では個別に「クラスタ330」、また集合的に「クラスタ330」とも呼ばれる。また、クラスタラベル342(1)~342(C)は、本明細書では個別に「クラスタラベル342」、また集合的に「クラスタラベル342」とも呼ばれる。
図1に関連して本明細書で前述したように、予測ラベル186(0)及びラベル信頼度188(0)は、マイクロウェルプレート1~Eを介して行われる実験に関連する、存在しない平均マイクロウェルプレートに関連する。予測ラベル186(1)~186(E)及びラベル信頼度188(1)~188(E)は、それぞれマイクロウェルプレート1~Eに関連付けられている。予測ラベル186(0)~186(E)のそれぞれは、クラスタラベル342(1)~342(C)の1つと等しく、任意の数の他の予測ラベル186とは異なり得る。
図示されているように、いくつかの実施形態では、実験の概要196は、予測ラベル186(0)、ラベル信頼度188(0)、及び整合するプレートの割合310を含むが、これらに限定されない。出力エンジン190は、いずれかの技術的に実行可能な方法で整合するプレートの割合310を計算することができる。例えば、いくつかの実施形態では、出力エンジン190は、予測ラベル186(0)に等しい予測ラベル186(1)~186(E)のパーセンテージに等しい整合するプレートの割合を設定する。
1からEの整数xに対するプレートの概要198(x)は、予測ラベル186(x)、ラベル信頼度188(x)、及び異常スコア320(x)を含むが、これらに限定されない。異常スコア320(x)は、予測ラベル186(x)に関連付けられたクラスタ330に対して、マイクロウェルプレートxがどの程度離れているかを示す。出力エンジン190は、いずれかの技術的に実行可能な方法で異常スコア320(x)を計算することができる。
説明のみを目的として、いくつかの実施形態では、予測ラベル186(1)は、クラスタラベル342(C)「行の不履行」に等しく、出力エンジン190は、異常スコア320(x)を、特徴ベクトル138(x)と、平均ヒートマップセット344(C)に関連する特徴ベクトル138との間の非類似度に等しく設定する。出力エンジン190は、平均ヒートマップセット344(C)に関連付けられた特徴ベクトル138、及び特徴ベクトル138(x)と、平均ヒートマップセット344(C)に関連付けられた特徴ベクトル138との間の非類似度を、任意の技術的に実現可能な方法で計算することができる。
示されるように、いくつかの実施形態では、出力エンジン190は、分析GUI192を生成して表示する。説明のみを目的として、分析GUI192は、例示的なユーザの入力に基づく特定の時点で示されている。示されるように、分析GUI192は、非限定的に、マイクロウェルプレートのいずれも選択しないように構成されたプレートスライダ370と、クラスタラベル342(C)の行の不履行に関連付けられたラベル付きクラスタ340(C)を選択するように構成されたクラスタスライダ380、及びクラスタ表示ペイン390を含む。
クラスタスライダ380は、ラベル付きクラスタ340(C)を選択するように構成されているので、出力エンジン190は、ラベル付きクラスタ340(C)に関連する情報をクラスタ表示ペイン390に集める。示されるように、出力エンジン190は、平均ヒートマップセット344(C)を表示し、実験データセット106に関連付けられた実験に含まれるマイクロウェルプレートのサブセットが、行の不履行のクラスタラベル342(C)を有するクラスタ330(C)に割り当てられることを明示する。より具体的には、出力エンジン190は、マイクロウェルプレート1、3、45~52、及び58を含むマイクロウェルプレートのサブセットがクラスタラベル342(C)及び平均ヒートマップセット344(C)に関連付けられることを特定する。
図3に示すように、平均ヒートマップセット344(C)は、トレーニングアプリケーション120によってクラスタ330(C)に割り当てられた148のマイクロウェルプレートの画像化チャネル1~6の平均細胞数及び平均強度を視覚的に示すヒートマップ210(0)~210(6)を含む。図3に示される各ヒートマップ210において、下から4行目の測定値は異常に低く、行の不履行に関連する実行アーティファクトである。
クラスタ表示ペイン390に基づいて、マイクロウェルプレート1、3、45~52、及び58に関連する測定値を実験データセット106から除外することができる。さらに、根本原因の分析により、特定のディスペンスノズルが部分的に詰まっていると結論付けることができる。
図4は、様々な実施形態による、マイクロウェルプレートを含む実験において実行アーティファクトを識別するように分類子をトレーニングするための方法ステップの流れ図である。方法ステップは、図1~3のシステムを参照して説明されているが、当業者は、方法ステップを任意の順序で実施するように構成された任意のシステムが、本発明の範囲にあることを理解するであろう。
示されるように、方法400はステップ402を開始し、これにおいて、ラベル付けされていないトレーニングデータセット102に含まれるヒートマップ210のそれぞれについて、空間情報エクストラクタ220が異なる空間的特徴セット270を生成する。ステップ404で、xが1からHの間の整数である、ラベル付けされていないトレーニングデータセット102に含まれる、ヒートマップセット104(x)のそれぞれについて、集約エンジン280は、ヒートマップセット104(x)に関連付けられる空間的特徴セット270に基づいて、関連付けられた特徴ベクトル138(x)を生成する。
ステップ406で、クラスタリングエンジン140は、特徴ベクトル138(1)~138(H)に基づいてクラスタリング操作を実行して、クラスタセット148を生成する。ステップ408で、ラベル付けエンジン150は、クラスタセット148に基づいてラベルデータセット156を生成する。ステップ410で、ラベル付けエンジン150は、ラベルデータセット156に基づいてラベル付けされたトレーニングデータセット158を生成し、任意選択で、ラベルGUI152を表示する。
ステップ412で、ラベル付けエンジン150は、ラベル付けエンジン150がラベルGUI152を介して何らかの入力を受け取ったかどうかを判定する。ステップ412で、ラベル付けエンジン150が、ラベル付けエンジン150がラベルGUI152を介していずれかの入力を受け取っていないと判定した場合、方法400はステップ416に直接進む。
しかし、ステップ412で、ラベル付けエンジン150が、ラベル付けエンジン150がラベルGUI152を介して入力を受け取っていないと判定した場合、方法400はステップ414に直接進む。ステップ414で、ラベル付けエンジン150は、任意の数のクラスタセット148、ラベルデータセット156、及び/またはラベル付きトレーニングデータセット158を、入力に基づく任意の組み合わせで更新する。
ステップ416で、トレーニングエンジン160は、訓練された分類器170を生成するために、ラベル付けされたトレーニングデータセット158に基づいて機械学習操作を実行する。本明細書で言及されるように、機械学習操作は、経験から学習する、及び/またはデータにアクセスし、データを使用して学習することができるソフトウェアによって実行される、及び/またはそれに関連付けられる、任意のタイプの操作であり得る。機械学習操作のいくつかの例は、非限定的に、教師なし機械学習操作、教師あり機械学習操作、半教師あり機械学習操作、及び強化学習操作を含む。
ステップ418で、トレーニングアプリケーション120は、訓練された分類器170及びラベルデータセット156を実験分析アプリケーション180及び/または任意の数の他のソフトウェアアプリケーションに提示する。いくつかの実施形態では、トレーニングアプリケーション120はまた、ラベル付けされていないトレーニングデータセット102を実験分析アプリケーション180及び/または任意の数の他のソフトウェアアプリケーションに提示する。その後、方法400は終了する。
図5は、様々な実施形態による、訓練された分類器を使用するマイクロウェルプレートを含む実験において実行アーティファクトを検出するための方法ステップの流れ図である。方法ステップは、図1~3のシステムを参照して説明されているが、当業者は、方法ステップを任意の順序で実施するように構成された任意のシステムが、本発明の範囲にあることを理解するであろう。
示されるように、方法500はステップ502で始まり、入力エンジン182は、実験データセット106に含まれるヒートマップセット104(1’)~104(E’)に基づいて、実験全体を表すヒートマップセット104(0’)を生成する。ステップ504で、実験データセット106に関連付けられたヒートマップ210のそれぞれについて、空間情報エクストラクタ220は、異なる空間的特徴セット270を生成する。ステップ506で、xが0とEの間の整数である、ヒートマップセット104(x’)のそれぞれについて、集約エンジン280は、ヒートマップセット104(x’)に関連付けられる空間的特徴セット270に基づいて、関連付けられた特徴ベクトル138(x’)を生成する。
ステップ508で、実験分析アプリケーション180は、訓練された分類器170を使用して、xが0からEの間の整数である、特徴ベクトル138(x’)の各々を、予測ラベル186(x)に、任意選択で、ラベル信頼度188(x)にマッピングする。ステップ510で、出力エンジン190は、予測ラベル186(0)~186(E)、及び任意選択で、ラベル信頼度188(0)~188(E)、及び/またはラベルデータセット156に基づいて、実験の概要196とプレートの概要198(1)~198(E)を生成する。ステップ512で、実験分析アプリケーション180は、任意の数の実験の概要196の任意の部分、プレートの概要198(1)~198(E)、及び/またはラベルデータセット156を、任意の数及び/またはタイプのソフトウェアアプリケーションに、いずれかの組み合わせで提示する。その後、方法500は終了する。
要するに、開示された技術を使用して、マイクロウェルプレートを含む実験で実行での異常を正確かつ一貫して検出するように分類子をトレーニングすることができる。いくつかの実施形態では、トレーニングアプリケーションは、ラベル付けされていないトレーニングデータセットに基づいて、訓練された分類器を生成する。ラベル付けされていないトレーニングデータセットには、任意の数のヒートマップセットが含まれるが、これらに限定されず、各ヒートマップセットは、異なるマイクロウェルプレートに関連付けられた測定値を表す。トレーニングアプリケーションには、非限定的に、特徴エンジン、クラスタリングエンジン、ラベリングエンジン、及びトレーニングエンジンが、非限定的に含まれる。トレーニングアプリケーションは、ラベル付けされていないトレーニングデータセットに含まれる各ヒートマップセットの特徴ベクトルを生成するように特徴エンジンを構成する。
特定のヒートマップセットの特徴ベクトルを生成するために、特徴エンジンは、ヒートマップセットに含まれる各ヒートマップに、ウェーブレット変換を適用して、マルチレベルウェーブレット分解を生成する。次に、特徴エンジンは、各マルチレベルウェーブレット分解の2つの最低レベルから特徴を抽出して、空間的特徴セットを生成する。特徴エンジンは、空間的特徴セットを集約して、ヒートマップセットに関連付けられた特徴ベクトルを生成する。
クラスタリングエンジンは、特徴ベクトルに基づいて凝集クラスタリングアルゴリズムを実行し、任意の数の特徴ベクトルのクラスタを含むがこれに限定されないクラスタセットを生成する。ラベル付けエンジンは、クラスタごとにラベル付けされたクラスタを含むラベルデータセットを生成するが、これに限定されない。ラベル付けされた各クラスタには、関連するクラスタ、クラスタラベル、及びクラスタを表す平均ヒートマップセットが、非限定的に含まれる。ラベル付けエンジンは、任意選択でラベルGUIを表示する。ラベル付けエンジンは、ラベルGUIを介して受け取った入力に基づいてラベルデータセットを更新できる。
ラベル付けエンジンは、ラベルデータセットに基づいて、ラベル付けされたトレーニングデータセットを生成する。ラベル付けされたトレーニングデータセットには、各特徴ベクトルと関連するクラスタラベルが、非限定的に含まれる。ラベル付けされたトレーニングデータセットに基づいて、トレーニングエンジンは分類子をトレーニングして、特徴ベクトルを予測ラベル(つまり、クラスタラベルの1つ)及び関連するラベル信頼度にマッピングする。トレーニングアプリケーションは、訓練された分類器と、任意選択でラベルデータセットを実験分析アプリケーション及び/または任意の数の他のソフトウェアアプリケーションに送信する。
いくつかの実施形態では、実験分析アプリケーションは、訓練された分類器及びラベルデータセットを使用して、実験データセットにおける実行の異常を検出及び評価する。実験データセットは、マイクロウェルプレートを使用して実施された実験に関連付けられており、任意の数のヒートマップセットを含むが、これに限定されない。各ヒートマップセットは、異なるマイクロウェルプレートに関連付けられた測定値を表す。実験分析アプリケーションには、入力エンジン、特徴エンジン、訓練された分類器、及び出力エンジンが、非限定的に含まれる。
入力エンジンは、実験データセットに基づいて「平均」ヒートマップセットを生成し、特徴エンジンを使用して平均ヒートマップセットの特徴ベクトルを生成する。また、入力エンジンは特徴エンジンを使用して、実験データセットに含まれる各ヒートマップセットの特徴ベクトルを生成する。実験分析エンジンは、各特徴ベクトルを訓練された分類器に入力して、予測ラベルとラベル信頼度を生成する。その後、出力エンジンは、予測ラベル、ラベルの信頼度、及びラベルデータセットに基づいて、プレートの概要と実験の概要を生成する。
各プレートの概要は、異なるマイクロウェルプレートに関連付けられており、関連付けられた特徴ベクトルの予測ラベル、関連付けられたラベルの信頼度、及び異常スコアが、非限定的に含まれる。異常スコアは、予測ラベルに関連付けられたクラスタに対して、マイクロウェルプレートがどの程度離れているかを示す。実験の概要は、実験全体を表し、平均ヒートマップセットに関連付けられた特徴ベクトルの「平均」予測ラベル、関連付けられたラベルの信頼度、及び整合するプレートの割合が、非限定的に含まれる。整合するプレートの割合は、予測ラベルの平均に等しい予測ラベルを有する実験データセットに関連付けられたマイクロウェルプレートのパーセンテージを明示する。実験分析アプリケーションは、任意の数のソフトウェアアプリケーションを提示し、及び/または分析GUIを介して、任意の数のプレートの概要、実験の概要、及び/またはラベルデータセットの任意の部分を表示する。
先行技術に対する開示された技術の少なくとも1つの技術的利点は、実験分析アプリケーションが訓練された分類器を使用して、マイクロウェルプレートを含む実験における実行アーティファクトを、より正確かつ一貫して分析及び検出できることである。実験分析アプリケーションは、訓練された分類器を使用して、関連付けられたヒートマップの空間パターンに基づいてマイクロウェルプレートを自動的に分類するため、ヒートマップに反映された実行上の異常が見落とされたり誤解されたりする可能性が、従来のアプローチに比べて減少する。さらに、各クラスタの異常スコアと平均ヒートマップセットを計算することで、根本原因の分析と新しいタイプの実行アーティファクトの識別の両方を促進する。先行技術のアプローチとは異なり、訓練された分類器は、客観的かつ一貫して、経時的な実行上の異常及び異なる実験に対してマイクロウェルプレートを分類する。その結果、実行上の異常の傾向を効率的に検出し、実験プロセス及び/または装置を改善するために使用できる。これらの技術的利点により、従来技術のアプローチに対して1つまたは複数の技術的改善が得られる。
1. いくつかの実施形態では、マイクロウェルプレートを伴う実験において実行アーティファクトを検出するためのコンピュータ実装方法は、第1のマイクロウェルプレートに関連付けられた1つまたは複数のヒートマップに基づいて空間的特徴の1つまたは複数のセットを計算すること、第1の特徴ベクトルを生成するために、空間的特徴の1つまたは複数のセットを集約すること、及び前記第1の特徴ベクトルを訓練された分類器に入力することであって、それに応じて、前記第1のマイクロウェルプレートが第1の実行アーティファクトに関連付けられていることを示す第1のラベルを生成する、入力することを含む。
2.前記第1の特徴ベクトル及び前記第1のラベルに関連付けられた特徴ベクトルの第1のクラスタに基づいて、異常スコアを計算することをさらに含む、条項1に記載のコンピュータ実装方法。
3.複数のヒートマップに基づいて、実験に関連する第2の特徴ベクトルを計算することであって、前記複数のヒートマップは、前記第1のマイクロウェルプレートに関連する前記1つまたは複数のヒートマップを含む、前記計算すること、及び前記第2の特徴ベクトルを前記訓練された分類器に入力することであって、それに応じて、前記第1のラベルを含む複数のラベルに関して前記実験を分類する第2のラベルを生成する、前記入力することをさらに含む、条項1または2に記載のコンピュータ実装方法。
4.前記第1のマイクロウェルプレートを含む複数のマイクロウェルプレートに基づいて、実験に関連する第2の特徴ベクトルを計算すること、前記第2の特徴ベクトルを前記訓練された分類器に入力することであって、それに応じて前記第1のラベルを生成する、前記入力すること、及び前記複数のマイクロウェルプレートに含まれるマイクロウェルプレートのうちいくつが前記第1のラベルに関連付けられているかを示すパーセンテージを計算することをさらに含む、条項1~3のいずれかに記載のコンピュータ実装方法。
5.実験に関連付けられたマイクロウェルプレートのサブセットも前記第1のラベルに関連付けられていることを判定することであって、前記マイクロウェルプレートのサブセットは前記第1のマイクロウェルプレートを含む、前記判定すること、及びグラフィカルユーザインターフェース(「GUI」)を介して、前記第1のラベルに関連付けられた平均ヒートマップを表示すること、及び前記マイクロウェルプレートのサブセットが前記平均ヒートマップに関連付けられているという前記GUIを介した表示を生成すること、をさらに含む、条項1~4のいずれかに記載のコンピュータ実装方法。
6.GUIを介した、前記第1のラベルが前記1つまたは複数のヒートマップに関連付けられているという表示を生成することをさらに含む、条項1~5のいずれかに記載のコンピュータ実装方法。
7.前記訓練された分類器が、前記第1のラベルが前記第1のマイクロウェルプレートに適用される可能性を示すラベル信頼度をさらに生成する、条項1~6のいずれかに記載のコンピュータ実装方法。
8.前記1つまたは複数の空間的特徴のセットを計算することが、マルチレベルウェーブレット分解を生成するために、前記1つまたは複数のヒートマップに含まれる第1のヒートマップにウェーブレット変換を適用すること、及び前記マルチレベルウェーブレット分解の少なくとも最低のレベルから第1の空間的特徴のセットを抽出することを含む、条項1~7のいずれかに記載のコンピュータ実装方法。
9.前記1つまたは複数のヒートマップに含まれる第1のヒートマップが複数の強度を明示し、前記複数の強度に含まれる各強度が、前記第1のマイクロウェルプレートに含まれている異なるウェルに関連付けられる、条項1~8のいずれかに記載のコンピュータ実装方法。
10.前記訓練された分類器が、ランダムフォレスト、ニューラルネットワーク、判定木、または1つ以上の誘導クラスタリング操作によってトレーニングされたサポートベクターマシンを含む、条項1~9のいずれかに記載のコンピュータ実装方法。
11.いくつかの実施形態では、1つまたは複数の非一時的コンピュータ可読媒体は、1つまたは複数のプロセッサによって実行されるとき、前記1つまたは複数のプロセッサに、第1のマイクロウェルプレートに関連する1つまたは複数の測定値に基づいて空間的特徴の1つまたは複数のセットを計算するステップ、前記空間的特徴の1つまたは複数のセットに基づいて第1の特徴ベクトルを生成するステップ、及び前記第1の特徴ベクトルを訓練された機械学習モデルに入力するステップであって、それに応じて、前記第1のマイクロウェルプレートが第1の実行アーティファクトに関連付けられることを示す第1のラベルを生成する、前記入力するステップを行うことによって、マイクロウェルプレートを伴う実験で実行アーティファクトを検出させる命令を含む。
12.前記第1の特徴ベクトル及び前記第1のラベルに関連付けられた特徴ベクトルの第1のクラスタに基づいて、異常スコアを計算することをさらに含む、条項11に記載の1つまたは複数の非一時的コンピュータ可読媒体。
13.複数の測定値配列に基づいて、実験に関連する第2の特徴ベクトルを計算することであって、前記複数の測定値配列は、前記第1のマイクロウェルプレートに関連する前記1つまたは複数の測定値配列を含む、前記計算すること、及び前記第2の特徴ベクトルを前記訓練された機械学習モデルに入力することであって、それに応じて、前記第1のラベルを含む複数のラベルに関して前記実験を分類する第2のラベルを生成する、前記入力することをさらに含む、条項11または12に記載の1つまたは複数の非一時的コンピュータ可読媒体。
14.前記第1のマイクロウェルプレートを含む複数のマイクロウェルプレートに基づいて、実験に関連する第2の特徴ベクトルを計算すること、前記第2の特徴ベクトルを前記訓練された機械学習モデルに入力することであって、それに応じて前記第1のラベルを生成する、前記入力すること、及び前記複数のマイクロウェルプレートに含まれるマイクロウェルプレートのうちいくつが前記第1のラベルに関連付けられているかを示すパーセンテージを計算することをさらに含む、条項11~13のいずれかに記載の1つまたは複数の非一時的コンピュータ可読媒体。
15.実験に関連付けられたマイクロウェルプレートのサブセットも前記第1のラベルに関連付けられていることを判定することであって、前記マイクロウェルプレートのサブセットは前記第1のマイクロウェルプレートを含む、前記判定すること、及びグラフィカルユーザインターフェース(「GUI」)を介して、前記第1のラベルに関連付けられた平均測定値配列を表示すること、及び前記マイクロウェルプレートのサブセットが前記平均測定値配列に関連付けられているという前記GUIを介した表示を生成すること、をさらに含む、条項11~14のいずれかに記載の1つまたは複数の非一時的コンピュータ可読媒体。
16.前記マルチレベルウェーブレット分解を生成するために、前記空間的特徴の1つまたは複数のセットを計算することは、前記1つまたは複数の測定値配列に含まれる第1の測定値配列にウェーブレット変換を適用すること、及び前記マルチレベルウェーブレット分解の少なくとも最低のレベルから第1の空間的特徴のセットを抽出することを含む、条項11~15のいずれかに記載の1つまたは複数の非一時的コンピュータ可読媒体。
17.前記空間的特徴の1つまたは複数のセットを計算することは、前記1つまたは複数の測定値配列に含まれる第1の測定値配列に基づいて第1の空間情報を計算すること、及び前記第1の空間情報から第1の低周波の空間的特徴のセットを抽出することを含む、条項11~16のいずれかに記載の1つまたは複数の非一時的コンピュータ可読媒体。
18.前記1つまたは複数の測定値配列に含まれる第1の測定値配列は、複数の細胞数を明示し、前記複数のセルに含まれる各細胞数は、前記第1のマイクロウェルプレートに含まれる別のウェルに関連付けられる、条項11~17のいずれかに記載の1つまたは複数の非一時的コンピュータ可読媒体。
19.第1のマイクロウェルプレートが第1の実験に関連付けられ、第2のマイクロウェルプレートが第2の実験及び第2の特徴ベクトルに関連付けられ、前記第2の特徴ベクトルを前記訓練された機械学習モデルに入力することであって、それに応じて、前記第2のマイクロウェルプレートが第2の実行アーティファクトに関連付けられていることを示す第2のラベルを生成する、前記入力することをさらに含む、条項11~18のいずれかに記載の1つまたは複数の非一時的コンピュータ可読媒体。
20.いくつかの実施形態では、システムが、命令を格納する1つまたは複数のメモリと、1つまたは複数のプロセッサであって、前記命令を実行するときに、第1のマイクロウェルプレートに関連する複数の測定値に基づいて複数の空間的特徴を計算するステップ、前記複数の空間的特徴に基づいて特徴のセットを生成するステップ、及び前記特徴のセット及び訓練された機械学習モデルに基づいて第1のラベルを計算するステップであって、前記第1のラベルは、前記第1のマイクロウェルプレートが第1の実行アーティファクトに関連付けられていることを示す、前記計算するステップを行う前記1つまたは複数のメモリに結合される、前記1つまたは複数のプロセッサと、を含む。
請求項のいずれかに記載されている請求項の要素のいずれか及び/または本願に記載されたいずれかの要素のいずれかの組み合わせ及びすべての組み合わせは、何らかの形で、実施形態及び保護の意図された範囲内に入る。
様々な実施形態の説明は、例証の目的で提示されているが、包括的に、または開示される実施形態に限定されることは意図されていない。多くの修正及び変形例は、説明される実施形態の範囲及び主旨から逸脱することなく当業者に明白である。
本実施形態の態様は、システム、方法、またはコンピュータプログラム製品として具体化され得る。したがって、本開示の態様は、全体的にハードウェアの実施形態、全体的にソフトウェアの実施形態(ファームウェア、存在ソフトウェア、マイクロコードなどを含む)、またはすべて一般的に「モジュール」もしくは「システム」または「コンピュータ」と称され得るソフトウェア及びハードウェアの態様を組み合わせる実施形態の形態をとり得る。さらに、本開示で説明される任意のハードウェア及び/またはソフトウェアの技術、プロセス、機能、構成要素、エンジン、モジュール、またはシステムは、回路または回路のセットとして実装され得る。
本明細書で前述したように、本開示の態様は、コンピュータ可読プログラムコーデックが具現化された1つまたは複数のコンピュータ可読媒体で具現化されたコンピュータプログラム製品の形をとることができる。1つまたは複数のコンピュータ可読媒体の任意の組み合わせを利用することができる。各コンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体であり得る。コンピュータ可読記憶媒体は、例えば、限定するものではないが、電子、磁気、光、電磁気、赤外線、もしくは半導体のシステム、装置、もしくはデバイス、または任意の前述の好適な組み合わせであり得る。コンピュータ可読記憶媒体のより多くの具体例は、1つ以上の通信回線を有する電気的接続、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ、読み取り専用メモリ、消去可能プログラマブルROM、またはフラッシュメモリ)、光ファイバ、コンパクトディスク読み取り専用メモリ、光学記憶デバイス、磁気記憶デバイス、または前述の任意の好適な組み合わせを含むであろう。本文書の文脈において、コンピュータ可読記憶媒体は、命令実行システム、装置、もしくはデバイスによる使用のために、またはそれらと接続してプログラムを含むまたは記憶することができる任意の有形媒体であり得る。
本開示の態様は、本開示の実施形態に従った方法、装置(システム)、及びコンピュータプログラム製品のフローチャート図及び/またはブロック図を参照して上段にて説明されている。フローチャート図及び/またはブロック図の各ブロック、及びフローチャート図及び/またはブロック図のブロックの組み合わせは、コンピュータプログラム命令によって実施できることが理解される。これらのコンピュータプログラム命令は、機械を生成するために、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサに提示され得る。命令は、コンピュータまたは他のプログラム可能なデータ処理装置のプロセッサを介して実行されるとき、フローチャート及び/またはブロック図ブロック(複数可)で明示されている機能/動作の実装を可能にする。係るプロセッサは、限定ではなく、汎用プロセッサ、専用プロセッサ、アプリケーション特有プロセッサ、またはフィールドプログラム可能ゲートアレイであり得る。
図面のフローチャート及びブロック図は、本開示の様々な実施形態に従ったシステム、方法、装置、及びコンピュータプログラム製品の可能である実施態様のアーキテクチャ、機能、及び動作を示す。この点で、フローチャートまたはブロック図の各ブロックは、規定された論理関数(複数可)を実装するための1つ以上の実行可能命令を含むモジュール、セグメント、またはコードの一部を表し得る。また、いくつかの実施態様では、ブロックで留意される機能は、図で留意される順序とは違う順序で起こり得ることを留意されたい。例えば、連続して示される2つのブロックは、実際に、実質的に同時に実行され得る、または、ブロックは、時々、関与する機能に応じて、逆の順序で実行され得る。また、ブロック図及び/またはフローチャート図の各ブロック、及びブロック図及び/またはフローチャート図のブロックの組み合わせは、規定の機能もしくは動作、または特殊目的ハードウェア及びコンピュータ命令の組み合わせを行う特殊目的ハードウェアベースシステムによって実施され得ることが留意される。
上記は本開示の実施形態を対象としているが、本開示の他の及びさらなる実施形態は、その基本的範囲から逸脱することなく考案され得、その範囲は、以下の特許請求の範囲によって判定される。
上記は本開示の実施形態を対象としているが、本開示の他の及びさらなる実施形態は、その基本的範囲から逸脱することなく考案され得、その範囲は、以下の特許請求の範囲によって判定される。
以下、本発明の好ましい実施形態を項分け記載する。
実施形態1
マイクロウェルプレートを伴う実験で実行アーティファクトを検出するためのコンピュータ実装方法であって、
第1のマイクロウェルプレートに関連付けられた1つまたは複数のヒートマップに基づいて、空間的特徴の1つまたは複数のセットを計算すること、
第1の特徴ベクトルを生成するために、前記空間的特徴の1つまたは複数のセットを集約すること、及び
前記第1の特徴ベクトルを訓練された分類器に入力することであって、それに応じて、前記第1のマイクロウェルプレートが第1の実行アーティファクトに関連付けられることを示す第1のラベルを生成する、前記入力すること、
を含む前記方法。
実施形態2
前記第1の特徴ベクトル及び前記第1のラベルに関連付けられた特徴ベクトルの第1のクラスタに基づいて、異常スコアを計算することをさらに含む、実施形態1に記載のコンピュータ実装方法。
実施形態3
前記第1のマイクロウェルプレートを含む複数のマイクロウェルプレートに基づいて、実験に関連する第2の特徴ベクトルを計算すること、
前記第2の特徴ベクトルを前記訓練された分類器に入力することであって、それに応じて前記第1のラベルを生成する、前記入力すること、及び
前記複数のマイクロウェルプレートに含まれるマイクロウェルプレートのうちいくつが前記第1のラベルに関連付けられているかを示すパーセンテージを計算すること、
をさらに含む、実施形態1に記載のコンピュータ実装方法。
実施形態4
前記訓練された分類器が、前記第1のラベルが前記第1のマイクロウェルプレートに適用される可能性を示すラベル信頼度をさらに生成する、実施形態1に記載のコンピュータ実装方法。
実施形態5
前記1つまたは複数のヒートマップに含まれる第1のヒートマップが複数の強度を明示し、前記複数の強度に含まれる各強度が、前記第1のマイクロウェルプレートに含まれている異なるウェルに関連付けられる、実施形態1に記載のコンピュータ実装方法。
実施形態6
前記訓練された分類器は、
前記第1のマイクロウェルプレートに関連付けられた第1のヒートマップに基づいて第1の空間情報を計算すること、
前記第1の空間情報に基づいて第1の特徴のセットを計算すること、及び
前記第1の特徴のセットに基づいて1つまたは複数の機械学習操作を実行して、前記訓練された分類器を生成することであって、前記訓練された分類器は、複数の実行アーティファクトに関連する複数のラベルに関して、異なるマイクロウェルプレートに関連する特徴のセットを分類する、前記実行すること、
によりトレーニングされる、実施形態1に記載のコンピュータ実装方法。
実施形態7
前記訓練された分類器が、前記複数のラベルに含まれるラベルのラベル信頼度を推定することによって、特定のマイクロウェルプレートの所与の特徴のセットを分類し、前記ラベル信頼度が、前記ラベルが前記特定のマイクロウェルプレートに適用される可能性を示す、実施形態6に記載のコンピュータ実装方法。
実施形態8
前記第1の空間情報はマルチレベルウェーブレット分解を含み、前記第1の特徴のセットを計算することは、
前記マルチレベルウェーブレット分解の少なくとも最低のレベルから第1の複数の空間的特徴を抽出すること、及び
前記第1の複数の空間的特徴を第2の複数の空間的特徴と集約して、前記第1の特徴のセットを生成することであって、前記第2の複数の空間的特徴は、前記第1のマイクロウェルプレートにまた関連付けられる第2のヒートマップから導出される、前記集約すること、
を含む、実施形態6に記載のコンピュータ実装方法。
実施形態9
前記第1のヒートマップが複数の細胞数を特定し、前記複数の細胞数に含まれる各細胞数が、前記第1のマイクロウェルプレートに含まれる異なるウェルに関連付けられる、実施形態6に記載のコンピュータ実装方法。
実施形態10
前記1つまたは複数の機械学習操作に含まれる第1の機械学習操作は、教師あり機械学習操作、教師なし機械学習操作、半教師あり機械学習操作、または強化学習操作を含む、実施形態6に記載のコンピュータ実装方法。
実施形態11
1つまたは複数のプロセッサによって実行されるとき、前記1つまたは複数のプロセッサに、
第1のマイクロウェルプレートに関連する1つまたは複数の測定値に基づいて空間的特徴の1つまたは複数のセットを計算するステップ、
前記空間的特徴の1つまたは複数のセットに基づいて第1の特徴ベクトルを生成するステップ、及び
前記第1の特徴ベクトルを訓練された機械学習モデルに入力するステップであって、それに応じて、前記第1のマイクロウェルプレートが第1の実行アーティファクトに関連付けられることを示す第1のラベルを生成する、前記入力するステップ、
を行うことによって、マイクロウェルプレートを伴う実験で実行アーティファクトを検出させる命令を含む、1つまたは複数の非一時的コンピュータ可読媒体。
実施形態12
複数の測定値配列に基づいて、実験に関連する第2の特徴ベクトルを計算することであって、前記複数の測定値配列は、前記第1のマイクロウェルプレートに関連する前記1つまたは複数の測定値配列を含む、前記計算すること、及び
前記第2の特徴ベクトルを前記訓練された機械学習モデルに入力することであって、それに応じて、前記第1のラベルを含む複数のラベルに関して前記実験を分類する第2のラベルを生成する、前記入力すること、
をさらに含む、実施形態11に記載の1つまたは複数の非一時的コンピュータ可読媒体。
実施形態13
実験に関連付けられたマイクロウェルプレートのサブセットも前記第1のラベルに関連付けられていることを判定することであって、前記マイクロウェルプレートのサブセットは前記第1のマイクロウェルプレートを含む、前記判定すること、及び
グラフィカルユーザインターフェース(「GUI」)を介して、前記第1のラベルに関連付けられた平均測定値配列を表示すること、及び
前記マイクロウェルプレートのサブセットが前記平均測定値配列に関連付けられているという前記GUIを介した表示を生成すること、
をさらに含む、実施形態11に記載の1つまたは複数の非一時的コンピュータ可読媒体。
実施形態14
前記空間的特徴の1つまたは複数のセットを計算することは、
マルチレベルウェーブレット分解を生成するために、前記1つまたは複数の測定値配列に含まれる第1の測定値配列にウェーブレット変換を適用すること、及び
前記マルチレベルウェーブレット分解の少なくとも最低のレベルから第1の空間的特徴のセットを抽出すること、
を含む、実施形態11に記載の1つまたは複数の非一時的コンピュータ可読媒体。
実施形態15
前記空間的特徴の1つまたは複数のセットを計算することは、
前記1つまたは複数の測定値配列に含まれる第1の測定値配列に基づいて第1の空間情報を計算すること、及び
前記第1の空間情報から第1の低周波の空間的特徴のセットを抽出すること、
を含む、実施形態11に記載の1つまたは複数の非一時的コンピュータ可読媒体。
実施形態16
前記訓練された分類器が、
第1のマイクロウェルプレートに関連付けられた第1の測定値配列に基づいて1つまたは複数の空間パターンを判定すること、
前記1つまたは複数の空間パターンに基づいて、第1の特徴のセットを計算すること、及び
前記第1の特徴のセットに基づいて1つまたは複数の機械学習操作を実行して、訓練された分類器を生成することであって、前記訓練された分類器は、複数の実行アーティファクトに関連付けられる複数のラベルに関して、異なるマイクロウェルプレートに関連する特徴のセットを分類する、前記実行すること、
によりトレーニングされる、実施形態11に記載の1つまたは複数の非一時的コンピュータ可読媒体。
実施形態17
前記1つまたは複数の機械学習操作を実行する前に、複数の特徴のセットに対してクラスタリングアルゴリズムを実行して、前記複数のラベルを生成することをさらに含む、実施形態16に記載の1つまたは複数の非一時的コンピュータ可読媒体。
実施形態18
前記1つまたは複数の空間パターンを判定することは、前記第1の測定値配列にウェーブレット変換を適用することを含む、実施形態16に記載の1つまたは複数の非一時的コンピュータ可読媒体。
実施形態19
前記1つまたは複数の機械学習操作に含まれる第1の機械学習操作は、教師あり機械学習操作、教師なし機械学習操作、半教師あり機械学習操作、または強化学習操作を含む、実施形態16に記載の1つまたは複数の非一時的コンピュータ可読媒体。
実施形態20
システムであって、
命令を格納する1つまたは複数のメモリと、
1つまたは複数のプロセッサであって、前記命令を実行するときに、
第1のマイクロウェルプレートに関連する複数の測定値に基づいて複数の空間的特徴を計算するステップ、
前記複数の空間的特徴に基づいて特徴のセットを生成するステップ、及び
前記特徴のセット及び訓練された機械学習モデルに基づいて第1のラベルを計算するステップであって、前記第1のラベルは、前記第1のマイクロウェルプレートが第1の実行アーティファクトに関連付けられていることを示す、前記計算するステップ、
を行う前記1つまたは複数のメモリに結合される、前記1つまたは複数のプロセッサと、を含む、前記システム。

Claims (20)

  1. マイクロウェルプレートを伴う実験で実行アーティファクトを検出するためのコンピュータ実装方法であって、
    第1のマイクロウェルプレートに関連付けられた1つまたは複数のヒートマップに基づいて、空間的特徴の1つまたは複数のセットを計算すること、
    第1の特徴ベクトルを生成するために、前記空間的特徴の1つまたは複数のセットを集約すること、及び
    前記第1の特徴ベクトルを訓練された分類器に入力することであって、それに応じて、前記第1のマイクロウェルプレートが第1の実行アーティファクトに関連付けられることを示す第1のラベルを生成する、前記入力すること、
    を含む前記方法。
  2. 前記第1の特徴ベクトル及び前記第1のラベルに関連付けられた特徴ベクトルの第1のクラスタに基づいて、異常スコアを計算することをさらに含む、請求項1に記載のコンピュータ実装方法。
  3. 前記第1のマイクロウェルプレートを含む複数のマイクロウェルプレートに基づいて、実験に関連する第2の特徴ベクトルを計算すること、
    前記第2の特徴ベクトルを前記訓練された分類器に入力することであって、それに応じて前記第1のラベルを生成する、前記入力すること、及び
    前記複数のマイクロウェルプレートに含まれるマイクロウェルプレートのうちいくつが前記第1のラベルに関連付けられているかを示すパーセンテージを計算すること、
    をさらに含む、請求項1に記載のコンピュータ実装方法。
  4. 前記訓練された分類器が、前記第1のラベルが前記第1のマイクロウェルプレートに適用される可能性を示すラベル信頼度をさらに生成する、請求項1に記載のコンピュータ実装方法。
  5. 前記1つまたは複数のヒートマップに含まれる第1のヒートマップが複数の強度を明示し、前記複数の強度に含まれる各強度が、前記第1のマイクロウェルプレートに含まれている異なるウェルに関連付けられる、請求項1に記載のコンピュータ実装方法。
  6. 前記訓練された分類器は、
    前記第1のマイクロウェルプレートに関連付けられた第1のヒートマップに基づいて第1の空間情報を計算すること、
    前記第1の空間情報に基づいて第1の特徴のセットを計算すること、及び
    前記第1の特徴のセットに基づいて1つまたは複数の機械学習操作を実行して、前記訓練された分類器を生成することであって、前記訓練された分類器は、複数の実行アーティファクトに関連する複数のラベルに関して、異なるマイクロウェルプレートに関連する特徴のセットを分類する、前記実行すること、
    によりトレーニングされる、請求項1に記載のコンピュータ実装方法。
  7. 前記訓練された分類器が、前記複数のラベルに含まれるラベルのラベル信頼度を推定することによって、特定のマイクロウェルプレートの所与の特徴のセットを分類し、前記ラベル信頼度が、前記ラベルが前記特定のマイクロウェルプレートに適用される可能性を示す、請求項6に記載のコンピュータ実装方法。
  8. 前記第1の空間情報はマルチレベルウェーブレット分解を含み、前記第1の特徴のセットを計算することは、
    前記マルチレベルウェーブレット分解の少なくとも最低のレベルから第1の複数の空間的特徴を抽出すること、及び
    前記第1の複数の空間的特徴を第2の複数の空間的特徴と集約して、前記第1の特徴のセットを生成することであって、前記第2の複数の空間的特徴は、前記第1のマイクロウェルプレートにまた関連付けられる第2のヒートマップから導出される、前記集約すること、
    を含む、請求項6に記載のコンピュータ実装方法。
  9. 前記第1のヒートマップが複数の細胞数を特定し、前記複数の細胞数に含まれる各細胞数が、前記第1のマイクロウェルプレートに含まれる異なるウェルに関連付けられる、請求項6に記載のコンピュータ実装方法。
  10. 前記1つまたは複数の機械学習操作に含まれる第1の機械学習操作は、教師あり機械学習操作、教師なし機械学習操作、半教師あり機械学習操作、または強化学習操作を含む、請求項6に記載のコンピュータ実装方法。
  11. 1つまたは複数のプロセッサによって実行されるとき、前記1つまたは複数のプロセッサに、
    第1のマイクロウェルプレートに関連する1つまたは複数の測定値に基づいて空間的特徴の1つまたは複数のセットを計算するステップ、
    前記空間的特徴の1つまたは複数のセットに基づいて第1の特徴ベクトルを生成するステップ、及び
    前記第1の特徴ベクトルを訓練された機械学習モデルに入力するステップであって、それに応じて、前記第1のマイクロウェルプレートが第1の実行アーティファクトに関連付けられることを示す第1のラベルを生成する、前記入力するステップ、
    を行うことによって、マイクロウェルプレートを伴う実験で実行アーティファクトを検出させる命令を含む、1つまたは複数の非一時的コンピュータ可読媒体。
  12. 複数の測定値配列に基づいて、実験に関連する第2の特徴ベクトルを計算することであって、前記複数の測定値配列は、前記第1のマイクロウェルプレートに関連する前記1つまたは複数の測定値配列を含む、前記計算すること、及び
    前記第2の特徴ベクトルを前記訓練された機械学習モデルに入力することであって、それに応じて、前記第1のラベルを含む複数のラベルに関して前記実験を分類する第2のラベルを生成する、前記入力すること、
    をさらに含む、請求項11に記載の1つまたは複数の非一時的コンピュータ可読媒体。
  13. 実験に関連付けられたマイクロウェルプレートのサブセットも前記第1のラベルに関連付けられていることを判定することであって、前記マイクロウェルプレートのサブセットは前記第1のマイクロウェルプレートを含む、前記判定すること、及び
    グラフィカルユーザインターフェース(「GUI」)を介して、前記第1のラベルに関連付けられた平均測定値配列を表示すること、及び
    前記マイクロウェルプレートのサブセットが前記平均測定値配列に関連付けられているという前記GUIを介した表示を生成すること、
    をさらに含む、請求項11に記載の1つまたは複数の非一時的コンピュータ可読媒体。
  14. 前記空間的特徴の1つまたは複数のセットを計算することは、
    マルチレベルウェーブレット分解を生成するために、前記1つまたは複数の測定値配列に含まれる第1の測定値配列にウェーブレット変換を適用すること、及び
    前記マルチレベルウェーブレット分解の少なくとも最低のレベルから第1の空間的特徴のセットを抽出すること、
    を含む、請求項11に記載の1つまたは複数の非一時的コンピュータ可読媒体。
  15. 前記空間的特徴の1つまたは複数のセットを計算することは、
    前記1つまたは複数の測定値配列に含まれる第1の測定値配列に基づいて第1の空間情報を計算すること、及び
    前記第1の空間情報から第1の低周波の空間的特徴のセットを抽出すること、
    を含む、請求項11に記載の1つまたは複数の非一時的コンピュータ可読媒体。
  16. 前記訓練された分類器が、
    第1のマイクロウェルプレートに関連付けられた第1の測定値配列に基づいて1つまたは複数の空間パターンを判定すること、
    前記1つまたは複数の空間パターンに基づいて、第1の特徴のセットを計算すること、及び
    前記第1の特徴のセットに基づいて1つまたは複数の機械学習操作を実行して、訓練された分類器を生成することであって、前記訓練された分類器は、複数の実行アーティファクトに関連付けられる複数のラベルに関して、異なるマイクロウェルプレートに関連する特徴のセットを分類する、前記実行すること、
    によりトレーニングされる、請求項11に記載の1つまたは複数の非一時的コンピュータ可読媒体。
  17. 前記1つまたは複数の機械学習操作を実行する前に、複数の特徴のセットに対してクラスタリングアルゴリズムを実行して、前記複数のラベルを生成することをさらに含む、請求項16に記載の1つまたは複数の非一時的コンピュータ可読媒体。
  18. 前記1つまたは複数の空間パターンを判定することは、前記第1の測定値配列にウェーブレット変換を適用することを含む、請求項16に記載の1つまたは複数の非一時的コンピュータ可読媒体。
  19. 前記1つまたは複数の機械学習操作に含まれる第1の機械学習操作は、教師あり機械学習操作、教師なし機械学習操作、半教師あり機械学習操作、または強化学習操作を含む、請求項16に記載の1つまたは複数の非一時的コンピュータ可読媒体。
  20. システムであって、
    命令を格納する1つまたは複数のメモリと、
    1つまたは複数のプロセッサであって、前記命令を実行するときに、
    第1のマイクロウェルプレートに関連する複数の測定値に基づいて複数の空間的特徴を計算するステップ、
    前記複数の空間的特徴に基づいて特徴のセットを生成するステップ、及び
    前記特徴のセット及び訓練された機械学習モデルに基づいて第1のラベルを計算するステップであって、前記第1のラベルは、前記第1のマイクロウェルプレートが第1の実行アーティファクトに関連付けられていることを示す、前記計算するステップ、
    を行う前記1つまたは複数のメモリに結合される、前記1つまたは複数のプロセッサと、を含む、前記システム。
JP2023504097A 2020-07-27 2021-07-19 マイクロウェルプレートで実行アーティファクトを分析及び検出するための技法 Pending JP2023536695A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US16/940,325 2020-07-27
US16/940,320 US11361438B2 (en) 2020-07-27 2020-07-27 Techniques for analyzing and detecting executional artifacts in microwell plates
US16/940,320 2020-07-27
US16/940,325 US20220027795A1 (en) 2020-07-27 2020-07-27 Techniques for training a classifier to detect executional artifacts in microwell plates
PCT/US2021/042139 WO2022026226A1 (en) 2020-07-27 2021-07-19 Techniques for analyzing and detecting executional artifacts in microwell plates

Publications (1)

Publication Number Publication Date
JP2023536695A true JP2023536695A (ja) 2023-08-29

Family

ID=80036051

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023504097A Pending JP2023536695A (ja) 2020-07-27 2021-07-19 マイクロウェルプレートで実行アーティファクトを分析及び検出するための技法

Country Status (7)

Country Link
EP (1) EP4189641A1 (ja)
JP (1) JP2023536695A (ja)
CN (1) CN116210032A (ja)
AU (1) AU2021316176B2 (ja)
CA (1) CA3186058A1 (ja)
IL (1) IL300002A (ja)
WO (1) WO2022026226A1 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711174B2 (en) * 2004-05-13 2010-05-04 The Charles Stark Draper Laboratory, Inc. Methods and systems for imaging cells
DE102018133196A1 (de) * 2018-12-20 2020-06-25 Carl Zeiss Microscopy Gmbh Bildbasierte wartungsvorhersage und detektion von fehlbedienungen

Also Published As

Publication number Publication date
CA3186058A1 (en) 2022-02-03
AU2021316176B2 (en) 2023-10-19
IL300002A (en) 2023-03-01
EP4189641A1 (en) 2023-06-07
CN116210032A (zh) 2023-06-02
WO2022026226A1 (en) 2022-02-03
AU2021316176A1 (en) 2023-02-23

Similar Documents

Publication Publication Date Title
US10303979B2 (en) System and method for classifying and segmenting microscopy images with deep multiple instance learning
Rottmann et al. Prediction error meta classification in semantic segmentation: Detection via aggregated dispersion measures of softmax probabilities
Angermueller et al. Deep learning for computational biology
CA2948499C (en) System and method for classifying and segmenting microscopy images with deep multiple instance learning
US20170147941A1 (en) Subspace projection of multi-dimensional unsupervised machine learning models
Su et al. Interactive cell segmentation based on active and semi-supervised learning
US10614575B2 (en) Searching trees: live time-lapse cell-cycle progression modeling and analysis
Chessel An overview of data science uses in bioimage informatics
Chen et al. Diagnose like a pathologist: Weakly-supervised pathologist-tree network for slide-level immunohistochemical scoring
US20150294052A1 (en) Anomaly detection using tripoint arbitration
US20230027723A1 (en) Stain-free detection of embryo polarization using deep learning
Shahriyar et al. An approach for multi label image classification using single label convolutional neural network
US20220027795A1 (en) Techniques for training a classifier to detect executional artifacts in microwell plates
JP2023536695A (ja) マイクロウェルプレートで実行アーティファクトを分析及び検出するための技法
WO2023280229A1 (zh) 图像处理方法、电子设备及存储介质
US20220405299A1 (en) Visualizing feature variation effects on computer model prediction
KR101913952B1 (ko) V-CNN 접근을 통한 iPSC 집락 자동 인식 방법
US11361438B2 (en) Techniques for analyzing and detecting executional artifacts in microwell plates
Prasetio et al. Features Selection and k-NN Parameters Optimization based on Genetic Algorithm for Medical Datasets Classification
Al-Shammri et al. A Combined Method for Object Detection under Rain Conditions Using Deep Learning
CN115579069A (zh) scRNA-Seq细胞类型注释数据库的构建方法、装置及电子设备
JP6233432B2 (ja) 混合モデルの選択方法及び装置
Raveendran et al. Binary segmentation methods for identifying boundaries of spatial domains
Hill Modeling and analysis of mitochondrial dynamics using dynamic social network graphs
US20240061867A1 (en) Cluster-based dataset evolution

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230130

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230213

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230213

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240410

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240501