JP2019528426A

JP2019528426A - 患者層別化及び潜在的バイオマーカー同定のためのシステム及び方法

Info

Publication number: JP2019528426A
Application number: JP2018563575A
Authority: JP
Inventors: ナレイン，ニーブン，ラジン; アクマエヴ，ヴィアッチェスラヴ，アール．; ロドリゲス，レオナルド; ミラー，グレゴリー，マーク
Original assignee: バーグエルエルシー
Priority date: 2016-06-05
Filing date: 2017-06-05
Publication date: 2019-10-10
Anticipated expiration: 2037-06-05
Also published as: AU2017278261A1; US20200185063A1; US20230274799A1; EP3465200A1; EP3465200A4; AU2023203322A1; JP7042755B2; WO2017214068A1

Abstract

作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定するための方法及びシステムが本明細書に開示される。本方法は、複数の対象の分子的プロファイルデータを処理することを含み、該分子的プロファイルデータは、複数の対象に作用剤を投与する前、投与している間及び／又は投与した後に取得したデータを含む。本方法はまた、該対象の臨床記録データ（該臨床記録データは臨床的結果データを含む）を処理すること、該対象の処理された分子的プロファイルデータと処理された臨床記録データとを統合すること、併合されたデータとしてデータベースに記憶すること、臨床記録データに基づく１つ以上の判定基準を使用することにより併合データの２つ以上のサブセットを選択して、２つ以上の選択されたデータセットを生成すること、並びに選択されたデータセットのうちの１つ以上のデータセットを分析して、作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定することを含む。【選択図】図１

Description

関連出願
本出願は、２０１６年６月５日に出願された米国特許仮出願第６２／３４５，８５８号の恩典及び優先権を主張するものであり、この仮出願の内容は、その全体が参照によって本明細書に組み込まれている。

特定の治療法に対する患者反応（patient response）を含む健康管理のさまざまな態様に対する洞察を得るために、多くのシステムがデータを分析する。洞察は、患者から集められた健康管理データ間の関係を決定することによって得ることができる。従来の方法では、処理及び分析のために健康管理データから抽出する少数の関連する変数（variable）を予め定める。この予め選択された少数の変数に基づいて、医療用薬物、疾患、症状などのさまざまな因子間の関係を確立する。分析する変数を予め選択することは、新たな関係又は未知の関係を発見する能力を制限する。変数を予め選択することは、関連する他の変数を発見する能力も制限する。例えば、糖尿病の分析を考えたときに変数が予め選択されている場合には、糖尿病に関連することが知られている又は疑われている変数を調べることだけに限定され、健康管理業界でそれまで知られていない糖尿病に関連する別の変数が見落とされる可能性がある。

予め選択された変数に集中するのではなしに、医療データを分析して、患者治療に使用するバイオマーカー（biomarker）の同定を容易にしうるデータ間の新規の関係を同定することが好ましい方法であろう。例えば、臨床試験は、特定の治療法に対する患者反応を詳細に分析することによって大量の医療データを収集する機会を提供する。しかしながら、患者反応の主要な動因（key driver）を同定するような態様でそれらの大量のデータを分析することは困難であった。したがって、データ間の新規の関係を決定し、最終的には患者治療を容易にするバイオマーカーを同定するために、大量の医療データを統合する方法が求められている。

本明細書に記載された実施形態は、作用剤（agent）の投与に関係した臨床的結果（clinical outcome）の１つ以上のバイオマーカー又は１つ以上の潜在的な（potential）バイオマーカー（以後、潜在的バイオマーカー）を同定する方法及びシステムを提供する。いくつかの実施形態は、患者層別化（patient stratification）のための方法及びシステムを提供する。いくつかの実施形態は臨床試験とともに利用される。

本発明の一実施形態は、複数の対象のうちのそれぞれの対象の分子的プロファイルデータ（molecular profile data）を処理すること、複数の対象のうちのそれぞれの対象の臨床記録データを処理すること、複数の対象の処理された分子的プロファイルデータと複数の対象の処理された臨床記録データとを統合し、併合されたデータ（merged data）（以後、併合データ）としてデータベースに記憶すること、臨床記録データに基づく１つ以上の判定基準を使用することにより併合データの２つ以上のサブセットを選択して、２つ以上の選択されたデータセットを生成すること、並びに選択されたデータセットのうちの１つ以上のデータセットを分析して、作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定することを含む方法を提供する。それぞれの対象の分子的プロファイルデータは、当該対象から取得した複数の試料の分析によって生成されたプロテオミクス、メタボロミクス、リピドミクス（lipidomics）、ゲノミクス、トランスクリプトミクス（transcriptomics）、マイクロアレイ及び配列決定データのうちの１つ以上のデータを含む。それぞれの対象の複数の試料は、当該対象に作用剤を投与する前、投与している間及び／又は投与した後に取得した試料を含む。それぞれの対象の臨床記録データは、作用剤を投与する前、投与している間及び／又は投与した後に当該対象から取得した試料と、作用剤を投与する前、投与している間及び／又は投与した後に実施した当該対象の測定とのうちの一方又は両方に基づくデータを含む。臨床記録データは臨床的結果データを含む。

いくつかの実施形態では、この方法がさらに、複数の対象に作用剤を投与することを含む。いくつかの実施形態では、この方法がさらに、対象ごとに、当該対象から取得した複数の試料を分析して分子的プロファイルデータを取得することを含む。

いくつかの実施形態では、臨床記録データがさらに、薬物動態データ、病歴データ、臨床検査データ及びモバイルウェアラブルデバイスからのデータのうちの１つ以上のデータを含む。いくつかの実施形態では、対象の臨床記録データがさらに、当該対象に関する人口統計的情報を含む。

いくつかの実施形態では、作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定するために、選択された１つ以上のデータセットが、統計的方法、機械学習法及び人工知能法のうちの１つ以上の方法を使用して分析される。いくつかの実施形態では、作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定するために、選択された１つ以上のデータセットが、統計的方法、機械学習法及び人工知能法のうちの２つ以上の方法を使用して分析される。

いくつかの実施形態では、選択されたデータセットのうちの１つ以上のデータセットを分析して、作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定することが、選択されたデータセットのうちの１つ以上のデータセットに基づいて１つ以上の因果関係ネットワーク（causal relationship network）を生成すること、及び生成された１つ以上の因果関係ネットワークを分析して、１つ以上の結果動因に対応するノード（node）を同定することを含む。いくつかの実施形態では、生成された因果関係ネットワークを分析して、１つ以上の結果動因に対応するノードを同定することが、生成された因果関係ネットワークのうちの１つ以上の因果関係ネットワーク内の臨床的結果にｎ以下の接続度を有する関係によって接続されたノードに対応する変数を結果動因として同定することを含む。いくつかの実施形態では、ｎが、１０又は９又は８又は７又は６又は５又は４又は３又は２又は１である。いくつかの実施形態では、ｎが、３又は２又は１である。いくつかの実施形態では、ｎが、２又は１である。いくつかの実施形態では、ｎが１である。いくつかの実施形態では、生成された因果関係ネットワークを分析して、１つ以上の結果動因に対応するノードを同定することが、生成された１つ以上の因果関係ネットワークのネットワークトポロジ特徴（network topology feature）の分析を含む。

いくつかの実施形態では、生成された２つ以上の選択されたデータセットが、臨床的結果を示した対象にそれぞれが対応する第１の複数の選択されたデータセットと、第１の臨床的結果を示さなかった対象にそれぞれが対応する第２の複数の選択されたデータセットとを含み、選択されたデータセットのうちの１つ以上のデータセットに基づいて１つ以上の因果関係ネットワークを生成することが、臨床的結果を示した対象に対応する第１の複数の選択されたデータセットのうちの１つのデータセットにそれぞれ基づいて第１の複数の因果関係ネットワークを生成すること、及び臨床的結果を示さなかった対象に対応する第２の複数の選択されたデータセットのうちの１つのデータセットにそれぞれ基づいて第２の複数の因果関係ネットワークを生成することを含む。いくつかの実施形態によれば、生成された因果関係ネットワークを分析して、１つ以上の結果動因に対応するノードを同定することが、第１の複数の因果関係ネットワーク間の１つ以上の第１の共通性（commonality）を同定すること、第２の複数の因果関係ネットワーク間の１つ以上の第２の共通性を同定すること、及び第１の共通性と第２の共通性を比較して、１つ以上の結果動因を同定することを含む。

いくつかの実施形態では、生成された２つ以上の選択されたデータセットが、臨床的結果を示した一人以上の対象に対応するデータを含む第１の選択されたデータセットと、臨床的結果を示さなかった一人以上の対象に対応するデータを含む第２の選択されたデータセットとを含み、選択されたデータセットのうちの少なくともいくつかのデータセットに基づいて１つ以上の因果関係ネットワークを生成することが、臨床的結果を示した対象に対応する第１の選択されたデータセットに基づいて第１の因果関係ネットワークを生成すること、及び臨床的結果を示さなかった対象に対応する第２の選択されたデータセットに基づいて第２の因果関係ネットワークを生成することを含む。いくつかの実施形態によれば、１つ以上の結果動因は、第１の因果関係ネットワークと第２の因果関係ネットワークとの比較に基づいて同定される。いくつかの実施形態では、第１の因果関係ネットワークと第２の因果関係ネットワークとの比較が、第１の因果関係ネットワーク及び第２の因果関係ネットワークから差次的因果関係（differential causal relationship）を生成することを含み、１つ以上の結果動因が、生成された差次的因果関係ネットワークから同定される。

いくつかの実施形態では、生成された因果関係ネットワークがベイジアン因果関係ネットワーク（Bayesian causal relationship network）である。いくつかの実施形態では、１つ以上の結果動因が、作用剤の投与に関係した臨床的結果の１つ以上のバイオマーカー又は１つ以上の潜在的バイオマーカーである。

いくつかの実施形態では、生成された２つ以上の選択されたデータセットが、臨床的結果を示した対象のデータを含む第１の選択されたデータセットと、臨床的結果を示さなかった対象のデータを含む第２のスライスされたデータとを含み、選択されたデータセットのうちの１つ以上のデータセットを分析して、作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定することが、第１の選択されたデータセットと第２の選択されたデータセットの間の統計的に有意なレベルの差次的に発現された（differentially expressed）１つ以上の変数を同定することをさらに含む。いくつかの実施形態では、第１の選択されたデータセットと第２の選択されたデータセットが、作用剤の投与の時刻から見て同じ時点（time point）又は同じ範囲の時点に対応する。いくつかの実施形態では、第１の選択されたデータセットと第２の選択されたデータセットの間の統計的に有意なレベルの差次的に発現された１つ以上の変数を同定することが、２標本ｔ検定又はｌｉｍｍａ法を利用することを含む。いくつかの実施形態では、第１の選択されたデータセットと第２の選択されたデータセットの間の統計的に有意なレベルの差次的に発現された１つ以上の変数を同定することが、回帰分析を実行することを含む。

いくつかの実施形態では、選択されたデータセットのうちの１つ以上のデータセットを分析して、作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定することが、機械学習を利用して、同定された結果動因及び差次的に発現された１つ以上の変数を可能なバイオマーカーとして分析すること、並びに分析に基づいて、可能なバイオマーカーのサブセットを１つ以上の潜在的バイオマーカーとして選択することをさらに含み、機械学習が、他の可能なバイオマーカーに強く相関した可能なバイオマーカーにペナルティを課し（penalize）、臨床的結果との相関レベルに基づいて可能なバイオマーカーに報酬を与え（reward）、それによって臨床的結果の１つ以上の潜在的バイオマーカーを同定する。いくつかの実施形態では、可能なバイオマーカーを分析するために利用される機械学習が、イラスティックネットペナルティ（elastic net penalty）を用いたロジスティック回帰を適用する。

いくつかの実施形態では、複数の対象の処理された分子的プロファイルデータと複数の対象の処理された臨床記録データとを統合し、併合データとしてデータベースに記憶することが、それぞれの試料に関連づけられた対象ＩＤ（subject identification）及び時刻を含むマスタファイルに併合データを記憶することを含む。いくつかの実施形態では、分子的プロファイル試料に関連づけられた時刻に対応する時刻における少なくともいくつかの臨床記録データの補間された値を決定するために線形補間が使用される。

いくつかの実施形態では、この方法がさらに、生成されたベイジアン因果関係ネットワークのトポロジ特徴の分析によって、対象反応を決定するためのｉｎｓｉｌｉｃｏ計算診断患者マップを生成することを含む。いくつかの実施形態では、この方法がさらに、患者層別化のためのｉｎｓｉｌｉｃｏ計算診断患者マップを含む。

いくつかの実施形態では、１つ以上の潜在的バイオマーカーが、作用剤の効能又は有害事象の潜在的バイオマーカーである。いくつかの実施形態では、この方法が、疾患又は障害の治療における作用剤の効能の１つ以上の潜在的バイオマーカーを同定する方法である。いくつかの実施形態では、この方法が、作用剤の投与に関係した有害事象の発生の１つ以上の潜在的バイオマーカーを同定する方法である。いくつかの実施形態では、この方法が、患者層別化の方法であり、この方法がさらに、１つ以上の潜在的バイオマーカーを患者層別化に利用することを含む。

いくつかの実施形態では、１つ以上の潜在的バイオマーカーが、作用剤を使用して患者を治療するか否かを決定するための患者層別化に利用される。いくつかの実施形態では、この方法が、患者層別化の方法である。

いくつかの実施形態では、複数の対象への作用剤の投与が作用剤の臨床試験中に実施され、この方法がさらに、作用剤の後続の臨床試験中又は作用剤の同じ臨床試験の後続の段階中に、同定された１つ以上の潜在的バイオマーカーを患者層別化に利用することを含む。いくつかの実施形態では、１つ以上の潜在的バイオマーカーが、後続の臨床試験にどの患者を参加させるのかを決定するための患者層別化に使用される。いくつかの実施形態では、１つ以上の潜在的バイオマーカーが、後続の臨床試験において作用剤を受け入れる患者を決定するための患者層別化に使用される。

いくつかの実施形態では、併合データの２つ以上のサブセットを選択するための１つ以上の判定基準が表現型分類を含む。いくつかの実施形態では、併合データの２つ以上のサブセットを選択するための１つ以上の判定基準が臨床的結果データを含む。

いくつかの実施形態では、併合データの２つ以上のサブセットを選択するための１つ以上の判定基準が、作用剤の投与中に対象が有害事象を経験したのか又は投与後に経験したのかに関するデータを含む。

いくつかの実施形態では、作用剤が、疾患又は障害の治療を意図したものであり、併合データの２つ以上のサブセットを選択するための１つ以上の判定基準が、治療に対する当該対象の反応性（responsiveness）に関するデータを含む。

いくつかの実施形態では、併合データの選択された２つ以上のサブセットが、それぞれの個々の対象の選択されたデータセットを含む。いくつかの実施形態では、２つ以上の選択されたデータセットが、複数の対象のうちの全ての対象からの併合データを含む選択されたデータセットを含む。いくつかの実施形態では、それぞれの対象の１つ以上の試料が、血液、組織及び尿試料のうちの１つ以上の試料を含む。いくつかの実施形態では、それぞれの対象の１つ以上の試料が、血液、血漿、組織及び尿試料のうちの２つ以上の試料を含む。

いくつかの実施形態では、それぞれの対象の分子的プロファイルデータが、プロテオミクス、メタボロミクス、リピドミクス、ゲノミクス、トランスクリプトミクス、マイクロアレイ及び配列決定データのうちの２つ以上のデータを含む。いくつかの実施形態では、それぞれの対象の分子的プロファイルデータが、プロテオミクス、メタボロミクス、リピドミクス、ゲノミクス、トランスクリプトミクス、マイクロアレイ及び配列決定データのうちの３つ以上のデータを含む。いくつかの実施形態では、それぞれの対象の分子的プロファイルデータが、プロテオミクス、メタボロミクス及びリピドミクスデータを含む。いくつかの実施形態では、それぞれの対象の分子的プロファイルデータがさらに、ゲノミクス、トランスクリプトミクス、マイクロアレイ及び配列決定データのうちの１つ以上のデータを含む。

いくつかの実施形態では、臨床的結果データが、疾患又は障害の状況（state）又は状態（status）に関するデータを含む。いくつかの実施形態では、作用剤が、疾患又は障害の治療用の作用剤であり、臨床的結果データが、作用剤を用いた治療に対して対象が反応性（responsive）であったのか又は非反応性（refractory）であったのかを示すデータを含む。いくつかの実施形態では、臨床的結果データが、有害事象が作用剤の投与中に起きたのか又は投与後に起きたのかに関するデータを含む。

いくつかの実施形態では、この方法がさらに、重複した臨床記録データを照合し、相違点を解消することにより併合データを処理することを含む。いくつかの実施形態では、この方法がさらに、併合データをフィルタにかけて、対応する臨床記録データを欠く分子的データを除外することを含む。いくつかの実施形態では、それぞれの対象の分子的プロファイルデータを処理することが、複数の対象に対する治療の過程中の異なる時点において収集された分子的プロファイルデータを併合すること、分子的プロファイルデータをフィルタにかけて、まれにしか測定されなかった変数を除外すること、分子的プロファイルデータを正規化すること、及び複数の対象のうちの特定の対象に対して測定されなかった変数を代入する（imputing）ことをさらに含む。

いくつかの実施形態では、作用剤が癌の治療を意図したものである。いくつかの実施形態では、臨床的結果データが腫瘍サイズ測定を含む。いくつかの実施形態では、臨床的結果データが、腫瘍の機能画像化からのデータを含む。

いくつかの実施形態では、選択されたデータセットのうちの１つ以上のデータセットを分析して、作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定することが、選択された１つ以上のデータセットのうちのそれぞれのデータセットについてベイジアン因果関係ネットワークを生成することを含む。いくつかの実施形態によれば、この方法はさらに、対象の選択されたデータセットからの生成されたベイジアン因果関係ネットワークを、癌のｉｎｖｉｔｒｏモデルから取得されたデータに基づいて生成されたベイジアン因果関係ネットワークと比較することを含む。

いくつかの実施形態では、この方法がさらに、当該対象の人口統計的情報の図表現（graphical representation）と、当該対象の結果情報の図表現とを含む対象に特異的なプロファイル（subject-specific profile）（以後、対象特異的プロファイル）を生成することを含む。いくつかの実施形態では、当該対象の結果情報の図表現が、当該対象の有害事象情報の図表現、及び作用剤に対する反応性（responsivity）に関する情報の図表現を含む。

いくつかの実施形態では、複数の対象のうちの一部又は全部の対象が障害を有する。いくつかの実施形態では、障害が、癌、糖尿病及び心臓血管疾患からなる群から選択される。いくつかの実施形態では、障害が癌である。いくつかの実施形態では、癌が固形腫瘍を含む。

いくつかの実施形態では、それぞれの対象について、臨床記録データが、分子的プロファイルデータ用の試料が取得された時点と同じ時点において取得された試料からの薬物動態データを含む。いくつかの実施形態では、この方法がさらに、対象ごとに、分子的プロファイルデータ用の複数の試料を複数の時点において取得すること、及び薬物動態データ用の試料を同じ複数の時点において取得することを含む。

いくつかの実施形態では、同定される１つ以上の潜在的バイオマーカーが、作用剤の投与に関係した臨床的結果の１つ以上のバイオマーカーである。いくつかの実施形態では、この方法が、作用剤の投与に関係した臨床的結果の１つ以上のバイオマーカーを同定する方法である。

別の実施形態は、データベースと、記憶装置と、記憶装置と通信する処理装置とを含むシステムを提供する。この処理装置は、オミクス（omics）モジュール、臨床記録モジュール、統合モジュール、スライシング（slicing）モジュール及び分析モジュールを含む。オミクスモジュールは、複数の対象のうちのそれぞれの対象の分子的プロファイルデータを処理するように構成されており、それぞれの対象の分子的プロファイルデータは、当該対象から取得した複数の試料の分析によって生成されたプロテオミクス、メタボロミクス、リピドミクス、ゲノミクス、トランスクリプトミクス、マイクロアレイ及び配列決定データのうちの１つ以上のデータを含み、それぞれの対象の複数の試料は、当該対象に作用剤を投与する前、投与している間及び／又は投与した後に取得した試料を含む。臨床記録モジュールは、複数の対象のうちのそれぞれの対象の臨床記録データを処理するように構成されており、それぞれの対象の臨床記録データは、作用剤を投与する前、投与している間及び／又は投与した後に当該対象から取得した試料と、作用剤を投与する前、投与している間及び／又は投与した後に実施した当該対象の測定とのうちの一方又は両方に基づくデータを含み、臨床記録データは臨床的結果データを含む。統合モジュールは、複数の対象の処理された分子的プロファイルデータと複数の対象の処理された臨床記録データとを統合し、併合データとしてデータベースに記憶するように構成されている。スライシングモジュールは、臨床記録データに基づく１つ以上の判定基準を使用することにより併合データの２つ以上のサブセットを選択して、２つ以上の選択されたデータセットを生成するように構成されている。分析モジュールは、選択されたデータセットのうちの１つ以上のデータセットを分析して、作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定するように構成されている。

いくつかの実施形態では、処理装置が、対象ごとに、当該対象から取得した複数の試料を分析して分子的プロファイルデータを取得するように構成されている。いくつかの実施形態では、臨床記録データがさらに、薬物動態データ、病歴データ、臨床検査データ及びモバイルウェアラブルデバイスからのデータのうちの１つ以上のデータを含む。いくつかの実施形態では、対象の臨床記録データがさらに、当該対象に関する人口統計的情報を含む。いくつかの実施形態では、作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定するために、選択された１つ以上のデータセットが、統計的方法、機械学習法及び人工知能法のうちの１つ以上の方法を使用して分析される。いくつかの実施形態では、作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定するために、選択された１つ以上のデータセットが、統計的方法、機械学習法及び人工知能法のうちの２つ以上の方法を使用して分析される。

いくつかの実施形態では、分析モジュールがさらに、選択されたデータセットのうちの１つ以上のデータセットに基づいて１つ以上の因果関係ネットワークを生成し、生成された１つ以上の因果関係ネットワークを分析して、１つ以上の結果動因に対応するノードを同定するように構成されている。

いくつかの実施形態では、生成された因果関係ネットワークを分析して、１つ以上の結果動因に対応するノードを同定することが、生成された因果関係ネットワークのうちの１つ以上の因果関係ネットワーク内の臨床的結果にｎ以下の接続度を有する関係によって接続されたノードに対応する変数を結果動因として同定することを含む。ここで、ｎは、６、５、４、３、２又は１である。

いくつかの実施形態では、分析モジュールがさらに、機械学習を利用して、同定された結果動因及び差次的に発現された１つ以上の変数を可能なバイオマーカーとして分析し、この分析に基づいて、可能なバイオマーカーのサブセットを１つ以上の潜在的バイオマーカーとして選択するように構成されており、機械学習は、他の可能なバイオマーカーに強く相関した可能なバイオマーカーにペナルティを課し、臨床的結果との相関レベルに基づいて可能なバイオマーカーに報酬を与え、それによって臨床的結果の１つ以上の潜在的バイオマーカーを同定する。いくつかの実施形態では、可能なバイオマーカーを分析するために利用される機械学習が、イラスティックネットペナルティを用いたロジスティック回帰を適用する。

いくつかの実施形態では、統合モジュールが、複数の対象の処理された分子的プロファイルデータと複数の対象の処理された臨床記録データとを統合し、併合データとしてデータベースに記憶し、それぞれの試料に関連づけられた対象ＩＤ及び時刻を含むマスタファイルに併合データを記憶するように構成されている。

いくつかの実施形態では、処理装置がさらに、生成されたベイジアン因果関係ネットワークのトポロジ特徴の分析によって、対象反応を決定するためのｉｎｓｉｌｉｃｏ計算診断患者マップを生成するように構成されている。いくつかの実施形態では、ｉｎｓｉｌｉｃｏ計算診断マップが、患者層別化において使用されるように構成されている。

いくつかの実施形態では、このシステムが、疾患又は障害の治療における作用剤の効能の１つ以上の潜在的バイオマーカーを同定するシステムである。いくつかの実施形態では、このシステムが、作用剤の投与に関係した有害事象の発生の１つ以上の潜在的バイオマーカーを同定するシステムである。いくつかの実施形態では、このシステムが、患者層別化のためのシステムであり、この方法がさらに、１つ以上の潜在的バイオマーカーを患者層別化に利用することを含む。

いくつかの実施形態では、このシステムが、患者層別化のためのシステムであり、複数の対象への作用剤の投与が作用剤の臨床試験中に実施され、処理装置がさらに、作用剤の後続の臨床試験中又は作用剤の同じ臨床試験の後続の段階中に、同定された１つ以上の潜在的バイオマーカーを患者層別化に利用するように構成されている。２つ以上の選択されたデータセットが、それぞれの個々の対象の選択されたデータセットを含む、前記請求項のいずれか一項に記載のシステム。

いくつかの実施形態では、処理装置がさらに、重複した臨床記録データを照合し、相違点を解消することにより併合データを処理するように構成されている。いくつかの実施形態では、処理装置がさらに、併合データをフィルタにかけて、対応する臨床記録データを欠く分子的データを除外するように構成されている。

いくつかの実施形態では、オミクスモジュールがさらに、複数の対象に対する治療の過程中の異なる時点において収集された分子的プロファイルデータを併合し、分子的プロファイルデータをフィルタにかけて、まれにしか測定されなかった変数を除外し、分子的プロファイルデータを正規化し、複数の対象のうちの特定の対象に対して測定されなかった変数を代入するように構成されている。

別の実施形態は、実行されたときに本明細書に開示又は記載された方法を処理装置に実施させる命令を記憶した非一時的コンピュータ可読媒体を提供する。

本発明はさらに、少なくとも部分的に、コエンザイムＱ１０（ＣｏＱ１０）を用いた癌の治療に対して臨床的に反応性である対象では平均レベルよりも高いレベルでバイオマーカーＰＤＩＡ３が発現され、ＣｏＱ１０を用いた癌の治療に対して非反応性である対象では平均レベルよりも低いレベルでバイオマーカーＰＤＩＡ３が発現されるという知見に基づく。このことに応じて、本発明は、癌を有する対象のＣｏＱ１０を用いた治療に対する反応を予測する方法、又はＣｏＱ１０を用いて癌を治療するのに良好な候補として癌を有する対象を選択する方法を提供する。

一態様では、本発明が、ＣｏＱ１０を用いて癌を治療する対象を選択する方法であって、（ａ）対象の生物学的試料中のＰＤＩＡ３のレベルを検出すること、及び（ｂ）生物学的試料中のＰＤＩＡ３のレベルを所定の閾値と比較することを含み、ＰＤＩＡ３のレベルが所定の閾値よりも高い場合に、当該対象が、ＣｏＱ１０を用いて癌を治療する対象として選択される方法を提供する。

別の態様では、本発明が、癌を有する対象がＣｏＱ１０を用いた治療に反応するかどうかを予測する方法であって、（ａ）対象の生物学的試料中のＰＤＩＡ３のレベルを検出すること、及び（ｂ）生物学的試料中のＰＤＩＡ３のレベルを所定の閾値と比較することを含み、ＰＤＩＡ３のレベルが所定の閾値よりも高いことが、当該対象が、ＣｏＱ１０を用いた癌の治療に反応する可能性が高いことを示す方法を提供する。

ある種の実施形態では、生物学的試料が、血液、血清、尿、臓器組織、生検組織、糞便、皮膚、毛髪及び頬組織からなる群から選択される。

他の実施形態では、対象の生物学的試料中のＰＤＩＡ３のレベルを検出することが、生物学的試料中のＰＤＩＡ３タンパク質の量を決定することを含む。一実施形態では、ＰＤＩＡ３タンパク質のレベルが免疫学的アッセイ又はＥＬＩＳＡによって決定される。別の実施形態では、ＰＤＩＡ３タンパク質のレベルが質量分析法によって決定される。

一実施形態では、対象の生物学的試料中のＰＤＩＡ３のレベルを検出することが、生物学的試料を、ＰＤＩＡ３に選択的に結合する試薬と接触させてバイオマーカー複合体を形成させること、及びバイオマーカー複合体を検出することを含む。一実施形態では、試薬が、ＰＤＩＡ３の少なくとも１つのエピトープに選択的に結合する抗ＰＤＩＡ３抗体である。

別の実施形態では、対象の生物学的試料中のＰＤＩＡ３のレベルを検出することが、生物学的試料中のＰＤＩＡ３ｍＲＮＡの量を決定することを含む。一実施形態では、生物学的試料中のＰＤＩＡ３ｍＲＮＡの量を決定するために増幅反応が使用される。別の実施形態では、増幅反応が、ポリメラーゼ連鎖反応（ＰＣＲ）、核酸配列に基づく増幅アッセイ（nucleic acid sequence-based amplification assay：ＮＡＳＢＡ）、転写媒介増幅（transcription mediated amplification：ＴＭＡ）、リガーゼ連鎖反応（ＬＣＲ）、又は鎖置換増幅（ＳＤＡ）である。

一実施形態では、生物学的試料中のＰＤＩＡ３ｍＲＮＡの量を決定するためにハイブリダイゼーションアッセイが使用される。ある種の実施形態では、ＰＤＩＡ３ｍＲＮＡを検出するために、ハイブリダイゼーションアッセイにおいてＰＤＩＡ３ｍＲＮＡの一部分と相補的なオリゴヌクレオチドが使用される。

別の態様では、本発明が、ＣｏＱ１０を用いて癌を治療する対象を選択する方法であって、（ａ）生物学的試料を、ＰＤＩＡ３に選択的に結合する試薬と接触させること、（ｂ）試薬とＰＤＩＡ３の間で複合体を形成させること、（ｃ）複合体のレベルを検出すること、及び（ｄ）複合体のレベルを所定の閾値と比較することを含み、複合体のレベルが所定の閾値よりも高い場合に、当該対象が、ＣｏＱ１０を用いて癌を治療する対象として選択される方法を提供する。

別の態様では、本発明が、癌を有する対象がコエンザイムＱ１０（ＣｏＱ１０）を用いた治療に反応するかどうかを予測する方法であって、（ａ）生物学的試料を、ＰＤＩＡ３に選択的に結合する試薬と接触させること、（ｂ）試薬とＰＤＩＡ３の間で複合体を形成させること、（ｃ）複合体のレベルを検出すること、及び（ｄ）複合体のレベルを所定の閾値と比較することを含み、ＰＤＩＡ３のレベルが所定の閾値よりも高いことが、当該対象が、ＣｏＱ１０を用いた癌の治療に反応する可能性が高いことを示す方法を提供する。

一実施形態では、試薬が抗ＰＤＩＡ３抗体である。別の実施形態では、抗体が、検出可能な標識を含む。別の実施形態では、複合体のレベルを検出するステップがさらに、複合体を検出可能な２次抗体と接触させること、及び２次抗体のレベルを測定することを含む。

他の実施形態では、複合体のレベルが、免疫学的アッセイ又はＥＬＩＳＡによって決定される。

いくつかの実施形態では、癌が固形腫瘍である。他の実施形態では、癌が、扁平上皮癌（squamous cell carcinoma）、膠芽腫（glioblastoma）及び膵臓癌からなる群から選択される。

ある種の実施形態では、本発明の方法がさらに、ＰＤＩＡ３のレベルが所定の閾値よりも高い場合に対象にＣｏＱ１０を投与することを含む。一実施形態では、対象が、以前に投与されたＣｏＱ１０ではない。

いくつかの実施形態では、本発明の方法がさらに、対象から生物学的試料を取得することを含む。

別の態様では、本発明が、対象の癌を治療する方法であって、（ａ）対象から生物学的試料を取得すること、（ｂ）対象の生物学的試料を提出して、ＰＤＩＡ３のレベルに関する診断情報を取得すること、（ｃ）生物学的試料中のＰＤＩＡ３のレベルが閾値レベルよりも高い場合に治療上有効な量のＣｏＱ１０を対象に投与することを含む方法を提供する。

別の態様では、本発明が、対象の癌を治療する方法であって、（ａ）対象の生物学的試料中のＰＤＩＡ３のレベルに関する診断情報を取得すること、及び（ｂ）生物学的試料中のＰＤＩＡ３のレベルが閾値レベルよりも高い場合にＣｏＱ１０を対象に投与することを含む方法を提供する。

別の態様では、本発明が、対象の癌を治療する方法であって、（ａ）ＰＤＩＡ３のレベルに関する診断情報を同定する際に使用する生物学的試料を対象から取得すること、（ｂ）対象の生物学的試料中のＰＤＩＡ３のレベルを測定すること、（ｃ）ＰＤＩＡ３のレベルが閾値レベルよりも高い場合に、ＣｏＱ１０を対象に投与するよう健康管理提供者に推奨することを含む方法を提供する。

いくつかの実施形態では、治療する癌が固形腫瘍である。他の実施形態では、治療する癌が、扁平上皮癌、膠芽腫及び膵臓癌からなる群から選択される。

一実施形態では、ＰＤＩＡ３のレベルが、（ｉ）生物学的試料を、ＰＤＩＡ３に選択的に結合する試薬と接触させてバイオマーカー複合体を形成させること、及び（ｉｉ）バイオマーカー複合体を検出することによって決定される。ある種の実施形態では、試薬が、ＰＤＩＡ３の少なくとも１つのエピトープに選択的に結合する抗ＰＤＩＡ３抗体である。

他の実施形態では、ＰＤＩＡ３のレベルが、生物学的試料中のＰＤＩＡ３ｍＲＮＡの量を測定することによって決定される。ある種の実施形態では、生物学的試料中のＰＤＩＡ３ｍＲＮＡの量を測定するために増幅反応が使用される。一実施形態では、増幅反応が、（ａ）ポリメラーゼ連鎖反応（ＰＣＲ）、（ｂ）核酸配列に基づく増幅アッセイ（ＮＡＳＢＡ）、（ｃ）転写媒介増幅（ＴＭＡ）、（ｄ）リガーゼ連鎖反応（ＬＣＲ）又は（ｅ）鎖置換増幅（ＳＤＡ）である。

一実施形態では、生物学的試料中のＰＤＩＡ３ｍＲＮＡの量を測定するためにハイブリダイゼーションアッセイが使用される。ある種の実施形態では、ＰＤＩＡ３ｍＲＮＡを検出するために、ハイブリダイゼーションアッセイにおいてＰＤＩＡ３ｍＲＮＡの一部分と相補的なオリゴヌクレオチドが使用される。

別の態様では、本発明が、癌を有しＣｏＱ１０を用いた治療を必要としている対象の生物学的試料中のＰＤＩＡ３を検出するためのキットであって、対象の生物学的試料中のＰＤＩＡ３のレベルを測定するための少なくとも１つの試薬と、対象の生物学的試料中のＰＤＩＡ３のレベルを測定するための一組の説明書とを含むキットを提供する。

一実施形態では、試薬が抗ＰＤＩＡ３抗体である。別の実施形態では、キットがさらに、抗ＰＤＩＡ３抗体を検出する手段を含む。ある種の実施形態では、抗ＰＤＩＡ３抗体を検出する手段が、検出可能な２次抗体である。一実施形態では、試薬が、ＰＤＩＡ３ｍＲＮＡと相補的なオリゴヌクレオチドである。

一実施形態では、説明書が、生物学的試料中のＰＤＩＡ３レベルを検出するための免疫学的アッセイ又はＥＬＩＳＡを記述する。別の実施形態では、説明書が、生物学的試料中のＰＤＩＡ３レベルを検出するための質量分析アッセイを記述する。別の実施形態では、命令が、生物学的試料中のＰＤＩＡ３ｍＲＮＡのレベルを検定するための増幅反応を記述する。

一実施形態では、生物学的試料中のＰＤＩＡ３ｍＲＮＡの量を決定するために増幅反応が使用される。ある種の実施形態では、増幅反応が、ポリメラーゼ連鎖反応（ＰＣＲ）、核酸配列に基づく増幅アッセイ（ＮＡＳＢＡ）、転写媒介増幅（ＴＭＡ）、リガーゼ連鎖反応（ＬＣＲ）又は鎖置換増幅（ＳＤＡ）である。

一実施形態では、説明書が、生物学的試料中のＰＤＩＡ３ｍＲＮＡの量を決定するためのハイブリダイゼーションアッセイを記述する。

別の実施形態では、キットがさらに、ＰＤＩＡ３ｍＲＮＡの一部分と相補的な少なくとも一種のオリゴヌクレオチドを含む。

一実施形態では、説明書がさらに、対象の生物学的試料中のＰＤＩＡ３のレベルをＰＤＩＡ３の閾値と比較することを記述する。別の実施形態では、説明書がさらに、対象の生物学的試料中のＰＤＩＡ３のレベルとＰＤＩＡ３の閾値との比較に基づいて、ＣｏＱ１０を用いて治療する対象を選択することを記述する。

添付図面の図には本開示が例として示されており、添付図面の図は本開示を限定するものではない。添付図面では、特に記載がない限り、同様の参照符号が同様の要素を示す。

いくつかの実施形態に基づく、分子的プロファイルデータと臨床記録データとを統合して候補バイオマーカーを生成する方法のフロー図である。いくつかの実施形態に基づく、本明細書に記載された方法を実施するためのシステムを示す概略ネットワーク図である。いくつかの実施形態に基づく、本明細書に記載された方法を実施するためのモジュールを含むシステムを概略的に示すブロック図である。いくつかの実施形態に基づく、臨床試験によって取得されたデータを分析する方法のフロー図である。一実施形態に基づく、単一のデータフレームに併合された多数のバッチからの多数の注釈付きプロテオミクスデータファイルを示す図である。一実施形態に基づく、どのタンパク質がフィルタリングされるのかを示すフィルタリング前のプロテオミクスデータファイルを示す図であり、このフィルタリングでは、６０％を超える試料に欠測値を含むタンパク質が除外される。図７Ａは、正規化前の試料にわたるプロテオミクス発現データの箱ひげ図（ｂｏｘｐｌｏｔ）である。図７Ｂは、一実施形態に基づく、６０ｌｅｓｓ法による正規化後の図７Ａのプロテオミクス発現データの箱ひげ図である。一実施形態に基づく、正規化されたプロテオミクスデータセット中の欠測データが代入されたデータセットを示す図である。一実施形態に基づく、構造リピドミクスデータセット中の欠測データが代入されたデータセットを示す図である。一実施形態に基づく、構造リピドミクスデータセットに適用された正規化プロセスを示す４つのグラフであり、これらのグラフは、脂質クラスの未処理ｌｏｇ_２値（左上）、ｇｌｏｇによって変換された脂質クラスの脂質値（右上）、存在量（abundance）の変動係数（左下）、及び中央値に中心を置くｇｌｏｇ変換された脂質値（右下）を含む。一実施形態に基づく、シグナリング（signaling）リピドミクスデータセット中の欠測データが代入されたデータセットを示す図である。一実施形態に基づく、シグナリングリピドミクスデータセットに適用された正規化プロセスを示す４つのグラフであり、これらのグラフは、脂質クラスの未処理ｌｏｇ_２値（左上）、ｇｌｏｇによって変換された脂質クラスの脂質値（右上）、存在量の変動係数（左下）、及び中央値に中心を置くｇｌｏｇ変換された脂質値（右下）を含む。一実施形態に基づく、単一のデータフレームに併合される多数の尿プロテオミクスバッチからの注釈付きデータファイルを示す図である。一実施形態に基づく、どのタンパク質がフィルタリングされるのかを示すフィルタリング前の尿プロテオミクスデータセットを示す図であり、このフィルタリングでは、７５％を超える試料に欠測値を含むタンパク質が除外される。図１５Ａは、一実施形態に基づく、正規化前の尿プロテオミクスデータを示す図である。図１５Ｂは、一実施形態に基づく、水分補給の差に起因する分散を低減させる手法によって正規化された後の尿プロテオミクスデータを示す図である。一実施形態に基づく、正規化された尿プロテオミクスデータセット中の欠測データが代入されたデータセットを示す図である。一実施形態に基づく、どの代謝産物値がフィルタリングされるのかを示すフィルタリング前のメタボロミクスデータセットを示す図であり、このフィルタリングでは、６０％を超える試料に欠測値を含む代謝産物が除外される。一実施形態に基づく、メタボロミクスデータセット中の欠測データが代入されたメタボロミクスデータを示す図である。図１９Ａは、正規化前の試料にわたるメタボロミクスデータのグラフである。図１９Ｂは、一実施形態に基づく、６０−ｌｅｓｓ法による正規化後の試料にわたるメタボロミクスデータのグラフである。一実施形態に基づく、単一のデータフレームに併合された多数のバッチ及びデータ源からの注釈付き代謝産物データファイルを示す図である。一実施形態に基づく、リピドミクスデータの平均絶対偏差（mean absolute deviation：ＭＡＤ）の対数値の度数のグラフ（上）、及び４５パーセンタイルカットオフを示す線を有する、さまざまな脂質のｌｏｇ（ＭＡＤ）値のパーセンタイルのグラフ（下）である。このカットオフよりも低い変動性を有する脂質は不変の脂質とみなされ、除去される。一実施形態に基づく、完全な（スライスされていない）データセットを表すベイジアンネットワークの集合（ensemble）から形成されたベイジアンネットワークであって、視覚化前の集合に２０％のエッジ頻度フィルタを適用したベイジアンネットワークを示す図である。一実施形態に基づく、ネットワークトポグラフィの分析から決定された例示的な結果動因（潜在的バイオマーカー）の第１の第１度の近傍（first-degree neighbors）を示す、図２２のベイジアンネットワークのサブネットワーク（sub-network）を示す図である。一実施形態に基づく、ネットワークトポグラフィの分析から決定された第２の例示的な結果動因（潜在的バイオマーカー）の第１の第１度の近傍を示す、図２２のベイジアンネットワークの第２のサブネットワークを示す図である。一実施形態に基づく、血液及びリンパ系障害に関係した重度の有害事象（severe adverse event）を患者が経験している間に患者から収集されたデータを含むスライスされたデータセットから生成されたベイジアンネットワークの集合から形成されたベイジアンネットワークを示す図である。この集合には、視覚化前に４０％のエッジ頻度フィルタを適用した。一実施形態に基づく、血液及びリンパ系障害に関係した重度の有害事象を患者が経験していない間に患者から収集されたデータを含むスライスされたデータセットから生成されたベイジアンネットワークの集合から形成されたベイジアンネットワークを示す図である。この集合には、視覚化前に４０％のエッジ頻度フィルタを適用した。一実施形態に基づく、血液及びリンパ系障害に関係した重度の有害事象の存在（図２５）又は不在（図２６）に起因するネットワークの対から生成された差次的（デルタ）ネットワークを示す図である。一実施形態に基づく、例示的な患者の例示的な患者ダッシュボード（patient dashboard）を示す図であり、左上から時計回りに:患者の年齢(age)、性別(gender)、人種(race)、最初の腫瘍の部位、割り当てられた治療群(treatment arm)、試験の時間の長さ、最終治療サイクル(treatment cycle)及び腫瘍反応及び素質事象；この患者が受けた以前の治療のサブセット；クレアチンレベル、プロトロンビン時間及びＥＣＯＧ成績；試験中に経験されたグレード３の有害事象；試験中に経験されたグレード２の有害事象；試験中に経験されたグレード１の有害事象；試験参加中のプロトロンビン時間及び血中尿素窒素レベル；試験参加中のグルコース、ヘマトクリット、アスパラギン酸アミノトランスフェラーゼ、アラニンアミノトランスフェラーゼレベル；試験参加中に測定されたＣｏＱ１０血漿濃度；腫瘍反応（ＲＥＣＩＳＴ）によって着色された試験参加中の腫瘍測定の幾何平均である。全ての図で、ＣｏＱ１０の注入は灰色の陰影によって示されている。２サイクル目の始まりは縦の破線によって示されている。一実施形態に基づく、ＣｏＱ１０臨床試験の全ての患者試料の利用可能なオミクスデータを視覚化する（例えばウェブページとして実施された）例示的な試料マップを示す図である。一実施形態に基づく、試験に参加した全ての患者に対して実施された腫瘍サイズ測定の対話式視覚化を提供する（例えばウェブページとして実施された）例示的な対話式患者マップを示す図である。腫瘍サイズは、初期腫瘍サイズに対する百分率としてプロットされている。一実施形態に基づく、治療前に測定された患者反応を予測するコンパニオン診断バイオマーカー（companion diagnostic biomarker）（ＣＤｘマーカー）を示す箱ひげ図である。一実施形態に基づく、治療前に測定された重度の有害事象を予測するＣＤｘマーカーを示す箱ひげ図である。一実施形態に基づく、患者反応に影響を与える主要な動因を含むベイジアンネットワークの部分を概略的に示す図である。一実施形態に基づく、有害事象に影響を与える主要な動因を含むベイジアンネットワークの部分を概略的に示す図である。一実施形態に基づく、治療開始前に測定された重度の有害事象を予測する候補ＣＤｘマーカーを示す箱ひげ図であり、差次的発現による上位１０個のマーカーを含む図である。実施例１における、固形腫瘍の治療に関するコエンザイムＱ１０（ＣｏＱ１０）フェーズＩ臨床試験における治療群の概要を概略的に示す図である。この試験は、最大耐量（maximum tolerated dose：ＭＴＤ）を決定するために、コエンザイムＱ１０単独治療（monotherapy）（Ｍｏｎｏ）群及び併用治療（combination therapy）群を含み、併用治療群では、コエンザイムＱ１０を、標準化学療法剤ゲムシタビン（gemcitabine：ＧＥＭ）、５−フルオロウラシル（5-fluorouracil：５−ＦＵ）及びドセタキセル（docetaxel：ＤＯＣ）と一緒に投与する。実施例１における、手術を受け、それぞれイリノテカン及びアバスチンと組み合わせた複数のＦＯＬＦＩＲＩ及びＦＯＬＦＯＸレジメンで重く予備的に治療された転移性虫垂癌を有する患者のコエンザイムＱ１０単独治療前及びコエンザイムＱ１０単独治療後２、１０、１９及び２９週のＦＤＧ−ＰＥＴスキャンを示す図である。コエンザイムＱ１０単独治療は、６６ｍｇ／ｋｇの用量で開始し、２２週に８８ｍｇ／ｋｇ用量に移行した。実施例１における、固形腫瘍の治療に関するコエンザイムＱ１０（ＣｏＱ１０）フェーズＩ臨床試験に参加した患者のサンプリング及びＦＤＧＰＥＴ−スキャンのスケジュールの概要を概略的に示す図である。図３９Ａは、実施例１における、２７４ｍｇ／ｋｇ／週又は３４２ｍｇ／ｋｇ／週のコエンザイムＱ１０単独治療によって治療された患者の血漿中のコエンザイムＱ１０の平均濃度を示す図である。図３９Ｂは、実施例１における、コエンザイムＱ１０と標準化学療法との併用治療によって治療された患者の血漿中のコエンザイムＱ１０の平均濃度を示す図である。コエンザイムＱ１０の用量は２２０ｍｇ／ｋｇ／週又は２７４ｍｇ／ｋｇ／週とした。図３９Ａと図３９Ｂのデータの比較を示す図である。図４０Ａは、実施例１における、固形腫瘍の治療に関するコエンザイムＱ１０フェーズＩ臨床試験に参加した患者の人口統計的情報及び試験結果の概要を示す図である。図４０Ｂは、実施例１における、参加時間に対する患者の腫瘍サイズの進行を示す図である。図４０Ｃは、実施例１における、患者の血中グルコース（ＧＬＵＣ）、ヘマトクリット（ＨＣＴ）、アスパラギン酸トランスアミナーゼ（ＡＳＴ）及びアラニントランスアミナーゼ（ＡＬＴ）比の検査室測定値を示す図である。図４０Ｄは、実施例１における、臨床試験に参加している間に患者が示した有害事象を示す図である。コエンザイムＱ１０を用いた治療の前後の患者のＦＤＧ−ＰＥＴスキャンを示す図である。実施例１における、候補バイオマーカーを同定するデータ分析プロセスの概要を概略的に示す図である。実施例１に関する、図４１のプロセスの結果の概要を示す図であり、この図は、最初のコエンザイムＱ１０治療前に測定された血液中の差次的に発現された分子のうち、コエンザイムＱ１０治療の効能を潜在的に予測する可能性がある上位１０個の分子を示す箱ひげ図を含む。患者は、分析のために総合的臨床的利益（overall clinical benefit）群と非臨床的利益（no clinical benefit）群とに層別化された。実施例１に関する、候補バイオマーカーであるタンパク質ジスルフィドイソメラーゼＡ３（ＰＤＩＡ３）のバイオネットワーク（bionetwork）を示す図である。実施例１における、全ての患者のデータから生成されたベイジアン因果関係ネットワークと、変数である腫瘍サイズに関係したネットワークの一部分とを概略的に示す図である。実施例１における、反応性（総合的臨床的利益）患者及び非反応性（非臨床的利益）患者の時間ゼロにおける分子的プロファイルデータのセグメント化を概略的に示す図である。実施例１における、異なって発現された分子を同定するための、反応性（総合的臨床的利益）患者及び非反応性（非臨床的利益）患者の時間ゼロにおける分子的プロファイルデータの分析を概略的に示す図である。実施例１における、患者反応を予測すると同定された時間ゼロ変数の発現のグラフである。実施例２における、完全データセットから学習されたベイジアンネットワークから獲得された腫瘍反応（ＲＳＯＲＲＥＳ）の動因を示す図である。実施例２における、９６時間注入スケジュールの１サイクル目の患者データから学習されたベイジアンネットワークから獲得されたＣｏＱ１０の作用機序に対する洞察を示す図である。本明細書に記載されたシステム及び方法のいくつかの実施形態を実施する目的に使用することができるコンピューティングデバイスのブロック図である。

本明細書に記載されたいくつかの方法は、特定の薬物の治療の効能、患者の病歴、並びに治療前、治療中及び治療後の患者の分子的プロファイルデータを含む広範囲の医療データを効率的に統合して、これらの因子間の新規の関係を識別することを可能にする。例えば、患者から取得した試料をオミクス技術を使用して分析することにより、治療の経過の全体にわたって、タンパク質、脂質及び代謝産物レベルの幅広い規模の分析を実行することが可能である。いくつかの実施形態では、これらのオミクスデータを、人口統計的情報、病歴、治療の効能の測定及び投与された薬物の薬物動態などの他の臨床データと組み合わせて、薬物に対する患者反応を示す潜在的バイオマーカーを同定する。これらの潜在的バイオマーカーを、ある範囲の異なる用途に使用することができる。そのような用途には、薬物によって効果的に治療される可能性が高い患者又は薬物に反応して有害事象を経験する可能性が高い患者を選択することが含まれる。

本明細書に記載された実施形態は、作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定する方法、システム及びコンピュータ可読媒体、並びに例えば後続の臨床試験において患者を層別化する方法、システム及びコンピュータ可読媒体、又は臨床的治療を施す患者を選択する方法、システム及びコンピュータ可読媒体を含む。いくつかの実施形態は、複数の対象に作用剤を投与する前、投与している間、及び／又は投与した後に採取された試料の測定により取得された臨床記録データ及び分子的プロファイルデータを処理及び統合し、統合されたデータを分析して、作用剤の投与に関係した臨床的結果（例えば作用剤の効能、作用剤に関係した有害事象）の１つ以上の潜在的バイオマーカーを同定する方法及びシステムを提供する。いくつかの実施形態では、この分析が、統合されたデータのスライスから関係ネットワーク（例えば因果関係ネットワーク、ベイジアンネットワーク又はベイジアン因果関係ネットワーク）を生成すること、及びそれらの因果関係ネットワークのトポロジ特徴を分析することを含む。いくつかの実施形態では、因果関係ネットワークのトポロジ特徴の分析により、対象反応を決定するためのｉｎｓｉｌｉｃｏ計算診断患者マップが生成される。いくつかの実施形態では、作用剤の投与に対する患者反応を予測する目的に、作用剤の投与に関係した臨床的結果の同定された潜在的バイオマーカーが使用される。いくつかの実施形態では、臨床試験の部分として作用剤が対象に投与される。潜在的バイオマーカー、及びスライスされた統合後の分子的プロファイルデータと臨床記録データの分析は、例えば後続の臨床試験において患者を層別化するための情報、又は臨床的治療を施す患者を選択するための情報を提供しうる。

以下の説明は、本明細書に記載の方法及びシステムを当業者が作製し使用できるようにするために提示するものである。実施形態に対する様々な変形は、当業者にとって明らかである。本明細書が定義する一般原理は、本発明の原理と範囲から逸脱することなく、他の実施形態や用途に対して適用することができる。以下の説明において、説明のため様々な詳細部分を記載している。しかし、そのような特定の詳細部分がなくとも本発明を実施できることを、当業者は理解するであろう。したがって本文書は、実施形態を限定するためのものではなく、本明細書の原理と特徴に準じて最も広く解釈されるべきである。

定義

本明細書で使用するとき、具体的に定義することを意図しているが本明細書の他の部分においてまだ定義されていないいくつかの用語を、ここで定義する。

本明細書で使用するとき、用語「統合したデータセットをスライス（スライシング）する」とは、１以上の基準を用いて統合データの１つ以上のサブセットを選択することを指す。本明細書で使用するとき、用語「スライスされたデータセット」又は「データセットのスライス」とは、スライス操作から得られる統合データセットのサブセットであるデータセットを指し、本明細書では選択されたデータセットとも呼ばれる。

冠詞「a」及び「an」は、冠詞の文法的目的語のうち１種又は２種以上（すなわち、少なくとも１種）を指すために本明細書で使用される。例として「要素（an element）」は、１種の要素又は２種以上の要素を意味する。

用語「包含する（挙げられる）（including）」は、語句「包含するがこれに限定されない」を意味するために本明細書で使用され、これと互換的に用いられている。

用語「又は」は、文脈がこれ以外を明らかに示さない限り、用語「及び／又は」を意味するために本明細書で使用され、これと互換的に用いられている。

用語「等（例えば）（such as）」は、語句「等が挙げられるがこれに限定されない」を意味するために本明細書で使用され、これと互換的に用いられている。

用語「マイクロアレイ」は、紙、ナイロン若しくは他の種類の膜、フィルター、チップ、ガラススライド又はその他の適した固体支持体等、基板上に合成された別個のポリヌクレオチド、オリゴヌクレオチド、ポリペプチド（例えば、抗体）又はペプチドのアレイを指す。

用語「障害」及び「疾患」は、包括的に用いられ、身体のいずれかの部分、器官又は系（又はこれらのいずれかの組み合わせ）の正常構造又は機能からの何らかの逸脱を指す。特定の疾患は、生物学的、化学的及び物理学的変化を包含する特徴的な症状及び兆候により顕在化され、多くの場合、人口統計学的、環境的、職業的（employment）、遺伝的及び病歴的因子が挙げられるがこれらに限定されない種々の他の因子に関連する。特定の特徴的な兆候、症状及び関係する因子を種々の方法により定量化して、重要な診断情報を得ることができる。

本明細書で使用するとき、「癌」とは、ヒトに見られる、あらゆる種類の癌又は新生物又は悪性腫瘍を指し、限定されるものではないが、白血病、リンパ腫、黒色腫、癌腫及び肉腫が挙げられる。本明細書で使用するとき、「癌」、「新生物」及び「腫瘍」なる用語又は言葉は、互換的に、及び単数又は複数形で使用され、これらを宿主生物に対して病的にする悪性形質転換を受けた細胞を指す。原発性癌細胞（すなわち、悪性形質転換部位の近傍から得られた細胞）は、十分に確立された技術、特に組織学的検査により、非癌性細胞と容易に区別することができる。癌細胞の定義は、本明細書で使用するとき、原発性癌細胞だけでなく、癌幹細胞、並びに癌前駆細胞又は癌細胞の祖先に由来する任意の細胞も含む。これは、転移した癌細胞、癌細胞由来のｉｎｖｉｔｒｏ培養物及び細胞株を含む。「固形腫瘍」は、例えば、ＣＡＴスキャン、ＭＲイメージング、Ｘ線、超音波若しくは触診などの手法によって腫瘍塊を基準にして検出可能であり、及び／又は患者から得ることができる試料中の１種以上の癌特異的抗原の発現に起因して検出可能である腫瘍である。腫瘍は、測定可能な寸法を有する必要はない。

用語「発現」は、ＤＮＡ等のポリヌクレオチドからポリペプチドが産生されるプロセスを包含する。このプロセスは、遺伝子からｍＲＮＡへの転写及びこのｍＲＮＡからポリペプチドへの翻訳を含み得る。「発現」は、これが用いられる文脈に応じて、ＲＮＡ、タンパク質又はその両方の産生を指すことができる。

用語「遺伝子の発現のレベル」又は「遺伝子発現レベル」は、細胞におけるｍＲＮＡ並びにプレｍＲＮＡ新生転写物（複数可）、転写物プロセシング中間体、成熟ｍＲＮＡ（複数可）及び分解産物のレベル、あるいは遺伝子にコードされるタンパク質のレベルを指す。

用語「ゲノム」は、生物学的実体（細胞、組織、器官、系、生物）の遺伝情報の全体を指す。これは、ＤＮＡ又はＲＮＡ（例えば、特定のウイルスにおける）のいずれかにおいてコードされる。ゲノムは、ＤＮＡの遺伝子及び非コード配列の両方を包含する。

用語「プロテオーム」は、所定の時間においてゲノム、細胞、組織又は生物により発現されるタンパク質の全セットを指す。より具体的には、これは、所定の時間に定義された条件下で所定の種類の細胞又は生物において発現されたタンパク質の全セットを指すことができる。プロテオームは、例えば、遺伝子の選択的スプライシング及び／又は翻訳後修飾（グリコシル化又はリン酸化等）によるタンパク質バリアントを包含することができる。

用語「トランスクリプトーム」は、所定の時間において１個の細胞又は細胞集団において産生される、ｍＲＮＡ、ｒＲＮＡ、ｔＲＮＡ、及び他の非コードＲＮＡを包含する転写されたＲＮＡ分子の全セットを指す。この用語は、所定の生物における転写物の総セット、又は特定の細胞型に存在する転写物の特異的なサブセットに適用することができる。所定の細胞株に緩やかに固定された（突然変異を除く）ゲノムとは異なり、トランスクリプトームは、外部環境条件に伴って変動し得る。これは、細胞におけるあらゆるｍＲＮＡ転写物を包含するため、トランスクリプトームは、転写減衰等、ｍＲＮＡ分解現象を例外として、所定の時間において活発に発現されている遺伝子を反映する。

発現プロファイリングとも称されるトランスクリプトミクスの研究は、多くの場合、ＤＮＡマイクロアレイ技術に基づくハイスループット技法を用いて、所定の細胞集団におけるｍＲＮＡの発現レベルを試験する。

用語「メタボローム」は、所定の時間に所定の条件下で、生物学的試料内に見出された小分子代謝物（代謝性中間体、ホルモン及び他のシグナル伝達分子並びに二次代謝物等）の完全セットを指す。メタボロームは動的であり、刻一刻と変化し得る。

用語「リピドーム（lipidome）」は、所定の時間に所定の条件下で、生物学的試料内に見出された脂質の完全セットを指す。リピドームは動的であり、刻一刻と変化し得る。

本明細書で使用するとき、作用剤（物質）は対象に投与される何かを意味する。用語「作用剤（agent）」には、限定されるものではないが、疾患又は障害のための治療又は可能性ある治療、及び疾患又は障害の治療のための可能性ある又は公知の医薬剤が挙げられる。

本出願において明確に定義されていない他の用語は、当業者によって理解され得る意義を有する。

下の説明は、一部において個別のステップとして提示されているが、これは例証目的及び単純性のためであり、よって、現実的には、ステップのかかる厳正な順序及び／又は区分を暗示しない。更に、本発明のステップは別々に実施することができ、本明細書に提供されている本発明は、個々のステップそれぞれ別々を、また、残りのステップと独立的に行ってよい１種以上のステップ（例えば、いずれか１、２、３、４、５、６又は全７ステップ）の組み合わせを包含することが企図されている。

図１は、例示的な実施形態に基づく、分子的プロファイルデータと臨床記録データとを統合して、作用剤の投与に関係した臨床的結果の潜在的バイオマーカーを生成する方法１００の例示的なフロー図を示す。この方法は、コンピュータによって実施される方法（computer-implemented method）である。以下では、方法１００を実施する例示的なシステムを、図２、３及び４９に関して説明する。しかしながら、他の１つ以上のシステムを使用してこの方法を実施することもできることを当業者は理解する。

ステップ１０２で、複数の対象のうちのそれぞれの対象の分子的プロファイルデータを処理する。いくつかの実施形態では、それぞれの対象の分子的プロファイルデータが、当該対象から取得した複数の試料の分析によって生成されたプロテオミクス、メタボロミクス、リピドミクス、ゲノミクス、トランスクリプトミクス、マイクロアレイ及び配列決定データのうちの１つ以上のデータを含む。いくつかの実施形態では、それぞれの対象の分子的プロファイルデータが、当該対象から取得した複数の試料の分析によって生成されたプロテオミクス、メタボロミクス、リピドミクス、ゲノミクス、トランスクリプトミクス、マイクロアレイ及び配列決定データのうちの２つ以上のデータを含む。いくつかの実施形態では、それぞれの対象の分子的プロファイルデータが、当該対象から取得した複数の試料の分析によって生成されたプロテオミクス、メタボロミクス、リピドミクス、ゲノミクス、トランスクリプトミクス、マイクロアレイ及び配列決定データのうちの３つ以上のデータを含む。

それぞれの対象について、これらの複数の試料は、当該対象に作用剤を投与する前、投与している間及び／又は投与した後に取得した試料を含む。例えば、いくつかの実施形態では、これらの複数の試料が、当該対象に作用剤を投与する前及び投与している間に取得した試料を含む。いくつかの実施形態では、これらの複数の試料が、当該対象に作用剤を投与している間及び投与した後に取得した試料を含む。いくつかの実施形態では、これらの複数の試料が、当該対象に作用剤を投与する前及び投与した後に取得した試料を含む。いくつかの実施形態では、これらの複数の試料が、当該対象に作用剤を投与する前、投与している間及び投与した後に取得した試料を含む。

いくつかの実施形態では、この作用剤が、疾患又は障害に対する潜在的な治療法として評価されている。いくつかの実施形態では、この作用剤が、臨床試験の部分としてこれらの複数の対象に投与される。いくつかの実施形態では、この作用剤が、フェーズＩ臨床試験の部分としてこれらの複数の対象に投与される。いくつかの実施形態では、この方法が、これらの複数の対象にこの作用剤を投与することを含む。

いくつかの実施形態では、それぞれの対象からの試料が、血液、組織、尿、分泌物、汗、痰、糞便及び粘液試料、並びにこれらの試料の培養物のうちの１つ以上を含む。いくつかの実施形態では、それぞれの対象からの試料が、血液、組織、尿、分泌物、汗、痰、糞便及び粘液試料、並びにこれらの試料の培養物のうちの２つ以上を含む。いくつかの実施形態では、血液試料が、全血、血清、血漿及びバフィーコート（buffy coat）からなる群から選択される。いくつかの実施形態では、組織が、生検によって取得される。ある種の実施形態では、組織が腫瘍組織である。

いくつかの実施形態では、この方法がさらに、対象ごとに、当該対象から取得した複数の試料を分析して分子的プロファイルデータを取得することを含む。分子的プロファイルデータを取得する方法のさらなる説明は、「分子的プロファイルデータの生成」と題された後の項に出ている。

いくつかの実施形態では、分子的プロファイルデータを処理することが、複数の対象に対する治療の過程中の異なる時点において収集されたデータを組み合わせること、フィルタにかけて、まれにしか測定されなかった変数を除外すること、データの測定中に利用された異なるバッチ間で試料が比較可能であることを保証するために、系統的偏り（systematic bias）を除去することによってデータを正規化すること、及び複数の対象のうちの特定の対象に対して測定されなかった変数を代入することのうちの１つ以上を含む。分子的プロファイルデータの処理の追加の説明は、「オミクスデータ処理」と題された後の項に出ている。

ステップ１０４で、これらの複数の対象の臨床記録データを処理する。本明細書では臨床記録データを「臨床データ」とも呼ぶ。それぞれの対象の臨床記録データは、作用剤を投与する前、投与している間及び／若しくは投与した後に当該対象から取得した試料並びに／又は作用剤を投与する前、投与している間及び／若しくは投与した後に実施した当該対象の測定に基づくデータを含む。例えば、いくつかの実施形態では、臨床記録データが、当該対象に作用剤を投与する前及び投与している間に取得した試料に基づくデータを含む。いくつかの実施形態では、臨床記録データが、当該対象に作用剤を投与している間及び投与した後に取得した試料に基づくデータを含む。いくつかの実施形態では、臨床記録データが、当該対象に作用剤を投与する前及び投与した後に取得した試料に基づくデータを含む。いくつかの実施形態では、臨床記録データが、当該対象に作用剤を投与する前、投与している間及び投与した後に取得した試料に基づくデータを含む。いくつかの実施形態では、臨床記録データが、当該対象に作用剤を投与する前及び投与している間に実施した当該対象の測定に基づくデータを含む。いくつかの実施形態では、臨床記録データが、当該対象に作用剤を投与している間及び投与した後に実施した当該対象の測定に基づくデータを含む。いくつかの実施形態では、臨床記録データが、当該対象に作用剤を投与する前及び投与した後に実施した当該対象の測定に基づくデータを含む。いくつかの実施形態では、臨床記録データが、当該対象に作用剤を投与する前、投与している間及び投与した後に実施した当該対象の測定に基づくデータを含む。

臨床記録データは、対象から取得した試料に対して実施された臨床的測定、及び／或いは対象の全般的な健康状態の評価又は関心の疾患若しくは障害の状態の評価に関連する、対象に対して実施された臨床的測定を含む。例えば、全般的な健康状態の評価に関する臨床的測定は、体重、身長、ボディーマスインデックス（ＢＭＩ）、グルコースレベル、コレステロールレベル、血圧及びこれらの変化のうちの一部又は全部を含む。例えば、癌の状態の評価に関する臨床的測定は、腫瘍サイズ、ＰＥＴスキャン、ＦＤＥ−ＰＥＴスキャン、癌生検、潜在的な癌治療薬又は知られている癌治療薬の薬物動態、血中グルコース（ＧＬＵＣ）、ヘマトクリット（ＨＣＴ）、アスパラギン酸トランスアミナーゼ（ＡＳＴ）、アラニントランスアミナーゼ（ＡＬＴ）のレベル、及びこれらの変化のうちの一部又は全部を含む。いくつかの実施形態では、臨床記録データが、対象の病歴データ及び／又は人口統計的データを含む。人口統計的データは、限定はされないが、年齢、性及びエスニシティ（ethnicity）のうちの１つ又は全部を含む。臨床記録データは臨床的結果データを含む。いくつかの実施形態では、臨床的結果データが、疾患又は障害の治療に対する作用剤の効能に関係したデータを含む。例えば、臨床的結果データは、治療前、治療中及び／又は治療後の特定の時刻における対象の疾患又は障害の状況又は状態に関するデータを含みうる。いくつかの実施形態では、臨床的結果データが、作用剤の投与に関連した有害事象に関係したデータを含む。例えば、臨床的結果データは、作用剤の投与中又は投与後の有害事象の発生に関係した情報を含みうる。いくつかの実施形態では、作用剤が、疾患又は障害の治療又は潜在的治療であり、臨床的結果データが、作用剤を用いた治療に反応して対象が総合的臨床的利益を示したのか又は臨床的利益を示さなかったのかを示すデータを含む。実施形態では、臨床記録データが、従来の病歴記録から又はモバイルウェアラブルデバイスから検索又は取得される。

いくつかの実施形態では、臨床記録データがさらに、薬物動態データ、病歴データ、臨床検査データ、人口統計的データ及びモバイルウェアラブルデバイスからのデータのうちの１つ以上のデータを含む。

いくつかの実施形態では、臨床データが臨床データモニタによって提供される。臨床データの処理が、分子的プロファイルデータと臨床記録データの効率的な統合を可能にすることがある。例えば、臨床データは、異なる対象に対して標準化する必要がある多数の異なるフォーマット（例えばナラティブ（narrative）、連続（continuous）、離散（discrete）、ブール（Boolean））で提供されることがある。臨床データの処理の追加の説明は後の図４の説明に出ている。

ステップ１０６で、処理された分子的プロファイルデータと処理された臨床記録データとを統合し、併合データとしてデータベースに記憶する。いくつかの実施形態では、処理された分子的プロファイルデータと処理された臨床記録データとを統合することが、重複した臨床記録データを照合し、相違点を解消することを含む。いくつかの実施形態では、処理された分子的プロファイルデータと処理された臨床記録データとを統合することが、併合データをフィルタにかけて、対応する臨床記録データを欠く分子的データを除外することを含む。いくつかの実施形態では、異なる頻度でデータタイプが収集されるため、必要に応じて、腫瘍サイズなどの定量的な全ての臨床記録が、補間（例えば線形補間）によってオミクス試料の時点にマッチングされる。いくつかの実施形態では、特定の対象について、薬物動態（ＰＫ）用の試料と分子的プロファイルデータ用の試料とが同じ時点において（例えば同じ日に）取得される。このことは、臨床データと分子的プロファイルデータとの統合を助け、分子的プロファイル試料の収集に対応する時点に対して補間されたＰＫ値を求める必要性を回避する。

処理された臨床データと処理された記録データの統合の追加の説明は後の図４の説明に出ている。

ステップ１０８で、臨床記録データから取得した１つ以上の判定基準に基づいて併合データをスライスして、２つ以上のスライスされたデータセットを生成する。本明細書で使用されるとき、スライシング（スライス）は、判定基準又は特徴に基づいてデータを複数の群に分割することを指す。いくつかの実施形態では、併合データをスライスするための１つ以上の判定基準が、年齢、性又はエスニシティなどの表現型分類を含む。いくつかの実施形態では、併合データをスライスするための１つ以上の判定基準が、作用剤に対する見かけの反応性又は有害事象の発生などの臨床的結果データを含む。例えば、いくつかの実施形態では、有害事象を経験した対象に基づいて併合データをスライスして、スライスされた２つのデータセット、すなわち有害事象を経験した対象のデータに対応する１つのデータセット及び有害事象を経験しなかった対象のデータに対応する１つのデータセットを生成する。別の例として、いくつかの実施形態では、癌薬物の臨床試験のための治療時の腫瘍サイズの変化などの判定基準によってデータをスライスして、作用剤に対して反応性である（例えば総合的臨床的利益を示した）対象（例えば患者）及び非反応性であった（例えば臨床的利益を示さなかった）対象（例えば患者）のスライスされたデータセットを生成する。別の実施形態では、対象によって併合データをスライスして、それぞれの個々の対象（例えば患者）に対するスライスされたデータセットを生成する。いくつかの実施形態では、年齢、性又はエスニシティなどの人口統計的特性によってデータがスライスされる。いくつかの実施形態では、ボディーマスインデックス、高グルコースレベルの存在、高血圧の存在、病歴におけるある種の事象などの判定基準によってデータがスライスされる。

いくつかの実施形態では、異なる判定基準に基づいて併合データが複数回にわたってスライスされる。例えば、併合データを、全ての対象のデータを含む１つのスライスにスライスし、さらに臨床的結果データに基づいて（例えば作用剤を用いた治療に反応して総合的臨床的利益を示した対象のデータを含む１つのスライス及び作用剤を用いた治療に反応して臨床的利益を示さなかった対象のデータを含む別のスライスに）スライスすることができる。

ステップ１１０で、スライスされたデータセットのうちの１つ以上のデータセットを分析して、作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定する。いくつかの実施形態では、作用剤の投与に関係した臨床的結果の潜在的バイオマーカーを同定するために、スライスされたデータセットが、人工知能法（例えばＡＩネットワーク）、統計的方法（例えば差次的発現）及び機械学習法のうちの１つ以上の方法を使用して分析される。いくつかの実施形態では、作用剤の投与に関係した臨床的反応の潜在的バイオマーカーを同定するために、スライスされたデータセットが、人工知能法、統計的方法及び機械学習法のうちの２つ以上の方法を使用して分析される。人工知能法（例えばベイジアン因果関係ネットワークの生成）、統計的方法（例えば差次的に発現された変数の統計分析）、及び機械学習法（例えば他の技法によって生成された可能なバイオマーカーのセットから比較的に相関しない潜在的バイオマーカーを選択する回帰分析）を使用して、作用剤の効能の潜在的バイオマーカー及び有害反応の潜在的バイオマーカーを同定する例が、図４及び実施例１及び２に関して後に説明される。

いくつかの実施形態では、スライスされたデータセットのうちの１つ以上のデータセットを分析して１つ以上の潜在的バイオマーカーを同定することが、スライスされたデータセットのうちの１つ以上のデータセットに基づく１つ以上の関係ネットワーク（例えばベイジアン因果関係ネットワーク又はベイジアンネットワーク）の生成を含む。ベイジアン因果関係ネットワークの生成については、「ＡＩに基づくシステムを使用したベイジアン因果関係ネットワークの生成」と題された項で後に説明する。

１つ以上の因果関係ネットワークの生成を利用する実施形態では、生成された１つ以上の因果関係ネットワークの分析によって、１つ以上の出力動因に対応する１つ以上のノードを同定する。いくつかの実施形態では、１つ以上の出力動因に対応する１つ以上のノードを同定するために、因果関係ネットワークのトポロジ特徴の分析が使用される。いくつかの実施形態では、同定された１つ以上の出力動因が、作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーである。いくつかの実施形態では、出力動因が可能なバイオマーカーとして同定され、一群の可能なバイオマーカーから１つ以上の潜在的バイオマーカーを選択するための追加の分析が実施される。そのような実施形態では、１つ以上の出力動因を含む一群の可能なバイオマーカーから１つ以上の潜在的バイオマーカーが選択される。

いくつかの実施形態では、生成された１つ以上の因果関係ネットワークの分析が、生成された因果関係ネットワークのうちの１つ以上の因果関係ネットワーク内の臨床的結果に対応するノードに、ｎよりも小さい接続度を有する関係によって接続されたノードに対応する変数を結果動因として同定することを含む。例えば、ｎが１である場合には、結果動因が、１つの関係によって結果ノードに直接に接続された変数ノードである。別の例として、ｎが２である場合には、結果動因が、２つの関係及び介在するノードによって結果ノードに接続された変数ノードである。さまざまな実施形態において、ｎは、１、２、３、４、５、６、７、８、９又は１０である。いくつかの実施形態では、ｎが、３又は２又は１である。

いくつかの実施形態では、対象によってデータがスライスされる。いくつかの実施形態では、臨床的結果を示した対象に対応する第１の複数のスライスされたデータセットのうちの１つのデータセットにそれぞれ基づいて第１の複数の因果関係ネットワークが生成され、臨床的結果を示さなかった対象に対応する第２の複数のスライスされたデータセットのうちの１つのデータセットにそれぞれ基づいて第２の複数の因果関係ネットワークが生成される。第１の複数の因果関係ネットワーク間の１つ以上の第１の共通性が同定され、第２の複数の因果関係ネットワーク間の１つ以上の第２の共通性が同定される。１つ以上の結果動因を同定するために、第１の共通性と第２の共通性の比較が使用される。

いくつかの実施形態では、臨床的結果によって併合データがスライスされ、生成された２つ以上のスライスされたデータセットが、臨床的結果を示した一人以上の対象に対応するデータを含む第１のスライスされたデータセットと、臨床的結果を示さなかった一人以上の対象に対応するデータを含む第２のスライスされたデータセットとを含む。いくつかの実施形態では、臨床的結果を示した対象に対応する第１のスライスされたデータセットに基づいて第１の因果関係ネットワークが生成され、臨床的結果を示さなかった対象に対応する第２のスライスされたデータセットに基づいて第２の因果関係ネットワークが生成される。いくつかの実施形態では、１つ以上の結果動因が、臨床的結果を示した対象に対応する第１の因果関係と臨床的結果を示さなかった対象に対応する第２の因果関係との比較に基づいて同定される。いくつかの実施形態では、第１の因果関係ネットワーク及び第２の因果関係ネットワークに基づいて差次的（デルタ）ネットワークが生成され、１つ以上の結果動因が、生成された差次的因果関係ネットワークから同定される。

いくつかの実施形態では、スライスされたデータセットのうちの１つ以上のデータセットを分析して、作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定することが、臨床的結果に基づいてスライスされたスライスされたデータセット間の差次的に発現された１つ以上の変数を統計分析によって同定することをさらに含む。いくつかの実施形態では、差次的発現のこのような統計分析が、２標本ｔ検定又はｌｉｍｍａ法を利用する。いくつかの実施形態では、差次的に発現された変数のこのような統計分析が、回帰分析を実行することを含む。いくつかの実施形態では、この統計分析が、臨床的結果に基づいてスライスされたデータセット間の発現の最大差を示す変数のリストを生成する。それらの変数は、可能なバイオマーカーとして同定され、それらの可能なバイオマーカーの中から、潜在的バイオマーカーのサブセットが同定される。

いくつかの実施形態では、多くの（例えば数十から数百の）結果動因及び多くの（例えば数十から数百の）差次的に発現された変数が、可能なバイオマーカーとして同定されるが、これらの可能なバイオマーカーの多くはおそらく互いに強く相関している。効率のためには、関心の臨床的結果を強く予測し、関心の臨床的結果と強く相関するが、互いに比較的に相関せず、その結果、それぞれの追加のバイオマーカーが追加情報を提供する一組のバイオマーカー（例えば直交する（orthogonal）バイオマーカー）を同定することが有利である。いくつかの実施形態では、同定された可能なバイオマーカーの中から互いに比較的に相関しない（例えば直交する）１つ以上の潜在的バイオマーカーを決定するために追加の分析が実行される。

いくつかの実施形態では、生成されたネットワーク及び上位の差次的に発現された変数から同定された結果動因が、一群の可能なバイオマーカーを形成し、また、機械学習を使用することにより、その一群の可能なバイオマーカーのサブセットとして、１つ以上の潜在的バイオマーカーが同定される。例えば、いくつかの実施形態では、同定された結果動因及び差次的に発現された１つ以上の変数を可能なバイオマーカーとして分析し、この分析に基づいて、可能なバイオマーカーのサブセットを１つ以上の潜在的バイオマーカーとして選択するために、機械学習が使用され、この機械学習が、他の可能なバイオマーカーに強く相関した可能なバイオマーカーにペナルティを課し、臨床的結果との相関レベルに基づいて可能なバイオマーカーに報酬を与え、それによって臨床的結果の１つ以上の潜在的バイオマーカーを同定する。いくつかの実施形態では、可能なバイオマーカーを分析するために利用される機械学習が、イラスティックネットペナルティを用いたロジスティック回帰を適用する。これについては、「潜在的バイオマーカー（例えばコンパニオン診断ＣＤｘ）の決定」と題された項で後に説明する。

いくつかの実施形態では、１つ以上の潜在的バイオマーカーが、作用剤の効能又は有害事象の潜在的バイオマーカーである。いくつかの実施形態では、方法１００が、作用剤の投与に関係した有害事象の発生の１つ以上の潜在的バイオマーカーを同定する方法である。

作用剤が、疾患又は障害の潜在的治療であるときには、方法１００が、作用剤による治療に対してどの患者が反応性であるのかを予測するため、若しくは作用剤で治療されたときにどの患者が有害事象を経験する可能性が高いのか予測するため、又はその両方のための患者層別化の方法である。いくつかの実施形態では、この方法がさらに、同定された１つ以上の潜在的バイオマーカーを、患者層別化、例えば後続の臨床試験における患者層別化、又は臨床治療に参加する患者を選択するための患者層別化に利用することを含む。いくつかの実施形態では、後続の臨床試験にどの患者を参加させるのかを決定するための患者層別化に潜在的バイオマーカーを使用することができる。いくつかの実施形態では、後続の臨床試験において作用剤を受け入れる患者を決定するための患者層別化に潜在的バイオマーカーを使用することができる。

いくつかの実施形態では、方法１００がさらに、対象特異的プロファイルを表示装置（ディスプレイデバイス）上に表示することを含む。対象特異的プロファイルは臨床記録データの図表現を含む。対象特異的プロファイルは、当該対象の人口統計的情報の図表現、及び当該対象の結果情報の図表現を含む。当該対象の結果情報の図表現は、当該対象の有害事象情報の図表現、及び作用剤に対する反応性に関する情報の図表現を含むことができる。患者プロファイルの形態の対象特異的プロファイルについては図２８に関して示し、説明する。別の患者ファイルを実施例１に関して後に説明し、図４０Ａ〜４０Ｄに示す。

いくつかの実施形態は、上で説明した方法１００に従って実行される、処理された分子的プロファイルデータと処理された臨床記録のスライスされた併合データセットから生成された因果関係ネットワーク（例えばベイジアン因果関係ネットワーク）のトポロジ特徴の分析によって、対象反応を決定するためのｉｎｓｉｌｉｃｏ計算診断患者マップを生成する方法を含む。

いくつかの実施形態では、疾患又は障害のｉｎｖｉｔｒｏ細胞モデルを確立し、ベイジアン因果関係ネットワークを作成して、疾患若しくは障害に関連する分子ハブ、又は疾患若しくは障害の潜在的なモジュレーターを同定することができる。ｉｎｖｉｔｒｏ細胞モデルに基づくベイジアン因果関係ネットワークを使用して疾患又は障害のモジュレーターを同定するための方法及びシステムに関する詳細は、「照合による細胞に基づくアッセイ及びその使用」と題する米国特許出願公開第２０１２／０２５８８７４号Ａ１に見られる（その内容全体が参照により本明細書に組み込まれる）。いくつかの実施形態では、ｉｎｖｉｔｒｏ細胞モデルを使用して同定された疾患又は障害の潜在的モジュレーターは、スライスされたデータの分析から同定された潜在的バイオマーカーと比較して、潜在的バイオマーカーの作用機序に関する情報を得ることができる。ｉｎｖｉｔｒｏ細胞モデルは、ＢｅｒｇＩｎｔｅｒｒｏｇａｔｉｖｅＢｉｏｌｏｇｙ（ＴＭ）ＩｎｆｏｒｍａｔｉｃｓＳｕｉｔｅを用いて分析することができる。これは、多様な生物学的プロセスを理解するためのツールである。生物学的プロセスとは例えば、病態生理や、生物学的プロセスの基盤にある重要な分子動因であり、病態プロセスを形成する因子を含むものである。いくつかの例示的な実施形態は、ＢｅｒｇＩｎｔｅｒｒｏｇａｔｉｖｅＢｉｏｌｏｇｙ（ＴＭ）ＩｎｆｏｒｍａｔｉｃｓＳｕｉｔｅを用いて、他の病気、医薬品、生物学的プロセスなどに対する疾患の相互作用に関する新たな知見を得る。いくつかの例示的な実施形態は、ＢｅｒｇＩｎｔｅｒｒｏｇａｔｉｖｅＢｉｏｌｏｇｙ（ＴＭ）ＩｎｆｏｒｍａｔｉｃｓＳｕｉｔｅの少なくとも一部又は全部を組み込んだシステムを含む。

図２は、システム２００の例のネットワーク図を示す。システム２００は、その一部又は全体が本実施形態に基づく本明細書に記載の方法を実行するために使用され得る。システム２００は、ネットワーク２０５、デバイス２１０、デバイス２１５、デバイス２２０、デバイス２２５、サーバ２３０、サーバ２３５、データベース２４０、及びデータベースサーバ２４５を備え得る。デバイス２１０、２１５、２２０、２２５、サーバ２３０、サーバ２３５、データベース２４０、及びデータベースサーバ２４５は、それぞれネットワーク２０５と接続されている。

実施形態において、ネットワーク２０５の１以上の部分は、アドホックネットワーク、イントラネット、エクストラネット、仮想プライベートネットワーク（ＶＰＮ）、ローカルエリアネットワーク（ＬＡＮ）、無線ＬＡＮ（ＷＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）、無線ワイドエリアネットワーク（ＷＷＡＮ）、メトロポリタンエリアネットワーク（ＭＡＮ）、インターネットの一部、公衆電話網（ＰＳＴＮ）の一部、携帯電話ネットワーク、無線ネットワーク、ＷｉＦｉネットワーク、ＷｉＭａｘネットワーク、その他任意タイプのネットワーク、又はこれらネットワークの２以上の組み合わせである。

デバイス２１０、２１５、２２０、２２５としては、以下が挙げられるがこれに限定されるものではない：ワークステーション、パーソナルコンピュータ、汎用目的コンピュータ、インターネットアプライアンス、ラップトップ、デスクトップ、マルチプロセッサシステム、セットトップボックス、ネットワークＰＣ、無線デバイス、ポータブルデバイス、ウェアラブルコンピュータ、携帯電話、携帯電子個人端末（ＰＤＡ）、スマートフォン、タブレット、ウルトラブック、ネットブック、マルチプロセッサシステム、マイクロプロセッサベース又はプログラム可能電子機器、ミニコンピュータ、など。デバイス２１０、２１５、２２０、２２５のそれぞれは、有線又は無線接続を介してネットワーク２０５と接続することができる。

一部の実施形態において、サーバ２３０とサーバ２３５は、分散コンピュータ環境の一部であってもよい。そこでタスク／機能の一部はサーバ２３０と２３５の間で分散される。一部の実施形態において、サーバ２３０とサーバ２３５は、並列コンピュータ環境の一部であり、サーバ２３０とサーバ２３５はタスク／機能を並列実施して、本明細書が記載するベイジアン因果関係ネットワークを生成するために必要なコンピュータリソースと処理リソースを提供する。

一部の実施形態において、サーバ２３０、２３５、データベース２４０、データベースサーバ２４５はそれぞれ、有線接続によりネットワーク２０５と接続される。これに代えて、サーバ２３０、２３５、データベース２４０、又はデータベースサーバ２４５のうち１以上は、無線接続によりネットワーク２０５と接続することもできる。図示していないが、データベースサーバ２４５は、データベース２４０と直接接続することができ、あるいはサーバ２３０、２３５はデータベースサーバ２４５及び／又はデータベース２４０と直接接続することができる。サーバ２３０、２３５は、ネットワーク２０５を介してデバイス２１０、２１５、２２０、２２５と通信するように構成された１以上のコンピュータ又はプロセッサを備える。サーバ２３０、２３５は、デバイス２１０、２１５、２２０、及び２２５がアクセスする１以上のアプリケーション又はウェブサイトをホストし、及び／又はデータベース２４０のコンテンツにアクセスできるようにする。データベースサーバ２４５は、データベース２４０のコンテンツにアクセスできるようにするように構成された１以上のコンピュータ又はプロセッサを備える。データベース２４０は、サーバ２３０、２３５、データベース２４５、及び／又はデバイス２１０、２１５、２２０、２２５が用いるデータ及び／又は命令を格納する１以上のストレージデバイスを備える。データベース２４０、サーバ２３０、２３５、及び／又はデータベースサーバ２４５は、１以上の地理的に互いに分散した場所に配置し、又はデバイス２１０、２１５、２２０、２２５から地理的に分散した場所に配置することができる。これに代えてデータベース２４０は、サーバ２３０、若しくは２３５、又はデータベースサーバ２４５に含めることができる。

図３は、実施形態にしたがってモジュールで実装されたシステム３００を示すブロック図である。いくつかの実施形態においてモジュールは、オミクスモジュール３１０、臨床記録モジュール３２０、統合モジュール３３０、スライシングモジュール３４０、ベイジアンネットワークモジュール３５０、及び分析モジュール３６０を含む。実施形態の例において、モジュール３１０、３２０、３３０、３４０、３５０及び３６０のうち１以上は、サーバ２３０及び／又はサーバ２３５に含まれる。モジュール３１０、３２０、３３０、３４０、３５０及び３６０のうちその他のものは、デバイス２１０、２１５、２２０、２２５において提供される。

別の実施形態において、モジュールはデバイス２１０、２１５、２２０、２２５のいずれかが実装することができる。モジュールは、デバイス２１０、２１５、２２０、２２５が備える１以上のプロセッサが実行するように構成された１以上のソフトウェアコンポーネント、プログラム、アプリケーション、ａｐｐｓ、その他のコードベースユニット又は命令を備える。

図３においてモジュール３１０、３２０、３３０、３４０、３５０、３６０は個別のモジュールとして示しているが、モジュール３１０、３２０、３３０、３４０、３５０及び３６０は図示するよりも少ない又は多いモジュールとして実装できることを理解されたい。モジュール３１０、３２０、３３０、３４０、３５０及び３６０は、１以上の外部コンポーネントと通信できることを理解されたい。例えばデータベース、サーバ、データベースサーバ、又は他のデバイスである。

いくつかの実施形態では、オミクスモジュール３１０が、ハードウェアによって実施されたモジュール（以後、ハードウェア実施モジュール）であって、複数の対象の試料の分析によって取得された分子的プロファイルデータを受け取り、管理するように構成されたモジュールである。オミクスモジュール３１０は、試料に関するプロテオミクス、メタボロミクス、リピドミクス、ゲノミクス、トランスクリプトミクス、マイクロアレイ及び配列決定データのうちの任意のデータを受け取るように構成することができる。いくつかの実施形態では、オミクスモジュール３１０が、オミクスデータを生成する目的に使用されているシステムからオミクスデータを受け取るように構成されている。オミクスモジュール３１０はさらに、分子的プロファイルデータを処理して、処理された分子的プロファイルデータを生成するように構成されている。いくつかの実施形態では、オミクスモジュール３１０が、複数の対象に対する治療の過程中の異なる時点において収集されたデータを組み合わせるように構成されている。いくつかの実施形態では、オミクスモジュール３１０が、データをフィルタにかけて、まれにしか測定されなかった変数を除外するように構成されている。いくつかの実施形態では、オミクスモジュール３１０が、データを生成するための試料の分析中に利用された異なるバッチ間で試料が比較可能であることを保証するために、系統的偏りを除去することによってデータを正規化するように構成されている。いくつかの実施形態では、オミクスモジュール３１０が、複数の対象のうちの特定の対象に対して測定されなかった変数を代入するように構成されている。いくつかの実施形態では、オミクスモジュール３１０が、データを組み合わせ、データをフィルタリングし、データを正規化し、測定されなかった変数を代入するように構成されている。

いくつかの実施形態では、臨床記録モジュール３２０が、複数の対象の臨床記録データを受け取り、管理するように構成されたハードウェア実施モジュールである。臨床記録モジュール３２０はさらに、臨床記録データを処理するように構成されている。

いくつかの実施形態では、統合モジュール３３０が、複数の対象の処理された分子的プロファイルデータと処理された臨床記録データとを統合し、統合されたデータを併合データとしてデータベースに記憶するように構成されたハードウェア実施モジュールである。

いくつかの実施形態では、スライシングモジュール３４０が、臨床記録から取得された判定基準に基づいて併合データをスライスして、２つ以上のスライスされたデータセットを生成するように構成されたハードウェア実施モジュールである。

いくつかの実施形態は、スライスされたデータセットのうちの１つ以上のデータセットからベイジアン因果関係ネットワークを生成するように構成されたハードウェア実施モジュールであるベイジアンネットワーク生成モジュール３５０を含む。いくつかの実施形態では、ベイジアンネットワークモジュール３５０がさらに、生成されたベイジアン因果関係ネットワークから結果動因を同定するように構成されている。

分析モジュール３６０は、作用剤の投与に関係した臨床的結果を予測するためのバイオマーカーを同定するように構成されたハードウェア実施モジュールとすることができる。いくつかの実施形態では、生成されたベイジアンネットワークを分析して結果動因を同定することが、ベイジアンネットワークモジュール３５０の代わりに、又はベイジアンネットワークモデルとともに分析モジュール３６０によって実施される。いくつかの実施形態では、分析モジュール３６０が、統計分析を実施して、差次的に発現された変数を同定するように構成されている。いくつかの実施形態では、分析モジュール３６０がさらに、機械学習アルゴリズムを管理し、機械学習アルゴリズムを可能なバイオマーカーに適用して、作用剤の投与に関係した臨床的結果を予測するための潜在的バイオマーカー（予測子（predictor））を同定するように構成されている。同定された潜在的バイオマーカー（予測子）を作用剤の後続の臨床試験に適用するように、分析モジュール３６０を構成することもできる。いくつかの実施形態では、分析モジュール３６０が、異なる態様の分析を実行する多数の異なるモジュール（例えば結果動因同定モジュール、差次的発現モジュール及び機械学習モジュール）を含む。

図４は、一実施形態に基づく、臨床試験によって取得されたデータを分析する臨床試験分析ワークフロー（clinical trial analytics workflow：ＣＴＡＷ）４００の例示的なフロー図を示す。方法４００は臨床試験の文脈で説明されるが、臨床試験の文脈外でも、複数の対象に作用剤が投与される他の何らかの試験、実験又は研究にこの方法を適用することができることを当業者は理解する。臨床試験中の複数の対象に作用剤を投与する前、投与している間、及び／又は投与した後に、複数の対象から試料を収集する。例示的な実施形態では、対象（例えば患者）から試料（例えば血液、組織、尿試料）を取得し、オミクスプロファイリング（omics profiling）によって、リピドミクスデータ４０２、メタボロミクスデータ４０４及びプロテオミクスデータ４０６を生成するよう問い合わせる。収集した試料を処理してリピドミクスデータ４０２、メタボロミクスデータ４０４及びプロテオミクスデータ４０６を生成することのさらなる詳細については、「分子的プロファイルデータの生成」と題された項で後に説明する。いくつかの実施形態では、試料の分析により、ゲノミクスデータ及びトランスクリプトミクスデータなどの追加のデータも生成する。

ステップ４０８で、リピドミクスデータ４０２、メタボロミクスデータ４０４及びプロテオミクスデータ４０６を入力としてとるオミクスデータ処理を実行する。ゲノミクスデータ及び／又はトランスクリプトミクスデータを含む実施形態では、これらのデータもオミクスデータ処理に含める。特定技術の（technology-specific）パイプラインが、臨床試験中の異なる時点において収集されたデータを組み合わせる併合によって、これらの未処理のオミクス測定値を、処理された分子的プロファイルデータに変換する。いくつかの実施形態では、この処理が、まれにしか測定されなかった変数を除外するフィルタリングを含む。さらに、必要に応じて、バッチ間で試料が比較可能であることを保証するために、系統的偏りを除去することによってデータを正規化する。いくつかの実施形態では、必要に応じて、代入（imputation）を使用して、特定の試料中で測定されなかった変数のレベルを推測する。オミクス処理に関するさらなる詳細は、「オミクスデータ処理」と題された後の項に含まれている。

ステップ４１０で、いくつかの実施形態では、品質管理ステップによって、オミクスデータ処理のデータ処理信頼性を保証する。品質管理ステップは、未処理データファイルが期待されるフォーマットに従っているかどうかを試験するステップ、及びオミクスデータ処理のそれぞれのステップを追跡する直観的な視覚化を実施するステップを含む。トレーサビリティを保証するため、いくつかの実施形態では、品質管理ステップからの全ての出力が（例えばオミクスモジュール３１０によって）中央ログファイルに書き込まれる。

臨床データ４１２を取得する。臨床データの入力に関する追加情報は「臨床記録データ」と題された後の項に示されている。いくつかの実施形態では、分子プロファイリングに使用したどの試料がどの患者に対応するのか及びどの時点で試料を採取したのかを同定するマスタファイル４１４を作成又は取得する。この時点は、特定の対象の関連する出発時点に対して記録することができる（例えば、時間０を治療サイクルの始まりに対応させることができる）。いくつかの実施形態では薬物動態データ４１６も取得する。本明細書では薬物動態データ４１６を一種の臨床記録データとみなし、いくつかの実施形態では、臨床データ４１２と一緒に薬物動態データ４１６を提供する。臨床データの入力及びマスタファイルの生成に関する追加情報は「臨床記録データ」と題された後の項に示されている。

ステップ４１８で、処理された分子的プロファイルデータを臨床データと統合する。いくつかの実施形態では、対象を（例えば患者ＩＤによって）指定し、さらに収集されたそれぞれの試料に対応する時点を指定するマスタファイル４１４を用いて、処理された分子的プロファイルデータ（例えばオミクスデータ）を臨床記録と併合する。次いで、臨床データモニタによって提供された、臨床記録の形態の臨床データ４１２を、処理された分子的プロファイルデータと併合し、併合データをデータベースに記憶する。臨床データ４１２は薬物動態データ４１６を含むことができる。患者ＩＤ及び収集時刻が与えられている場合には、利用可能な臨床記録をオミクスデータと時間的にマッチングさせて、オミクスデータ及び臨床記録を含む統合されたデータセットを生成することができる。その結果生成されるデータベース中の併合データは、時間を横切って収集された全ての対象（例えば臨床試験に参加した患者）の人口統計、治療、疾患又は障害の状態、臨床的結果データ（例えば癌治療の臨床試験における腫瘍サイズ測定値、有害事象など）、検査室測定値、薬物動態データ、プロテオミクス、リピドミクス及びメタボロミクスデータのうちの任意の又は全てのデータを含むことができる。上述のとおり、補間（例えば線形補間）を利用して、腫瘍サイズなどの定量的な臨床記録を、オミクス試料の時点にマッチングさせることができる。

いくつかの実施形態では、ステップ４２０で、併合データに対して品質管理ステップを実行する。品質管理ステップが、重複した臨床記録を照合するステップとデータ源間の相違点を解消するステップのうちの一部又は全部を含むことができる。いくつかの実施形態では、このような不一致及びそれらの解消が全て（例えば統合モジュール３３０によって）ログファイルに記録される。いくつかの実施形態では、このステップが省略され、又は他の品質管理ステップと組み合わされる。

ステップ４２２で、併合データをフィルタにかける。このフィルタリングでは、対応する臨床情報を欠く時点の試料を同定し、それらの試料を併合データから除外する。いくつかの実施形態では、このステップが省略され、又は他のステップと組み合わされる。

ステップ４２４で、臨床データに基づく１つ以上の判定基準を使用して併合データをスライスして２つ以上のデータセット（スライス）を生成し、それによりスライスされたデータセットを形成する。異なる判定基準を使用して複数回にわたってデータをスライスして、多数のスライスされたデータセットを形成することができる。スライシングのためのさまざまな判定基準については図１のステップ１０８に関して上で説明した。例示的なデータスライスが後の実施例２で列挙される。

ステップ４２６で、スライスされたデータセットの基礎をなすデータを表すベイジアン因果関係ネットワークを生成する。これを、入力データに基づいてベイジアンネットワークを「学習する」と記述することができる。ベイジアンネットワークは、入力データ中の基礎をなす相関構造を最もよく記述する原因−結果グラフ（cause-and-effect graph）である。これらのネットワークはノード及びエッジ（edge）からなる。ネットワークノードは、分子的特徴（タンパク質、脂質、代謝産物）、臨床的変数（臨床検査、腫瘍反応）及び患者人口統計（治療群、年齢、人種）を表す。エッジは、ネットワークノード間の原因−結果関係を表す。

ベイジアン学習の前に、データスライス中のそれぞれの変数をミドル（middle）、トップ（top）又はボトム（bottom）変数として指定する。この定義は、それぞれの変数に許された接続のタイプを指す。ミドル変数は、子又は親ノードの役目を果たすことができるという点で制約がない。トップ変数は親ノードにしかなりえず、したがって子ノードの役目を果たすという点では制約がある。反対に、ボトム変数は子ノードにしかなりえず、したがって親ノードの役目を果たすという点では制約がある。例示的な実施形態では、トップ変数が、後に論じる実施例１及び２に割り当てられた試験群などの患者人口統計及び臨床的介入からなる。ボトム変数は、後に論じる実施例１及び２の腫瘍サイズ及び腫瘍反応など、臨床的結果に関係した特徴を含む。臨床検査及びオミクス変数はミドル変数とみなされ、したがって、それらは親又は子ノードの役目を果たすことができる。

いくつかの実施形態では、ＣＴＡＷが利用するベイジアンネットワークアルゴリズムが、それぞれのデータスライスからのネットワークの集合を学習する。ネットワークの集合は、データスライスのベイジアンネットワークを集合的に表す。例示的な集合では、学習するネットワークの数が５００個のネットワークを含むことがある。他の実施形態では、ＣＴＡＷが学習する集合中のネットワークの数が５００〜１０００個のネットワークを含む。他の実施形態では、ＣＴＡＷが学習するネットワークの数が１０００個を超えるネットワークを含む。いくつかの実施形態では、ベイジアンネットワークを生成するためのプラットホームとして、リコンストラクティングインテグレイティブモレキュラーベイジアンネットワーク（Reconstructing Integrative Molecular Bayesian Network：ＲＩＭＢＡＮｅｔ）が使用される。

いくつかの実施形態では、ベイジアン学習に続いて、以下の後処理ステップを適用する。５００個のネットワークのうち収束するネットワークの数が３００未満である集合中のネットワークは無視する。任意の集合ネットワークに含まれるエッジを組み合わせ、エッジの出現頻度を算出する。２０％のエッジ頻度要件を課すことにより、ネットワークの集合を横切ってまれにしか生じないエッジは除外する。親ノードデータセットを子ノードデータセットに関係づけるピアソン相関係数を計算することによって、それぞれのエッジの方向性を連続変数に割り当てる。１つ以上の離散変数を接続するエッジは「離散的（discrete）」とみなす。０．２よりも大きな相関係数は「直接（direct）」とみなし、−０．２よりも小さな相関係数は「逆（reverse）」とみなす。「直接」でも又は「逆」でもない相関係数は「因果（causal）」とみなす。例示的なデータセットからのネットワークの図表現が図２２に示されている。ベイジアン因果関係ネットワークの生成に関するさらなる詳細は、「ＡＩに基づくシステムを使用したベイジアン因果関係ネットワークの生成」と題された後の項に出ている。生成されたベイジアンネットワークのさらなる議論及び例は、「出力ＡＩネットワーク」と題された後の項に出ている。

いくつかの実施形態では、ＣＴＡＷ４００によって学習されたそれぞれのネットワークのトポロジ特徴を分析することによって、可能なバイオマーカー又は潜在的なバイオマーカーである結果動因を同定する。スライスされたデータセットからベイジアン因果関係ネットワークを生成した後、そのネットワークのトポロジを分析して、関心の結果の潜在的バイオマーカーを示すことができる。例えば、全ての患者を含むスライスされたデータセットを使用して、ベイジアン因果関係ネットワークを生成することができる。ベイジアン因果関係ネットワークでは、関心の結果変数の周囲のサブネットワークを同定することができる。例えば、投与された作用剤が、固形腫瘍を生じさせる条件を治療することを意図したものである場合には、腫瘍サイズを関心の結果変数とすることができる。サブネットワークは、関心の結果変数と第１度の関係（first degree relationship）を有する変数（例えば、腫瘍サイズ変数に１つの関係によって直接に接続された変数。図表現では、この変数が、「エッジ」によって腫瘍サイズ変数に接続された変数として示される）を含む。サブネットワークはさらに、関心の結果変数と第２度の関係を有する変数（例えば、腫瘍サイズ変数と１つの関係によって接続された変数に１つの関係によって接続された変数）を含むことがある。いくつかの実施形態では、サブネットワークがさらに、関心の結果変数と第３度の関係を有する変数を含む。次いで、サブネットワーク中の変数を、関心の結果の（例えば作用剤による治療に対する反応性の）可能なバイオマーカー又は潜在的なバイオマーカーとして分析する。例えば、ベイジアン因果関係ネットワークを使用したシミュレーションを利用して、関心の結果変数（例えば腫瘍サイズ）に対するサブネットワーク中の変数の影響を調べる。

いくつかの実施形態では、反応性の患者（以後、反応性患者）と非反応性の患者（以後、非反応性患者）とによってデータをスライスし、それらのスライスされたデータセットに基づいてベイジアン因果関係ネットワークを生成する。反応性患者のデータに基づくベイジアン因果関係ネットワーク中の関心の結果変数の周囲でサブネットワークを同定することができる。例えば、反応性患者のデータに基づくベイジアン因果関係ネットワークの腫瘍サイズ変数の周囲でローカルネットワークを同定することができる。

反応性患者に対するベイジアン関係ネットワーク及び非反応性患者に対するベイジアン関係ネットワークを、反応性の潜在的バイオマーカーを強調する差と比較することができる。いくつかの実施形態では、このような比較が、反応性患者に対するベイジアン関係ネットワーク及び非反応性患者に対するベイジアン関係ネットワークに基づく差次的（デルタ）ネットワークの形成を含む。生成差次的（デルタ）ネットワークに関するさらなる詳細は、「ＡＩに基づくシステムを使用したベイジアン因果関係ネットワークの生成」と題された後の項に出ている。

さらに、いくつかの実施形態では、それぞれのノードについて、単独で及び用語「癌」又は「ミトコンドリア」と組み合わせて文献探索を実行する。いくつかの実施形態では、２００を超える発表文献が存在するノードを可能なバイオマーカーのセットから除外する。それらのノードは、新規の薬物治療又は相互作用の発見に寄与しないためである。

ステップ４３２で、コンパニオン診断マーカー（ＣＤｘ）を同定する。ＣＤｘは、作用剤の投与に関係した臨床的結果のバイオマーカー又は潜在的バイオマーカーである。ＣＤｘは、治療前又は患者結果を予測する試験が始まった後の任意の時期に測定することができる。具体的には、ＣＤｘマーカーは、作用剤を用いて治療された患者の結果に関する予測を実施する目的に使用することができる分子的特徴及び／又は臨床検査のパネルである。理想的には、１つのパネルの中で使用されるＣＤｘは、関心の結果を予測し又は関心の結果と高い相関を有するが、互いに比較的に相関しない（例えば直交する）。ＣＤｘマーカーは３つの構成要素、すなわち（１）測定すべき一組の特徴、（２）それらの特徴を測定する時点、及び（３）予測する臨床的出力を有する。例えば、患者結果を予測するＣＤｘマーカーを導き出すシナリオは次のとおりである。測定するマーカーのパネルは、バフィーコート中で測定された７つのタンパク質のレベル、血漿中で測定された２つの脂質のレベル及び血漿中で測定された１つの代謝産物のレベルからなる。測定の時点は、作用剤の最初の投与を始める直前（例えばＣｏＱ１０の最初の注入の直前）である。これらのＣＤｘマーカーの予測力（predictive power）は、これらの分子的特徴を使用して、治療に対して患者が反応性なのか又は非反応性なのかを予測することであり、試験に参加した時間の長さを患者反応の代用物ととらえる。その結果得られた一組のＣＤｘマーカーを、図３１に示されているいような箱ひげ図として視覚化することができる。

同様に、重度の有害事象を予測するＣＤｘマーカーを見出すことができる。ここで、ＣＤｘマーカーのパネルは、血漿中で測定された１つのタンパク質、血漿中で測定された１つの代謝産物及びバフィーコート中で測定された８つのタンパク質からなることができる。治療を開始する前にこれらのＣＤｘマーカーを測定することによって、重度の有害事象を経験する一組の患者を予測することができ、残りの患者は、重度の有害事象を経験しないと予測される。図３２は、有害事象を予測するＣＤｘマーカーを示す。

本明細書で使用されるとき、コンパニオン診断（ＣＤｘ）は、作用剤の投与に関係した臨床的結果の潜在的バイオマーカー又はバイオマーカーである。患者結果は例えば、総合的臨床的利益を得た患者を臨床的利益を示さなかった患者から区別することによって、又は有害事象を経験した患者を経験しなかった患者から区別することによって定義することができる。この例示的な方法４００では、総合的臨床的利益４２８を示した患者と臨床的利益４３０を示さなかった患者とによってスライスされたデータセットの分析を使用して、作用剤の投与に対する患者反応を予測するＣＤｘバイオマーカーを同定する。ＣＴＡＷを使用して、治療を開始する前に患者結果を予測する一組のＣＤｘマーカーを同定することができる。いくつかの実施形態では、生成された因果関係ネットワークのトポロジ特徴を使用してＣＤｘ又は候補ＣＤｘを同定する。いくつかの実施形態では、ネットワークトポロジ特徴と統計分析との組合せを使用して候補ＣＤｘを同定する。候補ＣＤｘマーカーは可能なバイオマーカーであり、その中からＣＤｘ潜在的バイオマーカーが同定される。例えば、患者が重度の有害事象を経験するかどうかを予測する候補ＣＤｘマーカーを見出すことができる。図３５は、差次的発現から決定された上位１０個の候補ＣＤｘマーカーの箱ひげ図を示す。

いくつかの実施形態では、ネットワークトポロジ特徴（例えば結果動因を決定するため）、統計分析（例えば差次的に発現された変数を見つけるため）及び機械学習法の組合せを使用してＣＤｘを同定する。

いくつかの実施形態では、ネットワークトポロジ特徴及び統計分析を使用して可能なバイオマーカー（例えば候補ＣＤｘマーカー）のセットを同定し、それらの可能なバイオマーカーのセットを、機械学習を使用して分析して、互いに比較的に相関しないが、結果と強く相関し又は結果を強く予測するサブセットを選択する。それらのサブセットがＣＤｘマーカーである。例えば、そのような一実施形態では、ＣＤｘマーカーの同定に含まれるステップが、（１）関連したＡＩネットワーク中の予測対象に関係した主要な出力の動因である変数を獲得するステップ、（２）指定された時点における患者層別化群間の差次的に発現された変数を同定するステップ、及び（３）ステップ（１）及び（２）の結果を、どの特徴が表現型結果をロバストに予測するのかを判定する機械学習アルゴリズム（例えばイラスティックネットを使用した回帰）に入力するステップである。コンパニオン診断を決定するための分析のさらなる議論は、「潜在的バイオマーカー（例えばコンパニオン診断）の決定」と題された後の項に示されている。

図４に戻る。ＣＤｘパイプラインに続いて、ステップ４３４で、品質管理ステップが、同定されたバイオマーカーの信頼性を、ＣＤｘパイプラインに入力された処理後のデータセット中のそれらのバイオマーカーの測定値を確認することによって保証する。いくつかの実施形態では、これらの品質管理ステップ４３４が省略され、又は他のステップと組み合わされる。いくつかの実施形態では、品質管理手順の最初のステップが、１０個の候補ＣＤｘマーカーを無作為に選択するステップである。品質管理のために選択したそれらの候補ＣＤｘマーカーについて、患者層別化群（有害事象を経験した患者及び経験有害事象を経験しなかった患者など）の要約統計量（平均及び標準偏差）を計算する。次いで、正しいデータ点が選択されていること、及び適正な処理ステップが適用されていることを保証するために、算出された要約統計量を、ＣＴＡＷパイプラインによって以前に計算された値と比較する。加えて、所与のＣＤｘ分析に関する詳細な品質管理リポートを作成する。

オミクスデータ処理
バフィーコート及び血漿プロテオミクスデータの処理
いくつかの実施形態では、バフィーコート及び血漿プロテオミクスデータファイルを以下の方法に従って処理する。以下の方法では、どちらのタイプの試料を指すときでも用語「プロテオミクス」を使用する。いくつかの実施形態では、処理されたバフィーコート及び血漿プロテオミクスデータをプロテオミクスデータ４０６としてＣＴＡＷ４００に入力する。いくつかの実施形態では、データ処理が、ＣＴＡＷ４００との適合性（compatibility）を保証するために構文解析ツール（parsing tool）によって注釈が付けられたプロテオミクスデータファイルから始まる。次いで、多数のバッチを横切って収集された注釈付きのデータを併合して、収集された任意の試料中で測定された全てのタンパク質を含む図５に示されているような単一のデータフレーム５００を生成する。図５では、２つの未処理データファイル中に存在する試料が水平線５２０によって分離されている。一方の未処理データファイルでは一意的に測定されているが、もう一方のデータファイルではそうされていないタンパク質が垂直線５１０によって分離されている。

いくつかの実施形態では、ｌｏｇ_２変換を適用することによってプロテオミクスデータを変換する。２回以上測定されたタンパク質識別子（identifier）は、それらの中央値によってまとめられ、それによって一意のタンパク質識別子だけが残ることを保証する。いくつかの実施形態では、６０％を超える試料に欠測値があるタンパク質を信頼できないとみなし、したがって、図６のデータ表現６００に示されているようにそれらのタンパク質をさらなる分析から除外する。図６では、維持されたタンパク質及び除外されたタンパク質がそれぞれ、一番上の列６１０のより明灰色及びより暗灰色の陰影によって示されている。いくつかの実施形態では、バフィーコートプロテオミクス試料を処理するときに、タンパク質レベルがそれらのＱＣＰ試料に対して首尾一貫して測定されたものであることを保証する追加のフィルタリングステップ（ＱＣＰフィルタリング）を適用する。いくつかの実施形態では、６０−ｌｅｓｓと呼ばれる手法によってデータを正規化する。この手法は、最初に特徴ごとに変動係数を計算し、次に変動係数が下から６０％に入る特徴を不変であるとみなすことを含む。次いで、それぞれの試料の中心を不変のタンパク質の中央値に置き、試料ごとに、平均四分位範囲（mean interquartile range：ＩＱＲ）を四分位範囲で除した値でスケーリングする。正規化プロセス（６０−ｌｅｓｓ手法）前の試料にわたるタンパク質分布が図７Ａに示されている。図７Ｂは、正規化プロセスが適用された後の試料にわたるタンパク質分布を示す。その平均よりも低い２つの標準偏差及びその平均よりも高い２つの標準偏差から自動的に一意的にサンプリングするスクリプト、プログラム又はソフトウェアコードを使用して、欠測値を代入する。図８は、代入の前後のデータセットを示す。この図では、正規化されたプロテオミクスデータセット中の欠測データが代入されている。代入前のデータセットは線８１０の上に示されており、代入後の対応するデータセットは線８１０の下に示されている。

構造リピドミクス
いくつかの実施形態では、構造リピドミクスデータファイルに構文解析ツールによって注釈を付けて、未処理データをＣＴＡＷ４００に適合するフォーマットに変換する。処理されたリピドミクスデータはリピドミクスデータ４０２としてＣＴＡＷ４００に入力することができる。いくつかの実施形態では、データ処理が、個々のリピドミクスデータファイル中に見られる欠測データに対して代入を実行することから始まる。いくつかの実施形態では、脂質クラス中で観察された最も低い値とその値の半値との間で一意的にサンプリングすることによって欠測値を代入する。図９は、代入の前後のデータセットを示す。代入前のデータセットが水平線９１０の上に示されており、代入後のデータセットが水平線９１０の下に示されている。いくつかの実施形態では、代入が、それぞれのリピドミクスデータの処理で観察された最小値に対するものになるように、代入がデータファイルごとに実行される。

代入に続いて、データファイルを併合して脂質クラスの単一のリストとし、ｌｏｇ_２変換する。いくつかの実施形態では、脂質クラスごとに正規化を実行する。この正規化では、クラスごとに最適なラムダ（λ）値を決定する。このクラスの中の脂質値をｇｌｏｇ変換によって変換し、変換された脂質の中心を中央値に置く。正規化プロセスのそれぞれのステップ後のデータセットが図１０に示されている。次に、欠測データを含む任意の脂質を除外する。欠測データの存在は、バッチを横切って首尾一貫しては検出されなかった脂質を示すためである。最後に、前もって不安定であることが判明した脂質を除外し、それによって処理されたデータセットのロバストネス（robustness）を保証する。

血漿シグナリングリピドミクス
いくつかの実施形態では、シグナリングリピドミクスファイルに構文解析ツールによって注釈を付けて、未処理データをＣＴＡＷ４００に適合するフォーマットに変換する。処理されたリピドミクスデータはリピドミクスデータ４０２としてＣＴＡＷ４００に入力することができる。いくつかの実施形態では、それぞれのファイル中で観察される最も低い値とこの値の半値との間で一意的にサンプリングすることによって、個々の脂質ファイル中に存在する一切の欠測データを代入する。代入されたデータセットが図１１に示されている。この図では、代入前のデータセットが水平線１１１０の上に示されており、代入後のデータセットが水平線１１１０の下に示されている。この代入は、データファイルごとに実行し、それによって代入されたデータが、それぞれのリピドミクス処理に対して適切な範囲内にあることを保証する。いくつかの実施形態では、代入後、データを併合し、バッチ中の全ての試料を横切っては測定されなかった脂質を除外する。いくつかの実施形態では、次いでデータをｌｏｇ_２変換及び正規化する。正規化は、最適なラムダ（λ）値を決定し、ｇｌｏｇ変換を適用し、中央値に中心を置くことによって実施する。正規化プロセスのそれぞれのステップ後のデータセットが図１２に示されている。いくつかの実施形態では、正規化に続いて、前もって不安定であるとのフラグが立てられた脂質を除去する。

尿プロテオミクス
いくつかの実施形態では、データ処理が、ＣＴＡＷ４００との適合性を保証するためにカスタムの構文解析ツールによって注釈が付けられたプロテオミクスデータファイルから始まる。処理されたプロテオミクスデータはプロテオミクスデータ４０６としてＣＴＡＷ４００に入力することができる。いくつかの実施形態では、次いで、多数のバッチを横切って収集された注釈付きのデータを併合して、収集された任意の試料中で測定された全てのタンパク質を含む図１３に示されているような単一のデータフレーム１３００を生成する。図１３では、２つの未処理データファイル中に存在する試料が水平線１３２０によって分離されている。一方の未処理データファイルでは一意的に測定されているが、もう一方のデータファイルではそうされていないタンパク質が垂直線１３１０によって分離されている。いくつかの実施形態では、７５％を超える試料に欠測値があるタンパク質を信頼できないとみなし、したがって、図１４のデータ表現１４００に示されているようにそれらのタンパク質をさらなる分析から除外する。図１４では、維持されたタンパク質及び除外されたタンパク質がそれぞれ、一番上の列１４１０の明灰色及び暗灰色によって示されている。

いくつかの実施形態では、水分補給の差に起因する変動性を低減させるように設計された手順によって尿プロテオミクスデータを正規化する。この正規化は、値が希釈レベルだけに依存し、互いの値の相関が高く、それぞれの尿試料中で検出可能である安定したタンパク質を同定することによって実施する。安定したタンパク質を同定する最初のステップは、９７％を超える尿試料に存在するタンパク質を考慮するステップである。次に、この一組の候補安定タンパク質に、マルチスケールブートストラップリサンプリング（multiscale bootstrap resampling）を使用した階層的クラスタ化（hierarchical clustering）を適用して、クラスタ化結果の中のそれぞれのクラスタの有意性（significance）を推定する。次いで、クラスタを組み合わせ、一組の安定した尿タンパクとして働くそれらのメンバの能力を、正規化された値と正規化された値の平均値との間の絶対偏差の和を計算することによって評価する。絶対偏差の和が最も小さくなる一組の尿タンパクを最適な一組の安定した尿タンパクとして選択する。この一組の安定した尿タンパクが選択されたら、試料を横切って安定したタンパク質の中央値を計算し、それぞれの安定したタンパク質の発現レベルをこの値で除し、安定したタンパク質の試料当たりの平均発現を計算することによって、乗数（multiplier）を算出する。その結果得られる値は、試料ごとに全ての尿タンパク値に適用され、正規化された尿プロテオミクスデータを生成する除数（divisor）として機能する。正規化プロセス前の試料にわたるタンパク質分布が図１５Ａに示されている。図１５Ｂは、正規化プロセスが適用された後の試料にわたるタンパク質分布を示す。図１５Ａ及び１５Ｂの「ａｂｓ．ｄｉｆ」値はそれぞれ、未処理データと正規化されたデータの値と平均値の間の絶対偏差の和を指す。正規化に続いて、タンパク質値をｌｏｇ_２変換する。いくつかの実施形態では、次いで、正規化されたプロテオミクスデータフローの欠測データを代入する。図１６は、代入の前後のデータセットを示す。欠測値は、その平均よりも低い２つの標準偏差及びその平均よりも高い２つの標準偏差から一意的にサンプリングすることによって代入される。代入前のデータセットは線１６１０の上に示されており、代入後のデータセットは線１６１０の下に示されている。

血漿メタボロミクス
いくつかの実施形態では、分光計を使用して試料を分析する前に試料に実行する手順（クロマトグラフィ）に応じた異なる３つの技法によって血漿メタボロミクスデータを取得する。これらの３つの技法は、液体クロマトグラフィ−タンデム型質量分析法（liquid chromatography-tandem mass spectrometry：ＬＣＭＳＭＳ）、液体クロマトグラフィ−質量分析法（ＬＣＭＳ）及びガスクロマトグラフィ−質量分析法（ＧＣＭＳ）である。それぞれの技法による血漿メタボロミクスデータファイルを以下の方法に従って独立に処理し、最終的に併合する。処理されたメタボロミクスデータはメタボロミクスデータ４０４としてＣＴＡＷ４００に入力することができる。データ処理は、ＣＴＡＷ４００との適合性を保証するためにカスタムの構文解析ツールによって注釈が付けられたメタボロミクスデータファイルから始まる。

いくつかの実施形態では、次いで、多数のバッチを横切って収集された注釈付きのデータを併合して、特定の手順のために収集された任意の試料中で測定された全ての代謝産物を含む単一のデータフレームを生成する。いくつかの実施形態では、代謝産物名の代わりに、メタボロミクスデータベースから検索することができる一意の識別子が使用される。いくつかの実施形態では、６０％を超える試料に欠測値がある代謝産物を信頼できないとみなし、したがって、図１７のデータ表現１７００に示されているようにそれらの代謝産物をさらなる分析から除外する。図１７では、維持された代謝産物及び除外された代謝産物がそれぞれ、一番上の列１７１０の明灰色及び暗灰色によって示されている。

いくつかの実施形態では、欠測値を含む代謝産物の欠測値を、その平均よりも低い２つの標準偏差及びその平均よりも高い２つの標準偏差から均一にサンプリングすることによって代入する。代入されたデータセットが図１８に示されている。この図では、代入前のデータセットが水平線１８１０の上に示されており、代入後のデータセットが水平線１８１０の下に示されている。

いくつかの実施形態では、ｌｏｇ_２変換を適用することによってメタボロミクスデータを変換する。いくつかの実施形態では、６０−ｌｅｓｓと呼ばれる手法を使用してデータを正規化する。この手法は、最初に特徴ごとに変動係数を計算し、次に変動係数が下から６０％に入る特徴を不変であるとみなすことを含む。次いで、それぞれの試料の中心を不変の代謝産物の中央値に置き、試料ごとに、平均四分位範囲（ＩＱＲ）を四分位範囲で除した値でスケーリングする。正規化プロセス（６０−ｌｅｓｓ手法）前の試料にわたる代謝産物分布が図１９Ａに示されている。図１９Ｂは、正規化プロセスが適用された後の試料にわたる代謝産物分布を示す。

正規化後、全ての３つの技法による代謝産物データを１つに併合する。その結果得られたデータセットが図２０に示されている。この図では、２つの正規化されたデータファイル中に存在する試料が垂直線２０１０によって分離されている。一方の未処理データファイルでは一意的に測定されているが、もう一方のデータファイルではそうされていない代謝産物が垂直線２０１０によって分離されている。いくつかの実施形態では、２つ以上の技法で測定された代謝産物識別子／代謝産物を優先度に従ってフィルタリングする。技法間の代謝産物に対する優先度は次のとおりである：ＬＣＭＳＭＳ＞ＬＣＭＳ＞ＧＣＭＳ。したがって、ＬＣＭＳＭＳデータセット及びＬＣＭＳデータセット中に代謝産物識別子／代謝産物が存在する場合には、ＬＣＭＳ値を除外し、それにより代謝産物識別子当たり一組の値だけが存在することを保証する。

オミクスデータコンソリデーション
いくつかの実施形態では、オミクス技術によって測定され、処理された分子的特徴を組み合わせて１つのリストにする。一意の試料だけが保持されるように、重複する試料は平均する。欠測データが多すぎることに起因する低い変動性を有する脂質を含むことを防ぐため、図２１に示されているようにして不変の脂質を除去する。このフィルタリングに続いて、収集時刻に関する表現型情報の注釈をオミクス試料に付け、オミクス試料を単一のデータフレームに併合する。

未処理オミクスデータの入力
いくつかの実施形態では、ユーザ（例えば臨床試験管理者）が、未処理のオミクスデータを安全な共用ドライブ内に置き、これらのデータファイルを、ＣＴＡＷ４００による処理について評価する。本明細書に記載されたシステムは、どのファイルがデータを含むのかを識別し、それらのデータファイルに、それらのオミクス技術、試料タイプ及びバッチの注釈を付ける。この手法は、ブラックリストに記載されたキーワードをファイル名が含まない限り、共用ドライブ内に存在する全てのファイルは有効なデータファイルであると仮定することから始まる。表１（下記）は、排除されるブラックリスト用語を含むファイル名を列挙したものである。さらに、接尾辞「ａｌｌ」又は「ａｌｌ−ａｎｎｏｔａｔｅｄ」によって指定された併合されたプロテオミクス未処理ファイルは、個別のファイルが他に存在する場合には無視される。

有効な未処理のオミクスデータファイルを識別した後、使用されたオミクス技術とそれぞれの未処理データファイルに対応する試料タイプとを指定するコード化された名称を有するシンボリックリンク（symbolic link）を生成する。それぞれのファイルに対応するオミクス技術は、元のファイル名中に存在するキーワードに従って、又は個々の技術に固有の特徴の存在によって識別され、試料タイプは主として、ファイル名中のキーワード（尿、血漿、組織又はバフィーコート）の存在によって決定される。ファイル名から試料タイプを決定することができない場合には、マスタファイル中に存在する試料を探索することによって試料タイプを識別する。データタイプを識別した後にシンボリックリンクを生成する。表２（下記）は、本明細書に記載されたシステムによって分析される例示的なシンボリックリンクを示す。この例示的なシンボリックリンクは、１０５＿ＳＴ＿ＬＰ＿ＣＴ＿ＵＲ＿１６９＿０２＿０１．ｘｌｓｘである。

入力臨床記録データ
いくつかの実施形態では、臨床データが、一連のコンマセパレーテッドバリュー（comma-separated value：ＣＳＶ）ファイルとしてＣＴＡＷ４００に入力される。下表３は、例示的な入力臨床データファイルを示す。これらの入力データファイルは、クリニカルデータインターチェンジスタンダーズコンソーシアム（Clinical Data Interchange Standards Consortium：ＣＤＩＳＣ）によって定義されたスタディデータタブレーションモデル（Study Data Tabulation Model：ＳＤＴＭ）に準拠している。

分子的プロファイルデータの生成

患者試料から分子的プロファイルデータを生成するためのシステム及び方法は、質量分析に基づくプロテオミクス、マイクロアレイ遺伝子発現、ｑＰＣＲ遺伝子発現、質量分析に基づくメタボロミクス、及び質量分析に基づくリピドミクス、ＳＮＰマイクロアレイ、並びに他のプラットフォーム及び技術のためのシステム及び方法を含み得る。患者サンプルを分析するために、大規模ハイスループット定量的プロテオーム分析を使用することができる。

一部の例の実施形態において、定量的ポリメラーゼ連鎖反応（ｑＰＣＲ）及びプロテオミクスが実施されて、定量的ポリメラーゼ連鎖反応（ｑＰＣＲ）及びプロテオミクスによる細胞ｍＲＮＡ及びタンパク質発現の変化をプロファイリングする。全ＲＮＡは、市販のＲＮＡ単離キットを用いて単離することができる。ｃＤＮＡ合成後に、血管新生、アポトーシス及び糖尿病等、疾患領域又は細胞プロセスに特異的な市販のｑＰＣＲアレイ（例えば、ＳＡＢｉｏｓｃｉｅｎｃｅｓ製）を用いて、メーカーの説明書に従って予め定められた遺伝子のセットをプロファイリングすることができる。例えば、Ｂｉｏｒａｄｃｆｘ−３８４増幅システムは、あらゆる転写プロファイリング実験に用いることができる。データ収集（Ｃｔ）後に、メーカーのプロトコールに概要が述べられているδＣｔ方法を用いて、対照に対する最終変化倍数を決定することができる。プロテオミクスサンプル解析は、後続のセクションに記載されている通りに実施することができる。

この目的に適した多数の当該技術分野において認識されている技術が存在する。例示的な技法である、質量分析と組み合わせたｉＴＲＡＱ解析を下に簡潔に記載する。

定量的プロテオミクスアプローチは、８−ｐｌｅｘｉＴＲＡＱ試薬による安定的同位体標識と、ペプチド同定及び定量化のための２Ｄ−ＬＣＭＡＬＤＩＭＳ／ＭＳに基づく。この技法による定量化は相対的である。すなわちペプチド及びタンパク質は、参照サンプルに相対的な存在比を割り当てられる。複数のｉＴＲＡＱ実験における共通参照サンプルは、複数のｉＴＲＡＱ実験にわたるサンプルの比較を容易にする。

例えば、この解析スキームを実行するため、メーカーの示唆するところに従って、６種の一次サンプル及び２種の対照プールサンプルを８−ｐｌｅｘｉＴＲＡＱミックスに組み合わせることができる。続いて、８種のサンプルのこの混合物を二次元液体クロマトグラフィー（一次元目に強（ｓｔｒｏｎｇ）カチオン交換（ＳＣＸ）、二次元目に逆相ＨＰＬＣ）により分画することができ、次いで質量分析による解析に付すことができる。

用いることのできる例示的な研究室手順の概略は、本明細書に提供されている。

タンパク質抽出：細胞をプロテアーゼ阻害剤（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃＨａｌｔプロテアーゼ阻害剤ＥＤＴＡフリー）を含む８Ｍ尿素溶解バッファーにより溶解し、１０分毎に５秒間ボルテックス（ｖｅｒｔｅｘ）しつつ、氷上で３０分間インキュベートすることができる。５秒間パルスの超音波処理により溶解を完了することができる。細胞ライセートを１４０００×ｇで１５分間（４℃）遠心分離して、細胞デブリを除去することができる。ブラッドフォード（Ｂｒａｄｆｏｒｄ）アッセイを行って、タンパク質濃度の決定を実施することができる。各サンプル由来の１００μｇのタンパク質を還元（１０ｍＭジチオスレイトール（ＤＴＴ）、５５℃、１時間）し、アルキル化（２５ｍＭヨードアセトアミド、室温、３０分間）し、トリプシンで消化（１：２５ｗ／ｗ、２００ｍＭ重炭酸トリエチルアンモニウム（ＴＥＡＢ）、３７℃、１６時間）することができる。

ｉＴＲＡＱ８Ｐｌｅｘ標識：各実験セットにおける各トリプシン消化物由来のアリコートを一体にプールして、プールされた対照サンプルを作製することができる。メーカーのプロトコール（ＡＢＳｃｉｅｘ）に従ってｉＴＲＡＱ８Ｐｌｅｘ試薬により、各サンプル及びプールされた対照サンプル由来の等量のアリコートを標識することができる。反応物を組み合わせ、減圧乾固し、０．１％ギ酸を添加することにより再懸濁し、ＬＣ−ＭＳ／ＭＳにより解析することができる。

２Ｄ−ＮａｎｏＬＣ−ＭＳ／ＭＳ：全標識ペプチド混合物を、オンライン２Ｄ−ｎａｎｏＬＣにより分離し、エレクトロスプレータンデム質量分析により解析することができる。実験は、ナノエレクトロスプレーイオン源（ＴｈｅｒｍｏＥｌｅｃｔｒｏｎ、ドイツ、ブレーメン）を備えるＬＴＱＯｒｂｉｔｒａｐＶｅｌｏｓ質量分析計に接続されたＥｋｓｉｇｅｎｔ２ＤＮａｎｏＬＣＵｌｔｒａシステムにおいて行うことができる。

ペプチド混合物を、５ｃｍＳＣＸカラム（３００μｍＩＤ、５μｍ、ポリスルホエチルアスパルトアミド（ＰｏｌｙＳＵＬＦＯＥＴＨＹＬＡｓｐａｒｔａｍｉｄｅ）カラム、ＰｏｌｙＬＣ製、メリーランド州コロンビア）に流速４μＬ／分で注入し、１０個のイオン交換溶出セグメントにおいてＣ１８トラップカラム（２．５ｃｍ、１００μｍＩＤ、５μｍ、３００Å ＰｒｏｔｅｏＰｅｐＩＩ、ＮｅｗＯｂｊｅｃｔｉｖｅ製、マサチューセッツ州ウォバーン）へと溶出させ、Ｈ２Ｏ／０．１％ＦＡで５分間洗浄することができる。続いて、２〜４５％のＢ（Ｈ２Ｏ／０．１％ＦＡ（溶媒Ａ）及びＡＣＮ／０．１％ＦＡ（溶媒Ｂ））の勾配を用いて３００ｎＬ／分で１２０分間、１５ｃｍ溶融石英カラム（７５μｍＩＤ、５μｍ、３００Å ＰｒｏｔｅｏＰｅｐＩＩ、ＮｅｗＯｂｊｅｃｔｉｖｅ製、マサチューセッツ州ウォバーン）において分離を更に行うことができる。

Ｏｒｂｉｔｒａｐにおいて分解能３０，０００により、フルスキャンＭＳスペクトル（ｍ／ｚ３００〜２０００）を取得することができる。高エネルギーＣ−トラップ解離（ＨＣＤ）を用いてフラグメント化のために最も強いイオン（最大１０種）を連続して単離し、３０秒間動的に除外することができる。ＨＣＤは、単離幅１．２Ｄａで行うことができる。ｏｒｂｉｔｒａｐにおいて分解能７５００により、得られたフラグメントイオンをスキャンすることができる。ＬＴＱＯｒｂｉｔｒａｐＶｅｌｏｓは、Ｘｃａｌｉｂｕｒ２．１とｆｏｕｎｄａｔｉｏｎ１．０．１により制御することができる。

ペプチド／タンパク質同定及び定量化：ペプチド及びタンパク質は、ＳｗｉｓｓＰｒｏｔデータベースに対するＭａｓｃｏｔ検索エンジンを備えるＰｒｏｔｅｏｍｅＤｉｓｃｏｖｅｒｅｒソフトウェア（ＴｈｅｒｍｏＥｌｅｃｔｒｏｎ）を用いた自動データベース検索により同定することができる。検索パラメータは、ＭＳトレランス（ｔｏｌｅｒａｎｃｅ）に対し１０ｐｐｍ、ＭＳ２トレランスに対し０．０２Ｄａ及び最大２個の切断見逃しを許す完全トリプシン消化を包含し得る。カルバミドメチル化（Ｃａｒｂａｍｉｄｏｍｅｔｈｙｌａｔｉｏｎ）（Ｃ）は、固定された修飾として設定することができる。酸化（Ｍ）、ＴＭＴ６及び脱アミド（ＮＱ）は、動的な修飾として設定することができる。ペプチド及びタンパク質同定は、Ｍａｓｃｏｔ有意閾値（ｐ＜０．０５）によりフィルターをかけることができる。フィルターは、タンパク質同定の９９％信頼レベルを許可することができる（１％ＦＤＡ）。

ＰｒｏｔｅｏｍｅＤｉｓｃｏｖｅｒｅｒソフトウェアは、レポーターイオンに補正因子を適用することができ、あらゆる定量化チャネルが存在する訳でなければ、あらゆる定量化値を拒絶することができる。相対的タンパク質定量化は、平均強度における正規化により成し遂げることができる。

ＡＩに基づくシステムを使用したベイジアン因果関係ネットワークの生成

ベイジアン因果関係ネットワークの生成を、説明目的のため、以下でＡＩに基づくインフォマティクスシステムについて詳細に説明する。ただし当業者は、ベイジアン分析を用いる他のシステムを用いることができることを理解するであろう。

人工知能（ＡＩ）に基づくインフォマティクスシステム又はプラットフォームを用いて、スライスされたデータセットに基づくベイジアン因果関係ネットワークの生成を実施することができる。実施形態の例において、ＡＩに基づくシステムは、数学的アルゴリズムを用いて入力変数（例えば、加工された臨床記録データ及び加工された分子的プロファイルデータ）間の因果関係を確立する。このプロセスは、潜在的な、確立された及び／又は確認された生物学的関係性に関する先行する既存の知識を考慮することなく、入力データ単独のみに基づく。上記のように、生物学的データからのベイジアン因果関係ネットワークの生成に関するさらなる詳細は、「照合による細胞に基づくアッセイ及びその使用」という名称の米国特許出願公開第２０１２／０２５８８７４号Ａ１に記載されている（その全内容を参照により本明細書に組み入れる）。

一部の実施形態において、ベイジアン因果関係ネットワークの生成のためのかかるＡＩに基づくシステムの顕著な利点は、得られるネットワークが、生物学的プロセスに関する当該技術分野におけるいかなる既存の知識に頼る又は考慮することもなく、専らスライスされたデータに基づくことである。更に、好ましくはデータ点は、統計的に又は人為的にカットオフされず、代わりに、スライスされたデータは全て、変数間の関連を決定するためにＡＩシステムに読み込まれる。従って、作成されたベイジアン因果関係ネットワークの形態での得られた統計モデルは、入力データ間のいかなる公知の生物学的関係性も考慮しないため先入観のない（不偏性）ものである。

具体的には、スライスされたデータセットは、データ関連に基づき統計モデルを組み立てるＡＩに基づく情報システムに入力される。続いて、シミュレーションに基づくネットワークが、統計モデルから導かれる。

スライスされたデータを、必要があれば正規化し、入力データセットとしてＡＩに基づくインフォマティクスシステム（例えば、ベイジアンネットワークモジュール３５０）に入力する。一部の実施形態において、ＡＩに基づくインフォマティクスシステムは入力データを使用するものであり、入力データの小さなセット（例：２〜３メンバーセット又は２〜４メンバーセット）間の定量的関係を定義する可能性あるネットワークフラグメントのライブラリ又はリストを構築するために使用される。異なる種類の入力データは、それらが個々の患者において異なり得るかどうかにかかわらず、「変数」と呼ばれる。例えば、性別、年齢、民族、血圧、及び特定のタンパク質の発現レベルはすべて、この文脈では「変数」と呼ばれるだろう。ネットワークフラグメント内の変数間の関係は、線形、ロジスティック、多項式、優性ホモ接合、又は劣性ホモ接合、などである。各フラグメントにおける関係は、ベイジアン確率スコアを割り当てられる。このスコアは、関係候補が入力データを与えられる可能性を反映したものであり、数学的複雑さによって関係に対してペナルティを与える。スコアに基づいて、ライブラリ内の最も可能性のあるフラグメントを識別することができる（尤もらしいフラグメント）。フラグメント列挙において様々なモデルタイプを用いることができる。例えば以下が挙げられるがこれに限定されない：ロジスティック回帰、（分散分析）ＡＮＯＶＡモデル、（共分散分析）ＡＮＣＯＶＡモデル、非線形／多項回帰モデル、ノンパラメトリック回帰。モデルパラメータに対する従来の仮定は、モデルにおいて用いるパラメータ数に関してＧｕｌｌ分散又はベイジアン情報量基準（ＢＩＣ）ペナルティを想定している。

ネットワーク推論（inference）プロセスでは、フラグメントライブラリ内又は又はフラグメントのリスト内のフラグメントのサブセットから構築された集合内の各ネットワークを用いて初期試行ネットワークの集合が構築され、初期試行ネットワークが進化する。いくつかの実施形態では、初期試行ネットワークの集合内の各初期試行ネットワークは、フラグメントライブラリ又はフラグメントリストからのフラグメントの異なるサブセットを用いて構築される。最終的には、ライブラリ内のネットワークフラグメントの異なるサブセットから初期試行ネットワークの集合が作成される（例えば、５００ネットワーク又は１０００ネットワーク）。このプロセスは、並列集合サンプリングと呼ばれることがある。いくつかの実施形態では、集合内の各試行ネットワークは、ライブラリから追加のネットワークフラグメントを追加、減算、及び／又は置換することによって進化又は最適化される。いくつかの実施形態では、追加のデータが得られる場合、追加のデータはライブラリ内又はリスト上のネットワークフラグメントに組み込まれてもよく、各試行ネットワークの進化を通じて試行ネットワークの集合に組み込まれてもよい。最適化／進化プロセスの完了後、試行ネットワークの集合は、生成されたネットワークとして説明されることがある。

Xingら、「Causal Modeling Using Network Ensemble Simulations of Genetic and Gene Expression Data Predicts Genes Involved in Rheumatoid Arthritis」、PLoS Computational Biology、7巻、3号、1〜19(2011年3月)(e100105)に基づく、ベイジアンネットワーク及びネットワークフラグメントの根底にある数学的表現の概説を下に提示する。

ランダム変数Ｘ＝Ｘ_１，．．．，Ｘ_ｎによる多変量システムは、多数のパラメータΘを包含する多変量確率分布関数Ｐ（Ｘ_１，．．．，Ｘ_ｎ；Θ）により特徴付けることができる。多変量確率分布関数を因数分解し、ローカル条件付き確率分布の積により表すことができる：
（式中、各変数Ｘ_ｉは、Ｙ_ｊ１，．．．，Ｙ_ｊＫｉである、そのＫ_ｉ親変数を与えられたその非派生（ｄｅｓｃｅｎｄｅｎｔ）変数とは独立的である）。因数分解後に、各ローカル確率分布は、それ自身のパラメータΘ_ｉを有する。

多変量確率分布関数は、異なる仕方で因数分解することができ、各特定の因数分解及び対応するパラメータは、別個の確率的モデルである。各特定の因数分解（モデル）は、変数Ｘ_ｉ毎の頂点及びローカル条件付き分布
における変数間の依存性を表す頂点間の有向性エッジを有する、有向非巡回グラフ（ＤｉｒｅｃｔｅｄＡｃｒｙｌｉｃＧｒａｐｈ）（ＤＡＣ）で表すことができる。それぞれ頂点及び関連する有向性エッジを包含するＤＡＧの部分グラフは、ネットワークフラグメントである。

モデルは、入力データを仮定したとき、最も尤もらしい因子分解又は最も尤もらしいパラメータを判定することにより、進化又は最適化される。これは、“ベイジアンネットワークを学習する”と呼ぶことができる。換言すると、入力データのトレーニングセットを与えられると、その入力データに最も合致するネットワークを発見することである。これは、各ネットワークを入力データに対して評価するスコアリング関数を用いることにより実現される。

ベイジアンフレームワークを用いて、入力データを与えられたときの因子分解の尤度を判定することができる。ベイズの定理によれば、モデルＭ、所与のデータＤの事後確率Ｐ（Ｄ｜Ｍ）は、想定モデルＰ（Ｄ｜Ｍ）を与えられるとき、データの事後確率とモデルの事前確率Ｐ（Ｍ）の積の積に比例する。データの確率Ｐ（Ｄ）はモデル全体にわたって一定であると仮定する。これは以下の式により表される：

モデルを想定したデータの事後確率は、パラメータの事前分布でデータ尤度を積分することにより得られる：

全てのモデルが均等尤度（すなわちＰ（Ｍ）が一定）であると仮定すると、モデルＭ、所与のデータＤの事後確率は、各ローカルネットワークフラグメントＭ_ｉについてのパラメータの積分の積に因子分解することができる：

上記数式において、主要定数項は省略している。いくつかの実施形態において、ベイジアン情報量基準（ＢＩＣ）はモデルの事後確率Ｐ（Ｄ｜Ｍ）の負対数をとり、各モデルを以下のように「スコアリング」するために用いることができる：

モデルＭについての総スコアＳ_ｔｏｔは、ローカルスコアＳｉの各ローカルネットワークフラグメントについての合計である。ＢＩＣはさらに、各ネットワークフラグメントのスコアを判定する数式を与えている：
κ（Ｍｉ）は、モデルＭｉにおけるフィッティングパラメータの個数である。Ｎはサンプル（データ点）の個数である。Ｓ_ＭＬＥ（Ｍ_ｉ）は、ネットワークフラグメントの尤度関数の負対数であり、各ネットワークフラグメントについて用いる関数関係から計算することができる。ＢＩＣスコアについて、スコアが低いほどモデルは入力データに合致する尤度が高い。

試行ネットワークの集合はグローバル最適化され、これはネットワークを最適化又は進化させると呼ぶ。例えば、一部の実施形態において、試行ネットワークは、メトロポリスモンテカルロサンプリングアルゴリズムにしたがって進化し最適化される。シミュレーテッドアニーリングを用いて局所変換することにより、集合内の各試行ネットワークを最適化又は進化させることができる。シミュレーテッドアニーリングプロセスの例において、各試行ネットワークは、ライブラリからネットワークフラグメントを追加することにより、削除された試行ネットワークからネットワークフラグメントにより、ネットワークフラグメントを置き換えることにより、又はネットワークトポロジーを変更することにより変更され、ネットワークの新たなスコアが計算される。一般に、スコアが改善すると変更が維持され、スコアが悪化すると変更は拒否される。“温度”パラメータにより、悪化するスコアを維持するようなローカル変更を実施することができる。これは、最適化プロセスが局所解を回避するためのものである。“温度”パラメータは時間にともなって減少し、これにより最適化／進化プロセスを収束させることができる。

ネットワーク推定プロセスの全部又は一部は、異なる試行ネットワークについて並列実施することができる。各ネットワークは別のプロセッサ及び／又は別のコンピュータデバイス上で並行して最適化される。いくつかの実施形態において、最適化プロセスは、並列動作する数百から数千のプロセッサを組み込んだスーパーコンピュータ上で実施することができる。情報は、並列プロセッサ上で実施される最適化プロセス間で共有することができる。

最適化プロセスは、ネットワークフィルタを含むことができる。ネットワークフィルタは、総合スコアが閾値基準を満たさないネットワークを集合から除去する。除去されたネットワークは新たな試行ネットワークによって置き換えられる。“スケールフリー”でないネットワークも集合から除去することができる。ネットワーク集合が最適化又は進化完了すると、その結果は生成されたネットワークの集合と呼ぶことができる。これは生成されたコンセンサスネットワークと呼ぶことができる。

予測のための定量的関係情報を抽出するためのシミュレーション

生成したネットワークの集合を用いて、生物学的システムの挙動をシミュレーションし得る。各ノードに対して個々にシミュレートされる摂動を適用する一方で生成したネットワーク内の他のノードに対する影響を観察することにより、生成したネットワーク内の関係の定量的パラメータを抽出することができる。例えば定量情報抽出のシミュレーションは、ネットワーク内の各ノードを１０倍摂動させるステップ（増やす又は減らす）、モデル内の他ノード（例えばタンパク質）について事後分散を計算するステップ、を含む。終端はｔ検定によって、群あたり１００サンプル、有意度０．０１カットオフで比較される。ｔ検定統計は、１００個のｔ検定の中央値である。このシミュレーション技術を用いて、予測の強度を表すＡＵＣ（曲線下面積）と、終端を構築するノードのｉｎｓｉｌｉｃｏ値（magnitude）を表す変化倍率とが、ネットワーク集合内の各関係について生成される。

ローカルコンピュータシステムの関係定量化モジュールを用いて、摂動をＡＩに基づくシステムに実施させ、ＡＵＣ情報と比（倍率）情報を抽出することができる。抽出した定量情報は、親ノードを子ノードと接続する各エッジについての変化倍率とＡＵＣを含む。いくつかの実施形態において、カスタム構築したＲプログラムを用いて、定量情報を抽出することができる。

いくつかの実施形態において、生成した細胞モデルネットワークの集合をシミュレーションで用いて、結果を予測することができる。

ＡＩに基づくシステムの出力は、定量関係パラメータ及び／又はその他シミュレーション予測であってもよい。

得られたベイジアン因果関係ネットワーク

シミュレーションから得られた定量的関係情報を伴う又は伴わない生成されたネットワークの結果として生じる集合は、スライスされたデータセットを表すベイジアン因果関係ネットワークと呼ばれることがある。このネットワークは、スライスされたデータセットの変数を表すノードと、変数間の関係を表す方向性エッジを含む。

一部には、接続が、コンピュータアルゴリズムにより「学習」された観察データセット間の相関に基づき得るため、スライスされたデータセットにおける種々の変数に関するノード表示（node representing）データ間のネットワーク接続は「確率的」である。例えば、タンパク質Ｘの発現レベル及びタンパク質Ｙの発現レベルが、データセットの統計解析に基づき、正に又は負に相関する場合、因果関係を割り当て、タンパク質ＸとＹの間のネットワーク接続を確立することができる。かかる推定因果関係の信頼性は、ｐ値（例えば、ｐ＜０．１、０．０５、０．０１等）により測定することのできる接続の尤度により更に定義することができる。

スライスされたデータセット内の異なる変数に対するデータを表すノード間のネットワーク接続は、部分的には、リバースエンジニアリングプロセスによって決定されるネットワーク接続が、接続された変数間の関係の原因及び影響を反映するために、「方向性（directional）」又は「因果的（causal）」である。その結果、変数の発現レベルを上げると、接続が刺激的であるか抑制的であるかに応じて、他方の発現レベルが上昇するか、又は下降し得る。

一部には、該プロセスにより決定されるネットワーク接続が、既存のデータセット及びこれに関連する確率的尺度に基づきｉｎｓｉｌｉｃｏでシミュレートすることができるため、スライスされたデータにおける種々の変数に関するノード表示（node representing）データ間のネットワーク接続は「定量的」である。例えば、確立されたネットワーク接続において、所定のタンパク質（又はネットワークにおける「ノード」）の発現レベルを理論的に増加又は減少（例えば、１、２、３、５、１０、２０、３０、５０、１００倍以上）させ、ネットワークにおける他の接続されたタンパク質に対するその影響を定量的にシミュレートすることが可能となり得る。

少なくとも一部には、データ点は統計的に又は人為的にカットオフされないため、また一部には、対象の生物学的プロセスに関する既存の知識を参照することなく、ネットワーク接続が入力データ単独に基づくため、スライスされたデータにおける種々の変数に関するノード表示（node representing）データ間のネットワーク接続は「先入観のない（不偏性の）もの（unbiased）」である。

一部には、あらゆる入力変数間の広範な可能性ある接続は、先入観のない（unbiased）様式で体系的に探られたものであるため、データにおける分子測定値間のネットワーク接続は「体系的」及び（不偏性）である。かかる体系的探索を実行する演算能力における確実性は、入力変数の数が増加するにつれて指数関数的に増加する。

一般に、ほぼ５００〜１，０００種のネットワークの集合は通常、スライスされたデータセット内の変数の全ての間の確率的な因果関係がある定量的関係性の予測に十分である。ネットワークの集合は、データにおける不確定性を捕捉し、モデル予測毎の信頼測定基準の計算を可能にする。予測は、ネットワークの集合を一体的に用いて作成され、集合における個々のネットワーク由来の予測の差は、予測における不確定性の度合いを表す。この特色は、ネットワークに基づく臨床結果の予測の信頼測定基準の割り当てを可能にする。

モデルがリバースエンジニアリングされると、さらなるシミュレーションクエリーをモデルの集合において行い、対象の臨床結果に関する可能性あるバイオマーカーを決定することができる。

差次的（デルタ）ネットワークの生成

差次的ネットワーク創出モジュールを用いて、種々のスライスされたデータセットに関するベイジアン因果関係ネットワーク間で差次的（デルタ）ネットワークを作成することができる。差次的ネットワークは、種々のスライスされたデータセットに関するベイジアン因果関係ネットワークにおける関係性の定量的パラメータの全てを比較する。差次的ネットワークにおける関係性毎の定量的パラメータは、比較に基づく。一部の実施形態において、差次は、デルタ−デルタネットワークと呼ぶことのできる様々な差次的ネットワークの間で実施することができる。

そのような差分ネットワークは、１つのスライスデータセットにおいて他のスライスデータセットと比較して関係がどのように変化するかを強調する。例えば、反応性患者（例えば、全体的な臨床的利益を示す）に関するスライスデータと非反応性患者（例えば、臨床的利益を示さない）に関するスライスデータとに基づくベイジアン因果関係ネットワーク間の差分ネットワークを用いて、２つの患者群の変数間の関係における相違（差）を強調することができる。

ネットワークの可視化
ネットワークの集合及び差次的ネットワークの関係性の値は、ネットワーク可視化プログラム（例えば、複雑なネットワーク解析のためのサイトスケープ（Ｃｙｔｏｓｃａｐｅ）オープンソースプラットフォーム及びサイトスケープ（Ｃｙｔｏｓｃａｐｅ）コンソーシアムからの可視化）を用いて可視化することができる。ネットワークの視覚的描写において、各エッジ（例えば、タンパク質を接続する各線）の密集度は、倍数変化の強度を表す。エッジは、因果関係を示す方向性でもあり、各エッジは、関連した予測信頼レベルを有する。

ＣＴＡＷの出力
臨床試験の統計分析の結果はさまざまなファイルとして記憶される。いくつかの実施形態では、記憶されたファイルが、作用剤の試験と参加したそれぞれの患者内への投与の時間の分子的相関物（molecular correlate）を同定する回帰分析の完全な出力である結果を含む。回帰手順は次のように実施される。最初に、全ての患者試料の利用可能なオミクスデータを決定する。次に、それぞれの患者内で回帰分析を実行する。回帰分析に続いて、有意な結果を同定し、それらを編集してスプレッドシートにする。いくつかの実施形態では、スプレッドシートに加えて、有意な結果をヒートマップとして視覚化する。

いくつかの実施形態では、プロテオミクス回帰分析によって同定された経路メンバ（pathway member）の頻度を視覚化するためのワードクラウド（word cloud）を生成する。この手法は、最初に、経路を、生物学的機能を実行する一組のタンパク質であると考える。経路メンバシップ（membership）は、ＢｉｏＣａｒｔａ及びＫＥＧＧなどの公開されたデータベースから取得する。経路メンバシップについてのこの以前の知識が与えられたら、臨床試験患者からの回帰ヒット（regression hit）中の経路タンパク質の発生を計算する。ワードクラウドは、最も頻繁に見出される経路タンパク質を最も大きなテキストで示し、まれにしか見出されない経路タンパク質をより小さなテキストで示すことによって、この情報を視覚的な形態で表現する。色の使用により、プロテオミクス回帰ヒットの方向性がワードクラウド上に示される。患者試料中で首尾一貫してアップレギュレートされた回帰ヒットは赤で示され、ダウンレギュレートされたタンパク質は緑で示される。患者中でダウンレギュレートと同じくらいの頻度でアップレギュレートされた回帰ヒットは黒で示される。

いくつかの実施形態では、統計分析パイプラインの完了後に患者リポートが自動的に生成される。患者リポートには例えば、分析で使用された方法、利用可能なオミクスデータ、並びにアップレギュレートされたオミクスヒット及びダウンレギュレートされたオミクスヒットが記載される。加えて、いくつかの実施形態では、患者リポートに、ヒートマップ及び経路マップ視覚化が含まれる。

出力ＡＩネットワーク
いくつかの実施形態では、ＣＴＡＷ４００の１つの出力が、ベイジアン学習によって生成された一組の人工知能（ＡＩ）ネットワークである。ＡＩネットワークは、生成されたデータスライスごとに生成され、臨床的変数と分子的変数の間の原因−結果関係を明らかにする。例えば、重度の有害事象の場合には、２つのデータスライス、すなわち（１）患者が毒性グレード３の有害事象を経験したデータ、及び（２）患者が毒性グレード３の有害事象を経験しなかったデータが生成される。ベイジアン学習を適用することによって、毒性グレード３以上の有害事象からの患者データ、及びこれらの重度の有害事象のない患者データを表現するように、ネットワークが学習される。

図２５は、血液及びリンパ系の障害に関係した重度の有害事象を患者が経験している間にそれらの患者から収集されたデータを表すネットワークの集合であるＡＩネットワークを示す。重度の有害事象は、グレード３の毒性を有する有害事象と定義されている。その集合中で頻度が４０％未満のネットワークエッジはネットワーク視覚化の前に除去した。

図２６は、血液及びリンパ系の障害に関係した重度の有害事象を患者が経験していない間にそれらの患者から収集されたデータを表すネットワークの集合であるＡＩネットワークを示す。上と同じく、重度の有害事象は、グレード３の毒性を有する有害事象と定義されている。ネットワークの集合中で頻度が４０％未満のネットワークエッジはネットワーク視覚化の前に除去した。

個々のデータスライスによって学習されたネットワークに加え、ネットワークを組み合わせて、表現型状況間のトポロジの差に対するさらなる洞察を得ることもできる。例えば、２つのネットワークからなるネットワーク対からデルタネットワークを生成することができる。デルタネットワークは、一方のネットワークには存在するがもう一方のネットワークには存在しないエッジからなるネットワーク、又は、一方のネットワーク中のパラメータがもう一方のネットワークに対して有意に異なるネットワークである。図２５及び２６に関して上で説明した一対の有害事象ネットワークについて言えば、毒性グレード３の有害事象を表すネットワーク中には存在するが、毒性グレード３の有害事象がないことを表すネットワーク中には存在しないエッジを含むデルタネットワークを生成することができる。図２７は、この血液及びリンパ系の障害に関係した重度の有害事象象の存在又は不在に起因するネットワークの対から生成されたデルタネットワークを示す。このネットワークは、有害事象ネットワーク中に存在するエッジであり、患者が重度の有害事象を経験しなかったデータによって学習されたネットワーク中に存在しないエッジに限定される。

ログ
いくつかの実施形態では、ＣＴＡＷ４００が実行されたときに自動的にログファイルが生成される。ワークフローの実行中に、ログファイルは、ワークフローの進捗をユーザが監視することを可能にする。ログファイルを確認することにより、ユーザは、データ処理及びその後のステップが、ワークフローの実行を停止させたであろう予想外の入力に遭遇することなく適時に進んでいることを確信することができる。加えて、ログファイルの監視は、ワークフローの実行が完了するまでにどのくらいの時間がかかるのかをユーザが推定することを可能にする。ログファイルはさらに、ＣＴＡＷ４００の実行中に実施されたアクションを文書化する記録を提供する。文書化は、ＣＴＡＷによって生成された結果の信頼性をユーザが過去に遡って検査することを可能にする。

患者ダッシュボード
いくつかの実施形態では、臨床データの直観的な視覚化を提供する患者ダッシュボードがＣＴＡＷから出力される。図２８は、例示的な患者ダッシュボードを示す。人口統計的情報に加えて、患者ダッシュボードは、初期腫瘍位置、割り当てられた試験群、以前の治療、参加した時間の長さ及び素質事象に関する静的情報を提供する。試験参加の全体にわたって収集された臨床情報が縦にプロットされている。プロットに含まれる動的臨床情報の例は、腫瘍サイズ、腫瘍反応、検査室測定及び有害事象の存在である。さらに、作用剤注入及びサイクル開始日が患者プロファイル上に示されている。例示的な実施形態では、腫瘍サイズの低減が最も大きな患者が最初にプロットされるような形で、その時点の腫瘍サイズの順番に、患者が患者ダッシュボードにプロットされる。

試料マップ
いくつかの実施形態では、対話式視覚化（interactive visualization）試料データを可能にする試料マップがＣＴＡＷから出力される。図２９は、例示的な試料マップを示す。この視覚化は、患者試料ごとの利用可能なオミクスデータを対話式グリッド（grid）として示している。上述のとおり、いくつかの実施形態では、それぞれの患者が、患者の試験参加の全体にわたって収集された血漿、バフィーコート、尿及び組織試料を有する。この視覚化では、患者試料が行（row）によって示されており、時点が列（column）として示されている。オミクスデータの利用可能性が色によって示されており、８つの色レベルが、３つのオミクス技術、すなわちリピドミクス、プロテオミクス及びメタボロミクスの存在の有無を表している。

試料マップは、ユーザが、視覚化されたデータと対話することを可能にする。これは以下のように実施される。試料タイプ、患者又は他の判定基準に従ってデータ行の順序を並び替えることができる。試料タイプによる順序付けでは、一番上にバフィーコート試料を示し、続いて血漿、組織、尿を試料を示す。患者による順序付けでは、最初の患者の全ての試料を列挙し、続いて２番目の患者の全ての試料を列挙し、以下同様にして最後に最後の患者の全ての試料を列挙する。試料マップはさらに、視覚化が、特定の行（患者試料）及び列（時点）によって順序付けされることを可能にすることもできる。

患者マップ
例示的な実施形態では、患者マップウェブページが、臨床試験に参加した全ての患者に対して実施された腫瘍測定の対話式視覚化を提供する。図３０は、例示的な患者マップウェブページを示す。この視覚化は、ＣＴＡＷの部分として自動的に生成される。患者マップウェブページとの対話は、関心の患者サブセットの腫瘍成長をユーザが見ることを可能にする。

この患者マップウェブページに掲載されるためには、患者は、試験開始前に少なくとも１回及び試験開始後に少なくとも１回、腫瘍を測定をしなければならない。腫瘍サイズは、腫瘍部位を横切る幾何学的平均となるように測定される。患者試験群情報及び人口統計的情報は臨床記録から取得される。治療群が未定義の患者はこの視覚化から省かれる。人種情報を欠く患者にはプレースホルダ値「未指定（Not specified）」が与えられる。

ユーザは、患者腫瘍反応を着色するために使用されたカラースキーム（color scheme）を選択することによって患者マップと対話することができる。「治療（Treatment）」又は「研究群（Study Arm）」によって着色するオプションは、どの患者が単独治療群に割り当てられたのか、又は併用治療群で使用されている特定の化学療法剤をユーザが知ることを可能にする。さらに、線の色で、患者の性、人種、年齢又はエスニシティを示すこともできる。「結果（Outcome）」を選択すると、患者が試験から離脱した理由によって線が着色される。

潜在的バイオマーカー（例えばコンパニオン診断）の決定
上述のとおり、いくつかの実施形態では、潜在的バイオマーカー（例えばコンパニオン診断マーカーＣＤｘ）の決定が、結果動因を同定するためのＡＩ−ネットワーク（例えばベイジアンネットワーク）の分析、差次的に発現された変数を同定するための統計分析及び機械学習のうちの一部又は全部を含む。上述のとおり、いくつかの実施形態では、潜在的バイオマーカーの決定が、（１）関連したＡＩネットワーク中の予測対象に関係した主要な出力の動因である変数を獲得するステップ、（２）指定された時点における患者層別化群間の差次的に発現された変数を同定するステップ、及び（３）ステップ（１）及び（２）の結果を、どの特徴が表現型結果をロバストに予測するのかを判定する機械学習アルゴリズムに入力するステップを含む。

ＡＩネットワーク（例えばベイジアンネットワーク）による結果動因の同定
以前の項で説明したとおり、ＣＤｘマーカーを使用して、臨床的反応、有害事象の存在又は他の判定基準に基づいて患者を層別化することができる。候補ＣＤｘマーカーを選択する１つの方法は、結果動因を見つけることによる方法である。結果動因は、臨床的結果を生じさせる確率が高いことがＡＩネットワークによって推測されるノードと定義される。例示的な実施形態では、結果動因の決定が、特に所望の患者層別化のために実行され、３つの仕様（specification）を実施することを要求する。

第１の仕様は、関心の層別化に関係した臨床的結果変数のセットである。例えば、臨床反応に関して患者を層別化すると、臨床的結果変数の選択が例えば腫瘍サイズ、腫瘍反応及び相対的腫瘍サイズになる。層別化が、有害事象の存在又は不在に従って実施される場合には、臨床的結果変数が適切な有害事象変数を含むであろう。

第２の仕様は、その中から結果動因を獲得すべきＡＩネットワークのセットである。作用剤の投与前に特徴を測定することによって患者結果を予測する目的を有するＣＤｘパネルは、第１の治療サイクル（例えば１サイクル目）中に個々の患者からのＡＩネットワークから導出された結果動因を考慮する可能性がある。

最後の仕様は、結果動因と臨床的結果変数の間で実施される接続のタイプである。接続のタイプは、接続度及び方向性を含む。第１度の近傍である直接接続は、結果動因と臨床的結果変数の間の直接の因果相関を暗示する。第２度以上の接続は、間接的に接続する追加の変数を含む。方向性は、親−子ノードに関して臨床的結果変数に影響を与えるのにユーザが結果動因を必要とするかどうか、又は、逆に、ユーザがさらに、臨床的結果変数が結果動因に影響を与えることを許すかどうかを指定する。

結果動因を決定する手順は、次の２つのケーススタディによって示される：（１）治療に対する患者の反応による患者の層別化、及び（２）重度の有害事象の存在に基づく患者の層別化。患者反応に関係したＣＤｘマーカーを予測する第１のケーススタディに関しては、図３３に示されているように、１サイクル目に収集された患者データを表す３２個のＡＩネットワークのうちの少なくとも１つのＡＩネットワーク中の臨床的結果変数に対する１次親ノード（first-order parent node）の役目を果たす６８個の結果動因が見つかる。患者有害事象を予測する第２のケーススタディに関しては、図３４に示されているように、有害事象に関係した結果変数に対する１次親ノードの役目を果たす１１５個の結果動因が見つかる。両方のケーススタディで、１サイクル目に収集された患者データを表す３２個のＡＩネットワーク中の結果動因をそれから獲得するネットワークのセット。

差次的に発現された変数の同定
いくつかの実施形態では、臨床試験中に投与された作用剤に反応してその存在量が変化するオミクス特徴（タンパク質、脂質及び代謝産物）を、回帰分析を利用して見つける。回帰分析は、ＣＴＡＷの部分として、以下の３つの主要なステップで実施される：（１）ハウスキーピング（housekeeping）ステップ、（２）統計的モデル化ステップ、及び（３）結果を要約するステップ。

いくつかの実施形態では、回帰分析を始める前に、ハウスキーピングステップを実行して、以前の結果をアーカイブし、空の結果ディレクトリを生成する。回帰用の適切なデータセットをマップするため、オミクスデータ中の試料を、更新されたマスタファイル中の注釈とリンクさせる。次いで、患者、試料タイプ及び治療レジメンの組合せごとに回帰分析を実行する。例えば、２つの異なる治療レジメンがあり、１つの治療レジメンから始め、次いで別の治療レジメンに移った患者がいる試験では、患者が第１のレジメンに従っているときのデータを使用して回帰を実行し、患者が第２のレジメンに従っているときのデータを使用して別の回帰を実行する。これらの回帰はそれぞれ、オミクスデータセットの利用可能性に基づいてさらに分割される。

回帰分析は、所与のデータセットに対する多数の異なるモデルに基づくことができる。例えば、所与のデータセットを、特定のレジメン（例えば単独治療）の間に患者０１−００１に対して測定された血漿メタボロミクス試料とすることができる。第１の２つのモデルは、１サイクル目に収集された利用可能な試料を考慮する。モデル１は、オミクス特徴を、固定された期間（以後、固定期間）である週及び週内の時間に関係づける回帰である。モデル２は、１週目に限定され、したがってオミクス特徴を固定期間である時間に関係づける。第３のモデルは、投与前試料（pre-dose sample）に対する回帰であり、オミクス特徴を固定期間であるサイクル及び日（例えば１日目又は１５日目）に関係づける。第４のモデルは、最終サイクル試料（例えば２２日９５．５時間目）に対する回帰であり、オミクス特徴を固定期間であるサイクルに関係づける。第５の回帰は、利用可能な全てのデータを使用して、オミクス特徴に対する注入の効果を比較する。最後に、第６の回帰は、組織試料だけに使用されて、２週目をオミクス特徴のベースラインレベルと比較する。

回帰モデル化に続いて、個々の患者について分析結果を要約する。これは、有意な特徴の発生を要約して、それぞれの患者の統計分析リポートに含める（統計分析リポートの項）。加えて、有意な特徴に関して特定の群の要約を作成する。最後に、ＫＥＧＧ、ＢｉｏＣａｒｔａ、Ｒｅａｃｔｏｍｅ及びＮＣＩからの経路メンバシップ情報を使用した経路分析を有意な特徴に適用する。

全ての患者試料を使用して試験時間及び用量に対する追加の回帰を実行する。この回帰は、固定された効果と考えられる時間及び用量並びにランダムな効果と考えられる患者内の混合モデルを使用する。

候補ＣＤｘマーカー（可能なバイオマーカー）を選択する追加の方法は、統計的に有意なオミクス変数又は臨床検査を同定する方法である。統計的に有意な特徴は、所望の患者層別化において差次的に発現された特徴、又は回帰分析によって以前に同定された特徴と定義される。統計的に有意な特徴を潜在的ＣＤｘマーカーとして同定するためには２つの仕様を実施する必要がある。第１の仕様は、どの統計分析法を利用するかである。２つの患者層別化間で差次的に発現されたマーカーを同定する古典的な統計分析手法は、２標本ｔ検定を実行する手法である。或いは、その代わりに、バイオインフォマティクス（bioinformatics）の分野で確立された方法であるｌｉｍｍａ法を、差次的発現分析に使用することもできる。回帰分析の以前の結果を調べて、候補ＣＤｘマーカーの統計的に有意な特徴を見つけることができる。この手法は、回帰ヒットを統計的に有意とみなし、したがって全ての回帰ヒットが候補ＣＤｘマーカーとして評価される。

例示的な実施形態では、統計的に有意な候補ＣＤｘマーカーを同定するのに必要な第２の仕様が、統計的有意性をどのように定義するかである。差次的発現法が利用される場合には、有意性を、ｐ値又は偽発見率（false discovery rate：ＦＤＲ）カットオフに関して定義することができ、これは、カットオフよりも小さなｐ値又はＦＤＲを有する特徴が有意とみなされるように定義される。有意なｐ値及びＦＤＲの一般的なカットオフはそれぞれ０．０５及び０．１である。或いは、最上位の特徴が有意とみなされるように、ｐ値によって特徴をランク付けすることもできる。この手法を使用して、実際の有意性が特定のカットオフよりも小さいことを要求することなしに上位１００個の特徴を有意と定義することができる。回帰ヒットが潜在的ＣＤｘマーカーとして調べられる場合には、特定のカットオフに関するＦＤＲ値又はランク付けされたリストに従って統計的有意性を定義することもできる。個々の患者の回帰結果に回帰ヒットが存在することを要求するのではなく大部分の患者の回帰結果に回帰ヒットが存在することを要求するなど、回帰ヒットに関する追加の要件を課すことができる。

機械学習
いくつかの実施形態では、機械学習手法を適用することによって、潜在的バイオマーカーである有望な（Prospective）ＣＤｘマーカーを同定する。いくつかの実施形態では、ＡＩ−ネットワークを使用して同定された結果動因及び統計的方法を使用して同定された差次的に発現された変数が、一組の可能なバイオマーカーを形成し、機械学習を使用して、可能なバイオマーカーのサブセットを、出力を予測するが他の可能なバイオマーカーとは比較的に相関しない可能なバイオマーカーに対して選択する潜在的バイオマーカー又は有望なＣＤｘマーカーとして選択する。分子的特徴及び臨床検査の数は通常、患者の数よりもはるかに大きいことを考えると、例示的な実施形態では、患者層別化を予測する適切な機械学習手法が、イラスティックネットペナルティを用いたロジスティック回帰である。ロジスティック回帰はしばしば、予測子ｐの数が変数ｎの数よりも大きいときに縮退（degeneracy）に悩まされ、ｎがｐに近いときであっても不安定な挙動を示す。イラスティックネットペナルティはこれらの問題を緩和し、同様に変数を正則化（regularization）及び選択する。

イラスティックネットは、収縮（shrinkage）、正則化及び変数選択法である。イラスティックネットは、自動変数選択及び連続的な収縮を同時に実行し、相関した変数の群を選択することによってＣＤｘマーカーのセットを同定するために使用される。イラスティックネットは、優れた予測正確度を有する粗なイラスティックネットモデルを生成し、さらに、強く相関した予測子（すなわちＣＤｘマーカー）が一緒にモデル内又はモデル外にある傾向があるグルーピング効果を促進する。予測子（ｐ）の数が観察（ｎ）の数よりもはるかに大きいとき、例えば分子的特徴及び臨床検査の数が一般に患者の数よりもはるかに大きい場合に、イラスティックネットは特に有用である。

このシステムは、イラスティックネット回帰分析を連続測定に利用するカテゴリモデリングアプローチを適合させる。イラスティックネットペナルティは、式（１−α）｜β｜_１＋α｜β｜^２によって記述される。イラスティックネットパラメータα及びλは、逸脱度ペナルティ（deviance penalty）を最小化することを目的とするリーブワンアウト交差検証（leave-one-out cross-validation）によって決定される。探索のためのαの値は、０．０１刻みで０．０５から０．９５までと指定される。探索のためのλ値のシーケンスは、ｇｌｍｎｅｔ関数によって自動的に指定される。ｇｌｍｎｅｔは、Ｒプログラミングシステムで実施されるパッケージである。ｇｌｍｎｅｔは、ｌａｓｓｏ回帰、リッジ（ridge）回帰、及び正則化経路に沿って計算された循環座標降下（cyclical coordinate descent）を使用する２つのペナルティ（イラスティックネット）の混合物を用いて、一般化された線形モデルを推定する、高速アルゴリズムを含む。イラスティックネットパラメータの２つ以上のセットが同じ交差検証ペナルティを与える（すなわち最小逸脱度が結合される）場合には、λの最大値が選択され、このλ値に対応するα値が選ばれる。

最適なイラスティックネットパラメータが与えられたら、ブートストラップリサンプリングを利用して候補バイオマーカーのロバストネスを評価する。このプロセスは、入力データセットを置換（replacement）によってリサンプリングすること、及び最適なα及びλ値を使用してイラスティックネットモデルを再訓練することを含む。このブートストラップリサンプリングを５００回実行することによって、予測子としてのそれぞれの入力特徴のロバストネスを、リサンプリングされたデータセットによって当てはめられたモデルがどれくらいの頻度でモデル係数（β）中に非ゼロ値を含むのかをカウントすることにより評価することができる。最もロバストな特徴は、リサンプリングされたデータセットによって当てはめられたモデルの大部分に存在する特徴である。現在、このロバストネスカットオフは、リサンプリングされたデータセットによって訓練されたモデルで生じる入力特徴がロバストとみなされるようにセットされる。

さまざまな疾患及び障害に対する適用可能性
固形腫瘍を有する患者の候補バイオマーカーを同定する、後述する実施例１及び２に記載された方法は、他の障害を有する患者にも適用することができる。このような障害には、限定はされないが、感染症、自己免疫疾患（例えば多発性硬化症及びエリテマトーデス）、神経変性障害（例えばアルツハイマー病及びパーキンソン病）、脱毛症、炎症、糖尿病（例えばＩ型及びＩＩ型糖尿病、妊娠糖尿病）、糖尿病前症、メタボリックシンドローム、及び心臓血管疾患（例えば冠状動脈性心疾患（ＣＨＤ）、脳卒中、頚動脈疾患及び末梢血管病（ＰＶＤ））が含まれる。

癌患者の候補バイオマーカーを同定する実施例１及び２に記載された分析法は一般に他の障害にも適用可能だが、それぞれの患者から収集される臨床データは障害によってさまざまである。例えば、糖尿病の候補バイオマーカーを同定するために患者から収集される臨床データには、血中グルコース（例えば空腹時血中グルコース、食後血中グルコース）、グルコース耐性、血中グルカゴン、インスリン、インスリン感受性、ヘモグロビンＡ１ｃ（ＨｂＡ１ｃ）レベル、体重、胴囲（waist circumference）、高比重リポタンパク質（ＨＤＬ）コレステロール、低比重リポタンパク質（ＬＤＬ）コレステロール、総コレステロール、トリグリセリド、血圧、排尿頻度、及び血中グルコース低下薬の使用などがある。糖尿病を患っている患者の臨床的評価法は当技術分野で知られており、例えば米国特許出願公開第２０１６／００５８７６９号及び第２０１５／０３５９８６１号に記載されている。これらの文献はその全体が参照により本明細書に組み込まれている。

心臓血管疾患の候補バイオマーカーを同定するために患者から収集される臨床データには、ＨＤＬコレステロール、ＬＤＬコレステロール、総コレステロール、リポタンパク質ａ、アポリポタンパク質（ａｐｏＡ−Ｉ）、トリグリセリド、血圧、体重、胴囲、心電図（ＥＫＧ又はＥＣＧ）、心臓ストレステスト、喫煙歴、糖尿病歴、並びに降圧剤、血中グルコース低下薬及びコレステロール低下薬の使用などがある。心臓血管疾患を患っている患者の臨床的評価法は当技術分野で知られており、例えば米国特許出願公開第２０１６／０１３９１６０号に記載されている。この文献はその全体が参照により本明細書に組み込まれている。

ある種の実施形態では、本明細書に記載された方法を使用して、特定の障害の治療剤に対する患者の反応を予測する潜在的バイオマーカーを同定する。例えば、いくつかの実施形態では、候補バイオマーカーを使用して、障害を治療する際の治療剤の効能又は治療剤に反応して有害事象が生じる可能性を予測する。

ある種の実施形態では、この障害が糖尿病（例えばＩ型糖尿病、ＩＩ型糖尿病又は妊娠糖尿病）である。糖尿病の適当な治療剤には、限定はされないが、メグリチニド、スルホニル尿素、ジペプチジルペプチダーゼ−４（ＤＰＰ−４）阻害薬、ビグアニド、チアゾリジンジオン、αグルコシダーゼ阻害薬、アミリン模倣薬（amylin mimetic）、インクレチン模倣薬、インスリン及びこれらの任意の組合せなどがある。特定の実施形態では、糖尿病治療用の治療剤がＨＳＰ９０阻害薬、例えばＨＳＰ９０β阻害薬である。別の実施形態では、糖尿病治療用の治療剤がＥＮ０１又はＥＮ０１を含む分子である。

ある種の実施形態では、この障害が心臓血管疾患である。心臓血管疾患の適当な治療剤には、限定はされないが、スタチン（ＨＭＧ−ＣｏＡレダクターゼ阻害薬）、抗高血圧薬、血栓溶解薬、並びに抗血小板及び抗凝血療法などがある。スタチンには例えばアトルバスタチン、フルバスタチン、ロバスタチン、ピタバスタチン、プラバスタチン、ロスバスタチン及びシンバスタチンなどがある。抗高血圧薬には例えばアンギオテンシン変換酵素（ＡＣＥ）阻害薬、アドレナリン作用性神経系の遮断薬（β及びαアドレナリン作用遮断薬）、カルシウムチャネル遮断薬及びアンギオテンシン受容体遮断薬（ＡＲＢ）などがある。抗血小板及び抗凝血療法には例えばヘパリン、糖タンパク質ＩＩｂ／ＩＩＩａ阻害薬、クロピドグレル及びワルファリンなどがある。

ある種の実施形態では、この障害が癌である。ある種の実施形態では、この癌が、中枢神経系（ＣＮＳ）の癌ではない、すなわち脊髄、脳及び眼のうちの少なくとも１つに存在する腫瘍の癌ではない。ある種の実施形態では、原発癌がＣＮＳ癌ではない。ある種の実施形態では、この癌が血液腫瘍（すなわち非固形腫瘍）である。ある種の実施形態では、この癌が固形腫瘍を含む。ある種の実施形態では、この固形腫瘍が、癌腫、黒色腫、肉腫及びリンパ腫からなる群から選択される。ある種の実施形態では、この固形腫瘍が、乳癌、膀胱癌、大腸癌、直腸癌、子宮内膜癌、腎（腎細胞）癌、肺癌、黒色腫、膵臓癌、前立腺癌、甲状腺癌、皮膚癌、骨癌、脳癌、子宮頸癌、肝臓癌、胃癌、口腔癌、神経芽細胞腫、精巣癌、子宮癌、甲状腺癌及び外陰部癌からなる群から選択される。ある種の実施形態では、皮膚癌が、黒色腫、扁平上皮癌又は皮膚Ｔ細胞リンパ腫（ＣＴＣＬ）である。

癌治療用の適当な治療剤には、限定はされないが、小分子化学療法剤及び生物製剤が含まれる。特定の実施形態では、癌治療用の治療剤がコエンザイムＱ１０である。

小分子化学療法剤は、概して、例えば、以下を含む様々なクラスに属する：１．トポイソメラーゼＩＩ阻害剤（細胞傷害性抗生物質）、例えば、アントラサイクリン／アントラセンジオン、例えば、ドキソルビシン、エピルビシン、イダルビシン及びネモルビシン、アントラキノン、例えば、ミトキサントロン及びロソキサントロン、並びにポドフィロトキシン、例えば、エトポシド及びテニポシド；２．微小管形成に影響を及ぼす薬剤（分裂阻害剤）、例えば、植物アルカノイド（例えば、生物学的に活性かつ細胞傷害性である、植物由来のアルカリ性含窒素分子のファミリーに属する化合物）、例えば、タキサン、例えば、パクリタキセル及びドセタキセル、及びビンカアルカロイド、例えば、ビンブラスチン、ビンクリスチン、及びビノレルビン、並びにポドフィロトキシンの誘導体；３．アルキル化剤、例えば、ナイトロジェンマスタード、エチレンイミン化合物、アルキルスルホネート及びアルキル化作用を有する他の化合物、例えば、ニトロソウレア、ダカルバジン、シクロホスファミド、イホスファミド及びメルファラン；４．代謝拮抗物質（ヌクレオシド阻害剤）、例えば、葉酸塩、例えば、葉酸、フルオロピリミジン、プリン又はピリミジンアナログ、例えば、５−フルオロウラシル、カペシタビン、ゲムシタビン、メトトレキサート及びエダトレキサート；５．トポイソメラーゼＩ阻害剤、例えば、トポテカン、イリノテカン、及び９−ニトロカンプトテシン、カンプトテシン誘導体及びレチノイン酸；並びに６．白金化合物／錯体、例えば、シスプラチン、オキサリプラチン、及びカルボプラチン。

例示的な化学療法剤としては、限定されるものではないが、以下が挙げられる：アミホスチン（エチオール）、シスプラチン、ダカルバジン（ＤＴＩＣ）、ダクチノマイシン、メクロレタミン（ナイトロジェンマスタード）、ストレプトゾシン、シクロホスファミド、カルムスチン（carrnustine）（ＢＣＮＵ）、ロムスチン（ＣＣＮＵ）、ドキソルビシン（アドリアマイシン）、ドキソルビシンリポ（ドキシル）、ゲムシタビン（ジェムザール）、ダウノルビシン、ダウノルビシンリポ（ダウノキソーム）、プロカルバジン、マイトマイシン、シタラビン、エトポシド、メトトレキサート、５−フルオロウラシル（５−ＦＵ）、ビンブラスチン、ビンクリスチン、ブレオマイシン、パクリタキセル（タキソール）、ドセタキセル（タキソテール）、アルデスロイキン、アスパラギナーゼ、ブスルファン、カルボプラチン、クラドリビン、カンプトテシン、ＣＰＴ−Ｉ１、１０−ヒドロキシ−７−エチル−カンプトテシン（ＳＮ３８）、ダカルバジン、Ｓ−Ｉカペシタビン、フトラフール、５’デオキシフルオロウリジン、ＵＦＴ、エニルウラシル、デオキシシチジン、５−アザシトシン、５−アザデオキシシトシン、アロプリノール、２−クロロアデノシン、トリメトレキサート、アミノプテリン、メチレン−１０−デアザアミノプテリン（ＭＤＡＭ）、オキサプラチン、ピコプラチン、テトラプラチン、サトラプラチン、白金−ＤＡＣＨ、オルマプラチン、ＣＩ−９７３、ＪＭ−２１６、及びそれらの類似体、エピルビシン、エトポシドリン酸塩、９−アミノカンプトテシン、１０，１１−メチレンジオキシカンプトテシン、カレニテシン、９−ニトロカンプトテシン、ＴＡＳ１０３、ビンデシン、Ｌ−フェニルアラニンマスタード、イホスファミド、メホスファミド（ifosphamidemefosphamide）、ペルホスファミド、トロホスファミド、カルムスチン、セムスチン、エポチロンＡ〜Ｅ、トムデックス、６−メルカプトプリン、６−チオグアニン、アムサクリン、エトポシドリン酸塩、カレニテシン、アシクロビル、バラシクロビル、ガンシクロビル、アマンタジン、リマンタジン、ラミブジン、ジドブジン、ベバシズマブ、トラスツズマブ、リツキシマブ、５−フルオロウラシル、カペシタビン、ペントスタチン、トリメトレキサート、クラドリビン、フロクスウリジン、フルダラビン、ヒドロキシウレア、イホスファミド、イダルビシン、メスナ、イリノテカン、ミトキサントロン、トポテカン、ロイプロリド、メゲストロール、メルファラン、メルカプトプリン、プリカマイシン、ミトタン、ペグアスパルガーゼ、ペントスタチン、ピポブロマン、プリカマイシン、ストレプトゾシン、タモキシフェン、テニポシド、テストラクトン、チオグアニン、チオテパ、ウラシルマスタード、ビノレルビン、クロラムブシル、シスプラチン、ドキソルビシン、パクリタキセル（タキソール）、ブレオマイシン、ｍＴｏｒ、上皮成長因子受容体（ＥＧＦＲ）及び線維芽細胞成長因子（ＦＧＦ）、並びに特定の腫瘍又は癌のためのケアの適切な標準に基づいて、当業者に容易に明らかであるそれらの組み合わせ。

生物学的薬剤（生物製剤とも称される）とは、生物系、例えば、生物、細胞、又は組換え系の製品である。癌の治療のための好適な生物学的薬剤の例としては、核酸分子（例えば、アンチセンス核酸分子）、インターフェロン、インターロイキン、コロニー刺激因子、抗体、例えば、モノクローナル抗体、抗体薬物コンジュゲート、抗血管新生剤、及びサイトカインが挙げられる。例示的な生物学的薬剤は、概して、例えば以下の様々なクラスに属する：１．ホルモン、ホルモン類似体、及びホルモン複合体、例えば、エストロゲン及びエストロゲン類似体、プロゲステロン、プロゲステロン類似体及びプロゲスチン、アンドロゲン、副腎皮質ステロイド、抗エストロゲン、抗アンドロゲン、抗テストステロン、副腎ステロイド阻害剤、及び抗黄体化ホルモン；並びに２．酵素、タンパク質、ペプチド、ポリクローナル及び／又はモノクローナル抗体、例えば、インターロイキン、インターフェロン、コロニー刺激因子など。

本発明の予測方法

本発明は、少なくとも部分的には、バイオマーカータンパク質ジスルフィドイソメラーゼファミリーＡメンバー３（本明細書ではＰＤＩＡ３とも称する）が、コエンザイムＱ１０（ＣｏＱ１０）を用いた癌の治療に対して臨床的に反応性である対象の血清中の平均レベルより高いレベルで発現され、そしてＣｏＱ１０を用いた癌の治療に対して非反応性である対象の血清中の平均レベルより低いレベルで発現されるという知見に基づく。癌を有する対象由来の試料中のＰＤＩＡ３の発現レベルを決定することにより、医師はより情報に基づく治療決定を下すこと、及び癌の治療を個々の対象のニーズに合わせてカスタマイズすることが可能になり、それによって患者の治療利益を最大化しかつ患者の不必要な治療（何らの有意な利益をもたらさず、しばしば毒性副作用による重篤なリスクがある）に対する曝露を最小化する。

したがって、本発明は、対象から得られた試料中のＰＤＩＡ３の発現レベルに基づいて、ＣｏＱ１０による治療に対する癌を有する対象の反応を予測し、ＣｏＱ１０による癌の治療のための良好な候補として癌を有する対象を選択し、ＣｏＱ１０による癌を有する対象を治療するための方法を提供する。

一態様において、本発明は、コエンザイムＱ１０（ＣｏＱ１０）を用いた癌の治療のための対象の選択方法であって、（ａ）対象の生物学的試料中のＰＤＩＡ３のレベルを検出すること、及び（ｂ）生物学的試料中のＰＤＩＡ３のレベルを所定の閾値と比較することを含み、ＰＤＩＡ３のレベルが所定の閾値より高い場合、対象はＣｏＱ１０を用いた癌の治療のために選択される、上記方法を提供する。

別の態様では、本発明は、癌を有する対象がコエンザイムＱ１０（ＣｏＱ１０）による治療に対して反応性であるか非反応性であるかを予測するための方法であって、（ａ）対象の生物学的試料中のＰＤＩＡ３のレベルを検出すること、及び（ｂ）生物学的試料中のＰＤＩＡ３のレベルを所定の閾値と比較することを含み、所定の閾値より高いＰＤＩＡ３のレベルは、対象がＣｏＱ１０を用いた癌の治療に反応する可能性があることを示す、上記方法を提供する。

別の態様では、（ａ）対象から生物学的試料を入手すること、（ｂ）対象からの生物学的試料を提出してＰＤＩＡ３のレベルに関する診断情報を入手すること、（ｃ）生物学的試料中のＰＤＩＡ３のレベルが閾値レベルより高い場合、治療有効量のＣｏＱ１０を対象に投与することを含む、対象において癌を治療する方法が提供される。

さらに別の態様では、（ａ）対象からの生物学的試料中のＰＤＩＡ３のレベルに関する診断情報を得ること、及び（ｂ）生物学的試料中のＰＤＩＡ３のレベルが閾値レベルより高い場合に、対象にＣｏＱ１０を投与することを含む、対象において癌を治療する方法が提供される。

さらに別の態様では、本発明は、（ａ）ＰＤＩＡ３のレベルに関する診断情報の同定に使用するために、対象から生物学的試料を取得すること、（ｂ）対象からの生物学的試料中のＰＤＩＡ３のレベルを測定すること、（ｃ）ＰＤＩＡ３のレベルが閾値レベルより高い場合に、健康管理提供者にＣｏＱ１０を対象に投与することを推奨することを含む、対象において癌を治療する方法を提供する。

本明細書中で使用される場合、ＰＤＩＡ３の「閾値」又は「閾値」とは、対象（例えば、同じ状況の対象、例えば同じ癌を有しまだＣｏＱ１０による治療を受けていない対象）又は正常若しくは健常対象（例えば、癌を有しない対象）から得られた対応する対照／正常試料又は対照／正常試料の群におけるＰＤＩＡ３のレベル（例えば、生物学的試料中の発現レベル又は量（例えば、ｎｇ／ｍｌ））をいう。所定の閾値は、生物学的試料中のＰＤＩＡ３レベルの測定の前又はそれと同時に決定し得る。対照試料は、以前の時点の同じ対象からのものでも異なる対象からのものでもよい。

ＰＤＩＡ３の遺伝子及びタンパク質配列は当技術分野において公知であり、例えば、ＵｎｉＰｒｏｔＫＢＰ３０１０１又はＥｎｔｒｅｚＧｅｎｅ２９２３、ならびにＮＣＢＩ参照配列ＮＰ＿００５３０４．３に見出すことができる。

いくつかの実施形態では、治療対象の癌は固形腫瘍である。固形腫瘍は、本明細書に記載の任意の種類の固形腫瘍を含む、任意の種類の固形腫瘍であり得る。特定の実施形態では、治療対象の癌は、扁平上皮癌、膠芽腫、及び膵臓癌からなる群から選択される。

特定の実施形態では、生物学的試料は、血液、血清、尿、臓器組織、生検組織、糞便、皮膚、毛髪、及び頬組織からなる群から選択される。

他の実施形態では、対象における癌治療のための治療の臨床経過を決定する方法が開示される。特定の実施形態において、本方法は、対象から得られた生物学的試料中の対象のＰＤＩＡ３発現レベルを決定すること、及び対象のＰＤＩＡ３発現レベルに基づいて治療の臨床経過を同定することを含む。具体的な実施形態では、生物学的試料中のＰＤＩＡ３のレベルが閾値レベルより高いときに、ＣｏＱ１０による治療が選択される。

一実施形態では、ＣｏＱ１０に加えて、１又は複数の追加の抗癌治療薬を患者に（順次又は同時に）投与することができ、そのような治療薬としては化学療法又は放射線が挙げられるがこれらに限定されない。

組織試料

本発明を、ＰＤＩＡ３、例えば、ＰＤＩＡ３ポリペプチド、核酸、ｍＲＮＡ、又はマイクロＲＮＡを潜在的に含有する、発現する、含む任意の好適な生物学的試料を用いて実行することができる。例えば、全血及び血清を含む供給源から、疾患（例えば、膵臓の腫瘍、膠芽腫、又は扁平上皮癌などの腫瘍）を有する及び／又は健康な組織まで、生物学的試料を取得することができる。一実施形態において、生物学的試料は、血液、血清、尿、臓器組織、生検組織、糞便、皮膚、毛髪、及び頬組織からなる群より選択される。好ましい実施形態では、生物学的試料は血清試料である。別の実施形態においては、本発明を、新鮮に単離された、又は対象から収集された後、凍結若しくは保存された任意の好適な組織試料、あるいは例えば、診断、処置及び／又は結果の履歴がわかっている保管組織試料を用いて実行することができる。組織を、例えば、微細針吸引及び針生検などの任意の非侵襲的な手段により、又はあるいは、例えば、外科生検などの侵襲的な方法により収集することができる。

本発明の方法を、単一細胞レベルで実施することができる（例えば、癌性細胞の単離及び試験）。しかしながら、好ましくは、本発明の方法は、多くの細胞を含む試料を用いて実施され、アッセイは、試料中に存在する細胞及び組織の全収集物にわたって発現を「平均化」する。ＰＤＩＡ３の発現レベルを正確かつ信頼性をもって決定するのに十分な組織試料があるのが好ましい。特定の実施形態においては、複数の試料を同じ組織から採取して、組織の代表的サンプリングを得ることができる。さらに、十分な生物学的材料を取得して、２回、３回又はさらなる周回の試験を実施することができる。

組織及び／若しくは血液若しくは他の生物学的産物を単離及び／若しくは取得するため、並びに／又は検出反応を行う前に前記材料を処理するための任意の市販のデバイス又はシステムが企図される。

特定の実施形態においては、本発明は、ＰＤＩＡ３核酸分子（例えば、ＰＤＩＡ３をコードするｍＲＮＡ）の検出に関する。そのような実施形態においては、分析の前に、生物学的試料から、ＲＮＡを抽出することができる。ＲＮＡ抽出のための方法は、当業界で周知である（例えば、J. Sambrookら、「Molecular Cloning: A Laboratory Manual」、1989、第2版、Cold Spring Harbour Laboratory Press: New Yorkを参照されたい）。体液又は組織からのＲＮＡ単離の多くの方法は、ＲＮａｓｅを迅速かつ効率的に不活化するタンパク質変性剤の存在下での組織の破壊に基づく。一般に、ＲＮＡ単離試薬は、いくつかある成分の中でも、ＲＮａｓｅ阻害剤として作用することが知られる、グアニジニウムチオシアネート及び／又はベータ−メルカプトエタノールを含む。次いで、単離された全ＲＮＡを、タンパク質夾雑物からさらに精製し、選択的エタノール沈降、フェノール／クロロホルム抽出、次いで、イソプロパノール沈降（例えば、P. Chomczynski及びN. Sacchi、Anal. Biochem.、1987、162: 156-159を参照されたい）又は塩化セシウム、塩化リチウム若しくはトリフルオロ酢酸セシウム勾配遠心分離によって濃縮する。

いくつかの異なる多用途のキットを用いて、体液又は組織（例えば、前立腺組織試料）からＲＮＡ（すなわち、全ＲＮＡ又はｍＲＮＡ）を抽出することができ、それらは、例えば、Ambion, Inc.（Austin, Tex.）、Amersham Biosciences（Piscataway, N.J.）、BD Biosciences Clontech（Palo Alto, Calif.）、BioRad Laboratories（Hercules, Calif.）、GIBCO BRL（Gaithersburg, Md.）、及びGiagen, Inc.（Valencia, Calif.）から市販されている。通常、行おうとするプロトコールを非常に詳細に説明するユーザーガイドがこれらのキット全てに含まれる。感度、処理時間及び費用は、キット間で異なり得る。当業者であれば、特定の状況にとって最も適切なキットを容易に選択することができる。

特定の実施形態においては、抽出後、ｍＲＮＡは増幅され、ｃＤＮＡに転写された後、これは適切なＲＮＡポリメラーゼによる複数回の転写のための鋳型として役立ち得る。増幅方法は、当業界で周知である（例えば、A. R. Kimmel及びS. L. Berger、Methods Enzymol. 1987、152: 307-316; J. Sambrookら、「Molecular Cloning: A Laboratory Manual」、1989、2.sup.nd Ed.、Cold Spring Harbour Laboratory Press: New York; 「Short Protocols in Molecular Biology」、F. M. Ausubel (編)、2002、5.sup.th Ed.、John Wiley & Sons；米国特許第４，６８３，１９５号；第４，６８３，２０２号及び第４，８００，１５９号を参照されたい）。固定されたオリゴ−ｄＴプライマー、若しくはランダム配列プライマーなどの非特異的プライマーを用いて、又はモニタリングしようとするそれぞれの遺伝子プローブのためのＲＮＡに対して相補的な標的特異的プライマーを用いて、又は熱安定性ＤＮＡポリメラーゼ（ニワトリ骨髄芽球症ウイルス逆転写酵素若しくはモロニーマウス白血病ウイルス逆転写酵素など）を用いて、逆転写反応を実行することができる。

特定の実施形態においては、試料から単離されたＲＮＡ（例えば、ｃＤＮＡ又はｃＲＮＡへの増幅及び／又は変換の後）を、分析する前に検出剤で標識する。検出剤の役割は、ＲＮＡの検出を容易にするか、又はハイブリダイズした核酸断片（例えば、アレイに基づくアッセイにおいて遺伝子プローブにハイブリダイズした核酸断片）の可視化を可能にすることである。好ましくは、検出剤は、それが測定することができるシグナルを生成し、その強度が分析される試料中に存在する標識された核酸の量と関連するように選択される。アレイに基づく分析方法においては、検出剤はまた、好ましくは、それが局在化されたシグナルを生成し、それによって、アレイ上の各スポットからのシグナルの空間的分解を可能にするように選択される。

核酸分子を標識するための方法は、当業界で周知である。標識化プロトコール、標識検出技術及び当業界における最近の開発の概説については、例えば、L. J. Kricka、Ann. Clin. Biochem. 2002、39: 114-129; R. P. van Gijlswijkら、Expert Rev. Mol. Diagn. 2001、1: 81-91；及びS. Joosら、J. Biotechnol. 1994、35: 135-153を参照されたい。標準的な核酸標識化方法は、放射活性剤の組込み、蛍光色素（例えば、L. M. Smithら、Nucl. Acids Res. 1985、13: 2399-2412を参照されたい）又は酵素（例えば、B. A. Connoly及びP. Rider、Nucl. Acids. Res. 1985、13: 4485-4502を参照されたい）の直接的結合；免疫化学的に、又は他の親和性反応により検出可能にする核酸断片の化学的修飾（例えば、T. R. Brokerら、Nucl. Acids Res. 1978、5: 363-384; E. A. Bayerら、Methods of Biochem. Analysis、1980、26: 1-45; R. Langerら、Proc. Natl. Acad. Sci. USA、1981、78: 6633-6637; R. W. Richardsonら、Nucl. Acids Res. 1983、11: 6167-6184; D. J. Brigatiら、Virol. 1983、126: 32-50; P. Tchenら、Proc. Natl Acad. Sci. USA、1984、81: 3466-3470; J. E. Landegentら、Exp. Cell Res. 1984、15: 61-72; 及びA. H. Hopmanら、Exp. Cell Res. 1987、169: 357-368を参照されたい）；並びにランダムプライミング、ニックトランスレーション、ＰＣＲ及びターミナルトランスフェラーゼを用いるテーリングなどの酵素媒介性標識化方法（酵素的標識化に関する概説については、例えば、J. Temsamani及びS. Agrawal、Mol. Biotechnol. 1996、5: 223-232を参照されたい）を含む。

様々な検出剤のいずれかを、本発明の実施において用いることができる。好適な検出剤としては、限定されるものではないが、様々なリガンド、放射性核種、蛍光色素、化学発光剤、微粒子（例えば、量子ドット、ナノ結晶、リン光体など）、酵素（例えば、ＥＬＩＳＡにおいて用いられるもの、すなわち、西洋わさびペルオキシダーゼ、ベータ−ガラクトシダーゼ、ルシフェラーゼ、アルカリホスファターゼなど）、比色標識、磁気標識、及びビオチン、ジオキシゲニン若しくは他のハプテン並びに抗血清若しくはモノクローナル抗体が利用できるタンパク質が挙げられる。

しかしながら、いくつかの実施形態においては、ＰＤＩＡ３発現レベルは、ＰＤＩＡ３遺伝子産物（例えば、ＰＤＩＡ３タンパク質）の発現を検出することによって決定され、それにより、対象の試料から遺伝子試料（例えば、ＲＮＡ）を取得する必要性を排除する。

本発明の全ての方法に用いることができる保管組織試料は、典型的には、供給源から得られ、保存されたものである。好ましい保存方法としては、当業界で公知であるように、限定されるものではないが、パラフィン包埋、エタノール固定並びにホルムアルデヒド及び他の誘導体を含むホルマリンによる固定が挙げられる。組織試料は、一時的に「古い」ものであってもよく、例えば、数カ月若しくは数年古いもの、又は最近固定されたものであってもよい。例えば、術後手順は一般に、組織学的分析のための切り出された組織に対する固定ステップを含む。好ましい実施形態においては、組織試料は、疾患を有する組織試料、例えば、一次及び二次腫瘍組織並びにリンパ節組織及び転移組織を含む癌組織である。

かくして、保管試料は異種性であってもよく、１種を超える細胞型又は組織型、例えば、腫瘍及び非腫瘍組織を包含する。好ましい組織試料は、限定されるものではないが、膵臓の腫瘍、膠芽腫又は扁平上皮癌などの固形腫瘍試料を含む。膵臓の腫瘍、膠芽腫又は扁平上皮癌以外の状態への本発明の適用において、腫瘍供給源は、脳、骨、心臓、乳房、卵巣、前立腺、子宮、脾臓、膵臓、肝臓、腎臓、膀胱、胃及び筋肉であってもよいことが理解される。同様に、状態に応じて、好適な組織試料は、限定されるものではないが、体液（限定されるものではないが、実質的に任意の生物の、血液、尿、血清、リンパ、唾液、肛門及び膣分泌物、汗及び精液を含み、哺乳動物試料が好ましく、ヒト試料が特に好ましい）を含む。

バイオマーカーの検出及び／又は測定

本発明は、ＰＤＩＡ３を検出及び／又は測定するための任意の好適な手段、技術、及び／又は手順を企図する。当業者であれば、ＰＤＩＡ３を測定するために用いられる方法は、検出又は測定されるＰＤＩＡ３の種類（例えば、ｍＲＮＡ又はポリペプチド）及び生物学的試料の供給源に少なくとも依存することを理解できる。特定の生物学的試料はまた、ＰＤＩＡ３を測定する前に、特定の特殊な処理、例えば、ＰＤＩＡ３ｍＲＮＡが測定される場合、生検組織からのｍＲＮＡの調製も必要とし得る。

一実施形態では、本発明は、ＣｏＱ１０を用いた癌の治療のために対象を選択するための方法であって、（ａ）生物学的試料をＰＤＩＡ３に選択的に結合する試薬と接触させること、（ｂ）試薬とＰＤＩＡ３との間で複合体を形成させること、（ｃ）複合体のレベルを検出すること、及び（ｄ）複合体のレベルを所定の閾値と比較することを含み、複合体のレベルが所定の閾値より高い場合、対象はＣｏＱ１０を用いた癌の治療のために選択される、上記方法を提供する。

他の実施形態では、本発明は、癌を有する対象がＣｏＱ１０による治療に反応するかどうかを予測する方法であって、（ａ）生物学的試料をＰＤＩＡ３に選択的に結合する試薬と接触させること、（ｂ）試薬とＰＤＩＡ３との間で複合体を形成させること、（ｃ）複合体のレベルを検出すること、及び（ｄ）複合体のレベルを所定の閾値と比較することを含み、所定の閾値より高いＰＤＩＡ３のレベルは、対象がＣｏＱ１０による癌の治療に反応する可能性が高いことを示す、上記方法を提供する。

一実施形態では、複合体のレベルを検出することは、複合体を検出可能な二次抗体と接触させること、及び二次抗体のレベルを測定することをさらに含む。

一実施形態において、試薬は、ＰＤＩＡ３の少なくとも１つのエピトープに選択的に結合する抗ＰＤＩＡ３抗体である。別の実施形態では、生物学的試料中のＰＤＩＡ３タンパク質は、イムノアッセイ又はＥＬＩＳＡによって決定することができる。別の実施形態では、生物学的試料中のＰＤＩＡ３タンパク質もまた質量分析法によって決定することができる。

他の実施形態では、対象の生物学的試料中のＰＤＩＡ３のレベルを検出することは、生物学的試料中のＰＤＩＡ３ｍＲＮＡの量を決定することを含む。例えば、生物学的試料中のＰＤＩＡ３ｍＲＮＡの量を決定するために増幅反応が使用される。増幅反応は、例えば、ポリメラーゼ連鎖反応（ＰＣＲ）；核酸配列に基づく増幅アッセイ（ＮＡＳＢＡ）；転写媒介増幅（ＴＭＡ）；リガーゼ連鎖反応（ＬＣＲ）；又は鎖置換増幅（ＳＤＡ）を含み得る。

別の実施形態では、ハイブリダイゼーションアッセイが、生物学的試料中のＰＤＩＡ３ｍＲＮＡの量を決定するために使用される。例えば、ＰＤＩＡ３ｍＲＮＡの一部に相補的なオリゴヌクレオチドをハイブリダイゼーションアッセイに使用して、ＰＤＩＡ３ｍＲＮＡを検出することができる。

ＰＤＩＡ３タンパク質及びｍＲＮＡのレベルを決定するための様々な方法を以下に詳細に記載する。

１．核酸バイオマーカーの検出

特定の実施形態においては、本発明は、ＰＤＩＡ３核酸の検出を含む。様々な実施形態においては、本発明の診断／予後診断方法は、一般に、組織試料中のＰＤＩＡ３の発現レベルの決定を含む。本発明の方法の実行における遺伝子発現レベルの決定を、任意の好適な方法によって実施することができる。例えば、遺伝子発現レベルの決定を、目的の遺伝子から発現されるｍＲＮＡの発現を検出することによって、及び／又は遺伝子によりコードされるポリペプチドの発現を検出することによって実施することができる。

ＰＤＩＡ３をコードする核酸を検出するために、限定されるものではないが、サザンブロット分析、ノーザンブロット分析、ポリメラーゼ連鎖反応（ＰＣＲ）（例えば、米国特許第４，６８３，１９５号；第４，６８３，２０２号、及び第６，０４０，１６６号；「PCR Protocols: A Guide to Methods and Applications」、Innisら(編)、1990、Academic Press: New Yorkを参照されたい）、逆転写酵素ＰＣＲ（ＲＴ−ＰＣＲ）、アンカーＰＣＲ、競合的ＰＣＲ（例えば、米国特許第５，７４７，２５１号を参照されたい）、ｃＤＮＡ末端の迅速増幅（ＲＡＣＥ）（例えば、「Gene Cloning and Analysis: Current Innovations」、1997、pp. 99-115を参照されたい)；リガーゼ連鎖反応（ＬＣＲ）（例えば、ＥＰ０１３２０３０８を参照されたい）、片側ＰＣＲ（Oharaら、Proc. Natl. Acad. Sci.、1989、86: 5673-5677）、ｉｎｓｉｔｕハイブリダイゼーション、Ｔａｑｍａｎに基づくアッセイ（Hollandら、Proc. Natl. Acad. Sci.、1991、88: 7276-7280）、ディファレンシャルディスプレイ（例えば、Liangら、Nucl. Acid. Res.、1993、21: 3269-3275を参照されたい）及び他のＲＮＡフィンガープリンティング技術、核酸配列に基づく増幅（ＮＡＳＢＡ）及び他の転写に基づく増幅系（例えば、米国特許第５，４０９，８１８号及び第５，５５４，５２７号を参照されたい）、Ｑベータレプリカーゼ、鎖置換増幅（ＳＤＡ）、修復鎖反応（ＲＣＲ）、ヌクレアーゼ保護アッセイ、差分法、Ｒａｐｉｄ−Ｓｃａｎ（登録商標）などの、任意の好適な方法を用いることができる。

他の実施形態においては、ＰＤＩＡ３の遺伝子発現レベルを、ｍＲＮＡから産生された相補的ＤＮＡ（ｃＤＮＡ）又は相補的ＲＮＡ（ｃＲＮＡ）を増幅させること、及びマイクロアレイを用いてそれを分析することによって決定することができる。いくつかの異なるアレイ構成及びその製造方法が、当業者には公知である（例えば、米国特許第５，４４５，９３４号；第５，５３２，１２８号；第５，５５６，７５２号；第５，２４２，９７４号；第５，３８４，２６１号；第５，４０５，７８３号；第５，４１２，０８７号；第５，４２４，１８６号；第５，４２９，８０７号；第５，４３６，３２７号；第５，４７２，６７２号；第５，５２７，６８１号；第５，５２９，７５６号；第５，５４５，５３１号；第５，５５４，５０１号；第５，５６１，０７１号；第５，５７１，６３９号；第５，５９３，８３９号；第５，５９９，６９５号；第５，６２４，７１１号；第５，６５８，７３４号；及び第５，７００，６３７号を参照されたい）。

増幅のための鋳型として用いられる核酸を、標準的な方法に従って、生物学的試料中に含有される細胞から単離することができる（Sambrookら、1989）。核酸は、ゲノムＤＮＡ又は分画された若しくは全細胞ＲＮＡであってもよい。ＲＮＡを用いる場合、ＲＮＡを相補的ｃＤＮＡに変換することが望ましい場合がある。一実施形態においては、ＲＮＡは、全細胞ＲＮＡであり、増幅のための鋳型として直接的に用いられる。

ＰＤＩＡ３ヌクレオチド配列に対応する核酸に選択的にハイブリダイズするプライマー対を、選択的ハイブリダイゼーションを許容する条件下で単離された核酸と接触させる。一度ハイブリダイズしたら、核酸：プライマー複合体を、鋳型依存的核酸合成を容易にする１種以上の酵素と接触させる。「サイクル」とも呼ばれる、複数回の増幅を、十分な量の増幅産物が産生されるまで行う。次に、増幅産物を検出する。特定の適用においては、検出は、視覚的手段によって実施してもよい。あるいは、検出は、化学発光、取り込まれた放射標識若しくは蛍光標識の放射性シンチグラフィー又はさらには、電気若しくは熱インパルスシグナルを用いるシステム（Ａｆｆｙｍａｘ技術；Bellus、1994）による、産物の間接的同定を含んでもよい。検出後、所与の患者において見られた結果と、正常な患者及び癌患者の統計的に有意な参照群とを比較することができる。このように、検出された核酸の量と、様々な臨床状態とを相関させることが可能である。

本明細書で定義される用語「プライマー」は、鋳型依存的プロセスにおける新生核酸の合成をプライミングすることができる任意の核酸を包含することを意味する。典型的には、プライマーは、１０〜２０塩基対長のオリゴヌクレオチドであるが、より長い配列を用いてもよい。プライマーを、二本鎖又は一本鎖の形態で提供することができるが、一本鎖形態が好ましい。

いくつかの鋳型依存的プロセスが、所与の鋳型試料中に存在する核酸配列を増幅するために利用可能である。最もよく知られた増幅方法の１つは、それぞれ全体が参照により本明細書に組込まれる、米国特許第４，６８３，１９５号、第４，６８３，２０２号及び第４，８００，１５９号、並びにInnisら、1990に詳細に記載されているポリメラーゼ連鎖反応（ＰＣＲと呼ばれる）である。

ＰＣＲにおいては、標的核酸配列の反対の相補鎖上の領域と相補的である２つのプライマー配列を調製する。過剰のデオキシヌクレオシド三リン酸を、ＤＮＡポリメラーゼ、例えば、Ｔａｑポリメラーゼと共に反応混合物に添加する。標的核酸配列が試料中に存在する場合、プライマーは標的核酸に結合し、ポリメラーゼは、ヌクレオチド上に付加することにより標的核酸配列に沿ってプライマーの伸長を引き起こすであろう。反応混合物の温度を上昇及び低下させることにより、伸長されたプライマーは標的核酸から解離して、反応産物を形成し、過剰のプライマーは標的核酸及び反応産物に結合し、プロセスが繰り返される。

逆転写酵素ＰＣＲ増幅手順を実施して、増幅されたｍＲＮＡの量を定量することができる。ＲＮＡをｃＤＮＡに逆転写する方法は、周知であり、Sambrookら、1989に記載されている。逆転写のための代替的な方法は、熱安定性ＤＮＡポリメラーゼを用いるものである。これらの方法は、１９９０年１２月２１日に出願されたＷＯ９０／０７６４１に記載されている。ポリメラーゼ連鎖反応法は、当業界で周知である。

増幅のための別の方法は、全体が参照により本明細書に組込まれる欧州特許出願第３２０３０８号に開示されたリガーゼ連鎖反応（「ＬＣＲ」）である。ＬＣＲにおいては、２つの相補的プローブ対を調製し、標的配列の存在下で、各対は、それらが隣接するように標的の反対の相補鎖に結合する。リガーゼの存在下で、２つのプローブ対は連結して、単一のユニットを形成する。ＰＣＲにおけるような、温度サイクリングにより、結合しライゲートされたユニットは標的から解離し、次いで、過剰のプローブ対のライゲーションのための「標的配列」として働く。米国特許第４，８８３，７５０号は、プローブ対を標的配列に結合させるためのＬＣＲと類似する方法を記載する。

ＰＣＴ出願ＰＣＴ／ＵＳ８７／００８８０に記載されたＱベータレプリカーゼを、本発明におけるさらに別の増幅方法として用いることもできる。この方法においては、標的のものと相補的な領域を有するＲＮＡの複製配列を、ＲＮＡポリメラーゼの存在下で試料に添加する。ポリメラーゼは、複製配列をコピーした後、これを検出することができる。

制限エンドヌクレアーゼ及びリガーゼを用いて、制限部位の一方の鎖中にヌクレオチド５’−［α−チオ］−三リン酸を含有する標的分子の増幅を達成する、等温増幅法も、本発明における核酸の増幅において有用であり得る。全体が参照により本明細書に組込まれるWalkerら(1992)。

鎖置換増幅（ＳＤＡ）は、複数回の鎖置換及び合成を含む核酸の等温増幅、すなわち、ニックトランスレーションを実行する別の方法である。修復鎖反応（ＲＣＲ）と呼ばれる、類似の方法は、増幅のために標的化される領域を介するいくつかのプローブのアニーリング、次いで、４つの塩基のうちの２つのみが存在する修復反応を含む。他の２つの塩基は、容易な検出のためにビオチン化誘導体として添加することができる。同様の手法がＳＤＡにおいて用いられる。標的特異的配列を、サイクルプローブ反応（ＣＰＲ）を用いて検出することもできる。ＣＰＲにおいては、非特異的ＤＮＡの３’及び５’配列並びに特異的ＲＮＡの中央配列を有するプローブを、試料中に存在するＤＮＡにハイブリダイズさせる。ハイブリダイゼーションの際に、反応物をＲＮａｓｅＨで処理し、プローブの産物を、消化後に遊離される異なる産物として同定する。元の鋳型を別のサイクリングプローブにアニーリングさせ、反応を繰り返す。

それぞれ、その全体が参照により本明細書に組込まれるＧＢ出願第２２０２３２８号、及びＰＣＴ出願第ＰＣＴ／ＵＳ８９／０１０２５号に記載されたさらに他の増幅方法を、本発明に従って用いることができる。前者の出願においては、「改変」プライマーが、ＰＣＲのような、鋳型及び酵素依存的合成において用いられる。プライマーを、捕捉部分（例えば、ビオチン）及び／又は検出部分（例えば、酵素）で標識することによって改変することができる。後者の出願においては、過剰の標識されたプローブを試料に添加する。標的配列の存在下で、プローブが結合し、触媒的に切断される。切断後、標的配列は、過剰のプローブによって結合されて無傷のまま遊離する。標識されたプローブの切断は、標的配列の存在についてシグナルを発する。

他の企図される核酸増幅手順は、転写に基づく増幅系（ＴＡＳ）、例えば、核酸配列に基づく増幅（ＮＡＳＢＡ）及び３ＳＲを含む。その全体が参照により本明細書に組込まれるKwohら(1989); Gingerasら、ＰＣＴ出願ＷＯ８８／１０３１５。

Daveyら、欧州特許出願第３２９８２２号（その全体が参照により本明細書に組込まれる）は、一本鎖ＲＮＡ（「ｓｓＲＮＡ」）、ｓｓＤＮＡ、及び二本鎖ＤＮＡ（ｄｓＤＮＡ）を周期的に合成することを含む核酸増幅プロセスを開示し、これを本発明に従って用いることができる。ｓｓＲＮＡは、第１のプライマーオリゴヌクレオチドのための第１の鋳型であり、逆転写酵素（ＲＮＡ依存的ＤＮＡポリメラーゼ）によって伸長する。次いで、リボヌクレアーゼＨ（ＲＮａｓｅＨ、ＤＮＡ又はＲＮＡのいずれかとの二本鎖中のＲＮＡに特異的なＲＮａｓｅ）の作用により、得られるＤＮＡ：ＲＮＡ二本鎖からＲＮＡを除去する。得られるｓｓＤＮＡは、第２のプライマーのための第２の鋳型であり、鋳型とのその相同性に対して５’側にＲＮＡポリメラーゼプロモーター（例えば、Ｔ７ＲＮＡポリメラーゼ）の配列も含む。このプライマーを、ＤＮＡポリメラーゼ（例えば、大腸菌ＤＮＡポリメラーゼ１の大きい「Ｋｌｅｎｏｗ」断片）により伸長させ、プライマー間に元のＲＮＡのものと同一の配列を有し、さらに、一方の末端に、プロモーター配列を有する、二本鎖ＤＮＡ（「ｄｓＤＮＡ」）分子をもたらす。このプロモーター配列を、適切なＲＮＡポリメラーゼによって用いて、ＤＮＡの多くのＲＮＡコピーを作ることができる。次いで、これらのコピーは、非常に敏速な増幅をもたらすサイクルに再進入することができる。酵素を適切に選択すれば、各サイクルで酵素を添加することなく、等温的にこの増幅を行うことができる。このプロセスの循環的性質のため、ＤＮＡ又はＲＮＡのいずれかの形態であるように出発配列を選択することができる。

Millerら、ＰＣＴ出願ＷＯ８９／０６７００（その全体が参照により本明細書に組込まれる）は、プロモーター／プライマー配列の標的一本鎖ＤＮＡ（「ｓｓＤＮＡ」）へのハイブリダイゼーション、次いで、配列の多くのＲＮＡコピーの転写に基づく核酸配列増幅スキームを開示する。このスキームは循環的ではない、すなわち、新しい鋳型は得られるＲＮＡ転写物から産生されない。他の増幅方法は、「ｒａｃｅ」及び「片側ＰＣＲ．ＴＭ」を含む。それぞれその全体が参照により本明細書に組込まれる、Frohman(1990)及びOharaら(1989)。

得られる「ジ−オリゴヌクレオチド」の配列を有する核酸の存在下での２個（以上）のオリゴヌクレオチドのライゲーションによるジ−オリゴヌクレオチドの増幅に基づく方法を、本発明の増幅ステップにおいて用いることもできる。その全体が参照により本明細書に組込まれる、Wuら(1989)。

本発明のオリゴヌクレオチドプローブ又はプライマーは、特定のアッセイ形式及び特定の必要性及び用いられる標的配列に応じて、任意の好適な長さのものであってもよい。好ましい実施形態においては、オリゴヌクレオチドプローブ又はプライマーは、少なくとも１０ヌクレオチド長（好ましくは、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２．．．）であり、それらを、選択される核酸増幅系及び／又は用いられるハイブリダイゼーション系に特に適するように適合させることができる。当業界で周知の通り、より長いプローブ及びプライマーも、本発明の範囲内にある。３０を超える、４０を超える、５０を超えるヌクレオチドを有するプライマー及び１００を超える、２００を超える、３００を超える、５００を超える、８００を超える、１０００を超えるヌクレオチド長を有するプローブも、本発明によって包含される。勿論、より長いプライマーは、より高価であるという欠点を有し、かくして、当業界では１２〜３０ヌクレオチド長を有するプライマーが通常設計され、用いられる。当業界では周知の通り、１０〜２０００を超えるヌクレオチド長のプローブを、本発明の方法において用いることができる。上記の同一性の％に関して、プローブ及びプライマーの非特異的に記載されるサイズ（例えば、１６、１７、３１、２４、３９、３５０、４５０、５５０、９００、１２４０ヌクレオチド．．．）も、本発明の範囲内にある。一実施形態においては、本発明のオリゴヌクレオチドプローブ又はプライマーは、ＰＤＩＡ３ＲＮＡ（若しくはその相補配列）又はＰＤＩＡ３ｍＲＮＡと特異的にハイブリダイズする。

他の実施形態においては、検出手段は、例えば、特異的プライマー又はプローブを選択して、目的の標的バイオマーカー、例えば、ＰＤＩＡ３にアニーリングさせた後、選択的ハイブリダイゼーションの検出を行うハイブリダイゼーション技術を用いることができる。当業界で一般に公知であるように、オリゴヌクレオチドプローブ及びプライマーを、その標的配列とのハイブリダイゼーションの融点を考慮に入れることによって設計することができる（以下及びSambrookら、1989、Molecular Cloning--A Laboratory Manual、第2版、CSH Laboratories; Ausubelら、1994、Current Protocols in Molecular Biology、John Wiley & Sons Inc., N.Y.を参照されたい）。

本発明のアッセイ条件下でハイブリダイゼーションを起こさせるために、オリゴヌクレオチドプライマー及びプローブは、ＰＤＩＡ３又は本発明の別のバイオマーカーのポリヌクレオチドの一部に対して少なくとも７０％（少なくとも７１％、７２％、７３％、７４％）、好ましくは、少なくとも７５％（７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％）、より好ましくは、少なくとも９０％（９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、１００％）の同一性を有するオリゴヌクレオチド配列を含むべきである。本発明のプローブ及びプライマーは、ストリンジェントなハイブリダイゼーション条件下でハイブリダイズするもの、及び少なくとも中程度にストリンジェントな条件下で本発明のバイオマーカー相同体にハイブリダイズするものである。特定の実施形態においては、本発明のプローブ及びプライマーは、本発明のバイオマーカー（ＰＤＩＡ３、遺伝子配列（例えば、ｃＤＮＡ又はｍＲＮＡ）に対する完全な配列同一性を有する。当業界で公知のコンピュータアラインメント及び配列分析の方法を用いることにより、本明細書に開示される本発明のバイオマーカーに基づいて本発明において他のプローブ及びプライマーを容易に設計及び使用することができることが理解されるべきである（Molecular Cloning: A Laboratory Manual、第3版、Cold Spring Harbor Laboratory(編)、2000を参照されたい）。

２．ポリペプチドバイオマーカーの検出

本発明は、本発明のＰＤＩＡ３ポリペプチドを検出するための任意の好適な方法を企図する。特定の実施形態においては、検出方法は、ＰＤＩＡ３に特異的に結合する抗体を含む免疫検出方法である。様々な有用な免疫検出方法のステップが、例えば、参照により本明細書に組込まれるNakamuraら(1987)などの科学文献に記載されている。

一般に、免疫結合方法は、バイオマーカータンパク質、ペプチド又は抗体を含有すると疑われる試料を取得すること、及び場合により、免疫複合体の形成を可能にするのに有効な条件下で、該試料を、本発明による抗体又はタンパク質又はペプチドと接触させることを含む。

免疫結合方法は、試料中の反応成分の量を検出又は定量するための方法であって、結合プロセス中に形成される任意の免疫複合体の検出又は定量を必要とする方法を含む。ここで、前立腺特異的なタンパク質、ペプチド又は対応する抗体を含有すると疑われる試料を取得し、場合により、該試料を抗体又はコードされるタンパク質若しくはペプチドと接触させた後、特定の条件下で形成される免疫複合体の量を検出又は定量することができる。

バイオマーカー検出に関して、分析される生物学的試料は、ＰＤＩＡ３を含有すると疑われる任意の試料であってもよい。免疫複合体（一次免疫複合体）の形成を可能にするのに有効な条件下での、十分な時間にわたる、選択された生物学的試料と、タンパク質（例えば、ＰＤＩＡ３又は血液中の抗ＰＤＩＡ３抗体と結合するその抗原）、ペプチド（例えば、血液中の抗ＰＤＩＡ３抗体と結合するＰＤＩＡ３断片）、又は抗体（例えば、生物学的試料中のＰＤＩＡ３に結合する検出試薬として）との接触。一般に、複合体形成は、単に生物学的試料に組成物を添加し、存在する任意の抗原と抗体が免疫複合体を形成する、すなわち、それに結合するのに十分な時間にわたって混合物をインキュベートすることである。この時間の後、一般には、組織切片、ＥＬＩＳＡプレート、ドットブロット又はウェスタンブロットなどの試料−抗体組成物を洗浄して、任意の非特異的に結合した抗体種を除去し、検出しようとする一次免疫複合体内にこれらの抗体のみを特異的に結合させることができる。

一般に、免疫複合体形成の検出は、当業界で周知であり、いくつかの手法の適用によって達成することができる。これらの方法は、一般に、当業界で標準的に使用される放射性、蛍光、生物学的若しくは酵素的タグ又は標識などの、標識又はマーカーの検出に基づく。そのような標識の使用に関する米国特許としては、参照により本明細書に組込まれる米国特許第３，８１７，８３７号；第３，８５０，７５２号；第３，９３９，３５０号；第３，９９６，３４５号；第４，２７７，４３７号；第４，２７５，１４９号及び第４，３６６，２４１号が挙げられる。勿論、当業界で公知のように、第２の抗体又はビオチン／アビジンリガンド結合配置などの第２の結合リガンドの使用によってさらなる利点を見出すことができる。

検出において用いられる、コードされたタンパク質（例えば、ＰＤＩＡ３）、ペプチド（例えば、ＰＤＩＡ３ペプチド）又は対応する抗体（検出試薬としての抗ＰＤＩＡ３抗体）を、それ自身、検出可能な標識に連結してもよく、その後、この標識を単に検出し、それによって、組成物中の一次免疫複合体の量を決定することができる。

あるいは、一次免疫複合体内に結合するようになる第１の添加された成分を、コードされたタンパク質、ペプチド又は対応する抗体に対する結合親和性を有する第２の結合リガンドによって検出することができる。これらの場合、第２の結合リガンドを、検出可能な標識に連結することができる。第２の結合リガンドはそれ自身、抗体であることが多く、かくして、「第２」の抗体と呼ぶことができる。二次免疫複合体の形成を可能にするのに有効な条件下、及び十分な時間にわたって、一次免疫複合体を、標識された、二次結合リガンド、又は抗体と接触させる。次いで、一般的には、二次免疫複合体を洗浄して、非特異的に結合した標識された第２の抗体又はリガンドを除去した後、二次免疫複合体中の残存する標識を検出する。

さらなる方法は、２ステップの手法による一次免疫複合体の検出を含む。コードされたタンパク質、ペプチド又は対応する抗体に対する結合親和性を有する、抗体などの第２の結合リガンドを用いて、上記のような二次免疫複合体を形成する。洗浄後、二次免疫複合体を、再度、免疫複合体（三次免疫複合体）の形成を可能にするのに有効な条件下、及び十分な時間にわたって、第２の抗体に対する結合親和性を有する第３の結合リガンド又は抗体と接触させる。第３のリガンド又は抗体を検出可能な標識に連結し、かくして形成された三次免疫複合体の検出を可能にする。この系は、これが望ましい場合、シグナル増幅を提供することができる。

本発明の免疫検出方法は、前立腺癌などの状態の診断における明らかな有用性を有する。ここで、コードされたタンパク質又はペプチド又は対応する抗体のいずれかを含有すると疑われる生物学的試料又は臨床試料を用いる。しかしながら、これらの実施形態はまた、抗原又は抗体試料の滴定、ハイブリドーマの選択などにおける、非臨床試料への適用も有する。

本発明は、特に、免疫検出アッセイの型としてのＥＬＩＳＡの使用を企図する。本発明のバイオマーカータンパク質又はペプチドは、前立腺癌の診断及び予後モニタリングにおけるＥＬＩＳＡアッセイにおける免疫原として有用であることが企図される。イムノアッセイは、その最も単純かつ直接的な意味において、結合アッセイである。特定の好ましいイムノアッセイは、当業界で公知の様々な型の酵素結合免疫吸着アッセイ（ＥＬＩＳＡ）及びラジオイムノアッセイ（ＲＩＡ）である。組織切片を用いる免疫組織化学的検出も特に有用である。しかしながら、検出はそのような技術に限定されず、ウェスタンブロッティング、ドットブロッティング、ＦＡＣＳ分析なども用いることができることが容易に理解されるであろう。

１つの例示的なＥＬＩＳＡにおいては、本発明のバイオマーカーに結合する抗体を、ポリスチレンマイクロタイタープレート中のウェルなどの、タンパク質親和性を示す選択された表面上に固定する。次いで、臨床試料などの、前立腺癌マーカー抗原を含有すると疑われる試験組成物を、ウェルに添加する。結合させ、洗浄して非特異的に結合した免疫複合体を除去した後、結合した抗原を検出することができる。検出は、一般に、検出可能な標識に連結された標的タンパク質に特異的な第２の抗体の添加によって達成される。この型のＥＬＩＳＡは、単純な「サンドイッチＥＬＩＳＡ」である。検出はまた、第２の抗体の添加、次いで、第２の抗体に対する結合親和性を有する、検出可能な標識に連結された第３の抗体の添加により達成することもできる。

別の例示的なＥＬＩＳＡにおいては、前立腺癌マーカー抗原を含有すると疑われる試料を、ウェル表面上に固定した後、本発明の抗バイオマーカー抗体と接触させる。結合させ、洗浄して、非特異的に結合した免疫複合体を除去した後、結合した抗原を検出する。初期の抗体を検出可能な標識に連結する場合、免疫複合体を直接的に検出することができる。再度、免疫複合体を、第１の抗体に対する結合親和性を有する、検出可能な標識に連結された第２の抗体を用いて検出することができる。

用いられる形式とは関係なく、ＥＬＩＳＡは一般に、コーティング、インキュベート又は結合、非特異的に結合した種を除去するための洗浄、及び結合した免疫複合体の検出などの特定の特徴を有する。これらのものは、以下のように記載される。

プレートを抗原又は抗体でコーティングする際に、一般に、プレートのウェルを、抗原又は抗体の溶液と共に、一晩又は特定の時間にわたってインキュベートする。次いで、プレートのウェルを洗浄して、不完全に吸着した材料を除去する。次いで、ウェルの残りの利用可能な表面を、試験抗血清に関して抗原的に中性である非特異的タンパク質で「コーティング」する。これらのものとしては、ウシ血清アルブミン（ＢＳＡ）、カゼイン及びミルク粉末の溶液が挙げられる。コーティングは、固定化表面上の非特異的吸着部位のブロッキングを可能にし、かくして、表面上への抗血清の非特異的結合を原因とするバックグラウンドを軽減することができる。

ＥＬＩＳＡにおいては、直接的手順よりもむしろ、二次又は三次検出手段を使用することがおそらくより慣用的である。かくして、タンパク質又は抗体のウェルへの結合、バックグラウンドを軽減するための非反応性材料によるコーティング、未結合の材料を除去するための洗浄の後、固定化表面を、試験しようとする対照ヒト前立腺、癌及び／又は臨床試料若しくは生物学的試料と、免疫複合体（抗原／抗体）形成を可能にするのに有効な条件下で接触させる。次いで、免疫複合体の検出には、標識された二次結合リガンド若しくは抗体、又は二次結合リガンド若しくは抗体と共に、標識された三次抗体若しくは第３の結合リガンドが必要である。

語句「免疫複合体（抗原／抗体）形成を可能にするのに有効な条件下」とは、その条件が、好ましくは、抗原及び抗体を、ＢＳＡ、ウシガンマグロブリン（ＢＧＧ）及びリン酸緩衝生理食塩水（ＰＢＳ）／Ｔｗｅｅｎなどの溶液で希釈することを含むことを意味する。これらの添加される薬剤もまた、非特異的バックグラウンドの軽減を援助する傾向がある。

「好適な」条件はまた、インキュベーションが有効な結合を可能にするのに十分な温度で、及び時間にわたって行われることを意味する。インキュベーションステップは、好ましくは、２５〜２７℃の温度で、典型的には、約１〜２〜４ｈであるか、又は約４℃で一晩などであってもよい。

ＥＬＩＳＡにおける全てのインキュベーションステップの後、接触した表面を洗浄して、複合体化されていない材料を除去する。好ましい洗浄手順は、ＰＢＳ／Ｔｗｅｅｎ、又はホウ酸バッファーなどの溶液を用いる洗浄を含む。試験試料と元々結合した材料との特異的な免疫複合体の形成、及びその後の洗浄の後、さらに微量の免疫複合体の出現を決定することができる。

検出手段を提供するために、第２又は第３の抗体は、検出を可能にする関連する標識を有する。好ましくは、これは、適切な発色基質とのインキュベーションの際に発色現像を生成する酵素である。かくして、例えば、さらなる免疫複合体形成の発達に都合が良い時間及び条件下で、第１又は第２の免疫複合体を、ウレアーゼ、グルコースオキシダーゼ、アルカリホスファターゼ又は水素ペルオキシダーゼ結合抗体と接触させ、インキュベートすることを望むであろう（例えば、ＰＢＳ−ＴｗｅｅｎなどのＰＢＳ含有溶液中、室温で２ｈのインキュベーション）。

標識された抗体とのインキュベーション、未結合の材料を除去するためのその後の洗浄の後、例えば、尿素及びブロモクレゾールパープルなどの発色基質とのインキュベーションにより、標識の量を定量する。次いで、例えば、可視スペクトル分光光度計を用いて、色の生成の程度を測定することにより、定量を達成する。

ＰＤＩＡ３を、タンパク質質量分析法及び機器を用いて測定、定量、検出、及びさもなければ分析することもできる。タンパク質質量分析とは、タンパク質の試験への質量分析の適用を指す。限定を意図するものではないが、質量分析を用いてタンパク質を特徴付けるために、典型的には２つの手法が用いられる。第１には、無傷のタンパク質をイオン化した後、質量分析器に導入する。この手法は、タンパク質分析の「トップダウン」戦略と呼ばれる。全タンパク質のイオン化のための２つの主要な方法は、電子スプレーイオン化（ＥＳＩ）及びマトリックス支援レーザー脱離／イオン化（ＭＡＬＤＩ）である。第２の手法においては、タンパク質を、トリプシンなどのプロテアーゼを用いてより小さいペプチドに酵素的に消化する。続いて、これらのペプチドを、質量分析計に導入し、ペプチド質量フィンガープリンティング又はタンデム質量分析により同定する。従って、この後者の手法（「ボトムアップ」プロテオミクスとも呼ばれる）は、ペプチドレベルでの同定を使用し、タンパク質の存在を推察するものである。

本発明のバイオマーカーの全タンパク質質量分析を、飛行時間（ＴＯＦ）ＭＳ、又はフーリエ変換イオンサイクロトロン共鳴（ＦＴ−ＩＣＲ）を用いて行うことができる。これらの２つの型の機器は、その広い質量範囲のため、ＦＴ−ＩＣＲの場合、その高い質量精度のため有用である。ペプチド質量分析のために最も広く用いられる機器は、それらが高いペースでペプチド質量フィンガープリント（ＰＭＦ）の獲得を可能にするため（１ＰＭＦを約１０ｓｅｃで分析することができる）、ＭＡＬＤＩ飛行時間機器である。多段階四重極飛行時間及び四重極イオントラップも本出願において有用である。

ＰＤＩＡ３を、タンパク質と生物学的媒体又は試料中に同時に存在する分子との複雑な混合物中で測定することもできるが、試料の分画化が必要であることもあり、本明細書で企図される。タンパク質の複雑な混合物のイオン化は、多い方のタンパク質が同じ試料中の少ない方のタンパク質からシグナルを「かき消す」又は抑制する傾向を有する状況をもたらし得ることが理解されるであろう。さらに、複雑な混合物に由来する質量スペクトルは、圧倒的な数の混合物成分のため、解釈するのが難しいことがある。分画化を用いて、最初にタンパク質の複雑な混合物を分離した後、質量分析を行うことができる。酵素消化物からタンパク質、又はそのペプチド産物を分画するために２つの方法が広く用いられている。第１の方法は、全タンパク質を分画し、二次元ゲル電気泳動と呼ばれる。第２の方法である高速液体クロマトグラフィー（ＬＣ又はＨＰＬＣ）は、酵素的消化の後にペプチドを分画するために用いられる。いくつかの状況においては、これらの技術の両方を組合わせることが望ましい場合がある。タンパク質混合物を分画するための当業界で公知の任意の他の好適な方法も、本明細書で企図される。

２Ｄゲル上で同定されるゲルスポットは通常、１つのタンパク質に起因する。タンパク質の同一性が望ましい場合、通常は、目的のタンパク質スポットが切り出され、タンパク質分解的に消化される、ゲル内消化の方法が適用される。消化の結果得られるペプチド質量を、ペプチド質量フィンガープリンティングを用いる質量分析によって決定することができる。この情報がタンパク質の明確な同定を可能にしない場合、そのペプチドを、ｄｅｎｏｖｏ配列決定のためにタンデム質量分析にかけることができる。

ＨＰＬＣ／ＭＳを用いたタンパク質混合物の特性決定を、当業界では「ショットガンプロテオミクス」及びＭｕＤＰＩＴ（多次元タンパク質同定技術）と呼ぶこともできる。タンパク質混合物の消化の結果生じるペプチド混合物を、１又は２ステップの液体クロマトグラフィー（ＬＣ）によって分画する。クロマトグラフィー段階からの溶離液を、電子スプレーイオン化によって質量分析器に直接導入するか、又はＭＡＬＤＩを用いるレーザー質量分析のために一連の小スポット上に沈着させることができる。

ＰＤＩＡ３を、様々な技術を用いるＭＳを用いて同定することができ、全て本明細書で企図される。ペプチド質量フィンガープリンティングは、既知のタンパク質の一覧の消化から生じた予測質量のデータベースの検索への入力としてタンパク質分解ペプチドの質量を使用する。参照一覧中のタンパク質配列が、実験値と一致する有意数の予測質量を生じる場合、このタンパク質が元の試料中に存在していたことのいくつかの証拠がある。マイクロキャピラリー液体クロマトグラフィー（ＬＣ）及びデータベース検索と組合わせた自動化データ依存的電子スプレーイオン化（ＥＳＩ）タンデム質量分析（ＭＳ／ＭＳ）のための方法及び機器の開発は、ゲル分離されたタンパク質の同定の有意に高い感度及び速度を有することをさらに理解されるであろう。マイクロキャピラリーＬＣ−ＭＳ／ＭＳは、ゲル電気泳動分離を用いることなく混合物から直接的に個々のタンパク質を大規模に同定するために上手く用いられてきた（Linkら、1999; Opitekら、1997）。

いくつかの最近の方法は、質量分析によるタンパク質の定量を可能にする。例えば、安定な（例えば、非放射性の）より重い炭素（^１３Ｃ）又は窒素（^１５Ｎ）のアイソトープを、１つの試料中に組込むことができるが、他のものを対応する軽いアイソトープ（例えば、^１２Ｃ及び^１４Ｎ）で標識することができる。２つの試料を、分析前に混合する。異なる試料に由来するペプチドを、その質量の差異のため識別することができる。そのピーク強度の比は、ペプチド（及びタンパク質）の相対存在量に対応する。アイソトープ標識化のための最も有名な方法は、ＳＩＬＡＣ（細胞培養物中のアミノ酸による安定アイソトープ標識化）、トリプシン触媒された^１８Ｏ標識化、ＩＣＡＴ（アイソトープコード親和性タグ付け）、ｉＴＲＡＱ（相対的及び絶対的定量のための等圧タグ）である。「半定量的」質量分析は、試料を標識することなく実施することができる。典型的には、これはＭＡＬＤＩ分析を用いて行われる（線形モードで）。個々の分子（典型的には、タンパク質）に由来する、ピーク強度、又はピーク面積は、ここで、試料中のタンパク質の量と相関する。しかしながら、個々のシグナルは、タンパク質の一次構造、試料の複雑性、及び機器の設定に依存する。他の型の「標識を含まない」定量的質量分析は、相対タンパク質量を決定するための手段として消化されたタンパク質のスペクトル計数（又はペプチド計数）を用いる。

ＰＤＩＡ３を、発明を限定することを意図しない、以下の例示的な方法に従う質量分析を用いて、又は他の質量分析に基づく方法を用いて、複雑な生物学的試料から同定及び定量することができる。

この実施形態の第１のステップにおいては、（Ａ）タンパク質の複雑な混合物（少なくとも１種の目的のバイオマーカーを含む）を含む生物学的試料を、断片化し、安定アイソトープＸで標識する。（Ｂ）次に、少なくとも１種の目的の標的バイオマーカーと同一である標準タンパク質を断片化することにより調製され、安定アイソトープＹで標識された、既知量の内部標準を生物学的試料に添加する。（Ｃ）次いで、得られたこの試料を、ＬＣ−ＭＳ／ＭＳ装置に導入し、多反応モニタリング（ＭＲＭ）分析を、ＭＲＭクロマトグラムを得るための内部標準について選択されたＭＲＭ遷移を用いて実施する。（Ｄ）次いで、ＭＲＭクロマトグラムを見て、内部標準（内部標準ペプチド）に由来するペプチドと同じ保持時間を示す生物学的試料に由来する標的ペプチドバイオマーカーを同定し、内部標準ペプチドのピーク面積と、標的ペプチドバイオマーカーのピーク面積とを比較することにより試験試料中の標的タンパク質バイオマーカーを定量する。

血液、尿、唾液、毛髪、細胞、細胞組織、生検材料、及びその処理産物に由来する生物学的試料；並びに遺伝子組換え技術により調製されたタンパク質含有試料などの、任意の好適な生物学的試料を、ＬＣ−ＭＳ／ＭＳ／ＭＲＭ分析のための出発点として用いることができる。

上記ステップ（Ａ）〜（Ｄ）のそれぞれを、以下でさらに説明する。

ステップ（Ａ）（断片化及び標識化）。ステップ（Ａ）においては、標的タンパク質バイオマーカーをペプチドの収集物に断片化した後、安定アイソトープＸで標識する。標的タンパク質を断片化するために、例えば、標的タンパク質をトリプシンなどのタンパク質分解酵素（プロテアーゼ）で消化する方法、及び臭化シアンを用いる方法などの化学的切断方法を用いることができる。プロテアーゼによる消化が好ましい。タンパク質分解的消化を完了まで進行させた場合、所与のモル量のタンパク質は、同じモル量の各トリプシンペプチド切断産物を産生することが公知である。かくして、所与のタンパク質に対するトリプシンペプチドのモル量の決定は、試料中の元のタンパク質のモル量の決定を可能にする。標的タンパク質の絶対的定量を、プロテアーゼ消化物（ペプチドの収集物）中に含まれる標的タンパク質由来ペプチドの絶対量を決定することによって達成することができる。従って、タンパク質分解的消化を完了まで進行させるために、還元及びアルキル化処理を実施した後、トリプシンによるプロテアーゼ消化を行って、標的タンパク質中に含まれるジスルフィド結合を還元及びアルキル化するのが好ましい。

続いて、得られた消化物（生物学的試料中の標的バイオマーカーのペプチドを含む、ペプチドの収集物）を、安定アイソトープＸによる標識化にかける。安定アイソトープＸの例としては、水素原子については^１Ｈ及び^２Ｈ、炭素原子については^１２Ｃ及び^１３Ｃ、並びに窒素原子については^１４Ｎ及び^１５Ｎが挙げられる。任意のアイソトープを、それらから好適に選択することができる。安定アイソトープＸによる標識化を、消化物（ペプチドの収集物）を、安定アイソトープを含有する試薬と反応させることによって実施することができる。市販のそのような試薬の好ましい例としては、アミン特異的な安定アイソトープ試薬キットである、ｍＴＲＡＱ（登録商標）（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓにより製造）が挙げられる。ｍＴＲＡＱは、アイソトープ標識化の結果としてそれらの間で一定の質量差を有し、ペプチドのＮ末端又はリシン残基の一次アミンに結合する２又は３つの型の試薬（ｍＴＲＡＱ−ｌｉｇｈｔ及びｍＴＲＡＱ−ｈｅａｖｙ；又はｍＴＲＡＱ−Ｄ０、ｍＴＲＡＱ−Ｄ４、及びｍＴＲＡＱ−Ｄ８）から構成される。

ステップ（Ｂ）（内部標準の添加）。ステップ（Ｂ）においては、既知量の内部標準を、ステップ（Ａ）で得られた試料に添加する。本明細書で用いられる内部標準は、測定しようとする標的タンパク質（標的バイオマーカー）と同じアミノ酸配列からなるタンパク質（標準タンパク質）を断片化すること、及び得られた消化物（ペプチドの収集物）を安定アイソトープＹで標識化することにより得られる消化物（ペプチドの収集物）である。断片化処理を、標的タンパク質について上記されたのと同じ様式で実施することができる。安定アイソトープＹによる標識化も、標的タンパク質について上記されたのと同じ様式で実施することができる。しかしながら、本明細書で用いられる安定アイソトープＹは、標的タンパク質消化物を標識するために用いられる安定アイソトープＸのものと異なる質量を有するアイソトープでなければならない。例えば、上記のｍＴＲＡＱ（登録商標）（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓにより製造）を用いる場合、ｍＴＲＡＱ−ｌｉｇｈｔを用いて標的タンパク質消化物を標識する時は、ｍＴＲＡＱ−ｈｅａｖｙを用いて標準タンパク質消化物を標識するべきである。

ステップ（Ｃ）（ＬＣ−ＭＳ／ＭＳ及びＭＲＭ分析）。ステップ（Ｃ）においては、ステップ（Ｂ）で得られた試料を最初にＬＣ−ＭＳ／ＭＳ装置に入れた後、内部標準のために選択されたＭＲＭ遷移を用いて、多反応モニタリング（ＭＲＭ）分析を実施する。ＬＣ−ＭＳ／ＭＳ装置を用いるＬＣ（液体クロマトグラフィー）により、ステップ（Ｂ）で得られた試料（安定アイソトープで標識されたペプチドの収集物）を、最初に一次元又は多次元高速液体クロマトグラフィーによって分離する。そのような液体クロマトグラフィーの特定例としては、ペプチド間の電荷差を用いることによって分離を行う陽イオン交換クロマトグラフィー；及びペプチド間の疎水性の差を用いることによって分離を行う逆相クロマトグラフィーが挙げられる。これらの方法は両方とも、組合わせて用いてもよい。

続いて、それぞれの分離されたペプチドを、直列に接続した２つの質量分析計を含むタンデム質量分析計（ＭＳ／ＭＳ分光計）を用いることによるタンデム質量分析にかける。そのような質量分析計の使用により、数ｆｍｏｌレベルの標的タンパク質の検出が可能となる。さらに、ＭＳ／ＭＳ分析により、ペプチド上の内部配列情報の分析が可能になり、かくして、偽陽性なしに同定が可能となる。磁気セクター質量分析計（ＳｅｃｔｏｒＭＳ）、四重極質量分析計（ＱＭＳ）、飛行時間質量分析器（ＴＯＦＭＳ）、及びフーリエ変換イオンサイクロトロン共鳴質量分析計（ＦＴ−ＩＣＲＭＳ）、並びにこれらの分析器の組合せなどの、他の型のＭＳ分析を用いることもできる。

続いて、得られたデータを、検索エンジンに通し、スペクトルの割り当てを実施し、それぞれのタンパク質について実験的に検出されたペプチドを列挙する。好ましくは、検出されたペプチドをそれぞれのタンパク質についてグループ化し、好ましくは、前駆体イオンのものよりも大きいｍ／ｚ値を有する少なくとも３つのフラグメント及び好ましくは、５００以上のｍ／ｚ値を有する少なくとも３つのフラグメントを、スペクトル上でのシグナル強度の降順にそれぞれのＭＳ／ＭＳスペクトルから選択する。これらのものから、強度の降順に２つ以上のフラグメントを選択し、強度の平均を、ＭＲＲ遷移の予想感度と定義する。１つのタンパク質から複数のペプチドが検出される場合、最も高い感度を有する少なくとも２つのペプチドを、指標としての予想感度を用いて標準ペプチドとして選択する。

ステップ（Ｄ）（試験試料中の標的タンパク質の定量）。ステップ（Ｄ）は、ステップ（Ｃ）で検出されたＭＲＭクロマトグラム中で、内部標準に由来するペプチド（内部標準ペプチド）と同じ保持時間を示す標的タンパク質（目的の標的バイオマーカー）に由来するペプチドを同定すること、及び内部標準ペプチドのピーク面積と、標的ペプチドのピーク面積とを比較することにより、試験試料中の標的タンパク質を定量することを含む。事前に調製された標準タンパク質の較正曲線を用いることによって、標的タンパク質を定量することができる。

較正曲線を、以下の方法によって調製することができる。最初に、標的バイオマーカータンパク質のものと同一であるアミノ酸配列からなる組換えタンパク質を、上記のように、トリプシンなどのプロテアーゼで消化する。続いて、既知の濃度の前駆体−フラグメント遷移選択標準（ＰＦＴＳ）を、２つの異なる型の安定アイソトープで個別に標識する（すなわち、一方は内部標準ペプチドを標識するために用いられる安定異性体で標識される（ＩＳで標識される）が、他方は標的ペプチドを標識するために用いられる安定異性体で標識される（Ｔで標識される））。特定の量のＩＳ標識されたＰＴＦＳを、様々な濃度のＴ標識されたＰＴＦＳと混合することにより、複数の試料を作製する。これらの試料を、上記のＬＣ−ＭＳ／ＭＳ装置に入れて、ＭＲＭ分析を実施する。得られたＭＲＭクロマトグラム上でのＴ標識されたＰＴＦＳとＩＳ標識されたＰＴＦＳとの面積比（Ｔ標識されたＰＴＦＳ／ＩＳ標識されたＰＴＦＳ）を、Ｔ標識されたＰＴＦＳの量に対してプロットして、較正曲線を調製する。試験試料中に含まれる標的タンパク質の絶対量を、較正曲線を参照することにより算出することができる。

３．抗体及び標識

いくつかの実施形態においては、本発明は、ＰＤＩＡ３の高感度検出及び定量のための標識を含む方法及び組成物を提供する。当業者であれば、粒子の混合物（例えば、標識された抗ＰＤＩＡ３抗体若しくは標識された二次抗体、又はＰＤＩＡ３ｍＲＮＡに特異的にハイブリダイズする標識されたオリゴヌクレオチドプローブ）中でのその検出又は識別を可能にする標的分子を標識するために多くの戦略を用いることができることを認識できる。標識を、標識と標的との非特異的又は特異的相互作用を用いる方法などの、任意の公知の手段によって結合させることができる。標識は、検出可能なシグナルを提供するか、又は電界中での粒子の移動性に影響し得る。さらに、直接的に、又は結合パートナーを介して、標識化を達成することができる。

いくつかの実施形態においては、標識は、目的のバイオマーカーに結合する結合パートナーを含み、結合パートナーは蛍光部分に結合している。本発明の組成物及び方法は、高度に蛍光性の部分、例えば、レーザーが部分を含む直径約５μｍ以上のスポットに集中し、レーザーによってスポットを指向する総エネルギーが約３マイクロジュール以下である、部分の励起波長で光を放出するレーザーによってシミュレートした場合に少なくとも約２００個の光子を放出することができる部分を用いてもよい。本発明の組成物及び方法にとって好適な部分を、以下でより詳細に説明する。

いくつかの実施形態においては、本発明は、蛍光部分が、部分の励起波長で光を放出するレーザーによりシミュレートした場合に少なくとも約２００個の光子を放出することができ、レーザーが、部分を含む直径約５μｍ以上のスポットに集中し、レーザーによってスポットを指向する総エネルギーが約３マイクロジュール以下である、蛍光部分に結合する生物分子のための結合パートナーを含む生物分子を検出するための標識を提供する。いくつかの実施形態においては、部分は、複数の蛍光実体、例えば、約２〜４、２〜５、２〜６、２〜７、２〜８、２〜９、２〜１０、又は約３〜５、３〜６、３〜７、３〜８、３〜９、又は３〜１０個の蛍光実体を含む。いくつかの実施形態においては、部分は、約２〜４個の蛍光実体を含む。いくつかの実施形態においては、生物分子は、タンパク質又は小分子である。いくつかの実施形態においては、生物分子は、タンパク質である。蛍光実体は蛍光色素分子であってもよい。いくつかの実施形態においては、蛍光色素分子は、インドリウム環の３炭素上の置換基が化学反応基又はコンジュゲートした物質を含有する、少なくとも１個の置換されたインドリウム環系を含む。いくつかの実施形態においては、色素分子は、ＡｌｅｘａＦｌｕｏｒ４８８、ＡｌｅｘａＦｌｕｏｒ５３２、ＡｌｅｘａＦｌｕｏｒ６４７、ＡｌｅｘａＦｌｕｏｒ６８０又はＡｌｅｘａＦｌｕｏｒ７００からなる群より選択されるＡｌｅｘａＦｌｕｏｒ分子である。いくつかの実施形態においては、色素分子は、ＡｌｅｘａＦｌｕｏｒ４８８、ＡｌｅｘａＦｌｕｏｒ５３２、ＡｌｅｘａＦｌｕｏｒ６８０又はＡｌｅｘａＦｌｕｏｒ７００からなる群より選択されるＡｌｅｘａＦｌｕｏｒ分子である。いくつかの実施形態においては、色素分子は、ＡｌｅｘａＦｌｕｏｒ６４７色素分子である。いくつかの実施形態においては、色素分子は、第１の型及び第２の型の色素分子、例えば、第１の型及び第２の型の色素分子が異なる放出スペクトルを有する、例えば、２つの異なるＡｌｅｘａＦｌｕｏｒ分子を含む。第１の型の色素分子の数と第２の型の色素分子の数との比は、例えば、４：１、３：１、２：１、１：１、１：２、１：３又は１：４であってもよい。結合パートナーは、例えば、抗体であってもよい。

いくつかの実施形態においては、本発明は、標識が、マーカーのための結合パートナー及び蛍光部分を含み、蛍光部分が部分の励起波長で光を放出するレーザーによってシミュレートした場合に少なくとも約２００個の光子を放出することができ、レーザーが部分を含む直径約５μｍ以上のスポットに集中し、レーザーによってスポットを指向する総エネルギーが約３マイクロジュール以下である、本発明の生物学的マーカーの検出のための標識を提供する。いくつかの実施形態においては、蛍光部分は、蛍光分子を含む。いくつかの実施形態においては、蛍光部分は、複数の蛍光分子、例えば、約２〜１０、２〜８、２〜６、２〜４、３〜１０、３〜８、又は３〜６個の蛍光分子を含む。いくつかの実施形態においては、標識は、約２〜４個の蛍光分子を含む。いくつかの実施形態においては、蛍光色素分子は、インドリウム環の３炭素上の置換基が化学反応基又はコンジュゲートした物質を含有する、少なくとも１個の置換されたインドリウム環系を含む。いくつかの実施形態においては、蛍光分子は、ＡｌｅｘａＦｌｕｏｒ４８８、ＡｌｅｘａＦｌｕｏｒ５３２、ＡｌｅｘａＦｌｕｏｒ６４７、ＡｌｅｘａＦｌｕｏｒ６８０又はＡｌｅｘａＦｌｕｏｒ７００からなる群より選択される。いくつかの実施形態においては、蛍光分子は、ＡｌｅｘａＦｌｕｏｒ４８８、ＡｌｅｘａＦｌｕｏｒ５３２、ＡｌｅｘａＦｌｕｏｒ６８０又はＡｌｅｘａＦｌｕｏｒ７００からなる群より選択される。いくつかの実施形態においては、蛍光分子は、ＡｌｅｘａＦｌｕｏｒ６４７分子である。いくつかの実施形態においては、結合パートナーは、抗体を含む。いくつかの実施形態においては、抗体は、モノクローナル抗体である。他の実施形態においては、抗体は、ポリクローナル抗体である。

様々な実施形態においては、ＰＤＩＡ３を検出するための結合パートナーは、抗体又はその抗原結合フラグメントである。本明細書で用いられる用語「抗体」は、広い用語であり、限定されるものではないが、天然の抗体並びに非天然の抗体、例えば、一本鎖抗体、キメラ、二官能性及びヒト化抗体、並びにその抗原結合フラグメントなどを指すように、その通常の意味で用いられる。抗体の「抗原結合フラグメント」とは、抗原結合に関与する抗体の部分を指す。抗原結合部位は、重（「Ｈ」）鎖及び軽（「Ｌ」）鎖のＮ末端可変（「Ｖ」）領域のアミノ酸残基によって形成される。抗体が生じる分子のエピトープ又は領域の選択は、例えば、存在する場合、様々な形態の分子に対する、又は全部（例えば、分子の全部、若しくは実質的に全部）に対する、その特異性を決定づけることが理解されるであろう。

抗体を製造するための方法は、確立されている。当業者であれば、例えば、Antibodies, A Laboratory Manual、Harlow及びDavid Lane(編)、Cold Spring Harbor Laboratory (1988)、Cold Spring Harbor、N.Y.に記載のような、抗体の製造のための多くの手順が利用可能であることを認識するであろう。当業者であれば、抗体を模倣する結合フラグメント又はＦａｂフラグメントを、様々な手順によって遺伝子情報から調製することもできることもまた認識するであろう（Antibody Engineering: A Practical Approach (Borrebaeck, C.(編))、1995、Oxford University Press、Oxford; J. Immunol. 149、3914-3920 (1992)）。分子、例えば、タンパク質に対するモノクローナル及びポリクローナル抗体、並びにマーカーも市販されている（R and D Systems、Minneapolis、Minn.; HyTest、HyTest Ltd.、Turku Finland; Abcam Inc.、Cambridge、Mass.、USA、Life Diagnostics, Inc.、West Chester、Pa.、USA; Fitzgerald Industries International, Inc.、Concord、Mass. 01742-3049 USA; BiosPacific、Emeryville、Calif.）。

いくつかの実施形態においては、抗体は、ポリクローナル抗体である。他の実施形態においては、抗体は、モノクローナル抗体である。

さらに他の実施形態においては、特に、ｍＲＮＡバイオマーカー又は他の核酸系バイオマーカーを検出し、これにハイブリダイズする結合パートナーとしてオリゴヌクレオチドを用いる場合、結合パートナー（例えば、オリゴヌクレオチド）は、標識、例えば、蛍光部分又は色素を含んでもよい。さらに、本発明の任意の結合パートナー、例えば、抗体を、蛍光部分で標識することもできる。前記部分の蛍光は、本明細書に記載の単一分子検出器などの、単一分子検出器における検出を可能にするのに十分なものである。本明細書で用いられる用語「蛍光部分」は、全蛍光が、本明細書に記載の単一分子検出器中で部分を検出することができるようなものである１つ以上の蛍光実体を含む。かくして、蛍光部分は、単一の実体（例えば、量子ドット若しくは蛍光分子）又は複数の実体（例えば、複数の蛍光分子）を含んでもよい。本明細書で用いられる用語「部分」が蛍光実体の群、例えば、複数の蛍光色素分子を指す場合、それぞれ個々の実体を別々に結合パートナーに結合させるか、又は群としての実体が検出しようとする十分な蛍光を提供する限り、実体を一緒に結合させることができることが理解される。

キット／パネル

本発明はまた、対象（例えば、癌を有し、コエンザイムＱ１０による癌のための治療が必要な対象）からの生物学的試料中のＰＤＩＡ３のレベルを測定するための組成物及びキットも提供する。これらのキットは、１つ以上の以下のもの：ＰＤＩＡ３に特異的に結合する検出可能抗体、染色のための対象組織試料を取得及び／又は調製するための試薬、並びに使用のための説明書を含む。

本発明はまた、生物学的試料中のＰＤＩＡ３タンパク質又は核酸の存在を検出するためのキットも包含する。そのようなキットを用いて、癌に罹患した対象がコエンザイムＱ１０による治療に対して反応性であるかどうかを予測することができる。かかるキットはまた、コエンザイムＱ１０による治療のための対象を選択するために用いることができる。例えば、キットは、生物学的試料中のＰＤＩＡ３タンパク質又は核酸を検出することができる標識された化合物又は薬剤と、試料中のタンパク質又はｍＲＮＡの量を決定するための手段（例えば、タンパク質若しくはその断片に結合する抗体、又はタンパク質をコードするＤＮＡ若しくはｍＲＮＡに結合するオリゴヌクレオチドプローブ）とを含んでもよい。キットはまた、本明細書に提供される方法のいずれかを実施するため、又は本明細書に提供される教示に基づいてキットを用いて得られた結果を解釈するための、キットの使用のための説明書を含んでもよい。キットはまた、試料中に存在するマーカーの量の正規化のための、試料中の対照タンパク質、例えば、組織試料のためのアクチン、血液若しくは血液由来試料中のアルブミンの検出のための試薬を含んでもよい。キットはまた、対照としての使用のための検出のため、又はキットを用いて行われたアッセイの定量のための精製されたマーカーを含んでもよい。

抗体に基づくキットについては、キットは、例えば、（１）ＰＤＩＡ３タンパク質に結合する第１の抗体（例えば、固相支持体に結合した）；及び場合により、（２）ＰＤＩＡ３又は第１の抗体のいずれかに結合し、検出可能な標識にコンジュゲートされた第２の異なる抗体を含んでもよい。

オリゴヌクレオチドに基づくキットについては、キットは、例えば、（１）ＰＤＩＡ３タンパク質をコードする核酸配列にハイブリダイズするオリゴヌクレオチド、例えば、検出可能に標識されたオリゴヌクレオチド又は（２）マーカー核酸分子を増幅するのに有用な一対のプライマーを含んでもよい。

クロマトグラフィー方法について、キットは、クロマトグラフィーによる、ＰＤＩＡ３の検出及び同定を可能にする、標識されたマーカーなどのマーカーを含んでもよい。特定の実施形態においては、クロマトグラフィー方法のためのキットは、ＰＤＩＡ３の誘導体化のための化合物を含む。特定の実施形態においては、クロマトグラフィー方法のためのキットは、方法のマーカーを分析（resolve）するためのカラムを含む。

ＰＤＩＡ３の検出にとって特異的な試薬により、複雑な混合物、例えば、血清、組織試料中のマーカーの検出及び定量が可能になる。特定の実施形態においては、試薬は、種特異的である。特定の実施形態においては、試薬は、種特異的ではない。特定の実施形態においては、試薬は、アイソフォーム特異的である。特定の実施形態においては、試薬は、アイソフォーム特異的ではない。特定の実施形態においては、試薬は、全ＰＤＩＡ３を検出する。

特定の実施形態においては、対象（例えば、癌を有し、ＣｏＱ１０による治療の必要がある対象）からの生物学的試料中のＰＤＩＡ３を検出するためのキットは、ＰＤＩＡ３の発現のレベルの検出にとって特異的な少なくとも１つの試薬を含む。特定の実施形態においては、キットは、対象からの生物学的試料中のＰＤＩＡ３のレベルをＰＤＩＡ３の閾値と比較するための説明書をさらに含む。特定の実施形態においては、キットは、ＰＤＩＡ３の発現レベル（例えば閾値を超えるレベル）に基づいてＣｏＱ１０に対して反応性であると予測される対象の同定のための説明書をさらに含む。特定の実施形態においては、キットは、ＰＤＩＡ３の発現レベル（例えば閾値を超えるレベル）に基づいてＣｏＱ１０による治療のための対象を選択するための説明書をさらに含む。

特定の実施形態においては、キットは、例えば、緩衝剤、保存剤、タンパク質安定化剤、反応バッファーを含んでもよい。キットは、検出可能な標識（例えば、酵素又は基質）を検出するのに必要な成分をさらに含んでもよい。キットはまた、アッセイし、試験試料と比較することができる対照試料又は一連の対照試料を含有してもよい。対照は、必要に応じて、既知のレベルの標的マーカーを含む、精製されたタンパク質又は核酸の対照血清又は対照試料であってもよい。キットの各成分を、個々の容器内に封入してもよく、全ての様々な容器が、キットを用いて行われるアッセイの結果を解釈するための説明書と共に、単一のパッケージ内にあってもよい。本発明のキットは、場合により、本発明の方法を実施するために有用なさらなる成分を含んでもよい。

本発明は、限定と解釈されるべきではない以下の実施例によってさらに例示される。本出願を通して引用される全ての参考文献並びに公開された特許及び特許出願の内容は、参照により本明細書に組込まれるものとする。

［実施例１］
進行した固形腫瘍の治療用のコエンザイムＱ１０の進行中のフェーズＩ臨床試験における候補バイオマーカーの同定

癌治療のためのコエンザイムＱ１０の使用を誘導するための候補バイオマーカーを同定するために、進行した固形腫瘍の治療用のコエンザイムＱ１０の進行中のフェーズＩ臨床試験に参加した患者を評価した。この実施例は、試験の進行中に実施された予備的分析を含む。実施例２は、同じ臨床試験のより遅い期間に実施されたより徹底した分析を含み、この期間には、より多くの患者が参加し、より多くのデータが利用可能となった。

試験設計
この臨床試験は、固形腫瘍を有する患者の単独治療（治療群１）及び化学療法との併用治療（治療群２）として、１４４時間連続静脈内（ＩＶ）注入として投与されたコエンザイムＱ１０の用量制限毒性（dose limiting toxicity：ＤＬＴ）を調べる、多施設（multicenter）、非盲検（open-label）、非ランダム化（non-randomized）、用量漸増（dose-escalation）型の試験である。下表１及び２に示されているように、前立腺、結腸、乳房、肺及び膵臓腫瘍を含む広範囲の固形腫瘍を評価した。コエンザイムＱ１０は、用量レベルに応じて３回の連続４８時間用量又は２回の連続７２時間用量で投与した。ゲムシタビン、５−フルオロウラシル又はドセタキセルの３つの標準週１回化学療法レジメンを、コエンザイムＱ１０との併用で評価した。適格患者は、固形腫瘍を有し、標準治療に対して再発性／非反応性である１８才以上の患者である。８５人の患者が試験に参加した。単独治療群は、連続注入で６日間、２８日サイクルでコエンザイムＱ１０を受け取り、併用群（ゲムシタビン、５−フルオロウラシル又はドセタキセル）は、標準化学療法の開始前にコエンザイムＱ１０で３週間プライミングし、続いて６週サイクルで週１回投薬した。治療群の概要が図３６に示されている。

この試験は、それぞれ３〜６人の患者の連続するコホート（cohort）で用量を漸増させる標準３＋３用量漸増設計である。それぞれの用量レベルにおける毒性は、米国国立がん研究所有害事象共通用語規準（National Cancer Institute Common Terminology Criteria for Adverse Events）（CTCAE v4.02）に従ってグレード分けされる。安全性の管理は、コホートレビューコミッティー（Cohort Review Committee：ＣＲＣ）によって提供される。コホートの３人の患者がいずれも１サイクル目にＤＬＴを経験しなかった場合には、安全性及びより低いコホートからのＰＫデータのＣＲＣ審査の後に、次に高い用量レベルで３人の新たな患者を参加させることができる。この臨床試験は、国際公開第２０１５／０３５０９４号パンフレットにより詳細に記載されている。この文献はその全体が参照によって本明細書に組み込まれている。

患者評価
２週目に腫瘍反応を評価し、その後は２サイクルごとに腫瘍反応を評価した。６６人の患者うち１６人（２４％）は、≧４サイクルの間、最低限の安定疾患（Stable Disease）を維持した。腫瘍反応データを使用して患者を、「総合的臨床的利益」群又は「非臨床的利益」群に層別化した。

試験全体にわたるいくつかの時点において患者から血液試料を採取した。血液試料を遠心処理して、さらなる分析のために血漿／血清及び（白血球及び血小板を含む）バフィーコートを得た。単独治療及び併用治療の１サイクル目に尿試料を採取した。コエンザイムＱ１０治療を始める２週間前及びコエンザイムＱ１０治療を始めて２週間後に、フルオロデオキシグルコース（fluorodeoxyglucose：ＦＤＧ）取込みを伴うＰＥＴスキャン及び癌生検を実行した。ＦＤＧ−ＰＥＴスキャンを使用してコエンザイムＱ１０に対する腫瘍反応を評価した。ＦＤＧ−ＰＥＴスキャンを使用して腫瘍の代謝状態を判定することもできる。例えば、図３７は、手術を受け、それぞれイリノテカン及びアバスチンと組み合わせた複数のＦＯＬＦＩＲＩ及びＦＯＬＦＯＸレジメンで重く予備的に治療された転移性虫垂癌を有する患者のコエンザイムＱ１０単独治療前及びコエンザイムＱ１０単独治療後２、１０、１９及び２９週のＦＤＧ−ＰＥＴスキャンを示す。コエンザイムＱ１０単独治療は、６６ｍｇ／ｋｇの用量で開始し、２２週に８８ｍｇ／ｋｇ用量に移行した。

サンプリング及びＦＤＧＰＥＴ−スキャンのスケジュールの概要が図３８に示されている。

患者ごとに、後述する用量制限毒性（ＤＬＴ）、薬物動態（ｐＫ）及び有害事象を含む広範囲の臨床データを記録した。臨床データはさらに、年齢、性及びエスニシティなどの人口統計的データ；上述の腫瘍の状態；並びに腫瘍のタイプ、位置及びに以前の治療を含む病歴を含む。

用量制限毒性
ＤＬＴは、コエンザイムＱ１０単独治療群では１７１ｍｇ／ｋｇ、ゲムシタビン群では１３７ｍｇ／ｋｇ（最大投与量）で報告され、凝固障害（coagulopathy）に関係していた。下表１、２及び３を参照されたい。実施例１がカバーする期間に３つのＤＬＴが報告された。１つのＤＬＴ（グレード３の部分トロンボプラスチン時間（ＰＴＴ）異常）は、単独治療の用量レベル５（１７１ｍｇ／ｋｇ）で報告された。この事象は、ビタミンＫ及び新鮮凍結血漿（ＦＦＰ）の投与後、２日で解消した。この用量レベルで３人の追加の患者が参加した。追加のＤＬＴは報告されなかった。ゲムシタビンを用いた併用治療の用量レベル１３７ｍｇ／ｋｇで２つのＤＬＴ（グレード３のアスパラギン酸トランスアミナーゼ（ＡＳＴ）の上昇及びグレード４の血小板減少）が報告された。試験設計に従って、患者は、次に低い用量レベル（１１０ｍｇ／ｋｇ）に参加した。

最も一般的な関連有害事象は、ビタミンＫ投与後に緩和されたグレード１〜２のプロトロンビン時間（ＰＴ）／部分トロンボプラスチン時間（ＰＴＴ）／国際標準化比（International Normalized Ratio：ＩＮＲ）の延長であった。グレード３の４つの事象が報告された。実施例１がカバーする期間に１５０３の有害事象が報告された。７５の事象は重篤（serious）と報告された。重篤な有害事象のうち、２７はnot related、３８はunlikely related、８つはpossibly related、１つはprobably related、１つはdefinitely relatedであった（活性化部分トロンボプラスチン時間（ＡＰＴＴ）の延長）。

薬物動態
時間ゼロ並びにコエンザイムＱ１０を用いた１４４時間連続静脈内（ＩＶ）注入中及び注入後のいくつかの時点において、患者体内のコエンザイムＱ１０の薬物動態を測定した。群１（単独治療）に関して、コエンザイムＱ１０の平均濃度は、コエンザイムＱ１０の平均濃度が同様であった９６時間のサンプリング時間を除いて、用量３４２ｍｇ／ｋｇ／週の方が用量２７４ｍｇ／ｋｇ／週よりも高かった。群２（化学療法併用治療）に関して、血漿プロファイルは、注入の最初の７２時間、用量２７４ｍｇ／ｋｇ／週の方が用量２２０ｍｇ／ｋｇ／週よりもわずかに高く、注入の次の７２時間は、用量２７４ｍｇ／ｋｇ／週の方が明らかに高かった。図３９Ａ〜３９Ｃ及び表５を参照されたい。どの用量レベルでも群１と群２の間に薬物動態プロファイルの明らかな差はなかった。このことは、コエンザイムＱ１０の薬物動態に対して化学療法の併用は明らかな効果を持たないことを示している。

表４．コエンザイムＱ１０単独治療に対する用量制限毒性。括弧内に、それぞれの用量レベル（ＤＬ）に参加した患者の数が示されている。ＤＬ４及びＤＬ５は２回の連続７２時間ＩＶ注入で投与した。他の用量レベルは全て３回の連続４８時間ＩＶ注入によって投与した。

^＊プロトコル治療に対してunlikely related、疾患進行に対してlikely relatedに、毒性を判定しなおした。

下表は、ゲムシタビン、５−フルオロウラシル（５ＦＵ）又はドセタキセルを用いたコエンザイムＱ１０併用治療に対する用量制限毒性を示す。括弧内に、それぞれの用量レベル（ＤＬ）に参加した患者の数が示されている。ＤＬ４及びＤＬ５は２回の連続７２時間注入で投与した。他の用量レベルは全て３回の連続４８時間注入で投与した。５ＦＵ用量レベルは全て１００ｍｇ／ｍ^２のロイコボリンを含む。

下の表は、４％以上の頻度を有すると報告された有害事象を含む。

候補バイオマーカーの同定
データの分析を容易にするため、臨床データを「患者ダッシュボード」に表示した。自動的に生成されるダッシュボードは、試験に参加したそれぞれの患者の人口統計及び臨床的結果の包括的な視覚化を可能にした。患者ダッシュボードの例が図４０Ａ〜４０Ｄに示されている。例えば、図４０Ａは、患者０２−０１４の人口統計的情報及び試験結果の概要を示す。図４０Ｂは、参加時間に対する患者０２−０１４の腫瘍サイズの進行を示す。図４０Ｃは、患者０２−０１４の血中グルコース（ＧＬＵＣ）、ヘマトクリット（ＨＣＴ）、アスパラギン酸トランスアミナーゼ（ＡＳＴ）及びアラニントランスアミナーゼ（ＡＬＴ）比の検査室測定値を示す。図４０Ｄに示されているように、患者０２−０１４は、臨床試験に参加している間にグレード２の有害事象を経験した。図４０Ｅは、コエンザイムＱ１０を用いた治療の前後のＦＤＧ−ＰＥＴスキャンを示す。

患者から採取した血液（血漿及びバフィーコート）及び尿試料のプロテオミクス、メタボロミクス及びリピドミクス分析を実行して、治療の前後のタンパク質、代謝産物及び脂質レベルの変化を求め、総合的臨床的利益患者群と非臨床的利益患者群との差を同定した。特定技術のパイプラインを使用し、（１）異なる時点において収集されたデータを組み合わせ、（２）まれにしか測定されなかった変数を除外し、（３）バッチ間で試料が比較可能であることを保証するために系統的偏りを除去し、（４）特定の試料中で測定されなかった変数のレベルを推測することによって、これらの未処理の測定値を処理されたデータに変換した。品質管理（ＱＣ）ステップによってデータ処理の信頼性を保証した。このＱＣステップは、（１）未処理データファイルが期待されるフォーマットに従っているかどうかを試験するステップ、及び（２）オミクスデータ処理のそれぞれのステップを追跡する直観的な視覚化を実施するステップを含む。トレーサビリティを保証するため、品質管理からの全ての出力を中央ログファイルに書き込んだ。それぞれの試料が採取された患者及び時点を定義したマスタファイルによって、処理された分子的特徴を実施可能（actionable）にした。

次いで、処理されたデータを上述の臨床データと統合した。その結果得られるデータベースは、時間にわたって収集された試験に参加した全ての患者の人口統計、治療、疾患の状態、腫瘍サイズ測定、有害事象、検査室測定、臨床的結果、薬物動態データ、プロテオミクス、リピドミクス及びメタボロミクスを含む。この統合されたデータを使用して、患者ダッシュボード、数学的プロファイル及びＡＩ推測マップ（AI-inferred Map）を作成した。次いでこれらを調べて候補バイオマーカーを同定した。この分析プロセスの概要が、図４１及び以前に説明した図４に示されている。

例えば、３タイプの分析、具体的にはベイジアンネットワーク分析、統計分析及び機械学習を使用して、総合的臨床的利益患者を非臨床的利益患者から区別することができる、治療前に測定された分子的特徴を同定した。試験開始後の持続した時間の間に、何種類かのタンパク質、脂質及び代謝産物のレベルの患者群間の差を同定した。ＩｎｔｅｒｒｏｇａｔｉｖｅＢｉｏｌｏｇｙ（登録商標）プラットホームの統合されたオミクス及び人工知能（ＡＩ）プロファイリングから、反応及び安全性の分子シグナチャを導出した。機械学習を使用して、試料（患者）が総合的臨床的利益群に属するのか又は非臨床的利益群に属するのかを予測することができるマルチオミクス変数（multi-omic variable）を同定した。

都合のよい（favorable）臨床反応及び安全性と相関するバイオマーカー候補を同定した。例えば、図４２Ａは、最初のコエンザイムＱ１０治療前に測定された血液中の分子のうち、コエンザイムＱ１０治療の効能を潜在的に予測する可能性がある上位１０個の分子を示す。コエンザイムＱ１０のｐＫレベルは都合のよい反応の動因であった。これらの分子的相関物は腫瘍タイプ及び以前の治療から独立していた。このことはコエンザイムＱ１０の幅広い抗癌効果を示している。新規のマルチオミクスパネルは、治療前及び治療開始から２４時間後の反応をＡＵＣ＞０．８５で層別化することができた。

タンパク質ジスルフィドイソメラーゼＡ３（protein disulfide-isomerase A3：ＰＤＩＡ３）は、この分析で同定された１つの候補バイオマーカーである。図４２Ｂを参照されたい。ベイジアンネットワーク分析は、ＰＤＩＡ３のバイオネットワーク内で、総合的臨床的利益患者群と非臨床的利益患者群の間の明白な差を同定した。総合的臨床的利益患者と非臨床的利益患者の間の量的な差をコエンザイムＱ１０治療前に示したいくつかの追加の候補バイオマーカーも同定された。これらのマーカーを使用して、コエンザイムＱ１０治療に反応する可能性が高い固形腫瘍を有する対象を同定することができる。上で説明した分析を使用して、コエンザイムＱ１０治療によって潜在的に引き起こされる有害事象を予測する候補バイオマーカー、又はコエンザイムＱ１０の薬物動態（ＰＫ）を予測する候補バイオマーカーを同定することもできる。

候補バイオマーカーを同定するための分析
以下では、併合データのスライシングの説明及びスライスされたデータセットの分析を説明する。

併合された患者データを、複数のスライシングステップでスライスした。全ての患者のデータを含むスライスされたデータセットを生成した。臨床出力データを分析して、総合的臨床的利益患者及び非臨床的利益患者を同定した。併合データを、治療に反応して総合的臨床的利益を示すと同定された患者のデータを含むスライスされたデータセットと、治療に反応して臨床的利益を示さないと同定された患者のデータを含むスライスされたデータセットとにスライスした。

全ての患者のスライスされたデータセットから、ベイジアン因果関係ネットワークを生成した。図４３に概略的に示されているように、ベイジアン因果関係ネットワークのトポロジ分析を使用して、腫瘍サイズの潜在的な調節因子（regulator）を同定した。腫瘍サイズの潜在的な調節因子を編集してリストにした。

図４４に概略的に示されているように、時間ゼロ（治療前）に対応する分子的プロファイルデータを選択し、総合的臨床的利益患者及び非臨床的利益患者の時間ゼロにおけるスライスされたデータセットを準備した。

図４５に概略的に示されているように、時間ゼロのスライスされたデータセットを統計的に分析して、総合的臨床的利益患者と非臨床的利益患者の体内で異なって発現された分子的プロファイルの構成要素を同定した。

機械学習法を利用して、患者が総合的臨床的利益群に属するのか又は非臨床的利益群に属するのかを予測するためのマルチオミクス変数を、時間ゼロのスライスされたデータに基づいて同定した。機械学習法は潜在的な反応予測子のリストを与えた。

ＡＩに基づくベイジアンネットワーク分析による腫瘍サイズの調節因子、統計分析による時間ゼロの異なって発現された分子的プロファイル変数、及び機械学習法による潜在的反応予測子のリストを使用して、患者結果（ＣＤｘ）を予測するために治療前又は試験が始まった後の任意の時刻に測定することができるバイオマーカーを同定した。具体的には、腫瘍サイズの調節因子のリストと異なって発現された分子的プロファイル変数のリスト及び潜在的反応予測子のリストとの重なりに現れる変数を、患者結果を予測するためのコンパニオン診断として同定した。図４６は、総合的臨床的利益患者及び非臨床的利益患者内でのこれらのＣＤｘマーカーの発現を示すグラフである。

［実施例２］
固形腫瘍を有する患者の治療用のＣｏＱ１０のフェーズ１ａ／ｂ臨床試験における候補バイオマーカーの同定

実施例２は、固形腫瘍を有する患者の治療用のＣｏＱ１０のフェーズＩ臨床試験における候補バイオマーカーの分析であって、図４に関して上で説明したＣＴＡＷ４００を利用した分析を含む。実施例１は、同じ臨床試験内の同じ患者の一部から取得したデータの予備的分析に基づくものであった。しかしながら、実施例２は、より多くの患者に基づき、追加のデータを含み、追加の分析を組み込む。

試験設計
この試験は、Weill Cornell University Medical Center、Palo Alto Medical Foundation及びMD Anderson Cancer Centerにおいて、固形腫瘍を有する患者に対して３６か月間実施した。この試験は、標準３＋３用量漸増設計のフェーズ１ａ／ｂ臨床試験である。この試験の主たる目的は、単独治療及び化学療法との併用治療において１１４時間静脈内注入として投与したときのＣｏＱ１０の最大耐量を決定し、ＣｏＱ１０の安全性及び忍容性（ｔｏｌｅｒａｂｉｌｉｔｙ）を評価することである。２次的な目的は、ＣｏＱ１０の単独治療及び併用治療の血漿薬物動態を評価し、腎クリアランスを推定することである。

患者を、群１（単独治療、患者数４５）又は群２（ＣｏＱ１０と化学療法の併用治療、患者数１２０）に分けた。全ての患者が、２８日のそれぞれのサイクルの１、４、８、１１、１５、１８、２２及び２５日目にＣｏＱ１０の２回の連続７２時間注入を受けた。最初の注入時に最低８時間、患者をモニタリングした。２サイクル目の終わり及びその後は２サイクルごとにＣＴ又はＭＲＩスキャンを使用して腫瘍サイズを測定した。固形癌の治療効果判定のためのガイドライン（Response Evaluation Criteria in Solid Tumors：ＲＥＣＩＳＴ）によってＣｏＱ１０に対する反応を測定した。

いずれの群でも、容認できない毒性も又は容認できない疾患進行も経験しなかった患者については、最長１年間、２８日サイクルを追加して試験した。進行した群１の患者のうち選択された患者についてはＣｏＱ１０治療を続け、さらに化学療法も実施した。ＣｏＱ１０の用量レベルを評価し、この用量が安全であるとＣＲＣが判定した後、群２のコホート１は患者の増加を受け入れた。これらの患者には、ＣｏＱ１０と併用してゲムシタビン、５−ＦＵ又はドセタキセルを投与した。１サイクル目は、６週間、週２回、火曜日及び金曜日にＣｏＱ１０を投与し、月曜日に化学療法を用いた。続く２サイクル目〜１２サイクル目の期間は４週間とした。２サイクル目の後に反応を評価し、その後は２サイクルごとに反応を評価した。最初は群１にいた進行した患者は、適格であれば群２に移され、４週間の治療を受けた。併用治療で進行した患者は、化学療法の成分を切り換えるか、又はＣｏＱ１０の単独治療を受けた。単独治療との両方の最大耐量が確立された後、患者の拡張コホートを参加させた（単独治療では１２〜１５人、併用治療では治療法ごとに１０人）。

薬物動態学的／薬力学的（ＰＫ／ＰＤ）モデル化
単独治療及び併用治療のそれぞれのサイクル中に血液試料を採取した。１サイクル目に限り尿試料を収集した。ＣｏＱ１０を開始する前２週間以内にＰＥＴスキャンを実行し、ＣｏＱ１０治療を始めて２週間後にもＰＥＴスキャンを実行した。群１の患者については治療８週時に再びスキャンを実行し、群２の患者については治療１０週時にスキャンを実行した。ベースライン及び２週目の終わりに５回のコア生検を実行した。群２に移る患者も、ＣｏＱ１０を開始して２週間以内及び３週目にＰＥＴスキャン及び生検を受けた。

薬物、用量及び投与方法
ＣｏＱ１０ナノ懸濁液（nanosuspension）注入剤（４０ｍｇ／ｍｌ）を、１４４時間にわたって出発用量６６ｍｇ／ｋｇで静脈内投与した。患者はそれぞれ、２８日の各サイクル中に毎週２回の連続４８時間注入を受けた。用量は、最大耐量に到達するまで２５％漸増させることができた。安全なＣｏＱ１０用量に到達した後、群２は参加を認め、患者は、確認された用量のＣｏＱ１０治療及びゲムシタビン（６００ｍｇ／ｍ^２）、５−ＦＵ（３５０ｍｇ／ｍ^２）＋ロイコボリン（１００ｍｇ／ｍ^２）又はドセタキセル（２０ｍｇ／ｍ^２）を用いた週１度の化学療法を受けた。

試験データを用いたＣＴＡＷを使用した候補バイオマーカーの同定
ＣｏＱ１０固形腫瘍臨床試験に参加した患者の血漿、尿及び組織試料を、治療時間中のそれらの試料の生物学的特徴の高次元ビューを提供するために、マルチオミクスプロファイリングにかけた。図４に関して上で説明したＣＴＡＷ４００は、データ処理に始まり、候補診断バイオマーカーの同定で終わる全てのデータ分析ステップを、信頼性の高い自動化された手法で実行した。データ分析ワークフローを編成してパイプラインにすることによって、追加の対象が参加し、追加の臨床情報が使用可能になったときに、ユーザが、提供物（deliverables）を生成することが可能になった。

薬物動態データを分子的プロファイルデータの時点にマッチングさせるための薬物動態値の補間が必要なくなるように、患者ごとに、薬物動態値を取得するための試料は、分子的プロファイル値を取得するための試料と同じ時点で（例えば同じ日に）取得した。

本明細書に記載されているとおり、試験中に収集したデータをＣＴＡＷ４００に従って処理した。ＣＴＡＷ４００の１つのステップは、データをスライスし、ベイジアン学習を使用してネットワークを生成することである。主要な臨床変数の動因を、ＣＴＡＷによって生成されたＡＩネットワークから獲得した。この例示的な試験に基づいて、このワークフローは、下表９に示された患者結果変数（ＴＲＯＲＲＥＳ、ＴＲＰＣＴ及びＲＳＯＲＲＥＳ）の動因を含む１３７個のネットワークを生成した。ここでは、動因が、ボトム変数として子ノードに接続することに制約がある患者結果変数に対する親ノードの役目を果たすノードと定義される（図４７参照）。

下表８は、この試験中に収集されたデータから生成されたさまざまなデータスライス、及びそれらのデータスライスから生成されたネットワークの数を示す。ＲＳＯＲＲＥＳは、ＲＥＣＳＩＴ判定基準による腫瘍反応を指す。ＴＲＯＲＲＥＳは、特定の時刻に測定された患者腫瘍サイズの幾何平均である。ＴＲＰＣＴは、それぞれの患者の試験参加時の腫瘍サイズが１００％であるような相対的腫瘍サイズである。

例示的なデータスライスが下表８に示されている。

同様に、ＣＴＡＷによって生成されたＡＩネットワークから、ＣｏＱ１０の作用機序（ＭＯＡ）に対する洞察が見出された。これらの洞察は、ＡＩネットワーク中に、ＣｏＱ１０の血漿レベルと下流の分子的特徴との間の因果関係として現れた。ＭＯＡに対する洞察は、ＰＫ測定が使用可能であった１サイクル目に収集された患者データから獲得された（表１０）。９６時間スケジュールで注入された患者の１サイクル目のデータによって学習されたネットワークからのＭＯＡの例が図４８に示されている。

この例示的な試験から取得されたデータから生成された例示的なネットワークが図２２〜２７に示されている。主要な結果動因を示すサブネットワークが図２３、２４、３３及び３４に示されている。重度の有害事象を経験した患者のデータから生成されたネットワークと重度の有害事象を経験しなかった患者のデータから生成されたネットワークとの比較に基づく差次的ネットワーク（デルタ）が生成された。これが図３４に示されている。

図４に関して上で説明した回帰分析を使用して、反応性及び効能を予測するための統計的に有意な差次的に発現された変数を同定した。重度の有害事象を治療前に予測するための統計的に有意な差次的に発現された変数を、図３５に示されているように決定した。

ブートストラップリサンプリングに結合されたイラスティックネットペナルティを用いた回帰を利用する機械学習を使用して、ＡＩネットワーク分析によって同定された結果動因及び差次的に発現された変数を含む一群の可能なバイオマーカー、具体的には一群の候補ＣＤｘマーカーの中から、潜在的バイオマーカー、具体的にはＣＤｘマーカーを同定した。イラスティックネットパラメータ及び機械学習の結果が下表１１に示されている。表１１は、グレード３以上の有害事象を経験した患者とそれを経験しなかった患者との間で時間ゼロに測定された上位１０個のロバストな特徴を示す。ロバストネスは、存在するブートストラップリサンプルの百分率によって定義した。

反応性を予測した治療前に測定するＣＤｘマーカーのスケーリングされた発現値が図３１に示されている。

重度の有害事象を予測した治療前に測定するＣＤｘマーカーのスケーリングされた発現値が図３２に示されている。

総合的臨床的利益及び非臨床的利益に対する上位１０個のＣＤｘマーカーの発現レベルが図４６に示されている。

方法を実装するためのシステム

特定の実施形態は、論理回路又はいくつかのコンポーネント、モジュール、メカニズムを含むものとして記載している。モジュールは、ソフトウェアモジュール（例：機械可読媒体又は伝送信号に実装したコード）又はハードウェアモジュールを構成する。ハードウェアモジュールは、動作を実施することができる有体ユニットであり、何らかの態様で構成又は配置することができる。例示的な実施形態において、１以上のコンピュータシステム（例：スタンドアロン、クライアント又はサーバコンピュータシステム）又はコンピュータシステムの１以上のハードウェアモジュール（例：プロセッサ又はプロセッサグループ）は、ソフトウェア（例：アプリケーション又はその一部）によって、本明細書が記載する動作を実施するハードウェアモジュールとして構成することができる。

種々の実施形態において、ハードウェアモジュールは機械的又は電子的に実装することができる。例えばハードウェアモジュールは、特定の動作を実施するように永続的に構成された専用回路又は論理回路（例：特殊用途プロセッサ、例えばフィールドグラマブルゲートアレイ（ＦＰＧＡ）、特定用途集積回路（ＡＳＩＣ）、グラフィック処理装置（ＧＰＵ））を備えることができる。ハードウェアモジュールは、特定の動作を実施するようにソフトウェアによって一時的に構成されたプログラム可能論理回路又は回路（例：汎用プロセッサその他のプログラム可能プロセッサに包含されるもの）を備えることができる。専用永続構成回路において機械的に又は一時構成回路（例：ソフトウェアによって構成されるもの）においてハードウェアモジュールを実装する決定は、コストと時間によって決まることを理解されたい。

したがって、用語「ハードウェアモジュール」は、有体物を包含するものとして理解されたい。すなわち、本明細書が記載する態様で動作する及び／又は特定の動作を実施するように物理的に構築され、永続的に構成され（例えばハードワイアあれる）、又は一時的に構成された（例えばプログラムされた）物体であるものとして理解されたい。ハードウェアモジュールが一時的に構成された（例：プログラムされた）実施形態を考えると、各ハードウェアモジュールは任意の時点で構成又はインスタンス化する必要はない。例えばハードウェアモジュールがソフトウェアを用いて構成された汎用プロセッサを備える場合、汎用プロセッサは異なる時点において異なるハードウェアモジュールとして構成される。したがってソフトウェアは、ある時点において特定のハードウェアモジュールを構成し、別の時点において別のハードウェアモジュールを構成するようにプロセッサを設定しうる。

ハードウェアモジュールは、他のハードウェアモジュールと情報を送受信する。したがってハードウェアモジュールは、接続されているとみなすことができる。複数のハードウェアモジュールが同時に存在する場合、ハードウェアモジュールを接続する信号伝搬（例：適当な回路又はバスを介して）によって通信を実施できる。複数ハードウェアモジュールが異なる時点において構成され又はインスタンス化される実施形態において、そのハードウェアモジュール間の通信は例えば、複数ハードウェアモジュールがアクセスするメモリ構造において情報を格納取得することにより実施できる。例えばあるハードウェアモジュールがある動作を実施してその出力を接続されたメモリデバイスに書き込む。別のハードウェアモジュールは後にそのメモリデバイスにアクセスし、格納されている出力を取得及び処理する。ハードウェアモジュールは、入力デバイス又は出力デバイスと通信することができ、リソース上（例：情報のコレクション）で動作することもできる。

本明細書が記載する方法例の様々な動作は、関連する動作を実施するように一時的に構成された（例：ソフトウェアによって）又は永続的に構成された１以上のプロセッサによって、少なくとも部分的に実施することができる。一時的又は永続的構成のいずれであっても、そのプロセッサは１以上の動作又は機能を実施するよう動作するプロセッサ実装したモジュールを構成する。ここでいうモジュールは、いくつかの例の実施形態においては、プロセッサ実装したモジュールである。

同様に、本明細書が記載する方法は、少なくとも部分的にプロセッサ実装することができる。例えば方法の少なくとも一部の動作は、１以上のプロセッサ又はプロセッサ実装したモジュールによって実施できる。特定の動作の実施は、１以上のプロセッサ間で分散してもよく、単一マシン内にのみ配置する必要はなく、複数マシンに配置することができる。いくつかの例の実施形態において、プロセッサ（単数又は複数）は１つの位置に配置することができ（例：家庭環境、オフィス環境、サーバファーム）、他実施形態においてプロセッサは複数位置に分散することができる。

１以上のプロセッサは、「クラウドコンピューティング」環境で、又は「ソフトウェアアズアサービス（ＳａａＳ）」として、関連の動作の性能をサポートするように動作することができる。例えば少なくとも一部の動作をコンピュータグループ（プロセッサを含むマシンの例として）によって実施し、その動作をネットワーク経由で又は１以上の適当なインターフェース（例：ＡＰＩ）経由でアクセス可能にすることができる。

例示的な実施形態は、デジタル電子回路、コンピュータハードウェア、ファームウェア、ソフトウェア、これらの組み合わせに実装することができる。例示的な実施形態は、コンピュータプログラム製品を用いて実装することができる。例えば情報搬送体に実装したコンピュータプログラムである。情報搬送体は例えば、データ処理装置によって実行し又はその動作を制御する機械可読媒体である。データ処理装置は例えば、プログラム可能プロセッサ、コンピュータ、複数コンピュータである。

コンピュータプログラムは、任意のプログラミング言語で記述することができる。これはコンパイル又はインタープリタ言語を含む。コンピュータプログラムは、任意形態で配置することができる。例えばスタンドアロンプログラム、モジュール、サブルーチン、その他のコンピュータ環境において用いるのに適したユニットを含む。コンピュータプログラムを配信して１以上のコンピュータ上で実行することができる。あるいは、複数のコンピュータを１つのサイト上で実行してもよいし、通信ネットワークによって接続された複数サイトにまたがって実行してもよい。

例示的な実施形態において、コンピュータプログラムを実行する１以上のプログラム可能プロセッサによって動作を実施して、入力データを操作し出力を生成することにより、機能を実施することができる。実施形態の方法及び装置は、特定用途論理回路によって実施し、又は特定用途論理回路として実装することができる（例：ＦＰＧＡ又はＡＳＩＣ）。

コンピュータシステムは、クライアントとサーバを含む。クライアントとサーバは一般に、互いに離れており、通常は通信ネットワークを介してやり取りする。クライアントとサーバの関係は、各コンピュータ上で動作するコンピュータプログラムによって生じ、互いにクライアント−サーバ関係を有する。プログラム可能コンピュータシステムを配置する実施形態において、ハードウェアアーキテクチャとソフトウェアアーキテクチャともに考慮を要することを理解されたい。具体的には、ある機能を永続構成ハードウェア（例：ＡＳＩＣ）で実装するか、一時構成ハードウェア（例：ソフトウェアとプログラム可能プロセッサの組み合わせ）で実装するか、永続構成ハードウェアと一時構成ハードウェアの組み合わせで実装するかは、設計選択であることを理解されたい。以下は、設定されたハードウェア（例：マシン）とソフトウェアのアーキテクチャであり、様々な実施形態において用いることができる。

図４９は、コンピュータシステム９００の形態例のマシンのブロック図である。マシン（例：デバイス１１０、１１５、１２０、１２５；サーバ１３０、１３５；データベースサーバ１４０；データベース１３０）に本明細書の１以上の方法を実施させる命令を備える。別の実施形態において、マシンはスタンドアロンデバイスとして動作し、又は他のマシンと接続（例：ネットワーク）することができる。ネットワーク配置において、マシンはサーバとして動作し、又はサーバ−クライアントネットワーク環境におけるクライアントマシンとして動作し、又はピアトゥピア（又は分散）ネットワーク環境におけるピアマシンとして動作する。マシンは例えば、パーソナルコンピュータ（ＰＣ）、タブレットＰＣ、セットトップボックス（ＳＴＢ）、ＰＤＡ、携帯電話、ウェブアプライアンス、ネットワークルータ、スイッチ又はブリッジ、その他のマシン動作を指定する命令（シーケンシャルでもよいしそうでなくともよい）を実行できるマシンである。さらに、単一マシンのみを示しているが、用語「マシン」は、個別に又は連携して命令セット（又は複数のセット）を実行して本明細書が記載する１以上の方法を実施するマシンコレクションを含むものとして理解されたい。

例示的コンピュータシステム９００は、プロセッサ９０２（例：中央処理装置（ＣＰＵ）、マルチコアプロセッサ、及び／又はグラフィック処理装置（ＧＰＵ））、メインメモリ９０４、スタティックメモリ９０６を備える。これらはバス９０８を介して相互通信する。コンピュータシステム９００はさらに、ビデオディスプレイユニット９１０（例：液晶ディスプレイ（ＬＣＤ）、タッチスクリーン、ブラウン管（ＣＲＴ））を備える。コンピュータシステム９００は、英数字入力デバイス９１２（例：物理キーボード又は仮想キーボード）、ユーザインターフェース（ＵＩ）ナビゲーションデバイス９１４（例：マウス）、ディスクドライブユニット９１６、信号生成デバイス９１８（例：スピーカ）、ネットワークインターフェースデバイス９２０を備える。

ディスクドライブユニット９１６は、機械可読媒体９２２を備える。機械可読媒体９２２上には、本明細書が記載する方法又は機能の１以上を実装し又はこれを用いる１以上の命令セットとデータ構造（例：ソフトウェア）９２４が格納される。命令９２４は、コンピュータシステム９００が実行する間に、その全部又は一部をメインメモリ９０４、スタティックメモリ９０６、及び／又はプロセッサ９０２内に配置することができる。メインメモリ９０４とプロセッサ９０２は、機械可読媒体を構成する。

機械可読媒体９２２は、例示的な実施形態において単一媒体として示したが、用語「機械可読媒体」は、１以上の命令又はデータ構造を記憶する単一媒体又は複数媒体（例えば、集中型若しくは分散型データベース、及び／又は関連キャッシュ、及びサーバ）を含み得る。用語「機械可読媒体」はまた、マシンによって実行するための命令を記憶、コード化若しくは保持することができ、マシンに本発明の方法の１つ以上を実施させる、又はかかる命令により使用される若しくはかかる命令に関連するデータ構造を記憶、コード化若しくは保持することができる任意の有形媒体を含むものととらえられる。したがって、用語「機械可読媒体」は、固体メモリ、光媒体、磁気媒体を含むものと解釈されたい。ただしこれらに限るものではない。機械可読媒体の具体例として、不揮発性メモリが挙げられる。例えば以下を含む：半導体メモリデバイス（例：ＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄ−ＯｎｌｙＭｅｍｏｒｙ（ＥＰＲＯＭ）、ＥｌｅｃｔｒｉｃａｌｌｙＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄ−ＯｎｌｙＭｅｍｏｒｙ（ＥＥＰＲＯＭ））、フラッシュメモリデバイス；内部ハードディスクやリムーバブルディスクなどの磁気ディスク；磁気光学ディスク；ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭディスク。

通信ネットワーク９２６上で伝送媒体を用いて命令９２４をさらに送受信することができる。命令９２４は、ネットワークインターフェースデバイス９２０を用いて、任意の既存通信プロトコル（例：ＨＴＴＰ）により送信することができる。通信ネットワークの例として以下が挙げられる：ＬＡＮ、ＷＡＮ、インターネット、携帯電話ネットワーク、音声電話（ＰＯＴＳ）ネットワーク、無線データネットワーク（例：ＷｉＦｉ、ＷｉＭａｘネットワーク）。用語「伝送媒体」は、マシンが実行する命令を格納し、コード化し、搬送することができる任意の媒体を含むものとして理解されたい。さらに、デジタル又はアナログ通信信号その他のソフトウェア通信を可能にする媒体を含む。

具体的実施形態を参照して本発明を説明したが、本発明の趣旨と範囲から逸脱することなくこれら実施形態に対して様々な変形や変更が可能であることは明らかである。したがって本明細書と図面は、限定的意味ではなく説明のためのものであると理解されたい。

明確性のため、以上の説明は複数の機能ユニットとプロセッサを参照して実施形態を記載したことを理解されたい。ただし、本発明の機能を損なうことなく、機能を異なる機能ユニット、プロセッサ、又はドメイン間で分散できることは、明らかである。例えば別のプロセッサ又はコントローラが実施するように記載した機能は、同じプロセッサ又はコントローラが実施することもできる。したがって、特定の機能ユニットを参照することは、その機能を提供するのに適した手段を参照しているに過ぎず、厳密な論理的又は物理的構造や組織を示しているのではない。

具体的実施例を参照して実施形態を説明したが、本発明の趣旨と範囲から逸脱することなくこれら実施形態に対して様々な変形や変更をできることは、明らかである。したがって、本明細書と図面は説明目的のものであり、限定的に解するべきではない。添付する図面は、本発明を実施する実施形態を説明するためのものであり、限定のためのものではない。説明した実施形態は、当業者が本明細書の教示を実現できる程度に詳細に記載したものである。他の実施形態を用い又は派生して、本開示の範囲から逸脱することなく構造的又は論理的代替や変更をすることができる。したがって本明細書は、限定的に解するべきではなく、実施形態の範囲は特許請求範囲によってのみ定義され、これと等価な全ての範囲も含まれる。

本発明の実施形態を、個別に及び／又はまとめて説明した。これに際して用語“発明”を用いているが、これは便宜上のものであり、１以上のものが開示されていれば本願の範囲を自発的に単一の概念に制限する意図ではない。したがって、本明細書は具体的な実施形態を説明しているが、同じ目的を実現する構成はその具体的実施形態について置き換えできることを理解されたい。本開示は、様々な実施形態の全ての適用形態及び変形をカバーすることを意図している。上記実施形態の組み合わせ及び本明細書が具体的に記載していない他の実施形態は、本明細書を参照すれば当業者にとって明らかである。

本文書において、特許文書において一般的であるように、用語“ａ”を用いている。これは“少なくとも１つ”又は“１以上”と明示しなくとも、１以上を含むものである。本文書において、用語“又は”を用いている。これは、非排他的であることを意味しており、“Ａ又はＢ”は明示しない限り以下を含む：“ＡであるがＢでない”、“ＢであるがＡでない”、“Ａ及びＢ”。特許請求範囲において、用語“含む”や“において”を用いている。これは “備える”や“であって”と等価である。特許請求範囲において、用語“含む”や“備える”は、無制限のものである。すなわち、請求項においてその語句の後にリストされた要素を備えるシステム、デバイス、物品、プロセスは、その請求項の範囲に含まれる。さらに特許請求範囲において、用語“第１”、“第２”、“第３”などはラベルのためのみに用いており、数的要件を強調する意図するものではない。

要約を提供して、読者が本開示の内容を早く理解できるようにした。これは特許請求範囲の範囲や意味を限定するために用いるものではない。本明細書において、本開示を整理するため、様々な要素を１つの実施形態にグループ化している。この開示方法は、特許請求する実施形態が各請求項によって明示的に記載している以上の要素を必要とすることを表すものではない。特許請求範囲は、本発明が実施形態の全要素よりも少ない要素を備え得ることを反映したものである。したがって特許請求範囲は、個々の請求項が個別の実施形態上に立脚するものである。

Claims

複数の対象のうちのそれぞれの対象の分子的プロファイルデータを処理することであって、それぞれの対象の前記分子的プロファイルデータが、当該対象から取得した複数の試料の分析によって生成されたプロテオミクス、メタボロミクス、リピドミクス、ゲノミクス、トランスクリプトミクス、マイクロアレイ及び配列決定データのうちの１つ以上のデータを含み、それぞれの対象の前記複数の試料が、当該対象に作用剤を投与する前、投与している間及び／又は投与した後に取得した試料を含むものである；
前記複数の対象のうちのそれぞれの対象の臨床記録データを処理することであって、それぞれの対象の前記臨床記録データが、前記作用剤を投与する前、投与している間及び／又は投与した後に当該対象から取得した試料と、前記作用剤を投与する前、投与している間及び／又は投与した後に実施した当該対象の測定とのうちの一方又は両方に基づくデータを含み、前記臨床記録データが臨床的結果データを含むものである；
前記複数の対象の処理された前記分子的プロファイルデータと処理された前記臨床記録データとを統合し、併合データとしてデータベースに記憶すること；
前記臨床記録データに基づく１つ以上の判定基準を使用することにより前記併合データの２つ以上のサブセットを選択して、２つ以上の選択されたデータセットを生成すること；並びに
前記選択されたデータセットのうちの１つ以上のデータセットを分析して、前記作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定すること
を含む方法。
前記複数の対象に前記作用剤を投与することをさらに含む、請求項１に記載の方法。
対象ごとに、当該対象から取得した前記複数の試料を分析して前記分子的プロファイルデータを取得することをさらに含む、請求項１に記載の方法。
前記臨床記録データがさらに、薬物動態データ、病歴データ、臨床検査データ及びモバイルウェアラブルデバイスからのデータのうちの１つ以上のデータを含む、請求項１に記載の方法。
対象の前記臨床記録データがさらに、当該対象に関する人口統計的情報を含む、請求項１又は請求項４に記載の方法。
前記作用剤の投与に関係した前記臨床的結果の前記１つ以上の潜在的バイオマーカーを同定するために、選択された前記１つ以上のデータセットが、統計的方法、機械学習法及び人工知能法のうちの１つ以上の方法を使用して分析される、請求項１に記載の方法。
前記作用剤の投与に関係した前記臨床的結果の前記１つ以上の潜在的バイオマーカーを同定するために、選択された前記１つ以上のデータセットが、統計的方法、機械学習法及び人工知能法のうちの２つ以上の方法を使用して分析される、請求項１に記載の方法。
前記選択されたデータセットのうちの１つ以上のデータセットを分析して、前記作用剤の投与に関係した前記臨床的結果の前記１つ以上の潜在的バイオマーカーを同定することが、
前記選択されたデータセットのうちの１つ以上のデータセットに基づいて１つ以上の因果関係ネットワークを生成すること、及び
生成された前記１つ以上の因果関係ネットワークを分析して、１つ以上の結果動因に対応するノードを同定すること
を含む、請求項１に記載の方法。
前記生成された因果関係ネットワークを分析して、前記１つ以上の結果動因に対応するノードを同定することが、前記生成された因果関係ネットワークのうちの１つ以上の因果関係ネットワーク内の前記臨床的結果にｎ以下の接続度を有する関係によって接続されたノードに対応する変数を結果動因として同定することを含む、請求項８に記載の方法。
ｎが、１０又は９又は８又は７又は６又は５又は４又は３又は２又は１である、請求項９に記載の方法。
ｎが、３又は２又は１である、請求項９に記載の方法。
前記生成された因果関係ネットワークを分析して、前記１つ以上の結果動因に対応するノードを同定することが、前記生成された１つ以上の因果関係ネットワークのネットワークトポロジ特徴の分析を含む、請求項８に記載の方法。
生成された前記２つ以上の選択されたデータセットが、前記臨床的結果を示した対象にそれぞれが対応する第１の複数の選択されたデータセットと、前記第１の臨床的結果を示さなかった対象にそれぞれが対応する第２の複数の選択されたデータセットとを含み、
前記選択されたデータセットのうちの１つ以上のデータセットに基づいて前記１つ以上の因果関係ネットワークを生成することが、
前記臨床的結果を示した対象に対応する前記第１の複数の選択されたデータセットのうちの１つのデータセットにそれぞれ基づいて第１の複数の因果関係ネットワークを生成すること、及び
前記臨床的結果を示さなかった対象に対応する前記第２の複数の選択されたデータセットのうちの１つのデータセットにそれぞれ基づいて第２の複数の因果関係ネットワークを生成すること
を含み、
前記生成された因果関係ネットワークを分析して、１つ以上の結果動因に対応するノードを同定することが、
第１の複数の因果関係ネットワーク間の１つ以上の第１の共通性を同定すること、
前記第２の複数の因果関係ネットワーク間の１つ以上の第２の共通性を同定すること、及び
前記第１の共通性と前記第２の共通性を比較して、前記１つ以上の結果動因を同定すること
を含む、
請求項８に記載の方法。
生成された前記２つ以上の選択されたデータセットが、前記臨床的結果を示した一人以上の対象に対応するデータを含む第１の選択されたデータセットと、前記臨床的結果を示さなかった一人以上の対象に対応するデータを含む第２の選択されたデータセットとを含み、
前記選択されたデータセットのうちの少なくともいくつかのデータセットに基づいて前記１つ以上の因果関係ネットワークを生成することが、
前記臨床的結果を示した対象に対応する前記第１の選択されたデータセットに基づいて第１の因果関係ネットワークを生成すること、及び
前記臨床的結果を示さなかった対象に対応する前記第２の選択されたデータセットに基づいて第２の因果関係ネットワークを生成すること
を含み、
前記１つ以上の結果動因が、前記第１の因果関係ネットワークと前記第２の因果関係ネットワークとの比較に基づいて同定される、
請求項８に記載の方法。
前記第１の因果関係ネットワークと前記第２の因果関係ネットワークとの前記比較が、前記第１の因果関係ネットワーク及び前記第２の因果関係ネットワークから差次的因果関係を生成することを含み、前記１つ以上の結果動因が、生成された前記差次的因果関係ネットワークから同定される、請求項１４に記載の方法。
前記生成された因果関係ネットワークがベイジアン因果関係ネットワークである、請求項８〜１５のいずれか一項に記載の方法。
前記１つ以上の結果動因が、前記作用剤の投与に関係した前記臨床的結果の前記１つ以上の潜在的バイオマーカーである、請求項８〜１５のいずれか一項に記載の方法。
生成された前記２つ以上の選択されたデータセットが、前記臨床的結果を示した対象のデータを含む第１の選択されたデータセットと、前記臨床的結果を示さなかった対象のデータを含む第２のスライスされたデータとを含み、
前記選択されたデータセットのうちの１つ以上のデータセットを分析して、前記作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定することが、第１の選択されたデータセットと前記第２の選択されたデータセットの間の統計的に有意なレベルの差次的に発現された１つ以上の変数を同定することをさらに含む、
請求項８〜１５のいずれか一項に記載の方法。
前記第１の選択されたデータセットと前記第２の選択されたデータセットが、作用剤の投与の時刻から見て同じ時点又は同じ範囲の時点に対応する、請求項１８に記載の方法。
第１の選択されたデータセットと前記第２の選択されたデータセットの間の統計的に有意なレベルの差次的に発現された前記１つ以上の変数を同定することが、２標本ｔ検定又はｌｉｍｍａ法を利用する、請求項１８に記載の方法。
第１の選択されたデータセットと前記第２の選択されたデータセットの間の統計的に有意なレベルの差次的に発現された前記１つ以上の変数を同定することが、回帰分析を実行することを含む、請求項１８に記載の方法。
前記選択されたデータセットのうちの１つ以上のデータセットを分析して、前記作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定することが、
機械学習を利用して、同定された前記結果動因及び前記差次的に発現された１つ以上の変数を可能なバイオマーカーとして分析すること、並びに前記分析に基づいて、前記可能なバイオマーカーのサブセットを前記１つ以上の潜在的バイオマーカーとして選択することをさらに含み、前記機械学習が、他の可能なバイオマーカーに強く相関した可能なバイオマーカーにペナルティを課し、前記臨床的結果との相関レベルに基づいて可能なバイオマーカーに報酬を与え、それによって前記臨床的結果の１つ以上の潜在的バイオマーカーを同定する、
請求項１８に記載の方法。
前記可能なバイオマーカーを分析するために利用される前記機械学習が、イラスティックネットペナルティを用いたロジスティック回帰を適用する、請求項２２に記載の方法。
前記複数の対象の処理された前記分子的プロファイルデータと処理された前記臨床記録データとを統合し、併合データとして前記データベースに記憶することが、それぞれの試料に関連づけられた対象ＩＤ及び時刻を含むマスタファイルに前記併合データを記憶することを含む、請求項１に記載の方法。
分子的プロファイル試料に関連づけられた時刻に対応する時刻における少なくともいくつかの臨床記録データの補間された値を決定するために線形補間が使用される、請求項１に記載の方法。
前記生成されたベイジアン因果関係ネットワークのトポロジ特徴の分析によって、対象反応を決定するためのｉｎｓｉｌｉｃｏ計算診断患者マップを生成すること
をさらに含む、請求項８〜２５のいずれか一項に記載の方法。
請求項２６に記載の方法によって生成されたｉｎｓｉｌｉｃｏ計算診断患者マップを患者層別化に使用することを含む方法。
前記１つ以上の潜在的バイオマーカーが、作用剤の効能又は有害事象の潜在的バイオマーカーである、請求項１〜２７のいずれか一項に記載の方法。
疾患又は障害の治療における前記作用剤の効能の１つ以上の潜在的バイオマーカーを同定する方法である、請求項１〜２８のいずれか一項に記載の方法。
前記作用剤の投与に関係した有害事象の発生の１つ以上の潜在的バイオマーカーを同定する方法である、請求項１〜２９のいずれか一項に記載の方法。
患者層別化の方法であり、前記１つ以上の潜在的バイオマーカーを患者層別化に利用することをさらに含む、請求項１〜３０のいずれか一項に記載の方法。
前記１つ以上の潜在的バイオマーカーが、前記作用剤を使用して患者を治療するか否かを決定するための患者層別化に利用される、請求項１〜３１のいずれか一項に記載の方法。
患者層別化の方法であり、
前記複数の対象への作用剤の前記投与が前記作用剤の臨床試験中に実施され、
前記方法がさらに、前記作用剤の後続の臨床試験中又は前記作用剤の同じ臨床試験の後続の段階中に、同定された前記１つ以上の潜在的バイオマーカーを患者層別化に利用することを含む、
請求項１〜３２のいずれか一項に記載の方法。
前記１つ以上の潜在的バイオマーカーが、前記後続の臨床試験にどの患者を参加させるのかを決定するための患者層別化に使用される、請求項３３に記載の方法。
前記１つ以上の潜在的バイオマーカーが、前記後続の臨床試験において前記作用剤を受け入れる患者を決定するための患者層別化に使用される、請求項３３に記載の方法。
前記併合データの２つ以上のサブセットを選択するための前記１つ以上の判定基準が表現型分類を含む、請求項１〜３５のいずれか一項に記載の方法。
前記併合データの２つ以上のサブセットを選択するための前記１つ以上の判定基準が臨床的結果データを含む、請求項１〜３６のいずれか一項に記載の方法。
前記併合データの２つ以上のサブセットを選択するための前記１つ以上の判定基準が、前記作用剤の投与中に対象が有害事象を経験したのか又は投与後に経験したのかに関するデータを含む、請求項１〜３７のいずれか一項に記載の方法。
前記作用剤が、疾患又は障害の治療を意図したものであり、前記併合データの２つ以上のサブセットを選択するための前記１つ以上の判定基準が、前記治療に対する当該対象の反応性に関するデータを含む、請求項１〜３８のいずれか一項に記載の方法。
前記併合データの選択された前記２つ以上のサブセットが、それぞれの個々の対象の選択されたデータセットを含む、請求項１〜３９のいずれか一項に記載の方法。
前記２つ以上の選択されたデータセットが、前記複数の対象のうちの全ての対象からの前記併合データを含む選択されたデータセットを含む、請求項１〜４０のいずれか一項に記載の方法。
それぞれの対象の前記１つ以上の試料が、血液、組織及び尿試料のうちの１つ以上の試料を含む、請求項１〜４１のいずれか一項に記載の方法。
それぞれの対象の前記１つ以上の試料が、血液、血漿、組織及び尿試料のうちの２つ以上の試料を含む、請求項１〜４２のいずれか一項に記載の方法。
それぞれの対象の前記分子的プロファイルデータが、プロテオミクス、メタボロミクス、リピドミクス、ゲノミクス、トランスクリプトミクス、マイクロアレイ及び配列決定データのうちの２つ以上のデータを含む、請求項１〜４３のいずれか一項に記載の方法。
それぞれの対象の前記分子的プロファイルデータが、プロテオミクス、メタボロミクス、リピドミクス、ゲノミクス、トランスクリプトミクス、マイクロアレイ及び配列決定データのうちの３つ以上のデータを含む、請求項１〜４４のいずれか一項に記載の方法。
それぞれの対象の前記分子的プロファイルデータが、プロテオミクス、メタボロミクス及びリピドミクスデータを含む、請求項１〜４５のいずれか一項に記載の方法。
それぞれの対象の前記分子的プロファイルデータがさらに、ゲノミクス、トランスクリプトミクス、マイクロアレイ及び配列決定データのうちの１つ以上のデータを含む、請求項１〜４６のいずれか一項に記載の方法。
前記臨床的結果データが、疾患又は障害の状況又は状態に関するデータを含む、請求項１〜４７のいずれか一項に記載の方法。
前記作用剤が、疾患又は障害の治療用の作用剤であり、前記臨床的結果データが、前記作用剤を用いた治療に対して対象が反応性であったのか又は非反応性であったのかを示すデータを含む、請求項１〜４８のいずれか一項に記載の方法。
前記臨床的結果データが、有害事象が前記作用剤の投与中に起きたのか又は投与後に起きたのかに関するデータを含む、請求項１〜４９のいずれか一項に記載の方法。
重複した臨床記録データを照合し、相違点を解消することにより前記併合データを処理することをさらに含む、請求項１〜５０のいずれか一項に記載の方法。
前記併合データをフィルタにかけて、対応する臨床記録データを欠く分子的データを除外することをさらに含む、請求項１〜５１のいずれか一項に記載の方法。
それぞれの対象の分子的プロファイルデータを処理することが、
前記複数の対象に対する治療の過程中の異なる時点において収集された前記分子的プロファイルデータを併合すること、
前記分子的プロファイルデータをフィルタにかけて、まれにしか測定されなかった変数を除外すること、
前記分子的プロファイルデータを正規化すること、及び
前記複数の対象のうちの特定の対象に対して測定されなかった変数を代入すること
をさらに含む、請求項１〜５２のいずれか一項に記載の方法。
前記作用剤が癌の治療を意図したものである、請求項１〜５３のいずれか一項に記載の方法。
前記臨床的結果データが腫瘍サイズ測定を含む、請求項５４に記載の方法。
前記臨床的結果データが、腫瘍の機能画像化からのデータを含む、請求項５４に記載の方法。
前記選択されたデータセットのうちの１つ以上のデータセットを分析して、前記作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定することが、選択された前記１つ以上のデータセットのうちのそれぞれのデータセットについてベイジアン因果関係ネットワークを生成することを含み、
前記方法がさらに、対象の選択されたデータセットからの生成された前記ベイジアン因果関係ネットワークを、癌のｉｎｖｉｔｒｏモデルから取得されたデータに基づいて生成されたベイジアン因果関係ネットワークと比較することを含む、
請求項５４に記載の方法。
対象特異的プロファイルを生成することをさらに含み、前記対象特異的プロファイルが、
当該対象の人口統計的情報の図表現、及び
当該対象の結果情報の図表現
を含む、請求項１〜５７のいずれか一項に記載の方法。
当該対象の結果情報の前記図表現が、
当該対象の有害事象情報の図表現、及び
前記作用剤に対する反応性に関する情報の図表現
を含む、請求項５８に記載の方法。
前記複数の対象のうちの一部又は全部の対象が障害を有する、請求項１〜５９のいずれか一項に記載の方法。
前記障害が、癌、糖尿病及び心臓血管疾患からなる群から選択される、請求項６０に記載の方法。
前記障害が癌である、請求項６１に記載の方法。
前記癌が固形腫瘍を含む、請求項６２に記載の方法。
それぞれの対象について、前記臨床記録データが、分子的プロファイルデータ用の試料が取得された時点と同じ時点において取得された試料からの薬物動態データを含む、請求項１〜６３のいずれか一項に記載の方法。
対象ごとに、分子的プロファイルデータ用の前記複数の試料を複数の時点において取得すること、及び薬物動態データ用の試料を同じ複数の時点において取得することをさらに含む、請求項１〜６４のいずれか一項に記載の方法。
前記作用剤の投与に関係した前記臨床的結果の１つ以上のバイオマーカーを同定する方法であり、同定される前記１つ以上の潜在的バイオマーカーが、前記作用剤の投与に関係した前記臨床的結果の１つ以上のバイオマーカーである、請求項１〜６５のいずれか一項に記載の方法。
データベースと、
記憶装置と、
前記記憶装置と通信する処理装置と
を備え、前記処理装置が、
複数の対象のうちのそれぞれの対象の分子的プロファイルデータを処理するように構成されたオミクスモジュールであり、それぞれの対象の前記分子的プロファイルデータが、当該対象から取得した複数の試料の分析によって生成されたプロテオミクス、メタボロミクス、リピドミクス、ゲノミクス、トランスクリプトミクス、マイクロアレイ及び配列決定データのうちの１つ以上のデータを含み、それぞれの対象の前記複数の試料が、当該対象に作用剤を投与する前、投与している間及び／又は投与した後に取得した試料を含む、オミクスモジュールと、
前記複数の対象のうちのそれぞれの対象の臨床記録データを処理するように構成された臨床記録モジュールであり、それぞれの対象の前記臨床記録データが、前記作用剤を投与する前、投与している間及び／又は投与した後に当該対象から取得した試料と、前記作用剤を投与する前、投与している間及び／又は投与した後に実施した当該対象の測定とのうちの一方又は両方に基づくデータを含み、前記臨床記録データが臨床的結果データを含む、臨床記録モジュールと、
前記複数の対象の処理された前記分子的プロファイルデータと処理された前記臨床記録データとを統合し、併合データとして前記データベースに記憶するように構成された統合モジュールと、
前記臨床記録データに基づく１つ以上の判定基準を使用することにより前記併合データの２つ以上のサブセットを選択して、２つ以上の選択されたデータセットを生成するように構成されたスライシングモジュールと、
前記選択されたデータセットのうちの１つ以上のデータセットを分析して、前記作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定するように構成された分析モジュールと
を備える、システム。
前記処理装置が、対象ごとに、当該対象から取得した前記複数の試料を分析して前記分子的プロファイルデータを取得するように構成された、請求項６７に記載のシステム。
前記臨床記録データがさらに、薬物動態データ、病歴データ、臨床検査データ及びモバイルウェアラブルデバイスからのデータのうちの１つ以上のデータを含む、請求項６７に記載のシステム。
対象の前記臨床記録データがさらに、当該対象に関する人口統計的情報を含む、請求項６７から６９のいずれか一項に記載のシステム。
前記作用剤の投与に関係した前記臨床的結果の前記１つ以上の潜在的バイオマーカーを同定するために、選択された前記１つ以上のデータセットが、統計的方法、機械学習法及び人工知能法のうちの１つ以上の方法を使用して分析される、請求項６７に記載のシステム。
前記作用剤の投与に関係した前記臨床的結果の前記１つ以上の潜在的バイオマーカーを同定するために、選択された前記１つ以上のデータセットが、統計的方法、機械学習法及び人工知能法のうちの２つ以上の方法を使用して分析される、請求項７０に記載のシステム。
前記分析モジュールがさらに、
前記選択されたデータセットのうちの１つ以上のデータセットに基づいて１つ以上の因果関係ネットワークを生成し、
生成された前記１つ以上の因果関係ネットワークを分析して、１つ以上の結果動因に対応するノードを同定する
ように構成された、請求項６７に記載のシステム。
前記生成された因果関係ネットワークを分析して、前記１つ以上の結果動因に対応するノードを同定することが、前記生成された因果関係ネットワークのうちの１つ以上の因果関係ネットワーク内の前記臨床的結果にｎ以下の接続度を有する関係によって接続されたノードに対応する変数を結果動因として同定することを含む、請求項７３に記載のシステム。
ｎが、１０又は９又は８又は７又は６又は５又は４又は３又は２又は１である、請求項７４に記載のシステム。
ｎが２又は１である、請求項７５に記載のシステム。
前記生成された因果関係ネットワークを分析して、前記１つ以上の結果動因に対応するノードを同定することが、前記生成された１つ以上の因果関係ネットワークのネットワークトポロジ特徴の分析を含む、請求項７４に記載のシステム。
生成された前記２つ以上の選択されたデータセットが、前記臨床的結果を示した対象にそれぞれが対応する第１の複数の選択されたデータセットと、前記第１の臨床的結果を示さなかった対象にそれぞれが対応する第２の複数の選択されたデータセットとを含み、
前記選択されたデータセットのうちの１つ以上のデータセットに基づいて前記１つ以上の因果関係ネットワークを生成することが、
前記臨床的結果を示した対象に対応する前記第１の複数の選択されたデータセットのうちの１つのデータセットにそれぞれ基づいて第１の複数の因果関係ネットワークを生成すること、及び
前記臨床的結果を示さなかった対象に対応する前記第２の複数の選択されたデータセットのうちの１つのデータセットにそれぞれ基づいて第２の複数の因果関係ネットワークを生成すること
を含み、
前記生成された因果関係ネットワークを分析して、１つ以上の結果動因に対応するノードを同定することが、
第１の複数の因果関係ネットワーク間の１つ以上の第１の共通性を同定すること、
前記第２の複数の因果関係ネットワーク間の１つ以上の第２の共通性を同定すること、及び
前記第１の共通性と前記第２の共通性を比較して、前記１つ以上の結果動因を同定すること
を含む、
請求項７４に記載のシステム。
生成された前記２つ以上の選択されたデータセットが、前記臨床的結果を示した一人以上の対象に対応するデータを含む第１の選択されたデータセットと、前記臨床的結果を示さなかった一人以上の対象に対応するデータを含む第２の選択されたデータセットとを含み、
前記選択されたデータセットのうちの少なくともいくつかのデータセットに基づいて前記１つ以上の因果関係ネットワークを生成することが、
前記臨床的結果を示した対象に対応する前記第１の選択されたデータセットに基づいて第１の因果関係ネットワークを生成すること、及び
前記臨床的結果を示さなかった対象に対応する前記第２の選択されたデータセットに基づいて第２の因果関係ネットワークを生成すること
を含み、
前記１つ以上の結果動因が、前記第１の因果関係ネットワークと前記第２の因果関係ネットワークとの比較に基づいて同定される、
請求項７４に記載のシステム。
前記第１の因果関係ネットワークと前記第２の因果関係ネットワークとの前記比較が、前記第１の因果関係ネットワーク及び前記第２の因果関係ネットワークから差次的因果関係を生成することを含み、前記１つ以上の結果動因が、生成された前記差次的因果関係ネットワークから同定される、請求項７４に記載のシステム。
前記生成された因果関係ネットワークがベイジアン因果関係ネットワークである、請求項７４〜８０のいずれか一項に記載のシステム。
前記１つ以上の結果動因が、前記作用剤の投与に関係した前記臨床的結果の前記１つ以上の潜在的バイオマーカーである、請求項７４〜８０のいずれか一項に記載のシステム。
生成された前記２つ以上の選択されたデータセットが、前記臨床的結果を示した対象のデータを含む第１の選択されたデータセットと、前記臨床的結果を示さなかった対象のデータを含む第２の選択されたデータセットとを含み、前記スライシングモジュールがさらに、
第１の選択されたデータセットと前記第２の選択されたデータセットの間の統計的に有意なレベルの差次的に発現された１つ以上の変数を同定する
ように構成された、請求項７４〜８０のいずれか一項に記載のシステム。
前記第１の選択されたデータセットと前記第２の選択されたデータセットが、作用剤の投与の時刻から見て同じ時点又は同じ範囲の時点に対応する、請求項８３に記載のシステム。
第１の選択されたデータセットと前記第２の選択されたデータセットの間の統計的に有意なレベルの差次的に発現された前記１つ以上の変数を同定することが、２標本ｔ検定又はｌｉｍｍａ法を利用することを含む、請求項８３に記載のシステム。
第１の選択されたデータセットと前記第２の選択されたデータセットの間の統計的に有意なレベルの差次的に発現された前記１つ以上の変数を同定することが、回帰分析を実行することを含む、請求項８３に記載のシステム。
前記分析モジュールがさらに、
機械学習を利用して、同定された前記結果動因及び前記差次的に発現された１つ以上の変数を可能なバイオマーカーとして分析し、前記分析に基づいて、前記可能なバイオマーカーのサブセットを前記１つ以上の潜在的バイオマーカーとして選択する
ように構成されており、前記機械学習が、他の可能なバイオマーカーに強く相関した可能なバイオマーカーにペナルティを課し、前記臨床的結果との相関レベルに基づいて可能なバイオマーカーに報酬を与え、それによって前記臨床的結果の１つ以上の潜在的バイオマーカーを同定する、
請求項８３に記載のシステム。
前記可能なバイオマーカーを分析するために利用される前記機械学習が、イラスティックネットペナルティを用いたロジスティック回帰を適用する、請求項８７に記載のシステム。
前記統合モジュールが、前記複数の対象の処理された前記分子的プロファイルデータと処理された前記臨床記録データとを統合し、併合データとして前記データベースに記憶し、それぞれの試料に関連づけられた対象ＩＤ及び時刻を含むマスタファイルに前記併合データを記憶するように構成された、請求項６７に記載のシステム。
試料に関連づけられた時刻に対応する時刻における少なくともいくつかの臨床記録データの補間された値を決定するために線形補間が使用される、請求項６７に記載のシステム。
前記処理装置がさらに、
前記生成されたベイジアン因果関係ネットワークのトポロジ特徴の分析によって、対象反応を決定するためのｉｎｓｉｌｉｃｏ計算診断患者マップを生成する
ように構成された、請求項７３〜９０のいずれか一項に記載のシステム。
前記ｉｎｓｉｌｉｃｏ計算診断マップが、患者層別化において使用されるように構成された、請求項９１に記載のシステム。
前記１つ以上の潜在的バイオマーカーが、作用剤の効能又は有害事象の潜在的バイオマーカーである、請求項６７〜９２のいずれか一項に記載のシステム。
疾患又は障害の治療における前記作用剤の効能の１つ以上の潜在的バイオマーカーを同定するシステムである、請求項６７〜９３のいずれか一項に記載のシステム。
前記作用剤の投与に関係した有害事象の発生の１つ以上の潜在的バイオマーカーを同定するシステムである、請求項６７〜９４のいずれか一項に記載のシステム。
患者層別化のためのシステムであり、前記方法がさらに、前記１つ以上の潜在的バイオマーカーを患者層別化に利用することを含む、請求項６７〜９５のいずれか一項に記載のシステム。
前記１つ以上の潜在的バイオマーカーが、前記作用剤を使用して患者を治療するか否かを決定するための患者層別化に利用される、請求項６７〜９６のいずれか一項に記載のシステム。
患者層別化のためのシステムであり、
前記複数の対象への作用剤の前記投与が前記作用剤の臨床試験中に実施され、
前記処理装置がさらに、前記作用剤の後続の臨床試験中又は前記作用剤の同じ臨床試験の後続の段階中に、同定された前記１つ以上の潜在的バイオマーカーを患者層別化に利用するように構成された、
請求項６７〜９７のいずれか一項に記載のシステム。
前記１つ以上の潜在的バイオマーカーが、前記後続の臨床試験にどの患者を参加させるのかを決定するための患者層別化に使用される、請求項９８に記載のシステム。
前記１つ以上の潜在的バイオマーカーが、前記後続の臨床試験において前記作用剤を受け入れる患者を決定するための患者層別化に使用される、請求項９８に記載のシステム。
前記併合データの２つ以上のサブセットを選択するための前記１つ以上の判定基準が表現型分類を含む、請求項６７〜１００のいずれか一項に記載のシステム。
前記併合データの２つ以上のサブセットを選択するための前記１つ以上の判定基準が臨床的結果データを含む、請求項６７〜１０１のいずれか一項に記載のシステム。
前記併合データの２つ以上のサブセットを選択するための前記１つ以上の判定基準が、前記作用剤の投与中に対象が有害事象を経験したのか又は投与後に経験したのかに関するデータを含む、請求項６７〜１０２のいずれか一項に記載のシステム。
前記作用剤が、疾患又は障害の治療を意図したものであり、前記併合データの２つ以上のサブセットを選択するための前記１つ以上の判定基準が、前記治療に対する当該対象の反応性に関するデータを含む、請求項６７〜１０３のいずれか一項に記載のシステム。
前記２つ以上の選択されたデータセットが、それぞれの個々の対象の選択されたデータセットを含む、請求項６７〜１０４のいずれか一項に記載のシステム。
前記２つ以上の選択されたデータセットが、前記複数の対象のうちの全ての対象からの前記併合データを含む選択されたデータセットを含む、請求項６７〜１０５のいずれか一項に記載のシステム。
それぞれの対象の前記１つ以上の試料が、血液、組織及び尿試料のうちの１つ以上の試料を含む、請求項６７〜１０６のいずれか一項に記載のシステム。
それぞれの対象の前記１つ以上の試料が、血液、血漿、組織及び尿試料のうちの２つ以上の試料を含む、請求項６７〜１０７のいずれか一項に記載のシステム。
それぞれの対象の前記分子的プロファイルデータが、プロテオミクス、メタボロミクス、リピドミクス、ゲノミクス、トランスクリプトミクス、マイクロアレイ及び配列決定データのうちの２つ以上のデータを含む、請求項６７〜１０８のいずれか一項に記載のシステム。
それぞれの対象の前記分子的プロファイルデータが、プロテオミクス、メタボロミクス、リピドミクス、ゲノミクス、トランスクリプトミクス、マイクロアレイ及び配列決定データのうちの３つ以上のデータを含む、請求項６７〜１０９のいずれか一項に記載のシステム。
それぞれの対象の前記分子的プロファイルデータが、プロテオミクス、メタボロミクス及びリピドミクスデータを含む、請求項６７〜１１０のいずれか一項に記載のシステム。
それぞれの対象の前記分子的プロファイルデータがさらに、ゲノミクス、トランスクリプトミクス、マイクロアレイ及び配列決定データのうちの１つ以上のデータを含む、請求項６７〜１１１のいずれか一項に記載のシステム。
前記臨床的結果データが、疾患又は障害の状況又は状態に関するデータを含む、請求項６７〜１１２のいずれか一項に記載のシステム。
前記作用剤が、疾患又は障害の治療用の作用剤であり、前記臨床的結果データが、前記作用剤を用いた治療に対して対象が反応性であったのか又は非反応性であったのかを示すデータを含む、請求項６７〜１１３のいずれか一項に記載のシステム。
前記臨床的結果データが、有害事象が前記作用剤の投与中に起きたのか又は投与後に起きたのかに関するデータを含む、請求項６７〜１１４のいずれか一項に記載のシステム。
前記処理装置がさらに、
重複した臨床記録データを照合し、相違点を解消することにより前記併合データを処理する
ように構成された、請求項６７〜１１５のいずれか一項に記載のシステム。
前記処理装置がさらに、
前記併合データをフィルタにかけて、対応する臨床記録データを欠く分子的データを除外する
ように構成された、請求項６７〜１１６のいずれか一項に記載のシステム。
前記オミクスモジュールがさらに、
前記複数の対象に対する治療の過程中の異なる時点において収集された前記分子的プロファイルデータを併合し、
前記分子的プロファイルデータをフィルタにかけて、まれにしか測定されなかった変数を除外し、
前記分子的プロファイルデータを正規化し、
前記複数の対象のうちの特定の対象に対して測定されなかった変数を代入する
ように構成された、請求項６７〜１１７のいずれか一項に記載のシステム。
前記作用剤が癌の治療を意図したものである、請求項６７〜１１８のいずれか一項に記載のシステム。
前記臨床的結果データが腫瘍サイズ測定を含む、請求項１１９に記載のシステム。
前記臨床的結果データが、腫瘍の機能画像化からのデータを含む、請求項１１９に記載のシステム。
前記選択されたデータセットのうちの１つ以上のデータセットを分析して、前記作用剤の投与に関係した臨床的結果の１つ以上の潜在的バイオマーカーを同定することが、選択された前記１つ以上のデータセットのうちのそれぞれのデータセットについてベイジアン因果関係ネットワークを生成することを含み、
前記分析モジュールがさらに、対象の選択されたデータセットからの生成された前記ベイジアン因果関係ネットワークを、癌のｉｎｖｉｔｒｏモデルから取得されたデータに基づいて生成されたベイジアン因果関係ネットワークと比較するように構成された、
請求項１１９に記載のシステム。
前記処理装置がさらに、対象特異的プロファイルを生成するように構成されており、前記対象特異的プロファイルが、
当該対象の人口統計的情報の図表現、及び
当該対象の結果情報の図表現
を含む、請求項６７〜１２２のいずれか一項に記載のシステム。
当該対象の結果情報の前記図表現が、
当該対象の有害事象情報の図表現、及び
前記作用剤に対する反応性に関する情報の図表現
を含む、請求項１２３に記載のシステム。
前記複数の対象のうちの一部又は全部の対象が障害を有する、請求項６７〜１２４のいずれか一項に記載のシステム。
前記障害が、癌、糖尿病及び心臓血管疾患からなる群から選択される、請求項１２５に記載のシステム。
前記障害が癌である、請求項１２６に記載のシステム。
前記癌が固形腫瘍を含む、請求項１２７に記載のシステム。
実行されたときに請求項１〜６６のいずれか一項に記載の方法を処理装置に実施させる命令を記憶した非一時的コンピュータ可読媒体。