JP2019527894A

JP2019527894A - ダサチニブ反応予測モデルおよびその方法

Info

Publication number: JP2019527894A
Application number: JP2019505358A
Authority: JP
Inventors: ダブリュー．ゼトー，クリストファー; チャールズベンツ，ステファン; ジョセフヴァスケ，チャールズ
Original assignee: ナントミクス，エルエルシー
Priority date: 2016-08-03
Filing date: 2017-08-03
Publication date: 2019-10-03
Also published as: EP3494504A1; CA3032421A1; CN109952611A; KR20190038608A; EP3494504A4; AU2017305499A1; WO2018027076A1; US20180039732A1

Abstract

企図されるシステムおよび方法は、複数の別個の細胞タイプおよび薬物に関する反応予測因子のライブラリを確立するために、先験的な既知の細胞株ゲノミクスおよび薬物反応データを使用する。次に、選択された反応予測因子の統計学的分析を使用して、他の薬物と比較して予測力が顕著に向上している反応予測因子によって薬物を特定する。次に、このようにして特定された反応予測因子のエンティティ係数（ｅｎｔｉｔｙｃｏｅｆｆｉｃｉｅｎｔ）を実際の患者のオミクスシグネチュア（ｏｍｉｃｓｓｉｇｎａｔｕｒｅ）に基づいたパスウェイモデルの出力に適用する。【選択図】図２

Description

本願は、２０１６年８月３日提出の米国特許仮出願第６２／３７０，６５７号明細書に対する優先権を主張する。

本発明の分野は、（好ましくは高い精度向上）反応予測因子のエンティティ係数（ｅｎｔｉｔｙｃｏｅｆｆｉｃｉｅｎｔ）を用いてさらに処理されるパスウェイモデル情報に基づいて薬物に対する患者の薬物反応を予測するシステムおよび方法である。

パスウェイの計算論モデリングの様々なシステムおよび方法が当技術分野で公知である。例えば、いくつかのアルゴリズム（例えばＧＳＥＡ、ＳＰＩＡおよびＰａｔｈＯｌｏｇｉｓｔ）は、文献から精選されるパスウェイを使用して目的の変更されたパスウェイをうまく特定することが可能である。またさらなるツールは、文献中の精選された相互作用から因果グラフを構築し、これらのグラフを使用して発現プロファイルを説明している。ＡＲＡＣＮＥ、ＭＩＮＤｙおよびＣＯＮＥＸＩＣなどのアルゴリズムは、遺伝子転写情報（および、ＣＯＮＥＸＩＣの場合はコピー数）を取り込み、一組の癌試料において起こり得る転写ドライバーを特定する。しかし、これらのツールは、異なるドライバーを、目的の単数の標的を特定する機能的ネットワークに分類することを試みていない。ＮｅｔＢｏｘおよびＭｕｔｕａｌＥｘｃｌｕｓｉｖｉｔｙＭｏｄｕｌｅｓｉｎＣａｎｃｅｒ（ＭＥＭｏ）などの一部のより新しいパスウェイアルゴリズムは、癌におけるデータ統合問題の解決を試み、それによって、試料の発癌性に対する重要なカギとなる複数のデータタイプにわたるネットワークを特定する。

このようなツールは、ネットワークを発見するために複数のパスウェイにわたる少なくとも幾分かの限られた統合を可能にするが、これらは一般に、関連パスウェイまたはパスウェイのネットワークにおける制御情報およびこのような制御情報と１つ以上の生理学的効果との関連性を提供できない。性能を向上させるための試みにおいて、ＧＩＥＮＡは、単一の生物学パスウェイ内で無制御の遺伝子相互作用を探すが、パスウェイのトポロジーまたは相互作用の方向もしくは性質に関するこれまでの知識を考慮に入れていない。さらに、これらのモデリングシステムの比較的不完全な性質ゆえに、特に複数のパスウェイおよび／またはパスウェイ要素の相互作用を調べる場合、予測分析が不可能であることが多い。

つい最近、インビボパスウェイのイン・シリコパスウェイモデルを得るために、システムおよび方法の改善が記載され、代表的なシステムおよび方法が、国際公開第２０１１／１３９３４５号パンフレットおよび同第２０１３／０６２５０５号パンフレットに記載されている。このようなモデルのさらなる改良型が、異なるパスウェイ要素およびパスウェイ間の相互相関の特定に役立つ方法を開示する、国際公開第２０１４／０５９０３６号パンフレット（まとめて本明細書中で「ＰＡＲＡＤＩＧＭ」と呼ぶ）で提供された。このようなモデルは、例えば様々なシグナル伝達パスウェイの相互接続性および様々なパスウェイを通じたシグナルの流れに対して価値ある見識を提供する一方で、このようなモデリングを使用する多くの態様は真価を認められていないか、または認識さえされていない。

本明細書中の刊行物および特許出願は全て、各個々の刊行物または特許出願が具体的かつ個別に参照により組み込まれることを示す場合と同程度に参照により組み込まれる。組み込まれる参考文献中の用語の定義または使用が本明細書中で提供される用語の定義と一致しないかまたはそれに反する場合、本明細書中で提供されるその用語の定義が適用され、参考文献中のその用語の定義は適用されない。

国際公開第２０１４／１９３９８２号パンフレットに記載のようにＰＡＲＡＤＩＧＭからの見識を使用して、なおさらなる進展があった。ここで、複数の別個のデータセットを受け取り、疾患を有する細胞の処置パラメーター（例えば薬物による処置）の状況（例えば感受性または耐性）と関連がある別個のデータセット中の決定要因のパスウェイ要素を特定する、機械学習システムから、複数のモデルが得られている。このようなシステムは、潜在的治療モダリティへの見識を有利に提供する。しかし、機械学習システムから得られる潜在的に有効なモデルが非常に多数であるために、治療転帰の単純な予測は困難となる。

一方で、米国特許公開第２００４／０１９３０１９号明細書に記載のように、判別分析に基づくパターン認識を使用して、ある種の生物学的プロファイル情報を治療転帰情報と相関させたモデルが作成された。次に、予測モデルを使用して、処置に対して可能な反応を順位付けする。このような方法は、患者特異的プロファイル情報に基づいて起こり得る転帰を評価するのに役立ち得るが、分析は、一般的に、判別分析で使用されるパラメーターによりバイアスがかかる。さらに、このような分析は、対応する薬物および疾患状態の歴史的データのみを考慮に入れるため、他の無関係な疾患状態においてのみ有効であることが知られる薬物の発見は制限される。さらに、対応する薬物および疾患状態の歴史的データを入手できるか否かにより、このような方法の有効性がさらに制限される傾向がある。

結果的に、全てではないとしても殆どのイン・シリコ予測システムおよび方法が、選択されたパスウェイ活性の障害と治療選択肢との既知の相関に基づくか（例えば特定のキナーゼ活性の活性亢進および特定のキナーゼ阻害剤に対する起こり得る反応性の特定）、または非患者起源からの経験的インビトロデータの何れかに基づくことが理解されよう。なおさらに、パターンを特定するために機械学習を使用する場合、学習システムの固有のバイアスが、患者の特定の状況と必ずしも一致しない方式で出力を歪める傾向がある。

したがって、具体的な薬物反応の予測のための様々なシステムおよび方法が当技術分野で公知であるが、高い信頼性で薬物に対する単純かつロバストな治療予測を可能にするとともに患者特異的な治療反応の予測も可能にする、システムおよび方法が依然として必要とされている。

本発明の主題は、複数のエンティティ係数（ｅｎｔｉｔｙｃｏｅｆｆｉｃｉｅｎｔ）を有する多数の反応予測因子を確立するために複数の先験的な既知の細胞株ゲノミクスおよび薬物反応データを使用する様々な装置、システムおよび方法を対象とする。次いで、最高性能の反応予測因子（１つまたは複数）のエンティティ係数を使用して、パスウェイモデルの出力を変更し、治療転帰を予測する。有利なことに、このようなシステムおよび方法は、複数のパスウェイ要素および相互接続を統合可能であり、患者データに基づくことができ、単一の予め選択されたモデルの使用による分析バイアスを回避することができる。

本発明の主題の一態様において、本発明者らは、複数の反応予測因子を提供するステップを含む複数の反応予測因子を処理する方法であって、各反応予測因子が、薬物に関連し、複数のパスウェイ要素および関連するエンティティ係数を有する、方法を企図する。別のステップにおいて、対応するヌルモデルと比較した精度向上評価基準を各反応予測因子について計算して、単一の反応予測因子を選択し、選択した反応予測因子のパスウェイ要素および関連するエンティティ係数のサブセット、ならびに患者腫瘍のパスウェイモデル出力を少なくとも使用して、スコア（例えば薬物による治療に関する感受性スコア）を計算する。最も一般的には、ヌルモデルを作成する反応予測因子の計算で使用されない無作為選択データセットを使用して、対応するヌルモデルを計算する。

最も一般的には、複数の反応予測因子は、少なくとも１，０００または少なくとも１０，０００または少なくとも１００，０００個の反応予測因子である。エンティティ係数についてのパスウェイ要素は、制御ＲＮＡ、免疫シグナル伝達成分、細胞分化因子、細胞増殖因子、アポトーシスシグナル伝達成分、血管新生因子および／または細胞周期チェックポイント成分であることがさらに一般的に企図される。

精度向上評価基準に関して、精度向上は、精度値、精度向上、性能評価基準、曲線下面積評価基準、Ｒ^２値、ｐ−値評価基準、シルエット係数または混同行列を使用して決定され得ることが一般的に企図される。さらに、少なくとも２個または少なくとも４個または少なくとも６個または少なくとも１０個の異なる機械学習分類器を使用して複数の反応予測因子が確立され、適切な機械学習分類器には、線形カーネルサポートベクターマシン、一次または二次多項式カーネルサポートベクターマシン、リッジ回帰、エラスティックネットアルゴリズム、逐次最小問題最適化アルゴリズム、ランダムフォレストアルゴリズム、ナイーブベイズアルゴリズムおよびＮＭＦ予測因子アルゴリズムが包含されることが一般的に企図される。

パスウェイ要素および関連するエンティティ係数のサブセットは、典型的には、１〜５０個のエンティティ係数を含み、患者腫瘍のパスウェイモデル出力は、選択された反応予測因子におけるパスウェイ要素のサブセットと同じであるパスウェイ要素を含むことがさらに企図される。

したがって、および異なる見地から見て、発明者らはまた、薬物（例えば化学療法薬）を用いた患者の治療転帰の予測のために患者における腫瘍のパスウェイモデルの出力を使用する方法も企図する。最も一般的には、このような方法は、薬物を使用した患者に対する治療転帰スコアを予測するために、腫瘍のパスウェイモデルにおいて対応するパスウェイ要素の出力値に関して、因子として薬物に対する高い精度向上反応予測因子におけるパスウェイ要素の複数のエンティティ係数を使用するステップを含む。好ましくは、腫瘍のパスウェイモデルは、患者のオミクスデータを使用して計算され、複数のパスウェイ要素および関連する出力値を含み、高い精度向上反応予測因子は、対応するヌルモデルと比較して既定の最小の精度向上を有することがさらに好ましい。さらに、このような方法において、高い精度向上反応予測因子は複数の反応予測因子から選択されることが好ましく、各反応予測因子は薬物に関連する。

このような方法の典型的な態様において、複数のエンティティ係数は、高い精度向上反応予測因子の１〜５０個のエンティティ係数である、および／または複数のエンティティ係数は、エンティティ係数のサブセットであり、高い精度向上反応予測因子の全てのエンティティ係数の最上位三分位を含む。本発明の主題を制限することなく、一般的にはパスウェイモデルは確率的パスウェイモデル、特にＰＡＲＡＤＩＧＭ、であることが好ましい。

このような企図される方法での既定の最小の精度向上は、ヌルモデルに対して少なくとも５０％であり、ここでヌルモデルは、好ましくは、ヌルモデルを作成する高い精度向上反応予測因子の計算において使用されない無作為選択データセットを使用して計算される。さらに、複数の反応予測因子は比較的多数であってもよく、したがって少なくとも１，０００個または少なくとも１０，０００個または少なくとも１００，０００個の反応予測因子であってもよいことが企図され、これは、最も一般的には少なくとも２個の異なる機械学習分類器（例えば線形カーネルサポートベクターマシン、一次または二次多項式カーネルサポートベクターマシン、リッジ回帰、エラスティックネットアルゴリズム、逐次最小問題最適化アルゴリズム、ランダムフォレストアルゴリズム、ナイーブベイズアルゴリズム、ＮＭＦ予測因子アルゴリズムなど）を使用して確立される。

したがって、本発明の主題の例示的な一態様において、ダサチニブによる患者の腫瘍の処置に対する治療転帰を予測する方法が企図される。このような方法は、好ましくは、（ａ）患者の腫瘍のオミクスデータを得るステップと、（ｂ）パスウェイモデルおよびオミクスデータを使用するパスウェイ分析エンジンにより、腫瘍に対するパスウェイモデル出力を計算するステップであって、パスウェイ出力が複数のパスウェイ要素および関連する活性値を含む、ステップと、（ｃ）パスウェイモデル出力の対応するパスウェイ要素の活性値に、因子として個々のパスウェイエンティティの複数のエンティティ係数を適用して、それにより患者に対する治療転帰を予測するステップと、を含む。このような方法のパスウェイエンティティおよび個々のエンティティ係数は、好ましくは、ＭＩＲ３４Ａ＿（ｍｉＲＮＡ）：−０．１０５４５８９５；ＥＴＳ１：−０．０９４２６４８１７；５＿８＿Ｓ＿ｒＲＮＡ＿（ｒｎａ）：０．０８６０４４９５８；ＣＥＢＰＢ＿（ｄｉｍｅｒ）＿（ｃｏｍｐｌｅｘ）：０．０６７６９１４０７；ＦＯＳＬ１：−０．０６７２６３５６１；ＣＥＢＰＢ：０．０６６６９８５６９；ＪＵＮ／ＦＯＳ＿（ｃｏｍｐｌｅｘ）：−０．０６４５４９８８１；Ｆｒａ１／ＪＵＮ＿（ｃｏｍｐｌｅｘ）：−０．０６０４０３２９３；ＦＯＸＡ２：０．０５９７５５３１９；ＦＯＳ：−０．０５９５６０８３３；Ｅ２Ｆ１：−０．０５０９９２２７３；ＡＰ１＿（ｃｏｍｐｌｅｘ）：−０．０４９８２３４９２；ａｎｏｉｋｉｓ＿（ａｂｓｔｒａｃｔ）：−０．０４８５３３９９；ＦＯＸＡ１：０．０３５９９４３６７；ｄＮｐ６３ａ＿（ｔｅｔｒａｍｅｒ）＿（ｃｏｍｐｌｅｘ）：−０．０３３４７８５２１；ＴＰ６３：−０．０２９５６１３４；ＭＹＣ：０．０２６８４７４７９；ＴＰ６３−２：−０．０２６４２３５４２；Ｅ２Ｆ−１／ＤＰ−１＿（ｃｏｍｐｌｅｘ）：−０．０２３４６２０８１；ＭＹＢ：０．０２２２１１９３８；ＴＡｐ６３ｇ＿（ｔｅｔｒａｍｅｒ）＿（ｃｏｍｐｌｅｘ）：０．０１９７８９９２９；ＨＩＦ１Ａ／ＡＲＮＴ＿（ｃｏｍｐｌｅｘ）：０．０１９２２２２６７；ＪＵＮ／ＪＵＮ−ＦＯＳ＿（ｃｏｍｐｌｅｘ）：−０．０１９１８４４２４；ＭＹＣ／Ｍａｘ＿（ｃｏｍｐｌｅｘ）：−０．０１８５５３２７６；ＸＢＰ１−２：−０．０１７００９９１５；ｎｅｇａｔｉｖｅ＿ｒｅｇｕｌａｔｉｏｎ＿ｏｆ＿ＤＮＡ＿ｂｉｎｄｉｎｇ＿（ａｂｓｔｒａｃｔ）：−０．０１６２２４１３９；ＰＰＡＲＧＣ１Ａ：−０．０１５５２５３６１；ｐ５３＿ｔｅｔｒａｍｅｒ＿（ｃｏｍｐｌｅｘ）：−０．０１３８８１３５３；ＴＰ６３−５：０．０１１８６０９３６；ｐ５３＿（ｔｅｔｒａｍｅｒ）＿（ｃｏｍｐｌｅｘ）：−０．０１１１２０５６４；ＦＯＸＭ１：０．０１０５１５２８９；ＭＩＲ１４６Ａ＿（ｍｉＲＮＡ）−０．００４５８８２０３；ＭＩＲ２００Ａ＿（ｍｉＲＮＡ）：０．００４５７０８４２；ＭＩＲ２２＿（ｍｉＲＮＡ）：−０．００４５５２９６；ＭＩＲＬＥＴ７Ｇ＿（ｍｉＲＮＡ）：−０．００４５３４４１４；ＭＩＲ２６Ａ１＿（ｍｉＲＮＡ）：−０．００４５１５０５７；ＭＩＲ１４１＿（ｍｉＲＮＡ）：０．００４４９４８０６；ＭＩＲ３３８＿（ｍｉＲＮＡ）：０．００４４７３７７６；ＭＩＲ２３Ｂ＿（ｍｉＲＮＡ）：−０．００４４５２５０２：ＭＩＲ９−３＿（ｍｉＲＮＡ）：０．００４４３２１７４；ＭＩＲ２６Ｂ＿（ｍｉＲＮＡ）：−０．００４４１４６２７；ＭＩＲ４２９＿（ｍｉＲＮＡ）：０．００４４０１７０１；ＭＩＲ２６Ａ２＿（ｍｉＲＮＡ）：−０．００４３９３５２５；ＭＩＲ１７＿（ｍｉＲＮＡ）：０．００４３８５９４７；ＤＬＥＵ２＿（ｒｎａ）：−０．００４３７６１４１；ＤＬＥＵ１＿（ｒｎａ）：−０．００４３３７６５７；ＴＰ５３：−０．００３３０２８７９；ＪＵＮ：０．００３１８９０８５；ＮＯＴＣＨ４＿（ｒｎａ）：０．００２２１８０６６；およびＥ２Ｆ１／ＤＰ＿（ｃｏｍｐｌｅｘ）：０．０００３７６６５３からなる群から選択される。

さらに別の企図される態様において、発明者らはまた、パスウェイモデルの出力を変更して患者の治療転帰を予測するための、高い精度向上反応予測因子の複数のエンティティ係数の使用も企図し、ここで、この高い精度向上反応予測因子は薬物に関連し、パスウェイモデルは患者のオミクスデータを使用する。

最も一般的には、複数のエンティティ係数は、高い精度向上反応予測因子の１〜５０個のエンティティ係数であり、複数のエンティティ係数はエンティティ係数のサブセットであり、高い精度向上反応予測因子の全エンティティ係数の最上位三分位を含む。前述のように、パスウェイモデルが確率的パスウェイモデル（例えばＰＡＲＡＤＩＧＭ）であることおよび薬物が化学療法薬であることが一般的に好ましい。

同じ数字が同じ構成要素を表す添付の図面と共に以下の好ましい実施形態の詳細な説明から、本発明の主題の様々な目的、特性、態様および長所がより明らかになろう。

図１Ａ〜図１Ｃは、本明細書中で企図される反応予測因子の代表的な態様を概略的に示す。図２は、本発明の主題によるプロセスを代表例として概略的に示す。図３は、計算した治療反応／試験モデルの順位化リストを代表例として示し、ヌルモデルに対して精度向上がより高い反応／モデルが、精度向上が低いものの左に置かれている。一番左端の計算した治療反応／試験モデルは、最高の精度向上で、ダサチニブに対する患者の感受性を予測した。図４は、異なるパスウェイモデルおよびオミクス入力を用いた異なる計算に対する精度向上の代表的な結果を予測する。図５は、ヒトＴＣＧＡ腫瘍組織タイプにより選別したダサチニブ感受性の典型例を示す。図６は、具体的なヒトＴＣＧＡ腫瘍により選別したダサチニブ感受性の典型例を示す。

発明者らは、パスウェイモデル分析からの大量の反応予測因子の作成が高精度モデルの特定において有用なだけでなく、患者の具体的なオミクスデータに基づく患者の治療転帰の予測に有用なエンティティ係数（ｅｎｔｉｔｙｃｏｅｆｆｉｃｉｅｎｔ）を得るためにも使用できることを発見した。異なる見地から見ると、複数の実験、精選および／または実際の治療データ（例えば様々な薬物および薬物治療および疾患に対する既知の転帰および既知のオミクスデータを伴う状態に対するもの）に関するパスウェイ分析における機械学習は、反応予測モデルを提供し、これが次に具体的な薬物による具体的な治療転帰に関連するエンティティ係数を提供することが理解されよう。次に、実際の患者オミクスデータに基づくパスウェイモデル出力に関して、因子としてこれらのエンティティ係数を使用して、患者がその薬物によって治療される場合の起こり得る治療転帰を予測することができる。

一例において、以下でより詳細にさらに記載するように、本発明者らは、最初に、比較的多数のゲノムワイドアッセイ（一般的にはＲＮＡ発現レベル、ＤＮＡ配列情報およびコピー数情報を含む）、複数の組織タイプ由来の全部で約１，０００種類の細胞株を得た。次に、ＰＡＲＡＤＩＧＭソフトウェアを使用して発現およびコピー数データに基づいて推定パスウェイ活性（ＩＰＡ）を生成させた。なおさらなる段階において、本発明者らは、これらの細胞株におけるおよそ１４０種類の化合物の薬物反応データ（ＧＩ_５０）も得て、Ｔｏｐｍｏｄｅｌソフトウェアにおいて各化合物に対して複数の交差検証反応予測因子を作成した。とりわけ、試験した細胞株に対して、ダサチニブは、複数のモデルにおいて交差検証された精度を観察することによって最も正確に予測された薬物反応であったことが発見され、次いで上位のダサチニブ反応予測モデルをさらに分析した。ある分析において、下記でまたより詳細に示されるように、上位のダサチニブ反応予測モデルは、神経系細胞タイプにおいて予測有用性を有することが証明され、これを同様に、原発癌患者データ（ＴＣＧＡ）に対して上位の反応予測モデルを試験した場合の知見によっても検証した。とりわけ、ダサチニブは、急性リンパ芽球性白血病の処置に対する承認薬である。したがって、企図されるシステムおよび方法によって、ある薬物の使用が知られていないかまたは承認されていない状態におけるその薬物による治療の治療転帰の予測が可能となることが理解されよう。さらに、次にそのように特定された反応予測モデルのエンティティ係数を使用して、患者の実際のオミクスデータを使用した患者の治療転帰を予測することができることに留意されたい。

この文脈において、圧倒的な量の機械学習を行った予測モデルを準備することができ、これにより、様々なオミクスデータセットおよび／またはオミクスデータセットから準備されるパスウェイモデルに基づいた予測（例えば感受性）スコアの計算が可能になり得ることが理解されよう。残念ながら、例えば機械学習およびパスウェイ構築における基礎となる数学的な仮定、オミクスデータを得るための具体的な細胞培養または生検試料の使用、細胞培養または生検試料とともに使用される薬物などのために、これらのモデルは全て様々な固有のバイアスを有する。にもかかわらず、これらのモデルは全て、実際の細胞生物学的工程に基づき、したがって、少なくとも潜在的に価値がある見識を提供する。しかし、多様なモデルのいずれも、特定の薬物が患者において所望の治療転帰を有する可能性があるか否かを予測する特定の患者オミクス試料またはパスウェイモデルに対するマッチをどのモデルが提供するかについていかなる指針も提供しない。

発明者らは、今回、対応するヌルモデルに対して望ましく高い精度向上を有する薬物特異的な反応予測因子と、実際の患者データおよび特に患者データからのパスウェイモデルをマッチングするためのシステムおよび方法を発見しており、これにより、具体的な薬物を使用したその患者の起こり得る治療転帰の計算が可能となる。その文脈において、図１Ａで単純化されるように、代表的な反応予測因子（予測モデル）は、感受性または予測スコアを与える機械学習アルゴリズムから得られる多変量式とみなされ得る。より詳しくは、および図１Ｂでさらに例示されるように、薬物に曝露された細胞培養物または組織から生成されるオミクスデータおよび／またはパスウェイモデルを使用する機械学習アルゴリズムを用いて反応予測因子を生成する。図１Ｂで示されるように、細胞または組織を薬物に曝露し、最も一般的には陰性対照またはそうでなければ対比的な対照との比較において（例えば薬物なし、または異なる細胞を用いて）感受性を観察する（例えばＩＣ_５０、ＥＣ_５０などとして定量、または感受性もしくは耐性として定性的に評価）。次いで、細胞／組織からのオミクスデータおよび／またはパスウェイモデルを、トレーニングデータとして観察される因子と共に、機械学習アルゴリズムにおいて使用して、反応予測因子を得る。当然ではあるが、同じオミクスデータおよび／またはパスウェイモデルおよび観察される因子を、複数の機械学習アルゴリズムにおけるトレーニングデータとして使用することができることが理解され、全ての既知の機械学習アルゴリズムが本明細書中での使用に適切とみなされることが理解されよう。結果的に、１組のインビトロ実験で、複数のトレーニング済みモデル（すなわち、個々の機械学習アルゴリズムにより生成された反応予測因子）を提供できることが理解されよう。当技術分野でまた周知であるように、トレーニング済みモデルを得るために、入手可能なデータをトレーニングセットおよび評価セットに分割してもよく、または完全なトレーニング済みモデルを得るために全てのデータを使用することができる。異なる見地から見て、および図１Ｃで図示されるように、薬物に対する細胞または組織の感受性が既知である、薬物が既知である、ならびにオミクスデータおよび／またはパスウェイモデルが細胞または組織から容易に得られるトレーニングデータを使用して、機械学習アルゴリズムを用いて反応予測因子を生成することができる。次に、トレーニングデータと同じデータセット由来であり、前と同じように、薬物に対する細胞または組織の感受性が既知であり、薬物が既知であり、オミクスデータおよび／またはパスウェイモデルが細胞または組織から容易に得られる評価データを使用して、このように作成されたトレーニング済みモデルを検証することができる。したがって、多くのインビトロ試験が、患者のオミクスデータまたはパスウェイモデルを用いた計算に対して使用され得る多種多様の反応予測因子の基礎を形成することが理解されよう。次に、反応予測因子と併せて患者オミクスデータまたはパスウェイモデルを使用することにより、薬物に関して予測される反応スコア（予測される治療転帰または予測される感受性）を提供する。

最も有利には、企図するシステムおよび方法は、薬物および細胞または組織型と関連するオミクス情報数の増加をうまく利用することが認識されよう。さらに、本明細書中で与えられる例は複数の別個の薬物および細胞株に基づいたが、細胞のオミクスデータ、精選されたデータおよび単一の薬物にのみ関連する治療データ（一般的には別個の反応プロファイルを有する複数の別個の疾患（例えば癌）を有する細胞株と共に）から反応予測因子を生成できることが理解されよう。調べられる特定の薬物（１つまたは複数）にかかわらず、このような情報を使用して、膨大な数の個々の反応予測因子を準備することができ、したがって、反応予測因子のコレクションを具体的な癌のタイプおよび／または治療薬に限定する必要がないことが認識されよう。例えば、以下でさらに詳細に説明するように、発明者らは、パスウェイモデルオミクスデータとして、公開されているソース（例えばＣＣＬＥ発現、ＣＣＬＥコピー数、サンガー発現、サンガーコピー数）から異なるオミクスデータセットを得て、また、因子グラフに基づくパスウェイモデル（ここではＰＡＲＡＤＩＧＭ）において同じオミクスデータを使用して、１３９個の異なる薬物について報告する１０個の異なる入力データコレクションという結果に行き着いた。次に、これらのパスウェイモデルおよび既知の薬物反応を１３種類の異なる機械学習アルゴリズム（線形カーネルＳＶＭ、一次多項式カーネルＳＶＭ、二次多項式カーネルＳＶＭ、リッジ回帰、Ｌａｓｓｏ、エラスティックネット、逐次最小問題最適化法、ランダムフォレスト、Ｊ４８決定木、ナイーブベイズ、ＪＲｉｐルール、ＨｙｐｅｒＰｉｐｅｓおよびＮＭＦ予測因子）に供して、その結果、全部で１７６，１１２個の反応予測因子を得た。

この文脈において、各タイプの反応予測因子が、固有のバイアスまたは仮定を含み、同一であるデータに対してトレーニングを行った場合でも、得られる反応予測因子が他のタイプの反応予測因子と比較してどのように動作するかについてそれらが影響を与え得ることに留意しなければならない。したがって、同じトレーニングデータセットを使用しても、異なる反応予測因子は異なる予測／精度向上を生じる。これまで、予測転帰を改善しようとする試みにおいて、１つの機械学習アルゴリズムを最適化して、同じデータセットに対する正確な予測を向上させた。しかし、アルゴリズムの固有のバイアスにより、このような最適化は、予測の精度（すなわち、「コイン投げ」に対する正確な予測能）を必ずしもを向上させない。このようなバイアスは、関連するメタデータを伴う疾患特異的なデータセットに関して異なる基本原理および分類器によって多種多様な反応予測因子をトレーニングすることにより、および対応するヌルモデルに対して所望の予測力を有するものをそのようにトレーニングされた反応予測因子から選択することにより、克服することができる。

当然ではあるが、上記のものは、比較的限定されたデータセットを用いた単なる代表的な筋書きであり、それらの個々の薬物とそれぞれ組み合わせて、多数のさらなるデータ（例えばインビトロデータ、臨床試験データ、研究データ、治療データなど）を使用することができ、異なる機械学習アルゴリズムによってそれぞれ計算して、膨大な数（例えば１００，０００〜５００，０００または５００，０００〜１，０００，０００または１，０００，０００〜５，０００，０００または５，０００，０００〜１０，０００，０００およびさらに多い）の個々の反応予測因子に達することが理解されよう。このような計算は、コンピューティングインフラストラクチャーがなければ、ヒトの寿命の何倍も軽く超えることは明白である。

これもまた容易に認識されるはずであるが、コンピューティングインフラストラクチャーを使用しても、このような大量データは、患者の実際のデータセット（オミクスデータまたはパスウェイモデル）を細胞または組織培養のデータセットと連携させるべきである場合、膨大な計算量を必要とする。本発明者らは、今回、模擬ヌルセットおよび実際の患者データセット（オミクスデータまたはパスウェイモデル）を使用して１つの反応予測因子に対して２個の予測される反応を計算することによって、巨大な反応予測因子群でさえも、効果的に、および迅速に概念的に単純に分析できることを発見した。次に、予測反応間の差を使用して、何らかの１つの反応予測因子の性能を評価する。そのようにすれば、比較的単純な計算のみが必要とされ、反応予測因子は比較的単純であるため、比較的短時間で行うことができる。

結果的に、本明細書中で与えられる本発明の主題により、計算装置（１つまたは複数）の構築または構成がヒトの能力を超えた膨大な数のデジタルデータに対して動作することができることに留意すべきである。デジタルデータはオミクスデータおよび治療転帰の機械トレーニング済みのコンピューターモデルを表し得るが、デジタルデータは、実際の項目ではないこのような現実世界の項目の１つ以上のデジタルモデルの代表であることが理解されよう。むしろ、本明細書中で開示されるように、計算装置の記憶におけるこのようなデジタルモデルの具体化を通じて装置を正しく設定またはプログラミングすることによって、計算装置は、人間の能力を超える方式でデジタルデータまたはモデルを管理可能である。さらに、計算装置は、このような設定なしでは先験的能力を欠く。さらに、本発明の主題が、複雑なオミクス計算のコンピュータ分析に固有の問題を顕著に改善／軽減し、正確なモデル選択に関する指針を提供し、先験的な選択される機械学習アルゴリズムによるバイアスを排除することが理解されよう。

異なる見地から見て、コンピュータ技術における本発明のシステムおよび方法を使用して、オミクスデータに対する計算モデルにおける固有の問題が解決されることが理解されよう。したがって、コンピュータなしでは、問題、したがって本発明の主題は存在しない。より具体的には、本明細書中で提供されるシステムおよび方法の結果、他よりも精度向上が大きい１つ以上の薬物特異的な反応予測因子モデルが得られ、これは、治療転帰予測の迅速な決定のためのエンティティ係数を提供し、究極的にはより短い潜時で実際の患者データに基づく予測結果が生成される。

コンピュータに向けられるあらゆる言語、分析エンジンまたは機械学習システムは、個々に、またはまとめて動作する、サーバ、インターフェース、システム、データベース、エージェント、ピア、エンジン、コントローラー、モジュールまたは他のタイプの計算装置を含む、計算装置の何らかの適切な組み合わせを含むように解釈すべきであることに留意すべきである。計算装置は、タンジブルな、持続性コンピュータが読み取り可能なストレージ媒体（例えば、ハードドライブ、ＦＰＧＡ、ＰＬＡ、固相ドライブ、ＲＡＭ、フラッシュ、ＲＯＭなど）上に格納されるソフトウェアの指示を実行するように構成されるプロセッサを含むことが認識されよう。ソフトウェアの指示は、計算装置を構成するか、またはそうでなければ計算装置をプログラムして、開示の装置に関して以下で考察する役割、責任または他の機能を提供する。さらに、開示される技術は、コンピュータに基づくアルゴリズム、工程、方法または他の指示の実行に関連する開示の段階をプロセッサに実行させるソフトウェアの指示を格納する持続性コンピュータ可読媒体を含むコンピュータプログラム製品として具体化することができる。いくつかの実施形態において、様々なサーバ、システム、データベースまたはインターフェースは、おそらくＨＴＴＰ、ＨＴＴＰＳ、ＡＥＳ、官民鍵交換、ウェブサービスＡＰＩ、既知の金融取引プロトコールまたは他の電子情報交換方法に基づき、標準化プロトコールまたはアルゴリズムを使用してデータを交換する。装置間のデータ交換は、パケット交換方式のネットワーク、インターネット、ＬＡＮ、ＷＡＮ、ＶＰＮまたは他のタイプのパケット交換方式ネットワーク、回路交換方式ネットワークおよび／またはセル交換方式ネットワークで行われ得る。

本明細書中の記載において、および以下の特許請求の範囲を通じて使用されるように、システム、エンジン、サーバ、装置、モジュールまたは他のコンピュータ要素がメモリ中のデータに対して機能を遂行するかまたは実行するように構成されると記載されているとき、「構成される（ｃｏｎｆｉｇｕｒｅｄｔｏ）」または「プログラムされる（ｐｒｏｇｒａｍｍｅｄｔｏ）」の意味は、メモリ中に格納される標的データまたはデータオブジェクトに対して一連の機能を実行するかまたは動作するようにコンピュータ要素のメモリ中で格納される一連のソフトウェア指示によってプログラムされている、１つ以上のプロセッサまたはコンピュータ要素のコアとして定義される。

図２のフローチャートは、代表として、本発明の主題に従う典型的なワークフローを示す。ここで、第１段階において、オミクスおよび／またはパスウェイモデルデータおよび薬物反応が既知である複数の細胞／組織／患者データを精選する。当然ではあるが、このようなデータの精選に適切な全ての既知の情報の形態は、本明細書中での使用に適切とみなされ、医療サービスプロバイダー、研究室、病院、学術機関および／または保険キャリアからの患者データを含むことが理解されよう。したがって、データは、データベースもしくは分析装置から印刷してもよく、または電子フォーマットであり得る。さらに、データは、必ずしもヒトの試験由来である必要はなく、非ヒト起源（例えばげっ歯類、サルなど）のものでもあり得ることが理解されよう。同様に、データは細胞または組織培養由来であり得る。さらに、データが生データまたはオミクスデータである場合、このようなデータは一般的にはパスウェイ分析システムで処理され、特に好ましいパスウェイモデルシステムは、因子グラフに基づくシステム（例えばＰＡＲＡＤＩＧＭ）を含む。またさらに、データが、細胞、組織または患者を処置するために使用した（１つの）薬物または（複数の）薬物に関する情報ならびに適切な転帰記述子（例えば細胞または組織に対する薬物感受性または部分もしくは完全反応、ヒトに対する無病生存期間、再発、寛解）も含むことが一般的に好ましい。

ある企図される例において、細胞株のそれぞれについての具体的な薬物に対する感受性が既知である具体的な癌細胞タイプ（例えばメラノーマ）の別個の癌細胞株のコレクションから初期データを精選してもよい。このような感受性は実験的に決定し得るか、または文献から精選してもよい。あるいはまたはさらに、具体的な癌細胞タイプの別個の癌細胞株の収集物を使用する代わりに、具体的な癌細胞タイプの生検試料からデータを精選してもよく、薬物に対する感受性をインビトロで決定してもよく、または患者を薬物治療に供した際の患者治療転帰から推論してもよい。別の企図される例において、具体的な薬物に対する感受性が知られる細胞または組織についてオミクスデータが利用可能である場合、データは、公開ソースから精選し得る（例えば、臨床試験、学術論文、注釈付きのオミクスデータベースなど）。さらなる例において、細胞または組織は必ずしも同じ癌タイプ由来である必要はなく、実際には複数および別個の癌タイプ（例えば神経系の癌、肺、消化器系、非尿生殖器系、皮膚、腎臓、乳房、甲状腺、血液、骨、膵臓、軟組織などの癌）に由来し得ることが理解されよう。同様に、（同じ癌タイプまたは複数の癌タイプの）細胞の感受性が既知であることは、１つの薬物に限定される必要はないが、その複数の薬物感受性が同じ分析で使用され得ることが理解されよう。異なる見地から見て、感受性または他の転帰予測因子が既知である複数の細胞株／組織／生検試料の使用は、複数の別個の反応予測因子を生成させるための入力データとして使用され得る。

最も一般的には、初期データのソースに依存して、データは、オミクスデータ、例えば全ゲノムシーケンシングデータ、エクソームシーケンシングデータ、ＲＮＡシーケンシングおよび／または転写レベルデータ、定量的プロテオミクスデータおよび／またはタンパク質活性データなどである。好ましくは、次にこれらのデータを処理してパスウェイ活性情報を得て、ＧＳＥＡ、ＳＰＩＡ、ＰａｔｈＯｌｏｇｉｓｔ、ＡＲＡＣＮＥ、ＭＩＮＤｙ、ＣＯＮＥＸＩＣ、ＮｅｔＢｏｘおよびＭＥＭｏを含む、全ての既知のパスウェイ分析方法およびアルゴリズムが、本明細書中での使用に適切と思われる。しかし、特に好ましい態様において、パスウェイ分析は、ハイスループットゲノムデータにおけるパスウェイ推測に対する因子グラフフレームワークであるＰＡＲＡＤＩＧＭを使用して行う。ここで、遺伝子およびその産物の発現および既知の活性をコードする一連の相互接続される可変要素として、因子グラフによって遺伝子をモデル化し、これにより、多くのタイプのオミックデータをエビデンスとして組み込むことが可能になる。このような方法により、パスウェイの活性（例えば内部遺伝子状態、相互作用またはハイレベル「出力」）が確率的推測を使用して患者においてどの程度変更されるかの予測が可能になる（例えばＢｉｏｉｎｆｏｒｍａｔｉｃｓ．２０１０Ｊｕｎ１５；２６（１２）：ｉ２３７−ｉ２４５を参照）。オミクスデータに関するパスウェイ分析によって、有利におよび実質的に、機械学習を介して処理されるデータのボリュームが減少することにも留意すべきである。代わりに、パスウェイ分析（特にＰＡＲＡＤＩＧＭを使用する場合）は、パスウェイ要素（例えば遺伝子、タンパク質、タンパク質複合体）が多数の因子または値に関連する比較的単純なデータ構造を提供する。

この情報（例えば具体的な細胞または組織に対する薬物反応およびパスウェイモデル、一般的には陰性対照および／または他のパラメーターまたはメタデータと組み合わせる）を使用して、次に特異的な機械学習アルゴリズムを使用して反応予測因子を計算することができる。しかし、最も好ましい態様において、別個の反応予測因子のライブラリを得るために複数の別個の他の機械学習アルゴリズムを使用して、同じ情報について多数のさらなる反応予測因子を生成する。上で既に記載したように、さらなる複数の異なる機械学習アルゴリズムとともに、さらなる異なる薬物、オミクスデータセット、パスウェイモデリングおよび細胞タイプをさらに使用することができ、これにより利用可能な反応予測因子の数が指数関数的に増加する。実際に、このような組み合わせを使用すると、反応予測因子の数は、単一の薬物に対してさえも、容易に１，０００個を超え、より一般的には少なくとも１０，０００個、さらにより一般的には少なくとも１００，０００個の反応予測因子であり、これらを全て、反応予測因子ライブラリに収集することができることが認識されよう。しかし、図１Ａで代表的に示されるように、反応予測因子が比較的単純で、データ／ファイルサイズが小さいことが認識されよう。本質的に、反応予測因子は、複数のパスウェイ要素および関連因子を含む多変数方程式とみなすことができ、それによって細胞または生検の測定オミクスデータを使用して感受性（または他の転帰の目安）スコアの単純な計算が可能になる。

反応予測因子の作成後、各反応予測因子に対する予測の質を評価してもよく、最も好ましくは、無作為選択を超える予測力を有する反応予測因子を保持する。異なる見地から見て、様々な反応予測モデルを、その精度の向上に関して評価してもよい。容易に理解されようが、精度を評価する多数の方式があり、特定の選択肢は、少なくとも部分的に、使用する評価基準およびアルゴリズムに依存し得る。例えば、適切な評価基準は、精度値、精度向上、性能評価基準または対応するモデルの他の測定を含む。

さらなる例となる評価基準は、曲線下面積評価基準、Ｒ^２値、ｐ−値評価基準、シルエット係数、混同行列または反応予測因子の性質に関連する他の評価基準を含む。反応予測因子の数または精度分布に依存して、予測のために使用する反応予測因子を、（例えば最高の精度向上または最高の精度スコアなどを有する）上位モデルであるとして、または上位ｎ分位値（三分位値、四分位値、五分位値など）であるとして、または全てのモデルの上位ｎ％（上位５％、上位１０％などで）であるとして選択してもよいことが理解されよう。例えば高い精度向上モデルは一般的には精度向上の上位四分位に存在する。

次に、データベースにおける各反応予測因子のヌルモデルを使用して実際の患者データの高い予測スコアとのマッチを統計学的に選択するために、反応予測因子のライブラリまたは個々の反応予測因子（両者とも一般的には上述のような無作為選択を超える最小予測力を使用して選択される）を使用してもよい。より具体的には、無作為選択データセットの中程度の数（例えば１００〜５００または５００〜１，０００または１，０００〜１０，０００）を使用して、各反応予測因子に関するヌルモデルを計算する。最も一般的には、これらのデータセットは、反応予測因子の計算に使用されるが、ヌルモデルが生成される反応予測因子の計算には使用されない、パスウェイモデルデータおよび／またはオミクスデータを含む。予想され得るように、このように計算されたヌルモデルは、無関係なまたはマッチが低いパスウェイモデルまたはオミクスデータのバックグラウンドシグナル分布（例えば平均値および標準偏差）を提供し、これを結果のさらなる正規化および順位付けのために使用することができる。

例えば１つの反応予測因子が、既知のデータセットおよび既知の転帰に関して高い予測スコア（例えば高レベルの感受性または耐性）を予測し、無作為選択データセットに関して平均的な予測スコア（バックグラウンドシグナル）を予測する状況において、高いスコアを、生スコアとして記し、次にこれを、バックグラウンドシグナル分布を使用して補正し、標準化スコアに到達する。この標準化スコアは、既知のデータセットと、特定の細胞または組織の薬物を用いて当初計算された反応予測因子性能との適合を特徴づけることが理解されよう。したがって、ヌルモデルと対応する試験モデルまたは上位モデル（対応するモデルの中で最大の精度向上を有するモデル）間の比較、および生スコアの相違、およびより好ましくは標準化スコアの相違を、順位付けのために使用することができる。パスウェイエンティティおよび関連するエンティティ係数と共に、上位の反応予測因子（各薬物に対して、複数の薬物を試験する場合）を特定する。次に、このように選択された反応予測因子（１つまたは複数）を様々な方式で、特に実際の患者オミクスおよびパスウェイ分析データに基づく薬物に対する治療反応の予測に使用することができる。したがって、および別段の指示がない限り、「高い精度向上反応予測因子」という用語は、本明細書中で使用される場合、反応予測因子の標準化順位付けにおける上位三分位に順位付けられる反応予測因子を指す。

上述のように、各反応予測因子が比較的単純なデータ構造を有し、対応するエンティティ係数（一般的には数値）と共に、複数のエンティティ識別子（例えばＭＩＲ３４Ａ、ＡＰ１複合体、ＴＰ６３などのパスウェイエンティティ）を列挙することに特に留意すべきである。必要に応じて、エンティティの機能（例えば細胞周期、アポトーシスなど；未知の機能はＮＵＬＬとして表示する）も、以下の表１において反応予測因子に関して例として示されるように含めてもよい。

反応予測因子を使用して、実際の患者のパスウェイモデル出力から得た患者データを、反応予測因子において対応するパスウェイエンティティのエンティティ係数を使用して処理することができると認識されよう。例えば第一のパスウェイエンティティ（例えばＡＰ１）の（患者オミクスデータに基づく）パスウェイモデル出力が第１の値である場合、その第１の値を、反応予測因子における対応する係数（例えばＡＰ１に対する係数）により修正して、第１の修正値を生成すること等が可能である。次に、修正された出力エンティティ値（対応する係数により修正）の合計は、感受性（または他の転帰の目安）スコアを計算したモデルに対応する数値的な指標を提供し、これは、治療転帰に関する計算された予測値（例えば薬物感受性に対する正の数値）に対応する。

さらに企図される態様において、本明細書中で与えられるシステムおよび方法が、反応予測に関して望ましい高精度で、１つ以上の医薬品（例えば複数の細胞株が複数の治験薬物または薬物候補に曝露される開発パイプラインにおける治験薬物または薬物候補）を特定するためにも使用され得ることも認識されよう。このような特定は、複数の薬物が開発中である場合、ならびに企図されるシステムおよび方法が、望ましい高精度で予測することができる感受性（または他の転帰の目安）スコアを有するとして薬物を特定する場合、特に有益である。なおさらに、企図されるシステムおよび方法は、以下でより詳細に示すように、これまで認識されていない、または理解されていない適応症において薬物を特定するためにも適切である。簡潔に述べると、企図されるシステムおよび方法は、複数の適応症に関して複数の薬物を試験する場合に使用してもよい。反応予測モデルは、薬物ごとの最高の精度向上に従い、次いで（最高の精度向上を有する）薬物により最終的に順位付けされる。

このような計算は、反応予測因子のデータ構造が単純化されており、患者データを一般的に行われるようにインビトロモデルデータに適合させようと試みる機械学習工程を必要としないので、迅速であることが特に認識されよう。

実施例
以下の表２で示される様々な異なる機械学習分類器と組み合わせて、神経膠芽腫と診断された患者からの様々なオミクスデータ（例えば転写およびコピー数）およびパスウェイデータ（例えばＰＡＲＡＤＩＧＭ）、ならびに異なる細胞タイプの既知のゲノムデータセット、様々な薬物への曝露および薬物に対するそれぞれの関連する感受性から構築した反応予測因子に基づいて、神経膠芽腫と診断された患者に適切な薬物としてダサチニブが特定された。

より具体的には、上記のデータセット、薬物および分類器を使用して、２９，３５２個の完全にトレーニングされた薬物反応モデルを構築し、１４６，７６０個のさらなる評価モデルを構築し（５−倍ＣＶで）、全部で１７６，１１２個のモデルを分析して、様々な薬物に対する多数の反応予測因子を得た。マイクロアレイまたはシーケンシング技術を介して、神経膠芽腫患者からのゲノム規模データを個々の癌試料から収集した。同じ試料（例えば発現プロファイリングおよびコピー数推定）において独立したアッセイを行い、どのデータタイプが最良の予測を提供するかを評価した。これらの患者データを因子グラフに基づくモデル（ＰＡＲＡＤＩＧＭ）において統合した。オミクスデータのエビデンスを与えるパスウェイネットワークに対して最も可能性のある状態を推定し、推測されるパスウェイ活性として報告した（すなわちパスウェイモデルは、個々のパスウェイ要素の活性を用いて確立した）。この文脈において、企図されるシステムおよび方法は、単一のモデルの予測最適化にも基づいておらず、選択されたオミクスパラメーターと治療予測との最良の相関の特定にも基づいていないことが特に認識されよう。

次いで、予測因子データベースにおける反応予測因子および実際の患者データを使用して、１，０００個の無作為選択データセットによって各反応予測因子に関してヌルモデルを計算し、各ヌルモデルに関して平均値および標準偏差を記録した。次いで、各反応予測因子に対する患者データセットを使用して試験モデルを計算し、個々のヌルモデルからの結果を使用してその結果を標準化した。図３は、代表として、標準化スコアの順位付けを示す。ここで、各縦線は、具体的な薬物によりグループ化された反応予測因子の数の、平均値、最小値および最大値の結果を表す。図３から見られ得るように、左側の反応予測因子は、より一貫して正確に予測され、最も一貫して予測された薬物は、神経膠芽腫と診断された患者に関するダサチニブである。とりわけ、ダサチニブが、（「フィラデルフィア染色体」タンパク質を阻害する）経口Ｂｃｒ−Ａｂｌチロシンキナーゼ阻害剤として元来開発され、慢性骨髄性白血病およびフィラデルフィア染色体陽性急性リンパ芽球性白血病の患者における第１選択薬として承認されたことが理解されよう。当然ではあるが、上記の工程を、異なる神経膠芽腫（または他の選択された癌）癌細胞株または生検試料のみを使用して、および神経膠芽腫の処置に有効であることが既知であるか、または有効性が予想される薬物のみを使用して、神経膠芽腫（または他の選択された癌）からのデータのみを初期データとして含むように修正することができることも認識されよう。次に、このような修正工程によって、神経膠芽腫（または他の選択された癌）および特定の薬物のみに特異的である反応予測因子がもたらされる。一方で、上記の工程は、異なる神経膠芽腫（または他の選択された癌）癌細胞株または生検試料、および（場合によっては）神経膠芽腫の処置に有効であることが既知であるか、または有効性が予想される複数の異なる薬物を使用して、神経膠芽腫（または他の選択された癌）からのデータのみを初期データとして含むように修正することができる。次に、このような修正された工程によって、神経膠芽腫（または他の選択された癌）および複数の薬物候補に特異的な反応予測因子がもたらされる。

したがって、患者における薬物に対する反応は、（ａ）薬物標的のアゴニスト作用である方式で、および（ｂ）オミクスデータ／パスウェイモデルの具体的なセットの関数として薬物反応を予測するように各モデルを最適化した予測モデルのコレクションへの入力データとして使用する場合には、患者のオミクスデータ／パスウェイモデルに基づいて、予測することができることが理解されよう。さらに、予測された結果を対応するヌルモデルと比較することによって、バックグラウンドを上回る統計学的に関連がある予測が報告され、次いでこれにより、反応予測を順位付けすることが可能になる。さらに、患者データが固有バイアスを持ち込まないことを確実にするために、患者データから順列も作成することができ、これを次にヌルモデルに関して記載される方式で分類して、患者データおよびヌルモデルが同様に分布することを確実にする。

本明細書中での使用に適切なオミクスデータおよびパスウェイモデルに関して、全てのオミクスデータおよびパスウェイモデルが適切と考えられ、代表的なオミクスデータは、シーケンシングデータ、特に腫瘍対正常データ、例えば全ゲノムシーケンシングデータ、エクソームシーケンシングデータなどを含むことに留意すべきである。さらに、適切なオミクスデータはまた、トランスクリプトミクスデータおよびプロテオミクスデータも含む。同様に、適切なパスウェイ分析は、全て本明細書中で参照により組み込まれる国際公開第２０１１／１３９３４５Ａ２号パンフレット、同第２０１３／０６２５０５Ａ１号パンフレットおよび同第２０１４／０５９０３６号パンフレットに記載のような、遺伝子セットエンリッチメント解析（ＧＳＥＡ、ＢｒｏａｄＩｎｓｔｉｔｕｔｅ）に基づくモデル、シグナル伝達パスウェイインパクト解析（ＳＰＩＡ、Ｂｉｏｃｏｎｄｕｃｔｏｒ）に基づくモデルおよびＰａｔｈＯｌｏｇｉｓｔパスウェイモデル（ＮＣＢＩ）ならびに因子グラフに基づくモデルおよび特にＰＡＲＡＤＩＧＭを含む。図４は、平均精度をオミクスデータのタイプおよびパスウェイモデルの関数として示す、代表的な比較結果を提供する。明確に理解され得るように、最高精度は、ＰＡＲＡＤＩＧＭを使用して処理したサンガー発現データを用いて達成され、パスウェイモデルを得た。サンガー発現およびコピー数データを使用しても、同様に高精度が達成され、再びＰＡＲＡＤＩＧＭを使用して処理して、対応するパスウェイモデルを得た。とりわけ、パスウェイモデリングなしのサンガー発現データのみでも、幾分低いが比較的高い精度が得られる。コピー数オミクスデータのみは、それ自体またはＰＡＲＡＤＩＧＭを使用して処理した場合、幾分低く順位付けされた。

細胞株に関するオミクスデータおよびパスウェイモデルを使用して、このように得られた予測の精度も照合し、結果を図５で示す。ここで、調整された感受性スコアをプロットし、黒丸はどの感受性データが利用可能であったかについての予測を示し、白丸はどの感受性データが利用可能でなかったかについての予測を示し、不正確な予測についてはｘで標識する。とりわけ、神経細胞株におけるダサチニブに対する予測精度は７７．８％であり、これは神経膠芽腫患者に関する予測と一致する。

同様に、図５からわかるようにダサチニブ耐性を正確に予測することができることは注目すべきである。図６で見られ得るように、トレーニング細胞株パネルに対応する組織におけるＴＣＧＡ試料からの初期患者データを使用して、同様の照合を行った。組織効果が細胞株と患者データとの間で同様に挙動することに留意すること。例えば神経系の株と同様に、ＧＢＭ患者試料は、レスポンダーおよび非レスポンダーサブセットを含有することが予測される。さらに、ダサチニブがヒト腎臓明細胞癌腫の優れた代替的薬物候補であり得ることに留意すべきである。最も一般的には、反応予測因子が神経腫瘍に関して特に正確であることが示されたので、神経腫瘍（例えば神経膠芽腫）と診断された患者から患者データを得る。その目的で、腫瘍は生検試料であり得、オミクスデータは組織試料について、好ましくは適合する正常対照に対して決定され得る。次に、ＰＡＲＡＤＩＧＭ（または他の適切なパスウェイ分析ソフトウェア）においてオミクスデータを処理して、反応予測因子におけるエンティティに対応するエンティティに対するデータを含むパスウェイモデルを得る。次に、患者ＰＡＲＡＤＩＧＭ値を対応するエンティティ係数に適用し、反応予測因子エンティティ係数および患者からの実際のパスウェイデータに基づく結果は、反応予測因子に関連する治療転帰を示す。

上記表１のエンティティ係数をさらに参照して、ダサチニブに対する上位順位の（またはそうでなければ所望の）反応予測因子についてのそのように得られた係数の一部（およびより好ましくは全て）を実際の患者データと組み合わせて使用することができることは明白であろう。したがって、ダサチニブでの神経膠芽腫の処置に対する反応予測因子は、以下のエンティティおよび場合によっては個々の係数（ここではエンティティ：係数ペアとして挙げる）の少なくとも２個または少なくとも３個または少なくとも５個または少なくとも７個または少なくとも１０個を含み得る：ＭＩＲ３４Ａ＿（ｍｉＲＮＡ）：−０．１０５４５８９５；ＥＴＳ１：−０．０９４２６４８１７；５＿８＿Ｓ＿ｒＲＮＡ＿（ｒｎａ）：０．０８６０４４９５８；ＣＥＢＰＢ＿（ｄｉｍｅｒ）＿（ｃｏｍｐｌｅｘ）：０．０６７６９１４０７；ＦＯＳＬ１：−０．０６７２６３５６１；ＣＥＢＰＢ：０．０６６６９８５６９；ＪＵＮ／ＦＯＳ＿（ｃｏｍｐｌｅｘ）：−０．０６４５４９８８１；Ｆｒａ１／ＪＵＮ＿（ｃｏｍｐｌｅｘ）：−０．０６０４０３２９３；ＦＯＸＡ２：０．０５９７５５３１９；ＦＯＳ：−０．０５９５６０８３３；Ｅ２Ｆ１：−０．０５０９９２２７３；ＡＰ１＿（ｃｏｍｐｌｅｘ）：−０．０４９８２３４９２；ａｎｏｉｋｉｓ＿（ａｂｓｔｒａｃｔ）：−０．０４８５３３９９；ＦＯＸＡ１：０．０３５９９４３６７；ｄＮｐ６３ａ＿（ｔｅｔｒａｍｅｒ）＿（ｃｏｍｐｌｅｘ）：−０．０３３４７８５２１；ＴＰ６３：−０．０２９５６１３４；ＭＹＣ：０．０２６８４７４７９；ＴＰ６３−２：−０．０２６４２３５４２；Ｅ２Ｆ−１／ＤＰ−１＿（ｃｏｍｐｌｅｘ）：−０．０２３４６２０８１；ＭＹＢ：０．０２２２１１９３８；ＴＡｐ６３ｇ＿（ｔｅｔｒａｍｅｒ）＿（ｃｏｍｐｌｅｘ）：０．０１９７８９９２９；ＨＩＦ１Ａ／ＡＲＮＴ＿（ｃｏｍｐｌｅｘ）：０．０１９２２２２６７；ＪＵＮ／ＪＵＮ−ＦＯＳ＿（ｃｏｍｐｌｅｘ）：−０．０１９１８４４２４；ＭＹＣ／Ｍａｘ＿（ｃｏｍｐｌｅｘ）：−０．０１８５５３２７６；ＸＢＰ１−２：−０．０１７００９９１５；ｎｅｇａｔｉｖｅ＿ｒｅｇｕｌａｔｉｏｎ＿ｏｆ＿ＤＮＡ＿ｂｉｎｄｉｎｇ＿（ａｂｓｔｒａｃｔ）：−０．０１６２２４１３９；ＰＰＡＲＧＣ１Ａ：−０．０１５５２５３６１；ｐ５３＿ｔｅｔｒａｍｅｒ＿（ｃｏｍｐｌｅｘ）：−０．０１３８８１３５３；ＴＰ６３−５：０．０１１８６０９３６；ｐ５３＿（ｔｅｔｒａｍｅｒ）＿（ｃｏｍｐｌｅｘ）：−０．０１１１２０５６４；ＦＯＸＭ１：０．０１０５１５２８９；ＭＩＲ１４６Ａ＿（ｍｉＲＮＡ）−０．００４５８８２０３；ＭＩＲ２００Ａ＿（ｍｉＲＮＡ）：０．００４５７０８４２；ＭＩＲ２２＿（ｍｉＲＮＡ）：−０．００４５５２９６；ＭＩＲＬＥＴ７Ｇ＿（ｍｉＲＮＡ）：−０．００４５３４４１４；ＭＩＲ２６Ａ１＿（ｍｉＲＮＡ）：−０．００４５１５０５７；ＭＩＲ１４１＿（ｍｉＲＮＡ）：０．００４４９４８０６；ＭＩＲ３３８＿（ｍｉＲＮＡ）：０．００４４７３７７６；ＭＩＲ２３Ｂ＿（ｍｉＲＮＡ）：−０．００４４５２５０２：ＭＩＲ９−３＿（ｍｉＲＮＡ）：０．００４４３２１７４；ＭＩＲ２６Ｂ＿（ｍｉＲＮＡ）：−０．００４４１４６２７；ＭＩＲ４２９＿（ｍｉＲＮＡ）：０．００４４０１７０１；ＭＩＲ２６Ａ２＿（ｍｉＲＮＡ）：−０．００４３９３５２５；ＭＩＲ１７＿（ｍｉＲＮＡ）：０．００４３８５９４７；ＤＬＥＵ２＿（ｒｎａ）：−０．００４３７６１４１；ＤＬＥＵ１＿（ｒｎａ）：−０．００４３３７６５７；ＴＰ５３：−０．００３３０２８７９；ＪＵＮ：０．００３１８９０８５；ＮＯＴＣＨ４＿（ｒｎａ）：０．００２２１８０６６；およびＥ２Ｆ１／ＤＰ＿（ｃｏｍｐｌｅｘ）：０．０００３７６６５３。

本明細書中での使用に適切なさらなる考察は、全て本明細書中で参照により組み込まれる、２０１４年５月２８日提出の国際公開第２０１４／１９３９８２号パンフレット、２０１６年１月１９日提出の同第２０１６／１１８５２７号パンフレット、２０１６年３月３日提出の同第２０１６／１４１２１４号パンフレットおよび２０１６年６月１５日提出の同第２０１６／２０５３７７号パンフレットで開示される。

本明細書中の記載において使用される場合、および続く特許請求の範囲を通じて、「ａ」、「ａｎ」および「ｔｈｅ」の意味は、文脈から別段の明らかな指示がない限り、複数の言及も含む。また、本明細書中の記載において使用される場合、「ｉｎ」の意味は、文脈から別段の明らかな指示がない限り、「ｉｎ」および「ｏｎ」を含む。本明細書中でまた使用される場合、および文脈から別段の指示がない限り、「にカップリングされる（ｃｏｕｐｌｅｄｔｏ）」という用語は、直接的なカップリング（互いにカップリングされる２個の要素が互いに接触する）および間接的なカップリング（少なくとも１個のさらなる要素が２個の要素間に配置される）の両方を含むものとする。したがって、「にカップリングされる（ｃｏｕｐｌｅｄｔｏ）」および「とカップリングされる（ｃｏｕｐｌｅｄｗｉｔｈ）」という用語は同意語として使用される。最後に、および文脈が逆のことを示さない限り、本明細書中で示される全ての範囲は、それらの終点を含むものとして解釈すべきであり、オープンエンド型の範囲は、商業的に実際的な値を含むと解釈されるべきである。同様に全ての値のリストは、文脈が反対のことを示さない限り、中間値を含むものと考えるべきである。

本明細書中で本発明の概念から逸脱することなく、既に述べたもの以外の多くのさらなる修正が可能であることは当業者とって明らかであろう。したがって、本発明の主題は、添付の特許請求の範囲を除いて制限されるものではない。さらに、明細書および特許請求の範囲の両方の解釈において、全ての用語は、内容と一致する最も広く可能な方式で解釈すべきである。特に「含む（ｃｏｍｐｒｉｓｅｓ）」および「含むこと（ｃｏｍｐｒｉｓｉｎｇ）」という用語は、包括的に、要素、構成成分または段階を指すと解釈すべきであり、言及される要素、構成成分または段階が、明らかには言及されていない他の要素、構成成分または段階と共に、存在してもよく、または利用されてもよく、またはそれらと組み合わせてもよいことを示す。明細書特許請求の範囲がＡ、Ｂ、Ｃ・・・およびＮからなる群から選択される何れかのうち少なくとも１つを指す場合、文章は、Ａ＋ＮまたはＢ＋Ｎなどではなく、その群から１個の要素のみを必要とするように解釈すべきである。

Claims

複数の反応予測因子を処理する方法であって、
複数の反応予測因子を提供するステップであって、前記反応予測因子のそれぞれが、薬物に関連し且つ複数のパスウェイ要素および関連するエンティティ係数を有する、ステップと；
対応するヌルモデルと比較して前記反応予測因子のそれぞれについて精度向上評価基準を計算して、単一の反応予測因子を選択するステップと；
選択された反応予測因子のパスウェイ要素および関連するエンティティ係数のサブセット、ならびに患者腫瘍のパスウェイモデル出力を少なくとも使用してスコアを計算するステップと、
を含む方法。
前記複数の反応予測因子が、少なくとも１，０００個の反応予測因子である、請求項１に記載の方法。
前記複数の反応予測因子が、少なくとも１００，０００個の反応予測因子である、請求項１に記載の方法。
前記エンティティ係数についてのパスウェイ要素が、制御ＲＮＡ、免疫シグナル伝達成分、細胞分化因子、細胞増殖因子、アポトーシスシグナル伝達成分、血管新生因子および細胞周期チェックポイント成分からなる群から選択される、請求項１に記載の方法。
前記精度向上評価基準が、精度値、精度向上、性能評価基準、曲線下面積評価基準、Ｒ^２値、ｐ−値評価基準、シルエット係数および混同行列からなる群から選択される、請求項１に記載の方法。
前記複数の反応予測因子が、少なくとも２つの異なる機械学習分類器を使用して確立される、請求項１に記載の方法。
前記少なくとも２つの異なる機械学習分類器が、線形カーネルサポートベクターマシン、一次または二次多項式カーネルサポートベクターマシン、リッジ回帰、エラスティックネットアルゴリズム、逐次最小問題最適化アルゴリズム、ランダムフォレストアルゴリズム、ナイーブベイズアルゴリズムおよびＮＭＦ予測因子アルゴリズムからなる群から選択される、請求項６に記載の方法。
前記対応するヌルモデルが、前記ヌルモデルを作成する反応予測因子の計算で使用されない無作為選択データセットを使用して計算される、請求項１に記載の方法。
前記パスウェイ要素および関連するエンティティ係数のサブセットが、１〜５０個のエンティティ係数を含む、請求項１に記載の方法。
前記患者腫瘍のパスウェイモデル出力が、前記選択された反応予測因子におけるパスウェイ要素のサブセットと同じであるパスウェイ要素を含む、請求項１に記載の方法。
前記スコアが、前記薬物による処置に関する感受性スコアである、請求項１に記載の方法。
薬物を使用した患者の治療転帰を予測するために患者における腫瘍のパスウェイモデルの出力を使用する方法であって、
前記腫瘍のパスウェイモデルにおける対応するパスウェイ要素の出力値に関して、因子として薬物に関する高い精度向上反応予測因子におけるパスウェイ要素の複数のエンティティ係数を使用して、前記薬物を使用した患者の治療転帰スコアを予測するステップを含み；
前記腫瘍のパスウェイモデルが、前記患者のオミクスデータを使用して計算され、複数のパスウェイ要素および関連する出力値を含み；
前記高い精度向上反応予測因子が、対応するヌルモデルと比較して既定の最小の精度向上を有し；
前記高い精度向上反応予測因子が複数の反応予測因子から選択され、前記反応予測因子のそれぞれが前記薬物に関連する、
方法。
前記複数のエンティティ係数が、高い精度向上反応予測因子の１〜５０個のエンティティ係数である、請求項１２に記載の方法。
前記複数のエンティティ係数がエンティティ係数のサブセットであり、前記高い精度向上反応予測因子の全てのエンティティ係数の上位三分位を含む、請求項１２に記載の方法
前記パスウェイモデルが確率的パスウェイモデルである、請求項１２に記載の方法。
前記パスウェイモデルがＰＡＲＡＤＩＧＭである、請求項１２に記載の方法。
前記既定の最小の精度向上がヌルモデルよりも少なくとも５０％高い、請求項１２に記載の方法。
前記ヌルモデルが、前記ヌルモデルを作成する高い精度向上反応予測因子の計算において使用されない無作為選択データセットを使用して計算される、請求項１２に記載の方法。
前記複数の反応予測因子が、少なくとも１００，０００個の反応予測因子である、請求項１２に記載の方法。
前記複数の反応予測因子が、少なくとも２個の異なる機械学習分類器を使用して確立される、請求項１２に記載の方法。
前記少なくとも２個の異なる機械学習分類器が、線形カーネルサポートベクターマシン、一次または二次多項式カーネルサポートベクターマシン、リッジ回帰、エラスティックネットアルゴリズム、逐次最小問題最適化アルゴリズム、ランダムフォレストアルゴリズム、ナイーブベイズアルゴリズムおよびＮＭＦ予測因子アルゴリズムからなる群から選択される、請求項２０に記載の方法。
前記薬物が化学療法薬である、請求項１２に記載の方法。
ダサチニブによる患者の腫瘍の治療の治療転帰を予測する方法であって、
前記患者の腫瘍のオミクスデータを得るステップと；
パスウェイモデルおよび前記オミクスデータを使用するパスウェイ分析エンジンによって、前記腫瘍に対するパスウェイモデル出力を計算するステップであって、前記パスウェイ出力が複数のパスウェイ要素および関連する活性値を含む、ステップと；
前記パスウェイモデル出力の対応するパスウェイ要素の活性値に、因子として個々のパスウェイエンティティの複数のエンティティ係数を適用し、それにより前記患者の治療転帰を予測するステップと、
を含み；
前記パスウェイエンティティおよび個々のエンティティ係数が、ＭＩＲ３４Ａ＿（ｍｉＲＮＡ）：−０．１０５４５８９５；ＥＴＳ１：−０．０９４２６４８１７；５＿８＿Ｓ＿ｒＲＮＡ＿（ｒｎａ）：０．０８６０４４９５８；ＣＥＢＰＢ＿（ｄｉｍｅｒ）＿（ｃｏｍｐｌｅｘ）：０．０６７６９１４０７；ＦＯＳＬ１：−０．０６７２６３５６１；ＣＥＢＰＢ：０．０６６６９８５６９；ＪＵＮ／ＦＯＳ＿（ｃｏｍｐｌｅｘ）：−０．０６４５４９８８１；Ｆｒａ１／ＪＵＮ＿（ｃｏｍｐｌｅｘ）：−０．０６０４０３２９３；ＦＯＸＡ２：０．０５９７５５３１９；ＦＯＳ：−０．０５９５６０８３３；Ｅ２Ｆ１：−０．０５０９９２２７３；ＡＰ１＿（ｃｏｍｐｌｅｘ）：−０．０４９８２３４９２；ａｎｏｉｋｉｓ＿（ａｂｓｔｒａｃｔ）：−０．０４８５３３９９；ＦＯＸＡ１：０．０３５９９４３６７；ｄＮｐ６３ａ＿（ｔｅｔｒａｍｅｒ）＿（ｃｏｍｐｌｅｘ）：−０．０３３４７８５２１；ＴＰ６３：−０．０２９５６１３４；ＭＹＣ：０．０２６８４７４７９；ＴＰ６３−２：−０．０２６４２３５４２；Ｅ２Ｆ−１／ＤＰ−１＿（ｃｏｍｐｌｅｘ）：−０．０２３４６２０８１；ＭＹＢ：０．０２２２１１９３８；ＴＡｐ６３ｇ＿（ｔｅｔｒａｍｅｒ）＿（ｃｏｍｐｌｅｘ）：０．０１９７８９９２９；ＨＩＦ１Ａ／ＡＲＮＴ＿（ｃｏｍｐｌｅｘ）：０．０１９２２２２６７；ＪＵＮ／ＪＵＮ−ＦＯＳ＿（ｃｏｍｐｌｅｘ）：−０．０１９１８４４２４；ＭＹＣ／Ｍａｘ＿（ｃｏｍｐｌｅｘ）：−０．０１８５５３２７６；ＸＢＰ１−２：−０．０１７００９９１５；ｎｅｇａｔｉｖｅ＿ｒｅｇｕｌａｔｉｏｎ＿ｏｆ＿ＤＮＡ＿ｂｉｎｄｉｎｇ＿（ａｂｓｔｒａｃｔ）：−０．０１６２２４１３９；ＰＰＡＲＧＣ１Ａ：−０．０１５５２５３６１；ｐ５３＿ｔｅｔｒａｍｅｒ＿（ｃｏｍｐｌｅｘ）：−０．０１３８８１３５３；ＴＰ６３−５：０．０１１８６０９３６；ｐ５３＿（ｔｅｔｒａｍｅｒ）＿（ｃｏｍｐｌｅｘ）：−０．０１１１２０５６４；ＦＯＸＭ１：０．０１０５１５２８９；ＭＩＲ１４６Ａ＿（ｍｉＲＮＡ）−０．００４５８８２０３；ＭＩＲ２００Ａ＿（ｍｉＲＮＡ）：０．００４５７０８４２；ＭＩＲ２２＿（ｍｉＲＮＡ）：−０．００４５５２９６；ＭＩＲＬＥＴ７Ｇ＿（ｍｉＲＮＡ）：−０．００４５３４４１４；ＭＩＲ２６Ａ１＿（ｍｉＲＮＡ）：−０．００４５１５０５７；ＭＩＲ１４１＿（ｍｉＲＮＡ）：０．００４４９４８０６；ＭＩＲ３３８＿（ｍｉＲＮＡ）：０．００４４７３７７６；ＭＩＲ２３Ｂ＿（ｍｉＲＮＡ）：−０．００４４５２５０２：ＭＩＲ９−３＿（ｍｉＲＮＡ）：０．００４４３２１７４；ＭＩＲ２６Ｂ＿（ｍｉＲＮＡ）：−０．００４４１４６２７；ＭＩＲ４２９＿（ｍｉＲＮＡ）：０．００４４０１７０１；ＭＩＲ２６Ａ２＿（ｍｉＲＮＡ）：−０．００４３９３５２５；ＭＩＲ１７＿（ｍｉＲＮＡ）：０．００４３８５９４７；ＤＬＥＵ２＿（ｒｎａ）：−０．００４３７６１４１；ＤＬＥＵ１＿（ｒｎａ）：−０．００４３３７６５７；ＴＰ５３：−０．００３３０２８７９；ＪＵＮ：０．００３１８９０８５；ＮＯＴＣＨ４＿（ｒｎａ）：０．００２２１８０６６；およびＥ２Ｆ１／ＤＰ＿（ｃｏｍｐｌｅｘ）：０．０００３７６６５３からなる群から選択される、
方法。
前記パスウェイモデルが確率的パスウェイモデルである、請求項２３に記載の方法
前記パスウェイモデルがＰＡＲＡＤＩＧＭである、請求項２３に記載の方法。
前記患者のオミクスデータが、コピー数データ、発現レベルデータ、ＤＮＡ配列データおよび突然変異データのうちの少なくとも１つを含む、請求項２３に記載の方法
前記患者の治療転帰が、ダサチニブに対する感受性である、請求項２３に記載の方法。
前記腫瘍が神経腫瘍である、請求項２３に記載の方法。
患者の治療転帰を予測するためにパスウェイモデルの出力を修正するための、高い精度向上反応予測因子の複数のエンティティ係数の使用であって、前記高い精度向上反応予測因子が薬物に関連し、前記パスウェイモデルが前記患者のオミクスデータを使用する、使用。
前記複数のエンティティ係数が、前記高い精度向上反応予測因子の１〜５０個のエンティティ係数である、請求項２９に記載の使用。
前記複数のエンティティ係数が、エンティティ係数のサブセットであり、前記高い精度向上反応予測因子の全てのエンティティ係数の上位三分位を含む、請求項２９に記載の使用。
前記パスウェイモデルが確率的パスウェイモデルである、請求項２９に記載の使用。
前記パスウェイモデルがＰＡＲＡＤＩＧＭである、請求項２９に記載の使用。
前記薬物が化学療法薬である、請求項２９に記載の使用。
前記患者のオミクスデータが、コピー数データ、発現レベルデータ、ＤＮＡ配列データおよび突然変異データのうちの少なくとも１つを含む、請求項２９に記載の使用。