JP2019527894A - ダサチニブ反応予測モデルおよびその方法 - Google Patents
ダサチニブ反応予測モデルおよびその方法 Download PDFInfo
- Publication number
- JP2019527894A JP2019527894A JP2019505358A JP2019505358A JP2019527894A JP 2019527894 A JP2019527894 A JP 2019527894A JP 2019505358 A JP2019505358 A JP 2019505358A JP 2019505358 A JP2019505358 A JP 2019505358A JP 2019527894 A JP2019527894 A JP 2019527894A
- Authority
- JP
- Japan
- Prior art keywords
- pathway
- response
- data
- entity
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/33—Heterocyclic compounds
- A61K31/395—Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
- A61K31/495—Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with two or more nitrogen atoms as the only ring heteroatoms, e.g. piperazine or tetrazines
- A61K31/505—Pyrimidines; Hydrogenated pyrimidines, e.g. trimethoprim
- A61K31/506—Pyrimidines; Hydrogenated pyrimidines, e.g. trimethoprim not condensed and containing further heterocyclic rings
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K45/00—Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
- A61K45/06—Mixtures of active ingredients without chemical characterisation, e.g. antiphlogistics and cardiaca
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/574—Immunoassay; Biospecific binding assay; Materials therefor for cancer
- G01N33/57484—Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
- G16B5/20—Probabilistic models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/106—Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/136—Screening for pharmacological compounds
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/52—Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Theoretical Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Analytical Chemistry (AREA)
- Data Mining & Analysis (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Medicinal Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Genetics & Genomics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Food Science & Technology (AREA)
- Microbiology (AREA)
- Veterinary Medicine (AREA)
- Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Biochemistry (AREA)
Abstract
企図されるシステムおよび方法は、複数の別個の細胞タイプおよび薬物に関する反応予測因子のライブラリを確立するために、先験的な既知の細胞株ゲノミクスおよび薬物反応データを使用する。次に、選択された反応予測因子の統計学的分析を使用して、他の薬物と比較して予測力が顕著に向上している反応予測因子によって薬物を特定する。次に、このようにして特定された反応予測因子のエンティティ係数(entity coefficient)を実際の患者のオミクスシグネチュア(omics signature)に基づいたパスウェイモデルの出力に適用する。【選択図】図2
Description
本願は、2016年8月3日提出の米国特許仮出願第62/370,657号明細書に対する優先権を主張する。
本発明の分野は、(好ましくは高い精度向上)反応予測因子のエンティティ係数(entity coefficient)を用いてさらに処理されるパスウェイモデル情報に基づいて薬物に対する患者の薬物反応を予測するシステムおよび方法である。
パスウェイの計算論モデリングの様々なシステムおよび方法が当技術分野で公知である。例えば、いくつかのアルゴリズム(例えばGSEA、SPIAおよびPathOlogist)は、文献から精選されるパスウェイを使用して目的の変更されたパスウェイをうまく特定することが可能である。またさらなるツールは、文献中の精選された相互作用から因果グラフを構築し、これらのグラフを使用して発現プロファイルを説明している。ARACNE、MINDyおよびCONEXICなどのアルゴリズムは、遺伝子転写情報(および、CONEXICの場合はコピー数)を取り込み、一組の癌試料において起こり得る転写ドライバーを特定する。しかし、これらのツールは、異なるドライバーを、目的の単数の標的を特定する機能的ネットワークに分類することを試みていない。NetBoxおよびMutual Exclusivity Modules in Cancer(MEMo)などの一部のより新しいパスウェイアルゴリズムは、癌におけるデータ統合問題の解決を試み、それによって、試料の発癌性に対する重要なカギとなる複数のデータタイプにわたるネットワークを特定する。
このようなツールは、ネットワークを発見するために複数のパスウェイにわたる少なくとも幾分かの限られた統合を可能にするが、これらは一般に、関連パスウェイまたはパスウェイのネットワークにおける制御情報およびこのような制御情報と1つ以上の生理学的効果との関連性を提供できない。性能を向上させるための試みにおいて、GIENAは、単一の生物学パスウェイ内で無制御の遺伝子相互作用を探すが、パスウェイのトポロジーまたは相互作用の方向もしくは性質に関するこれまでの知識を考慮に入れていない。さらに、これらのモデリングシステムの比較的不完全な性質ゆえに、特に複数のパスウェイおよび/またはパスウェイ要素の相互作用を調べる場合、予測分析が不可能であることが多い。
つい最近、インビボパスウェイのイン・シリコパスウェイモデルを得るために、システムおよび方法の改善が記載され、代表的なシステムおよび方法が、国際公開第2011/139345号パンフレットおよび同第2013/062505号パンフレットに記載されている。このようなモデルのさらなる改良型が、異なるパスウェイ要素およびパスウェイ間の相互相関の特定に役立つ方法を開示する、国際公開第2014/059036号パンフレット(まとめて本明細書中で「PARADIGM」と呼ぶ)で提供された。このようなモデルは、例えば様々なシグナル伝達パスウェイの相互接続性および様々なパスウェイを通じたシグナルの流れに対して価値ある見識を提供する一方で、このようなモデリングを使用する多くの態様は真価を認められていないか、または認識さえされていない。
本明細書中の刊行物および特許出願は全て、各個々の刊行物または特許出願が具体的かつ個別に参照により組み込まれることを示す場合と同程度に参照により組み込まれる。組み込まれる参考文献中の用語の定義または使用が本明細書中で提供される用語の定義と一致しないかまたはそれに反する場合、本明細書中で提供されるその用語の定義が適用され、参考文献中のその用語の定義は適用されない。
国際公開第2014/193982号パンフレットに記載のようにPARADIGMからの見識を使用して、なおさらなる進展があった。ここで、複数の別個のデータセットを受け取り、疾患を有する細胞の処置パラメーター(例えば薬物による処置)の状況(例えば感受性または耐性)と関連がある別個のデータセット中の決定要因のパスウェイ要素を特定する、機械学習システムから、複数のモデルが得られている。このようなシステムは、潜在的治療モダリティへの見識を有利に提供する。しかし、機械学習システムから得られる潜在的に有効なモデルが非常に多数であるために、治療転帰の単純な予測は困難となる。
一方で、米国特許公開第2004/0193019号明細書に記載のように、判別分析に基づくパターン認識を使用して、ある種の生物学的プロファイル情報を治療転帰情報と相関させたモデルが作成された。次に、予測モデルを使用して、処置に対して可能な反応を順位付けする。このような方法は、患者特異的プロファイル情報に基づいて起こり得る転帰を評価するのに役立ち得るが、分析は、一般的に、判別分析で使用されるパラメーターによりバイアスがかかる。さらに、このような分析は、対応する薬物および疾患状態の歴史的データのみを考慮に入れるため、他の無関係な疾患状態においてのみ有効であることが知られる薬物の発見は制限される。さらに、対応する薬物および疾患状態の歴史的データを入手できるか否かにより、このような方法の有効性がさらに制限される傾向がある。
結果的に、全てではないとしても殆どのイン・シリコ予測システムおよび方法が、選択されたパスウェイ活性の障害と治療選択肢との既知の相関に基づくか(例えば特定のキナーゼ活性の活性亢進および特定のキナーゼ阻害剤に対する起こり得る反応性の特定)、または非患者起源からの経験的インビトロデータの何れかに基づくことが理解されよう。なおさらに、パターンを特定するために機械学習を使用する場合、学習システムの固有のバイアスが、患者の特定の状況と必ずしも一致しない方式で出力を歪める傾向がある。
したがって、具体的な薬物反応の予測のための様々なシステムおよび方法が当技術分野で公知であるが、高い信頼性で薬物に対する単純かつロバストな治療予測を可能にするとともに患者特異的な治療反応の予測も可能にする、システムおよび方法が依然として必要とされている。
本発明の主題は、複数のエンティティ係数(entity coefficient)を有する多数の反応予測因子を確立するために複数の先験的な既知の細胞株ゲノミクスおよび薬物反応データを使用する様々な装置、システムおよび方法を対象とする。次いで、最高性能の反応予測因子(1つまたは複数)のエンティティ係数を使用して、パスウェイモデルの出力を変更し、治療転帰を予測する。有利なことに、このようなシステムおよび方法は、複数のパスウェイ要素および相互接続を統合可能であり、患者データに基づくことができ、単一の予め選択されたモデルの使用による分析バイアスを回避することができる。
本発明の主題の一態様において、本発明者らは、複数の反応予測因子を提供するステップを含む複数の反応予測因子を処理する方法であって、各反応予測因子が、薬物に関連し、複数のパスウェイ要素および関連するエンティティ係数を有する、方法を企図する。別のステップにおいて、対応するヌルモデルと比較した精度向上評価基準を各反応予測因子について計算して、単一の反応予測因子を選択し、選択した反応予測因子のパスウェイ要素および関連するエンティティ係数のサブセット、ならびに患者腫瘍のパスウェイモデル出力を少なくとも使用して、スコア(例えば薬物による治療に関する感受性スコア)を計算する。最も一般的には、ヌルモデルを作成する反応予測因子の計算で使用されない無作為選択データセットを使用して、対応するヌルモデルを計算する。
最も一般的には、複数の反応予測因子は、少なくとも1,000または少なくとも10,000または少なくとも100,000個の反応予測因子である。エンティティ係数についてのパスウェイ要素は、制御RNA、免疫シグナル伝達成分、細胞分化因子、細胞増殖因子、アポトーシスシグナル伝達成分、血管新生因子および/または細胞周期チェックポイント成分であることがさらに一般的に企図される。
精度向上評価基準に関して、精度向上は、精度値、精度向上、性能評価基準、曲線下面積評価基準、R2値、p−値評価基準、シルエット係数または混同行列を使用して決定され得ることが一般的に企図される。さらに、少なくとも2個または少なくとも4個または少なくとも6個または少なくとも10個の異なる機械学習分類器を使用して複数の反応予測因子が確立され、適切な機械学習分類器には、線形カーネルサポートベクターマシン、一次または二次多項式カーネルサポートベクターマシン、リッジ回帰、エラスティックネットアルゴリズム、逐次最小問題最適化アルゴリズム、ランダムフォレストアルゴリズム、ナイーブベイズアルゴリズムおよびNMF予測因子アルゴリズムが包含されることが一般的に企図される。
パスウェイ要素および関連するエンティティ係数のサブセットは、典型的には、1〜50個のエンティティ係数を含み、患者腫瘍のパスウェイモデル出力は、選択された反応予測因子におけるパスウェイ要素のサブセットと同じであるパスウェイ要素を含むことがさらに企図される。
したがって、および異なる見地から見て、発明者らはまた、薬物(例えば化学療法薬)を用いた患者の治療転帰の予測のために患者における腫瘍のパスウェイモデルの出力を使用する方法も企図する。最も一般的には、このような方法は、薬物を使用した患者に対する治療転帰スコアを予測するために、腫瘍のパスウェイモデルにおいて対応するパスウェイ要素の出力値に関して、因子として薬物に対する高い精度向上反応予測因子におけるパスウェイ要素の複数のエンティティ係数を使用するステップを含む。好ましくは、腫瘍のパスウェイモデルは、患者のオミクスデータを使用して計算され、複数のパスウェイ要素および関連する出力値を含み、高い精度向上反応予測因子は、対応するヌルモデルと比較して既定の最小の精度向上を有することがさらに好ましい。さらに、このような方法において、高い精度向上反応予測因子は複数の反応予測因子から選択されることが好ましく、各反応予測因子は薬物に関連する。
このような方法の典型的な態様において、複数のエンティティ係数は、高い精度向上反応予測因子の1〜50個のエンティティ係数である、および/または複数のエンティティ係数は、エンティティ係数のサブセットであり、高い精度向上反応予測因子の全てのエンティティ係数の最上位三分位を含む。本発明の主題を制限することなく、一般的にはパスウェイモデルは確率的パスウェイモデル、特にPARADIGM、であることが好ましい。
このような企図される方法での既定の最小の精度向上は、ヌルモデルに対して少なくとも50%であり、ここでヌルモデルは、好ましくは、ヌルモデルを作成する高い精度向上反応予測因子の計算において使用されない無作為選択データセットを使用して計算される。さらに、複数の反応予測因子は比較的多数であってもよく、したがって少なくとも1,000個または少なくとも10,000個または少なくとも100,000個の反応予測因子であってもよいことが企図され、これは、最も一般的には少なくとも2個の異なる機械学習分類器(例えば線形カーネルサポートベクターマシン、一次または二次多項式カーネルサポートベクターマシン、リッジ回帰、エラスティックネットアルゴリズム、逐次最小問題最適化アルゴリズム、ランダムフォレストアルゴリズム、ナイーブベイズアルゴリズム、NMF予測因子アルゴリズムなど)を使用して確立される。
したがって、本発明の主題の例示的な一態様において、ダサチニブによる患者の腫瘍の処置に対する治療転帰を予測する方法が企図される。このような方法は、好ましくは、(a)患者の腫瘍のオミクスデータを得るステップと、(b)パスウェイモデルおよびオミクスデータを使用するパスウェイ分析エンジンにより、腫瘍に対するパスウェイモデル出力を計算するステップであって、パスウェイ出力が複数のパスウェイ要素および関連する活性値を含む、ステップと、(c)パスウェイモデル出力の対応するパスウェイ要素の活性値に、因子として個々のパスウェイエンティティの複数のエンティティ係数を適用して、それにより患者に対する治療転帰を予測するステップと、を含む。このような方法のパスウェイエンティティおよび個々のエンティティ係数は、好ましくは、MIR34A_(miRNA):−0.10545895;ETS1:−0.094264817;5_8_S_rRNA_(rna):0.086044958;CEBPB_(dimer)_(complex):0.067691407;FOSL1:−0.067263561;CEBPB:0.066698569;JUN/FOS_(complex):−0.064549881;Fra1/JUN_(complex):−0.060403293;FOXA2:0.059755319;FOS:−0.059560833;E2F1:−0.050992273;AP1_(complex):−0.049823492;anoikis_(abstract):−0.04853399;FOXA1:0.035994367;dNp63a_(tetramer)_(complex):−0.033478521;TP63:−0.02956134;MYC:0.026847479;TP63−2:−0.026423542;E2F−1/DP−1_(complex):−0.023462081;MYB:0.022211938;TAp63g_(tetramer)_(complex):0.019789929;HIF1A/ARNT_(complex):0.019222267;JUN/JUN−FOS_(complex):−0.019184424;MYC/Max_(complex):−0.018553276;XBP1−2:−0.017009915;negative_regulation_of_DNA_binding_(abstract):−0.016224139;PPARGC1A:−0.015525361;p53_tetramer_(complex):−0.013881353;TP63−5:0.011860936;p53_(tetramer)_(complex):−0.011120564;FOXM1:0.010515289;MIR146A_(miRNA)−0.004588203;MIR200A_(miRNA):0.004570842;MIR22_(miRNA):−0.00455296;MIRLET7G_(miRNA):−0.004534414;MIR26A1_(miRNA):−0.004515057;MIR141_(miRNA):0.004494806;MIR338_(miRNA):0.004473776;MIR23B_(miRNA):−0.004452502:MIR9−3_(miRNA):0.004432174;MIR26B_(miRNA):−0.004414627;MIR429_(miRNA):0.004401701;MIR26A2_(miRNA):−0.004393525;MIR17_(miRNA):0.004385947;DLEU2_(rna):−0.004376141;DLEU1_(rna):−0.004337657;TP53:−0.003302879;JUN:0.003189085;NOTCH4_(rna):0.002218066;およびE2F1/DP_(complex):0.000376653からなる群から選択される。
さらに別の企図される態様において、発明者らはまた、パスウェイモデルの出力を変更して患者の治療転帰を予測するための、高い精度向上反応予測因子の複数のエンティティ係数の使用も企図し、ここで、この高い精度向上反応予測因子は薬物に関連し、パスウェイモデルは患者のオミクスデータを使用する。
最も一般的には、複数のエンティティ係数は、高い精度向上反応予測因子の1〜50個のエンティティ係数であり、複数のエンティティ係数はエンティティ係数のサブセットであり、高い精度向上反応予測因子の全エンティティ係数の最上位三分位を含む。前述のように、パスウェイモデルが確率的パスウェイモデル(例えばPARADIGM)であることおよび薬物が化学療法薬であることが一般的に好ましい。
同じ数字が同じ構成要素を表す添付の図面と共に以下の好ましい実施形態の詳細な説明から、本発明の主題の様々な目的、特性、態様および長所がより明らかになろう。
発明者らは、パスウェイモデル分析からの大量の反応予測因子の作成が高精度モデルの特定において有用なだけでなく、患者の具体的なオミクスデータに基づく患者の治療転帰の予測に有用なエンティティ係数(entity coefficient)を得るためにも使用できることを発見した。異なる見地から見ると、複数の実験、精選および/または実際の治療データ(例えば様々な薬物および薬物治療および疾患に対する既知の転帰および既知のオミクスデータを伴う状態に対するもの)に関するパスウェイ分析における機械学習は、反応予測モデルを提供し、これが次に具体的な薬物による具体的な治療転帰に関連するエンティティ係数を提供することが理解されよう。次に、実際の患者オミクスデータに基づくパスウェイモデル出力に関して、因子としてこれらのエンティティ係数を使用して、患者がその薬物によって治療される場合の起こり得る治療転帰を予測することができる。
一例において、以下でより詳細にさらに記載するように、本発明者らは、最初に、比較的多数のゲノムワイドアッセイ(一般的にはRNA発現レベル、DNA配列情報およびコピー数情報を含む)、複数の組織タイプ由来の全部で約1,000種類の細胞株を得た。次に、PARADIGMソフトウェアを使用して発現およびコピー数データに基づいて推定パスウェイ活性(IPA)を生成させた。なおさらなる段階において、本発明者らは、これらの細胞株におけるおよそ140種類の化合物の薬物反応データ(GI50)も得て、Topmodelソフトウェアにおいて各化合物に対して複数の交差検証反応予測因子を作成した。とりわけ、試験した細胞株に対して、ダサチニブは、複数のモデルにおいて交差検証された精度を観察することによって最も正確に予測された薬物反応であったことが発見され、次いで上位のダサチニブ反応予測モデルをさらに分析した。ある分析において、下記でまたより詳細に示されるように、上位のダサチニブ反応予測モデルは、神経系細胞タイプにおいて予測有用性を有することが証明され、これを同様に、原発癌患者データ(TCGA)に対して上位の反応予測モデルを試験した場合の知見によっても検証した。とりわけ、ダサチニブは、急性リンパ芽球性白血病の処置に対する承認薬である。したがって、企図されるシステムおよび方法によって、ある薬物の使用が知られていないかまたは承認されていない状態におけるその薬物による治療の治療転帰の予測が可能となることが理解されよう。さらに、次にそのように特定された反応予測モデルのエンティティ係数を使用して、患者の実際のオミクスデータを使用した患者の治療転帰を予測することができることに留意されたい。
この文脈において、圧倒的な量の機械学習を行った予測モデルを準備することができ、これにより、様々なオミクスデータセットおよび/またはオミクスデータセットから準備されるパスウェイモデルに基づいた予測(例えば感受性)スコアの計算が可能になり得ることが理解されよう。残念ながら、例えば機械学習およびパスウェイ構築における基礎となる数学的な仮定、オミクスデータを得るための具体的な細胞培養または生検試料の使用、細胞培養または生検試料とともに使用される薬物などのために、これらのモデルは全て様々な固有のバイアスを有する。にもかかわらず、これらのモデルは全て、実際の細胞生物学的工程に基づき、したがって、少なくとも潜在的に価値がある見識を提供する。しかし、多様なモデルのいずれも、特定の薬物が患者において所望の治療転帰を有する可能性があるか否かを予測する特定の患者オミクス試料またはパスウェイモデルに対するマッチをどのモデルが提供するかについていかなる指針も提供しない。
発明者らは、今回、対応するヌルモデルに対して望ましく高い精度向上を有する薬物特異的な反応予測因子と、実際の患者データおよび特に患者データからのパスウェイモデルをマッチングするためのシステムおよび方法を発見しており、これにより、具体的な薬物を使用したその患者の起こり得る治療転帰の計算が可能となる。その文脈において、図1Aで単純化されるように、代表的な反応予測因子(予測モデル)は、感受性または予測スコアを与える機械学習アルゴリズムから得られる多変量式とみなされ得る。より詳しくは、および図1Bでさらに例示されるように、薬物に曝露された細胞培養物または組織から生成されるオミクスデータおよび/またはパスウェイモデルを使用する機械学習アルゴリズムを用いて反応予測因子を生成する。図1Bで示されるように、細胞または組織を薬物に曝露し、最も一般的には陰性対照またはそうでなければ対比的な対照との比較において(例えば薬物なし、または異なる細胞を用いて)感受性を観察する(例えばIC50、EC50などとして定量、または感受性もしくは耐性として定性的に評価)。次いで、細胞/組織からのオミクスデータおよび/またはパスウェイモデルを、トレーニングデータとして観察される因子と共に、機械学習アルゴリズムにおいて使用して、反応予測因子を得る。当然ではあるが、同じオミクスデータおよび/またはパスウェイモデルおよび観察される因子を、複数の機械学習アルゴリズムにおけるトレーニングデータとして使用することができることが理解され、全ての既知の機械学習アルゴリズムが本明細書中での使用に適切とみなされることが理解されよう。結果的に、1組のインビトロ実験で、複数のトレーニング済みモデル(すなわち、個々の機械学習アルゴリズムにより生成された反応予測因子)を提供できることが理解されよう。当技術分野でまた周知であるように、トレーニング済みモデルを得るために、入手可能なデータをトレーニングセットおよび評価セットに分割してもよく、または完全なトレーニング済みモデルを得るために全てのデータを使用することができる。異なる見地から見て、および図1Cで図示されるように、薬物に対する細胞または組織の感受性が既知である、薬物が既知である、ならびにオミクスデータおよび/またはパスウェイモデルが細胞または組織から容易に得られるトレーニングデータを使用して、機械学習アルゴリズムを用いて反応予測因子を生成することができる。次に、トレーニングデータと同じデータセット由来であり、前と同じように、薬物に対する細胞または組織の感受性が既知であり、薬物が既知であり、オミクスデータおよび/またはパスウェイモデルが細胞または組織から容易に得られる評価データを使用して、このように作成されたトレーニング済みモデルを検証することができる。したがって、多くのインビトロ試験が、患者のオミクスデータまたはパスウェイモデルを用いた計算に対して使用され得る多種多様の反応予測因子の基礎を形成することが理解されよう。次に、反応予測因子と併せて患者オミクスデータまたはパスウェイモデルを使用することにより、薬物に関して予測される反応スコア(予測される治療転帰または予測される感受性)を提供する。
最も有利には、企図するシステムおよび方法は、薬物および細胞または組織型と関連するオミクス情報数の増加をうまく利用することが認識されよう。さらに、本明細書中で与えられる例は複数の別個の薬物および細胞株に基づいたが、細胞のオミクスデータ、精選されたデータおよび単一の薬物にのみ関連する治療データ(一般的には別個の反応プロファイルを有する複数の別個の疾患(例えば癌)を有する細胞株と共に)から反応予測因子を生成できることが理解されよう。調べられる特定の薬物(1つまたは複数)にかかわらず、このような情報を使用して、膨大な数の個々の反応予測因子を準備することができ、したがって、反応予測因子のコレクションを具体的な癌のタイプおよび/または治療薬に限定する必要がないことが認識されよう。例えば、以下でさらに詳細に説明するように、発明者らは、パスウェイモデルオミクスデータとして、公開されているソース(例えばCCLE発現、CCLEコピー数、サンガー発現、サンガーコピー数)から異なるオミクスデータセットを得て、また、因子グラフに基づくパスウェイモデル(ここではPARADIGM)において同じオミクスデータを使用して、139個の異なる薬物について報告する10個の異なる入力データコレクションという結果に行き着いた。次に、これらのパスウェイモデルおよび既知の薬物反応を13種類の異なる機械学習アルゴリズム(線形カーネルSVM、一次多項式カーネルSVM、二次多項式カーネルSVM、リッジ回帰、Lasso、エラスティックネット、逐次最小問題最適化法、ランダムフォレスト、J48決定木、ナイーブベイズ、JRipルール、HyperPipesおよびNMF予測因子)に供して、その結果、全部で176,112個の反応予測因子を得た。
この文脈において、各タイプの反応予測因子が、固有のバイアスまたは仮定を含み、同一であるデータに対してトレーニングを行った場合でも、得られる反応予測因子が他のタイプの反応予測因子と比較してどのように動作するかについてそれらが影響を与え得ることに留意しなければならない。したがって、同じトレーニングデータセットを使用しても、異なる反応予測因子は異なる予測/精度向上を生じる。これまで、予測転帰を改善しようとする試みにおいて、1つの機械学習アルゴリズムを最適化して、同じデータセットに対する正確な予測を向上させた。しかし、アルゴリズムの固有のバイアスにより、このような最適化は、予測の精度(すなわち、「コイン投げ」に対する正確な予測能)を必ずしもを向上させない。このようなバイアスは、関連するメタデータを伴う疾患特異的なデータセットに関して異なる基本原理および分類器によって多種多様な反応予測因子をトレーニングすることにより、および対応するヌルモデルに対して所望の予測力を有するものをそのようにトレーニングされた反応予測因子から選択することにより、克服することができる。
当然ではあるが、上記のものは、比較的限定されたデータセットを用いた単なる代表的な筋書きであり、それらの個々の薬物とそれぞれ組み合わせて、多数のさらなるデータ(例えばインビトロデータ、臨床試験データ、研究データ、治療データなど)を使用することができ、異なる機械学習アルゴリズムによってそれぞれ計算して、膨大な数(例えば100,000〜500,000または500,000〜1,000,000または1,000,000〜5,000,000または5,000,000〜10,000,000およびさらに多い)の個々の反応予測因子に達することが理解されよう。このような計算は、コンピューティングインフラストラクチャーがなければ、ヒトの寿命の何倍も軽く超えることは明白である。
これもまた容易に認識されるはずであるが、コンピューティングインフラストラクチャーを使用しても、このような大量データは、患者の実際のデータセット(オミクスデータまたはパスウェイモデル)を細胞または組織培養のデータセットと連携させるべきである場合、膨大な計算量を必要とする。本発明者らは、今回、模擬ヌルセットおよび実際の患者データセット(オミクスデータまたはパスウェイモデル)を使用して1つの反応予測因子に対して2個の予測される反応を計算することによって、巨大な反応予測因子群でさえも、効果的に、および迅速に概念的に単純に分析できることを発見した。次に、予測反応間の差を使用して、何らかの1つの反応予測因子の性能を評価する。そのようにすれば、比較的単純な計算のみが必要とされ、反応予測因子は比較的単純であるため、比較的短時間で行うことができる。
結果的に、本明細書中で与えられる本発明の主題により、計算装置(1つまたは複数)の構築または構成がヒトの能力を超えた膨大な数のデジタルデータに対して動作することができることに留意すべきである。デジタルデータはオミクスデータおよび治療転帰の機械トレーニング済みのコンピューターモデルを表し得るが、デジタルデータは、実際の項目ではないこのような現実世界の項目の1つ以上のデジタルモデルの代表であることが理解されよう。むしろ、本明細書中で開示されるように、計算装置の記憶におけるこのようなデジタルモデルの具体化を通じて装置を正しく設定またはプログラミングすることによって、計算装置は、人間の能力を超える方式でデジタルデータまたはモデルを管理可能である。さらに、計算装置は、このような設定なしでは先験的能力を欠く。さらに、本発明の主題が、複雑なオミクス計算のコンピュータ分析に固有の問題を顕著に改善/軽減し、正確なモデル選択に関する指針を提供し、先験的な選択される機械学習アルゴリズムによるバイアスを排除することが理解されよう。
異なる見地から見て、コンピュータ技術における本発明のシステムおよび方法を使用して、オミクスデータに対する計算モデルにおける固有の問題が解決されることが理解されよう。したがって、コンピュータなしでは、問題、したがって本発明の主題は存在しない。より具体的には、本明細書中で提供されるシステムおよび方法の結果、他よりも精度向上が大きい1つ以上の薬物特異的な反応予測因子モデルが得られ、これは、治療転帰予測の迅速な決定のためのエンティティ係数を提供し、究極的にはより短い潜時で実際の患者データに基づく予測結果が生成される。
コンピュータに向けられるあらゆる言語、分析エンジンまたは機械学習システムは、個々に、またはまとめて動作する、サーバ、インターフェース、システム、データベース、エージェント、ピア、エンジン、コントローラー、モジュールまたは他のタイプの計算装置を含む、計算装置の何らかの適切な組み合わせを含むように解釈すべきであることに留意すべきである。計算装置は、タンジブルな、持続性コンピュータが読み取り可能なストレージ媒体(例えば、ハードドライブ、FPGA、PLA、固相ドライブ、RAM、フラッシュ、ROMなど)上に格納されるソフトウェアの指示を実行するように構成されるプロセッサを含むことが認識されよう。ソフトウェアの指示は、計算装置を構成するか、またはそうでなければ計算装置をプログラムして、開示の装置に関して以下で考察する役割、責任または他の機能を提供する。さらに、開示される技術は、コンピュータに基づくアルゴリズム、工程、方法または他の指示の実行に関連する開示の段階をプロセッサに実行させるソフトウェアの指示を格納する持続性コンピュータ可読媒体を含むコンピュータプログラム製品として具体化することができる。いくつかの実施形態において、様々なサーバ、システム、データベースまたはインターフェースは、おそらくHTTP、HTTPS、AES、官民鍵交換、ウェブサービスAPI、既知の金融取引プロトコールまたは他の電子情報交換方法に基づき、標準化プロトコールまたはアルゴリズムを使用してデータを交換する。装置間のデータ交換は、パケット交換方式のネットワーク、インターネット、LAN、WAN、VPNまたは他のタイプのパケット交換方式ネットワーク、回路交換方式ネットワークおよび/またはセル交換方式ネットワークで行われ得る。
本明細書中の記載において、および以下の特許請求の範囲を通じて使用されるように、システム、エンジン、サーバ、装置、モジュールまたは他のコンピュータ要素がメモリ中のデータに対して機能を遂行するかまたは実行するように構成されると記載されているとき、「構成される(configured to )」または「プログラムされる(programmed to)」の意味は、メモリ中に格納される標的データまたはデータオブジェクトに対して一連の機能を実行するかまたは動作するようにコンピュータ要素のメモリ中で格納される一連のソフトウェア指示によってプログラムされている、1つ以上のプロセッサまたはコンピュータ要素のコアとして定義される。
図2のフローチャートは、代表として、本発明の主題に従う典型的なワークフローを示す。ここで、第1段階において、オミクスおよび/またはパスウェイモデルデータおよび薬物反応が既知である複数の細胞/組織/患者データを精選する。当然ではあるが、このようなデータの精選に適切な全ての既知の情報の形態は、本明細書中での使用に適切とみなされ、医療サービスプロバイダー、研究室、病院、学術機関および/または保険キャリアからの患者データを含むことが理解されよう。したがって、データは、データベースもしくは分析装置から印刷してもよく、または電子フォーマットであり得る。さらに、データは、必ずしもヒトの試験由来である必要はなく、非ヒト起源(例えばげっ歯類、サルなど)のものでもあり得ることが理解されよう。同様に、データは細胞または組織培養由来であり得る。さらに、データが生データまたはオミクスデータである場合、このようなデータは一般的にはパスウェイ分析システムで処理され、特に好ましいパスウェイモデルシステムは、因子グラフに基づくシステム(例えばPARADIGM)を含む。またさらに、データが、細胞、組織または患者を処置するために使用した(1つの)薬物または(複数の)薬物に関する情報ならびに適切な転帰記述子(例えば細胞または組織に対する薬物感受性または部分もしくは完全反応、ヒトに対する無病生存期間、再発、寛解)も含むことが一般的に好ましい。
ある企図される例において、細胞株のそれぞれについての具体的な薬物に対する感受性が既知である具体的な癌細胞タイプ(例えばメラノーマ)の別個の癌細胞株のコレクションから初期データを精選してもよい。このような感受性は実験的に決定し得るか、または文献から精選してもよい。あるいはまたはさらに、具体的な癌細胞タイプの別個の癌細胞株の収集物を使用する代わりに、具体的な癌細胞タイプの生検試料からデータを精選してもよく、薬物に対する感受性をインビトロで決定してもよく、または患者を薬物治療に供した際の患者治療転帰から推論してもよい。別の企図される例において、具体的な薬物に対する感受性が知られる細胞または組織についてオミクスデータが利用可能である場合、データは、公開ソースから精選し得る(例えば、臨床試験、学術論文、注釈付きのオミクスデータベースなど)。さらなる例において、細胞または組織は必ずしも同じ癌タイプ由来である必要はなく、実際には複数および別個の癌タイプ(例えば神経系の癌、肺、消化器系、非尿生殖器系、皮膚、腎臓、乳房、甲状腺、血液、骨、膵臓、軟組織などの癌)に由来し得ることが理解されよう。同様に、(同じ癌タイプまたは複数の癌タイプの)細胞の感受性が既知であることは、1つの薬物に限定される必要はないが、その複数の薬物感受性が同じ分析で使用され得ることが理解されよう。異なる見地から見て、感受性または他の転帰予測因子が既知である複数の細胞株/組織/生検試料の使用は、複数の別個の反応予測因子を生成させるための入力データとして使用され得る。
最も一般的には、初期データのソースに依存して、データは、オミクスデータ、例えば全ゲノムシーケンシングデータ、エクソームシーケンシングデータ、RNAシーケンシングおよび/または転写レベルデータ、定量的プロテオミクスデータおよび/またはタンパク質活性データなどである。好ましくは、次にこれらのデータを処理してパスウェイ活性情報を得て、GSEA、SPIA、PathOlogist、ARACNE、MINDy、CONEXIC、NetBoxおよびMEMoを含む、全ての既知のパスウェイ分析方法およびアルゴリズムが、本明細書中での使用に適切と思われる。しかし、特に好ましい態様において、パスウェイ分析は、ハイスループットゲノムデータにおけるパスウェイ推測に対する因子グラフフレームワークであるPARADIGMを使用して行う。ここで、遺伝子およびその産物の発現および既知の活性をコードする一連の相互接続される可変要素として、因子グラフによって遺伝子をモデル化し、これにより、多くのタイプのオミックデータをエビデンスとして組み込むことが可能になる。このような方法により、パスウェイの活性(例えば内部遺伝子状態、相互作用またはハイレベル「出力」)が確率的推測を使用して患者においてどの程度変更されるかの予測が可能になる(例えばBioinformatics.2010 Jun 15;26(12):i237−i245を参照)。オミクスデータに関するパスウェイ分析によって、有利におよび実質的に、機械学習を介して処理されるデータのボリュームが減少することにも留意すべきである。代わりに、パスウェイ分析(特にPARADIGMを使用する場合)は、パスウェイ要素(例えば遺伝子、タンパク質、タンパク質複合体)が多数の因子または値に関連する比較的単純なデータ構造を提供する。
この情報(例えば具体的な細胞または組織に対する薬物反応およびパスウェイモデル、一般的には陰性対照および/または他のパラメーターまたはメタデータと組み合わせる)を使用して、次に特異的な機械学習アルゴリズムを使用して反応予測因子を計算することができる。しかし、最も好ましい態様において、別個の反応予測因子のライブラリを得るために複数の別個の他の機械学習アルゴリズムを使用して、同じ情報について多数のさらなる反応予測因子を生成する。上で既に記載したように、さらなる複数の異なる機械学習アルゴリズムとともに、さらなる異なる薬物、オミクスデータセット、パスウェイモデリングおよび細胞タイプをさらに使用することができ、これにより利用可能な反応予測因子の数が指数関数的に増加する。実際に、このような組み合わせを使用すると、反応予測因子の数は、単一の薬物に対してさえも、容易に1,000個を超え、より一般的には少なくとも10,000個、さらにより一般的には少なくとも100,000個の反応予測因子であり、これらを全て、反応予測因子ライブラリに収集することができることが認識されよう。しかし、図1Aで代表的に示されるように、反応予測因子が比較的単純で、データ/ファイルサイズが小さいことが認識されよう。本質的に、反応予測因子は、複数のパスウェイ要素および関連因子を含む多変数方程式とみなすことができ、それによって細胞または生検の測定オミクスデータを使用して感受性(または他の転帰の目安)スコアの単純な計算が可能になる。
反応予測因子の作成後、各反応予測因子に対する予測の質を評価してもよく、最も好ましくは、無作為選択を超える予測力を有する反応予測因子を保持する。異なる見地から見て、様々な反応予測モデルを、その精度の向上に関して評価してもよい。容易に理解されようが、精度を評価する多数の方式があり、特定の選択肢は、少なくとも部分的に、使用する評価基準およびアルゴリズムに依存し得る。例えば、適切な評価基準は、精度値、精度向上、性能評価基準または対応するモデルの他の測定を含む。
さらなる例となる評価基準は、曲線下面積評価基準、R2値、p−値評価基準、シルエット係数、混同行列または反応予測因子の性質に関連する他の評価基準を含む。反応予測因子の数または精度分布に依存して、予測のために使用する反応予測因子を、(例えば最高の精度向上または最高の精度スコアなどを有する)上位モデルであるとして、または上位n分位値(三分位値、四分位値、五分位値など)であるとして、または全てのモデルの上位n%(上位5%、上位10%などで)であるとして選択してもよいことが理解されよう。例えば高い精度向上モデルは一般的には精度向上の上位四分位に存在する。
次に、データベースにおける各反応予測因子のヌルモデルを使用して実際の患者データの高い予測スコアとのマッチを統計学的に選択するために、反応予測因子のライブラリまたは個々の反応予測因子(両者とも一般的には上述のような無作為選択を超える最小予測力を使用して選択される)を使用してもよい。より具体的には、無作為選択データセットの中程度の数(例えば100〜500または500〜1,000または1,000〜10,000)を使用して、各反応予測因子に関するヌルモデルを計算する。最も一般的には、これらのデータセットは、反応予測因子の計算に使用されるが、ヌルモデルが生成される反応予測因子の計算には使用されない、パスウェイモデルデータおよび/またはオミクスデータを含む。予想され得るように、このように計算されたヌルモデルは、無関係なまたはマッチが低いパスウェイモデルまたはオミクスデータのバックグラウンドシグナル分布(例えば平均値および標準偏差)を提供し、これを結果のさらなる正規化および順位付けのために使用することができる。
例えば1つの反応予測因子が、既知のデータセットおよび既知の転帰に関して高い予測スコア(例えば高レベルの感受性または耐性)を予測し、無作為選択データセットに関して平均的な予測スコア(バックグラウンドシグナル)を予測する状況において、高いスコアを、生スコアとして記し、次にこれを、バックグラウンドシグナル分布を使用して補正し、標準化スコアに到達する。この標準化スコアは、既知のデータセットと、特定の細胞または組織の薬物を用いて当初計算された反応予測因子性能との適合を特徴づけることが理解されよう。したがって、ヌルモデルと対応する試験モデルまたは上位モデル(対応するモデルの中で最大の精度向上を有するモデル)間の比較、および生スコアの相違、およびより好ましくは標準化スコアの相違を、順位付けのために使用することができる。パスウェイエンティティおよび関連するエンティティ係数と共に、上位の反応予測因子(各薬物に対して、複数の薬物を試験する場合)を特定する。次に、このように選択された反応予測因子(1つまたは複数)を様々な方式で、特に実際の患者オミクスおよびパスウェイ分析データに基づく薬物に対する治療反応の予測に使用することができる。したがって、および別段の指示がない限り、「高い精度向上反応予測因子」という用語は、本明細書中で使用される場合、反応予測因子の標準化順位付けにおける上位三分位に順位付けられる反応予測因子を指す。
上述のように、各反応予測因子が比較的単純なデータ構造を有し、対応するエンティティ係数(一般的には数値)と共に、複数のエンティティ識別子(例えばMIR34A、AP1複合体、TP63などのパスウェイエンティティ)を列挙することに特に留意すべきである。必要に応じて、エンティティの機能(例えば細胞周期、アポトーシスなど;未知の機能はNULLとして表示する)も、以下の表1において反応予測因子に関して例として示されるように含めてもよい。
反応予測因子を使用して、実際の患者のパスウェイモデル出力から得た患者データを、反応予測因子において対応するパスウェイエンティティのエンティティ係数を使用して処理することができると認識されよう。例えば第一のパスウェイエンティティ(例えばAP1)の(患者オミクスデータに基づく)パスウェイモデル出力が第1の値である場合、その第1の値を、反応予測因子における対応する係数(例えばAP1に対する係数)により修正して、第1の修正値を生成すること等が可能である。次に、修正された出力エンティティ値(対応する係数により修正)の合計は、感受性(または他の転帰の目安)スコアを計算したモデルに対応する数値的な指標を提供し、これは、治療転帰に関する計算された予測値(例えば薬物感受性に対する正の数値)に対応する。
さらに企図される態様において、本明細書中で与えられるシステムおよび方法が、反応予測に関して望ましい高精度で、1つ以上の医薬品(例えば複数の細胞株が複数の治験薬物または薬物候補に曝露される開発パイプラインにおける治験薬物または薬物候補)を特定するためにも使用され得ることも認識されよう。このような特定は、複数の薬物が開発中である場合、ならびに企図されるシステムおよび方法が、望ましい高精度で予測することができる感受性(または他の転帰の目安)スコアを有するとして薬物を特定する場合、特に有益である。なおさらに、企図されるシステムおよび方法は、以下でより詳細に示すように、これまで認識されていない、または理解されていない適応症において薬物を特定するためにも適切である。簡潔に述べると、企図されるシステムおよび方法は、複数の適応症に関して複数の薬物を試験する場合に使用してもよい。反応予測モデルは、薬物ごとの最高の精度向上に従い、次いで(最高の精度向上を有する)薬物により最終的に順位付けされる。
このような計算は、反応予測因子のデータ構造が単純化されており、患者データを一般的に行われるようにインビトロモデルデータに適合させようと試みる機械学習工程を必要としないので、迅速であることが特に認識されよう。
実施例
以下の表2で示される様々な異なる機械学習分類器と組み合わせて、神経膠芽腫と診断された患者からの様々なオミクスデータ(例えば転写およびコピー数)およびパスウェイデータ(例えばPARADIGM)、ならびに異なる細胞タイプの既知のゲノムデータセット、様々な薬物への曝露および薬物に対するそれぞれの関連する感受性から構築した反応予測因子に基づいて、神経膠芽腫と診断された患者に適切な薬物としてダサチニブが特定された。
以下の表2で示される様々な異なる機械学習分類器と組み合わせて、神経膠芽腫と診断された患者からの様々なオミクスデータ(例えば転写およびコピー数)およびパスウェイデータ(例えばPARADIGM)、ならびに異なる細胞タイプの既知のゲノムデータセット、様々な薬物への曝露および薬物に対するそれぞれの関連する感受性から構築した反応予測因子に基づいて、神経膠芽腫と診断された患者に適切な薬物としてダサチニブが特定された。
より具体的には、上記のデータセット、薬物および分類器を使用して、29,352個の完全にトレーニングされた薬物反応モデルを構築し、146,760個のさらなる評価モデルを構築し(5−倍CVで)、全部で176,112個のモデルを分析して、様々な薬物に対する多数の反応予測因子を得た。マイクロアレイまたはシーケンシング技術を介して、神経膠芽腫患者からのゲノム規模データを個々の癌試料から収集した。同じ試料(例えば発現プロファイリングおよびコピー数推定)において独立したアッセイを行い、どのデータタイプが最良の予測を提供するかを評価した。これらの患者データを因子グラフに基づくモデル(PARADIGM)において統合した。オミクスデータのエビデンスを与えるパスウェイネットワークに対して最も可能性のある状態を推定し、推測されるパスウェイ活性として報告した(すなわちパスウェイモデルは、個々のパスウェイ要素の活性を用いて確立した)。この文脈において、企図されるシステムおよび方法は、単一のモデルの予測最適化にも基づいておらず、選択されたオミクスパラメーターと治療予測との最良の相関の特定にも基づいていないことが特に認識されよう。
次いで、予測因子データベースにおける反応予測因子および実際の患者データを使用して、1,000個の無作為選択データセットによって各反応予測因子に関してヌルモデルを計算し、各ヌルモデルに関して平均値および標準偏差を記録した。次いで、各反応予測因子に対する患者データセットを使用して試験モデルを計算し、個々のヌルモデルからの結果を使用してその結果を標準化した。図3は、代表として、標準化スコアの順位付けを示す。ここで、各縦線は、具体的な薬物によりグループ化された反応予測因子の数の、平均値、最小値および最大値の結果を表す。図3から見られ得るように、左側の反応予測因子は、より一貫して正確に予測され、最も一貫して予測された薬物は、神経膠芽腫と診断された患者に関するダサチニブである。とりわけ、ダサチニブが、(「フィラデルフィア染色体」タンパク質を阻害する)経口Bcr−Ablチロシンキナーゼ阻害剤として元来開発され、慢性骨髄性白血病およびフィラデルフィア染色体陽性急性リンパ芽球性白血病の患者における第1選択薬として承認されたことが理解されよう。当然ではあるが、上記の工程を、異なる神経膠芽腫(または他の選択された癌)癌細胞株または生検試料のみを使用して、および神経膠芽腫の処置に有効であることが既知であるか、または有効性が予想される薬物のみを使用して、神経膠芽腫(または他の選択された癌)からのデータのみを初期データとして含むように修正することができることも認識されよう。次に、このような修正工程によって、神経膠芽腫(または他の選択された癌)および特定の薬物のみに特異的である反応予測因子がもたらされる。一方で、上記の工程は、異なる神経膠芽腫(または他の選択された癌)癌細胞株または生検試料、および(場合によっては)神経膠芽腫の処置に有効であることが既知であるか、または有効性が予想される複数の異なる薬物を使用して、神経膠芽腫(または他の選択された癌)からのデータのみを初期データとして含むように修正することができる。次に、このような修正された工程によって、神経膠芽腫(または他の選択された癌)および複数の薬物候補に特異的な反応予測因子がもたらされる。
したがって、患者における薬物に対する反応は、(a)薬物標的のアゴニスト作用である方式で、および(b)オミクスデータ/パスウェイモデルの具体的なセットの関数として薬物反応を予測するように各モデルを最適化した予測モデルのコレクションへの入力データとして使用する場合には、患者のオミクスデータ/パスウェイモデルに基づいて、予測することができることが理解されよう。さらに、予測された結果を対応するヌルモデルと比較することによって、バックグラウンドを上回る統計学的に関連がある予測が報告され、次いでこれにより、反応予測を順位付けすることが可能になる。さらに、患者データが固有バイアスを持ち込まないことを確実にするために、患者データから順列も作成することができ、これを次にヌルモデルに関して記載される方式で分類して、患者データおよびヌルモデルが同様に分布することを確実にする。
本明細書中での使用に適切なオミクスデータおよびパスウェイモデルに関して、全てのオミクスデータおよびパスウェイモデルが適切と考えられ、代表的なオミクスデータは、シーケンシングデータ、特に腫瘍対正常データ、例えば全ゲノムシーケンシングデータ、エクソームシーケンシングデータなどを含むことに留意すべきである。さらに、適切なオミクスデータはまた、トランスクリプトミクスデータおよびプロテオミクスデータも含む。同様に、適切なパスウェイ分析は、全て本明細書中で参照により組み込まれる国際公開第2011/139345A2号パンフレット、同第2013/062505A1号パンフレットおよび同第2014/059036号パンフレットに記載のような、遺伝子セットエンリッチメント解析(GSEA、Broad Institute)に基づくモデル、シグナル伝達パスウェイインパクト解析(SPIA、Bioconductor)に基づくモデルおよびPathOlogistパスウェイモデル(NCBI)ならびに因子グラフに基づくモデルおよび特にPARADIGMを含む。図4は、平均精度をオミクスデータのタイプおよびパスウェイモデルの関数として示す、代表的な比較結果を提供する。明確に理解され得るように、最高精度は、PARADIGMを使用して処理したサンガー発現データを用いて達成され、パスウェイモデルを得た。サンガー発現およびコピー数データを使用しても、同様に高精度が達成され、再びPARADIGMを使用して処理して、対応するパスウェイモデルを得た。とりわけ、パスウェイモデリングなしのサンガー発現データのみでも、幾分低いが比較的高い精度が得られる。コピー数オミクスデータのみは、それ自体またはPARADIGMを使用して処理した場合、幾分低く順位付けされた。
細胞株に関するオミクスデータおよびパスウェイモデルを使用して、このように得られた予測の精度も照合し、結果を図5で示す。ここで、調整された感受性スコアをプロットし、黒丸はどの感受性データが利用可能であったかについての予測を示し、白丸はどの感受性データが利用可能でなかったかについての予測を示し、不正確な予測についてはxで標識する。とりわけ、神経細胞株におけるダサチニブに対する予測精度は77.8%であり、これは神経膠芽腫患者に関する予測と一致する。
同様に、図5からわかるようにダサチニブ耐性を正確に予測することができることは注目すべきである。図6で見られ得るように、トレーニング細胞株パネルに対応する組織におけるTCGA試料からの初期患者データを使用して、同様の照合を行った。組織効果が細胞株と患者データとの間で同様に挙動することに留意すること。例えば神経系の株と同様に、GBM患者試料は、レスポンダーおよび非レスポンダーサブセットを含有することが予測される。さらに、ダサチニブがヒト腎臓明細胞癌腫の優れた代替的薬物候補であり得ることに留意すべきである。最も一般的には、反応予測因子が神経腫瘍に関して特に正確であることが示されたので、神経腫瘍(例えば神経膠芽腫)と診断された患者から患者データを得る。その目的で、腫瘍は生検試料であり得、オミクスデータは組織試料について、好ましくは適合する正常対照に対して決定され得る。次に、PARADIGM(または他の適切なパスウェイ分析ソフトウェア)においてオミクスデータを処理して、反応予測因子におけるエンティティに対応するエンティティに対するデータを含むパスウェイモデルを得る。次に、患者PARADIGM値を対応するエンティティ係数に適用し、反応予測因子エンティティ係数および患者からの実際のパスウェイデータに基づく結果は、反応予測因子に関連する治療転帰を示す。
上記表1のエンティティ係数をさらに参照して、ダサチニブに対する上位順位の(またはそうでなければ所望の)反応予測因子についてのそのように得られた係数の一部(およびより好ましくは全て)を実際の患者データと組み合わせて使用することができることは明白であろう。したがって、ダサチニブでの神経膠芽腫の処置に対する反応予測因子は、以下のエンティティおよび場合によっては個々の係数(ここではエンティティ:係数ペアとして挙げる)の少なくとも2個または少なくとも3個または少なくとも5個または少なくとも7個または少なくとも10個を含み得る:MIR34A_(miRNA):−0.10545895;ETS1:−0.094264817;5_8_S_rRNA_(rna):0.086044958;CEBPB_(dimer)_(complex):0.067691407;FOSL1:−0.067263561;CEBPB:0.066698569;JUN/FOS_(complex):−0.064549881;Fra1/JUN_(complex):−0.060403293;FOXA2:0.059755319;FOS:−0.059560833;E2F1:−0.050992273;AP1_(complex):−0.049823492;anoikis_(abstract):−0.04853399;FOXA1:0.035994367;dNp63a_(tetramer)_(complex):−0.033478521;TP63:−0.02956134;MYC:0.026847479;TP63−2:−0.026423542;E2F−1/DP−1_(complex):−0.023462081;MYB:0.022211938;TAp63g_(tetramer)_(complex):0.019789929;HIF1A/ARNT_(complex):0.019222267;JUN/JUN−FOS_(complex):−0.019184424;MYC/Max_(complex):−0.018553276;XBP1−2:−0.017009915;negative_regulation_of_DNA_binding_(abstract):−0.016224139;PPARGC1A:−0.015525361;p53_tetramer_(complex):−0.013881353;TP63−5:0.011860936;p53_(tetramer)_(complex):−0.011120564;FOXM1:0.010515289;MIR146A_(miRNA)−0.004588203;MIR200A_(miRNA):0.004570842;MIR22_(miRNA):−0.00455296;MIRLET7G_(miRNA):−0.004534414;MIR26A1_(miRNA):−0.004515057;MIR141_(miRNA):0.004494806;MIR338_(miRNA):0.004473776;MIR23B_(miRNA):−0.004452502:MIR9−3_(miRNA):0.004432174;MIR26B_(miRNA):−0.004414627;MIR429_(miRNA):0.004401701;MIR26A2_(miRNA):−0.004393525;MIR17_(miRNA):0.004385947;DLEU2_(rna):−0.004376141;DLEU1_(rna):−0.004337657;TP53:−0.003302879;JUN:0.003189085;NOTCH4_(rna):0.002218066;およびE2F1/DP_(complex):0.000376653。
本明細書中での使用に適切なさらなる考察は、全て本明細書中で参照により組み込まれる、2014年5月28日提出の国際公開第2014/193982号パンフレット、2016年1月19日提出の同第2016/118527号パンフレット、2016年3月3日提出の同第2016/141214号パンフレットおよび2016年6月15日提出の同第2016/205377号パンフレットで開示される。
本明細書中の記載において使用される場合、および続く特許請求の範囲を通じて、「a」、「an」および「the」の意味は、文脈から別段の明らかな指示がない限り、複数の言及も含む。また、本明細書中の記載において使用される場合、「in」の意味は、文脈から別段の明らかな指示がない限り、「in」および「on」を含む。本明細書中でまた使用される場合、および文脈から別段の指示がない限り、「にカップリングされる(coupled to)」という用語は、直接的なカップリング(互いにカップリングされる2個の要素が互いに接触する)および間接的なカップリング(少なくとも1個のさらなる要素が2個の要素間に配置される)の両方を含むものとする。したがって、「にカップリングされる(coupled to)」および「とカップリングされる(coupled with)」という用語は同意語として使用される。最後に、および文脈が逆のことを示さない限り、本明細書中で示される全ての範囲は、それらの終点を含むものとして解釈すべきであり、オープンエンド型の範囲は、商業的に実際的な値を含むと解釈されるべきである。同様に全ての値のリストは、文脈が反対のことを示さない限り、中間値を含むものと考えるべきである。
本明細書中で本発明の概念から逸脱することなく、既に述べたもの以外の多くのさらなる修正が可能であることは当業者とって明らかであろう。したがって、本発明の主題は、添付の特許請求の範囲を除いて制限されるものではない。さらに、明細書および特許請求の範囲の両方の解釈において、全ての用語は、内容と一致する最も広く可能な方式で解釈すべきである。特に「含む(comprises)」および「含むこと(comprising)」という用語は、包括的に、要素、構成成分または段階を指すと解釈すべきであり、言及される要素、構成成分または段階が、明らかには言及されていない他の要素、構成成分または段階と共に、存在してもよく、または利用されてもよく、またはそれらと組み合わせてもよいことを示す。明細書特許請求の範囲がA、B、C・・・およびNからなる群から選択される何れかのうち少なくとも1つを指す場合、文章は、A+NまたはB+Nなどではなく、その群から1個の要素のみを必要とするように解釈すべきである。
Claims (35)
- 複数の反応予測因子を処理する方法であって、
複数の反応予測因子を提供するステップであって、前記反応予測因子のそれぞれが、薬物に関連し且つ複数のパスウェイ要素および関連するエンティティ係数を有する、ステップと;
対応するヌルモデルと比較して前記反応予測因子のそれぞれについて精度向上評価基準を計算して、単一の反応予測因子を選択するステップと;
選択された反応予測因子のパスウェイ要素および関連するエンティティ係数のサブセット、ならびに患者腫瘍のパスウェイモデル出力を少なくとも使用してスコアを計算するステップと、
を含む方法。 - 前記複数の反応予測因子が、少なくとも1,000個の反応予測因子である、請求項1に記載の方法。
- 前記複数の反応予測因子が、少なくとも100,000個の反応予測因子である、請求項1に記載の方法。
- 前記エンティティ係数についてのパスウェイ要素が、制御RNA、免疫シグナル伝達成分、細胞分化因子、細胞増殖因子、アポトーシスシグナル伝達成分、血管新生因子および細胞周期チェックポイント成分からなる群から選択される、請求項1に記載の方法。
- 前記精度向上評価基準が、精度値、精度向上、性能評価基準、曲線下面積評価基準、R2値、p−値評価基準、シルエット係数および混同行列からなる群から選択される、請求項1に記載の方法。
- 前記複数の反応予測因子が、少なくとも2つの異なる機械学習分類器を使用して確立される、請求項1に記載の方法。
- 前記少なくとも2つの異なる機械学習分類器が、線形カーネルサポートベクターマシン、一次または二次多項式カーネルサポートベクターマシン、リッジ回帰、エラスティックネットアルゴリズム、逐次最小問題最適化アルゴリズム、ランダムフォレストアルゴリズム、ナイーブベイズアルゴリズムおよびNMF予測因子アルゴリズムからなる群から選択される、請求項6に記載の方法。
- 前記対応するヌルモデルが、前記ヌルモデルを作成する反応予測因子の計算で使用されない無作為選択データセットを使用して計算される、請求項1に記載の方法。
- 前記パスウェイ要素および関連するエンティティ係数のサブセットが、1〜50個のエンティティ係数を含む、請求項1に記載の方法。
- 前記患者腫瘍のパスウェイモデル出力が、前記選択された反応予測因子におけるパスウェイ要素のサブセットと同じであるパスウェイ要素を含む、請求項1に記載の方法。
- 前記スコアが、前記薬物による処置に関する感受性スコアである、請求項1に記載の方法。
- 薬物を使用した患者の治療転帰を予測するために患者における腫瘍のパスウェイモデルの出力を使用する方法であって、
前記腫瘍のパスウェイモデルにおける対応するパスウェイ要素の出力値に関して、因子として薬物に関する高い精度向上反応予測因子におけるパスウェイ要素の複数のエンティティ係数を使用して、前記薬物を使用した患者の治療転帰スコアを予測するステップを含み;
前記腫瘍のパスウェイモデルが、前記患者のオミクスデータを使用して計算され、複数のパスウェイ要素および関連する出力値を含み;
前記高い精度向上反応予測因子が、対応するヌルモデルと比較して既定の最小の精度向上を有し;
前記高い精度向上反応予測因子が複数の反応予測因子から選択され、前記反応予測因子のそれぞれが前記薬物に関連する、
方法。 - 前記複数のエンティティ係数が、高い精度向上反応予測因子の1〜50個のエンティティ係数である、請求項12に記載の方法。
- 前記複数のエンティティ係数がエンティティ係数のサブセットであり、前記高い精度向上反応予測因子の全てのエンティティ係数の上位三分位を含む、請求項12に記載の方法
- 前記パスウェイモデルが確率的パスウェイモデルである、請求項12に記載の方法。
- 前記パスウェイモデルがPARADIGMである、請求項12に記載の方法。
- 前記既定の最小の精度向上がヌルモデルよりも少なくとも50%高い、請求項12に記載の方法。
- 前記ヌルモデルが、前記ヌルモデルを作成する高い精度向上反応予測因子の計算において使用されない無作為選択データセットを使用して計算される、請求項12に記載の方法。
- 前記複数の反応予測因子が、少なくとも100,000個の反応予測因子である、請求項12に記載の方法。
- 前記複数の反応予測因子が、少なくとも2個の異なる機械学習分類器を使用して確立される、請求項12に記載の方法。
- 前記少なくとも2個の異なる機械学習分類器が、線形カーネルサポートベクターマシン、一次または二次多項式カーネルサポートベクターマシン、リッジ回帰、エラスティックネットアルゴリズム、逐次最小問題最適化アルゴリズム、ランダムフォレストアルゴリズム、ナイーブベイズアルゴリズムおよびNMF予測因子アルゴリズムからなる群から選択される、請求項20に記載の方法。
- 前記薬物が化学療法薬である、請求項12に記載の方法。
- ダサチニブによる患者の腫瘍の治療の治療転帰を予測する方法であって、
前記患者の腫瘍のオミクスデータを得るステップと;
パスウェイモデルおよび前記オミクスデータを使用するパスウェイ分析エンジンによって、前記腫瘍に対するパスウェイモデル出力を計算するステップであって、前記パスウェイ出力が複数のパスウェイ要素および関連する活性値を含む、ステップと;
前記パスウェイモデル出力の対応するパスウェイ要素の活性値に、因子として個々のパスウェイエンティティの複数のエンティティ係数を適用し、それにより前記患者の治療転帰を予測するステップと、
を含み;
前記パスウェイエンティティおよび個々のエンティティ係数が、MIR34A_(miRNA):−0.10545895;ETS1:−0.094264817;5_8_S_rRNA_(rna):0.086044958;CEBPB_(dimer)_(complex):0.067691407;FOSL1:−0.067263561;CEBPB:0.066698569;JUN/FOS_(complex):−0.064549881;Fra1/JUN_(complex):−0.060403293;FOXA2:0.059755319;FOS:−0.059560833;E2F1:−0.050992273;AP1_(complex):−0.049823492;anoikis_(abstract):−0.04853399;FOXA1:0.035994367;dNp63a_(tetramer)_(complex):−0.033478521;TP63:−0.02956134;MYC:0.026847479;TP63−2:−0.026423542;E2F−1/DP−1_(complex):−0.023462081;MYB:0.022211938;TAp63g_(tetramer)_(complex):0.019789929;HIF1A/ARNT_(complex):0.019222267;JUN/JUN−FOS_(complex):−0.019184424;MYC/Max_(complex):−0.018553276;XBP1−2:−0.017009915;negative_regulation_of_DNA_binding_(abstract):−0.016224139;PPARGC1A:−0.015525361;p53_tetramer_(complex):−0.013881353;TP63−5:0.011860936;p53_(tetramer)_(complex):−0.011120564;FOXM1:0.010515289;MIR146A_(miRNA)−0.004588203;MIR200A_(miRNA):0.004570842;MIR22_(miRNA):−0.00455296;MIRLET7G_(miRNA):−0.004534414;MIR26A1_(miRNA):−0.004515057;MIR141_(miRNA):0.004494806;MIR338_(miRNA):0.004473776;MIR23B_(miRNA):−0.004452502:MIR9−3_(miRNA):0.004432174;MIR26B_(miRNA):−0.004414627;MIR429_(miRNA):0.004401701;MIR26A2_(miRNA):−0.004393525;MIR17_(miRNA):0.004385947;DLEU2_(rna):−0.004376141;DLEU1_(rna):−0.004337657;TP53:−0.003302879;JUN:0.003189085;NOTCH4_(rna):0.002218066;およびE2F1/DP_(complex):0.000376653からなる群から選択される、
方法。 - 前記パスウェイモデルが確率的パスウェイモデルである、請求項23に記載の方法
- 前記パスウェイモデルがPARADIGMである、請求項23に記載の方法。
- 前記患者のオミクスデータが、コピー数データ、発現レベルデータ、DNA配列データおよび突然変異データのうちの少なくとも1つを含む、請求項23に記載の方法
- 前記患者の治療転帰が、ダサチニブに対する感受性である、請求項23に記載の方法。
- 前記腫瘍が神経腫瘍である、請求項23に記載の方法。
- 患者の治療転帰を予測するためにパスウェイモデルの出力を修正するための、高い精度向上反応予測因子の複数のエンティティ係数の使用であって、前記高い精度向上反応予測因子が薬物に関連し、前記パスウェイモデルが前記患者のオミクスデータを使用する、使用。
- 前記複数のエンティティ係数が、前記高い精度向上反応予測因子の1〜50個のエンティティ係数である、請求項29に記載の使用。
- 前記複数のエンティティ係数が、エンティティ係数のサブセットであり、前記高い精度向上反応予測因子の全てのエンティティ係数の上位三分位を含む、請求項29に記載の使用。
- 前記パスウェイモデルが確率的パスウェイモデルである、請求項29に記載の使用。
- 前記パスウェイモデルがPARADIGMである、請求項29に記載の使用。
- 前記薬物が化学療法薬である、請求項29に記載の使用。
- 前記患者のオミクスデータが、コピー数データ、発現レベルデータ、DNA配列データおよび突然変異データのうちの少なくとも1つを含む、請求項29に記載の使用。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662370657P | 2016-08-03 | 2016-08-03 | |
US62/370,657 | 2016-08-03 | ||
PCT/US2017/045378 WO2018027076A1 (en) | 2016-08-03 | 2017-08-03 | Dasatinib response prediction models and methods therefor |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019527894A true JP2019527894A (ja) | 2019-10-03 |
Family
ID=61069603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019505358A Abandoned JP2019527894A (ja) | 2016-08-03 | 2017-08-03 | ダサチニブ反応予測モデルおよびその方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20180039732A1 (ja) |
EP (1) | EP3494504A4 (ja) |
JP (1) | JP2019527894A (ja) |
KR (1) | KR20190038608A (ja) |
CN (1) | CN109952611A (ja) |
AU (1) | AU2017305499A1 (ja) |
CA (1) | CA3032421A1 (ja) |
WO (1) | WO2018027076A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109937452B (zh) | 2016-08-25 | 2023-04-11 | 南托米克斯有限责任公司 | 免疫疗法标志及其用途 |
CN108595909A (zh) * | 2018-03-29 | 2018-09-28 | 山东师范大学 | 基于集成分类器的ta蛋白靶向预测方法 |
US11769592B1 (en) * | 2018-10-07 | 2023-09-26 | Cerner Innovation, Inc. | Classifier apparatus with decision support tool |
US11749404B1 (en) | 2018-10-08 | 2023-09-05 | Cerner Innovation, Inc. | Decision support tool for venous thromboembolism (VTE) |
CN112819495A (zh) * | 2019-11-18 | 2021-05-18 | 南京财经大学 | 一种基于随机多项式核的用户购物意图预测方法 |
TWI762853B (zh) * | 2020-01-06 | 2022-05-01 | 宏碁股份有限公司 | 利用自動化機制挑選影響力指標的方法及電子裝置 |
CN111695464A (zh) * | 2020-06-01 | 2020-09-22 | 温州大学 | 一种基于融合核的线性核化特征空间成组性的建模方法 |
CN112001035B (zh) * | 2020-09-21 | 2024-02-23 | 南京航空航天大学 | 基于特征工程与岭回归机翼结构变形重构方法 |
CN116110509B (zh) * | 2022-11-15 | 2023-08-04 | 浙江大学 | 基于组学一致性预训练的药物敏感性预测方法和装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9342657B2 (en) * | 2003-03-24 | 2016-05-17 | Nien-Chih Wei | Methods for predicting an individual's clinical treatment outcome from sampling a group of patient's biological profiles |
US10192641B2 (en) * | 2010-04-29 | 2019-01-29 | The Regents Of The University Of California | Method of generating a dynamic pathway map |
AU2013315128B2 (en) * | 2012-09-14 | 2019-01-03 | Memorial Sloan-Kettering Cancer Center | Genes associated with dasatinib sensitivity |
KR101626487B1 (ko) * | 2012-10-09 | 2016-06-01 | 파이브3 제노믹스, 엘엘씨 | 생물학적 경로 내의 조절 상호작용의 학습 및 확인을 위한 시스템 및 방법 |
DK3005199T3 (da) * | 2013-05-28 | 2019-10-14 | Five3 Genomics Llc | Paradigme-medikament respons netværk |
CN107548498A (zh) * | 2015-01-20 | 2018-01-05 | 南托米克斯有限责任公司 | 用于反应预测高级别膀胱癌中的化疗的系统和方法 |
-
2017
- 2017-08-03 AU AU2017305499A patent/AU2017305499A1/en not_active Withdrawn
- 2017-08-03 US US15/668,616 patent/US20180039732A1/en not_active Abandoned
- 2017-08-03 WO PCT/US2017/045378 patent/WO2018027076A1/en unknown
- 2017-08-03 CN CN201780048218.6A patent/CN109952611A/zh not_active Withdrawn
- 2017-08-03 CA CA3032421A patent/CA3032421A1/en active Pending
- 2017-08-03 KR KR1020197006335A patent/KR20190038608A/ko not_active Application Discontinuation
- 2017-08-03 JP JP2019505358A patent/JP2019527894A/ja not_active Abandoned
- 2017-08-03 EP EP17837721.4A patent/EP3494504A4/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
CA3032421A1 (en) | 2018-02-08 |
AU2017305499A1 (en) | 2019-02-14 |
EP3494504A4 (en) | 2020-07-22 |
CN109952611A (zh) | 2019-06-28 |
EP3494504A1 (en) | 2019-06-12 |
KR20190038608A (ko) | 2019-04-08 |
US20180039732A1 (en) | 2018-02-08 |
WO2018027076A1 (en) | 2018-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6609355B2 (ja) | 細胞系ゲノミクスからの薬物応答の患者特異的予測のためのシステムおよび方法 | |
JP2019527894A (ja) | ダサチニブ反応予測モデルおよびその方法 | |
US10325673B2 (en) | Deep transcriptomic markers of human biological aging and methods of determining a biological aging clock | |
JP6356359B2 (ja) | アンサンブルに基づいたリサーチ・レコメンデーションシステムおよび方法 | |
AU2017202808B2 (en) | Paradigm drug response networks | |
US11101038B2 (en) | Systems and methods for response prediction to chemotherapy in high grade bladder cancer | |
CN114450750A (zh) | 人类生物性衰老的深度蛋白质组标志物和确定生物性衰老时钟的方法 | |
Badwan et al. | Machine learning approaches to predict drug efficacy and toxicity in oncology | |
Wegner | Computational analysis of metabolic data | |
Chauhan | An ML-based Cancer Genome Profile Drug Prediction Framework | |
Kilim et al. | Histopathology and proteomics are synergistic for High-Grade Serous Ovarian Cancer platinum response prediction | |
Dadu | ML-assisted therapeutics for neurodegenerative disorders | |
Lemetre | Artificial neural network techniques to investigate potential interactions between biomarkers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190327 |
|
A762 | Written abandonment of application |
Free format text: JAPANESE INTERMEDIATE CODE: A762 Effective date: 20201029 |