JP2018507470A - 高悪性度膀胱癌の化学療法に対する奏効を予測するシステムおよび方法 - Google Patents

高悪性度膀胱癌の化学療法に対する奏効を予測するシステムおよび方法 Download PDF

Info

Publication number
JP2018507470A
JP2018507470A JP2017537902A JP2017537902A JP2018507470A JP 2018507470 A JP2018507470 A JP 2018507470A JP 2017537902 A JP2017537902 A JP 2017537902A JP 2017537902 A JP2017537902 A JP 2017537902A JP 2018507470 A JP2018507470 A JP 2018507470A
Authority
JP
Japan
Prior art keywords
weka
linear
tom1
treatment
svmlight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2017537902A
Other languages
English (en)
Inventor
スゼット,クリストファー
Original Assignee
ナントミクス,エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ナントミクス,エルエルシー filed Critical ナントミクス,エルエルシー
Publication of JP2018507470A publication Critical patent/JP2018507470A/ja
Ceased legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Public Health (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Genetics & Genomics (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Primary Health Care (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Hospice & Palliative Care (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

企図されるシステムおよび方法は、高悪性度膀胱癌であると診断された患者に対する化学療法の転帰の予測を可能にするものである。特に好ましい態様では、機械学習に基づくモデルを用いて予測を実施し、このモデルは最小限の所定の精度上昇率を有するものであり、このように特定されたモデルは、転帰予測に用いるオミクスデータに固有性および重み係数を付与する。【選択図】図2

Description

本願は、2015年1月20日に出願された米国特許仮出願第62/105697号および2015年3月3日に出願された米国特許仮出願第62/127546号の優先権を主張するものであり、上記出願はともに参照により本明細書に組み込まれる。
本発明の分野は、膀胱癌の化学療法の治療転帰を予測するためのコンピュータによるシステムおよび方法である。
背景に関する記載には、本発明を理解するのに有用であると思われる情報が含まれる。本明細書に記載される情報が、いずれも本願で特許請求する発明の先行技術であるか、本願で特許請求する発明に関連するものであること、あるいは明示的または非明示的に参照される任意の刊行物が先行技術であることを認めるものではない。
本明細書の刊行物はいずれも、個々の刊行物または特許出願が参照により組み込まれることが明示的かつ個別に示される場合と同様に参照により組み込まれる。ある用語の定義または用法について、組み込まれる参考文献のものと本明細書に記載されるものとの間に不一致または対立がみられる場合、その用語の定義は、本明細書に記載されている方が適用され、参考文献のものは適用されない。
特定の種類の癌に薬物を適合させる、癌に対する薬物療法の選択肢の選択はこれまで、実験データおよび従来の所見に限られてきた。ごく最近では、分子医学の進歩により、化学療法を選択する際に細胞上の特異的受容体有無、シグナル伝達分子の変異状態などを考慮に入れるといったより個別化された方法が可能となっている。このような改善によって、少なくともいくつかの場合には生存期間が長くなったが、化学療法薬に対する奏効については、すべてないしほぼすべての場合、完全には予測することはできない。さらに、一度患者が特定の治療法に取り組むと、治療プロトコルの変更は多くの場合、推奨されることがなく、かつ/または患者の耐容性が不十分である。
将来の薬物介入の治療転帰が予測できるようにするため、これまでにコンピュータによる様々なシステムおよび方法が開発されてきた。最も注目すべきものとして、国際公開第2014/193982号には、コンピュータ上で経路モデルの諸経路要素(細胞のin vivoの特徴に対応する)を修正して薬物による細胞の治療をシミュレートするシステムおよび方法が記載されている。次いで、その修正モデルを用いて、1つまたは複数の経路に対する薬物の効果を予測するほか、薬物の患部組織に対する効果を間接的に予測することができる。このようなシステムは、特定の状況下では著明な予測力を発揮しているが、そのシステムは細胞培養のデータに基づくものであるため、in vivoの環境を十全に反映するものではなかった。さらに、治療のシミュレーションは、測定された特性および推定された特性に基づく単一モデルを用いて実施したものであり、したがって、そのモデルに特有の仮定に依存するものであった。記載されている方法では、モデルに固有の仮定によるリスクの低減に関する洞察は得られない。
複雑なin vivo系から得られた大量のデータに対応するため、ヒトの能力を上回る大量のデータセットを取り込むことが可能なコンピュータ主体の機械学習技術が開発されてきた。機械学習アルゴリズムは一般に、訓練データセットのパターンを認識し、新たな入力データが提示されたときに考え得る転帰を予測する方法を「学ぶ」または「訓練された状態」になるよう設計されることが多い。機械学習アルゴリズムには多数の種類があり、それぞれに根底となる特有の分析方法(例えば、サポートベクターマシン、ベイズ統計学、ランダムフォレストなど)およびその固有のバイアスがあることは注目に値する。このような分析の一例が、Weiの米国特許出願公開第2004/0193019号に記載されており、ここでは、判別分析に基づくパターン認識を用いて、生物学的プロファイルに関する情報と治療転帰に関する情報とを相関させる予測モデルを作製している。次いで、このように形成した予測モデルを用いて、治療に対して考え得る奏効を順位付けする。Weiは、単純に予測転帰モデルを構築して将来の転帰に基づく患者固有のプロファイルに関する情報を評価している。ただ、各アルゴリズムは特定の疾患および/または薬物治療については妥当ではないと思われる仮定の下で構築されているため、どのアルゴリズムも薬物治療の予測分析に適しているというわけではない。さらに、特定の予測に最適化されたモデルが、ランダム事象および/または他のモデルと比較したときに必ずしも最高の精度を示すわけではない。
このような問題に対処するため、Cesanoらの米国特許出願公開第2014/0199273号では、医療現場での予測または予後予測に適した特定のモデル/統計学的方法の選択について考察されている。Cesanoは適切なモデルの選択について考察しているが、これらのモデルは、選択後もなお固有のバイアスという同じ問題を抱えることになる。
このように、治療を予測する様々なシステムおよび方法が当該技術分野で公知であるが、そのすべてないしほぼすべてが様々な欠点を抱えている。したがって、治療を開始する前に意図する化学療法に対する癌患者の薬物治療による奏効をより正確に予測することができるシステムおよび方法が依然として必要とされている。
本発明者は、治療転帰と関連付けた既知の高悪性度膀胱癌のオミクス情報に関して訓練された様々な機械学習アルゴリズムを用いて作製したモデルを収集したものから、高悪性度膀胱癌の治療転帰を予測するモデルを導き出すことが可能であることを発見した。最も好ましくは、精度上昇率の高いモデルを特定し、その特定したモデルからオミクスパラメータおよび関連する重みを選択することによって予測精度を改善する。
本発明の主題の一態様では、本発明者は、高悪性度膀胱癌を有する患者の治療転帰を予測する方法を企図する。好ましい態様では、企図する方法は、患者から複数のオミクスデータを入手する段階と、(a)精度上昇率の測定基準を用いて、高悪性度膀胱癌治療の治療転帰を予測する単一モデルを少なくとも1つ選択するか、(b)予め決定した精度上昇率の測定基準に基づいて、高悪性度膀胱癌治療の治療転帰を予測する単一モデルを少なくとも1つ選択するさらなる段階とを含む。モデルは、多数のモデル、例えば少なくとも10例の訓練されたモデルまたは少なくとも100例もしくはそれ以上の訓練されたモデルのなかから選択され得る。また別の段階では、次いで、単一モデルおよび患者の複数のオミクスデータを用いて、分析エンジンにより予測転帰(例えば、治療が著効、治療が有効、治療が無効で安定および治療が無効で増悪)を計算する。
最も典型的には、オミクスデータには全ゲノムの示差的目的、エクソームの示差的目的、SNPデータ、コピー数データ、RNA転写データ、タンパク質発現データおよび/またはタンパク質活性データが含まれ、精度上昇率の測定基準は、精度上昇率、精度上昇率の分布、血中濃度曲線下面積の測定基準、Rの測定基準、p値の測定基準、シルエット係数および/または混同行列であり得るのがさらに好ましい。本発明の主題を限定するわけではないが、ほかにも、単一モデルの精度上昇率の測定基準が全モデルの上位四分位内または全モデルの上位5%以内にあるか、単一モデルの精度上昇率の測定基準が他のすべてのモデルを上回ることが企図される。
さらなる企図される態様では、NMFpredictor(線形)、SVMlight(線形)、SVMlight一次多項式カーネル(次数dの多項式)、SVMlight二次多項式カーネル(次数dの多項式)、WEKA SMO(線形)、WEKA j48樹木(樹木ベース)、WEKAハイパーパイプ(分布ベース)、WEKAランダムフォレスト(樹木ベース)、WEKAナイーブベイズ(確率論的/ベイズ)、WEKA JRip(ルールベース)、glmnet lasso(スパース線形)、glmnetリッジ回帰(スパース線形)およびglmnetエラスティックネット(スパース線形)からなる群より選択される分類器を用いる機械学習アルゴリズムを用いて、単一モデルを作製し得る。
最も好ましくは、計算する段階は、絶対値が最小である所定の重み(例えば、単一モデルの全重みの上位4分の1以内にある重み)を有する単一モデルの特徴を選択する段階を含む。多数の特徴が適切であり得るが、計算する段階に、単一モデルの少なくとも10個の異なる選択した特徴を用いることが企図される。高悪性度膀胱癌に特に好ましい方法では、単一モデルの特徴は、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1およびGSNからなる群より選択される遺伝子のRNA転写値である。さらに、遺伝子のRNA転写値をそれぞれの係数を用いて計算すること、それぞれの係数に重みを付けることのほか、(絶対値を用いた)重みの順序はPCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1、GSNであることが企図される。
したがって、異なる観点からみると、本発明者らは高悪性度膀胱癌を有する患者の治療転帰を予測する方法も企図する。このような方法は、好ましくは、患者の複数のRNA転写データを入手する段階と、モデルに患者の複数のRNA転写データを用いて、分析エンジンにより治療転帰スコアを計算するさらなる段階とを含む。最も典型的には、モデルは、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1およびGSNからなる群より選択される遺伝子のRNA転写値を用いるものである。
最も好ましくは、複数のRNA転写データはポリA RNAから得られるものであり、かつ/または治療転帰スコアは治療が著効である、治療が有効である、治療が無効で安定している、もしくは治療が無効で増悪していることを示すものである。上で既に述べた通り、モデルは、NMFpredictor(線形)、SVMlight(線形)、SVMlight一次多項式カーネル(次数dの多項式)、SVMlight二次多項式カーネル(次数dの多項式)、WEKA SMO(線形)、WEKA j48樹木(樹木ベース)、WEKAハイパーパイプ(分布ベース)、WEKAランダムフォレスト(樹木ベース)、WEKAナイーブベイズ(確率論的/ベイズ)、WEKA JRip(ルールベース)、glmnet lasso(スパース線形)、glmnetリッジ回帰(スパース線形)およびglmnetエラスティックネット(スパース線形)からなる群より選択される分類器を用いる機械学習アルゴリズムを用いて作製したものであり、かつ/または遺伝子のRNA転写値をそれぞれの係数を用いて計算し、それぞれの係数に絶対値を用いて、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1およびGSNの順序で重みを付けることが企図される。
したがって、本発明者らは、高悪性度膀胱癌を有する患者の治療転帰を予測する方法も企図する。このような方法で特に好ましいものは、患者の複数のRNA転写データを入手する段階であって、RNA転写値が、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1およびGSNからなる群より選択される少なくとも2種類の遺伝子の値である段階と、機械学習アルゴリズムによって作製したモデルにRNA転写値を用いて患者の治療転帰を予測するさらなる段階とを含む。
本発明の主題を限定するわけではないが、通常、機械学習アルゴリズムはNMFpredictor(線形)、SVMlight(線形)、SVMlight一次多項式カーネル(次数dの多項式)、SVMlight二次多項式カーネル(次数dの多項式)、WEKA SMO(線形)、WEKA j48樹木(樹木ベース)、WEKAハイパーパイプ(分布ベース)、WEKAランダムフォレスト(樹木ベース)、WEKAナイーブベイズ(確率論的/ベイズ)、WEKA JRip(ルールベース)、glmnet lasso(スパース線形)、glmnetリッジ回帰(スパース線形)およびglmnetエラスティックネット(スパース線形)からなる群より選択される分類器を用いるものであるのが好ましい。さらに、遺伝子RNA転写値はそれぞれの係数を用いて計算し、それぞれの係数に絶対値を用いて、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1、GSNの順序で重みを付けることが企図される。
したがって、本発明者らは、高悪性度膀胱癌治療の治療転帰の予測へのRNA転写値の使用も企図し、ここでは、予測は、機械学習アルゴリズムから得た単一モデルを用いるものであり、RNA転写値は、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1およびGSNからなる群より選択される遺伝子のものである。必ずしもというわけではないが、通常、遺伝子のRNA転写値はそれぞれの係数を用いて計算し、それぞれの因子にPCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1、GSNの順序の絶対値を用いて重みを付ける。
本発明の主題の様々な目的、特徴、態様および利点については、以下の好ましい実施形態の詳細な説明および同じ番号が同じ構成要素を表す添付図面からさらに明らかになるであろう。
精度上昇率の高いモデルにTCGA高悪性度膀胱癌データを用いて導き出した特徴および特徴重みの例示的な表である。 薬物治療の奏効例および無効例のTCGA高悪性度膀胱癌データから得たRNA転写値の例示的なヒートマップである。
(詳細な説明)
本発明の主題は、特定の新生物疾患(例えば、膀胱癌)に罹患している患者の比較的大きいクラスに関するゲノム情報を比較的多数の機械学習アルゴリズムにかけて、対応する多数の予測モデルを特定する様々なコンピュータシステムおよび方法に関する。次いで予測モデルの精度上昇率を分析し、次いで精度上昇率が最も高いモデル(1つまたは複数)を用いて、予測に適したオミクス因子を特定する。
したがって、企図されるシステムおよび方法は、単一モデルの予測最適化に基づくものでも、選択したオミクスパラメータと治療予測の相関性が最も高いものを特定することに基づくものでもないことを特に理解するべきである。代わりに、企図されるシステムおよび方法は、所定の精度上昇率または最小限の精度上昇率を有するモデルが得られる機械学習アルゴリズムを1回または複数回実行して導き出されるオミクスパラメータおよび関連する重み付け係数を特定することに依存するものであることを理解するべきである。特に、このように特定したオミクスパラメータは通常、それ単独では統計学的な予測力をもたず、したがって、いかなるオミクスベースの試験システムにも使用されることはない。しかし、このような特定されたオミクスパラメータを精度上昇率が高い訓練されたモデルに用いる場合、特に、訓練されたモデルに関連する重み付け係数を用いるシステムに適用する場合、複数のオミクスパラメータによってシステムが高い予測力をもつようになる。当然のことながら、このようなモデル、オミクスパラメータおよび重み付けは、特定の訓練セットおよび/または転帰予測の種類に固有のものであり、別の疾患(例えば、肺癌)および/または転帰予測(例えば、5年生存率)であれば、モデル、オミクスパラメータおよび重み付けが全く異なるものとなり得ることも理解するべきである。このように、本発明者は、高悪性度膀胱癌に関連する予測力が高い重み付けおよび/または訓練されたモデルを発見したと考える。さらに、事前に特定した経路(1つまたは複数)および/または経路要素(1つまたは複数)あるいは既知の経路モデル化のシステムおよび方法を用いコンピュータで調節することによって特定した経路および/または経路要素から治療予測を検証して、システムによって予測された治療戦略の確認に役立てることができる。
したがって、本発明の主題は、高悪性度膀胱癌に罹患している患者の比較的大きいクラスに関するゲノム情報および関連するメタデータを複数の異なる機械学習アルゴリズムにかける様々なシステムおよび方法に関するものであると考えられる。本発明の主題の好ましい一態様では、前処理段階でRNA転写値および関連するメタデータ(例えば、治療転帰)を訓練/バリデーション分離に供し、次いで、そのデータを様々な分析用の機械学習パッケージに供給する。
開示される本発明の主題の主眼は、ヒトの能力を超える大量のデジタルデータを処理するコンピュータデバイス(1つまたは複数)の構築または設定を可能にすることにあることに留意するべきである。デジタルデータは、機械に訓練されたオミクスデータおよび治療転帰のコンピュータモデルとなり得るが、デジタルデータは、そのような現実世界の事柄を表す1つまたは複数のデジタルモデルであって、実際の事柄ではないことを理解するべきである。むしろ、そのようなデジタルモデルをコンピュータデバイスのメモリにインストールして、本明細書に開示されるデバイスを適切に設定またはプログラムすることにより、コンピュータデバイスは、ヒトの能力を超え得る方法でデジタルデータまたはデジタルモデルを管理することが可能になる。さらに、コンピュータデバイスには、そのような設定を必要としない生得的な能力があるわけではない。さらに、本発明の主題によって、複雑なオミクス計算のコンピュータ分析が抱える問題点が大幅に改善/軽減されることを理解するべきである。
異なる観点からみれば、本発明のコンピュータ技術のシステムおよび方法は、オミクスデータの計算モデルが抱える問題点を解決するのに用いられることを理解するべきである。したがって、コンピュータがなければ、問題点、ひいては本発明の主題は存在しないことになる。より具体的には、本開示の方法により、能力の低い他の訓練されたモデルよりも精度上昇率が高い訓練され最適化されたモデルが1つまたは複数得られ、これにより、患者データに基づいて予測結果を出す際の待ち時間が短くなる。
コンピュータを指す言葉はいずれも、個別に、またはまとまって作動するサーバ、インターフェイス、システム、データベース、エージェント、ピア、エンジン、コントローラ、モジュールをはじめとするタイプのコンピュータデバイスを含めたコンピュータデバイスの任意の適切な組合せを含むものと解釈するべきであることに留意するべきである。コンピュータデバイスは、コンピュータで読取り可能な有形の一時的でない記憶媒体(例えば、ハードドライブ、FPGA、PLA、ソリッドステートドライブ、RAM、フラッシュ、ROMなど)に保存されているソフトウェアの指示を実行するよう設定されたプロセッサを含むことを理解するべきである。ソフトウェアの指示は、のちに本開示の装置に関して考察するように、役割、責務をはじめとする機能を与えるべくコンピュータデバイスを設定またはプログラムするものである。さらに、本開示の技術は、ソフトウェアの指示を保存したコンピュータで読取り可能な一時的でない媒体を含み、プロセッサにコンピュータベースのアルゴリズム、処理、方法をはじめとする指示の実行に関連する本開示の段階を実行させるコンピュータプログラム製品として1つにまとめることができる。いくつかの実施形態では、様々なサーバ、システム、データベースまたはインターフェイスが、可能性としてはHTTP、HTTPS、AES、パブリック−プライベート間のキー交換、ウェブサービスAPI、既知の金融取引プロトコルをはじめとする電子情報交換法に基づき、標準化されたプロトコルまたはアルゴリズムを用いてデータを交換する。デバイス間のデータ交換は、パケット交換網、インターネット、LAN、WAN、VPNをはじめとするタイプのパケット交換網、回路交換網および/またはセル交換網上で実施することができる。
本明細書の記載およびのちの請求項全体で使用されるシステム、エンジン、サーバ、デバイス、モジュールをはじめとする演算器がメモリ内のデータに対して機能を実施または実行するよう設定されていると記載される場合、「〜するよう設定されている」または「〜するようプログラムされている」の意味は、演算器の1つまたは複数のプロセッサまたはコアが、演算器のメモリに保存されている1組のソフトウェアの指示によって、メモリに保存されているターゲットデータまたはデータオブジェクトに対して機能のセットを実行するか、これらを処理するようプログラムされていることと定義される。
例えば、高悪性度膀胱癌の分析では、高悪性度膀胱癌と診断された患者の多数のゲノムデータをそれぞれのメタデータとともに処理して訓練データセットを作製し、次いで、これをモデルテンプレートの集合体に入力する(すなわち、機械学習アルゴリズムのソフトウェア実行)。このデータセットおよび機械学習システムを用いて対応する訓練されたモデルを作製し、次いで、のちに詳細に記載するように、その精度上昇率を分析(および順位付け)する。精度上昇率が最も高いモデルから各パラメータのオミクスパラメータおよび重み付け係数を抽出し、予測モデルとして用いる。
より具体的には、本発明者は上記の方法を用いて、公開されているデータ(ここではTCGA BLCAデータ)を分析することにより、データ内の高悪性度膀胱癌患者のうち化学療法が奏効し少なくとも外科手術を回避できる可能性のある患者を調べた。このデータセットでは、患者50例の薬物治療過程116例を追跡した。この116の治療例のうち111例が、アドリアマイシン、アバスチン、カルボプラチン、シスプラチン、ドセタキセル、ドキソルビシン、エトプシド(Etopside)、ゲムシタビン、イホスファミド、メトトレキサート、パクリタキセルおよびビンブラスチン(または上記の薬物に相当する販売名)を含めた化学療法剤であった。この化学療法による治療111例のうち、78例に「最良治療効果」が記録された。化学療法剤で著効または有効が記録された場合、その患者を「化学療法奏効例」と見なした。臨床的増悪または安定が記録された場合、その患者を「化学療法無効例」と見なした。計33例の化学療法の奏効が記録された(無効例15例および奏効例18例)。いずれの患者も、さらなるTCGA臨床情報を用いて高悪性度膀胱癌患者であることが確認された。
上記のデータを用いて、化学療法が奏効する可能性のある高悪性度腫瘍患者を予測するモデルの候補72例を作製した。k分割クロスバリデーションを用いて、データセットを訓練セットとバリデーションセットに分割することにより各モデルを訓練した。scikit−learn(scikit−learn developers、オンラインscikit−learn.org)から入手可能な予測モデルテンプレートに線形分類器、NMFベースの分類器、グラフィカルベースの分類器、樹木ベースの分類器、ベイズベースの分類器およびネットベースの分類器を含めた様々な分類器を用いて、利用可能なデータセットそれぞれについて予測モデル24例を計算し、評価モデル360例を得た。次いで、このように構築した評価モデル全部を精度上昇率の分析に供し、精度上昇率が最も高いモデル構築プロセスを特定した。この例では、多数派の分類器(ここでは、治療が奏効する)が出現した割合(頻度)に対しバリデーションデータセットを用いて、正しく予測した割合を比較することにより精度上昇率を計算した。例えば、既知のデータセットで奏効する治療の頻度が60%であり、モデルが治療転帰の85%を奏効と正しく予測する場合、精度上昇率は25%である。特に、構築されたモデル全体では、最良のモデル構築プロセスは、クロスバリデーションテストの諸分割数での精度が88%(多数派よりも33%高い)であり、エラスティックネット分類器を用いるものであった。72例の候補モデルから、最も精度の高い構築プロセスを用いた完全に訓練された最終モデルを選択した。
上記の方法を用いれば、短時間で比較的多数の訓練されたモデルが得られることを理解するべきである。例えば、p分割クロスバリデーションを用いて、n個のアルゴリズムをm種類の入力データセットとともに用いる場合、訓練されたモデルの総数はn×m×p例となる。次いで、このように構築した全モデルを精度上昇率の分析に供し、精度上昇率が最も高いモデルを特定した。この例では、多数派の分類器(ここでは、治療が奏効する)が出現した割合(頻度)に対しバリデーションデータセットを用いて、正しく予測した割合を比較することにより精度上昇率を計算した。例えば、既知のデータセットで奏効する治療の頻度が60%であり、モデルが治療転帰の85%を奏効と正しく予測する場合、精度上昇率は25%である。特に、構築されたモデル全体では、最良のモデル構築プロセスは、クロスバリデーションテストの諸分割数での精度が88%(多数派よりも33%高い)であり、エラスティックネット分類器を用いるものであった。
これに関連して、各タイプのモデルには固有のバイアスまたは仮定が含まれており、このことは、得られる訓練されたモデルが、他のタイプの訓練されたモデルと比較して、たとえ同一のデータで訓練された場合でも、どのように稼働するかに影響を及ぼし得ることを理解しなければならない。したがって、同じ訓練データセットを用いても、モデルが異なれば予測結果/精度上昇率も異なる。これまで、予測転帰を改善する試みとして、単一の機械学習アルゴリズムを最適化して同じデータセットでの予測精度を高めていた。しかし、アルゴリズムに固有のバイアスにより、そのような最適化が必ずしも予測精度(すなわち、「コイン投げ」に対する正確な予測能)を高めるわけではない。このようなバイアスは、基礎となる原理および分類器が異なる多種多様なモデルを疾患特異的データセットとそれに関連するメタデータで訓練し、そのように訓練したモデルから所望の精度上昇率またはロバスト性を有するものを選択することによって克服することができる。
精度上昇率が高い所望のモデルを選択した後、そのモデルから関連性の高いオミクスパラメータを選択して、予測精度が改善された予測モデルを作製することができる。図1に、RNAをコードする遺伝子の集合体であって、患者のオミクスデータがRNA転写データ(転写強度)である集合体を例示する。ここでは、遺伝子発現パネルのRNA転写レベルを用いて、事前に明らかにされているTGCAデータから上記のように予測モデルを構築した。最良の予測モデルは、クロスバリデーションテストの諸分割数で88%の精度を示したものであり、重み付け係数が最も大きい上位53の遺伝子が示されている。例えば、PCDHGA4遺伝子(プロトカドヘリンガンマサブファミリーA、4)はRNA発現に関する重み付け係数が−121543.6202であり、PCDHGA4遺伝子の下にはさらなる遺伝子および重み付け係数が記載されている。訓練されたモデルの作製には、RNA転写データ以外にも複数の様々な種類のデータを用いたことを理解するべきである。本発明者は、訓練データとしてRNA転写データを用いれば、他の種類のオミクスデータ(例えば、WGS、SNPコピー数、プロテオミクスなど)で訓練された他のモデルと比較して、最良のモデル(すなわち、精度上昇率が最も高いモデル)が得られることを発見した。
図2に実際の患者データのヒートマップを例示し、図中、マップの各行は単一の患者に対応し、各列は特定の遺伝子(ここでは、図1のグラフに記載されている遺伝子)に対応する。このほか、ヒートマップからわかるように、患者データは奏効例(CR(著効)とPR(有効)とに分類される)と無効例(増悪(疾患増悪が認められる)と安定(疾患増悪が認められない)とに分類される)。色の濃さ/グレースケール値は測定された転写レベルに対応し、−1.8〜1.8の色/グレースケール値で表されている。図1の重み付け係数と考えあわせると、各患者の最終予測スコアは、図2の各遺伝子の発現値と重み付け係数との積の合計となる。0より大きい最終予測スコア(+の符号を付した赤/グレー)はいずれも、治療が奏効する可能性があることを示しており、0より小さい最終予測スコア(−の符号を付した青/グレー)は、治療が奏効しない可能性があることを示している。「最上位モデルのシグネチャー」(最終予測スコア)からわかるように、「奏効例」のカテゴリーには偽陽性の結果が1例のみ認められ(奏効例のカテゴリーの最上行)、無効例には偽陰性の結果が2例認められる(増悪のカテゴリーの最下行、安定のカテゴリーの最下行)。
また、図2のヒートマップをさらに参照すると、マップの底部の棒グラフからわかるように、正確に予測には各RNA転写データの統計的有意性だけでは十分でないことを理解するべきである。ここでは、バーは、奏効例群の結果と無効例群の結果との間のt検定の値をボンフェローニ補正を用いて多重仮説検定用に補正したものに符号を付して表したものである。容易にわかるように、黒のバー(例えば、DDI2、AGAP1など)と白のバー(RPL39)とで示される奏効例と無効例との間に統計的有意差がみられたデータセットはごくわずかである。しかし、少なくともいくつかの個々の結果を(特に、重み付けの計算値と組み合わせて)考え合わせると、予測力は、他のすべての競合モデルを上回るわけではないにしても、このモデルが最も優れている。
さらに、経路モデル化アルゴリズム(例えば、国際公開第2011/139345号、国際公開第2013/062505号、国際公開第2014/059036号および国際公開第2014/193982号を参照されたい)に患者データを用いて、患者が実際の治療を受ける前に治療を検証および/またはシミュレートすることができ、次いで高悪性度膀胱癌に最良のモデルを用いて、そのようなバリデーションを再評価することができることも理解するべきである。例えば、コンピュータ上で経路モデル化システムの重み付けの大きいRNA転写を止めることができ、活性を再び推測し、in vivoの薬物介入で期待される効果を実際にコンピュータでシミュレートする。次いで、この予測モデルを用いて、新たに推測された介入後のデータを再評価することができる。
本発明の主題のさらなる企図される態様において、上の例ではRNA転写データを用いたが、1つまたは複数の他の(または追加の)オミクスデータも本明細書に教示するものとともに用いるのに適していることを理解するべきである。例えば、適切な別のオミクスデータまたは追加のオミクスデータとしては、全ゲノムの示差的目的データ、エクソームの示差的目的データ、SNPデータ、コピー数データ、タンパク質発現データおよび/またはタンパク質活性データが挙げられる。同じように、オミクスデータに関連するメタデータは治療転帰に限定する必要はなく、患者または治療に関連する多数の測定基準がこれに含まれ得る。例えば、企図されるメタデータには、治療コスト、耐性の可能性、転移性疾患の可能性、5年生存率、免疫療法への適性、患者背景に関する情報などが含まれ得る。
同様に、作製されるモデルの数は本発明の主題に限定されるわけではなく、(一般に)モデルの数は多い方が好ましいことに留意するべきである。このようなモデルは複数の異なる機械学習アルゴリズムをベースとするのが好ましく、あらゆる既知の機械学習アルゴリズムが本明細書での使用に適すると考えられることを理解するべきである。例えば、企図される分類器としては、線形分類器、NMFベースの分類器、グラフィカルベースの分類器、樹木ベースの分類器、ベイズベースの分類器、ルールベースの分類器、ネットベースの分類器およびkNN分類器のうちの1つまたは複数のものが挙げられる。ただし、特に好ましいアルゴリズムとしては、NMFpredictor(線形)、SVMlight(線形)、SVMlight一次多項式カーネル(次数dの多項式)、SVMlight二次多項式カーネル(次数dの多項式)、WEKA SMO(線形)、WEKA j48樹木(樹木ベース)、WEKAハイパーパイプ(分布ベース)、WEKAランダムフォレスト(樹木ベース)、WEKAナイーブベイズ(確率論的/ベイズ)、WEKA JRip(ルールベース)、glmnet lasso(スパース線形)、glmnetリッジ回帰(スパース線形)およびglmnetエラスティックネット(スパース線形)からなる群より選択される分類器を用いるアルゴリズムが挙げられる。上記の分類器以外にも、適切なアルゴリズムとしてほかにも、様々な形態のニューラルネットワーク(例えば、人工ニューラルネットワーク、畳込みニューラルネットワークなど)、二分決定木をはじめとするタイプの学習が挙げられる。このようなアルゴリズムの供給元は、TensorFlow(URL www.tensorflow.comを参照されたい)、OpenAI(URL www.openai.comを参照されたい)およびBaidu(URL research.baidu.com/warp−ctcを参照されたい)から容易に利用可能である。したがって、本発明者は、訓練されたモデルを少なくとも5例、少なくとも10例、少なくとも20例、少なくとも50例、少なくとも100例、少なくとも500例、少なくとも1,000例、少なくとも5,000例または少なくとも10,000例作製することを企図する。考え得る訓練データセットの数、バリデーションの数およびアルゴリズムのタイプの数によっては、得られる訓練されたモデルの数が1,000,000例を超えることさえあり得る。
モデルを作製した後、モデルの品質を評価し、予測力が無作為選択を上回る最も好ましいモデルを残す。異なる観点からみれば、モデルをその精度の上昇率で評価する。精度を評価する方法は多数存在し、具体的な選択は、少なくとも部分的には用いるアルゴリズムに左右され得る。例えば、適切な測定基準としては、対応するモデルの精度値、精度上昇率、性能測定基準をはじめとする測定値が挙げられる。測定基準の例としてはほかにも、血中濃度曲線下面積測定基準、R、p値測定基準、シルエット係数、混同行列をはじめとするモデルまたはそれに対応するモデルテンプレートの性質に関連する測定基準が挙げられる。
例えば、既知のデータセットおよび対応する既知の臨床転帰データを利用することによってモデルの精度を求めることができる。したがって、ある特定のモデルテンプレートに対して多数の評価モデルを構築し、これを訓練し、入力した既知のデータセットに対して検証することができる(例えば、k分割クロスバリデーション)。例えば、訓練されたモデルを訓練された入力データの80%に基づいて訓練することができる。評価モデルを訓練した後、残る20%のゲノムデータにその評価モデルを実行して、残る20%の既知の臨床転帰データと同じないしほぼ同じ予測データが得られるかどうかを確認することができる。次いで、訓練された評価モデルの精度を転帰の総数に対する正しい予測の数の比と考えることができる。
例えば、あるRNA転写データセット/臨床転帰データセットが患者500例のコホートを表すものとする。次いで、このデータセットを例えば400例の患者試料が含まれる評価訓練セットの1つまたは複数のグループに分割する。次いで、400例の患者試料に基づいてモデルを作製し、このように訓練したモデルを、残る100例の患者の転写データセットに対して実行し予測転帰100例を得ることによって検証する。次いで、この100例の予測転帰と、臨床転帰データセット内の患者データから得た実際の転帰100例とを比較する。訓練されたモデルの精度は、転帰の総数に対する正しい予測転帰の数とする。予測転帰100例のうち、訓練された評価モデルによって、患者データから得た実際の臨床転帰または既知の臨床転帰と一致する正しい転帰が85例得られた場合、その訓練された評価モデルの精度は85%であると考える。あるいは、観察された転帰(例えば、薬物奏効例)のRNA転写データセットのメタデータ内での頻度が60%であり、モデルによって得られる予測転帰100例のうち正しい転帰が85例である場合、精度上昇率は25%となる(すなわち、無作為に観察される結果を25%上回り;予測された事象が60%の頻度で起こり、85%の精度で正しい予測が得られ、精度上昇率が25%である)。
予測に用いるモデルは、モデルの数/精度の分布に応じて、最上位モデル(精度上昇率が最も高いモデルまたは精度スコアが最も高いモデルなど)、上位n分位(三分位、四分位、五分位など)または全モデルの上位n%(上位5%、上位10%など)に選ばれたものであり得ることを理解するべきである。したがって、適切なモデルは、精度上昇率の測定基準が他のすべてのモデルを上回るものであり得る。
単一モデルに関して、最上位モデル(または他の選択した単一モデル)に基づく予測は、入力データの一部であったオミクスデータ全部に基づく(すなわち、モデルの訓練に用いたRNA発現レベルを全部用いる)ものまたはそのオミクスデータのごく一部に基づくものであり得ることを理解するべきである。例えば、最終予測にオミクスデータの一部のみを用いる場合、図1の選択した特徴(遺伝子)に示されるように、所定の重みの絶対値がモデル内で最大または最小(例えば、単一モデル内の全重みの上位4分の1)であるオミクスデータが一般に好ましい。したがって、適切なモデルでは、予測に少なくとも5個、少なくとも10個、少なくとも20個、少なくとも50個または少なくとも100個の特徴を用いる。さらに、治療転帰間に実質的な統計的有意性のある特徴が特定された場合、そのような特徴を、好ましくは組み合わせて、予測アルゴリズムではなく遺伝子発現アレイに用い得る(例えば、図2の有意な特徴)ことも理解するべきである。
当業者には、本明細書の本発明の概念を逸脱することなく考え得る修正が、既に記載したもの以外にも多数あることが明らかになるはずである。したがって、本発明の主題は、添付の請求項の範囲内にある限り限定されることはない。さらに、明細書および請求項ともにその解釈にあたっては、あらゆる用語は文脈と矛盾しない範囲で可能な最も広い意味で解釈するべきである。特に、「含む(comprisesおよびcomprising)」という用語は、要素、成分または段階に非排他的に言及し、その言及される要素、成分または段階が、明記されていない他の要素、成分または段階とともに存在し得る、用いられ得る、または組み合わさり得ることを示すものであると解釈するべきである。本明細書の請求項で、A、B、C....およびNからなる群より選択されるもののうち少なくとも1つと言う場合、その文は、グループのうちAとNやBとNなどではなく、1つの要素のみが必要であることを述べているものと解釈するべきである。さらに、本明細書の記載およびのちの請求項全体で使用される「a」、「an」および「the」の意味には、文脈上明らかに別の意味を表す場合を除き、複数形の指示対象が含まれる。このほか、本明細書の記載に使用される「in」の意味には、文脈上明らかに別の意味を表す場合を除き、「in」および「on」が含まれる。

Claims (42)

  1. 高悪性度膀胱癌を有する患者の治療転帰を予測する方法であって、
    前記患者から複数のオミクスデータを入手することと、
    複数の機械学習アルゴリズムおよび事前に入手したオミクスデータを用いて複数のモデルを作製することと、
    精度上昇率の測定基準を用いて、前記複数のモデルから高悪性度膀胱癌治療の治療転帰を予測する単一モデルを選択するか、予め決定した精度上昇率の測定基準に基づいて、高悪性度膀胱癌治療の治療転帰を予測する単一モデルを選択することと、
    前記単一モデルおよび前記患者の複数のオミクスデータを用いて、分析エンジンにより予測転帰を計算することと
    を含む、方法。
  2. 前記オミクスデータが、全ゲノムの示差的対象、エクソームの示差的対象、SNPデータ、コピー数データ、RNA転写データ、タンパク質発現データおよびタンパク質活性データからなる群より選択される、請求項1に記載の方法。
  3. 前記精度上昇率の測定基準が、精度上昇率、精度上昇率の分布、血中濃度曲線下面積の測定基準、R、p値の測定基準、シルエット係数および混同行列からなる群より選択される、請求項1〜2のいずれか1項に記載の方法。
  4. 前記単一モデルを少なくとも100例のモデルのなかから選択する、請求項1〜3のいずれか1項に記載の方法。
  5. 前記単一モデルの精度上昇率の測定基準が、全モデルの上位四分位内にある、請求項1〜4のいずれか1項に記載の方法。
  6. 前記単一モデルの精度上昇率の測定基準が、全モデルの上位5%以内にある、請求項1〜5のいずれか1項に記載の方法。
  7. 前記単一モデルの精度上昇率の測定基準が、他のすべてのモデルを上回る、請求項1〜6のいずれか1項に記載の方法。
  8. 前記予測転帰が、治療が著効、治療が有効、治療が無効で安定および治療が無効で増悪からなる群より選択される、請求項1〜7のいずれか1項に記載の方法。
  9. 前記単一モデルが、NMFpredictor(線形)、SVMlight(線形)、SVMlight一次多項式カーネル(次数dの多項式)、SVMlight二次多項式カーネル(次数dの多項式)、WEKA SMO(線形)、WEKA j48樹木(樹木ベース)、WEKAハイパーパイプ(分布ベース)、WEKAランダムフォレスト(樹木ベース)、WEKAナイーブベイズ(確率論的/ベイズ)、WEKA JRip(ルールベース)、glmnet lasso(スパース線形)、glmnetリッジ回帰(スパース線形)およびglmnetエラスティックネット(スパース線形)からなる群より選択される分類器を用いる機械学習アルゴリズムを用いて作製されたものである、請求項1〜8のいずれか1項に記載の方法。
  10. 前記計算する段階が、絶対値が最小である所定の重みを有する前記単一モデルの特徴を選択する段階を含む、請求項1〜9のいずれか1項に記載の方法。
  11. 前記絶対値が最小である所定の重みが、前記単一モデルの全重みの上位4分の1以内にある、請求項10に記載の方法。
  12. 前記計算する段階に、前記単一モデルの少なくとも10個の異なる選択した特徴を用いる、請求項1〜11のいずれか1項に記載の方法。
  13. 前記特徴が、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1およびGSNからなる群より選択される遺伝子のRNA転写値である、請求項10に記載の方法。
  14. 前記遺伝子のRNA転写値をそれぞれの係数を用いて計算し、前記それぞれの係数に絶対値を用いて、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1、GSNの順序で重みを付ける、請求項13に記載の方法。
  15. 前記精度上昇率の測定基準が、精度上昇率、精度上昇率の分布、血中濃度曲線下面積の測定基準、R、p値の測定基準、シルエット係数および混同行列からなる群より選択される、請求項1に記載の方法。
  16. 前記単一モデルを少なくとも100例のモデルのなかから選択する、請求項1に記載の方法。
  17. 前記単一モデルの精度上昇率の測定基準が、全モデルの上位四分位内にある、請求項1に記載の方法。
  18. 前記単一モデルの精度上昇率の測定基準が、全モデルの上位5%以内にある、請求項1に記載の方法。
  19. 前記単一モデルの精度上昇率の測定基準が、他のすべてのモデルを上回る、請求項1に記載の方法。
  20. 前記予測転帰が、治療が著効、治療が有効、治療が無効で安定および治療が無効で増悪からなる群より選択される、請求項1に記載の方法。
  21. 前記単一モデルが、NMFpredictor(線形)、SVMlight(線形)、SVMlight一次多項式カーネル(次数dの多項式)、SVMlight二次多項式カーネル(次数dの多項式)、WEKA SMO(線形)、WEKA j48樹木(樹木ベース)、WEKAハイパーパイプ(分布ベース)、WEKAランダムフォレスト(樹木ベース)、WEKAナイーブベイズ(確率論的/ベイズ)、WEKA JRip(ルールベース)、glmnet lasso(スパース線形)、glmnetリッジ回帰(スパース線形)およびglmnetエラスティックネット(スパース線形)からなる群より選択される分類器を用いる機械学習アルゴリズムを用いて作製されたものである、請求項1に記載の方法。
  22. 前記計算する段階が、絶対値が最小である所定の重みを有する前記単一モデルの特徴を選択する段階を含む、請求項1に記載の方法。
  23. 絶対値が最小である所定の重みが、前記単一モデルの全重みの上位4分の1以内にある、請求項22に記載の方法。
  24. 前記計算する段階に、前記単一モデルの少なくとも10個の異なる選択した特徴を用いる、請求項1に記載の方法。
  25. 前記特徴が、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1およびGSNからなる群より選択される遺伝子のRNA転写値である、請求項22に記載の方法。
  26. 前記遺伝子のRNA転写値をそれぞれの係数を用いて計算し、前記それぞれの係数に絶対値を用いて、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1、GSNの順序で重みを付ける、請求項25に記載の方法。
  27. 高悪性度膀胱癌を有する患者の治療転帰を予測する方法であって、
    前記患者から複数のRNA転写データを入手することと、
    モデルに前記患者の複数のRNA転写データを用いて、分析エンジンにより治療転帰スコアを計算することと
    を含み、
    前記モデルが、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1およびGSNからなる群より選択される遺伝子のRNA転写値を用いるものである、
    方法。
  28. 前記複数のRNA転写データがポリA RNAから得られるものである、請求項27に記載の方法。
  29. 前記治療転帰スコアが、治療が著効、治療が有効、治療が無効で安定または治療が無効で増悪を示す、請求項27または28に記載の方法。
  30. 前記モデルが、NMFpredictor(線形)、SVMlight(線形)、SVMlight一次多項式カーネル(次数dの多項式)、SVMlight二次多項式カーネル(次数dの多項式)、WEKA SMO(線形)、WEKA j48樹木(樹木ベース)、WEKAハイパーパイプ(分布ベース)、WEKAランダムフォレスト(樹木ベース)、WEKAナイーブベイズ(確率論的/ベイズ)、WEKA JRip(ルールベース)、glmnet lasso(スパース線形)、glmnetリッジ回帰(スパース線形)およびglmnetエラスティックネット(スパース線形)からなる群より選択される分類器を用いる機械学習アルゴリズムを用いて作製されたものである、請求項27〜29のいずれか1項に記載の方法。
  31. 前記遺伝子のRNA転写値をそれぞれの係数を用いて計算し、前記それぞれの係数に絶対値を用いて、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1、GSNの順序で重みを付ける、請求項27〜30のいずれか1項に記載の方法。
  32. 前記治療転帰スコアが、治療が著効、治療が有効、治療が無効で安定または治療が無効で増悪を示す、請求項27に記載の方法。
  33. 前記モデルが、NMFpredictor(線形)、SVMlight(線形)、SVMlight一次多項式カーネル(次数dの多項式)、SVMlight二次多項式カーネル(次数dの多項式)、WEKA SMO(線形)、WEKA j48樹木(樹木ベース)、WEKAハイパーパイプ(分布ベース)、WEKAランダムフォレスト(樹木ベース)、WEKAナイーブベイズ(確率論的/ベイズ)、WEKA JRip(ルールベース)、glmnet lasso(スパース線形)、glmnetリッジ回帰(スパース線形)およびglmnetエラスティックネット(スパース線形)からなる群より選択される分類器を用いる機械学習アルゴリズムを用いて作製されたものである、請求項27に記載の方法。
  34. 前記遺伝子のRNA転写値をそれぞれの係数を用いて計算し、前記それぞれの係数に絶対値を用いて、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1、GSNの順序で重みを付ける、請求項27に記載の方法。
  35. 高悪性度膀胱癌を有する患者の治療転帰を予測する方法であって、
    前記患者の複数のRNA転写値を入手し、前記RNA転写値が、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1およびGSNからなる群より選択される少なくとも2種類の遺伝子の値であることと、
    機械学習アルゴリズムによって作製されたモデルに前記RNA転写値を用いて、前記患者の治療転帰を予測することと
    を含む、方法。
  36. 前記機械学習アルゴリズムが、NMFpredictor(線形)、SVMlight(線形)、SVMlight一次多項式カーネル(次数dの多項式)、SVMlight二次多項式カーネル(次数dの多項式)、WEKA SMO(線形)、WEKA j48樹木(樹木ベース)、WEKAハイパーパイプ(分布ベース)、WEKAランダムフォレスト(樹木ベース)、WEKAナイーブベイズ(確率論的/ベイズ)、WEKA JRip(ルールベース)、glmnet lasso(スパース線形)、glmnetリッジ回帰(スパース線形)およびglmnetエラスティックネット(スパース線形)からなる群より選択される分類器を用いるものである、請求項35に記載の方法。
  37. 前記機械学習アルゴリズムが、glmnetエラスティックネット(スパース線形)分類器を用いるものである、請求項36に記載の方法。
  38. 前記遺伝子のRNA転写値をそれぞれの係数を用いて計算し、前記それぞれの係数に絶対値を用いて、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1、GSNの順序で重みを付ける、請求項35に記載の方法。
  39. 高悪性度膀胱癌治療の治療転帰の予測への複数のRNA転写値の使用であって、前記予測が、複数の機械学習アルゴリズムから得た単一モデルを用いるものであり、前記RNA転写値が、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1およびGSNからなる群より選択される遺伝子のものである、使用。
  40. 前記遺伝子のRNA転写値をそれぞれの係数を用いて計算し、前記それぞれの係数に絶対値を用いて、PCDHGA4、PCDHGB1、HSP90AB2P、SPAG9、DDI2、TOP1P2、AGAP1、BBS9、FNIP2、LOC647121、NFIC、TGFBRAP1、EPRS、C9orf129、SARS、RBM28、NACC2、GTPBP5、PRKAR2A、CDK8、FAM24B、CRK、RAB2A、SMAD2、ELP2、WWP1、KIF5B、RPL39、PSEN1、SURF4、TTC35、TOM1、TES、VWA1、GOLGA2、ARHGAP21、FLJ37201、KIAA1429、AZIN1、SCAMP2、H1F0、PYCR1、SEC24D、FLNB、PATL1、HDLBP、RRBP1、OXR1、GLB1、NPEPPS、KIF1C、DDB1、GSNの順序で重みを付ける、請求項39に記載の使用。
  41. 前記機械学習アルゴリズムが、NMFpredictor(線形)、SVMlight(線形)、SVMlight一次多項式カーネル(次数dの多項式)、SVMlight二次多項式カーネル(次数dの多項式)、WEKA SMO(線形)、WEKA j48樹木(樹木ベース)、WEKAハイパーパイプ(分布ベース)、WEKAランダムフォレスト(樹木ベース)、WEKAナイーブベイズ(確率論的/ベイズ)、WEKA JRip(ルールベース)、glmnet lasso(スパース線形)、glmnetリッジ回帰(スパース線形)およびglmnetエラスティックネット(スパース線形)からなる群より選択される分類器を用いるものである、請求項39に記載の使用。
  42. 前記機械学習アルゴリズムが、glmnetエラスティックネット(スパース線形)を用いるものである、請求項41に記載の使用。
JP2017537902A 2015-01-20 2016-01-19 高悪性度膀胱癌の化学療法に対する奏効を予測するシステムおよび方法 Ceased JP2018507470A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562105697P 2015-01-20 2015-01-20
US62/105,697 2015-01-20
US201562127546P 2015-03-03 2015-03-03
US62/127,546 2015-03-03
PCT/US2016/013959 WO2016118527A1 (en) 2015-01-20 2016-01-19 Systems and methods for response prediction to chemotherapy in high grade bladder cancer

Publications (1)

Publication Number Publication Date
JP2018507470A true JP2018507470A (ja) 2018-03-15

Family

ID=56417658

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017537902A Ceased JP2018507470A (ja) 2015-01-20 2016-01-19 高悪性度膀胱癌の化学療法に対する奏効を予測するシステムおよび方法

Country Status (9)

Country Link
US (1) US11101038B2 (ja)
EP (1) EP3248127A4 (ja)
JP (1) JP2018507470A (ja)
KR (1) KR102116485B1 (ja)
CN (1) CN107548498A (ja)
AU (2) AU2016209478B2 (ja)
CA (1) CA2974199A1 (ja)
IL (1) IL253550B (ja)
WO (1) WO2016118527A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11101038B2 (en) 2015-01-20 2021-08-24 Nantomics, Llc Systems and methods for response prediction to chemotherapy in high grade bladder cancer

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2017290803A1 (en) 2016-06-30 2019-01-24 Nant Holdings Ip, Llc Nant cancer vaccine
CN109952611A (zh) * 2016-08-03 2019-06-28 南托米克斯有限责任公司 达沙替尼响应预测模型及其方法
CN109543203B (zh) * 2017-09-22 2023-04-18 山东建筑大学 一种基于随机森林的建筑冷热负荷预测方法
JP2021501422A (ja) * 2017-10-30 2021-01-14 ナントミクス,エルエルシー テモゾロミド反応予測因子及び方法
US11823773B2 (en) 2018-04-13 2023-11-21 Nant Holdings Ip, Llc Nant cancer vaccine strategies
US11564980B2 (en) 2018-04-23 2023-01-31 Nantcell, Inc. Tumor treatment method with an individualized peptide vaccine
TWI787500B (zh) 2018-04-23 2022-12-21 美商南特細胞公司 新抗原表位疫苗及免疫刺激組合物及方法
US20210228128A1 (en) * 2018-05-08 2021-07-29 Abbott Diabetes Care Inc. Sensing systems and methods for identifying emotional stress events
CN108611416B (zh) * 2018-05-09 2020-12-29 中国科学院昆明动物研究所 一种基于多基因表达特征谱的宫颈癌个性化预后评估方法
US20200118691A1 (en) * 2018-10-10 2020-04-16 Lukasz R. Kiljanek Generation of Simulated Patient Data for Training Predicted Medical Outcome Analysis Engine
JP2022504916A (ja) * 2018-10-12 2022-01-13 ヒューマン ロンジェヴィティ インコーポレイテッド 癌の遺伝子および臨床データの統合分析のためのマルチオミクス検索エンジン
CN109671499B (zh) * 2018-10-22 2023-06-13 南方医科大学 一种直肠毒性预测系统构建方法
EP3912007A4 (en) * 2019-01-10 2022-11-02 Travera LLC IDENTIFICATION OF CANCER THERAPIES
US10515715B1 (en) 2019-06-25 2019-12-24 Colgate-Palmolive Company Systems and methods for evaluating compositions
US11368890B2 (en) * 2020-06-30 2022-06-21 At&T Intellectual Property I, L.P. Predicting small cell capacity and coverage to facilitate offloading of macrocell capacity
CN115565610B (zh) * 2022-09-29 2024-06-11 四川大学 基于多组学数据的复发转移分析模型建立方法及系统
CN115631847B (zh) * 2022-10-19 2023-07-14 哈尔滨工业大学 基于多组学特征的早期肺癌诊断系统、存储介质及设备
CN116013528B (zh) * 2023-01-10 2023-11-24 中山大学孙逸仙纪念医院 结合fish检测的膀胱癌术后复发风险预测方法、装置及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060195266A1 (en) * 2005-02-25 2006-08-31 Yeatman Timothy J Methods for predicting cancer outcome and gene signatures for use therein
WO2012009382A2 (en) * 2010-07-12 2012-01-19 The Regents Of The University Of Colorado Molecular indicators of bladder cancer prognosis and prediction of treatment response
JP2013000067A (ja) * 2011-06-17 2013-01-07 Toray Ind Inc 膀胱ガン診断用組成物及び方法
WO2013090620A1 (en) * 2011-12-13 2013-06-20 Genomedx Biosciences, Inc. Cancer diagnostics using non-coding transcripts
WO2014043803A1 (en) * 2012-09-20 2014-03-27 Genomedx Biosciences, Inc. Thyroid cancer diagnostics

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001035316A2 (en) 1999-11-10 2001-05-17 Structural Bioinformatics, Inc. Computationally derived protein structures in pharmacogenomics
WO2003079286A1 (en) 2002-03-15 2003-09-25 Pacific Edge Biotechnology Limited Medical applications of adaptive learning systems using gene expression data
EP1579383A4 (en) 2002-10-24 2006-12-13 Univ Duke MODELING OF A BINARY PREVISIONAL TREE WITH SEVERAL PREDICTORS, AND ITS USE IN CLINICAL AND GENOMIC APPLICATIONS
US9342657B2 (en) 2003-03-24 2016-05-17 Nien-Chih Wei Methods for predicting an individual's clinical treatment outcome from sampling a group of patient's biological profiles
CA2531967C (en) * 2003-07-10 2013-07-16 Genomic Health, Inc. Expression profile algorithm and test for cancer prognosis
US20050210015A1 (en) 2004-03-19 2005-09-22 Zhou Xiang S System and method for patient identification for clinical trials using content-based retrieval and learning
JP5813908B2 (ja) 2004-04-09 2015-11-17 ジェノミック ヘルス, インコーポレイテッド 化学療法剤に対する応答を予測するための遺伝子発現マーカー
RU2007124523A (ru) 2004-12-30 2009-02-10 ПРОВЕНТИС, Инк., (US) Способы, системы и компьютерные программные продукты для разработки и использования прогнозных моделей для прогнозирования большинства медицинских случаев, оценки стратегий вмешательства и для одновременной оценки нерегулярности биологических маркеров
WO2007067500A2 (en) * 2005-12-05 2007-06-14 Genomic Health, Inc. Predictors of patient response to treatment with egfr inhibitors
GB2444410B (en) 2006-11-30 2011-08-24 Navigenics Inc Genetic analysis systems and methods
US7899764B2 (en) 2007-02-16 2011-03-01 Siemens Aktiengesellschaft Medical ontologies for machine learning and decision support
US7844609B2 (en) 2007-03-16 2010-11-30 Expanse Networks, Inc. Attribute combination discovery
JP5745273B2 (ja) 2007-11-30 2015-07-08 クラリエント ダイアグノスティック サービシーズ, インコーポレイテッド 化学療法のためのマーカーとしてのtle3
WO2010030794A1 (en) 2008-09-10 2010-03-18 Digital Infuzion, Inc. Machine learning methods and systems for identifying patterns in data
US8484225B1 (en) 2009-07-22 2013-07-09 Google Inc. Predicting object identity using an ensemble of predictors
US20110262921A1 (en) * 2010-04-23 2011-10-27 Sabichi Anita L Test for the Detection of Bladder Cancer
US10192641B2 (en) 2010-04-29 2019-01-29 The Regents Of The University Of California Method of generating a dynamic pathway map
CN110322924A (zh) 2010-04-29 2019-10-11 加利福尼亚大学董事会 利用关于基因组模型的数据集成的途径识别方法(paradigm)
KR102218512B1 (ko) 2010-05-25 2021-02-19 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 Bambam:고처리율 서열분석 데이터의 병렬 비교 분석
US9646134B2 (en) 2010-05-25 2017-05-09 The Regents Of The University Of California Bambam: parallel comparative analysis of high-throughput sequencing data
WO2012030840A2 (en) * 2010-08-30 2012-03-08 Myriad Genetics, Inc. Gene signatures for cancer diagnosis and prognosis
EP2681709A4 (en) 2011-03-04 2015-05-06 Kew Group Llc PERSONALIZED MEDICAL MANAGEMENT SYSTEM, NETWORKS AND ASSOCIATED METHODS
AU2012267888A1 (en) 2011-06-07 2014-01-30 Caris Mpi, Inc. Molecular profiling for cancer
US9678075B2 (en) 2011-06-10 2017-06-13 Deutsches Krebsforschungszentrum Prediction of recurrence for bladder cancer by a protein signature in tissue samples
US20140199273A1 (en) 2011-08-05 2014-07-17 Nodality, Inc. Methods for diagnosis, prognosis and methods of treatment
US9934361B2 (en) 2011-09-30 2018-04-03 Univfy Inc. Method for generating healthcare-related validated prediction models from multiple sources
EP2769321B1 (en) 2011-10-21 2016-06-01 Nestec S.A. Methods for improving inflammatory bowel disease diagnosis
EP2644705A1 (en) 2012-03-30 2013-10-02 RWTH Aachen Biomarker for bladder cancer
US9767526B2 (en) 2012-05-11 2017-09-19 Health Meta Llc Clinical trials subject identification system
EP2669682B1 (en) 2012-05-31 2017-04-19 Heinrich-Heine-Universität Düsseldorf Novel prognostic and predictive biomarkers (tumor markers) for human breast cancer
AU2013329319B2 (en) 2012-10-09 2019-03-14 Five3 Genomics, Llc Systems and methods for learning and identification of regulatory interactions in biological pathways
US20140143188A1 (en) 2012-11-16 2014-05-22 Genformatic, Llc Method of machine learning, employing bayesian latent class inference: combining multiple genomic feature detection algorithms to produce an integrated genomic feature set with specificity, sensitivity and accuracy
CA2905072A1 (en) 2013-03-15 2014-09-25 The Cleveland Clinic Foundation Self-evolving predictive model
CN105556523B (zh) 2013-05-28 2017-07-11 凡弗3基因组有限公司 Paradigm药物响应网络
CA2937051A1 (en) * 2014-01-17 2015-07-23 Ontario Institute For Cancer Research (Oicr) Biopsy-driven genomic signature for prostate cancer prognosis
WO2016118527A1 (en) 2015-01-20 2016-07-28 Nantomics, Llc Systems and methods for response prediction to chemotherapy in high grade bladder cancer
KR20190047108A (ko) 2015-03-03 2019-05-07 난토믹스, 엘엘씨 앙상블-기반 연구 추천 시스템 및 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060195266A1 (en) * 2005-02-25 2006-08-31 Yeatman Timothy J Methods for predicting cancer outcome and gene signatures for use therein
WO2012009382A2 (en) * 2010-07-12 2012-01-19 The Regents Of The University Of Colorado Molecular indicators of bladder cancer prognosis and prediction of treatment response
JP2013000067A (ja) * 2011-06-17 2013-01-07 Toray Ind Inc 膀胱ガン診断用組成物及び方法
WO2013090620A1 (en) * 2011-12-13 2013-06-20 Genomedx Biosciences, Inc. Cancer diagnostics using non-coding transcripts
WO2014043803A1 (en) * 2012-09-20 2014-03-27 Genomedx Biosciences, Inc. Thyroid cancer diagnostics

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11101038B2 (en) 2015-01-20 2021-08-24 Nantomics, Llc Systems and methods for response prediction to chemotherapy in high grade bladder cancer

Also Published As

Publication number Publication date
WO2016118527A1 (en) 2016-07-28
KR20180010176A (ko) 2018-01-30
CN107548498A (zh) 2018-01-05
US20180004905A1 (en) 2018-01-04
AU2016209478B2 (en) 2019-03-07
CA2974199A1 (en) 2016-07-28
US11101038B2 (en) 2021-08-24
KR102116485B1 (ko) 2020-05-28
AU2016209478A1 (en) 2017-08-10
IL253550A0 (en) 2017-09-28
EP3248127A4 (en) 2018-08-08
EP3248127A1 (en) 2017-11-29
IL253550B (en) 2020-05-31
AU2019203295A1 (en) 2019-05-30

Similar Documents

Publication Publication Date Title
JP2018507470A (ja) 高悪性度膀胱癌の化学療法に対する奏効を予測するシステムおよび方法
JP6609355B2 (ja) 細胞系ゲノミクスからの薬物応答の患者特異的予測のためのシステムおよび方法
KR102190299B1 (ko) 인공신경망을 이용한 위암의 예후 예측 방법, 장치 및 프로그램
Jakobsen et al. Applying machine learning in motor activity time series of depressed bipolar and unipolar patients compared to healthy controls
Kurilov et al. Assessment of modelling strategies for drug response prediction in cell lines and xenografts
JP2019527894A (ja) ダサチニブ反応予測モデルおよびその方法
He et al. Identification of putative causal loci in whole-genome sequencing data via knockoff statistics
Zang et al. Adaptive clinical trial designs in oncology
CA2877436C (en) Systems and methods for generating biomarker signatures
Behrman et al. Classification of patients with pain based on neuropathic pain symptoms: Comparison of an artificial neural network against an established scoring system
Zhang et al. Trabeculae microstructure parameters serve as effective predictors for marginal bone loss of dental implant in the mandible
Hernández-Lorenzo et al. On the limits of graph neural networks for the early diagnosis of Alzheimer’s disease
Hossain et al. Application of skew-normal distribution for detecting differential expression to microRNA data
van Houwelingen From model building to validation and back: a plea for robustness
Fisher et al. Stochastic optimization of adaptive enrichment designs for two subpopulations
US10734095B2 (en) Systems and methods for prioritizing variants of unknown significance
Li et al. Robust nonparametric integrative analysis to decipher heterogeneity and commonality across subgroups using sparse boosting
Chen et al. Artificial neural network prediction for cancer survival time by gene expression data
Bian et al. Autoencoder-transformed transcriptome improves genotype-phenotype association studies
Farah et al. DNA based disease prediction using pathway analysis
Jin Biologically Interpretable Machine Learning Methods to Understand Gene Regulation for Disease Phenotypes
Yang Applying machine learning to derive actionable insights in precision oncology
Chang et al. High-dimensional causal mediation analysis by partial sum statistic and sample splitting strategy in imaging genetics application
Dadu ML-assisted therapeutics for neurodegenerative disorders
Bao et al. Explaining the genetic causality for complex diseases via deep association kernel learning

Legal Events

Date Code Title Description
A529 Written submission of copy of amendment under article 34 pct

Free format text: JAPANESE INTERMEDIATE CODE: A529

Effective date: 20170815

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190910

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20191205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200130

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200609

A045 Written measure of dismissal of application [lapsed due to lack of payment]

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20201027