JP2020523991A - Praegnant転移性乳癌コホートにおける不良アウトカムの予後指標因子 - Google Patents

Praegnant転移性乳癌コホートにおける不良アウトカムの予後指標因子 Download PDF

Info

Publication number
JP2020523991A
JP2020523991A JP2019569362A JP2019569362A JP2020523991A JP 2020523991 A JP2020523991 A JP 2020523991A JP 2019569362 A JP2019569362 A JP 2019569362A JP 2019569362 A JP2019569362 A JP 2019569362A JP 2020523991 A JP2020523991 A JP 2020523991A
Authority
JP
Japan
Prior art keywords
genes
survival
patients
clusters
patient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2019569362A
Other languages
English (en)
Inventor
ゼトー,クリストファー
チャールズ ベンツ,スティーブン
チャールズ ベンツ,スティーブン
グエン,アンドリュー
Original Assignee
ナントミクス,エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ナントミクス,エルエルシー filed Critical ナントミクス,エルエルシー
Publication of JP2020523991A publication Critical patent/JP2020523991A/ja
Abandoned legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Software Systems (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Artificial Intelligence (AREA)
  • Zoology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Oncology (AREA)
  • Bioethics (AREA)
  • Microbiology (AREA)
  • Computing Systems (AREA)

Abstract

転移性乳癌と診断された患者の腫瘍組織からのトランスクリプトミクスデータがクラスタリングされ、且つ患者の全生存と関連付けられる。不良アウトカムと関連するクラスタの1つからの遺伝子のサブセットは、複数の遺伝子の発現レベルに基づいて生存期間を予測する生存予測モデルを作成するために使用される。このように作成された生存予測モデルを使用して、転移性乳癌と診断された患者の生存期間が予測され得、及びその生存期間に基づいて治療レジメンが更新又は作成され得る。

Description

本出願は、2017年6月16日に出願された本出願人らの同時係属米国仮特許出願第62/521,267号明細書及び2017年12月4日に出願された同第62/594,345号明細書に対する優先権を主張する。
本発明の分野は、転移性乳癌患者の予後及び/又は生存を予測するために使用され得る転移性乳癌の分子プロファイルを同定するシステム及び方法である。
本明細書における全ての刊行物及び特許出願は、それぞれの個々の刊行物又は特許出願が参照により組み込まれることが具体的及び個別的に示されるのと同程度に参照により組み込まれる。組み込まれる参照文献における用語の定義又は使用が、本明細書に提供されるその用語の定義と不一致であるか又は逆である場合、本明細書に提供されるその用語の定義が適用され、参照文献におけるその用語の定義は適用されない。
初回診断時、乳癌は、典型的には、種々の基準、例としてグレード、病期及び組織病理を使用して分類される。ここ10年にわたり、分子的特徴付けも考慮されるようになっており、それとしては、典型的には、受容体状態、特にエストロゲン受容体(ER)、プロゲステロン受容体(PR)及びヒト上皮成長因子受容体2(HER2)が挙げられる。さらに、多数の遺伝子ベーステストが癌のさらなるサブタイピングにおいて一般的になっている。
例えば、トリプルネガティブ乳癌(TNBC)を、化学療法に対して観察される治療応答のレトロスペクティブ分析に基づき、いくつかの分子的に区別されるサブグループの分子サブタイプにリファインする労力が払われている(例えば、PLOS ONE|DOI:10.1371/journal.pone.0157368 June 16、2016を参照されたい)。同様に、TNBCについてのサブタイプは、TNBCの5つの潜在的な臨床的に実用可能なグルーピングに基づいて定義された:1)DNA修復欠損又は成長因子経路を有するベーサルライクTNBC;2)上皮間葉移行及び癌幹細胞特徴を有する間葉様TNBC;3)免疫関連TNBC;4)アンドロゲン受容体過剰発現を有するルミナール/アポクリンTNBC;並びに5)HER2エンリッチドTNBC(例えば、Oncotarget,Vol.6、No.15;pp 12890−12908を参照されたい)。さらに別の研究(例えば、J Breast Cancer 2016 September;19(3):223−230を参照されたい)において、TNBCのサブタイプは、ベーサルライク、間葉、ルミナールアンドロゲン受容体及び免疫エンリッチド(immune enriched)と同定された。一層さらなる公知の研究において、発現サブタイピングが実施され、テストされた患者サンプルのうちの3つのサブクラスタが同定された(例えば、Breast Cancer Research(2015)17:43を参照されたい)。同様に、TNBCを遺伝子発現により分類するためのオンライン分類ツール(URL:cbc.mc.vanderbilt.edu/tnbc;Cancer Informatics 2012:11 147−156)が公開され、それは、TNBCデータを6つの区別されるサブタイプに分類する。
しかしながら、乳癌が転移性乳癌である場合、患者は、新規標的療法にかかわらず、極めて不所望な予後を有することが多い。さらに、進行性/転移性乳癌を有する患者についての予後及び予測因子は、十分に理解されていない。実際、転移性状況における患者及び腫瘍の分子的評価は、この患者群への多大な利益を示す分子プレシジョンメディシンの進歩に関わらず、定型的に実施されていない。
したがって、乳癌を分類する種々のシステム及び方法は、当技術分野において公知であるが、転移性乳癌の分子的特徴付けは、十分に理解されていない。したがって、転移性乳癌の分子的特徴付けを可能とするシステム及び方法が必要とされ続けている。
本発明の主題は、転移性乳癌組織の遺伝子発現プロファイルを使用して患者の全生存期間と有意に関連する遺伝子のクラスタを同定する種々のシステム及び方法を対象とする。次いで、このように同定されたクラスタを使用して、複数の患者の少なくとも一部の不良生存と関連する少なくとも1つのクラスタ中の複数の遺伝子の発現レベルに基づき、生存期間を予測する生存予測モデルを作成することができる。
したがって、本発明の主題の一態様としては、転移性乳癌についての生存予測モデルを作成する方法が挙げられる。この方法は、転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを得るステップを含む。次いで、完全ピアソン相関を使用して、複数のクラスタへのトランスクリプトミクスデータを複数のクラスタにクラスタリングする。典型的には、トランスクリプトミクスデータは、少なくとも1,000個の遺伝子のRNA−seqデータ及び/又はRNA発現レベルを含み、クラスタの数は、エルボー法を使用して決定される。複数のクラスタのうち、複数のクラスタを複数の患者の全生存と相関させることにより、複数の患者の少なくとも一部の不良生存と関連するものとして少なくとも1つのクラスタを同定する。好ましくは、複数のクラスタは、複数の患者の全生存と示差的に相関される。次いで、複数の遺伝子の発現レベルに基づき、生存期間を予測する生存予測モデルを作成する。好ましくは、複数の遺伝子は、複数の患者の少なくとも一部の不良生存と関連する少なくとも1つのクラスタ中に存在し、WNTシグナリング経路又は多能性経路と関連する少なくとも1つの遺伝子を含む。さらに、少なくとも1つのクラスタは、1.3超のハザード比を有することが好ましい。
好ましくは、複数の遺伝子は、複数の遺伝子の発現レベルの関数における複数の患者のうちの短期生存者(low survivor)からの長期生存者(high survivor)の分離の質に基づき、少なくとも1つのクラスタのトランスクリプトミクスデータのうちから選択される。一部の実施形態において、複数の遺伝子は、50個未満である。他の実施形態において、複数の遺伝子は、TMEM257、FAM180B、WNT11、CTDSPL、PROK1、GAD2、GRK7、FZD6、KRTAP505、KRT31、PRAMEF12、SYNGR4、SOX2、BHLHA9、POU1F1、KHNYN、CACNA2D4、C3orf36、RHOXF2、PABPN1L、EID2B、BBS4、AGPS、EFCC1、ROBO2、CMTM4、THTPA、ZP4、HIST1H2BE、LOC286238、IFNL2、DGKK、GNGT1、USP17L30及びERN1からなる群から選択される。
さらに、方法は、予測生存期間を患者の実際の生存期間と比較することにより、生存予測モデルのc統計量を計算することをさらに含み得る。好ましくは、生存予測モデルのc統計量は、0.7超である。
本発明の主題の別の態様において、本発明者らは、転移性乳癌と診断された患者の生存期間を予測する方法を企図する。この方法において、患者の腫瘍組織のトランスクリプトミクスデータを得、トランスクリプトミクスデータからの複数の遺伝子のRNA発現レベルを決定する。典型的には、トランスクリプトミクスデータは、RNA−seqデータを含む。生存予測モデルを使用して、RNA発現レベルに基づいて患者の生存期間を予測することができる。最も好ましくは、複数の遺伝子のうちの少なくとも2つの遺伝子は、Wntシグナリング経路又は多能性経路と関連する。
最も典型的には、複数の遺伝子の数は、50個未満である。好ましくは、複数の遺伝子は、TMEM257、FAM180B、WNT11、CTDSPL、PROK1、GAD2、GRK7、FZD6、KRTAP505、KRT31、PRAMEF12、SYNGR4、SOX2、BHLHA9、POU1F1、KHNYN、CACNA2D4、C3orf36、RHOXF2、PABPN1L、EID2B、BBS4、AGPS、EFCC1、ROBO2、CMTM4、THTPA、ZP4、HIST1H2BE、LOC286238、IFNL2、DGKK、GNGT1、USP17L30及びERN1からなる群から選択される。
好ましくは、生存予測モデルは、転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを得ることによって作成される。次いで、完全ピアソン相関を使用して、複数のクラスタへのトランスクリプトミクスデータを複数のクラスタにクラスタリングする。典型的には、トランスクリプトミクスデータは、少なくとも1,000個の遺伝子のRNA−seqデータ及び/又はRNA発現レベルを含み、クラスタの数は、エルボー法を使用して決定される。複数のクラスタのうち、複数のクラスタを複数の患者の全生存と相関させることにより、複数の患者の少なくとも一部の不良生存と関連するものとして少なくとも1つのクラスタを同定する。好ましくは、複数のクラスタは、複数の患者の全生存と示差的に相関される。この方法において生存期間を予測するために使用される複数の遺伝子は、複数の遺伝子の発現レベルの関数における複数の患者のうちの短期生存者からの長期生存者の分離の質に基づき、少なくとも1つのクラスタから選択され得る。さらに、少なくとも1つのクラスタは、1.3超のハザード比を有することが好ましい。
さらに、生存予測モデルのc統計量は、予測生存期間を患者の実際の生存期間と比較することによって計算され得る。好ましくは、生存予測モデルのc統計量は、0.7超である。
さらに、方法は、予測生存期間に基づき、患者記録を更新若しくは作成するステップ及び/又は予測生存期間に基づき、患者のための治療レジメンを修正するステップを含み得る。
本発明の主題のさらに別の態様において、本発明者らは、転移性乳癌と診断された患者のための治療レジメンを作成又は更新する方法を企図する。この方法において、患者の腫瘍組織のトランスクリプトミクスデータを得、トランスクリプトミクスデータからの複数の遺伝子のRNA発現レベルを決定する。典型的には、トランスクリプトミクスデータは、RNA−seqデータを含む。次いで、生存予測モデルを使用して、RNA発現レベルに基づいて患者の生存期間を予測することができる。方法は、Wntシグナリング経路又は多能性経路の経路要素を標的化する少なくとも1つの薬剤を含むように治療レジメンを作成又は更新するステップで続く。
最も典型的には、複数の遺伝子の数は、50個未満である。好ましくは、複数の遺伝子は、TMEM257、FAM180B、WNT11、CTDSPL、PROK1、GAD2、GRK7、FZD6、KRTAP505、KRT31、PRAMEF12、SYNGR4、SOX2、BHLHA9、POU1F1、KHNYN、CACNA2D4、C3orf36、RHOXF2、PABPN1L、EID2B、BBS4、AGPS、EFCC1、ROBO2、CMTM4、THTPA、ZP4、HIST1H2BE、LOC286238、IFNL2、DGKK、GNGT1、USP17L30及びERN1からなる群から選択される。代わりに、複数の遺伝子は、WNT11、SOX2及びFZD6を含む。
好ましくは、生存予測モデルは、転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを得ることによって作成される。次いで、完全ピアソン相関を使用して、複数のクラスタへのトランスクリプトミクスデータを複数のクラスタにクラスタリングする。典型的には、トランスクリプトミクスデータは、少なくとも1,000個の遺伝子のRNA−seqデータ及び/又はRNA発現レベルを含み、クラスタの数は、エルボー法を使用して決定される。複数のクラスタのうち、複数のクラスタを複数の患者の全生存と相関させることにより、複数の患者の少なくとも一部の不良生存と関連するものとして少なくとも1つのクラスタを同定する。好ましくは、複数のクラスタは、複数の患者の全生存と示差的に相関される。この方法において生存期間を予測するために使用される複数の遺伝子は、複数の遺伝子の発現レベルの関数における複数の患者のうちの短期生存者からの長期生存者の分離の質に基づき、少なくとも1つのクラスタから選択され得る。さらに、少なくとも1つのクラスタは、1.3超のハザード比を有することが好ましい。
さらに、生存予測モデルのc統計量は、予測生存期間を患者の実際の生存期間と比較することによって計算され得る。好ましくは、生存予測モデルのc統計量は、0.7超である。さらに、方法は、予測生存期間に基づき、患者記録を更新又は作成するステップを含み得る。
本発明の主題の種々の目的、特徴部、態様及び利点は、添付の図面に加えて好ましい実施形態の以下の詳細な説明からより明らかになる。
PRAEGNANT試験プログラムの概略的説明である。 免疫組織化学(IHC)グルーピングにより階層化されたPRAEGNANT試験プログラムにおける全生存(OS)を示すグラフである。 PAM50サブタイプグルーピングにより階層化されたPRAEGNANT試験プログラムにおける全生存(OS)を示すグラフである。 1,000個の最も変動して発現される遺伝子及び完全ピアソン相関を使用した5つのクラスタへのクラスタリングについての例示的なヒートマップである。 図4において決定された遺伝子の5つのクラスタの遺伝子発現レベルにより階層化されたPRAEGNANT試験プログラムにおける全生存(OS)を示すグラフである。 それぞれクラスタ5及び2における最不良生存グルーピング(6A)及び最良好生存グルーピング(6B)についての例示的なベン図グラフを示す。 訓練データセット及び評価データセットを用いた例示的な死亡までの時間の予測グラフを示す。 生存予測モデルにおいて使用された35個の遺伝子のヒートマップを示す。
ここで、本発明者らは、転移性乳癌と診断された患者の腫瘍組織から決定された遺伝子の発現プロファイリングを使用して、転移性乳癌患者の異なるレベルの全生存と関連する遺伝子発現パターンのクラスタを作成できることを発見した。本発明者らは、このように作成されたクラスタ、より具体的には転移性乳癌患者の不良予後又は不良生存と関連する高リスククラスタが、不良予後を有する患者の生存期間又は死亡までの時間を予測するための他のマーカー又はサブタイピング法よりも良好な指標因子であり得ることをさらに発見した。高リスククラスタ中の遺伝子のうち、本発明者らは、高精度の予測モデルを作成するために使用することができる、生存期間と最も実質的に関連する遺伝子の小さいサブセットを同定することができた。
異なる観点から考慮すると、患者の生存期間又は死亡までの時間は、トランスクリプトミクスを、患者の異なる生存期間又は死亡までの時間に関連する複数のクラスタにクラスタリングすることにより同定された遺伝子のグループの発現プロファイリングを決定することにより、より高信頼度で予測できることを本発明者らは発見した。遺伝子のグループの遺伝子の数は、機械学習を使用して低減させることができる一方、予測の信頼性及び精度を維持又はさらに増加させ、そうして患者の生存期間の正確な予測を提供するために処理されるデータの量を低減させ得ることを本発明者らはさらに見出した。結果的に、本発明の主題の1つの特に好ましい態様において、本発明者らは、転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを使用し、トランスクリプトミクスデータを、少なくとも1つが患者の不良生存と関連する複数のクラスタにクラスタリングして、転移性乳癌についての生存予測モデルを作成する方法を企図する。このようにクラスタリングされたトランスクリプトミクスデータからの遺伝子のサブセット及び/又はその発現パターンを同定し、全生存と関連付け、そうして高信頼性の生存予測モデルを作成し得る。
本明細書において使用される用語「腫瘍」は、ヒト体内の1つ以上の解剖学的部位に位置するか又は見出され得る1つ以上の癌細胞、癌組織、悪性腫瘍細胞又は悪性腫瘍組織を指し、それらと互換的に使用される。本明細書において使用される用語「患者」には、病態(例えば、癌)と診断された個体並びに病態を検出又は同定する目的で検査及び/又はテストを受ける個体の両方が含まれることに留意すべきである。したがって、腫瘍を有する患者は、癌と診断された個体及び癌を有する疑いがある個体の両方を指す。本明細書において使用される用語「提供する」又は「提供すること」は、製造し、作成し、配置し、使用可能とし、移し、又は使用準備する任意の動作を指し、その用語にはそれらが含まれる。
トランスクリプトミクスデータの取得
オミクスデータ、特にトランスクリプトミクスデータを得る任意の好適な方法及び/又は手順が企図される。例えば、トランスクリプトミクスデータは、個体から組織を得、その組織を処理してその組織からRNAを得、関連情報をさらに分析することにより得ることができる。別の例において、トランスクリプトミクスデータは、個体のトランスクリプトミクス情報を保存するデータベースから直接得ることができる。
個体の組織からオミクスデータを得る場合、患者から腫瘍サンプル(腫瘍細胞若しくは腫瘍組織)又は健常組織を得る任意の好適な方法が企図される。最も典型的には、腫瘍サンプル又は健常組織サンプルは、生検(例として、液体生検又は外科手術中若しくは独立した生検手順の組織切除を介して得られるものなど)を介して患者から得ることができ、それは、組織からオミクスデータを得るさらなるプロセスまで新鮮物又は処理物(例えば、冷凍物など)であり得る。例えば、組織又は細胞は、新鮮物又は冷凍物であり得る。他の例において、組織又は細胞は、細胞/組織抽出物の形態であり得る。一部の実施形態において、組織又は細胞は、単一又は複数の異なる組織又は解剖学的領域から得ることができる。例えば、転移性乳癌組織は、患者の乳房及び転移乳癌組織についての他の器官(例えば、肝臓、脳、リンパ節、血液、肺など)から得ることができる。別の例において、患者の健常組織又は対応する正常組織(例えば、患者の非癌性乳房組織)は、身体又は器官の任意の部分、好ましくは肝臓、血液又は腫瘍付近(解剖学的距離が近いなど)の任意の他の組織から得ることができる。
一部の実施形態において、腫瘍サンプルを複数の時点で患者から得て、関連期間にわたる腫瘍サンプルの任意の変化を決定することができる。例えば、腫瘍サンプル(又は疑いがある腫瘍サンプル)は、サンプルが癌性と決定又は診断される前及びその後に得ることができる。別の例において、腫瘍サンプル(又は疑いがある腫瘍サンプル)は、1回又は一連の抗腫瘍治療(例えば、放射線療法、化学療法、免疫療法など)前、その間及び/又はその後(例えば、完了時など)に得ることができる。さらに別の例において、腫瘍サンプル(又は疑いがある腫瘍サンプル)は、新たな転移組織又は細胞の同定時に腫瘍の進行の間に得ることができる。
得られた腫瘍サンプル(細胞若しくは組織)又は健常サンプル(サンプル若しくは組織)からRNA(例えば、mRNA、miRNA、siRNA、shRNAなど)を単離し、さらに分析してトランスクリプトミクスデータを得ることができる。代わりに及び/又は加えて、トランスクリプトミクスデータを得るステップは、1人以上の患者及び/又は健常個体のトランスクリプトミクス情報を保存するデータベースからトランスクリプトミクスデータを受容することを含み得る。例えば、患者の腫瘍のトランスクリプトミクスデータは、患者の腫瘍組織からの単離RNAから得ることができ、得られたオミクスデータは、同一タイプの腫瘍又は異なるタイプの腫瘍を有する他の患者の他のトランスクリプトミクスデータセットとデータベース(例えば、クラウドデータベース、サーバなど)に保存することができる。患者の健常個体又は対応する正常組織(若しくは健常組織)から得られたトランスクリプトミクスデータも、分析時にデータベースから関連データセットを検索することができるようにデータベースに保存することができる。
癌及び/又は正常細胞のトランスクリプトミクスデータは、患者から、患者又は健常個体の癌組織(罹患組織)及び/又は対応する健常組織から得られたRNA(好ましくは、細胞mRNA)の配列情報及び/又は発現レベル(例として、発現プロファイリング、コピー数又はスプライスバリアント分析)を含む。当技術分野において公知のトランスクリプトミック分析の多数の方法が存在し、公知の方法の全てが本明細書における使用に好適であると考えられる(例えば、RNAseq、RNAハイブリダイゼーションアレイ、qPCRなど)。結果的に、好ましい材料としては、mRNA及び一次転写産物(hnRNA)が挙げられ、RNA配列情報は、同一患者の腫瘍サンプル及び対応する正常(健常)サンプルから順次得られた逆転写ポリA−RNAから得ることができる。同様に、ポリA−RNAは、典型的にはトランスクリプトームの代表物として好ましい一方、RNAの他の形態(hn−RNA、非ポリアデニル化RNA、siRNA、miRNAなど)も本明細書における使用に好適であると考えられることに留意すべきである。好ましい方法としては、定量的RNA(hnRNA又はmRNA)分析、特に例としてRNAseq、qPCR及び/又はrtPCRベースの方法が挙げられるが、種々の代替法(例えば、固相ハイブリダイゼーションベースの方法)も好適であると考えられる。
特定の疾患(例えば、癌など)、病期又は分析のタイプのために1つ以上の所望の核酸又は遺伝子を選択できることを認識すべきである。好ましくは、トランスクリプトミクスデータは、変動発現遺伝子のRNA発現レベルを含む。本明細書において使用される変動発現遺伝子は、発現レベルがサンプル間で少なくとも10%、好ましくは少なくとも20%、より好ましくは少なくとも30%、最も好ましくは少なくとも50%変動する任意の遺伝子を指す。したがって、トランスクリプトミクスデータに含まれる遺伝子の数は、特定の疾患(例えば、癌など)、病期又は分析のタイプに応じて変動し得る。最も典型的には、転移性乳癌組織のトランスクリプトミクスデータにおいて、トランスクリプトミクスデータに含めるべき変動発現遺伝子の数は、少なくとも300個の遺伝子、好ましくは少なくとも5,00個の遺伝子、より好ましくは少なくとも1,000個の遺伝子、最も好ましくは少なくとも1,500個の遺伝子である。
患者からトランスクリプトミクスデータを得る1つの例示的なプロトコル及び/又はデータベースとしては、企図されるトランスクリプトミックプロファイリングを含み、腫瘍/患者分子的特徴のリアルタイム包括的分析のためのインフラストラクチャを提供するように設計されるプロスペクティブ分子乳癌レジストリ(PRAEGNANT;試験プロトコル(NCT02338767))を挙げることができる。図1に示されるとおり、PRAEGNANT試験プログラムは、転移又は手術不可能な局所領域疾患のいずれかを有する患者にフォーカスする。組み入れは、規定の治療ラインを受容する患者に限定されない。疾患進行は、客観的に評価可能でなければならない。腫瘍再評価は、2〜3ヵ月ごとに行い、疾患が治療の変更後ごとに進行し続ける場合に追加の評価を実施する。有害事象及び重度の有害事象は、試験全体を通して生活の質として継続的に報告し、患者が任意の有害事象と一緒にその生活の質をそれら自身で記録することを可能とするプログラム(PRO;患者報告アウトカム)を使用する。
トランスクリプトミクス分析及びクラスタリング
本発明者らは、好ましくは、類似の疾患の状態において同一の疾患と診断された複数の患者のトランスクリプトミクスデータを遺伝子の発現レベルの相関及び/又はパターンに基づいて複数のグループにクラスタリングできることを企図する。トランスクリプトミクスデータをクラスタリングする任意の好適な方法が企図される。例えば、腫瘍組織中の変動発現遺伝子は、線形回帰法を使用して、好ましくは完全ピアソン相関を使用してクラスタリングすることができる。このような例において、遺伝子の1つのグループ又はクラスタにおける相関係数の絶対値は、少なくとも0.4超、好ましくは0.5超、より好ましくは0.6超、最も好ましくは0.7超であることが好ましい。したがって、一部の状況において、1つのクラスタ又は1つのグループ中の遺伝子は、互いに負又は正に相関する2つ以上のサブグループに分けることができる。
さらに、クラスタ又はグループのメンバー(量)(例えば、k平均アルゴリズムにおけるk)は、任意の好適な手段又はアルゴリズムにより決定することができる。1つの例示的な好ましい方法は、エルボー法である。また、他の方法としては、x平均クラスタリング、情報量規準アプローチ(例えば、赤池情報量規準(AIC)、ベイズ情報量規準(BIC)又は逸脱度情報量規準(DIC)など)、情報理論的アプローチ(例えば、ジャンプ法(jump method)など)、シルエット法及び/又はクロスバリデーション法が挙げられる。エルボー法を使用してクラスタの数を決定する場合、決定された数値及び次の値について説明される分散の割合の増分(F検定値)は、10%未満又は好ましくは5%未満であることが好ましい。例えば、図4に示されるとおり、ヒートマップにおいて、完全ピアソン相関を使用して遺伝子発現パターンに基づいて1,000個超の変動発現遺伝子を5つのクラスタにクラスタリングする。3〜10個のクラスタの最適数は、エルボー法を使用して同定し(データを示さず)、k平均を使用してそれぞれの患者のそれぞれの腫瘍サンプル(合計142個のサンプル)のトランスクリプトミクスデータ(遺伝子発現レベル)を5つのクラスタの1つと関連付けた。
トランスクリプトミクスデータのそれぞれのクラスタを患者の示差的な全生存と関連付けることができ、不良生存と関連する少なくとも1つのクラスタを同定できることが企図される。本明細書において使用される全生存は、疾患と診断された患者が依然として生存している診断日からの日数により計測する。例えば、図5に示されるとおり、それぞれのクラスタ(クラスタ1〜5)に対応する患者のサブセットの全生存は、カプランマイヤー曲線上で可視化されるとおり、5つのクラスタ間で示差的な全生存を示す。コックス比例ハザードモデルをそれらの5つのクラスタにフィットさせ、関連係数からそれぞれのクラスタのハザード比を計算する。一般に、ハザード比は、変動発現遺伝子の数(共変量の数)及び変動発現遺伝子の影響に基づいて計算することができる。本発明者らは、5つのクラスタのうち、クラスタ5(合計13個のサンプルのトランスクリプトミクスデータに対応する)が最大のハザード比(1.451、p=0.0021)を有することを見出し、それは、クラスタ5が転移性乳癌予後の不良アウトカムと最も有意に関連することを示した。
本発明者らは、患者の全生存、特に患者の不良アウトカムが、転移性乳癌と関連することが公知の他の個々の臨床的特徴又はマーカーと比較して、クラスタリングされた遺伝子及びそれらの発現パターンと有意に関連することを見出した。例えば、複数の転移性乳癌患者から、図1に示される実験スキームに従って腫瘍組織を得た。利用可能な初期結果に基づき、25個の臨床的特徴を、表1に例示的に示されるとおりコックス比例ハザードモデルにおいて生存との有意な関連について独立してテストした。特徴としては、とりわけ、診断情報(グレード、ホルモン受容体状態など)、健常関連要因(BMI、体重など)、以前の乳癌診断の本人及び家族の病歴が挙げられる。このような特徴のうち、本発明者らは、示差的な生存と有意に関連する(p<0.05)5つの特徴(エストロゲン受容体(ER)又はプロゲステロン受容体(PR)陽性、トリプルネガティブ状態、61歳未満診断及びトリプルネガティブ状態、PR陽性状態及びボディマスインデックス(BMI))並びにサブタイプを規定するために使用される3つの追加の特徴(ER状態、HER2状態及び診断時グレード)を同定した。最も強力なアウトカムの指標因子は、分子的特徴:ER又はPR陽性状態及びトリプルネガティブ状態(ER−PR−HER2−)であった。
Figure 2020523991
したがって、次に、本発明者らは、転移性乳癌についての3つの免疫組織化学(IHC)マーカー:エストロゲン受容体(ER)、プロゲステロン受容体(PR)及び上皮成長因子(HER2)を、臨床サブタイプを規定するための診断時グレード(G1)とともに使用して、分子マーカー及び転移性乳癌の臨床サブタイプと全生存率との間の相関を評価した。患者の生検組織を得、マーカータンパク質の発現及び/又は強度を決定して患者のサンプルを4つのグループ又はクラスタにグルーピングした:3つ全ての受容体についてIHC陰性をTNBCとしてグルーピングし;HER2+サンプルをHER2としてグルーピングし;ER/PR+及び3未満のG1をルミナールAとしてグルーピングし;ER/PR+及び2超のG1をルミナールBとしてグルーピングした。全生存(OS)を、図2に示されるとおり標準IHC分類(ルミナールA、ルミナールB、TNBC及びHER2)に対してプロットした。コックス比例ハザードモデルをそれらの4つのグループにフィットさせ、関連係数からハザード比を計算した。予期される傾向が明らかである一方(例えば、TNBCは不良予後を有する)、本発明者らは、臨床及び分子サブタイプ(タンパク質発現レベル)に基づく分類がコホートサイズにおいて統計的に有意なレベルで患者の全生存と関連し得ないことを見出すことができた。
本発明者らは、臨床及び分子サブタイプと患者の全生存との間の相関が、臨床及び分子サブタイプをそれらのトランスクリプトミクスデータにより分析する場合により実質的であるか否かをさらに決定した。したがって、OSについての公知の臨床関連要因(例えば、ホルモン受容体状態、診断時年齢及びBMI)をコックス比例ハザード比により分析し、アウトカムのトランスクリプトミックマーカーと比較した。全ての患者腫瘍をIlluminaシーケンシングプラットフォーム上でシーケンシングし、RNAseq発現データをRSEMにより分析してそれぞれの遺伝子アイソフォームについての転写産物百万分率(TPM)値を推定した。TPM対数値を推定PAM50内因性乳癌クラスタ遺伝子セットにおいて使用してPREAGNANTコホートにおけるサブグループを同定した。図3に示されるとおり、全生存(OS)を標準PAM50内因性サブタイプ:ルミナールA、ルミナールB、ベーサル及びHER2に対してプロットした。コックス比例ハザードモデルをそれらの4つのサブグループにフィットさせ、関連係数からハザード比を計算した。本発明者らは、HER2グループが十分な分析表現を有さない一方、ベーサル及びルミナールAサブタイプがそれぞれ不良及び最良好の生存と有意に相関することを見出した。試験プロトコルからの利用可能なオミクスデータに基づき、本発明者らは、ホルモン受容体陽性(HR=0.7、p<0.006)及びTNBC状態(HR=1.4、p<0.01)がアウトカムと有意に関連することを見出した。さらに、PAM50サブタイプも強力なアウトカムの指標因子であった(例えば、他のサブタイプと比較したベーサル疾患は、HR=1.34を有する、p<0.04)。特に、発現ベースPAM50サブタイプは、同等のIHCベースサブタイプよりも有意な示差的な生存を示した。
また、一部のPAM50サブタイプは、患者の全生存と相対的に強力に関連し得たが、本発明者らは、このコホートにおけるRNA発現ベース高リスククラスタが、他のクラスタと比較して臨床バリアント、IHCマーカー又は確立されたサブタイプよりも不良予後をHR=1.45(p<0.003)で示すことを見出した。表2は、IHC/臨床情報、確立された発現サブタイプ及び患者間の複数の遺伝子のRNA発現レベルを使用するクラスタリングを使用する最良好及び最不良の全生存を有する患者サブグループを列記する。このコホートにおける内因性サブタイプ(複数の遺伝子のRNA発現レベルを使用するクラスタリング)は、IHC/臨床サブタイプ又はPAM50内因性サブタイプと比較して示差的な生存と最も強力に相関する(p<0.02)。
Figure 2020523991
さらに、本発明者らは、IHC/臨床情報、確立された発現サブタイプ(PAM50)及び患者間の複数の遺伝子のRNA発現レベルを使用するクラスタリングにより分類される患者グループが実質的に重複しないことも見出した。例えば、図6Aは、主に転移性乳癌の不良アウトカムと関連する3つの患者グループ(IHC/臨床サブグルーピングからのTNBCグループ、PAM50サブグルーピングからのベーサルグループ、RNA発現レベルを使用するクラスタリングからのクラスタ5)のベン図を示す。最不良の全生存の3つの群間で一部の重複する患者集団が存在する一方、2つのグループの組合せは、それぞれのグループの患者の50%超を共有しない。同様に、図6Bは、主に転移性乳癌の最良好アウトカムと関連する3つの患者グループ(IHC/臨床及びPAM50についてのルミナールAグループ並びにRNA発現レベルを使用するクラスタリングからのクラスタ2)のベン図を示す。最不良の全生存の3つの群間で一部の重複する患者集団が存在する一方、2つのグループの組合せは、それぞれのグループの患者の50%超を共有しない。さらに、IHC/臨床サブグルーピングにおいてルミナールAグループと分類された患者のグループ及びPAM50サブグルーピングにおいてルミナールAグループと分類された患者のグループも実質的に重複しておらず、IHC/臨床サブグルーピング及びPAM50サブグルーピングにおいて同一の分子マーカー(タンパク質又はRNAのいずれかの異なる形態)を使用するサブグルーピングがマーカーと全生存との異なる相関を与え、したがって、そのようなグルーピングからの相関を使用すると信頼性の低い生存期間の予測が得られ得ることを示す。
このような結果は、発現レベルが相関する遺伝子をクラスタリングすることによる分子プロファイリングを使用して、患者の全生存又は予期予後の、特に転移性乳癌と診断された患者の不良アウトカムのより高精度の予測モデルを作成できることを示唆する。したがって、本発明者らは、遺伝子のRNA発現レベルの相関から作成された少なくとも1つのクラスタが、選択されたクラスタ中の複数の遺伝子の患者のRNA発現レベルの関数における生存期間(又は死亡までの時間)を予測する機械学習を使用して生存予測モデルを作成するように選択できることをさらに企図する。好ましい実施形態において、生存予測モデルを作成するために使用される遺伝子クラスタは、患者の不良アウトカムと最も実質的に関連するものである。別の好ましい実施形態において、生存予測モデルを作成するために使用される遺伝子クラスタは、0.8超、好ましくは1.0超、より好ましくは1.2超、最も好ましくは1.3超のハザード比を有する。例えば、転移性乳癌の遺伝子の好ましいクラスタとしては、図4及び5に示されるクラスタ5を挙げることができる。なぜなら、そのクラスタは、転移性乳癌患者の全生存と最も実質的に反相関するためである。
一部の実施形態において、選択されたクラスタ中の全部の又は実質的に全ての遺伝子を使用して生存予測モデルを作成することができる。このような実施形態において、選択されたクラスタ中の遺伝子の数は、データを効率的に処理するため及びさらに低信頼性変動発現データを低減させるために200個未満、好ましくは100個未満、より好ましくは50個未満の遺伝子であることが好ましい。他の実施形態において、クラスタ中の全ての遺伝子のうちの遺伝子のサブセットは、生存予測モデルを作成するように選択することができる。このような実施形態において、遺伝子のサブセットは、複数の遺伝子の発現レベルの関数における複数の患者のうちの短期生存者からの長期生存者の分離の質に基づいて選択することが好ましい。換言すると、例えば、遺伝子のサブセットは、全体的に又は個別的に長期間生存した(全生存に対して上位10%、上位20%、上位30%)転移性乳癌患者が複数の遺伝子の少なくとも10%、少なくとも20%、少なくとも30%高い又は低い平均発現レベルを有する場合に選択する。
代わりに及び/又は加えて、遺伝子のサブセットは、遺伝子の数を低減させて生存予測モデルの予測可能性及び効率を最大化する機械学習アルゴリズムにより選択することができる。一般に、選択又は低減処理は、それぞれの変数(例えば、それぞれの遺伝子発現レベルなど)の重要度のレベルの決定を可能とし、他の変数の効果の評価もそのようなものが統計的に排除される場合に可能とする。任意の好適な機械学習アルゴリズムが企図され、例示的な機械学習アルゴリズムとしては、限定されるものではないが、線形カーネルサポートベクターマシン(SVM)(参照により全体として本明細書に組み込まれるBen−Hurらによる「A User’s Guide to Support Vector Machines」という名称の刊行物に記載のSVM)、一次多項式カーネルSVM、二次多項式カーネルSVM、リッジ回帰、ラッソ、エラスティックネット、逐次最小問題最適化法、ランダムフォレスト、J48ツリー、単純ベイズ、JRipルール、HyperPipes及びNMF予測因子が挙げられる。このような例において、予測モデルは、患者のトランスクリプトミクスデータの少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%及び訓練データセットとしての生存データを用いて作成し、訓練できることが企図される。訓練データセットを分析するために使用され、予測モデルの構築のために選択される遺伝子の数は、選択処理(例えば、分散閾値選択、L1選択など)を使用して低減させることができる。次いで、予測モデルを患者のトランスクリプトミクスデータのサブセット及び評価データセットとしての生存データを用いてテストすることができる。
一部の実施形態において、予測モデルの妥当性は、予測モデルのc統計量を計算することにより決定することができる。一般に、c統計量又は一致頻度は、予測生存期間及び実際の生存期間が一致する患者の数が増加する場合に増加する。好ましくは、選択された遺伝子のサブセット及びそれらの発現レベルを使用する生存期間予測モデルは、0.5超、好ましくは0.6超、より好ましくは0.7超、最も好ましくは0.75超のc統計量を有する。
図7は、予測モデルにより作成された訓練セットの予測全生存データ(四角として示される)及び予測モデルにより作成された評価データセットの予測全生存データ(丸)及び実際の生存データをプロットする1つの例示的なグラフを示す。死亡がアノテートされた43人の患者についての全RNAseq発現及び生存データを使用して死亡までの時間の予測モデルを構築し、テストした。これらの患者の80パーセントを訓練セットとして無作為に選択した。得られたモデルを、提出された20%のテストサンプルにおけるOSの予測に適用した。このモデルは、0.78のc統計量を達成し、真のOS標識である。
図7のグラフとして示される予測モデルにおいて、本発明者らは、予測モデルを作成するための遺伝子の数を50個未満に低減させ得ることを見出した。より具体的には、ラッソ回帰モデルを訓練データにフィットさせ、それは、L1選択処理を使用して最終予測モデルにおいて利用される遺伝子特徴の数を最小化し、それは、>19000個の特徴から減少した35個の特徴(遺伝子、遺伝子発現レベルなど)のみを使用するモデルをもたらす。図8は、この生存予測モデルにおいて使用された35個の遺伝子のヒートマップを示す。行は、階層クラスタリングによりソートし、列は、OS増加の順で左から右にソートする。短期及び長期生存者間の示差的発現の明確なパターンが存在し、例としてTMEM257、FAM180B、WNT11、CTDSPL、PROK1、GAD2、GRK7、FZD6、KRTAP505、KRT31、PRAMEF12、SYNGR4、SOX2、BHLHA9、POU1F1、KHNYN、CACNA2D4、C3orf36、RHOXF2、PABPN1L、EID2B、BBS4、AGPS、EFCC1、ROBO2、CMTM4、THTPA、ZP4、HIST1H2BE、LOC286238、IFNL2、DGKK、GNGT1、USP17L30及びERN1の遺伝子発現レベルが挙げられる。
本発明者らは、生存予測モデルにおいて使用された35個の選択遺伝子の一部の遺伝子が1つ以上の腫瘍関連経路と関連することをさらに見出した。35個の選択遺伝子は、遺伝子セット濃縮分析(GSEA)を使用して分析する。表3は、これらの35個の予測遺伝子についての例示的なGSEAについての結果を示す。5つのデータベースを、キュレートされたそれらの予測遺伝子についての濃縮遺伝子セットに対してクエリした(Wikipathways、GO、KEGGなど)。この表は、有意に関連するものを示す(調整p<0.05)。35個の遺伝子の3つをWNTシグナリング及び多能性と関連すると一貫して同定し、それは、この予後モデルについての機能的アノテーションを示唆する。
Figure 2020523991
予後シグネチャを開発するための分子プロファイリングの使用は、総コホートの小さいサブセット中でも転移性状況において不良アウトカムの標準的な臨床関連要因よりも優れていることを認識すべきである。さらに、単一又は少数の公知の臨床マーカーに代えてマーカーのグループとしてこのようにクラスタリングされた遺伝子発現を使用して作成された予測モデルは、より高信頼性の高精度の予測又は推定生存期間を転移性乳癌と診断された患者に提供し得た。したがって、このアプローチは、単一又は少数の公知の臨床マーカー又は表現型を使用する従来の技術を使用して予後を高信頼性で予測することができなかった転移性乳癌についての診断及び/又は予後ツールを進歩させ、改善する。さらに、遺伝子のサブセットのうちのいくつかの腫瘍経路関連遺伝子を同定することにより、このアプローチは、不良アウトカムを有する転移性乳癌患者を治療するための潜在的な標的も提供する。
したがって、本発明の主題の別の態様において、本発明者らは、転移性乳癌と診断された患者の生存期間を予測する方法を企図する。この方法において、単一の解剖学的部位又は複数の解剖学的部位のいずれかからの腫瘍組織のトランスクリプトミクスデータを得る。トランスクリプトミクスデータのうち、患者の生存期間の予測に関連するトランスクリプトミクスデータのサブセットをさらに得ることができる。好ましくは、トランスクリプトミクスデータのサブセットは、TMEM257、FAM180B、WNT11、CTDSPL、PROK1、GAD2、GRK7、FZD6、KRTAP505、KRT31、PRAMEF12、SYNGR4、SOX2、BHLHA9、POU1F1、KHNYN、CACNA2D4、C3orf36、RHOXF2、PABPN1L、EID2B、BBS4、AGPS、EFCC1、ROBO2、CMTM4、THTPA、ZP4、HIST1H2BE、LOC286238、IFNL2、DGKK、GNGT1、USP17L30及びERN1から選択される複数の遺伝子のRNA発現レベルを含む。より好ましくは、トランスクリプトミクスデータのサブセットは、Wntシグナリング経路又は多能性経路と関連する少なくとも2つの遺伝子のRNA発現レベルを含み、それは、SOX2、WNT11及びFZD6を含み得る。このように得られたトランスクリプトミクスデータのサブセットは、上記の生存予測モデルを使用してさらに分析して、患者の生存期間を予測することができる。
本発明者らは、予測生存期間並びに/又は選択された遺伝子のサブセット、例えば特にSOX2、WNT11及びFZD6の遺伝子発現データに基づき、患者記録を作成又は更新することができ、新たな治療計画を推奨することができるか、又は事前に使用された治療計画を更新できることをさらに企図する。例えば、患者の予後が不良(予測生存期間が短い)と予測され、SOX2の発現レベルが実質的に減少し、Wntシグナリング経路の脱阻害及び癌細胞の転移能を示す場合、患者記録自体を更新することができ、Wntシグナリング経路を阻害するか、又はSOX2発現若しくは既存のSOX2活性を増加させるための治療剤を含めるように患者に対する治療レジメンを作成し、更新することができる。さらに、更新又は作成される治療レジメンは、予測生存期間を反映する治療タイムラインを含み得る(例えば、予期生存期間よりも長期間を要し得る治療計画の一部の選択を排除し、予期生存期間の50%以内で終了させることができる治療によりレジメンを修正するなど)。このような実施形態において、更新された治療レジメン(例えば、治療の少なくとも5日後、治療の少なくとも10日後など)を適用した後に患者のトランスクリプトミクスデータを得て、治療後の生存期間をさらに予測できることも企図される。
本明細書の詳細な説明及び以下の特許請求の範囲全体にわたり使用される「1つの(a)」、「1つの(an)」及び「その」の意味には、文脈が特に明示しない限り、複数の言及対象が含まれる。さらに、本明細書の詳細な説明において使用される「中」の意味には、文脈が特に明示しない限り、「中」及び「上」が含まれる。最後に、文脈が相反を示さない限り、本明細書に記載の全ての範囲は、それらの終点を包括するものと解釈すべきであり、オープンエンドの範囲は、商用的な値を含めるように解釈すべきである。同様に、値の全ての列記は、文脈が相反を示さない限り、中間値を包括するものとみなすべきである。
本明細書に記載の全ての方法は、特に本明細書に示されない限り又は特に文脈により明らかに矛盾しない限り、任意の好適な順序で実施することができる。本明細書のある実施形態に関して提供されるいずれか及び全ての例の使用又は例示的な言語(例えば、「など」)は、本発明の主題をより良好に説明するものにすぎず、他で特許請求されない限り本発明の主題の範囲を限定するものではない。本明細書中の言語は、任意の特許請求されていない要素が本発明の主題の実施に不可欠であることを示すと解釈すべきでない。
既に記載のものに加え、本明細書の本発明の概念を逸脱せずにより多くの改変形態が考えられることは、当業者に明らかなはずである。したがって、本発明の主題は、添付の特許請求の範囲の範囲以外で限定されるべきではない。さらに、本明細書及び特許請求の範囲の両方の解釈において、全ての用語は、文脈と一致する最も広い可能な様式で解釈すべきである。特に、用語「含む(comprises)」及び「含む(comprising)」は、非排他的様式で要素、構成成分又はステップを指すものと解釈すべきであり、言及される要素、構成成分又はステップが、明示的に言及されない他の要素、構成成分若しくはステップと存在するか、又は利用されるか、又は組み合わされ得ることを示す。本明細書の特許請求の範囲が、A、B、C....及びNからなる群から選択されるものの少なくとも1つを指す場合、本文は、その群からの1つの要素のみを要求し、A及びNでもB及びNでもないなどと解釈すべきである。

Claims (68)

  1. 転移性乳癌についての生存予測モデルを作成する方法であって、
    転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを得ること;
    完全ピアソン相関を使用して前記トランスクリプトミクスデータを複数のクラスタにクラスタリングすること;
    前記複数のクラスタを前記複数の患者の全生存と相関させることにより、前記複数の患者の少なくとも一部の不良生存と関連する少なくとも1つのクラスタを同定すること;
    前記複数の患者の少なくとも一部の不良生存と関連する前記少なくとも1つのクラスタ中の複数の遺伝子の発現レベルに基づき、生存期間を予測する前記生存予測モデルを作成すること
    を含み、前記複数の遺伝子は、WNTシグナリング経路又は多能性経路と関連する少なくとも1つの遺伝子を含む、方法。
  2. 前記トランスクリプトミクスデータは、少なくとも1,000個の遺伝子のRNA発現レベルを含む、請求項1に記載の方法。
  3. 前記複数のクラスタの数は、エルボー法を使用して決定される、請求項1又は2に記載の方法。
  4. 前記複数のクラスタは、前記複数の患者の前記全生存と示差的に相関される、請求項1〜3のいずれか一項に記載の方法。
  5. 前記少なくとも1つのクラスタは、1.3超のハザード比を有する、請求項1〜4のいずれか一項に記載の方法。
  6. 前記複数の遺伝子は、前記複数の遺伝子の前記発現レベルの関数における前記複数の患者のうちの短期生存者からの長期生存者の分離の質に基づき、前記少なくとも1つのクラスタのトランスクリプトミクスデータのうちから選択される、請求項1〜5のいずれか一項に記載の方法。
  7. 前記複数の遺伝子の数は、50個未満である、請求項1〜6のいずれか一項に記載の方法。
  8. 前記複数の遺伝子は、TMEM257、FAM180B、WNT11、CTDSPL、PROK1、GAD2、GRK7、FZD6、KRTAP505、KRT31、PRAMEF12、SYNGR4、SOX2、BHLHA9、POU1F1、KHNYN、CACNA2D4、C3orf36、RHOXF2、PABPN1L、EID2B、BBS4、AGPS、EFCC1、ROBO2、CMTM4、THTPA、ZP4、HIST1H2BE、LOC286238、IFNL2、DGKK、GNGT1、USP17L30及びERN1からなる群から選択される、請求項1〜7のいずれか一項に記載の方法。
  9. 前記トランスクリプトミクスデータは、RNA−seqデータを含む、請求項1〜8のいずれか一項に記載の方法。
  10. 前記予測生存期間を前記患者の実際の生存期間と比較することにより、前記生存予測モデルのc統計量を計算することをさらに含む、請求項1〜9のいずれか一項に記載の方法。
  11. 前記c統計量は、0.7超である、請求項10に記載の方法。
  12. 前記複数のクラスタの数は、エルボー法を使用して決定される、請求項1に記載の方法。
  13. 前記複数のクラスタは、前記複数の患者の前記全生存と示差的に相関される、請求項1に記載の方法。
  14. 前記少なくとも1つのクラスタは、1.3超のハザード比を有する、請求項1に記載の方法。
  15. 前記複数の遺伝子は、前記複数の遺伝子の前記発現レベルの関数における前記複数の患者のうちの短期生存者からの長期生存者の分離の質に基づき、前記少なくとも1つのクラスタのトランスクリプトミクスデータのうちから選択される、請求項1に記載の方法。
  16. 前記複数の遺伝子の数は、50個未満である、請求項1に記載の方法。
  17. 前記複数の遺伝子は、TMEM257、FAM180B、WNT11、CTDSPL、PROK1、GAD2、GRK7、FZD6、KRTAP505、KRT31、PRAMEF12、SYNGR4、SOX2、BHLHA9、POU1F1、KHNYN、CACNA2D4、C3orf36、RHOXF2、PABPN1L、EID2B、BBS4、AGPS、EFCC1、ROBO2、CMTM4、THTPA、ZP4、HIST1H2BE、LOC286238、IFNL2、DGKK、GNGT1、USP17L30及びERN1からなる群から選択される、請求項1に記載の方法。
  18. 前記トランスクリプトミクスデータは、RNA−seqデータを含む、請求項1に記載の方法。
  19. 前記予測生存期間を前記患者の実際の生存期間と比較することにより、前記生存予測モデルのc統計量を計算することをさらに含む、請求項1に記載の方法。
  20. 前記c統計量は、0.7超である、請求項18に記載の方法。
  21. 転移性乳癌と診断された患者の生存期間を予測する方法であって、
    前記患者の腫瘍組織のトランスクリプトミクスデータを得ること;
    前記トランスクリプトミクスデータからの複数の遺伝子のRNA発現レベルを決定すること;
    生存予測モデルを使用して、前記RNA発現レベルに基づいて前記患者の前記生存期間を予測すること
    を含み、前記複数の遺伝子のうちの少なくとも2つの遺伝子は、Wntシグナリング経路又は多能性経路と関連する、方法。
  22. トランスクリプトミクスデータは、RNA−seqデータを含む、請求項20に記載の方法。
  23. 前記複数の遺伝子の数は、50個未満である、請求項20又は21に記載の方法。
  24. 前記複数の遺伝子は、TMEM257、FAM180B、WNT11、CTDSPL、PROK1、GAD2、GRK7、FZD6、KRTAP505、KRT31、PRAMEF12、SYNGR4、SOX2、BHLHA9、POU1F1、KHNYN、CACNA2D4、C3orf36、RHOXF2、PABPN1L、EID2B、BBS4、AGPS、EFCC1、ROBO2、CMTM4、THTPA、ZP4、HIST1H2BE、LOC286238、IFNL2、DGKK、GNGT1、USP17L30及びERN1からなる群から選択される、請求項20〜22のいずれか一項に記載の方法。
  25. 前記生存予測モデルは、
    転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを得るステップ;
    完全ピアソン相関を使用して前記トランスクリプトミクスデータを複数のクラスタにクラスタリングするステップ;
    前記複数のクラスタを前記複数の患者の全生存と相関させることにより、前記複数の患者の少なくとも一部の不良生存と関連する少なくとも1つのクラスタを同定するステップ;及び
    前記複数の遺伝子の前記発現レベルの関数における前記複数の患者のうちの短期生存者からの長期生存者の分離の質に基づき、前記少なくとも1つのクラスタから前記複数の遺伝子を選択するステップ
    を使用して作成される、請求項20〜23のいずれか一項に記載の方法。
  26. 前記複数の患者の前記トランスクリプトミクスデータは、少なくとも1,000個の遺伝子のRNA発現レベルを含む、請求項24に記載の方法。
  27. 前記複数のクラスタの数は、エルボー法を使用して決定される、請求項24又は25に記載の方法。
  28. 前記複数のクラスタは、前記複数の患者の前記全生存と示差的に相関される、請求項24〜26のいずれか一項に記載の方法。
  29. 前記少なくとも1つのクラスタは、1.3超のハザード比を有する、請求項24〜27のいずれか一項に記載の方法。
  30. 前記予測生存期間を前記患者の実際の生存期間と比較することにより、前記生存予測モデルのc統計量を計算することをさらに含む、請求項24〜28のいずれか一項に記載の方法。
  31. 前記生存予測モデルの前記c統計量は、0.7超である、請求項29に記載の方法。
  32. 前記予測生存期間に基づき、患者記録を更新又は作成することをさらに含む、請求項20〜30のいずれか一項に記載の方法。
  33. 前記予測生存期間に基づき、前記患者のための治療レジメンを修正することをさらに含む、請求項20〜31のいずれか一項に記載の方法。
  34. 前記複数の遺伝子の数は、50個未満である、請求項20に記載の方法。
  35. 前記複数の遺伝子は、TMEM257、FAM180B、WNT11、CTDSPL、PROK1、GAD2、GRK7、FZD6、KRTAP505、KRT31、PRAMEF12、SYNGR4、SOX2、BHLHA9、POU1F1、KHNYN、CACNA2D4、C3orf36、RHOXF2、PABPN1L、EID2B、BBS4、AGPS、EFCC1、ROBO2、CMTM4、THTPA、ZP4、HIST1H2BE、LOC286238、IFNL2、DGKK、GNGT1、USP17L30及びERN1からなる群から選択される、請求項20に記載の方法。
  36. 前記生存予測モデルは、
    転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを得るステップ;
    完全ピアソン相関を使用して前記トランスクリプトミクスデータを複数のクラスタにクラスタリングするステップ;
    前記複数のクラスタを前記複数の患者の全生存と相関させることにより、前記複数の患者の少なくとも一部の不良生存と関連する少なくとも1つのクラスタを同定するステップ;及び
    前記複数の遺伝子の前記発現レベルの関数における前記複数の患者のうちの短期生存者からの長期生存者の分離の質に基づき、前記少なくとも1つのクラスタから前記複数の遺伝子を選択するステップ
    を使用して作成される、請求項20に記載の方法。
  37. 前記複数の患者の前記トランスクリプトミクスデータは、少なくとも1,000個の遺伝子のRNA発現レベルを含む、請求項35に記載の方法。
  38. 前記複数のクラスタの数は、エルボー法を使用して決定される、請求項35に記載の方法。
  39. 前記複数のクラスタは、前記複数の患者の前記全生存と示差的に相関される、請求項35に記載の方法。
  40. 前記少なくとも1つのクラスタは、1.3超のハザード比を有する、請求項35に記載の方法。
  41. 前記予測生存期間を前記患者の実際の生存期間と比較することにより、前記生存予測モデルのc統計量を計算することをさらに含む、請求項35に記載の方法。
  42. 前記生存予測モデルの前記c統計量は、0.7超である、請求項40に記載の方法。
  43. 前記予測生存期間に基づき、患者記録を更新又は作成することをさらに含む、請求項20に記載の方法。
  44. 前記予測生存期間に基づき、前記患者のための治療レジメンを修正することをさらに含む、請求項20に記載の方法。
  45. 転移性乳癌と診断された患者のための治療レジメンを作成又は更新する方法であって、
    前記患者の腫瘍組織のトランスクリプトミクスデータを得ること;
    前記トランスクリプトミクスデータからの複数の遺伝子のRNA発現レベルを決定すること;
    生存予測モデルを使用して、前記RNA発現モデルに基づいて前記患者の生存期間を予測すること;及び
    Wntシグナリング経路又は多能性経路の経路要素を標的化する少なくとも1つの薬剤を含むように前記治療レジメンを作成又は更新すること
    を含む方法。
  46. トランスクリプトミクスデータは、RNA−seqデータを含む、請求項44に記載の方法。
  47. 前記複数の遺伝子の数は、50個未満である、請求項44又は45に記載の方法。
  48. 前記複数の遺伝子は、TMEM257、FAM180B、WNT11、CTDSPL、PROK1、GAD2、GRK7、FZD6、KRTAP505、KRT31、PRAMEF12、SYNGR4、SOX2、BHLHA9、POU1F1、KHNYN、CACNA2D4、C3orf36、RHOXF2、PABPN1L、EID2B、BBS4、AGPS、EFCC1、ROBO2、CMTM4、THTPA、ZP4、HIST1H2BE、LOC286238、IFNL2、DGKK、GNGT1、USP17L30及びERN1からなる群から選択される、請求項44〜46のいずれか一項に記載の方法。
  49. 前記複数の遺伝子は、WNT11、SOX2及びFZD6を含む、請求項44〜47のいずれか一項に記載の方法。
  50. 前記生存予測モデルは、
    転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを得るステップ;
    完全ピアソン相関を使用して前記トランスクリプトミクスデータを複数のクラスタにクラスタリングするステップ;
    前記複数のクラスタを前記複数の患者の全生存と相関させることにより、前記複数の患者の少なくとも一部の不良生存と関連する少なくとも1つのクラスタを同定するステップ;及び
    前記複数の遺伝子の前記発現レベルの関数における前記複数の患者のうちの短期生存者からの長期生存者の分離の質に基づき、前記少なくとも1つのクラスタから前記複数の遺伝子を選択するステップ
    を使用して作成される、請求項44〜48のいずれか一項に記載の方法。
  51. 前記複数の患者の前記トランスクリプトミクスデータは、少なくとも1,000個の遺伝子のRNA発現レベルを含む、請求項49に記載の方法。
  52. 前記複数のクラスタの数は、エルボー法を使用して決定される、請求項49又は50に記載の方法。
  53. 前記複数のクラスタは、前記複数の患者の前記全生存と示差的に相関される、請求項49〜51のいずれか一項に記載の方法。
  54. 前記少なくとも1つのクラスタは、1.3超のハザード比を有する、請求項49〜52のいずれか一項に記載の方法。
  55. 前記予測生存期間を前記患者の実際の生存期間と比較することにより、前記生存予測モデルのc統計量を計算することをさらに含む、請求項49〜53のいずれか一項に記載の方法。
  56. 前記生存予測モデルの前記c統計量は、0.7超である、請求項54に記載の方法。
  57. 前記予測生存期間に基づき、患者記録を更新又は作成することをさらに含む、請求項44〜55のいずれか一項に記載の方法。
  58. 前記複数の遺伝子の数は、50個未満である、請求項44に記載の方法。
  59. 前記複数の遺伝子は、TMEM257、FAM180B、WNT11、CTDSPL、PROK1、GAD2、GRK7、FZD6、KRTAP505、KRT31、PRAMEF12、SYNGR4、SOX2、BHLHA9、POU1F1、KHNYN、CACNA2D4、C3orf36、RHOXF2、PABPN1L、EID2B、BBS4、AGPS、EFCC1、ROBO2、CMTM4、THTPA、ZP4、HIST1H2BE、LOC286238、IFNL2、DGKK、GNGT1、USP17L30及びERN1からなる群から選択される、請求項44に記載の方法。
  60. 前記複数の遺伝子は、WNT11、SOX2及びFZD6を含む、請求項44に記載の方法。
  61. 前記生存予測モデルは、
    転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを得るステップ;
    完全ピアソン相関を使用して前記トランスクリプトミクスデータを複数のクラスタにクラスタリングするステップ;
    前記複数のクラスタを前記複数の患者の全生存と相関させることにより、前記複数の患者の少なくとも一部の不良生存と関連する少なくとも1つのクラスタを同定するステップ;及び
    前記複数の遺伝子の前記発現レベルの関数における前記複数の患者のうちの短期生存者からの長期生存者の分離の質に基づき、前記少なくとも1つのクラスタから前記複数の遺伝子を選択するステップ
    を使用して作成される、請求項44に記載の方法。
  62. 前記複数の患者の前記トランスクリプトミクスデータは、少なくとも1,000個の遺伝子のRNA発現レベルを含む、請求項60に記載の方法。
  63. 前記複数のクラスタの数は、エルボー法を使用して決定される、請求項60に記載の方法。
  64. 前記複数のクラスタは、前記複数の患者の前記全生存と示差的に相関される、請求項60に記載の方法。
  65. 前記少なくとも1つのクラスタは、1.3超のハザード比を有する、請求項60に記載の方法。
  66. 前記予測生存期間を前記患者の実際の生存期間と比較することにより、前記生存予測モデルのc統計量を計算することをさらに含む、請求項60に記載の方法。
  67. 前記生存予測モデルの前記c統計量は、0.7超である、請求項65に記載の方法。
  68. 前記予測生存期間に基づき、患者記録を更新又は作成することをさらに含む、請求項44に記載の方法。
JP2019569362A 2017-06-16 2018-06-15 Praegnant転移性乳癌コホートにおける不良アウトカムの予後指標因子 Abandoned JP2020523991A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762521267P 2017-06-16 2017-06-16
US62/521,267 2017-06-16
US201762594345P 2017-12-04 2017-12-04
US62/594,345 2017-12-04
PCT/US2018/037876 WO2018232320A2 (en) 2017-06-16 2018-06-15 Prognostic indicators of poor outcomes in praegnant metastatic breast cancer cohort

Publications (1)

Publication Number Publication Date
JP2020523991A true JP2020523991A (ja) 2020-08-13

Family

ID=64659406

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019569362A Abandoned JP2020523991A (ja) 2017-06-16 2018-06-15 Praegnant転移性乳癌コホートにおける不良アウトカムの予後指標因子

Country Status (10)

Country Link
US (1) US20210142864A1 (ja)
EP (1) EP3639277A2 (ja)
JP (1) JP2020523991A (ja)
KR (1) KR20200010576A (ja)
CN (1) CN110770849A (ja)
AU (1) AU2018283369A1 (ja)
CA (1) CA3066930A1 (ja)
IL (1) IL271479A (ja)
SG (1) SG11201911820RA (ja)
WO (1) WO2018232320A2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112309571B (zh) * 2020-10-30 2022-04-15 电子科技大学 数字病理图像的预后量化特征的筛选方法
CN112877440B (zh) * 2021-04-20 2023-04-14 桂林医学院附属医院 生物标志物在预测肝癌复发中的应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI359198B (en) * 2005-08-30 2012-03-01 Univ Nat Taiwan Gene expression profile predicts patient survival
US8202968B2 (en) * 2006-10-20 2012-06-19 Washington University Predicting lung cancer survival using gene expression
JP5740302B2 (ja) * 2008-05-30 2015-06-24 ザ ユニバーシティー オブ ノースカロライナ アット チャペル ヒル 乳癌の予後を予測するための遺伝子発現プロフィール
EP2872646B1 (en) * 2012-07-12 2017-08-30 Institut National de la Sante et de la Recherche Medicale (INSERM) Methods for predicting the survival time and treatment responsiveness of a patient suffering from a solid cancer with a signature of at least 7 genes
EP3325652A1 (en) * 2015-07-23 2018-05-30 INSERM - Institut National de la Santé et de la Recherche Médicale Methods for predicting the survival time and treatment responsiveness of a patient suffering from a solid cancer

Also Published As

Publication number Publication date
KR20200010576A (ko) 2020-01-30
IL271479A (en) 2020-01-30
WO2018232320A3 (en) 2019-03-07
AU2018283369A1 (en) 2020-01-23
EP3639277A2 (en) 2020-04-22
CN110770849A (zh) 2020-02-07
WO2018232320A2 (en) 2018-12-20
CA3066930A1 (en) 2018-12-20
US20210142864A1 (en) 2021-05-13
SG11201911820RA (en) 2020-01-30

Similar Documents

Publication Publication Date Title
JP5089993B2 (ja) 乳癌の予後診断
AU2015289758A1 (en) Methods for evaluating lung cancer status
US20110224908A1 (en) Gene signature for diagnosis and prognosis of breast cancer and ovarian cancer
JP2019514396A (ja) チェックポイント不全およびそれに関する方法
US20230073731A1 (en) Gene expression analysis techniques using gene ranking and statistical models for identifying biological sample characteristics
JP2023524016A (ja) 結腸細胞増殖性障害を特定するためのrnaマーカと方法
CN109072481A (zh) 早期乳腺癌内分泌治疗后剩余风险的基因特征
WO2021006279A1 (en) Data processing and classification for determining a likelihood score for breast disease
EP2406729B1 (en) A method, system and computer program product for the systematic evaluation of the prognostic properties of gene pairs for medical conditions.
JP2016073287A (ja) 腫瘍特性及びマーカーセットの同定のための方法、腫瘍分類、並びに癌のマーカーセット
JP2020523991A (ja) Praegnant転移性乳癌コホートにおける不良アウトカムの予後指標因子
WO2007041238A2 (en) Methods of identification and use of gene signatures
Henry et al. Use of gene-expression profiling to recommend adjuvant chemotherapy for breast cancer
Bhattacharjee et al. A combined iterative sure independence screening and Cox proportional hazard model for extracting and analyzing prognostic biomarkers of adenocarcinoma lung cancer
US20200294622A1 (en) Subtyping of TNBC And Methods
US20210102260A1 (en) Patient classification and prognositic method
Stavridi et al. Comparison of the ability of different clinical treatment scores to estimate prognosis in high-risk early breast cancer patients: a Hellenic Cooperative Oncology Group Study
US20160281177A1 (en) Gene signatures for renal cancer prognosis
Torre Pernas Finding a predictive gene signature in pancreatic cancer using gene expression
US20220033882A1 (en) Methods of diagnosing and treating patients with pigmented skin lesions
Bogdan-Alexandru Identification of biomarkers for the management of human prostate cancer
CN111492435A (zh) 替莫唑胺反应预测因子和方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200225

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200225

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20201126