CN101720358A - 前列腺癌存活和复发 - Google Patents

前列腺癌存活和复发 Download PDF

Info

Publication number
CN101720358A
CN101720358A CN200880011793A CN200880011793A CN101720358A CN 101720358 A CN101720358 A CN 101720358A CN 200880011793 A CN200880011793 A CN 200880011793A CN 200880011793 A CN200880011793 A CN 200880011793A CN 101720358 A CN101720358 A CN 101720358A
Authority
CN
China
Prior art keywords
kinds
prostate cancer
gene
expression
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880011793A
Other languages
English (en)
Inventor
马小骏
C·-L·吴
M·G·厄兰德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
General Hospital Corp
Biotheranostics Inc
Original Assignee
General Hospital Corp
Aviaradx Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by General Hospital Corp, Aviaradx Inc filed Critical General Hospital Corp
Publication of CN101720358A publication Critical patent/CN101720358A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明包括鉴定和使用与前列腺癌临床相关的基因表达的概况或模式。具体说,本发明基于与患者存活和前列腺癌复发相关联的基因的种类。基因表达概况可以体现在核酸表达,蛋白质表达或其他表达形式中,并可用于预测患有前列腺癌的对象的存活和/或预测前列腺癌复发。该概况也可用于研究和/或诊断前列腺癌细胞和组织,以及研究和/或确定患者的预后。用于诊断或预后时,根据可能的预期寿命,癌症复发和/或转移,可用该概况确定前列腺癌的治疗。

Description

前列腺癌存活和复发
相关申请
本申请要求2007年2月23日申请的美国临时专利申请60/891,477的优先权(2008年2月23日(周六)是其12个月的期限),通过引用将其纳入本文,就好像全文列出那样。
技术领域
本发明设计鉴定和使用与前列腺癌临床相关的基因(或序列)表达的概况或模式。具体说,本发明基于鉴定其表达与患者存活,前列腺癌复发和/或出现前列腺癌转移相关联的基因或表达序列。体现为核酸表达,蛋白质表达或其他表达形式的基因表达概况可用于预测患有前列腺癌的对象的存活,预测前列腺癌复发和/或预测前列腺癌转移的出现。该概况也可用于研究和/或诊断前列腺癌细胞和组织,以及研究和/或确定患者的预后。用于诊断或预后时,根据预期寿命,癌症复发和/或癌症转移的概率,用该概况确定前列腺癌的治疗。
背景技术
前列腺癌是美国男性中最常诊断出的癌症,每年约有240,000例新诊断的患者和40,000例癌症死亡。由于在分子和遗传水平对该癌症欠缺了解并且对其天然疾病过程缺乏理解,临床上难以诊断和控制前列腺癌。
前列腺癌研究受限于可用于研究的前列腺癌组织标本来源不足,特别是病理学良好表征,为进行RNA和蛋白质研究而适当保存以及与患者临床,病例和随访信息相关联的标本。
用手术治疗一些前列腺癌病例。然而,一部分患者治疗失败。这可通过化学失败(术后1年PSA上升)或发生转移(常见于淋巴结和骨)进行判断。鉴定或预测术后患者是否可能出现PSA失败,前列腺癌复发和/或发生转移的能力将为患者带来多项益处。
发明内容
本发明包括鉴定和使用在临床上与前列腺癌有关的基因(或序列)表达模式(或概况或″签名″)。体现为核酸表达,蛋白质表达或其他表达形式的基因表达概况可用于预测患有前列腺癌的对象的前列腺癌复发和/或存活。在涉及使用前列腺切除术的实施方式中,本发明包括预测前列腺癌复发,癌症转移或PSA水平升高复发的可能性的方法。
一方面,本发明包括鉴定,然后使用能提供与前列腺癌有关的预后信息的基因(或序列)表达概况的方法。该表达概况与癌症复发,癌症转移和/或存活后果情况良好或不良的患者相关联(因此能够区分这些患者)。在一些实施方式中,本发明包括在患有前列腺癌的对象中鉴定与癌症复发和/或转移相关的表达概况的方法。在其他实施方式中,本发明包括将患者的前列腺癌细胞样品中基因(或序列)表达与经鉴定的表达概况作比较的方法,以确定患者在,例如前列腺切除术后的可能后果。优选使用本发明的这些实施方式以满足重要而未满足的诊断需求,以便能够预测患者是否可能得益于手术治疗前列腺癌,或者患者采用另一类治疗是否更好或是否需要除手术外的辅助治疗。
可能获益于根治性前列腺切除术的患者的一个非限制性例子是通过患者前列腺癌细胞的表达概况(如本文所述)预测术后癌症不会复发和/或不会转移的患者。以相关方式,预测不会从手术获益的患者的非限制性例子是通过患者前列腺癌细胞的表达概况(如本文所述)预测术后会发生癌症转移的患者。例如,前列腺癌的复发可以是在相同部位,而转移常常出现在不同的部位或组织,例如但不限于淋巴结或骨。
在其他实施方式中,提供了将具有前列腺癌细胞的患者群体中,或在前列腺切除术后的患者鉴定为,相对于另一亚群属于癌症复发和/或存活后果更好(例如复发或转移风险较低)的患者亚群的方法,或相对于另一亚群属于癌症复发和/或存活后果较差(例如复发或转移风险升高)的患者亚群的方法。因此,该方法能够将患者分成至少两个亚群或亚型。
本发明包括通过测定本文所述的表达模式将前列腺癌患者(任选在前列腺癌切除术后)鉴定为可能具有较好或较差的癌症复发,癌症转移和/或存活后果的非主观手段。因此,以前用主观解释(例如根据免疫组化染色和主观分析)确定前列腺癌患者或前列腺切除术后患者的预防和/或治疗,本发明引入了客观的表达模式,客观表达模式可单用或与其他(主观和/或客观)标准联用以便更准确地评价患者后果,包括存活和癌症的复发或转移。因此,本发明的表达模式包括确定前列腺癌或前列腺癌切除术后预后的手段。
本发明的表达模式包括能够较为精确地区别前列腺癌或前列腺切除术后的后果的一种以上基因或表达序列。经鉴定,该基因或表达序列的表达水平与后果相关联,以使该表达水平可用于确定患者的优选治疗方案。因此,本发明包括通过测定所述对象的含前列腺癌细胞的样品中与本文所述患者后果相关的表达水平来确定患有前列腺癌,任选是前列腺癌切除术后的对象的后果的方法。
另一方面,本发明包括测定对象中前列腺癌复发和/或转移的风险的方法。该方法包括测定所述对象的含有前列腺癌细胞的样品中两种或多种基因的表达水平,并单独比较各基因的表达水平或比较总体表达水平与其在前列腺癌细胞群中的平均或中值表达水平,所述基因选自本文附图14和15中的基因标号1-362。然后,该评价可用于确定获得该样品的对象中前列腺癌复发和/或转移的风险。根据与前列腺癌细胞群体中平均或中值表达水平的比较,将公开的基因(或表达序列)的表达水平与癌症复发和/或转移的低风险或者癌症复发和/或转移的高风险相关联。另一方面,本文公开的各基因(或表达序列)的表达水平较高或较低(与前列腺癌细胞群体中的平均或中值表达水平作比较),因而相对于该平均值或中值的偏差与本文所述的较高风险或较低风险相关联。两种或多种基因(或表达序列)偏差的各集合是本发明的表达模式或概况。
在一些实施方式中,可使用选自本文所述SEQ ID NO:1-362的两种或多种核酸探针测定表达水平。这些探针在适当条件下杂交,并检测本文所述的表达序列。在其它实施方式中,可使用能杂交与SEQ ID NO:1-362相同的表达序列的其它探针。可通过分析SEQ ID NO:1-362检测的表达序列制备或选择这些其他探针。在其它情况下,其他探针序列可以是标为基因标号:1-362的序列的全部或一部分。在许多实施方式中,可使用探针检测从本文所述表达序列(或基因)扩增的序列的某个区域。
检测或测定两种或多种的表达水平可称为检测或测定表达概况或特征。如本文所述鉴定和使用包含两种或多种所公开序列的本发明表达模式。对于其鉴定,通过定量测定mRNA的表达水平在含前列腺癌细胞的样品中对基因表达水平进行大量取样。在一个实施方式中,本发明包括通过分析单个细胞或均质细胞群体的总体(global),或接近总体的基因表达概况来检测基因(或序列)表达水平,所述单个细胞或均质细胞群体通过简单的组织活检剥离了污染细胞,或从污染细胞中分离或纯化。由于在不同患者的细胞之间以及同一患者样品的细胞之间,许多基因的表达不同,所以将单个基因序列表达的多个数据用作参比数据产生模型,进而鉴定其表达与特定的前列腺癌或前列腺切除术后的后果有关的各基因和序列。
然后,分析这些模型中各种基因的表达水平,以鉴定其表达与前列腺癌或前列腺切除术后的后果正相关或负相关的核酸序列。本发明包括鉴定为与本文所述后果相关的核酸序列,这些序列是细胞中表达序列的子集。本发明的表达模式或概况包括联用这些鉴定的序列(或基因)。使用多种样品鉴定表达序列能提高认为某基因与前列腺癌复发,转移和/或存活后果相关联的置信度。如果没有足够的置信度,那么特定基因事实上是否与后果相关仍然不可预测,并且基因的表达可否成功用于鉴定前列腺癌或前列腺切除术后的对象或患者的后果也不可预测。一旦鉴定,可选择对应于所公开基因(或表达序列)的两种或多种核酸序列,以评价待检测或评价其预测特性的表达概况。
相比于另一种,与一种后果高度相关的表达水平概况可用于测定对象或患者的含前列腺癌细胞的样品,以预测获得该样品的对象的后果,将其用作根据所鉴定的后果确定所述对象的治疗方案的方法的一部分。
相关基因可成对(具有显著精确性)使用,或者以更多数量一起使用,以提高将分子表达表型与前列腺癌或前列腺切除术后的后果精确关联的能力。这种关联能够在分子水平确定如本文所述的前列腺癌的复发,癌症转移和/或存活后果。不想受限于理论,并且提高对本发明的理解,所公开的分子测定比与前列腺癌相关的其他分子指标,例如测定前列腺血清抗原(PSA)水平更有效。额外应用相关表达模式和概况可对细胞和组织进行分类;确定诊断和/或预后;和确定和/或改变治疗。
区别的能力是通过将各基因序列的表达鉴定为相关而不是通过用于确定实际表达水平的试验形式获得的。试验可利用本文所述各鉴定基因的任何鉴定特征,只要该试验能定性或定量地反映“转录组”(基因组中的基因转录组分)或“蛋白质组”(基因组中表达基因的翻译组分)中该基因序列的表达。鉴定特征包括但不限于用于编码(DNA)或表达(RNA)对所述基因编码的蛋白具有特异性或活性的所述基因或表位的独特核酸序列。所有需要的是在前列腺癌或前列腺切除术后的后果之间进行区别所必需的基因序列,以及用于表达试验的含有合适细胞的样品。
相似地,含有细胞的样品的特性不受限制,诸如新鲜组织,新鲜冷冻组织和固定组织,如福尔马林固定的石蜡包埋(FFPE)组织等样品均可用于本发明公开的方法。在一些实施方式中,样品可以是针吸(组织芯)活检或其他活检的样品。
为了检测鉴定的表达模式或概况,通过收集单个细胞或均质细胞群体的总体,或接近总体的基因表达确定本文公开的(disci)基因(或序列)表达模式,所述单个细胞或均质细胞群体通过简单的组织活检剥离了污染细胞,或从污染细胞中分离或纯化,。然后,检测或测定该模式或概况中的基因(序列)表达水平。在其它实施方式中,一种方法可只检测或测定所述概况中基因(序列)的表达水平,而不评估或测定其它基因或序列的表达。
另一方面,可将分析表达水平与前列腺癌的其它评估或指标组合使用,或用前者代替后者。在一些实施方式中,可将该分析与确定包含对象的前列腺癌细胞的样品中前列腺癌等级的方法联用。在其它实施方式中,与确定样品中前列腺癌分期的方法联用。第三种可能性是与检测或测定对象的PSA水平联用,任选在分离前列腺癌细胞的步骤之前。当然,也可能与这些代表性例子中的一种,两种或所有三种联用。只要使用一种以上类型的评估,则结果是多变量分析。本发明明确包括本文所述评估的所有可能组合,如多变量实施方式。
通常,可使用本领域技术人员已知的评估前列腺癌等级和/或分期的任何接受的方法。在一些情况下,确定前列腺癌等级的方法包括确定格利森(Gleason)评分(或格利森等级)。在其它情况下,确定前列腺癌分期的方法包括按照美国联合癌症委员会(AJCC)用于评估前列腺癌分期的肿瘤分期体系进行确定。如本文所述,可以通过分析基因(序列)的表达水平来替代格利森评分或AJCC肿瘤分期确定法。
在PSA水平的情况下,可以在用于提供本文所述方法所用的包含前列腺癌细胞样品的前列腺切除术之前对其进行评估。。
另一方面,本发明包括检测本文所述基因(或序列)的表达的物理和方法。这些方式可涉及测定基因(或序列)表达的DNA模板,用作表达基因(或序列)的中间体的RNA,或基因(或序列)表达的蛋白质产物的一个或多个方面。
本发明提供的一个优点是可去除污染的非前列腺癌细胞(例如渗漏的淋巴细胞或其他免疫系统细胞),以降低其对本文所述用于预测患者的癌症复发和/或存活后果的表达模式或概况的测量的影响。使用含有许多细胞类型的活检样品产生基因表达概况时,存在这种污染。
虽然本发明主要描述的是人前列腺癌,但它也可应用于已知可能患上前列腺癌的任何动物的前列腺癌。用于本发明的动物的非限制性例子是哺乳动物,特别是对农业应用有重要意义的动物(例如但不限于,牛、绵羊、马和其他″家畜″),前列腺癌动物模型和人类伴侣动物(例如但不限于犬和猫)。
附图简述
图1说明如本文实施例1和表1所述的人类患者样品的代表性数据分析方案。
图2显示本文所述的随机森林(Random Forests)TM算法的500种基因选择迭代的结果。
图3A显示在含有鉴定了癌组织区域的根治性前列腺切除术标本(FFPE组织)的载玻片上鉴定前列腺癌的代表性方法。图3B显示去除非癌组织后切下(宏观剥离)的前列腺癌材料。
图4显示训练和测试组样品的基因风险特征和格利森等级或评分(<=6,7或>=8)之间的相关性。
图5显示训练和测试组样品的基因风险特征和期(II或III期)之间的相关性。
图6显示训练和测试组样品的基因风险特征和术前PSA(前列腺血清抗原)值之间的相关性。
图7显示在手术介入治疗前列腺癌之后,PSA失效自由度(PSA值升高)的KM分析(Kaplan-Meier analysis)结果。该结果显示分成癌症复发和存活概率后果较佳(复发率较低,转移引起的死亡率较低)的“低”风险亚群,和后果较差(复发和转移发生率较高)的“高”风险亚群。
图8显示在手术介入治疗前列腺癌后,在格利森等级或评分<=6和等于7的细胞样品中对PSA失效自由度进行KM分析的结果。该结果显示分成具有癌症复发和存活概率后果较佳(复发率较低,转移引起的死亡率较低)的“低”风险亚群,和癌症复发后果较差(复发和转移发生率较高)的“高”风险亚群。如果将样品分为格利森等级或评分<=6,评分等于7或评分>=8的组,则观察到相似结果。
图9显示单独基于格利森等级的存活曲线。
图10显示单独基于AJCC分期的存活曲线。
图11显示使用公开的风险评分(基于62个代表性基因)将189位患者分成存活后果概率较高(转移造成的死亡率较低)的“低”风险亚群和10年后果较差(转移发生率较高)的“高”风险亚群的结果。
图12显示10年内图11风险评分与转移概率的曲线图。如图所示,对象的前列腺癌细胞的评分超过0表明手术介入后10年内发生转移的风险增加。
图13小结和比较了单变量和多变量分析在PSA失效中的应用。标出的AJCC分期是II期与III期。CI指置信区间。
图14列出本文所述33(种基因)的标识和鉴定信息。可利用基因编号将各基因与探针的相应SEQ ID NO和其在下表1中的性能信息交叉对应起来。″频率″列列出了鉴定分子在所产生的500组中的出现频率(如实施例1所述)。其余列含有各基因的鉴定信息,如基因登录号(″检索关键字″列),表1中相应探针序列的登录号(″探针编号″列),基因名称标识符(″标识符″列)和简要说明(最后一列)。
图15列出如本文所述使用的另外25种基因的标识和鉴定信息。可利用基因编号和性能信息(z和p值)将各基因与探针的相应SEQ ID NO和其在下表3中的性能信息交叉对应起来。各基因的鉴定信息包括基因登录号(″检索关键字″列),表3中相应探针序列的登录号(″探针编号″列),基因名称标识符(″标识符″列)和简要说明(最后一列)。
本发明实施方式详述
术语定义
基因表达“模式”或“概况”或“签名”指两种或多种基因(表达序列)在两种或多种前列腺癌,或前列腺切除术后癌症复发,转移和/或存活后果之间的相对表达,该表达与区别后果的能力相关联。
“基因”或“表达序列”是编码和以可检测方式表达RNA或蛋白质形式的独立产物的多核苷酸。应理解,一种以上多核苷酸可能编码一种独立产物。该术语包括根据染色体位置和在正常有丝分裂期间重组的能力,编码相同产物或其功能相关(包括功能的获得,丧失或调节)类似物的基因或表达序列的等位基因和多态型。
术语“相关”或“关联”或其等价形式指两种或多种基因的表达和前列腺细胞的生理状态之间的相关性,从而排除使用本文所述方法鉴定的一种或多种其他状态。基因可以高水平或低水平表达,仍然与一种或多种前列腺癌,或前列腺切除术后状态或后果相关联。表示相关性的一种方式是用本文所述的z值表述各种基因(或表达序列)。可认为z值说明了基因(或表达序列)的表达水平和特定后果,如随时间推移癌症复发,癌症转移和/或存活之间的相关性的强度或权重。该数值可具有正或负(+/-)标记,该标记任意而一致地分别说明过度表达或低表达。由于该标记是任意的,所以其指代内容不难转换(但必须一致),这不会产生不良后果。
在一些实施方式中,标准化(如相对于以较恒定的水平表达的参比基因的表达)后,将强度(或权重)乘以给定基因(或表达序列)的表达水平,以得到该基因(或序列)的表达的数值或评分。在许多情况下,按照本领域技术人员所知将表达数据标准化,中值中心化和对数化,然后进一步使用,例如用于聚类分析和判别分析。使用一种以上表达水平时(例如在基因表达概况或模式的情况下),可对该数值或评分求和,然后作为总值分析,以评估相关性或根据相关性进行分类。
“多核苷酸”是任何长度的核糖核苷酸或脱氧核糖核苷酸的多聚形式。该术语仅指该分子的一级结构。因此,该术语包括双链和单链DNA和RNA。它也包括已知修饰类型,包括本领域已知的标签,甲基化,″加帽″,用类似物取代一个或多个天然产生的核苷酸,核苷酸间修饰如不荷电连接(如硫代磷酸酯,二硫代磷酸酯等),以及未修饰形式的多核苷酸。
术语“扩增”以其广泛含义使用,指用DNA或RNA聚合酶通过酶促方法制备产生扩增产物。本文所用术语“扩增”通常指产生所需样品的多个拷贝的过程。“多个拷贝”指至少2个拷贝。“拷贝”不一定意味着与模板序列完美互补或完全相同。
合适时,术语“相应”可指某核酸分子与另一核酸分子共有实质量的序列相同性。实质量指至少95%,通常至少98%,更通常至少99%,序列相同性用BLAST算法测定,如Altschul等(1990),J.Mol.Biol.215:403-410所述(使用公开的默认设置,即参数w=4,t=17)。扩增mRNA的方法通常是本领域已知的,包括逆转录PCR(RT-PCR)和美国专利申请10/062,857(2001年10月25日提交)以及美国临时专利申请60/298,847(2001年6月15日提交)和60/257,801(2000年12月22日提交)所述的方法,这些文献如同全文列出那样通过引用全文纳入本文。可以使用的另一种方法是定量PCR(或Q-PCR)。或者,可通过本领域已知方法将RNA直接标记为相应的cDNA。
“微阵列”是在固体支持物,例如但不限于玻璃,塑料或合成膜上形成的,各自具有确定面积的离散区域的线性或二维阵列。微阵列上离散区域的密度取决于准备在单个固相支持物表面上检测的固定多核苷酸的总数,例如至少约50/cm2,至少约100/cm2,至少约500/cm2,但在一些实施方式中低于约1,000/cm2。该阵列总共含有少于约500,约1000,约1500,约2000,约2500或约3000种固定多核苷酸。本文所用的DNA微阵列是设置在芯片或其他表面上,用于杂交由样品扩增或克隆的多核苷酸的寡核苷酸或多核苷酸阵列。由于特定类群的多核苷酸在阵列中的位置已知,所以可根据其结合于微阵列中的特定位置确定样品多核苷酸的种类。
由于本发明依赖对过度表达或低表达的基因(或表达序列)的鉴定,所以本发明的一个实施方式包括通过样品细胞的mRNA,或者其扩增或克隆产物(例如DNA或cDNA)与特定(种类)的独特多核苷酸的杂交来测定表达。
这种类型的多核苷酸可含有在其他基因序列中未发现的基因序列的至少约20,至少约22,至少约24,至少约26,至少约28,至少约30或至少约32个连续碱基对。前一句中所用术语“约”指从所述数值增加或减少1。其他实施方式可使用在其他基因序列中未发现的基因序列的至少或约50,至少或约100,至少或约150,至少或约200,至少或约250,至少或约300,至少或约350或者至少或约400个碱基对的多核苷酸。前一句中所用术语“约”指从所述数值增加或减少10%。这类多核苷酸也可指能够杂交本文所述基因序列或其独特部分的多核苷酸探针。在许多情况下,杂交条件是严谨条件,或其等同条件:约30%v/v至约50%甲酰胺,约0.01M至约0.15M盐用于杂交,约0.01M至约0.15M盐用于约55-65℃或更高温度的洗涤条件。
在其它实施方式中,可使用能杂交与SEQ ID NO:1-362相同的表达序列的其它探针。可通过分析SEQ ID NO:1-362检测的表达序列制备或选择这些其他探针。用于本发明的这些其他多核苷酸探针与所用基因序列的相同性可以为约或95%、约或96%、约或97%、约或98%或约或99%。用BLAST算法确定相同性,如上所述。这些其他探针也可根据在如上所述的严谨条件或其等同条件下,与本发明的表达基因和序列杂交的能力进行描述。
在许多情况下,序列是基因编码的mRNA,mRNA的相应cDNA和/或这类序列的扩增产物的序列。在本发明的一些实施方式中,多核苷酸探针固定在阵列,其他器件上,或定位探针的各点中。在许多实施方式中,探针指向作为或含有一部分3′非翻译区的基因(或表达序列)的区域。在一些情况下,该区域在聚腺苷酸化信号或聚腺苷酸化mRNA的约100、200、300、400、500、600、700、800、900或更多个核苷酸内。
或者,在本发明的另一实施方式中,可使用所述细胞样品中各基因产物(蛋白质)的一个或多个表位的一种或多种特异性抗体,分析所述细胞样品中表达的蛋白质,以确定基因表达。可标记这类抗体,以便在结合于基因产物后更容易地进行检测。
术语“标记”指能够产生说明存在标记分子的可检测信号的组分。合适的标记包括放射性同位素,核苷酸生色团、酶、底物、荧光分子、化学发光部分、磁性颗粒、生物发光部分等。同样,标记是可通过光谱法、光化学、生物化学、免疫化学、电学、光学或化学手段检测的任何组分。
术语“支持物”指常规支持物,例如珠、颗粒、浸渍片、纤维、滤纸、膜和硅烷或硅酸盐支持物如载玻片。
本文所用术语“前列腺组织样品”或“前列腺癌细胞样品”指由个体,例如前列腺癌患者分离的前列腺组织的样品。该样品可来自通过前列腺切除术,例如根治性前列腺切除术取出的物质。或者,它们可通过其它方式获得,例如针吸(组织芯)活检或其它活检技术,如横向定位的活检法(laterally directedbiopsies)、常规六分区活检法(sextant biopsy approach)、六分区和横向活检的不同组合形成的延伸技术,经直肠超声波导向前列腺活检和本领域技术人员已知的其它技术。这类样品是初级分离物(与培养细胞相反),可通过本领域已知的任何合适方式收集。在一些实施方式中,“样品”可通过侵入性方法,包括但不限于手术活检收集。样品可含有前列腺肿瘤细胞,可通过已知方法或本领域技术人员认为合适的其它方法分离这些细胞。分离方法包括但不限于:显微切割,激光捕获显微切割(LCM)或激光显微切割(LMD),然后按照本发明使用。
“表达”和“基因表达”包括转录和/或酸物质。
本文所用术语“包含”和其关联形式以其包括性含义使用,即等同于术语“包括”和其相应关联形式。
“允许”某事件发生的条件或“适合”某事件发生的条件或“合适”条件是不阻止该事件发生的条件,所述事件例如杂交、链延伸等。因此,这些条件允许,增强,促进和/或有利于该事件。如本领域所知和本文所述,这类条件取决于,例如,核苷酸序列的特性,温度和缓冲液条件。这些条件也取决于需要什么事件,例如杂交,切割,链延伸或转录。
本文所用的序列″突变″指本文所公开的感兴趣基因的序列相对于参比序列的任何序列改变。序列突变包括由于诸如取代,缺失或插入等机制发生的单核苷酸改变或序列中一个以上核苷酸改变。单核苷酸多态性(SNP)也是本文所用的序列突变。因为本发明基于基因(或序列)表达水平,所以在本发明实施中也可测定基因中不是编码区,但是调节区中的突变。
“检测”包括任何检测方式,包括直接和间接检测基因表达和其中的改变。例如,产物“可检测地减少”可直接或间接观察,该术语表明任何减少情况(包括不存在可检测信号)。类似地,产物“可检测地增加”指直接或间接观察到的任何增加。
前列腺切除术指由技术人员,例如外科医生去除前列腺组织。非限制性例子包括根治性前列腺切除术;开放式(传统)前列腺切除术(包括经会阴切开);腹腔镜前列腺切除术;和机器人(保留神经)前列腺切除术。
格利森评分指受过训练的病理学家按照格利森系统对前列腺癌样品进行分级,该系统根据前列腺组织样品与正常组织样品中细胞的相似性用数值1-5指定格利森评分。看上去很像正常前列腺组织的组织给予评分或评级1,而缺少正常特征并且细胞似乎无规则散布在前列腺中的组织给予评分或评级5。2-4的评分或评级(包括性)的特征介于这些可能性之间。但是,因为前列腺癌可能具有不同评分或评级的区域,所以可对构成大部分组织的两个区域给予单独评分或评级。这两个评分或评级加起来得到2-10的格利森评分(或格利森求和)。
除非另外定义,本文中所使用的所有技术和科学术语都具有本发明所属领域普通技术人员通常所理解的同样含义。
概述
本发明部分基于使用1993-1995保存的FFPE组织的前列腺癌样品的不同训练和测试组发现了前列腺血清抗原(PSA)失效的基于基因(或序列)表达的预测指标。该样品具有相关的长期患者随访临床数据,获得样品的患者包括那些在手术后至少10年没有出现疾病证据(NED)的患者和随后复发(如远端转移)的患者。通过对该样品进行基于RNA的表达概况分析,从约1536种基因的初始集合中鉴定到在不同癌症类型中高度动态表达(或表达水平不同)的62,92,337和362种基因(或表达序列)。这些基因的表达水平与PSA失效和本文所述的临床后果相关联,因此可用作本文所述的预测指标。据报道,鉴定基因参与细胞功能,包括细胞周期,血液凝固和伤口愈合,转录调节以及凋亡。
所公开的基因表达模式(概况)的预测能力可能与格利森评分和AJCC肿瘤分期有关。它也与术前PSA水平一致。该概况也能够将格利森评分<=6和7的样品分成PSA失效的低风险和高风险。在具有已知概况的多变量分析中,概况是保持统计学显著性(p<0.05)的唯一预测指标。因此,检测活检样品或前列腺切除术取出组织的概况能够区分缓慢进展(indolent)癌症与侵袭性癌症。
本发明包括鉴定和使用基因表达模式(或者概况或“签名”),该表达模式可用于区别(或关联于)对象的前列腺癌存活和复发后果。这类模式可通过本发明方法使用多种参比细胞或组织样品测定,如前列腺癌病理学领域普通病理学工作者所知的那样,其反映出前列腺癌细胞与正常或其它非癌细胞不同。可将获得样品的对象的后果与表达数据相关联以鉴定与该后果相关的模式。由于总体基因表达概况在不同人,不同癌症和不同癌细胞之间不同,所以可按照本文所述产生某些细胞和表达或低表达的基因之间的关系,以鉴定能够区别前列腺癌后果的基因。
基因和序列的鉴定和描述
本发明可用任何两种或多种公开的基因(表达序列)实施,就前列腺癌,或前列腺切除术后的后果,如术后PSA上升>0.2ng(″PSA失效″)而言,发现所述基因差异表达。用各种均质前列腺癌细胞群体的表达概况进行鉴定。表达概况中各基因的表达水平可能与特定的后果相关联。或者,可汇集(合并)两种或多种基因(表达序列)的表达水平,并根据与特定后果的关联性使用。后果的非限制性例子包括但不限于:远端转移,如转移至淋巴结或骨,或者需要随访化疗或放疗或冷冻疗法。在其它实施方式中,可利用该表达概况将对象或患者分成不同预后类型,即″密切观察等待″与″需要进一步治疗″,后者可能包括除前列腺癌/肿瘤切除术外的新辅助疗法或辅助疗法。因此,所公开的方法可用作特定控制(par management)。
利用与前列腺癌(或前列腺切除术后)存活,转移或复发后果显著相关的基因区别后果。或者,具有显著相关性的基因可与具有较低相关性的基因联用,以形成本发明的表达模式或概况,但不会明显丧失区别后果的能力。可通过本领域认可的适当方式选择和测试这类组合(或表达模式),这些方式包括但不限于:聚类分析,支持性载体机器,神经网络和本领域已知的其它算法。该模式或概况能够根据模型中区别所用基因的表达来预测未知样品的分类。可利用“弃一法”交互证实来检测各种组合的性能,并帮助鉴定对某组合的预测能力而言信息性较低或不利的权重(表达基因或序列)。也可利用交互证实鉴定其表达提高了该模型的预测能力的基因或序列。
与特定的前列腺癌或前列腺切除术后的后果相关联表达的公开基因(序列)能将基因表达分析只集中于有利于在不同后果中区分对象的那些基因。相对来说,其他基因在前列腺癌细胞中的表达不能提供有关与并且有助于差异预后(或区别)前列腺癌后果的信息。
本领域技术人员应理解,即使只基于一小组参比基因表达数据,组合(表达模式或概况)也特别有用,并且包含的参比数据越多准确度可变得更高,但准确度持续增加可能随着额外各数据而降低。利用区别前列腺癌或前列腺切除术后不同后果的本文鉴定和公开的基因准备额外的参比基因表达数据是常规方法,不难由本领域技术人员进行,以便产生上述模型从而根据那些基因的表达水平预测未知样品的状态。
本发明包括图14中所列基因的表达序列。
表1
Q ID                                                                                    62种
频率探针序列                                                      z         P           的组
IO:
1    500    GGCTCCTAGAAGCCCCATTCAATATCACTACTCTTTAACGAGTGCC        -3.00978  0.004298    是
2    488    TGACTGGATGGACACATTGCTGTGGGTAGTCCCTCCTACTAGGA          3.250421  0.000878    是
3    475    CCAACTATGAAAGGCCATAGAAACGTTTTAATTTTCAATGAAGTCACTGA    1.295466  0.199714    是
4    386    ATATTTTGGTGTTTGCGAGGCATGCAGTCAATATTTTGTACAGTTAGT      2.775622  0.00728     是
5    349    TGCATGGTTGGTCTGAAAATAGAGTTGGGCTTAATGTTGACTTCTATTAC    5.04529   6.51E-06    是
6    338    TCACATCAGTCTTCCGGAATCAAGATCAACATATCAGGTGGTCATT        3.405667  0.000631    是
7    334    CCCCACCCCTATCGTGGTTATTGTGTTTTTGGACTGAATTTACTTG        4.583428  2.21E-07    是
8    297    CCGGATGGTGCTTCTAATTTTCTGCTAACCTGTACTGTGGTGTGTGTA      3.80189   0.000379    是
9    291    CCTCCGAGCTGCTAGCTGACAAATACAATTCTGAAGGAATCCAAA         3.710157  0.00019     是
10   287    GCCTGTATCCCGGTGGGAGTACTATGAGTCAGTGTACACAGAACG         -3.6926   0.000507    是
11   267    AAACCATCAGCCGGCCTTTTATATGGGTCTTCACTCTGACTAGAATT       3.57085   0.0014      是
12   267    GACTGATGCCAGGACAACCTTTCTCCCAGATGTAAACAGAGAGACATG      -4.19554  2.68E-06    是
13   259    CACTGGACACCCTTCGAGTGTGGGTTTTAACATCCCTGTGAGATT         2.634469  0.006429    是
14   254    GATCTGGGGATCACGCCTTGCCCAAGTGTGAGATTACCTTTCT           2.052031  0.040119    是
15   244    TTCAGGCTTAATGCTGCACCTAGATATAAATGCTAATGATACTTGGGTT     5.729346  2.33E-07    是
16   232    GAGTCAGTGGATGGACAGGTGGTTTCTTCCCACAAGAGAGAAAT          -3.40600  0.1156      是
17   227    TGGTAGGAGATACTAATTGGATTCGGAGATATTAATTGGATTTGGCCA      -1.61758  0.110916    是
18   211    CCTAAGGTGGTTGTGCTCGGAGGGTTTCTTGTTTCTTTTCCATTTT        1.001552  0.315659    是
19   194    GCTCAATATTCCCAGAATAGTTTTCAATGTATTAATGAAGTGATTAATTGGCT 4.402902  4.56E-06    是
20   169    TTGCTTTTTCTTCCTTTGGGATGTTGGAAGCTACAGAAATATTTATAAA     3.113451  0.002649    是
21   181    AGGCCTCATCCTCCACTGAAGAGTATGGATTGAAGGATTGTGAAC         4.029959  5.79E-05    是
22   181    GCTGAAGGACCCTGAGGAGCTTCGCAACTACATGGAGAGGATC           2.98415   0.004216    是
23   178    TGTTTCAAAACCACTTGCCATCCTGTTAGATTGCCAGTTCCTGG          1.89886   0.057651    是
24   164    ATCAAGCAAGTTCCTGCTGCTGAAGGATAAGACACAGATGACCTG         -0.84556  0.373466    是
25   142    TAAGTCGGGTGGCAATTGTCAGGGTGTGGGAATTTCTTTTCCTAC         3.39272   0.000659    是
26   140    AGTTCTGACCCAACCACAGAGGATGCTGACATCATTTGTATTATGTTC      -2.26722  0.020347    是
27   135    CCATGGCAGTGGGAAAAATGTAGGAGACTGTTTGGAAATTGATTTT        -1.91339  0.060183    是
28    118   AGGACCTGAAGGGTGACATCCAGGAGGGGCCTCTGAAATTTC           1.467298    0.152499    是
29    117   GGACTCATCTTTCCCTCCTTGGTGATTCCGCAGTGAGAGAGT           2.349832    0.026905    是
30    117   CTCCCTGAAAAACCATTCCTGCTGAAACTGCTGTAGAAATTGTGAAG      3.856822    3.49E-05    是
31    114   CCCCTGAAAAGTGAGCAGCAACGTAAAAACGTATGTGAAGCCTCT        2.97408     0.002585
32    109   CACCTGCTCTAGGGACGATTCGTTTGAAAGAGAGTAAGATGCATTAA      -3.92943    0.000275    是
33    103   CCACCTGTTCTGAATTTGCAAGAATTAGAGGCGTATAGAGACAAATTG     1.583424    0.10573     是
34    102   TGTTTGGTCGTAATGTCTGCATGATATTTGTGCACATTTATTAAGTATCG   -3.38591    0.000419    是
35    102   GGCTGGGTGTTTTCAAATGTCAGCTTAAAATTGGTAATTGAATGGAA      -2.34381    0.021355    是
36    99    GCAAGCATAAGGGAAAATGTCACGTAAACTAGATCAGGGAACAAAATC     1.603483    0.122455    是
37    92    GCCAAGACCACCCAGGAAACCATCGACAAGACTGCTAAGCAG           -2.61622    0.013024    是
38    81    TTTGCAAAGAATCCAGGACAAAAAGGATTAGATCTAGAAATGGCCATT     -0.1063     0.915443
39    77    GGTGACTTTTGCAATTCAGGGAAGATTTGGGCATATTAAATGAAAGA      -2.49834    0.012822    是
40    74    ATTATGCCACCTTGGATGGAGCCAAGGATATCGAAGGCTTGCT          -0.69455    0.484731
41    71    TTGATTTGGGACTTGGGAGACCTCTCT TCTGTAAGCAACTCAATAAA     3.539216    0.00045     是
42    67    AATCCTGTGGTGAATGGTGGTGTACTTTAAAGCTGTCACCATGTTA       1.171006    0.231962    是
43    64    CTTGAGTCCCACCCAAAACCTCTAGTAGGGTTTTAATAACGCTCAC       3.521289    0.000326
44    64    TCTTTCAGAAGTGAAGAGGGGGCTAGAAGGACTCTGAGAAGTTGGTA      3.320872    0.001015    是
45    60    GCAGAGAGTGCCGATCTTACTCAAGTACCTAGACTCAGATACAGAGAAGG   2.934405    0.002862    是
46    60    CGGAACTCTTGTGCGTAAGGAAAAGTAAGGAAAACGATTCCTTCTAA      2.370805    0.019885    是
47    59    AATGTGGGAAGGTGGGGGTTATGGAGGAGATAACTCAAAACTTCT        3.829441    0.00022     是
48    59    CCCCATCTTGTGGTAACTTGCTGCTTCTGCACTTCATATCCATATTT      1.175431    0.263596    是
49    54    TTATCCATTCGTTGTGGACCCACAGATTGCATCTTTAAATTCATAAT      1.210782    0.239402
50    52    AGGTCCTCAGATGGGAATTGCACAGTAGGATGTGGAACCTGTTT         -1.45819    0.141876    是
51    51    TGTAACATTCGTGAAGCTGTTCCCACTCCCAGATGGTTTTATCAATA      1.852187    0.06511     是
52    48    TTTTAACTTCTATATGGGACCCGAATTAGACACTGCTGAATCCTGTAC     3.449622    0.000296    是
53    46    AGAAGAGCACAAAGCAAGGCCATTGCAACAGGCATTTAAAAATTATT      -4.08976    7.22E-05
54    46    CTCAATGCATCCATCTTGGGCTGATCATGCCACAGATCTCATTC         3.285094    0.001303    是
55    45    AATTCCTCGGGAAAGGTGAACCTGAACAACCCAAGTCTCTCTCT         -4.17274    3.78E-05
56    45    GCTCTGTTACAGCTCTGACCACGAAAAACTGAAGCCTCAGTACTTG       -3.86847    0.000157    是
57    44    CCACTTGACAGTGGAGCAGAGGGGTTACCCAGATTTCAACCTCAT        1.389785    0.187738
58    44    TTCTGGGATTTCTCTAGAGGCTGGCAAGAACCAGTTGTTTTGTCTTG      0.716713    0.475575
59    42    TGAGCACCTTTTAAACCTGCTGCACAATAATTGAGGAAATAGACTCTTT    1.253049    0.204046
60    42    CGTGTCAACAATGGTAAAGGGGATGTATGGCATTGAGAATGAAGTC       -422412     0.000197    是
61    41    TCAAAGTTCCCCAAGAAGAACTGGAAAATGCCAGCCTAGTGTTTAC       -1.17228    0.26041     是
62    37    ATGTTCACCTGGCAATCAGCTGAGTTGAGACTTTGGAATAAGACACT      3.369271    0.000783
63    37    TTTAATTATGGTGAGCGTTTCCGTTTGGGTACAAGGAATATGAGAGAT     -1.57416    0.125115
64    34    TGAGAGCATGCCAAAATTTGCTAAGTCTTACAAAGATCAAGGGCT        3.791155    0.000213    是
65    33    TCCCTACCAAGTGAAAATTGATGTGTGTTAAGAGGGTACAGAATTATCAAC  2.285228    0.014636
66    33    GGTGATTTGCTGCTGGCTTTCTATCATTTTTATGTTTTAATGCAAAG      -3.31128    0.001117    是
67    33    GGCCAAGAATATTGCAAAATACATGAAGCTTCATGCACTTAAAGAAGTA    -0.5838     0.561233
68    32    CTCCTCAGGACCCTCTGGGTCACACATCTTTAGGGTCAGTGAAC         -3.24137    0.000608    是
69    32    GGCAACAGGAAACAGGTTTTGCAAGTTCAAGGTTCACTCCCTATAT       3.728802    4.82E-05
70    30    TGAAAAAGTTATCTCTGGGTATTGCATAAAAGGCTTCATCTTATAAAGTGA  -1.39464    0.192516
71    29    CCACGAGGATGGCCCACAAGCAGATCTACTACTCGGACAAGT           0.902775    0.379221
72    28    TCTGCTCTCCATCCAGAGCCTTCTAGGAGAACCCAACATTGATAGT       4.556078    1.33E-05
73    27    GTGAGGAGCGAAGAGCCCTCTGCTCTAGGATTTGGGTTGAAAAA         1.185538    0.24293
74    27    TGGCACTTTGTTTGTGTTGTTGGAAAAAGTCACATTGCCATTAAAC       0.806045    0.423301    是
75    26    GGCTGGATCAAGGGCAAAAACTGGTCATTAAGTCATCTGACATTAA       2.219451    0.029617
76    26    GAGAGAAATTTTAGGTGGTTGAAATGATTAAATGGAAAGAGATTTATTTTCA -2.55709    0.010361
77    26    TCTTTGAGAAACAGCGTGGATTTTACTTATCTGTGTATTCACAGAGCTT    1.067981    0.294969    是
78    25    ATAGAGCACCCAGCCCCACCCCTGTAAATGGAATTTACCAGATG         1.605946    0.10608     是
79    24    TCACAGGATCCTGAGCTGCACTTACCTGTGAGAGTCTTCAAACTTT       0.054807    0.956306
80    24    GCTGAAGTGTTCATAAGATAACAATAGGCTTGAATCTCCAATTCAAATGAAT 0.213151    0.831225
81    24    TTGTGACATTGTGACAAGCTCCATGTCCTTTAAAATCAGTCACTCTG      -5.23137    3.27E-07    是
82    24    TGGAAACTCTTGGACCAAGATTAGGATTAATTTGTTTTTGAAGTTTTTTG   0.949064    0.344716
83    22    CATTCAATCCGGACCATTTTCTGGAGAATGGACAGTTTAAGAAAAGG      0.784157    0.439473
84    22    TGCTGAACTCACAGTTAGACAATCCATGGTTTAATGCACATGAAATTACC   -0.14282    0.887169
85    22    ACGATAACCTGGCAGTGGAAGGAAAGAAGCATGGTCTACTTTAGGT       -2.47268    0.010003
86    21    CTGCTTGATTTTTGCCTCTTCCAGTCTTCCTGACACTTTAATTACCA      -4.14257    2.03E-05
87    21    TCAACATCACAATGGCAAAGAAGAAATATACTGTACAAAACTGCAGGAA    -1.72036    0.093687
88    21    TTTGCATGTCCAAATTGCTTCCTTCTTTTTAGCAGAAAGGAGGAGT       -1.91298    0.083553    是
89    21    TCCAGGCATTTTAGAACTATGCAATTGTGATTTAAAATGCAACTTTGT     -2.15046    0.037021
90    21   GAGACAGGGAAACACAAGGGGAGTAGAAGGCTTCAGTAGAAGATTTC          1.665338    0.12772
91    20   GTGGTCATCATCAAGGCATGCCAGGATACCTTCCTGGTGCTAT              -1.18886    0.2414
92    20   CCTGGTAAGTATGCAGCACATTGCTTATATCCTGGGTATGCATTATTTT        3.422692    0.000874
93    20   TCAATGAGTAACAGGAAAATTTTAAAAATACAGATAGATATATGCTCTGCATG    3.192274    0.001222
94    20   TGCCCAGTTTGTTCAAGAAGCCACTTACAAGGAAGTAAGCAAAATG           -0.54687    0.573053
95    19   GAAACGGGGCCATATAGTTTGGTTATGACATCAATATTTTACCTAGGTG        4.220137    3.53E-05
96    18   ATTTCCATGCCGTCTACAGGGATGACCTGAAGAAATTGCTAGAGAC           -1.16115    0.230302
97    18   TGCATAATTCATTGTTGCCAAGGAATAAAGTGAAGAAACAGCACCTT          -1.41926    0.138831
98    18   CTGCTCTTGTGCCCTTCTGAGCCCACAATAAAGGCTGAGCTCTTA            2.079621    0.016021
99    18   CCTCCGGAAGCTGTCGACTTCATGACAAGCATTTTGTGAACTAG             1.81169     0.070381    是
00    18   CATAGCTCTTTGGCTCGTGAACCTAATTGTAAACTTTCAGGTATTTTTG        1.766145    0.074049
01    17   CCAGTTATGCAGCACCTGGCTAAGAATGTAGTCATGGTAAATCAAGG          3.991931    0.000108
02    17   GGCAGGCACTTTAATACCAAACTGTAACATGTCTCAACTGTATACAACTCA      1.692111    0.097387    是
03    16   GCCACACTGAAAAGGAAAATGGGAATTTATAACCCAGTGAGTTCAGC          0.852486    0.40553
04    16   CTGGGCATACAACCCTCTGCTTTCACATCTCTGAGCTATATCCTCA           -3.7346     0.000251
05    16   AGCAGACAAAAAAGGCACTTTTCAGAACATCAAATTCCTAATGAAGAAG        -3.23615    0.002278    是
06    15   TGCTTCATTGTGCCCTTTTTCTTATTGGTTTAGAACTCTTGATTTTG          3.311718    0.001031
07    15   GATGTGGCAGAATCCACACCAGCTTATCAACCAACACAGCTAATTT           1.389693    0.166098
08    15   GGGGGAGTAAAAAATTGAATTTTAACAAAAGATCTTAGGGGAATGTGATT       -3.0524     0.002691
09    14   CCTTGATGCTGTCTGTACAGGGTTCATATTTTGTAGCGAAAGTCGTTT         -2.22662    0.020629
10    14   CATCCAGGACACTGGGAGCACATAGAGATTCACCCATGTTTGTT             1.067035    0.287699
11    14   CGGAAGAACTGAGCACTCTGTTCTCCAAACCTATCAGAAATTTGTGG          3.742475    0.000285
12    13   ACCAGTAGGGGCTTATAATAAAGGACTGTAATCTTATTTAGGAAGTTGACTT     -4.16547    2.91E-05
13    13   CACTTTCAGATAAGAGGTGTTTGCTGGGATGGAAGAACTACCTGGC           1.85552     0.076369
14    13   GAAAGCCTTCCTCGGGTTCAAAGCTGGATTTTGAACTGAAGAAGAT           3.344591    0.000724
15    12   TGAAAATTGGTAGATCAGAGTTGAGCTGATTGGAGGACCAAATTAAAA         -2.61178    0.007099
16    12   TTCCATTGTAATTGCTATCGCCATCACAGCTGAACTTGTTGAGAT            3.126618    0.001574
17    12   GACACAGATGACTCTTTGGTGTTGGTCTTTTTGTCTGCAGTGAATGTT         1.891374    0.056055
18    11   TCAAGAAAGGGATTCCGAGGCCAATAAGCCCTCCTTTCTCTTG              -1.24114    0.198279
19    10   TCCAGATAACTTTCAGGCACTGCTGGAGTGTCGGATAAATTCTGGT           1.813774    0.066896
20    10   AATCCTCACATCGTGCCAAACTTAGTCTGGTTACTAAGCCTAAAAACA         2.403548    0.016851
21    10   ATTGAGGATTTGTGGGCAGCCAGAGGGAGTCTGACTGAAGTTTAC            -2.29581    0.02535
22    9    TGCCAGAATCTAGTGGGATGGAAGTTTTTGCTACATGTTATCCACC           -0.34425    0.731248
23    9    TTCCTTCATGTAACTTCCCTGAAAAATCTAAGTGTTTCATAAATTTGAGAG      2.695661    0.00798
24    9    CTCTGGTGTTTTCGCCAGACAATAAACTTACACTGGAAGCTTTGAT           -3.03684    0.002403
25    9    TTGAACACAGGCTTTGTCTGAATGATGTTCTTTTATCTCTTGAACACAA        -3.59572    0.000682
26    9    GAAGCCAAAGTACCCGCACTGCGAGGAGAAGATGGTTATCATCAC            1.937332    0.052778
27    9    AGCTGGCGCCAGCTTCTTCTCCTGGATCCAGTAAGAGTTTCG               -0.59083    0.544181
28    9    CCTGAAGGAAACCACTGGCTTGATATTTCTGTGAGTCGTGTTGC             -0.58376    0.559447
29    8    CCACCTTTCCTCCCAGCAAGCATCTGGCCAATCCTATTCTTC               -2.29915    0.014561
30    8    GTGAGGTACAGGCGGAAGTTGGAATCAGGTTTTAGGATTCTGTCTC           4.941946    1.60E-05
31    8    CTTGGCCTGAAGAGGTGCAGAAAATACAGACCAAAGTTGACCAG             -1.9620.    0.49061
32    8    ACATAGTGACATGCACACGGGAAAGCCTTAAAAATATCCTTGATGTAC         -3.61201    0.000318
33    8    TAATGCAAGCCCTGACTGGGTGGAAGCTGAAGTCTTGCTGTTTTA            2.396608    0.012653
34    8    TCCTTTTTTGGGGAAATCTGAGCCTAGCTCAGAAAAACATAAAGCAC          -3.97531    0.00059
35    7    GGCCCTTCCTGATGATCATTGTCCCTACAGACACCCAGAACATCTT           -2.36278    0.018244
36    7    GGAGCTGGGGAGCTGTGTTAAGTCAAAGTAGAAACCCTGCAGTGTT           -4.42673    3.66E-06
37    7    GCAGAAAAGAAGACGAGAATGCAACCATACCTAGATGGACTTTTCCAC         2.728168    0.006056
38    7    AACAAGTGGGATTTTCTGGGCCAGCAAGTCTTCCAAACTGTATATG           -0.21615    0.829698
39    7    GCTGTGTGGGTCACACAAGGTCTACATTACAAAAGACAGAATTCAGG          -2.47087    0.013094
40    7    TGCACAGATCTGCTTGATCAATTCCCTTGAATAGGGAAGTAACATTTG         3.051955    0.001684
41    7    CCCTATGAGTGGAAGGGTCCATTTTGAAGTCAGTGGAGTAAGCTTTA          -1.23786    0.21761
42    7    AGAGCTTCTGAGGCGCTGCTTTGTCAAAAGGAAGTCTCTAGGTTC            1.688918    0.097307
43    6    TGTGAAAACAAGCTTCAAAGCCATATGGACACTGTGACAATGACTA           3.369288    0.000926
44    6    GCATCTCCCTGACCTTCTCCAGGGACAGAAGCAGGAGTAAGTTTC            -4.1766     1.77E-05
45    6    CGCCAGCTACAATCCCATGGTGCTCATTCAAAAGACCGACAC               -1.32939    0.195817
46    6    GATCCGGGATGGGAGACCCCACTTTAGAAAGGGTCGTCACTC               2.803856    0.002763
47    6    TGGATTGAGAAAACCTATATCCATTCTTTATATCAATGTATAGTTTTAGTCTCCT  2.448797    0.019091
48    6    GGTGAATGCCCTCAACTTCTCAGTGAATTACAGTGAAGACTTTGTTGA         1.886404    0.063745
49    6    ATACGGCGAGGTAGAGTTGGCCATATTTCAGAGACTTAGATTGACGT          4.337458    1.70E-05
50    6    GCTCGTTTGGTGCACTCTCGTGGGAGACAATCAGAGAACAACATA            1.225008    0.19426
51    6    GCCTTTCCATCTGGCATTTCCCGCTCATTTATATGACTTGCTGAG            2.968053    0.002255
52    6    TCCGGTGACCAGGTGTCTACAAGGACAAGGTTCAGAAATTGTACAG         2.304752    0.025941
53    5    GCAGAGGTTCTTTTAAAGGGGCAGAAAAACTCTGGGAAATAAGAGAG        -3.24369    0.000993
54    5    TTTTCCCCACCCGAGATGAAGGATACGCTGTATTTTTTGCCTAAT          2.24033     0.011993
55    5    ACTGCAGGATACACTCCCCTCCTGCTACCTAGGCAGGCGTGAG            -0.88751    0.353721
56    5    GGTTTAACCCGAGTCACCCAGCTGGTCTCATACATAGACAGCACTT         2.232118    0.02553
57    5    GACACTTGTTTAGACGATTGGCCATTCTAAAGTTGGTGAGTTTGTCAA       1.647226    0.102927
58    5    TCACCAAAAGCTGTATGACTGGATGTTCTGGTTACCTGGTTTACAAAAT      2.938772    0.002383
59    5    CATAAGCTGGTATCAGTGGTTCGGGGGAAATAGTTCCATTCTATGACTC      -3.01637    0.003841
60    5    TTGGCGATCATTTCCCAAGATTGGTTTCCCTTGAGTTTTTGTTAAA         -4.22349    5.18E-05
61    5    CCTAGTTTGATGCCCTTATGTCCCGGAGGGGTTCACAAAGTGCT           -0.55135    0.58089
62    5    TTTTCGAAGGATAATTTTGGAGGCNAGAAAAAATGGACGGGG             -2.37921    0.016098
63    5    TGTTCGCGACTAGTTGGCTCTGAGATACTAATAGGTGTGTGAGGCTC        -2.17442    0.018122
64    5    CACCTGGACCCCTGCATTGGAACTGGAGGCAGGGAACAT                -2.2306     0.022824
65    5    TGGAAGGATGGAAGAAACGCCTGGAGAATATTTGGGATGAGACAC          -1.79624    0.085727
66    5    GCATTACTTTGAATTTAATGTTGCGCTTGTGCACTGTGTTAATATTGTTT     -2.46291    0.016207
67    5    GGTGATGGGGACCGTCTTTCTTTTACTGACACATGACCAATCATA          -2.30099    0.020722
68    5    TGGGCAAAACCATTGAATTTCACATGGGTGGTAATATGGAGTTAAA         -2.99545    0.002532
69    5    AACCAGCCTTCAGAGCGTTCTCTGTCCTGCTTCTAACGTCACTT           0.01601     0.987237
70    5    TGCCACATTTGACTGAATTGAGCTGTCATTTGTACATTTAAAGCAGC        -0.67643    0.497085
71    4    TATATGGTTTCCAAAGGGTGCCCCTATGATCCATTGTCCCCACT           -1.76935    0.075774
72    4    TTTAAGGACTGATCATTGGCTCTGAGGACACTTCAACTAGTTAGCCTTCT     0.11679     0.907115
73    4    CCCTCATCAAAGTCCTCGGTGTTTTTTAAATTATCAGAACTGCCC          -2.8669     0.003674
74    4    CAAATGGTTACCTTGTTATTTAACCCATTTGTCTCTACTTTTCCCTGTACTT   3.411476    0.000689
75    4    GCCAGCTGCATGCAGGAGCGTGCCATCCAGACAGACTTC                -2.24724    0.024396
76    4    CACTCCAGGCAGGTCTTGGGGCTCCTATGTAAGCTGTGTTAAGC           -1.38308    0.168369
77    4    GGCTGGCAACTTAGAGGTGGGGAGCAGAGAATTCTCTTATCCAAC          -2.0969     0.052047
78    4    GATTCATCCAGCCTTCCAGCTCTGTTATTTAAAGCAAGAACACTTCTG       4.423002    2.51E-05
79    4    CCTAAAGCAAGCCTGAATTGGCTATGCAGTACATTGTATTCTGTTTG        -4.28624    2.42E-05
80    4    CGGGCTTTTAGCAGCATGTACCCAAAGTGTTCTGATTCCTTCAACT         -0.69941    0.485384
81    4    CTAAGGGATGGGGCAGTCTCTGCCCAAACATAAAGAGAACTCTGG          0.451498    0.654537
82    4    AAATCCAAACTCTCAATTACGCCATGGTAATTCAGTCACTAAAATATGT      -3.42088    0.000689
83    4    GCAGGAACCGCGAGATGGTCTAGAGTCAGCTTACATCCCTGA             -2.37983    0.026005
84    4    TGTTCCACTGAGCTCCTGTTGCTTACCATCAAGTCAACAGTTATCA         0.232032    0.818608
85    4    CTCAATGTAACCTCAGGGGCCAGTTTTAGCATTTGAAATGGTTCT          -1.76115    0.095531
86    4    TCTGACCAGTTACAGCCCCAAAGATGCAGTGATAACTGTGATGTATG        -1.37322    0.133757
87    4    GCATCCAGAACAGCCTGCTTGGACACAGCTCGGTGGAAGAT              -2.12389    0.039832
88    3    TTACAAATGACTCAGCCCACGTGCCACTCAATACAAATGTTCTGCTAT       2.395553    0.016443
89    3    ACAGCCCTGCTCCCAAGTACAAATAGAGTGACCCGTAAAATCTAGG         -3.50224    0.000637
90    3    CCAGATACTACTCGGCGCTGCGACACTACATCAACCTCATCACC           -2.27536    0.031464
91    3    AATAAGCAGGATGTTGGCCACCAGGTGCCTTTCAAATTTAGAAA           1.68039     0.069608
92    3    GGAATTTGATTCTTCCAGAATGACCTTCTTATTTATGTAACTGGCTTTCA     3.817877    0.000172
93    3    CAAGGTGTAGCAAGTGTACCCACACAGATAGCATTCAACAAAAGCTG        -2.7616     0.00587
94    3    CACAGAGTCTGAAAAGCGGGTCTCCGTCTACCAGAAGGTGACCTCC         -0.46636    0.642653
95    3    TGAGGACTCAGAAGTTCAAGCTAAATATTGTTTACATTTTCTGGTACTCTG    2.004388    0.050059
96    3    TGGAATGGTGAAAGAGAGATGCCGTGTTTTGAAAGTAAGATGATGAAA       1.286332    0.218274
97    3    CAGGGGTTGAGAGCTTTCTGCCTTAGCCTACCATGTGAAACTCTA          0.396152    0.693055
98    3    CACAGATGAGAACCACGCCTAGCCAAAATCACTTTTCCTGTTTGC          0.932001    0.350214
99    3    AGGCATGGGAGTCATTGTCCACATCATCGAGAAGGACAAAATC            1.048222    0.289167
00    3    AACGGGATCCTCTGTGGTCGCGACACTGACCTAGACGGCTT              1.930889    0.05573
01    3    TGTGTGGCTTCCTGCAAGGTACCTTCATCTCTGAGTTACCTGACTC         -2.12276    0.038612
02    3    GCTGTCCTCAAAGCATCCAGTGAACACTGGAAGAGGCTTCTAGAA          2.647942    0.012248
03    3    CCCTTTCTTTGATGGTGCTTGCAGGTTTTCTAGGTAGAAATTATTTCA       1.507454    0.122396
04    3    AAATGTACCAATCAGCATGCTGTGTCTAGCTCAAGAACTCAAGCTCC        -0.57666    0.565438
05    3    CGTCACCCCAAAAAGTTCCCTCCATATCCCTTTGCAGTCAGTTC           0.760999    0.450353
06    3    CATGACCGCATGGTATACCTGGGCCTCTCAGACTACTTCTTCAACA         2.48108     0.008418
07    3    GCATTAGTATGACAGTAGGGGGGCTGTTAGAATTGCTGCTATACTGGT       -1.3436     0.203689
08    3    CCAGGATAAAGCTTCCGGGAAAACAGCTATTATATCAGCTTTTCTGA        2.988968    0.005851
09    3    TTCCTGCTACACATGCCCTGAATGAATTGCTAAATTTCAAAGGAAAT        0.810494    0.410805
10    2    TGGCCTGTGGTTATCTTGGAAATTGGTGATTTATGCTAGAAAGCTTT        -2.73832    0.007474
11    2    GGGAGAAAGCTAATGTTTTCCACAAGACTGAACAACGTGTATTTACACG      -3.19477    0.000546
12    2    GTGCTGGGTGCATATCATCCAGGATAATATTCTGCCCAACTCCAT          -1.23963    0.215301
13    2    CCCAGGATTATGTTTGTTGACCCATCTCTGACAGTTAGAGCCGATAT        -1.35681    0.189959
14    2    GCTGGACAGGAGCACTTTATCTGAAGACAAACTCATTTAATCATCTTTG          1.270148    0.203802
15    2    AGTTGCAAAAATGGCTCCATCGGTAACTCAAGCTTCAGAATGTTATG            2.416151    0.015977
16    2    TCATCGGAGTAGATTCCGGGTGCCTTTACTCCACTGTGACCTCATA             -1.28409    0.192946
17    2    GTGTGCTCAGGCAATTATTTTGCTAAGAATGTGAATTCAAGTGCAG             2.642687    0.006795
18    2    TGGGAAAGTATCAGGAGTGCCATGATTCCAATGTTTTCCTTCTTTTA            2.157816    0.025861
19    2    AGACGGCGCAGACATGTCAGAACAAAGTAAGGATCTGAGCGAC                -3.49114    0.000292
20    2    CCAGCATTAAGTACTGTATATCGCCCTGTACTTGGATAGGCTGGCTAAC          0.144643    0.885072
21    2    AGGCAAGGAGGAGGGGAATTTTAAAACCATCTTATTTGAACTGAGAG            1.851673    0.064779
22    2    TGGTGCTCTATGCTCAATGATGGTCTTACACATTCCTCTAGGGAAAG            3.451224    0.001721
23    2    CCCTTTCTATTCTGAACAACTGTCTCCATTTTTCAAGTGTGAGAGATAAGG        2.35354     0.015021
24    2    CAGTCGAGACCCAGATCCACTGAACATCTGTGTCTTTATTTTGCTG             1.792116    0.072731
25    2    GCAGACATCCTGTGAAGCAGGACCTGCTGAAGAGGAGACTTTCTAT             0.353515    0.72344
26    2    TGAGAAAGCTCAAGATTCCAAGGCCTATTCAAAAATCACTGAAGGAAA           2.674193    0.01623
27    2    CAATCCGAGTTCCCGGATGAGGGAACATTCTGCAGTATAAAGGG               -1.59105    0.109934
28    2    CAGCACCAAGTCTACGGGTGCCAGATCAGTAGGGCCTGTGATT                2.448186    0.011472
29    2    AGCAACAGCAAATCACGACCACTGATAGATGTCTATTCTTGTTGGA             1.239036    0.208803
30    2    CTTGCCCATCTAGCACTTTGGAAATCAGTATTTAAATGCGAAATA ATC          1.984819    0.047707
31    2    TTTTCAGGTTTATTCTTTTAGCAGGTGTAGTTAAACGACCTCCACTGAAC         0.755574    0.449369
32    2    TGCCAAAAATTAAAGTGCAATATTGTATATTTTTAAGAACAAATTTAAAATAGAA    -0.31259    0.755488
33    2    TTCTGAGGAGGAGAGAGTGAGGGTTTTGCTATTGACTGACTTGAAC             -0.56126    0.582467
34    2    CTGGGGGCGCAACCACCCCTTCCTTAGGTTGATGTGCTT                    -2.07743    0.039244
35    2    ACGCTGTGCGTTTGTCAGAATGAAGTATACAAGTCAATGTTTTTCCC            -0.98359    0.325597
36    2    TGTTGAATACTTGGCCCCATGAGCCATGCCTTTCTGTATAGTACAC             -1.61334    0.089292
37    2    GCTATACCTCATTCACAGCTCCTTGTGAGTGTGTGCACAGGAAATAAG           0.661879    0.50136
38    2    ACACTGTTGGACCTGACCCACACTGAATGTAGTCTTTCAGTACGAGA            1.423365    0.138012
39    1    TCCTGCAAGTAAGAATGTTTTCACACTGAGCTATTGATTTAACCAAGC           0.61193     0.55105
40    1    GGGAGGTCAGACACGCTTCATTATATCTCCGTCTCTTTTATGGTTT             0.118933    0.905287
41    1    TGGTTGTGCTTGCTTTCCTTTTTTAGAAAGTTCTAGAAAATAGGAAAACG         -0.29803    0.763403
42    1    GCTCCGGCAGCACCTTTATCTATGGTTATGTGGATGCAGCATATAAG            0.36714     0.713965
43    1    AACCTCCCAGAGTTAGCCAGCCTTTCAGAGTTGAAGTCACAGCT               3.427416    0.000767
44    1    ATGTGCACCTTTGAGGCTACGGGCTTCTCCAAAGACTTAGGAATCT             -2.69533    0.003868
45    1    ATGTGGCCATTACCGTCATTGGCCTGTGAAGCATTGGACATTTATA             1.572459    0.10227
46    1    GGCCTGTGAAAACAGAGGCTTTTGCATTGTCTCTTGACATCAGAAGT            -1.55078    0.126022
47    1    AGCCAAGGCAGGGTGGACAGTGTGAGAGAGCTAGTGTAAGCTGT               -4.58277    3.08E-05
48    1    ACATGGTTGTGCAGGGCCATGTGTGAAGACAGCATGAGTCTTA                -1.37266    0.163501
49    1    TGATGTTGGTTGTAATGGTTGGGTTTAGGATGAACCATTTTAAGGAT            -3.34973    0.000692
50    1    GTCCCAAAGGTGGAATACAACCAGAGGTCTCATCTCTGAACTTTCTT            -0.7171     0.473628
51    1    GGCGTCTACAGAGACCAGCCATATGGCAGATACTGATTGTACTGTCT            3.48851     0.000532
52    1    TGTTTGCCTCAAACGCTGTGTTTAAACAACGTTAAACTCTTAGCCT             0.57799     0.564212
53    1    TGCCAAAAATAAACTCACATGAGCACATGACAGTCTGAGCTCTATAATCA         0.417675    0.679323
54    1    GTGCATGGACGACTGAACACAATCAACTGTGAGGAAGGAGATAAACT            -0.49188    0.625569
55    1    CCTTGCCACGGTTCTAGAGCAGCGTAGACAGCTGGTAAACTGAAGA             -1.4853     0.140016
56    1    CATCGAGAGCGCACACAAGACGCCACTGTAAAAGGATCACAGAT               -2.23853    0.021028
57    1    GGAGTTCCAGGAGATTCAACCAGGATGTTTCTACACCTGTGGGTTA             -2.6129     0.009463
58    1    CAGCCACCATCAAAGCCCATTCGTAGGAAATTCAGACCAGAAAAC              -2.13238    0.039635
59    1    TTTGGAAGGCATTGAAGCTTGCACCTTTTCATGTACAGCATTAAAA             2.984702    0.00337
60    1    GACCAGGTCTATCAGCCCCTCCGAGATCGAGATGATGCTCAGTAC              0.012992    0.989634
61    1    ATCCAACACAGCCAGAACCCGCGATTCTACCACAAGTGACCATC               -2.02092    0.048641
62    1    TTGCCTGGAGAAAGAGAAGAAAATATTTTTTAAAAAGCTAGTTTATTTAGC        -0.31184    0.755184
63    1    TCACCCCTGACACAACATTTTCAGAATTCCAGACGATACTGTGATAA            0.561867    0.577848
64    1    ACGGAAACAGACCCCTGCTTTCGAATTTACATGTTCATGATGTGC              -3.07043    0.001314
65    1    CTTCGCCCCTCCCTTGTTTTATATTTTATGAAGTTAGTGCGGG                -0.71287    0.476918
66    1    ACCAACCAATACTCAGGAGAACCCTGCCTATGAGGAATATATAAGACCA          -3.58227    0.000386
67    1    TGTTTGGAAAATCACATCATGCCTAGAATCTGAAATTGAATTAGCAA            1.822415    0.059401
68    1    GCCAAGAGAATCAGAGAAAGATGCTGCATTTTATAATCAAAGCCCAAAC          3.532588    0.000225
69    1    CGTTACAGTATTCTGATTATATTACTGACACAGTCAAAATGATTAACTGTACAA     2.897694    0.007766
70    1    TTGTGCCTGTGTGTTACCATGCTAAGAATGTCTTTGTTTAAAGGGAA            -1.30273    0.21043
71    1    GCAACAGCAAGCTGTAGAGCGGGCCAATGATAAATCACATTGAATC             2.236428    0.023294
72    1    AAGCCAAAGGAACTGGAGGCACTGATTTAATGAATTTCCTGAAGA              0.742825    0.459843
73    1    TTTCCTCTTGATCGGGAACTCCTGCTTCTCCTTGCCTCGAAAT                -3.54509    0.000263
74    1    CCAGGTACAATGGCAGAGCCTTTCCATACCTGTACTCACAACTAGC             -0.50817    0.617396
75    1    TGGTCTTCTTGCATCGATGATCCAACAGCAACACCATTTTTAAATTA            2.61129     0.008828
76    1    TGTCCCTTTGATACTTGTGCTCTGCTGAGAATGTACAGTTTGCATTAA       4.051892    5.82E-05
77    1    GAGAGGCAGCATTGCACAGTGAAAGAATTCTGGATATCTCAGGAG          0.118343    0.905829
78    1    TTGGATGAGATTAGGAGATCAGAGGCTGGACCTTCTCTTGATAATGC        3.212168    0.003088
79    1    AATTGTTGACATTCATGTCTCTGAGTTACAAAAGTGCTAATTCACTACATGT   1.92036     0.050161
80    1    GGGGAAATTCAAGCAGTGTTTCCTCAACCAGTCACATAGAACTCTG         -0.78853    0.427972
81    1    CTGTCCAGCCGCATGGAGGGCATGATGGCTTCCTACAC                 2.265809    0.038306
82    1    TGTCAATCTGTCCTCGGCTGCCCTTCTCATTTGTTGATGGGAC            2.656332    0.009243
83    1    GGAGACTTTCACAAGTGGTTTCCATGGAGATAGAATGAAGCATTCTGT       0.674533    0.493893
84    1    AGTAGTTTCTCCAAGTACTTTTGTGCTATCAATGAGTTCTTCTCAAAAAAT    -2.07479    0.048611
85    1    TTTCTTTGCTAAGCCTTGCATGCAAAATTTGAAATTTTAACATTGGC        0.55078     0.582445
86    1    ACAAAACGAGTCCAGCGACGAGGAGAGCCTGAGAAAAGAGAGAG           -1.49962    0.131713
87    1    AAATGAGGGCCCGTAACAGAACCAGTGTGTGTATAACGAAAACCAT         -1.4828     0.140027
88    1    TCACCTCAGTCTCTAATTGGCTGTGAGTCAGTCTTTCATTTACATAGGGT     1.359493    0.181639
89    1    CGTCCAGCCAAGAGCTCTTCATCTGCTACAAGAACATTTGAATCTT         -0.00765    0.993894
90    1    GATTGCAATGATGATGTCCAAGGTAAGCTATTAAAAGGCAGGTTACT        2.290805    0.021577
91    1    CTTGCCAGCAGCAATCATTTGGGGAAGAATCTACAGTTGCTGAT           1.790334    0.066752
92    1    TTCCTTTGGGAGAAACCTGTTCATTCCAATCTTCTAATTACAGTGGTT       -2.87514    0.002884
93    1    CAGGACATCATGAGCAGGCAGCAGGGAGAGAGCAACCAAGAG             2.201609    0.048986
94    1    ACTCGGATTCTTTTGCATGATGGGGTAAAGCTTAGCAGAGAATCATG        -4.84228    2.84E-06
95    1    GACGTGAAGTCTCGGGCAAAGCGTTATGAGAAGCTGGACTTCCT           1.175155    0.244078
96    1    CCTCTGTGTTCACTTCGCCTTGCTCTTGAAAGTGCAGTATTTTTCT         1.150612    0.26183
97    1    TCAGGTGTCATCACTGTTCAAAAGGTAAGCACATTTAGAATTTTGTTCTT     0.963905    0.33534
98    1    CCCTTACCCCTCTCTGGGCCCATGAATTCCTGGCTTGGTTTA             -3.09019    0.003466
99    1    GGGAAAACATCCATGCTGGACTCCTGAAGAAGTTAAATGAACTGGA         0.235534    0.813451
00    1    CTCCACCAGAAGGGCACACTTTCATCTAATTTGGGGTATCACTGAG         -1.26117    0.216194
01    1    TTCTCTCAAAATACTAAACAGAGGTGGTTTTATTGATAAGATTTTGGCTGT    -0.63027    0.53117
02    1    GCATGCTGTTGTACATGATCCTGACAAGAAGAAAATGAAGCTCAAAGT       2.105255    0.032858
03    1    GTTCTCCCCTCTGGCCCCTGGAGAGAAGGGAGCATTCCTA               0.808842    0.416399
04    1    TCTTGGTGGGTCAAGACTTTCTGATAAATCAGTTAGCACCATGCAT         -0.87476    0.375354
05    1    CTGGAATAATGGAAAGAAATGGGGGCTTTGGAGAACTAGGATGTTTC        3.031192    0.002176
06    1    GCCCACATGGATAGCACAGTTGTCAGACAAGATTCCTTCAGATTC          -2.85804    0.004514
07    1    CGCCTTCCTCTTTTTAAGCTGTTTTATGAAAAAGACCTAGAAGTTCTTG      3.505339    0.000639
08    1    CTCCAAGCCGATCACCAAGAGTAAATCAGAAGCAAACCTCATC            -3.8295     0.000169
09    1    AAAGTTGTGTAAGCGCCTGCGTTCTTCTGGGTTTGGCTAGATAG           -0.09465    0.924545
10    1    ATGGACTGCTTTGCTGGATTGGCACTGAGCAACTTTAGGAAATGTC         -1.62044    0.109697
11    1    TGATGAAATAACTTGGGGCGTTGAAGAGCTGTTTAATTTTAAATGCC        1.824359    0.047857
12    1    GCTCGCCCCTGTTTTTTGTAGAATCTCTTCATGCTTGACATACCTAC        1.700431    0.04944
13    1    CATAGGTGCCATCGTGGTTGAGACAAGTGCAAAAAATGCTATTAAT         -0.74552    0.463916
14    1    TGTCTGTGTCAGACGTACAGCCAGACATGTTCTCTATTGGCATTTTT        -1.1303     0.263264
15    1    CAGGCCTGGTGCTCAGTCGTACGACCTGTACCTCTCAACTTTTG           0.790296    0.40455
16    1    AACTCCTGCGATCAGCTTGTGACTTACAAACCTTGTTTAAAAGCTG         2.767204    0.006542
17    1    TCAGTGAGAGACTCCAGGACTTTGACAAAAGCAAGCATGTCATCTATG       2.720559    0.00547
18    1    AGCCACTTGCCCCAGTTCATAACCCCATTAGTGTCTAAGAAGATTTC        -0.77976    0.423543
19    1    CACCAGGGACACATTTCTCTGTCTTTTTTGATCAGTGTCCTATACATC       0.388028    0.695317
20    1    GTCAGCTTGCCCAGGTTCAAACTGGAAGAGAGTTACACTCTCAACTC        -3.24347    0.001134
21    1    TGATACCCACCGGGTCTGACATTCCAAGTAACCAGTATGTAACTGG         2.310635    0.02143
22    1    TTGTGCAGATAGTATTTCTGATTGATGTCATCTATCAAGAATTTCAAGAGATT  -0.97212    0.33353
23    1    AAGACTGTCAGGAAGGGTCGGAGTCTGTAAAACCAGCATACAGTTT         2.012969    0.039001
24    1    AATGGGCATAAAGCTTCACACTAGTAACAAAAATGGCTTAACTTTATTACA    -0.43582    0.664998
25    1    TCACATCAGGGCAAATGAAATATCCATCAACTCCAGCATTTATCATT        2.686802    0.005053
26    1    TGCCTTTTTGCCTTTGGTAACATAACTCTGGGAGTCTTGGTTTAT          -2.86852    0.003159
27    1    CCACTGGTCATGCTGTGGAAAATTTAATGAGAAATCTGAATGCACAT        -2.15718    0.038994
28    1    CATTCCGCTCAAAGGTCACTGAGACTTTTGCCTCACCTAAAGAGA          1.771767    0.077694
29    1    TGAGGAAATCAAAGTGCTATTACGAAGTTCAAGATCAAAAAGGCTTATAA     1.823273    0.066945
30    1    GCTTTGGGGAGGACAAAACTTGTAAGTACAGTCAAGGACAAGACTTG        3.022171    0.002277
31    1    ACGTTCCAGGGCCCAAAGCCCAGCTCTTTGTTCAGTTGACTTA            3.641037    0.000299
32    1    TGGCCAAATTAGATGTGTGCTGAAGACAATCAGTCACTGGGTCTATA        0.779861    0.438386
33    1    TGGCTTGTCATTCTGTACACTGACCTTAGGCATGGAGAAAATTACTTG       1.77954     0.072713
34    1    TCATGAATTTTTTAATCCCATTGCAAACATTATTCCAAGAGTATCCCAG      0.918826    0.36453
35    1    CCCCGTCTCCCTCCCAACTTATACGACCTGATTTCCTTAGGA             -2.18861    0.026936
36    1    CCACACAGCCAAGCTGAGACTGTGGCAATGTGTTGAGTCATATACATT       1.12796     0.260712
37    1    ATTACCTCAGTCCCCGAGGACAGTTTTGAAGGACTTGTTCAGTTAC         1.485189    0.158865
测定方法
为在本发明的实施中测定基因(表达序列)的表达水平(升高或降低),可利用本领域已知的任何方法。在一些实施方式中,使用基于与本文鉴定和公开的基因(或探针序列)杂交的RNA的表达。这不难通过本领域已知或认为等同的任何RNA检测或扩增+检测方法进行,这些方法例如但不限于逆转录-PCR(RT-PCR),实时PCR,实时RT-PCR,美国专利申请10/062,857(2001年10月25日提交)以及美国临时专利申请60/298,847(2001年6月15日提交)和60/257,801(2000年12月22日提交)所述方法和检测是否存在RNA稳定序列或去稳定序列的方法。
或者,可使用基于DNA状态检测的表达。对于与特定前列腺癌或前列腺切除术后的后果相关的表达水平降低的基因,可将该鉴定基因的DNA确定为被甲基化或缺失。这不难通过本领域已知的基于PCR的方法进行,包括但不限于:Q-PCR。相反,对于与特定前列腺癌或前列腺切除术后的后果相关的表达水平升高的基因,可将该鉴定基因的DNA确定为被扩增。这不难通过本领域已知的基于PCR的荧光原位杂交(FISH)和染色体原位杂交(CISH)进行。
也可使用基于蛋白质水平或活性的存在,升高或降低的表达。可通过本领域已知和认定为适合检测蛋白质的任何基于免疫组化(IHC),基于血液(特别对于分泌蛋白质而言),基于抗体(包括该蛋白的自身抗体),基于脱落细胞(来自癌症),基于质谱和基于图像(包括使用标记配体)的方法进行检测。使用通过非侵入性方法(如灌洗或针吸)获得的细胞确定癌症后(其中癌细胞来源未知),还可利用基于抗体和图像的方法还定位肿瘤。可使用标记的抗体或配体定位患者体内的癌瘤。
使用基于核酸的试验确定表达的一种实施方式是将本文鉴定的基因的一个或多个序列以多核苷酸的形式固定在固体支持物,包括但不限于固体基材如阵列上,或利用本领域已知的珠基技术固定在珠上。在一些实施方式中,该试验是DASL(cDNA-介导的退火,选择,延伸和连接)试验,可获自伊鲁米那公司(Illumina)。或者,也可使用本领域已知的基于溶液的表达试验。
固定的多核苷酸探针可以是独特的,或者对所公开基因(或表达序列)特异的,以至于该多核苷酸能够杂交玉对应于基因(或表达序列)的DNA或RNA。这些多核苷酸可以是基因(或表达序列)全长,或者是被任选最小间断(如错配或插入非互补碱基对)的较短长度的探针(通过由该序列的5′或3′端缺失比本领域已知的全长序列短至多1个核苷酸),以便不影响它们与对应于该基因(或表达序列)的关联DNA或RNA杂交。在许多实施方式中,多核苷酸探针含有来自公开基因或表达序列的3′端的序列。相对于所公开基因序列,含有突变的多核苷酸探针也可使用,只要存在的突变仍能允许杂交产生可检测信号。
可利用固定的多核苷酸确定由样品对象(如获得该样品的患者)后果未知的样品前列腺细胞制备的核酸样品的状态,或确认已经指定给样品对象的后果。不限制本发明的情况下,这种细胞可来自前列腺癌患者,例如前列腺切除术取出的材料。固定的多核苷酸只需要足以在合适条件下与衍生自样品的相应核酸分子特异性杂交。虽然即使一种相关基因的表达也能够足够准确地区别两种前列腺癌后果,本发明包括使用来自一种以上基因或表达序列的表达水平。
因此,本发明包括使用两种或更多种,三种或更多种,四种或更多种,五种或更多种,六种或更多种,七种或更多种,八种或更多种,九种或更多种,十种或更多种,或者十一种或更多种本文所述基因或表达序列来区别后果。此外,可测定12种或更多种,14种或更多种,16种或更多种,18种或更多种,20种或更多种,22种或更多种,24种或更多种,26种或更多种,28种或更多种,30种或更多种,32种或更多种,34种或更多种,36种或更多种,38种或更多种,40种或更多种,45种或更多种,50种或更多种,55种或更多种,60种或更多种,62种或更多种,65种或更多种,70种或更多种,75种或更多种,80种或更多种,85种或更多种,90种或更多种,或者92种或更多种基因或表达序列的表达水平,并用于本发明方法。当然,其它实施方式包括使用表1和图14中各自所示的100种或更多种,150种或更多种,200种或更多种,250种或更多种,300种或更多种,至多337种,或者本文所述的全部362种基因(或表达序列)。
在一些实施方式中,使用62种的基因(表达序列)集合或92种的集合。在其它实施方式中,所用基因(或表达序列)来自表1和图14的337种的集合,或者是来自表1和图14的基因以及来自表3和图15的基因的组合。在许多情况下,所用基因(或表达序列)的组合或集合包括基因编号1(FEV)或与SEQ IDNO:1杂交的表达序列。在其它实施方式中,某组合包括以相关性p值<0.0001表达的一种或多种基因或表达序列。
或者,某组合包括以高频出现的本文所述的基因或表达序列。出现频率高于400,高于350,高于300,高于250,高于200,高于150或高于100的这类基因或表达序列的非限制性例子如本文所述。但是当然,也可使用频率较高的一种或多种基因(或序列)与频率较低的一种或多种基因(或序列)的组合。
在只要分析两种或少数基因的实施方式中,衍生自样品前列腺癌细胞的核酸优选使用合适的引物(例如PCR引物)扩增,以便只扩增待分析的基因,从而降低样品中其他表达基因或序列的污染背景信号。本发明的PCR扩增子可以是任何大小,包括至少或约50,至少或约100,至少或约150,至少或约200,至少或约250,至少或约300,至少或约350,或者至少或约400个连续核苷酸,均包含与所用PCR引物互补的部分。当然,任选地,PCR可以是逆转录偶联的PCR(或者在原料是RNA的情况下是RT-PCR)或定量PCR,如实时PCR,或其组合。当然,可通过本领域技术人员已知的手段制备和使用来自本文所述样品的RNA。
或者,要分析多种基因或者使用非常少的细胞(或一个细胞)时,可总体扩增样品的核酸,然后与阵列或微阵列上固定的多核苷酸探针杂交。当然,RNA或其对应的cDNA可以不经扩增以本领域已知方法直接标记和使用。
本发明提供一组更客观的标准,其形式是一个离散的基因集合的基因表达概况,以区别(或描绘)前列腺癌或前列腺切除术后的后果。在一些实施方式中,用该试验区别手术介入去除前列腺癌肿瘤后10年内或约10年的较好和较差后果。也可进行比较,以区分约10,约20,约30,约40,约50,约60,约70,约80,约90或约100个月后的后果。
虽然较好和较差的癌症复发,转移和/或存活后果可在彼此的比较中相对定义,但手术介入去除前列腺癌肿瘤约60个月后,优于50%癌症复发机率和/或50%存活机率的情况可视作“较好的”后果。“较好的”后果也可以是手术介入后约60个月,优于约60%,约70%,约80%或约90%癌症复发和/或存活机率的情况。“较差的”后果可以是手术介入去除前列腺癌肿瘤约60个月后,癌症复发机率为50%或更高和/或存活机率低于50%的情况。
本文公开的方法也可用于固体组织材料。例如,可收集和制备固体活检样品进行目测观察,然后测定本文鉴定的两种或多种基因或表达序列的表达,以确定前列腺癌或前列腺切除术后的后果。一种方式是使用检测所述基因的表达的多核苷酸或蛋白质鉴定探针进行原位杂交。
在一些实施方式中,为了方便和准确,检测样品的基因表达可使用能够测定一些或所有本文所述基因的基因表达的一个微阵列。
其它实施方式
本发明的其它应用包括提供将前列腺癌细胞样品鉴定为与特定前列腺癌存活或复发后果相关以供进一步探究或研究的能力。在需要根据客观的遗传或分子标准鉴定细胞的许多情况下,这种方式特别有利。
用于本发明方法的材料最好适于制备按照熟知步骤产生的试剂盒。因此,本发明提供一种试剂盒,其装有用于检测鉴定前列腺癌或前列腺切除术后的后果的所公开基因和序列的表达的试剂。这类试剂盒任选装有试剂和有关其在本发明方法中的应用的标识说明或标签或说明书。这类试剂盒可装有容器,各自装有用于本发明方法的一种或多种物质(一般是浓缩形式),包括例如预制微阵列,缓冲液,合适的核苷酸三磷酸(如dATP,dCTP,dGTP和dTTP;或者rATP,rCTP,rGTP和UTP),逆转录酶,DNA聚合酶,RNA聚合酶和本发明一种或多种引物的混合物(如连接于能与RNA聚合物反应的启动子的合适长度聚(T)或随机引物)。一般装有一套说明书。
本发明提供的方法也可全部或部分自动化。也可实施本发明的全部方面使它们基本由所公开基因的子集组成,从而排除了与通过含细胞样品鉴定前列腺癌复发,转移和/或存活后果无关的材料。
目前总地提供了本发明内容,通过参照以说明方式提供的以下实施例能更容易理解本发明,但这些实施例不应限制本发明内容,除非特别说明。
实施例
实施例I:临床样品收集和临床病理学参数。
利用来自1993-1995根治性前列腺切除术的具有PSA和其它患者后果数据的前列腺样品发现表达水平与临床前列腺癌或前列腺切除术后的后果相关的基因(表达序列)集合。利用其他样品检测或验证所鉴定的基因集合的预测或预后能力。
对应于样品的患者概况的特征见表2。
表2
Figure G200880011793XD00241
用患者样品进行此种鉴定的方法的示意图见图1。简要说,从210个患者样品的初始集合中选择191个患者样品。将这191个样品分成训练组(124个样品)和测试组(67个样品),前者用于通过随机森林(Random ForestsTM)算法鉴定基因集合。使用该算法获得的500个独立运行(基因集合)的代表性结果见图2,它是集合中基因(表达序列)的数量与未调整p值的对数的图(等同于对数秩检验)。图2显示包含不同数量的基因(表达序列)的这500个集合的性能和它们将样品(以及患者)准确鉴定为癌症复发和或转移风险高或低的能力,其显著性如观察到的为调整p值所示。这500个集合中的基因(表达序列)反映了上述表1和本文图14总结的337种独特(非重复)核酸分子。
检查通过该算法产生的7个34种基因的集合,发现它们反映了上表1中鉴定的62种非重复分子(参见其中“62种的组”一列),可通过基因编号(与SEQID NO相比)和在337条条目内容中的出现频率与图14交叉对应。本文讨论的这62种基因(表达序列)的表达水平作为基因集合的非限制性、代表性实例,包括图2所示和本文公开的其他集合。因此,在图1所示的测试组中,将这62种基因在前列腺癌细胞样品中的表达水平用作后果的风险指数(预测指标)。
实施例II:鉴定具有不同患者后果的亚型
对124个样品的训练组进行基因选择以鉴定预测后果的基因。参见图1和表2。然后,用鉴定的基因在通过分离癌细胞(参见图3A和3B)加工的67个样品的测试组中预测后果。将预测的后果与由获得该样品的患者记录的后果作比较。
作为代表性实例,将基因特异性寡核苷酸探针固定在(例如)微阵列上,然后在65℃,1x杂交缓冲液中进行的共杂交反应中与Cy5-标记的样品RNA和Cy3-标记的参比RNA杂交。用0.1xSSC/0.005%曲通X-102在37℃洗涤固定的标记。用图像分析软件进行图像分析。用强度依赖性非线性回归法将原始的Cy5/Cy3比例标准化。
从所有样品标准化的Cy5/Cy3比例是每种基因集中的中值(或平均值)。
用合适软件,例如Cox回归分析和随机森林(Random ForestsTM)对差异基因表达的显著性进行鉴定和置换检验。由诊断日期计算无疾病存活。将事件评为首次复发或远端转移。通过KM估计值计算存活曲线,并通过对数秩检验进行比较。
图4-6显示与用于评估前列腺癌样品和患者的已知因素相比,用公开的62种基因的集合作为组合的代表性风险指数(或风险评分)的性能。这些因素是格利森分级(或格利森评分),AJCC前列腺癌分期系统和术前(手术介入前)PSA(前列腺血清抗原)水平。这些比较证明,本发明的基因表达概况与这些其它因素相关联,因此可与这些其它因素中的任一种或多种联用,或者单用以概括这些因素各自提供的信息。
也发现这62种基因(表达序列)的表达水平能够将训练组的124个样品和测试组的67个样品分成“高”和“低”风险分类(见图7)。
实施例III:在不同前列腺癌分级内鉴定亚型
根据代表性的62种基因的集合的表达水平,联合图7与图4证明″高″和″低″亚类的风险评分(或风险指数)可用于以与格利森分级一致的方式分类样品(和患者),其中分级越高,风险评分超过零的可能性越大,因此出现较差后果的风险越高。零值代表集合中所有前列腺癌样品的评分的平均值和/或中值。“高风险”分类基于超过零的风险评分,“低风险”分类基于低于零的数值。结果是,可利用风险评分(或风险指数)将格利森分级≤6或7(或甚至≥8)的样品和患者分为本文所述的“高”和“低”风险类群。参见图8。
这表明,可在不用格利森分级的情况下,利用风险评分(或风险指数)对样品和患者进行分类。或者,这两种分析可一起使用,任选连续使用,例如测定格利森分级后,测定分级≤6或7(或甚至≥8)的样品(和患者)的风险评分。
联用尤其宜用于″划入″高风险对象以进行熟练临床医生已知的合适或进一步临床治疗,例如化疗或放疗或冷冻疗法,和″排除″低风险对象,以使他们不再接受不必要并且具有不良副作用的治疗。
实施例IV:在不同前列腺癌分期内鉴定亚型
根据代表性的62种基因的集合的表达水平,联合图7与图5证明″高″和″低″亚类的风险评分(或风险指数)可用于以与AJCC前列腺癌分期一致的方式分类样品(和患者),其中III期更可能与超过零的风险评分相关联,因此出现较差后果的风险较高。零值再次代表集合中所有前列腺癌样品的评分的平均值和/或中值。“高风险”分类仍然基于超过零的风险评分,“低风险”分类基于低于零的数值。结果是,可利用风险评分(或风险指数)将AJCC II期或III期分类的样品和患者分为本文所述的“高”和“低”风险类群。
这表明,在不用AJCC分期评估的情况下,可利用风险评分(或风险指数)对样品和患者进行分类。或者,这两种分析可一起使用,任选连续使用,例如测定AJCC分期后,测定具有II期或III期前列腺癌的样品(和患者)的风险评分。联用尤其宜用于″划入″高风险对象以进行熟练临床医生已知的合适临床治疗,和″排除″低风险对象,以使他们可合理地避免接受具有不良副作用的治疗。联用也可改变患者或对象的分类,如适合″密切观察等待″。
实施例V:与术前PSA分析联用
虽然格利森分级和AJCC分期分析都需要使用前列腺癌细胞样品,但根据代表性62种基因的集合的表达水平,图6中″高″和″低″亚类中的风险评分(或风险指数)之间的一致性说明术前PSA值应与本文所述的风险评分联合考虑。该联合可以是连续,例如测定术前PSA值后测定PSA值为30或更高,25或更高,20或更高,15或更高,10或更高,或者5或更高的样品(和患者)的风险评分。
实施例VI:通过Cox回归分析鉴定基因
利用Cox回归分析鉴定92种基因(或表达序列),其表达水平能够对含有前列腺癌细胞的样品进行分类,如上所述。这92种基因(或表达序列)中的六十七(67)种是图14和表1中337种基因(或表达序列)共有的(参见图14或表1的″Cox92″列),可与基因编号(与SEQ ID NO)和频率互相交叉对应。这92种中的其余二十五(25)种基因(或表达序列)列于图15和下表3,可与基因编号(与SEQ
ID NO相比)以及z和p值相互交叉对象。
表3
SEQ ID
NO:探针序列                                                Z            p
338    GATGCACCAGGCGAGGAAACGAGACCTCTTTCGTTCCTTCTAG          -4.999253    4.18E-06
339    ATGCCTGAGGCATGAGTGACTGTGCATTTGAGATAGTTTTCCCTAT       -4.834638    4.97E-06
340    TGAAAAAGAACAAGAGCTGGACACATTAAAAAGAAAGAGTCCATCAGATT   4.3810131    2.31E-05
341    CAGAAGGACCTGGGGGATGGCGTGTATGGCTTCGAGTATTACC          -4.181005    2.89E-05
342    AGGGCTGTCATCAACATGGATATGACATTTCACAACAGTGACTAG        -3.804427    5.90E-05
343    TGGCTTTGCACAGAACCAGCTAGTTATTTGGAAGTACCCAACC          4.2565288    5.95E-05
344    TGTGGGTTAGCATCAAGTTCTCCCCAGGGTAGAATTCAATCAGAGCT      -4.211286    8.06E-05
345    CAATGCAAAAAGTATTCGCTGCTGTTTACATTAGAAATCACTTCCAGC     -3.829636    8.59E-05
346    TGTACAGTGGAACCATGTGACCATGTCTTGTGCTTGCAATATAGAAA      3.7423758    0.0001308
347    GGCAAATCCTTCAAGCAGGGATAAAAGTCGATCTTCAAACATTAACTT     -3.604833    0.0001884
348    GGGTTTGGGGGAGATTTTACTCCTTTCTTCAACAACTATTCACTGGA       -3.554167    0.0003955
349    TTTTAGGCCTTTGGGGGAATTGATTTTTATCCACAGGTAGAAAATG        -3.576323    0.0004075
350    CTATGCAGGAAAATAGCACCCCCCGTGAGGACTAATCCAGATACATC       -3.553166    0.0004276
351    AGGTATGGCCTCACAAGTCTTGGTCTACCCACCATATGTTTATCAAA       -3.464213    0.0006149
352    AGGAGGTGTCAGACTGCTGAAGCCGACTCTGAAAGTGATCATGAAGT       3.5820846    0.0006381
353    GAGGGCATGTTGTCCATATCCCTGTGGAATACAGACCGTGTAACT         3.4420595    0.0006641
354    TCTAATGTGCACGGTGTGACTGGCAGAGTGAGTTTAAAAGCTTTACGA      -3.230789    0.0007048
355    TGTTGCCAAGCTAGTCTACAAAGCATCTGATTTTGGAAGTACATGGAAT     3.6130547    0.0007484
356    TTACACCTTTCCCCCCTGAAATGTATAGAATCCATTTGTCATCAGG        -3.434091    0.0007518
357    AATTGGTGAACAAAAAATGCCCAAGGCTTCTCATGTCTTTATTCTG        -3.341571    0.0007655
358    GGAGAATTCTTTAGGTTGTCCCCTAAAGATTCTGAAAAAGAGAATCAGA     3.3060176    0.0007756
359    GTAGCCTCACCATTAGTGGCAGCATCATGTAACTGAGTGGACTGTG        3.8470148    0.0007772
360    TTTGCTCACAAGCCATATTGGCCCGATTAGTGGTACTGTCTGACTC        3.2305915    0.000808
361    TGAGCTTACAACAGGTCTCGAGCTGGTGGACTCCTGTATTAGGTCACT      3.2987578    0.000825
362    GCATGCAGATGTCAAGGCAGTTAGGAAGTAAATGGTGTCTTGTAGA        3.2511294    0.0008645
本文引用的所有参考文献,包括专利,专利申请和出版物均通过引用全文纳入本文,不论之前是否特别引入。
现已完全描述了本发明,本领域技术人员应理解,无需过多试验即可在各种等同的参数,浓度和条件范围内实施本发明,而不背离本发明的构思和范围。
虽然参照具体实施方式描述了本发明,但应理解,它能够进一步修改。通常按照本发明的原理,本申请应涵盖本发明的所有变化,应用或改变形式,包括属于本发明所属领域的已知或常规实践以及适用于上文所述必要特征的与本发明相偏离之处。

Claims (20)

1.一种测定患有前列腺癌的对象的癌症复发和/或存活后果,或预后的方法,所述方法包括测定包含所述对象的前列腺癌细胞的样品的基因表达水平,其中该表达水平与前列腺切除术后约一年癌症复发和/或转移的低风险,癌症复发和/或转移的高风险,或PSA水平升高相关联。
2.一种测定对象的前列腺癌复发和/或转移的风险的方法,所述方法包括测定包含所述对象的前列腺癌细胞的样品中两种或多种选自图14和15中基因编号1-362的基因的表达水平,将各基因的表达水平或总表达水平与前列腺癌细胞中的平均表达值或中位表达值作比较,并确定所述对象中前列腺癌复发和/或转移的风险,其中表达水平与癌症复发和/或转移的低风险或者癌症复发和/或转移的高风险相关联。
3.如权利要求2所述的方法,其特征在于,所述方法还包括为具有确定的癌症复发和/或存活后果的对象选择治疗。
4.如权利要求1或2或3所述的方法,其特征在于,所述测定包括由所述样品制备RNA。
5.如权利要求4所述的方法,其特征在于,所述RNA用于PCR。
6.如权利要求4所述的方法,其特征在于,所述测定包括使用阵列。
7.如权利要求1或2或3所述的方法,其特征在于,所述样品由前列腺切除术期间切除的组织上剥离。
8.如权利要求5所述的方法,其特征在于,所述PCR是RT-PCR,任选是实时RT-PCR。
9.如权利要求1或2或3或4或5或6或7或8所述的方法,其特征在于,所述表达水平的相关性的p值<0.0001。
10.如权利要求1或2或3或4或5或6或7或8所述的方法,其特征在于,所述样品包含分离的前列腺癌细胞。
11.一种在前列腺切除术后确定前列腺癌患者的治疗方案的方法,所述方法包括通过测定所述患者的前列腺癌细胞的样品的基因表达水平来确定所述患者的癌症复发和/或存活后果,其中所述表达水平与前列腺切除术后约1年癌症复发或转移的低风险,癌症复发或转移的高风险,或PSA水平升高相关联;和为具有这种癌症复发和/或存活后果的患者选择治疗方案。
12.如权利要求3或11所述的方法,其特征在于,所述治疗方案包括化疗。
13.如权利要求3或11所述的方法,其特征在于,所述治疗方案包括放疗。
14.如权利要求1或2所述的方法,其特征在于,该方法还包括i)测定所述样品的前列腺癌分级,
ii)测定所述样品的前列腺癌分期,或iii)二者;其中i),ii)或i)和ii)任选在确定所述对象的前列腺癌复发和/或转移风险之前进行。
15.如权利要求14所述的方法,其特征在于,测定前列腺癌分级包括确定格利森评分。
16.如权利要求14所述的方法,其特征在于,测定前列腺癌分期包括确定AJCC分期。
17.如权利要求14所述的方法,其特征在于,所述方法包括通过格利森评分确定前列腺癌分级和按照AJCC分期确定前列腺癌分期,从而进行多变量分析以确定所述对象中前列腺癌复发和/或转移的风险。
18.如权利要求2所述的方法,其特征在于,所述方法还包括测定所述对象中前列腺血清抗原(PSA)水平,任选在用于提供包含前列腺癌细胞的所述样品的前列腺切除术之前进行。
19.如权利要求2所述的方法,其特征在于,测定4种或更多种,如6种或更多种,8种或更多种,10种或更多种,12种或更多种,14种或更多种,16种或更多种,18种或更多种,20种或更多种,22种或更多种,24种或更多种,26种或更多种,28种或更多种,30种或更多种,32种或更多种,34种或更多种,36种或更多种,38种或更多种,40种或更多种,45种或更多种,50种或更多种,55种或更多种,60种或更多种,65种或更多种,70种或更多种,或者92种或更多种基因的表达水平。
20.如权利要求2所述的方法,其特征在于,所述测定包括测定基因编号1的表达水平,任选使用SEQ ID NO:1作为探针。
CN200880011793A 2007-02-23 2008-02-25 前列腺癌存活和复发 Pending CN101720358A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US89147707P 2007-02-23 2007-02-23
US60/891,477 2007-02-23
PCT/US2008/054820 WO2008103971A2 (en) 2007-02-23 2008-02-25 Prostate cancer survival and recurrence

Publications (1)

Publication Number Publication Date
CN101720358A true CN101720358A (zh) 2010-06-02

Family

ID=39710787

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880011793A Pending CN101720358A (zh) 2007-02-23 2008-02-25 前列腺癌存活和复发

Country Status (6)

Country Link
EP (2) EP2754720A1 (zh)
JP (1) JP2010518868A (zh)
CN (1) CN101720358A (zh)
CA (2) CA2684897A1 (zh)
ES (1) ES2527062T3 (zh)
WO (1) WO2008103971A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968558A (zh) * 2012-11-14 2013-03-13 叶定伟 一种预测初诊前列腺癌骨转移风险的装置

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0701662D0 (en) 2006-12-14 2007-03-07 Blatchford & Sons Ltd A lower limb prosthesis
US8628585B2 (en) 2007-12-14 2014-01-14 Blatchford Products Limited Lower limb prosthesis
EP2350278A2 (en) 2008-09-23 2011-08-03 Silence Therapeutics AG Means for inhibiting the expression of orc-1
EP3524697A1 (en) * 2009-01-07 2019-08-14 Myriad Genetics, Inc. Cancer biomarkers
US20120041274A1 (en) 2010-01-07 2012-02-16 Myriad Genetics, Incorporated Cancer biomarkers
US20120053253A1 (en) 2010-07-07 2012-03-01 Myriad Genetics, Incorporated Gene signatures for cancer prognosis
WO2012030840A2 (en) 2010-08-30 2012-03-08 Myriad Genetics, Inc. Gene signatures for cancer diagnosis and prognosis
CA2891653A1 (en) 2012-11-16 2014-05-22 Myriad Genetics, Inc. Gene signatures for cancer prognosis
CA2947624A1 (en) 2014-05-13 2015-11-19 Myriad Genetics, Inc. Gene signatures for cancer prognosis
GB201616912D0 (en) 2016-10-05 2016-11-16 University Of East Anglia Classification of cancer

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6285701B1 (en) 1998-08-06 2001-09-04 Lambda Physik Ag Laser resonator for improving narrow band emission of an excimer laser
AU2001273337B2 (en) * 2000-07-10 2006-06-29 Board Of Regents, The University Of Texas System Chromosome 3p21.3 genes are tumor suppressors
US7229774B2 (en) * 2001-08-02 2007-06-12 Regents Of The University Of Michigan Expression profile of prostate cancer
US6949342B2 (en) * 2001-12-21 2005-09-27 Whitehead Institute For Biomedical Research Prostate cancer diagnosis and outcome prediction by expression analysis
US7204987B2 (en) * 2003-06-11 2007-04-17 Ultra Biotech Limited Biological compositions and methods for treatment of prostate cancer
CA2648021A1 (en) * 2006-03-31 2007-10-11 Ordway Research Institute, Inc. Prognostic and diagnostic method for cancer therapy

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968558A (zh) * 2012-11-14 2013-03-13 叶定伟 一种预测初诊前列腺癌骨转移风险的装置
CN102968558B (zh) * 2012-11-14 2015-11-18 叶定伟 一种预测初诊前列腺癌骨转移风险的装置

Also Published As

Publication number Publication date
WO2008103971A2 (en) 2008-08-28
JP2010518868A (ja) 2010-06-03
WO2008103971A9 (en) 2013-06-06
CA2684897A1 (en) 2008-08-28
EP2121988A2 (en) 2009-11-25
EP2754720A1 (en) 2014-07-16
ES2527062T3 (es) 2015-01-20
EP2121988B1 (en) 2014-12-17
EP2121988A4 (en) 2010-06-09
WO2008103971A3 (en) 2009-12-10
CA2939539A1 (en) 2008-08-28

Similar Documents

Publication Publication Date Title
CN101720358A (zh) 前列腺癌存活和复发
US11549148B2 (en) Neuroendocrine tumors
US10619211B2 (en) Methods using DNA methylation for identifying a cell or a mixture of cells for prognosis and diagnosis of diseases, and for cell remediation therapies
US20180011106A1 (en) Methods for identifying, diagnosing, and predicting survival of lymphomas
JP5060945B2 (ja) 癌診断のためのオリゴヌクレオチド
US20060292572A1 (en) Cell-type-specific patterns of gene expression
US20170073758A1 (en) Methods and materials for identifying the origin of a carcinoma of unknown primary origin
CN102696034B (zh) 基于基因拷贝数改变的模式的非小细胞肺癌的基因组分类
JP2009131278A (ja) 遺伝子発現署名を使用する、癌による死亡および前立腺癌生存率を予測するための方法および組成物
WO2007035676A2 (en) Methods and materials for identifying the origin of a carcinoma of unknown primary origin
CN104364654A (zh) 预测和检测癌症风险的方法
WO2006127537A2 (en) Thyroid fine needle aspiration molecular assay
CN102089444A (zh) 利用核酸分析方法来诊断黑素瘤和太阳能雀斑
EP2524051A2 (en) Diagnostic gene expression platform
CN105722998A (zh) 预测乳腺癌复发
CN103403187A (zh) 结肠直肠癌复发的预后特征
Zeng et al. A narrative review of five multigenetic assays in breast cancer
US20180051342A1 (en) Prostate cancer survival and recurrence
EP2126128A2 (en) Gene expression profiling for identification, monitoring, and treatment of lupus erythematosus
KR20160086145A (ko) 유방암의 예후 예측용 유전자 선별방법
ZA200503797B (en) Product and method
US20150329911A1 (en) Nucleic acid biomarkers for prostate cancer
WO2013002750A2 (en) Determining tumor origin
CN110117656A (zh) 一种与胃腺癌发生发展相关的生物标志物
CN112877435B (zh) 口腔鳞癌生物标志物及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20100602