CN104508486B - 用于确定乳癌相关疾病状态的方法和用于该方法中的阵列 - Google Patents

用于确定乳癌相关疾病状态的方法和用于该方法中的阵列 Download PDF

Info

Publication number
CN104508486B
CN104508486B CN201380029458.3A CN201380029458A CN104508486B CN 104508486 B CN104508486 B CN 104508486B CN 201380029458 A CN201380029458 A CN 201380029458A CN 104508486 B CN104508486 B CN 104508486B
Authority
CN
China
Prior art keywords
breast cancer
cancer cell
histological grades
sample
purposes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201380029458.3A
Other languages
English (en)
Other versions
CN104508486A (zh
Inventor
C.A.K.博雷贝克
C.L.B.温格伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Immunovia AB
Original Assignee
Immunovia AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Immunovia AB filed Critical Immunovia AB
Priority to CN201710403116.3A priority Critical patent/CN107782901A/zh
Publication of CN104508486A publication Critical patent/CN104508486A/zh
Application granted granted Critical
Publication of CN104508486B publication Critical patent/CN104508486B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57415Specifically defined cancers of breast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2446/00Magnetic particle immunoreagent carriers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2570/00Omics, e.g. proteomics, glycomics or lipidomics; Methods of analysis focusing on the entire complement of classes of biological molecules or subsets thereof, i.e. focusing on proteomes, glycomes or lipidomes

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

本发明提供了一种用于确定乳癌相关疾病状态的方法,其包括步骤:a)提供待测试的样品;和b)通过测量测试样品中一种或多种选自表1中限定的生物标记物的存在和/或含量来确定测试样品的生物标记物特征;其中测试样品中一种或多种选自表1中限定的生物标记物的存在和/或含量表示乳癌相关的疾病状态。本发明进一步提供了用于所述方法中的阵列和试剂盒。

Description

用于确定乳癌相关疾病状态的方法和用于该方法中的阵列
发明领域
本发明提供了用于确定乳癌相关疾病状态的方法,以及用于这些方法中的阵列和试剂盒。
发明背景
乳癌(breast cancer)是最常诊断出来的癌症并且是女性中癌症死亡的主要诱因,占据了总癌症病例的23%和癌症相关死亡的14%(Jemal等,2011)。传统的临床病理学参数,如组织学等级、肿瘤大小、年龄、淋巴结牵涉和激素受体状况,用来决定治疗和估计预后(Ciocca和Elledge,2000;Elston和Ellis,1991;Hondermarck等,2008;Hudis,2007;Slamon等,2001)。组织学等级,其为最常用的预后因素之一,是组合评分,基于肿瘤细胞的形态学和细胞学特征的显微评价,反映出肿瘤的侵略性。然后将这种组合评分用于将乳癌分级成:级别1-缓慢生长和充分分化,级别2-适度分化,和级别3-高度增殖和差的分化(Elston和Ellis,1991)。然而,用于患者预后的组织学等级的临床值有争论,主要反映出目前与肿瘤分级相关的挑战(Frierson等,1995;Robbins等,1995)。此外,30-60%的肿瘤归类为组织学等级2,其已经变成代表非常不均匀的患者群并且证明了对于作出临床决定提供的信息较少(Sotiriou等,2006)。显然,传统临床实验室参数对于适当的预后和风险组辨别以及对于预测给予的治疗是否将成功仍然是不够的。因此,一些患者将被过度治疗、治疗不足或甚至用将不会给予任何益处的疗法进行治疗。因此,为了进一步推进预后,并且因此推进治疗结果,需要更深一步的乳癌生物学和肿瘤进展的分子理解与改进的个性化预后和治疗决定的方式的结合。
发明内容
迄今为止,一组基因组成果已经产生了用于将乳癌类型分成亚组(Ivshina等,2006;Perou等,2000;Sorlie等,2001)以及用于乳癌预后和风险分级(Paik等,2004;van'tVeer等,2002;van de Vijver等,2002)的分子特征(signature)。另一方面,已经预期蛋白质组学发现促进了关键的发现转变成临床实践(Hanash,2003)。关于这点,典型的基于质谱(MS)的蛋白质组学已经产生了有价值的乳癌蛋白质组库,主要靶向细胞系和少数的组织样品(Bouchal等,2009;Geiger等,2010;Geiger等,2012;Gong等,2008;Kang等,2010;Strande等,2009;Sutton等,2010),并且最近,亲和性蛋白质组学成果提出了用于乳癌诊断和用于预测复发风险的第一个多重血清谱(Carlsson等,2008;Carlsson等,2011)。尽管最近技术有进展,但是使用典型的蛋白组学技术(Aebersold和Mann,2003)或亲和力蛋白质组学(Borrebaeck和Wingren,2011),以灵敏且可再现方式产生详细的大群粗蛋白组(例如,组织提取物)的蛋白质表达谱仍然是一种挑战。
为了解决这些问题,发明人最近研发了整体蛋白质组检测(global proteomesurvey)(GPS)技术平台(Wingren等,2009),其结合亲和力蛋白质组学和MS的最佳特征。GPS适用于以灵敏和定量方式发现尝试、再现地解密粗蛋白质组(Olsson等,2012;Olsson等,2011)。
在这个研究中,发明人使用GPS深入地描绘了组织分级的乳癌组织的分子组织谱,反映出肿瘤进展。为此,分析了52个乳癌组织蛋白质组,以我们的知识来看,其代表了最大的无标记的基于LC-MS/MS的乳癌组织研究之一。使用正交方法成功证实了蛋白质表达谱。在长期运行中,这些组织生物标记物谱将为提高的分类和预后做好准备。
因此,本发明的第一个方面提供了一种用于确定乳癌相关疾病状态的方法,其包括步骤:
a)提供待测试的样品;和
b)通过测量测试样品中一种或多种选自表1中限定的生物标记物的存在和/或含量来确定测试样品的生物标记物特征;
其中测试样品中一种或多种选自表1中限定的生物标记物的存在和/或含量表示乳癌相关的疾病状态。因此,实际上,步骤(b)包括另外的步骤((b)(i)):使用或基于测试样品中一种或多种选自表1中限定的生物标记物的存在和/或含量确定乳癌相关疾病状态的步骤。
“乳癌相关疾病状态”表示乳癌细胞的组织学等级和/或包括乳癌细胞的个体的无转移生存时间。
乳癌相关疾病状态可以是(乳癌细胞的)组织学等级和/或(个体的)无转移生存时间。
“生物标记物”表示天然产生的生物分子,或其组分或片段,其测量可以提供用于乳癌预后的信息。例如,生物标记物可以是天然产生的蛋白质或碳水化合物部分,或其抗原组分或片段。
优选,从哺乳动物提供待测试样品。哺乳动物可以是任何家畜或农场动物。优选,哺乳动物是大鼠、小鼠、豚鼠、猫、狗、马或灵长类。最优选,哺乳动物是人。优选,样品是包括乳癌细胞或由乳癌细胞组成的细胞或组织样品(或其衍生物),或同样优选,是源自包括乳癌细胞或由乳癌细胞组成的细胞或组织样品的蛋白质或核酸。优选,测试和对照样品源自相同物种。
在乳癌相关疾病状态是或包括乳癌细胞的组织学分级的情况中,该方法可以进一步包括步骤:
c)提供一种或多种包括组织学等级1乳癌细胞、组织学等级2乳癌细胞和/或组织学等级3乳癌细胞或由组织学等级1乳癌细胞、组织学等级2乳癌细胞和/或组织学等级3乳癌细胞组成的对照样品;和
d)通过测量对照样品中步骤(b)中测量的一种或多种生物标记物的存在和/或含量来确定对照样品的生物标记物特征;
其中在步骤(b)中测量的测试样品中一种或多种生物标记物的存在和/或含量符合以下的情况下鉴定了乳癌细胞的存在:
i)对应于包括第一个组织学等级的乳癌细胞或由第一个组织学等级的乳癌细胞组成的对照样品中的存在和/或含量(在存在的情况下);
ii)不同于包括第二个组织学等级的乳癌细胞或由第二个组织学等级的乳癌细胞组成的对照样品中的存在和/或含量(在存在的情况下);
iii)不同于包括第三个组织学等级的乳癌细胞或由第三个组织学等级的乳癌细胞组成的对照样品中的存在和/或含量(在存在的情况下)。
因此,如果第一个组织学等级是Elston等级1,则第二个和第三个组织学等级(在存在的情况下)将是Elston等级2和Elston等级3(或反之亦然)。在第一个组织学等级是Elston等级2的情况中,第二个和第三个组织学等级(在存在的情况下)将是Elston等级1和Elston等级3(或反之亦然)。在第一个组织学等级是Elston等级3的情况中,第二个和第三个组织学等级(在存在的情况下)将是Elston等级1和Elston等级2(反之亦然)。
“对应于包括第一个组织学等级的乳癌细胞或由第一个组织学等级的乳癌细胞组成的对照样品中的存在和/或含量”表示存在和或含量等于包括第一个组织学等级的乳癌细胞或由第一个组织学等级的乳癌细胞组成的对照样品的存在和或含量;或与包括第二个组织学等级的乳癌细胞或由第二个组织学等级的乳癌细胞组成的对照样品和/或包括第三个组织学等级的乳癌细胞或由第三个组织学等级的乳癌细胞组成的对照样品相比,更接近于包括第一个组织学等级的乳癌细胞或由第一个组织学等级的乳癌细胞组成的对照样品的存在和或含量(或更接近于代表其的预定参照值)。优选,存在和/或含量为包括第一个组织学等级的乳癌细胞或由第一个组织学等级的乳癌细胞组成的对照样品的存在和或含量的至少60%,例如,至少65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
“不同于包括第三个组织学等级的乳癌细胞或由第三个组织学等级的乳癌细胞组成的对照样品中的存在和/或含量”表示存在和或含量不同于包括第一个组织学等级的乳癌细胞或由第一个组织学等级的乳癌细胞组成的对照样品的存在和或含量;或不同于包括第二个组织学等级的乳癌细胞或由第二个组织学等级的乳癌细胞组成的对照样品的存在和或含量和/或包括第三个组织学等级的乳癌细胞或由第三个组织学等级的乳癌细胞组成的对照样品的存在和或含量(或不同于代表其的预定参照值)。优选,存在和/或含量不超过包括第二个组织学等级的乳癌细胞或由第二个组织学等级的乳癌细胞组成的对照样品和/或包括第三个组织学等级的乳癌细胞或由第三个组织学等级的乳癌细胞组成的对照样品的存在和或含量的40%,例如,不超过39%、38%、37%、36%、35%、34%、33%、32%、31%、30%、29%、28%、27%、26%、25%、24%、23%、22%、21%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%。
优选,组织学等级对照样品包括单个组织学等级的乳癌细胞或由单个组织学等级的乳癌细胞组成。优选,步骤(c)包括以下或由以下组成:
i)提供一种或多种包括组织学等级1乳癌细胞或由组织学等级1乳癌细胞组成的对照样品;提供一种或多种包括组织学等级2乳癌细胞或由组织学等级2乳癌细胞组成的对照样品;和提供一种或多种包括组织学等级3乳癌细胞或由组织学等级3乳癌细胞组成的对照样品;
ii)提供一种或多种包括组织学等级1乳癌细胞或由组织学等级1乳癌细胞组成的对照样品;和提供一种或多种包括组织学等级2乳癌细胞或由组织学等级2乳癌细胞组成的对照样品;
iii)提供一种或多种包括组织学等级1乳癌细胞或由组织学等级1乳癌细胞组成的对照样品;和提供一种或多种包括组织学等级3乳癌细胞或由组织学等级3乳癌细胞组成的对照样品;
iv)提供一种或多种包括组织学等级2乳癌细胞或由组织学等级2乳癌细胞组成的对照样品;和提供一种或多种包括组织学等级3乳癌细胞或由组织学等级3乳癌细胞组成的对照样品;
v)提供一种或多种包括组织学等级1乳癌细胞或由组织学等级1乳癌细胞组成的对照样品;
vi)提供一种或多种包括组织学等级2乳癌细胞或由组织学等级2乳癌细胞组成的对照样品;或
vii)提供一种或多种包括组织学等级3乳癌细胞或由组织学等级3乳癌细胞组成的对照样品。
在乳癌相关疾病状态是或包括个体的无转移生存时间的情况中,该方法可以进一步包括步骤:
c)提供一种或多种包括来自具有低于10年无转移生存的个体的乳癌细胞或由来自具有低于10年无转移生存个体的乳癌细胞组成的第一个对照样品;和/或一种或多种包括来自具有10年或更长时间的无转移生存个体的乳癌细胞或由来自具有10年或更长时间的无转移生存个体的乳癌细胞组成的第二个对照样品;和
d)通过测量对照样品中步骤(b)中测量的一种或多种生物标记物的存在和/或含量来确定对照样品的生物标记物特征;
其中个体的无转移生存时间在步骤(b)中测量的一种或多种生物标记物的存在和/或含量对应于第一个对照样品的存在和/或含量(在存在的情况下)和/或不同于第二个对照样品的存在和/或含量(在存在的情况下)的情况下鉴定为少于10年;
和其中个体的无转移生存时间在步骤(b)中测量的一种或多种生物标记物的存在和/或含量不同于第一个对照样品的存在和/或含量(在存在的情况下)和/或对应于第二个对照样品的存在和/或含量(在存在的情况下)的情况下鉴定为超过10年。
“对应于一种或多种第一个对照样品的存在和/或含量”表示存在和或含量与一种或多种第一个对照样品的存在和或含量相同;或与一种或多种第二个对照样品相比,更接近于第一个对照样品的存在和或含量(或代表其的预定参照值)。优选,存在和/或含量为第一个对照样品的存在和或含量的至少60%,例如,至少65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
“不同于一种或多种第二个对照样品的存在和/或含量”表示存在和或含量不同于第二个对照样品的存在和或含量(或代表其的约定参照值)。优选,存在和/或含量不超过第二个对照样品的存在和或含量的40%,例如,不超过39%、38%、37%、36%、35%、34%、33%、32%、31%、30%、29%、28%、27%、26%、25%、24%、23%、22%、21%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%。
优选,一种或多种第一个和/或第二个无转移生存时间对照样品与待测试样品具有相同的组织学等级。
优选,一种或多种对照样品是与待测试个体的年龄-和/或性别-相匹配的。换句话说,健康个体与待测试个体大致是相同年龄的(例如,5年内)和相同性别的。
优选,将步骤(b)中测量的测试样品中的一种或多种生物标志物的存在和/或含量相对于预定的参照值进行比较。
因此,优选步骤(b)中测量的测试样品中的一种或多种生物标记物的存在和/或含量显著不同于(即,统计学上不同于)步骤(d)中测量的一种或多种生物标记物的存在和/或含量或预定的参照值。例如,如所附实施例中讨论的,测试和对照样品中特定生物标记物的存在和/或含量之间的显著差异可以归类为其中p<0.05的那些(例如,其中p<0.04,p<0.03,p<0.02或其中p<0.01)。
因此,本发明的第一个方面的方法可以包括确定乳癌细胞的组织学等级和个体的无转移生存时间(同时或连续地)或由确定乳癌细胞的组织学等级和个体的无转移生存时间(同时或连续地)组成。
优选,步骤(b)包括测量测试样品中一种或多种选自表1中限定的生物标记物的存在和/或含量或由测量测试样品中一种或多种选自表1中限定的生物标记物的存在和/或含量组成,所述一种或多种选自表1中限定的生物标记物例如,至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78或至少79种选自表1中限定的生物标记物。
因此,本发明的第一个方面可以包括用于确定乳癌细胞组织学等级的方法或由用于确定乳癌细胞组织学等级的方法组成(即,对乳癌样品分级,以确定组织学等级),所述方法包括步骤:
a)提供待测试样品;
b)通过测量测试样品中一种或多种选自表1中限定的生物标记物的存在和/或含量来确定测试样品的生物标记物特征;
其中测试样品中一种或多种选自表1中限定的生物标记物的存在和/或含量表示乳癌细胞的组织学等级。
“确定乳癌细胞的组织学等级”表示将样品的乳癌细胞归类为组织学等级1(即,Elston等级1)、组织学等级2(即,Elston等级2)或组织学等级3(即,Elston等级3),如Elston,C.W.,和Ellis,I.O.(1991).Pathological prognostic factors in breastcancer.I.The value of histological grade in breast cancer:experience from alarge study with long-term follow-up.Histopathology 19,403-410中限定的,将其通过引用并入本申请中。
在方法包括确定乳癌细胞组织学等级或由确定乳癌细胞组织学等级组成的情况中,步骤(b)可以包括测量测试样品中一种或多种选自表1A中限定的生物标记物的存在和/或含量或由测量测试样品中一种或多种选自表1A中限定的生物标记物的存在和/或含量组成,所述一种或多种选自表1A中限定的生物标记物例如,至少2种选自表1A中限定的生物标记物。优选,步骤(b)包括测量测试样品中一种或多种选自表1B中限定的生物标记物的存在和/或含量或由测量测试样品中一种或多种选自表1B中限定的生物标记物的存在和/或含量组成,所述一种或多种选自表1B中限定的生物标记物例如,至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或至少30种选自表1B中限定的生物标记物。优选,步骤(b)包括测量测试样品中一种或多种选自表1C中限定的生物标记物的存在和/或含量或由测量测试样品中一种或多种选自表1C中限定的生物标记物的存在和/或含量组成,所述一种或多种选自表1C中限定的生物标记物例如,至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或至少28种选自表1C中限定的生物标记物。不太优选,步骤(b)包括测量测试样品中一种或多种选自表1D中限定的生物标记物的存在和/或含量或由测量测试样品中一种或多种选自表1D中限定的生物标记物的存在和/或含量组成,所述一种或多种选自表1D中限定的生物标记物例如,至少2、3、4、5、6、7、8、9或至少10种选自表1D中限定的生物标记物。还是不太优选,步骤(b)包括测量测试样品中一种或多种选自表1E中限定的生物标记物的存在和/或含量或由测量测试样品中一种或多种选自表1E中限定的生物标记物的存在和/或含量组成,所述一种或多种选自表1E中限定的生物标记物例如,至少2、3、4、5、6、7、8或至少9种选自表1E中限定的生物标记物。因此,步骤(b)可以包括测量测试样品中表1中限定的全部生物标记物的存在和/或含量或由测量测试样品中表1中限定的全部生物标记物的存在和/或含量组成。
因此,本发明的第一个方面可以包括用于确定个体无转移生存时间的方法或由用于确定个体无转移生存时间的方法组成,所述方法包括步骤:
a)提供待测试样品;
b)通过测量测试样品中一种或多种选自表1中限定的生物标记物的存在和/或含量来确定测试样品的生物标记物特征;
其中测试样品中一种或多种选自表1中限定的生物标记物的存在和/或含量表示个体的无转移生存时间。
“确定个体的无转移生存时间”表示预后从其获得测试样品的个体从初次诊断开始具有少于10年或超过10年的无转移生存时间(无远端转移的生存/DMFS)。
在方法包括确定个体无转移生存或由确定个体无转移生存组成的情况中,步骤(b)可以包括测量测试样品中一种或多种选自表1A中限定的生物标记物的存在和/或含量或由测量测试样品中一种或多种选自表1A中限定的生物标记物的存在和/或含量组成,所述一种或多种选自表1A中限定的生物标记物例如,至少2种选自表1A中限定的生物标记物。优选,步骤(b)包括测量测试样品中一种或多种选自表1B中限定的生物标记物的存在和/或含量或由测量测试样品中一种或多种选自表1B中限定的生物标记物的存在和/或含量组成,所述一种或多种选自表1B中限定的生物标记物例如,至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或至少30种选自表1B中限定的生物标记物。优选,步骤(b)包括测量测试样品中一种或多种选自表1D中限定的生物标记物的存在和/或含量或由测量测试样品中一种或多种选自表1D中限定的生物标记物的存在和/或含量组成,所述一种或多种选自表1D中限定的生物标记物例如,至少2、3、4、5、6、7、8、9或至少10种选自表1D中限定的生物标记物。优选,步骤(b)包括测量测试样品中表1A、表1B和表1D中限定的全部生物标记物的存在和/或含量。
在方法包括确定个体无转移生存或由确定个体无转移生存组成的情况中,尽管不太优选,但是步骤(b)可以包括测量测试样品中一种或多种选自表1C中限定的生物标记物的存在和/或含量或由测量测试样品中一种或多种选自表1C中限定的生物标记物的存在和/或含量组成,所述一种或多种选自表1C中限定的生物标记物例如,至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或至少28种选自表1C中限定的生物标记物。还不太优选,步骤(b)包括测量测试样品中一种或多种选自表1E中限定的生物标记物的存在和/或含量或由测量测试样品中一种或多种选自表1E中限定的生物标记物的存在和/或含量组成,所述一种或多种选自表1E中限定的生物标记物例如,至少2、3、4、5、6、7、8或至少9种选自表1E中限定的生物标记物。还不太优选,步骤(b)可以包括测量测试样品中表1C和表1E中限定的全部生物标记物的存在和/或含量。
因此,尽管不太优选,本发明第一个方面的方法可以包括确定个体无转移生存时间或由确定个体无转移生存时间组成,其中步骤(b)包括测量测试样品中标1中限定的全部生物标记物的存在和/或含量或由测量测试样品中标1中限定的全部生物标记物的存在和/或含量组成。
因此,根据本发明的第一个方面的方法可以包括测量SPON1表达。该方法可以包括测量KERA表达。该方法可以包括测量APCS表达。该方法可以包括测量ATP6V1G1表达。该方法可以包括测量RPS27L表达。该方法可以包括测量DPYSL3表达。该方法可以包括测量ERP44表达。该方法可以包括测量RAPGEF1表达。该方法可以包括测量ACLY表达。该方法可以包括测量CMA1表达。该方法可以包括测量MCM3表达。该方法可以包括测量ANGPTL2表达。该方法可以包括测量AEBP1表达。该方法可以包括测量UBE2V2表达。该方法可以包括测量MIS18BP1表达。该方法可以包括测量CLCF1表达。该方法可以包括测量ABAT表达。该方法可以包括测量SLC25A5表达。该方法可以包括测量STIP1表达。该方法可以包括测量OLFL3表达。该方法可以包括测量CD3G表达。该方法可以包括测量MCM7表达。该方法可以包括测量SLC25A11表达。该方法可以包括测量NOP56表达。该方法可以包括测量RRP8表达。该方法可以包括测量SLTM表达。该方法可以包括测量TSN表达。该方法可以包括测量ECH1表达。该方法可以包括测量PRELP表达。该方法可以包括测量SARS表达。该方法可以包括测量RPS25表达。该方法可以包括测量ESYT1表达。该方法可以包括测量PODN表达。该方法可以包括测量RPRD1B表达。该方法可以包括测量RPLP0P6表达。该方法可以包括测量CD300LG表达。该方法可以包括测量SUGT1表达。该方法可以包括测量POTEF表达。该方法可以包括测量KARS表达。该方法可以包括测量NDUFS2表达。该方法可以包括测量HNRNPH2表达。该方法可以包括测量CALU表达。该方法可以包括测量EIF3B表达。该方法可以包括测量SLC4A1AP表达。该方法可以包括测量RPS5表达。该方法可以包括测量PLXDC2表达。该方法可以包括测量KIAA1324表达。该方法可以包括测量MRC1表达。该方法可以包括测量RPRD1A表达。该方法可以包括测量SHMT2表达。该方法可以包括测量CCT4表达。该方法可以包括测量TSSC1表达。该方法可以包括测量IKZF3表达。该方法可以包括测量UBE2Q1表达。该方法可以包括测量PSMD9表达。该方法可以包括测量SNRNP70表达。该方法可以包括测量RALB表达。该方法可以包括测量ACO2表达。该方法可以包括测量MYO18A表达。该方法可以包括测量QARS表达。该方法可以包括测量PABPC4表达。该方法可以包括测量SCGB1D2表达。该方法可以包括测量PFKP表达。该方法可以包括测量SLC3A2表达。该方法可以包括测量ASPN表达。该方法可以包括测量CD38表达。该方法可以包括测量MXRA5表达。该方法可以包括测量CDK1表达。该方法可以包括测量STC2表达。该方法可以包括测量CTSC表达。该方法可以包括测量NOP58表达。该方法可以包括测量PGK1表达。该方法可以包括测量FKBP3表达。该方法可以包括测量GSTM3表达。该方法可以包括测量CALML5表达。该方法可以包括测量PML表达。该方法可以包括测量ADAMTS4表达。该方法可以包括测量THBS1表达。该方法可以包括测量FN1表达。
在一个优选的实施方案中,步骤(b)包括测量测试样品中一种或多种选自MCM7、NOP56、MCM3、RABPC4、MXRA5、STC2、SCGB1D2和ANGPTL2的生物标记物的存在和/或含量或由测量测试样品中一种或多种选自MCM7、NOP56、MCM3、RABPC4、MXRA5、STC2、SCGB1D2和ANGPTL2的生物标记物的存在和/或含量组成。例如,步骤(b)可以包括测量测试样品中的这些生物标记物中的2、3、4、5、6、7或8种的存在和/或含量或由测量测试样品中的这些生物标记物中的2、3、4、5、6、7或8种的存在和/或含量组成。优选,在这个实施方案中,乳癌相关疾病状态是组织学等级;然而,不太优选,乳癌相关疾病状态是或还包括无转移生存时间。
在另一个优选实施方案中,步骤(b)包括测量测试样品中一种或多种选自OLFML3、SPON1、PODN和ASPN的生物标记物的存在和/或含量或由测量测试样品中一种或多种选自OLFML3、SPON1、PODN和ASPN的生物标记物的存在和/或含量组成。例如、步骤(b)可以包括测量测试样品中的这些生物标记物中的2、3或4种的存在和/或含量或由测量测试样品中的这些生物标记物中的2、3或4种的存在和/或含量组成。优选,在这个实施方案中,乳癌相关疾病状态是组织学等级;然而,不太优选,乳癌相关疾病状态是或还包括无转移生存时间。
“表达”表示基因产物如mRNA或蛋白质的水平或含量。
检测和/或测量蛋白质和/或核酸的浓度的方法是本领域技术人员公知的,参见,例如Sambrook and Russell,2001,Cold Spring Harbor Laboratory Press。
用于检测和/或测量蛋白质的优选方法包括Western印迹、North-Western印迹、免疫吸附测定(ELISA)、抗体微阵列、组织微阵列(TMA)、免疫沉淀、原位杂交和其他免疫组织化学技术、放射性免疫测定(RIA)、免疫放射性测定(IRMA)和免疫酶测定(IEMA),包括使用单克隆和/或多克隆抗体的夹层测定(sandwich assay)。示例性夹层测定描述于David等的美国专利4,376,110和4,486,530中,通过引用并入本申请。载玻片上的细胞的抗体染色可以用于细胞学实验室诊断测试中公知的以及本领域技术人员已知的方法中。
通常,ELISA涉及使用产生有色反应产物的酶,其通常在固相试验中。如辣根过氧化物酶和磷酸酶这样的酶已经被广泛使用。放大磷酸酶反应的一种方式是使用NADP作为底物,来产生NAD,其现在作为用于第二个酶系统的辅酶。因为组织中不存在酶,因此来自大肠杆菌的焦磷酸酶提供了良好的缀合物,其是稳定的并且产生了良好的反应颜色。还可以使用基于酶(如,萤光素酶)的化学发光系统。
常常使用与维生素生物素的缀合,因为这可以通过其与酶联抗生物素蛋白(avidin)或抗生物素蛋白链菌素(streptavidin)的反应容易地检测出来,其以很高的特异性和亲和力与酶联抗生物素蛋白或抗生物素蛋白链菌素结合。
用于核酸(例如,mRNA)的检测和/或测量的优选方法包括southern印迹、northern印迹、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量实时PCR(qRT-PCR)、纳米阵列、微阵列、大阵列(macroarray)、放射自显影术和原位杂交。
在本发明的第一个方面的一个实施方案中,步骤(b)包括测量编码一种或多种生物标记物的核酸分子的表达。核酸分子可以是cDNA分子或mRNA分子。优选,核酸分子是mRNA分子。还优选,核酸分子是cDNA分子。
因此,可以使用选自Southern印迹、Northern印迹、聚合酶链式反应(PCR)、逆转录PCR(RT-PCR)、定量实时PCR(qRT-PCR)、纳米阵列、微阵列、大阵列、放射自显影术和原位杂交的方法来进行步骤(b)中一种或多种生物标记物的表达的测量。优选,使用DNA微阵列来确定步骤(b)中测量一种或多种生物标记物的表达。因此,该方法可以包括使用一种或多种结合部分(moiety)来测量步骤(b)中一种或多种生物标记物的表达或由使用一种或多种结合部分来测量步骤(b)中一种或多种生物标记物的表达组成,每个所述结合部分能够选择性地结合编码表1中鉴定的生物标记物之一的核酸分子。
优选,一种或多种结合部分各自包含核酸分子或由核酸分子组成,所述核酸分子如DNA、RNA、PNA、LNA、GNA、TNA或PMO(优选DNA)。优选,一种或多种结合部分为5至100个核苷酸长。更优选,一种或多种核酸分子为15至35个核苷酸长。结合部分可以包括可检测部分。
如以下讨论的,基于其结合给定的核酸、蛋白质或氨基酸基序的能力,从文库选择或筛选合适的结合剂(也称为结合分子)。
在本发明的第一个方面的另一个实施方案中,步骤(b)包括测量一种或多种生物标记物的蛋白质或多肽或其片段或衍生物的表达。优选,使用一种或多种结合部分进行步骤(b)中测量一种或多种生物标记物的表达,每个所述结合部分能够选择性地结合表1中鉴定的生物标记物之一。
一种或多种结合部分可以包括抗体或其抗原结合片段或由抗体或其抗原结合片段组成。
术语“抗体”包括任何合成的抗体、重组抗体或抗体杂合物,如但不限于,由免疫球蛋白轻链和/或重链可变区和/或恒定区的噬菌体展示产生的单链抗体分子,或在本领域技术人员已知的免疫测定形式中能够结合抗原的其他免疫相互作用分子。本发明还包括使用抗体样结合剂,如亲和体(affibody)和适体。
涉及保留了其特异性结合位点的抗体片段的合成的技术的综述可以在Winter&Milstein(1991)Nature 349,293-299中找到。
另外地,或替换地,第一个结合分子中的一个或多个可以是适体(参见Collett等,2005,Methods 37:4-15)。
分子文库,如抗体文库(Clackson等,1991,Nature 352,624-628;Marks等,1991,JMol Biol 222(3):581-97)、肽文库(Smith,1985,Science 228(4705):1315-7)、表达的cDNA文库(Santi等,(2000)J Mol Biol 296(2):497-508)、抗体框架以外的其他支架(如亲和体)上的文库(Gunneriusson等,1999,Appl Environ Microbiol 65(9):4134-40)或基于适体的文库(Kenan等,1999,Methods Mol Biol 118,217-31),可以用作从其选择用于本发明方法中的给定基序特异性的结合分子的来源。
分子文库可以在原核细胞(Clackson等,1991,op.cit.;Marks等,1991,op.cit.)或真核细胞(Kieke等,1999,Proc Natl Acad Sci USA,96(10):5651-6)中体内表达或可以在体外表达,而没有细胞的涉及(Hanes&Pluckthun,1997,Proc Natl Acad Sci USA 94(10):4937-42;He&Taussig,1997,Nucleic Acids Res 25(24):5132-4;Nemoto等,1997,FEBS Lett,414(2):405-8)。
在使用基于蛋白质的文库时的情况中,常常将编码潜在结合分子的文库的基因包装在病毒中,并且在病毒表面展示潜在的结合分子(Clackson等,1991,supra;Marks等,1991,supra;Smith,1985,supra)。
可能最常使用的展示系统是其表面展示抗体片段的丝状噬菌体,所述抗体片段表达为与噬菌体的次要外壳蛋白的融合(Clackson等,1991,supra;Marks等,1991,supra)。然而,用于展示的其他合适系统包括使用其他病毒(EP 39678)、细菌(Gunneriusson等,1999,supra;Daugherty等,1998,Protein Eng 11(9):825-32;Daugherty等,1999,Protein Eng12(7):613-21)和酵母(Shusta等,1999,J Mol Biol 292(5):949-56)。
此外,已经利用所谓核糖体展示系统中的多肽产物与其编码mRNA的连接(Hanes&Pluckthun,1997,supra;He&Taussig,1997,supra;Nemoto等,1997,supra),或替换地,多肽产物与编码DNA的连接(参见美国专利5,856,090和WO 98/37186),研发了展示系统。
抗体的可变重链(VH)和可变轻链(VL)结构域涉及抗原识别,这是早先首先在蛋白酶消化实验中认识到的事实。通过啮齿动物抗体的“人源化”发现了更多证实。啮齿动物来源的可变结构域可以与人来源的恒定结构域融合,使得所得到的抗体保留啮齿动物亲本抗体的抗原特异性(Morrison等,(1984)Proc.Natl.Acad.Sci.USA 81,6851-6855)。
从涉及所有含有一个或多个可变结构域的抗体片段的细菌表达的实验已知,通过可变结构域给予抗原特异性并且与恒定结构域无关。这些分子包括Fab-样分子(Better等,(1988)Science 240,1041);Fv分子(Skerra等,(1988)Science 240,1038);单链Fv(ScFv)分子,其中VH和VL亲本结构域经由弹性寡核苷酸连接(Bird等(1988)Science 242,423;Huston等(1988)Proc.Natl.Acad.Sci.USA 85,5879)和包含分离的V结构域的单结构域抗体(dAb)(Ward等(1989)Nature 341,544)。涉及保留其特异性结合位点的抗体片段的合成的技术的综述可以在Winter&Milstein(1991)Nature 349,293-299中找到。
抗体或抗原结合片段可以选自完整抗体、Fv片段(例如,单链Fv和二硫化物键合的Fv)、Fab-样片段(例如,Fab片段,Fab’片段和F(ab)2片段)、单个可变结构域(例如,VH和VL结构域)和结构域抗体(dAb,包括单一和双重形式[即,dAb-连接物-dAb])。优选,抗体或抗原结合片段是单链Fv(scFv)。
一个或多个结合部分可以替换地包含抗体样结合剂或由抗体样结合剂组成,所述抗体样结合剂例如,亲和体或适体。
“scFv分子”表示其中VH和VL配偶体结构域通过弹性寡肽来连接。
使用抗体片段,相比于完整抗体的优点是几倍的。片段的较小尺寸可以导致提高的药物学特性,如更好地渗透实体组织。除去了完整抗体的效应子功能,如补体结合。Fab、Fv、ScFv和dAb抗体片段全部可以在大肠杆菌中表达并分泌出来,因此允许容易地生产大量的所述片段。
完整抗体和F(ab’)2片段是“二价的”。“二价的”表示所述抗体和F(ab’)2片段具有两个抗原结合位点。相反,Fab、Fv、ScFv和dAb片段是单价的,只具有一个抗原结合位点。
抗体可以是单克隆或多克隆的。合适的单克隆抗体可以通过已知技术来制备,例如,“Monoclonal Antibodies:Amanual of techniques”,H Zola(CRC Press,1988)和“Monoclonal Hybridoma Antibodies:Techniques and applications”,J G R Hurrell(CRC Press,1982)中公开的那些,通过引用将这两篇并入本申请。
当潜在结合分子选自文库时,通常使用具有限定基序的一个或多个选择剂肽。在用于选择剂肽的基序的设计中,可以使用提供结构从而降低肽中灵活性的氨基酸残基或允许与结合分子相互作用的带电的、极性或疏水性侧链。例如:
(i)脯氨酸可以稳定肽结构,因为其侧链对α碳以及氮都能结合;
(ii)苯丙氨酸、酪氨酸和色氨酸具有芳香族侧链并且是高度疏水性的,而亮氨酸和异亮氨酸具有脂肪族侧链并且也是疏水性的;
(iii)赖氨酸、精氨酸和组氨酸具有碱性侧链,并且在中性pH下带正电,而天冬氨酸盐和谷氨酸盐具有酸性侧链并且在中性pH下是带负电的;
(iv)天冬氨酸和谷氨酸在中性pH下是中性的,但含有参与氢键的酰胺基团;
(v)丝氨酸、苏氨酸和酪氨酸侧链含有羟基基团,其可以参与氢键。
通常,结合分子的选择可以涉及阵列技术和系统的使用,以分析与对应于结合分子类型的点的结合。
因此,优选抗体或其片段是单克隆抗体或其片段。优选,抗体或抗原结合片段选自完整抗体、Fv片段(例如,单链Fv和二硫化物键合的Fv)、Fab-样片段(例如,Fab片段、Fab’片段和F(ab)2片段)、单个可变结构域(例如,VH和VL结构域)和结构域抗体(dAb,包括单一和双重形式[即,dAb-连接物-dAb])。因此,抗体或抗原结合片段可以是单链Fv(scFv)。或者,一个或多个结合部分包括抗体样结合剂或由抗体样结合剂组成,所述抗体样结合剂例如,亲和体或适体。一个或多个结合部分包括可检测部分。
“可检测部分”包括允许直接或间接测定其存在和/或相对含量和/或位置(例如,在阵列上的位置)的部分。
合适的可检测部分是本领域公知的。
例如,可检测部分可以是荧光和/或发光和/或化学发光部分,其暴露于特定条件时,可以检测到。这样的荧光部分可能需要暴露于特定波长和强度的照射(即,光),以引起荧光部分的激发,由此使其发射出可以检测到的特定波长的可检测荧光。
或者,可检测部分可以是酶,其能够将(优选不可检测的)底物转化成可观察和/或检测到的可检测产物。合适的酶的实例在以下涉及例如ELISA测定中更详细地讨论。
因此,可检测部分可以选自:荧光部分;发光部分;化学发光部分;放射性部分(例如,放射性原子);或酶部分。优选,可检测部分包括放射性原子或由放射性原子组成。放射性原子可以选自锝-99m、碘-123、碘-125、碘-131、铟-111、氟-19、碳-13、氮-15、氧-17、磷-32、硫-35、氘、氚、铼-186、铼-188和钇-90。
明显地,待检测物质(如,例如,本申请中所述的测试样品和/或对照样品中的一种或多种生物标记物和/或用于检测所选蛋白的抗体分子)必须具有足够的合适的原子同位素,使得能容易地检测到可检测部分。
在可替换的优选实施方案中,结合部分的可检测部分是荧光部分。
可以以已知的方式将放射性或其他标记结合至本发明方法的样品中存在的生物标记物中和/或本发明的结合部分中。例如,如果结合剂是多肽,其可以是生物合成的或可以使用适当的氨基酸前体通过化学氨基酸合成来合成,其中涉及例如用氟-19替代氢。例如,可以经由结合部分中半胱氨酸残基连接标记物,如99mTc、123I、186Rh、188Rh和111In。可以经由赖氨酸残基连接钇-90。IODOGEN方法(Fraker等(1978)Biochem.Biophys.Res.Comm.80,49-57)可以用于结合123I。参考文献(“Monoclonal Antibodies in Immunoscintigraphy”,J-F Chatal,CRC Press,1989)详细描述了其他方法。用于将其他可检测部分(如酶、荧光、发光、化学发光或放射性部分)缀合至蛋白质的方法是本领域公知的。
本领域技术人员将认识到可以用间接帮助确定所述蛋白质的存在、含量和/或位置的部分来标记待测试样品中的生物标记物。因此,该部分可以构成多组分可检测部分中的一种组分。例如,可以用生物素标记待测试样品中的生物标记物,这允许随后使用与可检测标记融合或以其它方式结合的抗生物素蛋白链菌素来检测。
可检测部分可以选自荧光部分、发光部分、化学发光部分、放射性部分和酶部分。
因此,可检测部分可以包括放射性原子或由放射性原子组成。放射性原子可以选自锝-99m、碘-123、碘-125、碘-131、铟-111、氟-19、碳-13、氮-15、氧-17、磷-32、硫-35、氘、氚、铼-186、铼-188和钇-90。
或者,结合部分的可检测部分可以是荧光部分。
在根据本发明的第一个方面的方法中,分别在步骤(b)和/或步骤(d)之前,处理步骤(a)和/或步骤(c)中提供的样品,使得用生物素标记样品中存在的任何生物标记物。可以使用包括抗生物素蛋白链菌素和可检测部分(如荧光部分)的检测剂来进行步骤(b)和/或步骤(d)。
因此,可以首先使用第一种结合剂来分离和/或固定待测试样品中的目标蛋白质,此后,可以使用第二种结合剂来测定所述生物标记物的存在和/或相对含量。
在一个实施方案中,第二种结合剂是抗体或其抗原结合片段;通常是重组抗体或其片段。方便地,抗体或其片段选自:scFv;Fab;免疫球蛋白分子的结合结构域。以上详细描述了合适的抗体和片段,及其制备方法。
或者,第二种结合剂可以是抗体样结合剂,如亲和体或适体。
或者,在待测试样品中的蛋白质上的可检测部分包括特异性结合对的成员(例如,生物素)或由特异性结合对的成员(例如,生物素)组成的情况中,第二种结合剂可以包括特异性结合对的互补成员(例如,抗生物素蛋白链菌素)或由特异性结合对的互补成员(例如,抗生物素蛋白链菌素)组成。
在使用检测测定的情况中,优选可检测部分选自:荧光部分;发光部分;化学发光部分;放射性部分;酶部分。以上描述了用于本发明方法中的合适的可检测部分的实例。
用于检测血清或血浆蛋白的优选测定包括酶联免疫吸附测定(ELISA)、放射性免疫测定(RIA)、免疫放射性测定测定(IRMA)和免疫酶测定(IEMA),包括使用单克隆和/或多克隆抗体的夹层测定。示例性夹层测定描述于David等的美国专利4,376,110和4,486,530中,通过引用并入本申请。载玻片上的细胞的抗体染色可以用于细胞学实验室诊断测试中公知的以及本领域技术人员已知的方法中。
因此,在一个实施方案中,测定是ELISA(酶联免疫吸附测定),其通常涉及使用产生有色反应产物的酶,其通常在固相测定中。如辣根过氧化物酶和磷酸酶这样的酶已经被广泛使用。放大磷酸酶反应的一种方式是使用NADP作为底物,来产生NAD,其现在作为用于第二个酶系统的辅酶。因为组织中不存在酶,因此来自大肠杆菌的焦磷酸酶提供了良好的缀合物,其是稳定的并且产生了良好的反应颜色。还可以使用基于酶(如,荧光素酶)的化学发光系统。
常常使用与维生素生物素的缀合,因为这可以通过其与酶联抗生物素蛋白或抗生物素蛋白链菌素的反应容易地检测出来,其以很高的特异性和亲和力与酶联抗生物素蛋白或抗生物素蛋白链菌素结合。
在可替换的实施方案中,用于蛋白质检测的测定方便地是荧光测定测定。因此,第二种结合剂的可检测部分可以是荧光部分,如Alexa荧光团(例如,Alexa-647)。
优选,如通过ROC AUC值测定的方法的预测准确性为至少0.50,例如,至少0.55、0.60、0.65、0.70、0.75、0.80、0.85、0.90、0.95、0.96、0.97、0.98或至少0.99。更优选,如通过ROC AUC值测定的方法的预测准确性为至少0.80(最优选1)。
在本发明的第一个方面的方法中,可以使用如基于珠子的阵列或基于表面的阵列这样的阵列来进行。优选,阵列选自:大阵列;微阵列;纳米阵列。
可以使用支持向量仪(SVM),如可从http://cran.r-project.org/web/packages/e1071/index.html(例如,e1071 1.5-24)获得的那些,来进行用于测定乳癌相关疾病状态的方法。然而,也可以使用任何其他合适的方式。SVM也可以用于测定包括如本申请中限定的一种或多种表1生物标记物或由本申请中限定的一种或多种表1生物标记物组成的生物标记物特征的ROC AUC。
支持向量仪(SVM)是用于分类和回归的一组相关管理学习方法。给定一组训练实例,每个标记为属于两类中的一类,SVM训练算法构建预测新的实例是否落入一类或另一类的模型。直观地,SVM模型是作为空间中的点的实例表示,作图以使得分开类别的实例通过明显的尽可能宽的间隙分开。然后将新的实例作图至相同的空间中,并且基于它们落入间隙的哪一侧来预测属于哪一类。
更正式地,支持向量仪在高或无穷的三维空间中构建了超平面或超平面组,其可以用于分类、回归或其他任务。直观地,通过对任何类别的最接近训练数据点具有最大距离的超平面来实现良好的分离(称为功能边缘),因为通常边缘越大,分类器的泛化误差越低。关于SVM的更多信息,参见,例如,Burges,1998,Data Mining and Knowledge Discovery,2:121-167。
在本发明的一个实施方案中,在使用已知物质(即,已知组织学等级的乳癌细胞或来自具有已知无远端转移生存的乳癌患者的乳癌细胞)的生物标记物谱进行本发明的方法之前,对SVM“进行训练”。通过运行这样的训练样品,SVM能够知道与特定特征相关的生物标记物谱。一旦完成训练过程,然后SVM能够确定测试的生物标记物样品是否来自特定的乳癌样品类型(即,特定的乳癌相关疾病状态)。
然而,可以通过用必需的训练参数对SVM进行预先编程来绕过这种训练程序。例如,使用其中详述的值和/或调整模式,基于表1中所列生物标记物的测量,使用表4中详述的SVM算法,根据已知的SVM参数,来鉴定属于特定乳癌相关疾病状态的细胞。
本领域技术人员将认识到可以通过用合适的数据选择训练SVM仪器,针对表1中所列的生物标记物的任意组合,来确定合适的SVM参数(即,来自已知生物学等级的细胞和/或来自具有已知无转移生存时间的个体的细胞的生物标记物测量)。
或者,根据本领域已知的任何其他合适的统计学方法,如主成分分析(PCA)和其他多变量统计学分析(例如,向后逐步逻辑回归模型),表1数据可以用于确定特定的乳癌相关疾病状态。对于多变量统计学分析的综述,参见,例如,Schervish,Mark J.(1987年11月),"A Review of Multivariate Analysis".Statistical Science 2(4):396-413,将其通过引用并入本申请中。
优选,本发明的方法具有至少65%的准确性,例如,66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的准确性。
优选,本发明的方法具有至少65%的灵敏度,例如,66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的灵敏度。
优选,本发明的方法具有至少65%的特异性,例如,66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的特异性。
“准确性”表示方法的正确结果的比例,“灵敏度”表示正确归类为阳性的所有阳性化学物质的比例,和“特异性”表示正确归类为阴性的所有阴性化学物质的比例。
本发明的第一个方面的方法可以进一步包括步骤:
e)基于之前步骤中确定的乳癌相关疾病状态,给测试的个体提供治疗。
因此,该方法包括根据其乳癌的组织学等级和/或根据其预测的无转移生存时间来治疗患者。例如,对于较高等级的乳癌和/或其中预测无转移生存时间相对低(例如,少于10年)/相对高(例如,超过10年),提供侵略性更高的治疗。可以根据当时的普遍指导,例如,参见,NICE Clinical Guideline 80“Early and locally advanced breast cancer:Diagnosis and treatment”(可从http://www.nice.org.uk/nicemedia/pdf/CG80NICEGuideline.pdf获得),由本领域技术人员确定合适的治疗方法,将其通过引用并入本申请中。
因此,本发明包括用于治疗乳癌的抗肿瘤剂,其中基于本发明第一个方面的方法的结果来确定剂量方案。
本发明包括抗肿瘤剂在治疗乳癌中的用途,其中基于本发明第一个方面的方法的结果来确定剂量方案。
本发明包括抗肿瘤剂在制备用于治疗乳癌的药物中的用途,其中基于本发明第一个方面的方法的结果来确定剂量方案。
本发明包括治疗乳癌的方法,包括提供足量的抗肿瘤剂,其中基于本发明的第一个方面的方法的结果来确定足以治疗乳癌的抗肿瘤剂的含量。
在一个实施方案中,抗肿瘤剂是烷化剂(ATC编码L01a)、抗代谢物(ATC编码L01b)、植物生物碱或其他天然产物(ATC编码L01c)、细胞毒性抗生素或相关物质(ATC编码L01d)或其他抗肿瘤剂(ATC编码L01x)。
因此,在一个实施方案中,抗肿瘤剂是选自以下的烷化剂:氮芥类似物(例如,环磷酰胺、苯丁酸氮芥、美法仑、氮芥、异环磷酰胺、氯乙环磷酰胺、泼尼氮芥或苯达莫司汀)、烷基磺酸盐(例如,白消安、苏消安或甘露舒凡)、乙撑亚胺(例如,噻替派、三亚胺醌或卡波醌)、亚硝基脲(例如,卡莫司汀、洛莫司汀、司莫司汀、链脲霉素、福莫司汀、尼莫司汀或雷莫司汀)、环氧化物(例如,依托格鲁)或另一种烷化剂(ATC编码L01ax,例如,二溴甘露醇、哌泊溴烷、替莫唑胺或达卡巴嗪)。
在另一个实施方案中,抗肿瘤剂是选自以下的抗代谢物:叶酸类似物(例如,甲氨蝶呤、雷替曲塞、培美曲塞或普拉曲塞)、嘌呤类似物(例如,巯嘌呤、硫鸟嘌呤、克拉屈滨、氟达拉滨、克罗拉滨或奈拉滨)或嘧啶类似物(例如,阿糖胞苷、氟尿嘧啶、替加氟、卡莫氟、吉西他滨、卡培他滨、阿扎胞苷或地西他滨)。
在再进一步的实施方案中,抗肿瘤剂是选自以下的植物碱或其它天然产物:长春花属生物碱或长春花属生物碱类似物(例如,长春花碱、长春新碱、长春地辛、长春瑞滨或长春氟宁)、鬼臼毒素衍生物(例如,依托泊苷或替尼泊苷)、秋水仙碱衍生物(例如,秋水仙胺)、紫杉烷(例如,紫杉醇、多西他赛或聚谷氨酸紫杉醇),或另一种植物碱或天然产物(ATC编码L01cx,例如,曲贝替丁)。
在一个实施方案中,抗肿瘤剂是选自以下的细胞毒性抗生素或相关物质:放线菌素(例如,放线菌素D)、蒽环或相关物质(例如,阿霉素、柔红霉素、表柔比星、阿柔比星、佐柔比星、伊达比星、米托蒽醌、吡柔比星、戊柔比星、氨柔比星或匹杉琼(pixantrone))或另一种(ATC编号L01dc,例如,博来霉素、普卡霉素、丝裂霉素或伊沙匹隆)。
在进一步的实施方案中,抗肿瘤剂是选自以下的其他抗肿瘤剂:铂化合物(例如,顺铂、卡铂、奥沙利铂、沙铂或polyplatillen)、甲肼(例如,丙卡巴肼)、单克隆抗体(例如,依决洛单抗、利妥昔单抗、曲妥珠单抗、阿伦单抗、吉姆单抗、西妥昔单抗、贝伐单抗、帕尼单抗、卡妥索单抗或奥法木单抗)、用于光动力学疗法/放疗中的增敏剂(例如,卟吩姆钠、氨基乙酰丙酸甲酯、氨基乙酰丙酸、替莫泊芬或乙丙昔罗(efaproxiral))或蛋白激酶抑制剂(例如,伊马替尼、吉非替尼、厄洛替尼、舒尼替尼、索拉替尼、达沙替尼、拉帕替尼、尼洛替尼、替西罗莫司、依维莫司、帕唑帕尼、凡德他尼、阿法替尼、马赛替尼或toceranib)。
在再进一步的实施方案中,抗肿瘤剂是选自以下的其他肿瘤剂:安吖啶、天冬酰胺酶、六甲蜜胺、羟基脲、氯尼达明、喷司他丁、米替福新、马索罗酚、雌氮芥、维A酸、米托胍腙、托泊替康、噻唑呋林、伊立替康、阿利维A酸、米托坦、培加帕酶、贝沙罗汀、三氧化二砷、地尼白介素(denileukin diftitox)、硼替佐米、塞来昔布、阿那格雷、奥利默森(oblimersen)、腺病毒载体定位码基因注射剂(sitimagene ceradenovec)、伏立诺他、罗米地辛、高三尖杉酯碱注射液(omacetaxine mepesuccinate)或艾日布林。
因此,本发明的第二个方面提供了用于根据本发明第一个方面的方法中的阵列,该阵列包括如上关于本发明第一个方面限定的一种或多种的第一种结合剂。
阵列结合剂可以包括共同地能够结合一种或多种选自表1A中限定的生物标记物的结合剂或由共同地能够结合一种或多种选自表1A中限定的生物标记物的结合剂组成,所述一种或多种选自表1A中限定的生物标记物例如,至少2种选自表1A中限定的生物标记物。优选,阵列结合剂可以包括共同地能够结合一种或多种选自表1B中限定的生物标记物的结合剂或由共同地能够结合一种或多种选自表1B中限定的生物标记物的结合剂组成,所述一种或多种选自表1B中限定的生物标记物例如,至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或至少30种选自表1B中限定的生物标记物。优选,阵列结合剂可以包括共同地能够结合一种或多种选自表1C中限定的生物标记物的结合剂或由共同地能够结合一种或多种选自表1C中限定的生物标记物的结合剂组成,所述一种或多种选自表1C中限定的生物标记物例如,至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或至少28种选自表1C中限定的生物标记物。优选,阵列结合剂可以包括共同地能够结合一种或多种选自表1D中限定的生物标记物的结合剂或由共同地能够结合一种或多种选自表1D中限定的生物标记物的结合剂组成,所述一种或多种选自表1D中限定的生物标记物例如,至少2、3、4、5、6、7、8、9或至少10种选自表1D中限定的生物标记物。优选,阵列结合剂可以包括共同地能够结合一种或多种选自表1E中限定的生物标记物的结合剂或由共同地能够结合一种或多种选自表1E中限定的生物标记物的结合剂组成,所述一种或多种选自表1E中限定的生物标记物例如,至少2、3、4、5、6、7、8或至少9种选自表1E中限定的生物标记物。
因此,阵列结合剂可以包括共同地能够结合表1A中限定的全部生物标记物的结合剂或由共同地能够结合表1A中限定的全部生物标记物的结合剂组成。阵列结合剂可以包括共同地能够结合表1B中限定的全部生物标记物的结合剂或由共同地能够结合表1B中限定的全部生物标记物的结合剂组成。阵列结合剂可以包括共同地能够结合表1C中限定的全部生物标记物的结合剂或由共同地能够结合表1C中限定的全部生物标记物的结合剂组成。阵列结合剂可以包括共同地能够结合表1D中限定的全部生物标记物的结合剂或由共同地能够结合表1D中限定的全部生物标记物的结合剂组成。阵列结合剂可以包括共同地能够结合表1E中限定的全部生物标记物的结合剂或由共同地能够结合表1E中限定的全部生物标记物的结合剂组成。优选,阵列结合剂包括共同地能够结合表1中限定的全部生物标记物的结合剂或由共同地能够结合表1中限定的全部生物标记物的结合剂组成。
阵列中的第一种结合剂可以是固定的。
阵列本身是本领域公知的。通常,它们由具有隔开(即,分离)区域(“点”)的线性或二维结构形成,每个具有有限的面积,在固体支持物的表面上形成。阵列还可以是珠子结构,其中每个珠子通过分子编码或颜色编码来识别或在连续流动中识别。在样品通过一系列点的情况中,还可以按序进行分析,每个点从溶液中吸附所述类别的分子。固体支持物通常是玻璃或聚合物,最常用的聚合物是纤维素、聚丙烯酰胺、尼龙、聚苯乙烯、聚氯乙烯或聚丙烯。固体支持物可以是管子、珠子、圆盘、硅芯片、微板、聚乙二烯二氟化物(PVDF)膜、硝基纤维素膜、尼龙膜、其他多孔膜、无孔膜(例如,塑料、聚合物、塑胶、硅等)、多个聚合针,或多个微滴定孔,或任何其他适用于固定蛋白质、多核苷酸和其他合适分子和/或进行免疫测定的表面的形式。结合过程也是本领域公知的,并且通常由交联共价结合或物理吸附蛋白质分子、多核苷酸等至固体支持物上组成。或者,可以使用经由亲和力标签(tag)或相似构建体的探针的亲和力偶联。通过使用公知技术,如接触或非接触印刷、掩蔽或照相平版印刷术,可以限定每个点的位置。对于综述,参见,Jenkins,R.E.,Pennington,S.R.(2001,Proteomics,2,13-29)和Lal等(2002,Drug Discov Today 15;7(18Suppl):S143-9)。
通常,阵列是微阵列。“微阵列”包括具有至少约100/cm2的离散区域密度的区域的阵列的含义,并且优选至少1000/cm2。微阵列中的区域具有典型的尺寸,例如,直径,在约10-250μm的范围中,并且与阵列中的其他区域隔开约相同的距离。阵列可替换地是大阵列或纳米阵列。
一旦已经鉴定并分离合适的结合分子(以上讨论的),本领域技术人员可以使用分子生物学领域公知的方法来制造阵列;参见以下的实施例。
本发明的第三个方面提供了一种或多种选自表1A、表1B、表1C、表1D和/或表1D中限定的生物标记物用于确定乳癌相关疾病状态的用途。
在一个实施方案中,表1A、表1B、表1C、表1D和表1D中限定的全部生物标记物共同地用于确定乳癌相关疾病状态。
本发明的第四个方面提供了用于根据本发明的第一个方面的方法中的分析试剂盒,其包括:
A)根据本发明第二个方面的或如本发明第一个方面中限定的阵列;和
B)用于进行如本发明第一个方面中限定的方法的说明书(任选)。
分析试剂盒可以包括如本申请发明的第一个方面中限定的一种或多种对照样品。
优选,现在将参照以下附图描述具体表现为本发明特定方面的非限制性实施例。
附图说明
图1.肽和蛋白质统计学。(A)每个样品鉴定的独特肽序列的总数(FDR 0.01,使用Mascot+X!Tandem)。(B)每个样品鉴定的装配蛋白质群组(protein group)的总数(FDR0.01,设定在蛋白质水平,使用Mascot+X!Tandem)。(C)每个蛋白质群组的独特肽的数量(FDR 0.01,设定在蛋白质水平,使用Mascot+X!Tandem),在整个研究中形成2140个蛋白质群组的总蛋白质覆盖。(数据基于全部样品和运行,包括复制、集合样品运行和具有缺少的临床参数的样品)。(D)相对于PeptideAtlas(版本2011-08Ens62,人)定量肽的评价(Progenesis LC-MS软件,限于使用FDR 0.01的Mascot评分的肽)。此外,对于PeptideAtlas中不存在的肽,为了评价是否已经报道了相应的蛋白质,进行第二个比较。在多个蛋白质就位的情况中,评价全部。(E)肽长度的比较。(F)在PeptideAtlas中观察到的肽频率。
图2.完整GPS设定的再现性(即,捕获+LC-MS/MS)说明了针对代表性样品(样品7267)和参照(集合样品)样品的组合数据和单独的混合物。为了包括(绘图)数据点,必须在全部重复三次的运行中,将蛋白质定量(标准化丰度>0)。这样的要求用于图A-E中绘制的所有数据。(A)针对所有组合的数据进行了说明(基于1264个蛋白质)。(B)针对CIMS-混合物1进行了说明(基于315个蛋白质)。(C)针对CIMS-混合物2进行了说明(基于661个蛋白质)。(D)针对CIMS-混合物3进行了说明(基于452个蛋白质)。(E)针对CIMS-混合物4进行了说明(基于370个蛋白质)。
图3.基于组织学等级、雌激素受体状况和HER2状况的显著差异表达的蛋白质。差异表达的分析物显示于热图(heatmap)中(红色-上调,绿色-下调)。(A)组织学等级1、等级2和等级3样品的PCA-图和相关热图(在方差0.2、p-值<0.01、q-值<0.25上过滤的数据)。此外,使用SVM的来自弃一交叉验证(leave-one out cross validation)方法的结果由ROC-面积值证实。(B)ER-阳性和ER-阴性样品的PCA-图和相关热图(在方差0.2、p-值<0.01、q-值<0.32上过滤的数据)。此外,用ROC-曲线说明了来自弃一交叉验证方法的结果。(C)HER2-阳性和阴性样品的PCA-图和相关热图(在方差0.2、p-值<0.01、q-值<0.9上过滤的数据)。用ROC-曲线说明了来自弃一交叉验证方法的结果。
图4.使用IPA的三个组织学等级的肿瘤类型之间的差异表达的分析物的生物学关联性。(A)将三个肿瘤群之间的鉴定为显著差异表达的蛋白质的49个蛋白质作图于它们的细胞位置。着色的log2-比例(中值等级3/中值等级1),其中红色说明上调,而绿色说明下调。已经指出具有已知的与肿瘤发生关联的蛋白质。(B)发现顶端报道的网络与DNA复制、重组、细胞周期和自由基清除相关。(C)发现第二个报道的网络与基因表达、传染病和癌症相关。
图5.使用正交方法证实蛋白质表达谱。为此,使用了基于来自1411个组织学等级的肿瘤样品的mRNA表达谱。在组织学等级1、2和3中49个差异表达蛋白质中的42个成功作图(使用Gene Entrez ID)于GOBO-数据库中。(A)针对发现在组织学等级3肿瘤中展示出降低的蛋白质表达的蛋白质的mRNA表达谱(与组织学等级1相比的中值比例),其中15个(总共16个)分析物可以用GOBO-工具作图。此外,指出15个基因与不同基因群组模块(gene setmodule)表达谱的关联。灰色点表示实际的关联值。(B)针对发现在组织学等级3肿瘤中展示出提高的表达的蛋白质的mRNA表达谱(与组织学等级1相比),其中27个(总共33个)可以用GOBO-工具作图。此外,指出27个基因与不同基因群组模块表达谱的关联。灰色点表示实际的关联值。
图6.表1生物标记物的不同长度和组合的示例性生物标记物特征的卡普兰-迈耶分析。
图7.研究中使用的工作流的图示。(A)肿瘤样品制备和(B)使用CIMS-抗体的肽捕获,在LC-MS/MS上的运行时间表和数据分析。在移动至下一个CIMS-粘合剂混合物衍生的洗脱物之前,结束所有源自一个CIMS-粘合剂混合物的洗脱物的分析。因此,所有CIMS-粘合剂混合物分析从来自集合样品的洗脱物的分析开始,接着是根据组织学等级的随机顺序的一半个体样品的分析。通过混合物达到一半时,注入另一个集合样品,然后注入剩余样品,并且在结束时,用第三个集合样品结束。完成后,开始来自下一个CIMS-粘合剂混合物的洗脱物的分析。在粘合剂混合物2和粘合剂混合物3之间,运行两次空白珠的注入。空白珠不含连接的抗体,因此应当只洗脱结合磁珠的背景肽。在Proteios SE和Progenisis中分析数据,以获得肽和蛋白质的鉴定和定量。
图8.作为Venn图说明的完整GPS设定(即,捕获+LC-MS/MS)的鉴定再现性。(A)对于样品7267的重复捕获运行之间的肽的重叠(所有独特序列)。显示了对于样品7267(上图)和单独混合物(较小的四个Venn图)的总覆盖的统计。从Proteios SE产生的数据(即,Mascot和X!Tandem评分的肽)。(B)对于集合样品的重复捕获运行之间的肽的重叠(所有独特序列)。显示了总(上图)和单独混合物的统计。从Proteios SE产生的数据(即,Mascot和X!Tandem评分的肽)。
图9.对于定量蛋白质的log2MS强度的分布。(A)对于1364个蛋白质(排除了24个具有0的中值log2强度值的蛋白质)绘制的中值标准化丰度(基于具有临床记录的50个样品)。条块根据MS强度着色,从淡黄色(低MS强度)至深红色(高MS强度)。(B)基于针对选定的蛋白质类别的GO生物学过程的log2MS强度的分布。使用Generic Gene Ontology(GO)TermMapper工具(http://go.princeton.edu/cgi-bin/GOTermMapper),通过主要生物过程将分析物分组。
图10.在三个组织学等级之间的差异表达蛋白质中的8个的单独强度箱线图,证明了组织学等级3肿瘤中的最高表达。
图11.在三个组织学等级之间的差异表达蛋白质中的8个的单独强度箱线图,证明了组织学等级1肿瘤中的最高表达。
图12.组织学等级之间的扩充比较。(A)组织学等级2(H2)和组织学等级1(H1)之间,组织学等级3(H3)和组织学等级1(H1)之间以及组织学等级3(H3)和组织学等级2(H2)之间的log2-倍数变化。顶部49个说明的分析物是鉴定为在三个等级之间差异表达的蛋白质特征。因此,计算和显示了所有比较。较下面的47个分析物源自两个等级之间的SVM-计算,同时不考虑第三个等级。对所有三个比较进行了所述计算,并且因此汇编了显著性分析物的列表。使用Matrix2png(Pavlidis和Noble,2003)产生了矩阵色图。(B)源自两组比较的SVM计算的ROC AUC值。列出了来自未过滤(完整数据集)以及过滤数据(方差0.2和p-值<0.01)的ROC AUC值。(C)组织学等级1和3的热图(在方差0.2,p-值<0.01,q-值<0.25上过滤的数据)。差异表达的分析物显示于热图中,其中红色说明了上调,而绿色说明了下调。(D)使用在等级1和等级3之间差异表达的50个蛋白质的组织学等级1、等级2和等级3的PCA-图(图12C)。
图13.针对在ER-状况比较或HER2/neu-状况比较中鉴定为差异表达的蛋白质子集举例说明的单独强度箱线图。(A)ER-阳性和ER-阴性肿瘤之间的差异表达的分析物。(B)HER2-阴性和HER2-阳性肿瘤之间的差异表达的分析物。
图14.Ki67-阳性(25%截留)和Ki67-阴性分级肿瘤的评价。差异表达的分析物显示于热图中,其中红色说明上调,而绿色说明下调。(A)Ki67-阳性和Ki67-阴性分级肿瘤的PCA-图。相应分析物和样品的热图。(在方差0.2,p-值<0.01,q-值<0.27上过滤的数据)。(B)用ROC-曲线说明了来自使用SVM的弃一交叉验证方法的结果。
图15.针对反映出组织学等级或ER-状况的差异表达分析物,使用IPA的转录因子关联网络分析。连接分子的线表示分子相关性,而箭头的样式表示特定的分子相关性和相互作用的方向性。(A)将多组组织学等级比较中鉴定的49个蛋白质用作输入。为了色码测量的分析物,使用了针对组织学等级3/组织学等级1的中值的log2比例。红色说明上调。绿色说明下调。(B)将ER-状况比较中鉴定的39个蛋白质用作输入。为了色码测量的分析物,使用了中值的log2比例。在ER-阴性样品中,红色说明上调,而绿色说明下调。
图16.发现基于来自针对分析物子集举例说明的1411个组织学等级肿瘤样品的数据的单独mRNA表达谱展示了组织学等级之间显著差异的蛋白质表达。(A-E)发现五个蛋白质的mRNA表达水平在组织学等级3肿瘤中呈现出提高的表达。(F-J)发现五个蛋白质的mRNA表达水平在组织学等级3肿瘤中呈现出降低的表达。
图17.基于来自1620个ER-状况限定的乳腺肿瘤样品的数据的mRNA表达谱。使用gene entrez ID,将39个差异表达的蛋白质中的32个成功作图于GOBO-数据库中。(A)发现10个蛋白质的mRNA表达谱在ER-阳性肿瘤中呈现出提高的蛋白质表达。此外,说明了10个基因与不同基因群组模块表达模式的关联。灰色点表示实际的关联值。(B)发现蛋白质的mRNA表达谱在ER-阳性肿瘤中呈现出降低的表达。此外,可以看到22个基因与不同基因群组模块表达模式的关联。灰色点表示实际的关联值。(C-D)发现针对两个蛋白质举例说明的单独mRNA表达谱在ER-阳性肿瘤中呈现出提高的表达。(E-F)发现针对两个蛋白质举例说明的单独mRNA表达谱在ER-阳性肿瘤中呈现出降低的表达。
图18.使用GOBO-数据库工具,对单独的mRNA表达谱作图,针对三个分析物举例说明,发现了在HER2/neu比较中呈现出显著差异的蛋白质表达。数据基于1881个可用的肿瘤样品。(A)HER2/neu,(B)S100A9,(C)GRB7。除了以上三个分析物,测试了第四个蛋白(登录号P22392),以进行作图。然而,由于使用Gene Entrez ID 4831或654364,来自GOBO-数据库工具的错误信息,因此丢失了该数据。
图19.卡普兰-迈耶分析,使用DMFS作为10-年终点。使用Entrez Gene ID(转换swissprot ID后),将区分了组织学等级的49个蛋白质中的42个成功作图于基因表达数据库。将分析物分成两组(基于上调或下调,使用针对观察的蛋白质表达水平的组织学等级3和等级1之间的比例),形成15个下调分析物和27个上调分析物。然后使用基因表达数据库,将这两个组用于评价无远端转移的生存(DMFS)的潜在风险。通过将基因表达数据分层成三个分位数,使用DMFS作为用于组织学等级肿瘤的10-年终点(n=1379),来进行卡普兰-迈耶分析。此外,使用DMFS作为10-年终点,基于单个基因,产生了四个单独的卡普兰-迈耶分析(2个下调和两个上调),并且使用GOBO-工具,以相似的方式呈现出来。
图20.乳癌组织样品选自52个样品的相同初始群,在此包括6个等级1样品,9个等级2样品和6个等级9样品。将样品在溶液中消化(胰蛋白酶化)并且使用选择性监控反应(SRM)设定分析(一种确定的基于质谱的方法)。靶向对应于来自生物标记物列表的8个蛋白质的9个肽并且定量。样品重复三份运行。使用Anubis分析了数据,接着进行P-值过滤(p<0.01)和q-值过滤(q<0.11)。使用截短的标记物列表,数据显示出乳癌组织样品可以根据等级区分。
图21.乳癌组织样品选自52个样品的相同初始群,在此包括分布在等级1、2和3中的47个样品(具有技术重复性)。将样品在凝胶中消化(胰蛋白酶化),并且使用选择性监控反应(SRM)设定分析(一种确定的基于质谱的方法)。靶向对应于来自生物标记物列表的4个蛋白质的8个肽并且定量。样品重复三份运行。使用Anubis分析了数据,接着进行P-值过滤(p<0.01)和q-值过滤(q<0.009)。使用截短的标记物列表,数据显示出乳癌组织样品可以根据等级区分。
实施例
介绍
使用目前的临床和实验室参数,乳癌患者中的肿瘤进展和预后是难以评价的,并且不存在候选多重组织生物标记物特征。在解决这一临床未满足需求的尝试中,发明人应用了最近研发的蛋白质组发现工具,意味着整体蛋白质组检测。因此,通过结合亲和力蛋白质组学,只基于9个抗体,和无标记LC-MS/MS,发明人剖析了52个乳癌组织样品,代表了最大的乳癌组织蛋白质组研究之一,并且成功地产生了表示1388个蛋白质的详细定量蛋白质组图谱。结果表明发明人已经深入地破译了组织学等级的乳癌肿瘤的分子谱,其反映出肿瘤进展。更详细地,定义了49-丛(plex)组织生物标记物特征(其中p<0.01)和79-丛组织生物标记物(其中p<0.02)特征,以高准确性区分组织学等级1至3乳癌肿瘤。鉴定了生物学上高度相关的蛋白质,并且差异表达的蛋白质支持目前关于肿瘤微环境对肿瘤进展重塑的假设。此外,还证明了使用标记物来评估无远端转移的生存的风险。此外,分别描绘了反映出ER-、HER2-和Ki67-状况的乳癌相关生物标记物特征。分别使用独立方法(mRNA谱测定)和患者群,确认了生物标记物特征。总之,这些分子谱提供了提高的乳癌分类和预后。
实验程序
临床样品
该研究通过Lund,瑞典的区域伦理审查委员会(regional ethics review board)的批准。从Department of Oncology(SUS,Lund)招募五十二名乳癌患者。获得了50个组织样品的全部临床记录。基于组织学等级1(n=9)、等级2(n=17)和等级3(n=24),将样品进行细分。
胰蛋白酶消化的人乳癌组织样品的制备
从52个乳癌组织块提取蛋白质并且随后还原、烷基化、胰蛋白酶消化和最终储存在-80℃,直至进一步的使用。此外,通过合并来自所有消化样品的5μl等份试样来产生用作参照样品的集合样品,并且储存在-80℃,直至进一步的使用。在补充实验程序中提供了关于样品制备的详细内容。
CIMS-scFv抗体的产生和与磁珠的偶联
在大肠杆菌培养物中产生了对抗六个短C-末端氨基酸肽基序的九个CIMS scFv抗体(表S2),并且使用Ni2+-NTA亲和力色谱纯化。接着,将纯化的抗体与磁珠偶联。在补充实验程序中提供了关于scFv生产和偶联的详细内容。
无标记定量GPS实验
通过混合等量的两种或三种不同粘合剂(表S2),制得了四个不同集合(称为CIMS-粘合剂混合物1至4)的抗体-缀合的珠子。将抗体混合物暴露于胰蛋白酶样品,洗涤,并且最终用乙酸孵育,以洗脱捕获的肽。然后将洗脱液直接用于MS-分析,而没有任何其他清洗。使用26天MS-仪器时间,运行了完整的研究,分成6.5天的四个块(一种CIMS-粘合剂混合物/块)。每个CIMS-粘合剂混合物单独分析全部样品一次。此外,在每个块内进行了选定样品的重复三次捕获,作为背对背(back-to-back)LC-MS/MS运行。在4个块内和4个块之间随着时间推移重复分析了参照样品(图7)。总共进行了238个LC-MS/MS运行,并且在补充实验程序中提供了关于肽捕获和相关质谱分析的所有详细内容。
蛋白质鉴定和定量
通过两个软件包,即Proteios SE(Hakkinen等,2009)和Progenesis LC-MS(Nonlinear Dynamics,UK),分析了所产生的数据。进行了相对正向和反向组合的数据库的研究(Homo Sapiens Swiss-Prot,2011年8月,获得了总共71324个数据库条目),基于为了产生肽鉴定而鉴定的反向目标的数量,评估了0.01的假发现率(FDR)。Progenesis-LC-MS软件(v4.0)用于比对特征、鉴定(Mascot)和产生定量值。补充实验程序中提供了关于研究参数和数据加工的详细内容。
统计学和生物信息学分析
使用one-way ANOVA,将Qlucore Omics Explorer v(2.2)(Qlucore AB,Lund,瑞典)用于鉴定显著上调或下调的蛋白质(p<0.01)。基于Benjamini和Hochberg方法(Benjamini和Hochberg,1995),产生了q-值。在Qlucore中产生了主成分分析(PCA)图和热图。支持向量仪(SVM)是使用弃一交叉验证程序用于将样品归类的一种学习方法(Cortes和Vapnik,1995),并且对未过滤的和p-值过滤的数据进行了分析。使用SVM判定值和曲线下面积(AUC)构建了接收者操作特征(ROC)曲线(Lasko等,2005),其用作分类器性能的测量。此外,将Ingenuity Systems Pathway Analysis(IPA)(v 11904312,www.ingenuity.com)用于显著差异表达的蛋白质,以提取信息,如蛋白质定位、潜在的网络相互作用、转录因子关联以及与肿瘤发生的关联。使用GOBO搜寻工具(Ringner等,2011),相对大的针对具有临床参数(如,组织学等级1、2和3,ER-状况或HER2-状况)的乳癌组织的公开的基因表达数据的群,在mRNA水平最终证实了实验上产生的蛋白质特征。
补充实验程序
胰蛋白酶消化的人乳癌组织样品的制备
从乳癌组织块提取蛋白质,并且储存在-80℃,直至使用。简而言之,将组织块(约50mg/样品)在Teflon容器中均质化,在液氮中预冷,其通过将钢瓶固定在振荡器中2×30秒同时在两轮振荡之间在液氮中快速冷却来进行。将均质的组织粉收集在含有8M脲、30mMTris、5mM乙酸镁和4%(w/v)CHAPS(pH8.5)的裂解缓冲液中(2mg组织/30μl缓冲液)。将试管简短涡旋并且在冰上孵育40分钟,每5分钟将样品简短涡旋。孵育后,将样品在13000rpm涡旋,并且将上清液转移至新试管中,接着第二次离心。使用Zeba脱盐旋转柱(Pierce,Rockford,IL,USA)将缓冲液交换成0.15M HEPES,0.5M脲(pH8.0),之后使用Total ProteinKit,Micro Lowry(Sigma,St.Louis,MO,USA)测定蛋白质浓度。最后,将样品等分,并且储存在-80℃,直至进一步使用。将蛋白质提取物解冻,还原,烷基化和胰蛋白酶酰化。首先,分别加入SDS和TECP-HCl(Thermo Scientific,Rockford,IL,USA)至0.02%(w/v)和5mM,并且将样品在56℃还原60分钟。将样品冷却至室温,接着加入碘乙酰胺至10mM,然后在室温烷基化30分钟。接着,加入20μg/mg蛋白质的测序等级改性的胰蛋白酶(Promega,Madison,Wisconsin,USA),在37℃持续16小时。为了确保完成消化,加入第二个等份的胰蛋白酶(10μg/mg蛋白质),并且将试管在37℃再孵育3小时。最后,将消化的样品等分,并且储存在-80℃,直至进一步使用。此外,制备分开的集合样品,其通过将来自所有消化样品的5μl等份试样混合产生,并且储存在-80℃,直至进一步使用。为了提高潜在的实验性蛋白质组覆盖,仍然单独分析了其有限的临床数据在如下表S1中的两个样品,并且包括在集合样品中。
CIMS-scFv抗体的产生和与磁珠的偶联
从n-CoDeR(Soderlind等,2000)文库选择了九个CIMS scFv抗体(相对六个短C-末端氨基酸肽基序(称为M-1、M-15、M-31、M-32、M-33和M-34)的克隆1-B03、15-A06、17-C08、17-E02、31-001-D01、32-3A-G03、33-3C-A09、33-3D-F06和34-3A-D10),并且由BioInventInternational AB,Lund,瑞典友好地提供(表S2)。最近已经测定了六个CIMS抗体的特异性和解离常数(低μM范围)(Olsson等,2011)。在100ml大肠杆菌培养物中产生抗体,并且使用Ni2+-NTA琼脂糖上的亲和色谱(Qiagen,Hilden,德国)纯化。用250mM咪唑洗脱结合的分子,相对PBS(pH7.4)渗析72小时,然后储存在+4℃,直至使用。通过测量280nm的吸光值来确定蛋白质浓度。通过在Agilent Bioanalyzer(Agilent,Waldbronn,德国)上运行Protein 80芯片,证实了scFv抗体的完整性和纯度。按照之前所述的(Olsson等,2011),将纯化的scFv与磁珠(M-270羧酸活化的,Invitrogen Dynal,Oslo)单独偶联。简而言之,将一批180-250μg纯化的scFv与~9mg(300μl)磁珠共价偶联(EDC-NHS化学),并且储存在4℃在PBS中的0.005%(v/v)吐温-20中,直至进一步使用。此外,产生了一批空白珠(即,用偶联实验方案产生的但没有添加scFv的珠子)。
无标记定量GPS实验
通过混合等量的两种或三种不同粘合剂制得了四种不同的缀合珠子集合(称为CIMS-粘合剂混合物1至4),所述混合物根据以下:混合物1(CIMS-33-3D-F06和CIMS-33-3C-A09)、混合物2(CIMS-17-C08和CIMS-17-E02)、混合物3(CIMS-15-A06和CIMS-34-3A-D10)和混合物4(CIMS-1-B03、CIMS-32-3A-G03和CIMS-31-001-D01)(表S2)。对于每次捕获,使用50μl集合珠子溶液,并且scFv-珠子从未重复使用。用350μl PBS预先洗涤珠子,接着暴露于35μl终体积的胰蛋白酶样品消化物(用PBS稀释并加入苯甲基磺酰氟(PMSF)至1mM的终浓度),然后边温和搅拌边将珠子孵育20分钟。接着,将试管置于磁铁上,除去上清液,并且分别用100和90μl PBS洗涤珠子(在每个洗涤步骤之间,将珠子转移至新的试管中,并且总的洗涤时间为5分钟)。最后,用9.5μl 5%(v/v)乙酸溶液将珠子孵育2分钟,以洗脱捕获的肽。然后将洗脱液直接用于质谱分析,而没有任何另外的清洗。
将与Eksigent nanoLC 2DTM加HPLC系统(Eksigent technologies,Dublin,CA,USA)连接的ESI-LTQ-Orbitrap XL质谱仪(Thermo Electron,Breman,德国)用于所有样品。自动取样机注入6μl GPS-产生的洗脱液。在每个分析样品之间使用了空白LC-MS/MS运行。将肽以15μl/min的恒定流速加样于预备柱上(PepMap 100,C18,5μm,5mm×0.3mm,LCPackings,Amsterdam,Netherlands)。随后将肽在10μm熔融石英发射器,75μm×16cm(PicoTipTM Emitter,New Objective,Inc.Woburn,MA,USA)上分离,其内部用Reprosil-Pur C18-AQ树脂(3μm Dr.Maisch,GmbH,德国)装填。用含有0.1%(v/v)甲酸的水中3至35%(v/v)乙腈的35分钟线性梯度洗脱肽,使用300nl/min的流速。以数据依赖性模式操作LTQ-Orbitrap,以在Orbitrap-MS(从m/z 400至2000)和LTQ-MS/MS获取之间自动转换。每次FT-MS扫描,在线性离子捕获器中获得了四个MS/MS谱,其使用针对内部校准的锁定质量选项(m/z 445.120025),在60,000FWHM标称分辨率设定下获取。使用两个重复计数,将动态排除列表限于500个条目,其具有20秒的重复持续时间,并且具有120秒的最大停留期。前体离子电荷状态筛选能够选择具有至少两个电荷的离子以及具有不确定电荷状态的排斥离子。将标准化碰撞能力设定为35%,并且针对每个光谱获取一个微扫描。每个CIMS-粘合剂混合单独分析全部样品一次。此外,针对每种CIMS-粘合剂混合物,进行了集合样品(基于研究中的所有样品)的重复三次捕获,并且在较长时间段内针对MS-分析分布(每种粘合剂混合物LC-MS序列运行的开始、中间和结束)(图7)。这对于CIMS-粘合剂混合物1和4是可能的。然而,对于CIMS-粘合剂-混合物2和3,序列运行中超过一半,需要替换分析LC-柱(两次),并且确定在新替换的柱上直接运行预定的最后集合运行,导致在集合运行后分析了少数样品(9个样品中分别11个)。此外,针对每种CIMS-粘合剂混合物,对样品(7267,8613)进行了重复三次捕获。将空白珠,即,没有任何缀合抗体的珠子,暴露于集合的消化物,以评价潜在的珠子背景结合肽。基于从两次空白珠“捕获”鉴定的背景结合肽的低数量,所有产生的数据均未过滤,除非另外指出。
蛋白质鉴定和定量
首先使用Proteios SE分析了所产生的数据,以用于使用Mascot和X!Tandem来产生鉴定。简而言之,使用Proteios(v 2.17)平台,将所有文件进行处理并转化成mzML和mgf格式,并且将以下搜寻参数用于Mascot和X!Tandem:酶:胰蛋白酶;错失的分裂1;固定的修饰:脲基甲基(C);可变的修饰:甲硫氨酸氧化(O)。此外,可变N-乙酰基允许在X!Tandem中进行搜寻(www.thegpm.org/tandem/)。使用3ppm的肽质量公差和0.5Da的片段质量公差,并且相对正向和反向组合的数据库进行搜寻(Homo Sapiens Swiss-Prot,2011年8月,得到总共71324个数据库条目)。使用了Mascot和X!Tandem中的自动化数据库搜寻和随后的组合(具有0.01的假发现率(FDR))(基于鉴定的反向目标的数量来评估),以用于产生肽鉴定。当使用Proteios SE针对每个样品产生肽鉴定时,应用了蛋白质水平上的0.01的FDR。所有原始数据储存在Proteios SE内。
由于分析时的Proteios SE没有给予定量的无标记插入式分析模块(正在研发中),将Progenesis-LC-MS软件(v 4.0)用于产生所有定量值。简而言之,在使用Progenesis-LC-MS软件之前,使用ProteoWizard软件包,将原始数据文件转化成mzXML。使用了具有默认设置和最小输入的内置功能查找工具、Mascot搜寻工具和组合的分级工具(CIMS-粘合剂-混合物1、2、3和4)。为了最佳特征比对,将针对各个CIMS-粘合剂混合物的集合样品的第一个注射运行(图7)用作参照比对文件,除了CIMS-混合物3运行,其中将一半集合运行用作参照比对文件。包括了对于CIMS-混合物1和2的10-50分钟停留时间之间比对和检测的特征,以及对于CIMS-混合物3和4的10-49分钟停留时间之间比对和检测的特征,以用于定量。提取所产生的标准化丰度值,并且用于统计学和生物信息学分析。由于使用Progenesis软件的限制,鉴定仅限于Mascot搜寻,意味着没有包括来自Proteios SE的X!Tandem产生的鉴定以用于下游定量分析。使用了上述相同的数据库(Homo Sapiens Swiss-Prot,2011年8月,正向和反向组合数据库)和搜寻参数,并且应用了0.01的截留FDR值。
结果
在这个研究中,使用GPS破译了52个粗制乳癌组织提取物的半-整体蛋白质表达谱(鉴定和定量)。描绘了反映出组织学等级的组织生物标记物特征以及其他关键临床实验室参数,如雌激素受体(ER)、HER2和Ki-67。描述了实验设计的整体工作流显示于图7中。
蛋白质覆盖、动态范围和测定性能
使用GPS,鉴定了总共2,140个蛋白质群组(图1A-C)。鉴定再现性高,形成了54.7%肽重叠(图8A)。比较起来,在整个项目中重复分析的参照样品显示出43.9%肽鉴定重叠(图8B)。在鉴定的蛋白质中,总共成功定量了1388个蛋白质(图9),并且随后用于搜寻疾病相关标记物。发现针对7267-样品定量的总中值CV值为10.8%(图2A),而参照样品的相应总中值CV值为22.8%(图2A)。特别地,对应于61个蛋白质的约38%(833个肽)的定量的肽,之前在PeptideAtals中没有被报道过(图1D),这表明是基本上新的覆盖。通过相当大的一部分的检测肽较短的事实进一步强调了这一情况,与之前报道的那些相比,具有9对11个氨基酸的中值长(图1E)。
评价了针对所有定量的蛋白质测量的log2-MS强度标准化丰度的分布,并且显示出~106的动态范围(图9A)。通过在由PeptideAtlas中常常报道至很少报道的范围内肽容易检测的事实进一步说明了通过GPS测定产生的深入覆盖(图1F)。然后通过主要的生物学过程,将检测的蛋白质分组,并且发现在几个组中分布(图9B)。令人感兴趣地,用过程如翻译进行分组的蛋白质(例如,60S核糖体蛋白),与预期的一样,发现其相比于例如有丝分裂中涉及的其他蛋白质(例如,CDK1)而言呈现出更高的整体丰度。总之,数据表明了GPS以可再现的方式提供新的和深入的覆盖的能力。
反映出组织学等级的蛋白质表达谱
首先,发明人检查了是否可以破译反映出组织学等级的组织生物标记物特征。使用多变量分析(3组比较),在等级1、等级2和等级3群组之间鉴定出49个显著(p<0.01,q-值<0.25)差异表达的蛋白质。基于这种特征,PCA-图显示出组织学等级1和等级3肿瘤可以很好地分离,而组织学等级2肿瘤似乎异质性更高,并且在其他两组中散布(图3A)。观察到随着组织学等级提高上调和下调分析物的模式。例如,细胞周期蛋白-依赖性激酶1(CDK1)、迷你染色体维持复合物组分3(MCM3)、DNA复制许可因子MCM7、ATP-柠檬酸合成酶(ACLY)、多腺苷酸-结合蛋白4(PABPC4)和6-磷酸果糖激酶类型C(PFKP)是上调组织标记物(图3A和图10)。相反,如keratocan(KERA)、spondin(SPON1)、asporin(ASPB)、脂肪细胞增强子-结合蛋白1(AEBP1)、胰凝乳蛋白酶(CMA1)和olfactomedin-样蛋白3(OLFML3)的分析物是下调分析物,即,在组织等级1肿瘤中呈现出较高的表达水平(图3A和图11)。
随后发明人检查了49个p-值过滤的(p<0.01)生物标记物列表是否可以用于基于组织学等级将组织归类。为此,发明人运行了使用SVM的弃一交叉验证,并且收集所有样品的判定值。然后将预测值用于构建ROC曲线,并且计算AUC值(图3A)。结果表明组织学等级肿瘤亚组可以很好地分离(AUC=0.75-0.93),尽管等级2再次显示出异质性更高。
接着,发明人研究了使用两组比较替代多变量方法对限定差异表达标记物的影响(图12)。如预期的,数据显示出单独组织学亚组的分类提高了,如通过AUC-值判断的(AUC=0.91-0.92)。聚焦于组织学等级1对等级3,描绘了50个显著(p<0.01)差异表达的分析物,其中31个与之前的49-生物标记物特征重叠(cfs.图3A-3C和12C)。当将组织学等级2作图于等级1对等级1的50个冷冻生物标记物比较时,再次呈现出异质特征并且在两个群中散布(cfs.图3A和12D)。
ER-状况的影响
由于24个组织学等级3肿瘤中的14个归类为ER-阴性,并且17个阴性样品中的14个实际上是等级3肿瘤,发明人研究了ER-状况对表达谱的直接影响。为了测试这种假设,只使用ER-阳性样品(n=33)重新检查了肿瘤。采取了多变量方法,结果表明18个显著差异表达的蛋白质(p<0.01,q-值<0.51)是确定的,并且组织学等级1对等级3组织可以很好地归类(0.9的AUC-值,数据未显示)。特别地,发现18个分析物中的16个(例如,ASPN、SPON1、KERA、ACLY、APCS和PABPC4)与最初破译的49个生物标记物特征重叠(图3A)。因此,数据进一步支持49个生物标记物特征反映出组织学等级的观察。
此外,发明人还检查了是否可以解释ER-相关组织生物标记物特征。结果表明ER-阳性和ER-阴性乳癌组织可以很好地归类(AUC=0.82)(图3B),并且鉴定出39个差异表达的分析物(p<0.01,q-值<0.32)(例如GREB1,图3B和13A)。因此,数据显示出已经检测到ER-相关组织生物标记物特征。
反映出HER2/neu-状况和Ki67-状况的蛋白质表达谱
当使用弃一交叉验证基于HER2/neu-状况比较52个乳癌组织提取物时,数据显示出可以区分2个群(AUC=0.98),并且鉴定出五个差异表达的标记物(p<0.01,q-值<0.9)(图3C)。最重要地,发现受体酪氨酸-蛋白质激酶erbB-2(HER2)是上调蛋白质(图3C和图13B)。
此外,以相似的方式,也可以破译反映出Ki67-状况的组织蛋白特征(其中将25%的Ki67-阳性癌核用作截留)。总体上,发现45个蛋白质是差异表达的(p<0.01,q-值<0.27)(图14A)。数据证明了可以分离Ki67-阳性对Ki67-阴性肿瘤(AUC=0.84)(图14B)。因此,结果表明已经确定了反映出HER2/neu状况和Ki67-状况的蛋白质表达谱。
生物学相关性
然后检查了49个区分组织学等级1至3的组织生物标记物特征的生物学相关性。为此,使用IPA软件,将每个单独的蛋白质的细胞位置作图(图4A),并且研究了网络相关功能和潜在的关联(图4B-4C)。显示了反映出细胞位置的主要的下调蛋白质(胞外基质(ECM))和上调分析物(质膜、细胞质和核)的图。更重要地,发现顶级网络与DNA复制、重组和修复、细胞周期和自由基清除相关,而第二高的等级网络与基因表达、传染病和癌症相关。值得注意的是,第1级网络内的几种蛋白质与NF-kB和VEGF直接或间接相关(图4B)。此外,第二个网络内的大部分ECM蛋白质是确定的,并且几种与转化生长因子-β(TGFβ1)直接或间接相关(图4C)。因此,结果表明了已经鉴定出反映了组织学等级的生物学上高度相关的组织生物标记物。
此外,还使用IPA评价了49个组织生物标记物特征和转录因子网络之间的相关性(图15)。值得注意的是,发现了Rb和E2F2在顶级相关的转录调节剂中(图15A)。比较起来,当组织生物标记物特征区分ER-阳性对ER-阴性肿瘤时,发现雌激素受体2(ESR2)和孕酮受体(PGR)在顶级相关的调节剂中(图15B中)。
候选乳癌进展特征的证实
在确认区分组织学等级1至3的49个组织生物标记物特征的尝试中,将数据与公众可获得的正交乳癌mRNA谱数据集相比。确认群由1,881个样品组成,其中1,411个具有指定的组织学等级,包括等级1(n=239),等级2(n=667)和等级3(n=495)。使用基因entrezID,49个组织生物标记物中的四十二个可以作图于基因表达数据库中,并且随后用于确认测试中。
然后基于针对级别3对级别1观察到的下调(15个分析物)或上调(27个分析物)的蛋白质表达谱,将42个组织标记物分成两组,并且与相应的mRNA表达谱进行比较(图5A-5B)。用mRNA表达水平充分确认了下调(例如,SPON1和KERA)(图5A、11、16I和17J)和上调蛋白质(例如,CDK1和MCM3)(图5B、10、16A和16B)的蛋白质表达谱。令人感兴趣地,发现了上调标记物呈现出与检查点和M-期基因模块具有高相关性的mRNA谱(图5A),而下调标记物的组呈现出与基质基因群组模块具有高相关性的mRNA谱(图5B)。
ER-和HER2-相关组织生物标记物特征的确认
然后以相似的方式,使用如上相同的公众可利用的正交乳癌mRNA谱数据库,尝试确认反映出ER-状况(图3B)和HER2-状况(图3C)的组织生物标记物特征。
在ER的情况中,确认组由具有指定的ER-状况的1,620个样品组成,包括395个ER-阴性和1225个ER-阴性样品。39个组织生物标记物中的三十二个可以作图于基因表达数据库,并且随后用于确认中。然后基于观察到的蛋白质表达谱,将32个标记物分成两组(10个上调和22个下调),并且与相应的mRNA表达谱进行比较(图17)。除了少数例外(例如,补体C3(图17F和图13A)),用相应的mRNA表达谱充分确认了观察到的蛋白质表达谱(cfs.图3B、13A和17)。在这一内容中,令人感兴趣地注意到发现ER-阳性肿瘤中的上调蛋白质组呈现出与类固醇应答基因模块具有高相关性的mRNA谱,而发现下调蛋白质组呈现出与免疫应答和基底基因群组模块具有高相关性的mRNA谱(图17A-17B)。
用于HER2的确认组由1,881个样品组成,分成HER2-阳性(n=152)、基底(n=357)、内腔-A(n=483)、内腔-B(n=289)、正常样(n=257)和未分类(n=344)。5个组织标记物中的三个可以作图于确认数据集,并且用于随后的评价中(图18)。结果表明蛋白质表达谱和基因表达谱充分相关(cfs.图3C、13B和18),进一步确认了观察结果。
评价无远端转移的生存
最后,发明人再次使用相同的公众可利用的基因表达数据集,检查了49个反映出组织学等级的组织生物标记物特征是否也可以用于评价无远端转移的生存(DMFS)的风险。49个组织生物标记物中的四十二个可以作图于具有10年终点生存数据的1379个样品。将标记物分成两组,反映出等级3对等级1中的下调(n=15)和上调(n=27)的标记物,然后通过基于这些分析物的表达水平将基因表达数据分级成三个分位数(低、中等和高),使用具有10-年终点的DMFS进行卡普兰-迈耶分析(图19)。特别地,数据表明了下调的分析物(主要是ECM相关的分析物)的群预测了DMFS的风险。实际上,这可以通过靶向单个下调(例如,KERA和OLFM3)或上调(例如,CDK1)的生物标记物来完成。
讨论
在这个研究中,发明人已经第一次深入地破译了反映出乳癌中肿瘤进展的多重组织生物标记物特征,下一步针对乳癌中的个性化用药进行研究。使用发明人最近内部研发的GPS技术(Olsson等,2012;Olsson等,2011;Wingren等,2009)来实现这一成果。因此,通过结合亲和性蛋白质组学,只基于9个抗体和无标记LC-MS/MS,发明人剖析了52个乳癌组织样品,其代表了最大的乳癌组织蛋白质组研究之一,并且成功地产生了反应出1388个蛋白质的详细定量蛋白质组图谱。
更详细地,描绘了以高特异性和灵敏度区分组织学等级1至3乳癌肿瘤的最先49-丛组织生物标记物特征。这一列表可以扩充至79种差异表达的标记物,将p-值标准设定至p<0.02,但在此将讨论聚焦于头49种分析物(p<0.01)。分子谱,或蛋白质指纹,支持了目前的观点:等级1和等级3肿瘤区别更大,而等级2肿瘤异质性更高(Sotiriou等,2006)。当剖析特征时,鉴定了之前已知的与乳癌相关的生物标记物以及新的候选生物标记物。从技术观点看,这种新的覆盖是由大比例的(~38%)定量的肽之前在PeptideAtals数据库中没有报道的事实而反映出来的(Deutsch等,2008)。在相对Human Protein Atlas项目(Uhlen等,2010)搜寻这49种分析物时,这种由GPS设定提供的新的覆盖也变得明显。尽管HumanProtein Atlas项目目前覆盖了超过50%的非-多余人蛋白质组,但没有任何抗体或任何组织学染色报道了49种差异表达蛋白质中的13种。
已经表明单独的ES-状况影响了乳腺肿瘤中超过10%的基因的表达,并且通常认为对生存具有影响。由于ER-阴性乳癌通常侵略性更大,并且基于抗雌激素的治疗是无效的,因此迫切地需要其他靶向的治疗(Rochefort等,2003)。发明人鉴定了能够以适当的特异性和灵敏度区分ER-阳性和ER-阴性肿瘤的39种蛋白质特征。值得注意的是,39种标记物中的11种目前尚未被Human Protein Atlas项目覆盖,再次概述了通过GPS技术提供的新覆盖(Uhlen等,2010)。39种标记物之一,GREB1,已经表明作为对内分泌治疗应答的候选临床标记物以及潜在的治疗靶标(Hnatyszyn等,2010;Rae等,2005)。GREB1是介导雌激素刺激的细胞增殖的雌激素调节的基因,并且最近报道了在ER-阳性乳癌细胞和正常乳房组织中表达,但在ER-阴性样品中不表达,这概括了其作为ER替代标记物的潜能(Hnatyszyn等,2010)。用GPS产生的蛋白质谱进一步支持这一概念(图13A)。
此外,破译了能够区分临床上限定的HER2-阳性和HER2-阴性样品的5种蛋白质特征(图3C)。实际上,鉴定了低丰度受体酪氨酸-蛋白激酶erbB-2(HER2-蛋白),定量,并且发现其是差异表达标记物之一。因此,将临床情况中使用GPS测量HER2的可能设想为目前使用的基于传统免疫组织化学或荧光原位杂交(FISH)的检测系统的补充。最近的研究表明五个基于HER2的测试中的一个可能产生了不正确的结果(Phillips等,2009)。此外,还发现S100-A9和生长因子受体结合的蛋白7(GRB7)在大部分HER2-阳性限定样品中呈现出提高的表达(图13B)。最近报道了高GRB7表达与高HER2-表达相关,并且用于限定具有生存降低的乳癌患者的亚群(Nadler等,2010)。S100基因家族编码低分子量钙结合蛋白,并且特异性的S100成员与癌症进展、转移相关,并且具有作为乳癌患者中抗药性预测标记物的可能(McKieman等,2011;Yang等,2011)。
最重要地,使用GOBO工具(Ringner等,2011),使用独立的数据集和正交方法(mRNA表达水平),不仅确认了反映出组织学等级的生物标记物特征,而且确认了反映出ER-状况和HER2-状况的生物标记物特征。由于其常常是通过基因特征捕获的功能性过程,而且不是重要的单独基因,因此基于与已知基因群组模块的关联,评价了上调和下调的蛋白质组(Wirapati等,2008)。与针对基质、检查点和类固醇应答的基因群组模块的显著关联特别值得注意(图5A-5B和图17)。此外,当使用组织学衍生的蛋白质分析物评价DMFS作为终点时,数据清楚地表明更差的临床结果,特别是使用下调的ECM蛋白质时的结果。因此,独立的mRNA确认,增加了针对报道的候选生物标记物特征及其在未来乳房组织肿瘤分类中的潜能的强烈支持。
总之,发明人已经证明了发明人最近研发的GPS技术平台用于临床蛋白质组发现谱测定的适用性。在这个研究中已经报道了反映出组织学等级的组织生物标记物特征,即,肿瘤进展,以及其他关键的临床实验室参数,如ER-、HER2-和Ki67-状况;这些新的组织生物标记物谱允许提高的乳癌的分类和预后。
参考文献
Aebersold,R.和Mann,M.(2003).Mass spectrometry-based proteomics.Nature422,198-207.
Benjamini,Y.和Hochberg,Y.(1995).Controlling the false discovery rate:a practical and powerful approach to multiple testing.Journal of the RoyalStatistical Society Series B 57,289-300.
Bergamaschi,A.,Tagliabue,E.,Sorlie,T.,Naume,B.,Triulzi,T.,Orlandi,R.,Russnes,H.G.,Nesland,J.M.,Tammi,R.,Auvinen,P.等.(2008).Extracellular matrixsignature identifies breast cancer subgroups with different clinicaloutcome.The Journal of pathology 214,357-367.
Bierie,B.和Moses,H.L.(2006).Tumour microenvironment:TGFbeta:themolecular Jekyll and Hyde of cancer.Nature reviews Cancer 6,506-520.
Borrebaeck,C.A.和Wingren,C.(2011).Recombinant antibodies for thegeneration of antibody arrays.Methods Mol Biol 785,247-262.
Bouchal,P.,Roumeliotis,T.,Hrstka,R.,Nenutil,R.,Vojtesek,B.和Garbis,S.D.(2009).Biomarker discovery in low-grade breast cancer using isobaricstable isotope tags and two-dimensional liquid chromatography-tandem massspectrometry(iTRAQ-2DLC-MS/MS)based quantitative proteomic analysis.Journalof proteome research 8,362-373.
Carlsson,A.,Wingren,C.,Ingvarsson,J.,Ellmark,P.,Baldertorp,B.,Ferno,M.,Olsson,H.和Borrebaeck,C.A.(2008).Serum proteome profiling of metastaticbreast cancer using recombinant antibody microarrays.Eur J Cancer 44,472-480.
Carlsson,A.,Wingren,C.,Kristensson,M.,Rose,C.,Ferno,M.,Olsson,H.,Jernstrom,H.,Ek,S.,Gustavsson,E.,Ingvar,C.等(2011).Molecular serum portraitsin patients with primary breast cancer predict the development of distantmetastases.Proceedings of the National Academy of Sciences of the UnitedStates of America 108,14252-14257.
Ciocca,D.R.和Elledge,R.(2000).Molecular markers for predictingresponse to tamoxifen in breast cancer patients.Endocrine 13,1-10.
Cortes,C.和Vapnik,V.(1995).Support-Vector Networks.Machine Learning20,273-297.
Cortez,D.,Glick,G.和Elledge,S.J.(2004).Minichromosome maintenanceproteins are direct targets of the ATM and ATR checkpoint kinases.Proceedingsof the National Academy of Sciences of the United States of America 101,10078-10083.
Desmedt,C.,Haibe-Kains,B.,Wirapati,P.,Buyse,M.,Larsimont,D.,Bontempi,G.,Delorenzi,M.,Piccart,M.和Sotiriou,C.(2008).Biological processes associatedwith breast cancer clinical outcome depend on the molecular subtypes.Clinicalcancer research:an official journal of the American Association for CancerResearch 14,5158-5165.
Deutsch,E.W.,Lam,H.和Aebersold,R.(2008).PeptideAtlas:a resource fortarget selection for emerging targeted proteomics workflows.EMBO reports 9,429-434.
Dowsett,M.,Goldhirsch,A.,Hayes,D.F.,Senn,H.J.,Wood,W.和Viale,G.(2007).International Web-based consultation on priorities for translationalbreast cancer research.Breast cancer research:BCR 9,R81.
Elston,C.W.和Ellis,I.O.(1991).Pathological prognostic factors inbreast cancer.I.The value of histological grade in breast cancer:experiencefrom a large study with long-term follow-up.Histopathology 19,403-410.
Fata,J.E.,Werb,Z.和Bissell,M.J.(2004).Regulation of mammary glandbranching morphogenesis by the extracellular matrix and its remodelingenzymes.Breast cancer research:BCR 6,1-11.
Frierson,H.F.,Jr.,Wolber,R.A.,Berean,K.W.,Franquemont,D.W.,Gaffey,M.J.,Boyd,J.C.和Wilbur,D.C.(1995).Interobserver reproducibility of theNottingham modification of the Bloom and Richardson histologic grading schemefor infiltrating ductal carcinoma.American journal of clinical pathology 103,195-198.
Geiger,T.,Cox,J.,Ostasiewicz,P.,Wisniewski,J.R.和Mann,M.(2010).Super-SILAC mix for quantitative proteomics of human tumor tissue.Nature methods 7,383-385.
Geiger,T.,Madden,S.F.,Gallagher,W.M.,Cox,J.和Mann,M.(2012).Proteomicportrait of human breast cancer progression identifies novel prognosticmarkers.Cancer research.
Gong,Y.,Wang,N.,Wu,F.,Cass,C.E.,Damaraju,S.,Mackey,J.R.和Li,L.(2008).Proteome profile of human breast cancer tissue generated by LC-ESI-MS/MScombined with sequential protein precipitation and solubilization.Journal ofproteome research 7,3583-3590.
Ha,S.A.,Shin,S.M.,Namkoong,H.,Lee,H.,Cho,G.W.,Hur,S.Y.,Kim,T.E.和Kim,J.W.(2004).Cancer-associated expression of minichromosome maintenance 3genein several human cancers and its involvement in tumorigenesis.Clinical cancerresearch:an official journal of the American Association for Cancer Research10,8386-8395.
Hakkinen,J.,Vincic,G.,Mansson,O.,Warell,K.和Levander,F.(2009).Theproteios software environment:an extensible multiuser platform for managementand analysis of proteomics data.Journal of proteome research 8,3037-3043.
Hanahan,D.和Weinberg,R.A.(2000).The hallmarks of cancer.Cell 100,57-70.
Hanahan,D.,and Weinberg,R.A.(2011).Hallmarks of cancer:the nextgeneration.Cell 144,646-674.
Hanash,S.(2003).Disease proteomics.Nature 422,226-232.
Hnatyszyn,H.J.,Liu,M.,Hilger,A.,Herbert,L.,Gomez-Fernandez,C.R.,Jorda,M.,Thomas,D.,Rae,J.M.,El-Ashry,D.和Lippman,M.E.(2010).Correlation ofGREB1mRNAwith protein expression in breast cancer:validation of a novelGREB1monoclonal antibody.Breast cancer research and treatment 122,371-380.
Hondermarck,H.,Tastet,C.,El Yazidi-Belkoura,I.,Toillon,R.A.和LeBourhis,X.(2008).Proteomics of breast cancer:the quest for markers andtherapeutic targets.Journal of proteome research 7,1403-1411.
Hudis,C.A.(2007).Trastuzumab--mechanism of action and use in clinicalpractice.The New England journal of medicine 357,39-51.
Ivshina,A.V.,George,J.,Senko,O.,Mow,B.,Putti,T.C.,Smeds,J.,Lindahl,T.,Pawitan,Y.,Hall,P.,Nordgren,H.等(2006).Genetic reclassification ofhistologic grade delineates new clinical subtypes of breast cancer.Cancerresearch 66,10292-10301.
Jemal,A.,Bray,F.,Center,M.M.,Ferlay,J.,Ward,E.和Forman,D.(2011).Global cancer statistics.CA:a cancer journal for clinicians 61,69-90.
Johnson,N.,Li,Y.C.,Walton,Z.E.,Cheng,K.A.,Li,D.,Rodig,S.J.,Moreau,L.A.,Unitt,C.,Bronson,R.T.,Thomas,H.D.等(2011).Compromised CDK1activitysensitizes BRCA-proficient cancers to PARP inhibition.Nature medicine 17,875-882.
Kang,S.,Kim,M.J.,An,H.,Kim,B.G.,Choi,Y.P.,Kang,K.S.,Gao,M.Q.,Park,H.,Na,H.J.,Kim,H.K.等(2010).Proteomic molecular portrait of interface zone inbreast cancer.Journal of proteome research 9,5638-5645.
Kuhn,U.和Wahle,E.(2004).Structure and function of poly(A)bindingproteins.Biochimica et biophysica acta 1678,67-84.
Lasko,T.A.,Bhagwat,J.G.,Zou,K.H.和Ohno-Machado,L.(2005).The use ofreceiver operating characteristic curves in biomedical informatics.Journal ofbiomedical informatics 38,404-415.
Malumbres,M.和Barbacid,M.(2009).Cell cycle,CDKs and cancer:a changingparadigm.Nature reviews Cancer 9,153-166.
Mangus,D.A.,Evans,M.C.和Jacobson,A.(2003).Poly(A)-binding proteins:multifunctional scaffolds for the post-transcriptional control of geneexpression.Genome biology 4,223.
McKiernan,E.,McDermott,E.W.,Evoy,D.,Crown,J.和Duffy,M.J.(2011).Therole of S100genes in breast cancer progression.Tumour biology:the journal ofthe International Society for Oncodevelopmental Biology and Medicine 32,441-450.
Moon,J.S.,Kim,H.E.,Koh,E.,Park,S.H.,Jin,W.J.,Park,B.W.,Park,S.W.和Kim,K.S.(2011).Kruppel-like factor 4(KLF4)activates the transcription of thegene for the platelet isoform of phosphofructokinase(PFKP)in breastcancer.The Journal of biological chemistry 286,23808-23816.
Nadler,Y.,Gonzalez,A.M.,Camp,R.L.,Rimm,D.L.,Kluger,H.M.和Kluger,Y.(2010).Growth factor receptor-bound protein-7(Grb7)as a prognostic marker andtherapeutic target in breast cancer.Annals of oncology:official journal ofthe European Society for Medical Oncology/ESMO 21,466-473.
Olsson,N.,James,P.,Borrebaeck,C.A.和Wingren,C.(2012).Quantitativeproteomics targeting classes of motif-containing peptides usingimmunoaffinity-based mass spectrometry.Submitted.
Olsson,N.,Wingren,C.,Mattsson,M.,James,P.,D,O.C.,Nilsson,F.,Cahill,D.J.和Borrebaeck,C.A.(2011).Proteomic analysis and discovery using affinityproteomics and mass spectrometry.Molecular&cellular proteomics:MCP 10,M110003962.
Olsson,N.,Wingren,C.,Mattsson,M.,James,P.,D,O.C.,Nilsson,F.,Cahill,D.J.,和Borrebaeck,C.A.(2011).Proteomic analysis and discovery using affinityproteomics and mass spectrometry.Molecular&cellular proteomics:MCP 10,M110003962.
Paik,S.,Shak,S.,Tang,G.,Kim,C.,Baker,J.,Cronin,M.,Baehner,F.L.,Walker,M.G.,Watson,D.,Park,T.等(2004).A multigene assay to predict recurrenceof tamoxifen-treated,node-negative breast cancer.The New England journal ofmedicine 351,2817-2826.
Pavlidis,P.和Noble,W.S.(2003).Matrix2png:a utility for visualizingmatrix data.Bioinformatics 19,295-296.
Pei,D.S.,Qian,G.W.,Tian,H.,Mou,J.,Li,W.和Zheng,J.N.(2012).Analysis ofhuman Ki-67gene promoter and identification of the Sp1binding sites for Ki-67transcription.Tumour biology:the journal of the International Society forOncodevelopmental Biology and Medicine 33,257-266.
Perou,C.M.,Sorlie,T.,Eisen,M.B.,van de Rijn,M.,Jeffrey,S.S.,Rees,C.A.,Pollack,J.R.,Ross,D.T.,Johnsen,H.,Akslen,L.A.等(2000).Molecularportraits of human breast tumours.Nature 406,747-752.
Phillips,K.A.,Marshall,D.A.,Haas,J.S.,Elkin,E.B.,Liang,S.Y.,Hassett,M.J.,Ferrusi,I.,Brock,J.E.和Van Bebber,S.L.(2009).Clinical practice patternsand cost effectiveness of human epidermal growth receptor 2 testingstrategies in breast cancer patients.Cancer 115,5166-5174.
Place,A.E.,Jin Huh,S.和Polyak,K.(2011).The microenvironment in breastcancer progression:biology and implications for treatment.Breast cancerresearch:BCR 13,227.
Rae,J.M.,Johnson,M.D.,Scheys,J.O.,Cordero,K.E.,Larios,J.M.和Lippman,M.E.(2005).GREB 1is a critical regulator of hormone dependent breast cancergrowth.Breast cancer research and treatment 92,141-149.
Ringner,M.,Fredlund,E.,Hakkinen,J.,Borg,A.和Staaf,J.(2011).GOBO:geneexpression-based outcome for breast cancer online.PloS one 6,e17911.
Robbins,P.,Pinder,S.,de Klerk,N.,Dawkins,H.,Harvey,J.,Sterrett,G.,Ellis,I.和Elston,C.(1995).Histological grading of breast carcinomas:a studyof interobserver agreement.Human pathology 26,873-879.
Rochefort,H.,Glondu,M.,Sahla,M.E.,Platet,N.和Garcia,M.(2003).How totarget estrogen receptor-negative breast cancer?Endocrine-related cancer 10,261-266.
Slamon,D.J.,Leyland-Jones,B.,Shak,S.,Fuchs,H.,Paton,V.,Bajamonde,A.,Fleming,T.,Eiermann,W.,Wolter,J.,Pegram,M.等(2001).Use of chemotherapy plus amonoclonal antibody against HER2for metastatic breast cancer thatoverexpresses HER2.The New England journal of medicine 344,783-792.
Soderlind,E.,Strandberg,L.,Jirholt,P.,Kobayashi,N.,Alexeiva,V.,Aberg,A.M.,Nilsson,A.,Jansson,B.,Ohlin,M.,Wingren,C.等(2000).Recombining germline-derived CDR sequences for creating diverse single-framework antibodylibraries.Nature biotechnology 18,852-856.
Sorlie,T.,Perou,C.M.,Tibshirani,R.,Aas,T.,Geisler,S.,Johnsen,H.,Hastie,T.,Eisen,M.B.,van de Rijn,M.,Jeffrey,S.S.等(2001).Gene expressionpatterns of breast carcinomas distinguish tumor subclasses with clinicalimplications.Proceedings of the National Academy of Sciences of the UnitedStates of America 98,10869-10874.
Sotiriou,C.,Wirapati,P.,Loi,S.,Harris,A.,Fox,S.,Smeds,J.,Nordgren,H.,Farmer,P.,Praz,V.,Haibe-Kains,B.等(2006).Gene expression profiling in breastcancer:understanding the molecular basis of histologic grade to improveprognosis.Journal of the National Cancer Institute 98,262-272.
Strande,V.,Canelle,L.,Tastet,C.,Burlet-Schiltz,O.,Monsarrat,B.和Hondermarck,H.(2009).The proteome of the human breast cancer cell line MDA-MB-231:Analysis by LTQ-Orbitrap mass spectrometry.Proteomics Clinicalapplications 3,41-50.
Sutton,C.W.,Rustogi,N.,Gurkan,C.,Scally,A.,Loizidou,M.A.,Hadjisavvas,A.和Kyriacou,K.(2010).Quantitative proteomic profiling of matched normal andtumor breast tissues.Journal of proteome research 9,3891-3902.
Turashvili,G.,Bouchal,J.,Baumforth,K.,Wei,W.,Dziechciarkova,M.,Ehrmann,J.,Klein,J.,Fridman,E.,Skarda,J.,Srovnal,J.等(2007).Novel markers fordifferentiation of lobular and ductal invasive breast carcinomas by lasermicrodissection and microarray analysis.BMC cancer 7,55.
Uhlen,M.,Oksvold,P.,Fagerberg,L.,Lundberg,E.,Jonasson,K.,Forsberg,M.,Zwahlen,M.,Kampf,C.,Wester,K.,Hober,S.等(2010).Towards a knowledge-basedHuman Protein Atlas.Nature biotechnology 28,1248-1250.
van de Vijver,M.J.,He,Y.D.,van't Veer,L.J.,Dai,H.,Hart,A.A.,Voskuil,D.W.,Schreiber,G.J.,Peterse,J.L.,Roberts,C.,Marton,M.J.等(2002).A gene-expression signature as a predictor of survival in breast cancer.The NewEngland journal of medicine 347,1999-2009.
van't Veer,L.J.,Dai,H.,van de Vijver,M.J.,He,Y.D.,Hart,A.A.,Mao,M.,Peterse,H.L.,van der Kooy,K.,Marton,M.J.,Witteveen,A.T.等(2002).Geneexpression profiling predicts clinical outcome of breast cancer.Nature 415,530-536.
Wang,T.H.,Chao,A.,Tsai,C.L.,Chang,C.L.,Chen,S.H.,Lee,Y.S.,Chen,J.K.,Lin,Y.J.,Chang,P.Y.,Wang,C.J.等(2010).Stress-induced phosphoprotein 1as asecreted biomarker for human ovarian cancer promotes cancer cellproliferation.Molecular&cellular proteomics:MCP 9,1873-1884.
Wingren,C.,James,P.和Borrebaeck,C.A.(2009).Strategy for surveying theproteome using affinity proteomics and mass spectrometry.Proteomics 9,1511-1517.
Wirapati,P.,Sotiriou,C.,Kunkel,S.,Farmer,P.,Pradervand,S.,Haibe-Kains,B.,Desmedt,C.,Ignatiadis,M.,Sengstag,T.,Schutz,F.等(2008).Meta-analysisof gene expression profiles in breast cancer:toward a unified understandingof breast cancer subtyping and prognosis signatures.Breast cancer research:BCR 10,R65.
Yang,W.S.,Moon,H.G.,Kim,H.S.,Choi,E.J.,Yu,M.H.,Noh,D.Y.和Lee,C.(2011).Proteomic Approach Reveals FKBP4and S100A9as Potential PredictionMarkers of Therapeutic Response to Neoadjuvant Chemotherapy in Patients withBreast Cancer.Journal of proteome research.
Zhang,L.,Reidy,S.P.,Bogachev,O.,Hall,B.K.,Majdalawieh,A.和Ro,H.S.(2011).Lactation defect with impaired secretory activation in AEBP1-nullmice.PloS one 6,e27795.
表2:用于确定乳癌相关疾病状态的生物标记物的推荐名称
表3:示例性生物标记物组合的ROC AUC值
表4:组织学等级SVM脚本
补充表1
补充表2
*关于结合剂特征的详细内容,参见Olsson等(2011)MCP M110.003962.

Claims (51)

1.至少两种选自表1中限定的生物标记物的结合部分在制备用于确定乳癌相关疾病状态的试剂盒中的用途,其包括步骤:
a)提供待测试的人乳癌组织样品;和
b)通过测量测试样品中至少两种选自表1中限定的生物标记物的存在和/或含量来确定测试样品的生物标记物特征;
其中所述乳癌相关疾病状态为乳癌细胞的组织学等级和/或无转移生存时间,
其中所述至少两种生物标记物包括KERA和SPON1;且
其中测试样品中至少两种选自表1中限定的生物标记物的存在和/或含量表示乳癌相关的疾病状态。
2.根据权利要求1的用途,其中乳癌相关疾病状态是乳癌细胞的组织学等级。
3.根据权利要求2的用途,其中该用途进一步包括步骤:
c)提供一种或多种包括组织学等级1乳癌细胞、组织学等级2乳癌细胞和/或组织学等级3乳癌细胞或由组织学等级1乳癌细胞、组织学等级2乳癌细胞和/或组织学等级3乳癌细胞组成的对照样品;和
d)通过测量对照样品中步骤(b)中测量的至少两种生物标记物的存在和/或含量来确定对照样品的生物标记物特征;
其中测试样品中步骤(b)中测量的至少两种生物标记物的存在和/或含量符合以下的情况下鉴定了乳癌细胞的组织学等级:
i)对应于包括第一个组织学等级的乳癌细胞或由第一个组织学等级的乳癌细胞组成的对照样品中的存在和/或含量;
ii)不同于包括第二个组织学等级的乳癌细胞或由第二个组织学等级的乳癌细胞组成的对照样品中的存在和/或含量;和/或
iii)不同于包括第三个组织学等级的乳癌细胞或由第三个组织学等级的乳癌细胞组成的对照样品中的存在和/或含量。
4.根据权利要求3的用途,其中每个对照样品包括单个组织学等级的乳癌细胞或由单个组织学等级的乳癌细胞组成。
5.根据权利要求3或4的用途,其中步骤(c)包括以下或由以下组成:
i)提供一种或多种包括组织学等级1乳癌细胞或由组织学等级1乳癌细胞组成的对照样品;提供一种或多种包括组织学等级2乳癌细胞或由组织学等级2乳癌细胞组成的对照样品;和提供一种或多种包括组织学等级3乳癌细胞或由组织学等级3乳癌细胞组成的对照样品;
ii)提供一种或多种包括组织学等级1乳癌细胞或由组织学等级1乳癌细胞组成的对照样品;和提供一种或多种包括组织学等级2乳癌细胞或由组织学等级2乳癌细胞组成的对照样品;
iii)提供一种或多种包括组织学等级1乳癌细胞或由组织学等级1乳癌细胞组成的对照样品;和提供一种或多种包括组织学等级3乳癌细胞或由组织学等级3乳癌细胞组成的对照样品;
iv)提供一种或多种包括组织学等级2乳癌细胞或由组织学等级2乳癌细胞组成的对照样品;和提供一种或多种包括组织学等级3乳癌细胞或由组织学等级3乳癌细胞组成的对照样品;
v)提供一种或多种包括组织学等级1乳癌细胞或由组织学等级1乳癌细胞组成的对照样品;
vi)提供一种或多种包括组织学等级2乳癌细胞或由组织学等级2乳癌细胞组成的对照样品;或
vii)提供一种或多种包括组织学等级3乳癌细胞或由组织学等级3乳癌细胞组成的对照样品。
6.根据权利要求1的用途,其中乳癌相关疾病状态是个体的无转移生存时间。
7.根据权利要求6的用途,其中该用途进一步包括步骤:
c)提供一种或多种包括来自具有低于10年无转移生存的个体的乳癌细胞或由来自具有低于10年无转移生存个体的乳癌细胞组成的第一个对照样品;和/或一种或多种包括来自具有10年或更长时间的无转移生存个体的乳癌细胞或由来自具有10年或更长时间的无转移生存个体的乳癌细胞组成的第二个对照样品;和
d)通过测量对照样品中步骤(b)中测量的至少两种生物标记物的存在和/或含量来确定对照样品的生物标记物特征;
其中个体的无转移生存时间在步骤(b)中测量的至少两种生物标记物的存在和/或含量对应于第一个对照样品的存在和/或含量和/或不同于第二个对照样品的存在和/或含量的情况下鉴定为少于10年;
和其中个体的无转移生存时间在步骤(b)中测量的至少两种生物标记物的存在和/或含量不同于第一个对照样品的存在和/或含量和/或对应于第二个对照样品的存在和/或含量的情况下鉴定为超过10年。
8.根据权利要求7的用途,其中一种或多种第一个和/或第二个对照样品与待测试样品具有相同的组织学等级。
9.根据权利要求2的用途,其中步骤(b)包括测量测试样品中一种或多种选自表1的B)部分中限定的生物标记物的存在和/或含量。
10.根据权利要求2的用途,其中步骤(b)包括测量测试样品中一种或多种选自表1的C)部分中限定的生物标记物的存在和/或含量。
11.根据权利要求2的用途,其中步骤(b)包括测量测试样品中一种或多种选自表1的D)部分中限定的生物标记物的存在和/或含量。
12.根据权利要求2的用途,其中步骤(b)包括测量测试样品中一种或多种选自表1的E)部分中限定的生物标记物的存在和/或含量。
13.根据权利要求2的用途,其中步骤(b)包括测量测试样品中表1中限定的全部生物标记物的存在和/或含量。
14.根据权利要求6的用途,其中步骤(b)包括测量测试样品中一种或多种选自表1的B)部分中限定的生物标记物的存在和/或含量。
15.根据权利要求6的用途,其中步骤(b)包括测量测试样品中一种或多种选自表1的D)部分中限定的生物标记物的存在和/或含量。
16.根据权利要求6的用途,其中步骤(b)包括测量测试样品中表1的A)、B)和D)部分中限定的全部生物标记物的存在和/或含量。
17.根据权利要求6的用途,其中步骤(b)包括测量测试样品中一种或多种选自表1的C)部分中限定的生物标记物的存在和/或含量。
18.根据权利要求6的用途,其中步骤(b)包括测量测试样品中一种或多种选自表1的E)部分中限定的生物标记物的存在和/或含量。
19.根据权利要求6的用途,其中步骤(b)包括测量测试样品中表1的C)和E)部分中限定的全部生物标记物的存在和/或含量。
20.根据权利要求6的用途,其中步骤(b)包括测量测试样品中表1中限定的全部生物标记物的存在和/或含量。
21.根据权利要求1的用途,其中步骤(b)包括测量编码至少两种生物标记物的核酸分子的表达。
22.根据权利要求21的用途,其中核酸分子是cDNA分子或mRNA分子。
23.根据权利要求22的用途,其中核酸分子是mRNA分子。
24.根据权利要求22或23的用途,其中使用选自Southern杂交、Northern杂交、聚合酶链式反应(PCR)、纳米阵列、微阵列、大阵列、放射自显影术和原位杂交的方法来进行步骤(b)中测量至少两种生物标记物的表达。
25.根据权利要求22的用途,其中使用DNA微阵列确定步骤(b)中至少两种生物标记物表达的测量。
26.根据权利要求1的用途,其中使用至少两种结合部分进行步骤(b)中测量至少两种生物标记物的表达,每个所述结合部分能够选择性地结合编码表1中鉴定的生物标记物之一的核酸分子。
27.根据权利要求26的用途,其中至少两种结合部分各自包括核酸分子或由核酸分子组成。
28.根据权利要求27的用途,其中至少两种结合部分各自包括DNA、RNA、PNA、LNA、GNA、TNA或PMO或由DNA、RNA、PNA、LNA、GNA、TNA或PMO组成。
29.根据权利要求27或28的用途,其中至少两种结合部分各自包括DNA或由DNA组成。
30.根据权利要求27的用途,其中至少两种结合部分是5至100个核苷酸长。
31.根据权利要求27的用途,其中至少两种核酸分子是15至35个核苷酸长。
32.根据权利要求27的用途,其中结合部分包括可检测部分。
33.根据权利要求1的用途,其中步骤(b)包括测量至少两种生物标记物的蛋白质或多肽的表达。
34.根据权利要求33的用途,其中使用至少两种结合部分进行步骤(b)中测量至少两种或多种生物标记物的表达,每个所述结合部分能够选择性地结合表1中鉴定的生物标记物之一。
35.根据权利要求34的用途,其中至少两种结合部分包括抗体或其抗原结合片段或由抗体或其抗原结合片段组成。
36.根据权利要求35的用途,其中抗体或其片段是单克隆抗体或其片段。
37.根据权利要求35或36的用途,其中抗体或其抗原结合片段选自完整抗体、Fv片段、Fab-样片段、单个可变结构域和结构域抗体。
38.根据权利要求37的用途,其中抗体或抗原结合片段是单链Fv。
39.根据权利要求38的用途,其中至少两种结合部分包括抗体样结合剂或由抗体样结合剂组成。
40.根据权利要求34的用途,其中至少两种结合部分包括可检测部分。
41.根据权利要求32或40的用途,其中可检测部分选自发光部分、放射性部分和酶部分。
42.根据权利要求41的用途,其中可检测部分包括放射性原子或由放射性原子组成。
43.根据权利要求42的用途,其中放射性原子选自锝-99m、碘-123、碘-125、碘-131、铟-111、氟-19、碳-13、氮-15、氧-17、磷-32、硫-35、氘、氚、铼-186、铼-188和钇-90。
44.根据权利要求42的用途,其中结合部分的可检测部分是荧光部分。
45.根据权利要求1的用途,其中在步骤(b)之前,处理步骤(a)中提供的样品,使得用生物素标记样品中存在的任何生物标记物,并且使用包括荧光可检测部分和抗生物素蛋白链菌素的检测剂进行步骤(b)。
46.根据权利要求1的用途,其中通过ROC AUC值测定的方法的预测准确性为至少0.50。
47.根据权利要求46的用途,其中通过ROC AUC值测定的方法的预测准确性为至少0.80。
48.根据权利要求1的用途,其中使用阵列进行步骤(b)。
49.根据权利要求48的用途,其中阵列是基于珠子的阵列。
50.根据权利要求48的用途,其中阵列是基于表面的阵列。
51.根据权利要求48的用途,其中阵列选自:大阵列;微阵列;纳米阵列。
CN201380029458.3A 2012-04-10 2013-04-10 用于确定乳癌相关疾病状态的方法和用于该方法中的阵列 Expired - Fee Related CN104508486B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710403116.3A CN107782901A (zh) 2012-04-10 2013-04-10 用于确定乳癌相关疾病状态的方法和用于该方法中的阵列

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1206323.6A GB201206323D0 (en) 2012-04-10 2012-04-10 Methods and arrays for use in the same
GB1206323.6 2012-04-10
PCT/IB2013/052858 WO2013153524A1 (en) 2012-04-10 2013-04-10 Methods for determining a breast cancer-associated disease state and arrays for use in the methods

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201710403116.3A Division CN107782901A (zh) 2012-04-10 2013-04-10 用于确定乳癌相关疾病状态的方法和用于该方法中的阵列

Publications (2)

Publication Number Publication Date
CN104508486A CN104508486A (zh) 2015-04-08
CN104508486B true CN104508486B (zh) 2019-06-04

Family

ID=46177101

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201380029458.3A Expired - Fee Related CN104508486B (zh) 2012-04-10 2013-04-10 用于确定乳癌相关疾病状态的方法和用于该方法中的阵列
CN201710403116.3A Pending CN107782901A (zh) 2012-04-10 2013-04-10 用于确定乳癌相关疾病状态的方法和用于该方法中的阵列

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201710403116.3A Pending CN107782901A (zh) 2012-04-10 2013-04-10 用于确定乳癌相关疾病状态的方法和用于该方法中的阵列

Country Status (10)

Country Link
US (2) US20150057177A1 (zh)
EP (1) EP2836838A4 (zh)
JP (1) JP6470681B2 (zh)
KR (1) KR20140143457A (zh)
CN (2) CN104508486B (zh)
AU (1) AU2013248138B2 (zh)
CA (1) CA2869696A1 (zh)
GB (1) GB201206323D0 (zh)
MX (1) MX2014012192A (zh)
WO (1) WO2013153524A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201410226D0 (en) * 2014-06-09 2014-07-23 Immunovia Ab Methods and arrays for use in the same
CN106596494B (zh) * 2016-12-29 2019-05-10 青岛科技大学 一种基于荧光传感阵列的快速筛查早中晚期乳腺癌技术
GB201701572D0 (en) * 2017-01-31 2017-03-15 Immunovia Ab Methods, arrays and uses thereof
CN111458512A (zh) * 2019-01-21 2020-07-28 中国科学院分子细胞科学卓越创新中心 一种动脉粥样硬化生物标志物及其用途
JP7352937B2 (ja) * 2019-07-19 2023-09-29 公立大学法人福島県立医科大学 乳癌のサブタイプを鑑別又は分類するための鑑別マーカー遺伝子セット、方法およびキット
EP4278016A1 (en) * 2021-01-15 2023-11-22 Universite De Fribourg Biomarkers for breast cancer detection

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005005601A2 (en) * 2003-06-09 2005-01-20 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
WO2008048193A2 (en) * 2006-10-20 2008-04-24 Agency For Science, Technology And Research Breast tumour grading
WO2009132909A1 (en) * 2008-04-29 2009-11-05 Siemens Healthcare Diagnostics Gmbh A method for predicting a clinical response of a patient suffering from or at risk of developing cancer towards a given mode of treatment
WO2010088386A1 (en) * 2009-01-28 2010-08-05 University Of Notre Dame Du Lac Accelerated progression relapse test

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1876241A3 (en) * 1996-01-11 2008-07-30 Corixa Corporation Compositions and methods for the treatment and diagnosis of breast cancer
EP1468110A4 (en) * 2001-06-10 2008-01-30 Irm Llc MOLECULAR SIGNATURES NORMALLY TO THE DEATH LEADING CARCINOME
CN1839205B (zh) * 2003-05-29 2012-05-16 千年药品公司 用于鉴定、评估、预防和治疗乳腺癌的组合物、试剂盒及方法
WO2005080570A1 (ja) * 2004-02-24 2005-09-01 Mitsubishi Rayon Co., Ltd. 乳癌の術後予後予測に関与する遺伝子
JP2005270093A (ja) * 2004-02-24 2005-10-06 Nippon Medical School 乳癌の術後予後予測に関与する遺伝子
WO2006105642A1 (en) * 2005-04-05 2006-10-12 British Columbia Cancer Agency Biomarkers for the detection of lung cancer and uses thereof
US20070099209A1 (en) * 2005-06-13 2007-05-03 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
JP5196465B2 (ja) * 2007-04-24 2013-05-15 公益財団法人東京都農林水産振興財団 Mmp遺伝子発現促進剤、および、コラーゲン分解促進剤
NZ562237A (en) * 2007-10-05 2011-02-25 Pacific Edge Biotechnology Ltd Proliferation signature and prognosis for gastrointestinal cancer
GB0723179D0 (en) * 2007-11-27 2008-01-02 Immunovia Ab Diagnostic methods and arrays for use in the same
JP2010151800A (ja) * 2008-11-06 2010-07-08 Kumamoto Univ 生活習慣病及び/又は癌の診断剤
WO2010076322A1 (en) * 2008-12-30 2010-07-08 Siemens Healthcare Diagnostics Inc. Prediction of response to taxane/anthracycline-containing chemotherapy in breast cancer
EP3556867A1 (en) * 2009-11-23 2019-10-23 Genomic Health, Inc. Methods to predict clinical outcome of cancer
JPWO2011065533A1 (ja) * 2009-11-30 2013-04-18 国立大学法人大阪大学 乳癌術前化学療法に対する感受性の判定方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005005601A2 (en) * 2003-06-09 2005-01-20 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
WO2008048193A2 (en) * 2006-10-20 2008-04-24 Agency For Science, Technology And Research Breast tumour grading
WO2009132909A1 (en) * 2008-04-29 2009-11-05 Siemens Healthcare Diagnostics Gmbh A method for predicting a clinical response of a patient suffering from or at risk of developing cancer towards a given mode of treatment
WO2010088386A1 (en) * 2009-01-28 2010-08-05 University Of Notre Dame Du Lac Accelerated progression relapse test

Also Published As

Publication number Publication date
GB201206323D0 (en) 2012-05-23
CA2869696A1 (en) 2013-10-17
MX2014012192A (es) 2015-05-11
US20180284120A1 (en) 2018-10-04
EP2836838A1 (en) 2015-02-18
WO2013153524A1 (en) 2013-10-17
JP2015519043A (ja) 2015-07-09
JP6470681B2 (ja) 2019-02-13
WO2013153524A9 (en) 2014-03-13
AU2013248138B2 (en) 2019-01-17
EP2836838A4 (en) 2016-03-30
KR20140143457A (ko) 2014-12-16
CN107782901A (zh) 2018-03-09
US20150057177A1 (en) 2015-02-26
AU2013248138A1 (en) 2014-11-27
CN104508486A (zh) 2015-04-08

Similar Documents

Publication Publication Date Title
JP6971219B2 (ja) 横断組織切片のユーザー定義領域における複数のタンパク質の同時定量
JP6971218B2 (ja) 横断組織切片のユーザー定義領域における遺伝子発現の同時定量
CN104508486B (zh) 用于确定乳癌相关疾病状态的方法和用于该方法中的阵列
KR102014890B1 (ko) 췌장암의 존재를 결정하기 위한 방법, 어레이 및 그의 용도
KR102240473B1 (ko) 방법, 어레이 및 그의 용도
Olsson et al. Grading breast cancer tissues using molecular portraits
JP2021165745A (ja) 方法、アレイ、およびその使用
SG192910A1 (en) ALTERNATIVELY SPLICED mRNA ISOFORMS AS PROGNOSTIC INDICATORS FOR METASTATIC CANCER
JP6674889B2 (ja) 前立腺がんに対するバイオマーカー検出における使用のための方法とアレイ
Jain Innovations, challenges and future prospects of oncoproteomics
US20240060981A1 (en) Ovarian cancer biomarker detection through ovarian blood sampling
US20190284642A1 (en) Biomarkers for the prognosis and diagnosis of cancer
Wang et al. Distinguishing of tumor cell-targeting peptide ligands through a color-encoding microarray
CN106011142B (zh) 一种特异识别psa蛋白的寡核苷酸配基p7-26的序列和应用
JP2019032334A (ja) 乳癌関連の疾患状態を決定する方法およびこの方法における使用のためのアレイ
Lee et al. Conventional and proteomic technologies for the detection of early stage malignancies: markers for ovarian cancer
Class et al. Patent application title: METHODS FOR DETERMINING A BREAST CANCER-ASSOCIATED DISEASE STATE AND ARRAYS FOR USE IN THE METHODS Inventors: Carl Arne Krister Borrebaeck (Lund, SE) Carl Arne Krister Borrebaeck (Lund, SE) Christer Lars Bertil Wingren (Sandby, SE)
EP4314347A1 (en) Proteogenomic analysis of non-small cell lung cancer
Jain et al. Oncoproteomics
Pandey BioMed Research International

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190604

Termination date: 20210410