用于检测卵巢癌的生物标记的用途
本申请要求受益于于2002年8月6日提交的美国临时申请号60/401,837;于2003年1月21日提交的美国临时申请号60/441,727;于2003年4月4日提交的美国临时申请号60/460,342,该所有申请在此全文引入以供参考。
技术领域
本发明提供检测卵巢癌的重要生物标记。该些生物标记确认,通过辨别卵巢癌病人与健康个体的血清蛋白质图谱,并运用表面加强激光析电离(surfaceenhanced laser desorption/ionization,SELDI)分析法。本发明是关于生物标记的系统与方法,于此系统与方法中该些生物标记用于评定卵巢癌状态。本发明也确认该些生物标记为已知蛋白质。
现有技术
卵巢癌是发达国家中最致命的妇科恶性疾病中的一个。光是美国,每年诊断出约有23,000名妇女有此疾病,且几乎有14,000名妇女死于卵巢癌(Jamal,A.,etal.,CA Cancer J.Clin,2002;52:23-47)。虽然于癌症治疗方面有进步,然而卵巢癌死亡率在过去二十年事实上依旧无改变。陡峭的存活率梯度与诊断出卵巢癌时的卵巢癌状态有关,于改善卵巢癌病人长期存活率方面,早期检验依旧是最重要方法。
于癌症末期诊断出卵巢癌,有不佳的卵巢癌预后;与确认的诊断程序相关的成本及风险;以及一般女性中相对低普及的卵巢癌诊断,这些都对用于一般女性卵巢癌筛检的试验,于灵敏度及专一性方面提出非常严峻的要求。
适合于早期检测的肿瘤标记确认及癌症诊断,对改善病人临床结果具有很大的希望。这对模糊不明,或无症状,或物理检查相当不可行的肿瘤病人而言,尤其重要。虽然相当多的努力指向早期检测,然而并无有效成本的筛检试验发展出来(Paley PJ.,Curr Opin Oncol,2001;13(5):399-402),且妇女于诊断时通常带有传染的疾病(Ozols RF,et al.,上皮细胞卵巢癌(Epithelial ovarian cancer).In:Hoskins WJ,Perez CA,Young RC,编着,妇科肿瘤科的原理与实务(Principles and Practice ofGynecologic Oncology).3rd ed.Philadelphia:Lippincott,Williams and Wilkins;2000.p.981-1057)。
最特征化的肿瘤标记,CA125,于卵巢癌I期,大约30至40%是阴性,且于各种良性疾病中,CA125的量会升高(Meyer T,et al.,Br J Cancer,2000;82(9):1535-8;Buamah P.,J Surg Oncol,2000;75(4):264-5;Tuxen MK,et al.,Cancer Treat Rev,1995;21(3):215-45)。使用CA125作为以人口为基础的早期卵巢癌检测及诊断的筛检工具,遇到低灵敏度及专一性问题(MacDonald ND,et al.,Eur J Obstet Gynecol ReprodBiol,1999;82(2):155-7;Jacobs I,et al.,Hum Reprod,1989;4(1):1-12;Shih I-M,et al.,卵巢癌中的肿瘤标记(Tumor markers in ovarian cancer).In:Diamandis EP,Fritsche,H.,Lilja,H.,Chan,D.W.,and Schwartz,M.,编着.肿瘤标记生理学、疾病生物学、技术及临床应用(Tumor markers physiology,pathobiology,technology and clinicalapplications).Philadelphia:AACC Press;印刷中)。虽然骨盆及最近的阴道超音波扫描已用于高风险病人筛检,然而既无具足够灵敏度亦无具足够专一性的技术应用至一般妇女筛检上(MacDonald ND,et al.,见前文)。最近则致力于使用CA125与其它肿瘤标记的组合(Woolas RP XF,et al.,J Natl Cancer Inst,1993;85(21):1748-51;Woolas RP,et al.,Gynecol Oncol,1995;59(1):111-6;Zhang Z,et al.,Gynecol Oncol,1999;73(1):56-61;Zhang Z,et al.,使用多重标记检测I期上皮细胞卵巢癌:神经网络分析改善结果(Use of Multiple Markers to Detect Stage I Epithelial Ovarian Cancers:Neural Network Analysis Improves Performance).American Society of Clinical Oncology2001;年会摘要)于癌症模型的垂直风险研究上(Skates SJ,et al.,Cancer,1995;76(10Suppl):2004-10),以及与超音波串联作为第二线试验(Jacobs I DA,et al.,Br Med J,1993;306(6884):1030-34;Menon U TA,et al.,British Journal of Obstetrics andGynecology,2000;107(2):165-69),于改善整个试验专一性方面已显示希望的结果,但对诸如有相当低普及筛检的卵巢癌疾病而言,这是不足的。
由于卵巢癌末期可怕的预后,故有这一致的看法:即医师将接受具10%的最小阳性预测值试验(Bast,R.C.,et al.,Cancer Treatment and Research,2002;107:61-97)。将此看法延伸用至一般妇女,则一般筛检试验须要求大于70%的灵敏度及99.6%的专一性。目前,现存的血清学标记,诸如CA125、CA72-4或M-CSF,无一能个别地具此种结果(Bast,R.C.et al.,Int J Biol Markers,1998;13:179-87)。
因此,对早期卵巢癌检测,迫切地需要新血清学标记,其个别地或者与其它标记或诊断形式组合,使达到要求的灵敏度及专一性(Bast RC,et al,卵巢癌早期检测,希望及实现(Early detection of ovarian cancer.promise and reality).卵巢癌(Ovarian Cancer):ISIS Medical Media Ltd.,Oxford,UK;2001.印刷中)。若无可为人接受的筛检试验,则早期检测依旧是改善卵巢癌病人长期存活率的最关键因素。
因此,需要有一可信赖及准确的决定病人卵巢癌状态的方法,然后所述结果能用于受验者治疗的安排。
发明内容
通过测定生物标记,本发明提供灵敏与快速决定卵巢癌状态的方法及试剂。病人样本中该些标记测定,可提供讯息给诊断医生做相关的可能癌症诊断或阴性诊断(如:正常或未患病)。标记特征为分子量及/或已知蛋白质种类。标记能自样本中以各种区分技术,例如:以层析法分离结合质谱测定、以固定化抗体捕捉蛋白质或传统免疫分析法而自其它蛋白质中解析出来。优选实施例中,解析方法包括表面加强激光吸电离(SELDI)质谱测定,此方法中,质谱测定探头表面包括能结合标记的吸附剂。
更明确地说,本发明发现三种生物标记,经后续依据此处阐述方法,确认为(1)脂蛋白元A1(apoliprprotein A1)(此称为’Apo A1’)、(2)截短型甲状腺素运送蛋白(transthyretin)(此称为’甲状腺素运送蛋白ΔN10’)以及(3)间-α-胰蛋白酶抑制物重链H4切割片段(此称为’IAIH4片段’)。
本发明提供评定受验者卵巢癌状态方法,包括:(a)至少测定一种受验者样本中生物标记,其中该生物标记选自Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段以及其组合;以及(b)将测定与卵巢癌状态进行关联。某些方法,测定步骤包括检测样本中标记存在与否。其它方法,测定步骤包括样本中标记定量。又其它方法,测定步骤包括样本中生物标记类型确认。
本发明也涉及测定方法,其中该测定步骤包括:提供受验者血液或血液衍生物;以阴离子交换树脂区分蛋白质并收集含有Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段的区分物;以及自包含捕捉剂(能结合蛋白质生物标记)的基质表面,捕捉区分物中Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段。血液衍生物例如是血清或血浆。优选实施例中,基质是包括固定化金属螯合物(immobilizedmetal chelate,IMAC)铜表面的SELDI探头,其中,蛋白质生物标记是以SELDI检测。另外实施例中,基质是包括能结合Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段的生物专一性亲和剂的SELDI探头,其中,蛋白质生物标记是以SELDI检测。又另外实施例中,基质是包括能结合Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段的生物专一性亲和剂的微量滴定盘,其中,生物标记是以免疫分析法测定。
某些实施方案中,该些方法还包括以本发明方法确定的状态为基础的病人疗法安排。例如,假如本发明方法测定结果是不确定,或有理由认为再确认状态是必须的,则医生得要求更多试验。或者,假如状态显示手术是适宜的,则医生得安排病人手术。同样地,假如试验结果是阳性,例如,状态为末期卵巢癌,或假如状态是急性,则得无进一步疗法。又,假如结果显示治疗已成功,则得无进一步安排的必要。
本发明也提供这样的方法,于安排受验者后再测定至少一种生物标记。在此些情况,安排受验者疗法步骤,视所得结果然后加以重复或改变。
“卵巢癌状态”用语是指病人疾病状态。卵巢癌状态类型举例包括(但不设限为):受验者患癌风险、有无疾病、病人疾病状态以及疾病治疗效果。其它状态及每一状态程度是本技术中已知者。
本发明方法的有用生物标记选自Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段。某些优选实施例中,该方法还包括自受验者样本中测定至少一种先前已知标记(此称为’标记4’),且对至少一种标记4测定以及Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段测定,与卵巢癌状态进行关联。某些实施例,除选自Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段的标记外,只测定一种标记4,而其它实施例则测定多于一种的标记4。
标记4举例包括已知卵巢癌生物标记,例如(但不限定为):CA125、CA125II、CA15-3、CA19-9、CA72-4、CA195、肿瘤相关胰蛋白酶抑制物(TATI)、癌胚抗原(CEA)、胚胎碱性磷酸酶(PLAP)、Sialyl TN、半乳糖转移酶、巨噬细胞生长因子(M-CSF、CSF-1)、溶血磷脂酸(LPA)、表皮生长因子接受器细胞外区域分子量110kD部分(p110EGFR)、组织舒血管素(tissue kallikreins)(如舒血管素6与舒血管素10(NES-1))、prostasin(一种蛋白酶)、HE4、肌酸激酶B(CKB)、LASA、HER-2/neu、尿促性腺激素肽(urinary gonadotropin peptide)、Dianon NB 70/K、组织肽抗原(TPA)、造骨蛋白标记(osteopontin)及血红素结合球蛋白(haptoglobin),以及该些标记蛋白质变异物(如:可裂解形式、异型(isoforms))。
某些实施例,其方法提供测定所有三种生物标记:Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段。有些实施例,亦测定受验者样本中至少一种已知标记--标记4,且关联卵巢癌状态与标记4及其它三种生物标记(Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段)测定结果。如前所述,某些实施例中,进行检测的生物标记包括:所有三种生物标记(Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段)以及二种或更多选自指定为标记4组群的标记。
本发明也涉及指定为标记I至标记XLVIII生物标记。本发明蛋白质标记于数方面具有一或更多特征。特别是,在一个方面,该些标记于此处特定条件下有分子量特征,特别是当以质谱分析法决定时。另一实施方面,该些标记能以标记质谱讯号诸如大小(包括面积)及/或谱峰形状(包括与邻近峰靠近程度、邻近峰大小及形状等特性)为特征。又另一实施方面,该些标记能以亲和力结合特性为特征,特别是在专一性情况下对IMAC铜吸附剂结合能力,然而,亦得使用其它金属,例如镍。优选实施例中,本发明标记得以每一这样的方面为特征,亦即分子量、质谱讯号及结合IMAC-铜吸附剂。
关于此处揭示的标记质量,光谱仪器测定的质量准确度应约在该揭示分子量数值+/-0.15%间。此外,对这样的仪器存在的准确度变异,决定的光谱质量于约400至1000m/dm解析力限制内会有变化,此处m指质量,dm指于该质量谱峰0.5峰高处的谱峰宽度。质量准确度及解析力变异与质谱仪器及仪器操作有关,此反映于每一标记I至标记XL VIII揭示质量使用”约”用语上。其亦意味对于此处揭示的每一标记质量,这样的质量准确度与解析力变异以及”约”用语意义,包括由于受验者性别、基因型态及/或人种以及受验者特定癌症或来源或状态,存在的标记变异。
本发明还提供评定受验者卵巢癌状态方法,包括(a)测定受验者样本中至少一种生物标记,其中该生物标记选自标记I至标记XL VIII与其组合;以及(b)关联测定与卵巢癌状态。某些方法,测定步骤包括检测样本中生物标记是否存在。其它方法,测定步骤包括样本中标记定量。又其它方法,测定步骤包括样本中生物标记类型定性。
诊断试验准确度以接受者操作特征曲线(Receiver Operating Characteristiccurve)(“ROC”曲线)表示。一条ROC曲线为于诊断试验的不同可能切点,真阳性速率对伪阳性速率图。一条ROC曲线显示灵敏度与专一性间关系。亦就是说,灵敏度增加将伴随专一性降低。曲线越靠近左轴以及越靠近ROC空间顶部边缘,则试验越准确。反过来说,曲线越靠近ROC图45度对角线,则试验越不准确。ROC下面积是试验准确度测定。试验准确度依赖于该试验将试验组群区分为有无疑虑疾病的程度。曲线下面积(此称为”AUC”)为1代表一完美试验,而面积为0.5代表一较无用试验。因此,本发明优选生物标记与诊断方法,其AUC大于0.50,又优选试验AUC大于0.6,更优选试验AUC大于0.70。
测定生物标记优选方法包括使用生物芯片阵列。本发明有用的生物芯片阵列包括蛋白质与核酸阵列。一或多种标记为生物芯片阵列所捕捉,然后激光离子化以检测标记分子量。举例来说,标记分析通过一或多种标记分子量对阈值强度进行的,该强度对总离子电流已做标准化换算。优选地,是用对数转换降低谱峰强度范围,以限制检测出的标记数目。
本发明优选方法中,将生物标记测定与卵巢癌状态进行关联的步骤,通过软件分类算法执行的。优选地,是于生物芯片阵列上固定化受验者样本上产生数据,将所述生物芯片阵列进行激光离子化,然后测定质量/电荷比讯号强度;并且将数据转换成计算机可读形式;以及依照使用者输入参数执行数据分类演算,用以测定代表标记出现于卵巢癌病人中的讯号,而非癌症的受验者对照组则无该讯号。
举例来说,优选生物芯片表面是离子的、阴离子的、固定化镍离子组成的、正负离子混合物组成的、一或多种抗体组成的、单股或双股核酸、蛋白质、肽或肽片段、氨基酸探针或是嗜菌体展示库(phage display libraries)。
其它优选方法中,一或多种标记以激光吸/电离质谱法测定,包括提供适用于质谱仪的探针,该探针上贴附吸附剂,且使受验者样本与吸附剂接触;以及自探针解吸与电离标记,并以质谱仪检测去离子化/离子化标记。
优选的是,激光吸/电离质谱法包括:提供贴附吸附剂的基质;使受验者样本与吸附剂接触;置基质于适用于贴附有吸附剂的质谱仪探针上;以及自探针解吸与电离标记并以质谱仪检测去离子化/离子化标记。
吸附剂举例来说,是为疏水性、亲水性、离子或金属螯合物吸附剂,诸如:镍或抗体、单股或双股寡核苷酸、氨基酸、蛋白质、肽或肽片段。
本发明方法,能操作于遵从这样的方法的任何类型病人样本,例如:血液、血清及血浆。
某些实施例,测定受验者样本中多个生物标记,其中该生物标记选自包含Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段,以及至少一种已知标记--标记4。优选方法中,该多个生物标记由Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段组成。多个生物标记测定,亦能包括测定至少一种标记4。优选的是,蛋白质生物标记是以SELDI或免疫分析法测定。
本发明也提供测定方法,包括测定至少一种受验者样本中生物标记,其中该生物标记选自由Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段,以及其组合组成。某些该实施例中,方法还包括测定Apo A1及/或至少一种已知卵巢癌标记,亦就是标记4,例如:CA125、CA125II、CA15-3、CA19-9、CA72-4、CA195、TATI、CEA、PLAP、Sialyl TN、半乳糖转移酶、M-CSF、CSF-1、LPA、p110EGFR、组织舒血管素、prostasin、HE4、CKB、LASA、HER-2/neu、尿促性腺激素肽、Dianon NB 70/K、TPA、造骨蛋白标记、血红素结合球蛋白,以及该些标记蛋白质变异物(如:可裂解形式、异型)。
本发明也提供试剂盒,包括(a)与选自Apo A1、甲状腺素运送蛋白ΔN10、IAIH4片段及其组合的生物标记结合的捕捉剂;(b)包括至少一种该生物标记的容器。优选实施例中,捕捉试剂结合多个生物标记。一实施例中,多个生物标记包括Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段。捕捉试剂能为任何类型试剂,而优选试剂为SELDI探针。捕捉试剂亦得结合其它已知生物标记,如标记4。某些优选实施例中,试剂盒还包括第二种捕捉剂,该第二种捕捉剂能与一种未和第一种捕捉试剂相结合的生物标记相结合。
本发明进一步提供的试剂盒包括(a)第一种捕捉剂,其与至少一种选自ApoA1、甲状腺素运送蛋白ΔN10及IAIH4片段生物标记相结合;(b)第二种捕捉剂,其与至少一种未和第一种捕捉剂相结合的生物标记相结合。优选的是,至少一种捕捉剂为抗体。某些试剂盒还包括贴附或可贴附至少一种捕捉剂的质谱探针。
本发明某些试剂盒中,捕捉剂包括固定金属螯合物(“IMAC”)。
本发明某些试剂盒还包括洗提液,当冲提后与其它生物标记比较时,该洗提液选择性地允许已进行结合的生物标记保留于捕捉剂上。
本发明也提供试剂盒,其包括(a)与至少一种选自Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段生物标记相结合的第一种捕捉剂;以及(b)使用捕捉剂测定生物标记的说明书。某些该试剂盒中,捕捉剂包括抗体。再者,一些试剂盒还包括贴附或可贴附捕捉剂的质谱探针。一些试剂盒中,捕捉剂包括IMAC。试剂盒亦得含有洗提液,当冲提后与其它生物标记比较时,该洗提液选择性地允许已进行结合的生物标记保留于捕捉剂上。优选的是,试剂盒包括决定卵巢癌状态的试剂盒使用文字说明书,以及使试验样本与捕捉剂接触,并测定一或多种为捕捉剂滞留的生物标记的说明书。
试剂盒亦提供是抗体、单股或双股寡核苷酸、氨基酸、蛋白质、肽或肽片段的捕捉剂。
使用试剂盒测定一或多种蛋白质生物标记,通过由质谱法或免疫分析法如酶联免疫吸附分析法(enzyme-linked immunosorbent assay,ELISA)进行的。
本发明也提供检测卵巢癌的纯化蛋白质及/或用于进一步诊断分析法的抗体生成。纯化的蛋白质包括具核酸序列1(SEQ ID NO:1)(IAIH4片段)的纯化肽。本发明也提供复含可检测标记的纯化肽。
本发明也提供制品,包括至少一种捕捉剂与至少两种选自Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段生物标记相结合。本发明制品的其它实施例,还包括与其它已知卵巢癌标记相结合的捕捉试剂,该已知卵巢癌标记亦就是标记4,例如(但不限定为):CA125、CA125II、CA15-3、CA19-9、CA72-4、CA195、TATI、CEA、PLAP、Sialyl TN、半乳糖转移酶、M-CSF、CSF-1、LPA、p110EGFR、组织舒血管素、prostasin、HE4、CKB、LASA、HER-2/neu、尿促性腺激素肽、DianonNB 70/K、TPA、造骨蛋白标记、血红素结合球蛋白,以及该些标记蛋白质变异物(如:可裂解形式、异型)。
本发明也提供包括多个捕捉剂的系统,该每一捕捉剂与选自Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段以及至少一种标记4的不同生物标记相结合。
本发明也提供筛选试验,包括(a)使舒血管素与舒血管素基质、试验试剂相接触;以及(b)决定试验试剂是否调节舒血管素活性。于一这样的试验中,该基质为间-α-胰蛋白酶抑制物重链H4前体。该此试验,舒血管素嗜将基质切割成IAIH4片段。
以下叙述本发明其它方面。
附图说明
图1显示来自生物标记发现组标本的假凝胶质谱图,其显示位于12828和28043(组分pH4,IMAC-Cu阵列)以及在3272(组分pH9,IMAC-Cu阵列)的m/z的峰值。
图2(A)、(B)、(C)、(D)显示在CA125和三种识别的生物标记之间比较接收器操作特性(ROC)曲线。
图2(E)、(F)、(G)、(H)显示在CA125和两种多变量预测模型之间比较接收器操作特性(ROC)曲线。
图3(a)、(b)、(c)、(d)、(e)、(f)、(g)、(h)显示说明在病人和健康对照在生物标记发现组及其独立有效组之间的三种识别的生物标记和CA125的分布的散射点(泳道a-h)。
图3(i)、(j)、(k)、(l)显示说明在病人和健康对照在测试组(部分发现组生物标记)及其独立有效组之间的两种多变量可预测模型的输出量。
图4显示用于定性生物标记的分类算法图表。
定义
除非另有定义,此处所用的所有技术与科学用语,为熟悉本发明技术人员,通常所了解的意义。下列参考文献提供本发明所用许多用语的一般定义给具技能者:辛格顿(Singleton)等人着,微生物学与分子生物学辞典(Dictionary ofMicrobiology and Molecular Biology),第二版(1994年);沃克(Walker)编着,剑桥科学与技术辞典(The Cambridge Dictionary of Science and Technology)(1988年);李杰(R.Rieger)等人编着,遗传学辞典(The Glossary of Genetics),第五版,Springer Verlag出版(1991年);以及哈乐与马汉(Hale & Marham)著,哈泼柯林斯生物学辞典(TheHarper Collins Dictionary of Biology)(1991年)。除非另有定义否则下列用语如此处解释。
“气相离子光谱仪”是指检测气相离子的仪器。气相离子光谱仪包括提供气相离子的离子源。例如,气相离子光谱仪包括质谱仪、离子移动光谱仪及总离子流测定器。“气相离子光谱法”是指使用气相离子光谱仪检测气相离子。
“质谱仪”是指测定参数的气相离子光谱仪,其能将参数转化成气相离子质量/电荷比。质谱仪一般包括一离子源与一质量分析仪。质谱仪举例,如飞行时间(time-of-flight,TOF)式、磁扇形场(magnetic sector)式、四极杆过滤(quadrupolefilter)式、离子阱(ion trap)式、离子回旋共振(ion cyclotron resonance)式、静电扇形分析器,以及该些型式混合。”质谱法”是指使用质谱仪检测气相离子。
“激光解吸质谱仪”是指使用激光能量作为解吸、挥发及离子化分析物方法的质谱仪。
“串联质谱仪”是指任何具执行二连续步骤m/z区分,或离子(包括离子混合物中离子)测定能力的质谱仪。其构造包括具二个质量分析仪的质谱仪,该质量分析仪能执行二连续步骤m/z区分,或空间串联离子测定。该构造还包括具单一质量分析仪,该单一质量分析仪能执行二连续步骤m/z区分,或时间串联离子测定。该构造因此明确地包括质量选择四极杆-碰撞四极杆-飞行时间式质谱仪(Qq-TOF)、离子阱质谱仪、离子阱-TOF质谱仪、TOF-TOF质谱仪、傅立叶转换离子回旋共振质谱仪、静电扇形-磁场扇形质谱仪,以及该些型式组合。
“质量分析仪”是指质谱仪次组件,具测定参数方式,并能将参数转换成气相离子电荷比。于飞行时间式质谱仪中,质量分析仪包括一离子光学组件、一飞行管与-离子检测器。
“离子源”是指气相离子光谱仪次组件,能供应气相离子。一实施例中,离子源通过解吸/电离过程供应离子。这样的实施例一般包括探针接口,该接口将探针安设于对离子化能量(例如激光吸/电离源)具可调整的位置上,且于大气压或次大气压下与气相离子光谱仪检测器同时沟通。
固相分析物解吸/电离的离子化能量型式,例如有:(1)激光能;(2)快速原子(用于快速原子撞击);(3)放射性原子核(用于血浆解吸)β衰退产生的高能粒子;以及(4)一次离子产生二次离子(用于二次离子光谱仪)。固相分析物离子化能量优选型式为激光(用于激光吸/电离),特别是氮激光、钕-雅各激光(Nd-Yag laser)及其它脉冲激光源。”通量(fluence)”是指单位可调整影像面积通过的能量。高通量源(诸如激光)将传递约1mJ/mm2至50mJ/mm2能量。典型地,样本是置于探针表面,探针与探针接口囓合,且探针表面以离子化能量撞击。
其它分析物离子化能量型式包括,例如:(1)将气相中性物离子化的电子;(2)将气相、固相或液相中性物离子化的强电场;以及(3)应用离子化粒子或电场与中性化合物的组合,以引发气相、固相或液相中性物化学性离子化的能量源。
“固体支撑物”是指固体物质,其能衍生至或贴附至捕捉剂上。固体支撑物,例如有:探针、微量滴定盘及色层分析树脂。
“探针”于本发明中是指,适合与气相离子光谱仪(如质谱仪)探针接口啮合,并将分析物曝露于离子化能量中以进行离子化,以及将分析物导入至气相离子光谱仪(诸如质谱仪)的设计。“探针”一般包括固体基质(弹性或刚性),该固体基质具样本曝露表面,分析物于该表面上将曝露于离子化能量源中。
“表面加强激光吸/电离技术”或称“SELDI”是指解吸/电离气相离子光谱法(如质谱法)的方法。该方法中,分析物为啮合于气相离子光谱仪探针接口的SELDI探针表面所捕捉。于“SELDI质谱仪”中,气相离子光谱仪为质谱仪。SELDI技术于如美国专利US 5,719,060(Hutchens & Yip)及美国专利US6,225,047(Hutchens & Yip)中有叙述。
“表面加强亲和性捕捉(surface-enhanced affinity capture)”或称”SEAC”是SELDI变化,其包括使用具吸附剂表面的探针(”SEAC”探针)。“吸附剂表面”是指结合吸附剂(亦称为“捕捉剂”或“亲和剂”)的表面。吸附剂为任何能结合分析物(例如多肽或核酸目标物)的物质。“色层分析吸附剂“是指典型用于色层分析的物质。色层分析吸附剂包括,例如:离子交换物质、金属螯合物(如氰乙酸(nitriloacetic acid)或亚胺二乙酸(iminodiacetic acid))、固定化金属螯合物、疏水性交互作用吸附剂、亲水性交互作用吸附剂、染料、简单生物分子(如核苷酸、氨基酸、简单醣类与脂肪酸)以及混合型式吸附剂(如疏水吸引/静电排斥吸附剂)。“生物专一性吸附剂”是指包括生物分子,例如核酸分子(如适合体(aptamer))、多肽、多醣、脂肪、类固醇或这些分子结合物(如醣蛋白、脂蛋白、醣脂、核酸(如去氧核糖核酸(DNA))-蛋白质结合物)吸附剂。某些例中,生物专一性吸附剂能为巨分子结构,诸如多蛋白质复合体、生物膜或病毒。生物专一性吸附剂举例有抗体、受体蛋白质与核酸。生物专一性吸附试剂典型地,比色层分析吸附剂对目标分析物有较高专一性。又些用于SELDI的吸附剂举例,可于美国专利US 6,225,047(Hutchens & Yip,”应用滞留层析法产生不同图谱(Use ofretentate chromatograpy to generate difference maps),”2001年5月1日)中找到。
有些实施例,SEAC探针是作为预活化表面,该表面能修饰成具选择的吸附剂。例如,某些探针具反应性基团,通过共价键能与生物分子相结合。环氧化合物(epoxide)与carbodiimidizole是有用的反应性基团,以共价键与生物专一性吸附剂诸如抗体或细胞接受体相结合。
“吸附”是指分析物对吸附剂或捕捉剂的可检测非共价键结合。
“表面加强净解吸(surface-enhanced neat desorption)”或称”SEND”是SELDI变型,包括使用具能量吸附分子的探针,该能量吸附分子通过化学键结合至探针(“SEND探针”)表面。”能量吸附分子(energy absorbing molecules,EAM)”是指具来自激光吸/电离源吸附能量的分子,当与分析物接触时,将分析物解吸与电离。该探针表面包括用于基质辅助激光吸/电离(matrix-assisted laserdesorption/ionization,MALDI)的分子,经常称为”基质”,明确地包括桂皮酸(cinnamic acid)衍生物、3,5-二甲氧基-4-羟基桂皮酸(sinapinic acid,SPA)、氰基-羟基-桂皮酸(CHCA)及二羟基苯甲酸、阿魏酸(ferulic acid)、羟基苯乙酮衍生物,以及其它等。其亦包括用于SELDI的EAM。SEND于美国专利US 5,719,060与美国专利申请号60/408,255,2002年9月4日建檔(Kitagawa,”具用于分析物解吸/电离能量吸附基团的单体与聚合物(Monomers And Polymers Having Energy AbsorbingMoieties Of Use In Desorption/Ionization Of Analytes)”)中有进一步叙述。
“表面加强光敏贴附与释放(surface-enhanced photolabile attachment andrelease)”或称”SEPAR”是SELDI变型,包括使用具基团贴附至其表面的探针,该表面能与分析物共价结合,然后通过曝露于光源(如激光光)下,打断基团光敏键遂将分析物释放出来。SEPAR于美国专利US 5,719,060中有进一步叙述。
“洗提液(eluant)”或”清洗液”是指试剂,典型为溶夜。用于影响或修饰分析物对吸附剂表面的吸附,及/或自吸附剂表面将未键结物质移除。洗提液冲提特性与下列条件有关,例如:pH、离子强度、疏水性、水分子构造破坏(chaotropism)程度、清洁剂强度以及温度。
“分析物”是指待测样本的任何成分。该用语是指样本中单一成分或多个成分。
样本吸附至亲和性捕捉探针吸附表面的”复杂度”,代表吸附的不同种类蛋白质数目。
“分子结合对”与”专一性结合对”是指成对分子,典型为成对生物分子,呈现专一性结合。分子结合对包括(但不限制为)受体与配体、抗体与抗原、生物素(biotin)与卵白素(avidin),以及生物素与链卵白素(streptavidin)。
“监测”是指记录连续改变参数的变化。
“生物芯片”是指具贴附有吸附剂大抵平坦表面的固体基质。通常,该生物芯片表面包含多个可寻址位子,且每一位子结合有吸附剂。生物芯片能合适至与探针接口囓合,故可当作探针使用。
“蛋白质生物芯片”是指适于多肽捕捉的生物芯片。于该技术中有许多蛋白质芯片的叙述,这些包括,例如由赛弗吉生物系统公司(Ciphergen Biosystems)(加州Fremont)、Packard BioScience公司(康乃狄克州Meriden)、Zyomyx公司(加州Hayward)以及Phylos公司(麻萨诸塞州Lexington)生产的蛋白质生物芯片。这样的蛋白质芯片举例于下列专利或专利申请号中有叙述:美国专利US6,225,047(Hutchens & Yip,”应用滞留层析法产生不同图谱(Use of retentatechromatography to generate difference maps),”2001年5月1日);国际发刊WO99/51773(Kuimelis & Wagner,”可寻址蛋白质阵列(Addressable proteinarrays),”1999年10月14日);美国专利US 6,329,209(Wagner等人,”蛋白质-捕捉剂阵列及其使用方法(Arrays of protein-capture agents and methods of usethereof),”2001年12月11日);以及国际发刊WO 00/56934(Englert等人,”连续孔洞基质阵列(Continuous porous matrix arrays),”2000年9月28日)。
由赛弗吉生物系统公司制造的蛋白质生物芯片,具色层分析或生物专一性吸附剂贴附于可寻址位子表面。赛弗吉蛋白质
(Protein
)阵列包括:NP20、H4、H50、SAX-2、WCX-2、CM-10、IMAC-3、IMAC-30、LSAX-30、LWCX-30、IMAC-40、PS-10、PS-20以及PG-20。这些蛋白质芯片含有长条形状铝基质。该长条表面以二氧化硅涂覆着。
对于NP-20生物芯片,氧化硅功能是作为捕捉亲水性蛋白质的亲水性吸附剂。
H4、H50、SAX-2、WCX-2、CM-10、IMAC-3、IMAC-30、PS-10以及PS-20生物芯片复包含水合胶体型式的官能化、交联聚合物,该聚合物以物理方式贴附至生物芯片表面,或通过硅烷以共价键方式贴附至生物芯片表面。H4生物芯片具用于疏水性结合的异丙基官能基。H50生物芯片具用于疏水性结合的壬基苯氧基-多(乙二醇)-2-甲基丙烯酸酯。SAX-2生物芯片具用于阴离子交换的四级铵官能基。WCX-2与CM-10生物芯片具用于阳离子交换的羧酸盐官能基。IMAC-3与IMAC-30生物芯片具胺乙酸(nitriloacetic acid)官能基,其以螯合方式吸附过渡金属,诸如Cu++、Ni++。该些固定化金属离子允许通过由配位键结以吸附肽与蛋白质。PS-10生物芯片具carboimidizole官能基,能与蛋白质上基团反应进行共价键结。PS-20生物芯片具用于与蛋白质共价键结的环氧官能基。PS系列生物芯片用于将生物专一性吸附剂,如抗体、受体、凝集素(lectin)、肝素(heparin)、蛋白质A、生物素/链卵白素等,结合至具专一性捕捉样本中分析物的芯片表面。PG-20生物芯片为贴附有蛋白质G的PS-20芯片。LSAX-30(阴离子交换)、LWCX-30(阳离子交换)及IMAC-40(金属螯合物)生物芯片,于芯片表面具功能性的乳胶珠(latex bead)。这样的生物芯片于下列数据中有进一步叙述:WO 00/66265(Rich等人,”用于气相离子光谱仪的探针(Probes for a Gas Phase Ion Spectrometer),”2000年11月9日);WO 00/67293(Beecher等人,”用于气相质谱仪具有疏水性涂层的样本盛装器(Sample Holder with Hydrophobic Coating for Gas Phase MassSpectrometer),”2000年11月9日);美国专利申请号US 20030032043A1(Pohl &Papanu,”乳胶珠吸附芯片(Latex Based Adsorbent Chip),”2002年7月16日)以及美国专利申请号US 60/350,110(Um等人,”疏水性表面芯片(HydrophobicSurface Chip),”2001年11月8日)。
一旦分析物为生物芯片所捕捉,即能通过许多检测方法测定,例如:气相离子光谱法、光学法、电化学法、原子力显微镜以及射频法。此处将叙述气相离子光谱法。特别感兴趣的是质谱法以及尤其是SELDI的使用。光学法例如包括:萤光检测、发光、化学发光、吸收率、反射率、透光率、双折射率或折光指数(如表面电浆共振、椭圆偏光法、共振镜法、光栅耦合器波导法或干涉法)。光学法包括显微镜(共轭焦与非共轭焦)、影像法及非影像法。
各种型式免疫分析法(如ELISA),是受欢迎的检测固定相上分析物(其为固定相所捕捉)的方法。电化学法包括伏特安培法与安培法。射频法包括多极共振光谱法。
“标记”于本发明是指多肽(具特殊明显分子量),将癌症病人样本与对照组受验者样本(如诊断为阴性或无法检出癌症者、正常或健康者)比较,该多肽出现于二者中情况是有差异的。”生物标记”用语与”标记”用语可交换使用。
“测定”用语意味着方法,包括检测样本中标记是否存在;样本中标记定量;以及/或评定标记类型。测定是以本技术已知方法以及此处进一步叙述的方法进行,包括(但不限定为)SELDI与免疫分析法。任何适当方法能用于此处所述一或多种标记的测定。该些方法包括(但不限定为)质谱法(如激光解吸/离子化质谱法)、萤光法(如三明治免疫法)、表面电浆共振法、椭圆偏光法以及原子力显微镜。
“出现差异”一词是指,癌症病人样本与对照组受验者样本比较,二者样本中标记出现数量及/或频率是有差异的。例如:与对照组受验者样本比较,卵巢癌病人样本中IAIH4片段出现的数量增加。相反地,此处所述的Apo A1与甲状腺素运送蛋白ΔN10,与对照组受验者样本比较,于卵巢癌病人样本中出现的数量减少。又,标记能为多肽,与对照组受验者样本比较,于癌症病人样本中检测出该多肽的频率较高或较低。标记于数量、频率或二者方面有出现差异。
如果多肽于一样本中数量与于其它样本中数量有统计上显著差异,则多肽于二样本间是有出现差异。举例而言,如果多肽出现于一样本中比于其它样本中大至少约120%、至少约130%、至少约150%、至少约180%、至少约200%、至少约300%、至少约500%、至少约700%、至少约900%或至少约1000%;或者多肽于一样本中可检出而于其它样本中非可检测出,则多肽于二样本间是有出现差异。
可择一或附加地,如果于卵巢癌病人样本中检出多肽频率,比于对照组受验者样本中检出频率,于统计上显著较高或较低,则多肽于二组样本中是有出现差异。举例而言,如果检出多肽于一样本中比于其它样本中频率较高或较低至少约120%、至少约130%、至少约150%、至少约180%、至少约200%、至少约300%、至少约500%、至少约700%、至少约900%或至少约1000%,则多肽于二组样本间是有出现差异。
“诊断”意味确认病理状况的出现或性质,亦就是卵巢癌。诊断方法于灵敏度与专一性上有差异。诊断方法灵敏度是检验出阳性患病个体的百分比例(“真阳性”比例)。患病个体无法以该方法检出者是”伪阴性”。未患病受验者以该方法检验出阴性,称为”真阴性”。诊断方法专一性指小于1的伪阳性率,其中”伪阳性”率定义为未患病受验者检验出阳性的比例。当一特定诊断方法也许无法提供明确诊断情况,但如果该方法对诊断提供有帮助性的正向指引,则加上该诊断方法。
标记”试验量”是指标记出现于试验样本中的量。试验量能为绝对量(如ug/ml)或相对量(如讯号相对强度)。
标记”诊断量”是指标记于受验者样本中,与卵巢癌诊断结果一致的量。诊断量能为绝对量(如ug/ml)或相对量(如讯号相对强度)。
标记”对照量”,相较于标记试验量,能为任何量或一范围。例如,标记对照量能为于未罹卵巢癌者中的标记量。对照量能为绝对量(如ug/ml)或相对量(如讯号相对强度)。
“抗体”是指多肽配体,为一或多个免疫球蛋白基因或免疫球蛋白基因片段所充分编码,抗体专一性结合或辨认抗原决定位(如抗原)。辨认的免疫球蛋白基因包括κ及λ轻链固定区基因;α、γ、δ、ε及μ重链固定区基因;以及种种免疫球蛋白可变区基因。例如,当完整免疫球蛋白或当一些具相当特征化片段通过各种肽键酶分解产生时,会有抗体生成。这例如包括免疫球蛋白Fab’与F(ab)’2片段。此处所用”抗体”用语,亦包括由整个抗体修饰产生的抗体片段,或使用DNA重组技术重新合成的抗体片段。亦包括多株抗体、单株抗体、嵌合抗体、人化抗体或单链抗体。抗体”Fc”部分是指免疫球蛋白重链包括一或多个重链固定区功能区、CH1、CH2及CH3,但不包括重链可变区的部分。
“受验者疗法安排”是指临床医师或医师对卵巢癌状态决定的处理行为。例如,如果本发明方法结果无法下判断,或有理由认为状态再确认有其必要,则医师得要求更多试验。或者,如果状态显示动手术是适合的,则医师得安排病人动手术。如果状态属负面的,例如卵巢癌末期,或如果状态属急性的,则得无采取进一步措施。又,如果显示治疗已经成功,则得无采取进一步安排的必要。
本发明详细说明
本发明提供生物标记,该些标记产生自以蛋白质
生物标记系统(赛弗吉生物系统公司,加州Fremont)诊断出有卵巢癌病人,与无已知肿瘤疾病病人的蛋白质图谱比较。该些标记以及其它已知卵巢癌标记,是独立地并以多变量预测模型评估。特别是,其显示该些标记能提供甚省佳决定受验者卵巢癌状态的方法,而该些标记是独立使用,或以与该组群其它生物标记,或以与其它诊断试验组合使用为宜。
高产量蛋白质图谱及结合生物讯息工具的有效使用,可提供一种筛选癌症标记的有用逼近方法。简单来说,用于本发明的系统,利用色层分析蛋白质芯片
阵列以SELDI分析样本。结合至阵列的蛋白质以蛋白质
读取机(其是飞行时间质谱仪)读取。
本发明的基础,是源于卵巢癌病人与对照组受验者样本中,有蛋白质标记出现差异的发现;以及将该发现应用于决定卵巢癌状态的方法及试剂盒。该些蛋白质标记于卵巢癌病人样本中的量,与于未可检出人类癌症妇女样本中的量,发现有差异。因此,于试验样本中发现的一或多个标记的量与对照组比较;或者试验样本中一或多个标记存在与否,提供关于病人卵巢癌状态的有用讯息。
I.生物标记说明
A.脂蛋白元A1
本发明方法一有用标记举例,包括脂蛋白元A1,此处亦称为”Apo A1”。ApoA1通过质谱法可检出具m/z 28043谱峰。此处所述标记质量,当以揭示的SELDI质谱仪测定时,准确度应考虑为于该特殊值0.15%以内。Apo A1是依照操作步骤区分血液,接着应用至IMAC芯片,然后以SELDI检测。纯化的蛋白质以胰蛋白酶消化,然后确认为脂蛋白元A1。单离与确认ApoA1的操作步骤,于以下例中提出。ApoA1的量于某些卵巢癌状态病人中向下调整。因此,当与正常对照组比较,若无ApoA1,或者ApoA1的量系统计上显著减少,则将与卵巢癌状态进行关联。统计上显著减少是指本技术所已知者,如p值小于0.05。
B.甲状腺素运送蛋白ΔN10
本发明方法有用标记另一举例,包括前白蛋白型式,此处称为”甲状腺素运送蛋白ΔN10”。甲状腺素运送蛋白ΔN10通过质谱法可检出具m/z 12870.9谱峰。甲状腺素运送蛋白ΔN10是依照操步骤区分血液,接着应用至IMAC芯片,然后以SELDI检测。通过免疫沉淀与串联质谱法,发现该纯化蛋白质为前白蛋白截短型,缺乏N端十个氨基酸(此处称为”甲状腺素运送蛋白ΔN10”)。单离与确认甲状腺素运送蛋白ΔN10的操作步骤,于以下例中提出。甲状腺素运送蛋白ΔN10的量于某些卵巢癌状态病人中亦向下调整。因此,当与正常对照组比较时,若无甲状腺素运送蛋白ΔN10,或者甲状腺素运送蛋白ΔN10的量有统计上显著减少,则将与卵巢癌状态进行关联。
本发明于此处是以甲状腺素运送蛋白ΔN10说明。然而,原甲状腺素运送蛋白(13900道尔顿(dalton))于本发明方法中亦是有用的。
C.IAIH4片段
本发明方法另一有用标记举例,是间-α-胰蛋白酶抑制物重链H4切割片段,此处亦称为”IAIH4片段”。IAIH4片段通过质谱法可检出具m/z 3272谱峰。IAIH4片段检测,首先是依照操作步骤区分血液,接着应用至IMAC芯片,然后以SELDI检测。该谱峰是自卵巢癌病人血清,以一系列色层分析分离技术纯化得到的。其序列定为MNFRPGVLSSRQLGLPGPPDVPDHAAYHPF(SEQ ID NO:1),是人类间-α-胰蛋白酶抑制物片段具660-689个氨基酸长度,即重链H4(ITIH4;PK-120)。该结果是以胃蛋白酶消化该标记然后分析其产物而确定的。于卵巢癌病人某些状态,IAIH4片段数的量向上调整。因此,当与正常对照组比较时,IAIH4片段存在,或IAIH4片段的量增加,则将与卵巢癌状态进行关联。
E.其它发现的卵巢癌标记
于pH4与pH9冲提出的区分物中,亦确认出其它与卵巢癌疾病状态有关的生物指针。于pH4区分物中,与该些生物标记相对应的蛋白质或蛋白质片段,是以于SELDI蛋白质芯片/质谱中的谱峰强度代表,该些生物标记中心分子量有如下数值:
组1数据
标记号码 |
质量(道尔顿) |
I |
M4484.92 |
II |
M10065.9 |
III |
M9311.27 |
IV |
M27773.4 |
V |
M10668.3 |
VI |
M6953.19 |
VII |
M12870.9 |
VIII |
M13891.9 |
IX |
M7566.22 |
X |
M3339.22 |
XI |
M13596.8 |
XII |
M7769.93 |
XIII |
M14069.7 |
XIV |
M14338.7 |
XV |
M4499.12 |
XVI |
M6678.07 |
XVII |
M8144.60 |
组2数据
标记号码 |
质量(道尔顿) |
XVIII |
M11699.9 |
XIX |
M2729.15 |
XX |
M8949.37 |
XXI |
M30113.3 |
XXII |
M10668.3 |
XXIII |
M3379.43 |
XXIV |
M27288.8 |
XXV |
M29977.4 |
XXVI |
M1048.88 |
XXVII |
M39847.3 |
XXVIII |
M5607.28 |
XXIX |
M3822.84 |
XXX |
M29822.5 |
XXXI |
M41561.8 |
XXXII |
M4128.4 |
XXXIII |
M2340.70 |
于pH9区分物中,与该些生物标记相对应的蛋白质或蛋白质片段,是以于SELDI蛋白质芯片/质谱谱峰强度代表,该些生物标记中心分子量有如下数值:
组3数据
标记号码 |
质量(道尔顿) |
XXXIV |
M2748.46 |
XXXV |
M2866.33 |
XXXVI |
M2916.45 |
XXXVII |
M3033.86 |
XXXVIII |
M3193.54 |
XXXIX |
M3277.75 |
XL |
M3291.72 |
XLI |
M3307.35 |
XLII |
M4071.20 |
XLIII |
M4342.23 |
XLIV |
M5986.74 |
XLV |
M6023.61 |
XLVI |
M6308.55 |
XLVII |
M8132.55 |
XLVIII |
M8527.75 |
该些标记I至标记XLVIII的质量以揭示的SELDI质谱仪操作步骤决定时,考虑准确度应于该特定值0.15%以内。
如上述讨论,标记I至标记XLVIII亦得以对吸附剂的亲和力作为特征,特别是于特定条件下结合至固定化螯合剂(IMAC)-Cu基质表面,亲和力特征遵循该些举例的蛋白质芯片分析的一般结论。
E.已知的卵巢癌标记
本发明某些实施例亦使用已知卵巢癌生物标记与一或多种选自Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段的组合。此处使用的”标记4”用语是指已知的卵巢癌标记。有用的标记4举例包括(但不限定为):CA125、CA125II、CA15-3、CA19-9、CA72-4、CA195、TATI、CEA、PLAP、Sialyl TN、半乳糖转移酶、M-CSF、CSF-1、LPA、p110EGFR、组织舒血管素、prostasin、HE4、CKB、LASA、HER-2/neu、尿促性腺激素肽、DianonNB 70/K、TPA、造骨蛋白标记、血红素结合球蛋白以及该些生物标记蛋白质变异物(如:可裂解形式、异型)。
以标记于血液中的量为基础,然后与正常受验者比较,该些标记于诊断卵巢癌方面是有用的。例如,CA125已知在卵巢癌妇女血液中会提高。类似地,CA19-9、CA72-4、CA195、TATI、抑制素(inhibin)及PLAP,以及其它者,已知于卵巢癌妇女血液中亦会提高。本发明某些优选实施例中,至少一种已知标记(标记4)与至少一种选自Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段标记,是包括于该实施例方法中。
II试验样本
A)受验者类型
样本是收集自欲建立卵巢癌状态的妇女病人。受验者得为依照她们家族病史判定为具卵巢癌高危险群妇女。其它病人包括患卵巢癌妇女,而该试验是用来决定她们正在接受治疗或处理的效果。病人亦包括以试验做为例行检查一部分,或为建立生物标记底线量的健康妇女。样本得收集自已诊断出患卵巢癌并接受治疗以消除癌症,或也许减轻病症中的妇女。
B)样本类型与样本制备
本发明能测定不同生物学样本类型中的标记。样本以生物学液体样本为宜。本发明中有用生物学液体样本举例包括血液、血清、血浆、阴道分泌物、尿液、眼泪、唾液等。因为所有该些标记是于血清中发现,故血清为本发明实施例的优选样本源。
如有需要,能对样本进行制备以增加标记可检出率。例如,为增加标记可检出率,受验者血清样本以能使用如汽巴克隆(Cibacron)蓝色洋菜醣色层分析与单股DNA亲和性色层分析、阴离子交换树脂、亲和性色层分析(如与抗体)以及类似者区分为宜。区分方法与使用的检测方法类型有关。任何增加感兴趣蛋白质的方法皆能使用。是否进行样本制备,如前区分,是可加以选择的,视使用的检测方法而定,得不须增加标记可检出率。例如,如果使用专一性结合标记的抗体以检测样本中标记存在与否,则得不须制备样本。
典型地,样本制备包括样本区分与包含生物标记区分物的收集。前区分方法,例如包括:尺寸排斥色层分析法、离子交换色层分析法、肝素色层分析法、亲和性色层分析法、连续萃取法、凝胶电泳法与液相色层分析法。检测前亦得修饰分析物。该些简化样本以进行进一步分析的方法是有用的。例如,分析前自血液中除去如白蛋白的高含量蛋白质是有用的。区分方法举例,于PCT/US03/00531(在此全文引入以供参考)中有说明。
优选的是,样本是以阴离子交换树脂进行前区分。阴离子交换色层分析法允许粗略地依照它们电荷特性,进行样本中蛋白质前区分。例如,能使用Q阴离子交换树脂(如Biosepra公司的Q HyperD F),且样本能以不同pH的洗提液连续冲提。阴离子交换色层分析法允许样本中具更多负电荷的生物分子,与其它类型生物分子进行分离。以高pH洗提液冲提的蛋白质,可能是弱负电荷,而以低pH洗提液冲提的区分物,蛋白质可能是强负电荷。因此,除降低样本复杂性外,阴离子交换色层分析法是依照结合特性将蛋白质分离。
优选实施例中,血清样本是以阴离子交换色层分析法做区分。高含量蛋白质对较低含量蛋白质讯号的抑制,是对SELDI质谱法重要的挑战。样本区分降低每一区分物组成复杂性。欲将高含量蛋白质分离至一区分物中,俾于降低对较低含量蛋白质的讯号抑制时,亦能使用该方法。阴离子交换区分通过等电点(pI)分离蛋白质。蛋白质是由具两性电荷氨基酸组成,蛋白质电荷受其曝露环境的pH而改变。蛋白质等电点是指于该pH下,该蛋白质无净电荷的pH值。当环境pH等于蛋白质等电点时,则认为蛋白质为中性。当pH升高超过蛋白质等电点时,认为该蛋白质具净负电荷。当环境pH降低至蛋白质等电点以下时,认为该蛋白质具净正电荷。血清样本是依照以下实施例提出的操作步骤做区分,以获得此处叙述的标记。
蛋白质为阴离子交换树脂捕捉后,是以一系列于pH9、pH7、pH5、pH4、pH3步洗方式冲提。具三种可能性生物标记的受验者,通过三个区分物(pH9、pH4及有机溶剂)图形数据的单一化最大分离性分析(Unified Maximum SeparabilityAnalysis,UMSA)发现的。pH4区分物于m/z 12828与28043的二个谱峰强度,于癌症组群中皆向下调整;第三个标记是pH9流洗出的区分物中,位于m/z 3272的谱峰,其谱峰强度于癌症组群中向上调整。所有区分物皆结合至固定化金属亲和性色层分析阵列,该阵列具铜离子电荷(IMAC3-Cu)(见第一图光谱)。
样本中生物分子亦能以高解析电泳分离,如一维或二维凝胶电泳。含有标记的区分物能通过气相离子光谱法分离以及进一步分析。优选的是,是使用二维凝胶电泳产生包含一或多个标记的二维生物分子点阵列。例如参阅Jungblut &Thiede,Mass Spectr.Rev.16:145-162(1997)。
二维凝胶电泳能通过使用本技术已知方法来施行。例如见德意志(Deutscher)编着,酶学方法(Methods In Enzymology)第182册。典型地,样本中生物分子例如是以等电聚焦方式分离,此方式中样本中生物分子以pH梯度分离,直至生物分子达到净电荷为零(亦就是等电点)为止。这第一个分离步骤产生一维生物分子阵列。该一维阵列中生物分子,复以与第一个分离步骤所用技术通常有所区别的技术进行分离。例如,于第二维中,以等电聚焦方式分离的生物分子复以聚丙烯醯氨胶体,诸如十二烷基硫酸钠(SDS-PAGE)存在下的聚丙烯醯氨凝胶电泳法。SDS-PAGE胶体允许以分子生物分子量为基础的进一步分离。典型地,二维凝胶电泳能自复合混合物中,化学性分离分子量范围1000至200,000道尔顿的不同生物分子。该些胶体等电点范围约3-10(宽范围胶体)。
二维阵列中的生物分子能以任何本技术适合的已知方法进行检测。例如,将胶体中生物分子做标记或染色(如考马斯蓝或银染色)。如果凝胶电泳法产生相等于本发明一或多种标记分子量的色点,则该色点能通过气相离子光谱法做进一步分析。例如,该色点能自胶体中取出并以气相离子光谱法分析。或者,能通过施一电场将含有生物分子的胶体转移至钝性膜。然后膜上约相等于该标记分子量的色点,能通过气相离子光谱法进行分析。于气相离子光谱法中,色点能通过任何适合技术,诸如此处所述MALDI或SELDI(例如使用蛋白质
阵列)进行分析。
进行气相离子光谱法分析前,得将色点中生物分子用诸如蛋白酶(如胰蛋白酶)的切割剂切割成较小片段。生物分子消化成较小片段提供色点中该生物分子的质量指纹,若有需要,该指纹能用于标记确认的决定。
高效液相层析法(HPLC)能基于生物分子不同的物理性质如极性、电荷与大小,将样本中生物分子混合物分离。HPLC仪器通常由流动相储存源、帮浦、注射器、分离柱及检测器组成。样本中生物分子通过注射样本液至分离柱而分离。混合物中不同的生物分子,由于该生物分子在分离柱移动相与固定相间分布行为的差异,是以不同速度通过分离柱,故能收集相当于一或多种标记的该分子量及/或物理性质的区分物。区分物能通过气相离子光谱法检测标记而加以分析。例如,色点能通过如此处所述MALDI或SELDI(例如使用蛋白质
阵列)加以分析。
或可选择,标记分析前是先加以修饰以改进其解析力或用以决定其种类。例如,标记分析前得进行蛋白质分解消化。能使用任何蛋白酶进行消化。可能将标记切割成不连续数目片段的蛋白酶,诸如胰蛋白酶特别有用。消化产生的该片段可作为标记指纹,因此使间接检测该标记成为可能。当有类似分子量的标记也许与怀疑的该标记混肴时,标记指纹尤其有用。蛋白质分解片段对高分子量标记也有用处,因为较小标记较易为质谱法解析。另一举例,是能修饰生物分子以改善检测解析力。例如,能用神经胺糖酸酶(neuraminidase)自醣蛋白移除末端涎酸(sialic acid)残基,以改善对阴离子吸附剂(如阳离子交换蛋白质
阵列)的结合以及改善检测解析力。另一举例,标记能以贴附专一性与分子标记结合,又能辨识标记的特殊分子量标记加以修饰。或可选择,检测这样的修饰的标记后,该标记身份能复通过比对蛋白质数据库(如SwissProt)中,该修饰标记的物理与化学特征来决定。
III.标记捕捉
生物标记以为固定至固体支撑物(诸如此处所述任何生物芯片、多格微滴定盘或树脂)的捕捉剂捕捉为宜。特别是,本发明生物标记是以SELDI蛋白质生物芯片捕捉为宜。捕捉能发生于色层分析表面或生物专一性表面。任何包括反应性表面的SELDI蛋白质生物芯片,皆能用于捕捉与检测本发明的生物标记。然而,本发明的生物标记是结合至固定化金属螯合剂。IMAC-3与IMAC30生物芯片,其胺乙酸官能基通过螯合作用吸附诸如Cu++与Ni++的过渡金属离子,是本发明用于捕捉生物标记的优选SELDI生物芯片。任何包括反应性表面的SELDI蛋白质生物芯片,皆能用于捕捉与检测本发明的生物标记。该些生物芯片能以专一性捕捉标记的抗体进行衍生,或者以结合免疫球蛋白的蛋白质A或蛋白质G捕捉剂进行衍生。然后生物标记能为使用专一性抗体的溶液捕捉,同时该已捕捉的标记通过由捕捉剂自生物芯片上单离出来。
通常,含有生物标记的样本诸如血清,是放置于生物芯片的活性表面,以俾使有充分时间进行结合。然后,未结合的分子以适合冲提剂诸如磷酸盐缓冲液自该表面冲提出来。通常,该洗提液离子力越强,则该蛋白质必须结合越紧,俾使冲提后蛋白质仍留在该表面。此时滞留的蛋白质生物标记能以适合的方式检测。
IV.标记检测与测定
一旦基质例如生物芯片或抗体捕捉到标记,则能用任何适合方法测定样本中标记。例如,能以各种方法如包括气相离子光谱法、光学法、电化学法、原子力显微镜法以及射频法检测及/或测定标记。使用该些方法能检测一或多种标记。
A)SELDI
一种检测及/或测定生物标记优选的方法,是使用质谱法,尤其是“表面加强激光吸/电离”或“SELDI”。SELDI是指一解吸/电离气相离子光谱法(如质谱法)的方法,方法中分析物是由设于探针接口的SELDI探针表面捕捉。于“SELDI质谱”,该气相离子光谱仪是质谱仪。以上是较详细地叙述SELDI技术。Apo A1、甲状腺素运送蛋白ΔN10及IAIH4片段的检出谱峰,是分别位于m/z 28043、m/z约12870.9以及m/z 3272。
B)免疫分析法
另一实施例,免疫分析法能用于检测与分析样本中标记。该方法包括:(a)提供专一性结合标记的抗体;(b)以抗体接触样本;以及(c)检测样本中抗体结合标记的复合体是否存在。
免疫分析法是使用抗体专一性结合抗原(如标记)的方法。该免疫分析法特征是使用特定抗体专一性结合特性,进行抗原单离、定标及/或定量。当涉及蛋白质或肽时,抗体“专一性(或选择性)结合”或“具专一性(或选择性)免疫反应性”用语,是指于蛋白质与其它生物分子的异种分布中,决定该蛋白质存在的结合反应。因此,于设计的免疫分析法条件下,专一性抗体至少结合特定蛋白质二次,且对样本中其它蛋白质无显著量的充分结合。这样的条件下专一性结合抗体,得须选择对特定蛋白质具专一性的抗体。例如,自特定物种如大白鼠、老鼠或人的标记培养多株抗体,能选择得到那些只对该标记并不对其他蛋白质(除该标记多晶变异物与对偶基因外),具专一性免疫反应性的多株抗体。该选择得通过排除与其它物种中该标记分子进行交互反应的抗体而获得。
通过使用纯化的标记或核酸序列,专一性结合标记的抗体能以各种本技术已知的适合方法制备。如参阅柯林根(Coligan)著,免疫学现代档案(CurrentProtocols in immunology)(1991);哈洛与连(Harlow & Lane)著,抗体:实验室手册(Antibodies:A Laboratory Manual)(1988);高丁(Goding)著,单株抗体:原理与应用(Monoclonal Antibodies:Principles and Practice),第二版(1986);以及柯勒与密尔斯坦(Kohler & Milstein),Nature 256:495-497(1975)。这样的技术包括(但不限定为)通过噬菌体或类似媒介重组抗体资料选择抗体,以进行抗体制备;以及以免疫兔或免疫老鼠方法制备多株与单株抗体(如参阅Huse等人,Science 246:1275-1281(1989);Ward等人,Nature 341:544-546(1989))。典型专一性或选择性反应将至少高于背景讯号或噪声二倍,而更典型则为高于背景讯号10至100倍。
通常,自受验者处得到的样本能与专一性结合标记的抗体相接触。或可选择,抗体与样本接触前,能固定抗体至固体支撑物,以利于冲提与单离该复合物。固体支撑物举例包括如微滴定盘、棒、珠或微珠形状的玻璃或塑料。抗体亦能贴附于以上所述探针基质或蛋白质
阵列。样本以取自受验者的生物学液体样本为宜。生物学液体样本举例包括血液、血清、血浆、乳头分泌物、尿液、眼泪、唾液等。优选实施例中,生物学液体包括血清。样本接触抗体前,能以适当冲洗剂稀释样本。
以抗体培养样本后,清洗该混合物,而形成的抗体-标记复合物能进行检测。此检测能以检测剂培养该清洗后混合物来达到。此检测剂得是例如以可检测标记标示的第二抗体。可检测标记举例包括磁珠(如DYNABEADSTM)、萤光染料、放射性标记、酶(如辣根过氧化酶、碱性磷酸酶与其它ELISA常用的酶)以及比色标记如胶体金、有色玻璃或塑料珠。或者,样本中标记是以间接方法测定,其中,例如具标记的第二抗体是用于检测结合标记-专一性抗体;以及/或于竞争或抑制方法中,例如,结合该标记明显抗原决定基的单株抗体与该混合物同时培养。
测定抗体-标记复合物量或存在与否方法,例如包括萤光检测、发光、化学发光、吸收率、反射率、透光率、双折射率或折光指数(例如表面电浆共振、椭圆偏光法、共振镜法、光栅耦合器波导法或干涉法)。光学法包括显微镜(共轭焦与非共轭焦二者)、影像法与非影像法。电化学法包括伏特安培法与安培法。射频法包括多极共振光谱法。施行该些分析法的方法是本技术已经已知者。有用的分析法,例如包括酶免疫分析法(enzyme immune assay,EIA)诸如酶联结免疫吸附法(enzyme-linked immunosorbent assay,ELISA)、放射免疫分析法(radioimmune assay,RIA)、西方墨点分析法(Western blot assay)或长孔墨点分析法(slot blot assay)。该些方法于下列文献中亦有说明,例如,细胞生物学方法:细胞生物学中抗体(Methods in Cell Biology:Antibodies in Cell Biology),第37册(阿塞(Asai)编着,1993);基础与临床免疫学(Basic and Clinical Immunology)(史提特斯与特尔(Stites & Terr)编着,第7版,1991);以及哈洛与连的著作(前面已述)。
整个分析方法中,于每一试剂相结合后得须进行培养基及/或清洗步骤。培养步骤能自约5秒变化至数小时,以自约5分钟至约24小时为宜。然而,培养时间将视分析方法类型、标记、溶液体积、浓度等而定。虽然分析方法能于一温度范围如10℃至40℃下施行,但通常该分析方法将于常温下进行。
免疫分析法能用于决定样本中标记存在与否,以及样本中标记的量。抗体-标记复合物的量能通过与标准物比较而决定。标准物能为如已知化合物或样本中已知存在的另一种蛋白质。如上所示,标记试验量不须以绝对单位测定,只要该测定单位能与对照组比较即可。
检测样本中该些标记的方法有许多应用。例如,一或多种标记能用于帮助人类癌症诊断或预后的测定。另一举例,检测标记的方法能用于监测受验者对癌症治疗的反应。另一举例,检测标记的方法能用于分析与确认体内或体外,调节该些标记表现的化合物。优选实施例中,生物标记是用于区别肿瘤进程的不同阶段,以俾于帮助决定适合的疗法以及决定该肿瘤转移的程度。
V.资料分析
当例如使用质谱法测定样本时,即产生数据,该数据然后以计算机软件程序分析。通常,该软件是包括能将质谱仪讯号转换成计算机可读形式的译码。该软件亦包括译码,其是应用算法分析讯号,以决定该讯号是否于讯号中代表相当于本发明标记的”谱峰”,或是其它有用标记。该软件亦能包括执行比较试验样本与典型”正常”及人类癌症讯号特征,并决定该二讯号间符合程度演算的译码。该软件亦能包括指示试验样本接近哪一个特征的译码,因而提供可能的诊断。
本发明优选实施例中,测定多重生物标记。多重生物标记的使用提高试验预测值准确度,以及于诊断、毒物学、病人状态及病人监控方面提供较大的利用。该过程称为”图案辨识(pattern recognition)”,是检测多重生物标记形成的型样,型样辨识大大改善对预测药品临床蛋白体的灵敏度与专一性。临床样本数据(例如以SELDI获得者)细微变异,显示蛋白质表现的某些型样,能预测诸如一些疾病的存在与否;癌症进程特定状态;或是对药物治疗正向或逆向反应。
质谱法产生数据是由通过如上所述的离子检测器检测离子开始的。离子撞击检测器,产生由高速时间阵列记录器所数字化的电能,该记录器是数字化地捕捉模拟讯号。赛弗吉蛋白质
系统应用模拟对数字转换器(ADC)来完成此动作。ADC将检测器输出于固定宽度时间间隔积分成与时间相关的箱型讯号。该时间间隔典型为一至四纳秒(nanosecond)长。再者,最后分析的飞行时间光谱,典型地并不代表源自对样本离子化能量的单一脉冲讯号,而是源自一些脉冲讯号的总和。此能降低噪声与增加动态范围。该飞行时间数据然后进行数据处理。于赛弗吉蛋白质
软件,典型数据处理包括TOF对M/Z转换;基线扣除;以及高频噪声过滤。
TOF对M/Z转换包括将飞行时间转换成质量对电荷比(M/Z)的演算运用。于此步骤,讯号从时间相关转换成质量相关。亦就是,将每一飞行时间转换成质量对电荷比,或M/Z。校正是做内或外校正。于内校正,分析样本具一或多个已知M/Z分析物。于飞行时间中将代表该些质量分析物的讯号峰指定为该已知M/Z。依照该些指定M/Z比,计算转换飞行时间为M/Z数学函数的参数。于外校正,将飞行时间转换为M/Z的函数,诸如以先前内校正造出的函数,以未使用内校正物方式应用至飞行时间光谱上。
基线扣除通过消除扰乱光谱重复性仪器输出的假讯号,而改善数据定量。其包括使用导入参数,诸如峰宽演算以计算光谱基线,然后自质谱中扣除该基线。
高频噪声通过平滑函数除去。典型平滑函数是对每一时间相关bin,应用移动平均函数。于改善版中,移动平均过滤器是可变宽度数字过滤器,于该过滤器中,过滤器带宽是以如谱峰带宽的函数来改变,通常随飞行时间增加而变得较宽。例如见WO 00/70648,2000年11月23日(Gavin等人,“用于飞行时间质谱法的可变宽度数字过滤器(Variable Width Digital Filter for Time-of-flight MassSpectrometry)”)。
分析通常包括代表源自分析物讯号的光谱谱峰确认。当然,谱峰的选定能以肉眼进行。然而,亦有软件(是赛弗吉蛋白质
软件一部分)能用于自动检测谱峰。通常,软件功能是确认具讯号对噪声比大于选定阈值的讯号,以及对该谱峰讯号中央的谱峰质量作标记。一有用的应用,是比较许多光谱,以确认于某些选定比例的质谱中,出现的相同谱峰。该软件的一个版本,将出现于特定质量范围内不同光谱的所有谱峰进行分群,并对所有靠近该质量(M/Z)群的中点的谱峰指定质量(M/Z)。
源自一或多个光谱的谱峰数据,例如通过造出电子表格能进行进一步分析,于该电子表格中,电子表格每一列代表一特定质量,每一行代表由质量定义光谱中一谱峰,且每一单元格包含特定光谱中该谱峰强度。各种统计或型样辨认趋近法能应用至数据上。
于一例中,赛弗吉生物标记型样TM软件(Ciphergen’s Biomarker PatternsTMSoftware)用于检测产生的光谱型样。数据以分类模型的型样辨认处理进行分类。通常,该光谱将代表源自至少二种不同组群(使用分类演算来寻找)的样本。例如,该组群是病理学的对非病理学的(如癌症对非癌症)、药物反应对非药物反应、毒性反应对非毒性反应、疾病状态进步者对疾病状态非进步者、有表现型情况对无表现型情况。
本发明实施例产生的光谱能以分类模型的型样辨识处理分类。一些实施例中,源自使用样本如”已知样本”产生的光谱(如飞行时间光谱的质量光谱)数据,能用来”训练”分类模型。”已知样本”是事先分类(如癌症或非癌症)的样本。源自该光谱且用于形成分类模型的数据是称为”训练数据组”。一旦训练,分类模型能辨识源自用未知样本产生的光谱数据类型。分类模型然后能用于将未知样本分类。例如,于预测特定生物学样本是否与某一生物学状况(如疾病对非疾病)相关时,分类模型是有用的。
用于形成分类模型的训练数据组得包括原始数据或前处理数据。一些实施例中,原始数据是直接从飞行时间光谱或质谱得到的,然后以任何适当方式得进行选择性”前处理”。例如,能选择大于预定讯号对噪声比的讯号,如此便选择光谱中谱峰子集,而非选择光谱中所有谱峰。另一例中,具共同数值(如飞行时间数值或质量对电荷比数值)的预定数目谱峰”群组”能用于选择谱峰。举例来说,如果给定质量对电荷比的谱峰是少于质谱组群中该质谱的50%,然后则该质量对电荷比的谱峰能自训练数据组中省略。诸如这些的前处理步骤,能减少用于训练分类模型数据的数量。
分类模型能以任何适当的,意图将数据主体以数据中呈现的目标参数为基础,而分隔成类的统计分类(或”学习”)方法来形成。分类方法得为监督式(supervised)或非监督式(unsupervised)。监督式与非监督式分类处理例子于Jain著作中有说明”统计型样辨识:回顾(Statistical Pattern Recognition:A Review)”,类型分析的IEEE处理与机械智能,第22册,1期,2000年1月,此处是以完整参考资料方式引用。
于监督式分类中,含有已知类别样本的训练数据是呈现于学习机构中,学习机构学习多于一组定义每一已知类别的关系。新的数据然后得应用于该学习机构,该学习机构然后用学得的关系分类新数据。监督式分类处理举例包括线性回归处理[如多重线性回归(multiple linear regression,MLR)]、部分最小平方回归(partial least squares regression,PLS)与主成分回归(principal components regression,PCR)]、二元决策树(binary decision trees)(如递归分布处理(recursive partioning process)如分类及回归树(CART))、类神经网络(artificial neural networts)如倒传递网络(backpropagation networks)、辨别分析(如贝斯分类器(Bayesian classifier)或费雪分析(Fisher analysis))、逻辑分类器以及支持向量分类器(support vector classifier)(支持向量机(support vector machine))。
优选监督式分类方法系递归分布处理。递归分布处理使用递归分布树分类源自未知样本的光谱。关于递归分布处理进一步详细内容于美国专利US 20020138208A1(Paulse等人”分析质谱的方法(Method for analyzing mass spectra)”,2002年9月26日)中有提供。
其它实施例中,造出的分类模型能用非监督式学习方法形成。非监督式分类意图以训练数据组中的相似性为基础学习分类,其中训练数据组未有该训练数据组光谱的事前分类。非监督式学习方法包括群集分析。群集分析意图将数据分成理想上应有彼此非常相似,且对其他群集成员非常不相似的”群集”或群。相似性然后用一些测定数据项目间距离的距离尺度来测定,而群集将彼此靠近的数据项目集合起来。群集技术包括MacQueen K-平均值演算与Kohonen自我组织网络(Self-Organizing Map)演算。
主张学习算法用于分类生物学讯息的叙述,例如有:WO 01/31580(Barnhill等人,”确认生物学是统型样的方法与设计及其使用方法(Methods and devices foridentifying patterns in biological systems and methods of use thereof)”,2001年5月3日);US 2002/0193950A1(Gavin等人,”质谱方法或分析(Method or analyzing massspectra)”,2002年12月19日);US 2003/0004402A1(Hitt等人,”以自生物学数据隐藏型样为基础的生物学状态间辨别处理(Process for discriminating betweenbiological states based on hidden patterns from biological data)”,2003年1月2日);以及US 2003/0055615A1(张与张,”处理生物学表现数据的系统与方法(Systemsand methods for processing biological expression data)”,2003年3月20日)。
更特别地,为得到生物标记Apo A1、甲状腺素运送蛋白ΔN10与IAIH4片段,将癌症受验者与健康对照的样本谱峰强度数据当做”发现组”。将该数据组合并随意分成训练组与试验组,用单一最大分离分析(Unified MaximumSeparability Analysis,USMA)分类器的非线性版,建立并试验多变量预测模型。USMA分类器详细内容于US 2003/0055615A1中有叙述。
通常,自以上部分IV产生的数据是放入诊断算法(亦就是如上说明的分类算法)中。以学习算法为基础,然后产生分类算法。过程包括发展能够产生分类演算的演算。本发明方法以统计样本计算为基础,通过增加足够数目的一些卵巢癌与正常样本产生更准确的分类演算。于学习演算中,该样本是做为数据训练组。
该分类的产生,亦即诊断、演算,是依赖用于分析样本,以及产生前述部份IV得到的数据的分析操作。用于检测及/或测定该标记(如步骤IV)的操作步骤绝对必须与用于得到发展该分类演算的数据相同。必须于包括芯片类型与质谱仪参数的该训练与分类系统,以及一般样本制备与试验操作中维持该分析条件。如果该标记(步骤IV)检测及/或测定的操作步骤改变,则该学习演算与分类演算亦必须改变。类似地,如果该学习演算与分类演算改变,则该标记(步骤IV)检测及/或测定的操作步骤也必须改变,以使与用来产生分类演算的操作步骤相符合。发展新的分类演算模型须强调有足够数目的卵巢癌与正常样本,以新的检测操作步骤为基础发展新的训练数据组,用该数据产生新的分类演算,最后用多点(multi-site)研究验证该分类演算。
该分类模型能于任何适当的数字计算机上建立与使用。适当的数字计算机包括使用任何标准或特殊操作系统如Unix、WindowsTM或LinuxTM基本操作系统的微、迷你或大型计算机。使用的数字计算机得实体上与用于制造有兴趣光谱的质谱仪分开,或其得与质谱仪相连接。如果数字计算机是与质谱仪分开,则数据必须通过一些其它方式(不管人工或自动化)输入计算机中。
依照本发明实施例的训练数据组与分类模型能以数字计算机执行的计算机代码使其具体化。该计算机代码能存放于任何适当的计算机可读媒介包括光或磁盘、杆、带等,并能以任何适当计算机程序语言包括C、C++、visual basic等写成。
VI优选实施例
优选实施例中,血清样本是收集自病人,然后以上述说明的阴离子交换树脂区分。样本中生物标记是以IMAC铜蛋白质芯片阵列捕捉。该标记然后以SELDI检测。于此试验中能检测Apo A1、甲状腺素运送蛋白ΔN10与IAIH4片段。结果然后输入计算机系统,其中该系统含有的演算是以与用于学习演算与分类演算,原始决定该标记的相同参数进行设计。演算产生以该得到的数据为基础,而与每一生物标记相关的诊断。
特别优选实施例中,亦检测CA125II生物标记数量,检测是使用如免疫分析法的已知方法或使用SELDI蛋白质芯片阵列。该些实施例中,CA125II标记结果亦输入至计算机演算中,用于准备诊断。以该四种标记,Apo A1、甲状腺素运送蛋白ΔN10、IAIH4片段与CA125II检测为基础的诊断试验,至少有约80%专一性。
该诊断是由检查从SELDI试验,用生物标记发展的分类演算所产生的数据来决定。该分类演算是依赖于该用于检测该生物标记的试验操作步骤特点。该些特点例如包括样本制备、芯片类型与质谱仪参数。如果该试验参数改变,则该演算必须改变。同样地,如果该演算改变,则该试验操作步骤亦须改变。
另一实施例中,样本是收集自病人。生物标记是以上述说明的抗体蛋白质芯片阵列捕捉。该标记以生物专一性SELDI试验系统检测。于此试验中能检测Apo A1、甲状腺素运送蛋白ΔN10与IAIH4片段。结果然后输入计算机系统,其中该系统含有的演算是以与用于学习演算与分类演算,原始决定该标记的相同参数进行设计。演算产生以该得到的数据为基础,而与每一生物标记相关的诊断。
其它优选实施例中,该标记是以非SELDI方式捕捉与试验。于一例中,该样本收集自受验者。该生物标记是以用其它已知方法如抗体对该标记的基质捕捉。该标记以本技术已知的方法如光学法与折射指数检测。光学法例子包括如ELISA的萤光检测。折射指数例子包括表面电浆共振。该标记结果然后进行演算,该演算得或不须要使用人工智能。该演算产生以该得到的数据为基础,而与每一生物标记相关的诊断。
以上任何方法,源自样本的数据得直接自该检测方法输入至具诊断演算的计算机中。可择一采用将得到的数据以人工方式,或通过自动化方式,输入至含有该诊断演算的个别计算机中。
VII受验者诊断及卵巢癌状态决定
任何生物标记,各自地对卵巢癌状态的决定有帮助。首先,于受验者样本中测定选择的生物标记,是使用此处叙述的方法,如先捕捉于SELDI生物芯片接着以质谱法检测。然后该检测以区别卵巢癌状态与非癌症状态的诊断量或对照组比较。该诊断量将反映此处讯息:与非癌症状态比较,癌症状态中的特殊生物标记量是向上调节或向下调节。如本技术所悉知,该使用的特殊诊断量能加以调节以增加该诊断分析法(是依照诊断师喜好采用)灵敏度或专一性。当该试验量与该诊断量比较时,便显示出卵巢癌状态。
当各自生物标记是为有用的诊断标记时,发现生物标记组合比单一生物标记提供较大预测价值。特别是,样本中多个标记测定提高真阳性与真阴性诊断百分比,并将降低假阳性或假阴性百分比。因此,本发明优选方法包括多于一个生物标记的测定。例如,本发明方法ROC分析,其AUC大于0.50,优选方法AUC大于0.60,而更优选方法AUC大于0.70。特别佳方法AUC大于0.70,而最佳方法AUC大于0.80。
再者,使用测定本发明三种优选标记与标记4如CA125组合的方法,显著地改善该CA125诊断结果,提供AUC大于0.50的试验,AUC大于0.60的优选试验,AUC大于0.70的更优选试验。
为了使用组合生物标记,逻辑回归演算是有用的。该UMSA演算,对自试验数据产生诊断演算特别有用。该演算于下列Z.Zhang等人所着的微阵列数据应用于分类分离分析中有揭示:Lin SM,Johnson KF编着,微阵列数据分析方法:CAMDA’00报告,波士顿Kluwer学术出版社,2001:125-136;以及Z.Zhang等人,钓鱼期望-从表现图谱概略萃取型样的监督式逼近(Fishing Expedition-aSupervised Approach to Extract Patterns from a Comperndium of ExpressionProfile),于Lin SM,Johnson KF编着,微阵列数据分析方法II:CAMDA’01报告,波士顿Kluwer学术出版社,2002。
学习演算将产生多变量分类(诊断的)演算,并调成操作者期望的特定专一性与灵敏度。分类演算然后能用于决定卵巢癌状态态。该方法亦包括测定受验者样本中选定的生物标记(例如Apo A1、甲状腺素运送蛋白ΔN10与IAIH4片段)。该些测定提供给分类演算。该分类演算产生指示分数用以指示卵巢癌状态。
一些实施例,仅表示标记存在或不存在,并未对标记定量,这是有用的,能与卵巢癌可能诊断关联。例如,卵巢癌病人中检测到IAIH4片段频率比正常受验者高。同样地,例如,卵巢癌病人中检测到生物标记Apo A1与甲状腺素运送蛋白ΔN10频率比正常受验者低。因此,个别检测试验受验者的该些标记存在与否,显示该受验者有患卵巢癌的较高可能性。
其它实施例,标记测定能包括定量标记,以关联标记检测结果与卵巢癌可能诊断。因此,如果试验样本中检测的该标记量与对照量比较有差异(亦就是比对照组高或低,视该标记而定),则该试验受验者有患卵巢癌的较高可能性。
该相关性得考虑比较样本中该(些)标记量与该(些)标记对照量(该(些)标记向下或向上调节)(例如,正常者其癌症无法检测到)。对照量,例如是为未检测到癌症的正常受验者的可比较样本中,该出现标记量的平均或中位数。该对照量是于如该试验量测定相同或实质上类似实验条件下测定。该相关性得考虑试验样本中该标记存在与否,以及对照者中该相同标记检测频率。该相关性得考虑这两者因素以助于决定卵巢癌状态。
某些评定卵巢癌状态的方法实施例中,该方法还包括以该状态为基础的安排受验者疗法。如前所述,这样的安排说明医师或临床医师其后对决定卵巢癌状态采取的动作。例如,如果本发明方法的结果无法下结论,或有理由认为确认状态是须要的,则医生得要求更多试验。可择一地,如果该状态显示动手术是适当的,则医师得安排病人动手术。其它举例,该病人得接受化学治疗或放射线处理,以代替或辅助动手术。同样地,如果该结果是负面的,例如该状态显示卵巢癌末期或如果该状态为急性,则得无采取进一步动作。再者,如果该结果显示治疗已经成功,则得无进一步安排的必要。
本发明也提供如受验者安排后测定该生物标记(或生物标记特定组合)的方法。于该些例中,该些方法是用于监看卵巢癌状态,例如对癌症治疗反应、疾病减缓或疾病进展程度。因为该些方法容易使用以及该些方法缺乏侵入性,因此病人接受每一治疗后,得重复该些方法。此允许医师去检视该治疗过程的效果。如果该结果显示该治疗无效,则该处理过程得据此改变。此使医师于疗法选择时能有弹性。
另一例中,该些检测标记方法能用于分析及确认调节体内或体外该些标记表现的化合物。
本发明的方法亦有其它应用。例如,该些标记能用于筛选调节体内或体外该些标记表现的化合物,其中该些化合物于治疗或避免病人卵巢癌得有用处。另一例中,该些标记能用于监看对卵巢癌治疗的反应。又另一例中,该标记能用于遗传研究以决定是否该受验者有发展成卵巢癌的危险。例如,某些标记得基因上相关联。此是能例如通过分析有卵巢癌家庭病史的卵巢癌病人群样本而决定。该结果然后能与例如自无卵巢癌家庭病史的卵巢癌病人得到的资料加以比较。该基因上相关联的标记得做为,决定是否有卵巢癌家庭病史的受验者有卵巢癌倾向的工具。
VIII.试剂盒
又另一实施方面中,本发明提供评定卵巢癌状态的试剂盒,其中该试剂盒能用于测定本发明标记。例如,该试剂盒能用于测定任何一或多种此处所述的标记,该标记于卵巢癌病人者与正常受验者样本中有出现上差异。本发明试剂盒有许多应用。例如,该试剂盒能用于区别是否受验者有卵巢癌或有阴性诊断,如此能让医师或临床医师诊断该癌症存在与否。该试剂盒亦能用于监看病人对治疗过程的反应,以使医师能以该试验结果为基础调整疗法。另一例中,该试剂盒能用于确认体内或体外调节卵巢癌动物模型中一或多个该标记表现的化合物。
因此本发明提供的试剂盒包括(a)结合选自Apo A1、甲状腺素运送蛋白ΔN10与IAIH4片段,及该些标记组合生物标记的捕捉剂;以及(b)包括至少一种该标记的容器。于优选试剂盒中,该捕捉剂结合多个该些生物标记。该捕捉剂亦得结合至少一种已知生物标记,标记4,例如CA125。于某些优选实施例,该试剂盒还包括结合一种该第一捕捉剂未与其结合的生物标记的第二捕捉剂。
又本发明提供的试剂盒包括(a)结合至少一种选自Apo A1、甲状腺素运送蛋白ΔN10与IAIH4片段的生物标记的第一捕捉剂;以及(b)结合至少一种未与第一种捕捉剂结合的生物标记的第二捕捉剂。以至少一种该捕捉剂是抗体为宜。某些试剂盒还包括至少贴附或可贴附一捕捉剂的MS探针。
该捕捉剂能为任何类型的试剂,该试剂以SELDI探针为宜。本发明某些试剂盒,该捕捉剂包括IMAC。
本发明也提供试剂盒,包括(a)结合至少一种选自Apo A1、甲状腺素运送蛋白ΔN10与IAIH4片段的第一捕捉剂;以及(b)使用该捕捉剂测定该生物标记的说明书。某些试剂盒中,该捕捉剂包括抗体。再者,一些前述试剂盒还包括贴附或可贴附该捕捉剂的MS探针。一些试剂盒中,该捕捉剂包括IMAC。该三种确认标记中每一种,此处是结合至IMAC蛋白质
阵列。因此,本发明一优选实施例包括用于早期检测卵巢癌的高产量试验,该试验用于该三种分析物的IMAC蛋白质
阵列,以及传统CA-125ELISA(或该CA-125ELISA得转移至该蛋白质
阵列平台)分析病人样本。
其它实施例,该试剂盒如此处所述,包括至少一种结合至少一种选自标记I至标记XLVIII的捕捉剂。
本发明某些试剂盒还包括清洗液,或洗提液,当清洗后与其它生物标记比较,选择性地允许该结合生物标记滞留于该捕捉剂上。可选择地,该试剂盒得含有制造清洗液的说明书,其中该吸附剂与该清洗液组合允许使用气相离子光谱法测定该些标记。
优选地,该试剂盒包括用于检测癌症的该试剂盒使用说明书,以及提供试验样本与该捕捉剂接触,并检测一或多个为该捕捉剂滞留的生物标记的说明书。例如,该试剂盒得具标准说明书,以告知消费者如何于血清样本接触该捕捉剂后,清洗该捕捉剂(如探针)。另一例中,该试剂盒用于前区分样本,以降低该样本中蛋白质复杂性。另一例中,该试剂盒得具自动化该区分或其它程序的说明书。
该些试剂盒能自以上说明的物质制备,而该些物质(如探针基质、捕捉剂、吸附剂、清洗液等)的前述讨论是完全可应用至这部分,故将不再重复叙述。
另一实施例中,该试剂盒得包括具吸附剂(如以吸附剂功能化的颗粒)的第一基质,以及该第一基质能置其上以形成探针的第二基质,其中该探针是可移动可插入气相离子光谱仪中。其它实施例中,该试剂盒得包括单一基质,该基质是为可移动可插入具吸附剂于该基质上的探针形式。又另一实施例中,该试剂盒得还包括前区分自旋柱(如Cibacron蓝色洋菜糖柱、抗HAS洋菜糖柱、K-30尺寸排除柱、Q-阴离子交换自旋柱、单股DNA柱、lectin柱等)。
另一实施例中,试剂盒包括(a)专一性结合标记的抗体;(b)检测剂。该试剂盒能自以上所述物质制备,且前述关于该物质(如抗体、检测剂、固定化支撑物等)的讨论是完全可应用于这部分,因此将不再重复说明。可选择地,该试剂盒得还包括对适当操作参数(标记或独立型式)的说明书。
可选择地,该试剂盒得还包括标准或对照讯息,以便该试验样本能与该对照讯息比较,该讯息是对决定是否样本中该标记检测的试验量,是与卵巢癌诊断的诊断量符合的标准。
本发明也提供包括至少一种结合至少两种选自Apo A1、甲状腺素运送蛋白ΔN10与IAIH4片段生物标记的捕捉剂的制品。本发明制品例子包括,但不限定为,蛋白质
阵列、探针、微滴定盘、珠、试管、微量试管与任何其它捕捉剂能附着其上的固相。本发明制品其它实施例还包括结合其它已知卵巢癌标记,亦就是标记4,的捕捉剂。该物品举例,例如蛋白质
阵列,将具捕捉Apo A1、甲状腺素运送蛋白ΔN10与IAIH4片段及标记4的吸附剂。尤佳实施例中,标记4是CA125。另一例中,微滴定盘将具能结合Apo A1、甲状腺素运送蛋白ΔN10与IAIH4片段及标记4的抗体。这些是该些制品的一些实例。具本技术一般技能者将能制造其它该些与此处说明一致的物品。
本发明也提供包含多个捕捉剂的系统,而每一捕捉剂是与选自Apo A1、甲状腺素运送蛋白ΔN10、IAIH4片段与至少一种符合标记4类别的不同标记结合。该系统举例包括,但不限定为,蛋白质
阵列组,该蛋白质
阵列组包括结合一或多种选自Apo A1、甲状腺素运送蛋白ΔN10与IAIH4片段生物标记的吸附剂。该系统类型中,每一该生物标记得具一种蛋白质
阵列。或可选择地,对源自组群Apo A1、甲状腺素运送蛋白ΔN10与IAIH4片段的多个标记得具一种蛋白质
阵列,对CA125得具第二种蛋白质
阵列。其它系统举例包括该捕捉剂是含有对每一种该生物标记的抗体的试管,各自分开或成群。具本技术一般技能者将能制造其它该些与此处说明一致的物品。
本发明也提供筛选试验,包括(a)使舒血管素与舒血管素基质以及与试验剂接触;(b)决定该试验剂是否调节该舒血管素活性。一项这样的试验,该基质是间-α-胰蛋白酶抑制物重链H4前体。如以下讨论,业已发现数种舒血管素是卵巢癌中的dys-regulated(reviewed in Diamandis 2002)。因此,该舒血管素活性的决定是卵巢癌的显示。该方法中,决定是否该试验剂调节该舒血管素活性步骤,包括测定IAIH4片段存在或其量。以上说明该测定IAIH4片段方法能用于筛选。
以下例子提供做为举例,但并不做为限定。当提出特定例子时,以上说明是为举例,并不做为限定。任何一或多个该先前说明实施例的特征,能与一或多个本发明任何其它实施例的特征,以任何方式相结合。再者,本发明许多变化对具本技术技能者于评估该特定性时,将变得明显。所以,本发明范围应该非以对该上述说明的参考做决定,而是应该以对该附属专利范围以及其同等全范围的参考做决定。
本申请中引用的所有发表及专利文件,对所有目的皆相同,是以完整参考资料方式引用,如同独自地代表每一个独自的发表或专利文件一样。引用本文件中各种参考资料时,申请人不承认对该些发明是”现有技术”的任何特别参考资料。
实施例
材料与方法
样本
蛋白质体图形数据是自503个收集自葛洛宁恩大学医院(荷兰葛洛宁恩)、杜克大学药学中心(北卡罗莱纳州达拉谟)、妇女皇家医院(澳洲雪梨)以及MD安德生癌症中心(德州休斯敦)的血清样品。该卵巢癌群组由65位侵袭性类上皮卵巢癌I/II期病人与88位侵袭性类上皮卵巢癌III/IV期病人、28位临界肿瘤病人以及14位复发性疾病病人组成。该癌症案例是由病理学家以国际妇产科联盟(International Federation of Gynecologists and Obstetricians,FIGO)标准为依据所做的适当分期。65位侵袭性类上皮卵巢癌I/II期病人中,20位是浆液性、17位是黏液性、15位是子宫内膜状、8位是亮细胞、1位是癌肉瘤以及4位是混合上皮癌(mixed epithelial carcinoma)。该样本亦包括166位诊断为良性骨盆腔瘤与142位健康对照。该研究分布的特性与基本描述性统计,包括年龄与CA125数量,列于表1。
所有病人样本是于手术或治疗前收集,且健康志愿者样本是有机构验证而收集的。该血液样本允许凝结,而血清则是即刻分离处理。所有样本存放于-70℃,并于分析前立刻解冻。所有病人CA125数量可从先前使用CA125II放射免疫分析法试剂盒(Centocor)的研究而得到。
除503个用于蛋白质体图谱样品外,尚有142个收集自约翰霍普金药学研究所,用于常规临床实验室试验的建立样品,做为该确认生物标记(免疫分析试验可得到)量试验用。该些样本中,41个是采自卵巢癌晚期病人以及41个是采自健康妇女。剩余60个样本由20位每一位具乳癌、结肠癌与前列腺癌病人组成,且用于试验该确认生物标记的肿瘤位置专一性(表3)。所有样本于收集后2至4小时内处理,然后存放于2至8℃不超过48小时,接着于-70℃进行冷冻。CA125II分析法亦使用二位置免疫酶分析法(two-site immunoenzymometric assay)于TosohAIA-600II分析仪(Tosoh Medics公司制)进行。
实施例1:蛋白质表现图谱
血清区分:血清样本于冰上解冻,然后以20000g转速离心10分钟以除去沉淀。20ul血清与变性缓冲液(U9:9M尿素、2%CHAPS、50mMTris pH9.0)混合,并于4℃振荡20分钟。对每一样本,180ul Hyper Q DF阴离子交换树脂于200ul U1缓冲液中平衡三次(U9于50mM Tris pH9.0中稀释成1∶9)。该变性血清加到树脂中,并允许进行30分钟结合。然后收集未结合物质,接着将含有0.1%OGP的100ul 50mM Tris 9.0加至树脂中。收集该洗提液并与该未结合物质混合(流过树脂者;称为区分物1)。然后以pH梯度(每一100ul pH7、5、4、3冲提缓冲水溶液以及有机溶剂使用二次)冲提以收集各个区分物。此导致共收集六个区分物。分区是以Biomek 2000自动液体收集器(Beckman公司制)与微型混合振荡器(DPC)进行的。对照者共同血清(intergen)样本以相同方式处理以监控分析法的结果。
A.蛋白质表现图形使用材料
Beckman Biomek 2000自动化工作站
Q Hyper DF陶瓷阴离子交换树脂(法国Biosepra公司制)96格v型底微量盘.
96格loprodyne膜过滤盘(Silent Screen,Nalge Nunc)
平衡缓冲液-50mM Tris-HCl pH9.0
U9-9M尿素,2.0%CHAPS,50mM Tris-HCl pH 9.0;U1-1M尿素,0.22%CHAPS,50mM Tris-HCl pH 9.0;pH9.0缓冲液-100mM Tris-HCl,0.1%OGP pH9.0;pH 7.0缓冲液-100mM HEPES,0.1%OGP pH 7.0;pH 5.0缓冲液-100mM醋酸钠,0.1%OGP pH 5.0;pH 4.0缓冲液-100mM醋酸钠,0.1%OGPpH 4.0;pH 3.0缓冲液-50mM柠檬酸钠,0.1%OGP pH 3.0;有机缓冲液-33.3%异丙醇/16.67%乙腈/0.5%三氟乙酸(TFA)
B.操作程序
血清变性
以微量吸管吸取20ul血清至96格v型底微量盘中。加入30ul U9至每一含有血清的格中。然后以盘密封膜覆盖。当树脂进行平衡的时,将此盘中血清于4℃振荡至少20分钟。
树脂平衡
以三倍充填体积量的50mM Tris-HCl pH9.0清洗树脂五次。此操作能于50ml离心管内进行。通过加入等量体积的50mM Tris-HCl pH9.0至树脂中以制成50/50树脂泥。然后将180ul 50/50树脂泥加至96格过滤盘每一格中。规则地(每加二或三格)振荡含有树脂泥的试管以确保树脂对缓冲液的固定组成比例。将该缓冲液过滤后加入200ul U1,接着再过滤一次。以该相同方式再操作二次以上。
样本应用与培养
下一步骤是将该血清与树脂结合。此操作中第一步为以微量吸管吸取50ul每一样本至相对应的过滤盘格中。接着加入50ul U1至该样本盘每一格中并混合五次。然后自该样本盘每一格中吸取50ul至相对应的过滤盘格中。于4℃振荡30分钟。
下一步骤是收集该区分物。首先将96格v型底微量盘置于该过滤盘下方,然后收集通过该过滤盘的滤液。接着将100ul清洗缓冲液1加至该过滤盘每一格中后,于室温振荡10分钟。区分物1含有该流通过(the flow-through)与pH9的流出物。下一步将100ul清洗缓冲液2加至该过滤盘每一格中后,于室温振荡10分钟。将干净的v型底微量盘置于该过滤盘下方,然后收集区分物2。.接着将100ul清洗缓冲液2加至该过滤盘每一格中后,于室温振荡10分钟。收集该96格v型底微量盘区分物2的残留物。区分物2含有pH7的流出物。将100ul清洗缓冲液3加至该过滤盘每一格中后,于室温振荡10分钟。将干净的v型底微量盘置于该过滤盘下方,然后收集区分物3。接着将100ul清洗缓冲液3加至该过滤盘每一格中后,于室温振荡10分钟。收集该96格v型底微量盘区分物3的残留物。区分物3含有pH5的冲提流出物。将100ul清洗缓冲液4加至该过滤盘每一格中后,于室温振荡10分钟。将干净的v型底微量盘置于该过滤盘下方,然后收集区分物4。接着将100ul清洗缓冲液4加至该过滤盘每一格中后,于室温振荡10分钟。收集该96格v型底微量盘区分物4的残留物。区分物4含有pH4的冲提流出物。接着将100ul清洗缓冲液5加至该过滤盘每一格中后。于室温振荡10分钟。收集该96格v型底微量盘区分物5的残留物。区分物5含有pH3的冲提流出物。。接着将100ul清洗缓冲液6加至该过滤盘每一格中后,于室温振荡10分钟。将干净的v型底微量盘置于该过滤盘下方,然后收集区分物6。将100ul清洗缓冲液6加至该过滤盘每一格中后,于室温再次振荡10分钟。收集该96格v型底微量盘区分物6的残留物。区分物6含有该有机溶剂的冲提流出物。
冷冻该些区分物至操作芯片结合步骤时。
阵列结合:10ul每一区分物与90ul结合缓冲液混合,并结合至IMAC、SAX、H50与WCX蛋白质
阵列(赛弗吉公司Biosystem)上,做三重复。对IMAC,该结合缓冲液是含有500mM NaCl的100mM pH7.0磷酸钠溶液;对SAX,该结合缓冲液是100mM pH7.0磷酸钠溶液;对H50,该结合缓冲液是50%乙腈水溶液;对WCX,该结合缓冲液是100mM pH4.0醋酸钠溶液。结合可于室温反应30分钟产生。芯片然后以结合缓冲液清洗三次,再以蒸馏水清洗二次。使用介质为sinapinic acid。
数据采集与分析:对SELDI分析,所有阵列通过赛弗吉PBS II蛋白质芯片
阵列读取机进行读取,使用时间延滞聚焦、线性、激光析/电离飞行时间质谱仪。所有光谱以正离子模式采集。时间延滞聚焦延滞时间对肽是设定为400ns;对蛋白质设定为1900ns。离子是以3kV萃取脉冲萃取,并以20kV加速电压加速至最终速度。该系统使用重复速率为每秒2至5脉冲变化的脉冲氮激光。典型激光通量变化为30-150uJ/mm
2。大部分该样本分析是使用自动化分析操作控制该数据采集过程。每一光谱平均至少100次激光瞄准,并以已知肽或蛋白质混合物进行外校正。仪器每周以胰岛素与免疫球蛋白检查以确定功能。每一芯片以二种激光能量(高能与低能)读取。光谱进行外校正,基线以8倍适合宽度的设定进行减除,然后标准化至总离子流(排除介质区)。
实施例2:统计分析
生物标记发现:M/Z 2kD至50kD质量范围内欲评定的质量谱峰选自SELDI光谱。为了获得更多感兴趣范围内光谱资料变异的一致性,于进一步分析前,对谱峰强度进行对数转换。杜克大学医学中心(癌症病人36位,健康对照47位)以及葛洛宁恩大学医院(癌症病人20位,健康对照30位)的早期类上皮卵巢癌病人与健康对照的谱峰强度资料,使用单一化最大分离性分析(unified maximumseparability analysis,UMSA)算法进行分析。UMSA首先用于微阵列资料分析,接着用于蛋白质表现资料分析(ProPeak,3Z Informatics)。(LiJ,et al.,Clin Chem2002;48:1296-304;Rai AJ,et al.,Zhang Z,et al.Arch Pathol Lab Med 2002;126:1518-26;Zhang Z,et al.,应用分类分离性分析于微阵列数据(Applyingclassification separability analysis to microarray data).In:Lin SM,Johnson KF,eds.微阵列资料分析的方法(Methods of Microarray data analysis):papers fromCAMDA’00.Boston:Kluwer Academic Publishers,2001:125-136;Zhang Z,etal.,Fishing Expedition-a Supervised Approach to Extract Patterns from a Compediumof Expression Profiles.In:Lin SM,Johnson KF,eds.微阵列数据分析II(MicroarrayData Analysis II):papers from CAMDA‘01.Boston:Kluwer Academic Publishers,2002)。
为了降低将资料中偏移(biases)或人为因素的结果选作谱峰的可能性,自二处获得的资料是独立进行分析。使用拔鞋带法(bootstrap)重新抽样程序选择有显著贡献,以及对早期卵巢癌与健康对照的分离有一致性的谱峰。于每一拔鞋带法过程,随机选择固定百分比的癌症及对照组样本进行取代分析。各个谱峰依照它们于UMSA分类器线性解释中的贡献度排序。每一谱峰顺序的平均数及标准差是以多次(20至40次)过程结果来估算。选择具高平均数顺序及小标准差的谱峰,以形成短的候选谱峰名单。自二处获得的结果然后进行交叉比对,以决定最终一组具一致性表现型样的谱峰,作为潜在生物标记的名单。
多变量预测模型:为了建立多变量预测模型,将二处获得的结果进行组合,然后将其随机分成训练组及试验组.首先用试验组对潜在生物标记名单的效果,及建立的预测模型进行评估,最后用二处其余未参与生物标记发现及模型建立过程的独立数据进行评估.评估的统计方法包括灵敏度及专一性估计,以及接受者操作特征曲线(ROC)分析.
实施例3:生物标记纯化
对所有标记,血清首先以用于图谱化蛋白质表现的阴离子交换操作步骤进行区分。对每一纯化步骤,以NP20或IMAC-铜蛋白质
阵列监测区分物。
28kD标记纯化:将1ml阴离子交换分离的pH4区分物加至500ul的RPCPolyBio 10-15(BioSepra公司制)中,并于4℃培养1小时。收集含有乙腈(acetonitrile,CAN)量增加及0.1%三氟乙酸(trifluoroacetic acid,TFA)的区分物。75%乙腈/0.1%三氟乙酸的区分物以真空离心干燥机(speed-vac)干燥,然后于100ul不含二硫苏糖醇(1,4-dithiothreitol,DTT)的SDS-三(羟甲基)甲基甘胺酸(SDS-tricine)上样缓冲液中复水。将40ul样本加至16%三(羟甲基)甲基甘胺酸凝胶上,并以100mV电压跑4小时电泳。最后以胶体蓝试剂盒(Pierce公司制)将凝胶去色,并将该28kD标记刮取下来。
12.8kD标记纯化:将10ml阴离子交换分离的pH4区分物以1M pH11 2-胺基-2-(羟基甲基)-1,3-丙二醇-氯化氢(2-amino-2-(hydroxymethyl)-1,3-propanediolhydrochloride,Tris-HCl)溶液调整pH至7.5,然后加至10ml 4-巯基-乙基吡啶(4-mercapto-ethylpyridine,MEP)微珠(BioSepra公司制)上,而MEP微珠使用前先以20ml pH7.2磷酸盐缓冲液(PBS)清洗三次。于4℃摇晃30分钟后得到含有谱峰的冲提区分物。因为该区分物含有大量白蛋白,因此进行白蛋白免疫消耗(immunodepletion)。蛋白质-A微珠先以含有0.1%triton-100接口活性剂的1.5ml PBS洗涤三次,接着以1.5ml PBS洗涤三次。然后将4ml抗人类血清白蛋白(anti-humanserum albumin,anti-HAS)抗体(ICN公司制)加至1.5ml蛋白质-A微珠中,并耦合过夜。耦合的微珠以1ml含有0.1%triton-100的PBS洗涤三次,然后以1ml PBS洗涤三次。接着将经过MEP管柱的冲提流出物加至微珠中,并于4℃培养1小时。以3000rcf转速旋转1分钟后得到该冲提流出物。将经过蛋白质-A-抗HAS抗体管柱的冲提区分物加至含有1.5ml RPC PolyBio10-15树脂(BioSepra公司制)的旋转柱中,其中RPC PolyBio10-15树脂是已先以1.5ml 0.1%TFA洗涤四次。于4℃温和摇晃培养40分钟后,以3000rcf转速旋转移除该冲提区分物,并以0.8ml0.1%TFA洗涤该微珠。收集含有乙腈量增加及0.1%三氟乙酸的区分物。75%乙腈/0.1%三氟乙酸的区分物以真空离心干燥机干燥,然后于100ul不含DTT的SDS-tricine上样缓冲液中复水。将40ul样本加至16%tricine凝胶上,并以100mV电压跑4小时电泳。最后以胶体蓝试剂盒(Pierce公司制)将凝胶去色,并将该12.8kD标记刮取下来。
3272D生物标记纯化:将1ml阴离子交换分离的冲提区分物加至125ul(250ul50%泥状物)与硫酸铜耦合的IMAC纤维素(Biosepra公司制)中,并于4℃培养1小时。微珠然后以逐步增加咪唑(imidazole)梯度(每250ul含有500mM NaCl的100mMpH7 Na2HPO4+NH2PO4溶液中,溶有20mM、50mM、100mM、150mM及200mM咪唑)方式洗涤。将200ul含有生物标记(50至150mM咪唑)的区分物加载至C18管柱上(ANSYS技术公司制,Metachem polaris C18-A5U),并以1ml/min流速的0.1%TFA洗涤5分钟,接着以1ml/min流速的0%至9%乙腈(ACN)梯度0.1%TFA溶液洗涤10分钟。然后以1ml/min流速的9%ACN至45%ACN线性梯度0.1%TFA溶液冲提30分钟。收集每一1ml液体区分物,标记则位于第38个冲提区分物中(该区分物的ACN浓度为34.2%)。
实施例4:生物标记确认
已纯化的蛋白质以胰蛋白酶消化,然后胰蛋白酶解片段以蛋白质
读取机分析。每一光谱系至少250个激光瞄射点平均,并以已知肽混合物做外校正,或使用胰蛋白酶自体消化及基质谱峰做内校正。谱峰质量是符合ProFound检索的肽拼图位置(http://129.85.19.192/profound_bin/WebProFound.exe)。蛋白质序列是使用美国国立生物技术信息中心(The National Center for Biotechnology Information,NCBI)数据库进行修补。该些数据库比对确认,是使用配备蛋白质
阵列接口(赛弗吉公司制)的PE Sciex QStar(加拿大Concord)进行的。对MS/MS实验,光谱系从配备赛弗吉PCI 1000蛋白质
阵列接口的Sciex QStar(加拿大安大略Concord)串联四极杆-飞行时间质谱仪获得。离子是使用脉冲氮激光(LaserScience VSL 337NDS,美国麻萨诸塞Franklin),以每秒30个脉冲(传递平均130uJ/mm
2脉冲通量)产生的。10mtorr压力氮气用于已形成离子的碰撞冷却,以及所有低能碰撞引发解离(collision-induced dissociation,CID)实验。通常遵循50eV/kD规则来使用碰撞能。对MS及MS/MS模式,系统使用已知肽混合物进行外校正。蛋白质确认是使用加州大学旧金山分校(University of California,SanFrancisco,UCSF)ProteinProspector MS-Tag程序(http://prospector.ucsf.edu)来执行。以MS-Tag搜索数据库,是使用下列的数值执行的:智人(Homo sapiens)、胰蛋白酶消化(允许二个切割遗漏)、以胺甲醯胺基甲基化(carbamidomethylation)修饰半胱胺酸、母峰及片段离子质量容许量50ppm以及NCBI或Swiss-Prot数据库。
该些身份的确认通过EIA,或使用以免疫分析法为基础的蛋白质
阵列进行的。
虽然该些蛋白质通常已经作为急性期反应物的特征,但以免疫分析法做初步研究时,应该注意,脂蛋白元A1的量于乳癌或大肠癌病人中未发现改变,且前白蛋白的量于乳癌或大肠癌病人中亦未有改变。
甲状腺素运送蛋白是负面急性期蛋白质,它的量先前已报导,于类上皮卵巢癌病人中有减少(Mahlck CG,et al.,Gynecol Obstet Invest,1994;37:135-40)。甲状腺素运送蛋白是血清甲状腺素及三碘甲状腺素主要运送者,并通过由它与视网醇结合蛋白质的相互作用,帮助运送视网醇。缺乏甲状腺素运送蛋白的基因转殖鼠,其视网醇及视网醇结合蛋白质的量非常的低(van Bennekum AM,et al.,J.BiolChem 2001;276:1107-13),且视网醇结合蛋白质以及细胞视网醇结合蛋白质的量降低,已显示与卵巢上皮细胞恶性转形的速率增加相关(van Bennekum AM,et al.,J.Biol Chem 2001;276:1107-13;Roberts D,et al.,DNA Cell Biol 2002;21:11-9)。此外,已报导以寡核苷酸阵列分析的卵巢癌中,细胞视网醇结合蛋白质的量有改变(Giordano TJ,et al.,Am J Pathol 2001;159:1231-8)。
ITIH4的羧基质子(m/z 3272生物标记源自此)已显示是血浆舒血管素的受质(Pu XP,et al.,Biochim Biophys Acta 1994;1208:338-43;Nishimura H,et al.,FEBSLett 1995;357:207-11)。舒血管素蛋白酶包含血浆舒血管素及组织舒血管素,具重叠的受质专一性(Diamandis EP,et al.,Clin Chem 2002;48:1198-205)。组织舒血管素是大的复基因族(multigene family),包括前列腺专一性抗体(PSA;hk3),是为前列腺癌的肿瘤标记。于卵巢癌中已发现数种组织舒血管素有不正常调节,包括hK4、hK5、hK7、hK8及hK9(Yousef GM,et al.,Minerva Endocrinol 2002;27:157-66)。
甲状腺素运送蛋白ΔN10及IAIH4片段是成熟蛋白质截短型产物。该些标记得为由一或多个蛋白酶切割的产物,包括血浆舒血管素、组织舒血管素、金属蛋白酶基质或prostatin,最近报导于卵巢癌病例中,似胰蛋白酶的丝胺酸(serine)蛋白酶会增加(Mok SC,et al.,J Natl Cancer Inst 2001;93:1458-64)。产生该些标记的蛋白酶亦能作为标记使用,该些蛋白酶能与标记1至4组合,以俾于对预测模型赋予更高灵敏度及专一性。
实施例5:各生物标记识别能力
于发现组中,早期卵巢癌病人与健康对照间,三种生物标记表现量差异,是统计上显著(对m/z 12828及m/z 28043标记,P<0.000001;对m/z 3272标记,P<0.003)(表1)。
第2图(窗格图A至D)是对早期卵巢癌病人与健康对照数据,使用接受者操作特性曲线分析的三种各生物标记与CA125的识别能力比较。对窗格图A至D下列代表,1:CA125,2:m/z 12.8kD,3:m/z 28kD,4:m/z 3272D。CA125及m/z 12828于发现组及验证组二者中表现相当,而其余二种标记于一或二数据组中,比CA125有较小曲线下面积(area-under-curve,AUC)。然而,三种生物标记与CA !25间,估算的相关性是低的(未显示数据),显示他们彼此互补的可能性,以及多变量逼近或许超出CA125的单一分析表现。
因为健康对照的样本27%是来自年龄50岁或更高龄者,与早期卵巢癌组群的样本61%是来自年龄50岁或更高龄者比较(P<0.000001),我们考虑该些标记或许反映与年龄相关的变化。然而,确认的生物标记于年龄组群间既无显著性差异,与CA125的量比较,该些生物标记的量亦无差异(表1)。先前以人口为依据的研究已显示,脂蛋白元A1的量,实际上依年龄增长稍微增加(Jungner I,et al.,Clin Chem 1998;44:1641-9;Bachorik PS,et al.,Clin Chem 1997;43:2364-78)。
实施例6:多变量预测模型
二个多变量预测模型是以非线性UMSA分类器建立。首先只用三种生物标记当作输入,接着用三种生物标记与CA125的量。第2图中窗格图E至H是以ROC分析,对该二个模型的所有诊断结果与CA125的结果进行比较。对窗格图A至D下列代表,O:CA125,口:使用三种生物标记的多变量模型,Δ:使用三种生物标记与CA125的多变量模型。于训练数据中,0.5的临界值大约使灵敏度及专一性的总和最大化。以该临界值,将模型应用至试验组数据及独立验证组数据(表2)。对独立验证组中,健康对照与I/II期侵袭性卵巢癌质间的识别能力而言,使用三种生物标记及CA125的多变量模型,于82.6%灵敏度(95%置信区间(CI)61.2至95.1%),有93.7%(84.5至98.2%)专一性。相较下,CA125于11U/ml的临界值有相同灵敏度(82.6%),而其专一性却只有52.4%(39.4至65.1%)。表2亦包括独立验证组中,良性状态、末期侵袭性癌或边缘肿瘤的病人结果。
图3是绘制CA125及三种标记的分布型样,以及二种模型对所有诊断组群中样本的输出结果。Y轴是对所有三种生物标记以线性刻度表示的相对强度,对CA125言,血清量以对数刻度表示,对二种模型言,是0(最低罹癌风险)与1(最高罹癌风险)间的连续数值。样本组群包括:A)健康对照、B)良性、C)I/II期侵袭性癌、D)III/IV期侵袭性癌、E)复发者、F)I/II期边缘肿瘤。生物标记发现组中二个IIIc侵袭性病例,以及独立验证组中三个III/IV期边缘肿瘤并未绘制出来。
应注意,除m/z 3272外,其它二种生物标记以及二种预测模型,具有自良性病例中检测I/II期侵袭性癌的适度能力(对m/z 12828及28043,P各分别为0.004及0.001;对无CA125及有CA125的模型,P各分别为0.003及0.0001)。
实施例7:以免疫分析法独立验证
142个档案样品使用浊度免疫分析法(turbidimetric immunoassay),以微滴定盘型式进行脂蛋白元A1分析(美国Wako Chemical公司),以及使用颗粒增强浊度免疫分析法,于Dimension RxL仪器上(Dade-Behring公司制)(表3)。
与41位健康对照比较,于41位末期卵巢癌病人中,CA125血清的量是向上调节,而脂蛋白元A1及甲状腺素运送蛋白ΔN10的量是向下调节(P各分别为0.001895、0.000151、0.000006)。健康对照中,平均血清脂蛋白元A1的量,与乳癌或大肠直肠癌病人的平均血清脂蛋白元A1的量,无显著性差异(P各分别为0.844163、0.330148);与前列腺癌病人只有些微差异(P=0.043676)。大肠直肠癌病人中,平均血清甲状腺素运送蛋白的量(P=0.006889),比卵巢癌病人中,平均血清甲状腺素运送蛋白的量,向下调节的程度较小。健康对照与乳癌或前列腺癌病人间,平均血清甲状腺素运送蛋白ΔN10的量无显著性差异(P各分别为0.928519、0.546918)。
实施例8:分类演算
关于分类演算以图式叙述于第4图中,模块1至3是以UMSA学习算法训练。而最后的分类器模块,具有如一般支持向量机(support vector machine,SVM)分类器一样的数学形式。
UMSA分类器模块1:
CA125nm=log(CA125+0.01)
m/z 12.9Knm=(m/z 12828-61.103)/239.031
m/z 28Knm=(m/z 28043-61.3043)/238.9799
m/z 3272nm=log(m/z 3272+0.01)
Log0:自然对数
核心函数:多项式<X(:,i),X(:,j)>)^3.0
支持向量及系数:
CA125nm |
m/z 12.9Knm |
m/z 28Knm |
m/z 3272nm |
y |
alpha |
2.83966 |
-0.25465 |
-0.25597 |
-1.34323 |
1 |
0.00409 |
3.05918 |
-0.25416 |
-0.25435 |
-1.68740 |
-1 |
0.03389 |
2.39880 |
-0.25428 |
-0.25529 |
0.42657 |
1 |
0.05926 |
3.61658 |
-0.25450 |
-0.25578 |
-1.51413 |
1 |
0.22118 |
3.23120 |
-0.25417 |
-0.25493 |
-1.20065 |
-1 |
0.29988 |
UMSA分类器模块2:
CA125nm=log(CA125+0.01)
m/z 12.9Knm=(m/z 12828-0.345)/0.1114
m/z 28Knm=(m/z 28043-0.4834)/0.2792
m/z 3272nm=log(m/z 3272+0.01)
Log0:自然对数
核心函数:exp(-|X(:,i)-X(:,j)|^2/(2*(1.0)^2))
支持向量及系数:
UMSA分类器模块3::
核心函数:多项式<X(:,i),X(:,j)>)^2.0
X1=exp(模块1输出)/(1+exp(模块1输出))
X2=模块2输出
支持向量及系数:
X1 |
X2 |
y |
alpha |
0.72862 |
0.41333 |
1 |
0.830900 |
0.99835 |
0.25941 |
1 |
1.641283 |
0.39802 |
0.57799 |
1 |
1.839397 |
0.96185 |
0.23167 |
1 |
1.839397 |
0.58865 |
0.18582 |
-1 |
1.839397 |
0.96194 |
0.21066 |
1 |
1.839397 |
0.55377 |
0.10709 |
-1 |
1.839397 |
0.78444 |
0.05422 |
-1 |
1.839397 |
0.95604 |
-0.01117 |
-1 |
1.839397 |
0.48706 |
0.28531 |
-1 |
2.343210 |
后处理:
模块输出=exp(Y/2)/(1+exp(Y/2))
本发明已作详细说明,包括优选实施例。然而,运用本发明揭示,熟悉本技术技能者对本发明进行修饰及/或改进,其仍涵盖于如下列所提申请范围的本发明范畴及精神内。
本申请中引用的所有发表及专利文件,对所有目的皆相同,是以完整参考资料方式引用,如同独自地代表每一个独自的发表或专利文件一样。引用本文件中各种参考资料时,申请人不承认对该些发明是”现有技术”的任何特别参考资料。