本发明主张2004年12月1日申请的美国临时申请案第60/632,474号和2004年3月31日申请的美国临时申请案第60/558,422号的专利权利,该两案所揭示的内容以引用方式并入本文中。
【具体实施方式】
本发明提供的生物标记是通过对比来自诊断有卵巢癌病人的蛋白质指纹谱图和来自不患有已知肿瘤疾病病人的蛋白质指纹谱图、采用ProteinChipBiomarker System(由Ciphergen Biosystems,Inc.,Fremont,CA提供)而得到。并对这些生物标记以及其它已知卵巢癌标记一起单独或多元可预测性模式进行评价。尤其,实验表明这些生物标记(单独使用或最好结合这些生物标记中其它生物标记使用或结合其它诊断试验方法)提供一种判断受体中卵巢癌状态的新颖方法。
将生物信息工具有效运用到高产量蛋白质构型判定上提供了一种筛选癌症标记的有用方法。简言之,本发明使用的系统运用SELDI(表面强化激光解吸/电离,SurfaceEnhanced Laser Desorption/Ionization)技术并利用ProteinChipArray色谱仪对样本进行测试。结合到该列阵的蛋白质在ProteinChipReader(一种飞行时间质谱仪)中读取。
生物标记(或称为“标记”)是一种有机生物分子,该生物分子区别呈现在取自一种显型状态(如患有疾病)受体的样本中和取自另一种显型状态(如不患有疾病)受体的样本中。如果经统计计算显示不同群组中的生物标记的平均表达水平有明显差别,则表示生物标记在不同显型状态之间是区别呈现的。用于统计学意义的普通测试方法包括t-试验、ANOVA、Kruskal-Wallis、Wilcoxon、Mann-Whitney和优势率。单独使用或结合使用生物标记提供测量受体是属于一种显型状态还是其它一种显型状态这种具有相对风险的方法。因此,它们作为标记对于药物(治疗诊断学上)和药物毒性在疾病(诊断)、治疗有效性的判断上是很有用的。
本发明基于蛋白质标记在患有卵巢癌病人的样本中与在参照受体的样本中是区别呈现发现,并将该发现运用在用于判断卵巢癌状态的方法和仪器中。这些蛋白质标记在取自卵巢癌病人的样本中被发现的水平不用于取自人体癌症不可发现到的妇女体内的样本中。如此一来,与参照物对照,在测试样本中发现到的至少一种标记的数量,或者在测试样本中是否存在至少一种标记,对判断病人卵巢癌状态提供非常有用的信息。
I.生物标记的描述
A.载脂蛋白APOLIPOPROTEIN A1
用于本发明所述方法的标记的其中一种实施例是载脂蛋白A1,这里用“ApoA1”指代。ApoA1可通过质谱分析法在m/z为28043峰位置处(标记XXIV)识别出来。所述的标记的质量在按照SELDI质谱技术所测定的规定数值得0.15%范围内都被认为是准确的。相应地,还可在28055m/z峰位置处识别出ApoA1。
ApoA1按照所述方法的程序通过分馏血液来发现,然后施以IMAC芯片、由SELDI方法测定。经纯化的蛋白质经胰蛋白酶消化后视作载脂蛋白A1。在下面的实施例中将界定分离和确定ApoA1的操作程序。在患有某一阶段的卵巢癌病人体内ApoA1的数量会下降。因此,与正常状态的参照物相比,缺乏ApoA1或ApoA1的数量在统计学意义上下降都是与卵巢癌状态有关。统计学意义上下降是在本领域内都已知的概念,例如p值低于0.05。
本发明的优选方法包括使用ApoA1的经修饰后的形式。经修饰的ApoA1可能包括转译后加成各种不同的化学基团,例如糖基化、脂化、半胱氨酰化以及谷胱甘肽化的基团。
经修饰的ApoA1尤为优选实施例是峰位置处于29977.4处(标记XXV)的ApoA1。经修饰的ApoA1峰是上述ApoA1质谱峰上的肩峰。其它优选的经修饰的ApoA1形式是峰位置处于m/z为28262、28472、28692、28844以及29031处。第15图和第16图是表示经修饰的ApoA1生物标记的封位置的质谱图。
B.甲状腺素运输蛋白(transthyretin)
可用于本发明方法的标记的另一实施例包括前白蛋白形式,这里以”甲状腺素运输蛋白△N10”指代。甲状腺素运输蛋白△N10可通过质谱分析法在m/z为12870.9峰位置处识别出来。甲状腺素运输蛋白△N10按照所述方法的程序通过分馏血液来发现,然后施以IMAC芯片、由SELDI方法测定。通过免疫沉淀法和串联质谱分析法分析后,发现提纯的蛋白质截去以N为端点的十个氨基酸之前白蛋白截断形式(这里以”甲状腺素运输蛋白△N10”指代)。在下面的实施例中将界定分离和确定甲状腺素运输蛋白△N10的操作程序。在患有某一阶段的卵巢癌病人体内甲状腺素运输蛋白△N10的数量会下调。因此,与正常状态的参照物相比,缺乏甲状腺素运输蛋白△N10或甲状腺素运输蛋白△N10的数量在统计学意义上下降都是与卵巢癌状态有关。
所述的本发明中采用甲状腺素运输蛋白△N10。然而,天然甲状腺素运输蛋白(理论质量为13761或13767道尔顿)也同样适用于本发明中。除此之外,本发明的优选方法包括使用甲状腺素运输蛋白的经修饰的形式。其中包括转译后加成各种不同的化学基团,例如糖基化、脂化、半胱氨酰化、磺化、CysGly经修饰的以及谷胱甘肽化的基团。
经修饰的甲状腺素运输蛋白尤为优选实施例是半胱氨酰化甲状腺素运输蛋白(峰位置处于m/z为13890.8或13888道尔顿)。第8图是表示甲状腺素运输蛋白经还原反应和烷基化反应之后质谱图中峰的变化,表明甲状腺素运输蛋白达成半胱氨酰化。经修饰的甲状腺素运输蛋白的另一尤为优选实施例是谷胱甘肽化甲状腺素运输蛋白(峰位置处于m/z为14086.9或14093道尔顿)。经修饰的甲状腺素运输蛋白的另一优选实施例是磺化甲状腺素运输蛋白(峰位置处于m/z为13850道尔顿)。经修饰的甲状腺素运输蛋白的还一优选实施例是CysGly修饰的甲状腺素运输蛋白(峰位置处于m/z为13944道尔顿)。
第6图是表示截断形式(甲状腺素运输蛋白△N10)、未经修饰的、半胱氨酰化以及谷胱甘肽化的甲状腺素运输蛋白的相对峰的大小。如第7图所示,与其它癌症及不患癌症的参照物相比,患有卵巢癌病人体内截断形式(甲状腺素运输蛋白△N10)、未经修饰的、半胱氨酰化以及谷胱甘肽化的甲状腺素运输蛋白均降低(p<0.001)。
C.IAIH4片段
可用于本发明方法的标记的另一实施例世间-α-胰蛋白酶抑制因子重链H4的裂解片段,这里用”IAIH4片段”、“ITIH4片段”及/或PK120片段指代。在一优选实施例中,IAIH4片段是选自IAIH4片段No.1、IAIH4片段No.2以及IAIH4片段No.3。在一更佳实施例中,“IAIH4片段”这一类术语包括IAIH4片段No.1、IAIH4片段No.2以及IAIH4片段No.3的任意一者。
IAIH4片段No.1可通过质谱分析法在m/z为12870.9峰位置处识别出来。IAIH4片段No.1按照所述方法的程序通过分馏血液来发现,然后施以IMAC芯片、由SELDI方法测定。该谱峰是自卵巢癌病人血清、经一系列色层分析分离技术纯化得到的。其序列确定为MNFRPGVLSSRQLGLPGPPDVPDHAAYHPF(SEQ IDNO:1),是人类间-α-胰蛋白酶抑制因子片段具660-689个氨基酸长度,即重链H4(用IAIH4、ITIH4或PK120指代)。该结果是以胃蛋白酶消化该标记后分析其产物而确定的。在患有某一阶段的卵巢癌病人体内,IAIH4片段No.1数量会上调。因此,与正常参照物对比,IAIH4片段No.1的出现或IAIH4片段No.1数量上升都将与卵巢癌状态进行关联。
用抗体对IAIH4进行SELDI免疫试验,其结果可用于确定某一阶段卵巢癌中数量上升的IAIH4片段。已通过此方法确定了几个这样的片段,其中两个通过统计方法显示卵巢癌与非卵巢癌之间存在明显差异(请参阅第5图)。IAIH4片段No.2的序列确定为FRPGVLSSRQLGLPGPPDVPDHAAYHPF(SEQ ID NO:2),其包括了IAIH4片段No.1中除前面两个氨基酸残基的所有氨基酸残基。IAIH4片段No.2是通过质谱分析法在m/z为3031峰位置处识别出来的。IAIH4片段No.3的序列确定为RPGVLSSRQLGLPGPPDVPDHAAYHPF(SEQ IDNO:3),其包括了IAIH4片段No.1中除前面三个氨基酸残基的所有氨基酸残基。IAIH4片段No.3是通过质谱分析法在m/z为2884峰位置处识别出来的。正如IAIH4片段No.1那样,患有某一阶段卵巢癌病人体内IAIH4片段No.1及No.2数量会上调。因此,与正常参照物对比,IAIH4 No.1或No.2片段的出现或IAIH4 No.1或No.2片段数量上升都将与卵巢癌状态进行关联。
除此之外,本发明的优选方法还包括使用IAIH4片段的经修饰的形式。其包括转译后加成各种不同的化学基团,例如糖基化、脂化、半胱氨酰化以及谷胱甘肽化的基团。
D.其它被发现的卵巢癌标记
于pH4与pH9冲提出的区分物种,亦确认出其它与卵巢癌疾病状态有关的生物标记。于pH4区分物中,与该些生物标记相对应的蛋白质或蛋白质片段,是以于SELDI蛋白质芯片/质谱中的谱峰强度代表,该些生物标记中心分子量如下数值:
数据组1
标记号码 |
质量(道尔顿) |
I |
M4484.92 |
II |
M10065.9 |
III |
M9311.27 |
IV |
M27773.4 |
V |
M10668.3 |
VI |
M6953.19 |
VII |
M12870.9 |
VIII |
M13891.9 |
IX |
M7566.22 |
X |
M3339.22 |
XI |
M13596.8 |
XII |
M7769.93 |
XIII |
M14069.7 |
XIV |
M14338.7 |
XV |
M4499.12 |
XVI |
M6678.07 |
XVII |
M8144.60 |
数据组2
标记号码 |
质量(道尔顿) |
XV III |
M11699.9 |
XI X |
M2729.15 |
X X |
M8949.37 |
X XI |
M30113.3 |
X XII |
M10668.3 |
X X III |
M3379.43 |
X X IV |
M27288.8 |
X X V |
M29977.4 |
X X VI |
M1048.88 |
X X VII |
M39847.3 |
X X XIII |
M5607.28 |
X XI X |
M3822.84 |
X X X |
M29822.5 |
X X XI |
M41561.8 |
X X XII |
M4128.4 |
X X X III |
M2340.70 |
于pH9区分物中,与该些生物标记相对应的蛋白质或蛋白质片段,是以于SELDI蛋白质芯片/质谱中的谱峰强度代表,该些生物标记中心分子量如下数值:
数据组3
标记号码 |
质量(道尔顿) |
X X X IV |
M2748.46 |
X X X V |
M2866.33 |
X X X VI |
M2916.45 |
X X X VII |
M3033.86 |
X X X VIII |
M3193.54 |
X X XI X |
M3277.75 |
X L |
M3291.72 |
X LI |
M3307.35 |
X LII |
M4071.20 |
X LIII |
M4342.23 |
X LIV |
M5986.74 |
X LV |
M6023.61 |
X LVI |
M6308.55 |
X LVII |
M8132.55 |
X LVIII |
M8527.75 |
标记I至XLVIII生物标记的质量在由SELDI质谱仪测得的规定数值的0.15%范围内都被认为是精确的。
如上所述,标记I至XLVIII还可用与吸收剂的亲和力为表征,尤其是在下面会讲述到的“蛋白质芯片分析方法的实施例的一般性评价”指定的条件下与固定化鳌合物(IMAC)-Cu基材表面结合能力。
E.已知卵巢癌标记
本发明的某些实施例也采用已知卵巢癌生物标记结合使用至少一种选自由ApoA1、甲状腺素运输蛋白、IAIH4片段No.1、IAIH4片段No.2以及IAIH4片段No.3的标记的方式。这里“标记4”是用以指代已知卵巢癌标记。用作“标记4”的标记包括(但不仅限于)CA125、CA125II、CA15-3、CA19-9、CA72-4、CA195、TATI、CEA、PLAP、抗原Sialyl TN、半乳糖转移酶、M-CSF、CSF-1、LPA、p110EGFR、组织激肽释放酶、prostasin、HE4、CKB、LASA、HER-2/neu、尿促性腺激素肽、Dianon NB 70/K、TPA、骨桥蛋白和触珠蛋白以及这些标记的蛋白质变异体(如裂解形式、异构形式)。
与正常受验者对比,血液中这些标记的数值水平存在差别,基于这一事实,这些标记对于诊断卵巢癌是很有用的。例如,已知CA125在卵巢癌妇女血液中会提高。类似地,已知CA19-9、CA72-4、CA195、TATI、抑制素(inhibin)、PLAP及其它在卵巢癌妇女血液中亦会提高。在本发明的某些优选实施例所采用的方法中,至少一种已知标记(标记4)与至少一种选自ApoA1、甲状腺素运输蛋白、IAIH4片段No.1、IAIH4片段No.2以及IAIH4片段No.3的标记结合使用。
F.生物标记的经修饰的形式的使用
试验发现,蛋白质经常以各和不同的形式存在于样本中,而它们的质量均不同。这些形式经转译前后的经修饰的而得。转译前经修饰的形式包括等位变体、切片变体以及RNA编辑形式。转译后经修饰的形式包括经截断、蛋白水解裂片(如母蛋白质的片段)、糖基化、脂化、半胱氨酰化以及谷胱甘肽化、磷酸化、异戊二烯基化、酰胺化、乙酰化、甲基化、硫酸化、磺化、羟基化、十四烷酰化、法尼基化(farnesylation)、氧化、泛素华化(ubiqutination)的形式。包括指定蛋白质及其所有经修饰的形式在内的蛋白质集合本文用“蛋白质群”来指代。特异性蛋白质的所有经修饰的形式的集合(不包括指定蛋白质本身)本文用“经修饰的蛋白质群”来指代。本发明的任何生物标记的经修饰的形式也都可以用作生物标记。在某些情况下,经修饰的形式比本文提出的指定形式显示出更强的诊断能力。
经修饰的生物标记最初可经任何能够从生物标记中发现并识别经修饰的生物标记的方法发现。初步发现的优选方法包括起初采用诸如生物特异性捕获试剂来捕获生物标记及经修饰的生物标记,然后通过质谱仪检测被捕获到的蛋白质分子。详而言之,捕获蛋白质所使用到的生物特异性捕获试剂包括可识别生物标记及经修饰的生物标记的抗体、寡核甘酸配基或亲和体。而且这种方法还捕获了蛋白质相互作用物,该蛋白质相互作用物结合了蛋白质或可经抗体识别出来,而且本身可以是生物标记。优选地,生物特异性捕获试剂与固态物质结合。然后,采用SELDI质谱技术检测被捕获到的蛋白质,或从捕获试剂洗提蛋白质后,采用传统的MALDI或SELDI技术检测被洗提的蛋白质。由于质谱分析法可以区别并量化基于质量差异的经修饰的蛋白质,而无须作标签,这样使用质谱分析法就尤其吸引人。
优选地,生物特异性捕获试剂被结合到诸如珠粒、平皿、薄膜、或芯片这类固态物质上。本技术领域内之人士已熟知如何将诸如抗体这类生物标记结合到固态物质上的方法。例如,可采用具有双官能团的结合试剂,或者该固态物质可经诸如环氧化物或碳化二亚胺这类活性基团衍生而得,当这种固态物质与分子接触时即可发生结合。生物特异性捕获试剂可在同一位置与各种不同的靶向蛋白质混合,或者也可以在不同身体或可寻址的位置结合到固态物质上去。例如,可用经衍生的珠粒填充复数个色谱柱中,每个色谱柱只能捕获单种蛋白质群。或者,可用各种不同的经捕获试剂衍生而来的珠粒填充单个色谱柱,这样在单个位置处就捕获了所有分析物。相应地,诸如采用Luminex仪器(由Austin,TX提供)的xMAP技术这类经抗体衍生而来的以珠粒为载体的技术可用于检测蛋白质群。然而,生物特异性捕获试剂必须是特异性地针对蛋白质群中各个成员,以区分它们。
在另一实施例中,生物芯片表面既可在同一位置处、也可在不同身体可寻址的位置处经捕获试剂捕获蛋白质群衍生而得。在不同的可寻址的位置处捕获不同蛋白质群的一个优点是使分析过程变得简化。
识别经修饰的蛋白质并与有相关联的临床参数相关联的后,该经修饰的蛋白质可在本发明所述的任一方法中用作生物标记。从这一点讲,通过包括亲和捕获后采用质谱分析法、或特异性针对经修饰的蛋白质的传统免疫试验法在内的任意指定检测方法即可完成对经修饰的蛋白质的检测。免疫试验法要求诸如抗体的生物特异性捕获试剂去捕获分析物。而且,该试验方法必须要被设计为特异性区分蛋白质和经修饰的蛋白质。例如,可通过三明治试验法来达成这一目的,在该方法中,一种抗体捕获多于一种形式的蛋白质,而且清楚地区分抗体、特异性地结合以及提供各种形式蛋白质的检测。还可通过对动物用生物分子免疫来制得抗体。本发明采用的传统免疫试验法包括诸如ELISA或基于荧光的免疫试验法以及其它酶免疫试验法在内的三明治免疫试验法。
II.测试样本
A.受验者类型
样本从想要确定卵巢癌状态的妇女受验者体内采集而得。这些受验者可能是根据她们的家族史已经确诊为患有高危卵巢癌的妇女。而其它患有卵巢癌的妇女测试将用于判断治疗效果。而且,还包括接受作为例行检查一部分的测试的健康妇女,或是建立生物标记的基线数据库。样本可能是从已经确诊为患有卵巢癌且接受了消除或缓解癌症的妇女体内采集而得。
B.样本类型及样本制备
可以用各种不同的生物样本类型来测试标记。样本优选地是生物液体样本。例如,可用于本发明的生物液体样本包括血液、血清、血浆、阴道分泌物、尿液、泪液、唾液等等。由于所有标记都是在血清中发现的,所以血清是本发明实施例中优选样本来源。
若需要,对样本进行制备以增加标记可检出率。例如,为了增加标记可检出率,取自受验者体内的血清样本最好通过如汽巴克隆(Cibacron)蓝色琼脂糖色层分析与单股DNA亲和性色层分析、阴离子交换树脂、亲和性色层分析(如与抗体)以及类似者的方法进行区分。区分方法视所用检测方法而定。任何能增加感兴趣蛋白质的方法都可以被采用。是否进行样本制备,如前区分,是可加以选择的,根据所使用的检测方法的不同,样本可能不需要制备成有利于增加标记的可检出率。例如,如果使用专门结合标记的抗体来检测样本中的标记,那么就无需制备样本了。
典型地,样本制备过程包括样本区分以及收集用于探测是否含有生物标记的区分物。前区分方法包括例如,尺寸排斥色层分析法、离子交换色层分析法、甘肃色层分析法、亲和性色层分析法、连续萃取法、凝胶电泳法与液相色层分析法。检测前分析物亦可能会经过经修饰的。例如,分析前自血液中除去如白蛋白这类高数量蛋白质是有用的。区分方法举例于PCT/US03/00531(已引入此全文以供参考)中有说明。
优选地,样本是以阴离子交换树脂进行前区分。阴离子交换色层分析法允许粗略地依照它们电荷特性进行样本中蛋白质前区分。例如,采用Q阴离子交换树脂(如Biosepra公司的QHyperDF),而且样本能用具不同pH值得洗提液连续冲提。阴离子交换色层分析法允许样本中具更多负电荷的生物分子从其它类型生物分子分离出来。以高pH洗提液冲提的蛋白质可能是弱负电荷,而以低pH洗提液冲提的区分物中蛋白质可能是强负电荷。因此,除降低样本多样性外,阴离子交换色层分析法是依照它们结合的特性将蛋白质分离的。
在优选实施例中,血清样本是以阴离子色层分析法做区分。高数量蛋白质对较低数量蛋白质讯号的抑制是对SELDI质谱法重要的挑战。样本区分降低了每一区分物组成的多样性。这种方法也可用于试图将高数量蛋白质分离至一区分物中,从而降低对较低数量蛋白质的讯号抑制。阴离子交换区分通过等电点(pl)分离蛋白质。蛋白质是由具两性电荷氨基酸组成,蛋白质电荷受其曝露环境的pH而改变。蛋白质等电点是指蛋白质无净电荷处的pH值。当环境的pH等于蛋白质等电点时,则认为蛋白质为在中性。当pH高于蛋白质等电点时,则认为该蛋白质具净负电荷。当环境pH低于蛋白质等电点时,则认为该蛋白质具净正电荷。血清样本是依照以下实施例提出的操作步骤做区分,以获得本发明所述的标记。
蛋白质为阴离子交换树脂捕获后,以一系列于pH9、pH7、pH5、pH4、pH3清洗方式冲提。通过三个区分物(pH9、pH4及有机溶剂)的图形数据的单一化最大分离性分析(Unified Maximum Separability Analysis,UMSA)方法发现一组三种潜在生物标记。pH4区分物于m/z12828与28043这两个谱峰,在癌症组群中皆向下调整;第三个标记是pH9流洗出的区分物中,位于m/z3272的谱峰,其谱峰强度于癌症组群众向上调整。所有区分物皆结合至固定化金属亲和性色层分析列阵,该列阵具铜离子电荷(IMAC3-Cu)(请参阅第1图中的光谱图)。
样本中生物分子也能经高解析电泳分离,如一维或二维凝胶电泳。含有标记的区分物能通过气相离子光谱法分离并进一步分析。优选地,可采用二维凝胶电泳产生包括至少一种标记的二维生物分子点列阵。请参阅如Jungblut& Thided,Mass Spectr.Rev.16:145-162(1997)。
二维凝胶电泳可通过使用本领域技术已知方法来实施。例如见德意志(Deutscher)编着,酶学方法(MethodsIn Enzymology)第182卷。典型地,样本中生物分子是以犹如等电聚焦方式分离,此方式中样本中生物分子以pH梯度分离,直至生物分子达到净电荷为零(亦即等电点)为止。这第一个分离步骤产生了一维生物分子列阵。该一维列阵中生物分子进一步与第一个分离步骤所用技术通常有所区别的技术进行分离。例如,于第二维中, 以等电聚焦方式分离的生物分子复采用聚丙烯酰胺胶体进行分离,诸如在十二烷基硫酸钠(SDS-PAGE)存在下的聚丙烯酰胺凝胶电泳法。SDS-PAGE凝胶允许基于生物分子的分子量进行进一步分离。典型地,二维凝胶电泳能在复合混合物中化学性分离分子量范围1000至200000道尔顿的不同生物分子。该些凝胶的等电点范围约3-10(属于宽范围凝胶)。
二维列阵中的生物分子能以本技术领域内熟知的适合方法进行检测。例如,将凝胶中生物分子做标记或染色(如考马斯蓝或银染色)。如果凝胶电泳法产生相等于本发明的至少一种标记分子量的色点,则该色点可通过气相离子光谱法做进一步分析。或者,可通过施加一电场将含有生物分子的凝胶转移至钝化膜上。然后膜上约相等于该标记分子量的色点可通过气相离子光谱法进行分析。在气相离子光谱法中,色点可通过任何适合技术,诸如本文所述的MALDI或SELDI(例如使用ProteinChip列阵)进行分析。
进行气相离子光谱法分析前,还需要将色点中生物分子用诸如蛋白酶(如胰蛋白酶)的切割剂切割成较小片断。生物分子被切割成这样小的片段以供色点中该生物分子的质量指纹,若需要,该指纹能用于判别标记。
高效液相层析法(HPLC)也可基于生物分子不同的物理性质如极性、电荷及大小,将分离样本中生物分子混合物分离。HPLC仪器通常由流动相储罐、泵、注射器、分离柱及检测器组成。样本中生物分子通过注射等分试样至分离柱而进行分离。混合物中不同的生物分子,由于在分离柱中移动相与固定相间分布行为的差异,是以不同速度通过分离柱。故能收集相等于至少一种标记的分子量及/或物理性质的区分物。区分物可通过气相离子光谱法检测标记而加以分析。例如,色点可通过如此处所述的MALDI或SELDI(例如使用ProteinChip列阵)进行分析。
或可供选择地,标记在分析之前先经经修饰的以提高其解析力或判别力。例如,标记在分析前经蛋白质分解消化。任何蛋白酶都适用。可能将标记切割成不连续数目片断的蛋白酶,诸如胰蛋白酶,特别有用。消化产生的片段可作为标记指纹,这样使得间接检测该标记成为可能。当有类似分子量的标记也许会与还未确认的标记混淆时,标记指纹尤为有用。而且,蛋白质分解片断对高分子量标记也有用处,因为较小标记较易通过质谱法解析。在另一实施例中,生物分子可经经修饰的以提高检测解析力。例如,可用神经胺糖酸酶(neuraminidase)自糖蛋白移除末端唾液酸(sialicacid)残基,以改善对阴离子吸附剂(如阳离子交换ProteinChip列阵)的结合作用,以及改善检测解析力。另一实施例中,标记可通过黏附特异性结合分子标记,又可识别标记的特定分子量标记进行经修饰的。或可选择地,检测该经经修饰的的标记后,该标记还可通过匹配蛋白质数据库(如SwissProt)中经修饰的标记的物理和化学特征来进一步得到确定。
III.标记捕获
最好用可被固定至固体支撑物(诸如本文所述的任何生物芯片、多格微滴定盘或树脂)的捕获剂来捕获生物标记。尤其本发明的生物标记是用SELDI蛋白质生物芯片捕获。捕获是发生于色层分析表面或生物特异性表面。任何包括反应性表面的SELDI蛋白质生物芯片皆可用于捕获与检测本发明的生物标记。然而,本发明的生物标记是结合至固定化金属螯合物上。IMAC-3和IMAC-30生物芯片,其次氨基乙酸官能团可通过螯合作用吸收过渡金属离子(如Cu2+和Ni2+),是本发明用于捕获生物标记的优选SELDI生物芯片。任何包括反应性表面的SELDI蛋白质生物芯片皆可用于捕获和检测本发明的生物标记。这些生物芯片能以特异性捕获生物标记的抗体进行衍生,或者以结合免疫球蛋白的蛋白质A或蛋白质G捕获剂进行衍生。然后生物标记可为适用特异性抗体的溶液捕获,同时该该已捕获的标记通过由捕获剂自生物芯片上分离出来。
通常,含有诸如血清的生物标记样本是放置于生物芯片的活性表面上,以俾使有充分时间进行结合。然后,未结合的分子用适合的冲提剂诸如磷酸盐缓冲液自该表面冲提出来。通常,该冲提剂离子力越强,则该蛋白质必须结合得越紧,俾使冲提后蛋白质仍留在该表面上。此时滞留的蛋白质生物标记能以适合的方式进行检测。
IV.标记检测与测定
一旦诸如生物芯片或抗体的基质捕获到标记,则可用任何适合方法测定样本中的标记。例如,可能各种方法包括例如气相离子光谱法、光学法、电化学法、原子力显微镜法以及射频法检测及/或测定标记。使用这些方法可检测至少一种标记。
A.SELDI
一种检测及/或测定生物标记的优选方法是使用质谱法,尤其是″表面强化激光解吸/电离″或″SELDI″。SELDI是指在解吸/电离气相离子光谱测定法(如质谱分析法)的其中一种方法,在这种方法中,在SELDI探针的表面捕获分析物,而SELDI探针是与气相离子光谱测定仪(如质谱仪)的探针接口电性结合。在“SELDI质谱”中,该气相离子光谱测定仪是质谱仪。以上使较详细地叙述SELDI技术。ApoA1、六种形式的经修饰的ApoA1、甲状腺素运输蛋白△N10、天然甲状腺素运输蛋白、半胱氨酰化甲状腺素运输蛋白、磺化甲状腺素运输蛋白、CysGly修饰的甲状腺素运输蛋白、谷胱甘肽化甲状腺素运输蛋白、IAIH4片段No.1、IAIH4片段No.2以及IAIH4片段No.3的检出谱峰分别位于m/z约28043(或28055);m/z约29977.4,28262,28473,28692,28844,29031;m/z约12870.9,m/z约13761或13767;m/z约13890.8或13888;m/z约13850;m/z约13944;m/z约14086.9或14093;m/z约3272;m/z约3031;以及m/z约2884。
B.免疫试验法
在另一实施例中,可采用免疫试验法进行检测和分析样本中的标记。该方法包括:(a)提供特异性结合标记的抗体;(b)将样本与抗体接触;以及(c)检测样本中结合有标记的抗体复合体是否存在。
免疫试验法是一种用抗体特异性结合抗原(如标记)的测试方法。其特征是使用特定抗体特异性结合特性,进行抗原的分离、定标及/或定量。当涉及蛋白质或肽时,″特异性(或选择性)结合″至抗体或″具特异性(或选择性)免疫反应性″术语,是指于蛋白质与其它生物分子的异种分布中决定该蛋白质存在的结合反应。因此,自指定的免疫试验法条件下,特定的抗体至少结合特定蛋白质两次,且对样本中其它蛋白质无显著量地充分结合。与抗体在这种条件下特异性结合需要选择专门针对特定蛋白质的抗体。例如,选择自特定物种如大白鼠、老鼠或人类的标记培养的多株抗体,以得到那些只对该标记并不对其它蛋白质(除该标记的多晶变异体和对偶基因外)具特异性免疫反应性的多株抗体。这一选择可能需要通过排除与其它物种中标记分子进行交互反应的抗体而获得。
通过使用经纯化当标记或其核酸序列,特异性结合标记的抗体可采用各种本技术领域已知的适合方法制备。如,请参阅科立根(Coligan)着,免疫学现代档案(CurrentProtocols in immunology)(1991);哈洛与莲(Harlow &Lane)着,抗体:实验室手册(Antibodies:A LaboratoryManual)(1988);高丁(Goding)着,单株抗体:原理与应用(Monoclonal Antibodies:Principles and Practice),第二版(1986);以及科勒与密尔斯丹(Kohler &Milstein),Nature256:495-497(1975)。这样的技术包括,但不仅限于此,通过选择噬菌体或类似媒介物中重组抗体资料中的抗体,以进行抗体的制备,以及通过免疫兔或免疫老鼠的方法制备多株与单株抗体(如,请参阅Huse等人,Science246:1275-1281(1989);Ward等人,Nature341:544-546(1989))。典型来说,特异性或选择性反应将至少高于背景讯号或噪声两倍,而更典型地则为高于背景讯号10至100倍。
通常,自受验者处得到的样本可与特异性结合标记的抗体相接触。或可供选择地,抗体在与样本接触前,能被固定至固体支撑物上,以利于冲提与单离该化合物。固体支撑物包括例如微滴定盘、棒、珠或微珠形式的玻璃或塑料。抗体亦能黏附于以上所述的探针基质或ProteinChip列阵。样本以取自受验者的生物学液体样本为宜。生物学液体样本举例包括血液、血清、血浆、乳头分泌物、尿液、泪液、唾液等。在优选实施例中,该生物学液体是由血清组成。样本接触抗体之前,可用适当冲洗剂稀释样本。
用抗体培养样本后,清洗该混合物,这样就可以检测形成地抗体-标记化合物。此检测可通过检测试剂培养该已被清洗的混合物来完成。此检测试剂可以是例如以可检测标记标识的第二抗体。可检测标识举例包括磁珠(如DYNABEADSTM)、萤光染料、放射性标记、酶(如山葵过氧化酶、碱性磷酸酶及其它ELISA常用酶),以及诸如胶体金、有色玻璃或塑料珠的比色标记。或者,样本中的标记是以间接方法测定,其中,例如具标记的第二抗体被用作检测被结合的标记-特异性抗体,及/或竞争或抑制方法中,例如,结合至该标记的明显抗原决定基的单株抗体是与该混合物同时培养的。
测定抗体-标记化合物数量或存在与否的方法包括,例如,萤光、发光、化学发光、吸收率、反射率、透光率、双折射率或折光指数的检测(如表面电浆共振、椭偏术、共鸣镜法、光栅耦合器波导方法或干涉量度分析法)。光学方法还包括显微镜法(共焦或不共焦)、呈像方法和非呈像方法。电化学分析法包括伏安法和电流分析法。无线频率分析法包括多极共振光谱分析法。施行该些分析方法轼本技术领域已知者。有用的分析方法包括,例如,诸如酶联免疫吸附分析法(enzyme-linked immunosorbent assay,ELISA)、放射免疫分析法(radioimmune assay,RIA)、西方墨点分析法(Western blot assay)或长条墨点分析法(slotblotassay)的酶免疫分析法(enzyme immune assay,EIA)。该些方法于下列文献中亦有说明,例如,细胞生物学方法:细胞生物学中抗体(Methodsin Cell Biology:Antibodies in Cell Biology),第37卷(阿塞(Asai)编着,1993);基础与临床免疫学(Basic and ClinicalImmunology)(史提特斯与特尔(Stites & Terr)编着,第7版,1991);以及哈洛与莲的著作(前面已述)。
整个分析方法中,于每一试剂相结合后需要进行培养及/或清洗步骤。培养步骤自约5秒至几个小时变化,最好自约5分种至约24个小时。然而,培养时间将视分析方法类型、标记、溶液体积浓度等而定。虽然分析方法可于一温度范围如10℃至40℃下施行,但通常该分析方法将于常温下进行。
免疫分析法可用于判断样本种标记存在与否,以及样本种标记的量。抗体-标记化合物的量可通过与标准物对比而定。标准物是如已知化合物或已知存在于样本种的另一种蛋白质。如上所述,标记的试验量无须以绝对单位测定,只要该测定单位可与参照组对比即可。
检测样本中该些标记的方法有很多应用。例如,至少一种标记可用于帮助人类癌症诊断或预后的测定。另一实施例中,标记检测的方法可用于监测受验者对癌症治疗的反应。在一实施例中,检测标记的方法可用于分析与确认体内或体外调节这些标记表现的化合物。在优选实施例中,生物标记适用于区别肿瘤进程的不同阶段,以俾于帮助确定适当的疗法以及判断该肿瘤转移程度。
V.数据分析
当例如使用质谱法测定样本时,即产生数据,该数据随后通过计算器软件程序分析。通常,该软件是包括可将质谱仪讯号转换成计算器可读形式的编码。该软件还包括能将算法运用于判断讯号是否代表讯号中对应于本发明标记或其它有用标记的″谱峰″位置的讯号分析的编码。该软件还包括执行比较来自试验样本的讯号与″正常″及人类癌症的典型讯号特征以及确定这两种讯号间符合程度的算法的编码。该软件还包括指示试验样本最接近哪个特征的编码,从而提供可能性诊断。
本发明的优选实施例中,需要测定多种生物标记。使用多种生物标记可提高试验预测值得准确度,以及于诊断、毒物学、病人状态及病人监控方面提供较大用处。称为″图案识别(pattern recognition)″的过程大大改善了对预测性药物的临床蛋白体的灵敏度与特异性,其中该过程是检测由多种生物标记形成的图案。临床样本数据(例如以SELDI方法测得的)的细微差异显示蛋白质表现的某些图案可预测诸如一些疾病存在与否、癌症进程特定状态、或是药物治疗正向或逆向反应之类的表现型。
质谱法产生的数据是由通过如上所述的离子检测器检测离子开始的。离子撞击检测器,产生由高速时间列阵记录器所数字化的电能,该记录器是数字化地捕获仿真讯号。塞弗吉蛋白质芯片(Ciphergen′s ProteinChip)系统采用摹拟对数字转换器(ADC)来完成此动作。ADC将检测器输出于固定宽度时间间隔整合成与时间有关的箱型讯号。该时间间隔典型地为一至四纳秒(nanosecond)长。再者,最后分析的飞行时间光谱,典型地并不代表来自对样本离子化能量的单一脉冲讯号,而是来自许多脉冲讯号的总和。这样就能降低噪音,增加动态范围。该飞行时间数据随后进行数据处理。在塞弗吉蛋白质芯片软件中,典型数据处理包括TOF对M/Z转换、基线扣除、高频噪声过滤。
TOF对M/Z转换包括将飞行时间转换成质荷比(M/Z)的算法运用。在此步骤中,讯号从时间相关转换成质量相关。亦即,将每一飞行时间转换成质量对电荷比,即M/Z。校正是做内或外校正。于内校正,被分析的样本包涵至少一种已知M/Z分析物。位于代表这些质量分析物的飞行时间的讯号峰被指定为该已知M/Z。基于这些指定M/Z比值,计算转换飞行时间为M/Z数学函数的参数。于外校正,将飞行时间转换为M/Z的函数,诸如以先前内校正造出的函数,以未使用内校正物方式应用至飞行时间光谱上。
基线扣除是通过消除会干扰光谱的假的、可重复显现的仪器偏移量,来改善数据定量。其包括使用导入诸如峰宽的参数的算法以计算光谱基线,然后自质谱中扣除该基线。
高频噪声讯号是通过平滑函数除去的。典型平滑函数是对每一时间相关箱型讯号应用移动平均函数。于改善版中,移动平均过滤器是可变宽度数字过滤器,于该过滤器中,过滤器带宽是随着诸如谱峰带宽的函数而改变,通常随飞行时间增加而变宽。例如见2000年11月23日申请的国际专利WO00/70648(Gavin et al.,“Variable WidthDigital Filter for Time-of-flight Mass Spectrometry”)。
分析通常包括代表来自分析物讯号的光谱谱峰确认。当然,谱峰的选定可通过肉眼来完成。然而,塞弗吉蛋白质芯片软件中一部分程序亦可用于自动检测谱峰。通常,该程序的功能是识别具讯号对噪声比大于选定阙值的讯号,并对该谱峰讯号中央的谱峰质量做标记。在一有用的应用中,比较许多光谱,以确认出现在某些选定比例的质谱中的相同谱峰。该软件的一个版本是将出现于特定质量范围内不同光谱的所有谱峰聚集成群,并对靠近该质量(M/Z)群的中点的谱峰指定质量(M/Z)。
来自至少一个光谱的谱峰数据,通过例如制做电子表格来进行进一步分析,在该电子表格中,电子表格每一行代表一特定质谱,每一列代表由质量定义光谱中的谱峰,且每一单元格包含特定光谱中该谱峰强度。各种统计或图案辨认方法都可应用于数据上。
在一实施例中,塞弗吉生物标记式样TM软件(Ciphergen′s Biomarker PatternsTM Software)用于检测产生的光谱式样。采用分类模型的式样辨认处理对数据进行分类。通常,该光谱将代表来自至少两种不同组群(使用分类算法来寻找)的样本。例如,该组群是病理学的对非病理学的(如癌症对非癌症)、药物反应对非药物反应、毒性反应对非毒性反应、疾病状态进步者对疾病状态非进步者、有表现型情况对无表现型情况。
本发明实施态样中产生的光谱可用分类模型的式样辨识处理分类。在一些实施例中,源自使用诸如″已知样本″的样本产生的光谱(如飞行时间光谱的质量光谱)的数据可用于″训练″分类模型。″已知样本″是事先分类(如癌症或非癌症)的样本。来自该光谱且用于形成分类模型的数据被称未″训练数据组″。一经训练,该分类模型可识别来自用未知样本产生的光谱的数据类型。然后分类模型可用于将未知样本分类。例如,造预测特定生物学样本是否与某一生物学状况(如疾病对非疾病)相关时,分类模型是很有用的。
用于形成分类模型的训练数据组应包括天然数据或预处理数据。造一些实施例中,天然数据可直接从飞行时间光谱或质谱得到,然后以任何适当方式进行选择性″预处理″。例如,可选择大于预定讯号对噪声比的讯号,以便于选择光谱中谱峰子集,而不是选择光谱中所有谱峰。在另一实施例中,在普通数值(如飞行时间数值或质量对电荷比数值)的预定数目谱峰″群组″可用于选择谱峰。举例来说,如果给定质量对电荷比的谱峰少于质谱群组中该质谱的50%,那么该质量对电荷比的谱峰可自训练数据组中省略。诸如这些的预处理步骤可用于减少用于训练分类模型数据的数量。
分类模型可用任何适当且试图将数据主体基于数据中呈现的目标参数而分隔成组的统计分类(或″学习″)方法来形成。分类方法可以是监督式或非监督式。监督式与非监督式分类处理例子于Jain著作″统计式样识别:回顾(Statistical Pattern Recognitin:A Review)″,类型分析的IEEE处理与机械智能,第22卷,1期,2000年1月中有说明,此处以其完整资料引用作为参考。
于监督式分类中,含有已知种类例子的训练数据是呈现于学习机制中,即学习多于一组定义每一已知类别的关系。然后新数据被应用于该学习机制中,该学习机制然后用学到的关系分类新数据。监督式分类处理举例包括线性回归处理(如多重线性回归(multiple linearre gression,MLR)、部份最小平方回归(partial least squaresreg ression,PLS)与主成分回归(principle components regression,PCR))、二元决策树(binary decisi on trees)(如递归分布处理(recursive portioning processs),如分类及回归树(CART))、类神经网络(artificial neural networks)如倒传递网络(backpropagation networks)、辨别分析(如贝斯分类器(Bayesian classifier)或费舍分析(Fisheranalysis))、逻辑分类器以及支持向量分类器(supportvector classifier)(支持向量机(support vector machine))。
优选监督式分类方法是递归分布处理。递归分布处理使用递归分布树分类来自未知样本的光谱。关于递归分布处理进一步详细内容在美国专利US20020138208A1(Paulse et al.,“分析质谱方法(Method for analyzing massspectra),”2002年9月26日)中有提供。
在其它实施例中,制做出的分类模型可用非监督式学习方法形成。非监督式分类试图以训练数据组中的相似性为基础学习分类,其中无须预先分类来自训练数据组的光谱。非监督式学习方法包括群集分析。群集分析是试图将数据分成理想上应有彼此非常相似而又对其它群集成员非常不相似的″群集″或群组。相似性是用一些测量数据组间距离的距离尺度来测定,并且将彼此靠近的数据组集合起来。群集技术包括MacQueen K-平均值算法与Kohonen自我组织网络(SelfOrganizing Map)算法。
主张学习算法用于分类生物学讯息在例如国际专利WO01/31580(Barnhill等人,″确认生物学系统中式样的方法与装置及其使用方法(Methods and devices foridentifying patterns in biological systems and methods ofuse thereof)″,2001年5月3日);美国专利US2002/0193950A1(Gavin等人,″质谱方法或分析(Method or analyzing mass spectra)″,2002年12月19日);美国专利US2003/0004402A1(Hitt等人,″以自生物学数据隐藏式样为基础的生物学转台间识别处理(Process for discriminating between biological statesbased on hidden patterns from biological data)″,2003年1月2日);以及美国专利US2003/0055615A1(张与张,″处理生物学表现数据的系统与方法(Systems andmethods for processing biological expression data)″,2003年3月20日)。
详而言之,为得到生物标记ApoA1、甲状腺素运输蛋白以及IAIH4片段,将癌症病人与健康参照物的样本谱峰强度数据当作″发现组″。将该数据合并并随意分成训练组与试验组,用单一最大分离分析(Unified MaximumSeparability Analysis,USMA)分类器的非线性版建立并试验多变量预测模型。USMA分类器详细内容于美国专利US2003/0055615A1中有叙述。
通常,自上面部分IV产生的数据是被放入诊断算法(亦即如上所述的分类算法)中。以学习算法为基础,然后产生分类算法。该过程包括发展能够产生分类算法的算法。本发明的方法是基于统计样本计算,通过增加足够数目的一些卵巢癌与正常样本产生更精确的分类算法。在学习算法中,该样本是作为数据训练组。
该分类的产生,亦即诊断、演算,是依赖于用于分析样本亦即产生前述部分IV得到的数据的分析操作。用于检测及/或测定标记(如步骤IV)的操作步骤务必与用于获得发展该分类演算的数据相同。必须在整个训练和分类系统中保持不变的测试分析条件包括芯片类型与质谱仪参数,以及一般样本制备与试验操作步骤。如果检测及标记/或测定标记(如步骤IV)的操作步骤改变了,则该学习演算与分类演算也必须改变。类似地,如果学习演算与分类演算改变,则检测及标记/或测定标记(如步骤IV)的操作步骤也必须改变,俾使与用于产生分类演算的操作步骤一致。发展新的分类演算模型需要引入足够数目的卵巢癌与正常样本,以新的检测操作步骤为基础发展新的训练数据组,用该数据产生新的分类演算,最后用多点(multi-site)研究验证该分类演算。
分类模型可在任何适当的数字计算器上建立并使用。适当的数字计算器包括使用任何标准或特殊操作系统如Unix、Windows TM或LinuxTM基本操作系统的微、迷你或大型计算器。所使用的数字计算器在实体上可能与用于制造有兴趣光谱的质谱仪分开,也可能与质谱仪连用。如果数字计算器与质谱仪是分开的,则数据必须通过一些其它方式(不管人工或自动化)输入计算器中。
依照本发明实施例的训练数据组与分类模型可通过数字计算器执行的计算器代码使其具体化。该计算器代码可存放于任何适当的计算器可读媒介包括光盘或磁盘、棒、磁带等,并能以任何适当计算器程序语言包括C、C++、visual basic等写成。
VI.优选实施例
在优选实施例中,自病人体内收集血清样本,然后采用上述说明的阴离子交换树脂区分。用IMAC铜蛋白质芯片列阵捕获样本中生物标记。在这一测试中能检测到ApoA1、经修饰的ApoA1、甲状腺素运输蛋白△N10、天然甲状腺素运输蛋白、半胱氨酰化甲状腺素运输蛋白、磺化甲状腺素运输蛋白、CysGly修饰的甲状腺素运输蛋白、谷胱甘肽化甲状腺素运输蛋白、IAIH4片段No.1、IAIH4片段No.2以及IAIH4片段No.3。然后将结果输入计算器系统中,该系统包含有的算法是以与用于学习演算与分类演算来进行初始判断生物标记的相同参数进行设计。该算法基于接受到的与每个生物标记都相关的数据而产生诊断。
在尤其优选实施例中,也要检测CA125II生物标记的数量,而且也是通过使用诸如免疫分析法的已知方法或使用SELDI蛋白质芯片列阵来进行检测的。在这些实施例中,CA125II标记结果亦是输入至计算器演算中,用于准备诊断。基于ApoA1、甲状腺素运输蛋白△N10、IAIH4片段No.1以及CA125II这四种生物标记的检测的诊断试验,至少有约80%的特异性。
通过用生物标记发展的分类演算检查自SELDI试验产生的数据来判定诊断。该分类演算是依赖于用于检测该生物标记自怀疑试验操作步骤的特点。这些特点包括例如,样本制备、芯片类型以及质谱仪参数。如果该试验参数有改变,则该演算必须改变。同样地,如果该演算改变,则该试验操作步骤亦必须改变。
另一实施例中,自病人体内收集血清样本。采用上述说明的抗体蛋白质芯片列阵来捕获生物标记。用生物特异性SELDI测试系统来检测该标记。在这一测试中能检测到ApoA1、经修饰的ApoA1、甲状腺素运输蛋白△N10、天然甲状腺素运输蛋白、半胱氨酰化甲状腺素运输蛋白、磺化甲状腺素运输蛋白、CysGly修饰的甲状腺素运输蛋白、谷胱甘肽化甲状腺素运输蛋白、IAIH4片段No.1、IAIH4片段No.2以及IAIH4片段No.3。然后将结果输入计算器系统中,该系统包含有的算法是以与用于学习演算与分类演算来进行初始判断生物标记的相同参数进行设计。该算法基于接受到的与每个生物标记都相关的数据而产生诊断。
在其它优选实施例中,以非SELDI方式捕获与试验标记。于一实施例中,自病人体内收集血清样本。采用其它已知方法如抗体对标记在基质上捕获生物标记。用本技术领域内已知方法如光学法与折射指数法来检测该标记。光学法实例包括例如ELISA的萤光检测。折射指数法实例包括表面电浆共振。然后对标记结果进行演算,该演算可能需要亦可能不需要人工智能。该算法基于接受到的与每个生物标记都相关的数据而产生诊断。
上述任何方法中,自样本获得的数据可直接自该检测方法输入至具诊断演算的计算器中。或者,获得的数据以人工方式,或通过自动化方式,输入至具诊断演算的个别计算器中。
VII.受验者诊断及卵巢癌状态的确定
任何生物标记各自对卵巢癌状态的确定都有帮助。首先,在受验者样本中使用此处所述的方法,如先在SELDI生物芯片上捕获然后用质谱法检测,来测定被选择的生物标记。然后,用该测量结果与以区别卵巢癌状态与非癌症状态的诊断量或参照组相比较。该诊断量将反应这样的讯息:与非癌症状态比较,癌症状态中个别生物标记是上调或下调。如本技术领域内所习知的,该使用的特定诊断量须加以调节以提高诊断分析法(是依照诊断医师喜好采用)的灵敏度与特异性。这样,与该诊断量对照的试验量便显示出卵巢癌状态。
当各自生物标记是为有用的诊断标记时,发现生物标记组合提供了比单一生物标记更大的预测价值。尤其,样本中多个标记的检测提高了真阳性与真阴性诊断的百分比,并会降低假阳性或假阴性诊断的百分比。如此一来,本发明的优选方法是测定多于一个的生物标记。例如,本发明方法ROC分析中,其AUC大于0.50,更佳方法的AUC大于0.60,而更优方法的AUC大于0.70。特优方法AUC大于0.70,而最佳方法AU C大于0.80。
再者,使用本发明三个优选标记与诸如CA125的标记4组合在一起进行测定的方法大大改善了该CA125的诊断效果,提供AUC大于0.50的试验,AUC大于0.60的优选试验,AUC大于0.70的更优选试验。
为了使用组合生物标记,逻辑回归演算是有用的。UMSA演算对于自试验数据产生诊断演算尤为有用。该演算于下列文献中有揭露:Z.Zhang等人,将分类分离分析方法应用于微列阵数据中(Applying classificationseparability analysis to microarray data);Lin SM,JohnsonKF编着,微列阵数据分析方法(Methods of Microarray dataanalysis):CAMDA’00报告,波士顿Kluwer学术出版社,2001:125-136;以及Z.Zhang等人,钓鱼探险-从表现图谱概略萃取式样的监督式方法(Fishing Expedition-aSupervised Approach to Extract Patterns from aCompendium of Expression Profiles;Lin SM,Johnson KF编着,微列阵数据分析方法II:CAMDA’01报告,波士顿Kluwer学术出版社,2002。
学习演算将产生多变量分类(诊断)演算,并调成操作者期望的特定特异性与灵敏度。然后该分类演算可用于确定卵巢癌状态。该方法还包括测定受验者样本中被选定的生物标记(如ApoA1、经修饰的ApoA1、甲状腺素运输蛋白△N10、天然甲状腺素运输蛋白、半胱氨酰化甲状腺素运输蛋白、磺化甲状腺素运输蛋白、CysGly修饰的甲状腺素运输蛋白、谷胱甘肽化甲状腺素运输蛋白、IAIH4片段No.1、IAIH4片段No.2以及IAIH4片段No.3)。这些测量提供给分类演算。该分类演算产生指示卵巢癌状态的指示器分数。
在一些实施例中,在未对标记定量的情况下,少量出现标记或不出现标记是有用的,而且可以与卵巢癌的可能性诊断相关联。例如,卵巢癌病人中检测到IAIH4片段的频率比正常受验者高。同样地,例如,卵巢癌病人中检测到生物标记ApoA1与甲状腺素运输蛋白的频率比正常受验者低。因此,分别检测到受验者被发现存在或不存在表明该受验者有患卵巢癌的较高可能性。
其它实施例中,标记的测量包括定量标记,以关联标记检测结果与卵巢癌的可能性诊断。因此,如果受验者体内被检测到的标记数量与参照组数量比较有差异(亦即比参照组高或低,视该标记而定),则该受验者有患卵巢癌的较高可能性。
该关联性需要考虑比较样本中该(些)标记量与该(些)标记参照量(该(些)标记向上或向下调节)(例如,正常者无法检测到癌症)。参照量可以是例如为未检测到癌症的正常受验者的可比样本中出现标记量的平均或中位数。该参照量是在该试验量测定相同或实质上类似的实验条件下测定的。该相关性须考虑试验样本中该标记存在与否,以及参照组中该相同标记检测频率。该相关性须考虑这两者因素以助于确定卵巢癌状态。
在某些评定卵巢癌状态的方法实施例中,该方法还包括基于该状态的指导受验者治疗。如前所述,这种指导描述的是医师或临床医师在对确定卵巢癌状态之后采取的行动。例如,如果本发明方法的结果无法下结论或有理由认为确认状态是必须的,则医师必须安排更多试验。或者,如果该状态表明动手术是适当的,则医师必须安排病人动手术。其它举例,病人必须接受化学治疗或放射性疗法,以替代或辅助手术疗法。同样地,如果该结果是负面的,例如该状态显示卵巢癌晚期或如果该状态为急性,则无须采取进一步动作。再者,如果该结果显示已成功治愈,则无须进一步安排了。
本发明还提供受验者安排治疗方法后再次测定生物标记(或生物标记的特定组合)的方法。在这些例子中,该方法是用于监视癌症状态,例如对癌症治疗的反应、疾病减缓或疾病进展程度由于这些方法容易操作以及缺乏侵入性,因此病人接受每一治疗后,可重复使用这些方法。这样就允许医师监视治疗过程的效果。如果结果显示治疗无效,则处理过程应做相应变化。这使得医师可以弹性选择治疗方法。
另一实施例中,用于检测标记的方法可被用于分析及识别调节体内或体外该些标记表现的化合物。
本发明的方法亦有其它应用。例如,该标记可用于筛选调节体内或体外标记表现的化合物,其中该化合物反过来对治疗或避免病人卵巢癌很有用处。另一实施例中,该标记可用于监测对卵巢癌治疗的反应。又一实施例中,该标记可用于遗传研究以决定是否该受验者有发展成卵巢癌的风险。例如,某些标记可能在基因上是相关联的。这可以通过例如分析患有卵巢癌家族病史的卵巢癌病人群样本而定。该结果然后可与例如自无卵巢癌家族病史的卵巢癌病人得到的数据加以比较。基因上相关联的标记可作为判断有卵巢癌家族病史的受验者是否有卵巢癌倾向的工具。
本发明的另外一些实施例是有关于将分析结果或诊断结果或两者传达给技术专家、医师或病人。在某些实施例中,计算器被用作将分析结果或诊断结果或两者传达给相关群体如医师及其病人的工具。在一些实施例中,做试验或分析出试验结果所在的国家或司法系统与将该试验结果或诊断结果被传达给的国家或司法系统会不同。
本发明的优选实施例中,基于在试验受验者中是否存在本发明的任何生物标记的诊断结果一旦获得就应尽快传达给该受验者。该诊断结果可能是通过受验者的治疗医师传达给该受验者。或者,该诊断结果是通过邮件发送给试验受验者或通过电话传达给受验者。计算器可用于通过邮件或电话传达诊断结果。在某些实施例中,含有诊断测试结果的讯息被产生并使用计算器硬件与软件结合自动传递给熟悉通讯技术的受验者。一健康导向的通讯系统的例子在美国专利US6283761中有描述;然而,本发明并不仅限于利用这种特殊通讯系统。在本发明的方法的某些实施例中,所有或一些方法步骤,包括样本的分析、疾病的诊断以及测试结果或诊断结果的传达可在不同(如国外)司法系统进行。
VIII.试剂盒
在又一实施方面中,本发明提供用于评定卵巢癌状态的试剂盒,其中该试剂盒可用于测定本发明标记。例如,该试剂盒可用于测定任何至少一种此处所述的标记,该标记在卵巢癌病人者与正常受验者样本中出现有差异。本发明的试剂盒有许多应用。例如,该试剂盒可用作区别受验者是否有卵巢癌或有阴性诊断,这样让医师或临床医师诊断是否存在癌症。在另一实施例中,该试剂盒可用于确认体内或体外调节卵巢癌动物模型中至少一种标记表现的化合物。
因此本发明提供的试剂盒包括(a)结合选自ApoA1、经修饰的ApoA1、甲状腺素运输蛋白△N10、天然甲状腺素运输蛋白、半胱氨酰化甲状腺素运输蛋白、磺化甲状腺素运输蛋白、CysGly修饰的甲状腺素运输蛋白、谷胱甘肽化甲状腺素运输蛋白、IAIH4片段No.1、IAIH4片段No.2以及IAIH4片段NO.3,及其结合物的生物标记的捕获试剂;以及(b)包括至少一种生物标记的容器。在优选试剂盒中,该捕获试剂结合多种生物标记。该捕获试剂也可能结合至少一种已知生物标记,标记4,如CA125。在某些优选实施例中,试验试剂盒还包括第二捕获试剂,所述的第二捕获试剂是结合第一捕获试剂不结合的至少一种生物标记。
本发明提供的试剂盒还包括(a)结合至少一种生物标记的第一捕获试剂,其中所述的生物标记是选自ApoA1、经修饰的ApoA1、甲状腺素运输蛋白△N10、天然甲状腺素运输蛋白、半胱氨酰化甲状腺素运输蛋白、磺化甲状腺素运输蛋白、CysGly修饰的甲状腺素运输蛋白、谷胱甘肽化甲状腺素运输蛋白、IAIH4片段No.1、IAIH4片段No.2以及IAIH4片段No.3,以及(b)结合至少一种所述的第一捕获试剂不结合的生物标记的第二捕获试剂。优选地,至少一种所述的捕获试剂是抗体。某些试剂盒进一步包括至少一种捕获试剂粘附于或可粘附于其上的MS探针。
所述的捕获试剂可以为任何类型的试剂,以SELDI探针为宜。本发明的某些试剂盒中,所述的捕获试剂包括IMAC。
本发明提供的试剂盒进一步包括(a)结合至少一种生物标记的第一捕获试剂,其中所述的生物标记是选自ApoA1、经修饰的ApoA1、甲状腺素运输蛋白△N10、天然甲状腺素运输蛋白、半胱氨酰化甲状腺素运输蛋白、磺化甲状腺素运输蛋白、CysGly修饰的甲状腺素运输蛋白、谷胱甘肽化甲状腺素运输蛋白、IAIH4片段No.1、IAIH4片段No.2以及IAIH4片段No.3,以及(b)使用捕获试剂检测生物标记的说明书。在某些试剂盒中,该捕获试剂包括抗体。而且,一些试剂盒进一步包括所述的捕获试剂粘附于或可粘附于其上的MS探针。一些试剂盒中,所述的捕获试剂进一步包括IMAC。该三种经确认的标记中每一种,本文是结合至IMAC ProteinChip列阵。因此,本发明的优选实施例包括早期监测卵巢癌的高产量试验,该试验分析IMAC ProteinChip列阵上病人样本中该三种分析物,以及传统CA-125ELISA(或该CA-125ELISA被转移至该ProteinChip列阵平台)。
在其它实施例中,本文所述的试剂盒包括至少一种结合至少一种选自标记I至XLVIII的捕获试剂。
本发明的某些试剂盒进一步包括冲洗溶液,或洗提液,其中所述的试剂盒进一步包括冲洗溶液,冲洗后可选择性地允许被结合的生物标记保留于所述的捕获试剂上,而其它生物标记被冲洗下来。或者,该试剂盒含有制备该冲洗溶液的说明书,其中吸附剂与冲洗溶液的组合允许使用气相离子光谱法测定该些标记。
优选地,该试剂盒包括用于监测癌症的试剂盒的使用方法的书面说明书,并提供测试样本与捕获试剂接触及监测至少一种保留在该捕获试剂中的生物标记的操作说明。例如,试剂盒应该具有标准操作说明,以告知消费者在血清样本接触捕获试剂后如何清洗捕获试剂(如探针)。另一实施例中,试剂盒应具用于前区分样本的指示,以降低该样本中蛋白质的多样性。另一例中,试剂盒应具自动化该区分步骤或其它程序的说明书。
该些试剂盒可自上述说明的物质制备,而前述讨论的这些物质(如探针基质、捕获试剂、吸附剂、冲洗溶液等)是完全可应用至这部分,故将不再重复叙述。
在另一实施例中,该试剂盒还包括附着有吸附剂(如有吸附剂功能的颗粒)的第一基质,以及该第一基质能置其上以形成探针的第二基质,其中该探针是可移动可插入至气相离子光谱仪中。其它实施例中,该试剂盒包括单一基质,该基质是为可移动可插入于该基质上的具吸附剂的探针形式。又另一些实施例中,该试剂盒还包括前区分自旋柱(如汽巴克隆(Cibacron)蓝色琼脂糖柱、抗HAS琼脂糖柱、K-30尺寸排除柱、Q-阴离子交换自旋柱、单股DNA柱、lectin柱等)。
在另一实施例中,试剂盒包括(a)特异性结合标记的抗体;以及(b)检测剂。该试剂盒可自上述物质制备,且前述有关该物质(如抗体、检测剂、固定化支撑物等)的讨论是完全可应用于这部分,因此将不再重复说明。可供选择地,该试剂盒还包括前区分自旋柱。在一些实施例中,该试剂盒还包括以卷标或独立插件形式出现的适当操作参数的说明书。
可供选择地,该试剂盒还包括标准或参照讯息,以便测试样本能与参照讯息对比,以判断样本中被检测的标记的试验量是否与诊断卵巢癌的诊断量一致。
本发明进一步提供一种制品,包括结合至少两种生物标记的至少一种捕获试剂,所述的捕获试剂选自ApoA1、经修饰的ApoA1、甲状腺素运输蛋白△N10、天然甲状腺素运输蛋白、半胱氨酰化甲状腺素运输蛋白、磺化甲状腺素运输蛋白、CysGly修饰的甲状腺素运输蛋白、谷胱甘肽化甲状腺素运输蛋白、IAIH4片段No.1、IAIH4片段No.2以及IAIH4片段No.3。本发明所述的制品例子包括,但不仅限于,ProteinChip列阵、探针、微滴定盘、珠、试管、微量试管以及任何其它捕获试剂可附着其上的固态物质。本发明制品的其它实施例还包括结合其它已知卵巢癌标记,即标记4,的捕获试剂。所述的制品的一实施例中,用于实施例的ProteinChip列阵将具捕获ApoA1、经修饰的ApoA1、甲状腺素运输蛋白△N10、天然甲状腺素运输蛋白、半胱氨酰化甲状腺素运输蛋白、磺化甲状腺素运输蛋白、CysGly修饰的甲状腺素运输蛋白、谷胱甘肽化甲状腺素运输蛋白、IAIH4片段No.1、IAIH4片段No.2以及IAIH4段No.3以及标记4的吸附剂。在尤佳实施例中,标记4是CA125。在另一实施例中,微滴定盘将具可结合ApoA1、经修饰的ApoA1、甲状腺素运输蛋白△N10、天然甲状腺素运输蛋白、半胱氨酰化甲状腺素运输蛋白、磺化甲状腺素运输蛋白、CysGly修饰的甲状腺素运输蛋白、谷胱甘肽化甲状腺素运输蛋白、IAIH4片段No.1、IAIH4片段No.2及/或IAIH4片段No.3以及标记4的抗体。这些是该些制品的一些实施例。具本技术领域内一般技能者将根据此处所述的方法很容易地就可以制造出其它这类制品。
本发明进一步提供一种系统,包含多种捕获试剂,每种捕获试剂结合至不同生物标记,其中所述的生物标记选自ApoA1、经修饰的ApoA1、甲状腺素运输蛋白△N10、天然甲状腺素运输蛋白、半胱氨酰化甲状腺素运输蛋白、磺化甲状腺素运输蛋白、CysGly修饰的甲状腺素运输蛋白、谷胱甘肽化甲状腺素运输蛋白、IAIH4片段No.1、IAIH4片段No.2及/或IAIH4片段No.3以及至少一种适于标记4种类的标记。这一系统的实施例包括,但不仅限于,一组ProteinChip列阵,该ProteinChip列阵组包括结合有至少一种生物标记的吸附剂,所述的生物标记是选自ApoA1、经修饰的ApoA1、甲状腺素运输蛋白△N10、天然甲状腺素运输蛋白、半胱氨酰化甲状腺素运输蛋白、磺化甲状腺素运输蛋白、CysGly修饰的甲状腺素运输蛋白、谷胱甘肽化甲状腺素运输蛋白、IAIH4片段No.1、IAIH4片段No.2及/或IAIH4片段No.3。所述的系统类型中,每种所述的生物标记具有一种ProteinChip列阵。或者,可供选择地,多个标记具有一种ProteinChip列阵,其中所述的标记选自ApoA1、经修饰的ApoA1、甲状腺素运输蛋白△N10、天然甲状腺素运输蛋白、半胱氨酰化甲状腺素运输蛋白、磺化甲状腺素运输蛋白、CysGly修饰的甲状腺素运输蛋白、谷胱甘肽化甲状腺素运输蛋白、IAIH4片段No.1、IAIH4片段No.2及/或IAIH4片段No.3以及用作CA125的第ProteinChip列阵。其它系统的实施例包括那些捕获试剂是各自独立或成群地含有对每一种生物标记都有一种抗体的试管。具本技术领域内一般技能者将根据此处所述的方法很容易地就可以制造出其它这类制品。
本发明进一步提供一种筛检试验,包括(a)将激肽释放酶与激肽释放酶底物以及测试试剂接触,以及(b)判判断所述的测试试剂是否调节所述的激肽释放酶活性。在这样一种测试中,所述的底物是间-α-胰蛋白酶抑制因子重链H4前体。正如下面将要讨论的,业已发现数种激肽释放酶在卵巢癌中存在调节障碍问题(dys-regulated)(在Diamandis2002中有评论)。这样,判断了激肽释放酶的活性就显示了卵巢癌状态。在这种方法中,判断测试试剂是否起到调节激肽释放酶活性的作用的步骤包括测定是否存在IAIH4片段No.1、IAIH4片段No.2及/或IAIH4片段No.3或它们的数量。上述说明测定IAIH4片段的方法可用于该筛选方法中。
IX.筛选分析中用于识别卵巢癌的生物标记
本发明的方法还有其它应用。例如,生物标记可用于筛选可调节体内或体外生物标记的表达的化合物,这使得化合物反过来对治疗或阻止病人体内的卵巢癌是有用的。在另一实施例中,生物标记可用于监测对卵巢癌治疗的反应。在又另一实施例中,生物标记可用于遗传研究以决定是否该受验者有发展成卵巢癌的风险。
因此,例如,本发明的试剂盒可包括含有厌水性能的固体底物,比如蛋白质生物芯片(如塞弗吉蛋白质芯片列阵)以及用于冲洗该底物的缓冲剂,还包括用于测量芯片上本发明的生物标记以及利用这些测量结果来诊断卵巢癌的操作步骤的说明书。
适用于治疗试验的化合物最初可通过确认与至少一种本文所列举的生物标记相互作用的化合物而被筛选出来。例如,筛选过程包括重组地表达本发明的生物标记、提纯该生物标记以及将该生物标记固定于基质上。然后测试用的化合物与基质接触,尤其在水性环境下,测定该测试用的化合物与该生物标记间的相互作用,例如通过测量以盐浓度为性能的洗提率。某些蛋白质可识别并切割至少一种本发明的生物标记,其中可通过在标准分析中监测至少一种生物标记的切片,例如通过蛋白质的凝胶电泳分析方法,来检测该蛋白质。
在有关实施例中,还测定了测试用的化合物能够抑制本发明的至少一种生物标记的能力。本技术领域内的其中一个技艺是确认用于测定特定生物标记作用的技术将依该生物标记的功能与性质变化而变化。例如,分析生物标记的酶促作用,以供找到一适合基质以及该基质和反应物的表相可以很容易就被测量出来。潜在有治疗作用的测试化合物抑制或促进指定生物标记的作用的能力可通过测量存在或不存在该测试化合物下的催化效率而被确定下来。测试化合物干扰非酶促(如结构)机能或本发明的其中一种生物标记的作用的能力亦可被测量出来。例如,可通过存在或不存在测试化合物下分光镜检查来监测自组装多重蛋白质,其中该多重蛋白质是包含本发明的一种生物标记。或者,如果该生物标记是转录非酶增强子,则具干扰该生物标记促进转录能力的测试化合物可通过测量存在或不存在该测试化合物下体内或体外的依赖于生物标记的转录水平而被确定。
将能够调节本发明的任何生物标记的测试化合物投入到患有卵巢癌或其它癌症病人或有发展成为卵巢癌或其它癌症风险的病人体内。例如,如果体内特定生物标记阻止卵巢癌蛋白质的堆积,则投入可提高特定生物标记作用的测试化合物可降低病人体内卵巢癌发病风险。相反,如果具增强作用的生物标记是促发卵巢癌的至少一部分原因,则投入可降低特定生物标记作用的测试化合物可降低病人体内卵巢癌发病风险。
在其它方面的实施例种,本发明提供一种用于确定化合物是否对治疗与经修饰的IAIH4的数量升高有关的诸如卵巢癌这样的紊乱有用的方法。例如,在一实施例中,细胞提取或表达库可被筛选为促进全长IAIH4切割成截断形式的IAIH4的化合物。在这种筛选分析的一实施例中,可通过将荧光基团黏附到IAIH4上来检测IAIH4的切割行为,其中当IAIH4没在切割时,IAIH4是保持熄灭的,而当该蛋白质被切割时,IAIH4则发出荧光。或者可供选择地,全长IAIH4经修饰的以致于使得氨基酸x和y之间的酰胺键不可断裂,这种经修饰的IAIH4可被用于选择性地结合或″捕获″在体内分裂全长IAIH4处的细胞蛋白酶。筛选和确定蛋白酶及其靶向物在科学性文献中已被完整记录成册,如Lopez-Ottin等人编着(Nature Reviews,3:509-519(2002))。
在另一实施例中,本发明提供一种用于治疗或减缓诸如卵巢癌疾病的进展或发病可能性的方法,该方法伴随着截断IAIH4数量的升高。例如,在至少一种分裂全长IAIH4的蛋白质被确定后,组合库可被筛选成为具抑制经确定的蛋白质分裂作用的化合物。用于该些化合物的筛选化学库的方法在本技术领域内已熟知。请参阅例如Lopez-Ottin等人编着(2002)。或者可供选择地,可基于IAIH4的结构智能设计抑制作用的化合物。
全长IAIH4被认为是结合到并抑制血浆舒血管素。(请参考Pu XP等人着,Biochim Biophys Acta1994;1208:338-43;Nishimura H等人着,FEBS Lerr 1995;357:207-11)。以N为端点的IAIH4的截断产物被认为可减少IAIH4的蛋白酶的抑制作用。请参阅,例如,Abrahamson等人着(Biochem.J.273:621-626(1991))。化合物将全长IAIH4的官能团引入至截断IAIH4,因此很可能在治疗过程如卵巢癌的治疗过程中有用处,这与IAIH4的截断形式有关。因此,在进一步的实施例中,本发明提供用于确定可提高截断IAIH4对于其靶向蛋白酶的亲和性的化合物。例如,针对化合物将全长IAIH4的蛋白酶抑制作用引入至截断IAIH4的能力对化合物进行筛选。然后,能够调节IAIH4的抑制作用或与IAIH4相互作用的分子作用的测试化合物可在体内针对化合物在受验者体内缓解或阻止卵巢癌发展的能力进行试验。
在临床水平上讲,筛选测试化合物的步骤包括在受验者被曝露于测试化合物前后,自测试受验者取得样本。可测量并分析本发明的至少一种生物标记的样本的数量,以确定生物标记的数量是否在曝露于测试化合物后有改变。正如此处所述的,该样本可通过质谱分析法进行分析,或者该样本可通过本技术领域内已知的任何适当的方法进行分析。例如,可直接通过使用无线或荧光标识的抗体的西方墨点分析法测量本发明的至少一种生物标记的数量,其中该抗体是特异性结合至该生物标记。可供选择地,可测量编码至少一种生物标记的mRNA的数量变化,并且该变化与指定测试化合物投入至受验者有关。在进一步的实施例中,可用体外方法和材料测量至少一种生物标记的表达的数量变化。已用测试化合物处理的受验者将被例行检查由治疗方法产生的任何生理效果。尤其,该测试化合物被评定其是否降低受验者体内患疾病的可能性。可供选择地,如果该测试化合物被投入至先前被诊断患有卵巢癌的受验者,则该测试化合物被筛选其缓解或阻止疾病发展的能力。
X.产生分类演算及诊断结果的方法
数据组可通过多重分类演算进行分析。一些分类演算提供分散的分类规则;其它分类演算提供某一结果(组群)的可能性评估。在后面的例子中,判定(诊断)结果是基于最高可能性组群做出的。例如,考虑这三组问题:健康组、良性组以及患癌组。假定购建分类演算(如最近邻居分析方法),将其应用于样本A中,且该样本为健康的可能性为0,为良性的可能性为33%,为患癌的可能性为67%。则样本A被诊断为患有癌症。然而,这种方法没有考虑诊断过程中任何″模糊度″问题,即存在该样本为良性的一定可能性。因此,该诊断结果与健康或良性的可能性为0而患癌的可能性为1的样本B相同。
我们提出购建一源自每一组群分配的可能性的指数。该指数以任何计算器可执行的逻辑方法购建;在这一例子,我们创造该三种可能性的单一线性组合,即
I=0*p(参照)+1*p(良性)+2*p(患癌)
成为参照的可能性为1的样本的数值为0,成为良性的可能性为1的样本的数值为1,以及成为患癌的可能性为1的样本的数值为2。因此临床判定结果可基于该指数做出。指数为0的人不会有患癌症的风险,而指数为2的人患有癌症的风险很高。指数处于中间的人患癌风险不定,随着指数升高风险越高。
我们将这一方法应用于一组来自Mayo Clinic的180个样本中。我们基于该五种甲状腺素运输蛋白(transthyretin)形式以及一种载脂蛋白A1(apolipoproteinA1)形式产生最近邻居分类演算,在考虑及不考虑年龄的情况下。当年龄不包括在该模型中时,接下来的图标中指数数值作为组群的功能绘于图中。
数值为0的个体实际上没有患基于这些标记的卵巢癌的风险,而数值为2的个体患卵巢癌的风险最高。
提供以下例子作为举例说明,但并不仅限于此。当提供特定例子时,以上描述是说明性的,而不是限制性的。先前说明的实施例的任何至少一个特征可与本发明中任何其它实施例的至少一个特征以任何方式结合。而且,本发明的一些变动对具本技术的技能者于评论该特定性时,将变得很明显。因此,本发明的范围应该不是根据上述说明来确定的,而是应用根据附加的专利申请范围以及与它们同等的全部范围来确定。
本申请中引用的所有发表文献及专利文件是以完整资料方式引用以供参考,对所有目的皆相同,如同每个独立发表文献或专利文件被单独表示一样。申请人在将各种参考文献引用于该文件中时,申请人并不承认任何特定参考文献是他们发明的″先前技术″。
实施例
材料与方法
样本
蛋白质体图形数据是自503个在葛洛宁恩大学医院(荷兰葛洛宁恩)、杜克大学药学中心(北卡罗莱纳州杜尔汉)、妇女皇家医院(澳大利亚悉尼)以及MD安德生癌症中心(得克萨斯州休斯顿)收集的血清样本获得的。该卵巢癌群组由65位侵入性上皮卵巢癌I/II期病人与88位侵入性上皮卵巢癌III/IV期病人、28位临界肿瘤病人以及14位复发性疾病病人组成。该癌症案例是由病理学家以国际妇产科联(International Federation of Gynecologists andObstetricians,FIGO)标准为依据所做的适当分期。65位侵入性上皮卵巢癌I/II期病人中,20位是浆液性卵巢癌,17位是黏液性卵巢癌,15位是子宫内膜状卵巢癌,8位是透明细胞卵巢癌,1位是癌肉瘤卵巢癌,以及4位是混合上皮卵巢癌。该样本亦包括166位诊断位良性盆腔囊瘤以及142位健康参照物。研究分布的特性与基本描述性统计,包括年龄与CA125数量,列于表1。
所有病人样本是于手术或治疗前收集,且健康志愿者样本是有机构验证收集而来的。该血液样本可以凝结,而血清是即可分离处理。所有样本存放于-70℃,并于分析前立即解冻。所有病人CA125数量可从先前研究中使用CA125II放射性免疫分析法试剂盒(Centocor)而得到。
除503个用于蛋白质体图谱样品外,尚有142个收集自约翰霍普金药学研究所、用于常规临床实验室试验的建档血清样品,作为该经确认的生物标记(免疫分析试验可得到)数量试验用。该些样本中,41个是来自卵巢癌晚期病人以及41个是来自健康妇女。剩余的60个样本由具乳癌、结肠癌及前列腺癌这三组病人中每组20个组成,且用于试验该经确认的生物标记的肿瘤位置特异性(列于表3)。所有样本于收集后2至4小时内处理,然后存放于2至8℃不超过48小时,接着于-70℃下进行冷冻。CA125II分析亦使用二位置免疫酶分析法(two-siteimmunoenzymometric assay)于Tosoh AIA-600II分析仪(Tosoh Medics公司提供)进行。
实施例1:蛋白质表现图谱
血清区分:血清样本于冰上解冻,然后以20000g转速离心10分种以除去沉淀。20ul血清与变性缓冲液(U9∶9M尿素、2%CHAPS、50mMTris pH9.0)混合,并于4℃下振荡20分种。对每一样本,180ul Hyper Q DF阴离子交换树脂于200ul U1缓冲液(U9于50mM Tris pH9.0中稀释成1∶9)中平衡三次。该变性血清加于树脂中,并允许进行30分种结合反应。然后收集未经结合的物质,接着将含有0.1%OGP的100ul 50mM Tris 9.0加至树脂中。收集该洗提液并与该未经结合的物质(流体;区分物1)混合。然后以pH梯度(每一100ul pH7、5、4、3冲提缓冲水溶液以及有机溶剂使用两次)冲提以收集各个区分物。这将得到总共六个区分物。区分是以Biomek2000自动液体收集器(Beckman公司提供)与微型混合振荡器(DPC)进行的。参照混合人类血清的样本(Intergen公司提供)以相同方式处理以监控分析结果。
A.用于蛋白质表达图谱的材料
Beckman Biomek 2000自动化工作站
Q Hyper DF陶瓷阴离子交换树脂(法国Biosepra公司提供)96格v型底微量盘
96格LP尼龙羟基(LoProdyne)薄膜过滤盘(SilentScreen,Nalge Nunc)
平衡缓冲液-50mM Tris-HCl pH9.0
U9-9M尿素,2.0%CHAPS,50mM Tris-HCl pH9.0;Ul-1M尿素,0.22%C HAPS,50mM Tris-HCl pH9.0缓冲液-100mM醋酸钠,0.1%OGP pH4.0;pH3.0缓冲液-50mM柠檬酸钠,0.1%OGP pH3.0;有机缓冲液-33.3%异丙醇/16.67%乙氢/0.5%三氟乙酸(TFA)
B.操作程序
血清变性
以20ul移液管将血清至96格v型底微量盘中.加入30ulU9至每格含有血清中。然后用盘密封膜密封。当树脂进行时,将此盘中血清于4℃振荡至少20分种。
树脂平衡
以三倍于50mM Tris-HCl pH9.0充填体积量清洗树脂五次。此操作可在50ml离心管中进行。通过加入等量体积的50mM Tris-HCl pH9.0至树脂中以制成50/50树脂泥。然后将180ul 50/50树脂泥加至96格过滤盘每格中。规律地(每次加二或三格)振荡含有树脂泥的试管以确保树脂对缓冲液的固定组成比例。然后将该缓冲液过滤后加入200ul U1,接着再过滤一次。以该相同方式再操作两次以上。
样本应用与培养
下一步骤是将血清结合至树脂上。该操作中第一步为以50ul移液管将每一样本移至相对应的过滤盘格中。接着加50ul U1至该样本盘每格中并混合五次。然后自该样本盘每格中吸取50ul至相应的过滤盘格中。于4℃振荡30分种。
下一步骤是收集该区分物。将96格v型底微量盘置于该过滤盘下方。然后收集通过该过滤盘的滤液。接着将100ul清洗缓冲液1加至该过滤盘每格中后,于室温振荡10分种。区分物1含有该流通过与pH9洗脱物。下一步将100ul清洗缓冲液2加至该过滤盘每格中后,于室温振荡10分种。将干净的v型底微量盘置于该过滤盘下方,然后收集区分物2。接着将100ul清洗缓冲液2加至该过滤盘每格中后,于室温振荡10分种。在该96格v型底微量盘收集区分物2的残留物。区分物2含有pH7的洗脱物。将100ul清洗缓冲液3加至该过滤盘每格中后,于室温振荡10分种。将干净的v型底微量盘置于该过滤盘下方,然后收集区分物3。接着将100ul清洗缓冲液3加至该过滤盘每格中后,于室温振荡10分种。在该96格v型底微量盘收集区分物3的残余物。区分物3含有pH5的洗脱物。将干净的v型底微量盘置于该过滤盘下方,然后收集区分物4。接着将100ul清洗缓冲液4加至该过滤盘每格中后,于室温振荡10分种。在该96格v型底微量盘收集区分物4的残余物。区分物4含有pH4的洗脱物。接着将100ul清洗缓冲液5加至该过滤盘每格中后,于室温下振荡10分钟。在该96格v型底微量盘收集区分物5的残留物。区分物5含有pH3的洗脱物。接着将100ul清洗缓冲液6加至该过滤盘每格中后,于室温振荡10分种。将干净的v型底微量盘置于该过滤盘下方,然后收集区分物6。将100ul清洗缓冲液6加至该过滤盘每格中后,于室温下再次振荡10分钟。收集区分物6的残留物。区分物6含有该有机溶剂的洗脱物。
冷冻该些区分物以备芯片结合操作。
列阵结合:将10ul每一区分物与90ul结合缓冲液混合,并分三份结合至IMAC、SAX、H50以及W CX蛋白质芯片列阵(塞弗吉公司提供的Biosystem)上。对于IMAC,结合缓冲液是含有500mM NaCl的100mM pH7.0磷酸钠溶液;对于SAX,结合缓冲液是100mM pH7.0磷酸钠溶液;对于H50,结合缓冲液是50%乙氰水溶液;对于WCX,结合缓冲液是100mM pH4.0醋酸钠溶液。在室温下发生结合反应30分种。然后芯片用结合缓冲液清洗三次,再用蒸馏水清洗两次。使用介质为芥子酸(sinapinic acid)。
数据采集与分析:对于两种SELDI分析方法,所有列阵通过Ciphergen PBS II ProteinChip列阵读取机、时间延滞聚焦、线性、激光解吸/电离飞行时间质谱仪进行读写。所有光谱以正离子模式获得。时间延滞聚焦对于肽的延滞时间为400ns,而对于蛋白质是1900ns。用3kV离子萃取脉冲萃取离子,并以20kV加速电压加速至最终速度。该系统使用重复速率为每秒2至5脉冲变化的脉冲氮激光。典型激光通量变化范围为30-150uJ/mm2。自动化分析操作被用于控制大部分样本分析中数据采集过程。每一光谱平均至少100次激光瞄准,并以已知肽或蛋白质混合物进行外校正。每周都要用胰岛素与免疫球蛋白对仪器进行检查以确保功能的稳定性。每个芯片以两种激光能量(高能与低能)读取。光谱的基线用8倍于适合宽度的设定扣除以得到外校正,然后标准化至总离子流(排除介质区)。
实施例2:统计分析
生物标记的发现:从SELDI光谱中选择M/Z2kD-50kD的质量范围内合格的质量谱峰(S/N>5,群集质量窗口在0.3%)。为了获得更多有关光谱范围内数据变化的连续性,在进一步分析前对谱峰强度进行对数转换。采用单一化最大分离性分析(Unified Maximum SeparabilityAnalysis,UMSA)算法对来自杜克大学药学中心(Can=36,HCn=47)和葛洛宁恩大学医院(Can=20,HCn=30)的早期上皮卵巢癌病人和健康参照物进行分析,该UMSA算法是第一次用于微列阵数据分析,随后用于蛋白质表达数据分析(ProPeak,3Z Informatics)。(请参阅Li J,Clin Chem2002;48:1296-304;Rai AJ,et al.,Zhang Z,et al.,ArchPathol Lab Med2002;126:1518-26;Z.Zhang等人,将分类分离分析方法应用于微列阵数据中(Applyingclassification separability analysis to microarray data);LinSM,Johnson KF编着,微列阵数据分析方法(Methods ofMicroarray data analysis):CAMDA’00报告,波士顿Kluwer学术出版社,2001:125-136;以及Z.Zhang等人,钓鱼探险-从表现图谱概略萃取式样的监督式方法(Fishing Expedition-a Supervised Approach to ExtractPatterns from a Compendium of Expression Profiles;LinSM,Johnson KF编着,微列阵数据分析方法II:CAMDA’01报告,波士顿Kluwer学术出版社,2002)。
为了降低在选择谱峰中出现数据误差或人为现象的可能性,自两处获得的数据采取独立分析的方法。自举法重抽样技术被用于选择对区分早期卵巢癌和健康参照物有显著且连续贡献的谱峰。在每一自举法运行过程中,随机选择固定百分比的癌症及对照组样本进行取代分析。各个谱峰依照它们对UMSA分类器线性解释中的贡献度进行排序。每一谱峰顺序的平均数及标准偏差是以多次(20至40次)运行来估算。选择具高平均数顺序及小标准偏差的谱峰,以形成候选谱峰的短小名单。自两处获得的结果然后进行交叉对比,以决定最后一组具一致性表现式样的谱峰作为一组潜在生物标记。
多变量预测模型:为了建立多变量预测模型,将两处获得的数据进行组合,然后将其随机分成训练组及试验组。首先用试验组对潜在生物标记组的性能及建立的预测模型进行评估,最后用自剩余两处未参与生物标记发现及模型建立过程的独立数据进行验证。用于评估的统计方法包括灵敏度及特异性的估计,以及接收器操作特性曲线(ROC)分析。
实施例3:生物标记的纯化
对于所有标记,先采用用于蛋白质表现图谱化的阴离子交换操作步骤区分血清。对于每一纯化步骤,在NP20或IMAC-铜蛋白质芯片列阵上检测区分物。
28kD标记的纯化:将1ml阴离子交换分离的pH4区分物加至500ul的RPC PolyBio10-15(BioSepra公司提供)中,并于4℃下培养1小时。收集含有乙氰(acetonitrile,CAN)的数量逐渐增加的0.1%三氟乙酸(trifluoroaceticacid,TFA)的区分物。75%乙氰/0.1%三氟乙酸的区分物用真空离心干燥机(speed-vac)干燥,然后于100ul不含二硫苏糖醇(1,4-dithiothreitol,DTT)的SDS-三(羟甲基)甲基甘氨酸(SDS-tricine)上样缓冲液中复水。将40ul样本加至16%三(羟甲基)甲基甘氨酸(tricine)凝胶上,并以100mV电压运行4小时。用胶体蓝试剂盒(Pierce公司提供)将凝胶去色,并将该28kD标记刮取下来。
12.8kDa标记的纯化:将10ml阴离子交换分离的pH4区分物用1M pH11 Tris-HCl溶液调整pH至7.5,然后加至10ml MEP微珠(BioSepra公司提供)上,其中MEP微珠使用前先用20ml pH7.2磷酸盐缓冲液(PBS)清洗三次。于4℃摇晃30分种后得到含有该谱峰的洗提区分物。因为该区分物含有大量白蛋白,因此需进行白蛋白免疫消耗试验(immunodepletion)。蛋白质-A微珠先以含有0.1%triton-100接口活性剂的1.5ml PBS清洗三次,接着以1.5ml PBS清洗三次.然后将4ml抗人类血清白蛋白(anti-human serum albumin,anti-HAS)抗体(ICN公司提供)加至1.5ml蛋白质-A微珠中,并耦合过夜。耦合的微珠以1ml含有0.1%triton-100的PBS清洗三次,然后以1mlPBS清洗三次。接着将经过MEP管柱的洗提流出物加至微珠中,并于4℃培养1小时。以3000rc f转速旋转1分种后得到该洗提流出物。将经过蛋白质-A-抗HAS抗体管柱的洗提区分物加至含有1.5ml RPC PolyBio10-15树脂(Bio Sepra公司提供)的旋转柱中,其中RPC PolyBio10-15树脂是先用1.5ml0.1%TFA清洗四次。于4℃下摇晃培养40分种后,以3000rcf转速旋转移除该洗提区分物,并以0.8ml0.1%TFA清洗该微珠。收集含有乙氰数量逐渐增加的0.1%TFA的区分物。75%乙氰/0.1%TFA的区分物用真空离心干燥机干燥,然后于100ul不含DTT的SDS-tricine上样缓冲液中复水。将40ul样本加至16%tricine凝胶上,并以100mV电压运行4小时。用胶体蓝试剂盒(Pierce公司提供)将凝胶去色,并将该12.8kDa标记刮取下来。
3272D生物标记的纯化:将1ml阴离子交换分离的洗提区分物加至125ul(250ul 50%泥状物)与硫酸铜耦合的IMAC纤维素(Biosepra公司提供)中,并于4℃下培养1小时。然后微珠用梯度逐步增加的咪唑(imidazole)(含有500mM NaCl的100mM pH7 NaPO4溶液中,溶有250ul的20mM、50mM、100mM、150mM及200mM咪唑)方式清洗。将200ul含有生物标记(50至150mM咪唑)的区分物加至C18管柱上(ANSYS技术公司提供,Metachempolaris C18-A5U),并以1ml/min流速的0.1%TFA冲洗5分种,接着以1ml/min流速的0%至9%乙氰(ACN)梯度0.1%TFA溶液清洗10分种。然后以1ml/min流速的9%CAN至45% CAN线性梯度0.1%TFA溶液清洗30分种。收集1ml等分试样以及于第38个区分物(该区分物的CAN浓度为34.2%)中清洗的标记。
实施例4:生物标记的确认
已纯化的蛋白质用胰蛋白酶切片,然后胰蛋白酶解片段用蛋白质芯片读取机分析。每一光谱范围是至少250个激光瞄射点的平均,并用已知肽混合物做外校正,或用胰蛋白酶自溶及基质谱峰做内校正。谱峰质量是符合ProFound检索的肽拼图位置(在线提供)。蛋白质序列是使用美国国立生物技术信息中心(National Center forBiotechnology Information,NCBI)数据库进行修补。这些数据库匹配度的确认是使用配备蛋白质芯片列阵接口(Ciphergen公司提供)的PESciex QStar(加拿大Concord公司提供)进行的。对于MS/MS实验,光谱范围是从配备塞弗吉PCI1000蛋白质芯片列阵接口的Sciex Qstar(加拿大Concord公司提供)串联四极杆-飞行时间质谱仪获得。离子是使用脉冲氮激光(Laser Science VSL 337NDS,Franklin,MA,USA)以每秒30个脉冲(传递平均130uJ/mm2脉冲通量)产生的。压力为10mtorr的氮气用于已形成离子的碰撞冷却,以及所有低能碰撞引发解离(collision-induced dissociation,CID)试验。通常应用的碰撞能遵循50eV/kD规则。对于MS及MS/MS模式,系统使用已知肽混合物进行外校正.通过加州大学旧金山分校(University of California,San Francisco,UCSF)ProteinProspector MS-Tag程序(在线提供;请参阅ClauserK.R.et al.(1999)Anal.l Chem.71:2871)来进行蛋白质的确认。用下列数值来执行MS-Tag数据库搜索:智人(Homosapiens)、胰蛋白酶切片(允许两个切割被遗漏)、经以胺甲硫胺基甲基化(carbamidomethylation)经修饰的的半胱胺酸、母峰及片段离子质量容许量50ppm以及NCBI或Swiss-Prot数据库。
这些确认是通过EIA或使用基于免疫分析发的蛋白质芯片列阵进行的。
虽然这些蛋白质通常已被表征为急性期反应物,但在用免疫分析法做初步研究时,应当注意的是,载脂蛋白A 1(apolipoproteinA1)的数量于乳癌或结肠癌中为被发现有改变,且前白蛋白的数量于乳癌或前列腺癌病人中亦未被发现有改变。
甲状腺素运输蛋白是阴性急性期蛋白质,先前已有报导说,在上皮卵巢癌病人中,其数量会降低。(请参阅Mahlck CG,et al.,Gynecol Obstet Invest,1994;37:135-40)。甲状腺素运输蛋白是血清甲状腺素及三碘甲状腺素主要载体,并通过与视黄醇结合蛋白质间的相互作用来帮助运送视黄醇。缺乏甲状腺素运输蛋白表达的转基因鼠,其视黄醇和视黄醇结合蛋白质的数量非常低(请参阅van Bennekum AM,et al.,J.Biol Chem2001;276:1107-13),且数量降低的视黄醇结合蛋白质以及细胞视黄醇结合蛋白质已显示与卵巢上皮细胞恶性转形的速率增加有关(请参阅van Bennekum AM,et al.,J.BiolChem2001;276:1107-13;Roberts D,et al.,DNA Cell Biol2002;21:11-9)。此外,有报导说,通过寡核甘酸列阵分析,细胞视黄醇结合蛋白质的数量在卵巢癌中有改变。
产生m/z3272生物标记的IAIH4的羧基部分已显示是血浆舒血管素的基质。(请参阅Pu XP,et al.,BiochimBiophys Acta1994;1208:338-43;Nishimura H,et al.,FEBS Lett1995;357:207-11)。舒血管素蛋白酶包括血浆舒血管素及组织舒血管素,具有重叠基质特异性。(请参阅Diamandis EP,et al.,Clin Chem2002;48:1198-205)。组织舒血管素是属于庞大的复基因族(multigene family),该复基因族还包括前列腺特异性抗原(PSA;hK3),其是为前列腺癌的肿瘤标记。在卵巢癌中已发现数种组织舒血管素有不正常调节现象,其包括hK4、hK5、hK7、hK8及hK9(请参阅Yousef GM,et al.,Minerva Endocrinol 2002;27:157-66)。
甲状腺素运输蛋白△N10及IAIH4片段是成熟蛋白质的截断产物。这些标记是由至少一种蛋白酶切割而成的产物,该蛋白酶包括血浆舒血管素、组织舒血管素、金属蛋白酶基质或prostatin(一种似胰蛋白酶的丝胺酸(serine)蛋白酶,近期有报导说其在卵巢癌病例中会增加)。(请参阅Mok SC,et al.,J Natl Cancer Inst 2001;93:1458-64)。产生这些标记的蛋白酶亦可作为可与标记1至4组合以俾于对预测模型赋予更高灵敏度及特异性的标记使用。
实施例5:个别生物标记的识别能力
在发现组中,早期卵巢癌病人与健康参照物之间,三种生物标记的表达水平经统计计算发现存在显著差异(对m/z12828及m/z 28043标记,P<0.000001;对m/z3272标记,P<0.003,对m/z 303标记,P<0.04,以及对m/z 2884标记,P<0.005)(请见表1)。
第2图(窗格A-D)是通过对来自早期卵巢癌和健康参照物的数据,采用接受器操作特性(ROC)曲线分析的三种个别生物标记与CA125的区分能力进行比较。对于窗格A-D各代表1:CA125,2:m/z 12.8kD,3:m/z 28kD,4:m/z 3272D。CA125与m/z 12828于发现组及验证组二者中表现相当,而其它两种标记于一组或两组数据组中,比CA125有较小曲线下面积(area-under-curve,AUC)。然而,该三种生物标记和CA125中,经估算的相关性低(数据未显示),表示它们有彼此互补的可能性,并且多变量分析法可能优于CA125的单一分析方法。
由于健康参照物中的样本有27%是来自年龄至少在50岁的妇女,相比之下,早期卵巢癌组群(P<0.000001)的样本则有61%是来自年龄至少在50岁的妇女,因此值得关心的是,这些标记可能反应了与年龄有关的变化。然而,经确认的生物标记在两组年龄组群间无显著差异,或者,与CA125的数量相比,这些生物标记的数量存在差异(请见表1)。先前基于人口的研究已显示,载脂蛋白A1的数量实际上随着年龄增长略微增加(请参阅Jungner,etal.,Clin Chem 1998;44:1641-9;Bachorik PS,et al.,ClinChem1997;43:2364-78)。
实施例6:多变量预测模型
用非线性UMSA分类器建立两个多变量预测模型。第一个模型仅用该三个生物标记作为它的输入,第二个模型用该三个生物标记随同CA125一起。第2图中的窗格E-H是采用ROC分析法将该两个模型的所有诊断结果与CA125的诊断结果进行比较。对于窗格E-H各代表○:CA125,□:使用该三种生物标记的多变量模型,△:使用该三种生物标记与CA125的多变量模型。在训练数据组中,截止值为0.5使得灵敏度与特异性的总和接近最大化。以该截止值,将模型应用于试验组数据及独立验证组数据(请见表2)。对于独立验证组中健康参照物和I/II期侵入性卵巢癌之间的区别,使用该三种生物标记和CA125的多变量模型在灵敏度为82.6%(95%置信区间(CI)61.2至95.1%)时,其特异性为93.7%(84.5-98.2%)。相比之下,CA125在截止值为11U/mL其灵敏度相同(82.6%),而其特异性却只有52.4%(39.4-65.1%)。表2还包括独立验证组中,良性状态、晚期侵入性癌症或边缘肿瘤的病人的结果。
第3图绘制了CA125、该三种生物标记的分布图案,以及该两种模型对所有诊断组群中的样本的输出结果。Y轴是对所有三种生物标记以线性刻度表示的相对强度;对CA125以对数比例表示的血清数量;对两种模型,0(最低患癌风险)与1(最高患癌风险)间的连续数值。样本组群包括:A)健康参照物,B)良性,C)I/II期侵入性癌,D)HI/IV期侵入性癌,E)复发者,F)I/II期边缘肿瘤。生物标记发现组中两个IIIc侵入性病例和独立验证组中三个III/IV期边缘肿瘤未绘制出来。
应注意的是,除m/z 3272外,其它两种生物标记和两种预测模型具有良性病例中检测I/II期侵入性癌的适度能力(对m/z12828及28043,P分别为0.004及0.001;对无CA125及有CA125的模型,P分别为0.003及0.0001)。
实施例7:用免疫分析法独立验证
以微滴定盘格式(美国Wako Chemical公司提供)使用浊度免疫分析法(turbidimetric immunoassay)对142个已归档的样品进行载脂蛋白A1分析,对于甲状腺素运输蛋白△N10的分析是在Dimension RxL仪器(Dade-Behring公司提供)上使用颗粒强化浊度免疫分析法进行(请见表3)。
与41位健康参照物比较,在41位晚期卵巢癌病人中,CA125的血清数量上调,而载脂蛋白A1与甲状腺素运输蛋白△N10的数量下调(P分别为0.001895、0.000151、0.000006)。健康参照物的平均血清载脂蛋白A1的数量,与乳癌或结肠直肠癌病人的平均血清载脂蛋白A1的数量相比,无显著差异(P分别为0.844163、0.330148),与前列腺癌病人相比只有略微差异(P为0.043676)。结肠直肠癌病人(P为0.006889)中,平均血清甲状腺素运输蛋白△N10的数量下调程度比卵巢癌病人小。健康参照物与乳癌或前列腺癌病人中,平均血清甲状腺素运输蛋白△N10的数量无显著差异(P分别为0.928519、0.546918)。
实施例8:分类演算
于第4图中以图标方式叙述了分类演算,模块1至3是以UMSA学习算法训练。然而,最后的分类器模块具有如一般支持向量机(support vector machine,SVM)分类器一样的数学形式。
UMSA分类器模块1:
CA125nm=log(CA125+0.01)
m/z 12.9Knm=(m/z 12828-61.103)/239.031
m/z28Knm=(m/z28043-61.3043)/238.9799
m/z3272nm=log(m/z3272+0.01)
log():自然对数
核心函数:多项式<X(:,i),X(:,j)>)^3.0支持向量及系数:
CA125nm |
m/z12.9Knm |
m/z28Knm |
m/z3272nm |
y |
alpha |
2.83966 |
-0.25465 |
-0.25597 |
-1.34323 |
1 |
0.00409 |
3.05918 |
-0.25416 |
-0.25435 |
-1.68740 |
-1 |
0.03389 |
2.39880 |
-0.25428 |
-0.25529 |
0.42657 |
1 |
0.05926 |
3.61658 |
-0.25450 |
-0.25578 |
-1.51413 |
1 |
0.22118 |
3.23120 |
-0.25417 |
-0.25493 |
-1.20065 |
-1 |
0.29988 |
UMSA分类器模块2:
CA125nm=log(CA125+0.01)
m/z 12.9Knm=(m/z 12828-0.345)/0.1114
m/z28Knm=(m/z28043-0.4834)/0.2792
m/z 3272nm=log(m/z 3272+0.01)
log():自然对数
核心函数:exp(-|X(:,i)-X(:,j)|^2/(2*(1.0)^2))支持向量及系数:
标准化标记值 |
CA125nm |
m/z12.9Knm |
m/z28Knm |
m/z3272nm |
y |
alpha |
2.3618 |
0.1795 |
-0.3990 |
0.8717 |
1 |
0.0151 |
2.5734 |
0.4758 |
1.2307 |
-1.0328 |
-1 |
0.0582 |
1.6114 |
-1.1939 |
0.1311 |
-1.3318 |
-1 |
0.2112 |
2.1175 |
0.1975 |
-0.6103 |
-1.2588 |
-1 |
0.2705 |
3.5178 |
-0.6014 |
-1.3195 |
1.4120 |
1 |
0.2797 |
3.8525 |
-1.2926 |
-0.9327 |
-0.2890 |
1 |
0.3556 |
2.9658 |
-0.6014 |
0.2958 |
1.7483 |
1 |
0.3573 |
2.0028 |
-0.1167 |
1.4885 |
-1.7603 |
-1 |
0.4172 |
4.1061 |
-0.4668 |
1.0766 |
1.1743 |
1 |
0.4281 |
4.1776 |
-1.1400 |
-0.6927 |
1.3463 |
1 |
0.4927 |
1.5497 |
0.3142 |
1.6390 |
-0.6714 |
-1 |
0.6698 |
1.48396 |
-0.8707 |
-0.1519 |
-0.9113 |
-1 |
0.6860 |
3.9062 |
0.0987 |
1.9542 |
1.8925 |
1 |
0.7588 |
2.3988 |
-0.1975 |
-0.6748 |
0.4266 |
1 |
1.1697 |
3.6166 |
-0.6732 |
-1.0974 |
-1.5141 |
1 |
1.8394 |
3.2312 |
0.0269 |
-0.3703 |
-1.2006 |
-1 |
1.8394 |
UMSA分类器模块3:
核心函数:多项式<X(:,i),X(:,j)>)^2.0
X1=exp(模块1输出)/(1+exp(模块1输出))
X2=模块2输出
支持向量及系数:
X1 |
X2 |
y |
alpha |
0.72862 |
0.41333 |
1 |
0.830900 |
0.99835 |
0.25941 |
1 |
1.641283 |
0.39802 |
0.57799 |
1 |
1.839397 |
0.96185 |
0.23167 |
1 |
1.839397 |
0.58865 |
0.18582 |
-1 |
1.839397 |
0.96194 |
0.21066 |
1 |
1.839397 |
0.55377 |
0.10709 |
-1 |
1.839397 |
0.78444 |
0.05422 |
-1 |
1.839397 |
0.95604 |
-0.01117 |
-1 |
1.839397 |
0.48706 |
0.28531 |
-1 |
2.343210 |
后处理:
其它
模块输出=exp(Y/2)/(1+exp(Y/2))
本发明详细说明了包括优选实施例在内的描述。然而,任何熟知此项技艺的人士可运用本发明的揭示下,对本发明进行修饰及/或改进,其仍涵盖于如下列所提申请专利范围的本发明范畴及精深内。
本申请中所引用的所有出版发表物及专利文件,对所有目的适用范围均相同,是以完整参考资料方式引用,如同单独地代表每一个单独的出版发表物及专利文件一样。引用本文件中各种参考资料时,申请人并不承认任何特定的参考资料是对他们发明的″先前技术″。
实施例9:用于早期卵巢癌的标记的确认及与治疗方法的关联
病人:该研究包括25位忠良性卵巢癌的妇女、53位患早期(I,IIa期)卵巢癌的妇女、116位患晚期卵巢癌的妇女以及73位健康参照物,这些均取自位于葛洛宁恩和鲁文的两家医院。该些样本的组织学下一级类型包括:95位是浆液性卵巢癌,29位是黏液性卵巢癌,16位是子宫内膜状卵巢癌,11位是透明细胞卵巢癌,17位是癌肉瘤卵巢癌,以及1位是混合上皮卵巢癌。没有患边缘肿瘤的病人。患早期癌症的妇女平均年龄在51.8岁,晚期癌是58.8,良性癌是47岁,以及健康参照物是58岁。
色谱ProteinChip列阵:用7.5ul9M尿素/2%CHAPS/50mM TrisHCl混合溶液变性5ul血清。经变性的血清在生物芯片结合缓冲液(对于IMAC30列阵:50mM磷酸钠溶液,250mM NaCl溶液,pH6.0;对于Q10列阵:10mM磷酸钠缓冲液,pH7.0)中稀释。经稀释的血清在IMAC30列阵或Q10蛋白质芯片列阵上培养两个小时。先用结合缓冲液、然后用水清洗该些列阵,然后简单地置于空气中干燥。加入芥子酸,在4000系列蛋白质读取器中读取该些列阵。
数据分析:对质量外校正质谱,利用总离子流对强度进行内部标准化,基线扣除。手动选择谱峰并记录峰强度。用t-试验以及支持向量机(support vector machine)分析数据。
第9图描述了具代表性的于Q10蛋白质芯片列阵上甲状腺素运输蛋白试验的谱图。需注意的是,解析出五种形式的甲状腺素运输蛋白:未经经修饰的的、经磺化的、经半胱氨酰化的、经CysGly经修饰的的、经谷胱甘肽化的。除此之外,还可发现截断形式的甲状腺素运输蛋白(△N10);以比经半胱氨酰化的甲状腺素运输蛋白还要低的水平(~2%)出现。
该试验可通过使用蛋白质标准进行绝对量化以用于校正。第10图显示了,对不同形式的甲状腺素运输蛋白的水平,相应的线性谱峰强度。
从表4可以看出,甲状腺素运输蛋白与载脂蛋白A1的水平在卵巢癌病人中下降。两组t-试验表明,五种形式甲状腺素运输蛋白与载脂蛋白A1的水平在患有早期或晚期卵巢癌病人中均会下降。需注意的是,该些甲状腺素运输蛋白形式的水平在晚期病人中下降更加明显。
从表5可以看出,术后,甲状腺素运输蛋白与载脂蛋白A1的水平上升。盒须图(box-and-whiskerplots)表明,甲状腺素运输蛋白与载脂蛋白A1的水平于术后均回复到参照物水平。成对t-试验结果表明,该效应于统计上是有重要意义的。一些形式的甲状腺素运输蛋白表现出比其它形式更大的响应。
正如第11图中所示,各形式甲状腺素运输蛋白与载脂蛋白A1的组合会随着手术的进行而改变。支持向量机(support vector machine)的运算是基于五种形式甲状腺素运输蛋白与载脂蛋白A1建立的,被用于在术前和术后对于每个病人产生出一指数。术前水平与术后水平间比较得到的一组指数图揭示了,对于大多数病人,术后该指数会提高。在31/42(73.8%)早期卵巢癌病人中,该指数提高。正如第12图所示,该指数可用于监测病人情况,是该指数在治疗过程中如何变化的一举例。对于这个病人,该指数在术前很低,而在术后升高。直到1996年10月,水平一直保持很高。表明该病人在此时疾病状况好转。
实施例10:于一案例对照研究中标记的验证
病人:该研究包括45位患有上皮卵巢癌病人的妇女,71位良性卵巢癌病人,122位患有消化疾病的妇女。我们排除了一例儿科良性损害以及多于一次融解和冻结的样本。用于参照物的样本储存时间比案例以及良性疾病样本的储存时间长(即用于参照物的储存时间为21年,而用于案例及良性的储存时间为17年)。为使于发现谱峰中产生的偏差(与储存时间有关)最小化,我们限制了对于在1983-1989年期间收集的样本的标记数据的主要分析。这里表示的数据因此是基于42个卵巢癌病例,65位忠良性疾病的妇女,以及76个参照物。
色谱ProteinChip列阵:用7.5ul 9M尿素/2%CHAPS/50mM TrisHCl混合溶液变性5ul血清。经变性的血清在生物芯片结合缓冲液(对于IMAC30列阵:50mM磷酸钠溶液,250mM NaCl溶液,pH6.0;对于Q10列阵:10mM磷酸钠缓冲液,pH7.0)中稀释。经稀释的血清在IMAC30列阵或Q10蛋白质芯片列阵上培养两个小时。先用结合缓冲液、然后用水清洗该些列阵,然后简单地置于空气中干燥。加入芥子酸,在4000系列蛋白质读取器中读取该些列阵。
数据分析:对质量外校正质谱,利用总离子流对强度进行内部标准化,基线扣除。手动选择谱峰并记录峰强度。用费舍精确试验(Fisher exact tests)比较人口统计特性。用t-试验评估两组间峰高的区别。用线性和二次判别分析方法以及最近邻居分析方法建立分类器。用交叉验证程序评估分类中产生的误差率。
第13图,是表示在Q10 ProteinChip Array上各形式的甲状腺素运输蛋白和载脂蛋白A1产生的峰强度的散点图。对于各种形式的甲状腺素运输蛋白的两组t-试验值如下所示:未经经修饰的的,0.0076;经磺化的,0.0052;经半胱氨酰化的,0.0104;经CysGly经修饰的的,0.0026;经谷胱甘肽化的,0.0047。对于载脂蛋白A1的两组t-试验值为0.0009。
第14图,是表示采用最近邻居分析方法得到的指数数值。该模型包括六种形式的甲状腺素运输蛋白和载脂蛋白A1产生的峰强度,无论是包括年龄因素还是不包括年龄因素。使用的最近邻居分析方法是用于计算每种样本是为参照物、良性肿瘤或癌症的后事概率。计算公式为:p(良性肿瘤/生物标记)+2*p(癌症/生物标记)。0分表示该样本归为参照物,2分表示该样本归为癌症,中间分数中越接近2分,越有可能是癌症。