CN104364393A

CN104364393A - 用于诊断和治疗广泛性发育障碍的组合物和方法

Info

Publication number: CN104364393A
Application number: CN201380022420.3A
Authority: CN
Inventors: N·R·纳莱恩; P·P·纳莱恩
Original assignee: Berg Pharma LLC
Current assignee: Berg Pharma LLC
Priority date: 2012-03-05
Filing date: 2013-03-05
Publication date: 2015-02-18
Also published as: US20220137070A1; EP2823063A1; CA2866407A1; KR20140140069A; JP2015517801A; JP2020193986A; US20150023949A1; US20190242909A1; AU2013230045A1; US20180275146A1; JP2018153184A; WO2013134315A1; EP2823063A4; HK1206393A1

Abstract

描述了治疗和诊断人类广泛性发育障碍的方法。

Description

用于诊断和治疗广泛性发育障碍的组合物和方法

相关申请的相互参引

本申请要求2012年3月5日提交的序列号为No.61/606935、名称为“用于诊断和治疗广泛性发育障碍的组合物和方法”的美国临时申请的优先权，其全部内容通过引证纳入本文。

序列表

本申请包含已通过EFC-Web以ASCII形式提交的序列表，该序列表全文引证在本文中。所述ASCII复制件产生于2013年2月28日，名称为119992-05920_SL.txt，大小为1,144,066字节。

背景技术

广泛性发育障碍是一种重要的公众健康问题。尤其是自闭症谱系障碍，例如自闭症和艾斯伯格症候群，它们是始于童年早期的令人虚弱的流行病，需要有效的治疗。该障碍具有未被理解的复杂病因。

自闭症谱系障碍是高度遗传的，但环境因素也起到了重要的作用。同卵双胞胎的同病率约为90％，异卵双胞胎约10％。与自闭症谱系障碍相关的具体基因已被确定；然而，自闭症谱系障碍仅有约10-15％与已知的遗传易感性有关(Levy,S.E.等人，Lancet 374(9701):1627-1638(2010)，在下文中称作Levy等人)。此外，这些遗传易感性中没有一个在广泛性发育障碍的发展中是特异的。

在自闭症谱系障碍中已观察到各种神经生物学异常。这些疾病的特点是大头畸形；皮质白质增生和额叶、颞叶和边缘结构(如杏仁核)的异常生长形式；以及皮质微柱(Cortical minicolumn)和小脑的细胞结构异常。最近的研究结果表明，自闭症患者的大脑表现出参与细胞凋亡和正常层叠及维护大脑突触可塑性的该蛋白的失调。

现有技术中存在对治疗、预防、减少、诊断和预测广泛性发育障碍的方法的需要。

发明内容

本发明是基于，至少部分地基于以下发现：与正常的对比细胞，例如来自未患有自闭症或阿尔茨海默病的受试者的细胞(例如来自受试者的未患自闭症或阿尔茨海默病的兄弟姐妹或双亲的细胞)相比，在表2-6中列出的蛋白质在获自患有自闭症或阿尔茨海默病受试者的细胞中被调节，例如，上调或下调。因此，本发明提供了用于治疗、缓解症状、抑制进展、预防、诊断、或预测具有在表2-6中列出的一个或多个蛋白质的受试者的广泛性发育障碍的方法。

具体而言，本发明的一个方面提供评估个体是否患有广泛性发育障碍的方法，该方法包括：(1)确定表2-6中所列的一种或多种标志物在从受试者获得的生物学样品中的表达水平，其中使用试剂转化该标志物以使该标志物可检测；(2)将从受试者获得的生物学样品中所述一种或多种标志物的表达水平与对照样品中所述一种或多种标志物的表达水平进行比较；和(3)评估受试者是否患有广泛性发育障碍，其中，在从受试者获得的生物学样品中所述一种或多种标志物的表达水平相对于对照样品中所述一种或多种标志物的表达水平的调节是所述受试者患有广泛性发育障碍的指示。

在另一个方面，发明提供了预测受试者是否倾向于发展出广泛性发育障碍的方法，该方法包括：(1)确定表2-6中所列的一种或多种标志物在从受试者获得的生物学样品中的表达水平，其中使用试剂转化该标志物以使该标志物可检测；(2)将从受试者获得的生物学样品中所述一种或多种标志物的表达水平与对照样品中所述一种或多种标志物的表达水平进行比较；和(3)预测受试者是否倾向于发展出广泛性发育障碍，其中，在从受试者获得的生物学样品中所述一种或多种标志物的表达水平相对于对照样品中所述一种或多种标志物的表达水平的调节是所述受试者倾向于发展出广泛性发育障碍的指示。

在另一个方面，本发明提供了预测受试者广泛性发育障碍的严重程度的方法，该方法包括：(1)确定表2-6中所列的一种或多种标志物在从受试者获得的生物学样品中的表达水平，其中使用试剂转化该标志物以使该标志物可检测；(2)将从受试者获得的生物学样品中所述一种或多种标志物的表达水平与对照样品中所述一种或多种标志物的表达水平进行比较；和(3)评估受试者的广泛性发育障碍的严重程度，其中，在从受试者获得的生物学样品中所述一种或多种标志物的表达水平相对于对照样品中所述一种或多种标志物的表达水平的调节是所述受试者的广泛性发育障碍严重程度的指示。

在一些实施方式中，所述一种或多种标志物在受试者中的表达水平远离对照样品中表达水平的调节，例如至少2倍、3倍、4倍、5倍、10倍、15倍、10倍、30倍、40倍、50倍、100倍或更高，为受试者中广泛性发育障碍严重的指示。在一些实施方案中，受试者样品中一种或多种标志物的表达水平比患有不严重的广泛性发育障碍的受试者中的表达水平相对于对照样品中表达水平的调节更远是受试者广泛性发育障碍严重的指示。

在一些实施方式中，所述一种或多种标志物在受试者中的表达水平朝向在对照样品中表达水平的调节，例如至少2倍、3倍、4倍、5倍、10倍、15倍、10倍、30倍、40倍、50倍、100倍或更高，为受试者中广泛性发育障碍不严重的指示。在一些实施方案中，受试者样品中一种或多种标志物的表达水平比患有严重的广泛性发育障碍的受试者中的表达水平与对照样品中表达水平的调节更接近是受试者广泛性发育障碍不严重的指示。

在另一个方面，本发明提供了监测受试者中广泛性发育障碍或广泛性发育障碍症状的进展的方法，该方法包括：(1)确定第一次从受试者获得的第一生物学样品中存在的表2-6中所列的一种或多种标志物的表达水平，其中使用试剂转化该标志物以使该标志物可检测；(2)确定晚些时候第二次从受试者获得的第二生物学样品中存在的表2-6中所列的一种或多种标志物的表达水平，其中使用试剂转化该标志物以使该标志物可检测；(3)将表2－6中列出的一种或多种标志物在第一次获自受试者的第一生物学样品中的表达水平与所述一种或多种标志物在晚些时候第二次获自受试者的第二生物学样品中的表达水平进行比较；以及(4)监测广泛性发育障碍的进展，其中所述一种或多种标志物在第二样品中相比于在第一样品中的表达水平的调节是受试者广泛性发育障碍或广泛性发育障碍症状的进展的指示。

在一个实施方案中，第二样品中的表达水平远离对照样品中的表达水平的调节，例如比第一次的第一样品更加远离正常的或对照表达水平，是受试者广泛性发育障碍或广泛性发育障碍症状的进展的指示。

在一个实施方案中，第二样品相比于第一样品没有表达水平的调节(例如在第一和第二样品中的表达水平近似相同)是受试者广泛性发育障碍或广泛性发育障碍症状的没有进展的指示。在一个实施方案中，第二样品中的表达水平比第一次的第一样品中的表达水平朝向对照样品中表达水平的调节，例如，更接近于正常的或对照的表达水平，是受试者广泛性发育障碍或广泛性发育障碍症状没有进展的指示。

在一个实施方案中，所述方法还包括为被确认患有广泛性发育障碍或倾向于发展出广泛性发育障碍的受试者选择治疗方案。

在一个实施方案中，该方法还包括向被确认患有广泛性发育障碍或倾向于发展出广泛性发育障碍的受试者给药治疗方案。

在一个实施方案中，该方法还包括向其广泛性发育障碍的进展已被确认为减少、延迟或减轻的受试者继续给药持续的治疗方案。

在另一方面，本发明提供一种评估用于治疗受试者的广泛性发育障碍或广泛性发育障碍的症状的治疗方案的效果的方法，该方法包括：

(1)在向受试者给药至少一部分治疗方案之前，确定表2-6中所列的一种或多种标志物在从受试者获得的第一生物学样品中存在的表达水平，其中使用转化标志物的试剂以使所述标志物可被检测；

(2)在向受试者给药至少一部分治疗方案之后，确定表2-6中所列的一种或多种标志物存在于获自所述受试者的第二生物学样品的表达水平，其中使用试剂转化标志物以使该标志物可被检测；

(3)比较向受试者给药至少一部分治疗方案之前，表2-6中所列的一种或多种标志物存在于获自该受试者的第一样品中的表达水平与向受试者给药至少一部分治疗方案之后，表2-6中所列的一种或多种标志物存在于获自所述受试者的第二生物学样品的表达水平；以及

(4)评估治疗方案对于治疗广泛性发育障碍或广泛性发育障碍的症状是否有效，其中一种或多种标志物在第二样品中的表达水平较之于在第一样品中的表达水平的调节是治疗方案对于治疗广泛性发育障碍或广泛性发育障碍的症状是否有效的指示。

在一个实施方案中，该方法还包括向下述受试者连续给药治疗方案，对于该受试者所述给药方案被确定为对于治疗广泛性发育障碍或广泛性发育障碍的症状是有效的，或者中止对下述受试者的给药方案，对于该受试者所述给药方案被确定为对于治疗广泛性发育障碍或广泛性发育障碍的症状是无效的。

在另一个方面，本发明提供了一种鉴定用于治疗受试者的广泛性发育障碍或广泛性发育障碍的症状的化合物的方法，该方法包括：

(1)将生物学样品与测试化合物接触；

(2)确定表2-6中所列的一种或多种生物标志物存在于该生物学样品中的表达水平；

(3)将所述一种或多种标志物在该生物学样品中的表达水平与未接触测试化合物的对照样品中的表达水平比较；以及

(4)选择调节该一种或多种生物标志物在生物学样品中的表达水平的测试化合物，

由此鉴定用于治疗受试者广泛性发育障碍或广泛性发育障碍的症状的化合物。

在一个实施方案中，该广泛性发育障碍是自闭症谱系障碍。

在一个实施方案中，该广泛性发育障碍是孤独症(austic disorder)。

在一个实施方案中，该广泛性发育障碍是阿尔茨海默病。

在一个实施方案中，该广泛性发育障碍是自闭症和阿尔茨海默病。在一个实施方案中，该广泛性发育障碍是自闭症和阿尔茨海默病，且所述标志物是一种或多种如表3中列出的标志物。

在一个实施方案中，该广泛性发育障碍是艾斯伯格症候群。

在一个实施方案中，该广泛性发育障碍是广泛发育障碍非其他特定型。

在一个实施方案中，受试者患有广泛性发育障碍。

在一个实施方案中，受试者显示出广泛性发育障碍的亚综合表现(subsyndromal manifestation)。

在一个实施方案中，受试者疑似患有或倾向于发展出广泛性发育障碍。

在一个实施方案中，处理获自受试者的样品，以使得该样品转化，从而能够确定表2-6中所列的一种或多种标志物的表达水平。

在一个实施方案中，一种或多种标志物的表达水平在核酸水平上测定。

在一个实施方案中，一种或多种标志物的表达水平通过检测RNA确定。在一个实施方案中，一种或多种标志物的表达水平通过检测mRNA、miRNA或hnRNA确定。在一个实施方案中，一种或多种标志物的表达水平通过检测DNA确定。在一个实施方案中，一种或多种标志物的表达水平通过检测cDNA确定。

在一个实施方案中，一种或多种标志物的表达水平通过使用选自聚合酶链式反应(PCR)扩增反应、反转录PCR分析、定量反转录PCR分析、免疫印迹分析、RNA酶保护实验、数字RNA检测/定量，以及其组合或亚组合的技术确定。

在一个实施方案中，确定一种或多种标志物的表达水平包括采用抗体实施免疫测定。

在一个实施方案中，该一种或多种标志物包括蛋白质。

在一个实施方案中，该蛋白质使用结合所述一种或多种标志物中的至少一种的结合蛋白来测定。

在一个实施方案中，所述结合蛋白包括特异性结合至该蛋白的抗体或其抗原结合片段。

在一个实施方案中，所述抗体或其抗原结合片段选自鼠抗体、人抗体、人源化抗体、双特异性抗体、嵌合抗体、Fab、Fab’、F(ab’)₂、scFv、SMIP、亲和小体(affibody)、avimer、versabody、纳体(nanobody)、域抗体、以及上述任一种的抗原结合片段。

在一个实施方案中，所述结合蛋白包括多特异性结合蛋白。

在一个实施方案中，所述多特异性结合蛋白包括双重可变结构域免疫球蛋白(DVD-IgTM)分子，半体DVD-Ig(HDVD-Ig)分子，三重可变结构域免疫球蛋白(TVD-IgtDVD-Ig)分子，以及受体可变域免疫球蛋白(rDVD-Ig)分子。在一个实例中，多特异性结合蛋白(例如，多价的DVD-Ig(PDVD-Ig)分子)，单体的DVD-Ig(MDVD-Ig)分子，交叉(coDVD-Ig)的分子，血脑屏障(bbbDVD-Ig)分子，可裂解的连接体DVD-Ig(clDVD-Ig)分子或重定向的细胞毒性DVD-Ig(rcDVD-Ig)分子。

在一个实施方案中，所述抗体或其抗原结合片段包含标记物。

在一个实施方案中，所述标记物选自放射标记物、生物素标记物、发色团、荧光团和酶。

在一个实施方案中，至少一种或多种标志物的表达水平通过使用选自如下的技术来确定：免疫测定、蛋白质印迹分析、放射免疫测定、免疫荧光测定、免疫沉淀、平衡透析、免疫扩散、电化学发光免疫测定法(ECLIA)、ELISA测定法、聚合酶链式反应、免疫聚合酶链式反应，以及它们的组合或它们的子组合。

在一个实施方案中，所述免疫测定包括基于溶液的免疫测定法，其选自电化学发光、化学发光、荧光化学发光、荧光偏振、以及时间分辨荧光。

在一个实施方案中，该免疫测定包括夹心免疫测定法，其选自电化学发光，化学发光和荧光化学发光。

在一个实施方案中，所述样品包括从受试者获得的体液或其组分。在一个实施方案中，体液选自血液、血清、滑液、淋巴、血浆、尿液、羊水、房水、玻璃体液、胆汁、乳汁、脑脊髓液、耳垢、乳糜、囊液、淋巴液、粪便、胃酸、胃液、粘液、乳头吸出物、心包液、淋巴液、腹水、胸膜液、脓、唾液、皮脂、精液、汗水、血清、痰、泪液、阴道分泌物和从活检收集的体液。

在一个实施方案中，所述样品包括从受试者获得的组织或细胞，或其组分。

在另一方面，本发明提供一种治疗、减轻症状、抑制进展、或预防受试者的广泛性发育障碍的方法，该方法包括向有需要的受试者给药治疗有效量的包含表2-6中所列的一种或多种标志物的药物组合物。

在另一方面，本发明提供一种治疗、减轻症状、抑制进展或预防受试者的广泛性发育障碍的方法，该方法包括向有需要的受试者给药治疗有效量的包含调节表2-6所列一种或多种标志物的表达或活性的药剂的药物组合物。

在一个实施方案中，所述药剂抑制表2-6中所列的一种或多种标志物的表达或活性。

在一个实施方案中，所述药剂增强表2-6中所列的一种或多种标志物的表达或活性。

在另一方面，本发明提供一种鉴定调节表2-6中所列的一种或多种标志物的表达或活性的药剂的方法，包括将一种或多种标志物与测试药剂接触，将所述一种或多种与测试药剂接触的标志物的表达或活性与对照(例如一种或多种未与测试药剂接触的标志物的表达或活性)的活性相比较，以及鉴定出调节所述一种或多种标志物的表达或活性的药剂。

在一个实施方案中，所述药剂下调表2-6所列的一种或多种标志物中的至少一种。

在一个实施方案中，所述药剂上调表2-6所列的一种或多种标志物中的至少一种。

在另一个方面，本发明提供一种治疗、减轻症状、抑制进展或预防受试者的广泛性发育障碍的方法，该方法包括向有需要的受试者给药治疗有效量的包含根据前述方法鉴定出的药剂的药物组合物。

在前述所有方面的一个实施方案中，所述受试者是人类受试者。

本文所描述的发明是基于、至少部分地基于一种新的对网络生物学、基因组学、蛋白质组学、代谢组学、转录组学和生物信息学工具和方法的协同利用，它们组合后可以用来采用系统生物学方法研究选定的疾病状况，包括广泛性发育障碍、如自闭症和阿尔茨海默病。在平台技术的第一个步骤中，开发细胞模型系统以探究包含疾病相关细胞的疾病进程，例如广泛性发育障碍(包括自闭症)，任选地使所述细胞经受多种疾病相关的环境刺激(如高血糖，缺氧，免疫应激和脂质过氧化作用)。在一些实施方案中，细胞模型系统包括多个相互作用的细胞类型之间的细胞串扰机制。在第二步骤中，从该细胞模型系统通过使用多种技术的组合获得高通量生物学读数，包括，例如质谱(LC/MSMS)，流式细胞术，基于细胞的测定和功能测定法。在第三步骤中，对该高通量生物学读数之后进行生物信息学分析，以通过体外、体内和计算机建模研究相一致的数据的趋势。所得到的矩阵可进行交叉相关的数据挖掘，其中进行线性和非线性回归分析以识别结论性压力点(或“中枢”)。如本文中所介绍，这些“中枢”是药物发现的候选。特别是，这些中枢代表广泛性发育障碍的潜在的药物靶标和/或生物标志物。

疾病(例如广泛性发育障碍)和正常的表型之间的差异的分子印记可以用于洞察导致疾病发生和进展的机制。综合来看，上述平台技术结合战略细胞模型能够获得可靠的信息，其用来促进我们对疾病的认识，同时创造可能在临床上提高治疗标准的生物标志物文库和候选药物。

本发明的平台的一个重要特点在于基于AI的系统是基于获自细胞模型系统的数据集，而不需要借助或考虑任何已知的现有知识，例如关于生物学过程的已知的生物学关系(即没有数据点是人工的)。因此，由该平台产生的统计学模型是没有偏见的。本发明的平台及其组成部分(例如细胞模型系统和由其获得的数据集)的另一个重要特征在于其允许细胞模型随时间连续积累(例如通过引入新的细胞和/或条件)，以使得最初由广泛性发育障碍(例如自闭症)的细胞模型产生的“第一代”一致的因果关系网络可以随着细胞模型自身的进化而进化成多代的因果关系网络(由此获得δ或δ-δ网络)。这样，通过使用平台技术方法产生的细胞模型和细胞模型的数据集，以及由该细胞模型因果关系网络可以在该平台技术此前获得的知识上持续地进化和积累。

因此，本发明的一个方面提供了一种鉴定疾病进程(例如广泛性发育障碍)的调节子的方法，所述方法包括：(1)使用疾病相关细胞，例如与广泛性发育障碍相关的细胞来代表该疾病进程(例如广泛性发育障碍)的特征方面，从而建立疾病进程(例如广泛性发育障碍)的疾病模型；(2)由该疾病模型获得第一数据集，其中所述第一数据集代表多种基因在疾病相关细胞中的表达水平；(3)任选地，由该疾病模型获得第二数据集，其中所述第二数据集代表所述疾病相关细胞的功能活性或细胞应答；(4)仅仅基于第一数据集和任选地基于第二数据集，使用编程的计算装置在多种基因的表达水平和/或功能活性或细胞应答之间产生一致因果关系网络，其中所述一致因果关系网络的产生不是基于除第一数据集和第二数据集之外的任何已知的生物学关系；(5)从所述一致的因果关系网络中鉴定出所述疾病进程(例如广泛性发育障碍)中独特的因果关系，其中与所述独特的因果关系相关的基因被鉴定为该疾病进程(例如广泛性发育障碍)的调节子。

在一些实施方案中，所述疾病进程是广泛性发育障碍。

在一些实施方案中，所述疾病进程是自闭症或自闭症谱系障碍。

在一些实施方案中，所述调节子刺激或促进疾病进程。

在一些实施方案中，所述调节子抑制疾病进程。

在一些实施方案中，所述调节子转移能量代谢途径，特别是在疾病细胞中从糖酵解途径向氧化磷酸化途径转移。

在一些实施方案中，所述疾病模型包括疾病细胞的体外培养物，任选地进一步包括匹配的对照或正常细胞的体外培养物。

在一些实施方案中，所述疾病细胞的体外培养物经受环境扰动，而匹配的对照细胞的体外培养物是未经受环境扰动的相同的疾病细胞。

在一些实施方案中，所述环境扰动包括以下中的一种或多种：与试剂接触、培养条件改变、引入基因修饰/突变，以及引起基因修饰/突变的载体(例如质粒)。

在一些实施方案中，所述第一数据集包括多种基因的蛋白质和/或mRNA表达水平。

在一些实施方案中，所述第一数据集还包括脂质组学数据、代谢组学数据、转录组学数据、以及单核苷酸多态性(SNP)数据中的一种或多种。

在一些实施方案中，所述第二数据集包括下列中的一种或多种：生物能量学谱、细胞增殖、细胞凋亡、细胞器功能、以及通过选自ATP、ROS、OXPHOS和海马(Seahorse)分析的功能模型实现的基因型-表型相关性。

在一些实施方案中，步骤(4)通过基于人工智能(AI)的信息化平台实施。

在一些实施方案中，所述基于人工智能(AI)的信息化平台包括REFS(TM)。

在一些实施方案中，所述基于人工智能(AI)的信息化平台从所述第一数据集和所述第二数据集接收所有数据输入，而不使用统计截留点。

在一些实施方案中，在步骤(5)之前，在步骤(4)中确立的一致因果关系网络进一步基于输入数据通过计算机模拟被优化成模拟因果关系网络，以对所述一致因果关系网络中的一种或多种因果关系提供预测的置信水平。

在一些实施方案中，所述独立的因果关系被鉴定为差异性因果关系网络中独特地存在于疾病细胞中，并且不存在于匹配的对照细胞中的部分。

在一些实施方案中，该方法还包括在生物学系统验证所鉴定的独特因果关系。

在另一方面，本发明涉及提供使用在平台方法中的广泛性发育障碍的疾病模型的方法，包括：使用疾病相关的细胞(例如与广泛性发育障碍相关的细胞)代表广泛性发育障碍的特征方面，从而确立广泛性发育障碍的疾病模型，其中广泛性发育障碍的疾病模型可用于产生使用在所述平台方法中的疾病模型数据集；由此提供使用在平台方法中的广泛性发育障碍的疾病模型。

在另一个方面，本发明涉及从用在平台方法中的广泛性发育障碍的疾病模型获得第一数据集和第二数据集的方法，包括：(1)从使用在平台方法中的广泛性发育障碍的疾病模型中获得第一数据集，其中所述疾病模型包括疾病相关细胞，例如与广泛性发育障碍相关的细胞，并且其中所述第一数据集代表所述疾病相关细胞中的多种基因的表达水平；(2)任选地从用于平台方法中的疾病模型中获得第二数据集，其中所述第二数据集代表所述疾病相关细胞的功能活性或细胞应答；由此从所述广泛性发育障碍的疾病模型中获得第一数据集和第二数据集；由此从使用在平台方法中的广泛性发育障碍的疾病模型中获得第一数据集和第二数据集。

在另一个方面，本发明涉及一种鉴定广泛性发育障碍的调节子的方法，所述方法包括：(1)使用编程的计算机装置，在所述从广泛性发育障碍的疾病模型中获得的第一数据集和任选的第二数据集之间产生一致的因果关系网络，其中所述广泛性发育障碍的疾病模型包括疾病细胞，例如与广泛性发育障碍相关的细胞，并且其中所述第一数据集代表所述疾病相关细胞中的多种基因的表达水平，所述第二数据集代表所述疾病相关细胞的功能活性或细胞应答，其中所述一致因果关系网络的产生不是基于所述第一数据集和第二数据集之外的任何已知的生物学关系；(2)由所述一致因果关系网络鉴定出广泛性发育障碍中独特的因果关系，其中与独特的因果关系相关的基因被鉴定为广泛性发育障碍的调节子；由此鉴定出广泛性发育障碍的调节子。

在另一个方面，本发明涉及一种鉴定广泛性发育障碍的调节子的方法，所述方法包括：(1)提供由广泛性发育障碍的疾病模型产生的一致因果关系网络；(2)由所述一致因果关系网络鉴定出广泛性发育障碍中独特的因果关系，其中与独特的因果关系相关的基因被确认为广泛性发育障碍的调节子；由此鉴定出广泛性发育障碍的调节子。

在一些实施方案中，所述一致因果关系网络使用编程的计算机装置由获自广泛性发育障碍的疾病模型的第一数据集和第二数据集产生，其中所述疾病模型包括疾病细胞，例如与广泛性发育障碍相关的细胞，并且其中所述第一数据集代表所述疾病相关细胞中的多种基因的表达水平，所述第二数据集代表所述疾病相关细胞的功能活性或细胞应答，其中所述一致因果关系网络的产生不是基于所述第一数据集和第二数据集之外的任何已知的生物学关系。

在一些实施方案中，所述疾病进程是广泛性发育障碍。

在一些实施方案中，所述调节子刺激或促进疾病进程。

在一些实施方案中，所述调节子抑制疾病进程。

在一些实施方案中，所述第一数据集还包括脂质组学谱、代谢组学数据、转录组学数据、以及单核苷酸多态性(SNP)数据中的一种或多种。

在一些实施方案中，所述第二数据集包括下列中的一种或多种：生物能量学分析、细胞增殖、细胞凋亡、细胞器功能、以及通过选自ATP、ROS、OXPHOS和海马测定的功能模型实现的基因型-表型相关性。

在一些实施方案中，在步骤(5)之前，在步骤(4)中确立的一致因果关系网络进一步基于输入数据通过计算机模拟被优化成模拟因果关系网络，以提供对所述一致因果关系网络中的一种或多种因果关系提供预测的置信水平。

在一些实施方案中，该方法还包括在生物学系统中验证所鉴定的独特因果关系。

在某些实施方式中，“环境扰动”，本文也称为“外部刺激成分”，是治疗剂。在某些实施方式中，外部刺激成分是小分子(例如，不超过5kDa、4kDa、3kDa、2kDa、1kDa、500道尔顿或250道尔顿的小分子)。在某些实施方式中，外部刺激成分是生物剂。在某些实施方式中，外部刺激成分是一种化学剂。在某些实施方式中，外部刺激成分是对于细胞内源性的或外源性的。在某些实施方式中，外部刺激成分是MIM或表观代谢转变剂(epishifter)。在某些实施方式中，外部刺激成分是细胞系统的应激因素，如缺氧、高血糖症、高脂血症、高胰岛素血症和/或富乳酸状态。

在某些实施方式中，外部刺激成分可包括用于治疗疾病状态的治疗剂或候选治疗剂，包括化疗剂、蛋白质基的生物药、抗体、融合蛋白质、小分子药物、脂质、多糖、核酸等等。

在某些实施方式中，外部刺激成分可以是一个或多个应激因素，如那些通常在各种疾病状态下在体内遇到的，包括缺氧、高血糖状态、酸性环境(可通过乳酸处理模拟)等。

在其他实施方案中，外部刺激成分可以包括一种或多种MIM和/或表观代谢转变剂(epishifter)，如下文所述。MIM和表观代谢转变剂进一步在美国专利申请No.12/777902、12/778029、12/778054和12/778010中有描述，其整体内容以引证的方式明确纳入本文。示例性的MIM包括辅酶Q10(本文中也称作CoQ10)、维生素B族化合物或者形成维生素B族中的化合物的核苷、单核苷酸或二核苷酸、维生素D2、维生素D3、1,25-(OH)₂-维生素D2和1,25-(OH)₂-维生素D3。

在进行细胞输出测量(如蛋白质表达)中，可使用绝对量(例如，表达量)或相对水平(例如，相对表达水平)。在一个实施方式中，使用绝对量(例如，表达量)。在一个实施方式中，使用相对水平或量(例如，相对表达水平)。例如，为了确定细胞系统的蛋白质的相对表达水平，可以将细胞系统中任何给定的蛋白质的量(对细胞系统有或没有外部刺激)与合适的对照细胞系或细胞系的混合物(如在同一实验中使用的所有细胞)相比较，并给出倍数增加或倍数减少值。本领域技术人员将会理解，可以在任何细胞输出测量(如基因和/或RNA的转录水平、脂质水平或者任何功能输出，例如，如本文所述的细胞凋亡水平、毒性水平或ECAR或OCR)中使用绝对量或相对量。预先确定的倍数增加(例如，至少1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、25、30、35、40、45、50、75或100或者更多倍的增加)或倍数减少(例如，至少减少至0.9、0.8、0.75、0.7、0.6、0.5、0.45、0.4、0.35、0.3、0.25、0.2、0.15、0.1或0.05倍、或者减少到90％、85％、80％、75％、70％、65％、60％、55％、50％、45％、40％、35％、30％、25％、20％、15％、10％或5％或更少)的阈值水平可以被用于选择显著差异，和然后该显著差异的细胞输出数据可包括在用于本发明的平台技术方法中的数据集(例如，第一和第二数据集)中。本领域技术会认识到存在于前述列表中的所有的值也可以是范围的上限或下限，例如，在1.5至5倍、5至10倍、2至5倍、或0.9至0.7、0.9至0.5、0.7至0.3倍，它们也是本发明的部分。

在整个本申请中，显示在列表中的所有值，例如，如上述的那些，也可以是确定为本发明中的一部分的范围的上限或下限。

在本发明的方法的一个实施方式中，因果关系网中观察到的因果关系可以不都有生物学显著意义。对于所述探询生物评价被应用的任何给定的生物系统，一些(或者也许全部)的因果关系(以及与其相关的基因)相对于特定的所讨论的生物问题是“决定性的”，例如导致引起疾病状态(治疗性干预的潜在目标)或疾病状态的生物标志物(潜在的诊断或预后的因素)。在一个实施方式中，观察的在生物系统中独特的因果关系对于所讨论的特定生物问题是决定性的。在一个实施方式中，并非每一个在生物系统中观察到的独特的因果关系对于所讨论的特定生物问题是决定性的。

这种决定性的因果关系可以由所述方法的最终用户来选择，或者可以由生物信息学软件程序来选择，如REFS、DAVID-实现的比较途径分析程序或者KEGG途径分析程序。在某些实施方式中，使用一个以上的生物信息学软件程序，和来自两个或更多生物信息学软件程序的一致结果是优选的。

如本文所用的细胞输出的“差异”包括任何一个或多个细胞输出参数中的差异(例如，增加或减少的水平)。在某些实施方式中，差异各自独立地选自于mRNA转录、蛋白质表达、蛋白质活性、代谢物/中间体水平和/或配体-靶相互作用中的差异。例如，就蛋白质表达水平而言，可以通过使用本领域公认的技术，如以质谱分析为基础的检测(例如，iTRAQ、2D-LC-MSMS，等)测量和定量两个细胞输出之间的差异，例如在外部刺激成分治疗之前和之后与细胞系统相关的输出。

附图说明

图1：“组学”级联的图示。

图2：探寻式生物(Interrogative Biology)平台的图示。

图3：探寻式生物平台的图示。

图4A-4D：可用于示例性实施方案的基于AI信息系统的成分和方法的高水平图示。

图5：可用于一些示例性实施方案中的基于AI信息系统的方法流程图。

图6：图示绘出适用于实施本文中教导的示例性实施方案的示例性计算环境。

图7：根据一些实施方案的示例方法的高水平流程图。

图8：用于鉴定自闭症的新的生物标志物的实验方法的图示。

图9：用于鉴定自闭症的新的生物标志物的实验样品来源的图示。

图10：具有相对于正常样品而言在自闭症中独特的中枢/节点的整体差异性网络。

图11：由自闭症和阿尔茨海默病中共同的“疾病状态”驱动的分子实体网络。

图12：自闭症中的示例性因果分子相互作用网络。

图13：具有在自闭症相互作用网络中作为关键中枢的SPTAN1的示例性子网络。

图14：具有在自闭症相互作用网络中作为关键中枢的GLUD1的示例性子网络。

图15：具有在自闭症相互作用网络中作为关键中枢的CORO1A的示例性子网络。

发明的具体描述

自闭症谱系障碍(ASD)是一种广泛性发育障碍，包括一组严重的，难以理解的神经行为障碍。自闭症是一种复杂的神经发育障碍。该病的主要特征是社交技巧损害、难以沟通，以及受限的/重复行为。目前，这是排名第三的最常见的发育障碍。被诊断具有自闭症的儿童数量急剧增加，其被认为是流行病，目前的发病率是110名儿童中有1名，且男女比例为4:1。虽然自闭症不会影响患者的寿命，也可能是一个终身疾病。ASD具有很多疑似原因，包括基因突变和/或缺失，线粒体功能障碍，免疫学，饮食，汞中毒和病毒感染。有趣的是，线粒体功能障碍已被显示出在该疾病的病理生理中具有至关重要的作用。作为一种多因素疾病，自闭症在一个谱下具有非常不同的患者群。由于对该病的分子机制的缺乏了解，目前诊断是基于观察的行为变化，没有药物被批准用于专门治疗自闭症。目前，在临床诊断环境中还没有已确立的分子印记或终点。尚没有生物标志物被证实在个体病人中能够可靠地诊断自闭症。因此，缺少ASD的生物标志物是仲裁诊断中的一个主要瓶颈，以及用于开发药物来治疗和/或预防病症。

过去，显著精力一直放在自闭症的基因组学/遗传学研究。但是，迄今为止没有可用的有效生物标志物，没有客观的临床试验可以帮助临床医生，并且没有有希望的治疗方法来帮助自闭症儿童和他们的家庭。这种缺乏进展可能是由于在只进行基因/基因组学研究时，缺少对这种疾病背后的分子机制的整体理解。可能需要研究在所有组学水平(例如，基因组学，蛋白质组学等)，包括相互作用组上的差异性分子改变，从而获得对孤独症表型背后生物学系统的全面理解。

因此，申请人在本文中描述并采用了在探寻式发现平台技术(Interrogative Discovery Platform Technology)上的结合细胞生物学和多组学平台的新方法。探寻式平台技术使用基于数据驱动推导的人工智能(AI)来整合体外和/或体内/临床研究的数据，以挖掘数据并建立生物模型。图1提供了描绘在平台技术中采用不同“组学”级联的示意图。图2-3提供了探寻式发现平台技术的示意图。这个探寻式平台技术进一步被描述在申请PCT/US2012/027615中，其全部内容明确地以引用方式并入本文。将平台技术应用到广泛性发育障碍的细胞模型系统使得可以深入了解广泛性发育障碍的病理生理学机制，并已产生候选生物标志物，以及潜在的治疗靶点和/或疗法/药物。使用该平台技术确定的候选药物/药物靶点天然存在于人体内，因此，避免外源治疗剂的毒性作用。

I.定义

如本文中所使用的，下列术语的每一个具有在该部分中与其相关的意义。

冠词“一种(a)”和“一个(an)”在本文中是指一个或超过一个(即至至少一个)所述冠词的语法宾语。例如，“一个元素”意指一个元素或多于一个元素。

术语“包括”在本文中用于意指术语“包括但不限于”，并且可与所述短语互换使用。

除非本文中明确地另外指出，否则术语“或”在本文中意指术语“和/或”，并且可与所述术语互换使用。

术语“例如”在本文中用于意指术语“例如但不限于”，并且可与所述术语互换使用。

如本文中所使用的，术语“受试者”或“病人”是指人类或非人动物，例如患病的兽类，优选哺乳类。术语“非人动物”包括脊椎动物，例如哺乳动物，例如非人灵长类、鼠、啮齿类动物、兔、羊、狗、猫、马、牛、绵羊、犬科动物、猫科动物、马或牛的品种。在一个实施方案中，受试者是人类(例如具有广泛性发育障碍的人)。应注意，本文中描述的临床观察均是针对人类受试者，并且在至少一些实施方案中，受试者是人。

“治疗有效量”意指当给患者施用以治疗疾病时足以对所述疾病实现这种治疗的化合物的量，例如以适用于任何治疗的合理效益风险比产生一定的期望的局部或全身性效应的此种物质的量。当为了预防疾病施用时，所述量足以避免或延迟疾病的发作。“治疗有效量”将视所述化合物、治疗指数、溶解度、疾病和其严重性以及待治疗的患者的年龄、体重等而变化。例如，可以以足以产生适用于此类治疗的合理效益风险比的量施用通过本发明的方法发现的某些化合物。

“预防”或“防止”是指获得疾病或障碍(即，引起尚未在可遭受或易患疾病但仍未经历或展示疾病的症状的患者中发生的疾病的至少一个临床症状)的风险降低。

术语“预防性”或“治疗性”治疗是指给受试者施用一种或多种受试组合物。如果其在不期望的病状(例如，宿主动物的疾病或其他不期望的状态)的临床表现之前施用，则治疗是预防性的，即，其保护宿主免于发生不期望的病状，然而如果在不期望的病状表现之后施用，则治疗是治疗性的(即，其由此旨在减轻、改善或维持既有的不期望的病状或副作用)。

术语“治疗效应”是指由药理活性物质引起的动物，特别是哺乳动物的，更特别是人中的局部或全身性效应。所述术语因此意指意欲用于诊断、治疗、缓和、治疗或预防疾病或用于促进动物或人的期望的身体或心理发展和状态的任何物质。

“患者”意指任何动物(例如，人类或非人哺乳动物)，包括马、狗、猫、猪、山羊、兔、仓鼠、猴、豚鼠、大鼠、小鼠、蜥蜴、蛇、绵羊、牛、鱼和鸟。

术语“标志物”或“生物标志物”在本文中互换使用，是指用作生物状态的指示物的物质，例如基因、信使RNA(mRNA)、微小RNA(miRNA)、异质核RNA(hnRNA)，以及蛋白质或其部分。

“表达水平”或“表达形式”是指个体中一种或多种标志物或生物标志物的表达的定量或定性总结，例如相比于标准或对照。

“更高的表达水平”、“更高的活性水平”、“升高的表达水平”或“增加的活性水平”是指测试样品中的表达水平和/或活性，其高于用于估计表达和/或活性的测定的标准差，并且优选为标志在对照样品(例如，来自未患有广泛性发育障碍的健康受试者的样品)中的表达水平、优选所述标志在几个对照样品中的平均表达水平的至少2倍，更优选3、4、5、或10或更多倍。

“更低的表达水平”、“更低的活性水平”、“降低的表达水平”或“减少的活性水平”是指测试样品中的表达水平和/或活性，其高于用于评估表达和/或活性的测定的标准误差，但优选低于所述标志在对照样品(例如，利用用作所述标志物的预后能力的验证标准的随访信息针对一小组广泛性发育障碍直接或间接校准的样品)中的表达水平、优选所述标志在几个对照样品中的平均表达水平的至少1/2，更优选1/3、1/4、1/5或1/10或更低。

如本文中所使用的，“抗体”包括，作为例子，天然存在的抗体形式(例如IgG、IgA、IgM、IgE)和重组抗体例如单链抗体、嵌合抗体和人源化抗体以及多特异性抗体，以及所有上述抗体的片段和衍生物，所述片段和衍生物具有至少一个抗原结合位点。抗体衍生物可包括缀合至抗体的蛋白质或化学部分。

提及的基因包括天然存在的基因或基因的内源性版本，包括可以在受试者中发现的野生型，基因的多态或等位变体或突变体(例如，种系突变体、细胞突变)。在一个实施方案中，所述生物标志物基因的序列与表2-6中列出的标志物的序列至少约80％、至少约85％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、或至少约99％相同。序列同一性可以被确定，例如，通过使用NCBI BLAST(例如，用默认参数进行MEGABLAST)进行比较的序列。

在一个实施例中，一种或多种标志物的表达水平相对于对照样品确定，如标志物的在正常组织中的表达水平(例如，从正常组织样品中观察到的标志物的表达水平确定的范围)。在一个实施方案中，标志物的表达水平相对于对照样品确定，如在来自患病受试者的健康父母或兄弟姐妹的样品中的标志物的表达水平，或来自其他健康受试者的样品中的标志物的表达水平。在另一个实施方案中，一种或多种标志物的表达水平相对于对照样品确定，如患有广泛性发育障碍的其他受试者的样品中的一种或多种标志物的表达水平。例如，可以确定在其他受试者的样品中的表2-6中的一种或多种标志物的表达水平，以定义关联于一种特定治疗方法的敏感性的表达水平，并将感兴趣的受试者的样品中一种或多种标志物的表达水平与这些表达水平相比较。

术语“已知的标准水平”或“对照水平”是指被接受的或预先确定的一种或多种标志物的表达水平，例如在表2-6中所列的一种或多种标志物，其用于将受试者样品中的所述一种或多种标志物的表达水平进行比较。在一个实施方案中，标志物的对照表达水平是标志物在一群受试者的样品中的表达水平，例如在一群具有广泛性发育障碍的受试者中标志物的平均表达水平。在另一个实施方案中，所述群体包括一组不响应于特定治疗方法的受试者，或者一组以高或正常水平表达各标志物的受试者。在另一个实施方案中，对照水平形成一系列在正常组织中的标志物表达。在另一个实施方案中，对照水平形成了一系列在具有广泛性发育障碍的多种受试者的细胞或血浆中的标志物的表达。在另一个实施方案中，“对照水平”是指受试者中的预处理水平。

随着由常规实施本文描述的方法而获得进一步的信息，可以使用本发明所述标志物的“对照”表达水平的人群平均值。在其他实施方案中，所述标志物的“对照”表达水平可以通过确定从疑似广泛性发育障碍发病之前的受试者中、从储存的受试者样品中、从患病受试者的健康父母或兄弟姐妹获得的各标志物在受试者样品中的表达水平而确定。

本发明标志物的对照表达水平可获自公众可得的数据库。此外，Universal Reference Total RNA(Clontech Laboratories)和Universal HumanReference RNA(Stratagene)等可以用来作为对照。例如，定量PCR(qPCR)可以用来确定标志物的表达水平，并且用于检测受试者样品中标志物表达的循环数相比于采用这种对照来检测所需的循环数的增加表明标志物的表达水平低。

术语“样品”是指从受试者获得或分离出的细胞、组织或体液，以及受试者体内存在的细胞、组织或体液。术语“样品”包括来自受试者的任何体液、组织或细胞，或者细胞群，以及其任何组成部分，例如一部分或提取物。在一个实施方案中，组织或细胞从受试者中移出。在另一个实施方案中，组织或细胞存在于受试者体内。在一个实施方案中，体液包括羊水、房水、玻璃体液、胆汁、血液、乳汁、脑脊髓液、耳垢、乳糜、囊液、淋巴液、粪便、胃酸、胃液、淋巴液、粘液、乳头吸出物、心包液、淋巴液、腹水、血浆、胸膜液、脓、唾液、皮脂、精液、汗液、血清、痰液、滑液、泪液、尿液、阴道分泌物、或者从活检收集的体液。在一个实施方案中，所述样品包含来自受试者的蛋白质(例如蛋白质或多肽)。在另一个实施方案中，所述样品包含来自受试者的RNA(例如mRNA)或来自受试者的DNA(例如基因组DNA分子)。

本文中使用的“初步治疗”是指对患有广泛性发育障碍的受试者的初期治疗。

如果广泛性发育障碍的至少一种症状预期被或被缓解、终止、减慢或预防，则广泛性发育障碍被“治疗”。如本文中使用的，如果所述广泛性发育障碍的复发或严重程度降低、减慢、延迟或预防，则该广泛性发育障碍也得到“治疗”。

试剂盒是用于具体地检测本发明的标志物的包括至少一种试剂，例如探针的制造品(例如包装或容器)，所述制剂品作为一个单位被宣传、分配或售卖，以实施本发明的方法。

“代谢途径”是指将一种化合物转化成另一种化合物并且提供中间体和能量用于细胞功能的顺序酶介导反应。代谢途径可以是线型的或循环的。

“代谢状态”是指一个特定的细胞、多细胞或组织环境在给定时间点的分子含量，其由各种化学和生物指标来衡量，因为它们与健康或疾病状态。

术语“微阵列”指的是合成在基材上的不同多核苷酸、寡核苷酸、多肽(如抗体)或肽的阵列，所述基材如纸，尼龙或其它类型的膜、过滤器、芯片、载玻片或任何其它合适的固体支持物。

用于免疫检测，以确定本发明的一种或多种标志物的表达水平的抗体，可以用可检测的标记物来标记。与探针或抗体有关的术语“标记”旨在包括探针或抗体的直接标记(通过掺入标记物(例如，放射性原子)、偶联(即物理连接)可检测物质至探针或抗体)以及对探针或抗体的间接标记(通过与另一种直接标记的试剂反应)。间接标记的实例包括使用荧光标记的二抗来检测一抗，以及用生物素来末端标记DNA，使得它可以被荧光标记的链霉亲和素来检测。

在一个实施方案中，抗体是被标记的抗体，例如放射性标记的、生色团标记的、荧光团标记的或酶标记的抗体。在另一个实施方案中，使用抗体衍生物，例如与基质缀合的抗体，或与蛋白质-配体对(例如生物素-链霉亲和素)的蛋白质或配体缀合的抗体，或与生物标志物特异性结合的抗体片段(例如单链抗体，或分离的抗体高变区)。

术语“障碍”和“疾病”被包含地使用并且是指与身体的任何部分、器官或系统(或其任何组合)的正常结构或功能的任何偏差。具体的疾病表现在特征性症状和体征(包括生物、化学和物理变化)，并且通常与多个其他因素(包括但不限于人口统计、环境、职业、遗传和医疗史因素)相关。可通过多种方法定量某些特征性体征、症状和相关因素以产生重要诊断信息。

本文使用的术语“表达”是指从DNA产生多肽的过程。该过程包括基因转录成mRNA，和该mRNA翻译成多肽。根据其使用的上下文，“表达”可以指RNA、蛋白质或两者的产生。

术语“基因的表达水平”或“基因表达水平”是指在细胞中mRNA以及前mRNA新生转录本、转录加工的中间体、成熟mRNA和降解产物的水平，或由该基因编码的蛋白质的水平。

术语“调节”指反应的上调(即，激活或刺激)、下调(即，阻遏或抑制)，或组合或分开的两者。“调节子”是起调节作用的化合物或分子，可以是例如激动剂、拮抗剂、活化剂、刺激剂、阻遏物或抑制剂。

术语“基因组”是指生物实体(细胞、组织、器官、系统、生物体)的遗传信息的全部。它是以DNA或RNA(例如，在某些病毒中)编码的。基因组包括基因和DNA的非编码序列。

术语“蛋白质组”是指由基因组、细胞、组织或生物体在给定时间表达的蛋白质的整个集合。更具体地说，它可以指在限定的状态下在给定时间给定类型的细胞或生物体中表达的蛋白质的整个集合。蛋白质组可以包括由于例如，基因的选择性剪接和/或翻译后修饰(如糖基化或磷酸化)导致的蛋白质变体。

术语“转录组”是指在给定的时间一个或一群细胞中产生的转录RNA分子的整个集合，包括mRNA、rRNA、tRNA和其他非编码RNA。该术语可被应用于给定的生物体中转录本的总集，或应用于在特定细胞类型中存在的转录本的特定子集。与对于给定的细胞系大致固定(不包括突变)的基因组不同，转录组可以随外部环境条件而变化。因为细胞中包括了所有的mRNA转录物，转录组反映了在任何给定的时间活跃地表达的基因，除了mRNA降解现象，如转录弱化。

对转录组学的研究，也被称为表达谱，考察给定的细胞群中mRNA的表达水平，通常采用基于DNA微阵列技术的高通量技术。

术语“代谢组”是指在给定状态下在给定时间在生物样品内，如单一有机体中，发现的小分子代谢物(如代谢中间体、激素和其他信号分子和次级代谢产物)的完整集合。代谢组是动态的，且可以每秒发生变化。

术语“相互作用组(interactome)”是指在研究中的生物系统(例如，细胞)中分子相互作用的整个集合。它可以被显示为定向的图形。分子相互作用可以发生在属于不同的生物化学家族(蛋白质、核酸、脂质、碳水化合物等)的分子，且也在给定家族内的分子之间发生。当在蛋白质组学方面来说，相互作用组是指蛋白质-蛋白质相互作用网络(PPI)，或蛋白质相互作用网络(PIN)。另一个广泛研究的相互作用组类型是蛋白质-DNA相互作用组(转录因子形成的网络(和DNA或染色质调节蛋白质)和其靶基因)。

术语“细胞输出”包括涉及细胞状态的参数的集合，优选可测量的参数，所述细胞的状态包括(但不限于)：一个或多个基因的转录水平(例如，可通过RT-PCR、qPCR、微阵列等测量)、一种或多种蛋白质的表达水平(例如，可通过质谱法或Western印迹等测量)、一种或多种酶或蛋白质的绝对活性(例如，可作为底物转化率测量)或相对活性(例如，可作为与最大活性相比的％值测量)、一种或多种代谢物或中间体的水平、氧化磷酸化水平(例如，可通过耗氧率或OCR测量)、糖酵解水平(例如，可通过细胞外酸化率或ECAR测量)、配体-靶结合或相互作用的程度、细胞外分泌分子的活性等。细胞输出可以包括预先确定数的靶基因或蛋白质等的数据，或者可以包括对所有可检测的基因或蛋白质的整体评估。例如，可使用质谱法来确定和/或定量在给定的样品或细胞群体中表达的所有可检测的蛋白质，而没有在样品或细胞群体是否可以表达任何特定蛋白质的先前知识。

如本文所用的“细胞系统”包括同质的或异质的细胞群体。在系统内的细胞可以在自然的或生理的环境下在体内生长，或者可以在体外生长，例如，在受控的组织培养环境中。在系统内的细胞可以是相对同质的(例如，不低于70％、80％、90％、95％、99％、99.5％、99.9％同质的)，或者可以包含两种或更多种细胞类型，如通常发现在体内密切接近生长的细胞类型，或可以通过例如旁分泌或其他长距离细胞间通讯在体内彼此相互作用的细胞类型。细胞系统内的细胞可以源自建立的细胞系，包括广泛性发育障碍细胞系、永生细胞系或正常细胞系，或可以是原代细胞或从活组织或器官新分离的细胞。

细胞系统中的细胞通常与可以提供营养物、气体(氧气或二氧化碳等)、化学品或蛋白质性的/非蛋白质性的刺激物(其可以定义影响细胞行为的条件)的“细胞环境”接触。细胞环境可以是有限定的化学成分和/或不太明确限定的组织提取物或血清成分的化学介质，并且可以包括细胞在其中生长的特定pH、CO₂含量、压力和温度。或者，细胞环境可以是在体内发现的对于特定细胞系统的天然的或生理的环境。

在某些实施方式中，特定细胞系统的细胞环境还包括细胞系统的某些细胞表面特征，如细胞表面上的受体或配体的类型和它们各自的活性、碳水化合物或脂质分子的结构、膜极性或流动性、某些膜蛋白质的成簇状态等。这些细胞表面特征可以影响附近细胞(如属于不同细胞系统的细胞)的功能。然而，在某些其它实施方式中，细胞系统的细胞环境不包括细胞系统的细胞表面特征。

细胞环境可以被改变成为“改变的细胞环境”。变化可以包括在细胞环境中发现的任何一个或多个成分的改变(例如，增加或减少)，包括向细胞环境添加一种或多种“外部刺激成分”。外部刺激成分可以是细胞环境内源的(例如，细胞环境包含了一些水平的刺激物，和添加更多相同的刺激物以提高其水平)，或者可以是细胞环境外源的(例如刺激物主要在不存在于改变前的细胞环境中)。细胞环境还可以通过添加外部刺激成分导致的继发性变化而改变，由于外部刺激成分可以改变细胞系统的细胞输出，包括通过细胞系统分泌到细胞环境中的分子。

本文中使用的“外部刺激成分”包括任何可能影响细胞功能的外部的物理和/或化学刺激。这可以包括任何大或小的有机或无机分子、天然或人工合成的化学物质、温度转变、pH变化、辐射、光(UVA，UVB等)、微波、声波、电流、调制的或未调制的磁场等。

仅为示例的目的，上述外部刺激成分可以包括用于治疗疾病状态的治疗剂或候选治疗剂，包括化疗剂、基于蛋白质的生物药物、抗体、融合蛋白、小分子药物、脂质、多糖、核酸等。

在其他实施方案中，外部刺激成分可以是一种或多种应激因素，如那些在多种疾病条件下体内通常遇到的因素，包括缺氧，高血糖条件下，酸性环境(可以通过乳酸处理来模拟)等。

在其中需要研究两个或更多个细胞系统之间的相互作用的某些情况下，可以通过，例如，使第一细胞系统的改变的细胞环境与第二细胞系统接触以影响第二细胞系统的细胞输出而形成“交互细胞系统”。

如本文所用的“交互细胞系统”包含两个或更多个细胞系统，其中至少一个细胞系统的细胞环境接触到第二细胞系统，使得第二细胞系统中至少一个细胞输出被改变或受影响。在某些实施方式中，交互细胞系统内的细胞系统可以彼此直接接触。在其它实施方式中，没有细胞系统彼此直接接触。

例如，在某些实施方式中，交互细胞系统可以是侵袭实验装置的形式，其中第一细胞系统生长在插入物中和第二细胞系统生长在相应的小室隔间中。该两个细胞系统可以接触相同的或不同的培养基，并可以交换部分或全部的培养基成分。添加到一个细胞系统的外部刺激成分可以基本上被一个细胞系统吸收和/或在它有机会扩散到其他细胞系统之前降解。或者，外部刺激成分最终可以在两个细胞系统内接近或达到平衡。

在某些实施方式中，交互细胞系统可采取单独培养的细胞系统的形式，其中各个细胞系统可以有其自身的培养基和/或培养条件(温度、CO₂含量、pH值等)或者类似或相同的培养条件。可以通过例如，从一个细胞系统获取条件化的培养基并使其与另一个细胞系统接触来使两个细胞系统形成接触。如果需要的话，也可以在两个细胞系统之间实现直接的细胞-细胞接触。例如，如果需要的话，可在任何点上共培养两个细胞系统的细胞，且当至少一个细胞系统中的细胞具有可分选标志物或标记(如稳定表达的荧光标记蛋白GFP)时，可以随后通过，例如，FACS分选分离共培养的细胞系统。

类似地，在某些实施方式中，交互细胞系统可以仅仅是共培养。对一个细胞系统中的细胞的选择性处理可以通过在培养与另一个细胞系统的细胞共培养的处理细胞之前，首先处理该细胞系统中的细胞来实现。当需要研究，例如，由第一细胞系统受外部刺激成分的刺激后在第一细胞系统中的细胞表面变化引起的对第二细胞系统的效应时，共培养的交互细胞系统设置可能是有用的。

本发明的交互细胞系统特别适合于探索某些预先确定的外部刺激成分对一个或两个细胞系统的细胞输出的影响。这样的刺激物对第一细胞系统(其与刺激物直接接触)的初级影响可以通过比较在第一细胞系统与外部刺激接触之前和之后的细胞的输出(例如，蛋白质表达水平)而确定，其如本文所用的可以称为“(显著的)细胞输出差异”。通过第一细胞系统的改变的细胞环境(如其分泌组)介导的这样的刺激物对第二细胞系统的次生效应也可以类似地测定。为此，可以比较例如第二细胞系统的蛋白质组，在具有对第一细胞系统的外部刺激处理的第二细胞系统的蛋白质组和没有对第一细胞系统的外部刺激处理的第二细胞系统的蛋白质组之间进行。观察到的任何显著的变化(在蛋白质组或任何其它感兴趣的细胞输出中)可被称为“显著的细胞交互差异”。

在进行细胞输出测量(如蛋白质表达)中，可使用绝对表达量或相对表达水平。例如，为测定第二细胞系统的相对蛋白质表达水平，第二细胞系统中任何给定的蛋白质的量(有或没有对第一细胞系统的外部刺激)可以与合适的对照细胞系和细胞系的混合物对比，并给出倍数增加或倍数减少值。可以使用对于这种倍数增加(例如，至少1.5倍增加)或倍数减少(例如，至少减少至0.75倍或75％)的预先确定的阈值水平来选择显著的细胞交互差异。

为了进行说明，在建立用来模仿心血管疾病模型的方面的一个示例性的两细胞系统中，可以用缺氧条件(外部刺激成分)处理心平滑肌细胞系(第一细胞系统)，且可以使用常规的定量质谱法测定将肾细胞与心平滑肌的条件化培养基接触导致的肾细胞系(第二细胞系统)中蛋白质组变化。在与适当的对照(例如，与来自没有经过缺氧条件处理的类似培养的心平滑肌细胞的条件化培养基接触的类似培养的肾细胞)相比较的基础上，可以确定这些肾细胞中显著的细胞交互差异。

并不是每一个观察到的显著的细胞交互差异都可以具有生物学意义。对于应用所述探询生物评估的任何给定的生物系统，一些(或者可能全部)显著的细胞交互差异对于讨论的特定生物学问题，例如，引起疾病状态的原因(治疗性干预的潜在靶标)，或者作为疾病状态的生物标志物(潜在的诊断或预后因子)，可能是“决定性的”。

这样的决定性交互差异可以由所述方法的最终用户进行选择，或者它可以通过生物信息学软件程序，如DAVID可执行的比较途径分析程序或KEGG通路分析程序选择。在某些实施方式中，使用一个以上的生物信息学软件程序，且来自两个或更多个生物信息学软件程序的一致结果是优选的。

如本文所用的，细胞输出“差异”包括细胞输出中的任何一种或多种参数的差异(例如，提高或降低的水平)。例如，就蛋白质表达水平而言，两个细胞输出之间的差异可以通过使用本领域公认的技术，如基于质谱的分析(例如，iTRAQ、2D-LC-MS-MS等)测量和定量，例如，与外部刺激成分处理之前和之后的细胞系统相关的输出。

如本文所用的“探询式生物评估”可包括鉴别与外部刺激成分相关联的一个或多个决定性细胞交互差异(例如，生物途径，或途径的关键成员，或途径成员的主要调节子的活性的增加或减少)。它可以进一步包括涉及额外的步骤来测试或验证所确定的决定性细胞交互差异是否需要和/或足够用于与初始外部刺激成分相关联的下游事件，包括体内动物模型和/或体外组织培养实验。

现在将详细地参考本发明的示例方案。虽然本发明将参照示例性实施例来描述，但应理解，它并不意在将本发明限制到这些实施方案。与此相反，它旨在涵盖替换方案，改进方案和如可能由所附权利要求所限定的本发明的精神和范围内的等同方案。

II.探询式生物平台技术的概述

本发明的示例性实施方式中结合了可以使用探询生物学平台(“平台”)实施的方法，该平台是用于理解各种各样的生物学过程(如疾病病理生理学)和作为这种生物过程基础的关键分子驱动子(包括使疾病过程得以发生的因子)的工具。一些示例性实施方式包括可以结合该平台的至少一部分或全部的系统。一些示例性方法可以采用该平台的至少一部分或全部。涉及该平台的一些示例性实施方式的目标和目的出于说明性的目的一般地概述如下：

i)建立作为疾病过程(例如，广泛性发育障碍)的关键组成的驱动子的特定分子印记，因为它们与疾病过程的整体病理生理学相关；

ii)生成与疾病(例如广泛性发育障碍)过程相关的分子印记或差异图谱，这可有助于鉴别区分疾病状态与不同状态(例如，正常状态)的差异分子印记，和发展对于印记或分子实体的理解，因为它们裁断两种状态之间的变化(例如，从正常到疾病状态)的机制；和

ⅲ)研究分子活性的“中枢”作为用于疾病(例如广泛性发育障碍)的外部控制的潜在干预靶标(例如，使用该中枢作为潜在的治疗靶标)或作为所讨论的疾病(例如广泛性发育障碍)的潜在生物标志物(例如，疾病特异性生物标志物，用于预后和/或治疗诊断用途中)的作用。

涉及该平台的一些示例性的方法可以包括一个或多个以下特征：

1)在一个或多个模型中，优选在体外模型中，使用与生物过程相关的细胞对生物过程(例如，疾病过程)和/或生物过程的成分(例如，疾病生理及病理生理学)建模。例如，细胞可以是人类来源的细胞，其通常参与所讨论的生物过程。该模型可包括对于该生物过程(例如，疾病)特异性的各种细胞提示/状态/扰动。在理想的情况下，该模型代表各种(疾病)状态和通量成分而不是生物(疾病)状态的静态评估。

2)使用领域公认的任何手段确定mRNA和/或蛋白质印记的特征。例如，定量聚合酶链反应(qPCR)和蛋白质组学分析工具如质谱(MS)。这种mRNA和蛋白质数据集代表对环境/扰动的生物反应。在适用和可能的情况下，脂质组学、代谢组学和转录组学数据也可被整合作为用于所讨论的生物学过程的补充或替代测量值。SNP分析是在过程中有时可以使用的另一成分。它可以有助于研究，例如，SNP或特定突变是否对生物过程有任何影响。这些变量可以用于描述生物过程，无论是作为静态的“瞬象”或作为动态过程的表现。

3)测定对提示和扰动的一个或多个细胞反应，包括但不限于生物能量学谱、细胞增殖、细胞凋亡和细胞器功能。真正的基因型-表型相关性是通过采用功能模型(如ATP、ROS、OXPHOS、Seahorse分析等等)实现的。这样的细胞反应代表生物过程(或其模型)中对相应的mRNA/蛋白质表达的状态以及上面2)项中的任何其他相关状态做出响应的细胞反应。

4)通过采用基于人工智能(基于AI)的信息学系统或平台，整合在3)中获得的功能分析数据与在2)中获得的蛋白质组学和其它数据，并确定由因果关系驱动的蛋白质相关性。这样的基于AI的系统是基于，优选仅基于，2)和/或3)中得到的数据集，而不采用关于该生物过程的现有知识。优选地，没有数据点被统计地或人为地截流。相反，所有得到的数据被送入AI系统中用于确定蛋白质相关性。整合过程的一个目标或输出是不同生物学状态(例如，疾病相对于正常状态)之间的一个或多个差异网络(另外在本文中可称为“Δ网络”，或者在某些情况下视情况而定称为“Δ-Δ网络”)。

5)确定基于AI的信息学平台的输出的特征以考察作为潜在治疗靶标和/或生物标志物的各活性中枢。这样的分析可以基于所获得的数据集完全在计算机中进行而无需采用任何实际的湿实验室试验(wet-lab experiment)。

6)通过采用分子和细胞技术验证活性中枢。这种用湿实验室的细胞基实验对输出进行的信息后验证(post-informatic validation)可以是任选的，但它们有助于建立全循环的探询。

以上概述的任何或所有途径可以用在涉及任何生物过程的任何特定应用中，其取决于(至少部分地取决于)具体应用的性质。也就是说，上文所述的一个或多个途径可以被省略或修改，并且可以采用一个或多个附加的途径，其取决于具体的应用。

图2中描述了包括数据采集、数据整合和数据挖掘的平台成分的示意图。图1中描述了系统探询和来自“组学”级联的响应数据收集的示意图。

图7是示例性方法的高水平流程图，其中显示了可以被用来执行该示例性方法的示例性系统的成分。首先，使用通常与生物过程相关联的细胞建立生物过程(例如，疾病过程)和/或生物过程的成分(例如，疾病生理学和病理生理学)的模型(例如，体外模型)(步骤12)。例如，细胞可以是通常参与生物过程(例如，疾病)的来源于人的细胞。细胞模型可包括该生物过程(例如，疾病)特定的各种细胞提示、状态和/或扰动。在理想的情况下，细胞模型表示各种(疾病)状态和生物过程(例如，疾病)的通量成分而不是生物过程的静态评估。对比细胞模型可包括对照细胞或正常(如非病变的)细胞。细胞模型的附加说明出现在下面的IV.A节。

第一数据集是使用任何已知的方法或系统(例如，定量的聚合酶链反应(qPCR)和蛋白质组学分析工具，如质谱(MS))，从生物过程的细胞模型获得，其包括表示多个基因(例如，mRNA和/或蛋白质印记)的表达水平的信息(步骤16)。

第三数据集从生物过程的对比细胞模型获得(步骤18)。第三数据集包括代表来自对比细胞模型的对比细胞中多个基因的表达水平的信息。

在本发明方法的某些实施方式中，这些第一和第三数据集在本文中统称为“第一数据集”，其表示与生物系统相关的细胞(包括对比细胞的所有细胞)中多个基因的表达水平。

可以从一个或多个mRNA和/或蛋白质印记分析系统得到第一数据集和第三数据集。第一和第三数据集中的mRNA和蛋白质数据可以代表对环境和/或扰动的生物反应。在适用和可能的情况下，脂质组学、代谢组学和转录组学数据也可以被整合作为生物过程的补充或替代测量。SNP分析是可以有时使用在该方法中的另一成分。它可以有助于调查，例如，单核苷酸多态性(SNP)或特定的突变对生物过程是否有任何影响。数据变量可以被用于描述生物过程，无论是作为静态的“瞬象”，还是作为动态过程的表示。有关获取表示细胞中多个基因的表达水平的其他描述见以下的IV.B部分。

在一些实施方案中，第二数据集从生物过程的细胞模型获得，其包括表示细胞的功能活性或反应的信息(步骤20)。类似地，在一些实施方案中，第四数据集从生物过程的对比细胞模型获得，其包括表示对比细胞的功能活性或反应的信息(步骤22)。

在本发明方法的某些实施方式中，这些第二和第四数据集在本文中统称为“第二数据集”，其表示与生物系统相关的细胞(包括对比细胞的所有细胞)的功能活性或细胞反应。

可以使用一个或多个功能分析系统以获得有关细胞或对比细胞的功能活性或反应的信息。关于对提示和扰动的功能性细胞反应的信息可包括，但不限于，生物能量学谱、细胞增殖、细胞凋亡和细胞器功能。过程和途径的功能模型(例如，三磷酸腺苷(ATP)、活性氧物质(ROS)、氧化磷酸化(OXPHOS)、Seahorse分析等)可以被用来获得真正的基因型-表型相关性。功能活性或细胞反应表示在生物过程(或其模型)中的细胞响应于mRNA/蛋白质表达的相应状态以及任何其他相关应用的状态或扰动的反应。在下面IV.B部分中提供有关获得表示细胞的功能活性或反应的信息的附加信息。

该方法还包括在细胞和对照细胞中生成生物过程的计算机执行模型。例如，可对于细胞模型从第一数据集和第二数据集生成在所述多个基因的表达水平与所述功能活性或细胞反应之间的一个或多个(例如，一套)因果关系的贝叶斯网络(“生成的细胞模型网络”)(步骤24)。生成的细胞模型网络，单独或共同地，包括关于关系的定量概率定向信息。所生成的细胞模型网络不是基于来自第一数据集和第二数据集的信息以外的基因表达和/或功能活性或细胞反应之间的已知生物关系。一个或多个生成的细胞模型网络可统称为一致细胞模型网络。

可对于对比细胞模型从第一数据集和第二数据集生成在多个基因的表达水平与功能活性或细胞反应之间的一个或多个(例如，一套)因果关系的贝叶斯网络(“生成的对比细胞模型网络”)(步骤26)。生成的对比细胞模型网络，单独地或共同地，包括关于关系的定量概率定向信息。所生成的细胞网络不是基于第一数据集和第二数据集中的信息以外的基因表达和/或功能活性或细胞反应之间的已知生物关系。一个或多个生成的对比模型网络可统称为一致细胞模型网络。

可以使用基于人工智能(基于AI)的信息学平台建立所述生成的细胞模型网络和生成的对比细胞模型网络。关于建立生成的细胞模型网络、建立生成的对比细胞模型网络和基于AI的信息学系统的进一步细节出现在下面IV.C部分。

应当指出的是，可以采用许多不同的基于AI的平台或系统来生成包括定量概率定向信息的因果关系的贝叶斯网络。虽然本文所描述的某些实施例采用一个特定的可商业获得的系统，即，来自GNS(剑桥，MA)的REFS^TM(逆向工程/正向模拟)，但对于实施方式并没有限制。适合实施一些实施方式的基于AI的系统或平台采用数学算法以在输入变量(例如，第一和第二数据集)之间建立因果关系，其仅仅基于输入的数据而没有考虑到之前存在关于任何潜在的、已建立的和/或验证的生物关系的知识。

例如，REFS^TM基于AI的信息学平台利用实验得到的粗的(原始的)或最少加工的输入生物学数据(如遗传、基因组学、外遗传、蛋白质组学、代谢组学和临床数据)，并迅速执行万亿次计算以确定在完整系统中分子如何相互作用。REFS^TM基于AI的信息学平台执行逆向工程过程，其旨在基于定量表示基础生物系统的输入数据建立计算机实施的细胞模型(例如，生成的细胞模型网络)。另外，可以在计算机执行的细胞模型的基础上开发和快速模拟关于基础生物系统的假设，以获得关于所述假设的伴有相关置信水平的预测。

通过这种方式，由定量的计算机实施的细胞模型表示生物系统，其中模拟“干扰”来学习生物系统(例如，疾病)的详细机制、有效的干预策略和/或确定哪些患者会对给定的治疗方案做出反应的临床生物标志物。传统的生物信息学和统计学方法，以及基于已知生物学的建模的方法，通常不能提供这些类型的深入见解。

建立了生成的细胞模型网络和生成的对比细胞模型网络后，对它们进行比较。鉴别至少存在于一些所生成的细胞模型网络中且在生成的对比细胞模型网络中不存在或具有至少一个显著不同的参数的一个或多个因果关系(步骤28)。这样的对比可以导致建立差异网络。可以使用差异网络建立模块进行对比、识别和/或差异(Δ)网络的建立，其在下面的IV.D部分进一步详细描述。

在一些实施方式中，输入数据集来自一种细胞类型和一种对比细胞类型，其基于该一种细胞类型建立一套细胞模型网络和基于该一种对比对照细胞类型建立另一套对比细胞模型网络。可以在该一种细胞类型的该套网络和对比细胞类型的该套网络之间进行差分。

在其它实施方式中，输入数据集来自多种细胞类型和多种对比细胞类型。可以分别对于每个细胞类型和每个对比细胞类型单独地生成一套细胞模型网络，和/或来自多种细胞类型和多种对比细胞类型的数据可以组合成各自的复合数据集。复合数据集生成与多种细胞类型(复合数据)对应的一套网络，和生成与多种对比细胞类型(对比复合数据)对应的另一套网络。可以对用于复合数据的该套网络对比于用于对比复合数据的该套网络执行差分。

在一些实施方式中，可以在两个不同的差异网络之间执行差分。该输出可被称为Δ-Δ网络。

可以为生成的细胞模型网络中的每个关系确定定量关系信息(步骤30)。类似地，可以确定生成的对比细胞模型网络中每个关系的定量关系信息(步骤32)。有关该关系的定量信息可以包括表示因果关系的指令、有关该关系的统计不确定性的量度(例如，曲线下面积(AUC)的统计测量)和/或该关系的强度的定量幅度(例如，一倍)的表达。可以使用定量关系信息确定生成的细胞模型网络中的各种关系的特性，来探索网络中作为潜在治疗靶标和/或生物标志物的每个活性中枢。这样的分析可以完全在计算机中基于来自生成的细胞模型网络的结果进行而没有采用任何实际的湿实验室实验。

在一些实施方式中，可以通过采用分子和细胞技术对网络中的活性中枢进行验证。这种用湿实验室的基于细胞的实验对输出进行信息后验证不需要执行，但它可以帮助建立探询的完整循环。图4示意性地描绘了示例性的基于AI的信息学系统(例如，REFS^TM基于AI的信息学系统)的功能性和基于AI的系统与探询式生物学平台(“平台”)的其他成分或部分之间相互作用的简化高水平图示。在图4A中，从生物过程的模型(例如，疾病模型)获得的各种数据集，如药物的剂量、治疗剂量、蛋白质表达、mRNA表达和许多相关功能测量(如OCR、ECAR)的任何一种被送入基于AI的系统中。如图4B所示，AI系统在被称为贝叶斯片段计数(Bayesian Fragment Enumeration)的过程中从输入的数据集创建“网络片段”文库，其包括驱动生物过程(例如，疾病)中的分子机制的变量(蛋白质、脂质和代谢物)(图4B)。

在图4C中，基于AI的系统选择文库中的网络片段的子集，并从该片段构建初始试验网络。基于AI的系统也选择文库中网络片段的不同子集来构建另一初始试验网络。最终从文库中网络片段的不同子集建立一套初始试验网络(例如，1000个网络)。该过程可以被称为平行总体采样。整体中的各个试验网络通过从文库中增加、减去和/或替代额外的网络片段进行进化或优化。如果得到附加数据，该附加数据可被结合到网络文库的网络片段中，并且可以通过各个试验网络的进化被结合到整套试验网络中。优化/进化过程完成后，整套试验网络可以被描述为生成的细胞模型网络。

如图4D中所示，整套生成的细胞模型网络可以用来模拟生物系统的行为。模拟可用于预测生物系统对于条件变化的行为，这可以使用基于细胞的或基于动物的湿实验室实验来验证。另外，可以使用模拟功能，通过向每个节点单独地施加模拟的扰动而同时观察对所生成的细胞模型网络中其他节点的影响，来得到在所生成的细胞模型网络中关系的定量参数。在下面的IV.C部分中提供进一步的细节。

基于AI的信息学系统的自动化逆向工程过程建立了一套生成的细胞模型网络，它是该细胞的无偏的和系统的基于计算机的模型。

该逆向工程决定了数据中的分子测量之间概率定向网络连接，和感兴趣的表型结果。分子测量中的变异使得能够学习这些实体和终点变化之间的概率的原因和效果关系。平台的机器学习特性也使得交叉训练和不断进化的基于数据集的预测成为可能。

数据中分子测量之间的网络连接是“概率性的”，部分地因为连接可以基于由计算机算法“学习”的观察数据集之间的相关性。例如，如果基于数据集的统计分析，蛋白质X和蛋白质Y的表达水平是正相关或负相关的，则可以分配因果关系以建立蛋白质X和Y之间的网络连接。这种推定的因果关系的可靠性可以由该连接的似然性进一步定义，其可以通过p值测定(例如，p<0.1、0.05、0.01等)。

数据中分子测量之间的网络连接是“定向的”，部分地是因为分子测量之间的网络连接(如由反向工程过程所确定的)反映连接的基因/蛋白质之间关系的原因和效果，以使得提高一种蛋白质的表达水平可能导致其他蛋白质的表达水平上升或下降，这取决于该连接是刺激的还是抑制的。

数据中分子测量之间的网络连接是“定量的”，部分地因为分子测量之间的网络连接，如通过该方法所确定的，可以在计算机中基于现有的数据集和与其相关的概率测量来模拟。例如，在分子测量之间所建立的网络连接中，理论上可能会增加或减少(例如，增加或减少1、2、3、5、10、20、30、50、100倍或更高)给定蛋白质的表达水平(或在网络中的“节点”)，和定量模拟其对网络中其它连接的蛋白质的影响。

数据中分子测量之间的网络连接是“无偏的”，至少部分地因为没有数据点被统计地或人为地截流，和部分地因为该网络连接是仅基于输入的数据，而不涉及关于所讨论的生物过程的现有知识。

数据中分子测量之间的网络连接是“系统的”和(无偏的)，部分地因为所有输入变量之间的所有潜在连接已被系统地考察，例如，以成对的方式。执行这种系统性探测的计算能力的可靠性随着输入变量数的增加而呈指数地提高。

在一般情况下，一套约1000个网络通常足以预测所有被测实体之间的概率因果定量关系。该套网络捕获数据中的不确定性，且使得对于每个模型预测计算置信度量成为可能。使用该套网络一起产生预测，其中整套中的单个网络预测的差异代表预测中的不确定性程度。此特征使得能够对于从模型生成的临床反应的预测分配置信量度。

一旦模型进行逆向工程，可以对整套模型进行进一步模拟质询以确定所讨论的生物过程如疾病状态的关键分子驱动子。

III.平台技术的示例性步骤和成分

仅用于说明目的，所述平台技术的以下步骤可以在下文被描述，用于整合从定制的广泛性发育障碍模型获得的数据和用于鉴别驱动广泛性发育障碍发病的新蛋白质/途径。由这一分析所得的关系图谱提供广泛性发育障碍的治疗靶标以及与广泛性发育障碍相关的诊断/预后标志物。本文描述的方法在US13,411460中有进一步描述，其整体内容通过引用明确地纳入本文。

此外，虽然下面的描述在某些部分中作为离散的步骤呈现，但它是用于说明的目的和简单的原因，因此，在现实中，这并不意味着这样的严格的步骤顺序和/或分界。此外，本发明的步骤可以独立地进行，且此处提供的本发明意图单独地包含各单个步骤，以及所述平台技术的一个或多个步骤(例如，任何一个、两个、三个、四个、五个、六个或所有七个步骤)的组合，其可以独立于其余的步骤而进行。

本发明还意图包括作为本发明的独立成分和实施方式的平台技术的所有方面。例如，所生成的数据集意图是本发明的实施方式。作为进一步的例子，生成的因果关系网络、生成的一致因果关系网络和/或生成的模拟因果关系网络也意图是本发明的实施方式。确定为广泛性发育障碍中独特的因果关系意图是本发明的实施方式。另外，对于广泛性发育障碍定制的模型也意图是本发明的实施方式。

A、定制模型构建

平台技术的第一步是建立用于生物系统或过程(例如广泛性发育障碍)的模型。广泛性发育障碍的实例是自闭症。如任何其他复杂的生物过程或系统一样，自闭症是复杂的病理状态，其特征在于多个独特的方面。例如，线粒体功能障碍可能在自闭症病理学上起到重要的作用。其结果是，自闭症细胞可以对与线粒体功能相关联的环境的扰动(例如潜在药物的治疗)做出不同于正常细胞响应于相同处理的反应。因此，解密与正常细胞的反应相比自闭症对药物治疗的独特反应是有利的。为此，可以建立定制的自闭症模型以模拟与自闭症疾病相关的细胞环境，例如，自闭症患者的淋巴母细胞或其它体液(如血清或尿液)。与线粒体功能有关的环境扰动，例如辅酶Q10，可应用来处理自闭症的细胞。线粒体功能测定，例如ATP和/或ROS可用来提供深入的生物学读数。

可以在定制的广泛性发育障碍模型中独立地研究反映广泛性发育障碍特征的不同方面的单独条件，和/或可以结合在一起。在一个实施方式中，在定制的广泛性发育障碍模型中研究了至少2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或更多的反映或模拟广泛性发育障碍的不同方面的状态的组合。在一个实施方式中，在定制的广泛性发育障碍模型中研究反映或模拟广泛性发育障碍的不同方面的状态的单个状态和另外地至少2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或更多状态的组合。在前述列表中给出的所有值也可以是范围的上限或下限，其意图是本发明的部分，例如，1至5、1至10、1至20、1至30、2至5、2至10、5至10、1至20、5至20、10至20、10至25、10至30或10至50个不同的状态。

作为对照，在类似的状态下培养一个或多个正常细胞系(例如，获自正常的、未患病的受试者，例如患有广泛性发育障碍的受试者的正常的、未患病的家庭成员，并由其获得与广泛性发育障碍相关的细胞)，以便确定广泛性发育障碍中独特的蛋白质或途径(见下文)。

广泛性发育障碍模型中可以包括来自同一患有广泛性发育障碍的受试者的多种细胞类型，例如淋巴母细胞和来自中枢神经系统的细胞，或者患有广泛性发育障碍的不同受试者的细胞。在某些情况下，不同的与广泛性发育障碍模型相关联的细胞之间的交互式或ECS实验可以针对几种相互关联的目的而进行。

在一些涉及交互的实施方式中，任选地在定义的处理条件下，在细胞模型上进行的实验被设计用于通过另一个细胞系统或群(如获自中枢神经系统的细胞)确定一个细胞系统或群(如淋巴母细胞)的细胞状态或功能的调制。根据典型的设置，第一细胞系统/群接触外部刺激成分，如候选分子(例如，小的药物分子、蛋白质)或候选条件(例如，缺氧、高糖环境)。作为响应，第一细胞系统/群改变其转录组、蛋白质组、代谢组和/或相互作用组，从而导致可以很容易地在细胞内和细胞外检测的变化。例如，转录组的变化可以通过多个目标mRNA的转录水平测量；蛋白质组的变化可以通过多个目标蛋白质的表达水平测量；以及代谢组的变化可以通过对给定代谢物特别设计的分析通过多个目标代谢物的水平测量。可选择地，上述所指的代谢组和/或蛋白质组(至少关于某些分泌的代谢物或蛋白质)的变化也可以通过他们对第二细胞系统/群的效应进行测量，包括对第二细胞系统/群的转录组、蛋白质组、代谢组、相互作用组的调节。因此，该实验可用于确定第一细胞系统/群分泌的目标分子在不同处理条件下对第二细胞系统/群的影响。该实验也可以用于通过例如蛋白质组学差分筛选用来鉴别作为第一细胞系统(响应于外部刺激成分处理)对另一细胞系统的信号传导的结果而调节的任何蛋白质。相同实验设置也可以适应于反向设置，以至于也可以评估两个细胞系统间的相互影响。通常，对于这种类型的实验，细胞系对的选择主要是基于例如来源、疾病状态和细胞功能的因素。

虽然双细胞系统通常包括在这种类型的实验设置中，但类似的实验也可以被设计用于两个以上的细胞系统，例如，通过在单独的固相支持物上固定各个不同的细胞系统。

定制的模型一旦建立，可以将一个或多个“扰动”应用到该系统，如病人与病人之间的遗传变异，或具有/没用某些药物或前药进行处理。可以使用本领域公认的或专有的各种方法测量这种扰动对系统的影响，包括对广泛性发育障碍相关的细胞和正常对照细胞的影响，如下文IV.B节中所描述的。

在一个示例性实施方案中，使用来自患有广泛性发育障碍(如自闭症)的一个或多个受试者的细胞系和来自对照(例如，正常细胞，例如来自未患病的受试者的细胞，如所述患有广泛性发育障碍的受试者的一个或多个未受影响的家庭成员)的细胞系。在一个实施方案中，将细胞用或不用环境扰动处理，例如，用辅酶Q10处理。

通过实施本文中所描述的步骤，可以在本发明的平台技术的整个步骤中建立和使用定制的广泛性发育障碍模型，以最终确定在该广泛性发育障碍中独特的因果关系。但是，本领域技术人员可以理解，用来生成广泛性发育障碍的初始的“第一代”一致因果关系网络的定制建立的广泛性发育障碍模型可以随着时间不断地进化或扩展，例如，通过引入另外的细胞系和/或另外的合适条件。可以收集来自进化的广泛性发育障碍细胞模型的另外的数据，即来自所述细胞模型的新增加部分的数据。然后可以将从扩展或进化的细胞模型(即，从细胞模型的新增加部分)收集的新数据引入先前用来生成“第一代”一致因果关系网络的数据集，以便生成更强大的“第二代”一致因果关系网络。然后可以从“第二代”一致因果关系网络确定该广泛性发育障碍独特的新因果关系。以这种方式，细胞模型的进化提供了一致因果关系网络的演变，从而提供对于该广泛性发育障碍的调节子的新的和/或更可靠的深入了解。

本发明提供了包括使用环境影响剂治疗细胞的方法。“环境影响剂”(Env-influence)为以允许人疾病环境改变、重建回或维持正常或健康环境(从而导致正常状态)的有益方式影响或调节人的疾病环境的分子。环境影响剂包括如下定义的多维细胞内分子(MIM)和表观代谢转变剂(Epi-shifter)。MIM和表面代谢转变剂进一步详细地描述于US 12/777,902(US2011-0110914)中，其整体内容通过引用明确纳入本文。

术语“多维细胞内分子(MIM)”是由身体天然产生的和/或存在于人的至少一个细胞中的内源分子的分离形式或合成产生的形式。MIM的特征在于具有下列功能中的1个或多个、2个或更多个、3个或更多个或全部。MIM能够进入细胞，进入细胞包括完全或部分进入细胞，只要所述分子的生物活性部分完全进入细胞即可。MIM能够在细胞内诱导信号转导和/或基因表达机制。MIM是多维的，因为所述分子具有治疗和载体例如药物递送作用。MIM也是多维的，因为所述分子在疾病状态中以一种方式作用并且在正常状态中以不同方式作用。优选地，MIM选择性作用于疾病状态的细胞，并且在正常状态的(匹配)细胞中基本上没有作用。优选地，MIM选择性地使疾病状态的细胞在表型、代谢状态、基因型、mRNA/蛋白质表达水平等上与正常状态的(匹配)细胞更接近。

在一个实施方案中，MIM也是表观代谢转变剂。在另一个实施方案中，MIM不是表观代谢转变剂。本领域技术人员应理解，本发明的MIM也意欲包括两种或更多种内源分子的混合物，其中所述混合物的特征在于具有一种或多种上述功能。混合物中的内源分子以使混合物用作MIM的比率存在。

MIM可以是基于脂质或基于非脂质的分子。MIM的实例包括但不限于CoQ10、乙酰Co-A、棕榈酰Co-A、L-肉毒碱、氨基酸例如酪氨酸、苯丙氨酸和半胱氨酸。在一个实施方案中，MIM为小分子。在本发明的一个实施方案中，MIM不是CoQ10。MIM可由本领域技术人员使用本文中详细描述的任何测定方法常规地鉴定。

如本文中所使用的，“表观代谢转变剂”是调节从健康(或正常)状态至疾病状态以及相反过程的的代谢转变的分子(内源或外源的)，从而维持或重建人的组织、器官、系统和/或宿主健康。表观代谢转变剂能够实现组织微环境的标准化。例如，表观代谢转变剂包括当加入细胞或从细胞去除时能够影响细胞的微环境(例如，代谢状态)的任何分子。本领域技术人员应理解本发明的表观代谢转变剂也意在包括两种或更多种分子的混合物，其中所述混合物的特征在于具有上述功能的一个或多个。混合物中的分子以使混合物用作表观代谢转变剂的比率存在。

在一些实施方案中，所述表观代谢转变剂为酶，例如直接参与催化柠檬酸循环中的一个或多个反应或产生柠檬酸循环中间产物的酶，该酶的过量驱动柠檬酸循环。在一种实施方案中，所述酶为促进克雷布斯循环的组分酶或酶复合物例如合酶或连接酶。示例性酶包括琥珀酰CoA合酶(克雷布斯循环酶)或丙酮酸羧化酶(催化丙酮酸的可逆羧化以形成草酰乙酸盐(OAA)(克雷布斯循环的中间产物)的连接酶)。

在一些实施方案中，本发明的酶，例如，本文中描述的MIM或表观代谢转变剂，与在表2-6中列出的蛋白质具有共同的活性。如本文中所使用的，短语“与表2-6中列出的蛋白质具有共同的活性”是指一种蛋白质能够表现出与所述蛋白质至少部分相同或相似的活性。在一些实施方案中，本发明的蛋白质表现出25％或更高的所述蛋白质的活性。在一些实施方案中，本发明的化合物表现出高达且包含约130％的所述蛋白质的活性。在一些实施方案中，本发明的化合物表现出约30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％、101％、102％、103％、104％、105％、106％、107％、108％、109％、110％、111％、112％、113％、114％、115％、116％、117％、118％、119％、120％、121％、122％、123％、124％、125％、126％、127％、128％、129％或130％的所述蛋白质的活性。应理解本段列出的各个值可以被术语“约”修饰。另外，应理解本发明也要包括由本段中列出的任意两个值所限定的任何范围。例如，在一些实施方案中，本发明的蛋白质表现也约50％至约100％的所述蛋白质的活性。

B.数据收集

在一般情况下，可从任何定制的广泛性发育障碍的模型系统收集两种类型的数据。一种类型的数据(例如，第一数据集，第三数据集)通常涉及某些大分子的水平，如DNA、RNA、蛋白质、脂质等。此类别的示例性数据集是蛋白质组学数据(例如，涉及来自样本的所有或基本上所有可测量蛋白质的表达的定性和定量数据)。另一类型的可任选被收集的数据是功能数据(例如，任选的第二数据集，第四数据集)，其反映了第一类型数据中的变化导致的表型改变。

对于所述第一数据集，在一些示例性的实施方式中，进行定量聚合酶链反应(qPCR)和蛋白质组学分析来通过定量聚合酶链反应(qPCR)和蛋白质组学确定细胞mRNA和蛋白质表达的变化的特征。可以使用市售的RNA分离试剂盒分离总RNA。cDNA合成后，可以使用用于疾病区域或细胞过程，如血管生成、细胞凋亡和糖尿病，的特定市售qPCR阵列(例如，那些购自SA Biosciences的)，按照制造商的说明来确定一组预定的基因的特征。例如，Biorad CFX-384扩增系统可用于所有的转录谱分析实验。数据收集(C_t)后，可以使用如制造商的说明中列出的δCt方法确定相对于对照的最终倍数变化。可以按后续章节中所描述的进行蛋白质组学样品分析。

所述方法可以采用数百个具有类似性质的样品的大规模高通量的定量蛋白质组学分析，并提供用于确认细胞输出差异所必需的数据。

有许多适合这一目的本领域公认的技术。下面简要地描述示例性的技术，与质谱结合的iTRAQ分析。

定量蛋白质组学方法是基于采用8-plex iTRAQ试剂的稳定同位素标记和用于肽鉴别和定量的2D-LC MALDI MS/MS。使用这种技术的定量是相对的：肽和蛋白质被赋予相对于参比样本的丰度比。多重iTRAQ实验中常用的参比样本有利于整个多重iTRAQ实验中样本的对比。

例如，为实施这种分析方案，可以按照制造商的建议将6个初始样品和两个对照池样品组合成一个8-plex iTRAQ混合物。然后可以由二维液相色谱法将这一8样品的混合物分离，第一维度中的强阳离子交换(SCX)，和第二维度中的反相HPLC，然后可以进行质谱分析。

本文提供了可以使用的示例性实验室程序的简要概述。

蛋白质的提取：可以用8M尿素裂解缓冲液与蛋白酶抑制剂(ThermoScientific Halt蛋白酶抑制剂,不含EDTA)裂解细胞，并在冰上孵育30分钟，每10分钟涡旋(vertex)5秒。可以以5秒的脉冲通过超声波完成裂解。可以将细胞裂解物在14000×g下离心15分钟(4℃)以除去细胞碎片。可以进行Bradford分析以确定蛋白质的浓度。取自各个样品的100ug蛋白质可以还原(10mM的二硫苏糖醇(DTT)，55℃，1小时)、烷基化(25mM的碘乙酰胺，室温，30分钟)和用胰蛋白酶消化(1:25w/w，200mM三乙基碳酸氢铵(TEAB)，37℃，16小时)。

分泌组样品的制备：1)在一个实施方式中，可以将细胞培养在无血清培养基中：可以通过冷冻干燥器浓缩条件化的培养基、还原(10mM的二硫苏糖醇(DTT)，55℃，1小时)、烷基化(25mM的碘乙酰胺，在室温下，孵育30分钟)和然后用丙酮沉淀脱盐。可以用胰蛋白酶(1:25w/w，200mM三乙基碳酸氢铵(TEAB)，37℃，16小时)消化来自浓缩的条件化培养基的等量蛋白质。

在一个实施方式中，细胞可以培养在含血清培养基中：可以使用3kMWCO Vivaspin柱(GE Healthcare Life Sciences)减小培养基的体积，然后可以用1xPBS(Invitrogen)重构。可以按照制造商的说明使用带有缓冲交换的改进以优化条件培养基应用的AlbuVoid柱(Biotech Support Group,LLC)从所有样品中耗尽血清白蛋白质。

iTRAQ 8Plex标记：可以将来自各实验组中各个胰蛋白酶消化的试样汇集在一起以建立汇集的对照样品。可以根据制造商的方案(AB Sciex)将来自各个样品和汇集的对照样品的相等试样用iTRAQ 8Plex试剂标记。反应物可以组合，真空至干，通过添加0.1％甲酸再悬浮，和通过LC-MS/MS进行分析。

2D-NanoLC-MS/MS：所有的标记肽混合物可以通过在线2D-nanoLC分离并通过电喷雾串联质谱进行分析。实验可以在与配备有纳米电喷射离子源(Thermo Electron,Bremen,Germany)的LTQ Orbitrap Velos质谱仪连接的Eksigent 2D nanoLC Ultra系统上进行。

可以将肽混合物以4μL/分钟的流量注入5厘米SCX柱(300μm ID，5μm，聚SULFOETHYL Aspartamide柱，来自PolyLC列，哥伦比亚，MD)，和在10个离子交换洗脱片段中洗脱到C18捕获柱(2.5厘米，100μm ID，5μm，300埃ProteoPepII，来自New Objective,Woburn,MA)中和用H₂O/0.1％FA洗涤5分钟。然后可以进一步用2-45％B(H₂O/0.1％FA(溶剂A)和ACN/0.1％FA(溶剂B))梯度在15厘米熔融石英柱(75μm ID，5μm，300埃ProteoPepII，来自New Objective,Woburn,MA)上以300nL/分钟进行分离120分钟。

可以在Orbitrap中以30,000分辨率获得全扫描MS谱(m/z 300-2000)。可以对于使用高能C-阱解离(HCD)的片段化顺序地分离最强的离子(最多10个)和动态排除(dynamically exclude)30秒。可以用1.2Da的分离宽度进行HCD。可以在分辨率为7500的Orbitrap中扫描所产生的碎片离子。可以通过Xcalibur 2.1用foundation 1.0.1控制LTQ Orbitrap Velos。

多肽/蛋白质鉴定和定量：可以通过使用Proteome Discoverer软件(Thermo Electron)用Mascot搜索引擎对SwissProt数据库的自动数据库检索鉴别多肽和蛋白质。检索参数可以包括对于MS公差(MS tolerance)的10ppm、对于MS2公差的0.02Da和完全胰蛋白酶消化以允许最多2个缺失的裂隙。脲基甲基化(C)可以设置为固定的修饰。氧化(M)，TMT6，和脱酰胺化(NQ)可以设置为动态的修饰。肽和蛋白质的鉴定可以用Mascot显著性阈值(P<0.05)过滤。过滤器可以容许蛋白质鉴别的99％置信水平(1％FDA)。

Proteome Discoverer软件可以对报告离子应用校正因子，且如果不是所有定量通道都存在，可以拒绝所有的定量值。可以通过平均强度的标准化获得相对蛋白质定量。

关于第二类型的数据，在一些示例性实施方式中，广泛性发育障碍和正常模型的生物能量学图谱可以采用Seahorse^TMXF24分析仪来实现对糖酵解和氧化磷酸化成分的理解。

具体而言，可以将细胞以最佳密度接种在Seahorse培养板上。这些细胞可以被接种在100μl的培养基或处理溶液中并置于含5％CO₂的37℃培养箱中。两小时后，当细胞附着到24孔板上，可以添加另外的150μl的培养基或处理溶液且板可留在培养温育箱内过夜。这一两步接种程序允许细胞在培养板中均匀分布。包含氧和pH传感器的Seahorse盒可以在37℃的无二氧化碳培养箱中在校准流体中水化过夜。通常将三个线粒体药物加载到该盒的三个端口上。可以将寡霉素(复合体III抑制剂)、FCCP(解偶联剂)和鱼藤酮(复合体I抑制剂)分别加载到该盒的端口A、B和C中。可以在非缓冲的DMEM培养基中以10倍浓度制备所有药物原液。在测定前,可以先将盒与线粒体化合物在无CO₂培养箱中孵育约15分钟。可以在含有在正常的生长培养基中发现的浓度的葡萄糖的DMEM基非缓冲培养基中洗涤Seahorse培养板。细胞可以用630μl非缓冲培养基成层，并可以在将其置于具有预校准盒的Seahorse仪中之前在无CO₂培养箱中平衡。可以在通过端口启动药物注射前，将该仪器运行具有混合、等待和测量周期的三四个循环以获得基线。在引入下一药物之前可以有两个循环。

OCR(耗氧率)和ECAR(细胞外酸化率)可以通过电极在7μl室中记录且可以用推靠seahorse培养板的盒来建立。

C、数据整合与计算机模型生成

一旦已获得相关的数据集，可以使用基于AI的信息学系统或平台(例如，REFS^TM平台)进行数据集的整合和计算机执行的统计模型的生成。例如，示例性的基于AI的系统可以产生蛋白质相关性的基于模拟的网络作为代谢终点(ECAR/OCR)的关键驱动子。见图4。关于REFS^TM系统的一些背景细节可见于Xing等,“Causal Modeling Using Network Ensemble Simulations ofGenetic and Gene Expression Data Predicts Genes Involved in RheumatoidArthritis”,PLoS Computational Biology,vol.7,issue.3,1-19(2011年3月)(e100105)和Periwal的7,512,497号美国专利，其中各自的全部内容以其整体明确地通过引用并入本文。在本质上，如前面所述，REFS^TM系统是基于AI的系统，它采用数学算法来建立输入变量(例如，蛋白质表达水平、mRNA表达水平以及相应的功能数据，如在Seahorse培养板上测量的OCR/ECAR值)之间的因果关系。这个过程只基于单独的输入数据，而没有考虑之前存在的关于任何潜在的、已建立的和/或验证的生物学关系的知识。

特别是，本发明的平台的显著优势是，基于AI的系统是基于从细胞模型获得的数据集，而不诉诸于或考虑涉及该生物过程的本领域中的任何现有的知识。此外，优选地，没有统计地或人为地切除数据点，而是所有获得的数据被送入用于确定蛋白质相关性的AI系统中。因此，从平台产生的所得统计模型是无偏的，因为他们不考虑任何已知的生物学关系。

具体来说，可以将来自蛋白质组学和ECAR/OCR的数据输入到基于AI的信息系统中，其如上所述地基于数据关联构建统计模型。然后使用以下方法对各种疾病与正常情况(包括处理和条件)得到蛋白质相关性的基于模拟的网络。

在下面相对于图5呈现用于构建生成的(例如，优化或进化的)网络的示例性过程的详细描述。如上所述，将来自蛋白质组学的数据和任选的功能细胞数据输入到基于AI的系统中(步骤210)。预处理输入数据(其可能是原始数据或最低处理的数据)，其可以包括标准化(例如，使用分位函数或内部标准)(步骤212)。预处理还可以包括输入缺失的数据值(例如，通过使用K最近邻(K-NN)算法)(步骤212)。

预处理的数据用来构建网络片段文库(步骤214)。网络片段定义测量的变量(输入数据)的所有可能的小集合(如2-3个成员集合或2-4个成员集合)之间的定量的、连续的关系。在片段中变量之间的关系的关系可以是线性的、逻辑的、多项的、显性或隐性纯合的等。各个片段中的关系被分配反映候选关系可能如何给予输入数据的贝叶斯概率得分，且还对于其数学复杂性而惩罚该关系。通过为从输入数据推断的所有可能的成对和三元关系(且在一些实施方式中，还有四元关系)评分，可以识别文库中最有可能的片段(很可能片段)。也基于输入的数据计算关系的定量参数并对于各个片段进行储存。可以在片段列举中使用各种模型类型，包括但不限于线性回归、逻辑回归分析、(方差分析)ANOVA模型、(协方差分析)ANCOVA模型、非线性/多项式回归模型和甚至非参数回归。对模型参数的先验假定可以假设与模型中使用的参数的数目相关的Gull分布或贝叶斯信息标准(BIC)罚分。在网络推论过程中，从片段文库中的片段子集构建在一套初始试验网络中的各个网络。该套初始试验网络中的各个初始试验网络用片段文库中不同片段子集构建(步骤216)。

构成贝叶斯网络和网络片段的基础的数学表达式的概述介绍如下，其基于Xing等,“Causal Modeling Using Network Ensemble Simulations ofGenetic and Gene Expression Data Predicts Genes Involved in RheumatoidArthritis,”PLoS Computational Biology,vol.7,issue.3,1-19(2011年3月)(e100105)。

具有随机变量X＝X₁,Κ,X_n的多元系统可以以多元概率分布函数P(X₁,Κ,X_n；Θ)为特征，其包括了大量的参数Θ。该多元概率分布函数可以分解为因数并由局部条件概率分布的积表示：

P (X_{1}, K, X_{n}; Θ) = Π_{i - 1}^{n} P_{i} (X_{i} | Y_{j 1}, . . ., Y_{{jK}_{i}}; Θ_{i})

其中各个变量X_i独立于给出其K_i父变量(parent variable)(其是)的其非派生变量。分解为因数后，各个局部概率分布具有其自己的参数Θ_i。

多元概率分布函数可以以不同的方式利用各特定因数分解和相应的作为不同概率模型的参数来分解因数。各特定的因数分解(模型)可以由具有各个变量X_i的顶点和表示局部条件分布中变量之间的相关性的顶点之间的有向边的有向非循环图(DAC)表示。各包括顶点和相关有向边的DAG子图是网络片段。

通过确定最可能的因数分解和给出输入数据的最可能的参数对模型进行进化或优化。这可以被描述为“学习贝叶斯网络”，或者换句话说，给出输入数据的训练集，找到最佳匹配输入数据的网络。这是通过使用相对于输入数据评估各网络的评分函数完成的。

贝叶斯框架被用于确定给出输入数据的因数分解的可能性。贝叶斯定律阐明，模型M的后验概率P(D|M)，给定数据D，是与给定模型假设的数据的后验概率P(D|M)的积乘以模型的先验概率，P(M)，的积成比例的，假定数据的概率，P(D)，在模型间是恒定的。这由下面的公式表示：

P (M | D) = \frac{P (D | M) * P (M)}{P (D)} .

假设模型的数据的后验概率是参数先验分布上数据似然性的积分：

P(D|M)＝∫P(D|M(Θ))P(Θ|M)dΘ。

假设所有模型是等可能的(即，P(M)是恒定的)，给定数据D的模型M的后验概率可以因数分解成各个局部网络片段M_i的参数积分的积，如下所示：

P (M | D) = Π_{i = 1}^{n} &Integral; P_{i} (X_{i} | Y_{j 1}, . . ., Y_{j K_{i}}; Θ_{i}) .

请注意，在上述等式中，主要的常数项已被略去。在一些实施方式中，可以将取模型P(D|M)的后验概率的负对数的贝叶斯信息标准(BIC)用于如下所示地对各个模型“评分”：

S_{tot} (M) = - \log P (M \ | D) = Σ_{i = 1}^{n} S (M_{i}),

其中模型M的总评分S_tot是各个网络片段的局部评分的和。BIC进一步给出用来确定各单个网络片段的评分的表达式：

S (M_{i}) \approx S_{BIC} (M_{i}) = S_{MLE} (M_{i}) + \frac{κ (M_{i})}{2} \log N

其中κ(M_i)是模型M_i中拟合参数的数目和N是样品(数据点)的数目。S_MLE(M_i)是网络片段的似然函数的负对数，其可以从用于各个网络片段的函数关系计算出来。对于BIC评分，得分越低，模型越有可能拟合输入数据。

整套试验网被全局地优化，它可以被描述为优化或进化网络(步骤218)。例如，试验网络可以根据Metropolis Monte Carl采样算法进化和优化。模拟退火可用于通过局部转化来优化或进化整体中的各个实验网络。在一个示例的模拟退火过程中，通过从文库中添加网络片段，通过从试验网络删除网络片段，通过取代网络片段或通过以其他方式改变网络的拓扑结构来改变各个试验网络，且然后计算网络的新评分。一般来讲，如果评分改善，则保持这种变化，和如果评分恶化，则拒绝该变化。“温度”参数允许保持恶化评分的一些局部变化，这有助于在避免一些局部极小值的优化过程。“温度”参数随着时间降低，以允许优化/进化过程会聚。

所有或部分网络推理过程也可以与不同试验网络平行进行。各个网络可以在单独的处理器和/或在单独的计算设备上平行优化。在一些实施方式中，优化过程可以在包括并行操作的数百到数千个处理器的超级计算机上进行。可以在并行处理器上进行的优化过程之间共享信息。

优化过程可以包括从整体中放弃无法满足总体评分的阈值标准的任何网络的网络过滤器。放弃的网络可被新的初始网络代替。此外，任何不是“无尺度”的网络可以从整体中放弃。整套网络已被优化或进化后，其结果可被称一套生成的细胞模型网络，它可以被统称为生成的一致网络。

D、模拟以提取定量关系信息和用于预测

模拟可以被用来提取关于生成的细胞模型网络中的各关系的定量参数信息(步骤220)。例如，用于定量信息提取的模拟可以涉及扰动(增加或减少)网络中的各个节点10倍，并计算模型中的其他节点(例如，蛋白质)的后验分布。通过t检验比较终点与每组100个样品的假设和0.01显著性赶上值。t检验统计值是100个t检验的中值。通过使用这种模拟技术，为整套网络中的各个关系生成代表预测强度的AUC(曲线下面积)和代表驱动终点的节点的计算机计算幅度的倍数变化。

可采用本地计算机系统的关系量化模块来指导基于AI的系统进行扰动及提取AUC信息和倍数信息。提取的定量信息对于连接父节点与子节点的各个边界可包括倍数变化和AUC。在一些实施方式中，定制的R程序可用于提取定量信息。

在一些实施方式中，可以使用整套生成的细胞模型网络来通过模拟预测对条件变化的反应，其可以随后通过基于细胞的，或基于动物的湿实验室实验证实。

基于AI的系统的输出可以是定量关系参数和/或其他的模拟预测(222)。

E、生成差异(Δ)网络

也可以使用差异网络建立模块来产生在所生成的细胞模型网络和所生成的对比细胞模型网络之间的差异(Δ)网络(例如与广泛性发育障碍相关的细胞产生的网络和由对照细胞生成的网络之间的差异(Δ)网络)。如上所述，在一些实施方式中，差异网络比较所生成的细胞模型网络和生成的对比细胞模型网络中关系的所有定量参数。在差异网络中用于各个关系的定量参数是基于该对比。在一些实施方式中，可以在各种差异网络之间执行差分，这可称为Δ-Δ网络。差异网络创建模块可以是程序或用PERL编写的脚本。

F、网络的可视化

用于整套网络和差异网络的关系值可以使用网络可视化程序(例如，来自Cytoscape consortium的用于复杂的网络分析和可视化的Cytoscape开源平台)而可视化。在网络的视觉描绘中，各个边界的厚度(例如，连接蛋白质的各条线)表示倍数变化的强度。边界也是定向的以表明因果性，和各个边界有相关的预测置信水平。

G、示例性的计算机系统

图6示意性地描述了可以在一些实施方式中用于与基于AI的信息学系统进行通乞讯以生成差异网络、用于可视化网络、用于保存和存储数据和/或用于与用户进行交互的示例性计算机系统/环境。如上面所解释的，用于基于AI的信息学系统的计算可以在拥有数百或数千个直接或间接地与示例性计算机系统交互的并行处理器的单独超级计算机上进行。该环境包括具有相关外周设备的计算设备100。计算设备100是可编程的以实施用于执行本文所教导的各种方法或方法部分的可执行代码150。计算设备100包括存储装置116，如硬盘驱动器、CD-ROM或其他的非临时性计算机可读介质。存储设备116可以存储操作系统118和其他相关软件。计算设备100还可以包括存储器106。存储器106可包括计算机系统存储器或随机存取存储器，例如DRAM、SRAM、EDO RAM等。存储器106还可以包括其它类型的存储器，或它们的组合。计算设备100可以在存储设备116和/或存储器106中存储用于执行和处理可执行代码150的各个部分的指令。

可执行代码150可以包括用于与基于AI的信息学系统190通讯、用于生成差异网络(例如，差异网络创建模块)、用于从基于AI的信息学系统提取定量关系信息(例如，关系定量模块)和用于可视化网络(例如，Cytoscape)的代码。

在一些实施方式中，计算设备100可以直接或间接地与基于AI的信息学系统190(例如，用于执行REFS的系统)通讯。例如，计算设备100可以通过利用网络将数据文件(例如，数据帧)传送到基于AI的信息学系统190而与基于AI的信息学系统190通讯。另外，计算设备100可以具有可执行代码150，其提供了基于AI的信息学系统190的接口和指令。

在一些实施方式中，计算设备100可以直接或间接地与一个或多个为输入数据集提供数据的实验系统180通讯。用于生成数据的实验系统180可以包括用于基于质谱的蛋白质组学、微阵列基因表达、qPCR基因表达、基于质谱的代谢组学和基于质谱的脂质组学、SNP微阵列、功能分析组和其他体外生物学平台和技术的系统。

计算设备100还包括处理器102，并且可包括一个或多个附加的处理器102'，用于执行存储在存储器106中的软件和用于控制系统硬件、外周设备和/或外周硬件的其他程序。处理器102和处理器102'各自可以是单核处理器或多核(104和104')处理器。可以在计算设备100中采用虚拟化，以便计算设备中的基础结构和资源可动态共享。虚拟化处理器也可以与可执行代码150和存储装置116中的其他软件一起使用。可提供虚拟机114来操纵在多个理器上运行的过程，以使得该过程表现为只使用一个计算资源而不是多个。多个虚拟机也可以用于一个处理器。

用户可以通过可以显示用户界面124或任何其他界面的可视显示装置122，如计算机监视器，与计算设备100互动。显示装置122的用户界面124可用于显示原始数据、网络的可视化表现等。可视显示装置122也可以显示示例性实施方式的其他的方面或元件(例如，用于存储装置116的图标)。计算设备100可以包括其他I/O设备，例如键盘或多点触控界面(例如，触摸屏)108和点击设备110(例如，鼠标、轨迹球和/或触控板)，以用于从用户接收输入。键盘108和点击设备110可通过有线和/或无线连接与可视显示装置122和/或计算设备100连接。

计算设备100可以包括经由局域网(LAN)、广域网(WAN)或互联网，通过多种连接(包括但不限于，标准电话线、局域网或广域网连接(例如，802.11,T1,T3,56kb,X.25)、宽带连接(如ISDN、帧中继、ATM)、无线连接、控制器局域网络(CAN)或一些上述中任何或所有连接的组合)的与网络设备126的网络接口112。网络接口112可以包含内置的网络适配器、网络接口卡、PCMCIA网卡、卡式总线网络适配器(card bus networkadapter)、无线网络适配器、USB网络适配器、调制解调器或适用于实现计算设备100与能够通讯的任何类型的网络接口和执行在此描述的操作的任何其他设备。

此外，计算设备100可以是任何计算机系统，如工作站、台式计算机、服务器、笔记本电脑、手持式计算机或其他形式的能够通讯和并具有足够的处理器能力和存储容量以执行本文所描述的操作的计算或通讯装置。

计算设备100可以运行任何操作系统118如任何版本的微软Windows操作系统、不同版本的Unix和Linux操作系统、用于Macintosh电脑的任何版本的MACOS、任何嵌入式操作系统、任何实时操作系统、任何开源操作系统、任何专有操作系统、任何用于移动计算设备的操作系统或能够运行在计算设备上并执行本文描述的操作的任何其他操作系统。操作系统可以以原始模式或模仿模式运行。

H.用于鉴定作为广泛性发育障碍的治疗靶点和/或诊断标志物的示例性细胞模型和蛋白质分析

几乎所有的疾病状况都涉及不同细胞类型和/或器官系统之间复杂的相互作用。在一个细胞类型或器官中关键功能的扰动可以导致对其他相互作用的细胞类型和器官的次生效应，且这样的下游变化可以随之反馈于初始变化并导致进一步的复杂化。

因此，将给定疾病状况或过程解析为其组成部分(如成对细胞或器官之间的相互作用)并系统地探查这些成分之间的相互作用以获得该疾病状况的更完整的、全面的认识可能是有利的。

为此，申请人已鉴定了用于本发明的发现平台的与广泛性发育障碍(例如自闭症和阿尔茨海默病)相关的多种疾病状况相关的多组细胞对，并使用该发现平台进行了实验，以解密对于特定的疾病状态重要的关键的决定性差异。如本文所述对下述细胞系进行加工和分析。

在所列出的各疾病状况中可采用多种应激条件/应激源。这些应激条件/应激源可以形成细胞系的外部刺激。例如，细胞可以使用辅酶Q10处理。

1.蛋白质组学样品分析

在某些实施方式中，所述方法采用具有相似性质的数百个样品的大规模高通量定量蛋白质组学分析，并提供确定细胞输出差异所需的数据。

有许多本领域认可的技术适合于这一目的。下面简要地介绍一个示例性的技术，与质谱相结合的iTRAQ分析。

为了用iTRAQ技术提供用于相对定量的参比样品，创建了多个QC池。从Cell#1和Cell#2样品产生由各个样品的等分试样组成的两个独立的QC池，这些样品对于上清液和沉淀分别记为QCS1和QCS2及QCP1和QCP2。为了允许在两个细胞系间进行蛋白质浓度比较，来自如上所述的QC池的细胞沉淀等份试样以等体积混合以产生参比样品(QCP)。

定量蛋白质组学方法是基于用8-plex iTRAQ试剂的稳定同位素标记和用于肽识别和定量的2D-LC MALDI MS/MS。使用这种技术的定量是相对的：肽和蛋白质被赋予相对于参比样品的丰度比率。多重iTRAQ实验中的共同参比样品有助于多个iTRAQ实验之间的样品的比较。

要实施这个分析方案，根据制造商的说明，将6个原始样品和两个对照池样品组合成8-plex iTRAQ混合物，对照池样品用113和117试剂标记。然后，将这一8样品的混合物通过二维液相色谱法分离；第一维中的强阳离子交换(SCX)，和第二维度中的反相HPLC。将HPLC洗脱液直接分馏到MALDI板上，并在MDS SCIEX/AB 4800MALDI TOF/TOF质谱仪分析上分析该板。

在没有附加信息的情况下，假定蛋白质表达中的最重要变化是在不同处理条件下的相同细胞类型内的那些变化。出于这个原因，在单独的iTRAQ混合物中对来自Cell#1和Cell#2的原始样品进行分析。为了便于比较Cell#1与Cell#2样品中的蛋白质表达，在没被原始或细胞系特异性的QC样品(QC1和QC2)占用的可用“iTRAQ插槽”中分析通用QCP样品。

本文提供使用的实验室程序的简要概述。

a.从细胞上清液样本提取蛋白质

对于细胞上清液样品(CSN)，来自培养基的蛋白质的存在大大超过由培养的细胞所分泌的蛋白质。为了试图降低这一背景，实施前期丰富蛋白质的耗减。由于特定的亲和柱不可用于牛或马血清蛋白质，因此使用了抗-人IgY14柱。尽管抗体是针对人蛋白质的，但预计由该抗体的多克隆性质所提供的广谱特异性以完成存在于所使用的细胞培养基中的牛和马蛋白质的耗减。

在研究开始之前，在10毫升IgY14耗减柱上加载200μl等分的CSN QC材料以测定流过材料中总蛋白质浓度(二喹啉甲酸(BCA)分析)。然后选择加载体积以实现含约40μg总蛋白质的贫化级分。

b.从细胞沉淀提取蛋白质

Cell#1和Cell#2的等份试样在用于BGM的组织样品分析的“标准”裂解缓冲液中裂解，并通过BCA法测定总蛋白质含量。在确定了这些代表性细胞裂解物的蛋白质含量后，将所有的细胞沉淀样品(包括1.1节中所描述的QC样品)处理成细胞裂解物。将约40μg总蛋白质的裂解物量在处理流程中继续。

c.用于质谱的样品制备

样品制备遵循标准操作程序，并由如下构成：

·蛋白质的还原和烷基化

·反相柱上的蛋白质清洁(仅细胞沉淀)

·用胰蛋白酶消化

·iTRAQ标记

·强阳离子交换色谱-六个级分的收集(Agilent 1200系统)

·HPLC分离和点样至MALDI板(Dionex Ultimate3000/Probot系统)

d.MALDI MS和MS/MS

HPLC-MS通常采用在线ESI MS/MS策略。BG Medicine使用离线的LC-MALDI MS/MS平台，其导致在原始样品间观察到的蛋白质集的更好的一致性，而不需要多次注射同一样品。在所有iTRAQ混合物第一手数据收集之后，因为肽部分保留在MALDI目标板上，可以第二次使用定向的MS/MS采集模式(其来自在第一次采集中获得的知识)分析样品。以这种方式，完成所有的识别的蛋白质的最大观测频率(理想情况下，应当在每一个iTRAQ混合中测量每一个蛋白质)。

e.数据处理

在BGM蛋白质组学工作流程内的数据处理过程可以被分成如初步肽的识别和定量的那些程序(其对于每个iTRAQ混合物单独地完成)(1.5.1节)和如将肽最终分配至蛋白质和蛋白质的最后定量的那些过程(其直到项目数据采集完成时才完成)(1.5.2节)。

BGM蛋白质组学工作流程中的主要数据处理步骤是：

·使用Mascot(Matrix Sciences)数据库搜索引擎识别肽

·Mascot ID的自动内部验证

·肽的定量和蛋白质的初步定量

·最终数据集的专家监护

·使用自动化PVT工具最终分配各个混合物的肽到一组共同的蛋白质中

·消除离群点和蛋白质的最终定量

i.单个iTRAQ混合物的数据处理

由于各个iTRAQ混合物是通过工作流处理的，MS/MS谱使用专有的BGM软件工具分析以用于肽和蛋白质的鉴别以及定量信息的初步评估。基于这一初步分析的结果，针对一组BGM性能计量来判断用于混合物中各原始样品的工作流程的质量。如果给定的样品(或混合物)没通过指定的最小性能计量，且可获得另外的材料，该样品以其整体重复，且它是并入最后的数据集中来自该二次实施的工作流程的数据。

ii.肽鉴定

MS/MS谱针对包含被常见的污染序列(如猪胰蛋白酶)增强的人、牛、马序列的UniProt蛋白质序列数据库进行检索。在表1中给出了Mascot检索参数的细节，包括修饰的完整列表。

表1：Mascot检索参数

Mascot检索完成后，使用自动验证程序来促进(即验证)特定Mascot肽匹配。有效和无效匹配之间的区分是基于相对于预期的Mascot得分达到的Mascot得分和等级1的肽和等级2的肽的Mascot得分的差异。如果肽是与iTRAQ混合物中单一蛋白质相匹配的几个之一，或者如果肽存在于之前验证的肽的目录中，验证所需的标准有所放松。

iii.肽和蛋白质定量

用于各个混合物的一组验证的肽被用来计算各混合物的初步蛋白质量化计量。通过从用于各个验证肽的iTRAQ标记(例如，m/z 114、115、116、118、119或121)的峰面积除以通过参比池(QC1或QC2)的峰面积的最佳表示计算肽比率。此峰面积是113和117峰的平均值，条件是两个样品都通过QC接受标准。通过计算与该蛋白质相匹配的所有“有用的”验证肽的中位比来确定初步蛋白质比率。“有用的”肽是完全iTRAQ标记的(所有的N-端用赖氨酸或PyroGlu标记)和完全半胱氨酸标记的(即所有Cys残基用脲基甲基或N-端Pyro-cmc烷基化)。

f.获取后处理

一旦对于项目中的每一个组合物完成所有轮的MS/MS数据采集，则使用如下讨论的三个步骤校对数据，其目的是使来自各原始样品的结果能够简单地和有意义地与另一个样品的结果比较。

i.肽序列到蛋白质的总体分配

通过专有的蛋白质验证工具(PVT)进行肽序列到蛋白质登录号的最终分配。该PVT程序确定最好的、最小的非冗余蛋白质组来描述在方案中识别的肽的整个集合。这是已被优化以处理来自同种分类的数据的自动程序。

人工监护用于上清液实验的蛋白质分配以便处理在数据库中混合分类的复杂性。由于自动范式对于在牛和马血清补充的培养基中生长的细胞培养物是无效的，所以需要大量的人工监护以使任何给定蛋白质的来源的模糊最小化。

ii.肽比率的标准化

基于Vandesompele等人，Genome Biology,2002,3(7),research0034.1-11中的方法对各个样品的肽比率标准化。这一程序仅用于细胞沉淀的测量。对于上清液样品，考虑到来自培养基的对肽鉴定的最大影响，定量数据没有标准化。

iii.蛋白质比率的最终计算

使用标准统计离群消除过程从各蛋白质中位比率周围去除离群值，对数变换的数据集中超出1.96σ水平。该去除过程之后，(再)计算蛋白质比率的最终集。

IV.广泛性发育障碍

广泛性发育障碍是神经发育障碍，包括孤独症、艾斯伯格症候群、广泛性发育障碍非其他特定型(PDD-NOS)、雷特氏综合征和童年瓦解性障碍。该病症和诊断标准提供在精神疾病诊断与统计手册第4版(DSM-IV)，国际疾病分类，第10版，Levy等人，其中的有关内容都明确引入本文作为参考。自闭症谱系障碍包括自闭症(又称孤独症)、艾斯伯格症候群，和PDD-NOS。观察到自闭症谱系障碍在男性比女性中的频繁高三到四倍。在美国和欧洲，自闭症谱系障碍的患病率自1960年以来急剧增加。患病率估计约为1/150。

自闭症谱系障碍的特征是社交功能和沟通的质量损害，通常伴有重复性的和刻板的行为模式和兴趣。自闭症或孤独症包括相互社交的严重且广泛的受损。艾斯伯格症候群与其他自闭症谱系障碍的区别在于其在语言和认知发展上相对保守。虽然不是诊断所必需的，身体笨拙的和非典型语言使用在艾斯伯格症候群中常有报道。广泛性发育障碍非其他特定型(PDD-NOS，也被称为“非典型人格发展”，“非典型PDD，”或“非典型自闭症”)也包括在DSM-IV中，以涵盖有明显受损的社会互动障碍、沟通和/或刻板的行为模式或兴趣，但不符合另一广泛性发育障碍的全部特征的情况。被确诊为PDD-NOS的个体可能有社交困难，表现出重复的行为，或者对于某些刺激过于敏感。在与他人互动时，他们可能难以保持眼神接触，看起来没有感情，或看起来无法说话。他们还可能难以从一个活动转变到另一个。

具有自闭症谱系障碍的个体还表现出强迫行为，部分地与强迫症有关的症状重叠。可以想到，由本发明提供的方法可以用来治疗具有广泛性发育障碍的个体的强迫症状，以及其它类型的疾病，例如具有类似症状或病因的强迫症。

自闭症谱系障碍是高度遗传的；从家庭和双胞胎研究估计的遗传现象表明，变异约90％是由于遗传因素。患病者的父母和兄弟姐妹通常显示出自闭症的亚综合征表现(“广义自闭症表型”)，其中包括延迟的语言、语言的社会方面的困难、延迟的社会发展、没有亲密的友谊、以及一个完美主义或刚性的个性风格。然而，无论是遗传方面还是该障碍的复杂病因均未被理解。

雷特氏综合征是一种神经发育障碍，主要在女孩中观察到，特征是手和脚小、重复的手部动作和头部增长速度的减慢。具有雷特氏综合征的女孩容易发生胃肠功能紊乱，高达80％的有癫痫发作，它们通常没有语言能力，以及约50％不能行走。脊柱侧弯、生长障碍和便秘也很常见。

童年瓦解性障碍(CDD)，也被称为海勒氏综合征(Heller's syndrome)和崩解性精神病，其特征在于从2岁到大约10岁的年龄时出现语言、社会功能和运动技能的发育迟缓。CDD有时被认为是自闭症的一种低运作形式。

如本文中使用的，“呈现出广泛性发育障碍的一种或多种体征或症状”的受试者包括患有广泛性发育障碍的受试者，以及不患有发育障碍但表现出广泛性发育障碍的亚综合征表现的受试者，如广义的自闭症表型，其被描述在，例如，DSM-IV，Piven et al.,Am J Psychiatry 154:185-190(1997)和Losh etal.Am J Med Genet B Neuropsychiatr Genet 147:424-433(2008)。鉴定、定量和/或监控广泛性发育障碍、尤其是自闭症的一个或多个体征或症状，可以用孤独症诊断观察量表(ADOS)(Lord et al.,J.Autism Dev Dis.19:185-212(1989)，其通过引用并入本文)和/或修订的孤独症诊断访谈(ADI-R)(Lord,et al.,J.Autism Dev Dis.24:659-685(1994))进行。本文所用的广泛性发育障碍的一种或多种体征或症状是那些包括在广泛性发育障碍的诊断标准中的体征或症状，不包括其他在广泛性发育障碍中观察到的但不属于诊断标准的那些体征或症状，例如便秘、癫痫症、智力发育迟缓、身体畸形导致语迟，等等。

一个“表现出广泛性发育障碍的一个或多个体征或症状”的受试者也包括具有这种症状的非人类的受试者。表现出广泛性发育障碍的一个或多个体征或症状的非人类的动物包括这些障碍的动物模型。许多具有多种基因突变的小鼠已经建议用作本文中所述的自闭症和其他广泛性发育障碍的模型。脆性X综合征果蝇模型是已知的(如下面讨论的，脆性X基因型与孤独症相关联)，雷特氏综合征的小鼠模型也是已知的。

一个“患有”广泛性发育障碍的受试者包括已被临床诊断为具有这种病症的受试者，以及符合这种病症的诊断标准的受试者。诊断标准和用于诊断自闭症谱系障碍的方法在Levy等人和DSM-IV中有论述。

DSM-IV对于多种广泛性发育障碍的诊断标准如下：

299.00自闭症障碍

(A)(1)、(2)和(3)中总共有六项(或更多项)，其中至少两项出自(1)，且各一项出自(2)和(3):

(1)社会交往的质的受损，如表现为下述中的至少两种：

(a)在使用多种非语言行为来调节社会交往上明显受损，例如目光接触凝视、面部表情、身体姿势和动作

(b)不能够发展出适合发育水平的同伴关系

(c)缺少自发地寻求与他人分享快乐、兴趣或成就(例如缺少呈现、带来或指出感兴趣的对象)

(d)缺少社会或情感互惠；

(2)沟通方面质的受损，如表现为下述的至少一个：

(a)口头语言发育的迟缓或完全缺少发育(不伴随有尝试通过其他替代沟通模式如动作或手势来进行补偿)

(b)个体具有足够的说话能力，而在启动或维持与他人谈话的能力上明显损害

(c)刻板而重复地使用语言或特质性语言

(d)缺乏适应于发育水平的多样的、自发的虚构游戏(make-believeplay)或社会模仿行为

(3)受限制的重复和刻板的行为模式、兴趣和活动，如表现为下述的至少一个：

(a)包含专注于一种或多种在强度或焦点上异常的刻板的兴趣模式

(b)看起来僵化地遵守特定的、非功能性的程序或仪式

(c)刻板和重复的运动举止(例如手或手指拍打或扭曲，或复杂的全身运动)

(d)持续专注于物体的部位

(B)在以下几个方面的至少一个上延迟或功能异常，始于3岁前：(1)社会互动，(2)在社会交往中使用的语言，或(3)象征性的或假想的行为

(C)障碍没有更好地被雷特氏症或童年瓦解性障碍解释。

299.80雷特氏障碍

(A)以下全部:

(1)看起来正常的产前和围产期发育

(2)看起来正常的出生后前5个月的精神性运动发育

(3)出生时正常的头围

(B)在正常发育期之后下列所有开始出现：

(1)在5至48个月大期间头部增长减速

(2)在5至30个月大期间，之前已习得的有目的的手部技巧丢失，之后发展出刻板的手部运动(例如搓手或洗手)

(3)在过程的早期丢失社会参与(虽然社会互动常常在晚些时候发展)

(4)外观上缺乏协调步态或躯干运动

(5)严重受损的表达和接受语言发育，伴有严重精神运动性迟滞

299.10童年瓦解性障碍

(A)出生后至少头2年的发育看起来正常，如表现为存在与年龄相适应语言和非语言的沟通、社会关系、游戏和适应行为

(B)临床上显著的丢失至少两种以下方面的之前习得的技能(在10岁以前)：

(1)表达或接受语言

(2)社会技能或适应行为

(3)对肠道或膀胱的控制

(4)游戏

(5)运动技能

(C)在以下方面的至少两个上功能异常：

(1)社会交往上质的受损(例如非语言行为受损、不能发展出同伴关系，缺少社会或情感互惠)

(2)沟通上质的受损(例如延迟或缺乏口头语言，不能够启示或维持会话、刻板的和重复性地使用语言、缺乏多样的虚构游戏)

(3)受限、重复和刻板的行为模式、兴趣和活动，包括运动刻板和举止

(D)障碍没有更好地被另一种具体的广泛性发育障碍或精神分裂症解释。

299.80艾斯伯格症候群

(A)社会互动上质的损害，如表现为下列中的至少两种：

(1)在使用多种非语言行为来调节社会交往上明显受损，例如目光接触凝视、面部表情、身体姿势和动作

(2)不能够发展出适合发育水平的同伴关系

(3)缺少自发地寻求与他人分享快乐、兴趣或成就(例如缺少呈现、带来或指出感兴趣的对象)，缺少社会或情感互惠。

(B)受限制的重复和刻板的行为模式、兴趣、和活动，如表现为下述的至少一个：

(1)包含专注于一种或多种在强度或焦点上异常的刻板的和受限的兴趣模式

(2)看起来僵化地遵守特定的、非功能性的程序或仪式

(3)刻板和重复的运动举止(例如手或手指拍打或扭曲，或复杂的全身运动)

(4)持续专注于物体的部位

(C)障碍导致临床上显著的社会、职业或其他重要功能领域的受损。

(D)没有临床上显著的语言总体迟缓(例如到2岁时使用单个词，到3岁时使用沟通性的短语)

(E)没有临床上显著的认知发育迟缓或与年龄相适当的自助技能、适应行为的迟缓(除社会互动以外)，并且对童年环境好奇。

(F)不符合另一种特定的广泛性发育障碍或精神分裂症的标准。

299.80广泛性发育障碍非其他特定型(包括非典型自闭症)

该分类应在存在互惠社会互动的发展或者语言和非语言的沟通技能发生严重且广泛的受损，或者当存在刻板行为、兴趣和活动，但并不满足特定的广泛性发育障碍、精神分裂症、分裂型人格障碍或回避型人格障碍的标准时使用。例如，该分类包括非典型自闭症——由于发病年龄晚、非典型症状或低于阈值的症状，或者全部，因而表现不符合自闭症。

自闭症和广泛性发育障碍的遗传学

自闭症被认为是复杂的多因素障碍，涉及多种基因。因此，已确认多个位点，其中的一些或全部可能对于表型有作用。包含在该条目下的有AUTS1，其已被定位于染色体7q22。

其他易感的基因位点包括AUTS3(608049)，定位于染色体13q14；AUTS4(608636)，定位于染色体15q11；AUTS5(606053)，定位于染色体2q；AUTS6(609378)，定位于染色体17q11；AUTS7(610676)，定位于染色体17q21；AUTS8(607373)，定位于染色体3q25-q27；AUTS9(611015)，定位于染色体7q31；AUTS10(611016)，定位于染色体7q36；AUTS11(610836)，定位于染色体1q41；AUTS12(610838)，定位于染色体21p13-q11；AUTS13(610908)，定位于染色体12q14；AUTS14(611913)，定位于染色体16p11.2；AUTS15(612100)，与染色体7q35-q36上CNTNAP2基因(604569)的突变相关联；AUTS16(613410),与染色体3q24上的SLC9A9基因(608396)的突变相关联；以及AUTS17(613436)，与染色体11q13上的SHANK2基因(603290)的突变相关联。(注：符号“AUTS2”已被用于指染色体7q11上的基因(KIAA0442；607270)，因此没有用作该自闭症位点系列的一部分。)

自闭症的三种X-连接形式(AUTSX1；300425；AUTSX2；300495；AUTSX3；300496)各自与NLGN3(300336)、NLGN4(300427)和MECP2(300005)基因上的突变相关联。

除了图谱定位研究，功能候选基因和蛋白质组学方法已确认可能会影响自闭症发展的易感性的特定基因变异；参见例如染色体6p21.3上的乙二醛酶I基因(GLO1；138750)。

广泛性发育障碍的动物模型

许多小鼠模型已经被认为可能与用作自闭症或广泛性发育障碍模型相关。被提供作为可用于研究治疗剂(例如，在表2-6中列出的蛋白质)的疗效和安全性的动物模型的例子如下。可以理解，其他动物模型也是可用的，并且将来获得的也可被用于本发明。大部分的小鼠是市售的，例如，获自缅因州Bar Harbor的Jackson Laboratories(参见，例如，Mice strain sheds new lighton autism JAXNOTES Issue 512,Winter 2008)。

神经连接素3敲除的小鼠是基因外显子2和3缺失的定向突变品系(B6；129-Nlgn3^tm2.1Sud/J(Tabuchi et al.,Science 318(5847):71-6(2007))。这些小鼠在其其抑制性突触传递特性上没有显示出改变。纯合体是可存活的，具有正常大小，并且不显示任何整体的身体异常。有人建议，该突变体小鼠品系可以用于研究突触形成和/或功能和神经发育缺陷，如自闭症。产生的第二种神经连接素3转基因小鼠具有外显子7的R451C突变，其具有loxP位点侧翼(B6；129-Nlgn3^tm1Sud/J)。突变小鼠显示出抑制性突触传递以及空间学习和记忆增强，但在社会交往中显出缺陷。已提出，该突变小鼠品系可用于研究自闭症的病理生理学。当与Cre重组酶表达品系一起使用时，该品系对于产生两侧装接loxP等位基因的组织特异性突变体是有用的。靶向突变的纯合小鼠是可存活的、可繁殖的、大小正常且不显示任何整体的身体异常。

过表达鼠神经连接素2(B6.Cg-Tg(Thy1-Nlgn2)6Hnes/J)的转基因小鼠被认为是自闭症和雷特氏综合征的模型(Hines et al.,J Neurosci 28:6055-67,2008)。TgNL2转基因的小鼠半合子是可存活可繁殖的，但雌性半合子产量低。TgNL2转基因编码血凝素标记的鼠的神经连接素2(Nlgn2或NL2)基因，其由小鼠Thy1.2表达盒驱动。HA-NL2转录物和蛋白在神经细胞的整个神经轴表达(在皮质和边缘结构，例如杏仁核和海马上有高浓度)，并且主要定位来抑制突触接触。TgNL2.6小鼠有中度至高度的HA-NL2表达(约比野生型NL2高1.6倍)。这种过表达导致寿命和体重减少，并诱导异常的突触成熟和改变神经元兴奋性，导致行为缺陷。具体来说，TgNL2.6小鼠显现出让人联想到自闭症和/或雷特氏综合征的失调；跳跃、肢紧握、焦虑，以及受损的社会互动。转基因小鼠还表现出斯特劳布举尾(Straub tail)、驼背的短暂发作，和棘波放电的发生率增加。

具有Gabrb3(γ氨基丁酸(GABA-A)受体，β3亚基)的β3编码区的异常表达的小鼠被建议用作自闭症谱系障碍的模型(129-Gabrb3^tm1Geh/J)(Delorey et al.,Behav Brain Res 187:207-20,2008；Homanics et al.,Proc NatlAcad Sci U S A 94:4143-8,1997)。小鼠表现出多种表型异常，包括颚裂、癫痫发作、癫痫和对麻醉药和乙醇敏感。此外，观察到的行为缺陷(特别是关于社会行为)表明，突变小鼠可能是自闭症谱系障碍的有用模型。

BTBR T⁺tf/J是一个自然出现的突变小鼠品系，包括在至少在(TF)基因簇和DISC1基因上的突变(Petkov et al.,Genomics 83:902-11,2004)，已知它们与精神分裂症有关。小鼠表现出100％胼胝体缺失和严重减少的海马合缝(Wahlsten D,2003Brain Res.971:47-54)。该品系显示出多种自闭症症状，包括：与其他近交系相比减少的社会互动、游戏受损、低探索行为、不寻常的发声和高度焦虑(McFarlane et al.,Gen,Brain Behav 7:152-63,2008；Moy etal.,Behav Br Res.176:4-20,2007；Scattoni et al.,PLoS ONE,3:e3067,2008)。

精氨酸加压素受体1B中具有突变的小鼠通过将从起始甲硫氨酸之前到内源基因的跨膜VI区上游之间的编码区用新霉素抗性盒替换来产生。该小鼠已被建议可用于研究攻击行为、社会动机和适当的行为反应，并且可以是自闭症和侵略伴随痴呆以及创伤性脑损伤的潜在模型(B6；129X1-Avpr1b^tm1Wsy/J)。该靶向突变的纯合小鼠可存活、可繁殖、大小正常，显示出明显正常的性行为，并且不显示出任何整体上的身体异常。已证明纯合小鼠具有较少的社会侵略性、改变的化学探究行为，以及受损的社会认知(Wersinger et al.,Horm Behav 46:638-45,2004)。

可用作自闭症或其他广泛性发育障碍的其他模型可使用数据库jaxmice.jax.org/query/f？p＝205:1:2176162254083441获得。

V.本发明的标志物

本发明涉及标志物(以下称为“生物标志物”、“标志物”或“本发明的标志物”)。本发明中优选的标志物是表2-6中所列出的标志物。

本发明提供被标志物编码的或与标志物对应的核酸和蛋白质(以下分别简称为“标志物核酸”和“标志物蛋白质”)。这些标志物对于下述特别有用：筛选广泛性发育障碍的存在情况、评估广泛性发育障碍的严重程度、评估受试者是否患有广泛性发育障碍、鉴定用于治疗广泛性发育障碍的组合物、评估环境影响剂化合物对于治疗广泛性发育障碍的效果、监测广泛性发育障碍的进展、预后广泛性发育障碍的侵略性、预后广泛性发育障碍患者的存活率、预后广泛性发育障碍的复发，以及预后受试者是否易患广泛性发育障碍。

在本发明一些实施方案中，在本发明的方法中使用一种或多种生物标志物。如本文中所使用的，术语“一种或多种生物标志物”意指在所公开的生物标志物列表中的至少一种生物标志物被检测，在多个实施方案中，所列表中的多于一种的生物标志物可被检测，例如两种、三种、四种、五种、十种、二十种、四十种、五十种、多于五十种、或表中的所有标志物被检测。

“标志物”是这样的基因，其在组织或细胞中的表达水平相比于正常或健康的组织或细胞中的表达水平发生的改变与疾病状态，例如广泛性发育障碍(如自闭症或阿尔茨海默病)相关。“标志物核酸”是由本发明的标志物编码的或与其对应的核酸(例如mRNA，cDNA)。这种标志物核酸包括DNA(如cDNA)，其包含任一SEQ ID NO(nts)的全部或部分序列或者这样的序列的互补序列。标志物核酸还包括包含任一SEQ ID NO(nts)的全部或部分序列或者这样的序列的互补序列的RNA，其中所有胸苷残基被尿苷残基取代。“标志物蛋白质”是本发明的标志物编码的或与之对应的蛋白质。标志物蛋白质包含任一SEQ ID NO(AAs)的全部或部分序列。术语“蛋白质”和“多肽”可以互换使用。

标志物的“正常”表达水平是标志物在未患有广泛性发育障碍(如自闭症或阿尔茨海默病)的人类受试者或患者的细胞中的表达水平。

标志物的“过表达”或“较高的表达水平”指的是测试样品中的大于用来评估表达的分析法的标准误差的表达水平，且优选至少是两倍，更优选为对照样品(例如，不具有与疾病、即广泛性发育障碍相关的标志物的来自健康受试者的样品)中标志物表达水平，和优选地，几个对照样品中标志物的平均表达水平的三、四、五、六、七、八、九或十倍。

标志物的“较低表达水平”是指测试样品中的下述表达水平，其比对照样品(例如，没有与疾病，即广泛性发育障碍相关的标志物的来自健康受试者的样品)中的标志物表达水平，和优选地几个对照样品中标志物的平均表达水平低至少两倍，更优选三、四、五、六、七、八、九或十倍。

“转录的多核苷酸”或“核苷酸转录物”是与通过本发明标志物的转录和RNA转录物的正常的转录后加工(如剪接)(如果有的话)及RNA转录物的反转录产生的成熟mRNA的全部或一部分互补或同源的多核苷酸(例如，mRNA、hnRNA、cDNA，或这种DNA或cDNA的类似物)。

“互补”是指两个核酸链的区域之间或同一核酸链的两个区域之间的序列互补性的广义概念。已知第一核酸区域的腺嘌呤残基能够与反平行于第一区域的第二核酸区域的残基形成特定氢键(“碱基配对”)(如果该残基是胸腺嘧啶或尿嘧啶)。类似地，已知第一核酸区域的胞嘧啶残基能够与反平行于第一区域的第二核酸区域的残基配对，如果该残基是鸟嘌呤。如果当两个区域以反平行的方式排列时，第一区域的至少一个核苷酸残基能够与第二区域的残基碱基配对，那么核酸的第一区域互补于相同或不同核酸的第二区域。优选地，第一区域包含第一部分和第二区域包含第二部分，由此，当第一和第二部分以反平行方式排列时，第一部分的至少约50％和优选至少约75％、至少约90％或至少约95％的核苷酸残基能够与第二部分中的核苷酸残基碱基配对。更优选地，第一部分的所有核苷酸残基能够与第二部分中的核苷酸残基碱基配对。

如本文所用的“同源的”是指相同核酸链的两个区域之间或两个不同核酸链的区域之间的核苷酸序列相似性。当两个区域中的核苷酸残基位置被相同的核苷酸残基占据，那么该区域在那个位置是同源的。如果各个区域的至少一个核苷酸残基位置被相同的残基占据，则第一区域与第二区域是同源的。两个区域之间的同源性以被相同的核苷酸残基所占据的两个区域的核苷酸残基位置的比例表示。举例来说，具有核苷酸序列5'-ATTGCC-3'的区域和具有核苷酸序列5'-TATGGC-3'的区域有50％的同源性。优选地，第一区域包含第一部分和第二区域包含第二部分，由此，各个部分的至少约50％，优选至少约75％、至少约90％或至少约95％的核苷酸残基位置被相同的核苷酸残基所占据。更优选的是，各个部分的所有核苷酸残基位置被相同的核苷酸残基占据。

“本发明的蛋白质”包含标志物蛋白质及其片段；变体标志物蛋白质及其片段；含有标志物或变体标志物蛋白质的至少15个氨基酸的片段的肽和多肽；和含有标志物或变体标志物蛋白质或者标志物或变体标志物蛋白质的至少15个氨基酸的片段的融合蛋白质。

本发明进一步提供了与本发明的标志物蛋白质和标志物蛋白质的片段特异性结合的抗体、抗体衍生物和抗体片段。除非其中另有规定，术语“抗体”和“多个抗体”广义地包含天然存在的抗体形式(例如，IgG、IgA、IgM、IgE)和重组抗体，如单链抗体、嵌合抗体和人源化抗体及多特异性抗体，以及所有上述形式的片段和衍生物，该片段和衍生物至少具有抗原结合位点。抗体衍生物可以包含与抗体偶联的蛋白质或化学部分。

在一些这样的实施方式中，即其中特别列出的基因与多于一种的治疗条件相关(例如治疗后不同的时期，或使用不同浓度的潜在环境影响剂来治疗)，特定基因的倍数变化是指所记录的最长治疗时间。在其他实施方式中，特定基因的倍数变化是指所记录的最短的治疗时间。在其他实施方式中，特定基因的倍数变化是指用最高浓度的环境影响剂处理。在再一种实施方式中，特定基因的倍数变化是指以一种与环境影响剂的治疗效果一致的方式调节(例如上调或下调)。

在某些实施方式中，正或负的倍数变化是指本文所述的任何基因的倍数变化。

如本文中所使用的，“正倍数变化”是指本文所列标志物的“上调”或“(表达)增加”。

如本文中所使用的，“负倍数变化”是指本文所列标志物的“下调”或“(表达)减少”。

本发明的各方面在下面的小节中进一步详细描述。

1.分离的核酸分子

本发明的一个方面涉及分离的核酸分子，包括编码标志物蛋白质或其一部分的核酸。本发明的分离的核酸还包括足以用作杂交探针来确定标志物核酸分子及标志物核酸分子的片段的核酸分子，例如，那些适合用作标志物核酸分子的扩增或突变的PCR引物的核酸分子。如本文所用的术语“核酸分子”旨在包括DNA分子(例如，cDNA或基因组DNA)和RNA分子(例如，mRNA)及使用核苷酸类似物产生的DNA或RNA的类似物。核酸分子可以是单链的或双链的，但优选为双链DNA。

“分离的”核酸分子是与存在于该核酸分子的天然来源中的其他核酸分子分离的核酸分子。在一个实施方式中，“分离的”核酸分子不含核酸所来源的生物体的基因组DNA中自然侧邻该核酸的序列(即，位于该核酸的5'和3'端的序列)(优选蛋白质编码序列)。例如，在各种实施方式中，分离的核酸分子可以包含少于约5kB、4kB、3kB、2kB、1kB、0.5kB或0.1kB的该核酸所来源的细胞的基因组DNA中自然侧邻该核酸分子的核苷酸序列。在另一个实施方式中，“分离的”核酸分子，如cDNA分子，可以基本上不含其他细胞物质，或当通过重组技术产生时基本上不含培养基，或当化学合成时基本上不含化学前体或其他化学物质。基本上不含细胞物质的核酸分子包括具有小于约30％、20％、10％或5％的异源核酸(这里也称为“污染核酸”)的制剂。

可以使用标准的分子生物学技术和本文所描述的数据库记录中的序列信息分离本发明的核酸分子。使用这样的核酸序列的全部或一部分，可以使用标准杂交和克隆技术(例如，如Sambrook等,ed.,Molecular Cloning:ALaboratory Manual,2nd ed.,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY,1989中所描述的)分离本发明的核酸分子。

可以使用作为模板的cDNA、mRNA或基因组DNA和适当的寡核苷酸引物根据标准PCR扩增技术来扩增本发明的核酸分子。如此扩增的核酸可以被克隆到合适的载体中，和通过DNA序列分析鉴定。此外，对应于本发明的核酸分子的全部或一部分的核苷酸可以通过标准合成技术，例如，使用自动DNA合成仪制备。

在另一个优选的实施方式中，本发明的分离的核酸分子包含的核酸分子具有与标志物核酸的核苷酸序列或与编码标志物蛋白质的核酸的核苷酸序列互补的核苷酸序列。与给定的核苷酸序列互补的核酸分子是与给定的核苷酸序列充分互补的核酸分子，它可以与给定的核苷酸序列杂交从而形成稳定的双链体。

此外，本发明的核酸分子可以只包含核酸序列的一部分，其中全长核酸序列包含标志物核酸或它编码标志物蛋白质。这样的核酸可用作，例如，探针或引物。该探针/引物通常作为一个或多个基本上纯化的寡核苷酸使用。该寡核苷酸典型地包含在严格条件下与本发明核酸的至少约7个、优选约15个、更优选为约25、50、75、100、125、150、175、200、250、300，350或400个或更多个连续核苷酸杂交的核苷酸序列的区域。

基于本发明核酸分子的序列的探针可用于检测对应于本发明的一个或多个标志物的转录本或基因组序列。该探针包含连接在其上的标记基团，例如，放射性同位素、荧光化合物、酶或酶辅因子。这样的探针可用作用于识别错误表达蛋白质的细胞或组织的诊断测试试剂盒的部分，如通过测量来自受试者的细胞样品中编码蛋白质的核酸分子的水平，例如，检测mRNA水平或测定编码该蛋白质的基因是否已突变或缺失。

本发明还包含由于遗传密码的简并性而与编码标志物蛋白质(例如具有SEQ ID NO(AAs)的序列的蛋白质)的核酸的核苷酸序列不同的并因此编码相同的蛋白质的核酸分子。

本领域技术人员将能理解，导致氨基酸序列变化的DNA序列多态性可能存在于群体(例如，人类群体)中。由于自然等位基因变异，这种基因多态性可能存在于群体内的个体之间。等位基因是在给定的基因座处交替出现的一组基因之一。此外，应该理解的是，影响RNA表达水平的DNA多态性也可以存在，其可以影响该基因的整体表达水平(例如，通过影响调节或降解)。

如本文所用的，术语“等位基因变异体”是指存生于给定基因座处的核苷酸序列，或指由核苷酸序列编码的多肽。

如本文所用的，术语“基因”和“重组基因”指含有编码与本发明的标志物对应的多肽的开放阅读框的核酸分子。通常，这样的天然等位基因变异可以导致给定基因的核苷酸序列中1-5％的变异。可选等位基因可以通过测序多个不同个体中的目标基因来识别。这可以通过使用杂交探针很容易地进行以识别多个个体中的相同基因座。任何及所有这样的核苷酸变异及所产生的氨基酸多态性或变异(其为天然等位基因变异的结果且不改变功能活性)意图在本发明的范围之内。

在另一个实施方式中，本发明的分离核酸分子长度是至少7、15、20、25、30、40、60、80、100、150、200、250、300、350、400、450、550、650、700、800、900、1000、1200、1400、1600、1800、2000、2200、2400、2600、2800、3000、3500、4000、4500或更多个核苷酸，且在严格条件下与标志物核酸或与编码标志物蛋白质的核酸杂交。如本文所用的，术语“在严格条件下杂交”意图描述用于杂交和洗涤的条件，其中在该条件下，至少60％(65％、70％、优选75％)彼此相同的核苷酸序列通常保持彼此杂交。这种严格条件是本技术领域的技术人员已知的，并且可以在Current Protocols in MolecularBiology,John Wiley&Sons,N.Y.(1989)的6.3.1-6.3.6节中发现。严格杂交条件的优选的非限制性的例子是在约45℃下6X的氯化钠/柠檬酸钠(SSC)中杂交，然后在0.2X SSC，0.1％SDS中于50-65℃下洗涤一次或多次。

除了可以存在于群体中的天然存在的本发明核酸分子的等位基因变异体，本领域技术人员将进一步理解，序列变化可以由突变引入，从而导致所编码的蛋白质的氨基酸序列的变化，而不改变由此编码的蛋白质的生物学活性。例如，一种变化可以导致在“非必需”氨基酸残基处的氨基酸置换的核苷酸取代。“非必需”氨基酸残基是可以在不改变生物活性的情况下从野生型序列发生改变的残基，而“必需”氨基酸残基是生物活性所必需的。例如，各种不同物种的同源物之间非保守的或仅半保守的氨基酸残基对于活性可能是非必需的且因此很可能是进行改变的目标。或者，在各种不同物种(例如，鼠和人)的同源物之间保守的氨基酸残基可能是活性必需的，且因此不太可能是改变的目标。

因此，本发明的另一个方面涉及到编码包含对于活性非必需的氨基酸残基中的变化的变异标志物蛋白质的核酸分子。这样的变异标志物蛋白质与天然存在的标志物蛋白质的氨基酸序列不同，但仍保留生物活性。在一个实施方式中，这样的变异标志物蛋白质具有与标志物蛋白质的氨基酸序列至少约40％相同的、50％、60％、70％、80％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的氨基酸序列。

通过向标志物核酸的核苷酸序列中引入一个或多个核苷酸取代、添加或缺失可以产生编码变异标志物蛋白质的分离的核酸分子，以使得一个或多个氨基酸残基置换、添加或缺失被引入到编码的蛋白质中。突变可以通过标准技术(如定点诱变和PCR介导的诱变)引入。优选地，在一个或多个预测的非必需氨基酸残基处进行保守氨基酸置换。“保守氨基酸置换”是在其中氨基酸残基用具有类似侧链的氨基酸残基代替的置换。具有类似侧链的氨基酸残基的家族已在本领域中定义。在这些家族包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸、组氨酸)、具有酸性侧链的氨基酸(例如天冬氨酸、谷氨酸)、具有不带电荷的极性侧链的氨基酸(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、具有非极性侧链的氨基酸(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、蛋氨酸、色氨酸)、具有β-分支侧链的氨基酸(例如苏氨酸、缬氨酸、异亮氨酸)和具有芳族侧链的氨基酸(例如，酪氨酸、苯丙氨酸、色氨酸、组氨酸)。或者，突变可以沿全部或部分编码序列随机引入，例如通过饱和诱变，且得到的突变体可进行生物活性的筛选以鉴别保留活性的突变体。诱变后，可重组表达编码的蛋白质并可测定蛋白质的活性。

本发明包括反义核酸分子，即与本发明的正义核酸互补的分子，例如，与双链标志物cDNA分子的编码链互补的或与标志物mRNA序列互补的。因此，本发明的反义核酸可以与本发明的正义核酸氢键结合(即与之退火)。反义核酸可与整个编码链互补，或者只与其一部分互补，例如，蛋白质编码区的全部或部分(或开放阅读框)。反义核酸分子也可以与编码标志物蛋白质的核苷酸序列的编码链的全部或部分非编码区是反义的。非编码区(“5'和3'非翻译区”)是侧邻编码区的5'和3'序列且未被翻译成氨基酸。

反义寡核苷酸长度可以是，例如，约5、10、15、20、25、30、35、40、45或50个或更多个核苷酸。可以使用本领域中已知的方法利用化学合成和酶促连接反应构造本发明的反义核酸。例如，可以使用天然存在的核苷酸或设计用于提高分子的生物稳定性或提高反义和正义的核酸之间形成的双链体的物理稳定性的不同地修饰的核苷酸来化学合成反义核酸(例如，反义寡核苷酸)，例如，可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可用于产生反义核酸的修饰核苷酸的例子包括5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧羟基甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫尿核苷、5-羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖基Q核苷、肌苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、β-D-甘露糖基Q核苷、5'-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-N6-异戊烯腺嘌呤、尿嘧啶-5-氧基乙酸(v)、wybutoxosine、假尿嘧啶、Q核苷、2-硫代胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧基乙酸甲酯、尿嘧啶-5-氧基乙酸(v)、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、(acp3)w和2,6-二氨基嘌呤。或者，可以使用核酸已经按反义方向(即，由所插入的核酸转录的RNA将是所需靶核酸的反义方向，在以下小节进一步描述)亚克隆至其中的表达载体以生物方法产生反义核酸。

通常将本发明的反义核酸分子施用于受试者或在原位产生以使得它们杂交于或结合于细胞mRNA和/或编码标志物蛋白质的基因组DNA，从而抑制标志物的表达，例如，通过抑制转录和/或翻译。杂交可以通过常规的核苷酸互补性以形成稳定的双链体，或者例如，在结合DNA双链体的反义核酸分子的情况下，通过双螺旋的大沟中的特异性相互作用。施用本发明的反义核酸分子的途径的实例包括在组织部位直接注射或将反义核酸输注到广泛性发育障碍相关的体液中。或者，反义核酸分子可被修饰以靶向选定的细胞，并随后全身性施用。例如，对于全身施用，反义分子可以被修饰以使得它们特异性结合在选定细胞表面上表达的受体或抗原，例如，通过将反义核酸分子与结合细胞表面受体或抗原的肽或抗体相连接。也可以使用本文中所描述的载体将反义核酸分子递送到细胞。为了达到足够的细胞内反义分子的浓度，优选的是其中反义核酸分子被置于强pol II或pol III启动子控制下的载体构建体。

本发明的反义核酸分子可以是α-端基异构核酸分子。α-端基异构核酸分子与互补的RNA形成特定的双链杂交体，其中与通常的α-单元相反，该链彼此平行延伸(Gaultier等，1987,Nucleic Acids Res.15:6625-6641)。反义核酸分子还可以包含2'-o-甲基核糖核苷酸(Inoue等，1987,Nucleic Acids Res.15:6131-6148)或嵌合的RNA-DNA类似物(Inoue等，1987,FEBS Lett.215:327-330)。

本发明还包括核酶。核酶是具有核糖核酸酶活性的催化RNA分子，其能够切割与它们有互补区域的单链核酸，如mRNA。因此，核酶(例如，Haselhoff和Gerlach,1988,Nature 334:585-591中所描述的锤头核酶)可用于催化切割mRNA转录本，从而抑制由该mRNA编码的蛋白质的翻译。可以根据对应于标志物的cDNA的核苷酸序列设计具有对于编码标志物蛋白质的核酸分子的特异性的核酶。例如，可以构建四膜虫L-19IVS RNA的衍生物，其中活性位点的核苷酸序列互补于待切割的核苷酸序列(见Cech等，4,987,071号美国专利；和Cech等，5,116,742号美国专利)。或者，可以使用编码本发明多肽的mRNA来从RNA分子池选择具有特定的核糖核酸酶活性的催化RNA(见，例如，Bartel和Szostak,1993,Science 261:1411-1418)。

本发明还包括形成三股螺旋结构的核酸分子。例如，本发明的标志物的表达可以通过靶向于与编码标志物核酸或蛋白质的基因的调控区域(例如，启动子和/或增强子)互补的核苷酸序列抑制以形成三股螺旋结构(其防止靶细胞中基因的转录)而抑制。通常见于Helene(1991)Anticancer Drug Des.6(6):569-84；Helene(1992)Ann.N.Y.Acad.Sci.660:27-36和Maher(1992)Bioassays 14(12):807-15。

在各种实施方式中，可以在碱基部分、糖基部分或磷酸骨架处修饰本发明的核酸分子以改善，例如，分子的稳定性、杂交或溶解性。例如，核酸的脱氧核糖磷酸酯骨架可以被修饰以产生肽核酸(参见Hyrup等，1996,Bioorganic&Medicinal Chemistry 4(1):5-23)。如本文所用的，术语“肽核酸”或“PNA”是指核酸模拟物，例如，DNA模拟物，其中是脱氧核糖磷酸酯骨架被假肽骨架替换，且只有四种天然核碱基被保留。PNA的中性骨架已被证明允许在低离子强度的条件下与DNA和RNA特异性杂交。可使用标准的固相肽合成方案进行PNA寡聚体的合成，如Hyrup等，(1996),同上；Perry-O'Keefe等(1996)Proc.Natl.Acad.Sci.USA 93:14670-675中所描述的。

PNA可用于治疗和诊断应用中。例如，PNA可被用作反义或反基因剂而用于基因表达的序列特异性调节，例如，通过诱导转录或翻译抑止或抑制复制。PNA也可以用于，例如，基因中单碱基对突变的分析，例如通过PNA定向PCR夹，当与其他酶(例如，S1核酸酶)组合使用时作为人工限制性内切酶(Hyrup(1996)，同上)；或作为探针或引物用于DNA测序和杂交(Hyrup，1996年，同上；Perry-O'Keefe等人，1996,Proc.Natl.Acad.Sci.USA93:14670-675)。

在另一个实施方式中，可以通过将亲脂性的或其他辅助基团连接到PNA上，通过形成PNA-DNA嵌合体或通过使用脂质体或本领域中已知的其它药物递送技术修饰PNA，例如，为提高它们的稳定性或细胞摄取。例如，可以生成PNA-DNA嵌合体，其可以结合PNA和DNA的有利性质。这种嵌合体允许DNA识别酶(例如，RNA酶H和DNA聚合酶)与DNA部分相互作用，而PNA部分将提供高结合亲和力和特异性。可以使用根据碱基堆积、核碱基之间的键数和定向选择的适当长度的接头来连接PNA-DNA嵌合体(Hyrup，1996，同上)。PNA-DNA嵌合体的合成可以如Hyrup(1996)，同上和Finn等(1996)Nucleic Acids Res.24(17):3357-63中所描述的进行。例如，可使用标准的亚磷酰胺偶联化学作用和修饰的核苷类似物在固相支持物上合成DNA链。化合物如5'-(4-甲氧基三苯甲基)氨基-5'-脱氧-胸腺嘧啶亚磷酰胺可以被用作PNA与DNA的5'末端之间的连接(Mag等,1989,Nucleic Acids Res.17:5973-88)。然后PNA单体以逐步的方式偶合以产生带有5'PNA片段和3'DNA片段的嵌合分子(Finn等人，1996,Nucleic Acids Res.24(17):3357-63)。或者，可以合成带有5'DNA片段和3'PNA片段的嵌合分子(Peterser等，1975,Bioorganic Med.Chem.Lett.5:1119-11124)。

在其它实施方式中，寡核苷酸可以包括其他附接的基团，如肽(例如，用于体内靶向宿主细胞受体)，或有助于运输穿过细胞膜(见，例如，Letsinger等,1989,Proc.Natl.Acad.Sci.USA 86:6553-6556；Lemaitre等,1987,Proc.Natl.Acad.Sci.USA 84:648-652；PCT公开号WO 88/09810)或血脑屏障(见例如，PCT公开号WO 89/10134)的试剂。此外，寡核苷酸可以用杂交触发的裂解剂(见，例如，Krol等,1988,Bio/Techniques 6:958-976)或嵌入剂(见，例如Zon,1988,Pharm.Res.5:539-549)修饰。为此，该寡核苷酸可以与另一种分子偶联，例如，肽、杂交触发交联剂、运输剂、杂交触发的裂解剂等。

本发明还包括具有至少一个与本发明的核酸互补的区域的分子信标核酸，以使得该分子信标可用于定量样品中本发明核酸的存在。“分子信标”核酸是包含一对互补区域并具有荧光团和与其相关的荧光淬灭剂的核酸。荧光团和淬灭剂与核酸的不同部分相结合，其方向使得当互补区域彼此退火时，荧光团的荧光被淬灭剂淬灭。当核酸的互补区域未与彼此退火时，荧光团的荧光以在较小程度淬灭。分子信标核酸在例如，5,876,930号美国专利中描述。

2.分离的蛋白质和抗体

本发明的一个方面涉及分离的标志物蛋白质及其生物活性部分，以及适合用作免疫原以产生针对标志物蛋白质或其片段的抗体的多肽片段。在一个实施方式中，可以使用标准的蛋白质纯化技术通过适当的纯化方案从细胞或组织来源分离原始的标志物蛋白质。在另一个实施方式中，通过重组DNA技术产生含有标志物蛋白质的全部或片段的蛋白质或肽。替代重组表达，这样的蛋白质或肽可以使用标准的肽合成技术化学合成。

“分离的”或“纯化的”蛋白质或其生物活性部分基本上不含来自于该蛋白质所来源的细胞或组织源的细胞物质或其它污染蛋白质，或当化学合成时基本上不含化学前体或其他化学物质。词语“基本上不含细胞物质”包括其中蛋白质与它所分离或重组产生的细胞的细胞组分分离的蛋白质制剂。因此，基本上不含细胞物质的蛋白质包括具有小于约30％、20％、10％或5％(以干重计)的异源蛋白质(这里也称为“污染蛋白质”)的蛋白质制剂。当重组产生蛋白质或其生物活性部分时，也优选基本上不含培养基，即培养基占蛋白质制剂的小于约20％、10％或5％的体积。当通过化学合成制备蛋白质时，优选基本上不含化学前体或其他化学物质，即，它与参与蛋白质合成的化学前体或者其他化学物质分离。因此，这类蛋白质的制剂具有少于约30％、20％、10％、5％(以干重计)的化学前体或目标多肽以外的化合物。

标志物蛋白质的生物活性部分包括包含与标志物蛋白质的氨基酸序列足够相同的或者是源自于标志物蛋白质的氨基酸序列的氨基酸序列的多肽，其包括比全长蛋白质较少的氨基酸并表现相应的全长蛋白质的至少一种活性。通常情况下，生物活性部分包含具有相应的全长蛋白质的至少一种活性的结构域或基序。本发明的标志物蛋白质的生物活性部分可以是，例如，长度10、25、50、100或更多个氨基酸的多肽。此外，其中标志物蛋白质的其他区域被删除的其它生物活性部分可以通过重组技术制备并评价天然形式的标志物蛋白质的一个或多个功能活性。

优选的标志物蛋白质是由含有任一种SEQ ID NO(nts)序列的核苷酸序列编码。其它有用的蛋白质与这些序列之一基本上相同的(例如，至少约40％，优选50％、60％、70％、80％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％)并保持相应的天然存在的标志物蛋白质的功能活性，但由于天然的等位基因变异或诱突而在氨基酸序列上不同。

为了确定两个氨基酸序列或两个核酸的百分同一性，序列为最佳比较的目的而进行比对(例如，间隙可以被引入第一氨基酸或核酸序列的序列中以与第二氨基酸或核酸序列最优比对)。然后比较相应的氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一序列中的位置由与第二序列中的相应位置中的相同氨基酸残基或核苷酸占据时，则分子在该位置上是相同的。优选地，使用全局比对计算两个序列之间的百分同一性。或者使用局部比对计算两个序列之间的百分同一性。在两个序列之间的百分同一性是序列所共有的相同位置数的函数(即，％同一性＝相同位置#/总的位置#(例如，重叠的位置)×100)。在一个实施方式中，两个序列是相同的长度。在另一个实施方式中，两个序列是不相同的长度。

可以使用数学算法来完成两个序列之间的百分同一性的确定。用于比较两个序列的数学算法的一种优选的非限制性的例子是Karlin和Altschul(1990)Proc.Natl.Acad.Sci.USA 87:2264-2268的算法，其在Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877中改进。这样的算法被整合入Altschul等(1990)J.Mol.Biol.215:403-410的BLASTN和BLASTX程序中。可以用BLASTN(得分＝100，字长＝12)程序执行BLAST核苷酸检索以得到与本发明的核酸分子同源的核苷酸序列。可以用BLASTP程序(得分＝50，字长＝3)进行BLAST蛋白质检索以得到与本发明的蛋白质分子同源的氨基酸序列。为了获得用于比较目的的带间隙比对，可以使用称为间隙BLAST的新版BLAST算法，如Altschul等(1997)Nucleic Acids Res.25:3389-3402中所描述的，其能够执行用于程序BLASTN、BLASTP和BLASTX的间隙局部比对。或者，可以使用PSI-Blast执行迭代搜索，其检测分子之间的远缘关系。当利用BLAST、间隙BLAST和PSI-Blast程序时，可以使用的相应程序(例如，BLASTX和BLASTN)的默认参数。见http://www.ncbi.nlm.nih.gov。用于序列比较的数学算法的另一个优选的非限制性的例子是Myers和Miller，(1988)CABIOS 4:11-17的算法。这样的算法被整合到ALIGN程序(版本2.0)中，这是GCG序列比对软件包的部分。当将ALIGN程序用于比较氨基酸序列时，可以使用PAM120权重残基表(weight residue table)，12的间隙长度罚分和4的间隙罚分。用于确定局部序列相似性和比对的区域的再另一种有用的算法是FASTA算法，如Pearson和Lipman(1988)Proc.Natl.Acad.Sci.USA 85:2444-2448中所描述的。当将FASTA算法用于比较核苷酸或氨基酸序列时，PAM120权重残基表可以与，例如，2的k-重值使用。

可以使用与上述类似的技术在有或没有允许的间隙的情况下确定两个序列之间的百分同一性。在计算百分同一性中，只有计算精确的匹配。

本发明还提供了包含标志物蛋白质或其片段的嵌合的或融合的蛋白质。如本文所用的，“嵌合蛋白质”或“融合蛋白质”包含可操作地与异源多肽(即，标志物蛋白质以外的多肽)连接的标志物蛋白质的全部或部分(优选生物活性部分)。在融合蛋白质中，术语“可操作地连接”是为了表明标志物蛋白质或其片段与异源多肽彼此同框融合。异源多肽可以与标志物蛋白质或片段的氨基末端或羧基末端融合。

一种有用的融合蛋白质是其中的标志物蛋白质或片段融合于GST序列的羧基末端的GST融合蛋白质。这样的融合蛋白质可以帮助本发明的重组多肽的纯化。

在另一个实施方式中，融合蛋白质在其氨基末端包含异源信号序列。例如，标志物蛋白质的天然信号序列可以被移除和被来自另一个蛋白质的信号序列替换。例如，杆状病毒包膜蛋白的gp67分泌序列可以被用作异源信号序列(Ausubel等编辑，Current Protocols in Molecular Biology,John Wiley&Sons,NY,1992)。真核异源信号序列的其他例子包括蜂毒肽和人类胎盘碱性磷酸酶的分泌序列(Stratagene；La Jolla,California)。在再另一个示例中，可使用的原核异源信号序列包括phoA分泌信号(Sambrook等，同上)和蛋白A分泌信号(Pharmacia Biotech；Piscataway,New Jersey)。

在再另一个实施方式中，融合蛋白质是其中标志物蛋白质的全部或部分与来自免疫球蛋白家族成员的序列融合的免疫球蛋白融合蛋白。本发明的免疫球蛋白融合蛋白可合并到药物组合物中，并向受试者施用以抑制配体(可溶的或膜结合的)与细胞表面上的蛋白质(受体)之间的相互作用，从而在体内抑制信号转导。免疫球蛋白融合蛋白可用于影响标志物蛋白质的同源配体的生物利用度。配体/受体相互作用的抑制可以是治疗上有用的，用于治疗增殖性和分化性障碍和用于调节(例如，促进或抑制)细胞的存活。此外，本发明的免疫球蛋白融合蛋白可以被用作免疫原而产生针对受试者中的标志物蛋白质的抗体，以纯化配体，并在筛选试验中，以鉴别抑制标志物蛋白质与配体的相互作用的分子。

可通过标准的重组DNA技术产生本发明的嵌合和融合蛋白质。在另一个实施方式中，可以通过常规技术(包括自动DNA合成仪)来合成融合基因。或者，可以使用锚定引物进行基因片段的PCR扩增，其中锚定引物导致两个连续的基因片段之间产生互补悬端，其可随后进行退火并重新扩增以产生嵌合的基因序列(见，例如，Ausubel等人，同上)。此外，许多表达载体是市售的，其已编码融合部分(例如，GST多肽)。编码本发明多肽的核酸可以被克隆到这样的表达载体中以至于融合部分被与本发明的多肽同框地连接。

可以使用信号序列来促进标志物蛋白质的分泌和分离。信号序列通常特征是疏水性氨基酸的核心，其一般在一个或多个裂解事件中从分泌过程中的成熟蛋白上被切割。这种信号肽包含加工位点，其允许在成熟蛋白通过分泌途径时信号序列从成熟蛋白切割。因此，本发明涉及具有信号序列的标志物蛋白质、融合蛋白或其片段，以及信号序列已经从其上中被蛋白水解地裂解的这种蛋白质(即，切割产物)。在一个实施方式中，编码信号序列的核酸序列可以被可操作地连接于表达载体中的目标蛋白质，例如标志物蛋白质或其片段。信号序列指导蛋白质的分泌，如从表达载体转化到其中的真核宿主分泌，和随后或同时切割信号序列。然后可以通过本领域公知的方法从细胞外培养基中很容易地纯化蛋白质。或者，可以使用有利于纯化的序列(如用GST结构域)将信号序列链接到目标蛋白质上。

本发明还涉及到的标志物蛋白质的变体。这样的变体具有改变的氨基酸序列，其可以作为激动剂(模拟物)或拮抗剂发挥功能。变体可以通过诱变产生，例如，离散的点突变或截短。激动剂可以保留天然存在形式的蛋白质的基本相同的生物活性或生物活性的子集。蛋白质的拮抗剂可以抑制天然存在形式的蛋白质的一个或多个活性，例如，竞争结合于其中包括目标蛋白质的细胞信号级联中的下游或上游成员。因此，特定的生物效应可通过用具有受限功能的变体处理而引起。相对于用天然存在形式的蛋白质进行治疗，用具有天然存在形式的蛋白质的生物活性子集的变体治疗受试者可以在受试者中有较少的副作用。

可以通过针对激动剂或拮抗剂活性筛选本发明的蛋白质的突变体(例如，截短的突变体)的组合文库识别作为激动剂(模拟物)或作为拮抗剂发挥功能的标志物蛋白质的变体。在一个实施方式中，变体的杂色文库(variegated library)是通过核酸水平的组合诱变产生的，且由杂色基因文库编码。变体的杂色文库可以通过，例如，将合成寡核苷酸的混合物酶促接合至基因序列中而产生，以使得潜在蛋白质序列的简并集可作为单个多肽或可选地作为一组较大的融合蛋白质(例如，对于噬菌体展示)表达。有很多种方法可用于从简并寡核苷酸序列产生标志物蛋白质的潜在变体的文库。合成简并寡核苷酸的方法在本领域中是已知的(参见，例如，Narang,1983,Tetrahedron 39:3；Itakura等,1984,Annu.Rev.Biochem.53:323；Itakura等,1984,Science 198:1056；Ike等,1983Nucleic Acid Res.11:477)。

此外，标志物蛋白质片段的文库可用于产生多肽的杂色群以用于筛选和随后选择变体标志物蛋白或其片段。例如，可以通过在其中每个分子只存在一个切口的条件下用核酸酶处理目的编码序列的双链PCR片段，使双链DNA变性，使DNA复性以形成其可以包括来自不同的切口产物的正义/反义对的双链DNA，通过用S1核酸酶处理从改组的双链体去除单链部分，和将所获得的片段文库接合至表达载体中来产生编码序列片段的文库。通过该方法，可以得到编码目标蛋白质的氨基末端和各种尺寸的内部片段的表达文库。

本领域中已知用于筛选通过点突变或截短产生的组合文库的基因产物和用于筛选具有选定的属性的基因产物的cDNA文库的几种技术。用于筛选大基因文库的适合于高通量分析的最广泛使用的技术通常包括将基因文库克隆到可复制的表达载体中，用得到的载体文库转化适当的细胞，和在检测所需的活性有利于分离编码其产物被检测的基因的载体的条件下表达该组合基因。递归集合诱变(REM)，一种提高功能突变在文库中的频率的技术，可以结合筛选分析使用以识别本发明蛋白质的变体(Arkin和Yourvan,1992,Proc.Natl.Acad.Sci.USA 89:7811-7815；Delgrave等,1993,Protein Engineering6(3):327-331)。

本发明的另一个方面涉及针对本发明蛋白质的抗体。在优选的实施方式中，所述抗体特异性结合标志物的蛋白质或其片段。文中可互换使用的术语“抗体”和“多个抗体”指免疫球蛋白分子及包含免疫球蛋白分子的免疫学活性部分的其片段和衍生物(即，这样的部分含有特异性结合抗原如标志物蛋白质，例如标志物蛋白质的表位，的抗原结合位点)。特异性结合本发明蛋白质的抗体是结合该蛋白质，但基本上不结合天然含有该蛋白质的样品(例如，生物样品)中的其它分子的抗体。免疫球蛋白分子的免疫活性部分的例子包括，但不限于，单链抗体(scAb)、F(ab)和F(ab')₂片段。

本发明的分离的蛋白质或其片段可用作免疫原以产生抗体。可以使用全长蛋白质，或可替代地，本发明提供用作免疫原的抗原性肽片段。本发明蛋白质的抗原性肽包含本发明的蛋白质之一的氨基酸序列的至少8个(优选为10、15、20或30个或更多个)氨基酸残基，和包括至少一个蛋白质的表位，以至于针对该肽产生的抗体与该蛋白质形成特异性的免疫复合物。抗原性肽所包含的优选表位是位于蛋白质表面上的区域，例如，亲水性区域。可以使用疏水性序列分析、亲水性序列分析或类似分析来识别亲水性区域。在优选的实施方式中，分离的标志物蛋白质或其片段用作免疫原。

免疫原通常用来通过免疫合适的(即具有免疫能力的)主体如兔子、山羊、小鼠或其他哺乳动物或脊椎动物制备抗体。合适的免疫原性制剂可以包含，例如，重组表达或化学合成的蛋白质或肽。该制剂还可以包括佐剂，如弗氏完全或不完全佐剂，或类似的免疫刺激剂。优选的免疫原组合物是不含其他人类蛋白质的那些，诸如，例如，使用非人类宿主细胞重组表达本发明蛋白质而形成的免疫原组合物。以这样的方式，获得的抗体组合物具有减少或没有本发明蛋白质之外的人类蛋白质的结合。

本发明提供了多克隆抗体和单克隆抗体。本文所用的术语“单克隆抗体”或“单克隆抗体组合物”是指抗体分子群体，其只包含能够与特定表位免疫反应的一类抗原结合位点。优选的多克隆抗体和单克隆抗体组合物是已被选择为针对本发明蛋白质的抗体的组合物。特别优选的多克隆抗体和单克隆抗体制剂是只含有针对标志物蛋白质或其片段的抗体的制剂。

可以通过使用本发明蛋白质作为免疫原对合适的主体进行免疫来制备多克隆抗体。可以通过标准技术，如用酶联免疫吸附试验(ELISA)，使用固定化多肽随着时间监测免疫主体中的抗体效价。在免疫后的适当时间，例如，当特定的抗体效价最高时，可以从受试者获得产生抗体的细胞，并通过标准技术，例如最初由Kohler和Milstein(1975)Nature 256:495-497描述的杂交瘤技术、人B细胞杂交瘤技术(参见Kozbor等，1983,Immunol.Today4:72)、EBV-杂交瘤技术(见Cole等，第77-96页，Monoclonal Antibodiesand Cancer Therapy,Alan R.Liss,Inc.,1985)或三源杂交瘤技术，来制备单克隆抗体(mAb)。用于产生杂交瘤的技术是众所周知的(一般参见CurrentProtocols in Immunology,Coligan等编辑,John Wiley&Sons,New York,1994)。产生本发明的单克隆抗体的杂交瘤细胞是通过，例如，使用标准的ELISA分析筛选用于结合目标多肽的抗体的杂交瘤培养物上清液进行检测的。

作为用于制备分泌单克隆抗体的杂交瘤的可选方式，可以通过用目标多肽筛选重组组合免疫球蛋白文库(例如，抗体噬菌体展示文库)来识别和分离针对本发明蛋白质的单克隆抗体。用于产生和筛选噬菌体展示文库的试剂盒是市售可得的(例如，Pharmacia Recombinant Phage Antibody System,Catalog No.27-9400-01和Stratagene SurfZAP Phage Display Kit,Catalog No.240612)。此外，特别适合产生和筛选抗体展示文库的方法和试剂的例子可以在例如，5,223,409号美国专利、PCT公开号WO 92/18619、PCT公开号WO 91/17271；PCT公开号WO 92/20791、PCT公开号WO 92/15679、PCT公开号WO 93/01288、PCT公开号WO 92/01047、PCT公开号WO 92/09690、PCT公开号WO 90/02809；Fuchs等(1991)Bio/Technology 9:1370-1372；Hay等(1992)Hum.Antibod.Hybridomas 3:81-85；Huse等，(1989)Science246:1275-1281；Griffiths等，(1993)EMBO J.12:725-734中找到。

本发明还提供了特异性结合本发明蛋白质的重组抗体。在优选的实施方式中，重组抗体特异性结合标志物蛋白质或其片段。重组抗体包括但不限于，嵌合和人源化单克隆抗体(其包含人和非人部分)、单链抗体和多特异性抗体。嵌合抗体是其中不同部分是来自于不同动物物种的分子，如具有源自于鼠mAb的可变区和人免疫球蛋白恒定区的那些(见，例如，Cabilly等，4,816,567号美国专利和Boss等，4,816,397号美国专利，其全文通过引用的方式并入本文)。单链抗体具有抗原结合位点和由单一多肽组成。它们可以通过本领域中已知的技术产生，例如，使用Ladner等，4,946,778号美国专利(通过引用将其全部并入本文)；Bird等，(1988)Science 242:423-426；Whitlow等，(1991)Methods in Enzymology 2:1-9；Whitlow等，(1991)Methods inEnzymology 2:97-105和Huston等,(1991)Methods in Molecular Design andModeling:Concepts and Applications 203:46-88k描述的方法。多特异性抗体是具有至少两个特异性结合不同抗原的抗原结合位点的抗体分子。这样的分子可以通过本领域已知的技术生产，例如使用在Segal,4,676,980号美国专利(其公开的内容通过引用全部并入本文)，Holliger等，(1993)Proc.Natl.Acad.Sci.USA 90:6444-6448；Whitlow等，(1994)Protein Eng.7:1017-1026和6,121,424号美国专利中描述的方法。

人源化抗体是具有一个或多个来自非人类物种的互补性决定区(CDR)和来自人免疫球蛋白分子的框架区的来自非人类物种的抗体分子(见，例如，Queen，5,585,089号美国专利，通过引用将其全部并入本文)。人源化单克隆抗体可以通过本领域中已知的重组DNA技术生产，例如，使用PCT公开号WO 87/02671、欧洲专利申请184,187、欧洲专利申请171,496、欧洲专利申请173,494、PCT公开号WO 86/01533、4,816,567号美国专利、欧洲专利申请125,023、Better等(1988)Science 240:1041-1043；Liu等(1987)Proc.Natl.Acad.Sci.USA 84:3439-3443；Liu等(1987)J.Immunol.139:3521-3526；Sun等(1987)Proc.Natl.Acad.Sci.USA 84:214-218；Nishimura等(1987)Cancer Res.47:999-1005；Wood等(1985)Nature 314:446-449和Shaw等(1988)J.Natl.Cancer Inst.80:1553-1559)；Morrison(1985)Science229:1202-1207；Oi等(1986)Bio/Techniques 4:214；5,225,539号美国专利；Jones等(1986)Nature 321:552-525；Verhoeyan等(1988)Science 239:1534和Beidler等(1988)J.Immunol.141:4053-4060中所述的方法。

更具体地，人源化抗体可以例如，使用不能表达内源性免疫球蛋白重链和轻链基因但是可以表达人重链和轻链基因的转基因小鼠产生。用所选择的抗原(例如，对应于本发明标志物的多肽的全部或部分)以正常的方式免疫转基因小鼠。针对该抗原的单克隆抗体可以使用常规杂交瘤技术获得。转基因小鼠携带的人免疫球蛋白转基因在B细胞分化过程中重新排列，并随后发生类别转换和体细胞突变。因此，使用这样的技术，有可能产生治疗上有用的IgG、IgA和IgE抗体。对于用于产生人抗体的这项技术的综述，参见Lonberg和Huszar(1995)Int.Rev.Immunol.13:65-93。对于用于产生人抗体和人单克隆抗体的这种技术和用于产生这样的抗体的方案的详细讨论，参见，例如，5,625,126号美国专利、5,633,425号美国专利、5,569,825号美国专利、5,661,016号美国专利和5,545,806号美国专利。此外，公司如Abgenix Inc.(Freemont,CA)可从事于使用类似上述的技术提供针对选择的抗原的人类抗体。

可以使用被称为“导向选择”的技术产生识别选定的表位的完全的人抗体。在这种方法中，选定的非人单克隆抗体，例如，鼠抗体，被用于指导选择识别相同表位的完全的人抗体(Jespers等，1994,Bio/technology12:899-903)。

可以在生产(例如，从受试者的血液或血清)或合成后分离本发明的抗体和通过熟知的技术进一步纯化。例如，可以使用蛋白A色谱纯化IgG抗体。可以通过，例如，亲和层析选择(例如，部分纯化)或纯化对本发明的蛋白质特异性的抗体。例如，如本文所述的产生本发明的重组表达和纯化(或部分纯化)的蛋白质，和共价或非共价地结合到固体支持物(如，例如，层析柱)上。然后该柱可以用于从含有针对大量的不同表位的抗体的样品中亲和纯化对本发明的蛋白质特异性的抗体，从而产生基本上纯化的抗体组合物，即基本上不含污染抗体的抗体组合物。在上下文中，基本上纯化的抗体组合物是指抗体样品中含有至多仅30％(以干重计算)的针对本发明所需蛋白质的表位以外的表位的污染抗体，且优选最多20％，还更优选最多10％，并且最优选最多5％(以干重计算)的样品是污染的抗体。纯化的抗体组合物是指组合物中至少99％的抗体是针对本发明的所需蛋白质。

在优选的实施方式中，本发明的基本上纯化的抗体可特异性地结合本发明蛋白质的信号肽、分泌序列、胞外结构域、跨膜或胞质域或者胞质膜。在特别优选的实施方式中，本发明的基本上纯化的抗体特异性结合本发明蛋白质的氨基酸序列的分泌序列或胞外结构域。在更优选的实施方式中，本发明的基本上纯化的抗体特异性结合标志物蛋白质的氨基酸序列的分泌序列或胞外结构域。

通过标准技术，如亲和色谱法或免疫沉淀，可以将针对本发明蛋白质的抗体用于分离该蛋白质。此外，这样的抗体可用于检测标志物蛋白质或其片段(例如，在细胞溶解产物或细胞上清液中)，以评估标志物的表达水平和表达谱。该抗体也可在诊断上被用于监测组织或人体体液中(例如，广泛性发育障碍相关的体液中)的蛋白质水平而作为临床检验的部分，例如用于，例如，测定给定的治疗方案的疗效。通过使用抗体衍生物可以有助于检测，其中该抗体衍生物包含与可检测物质偶联的本发明的抗体。可检测物质的例子包括各种酶、辅基、荧光材料、发光材料、生物发光材料和放射性材料。合适的酶的例子包括辣根过氧化物酶、碱性磷酸酶、β-半乳糖苷酶或乙酰胆碱酯酶；合适的辅基复合体的例子包括抗生蛋白链菌素/生物素和抗生物素蛋白/生物素；合适的荧光材料的例子包括伞形酮、荧光素、异硫氰酸荧光素、若丹明、二氯三嗪基胺荧光素、丹磺酰氯或藻红蛋白；发光材料的例子包括鲁米诺；生物发光材料的例子包括萤光素酶、萤光素和水母蛋白；合适的放射性物质的例子包括¹²⁵I、¹³¹I、³⁵S或³H。

本发明的抗体也可以用作治疗广泛性发育障碍的治疗剂。在优选的实施方式中，将本发明的完全人抗体用于治疗性治疗患有广泛性发育障碍的人类患者。在另一个优选的实施方式中，特异性结合标志物蛋白质或其片段的抗体被用于治疗性治疗。另外，这样的治疗性抗体可以是抗体衍生物或免疫毒素，其包含与治疗性基团如细胞毒素、治疗剂或放射性金属离子偶联的抗体。细胞毒素或细胞毒性剂包括任何对细胞有害的试剂。例子包括紫杉醇、细胞松弛素B、短杆菌肽D、溴化乙锭、吐根碱、丝裂霉素、依托泊苷，替尼泊苷、长春新碱、长春碱、秋水仙素、阿霉素、柔红霉素、二羟基蒽二酮(dihydroxyanthracin dione)、米托蒽醌、光辉霉素、放线菌素D、1-脱氢睾酮、糖皮质激素、普鲁卡因、丁卡因、利多卡因、心得安和嘌呤霉素及其类似物或同源物。治疗剂包括但不限于，抗代谢物(例如，氨甲喋呤、6-巯基嘌呤、6-硫鸟嘌呤、阿糖胞苷、5-氟尿嘧啶、氮烯唑胺)、烷基化剂(如氮芥、塞替派(thioepa)、苯丁酸氮芥、美法仑、卡莫司汀(BSNU)和洛莫司汀(CCNU)、环磷酰胺(cyclothosphamide)、白消安、二溴甘露醇、链脲佐菌素、丝裂霉素C和顺二氯二胺铂(II)(DDP)顺铂)、蒽环类抗生素(如，道诺红霉素(原道诺霉素)和阿霉素)、抗生素(如放线菌素D(原放线菌素)、博莱霉素、光神霉素和氨茴霉素(AMC))和抗有丝分裂剂(例如，长春新碱和长春花碱)。

本发明的偶联抗体可用于改变给定的生物反应，因为药物部分不应理解为限于经典的化学治疗剂。例如，该药物部分可以是具有所需的生物学活性的蛋白质或多肽。这些蛋白质可以包括，例如，毒素如核糖体抑制蛋白质(参见Better等，6,146,631号美国专利，在此全部引入其公开内容)、相思豆毒蛋白、蓖麻蛋白质A、假单胞菌外毒素或白喉毒素；蛋白质如肿瘤坏死因子、α-干扰素、β-干扰素、神经生长因子、血小板源生长因子、组织纤溶酶原激活剂或生物反应调节剂；或生物反应调节剂如，例如，淋巴因子、白介素1(“IL-1”)、白细胞介素2(“IL-2”)、白细胞介素6(“IL-6”)、粒细胞巨噬细胞集落刺激因子(“GM-CSF”)、粒细胞集落刺激因子(“G-CSF”)或其它生长因子。

用于将这些治疗部分与抗体相偶联的技术是众所周知的，见例如，Arnon等,"Monoclonal Antibodies For Immunotargeting Of Drugs In CancerTherapy",Monoclonal Antibodies And Cancer Therapy,Reisfeld等(eds.),pp.243-56(Alan R.Liss,Inc.1985)；Hellstrom等,"Antibodies For Drug Delivery",Controlled Drug Delivery(2nd Ed.),Robinson等(eds.),pp.623-53(MarcelDekker,Inc.1987)；Thorpe,"Antibody Carriers Of Cytotoxic Agents In CancerTherapy:A Review",Monoclonal Antibodies'84:Biological And ClinicalApplications,Pinchera等(eds.),pp.475-506(1985)；"Analysis,Results,AndFuture Prospective Of The Therapeutic Use Of Radiolabeled Antibody In CancerTherapy",Monoclonal Antibodies For Cancer Detection And Therapy,Baldwin等(eds.),pp.303-16(Academic Press 1985)和Thorpe等,"The Preparation AndCytotoxic Properties Of Antibody-Toxin Conjugates",Immunol.Rev.,62:119-58(1982)。

因此，在一个方面，本发明提供了基本上纯化的抗体、抗体片段和衍生物，其全部特异性结合本发明的蛋白质和优选地标志物蛋白质。在各种实施方式中，本发明的基本上纯化的抗体或它们的片段或衍生物可以是人抗体、非人抗体、嵌合抗体和/或人源化抗体。在另一个方面，本发明提供了非人抗体、抗体片段和衍生物，其全部特异性结合本发明的蛋白质和优选标志物蛋白质。这种非人抗体可以是山羊、小鼠、绵羊、马、鸡、兔或大鼠抗体。或者，本发明的非人抗体可以是嵌合的和/或人源化的抗体。此外，本发明的非人抗体可以是多克隆抗体或单克隆抗体。在再进一步的方面，本发明提供了单克隆抗体、抗体片段和衍生物，其全部特异性结合本发明的蛋白质和优选标志物蛋白质。该单克隆抗体可以是人抗体、人源化抗体、嵌合抗体和/或非人抗体。

本发明还提供了含有与可检测物质相结合的本发明抗体及其使用说明的试剂盒。本发明的再另一个方面是药物组合物，其含有本发明的抗体。在一个实施方式中，该药物组合物包含本发明的抗体和药学上可接受的载体。

3.本发明标记物的序列

下文详细描述了有关本发明标志物的信息。本发明标志物的序列在同时提交的序列表中列出。

AHSA1

正式符号：AHSA1

正式名称：AHA1，热休克90kDa蛋白ATP酶同源物1激活因子(酵母)

基因ID：10598

生物体：智人(Homo sapiens)

其他别名：HSPC322,AHA1,C14orf3,p38

其他指称：90kDa热休克蛋白ATP酶同源物1激活因子

核苷酸序列：

NCBI索引序列：NM_012111.2

位置：NM_012111

查询号：NM_012111

版本 NM_012111.2 GI:224451069

SEQ ID NO:1

蛋白质序列:

NCBI索引序列：NP_036243.1

位置：NP_036243

查询号：NP_036243

版本 NP_036243.1 GI:6912280

SEQ ID NO:2

AHSG

正式符号：AHSG

正式名称：α-2-HS-糖蛋白

基因ID：197

生物体：智人

其他别名：PRO2743,A2HS,AHS,FETUA,HSGA

其他指称：α-2-Z-球蛋白；ba-α-2-糖蛋白；胎球蛋白-A

核苷酸序列：

NCBI索引序列：NM_001622.2

位置：NM_001622

查询号：NM_001622

版本 NM_001622.2 GI:156523969

SEQ ID NO:3

蛋白质序列:

NCBI索引序列：NP_001613.2

位置：NP_001613

查询号：NP_001613

版本 NP_001613.2 GI:156523970

SEQ ID NO:4

ANXA6

正式符号：ANXA6

正式名称：膜联蛋白A6

基因ID：309

生物体：智人

其他别名：ANX6,CBP68

其他指称：67kDa钙电蛋白(calelectrin)；CPB-II；膜联蛋白VI(p68)；膜联蛋白-6；钙结合蛋白p68；钙电蛋白；钙磷脂结合蛋白II；钙磷脂结合蛋白-II；嗜铬粒结合蛋白(chromobindin)-20；脂皮质蛋白VI；p68；p70

核苷酸序列：转录变异体1

NCBI索引序列：NM_001155.4

位置：NM_001155

查询号：NM_001155

版本 NM_001155.4 GI:302129650

SEQ ID NO:5

蛋白质序列:同种型1

NCBI索引序列：NP_001146.2

位置：NP_001146

查询号：NP_001146

版本 NP_001146.2 GI:71773329

SEQ ID NO:6

核苷酸序列：转录变异体2

NCBI索引序列：NM_001193544.1

位置：NM_001193544

查询号：NM_001193544

版本 NM_001193544.1 GI:302129651

SEQ ID NO:7

蛋白质序列:同种型2

NCBI索引序列：NP_001180473.1

位置：NP_001180473

查询号：NP_001180473

版本 NP_001180473.1 GI:302129652

SEQ ID NO:8

AP1S1

正式符号：AP1S1

正式名称：衔接子相关的蛋白质复合物1，σ-1亚基

基因ID：1174

生物体：智人

其他别名：AP19,CLAPS1,MEDNIK,SIGMA1A,WUGSC:H_DJ0747G18.2

其他指称：AP-1复合物亚基σ-1A；HA119kDa亚基；衔接子相关的蛋白质复合物1σ-1A亚基；网格蛋白装配蛋白复合物1σ-1A小链；网格蛋白包覆装配蛋白(clathrin coat assembly protein)AP19；网格蛋白-相关/装配/衔接子蛋白，小1(19kD)；高尔基体衔接子HA1/AP1衔接蛋白σ-1A亚基；AP-1网格蛋白衔接子复合物的σ1A亚基；σ1A-衔接蛋白

核苷酸序列：

NCBI索引序列：NM_001283.3

位置：NM_001283

查询号：NM_001283

版本 NM_001283.3 GI:148536831

SEQ ID NO:9

蛋白质序列:

NCBI索引序列：NP_001274.1

位置：NP_001274

查询号：NP_001274

版本 NP_001274.1 GI:4557471

SEQ ID NO:10

APMAP

正式符号：APMAP

正式名称：脂肪细胞膜相关蛋白

基因ID：57136

生物体：智人

其他别名：RP4-568C11.2,BSCv,C20orf3

其他指称：脂肪细胞膜-相关蛋白；蛋白BSCv

核苷酸序列：

NCBI索引序列：NM_020531.2

位置：NM_020531

查询号：NM_020531

版本 NM_020531.2 GI:41327713

SEQ ID NO:11

蛋白质序列:

NCBI索引序列：NP_065392.1

位置：NP_065392

查询号：NP_065392

版本 NP_065392.1 GI:24308201

SEQ ID NO:12

CAPG

正式符号：CAPG

正式名称：加帽蛋白(肌动蛋白丝)，凝溶胶蛋白样

基因ID：822

生物体：智人

其他别名：AFCP,MCP

其他指称：肌动蛋白调节蛋白CAP-G；肌动蛋白调节蛋白CAP-G；凝溶胶蛋白样加帽蛋白；巨噬细胞加帽蛋白；巨噬细胞-加帽蛋白

核苷酸序列：转录变异体2

NCBI索引序列：NM_001256139.1

位置：NM_001256139

查询号：NM_001256139

版本 NM_001256139.1 GI:371502124

SEQ ID NO:13

蛋白质序列:同种型1

NCBI索引序列：NP_001243068.1

位置：NP_001243068

查询号：NP_001243068

版本 NP_001243068.1 GI:371502125

SEQ ID NO:14

核苷酸序列：转录变异体3

NCBI索引序列：NM_001256140.1

位置：NM_001256140

查询号：NM_001256140

版本 NM_001256140.1 GI:371502126

SEQ ID NO:15

蛋白质序列:同种型2

NCBI索引序列：NP_001243069.1

位置：NP_001243069

查询号：NP_001243069

版本 NP_001243069.1 GI:371502127

SEQ ID NO:16

核苷酸序列：转录变异体1

NCBI索引序列：NM_001747.3

位置：NM_001747

查询号：NM_001747

版本 NM_001747.3 GI:371502123

SEQ ID NO:17

蛋白质序列:同种型1

NCBI索引序列：NP_001738.2

位置：NP_001738

查询号：NP_001738

版本 NP_001738.2 GI:63252913

SEQ ID NO:18

CORO1A

正式符号：CORO1A

正式名称：冠蛋白(coronin)，肌动蛋白结合蛋白，1A

基因ID：11151

生物体：智人

其他别名：CLABP,CLIPINA,HCORO1,TACO,p57

其他指称：clipin-A；冠蛋白-1；冠蛋白-1A；冠蛋白-样蛋白A；冠蛋白-样蛋白p57；含有色氨酸-天冬氨酸的外壳蛋白

核苷酸序列：

NCBI索引序列：NM_001193333.2

位置：NM_001193333

查询号：NM_001193333

版本 NM_001193333.2 GI:306482594

SEQ ID NO:19

蛋白质序列:

NCBI索引序列：NP_001180262.1

位置：NP_001180262

查询号：NP_001180262

版本 NP_001180262.1 GI:300934762

SEQ ID NO:20

核苷酸序列：转录变异体2

NCBI索引序列：NM_007074.3

位置：NM_007074

查询号：NM_007074

版本 NM_007074.3 GI:306482593

SEQ ID NO:21

蛋白质序列:

NCBI索引序列：NP_009005.1

位置：NP_009005

查询号：NP_009005

版本 NP_009005.1 GI:5902134

SEQ ID NO:22

COTL1

正式符号：COTL1

正式名称：类肌动蛋白辅助蛋白(coactosin-like)1(网柄菌属)

基因ID：23406

生物体：智人

其他别名：CLP

其他指称：肌动蛋白辅助蛋白类似蛋白

核苷酸序列：

NCBI索引序列：NM_021149.2

位置：NM_021149

查询号：NM_021149

版本 NM_021149.2 GI:23510452

SEQ ID NO:23

蛋白质序列:

NCBI索引序列：NP_066972.1

位置：NP_066972

查询号：NP_066972

版本 NP_066972.1 GI:21624607

SEQ ID NO:24

CPOX

正式符号：CPOX

正式名称：

基因ID：1371

生物体：智人

其他别名：CPO,CPX,HCP

其他指称：COX；粪生素(coprogen)氧化酶；粪卟啉原III氧化酶，线粒体；粪卟啉原酶(coproporphyrinogenase)

核苷酸序列：

NCBI索引序列：NM_000097.5

位置：NM_000097

查询号：NM_000097

版本 NM_000097.5 GI:261862333

SEQ ID NO:25

蛋白质序列:

NCBI索引序列：NP_000088.3

位置：NP_000088

查询号：NP_000088

版本 NP_000088.3 GI:41393599

SEQ ID NO:26

CPSF6

正式符号：CPSF6

正式名称：断裂和聚腺苷酸化特异因子6，68kDa

基因ID：11052

生物体：智人

其他别名：CFIM,CFIM68,HPBRII-4,HPBRII-7

其他指称：CPSF 68kDa亚基；断裂和聚腺苷酸化特异因子68kDa亚基；断裂和聚腺苷酸化特异因子亚基6；pre-mRNA断裂因子I，68kD亚基；pre-mRNA断裂因子Im(68kD)；pre-mRNA断裂因子Im 68kDa亚基；蛋白质HPBRII-4/7

核苷酸序列：

NCBI索引序列：NM_007007.2

位置：NM_007007

查询号：NM_007007

版本 NM_007007.2 GI:162329582

SEQ ID NO:27

蛋白质序列:

NCBI索引序列：NP_008938.2

位置：NP_008938

查询号：NP_008938

版本 NP_008938.2 GI:162329583

SEQ ID NO:28

CUX1

正式符号：CUX1

正式名称：切样同源框1(cut-like homeobox 1)

基因ID：1523

生物体：智人

其他别名：CASP,CDP,CDP/Cut,CDP1,COY1,CUTL1,CUX,Clox,Cux/CDP,GOLIM6,Nbla10317,p100,p110,p200,p75

其他指称：CCAAT置换蛋白；cut同源物；高尔基体整合膜蛋白6；同源框蛋白cux-1；蛋白质CASP；Nbla10317的推定蛋白产物

核苷酸序列：转录变异体4

NCBI索引序列：NM_001202543.1

位置：NM_001202543

查询号：NM_001202543

版本:NM_001202543.1 GI:321400106

SEQ ID NO:29

蛋白质序列:同种型d

NCBI索引序列：NP_001189472.1

位置：NP_001189472

查询号：NP_001189472

版本:NP_001189472.1 GI:321400107

SEQ ID NO:30

核苷酸序列：转录变异体5

NCBI索引序列：NM_001202544.1

位置：NM_001202544

查询号：NM_001202544

版本:NM_001202544.1 GI:321400111

SEQ ID NO:31

蛋白质序列:同种型e

NCBI索引序列：NP_001189473.1

位置：NP_001189473

查询号：NP_001189473

版本:NP_001189473.1 GI:321400112

SEQ ID NO:32

核苷酸序列：转录变异体6

NCBI索引序列：NM_001202545.1

位置：NM_001202545

查询号：NM_001202545XR_108855XR_110720XR_113043

版本:NM_001202545.1 GI:321400113

SEQ ID NO:33

蛋白质序列:同种型f

NCBI索引序列：NP_001189474.1

位置：NP_001189474

查询号：NP_001189474

版本:NP_001189474.1 GI:321400114

SEQ ID NO:34

核苷酸序列：转录变异体7

NCBI索引序列：NM_001202546.1

位置：NM_001202546

查询号：NM_001202546

版本:NM_001202546.1 GI:321400115

SEQ ID NO:35

蛋白质序列:同种型g

NCBI索引序列：NP_001189475.1

位置：NP_001189475

查询号：NP_001189475

版本:NP_001189475.1 GI:321400116

SEQ ID NO:36

核苷酸序列：转录变异体2

NCBI索引序列：NM_001913.3

位置：NM_001913

查询号：NM_001913

版本:NM_001913.3 GI:321400109

SEQ ID NO:37

蛋白质序列:同种型b

NCBI索引序列：NP_001904.2

位置：NP_001904

查询号：NP_001904

版本:NP_001904.2 GI:31652236

SEQ ID NO:38

核苷酸序列：转录变异体3

NCBI索引序列：NM_181500.2

位置：NM_181500

查询号：NM_181500

版本:NM_181500.2 GI:321400110

SEQ ID NO:39

蛋白质序列:同种型c

NCBI索引序列：NP_852477.1

位置：NP_852477

查询号：NP_852477

版本:NP_852477.1 GI:31652238

SEQ ID NO:40

核苷酸序列：转录变异体1

NCBI索引序列：NM_181552.3

位置：NM_181552

查询号：NM_181552

版本:NM_181552.3 GI:321400108

SEQ ID NO:41

蛋白质序列:同种型a

NCBI索引序列：NP_853530.2

位置：NP_853530

查询号：NP_853530

版本:NP_853530.2 GI:148277064

SEQ ID NO:42

DDX39A

正式符号：DDX39A

正式名称：DEAD(Asp-Glu-Ala-Asp)盒多肽39A("DEAD"以SEQ ID NO:244公开)

基因ID：10212

生物体：智人

其他别名：BAT1,BAT1L,DDX39,DDXL,URH49

其他指称：ATP依赖RNA解旋酶DDX39A；DEAD(Asp-Glu-Ala-Asp)(SEQID NO:244)盒多肽39转录物；DEAD(SEQ ID NO:244)盒蛋白39；DEAD/H(Asp-Glu-Ala-Asp/His)(SEQ ID NO:245)盒多肽39；UAP56-相关解旋酶，49kDa；核RNA解旋酶URH49；核RNA解旋酶，DEAD盒家族的DECD变异体(SEQ ID NO:246)("DEAD"以SEQ ID NO:244公开)

核苷酸序列：

NCBI索引序列：NM_005804.3

位置：NM_005804

查询号：NM_005804

版本 NM_005804.3 GI:308522777

SEQ ID NO:43

蛋白质序列:

NCBI索引序列：NP_005795.2

位置：NP_005795

查询号：NP_005795

版本 NP_005795.2 GI:21040371

SEQ ID NO:44

DDX6

正式符号：DDX6

正式名称：DEAD(Asp-Glu-Ala-Asp)盒解旋酶6("DEAD"以SEQ ID NO:244公开)

基因ID：1656

生物体：智人

其他别名：HLR2,P54,RCK

其他指称：ATP-依赖RNA解旋酶p54；DEAD(Asp-Glu-Ala-Asp)(SEQ ID NO:244)盒多肽6；DEAD(SEQ ID NO:244)盒蛋白6；DEAD(SEQ ID NO:244)盒-6；DEAD/H(Asp-Glu-Ala-Asp/His)(SEQ ID NO:245)盒多肽6(RNA解旋酶，54kD)；癌基因RCK；疑似ATP-依赖RNA解旋酶DDX6

核苷酸序列：转录变异体2

NCBI索引序列：NM_001257191.1

位置：NM_001257191

查询号：NM_001257191

版本:NM_001257191.1 GI:380692341

SEQ ID NO:45

蛋白质序列:

NCBI索引序列：NP_001244120.1

位置：NP_001244120

查询号：NP_001244120

版本:NP_001244120.1 GI:380692342

SEQ ID NO:46

核苷酸序列：转录变异体1

NCBI索引序列：NM_004397.4

位置：NM_004397

查询号：NM_004397

版本:NM_004397.4 GI:164664517

SEQ ID NO:47

蛋白质序列:

NCBI索引序列：NP_004388.2

位置：NP_004388

查询号：NP_004388

版本:NP_004388.2 GI:164664518

SEQ ID NO:48

DIABLO

正式符号：DIABLO

正式名称：diablo，IAP-结合线粒体蛋白

基因ID：56616

生物体：智人

其他别名：hCG_1782202,DFNA64,DIABLO-S,SMAC,SMAC3

其他指称：0610041G12Rik；diablo同源物，线粒体；具有低pI的直接IAP-结合蛋白；线粒体Smac蛋白；第二个线粒体来源的半胱氨酸蛋白酶激活剂

核苷酸序列：线粒体同种型1前体

NCBI索引序列：NM_019887.4

位置：NM_019887

查询号：NM_019887

版本:NM_019887.4 GI:218505810

SEQ ID NO:49

蛋白质序列:同种型1

NCBI索引序列：NP_063940.1

位置：NP_063940

查询号：NP_063940

版本:NP_063940.1 GI:9845297

SEQ ID NO:50

核苷酸序列：线粒体同种型3前体

NCBI索引序列：NM_138929.3

位置：NM_138929

查询号：NM_138929

版本:NM_138929.3 GI:218505811

SEQ ID NO:51

蛋白质序列:同种型3

NCBI索引序列：NP_620307.1

位置：NP_620307

查询号：NP_620307

版本:NP_620307.1 GI:21070976

SEQ ID NO:52

EIF3B

正式符号：EIF3B

正式名称：真核翻译起始因子3，亚基B

基因ID：8662

生物体：智人

其他别名：EIF3-ETA,EIF3-P110,EIF3-P116,EIF3S9,PRT1

其他指称：eIF-3-eta；eIF3p110；eIF3p116；真核翻译起始因子3亚基9；真核翻译起始因子3亚基B；真核翻译起始因子3，亚基9(eta,116kD)；真核翻译起始因子3，亚基9eta，116kDa；hPrt1；prt1同源物

核苷酸序列：

NCBI索引序列：NM_001037283.1

位置：NM_001037283

查询号：NM_001037283

版本:NM_001037283.1 GI:83367071

SEQ ID NO:53

蛋白质序列:

NCBI索引序列：NP_001032360.1

位置：NP_001032360

查询号：NP_001032360

版本:NP_001032360.1 GI:83367072

SEQ ID NO:54

核苷酸序列：

NCBI索引序列：NM_003751.3

位置：NM_003751

查询号：NM_003751

版本:NM_003751.3 GI:83367073

SEQ ID NO:55

蛋白质序列:

NCBI索引序列：NP_003742.2

位置：NP_003742

查询号：NP_003742

版本:NP_003742.2 GI:33239445

SEQ ID NO:56

EIF3G

正式符号：EIF3G

正式名称：真核翻译起始因子3，亚基G

基因ID：8666

生物体：智人

其他别名：EIF3-P42,EIF3S4,eIF3-delta,eIF3-p44

其他指称:eIF-3RNA-结合亚基；eIF-3-delta；eIF3p42；eIF3p44；真核翻译起始因子3RNA-结合亚基；真核翻译起始因子3亚基4；真核翻译起始因子3亚基G；真核翻译起始因子3亚基p42；真核翻译起始因子3，亚基4(delta,44kD)；真核翻译起始因子3，亚基4delta，44kDa

核苷酸序列：

NCBI索引序列：NM_003755.3

位置：NM_003755

查询号：NM_003755

版本:NM_003755.3 GI:83281440

SEQ ID NO:57

蛋白质序列:

NCBI索引序列：NP_003746.2

位置：NP_003746

查询号：NP_003746

版本:NP_003746.2 GI:49472822

SEQ ID NO:58

EIF3L

正式符号：EIF3L

正式名称：真核翻译起始因子3，亚基L

基因ID：51386

生物体：智人

其他别名：AL022311.1,EIF3EIP,EIF3S11,EIF3S6IP,HSPC021,HSPC025,MSTP005

其他指称：eIEF相关蛋白HSPC021；真核翻译起始因子3亚基6-相互作用蛋白；真核翻译起始因子3亚基E-相互作用蛋白；真核翻译起始因子3亚基L

核苷酸序列：同种型1

NCBI索引序列：NM_016091.3

位置：NM_016091

查询号：NM_016091

版本:NM_016091.3 GI:339275829

SEQ ID NO:59

蛋白质序列:同种型1

NCBI索引序列：NP_057175.1

位置：NP_057175

查询号：NP_057175

版本:NP_057175.1 GI:7705433

SEQ ID NO:60

核苷酸序列：同种型2

NCBI索引序列：NM_001242923.1

位置：NM_001242923

查询号：NM_001242923

版本:NM_001242923.1 GI:339275830

SEQ ID NO:61

蛋白质序列:同种型2

NCBI索引序列：NP_001229852.1

位置：NP_001229852

查询号：NP_001229852

版本:NP_001229852.1 GI:339275831

SEQ ID NO:62

EIF4A2

正式符号：EIF4A2

正式名称：真核翻译起始因子4A2

基因ID：1974

生物体：智人

其他别名：BM-010,DDX2B,EIF4A,EIF4F,eIF-4A-II,eIF4A-II

其他指称：ATP-依赖RNA解旋酶eIF4A-2；真核起始因子4A-II；真核翻译起始因子4A

核苷酸序列：

NCBI索引序列：NM_001967.3

位置：NM_001967

查询号：NM_001967

版本:NM_001967.3 GI:83700234

SEQ ID NO:63

蛋白质序列:

NCBI索引序列：NP_001958.2

位置：NP_001958

查询号：NP_001958

版本:NP_001958.2 GI:83700235

SEQ ID NO:64

ERAP1

正式符号：ERAP1

正式名称：内质网氨基肽酶1

基因ID：51752

生物体：智人

其他别名：UNQ584/PRO1154,A-LAP,ALAP,APPILS,ARTS-1,ARTS1,ERAAP,ERAAP1,PILS-AP,PILSAP

其他指称：脂肪细胞源性亮氨酸氨基肽酶；氨基肽酶PILS；TNFR1脱落的氨基肽酶调节子；与抗原加工相关的内质网氨基肽酶；嘌呤霉素不敏感的亮氨酰特异性氨基肽酶；1型肿瘤坏死因子受体脱落氨肽酶调控因子

核苷酸序列：转录变异体2

NCBI索引序列：NM_001040458.1

位置：NM_001040458

查询号：NM_001040458

版本:NM_001040458.1 GI:94818890

SEQ ID NO:65

蛋白质序列:变异体2

NCBI索引序列：NP_001035548.1

位置：NP_001035548

查询号：NP_001035548

版本:NP_001035548.1 GI:94818891

SEQ ID NO:66

核苷酸序列：转录变异体1

NCBI索引序列：NM_016442.3

位置：NM_016442

查询号：NM_016442

版本:NM_016442.3 GI:94818900

SEQ ID NO:67

蛋白质序列:变异体1

NCBI索引序列：NP_057526.3

位置：NP_057526

查询号：NP_057526

版本:NP_057526.3 GI:94818901

SEQ ID NO:68

核苷酸序列：转录变异体3

NCBI索引序列：NM_001198541.1

位置：NM_001198541

查询号：NM_001198541

版本:NM_001198541.1 GI:309747090

SEQ ID NO:69

蛋白质序列:变异体3

NCBI索引序列：NP_001185470.1

位置：NP_001185470

查询号：NP_001185470

版本:NP_001185470.1 GI:309747091

SEQ ID NO:70

ERP44

正式符号：ERP44

正式名称：内质网蛋白44

基因ID：23071

生物体：智人

其他别名：UNQ532/PRO1075,PDIA10,TXNDC4

其他指称：ER蛋白44；内质网驻留蛋白44；内质网驻留蛋白44kDa；蛋白质二硫键异构酶家族A，成员10；硫氧化还原蛋白域含4(内质网)；硫氧化还原蛋白域含蛋白4

核苷酸序列：

NCBI索引序列：NM_015051.1

位置：NM_015051

查询号：NM_015051

版本:NM_015051.1 GI:52487190

SEQ ID NO:71

蛋白质序列:

NCBI索引序列：NP_055866.1

位置：NP_055866

查询号：NP_055866

版本:NP_055866.1 GI:52487191

SEQ ID NO:72

ETFB

正式符号：ETFB

正式名称：电子转移黄素蛋白，β多肽

基因ID：2109

生物体：智人

其他别名：FP585,MADD

其他指称：β-ETF；电子转移黄素蛋白β亚基；电子转移黄素蛋白β-亚基；电子转移黄素蛋白亚基β；电子转移黄素蛋白，β多肽；电子-转移-黄素蛋白，β多肽

核苷酸序列：同种型1

NCBI索引序列：NM_001985.2

位置：NM_001985

查询号：NM_001985

版本:NM_001985.2 GI:62420878

SEQ ID NO:73

蛋白质序列:同种型1

NCBI索引序列：NP_001976.1

位置：NP_001976

查询号：NP_001976

版本:NP_001976.1 GI:4503609

SEQ ID NO:74

核苷酸序列：同种型2

NCBI索引序列：NM_001014763.1

位置：NM_001014763

查询号：NM_001014763

版本:NM_001014763.1 GI:62420876

SEQ ID NO:75

蛋白质序列:同种型2

NCBI索引序列：NP_001014763.1

位置：NP_001014763

查询号：NP_001014763

版本:NP_001014763.1 GI:62420877

SEQ ID NO:76

FARSA

正式符号：FARSA

正式名称：苯丙氨酰-tRNA合成酶，α亚基

基因ID：2193

生物体：智人

其他别名：CML33,FARSL,FARSLA,FRSA,PheHA

其他指称：pheRS；苯丙氨酸tRNA连接酶1，α，细胞质；苯丙氨酸--tRNA连接酶α链；苯丙氨酸--tRNA连接酶α亚基；苯丙氨酸-tRNA合成酶α-亚基；类苯丙氨酸-tRNA合成酶，α亚基；苯丙氨酰-tRNA合成酶α链；类苯丙氨酰-tRNA合成酶，α亚基

核苷酸序列：

NCBI索引序列：NM_004461.2

位置：NM_004461

查询号：NM_004461

版本:NM_004461.2 GI:126517492

SEQ ID NO:77

蛋白质序列:

NCBI索引序列：NP_004452.1

位置：NP_004452

查询号：NP_004452

版本:NP_004452.1 GI:4758340

SEQ ID NO:78

FKBP4

正式符号：FKBP4

正式名称：FK506结合蛋白4，59kDa

基因ID：2288

生物体：智人

其他别名：FKBP51,FKBP52,FKBP59,HBI,Hsp56,PPIase,p52

其他指称：51kDa FK506-结合蛋白；FK506-结合蛋白4(59kD)；HSP结合亲免素；T-cell FK506-结合蛋白，59kD；肽脯氨酰顺反异构酶FKBP4；肽脯氨酰顺反异构酶；旋转异构酶

核苷酸序列：

NCBI索引序列：NM_002014.3

位置：NM_002014

查询号：NM_002014

版本:NM_002014.3 GI:206725538

SEQ ID NO:79

蛋白质序列:

NCBI索引序列：NP_002005.1

位置：NP_002005

查询号：NP_002005

版本:NP_002005.1 GI:4503729

SEQ ID NO:80

GET4

正式符号：GET4

正式名称：高尔基体至ER运输蛋白4同源物(golgi to ER traffic protein 4homolog)

基因ID：51608

生物体：智人

其他别名：CEE；TRC35；CGI-20；C7orf20

其他指称：高尔基体至ER运输蛋白4同源物；H_NH1244M04.5；保守边缘表达蛋白；保守边缘蛋白；保守边缘-表达蛋白；跨膜结构域识别复合物35kDa亚基；跨膜结构域识别复合物，35kDa

核苷酸序列：

NCBI索引序列：NM_015949.2

位置：NM_015949

查询号：NM_015949

版本:NM_015949.2 GI:38570061

SEQ ID NO:81

蛋白质序列:

NCBI索引序列：NP_057033.2

位置：:NP_057033

查询号：NP_057033

版本:NP_057033.2 GI:38570062

SEQ ID NO:82

GLUD1

正式符号：GLUD1

正式名称：谷氨酸脱氢酶1

基因ID：2746

生物体：智人

其他别名：GDH；GDH1；GLUD

其他指称：GDH 1；谷氨酸脱氢酶(NAD(P)+)；谷氨酸脱氢酶1，线粒体

核苷酸序列：

NCBI索引序列：NM_005271.3

位置：NM_005271

查询号：NM_005271

版本:NM_005271.3 GI:260064010

SEQ ID NO:83

蛋白质序列:

NCBI索引序列：NP_005262.1

位置：NP_005262

查询号：NP_005262

版本:NP_005262.1 GI:4885281

SEQ ID NO:84

GTF2I

正式符号：GTF2I

正式名称：通用转录因子IIi

基因ID：2969

生物体：智人

其他别名：BAP135,BTKAP1,DIWS,GTFII-I,IB291,SPIN,TFII-I,WBS,WBSCR6

其他指称：BTK-关联蛋白135；BTK-关联蛋白，135kD；Bruton酪氨酸激酶-关联蛋白135；SRF-Phox1-相互作用蛋白；Williams-Beuren综合征染色体区域6；通用转录因子II-I；williams-Beuren综合征染色体区域6蛋白

核苷酸序列：转录变异体5

NCBI索引序列：NM_001163636.1

位置：NM_001163636

查询号：NM_001163636

版本:NM_001163636.1 GI:254692933

SEQ ID NO:85

蛋白质序列:同种型5

NCBI索引序列：NP_001157108.1

位置：NP_001157108

查询号：NP_001157108

版本:NP_001157108.1 GI:254692934

SEQ ID NO:86

核苷酸序列：转录变异体4

NCBI索引序列：NM_001518.3

位置：NM_001518

查询号：NM_001518

版本:NM_001518.3 GI:169881251

SEQ ID NO:87

蛋白质序列:同种型4

NCBI索引序列：NP_001509.3

位置：NP_001509

查询号：NP_001509NP_127496XP_944599

版本:NP_001509.3 GI:169881252

SEQ ID NO:88

核苷酸序列：转录变异体1

NCBI索引序列：NM_032999.2

位置：NM_032999

查询号：NM_032999

版本:NM_032999.2 GI:169881253

SEQ ID NO:89

蛋白质序列:同种型1

NCBI索引序列：NP_127492.1

位置：NP_127492

查询号：NP_127492

版本:NP_127492.1 GI:14670350

SEQ ID NO:90

核苷酸序列：转录变异体2

NCBI索引序列：NM_033000.2

位置：NM_033000

查询号：NM_033000 XM_001133646

版本:NM_033000.2 GI:169881254

SEQ ID NO:91

蛋白质序列:同种型2

NCBI索引序列：NP_127493.1

位置：NP_127493

查询号：NP_127493 XP_001133646

版本:NP_127493.1 GI:14670352

SEQ ID NO:92

核苷酸序列：转录变异体3

NCBI索引序列：NM_033001.2

位置：NM_033001

查询号：NM_033001 XM_001130609

版本:NM_033001.2 GI:169881255

SEQ ID NO:93

蛋白质序列:同种型3

NCBI索引序列：NP_127494.1

位置：NP_127494

查询号：NP_127494 XP_001130609

版本:NP_127494.1 GI:14670354

SEQ ID NO:94

HBA2

正式符号：HBA2

正式名称：血红蛋白，α2

基因ID：3040

生物体：智人

其他别名：HBH

其他指称：α球蛋白；α-2球蛋白；α-球蛋白；血红蛋白α链；血红蛋白亚基α

核苷酸序列：

NCBI索引序列：NM_000517.4

位置：NM_000517

查询号：NM_000517

版本:NM_000517.4 GI:172072689

SEQ ID NO:95

蛋白质序列:

NCBI索引序列：NP_000508.1

位置：NP_000508

查询号：NP_000508

版本:NP_000508.1 GI:4504345

SEQ ID NO:96

HLA-A

正式符号：HLA-A

正式名称：主要组织相容性复合体I类，A

基因ID：3105

生物体：智人

其他别名：DAQB-90C11.16-002,HLAA

其他指称：HLA I类组织相容性抗原，A-1α链；MHC I类抗原HLA-A重链；抗原呈现分子；白细胞抗原I-A类

核苷酸序列：转录变异体2

NCBI索引序列：NM_001242758.1

位置：NM_001242758

查询号：NM_001242758 XM_003960035 XM_003960036

XM_003960037 XM_003960038 XM_003960039

XM_003960040 XM_003960041 XM_003960042

XM_003960043 XM_003960044 XM_003960045

版本:NM_001242758.1 GI:337752169

SEQ ID NO:97

蛋白质序列:A*01:01:01:01等位基因

NCBI索引序列：NP_001229687.1

位置：NP_001229687

查询号：NP_001229687 XP_003960084 XP_003960085 XP_003960086

XP_003960087 XP_003960088 XP_003960089 XP_003960090

XP_003960091 XP_003960092 XP_003960093 XP_003960094

版本:NP_001229687.1 GI:337752170

SEQ ID NO:98

核苷酸序列：转录变异体1

NCBI索引序列：NM_002116.7

位置：NM_002116

查询号：NM_002116 NM_001080840 XM_001713645

版本:NM_002116.7 GI:337752171

SEQ ID NO:99

蛋白质序列:A*03:01:0:01等位基因

NCBI索引序列：NP_002107.3

位置：NP_002107 NP_001074309 XP_001713697

查询号：NP_002107

版本:NP_002107.3 GI:24797067

SEQ ID NO:100

HLA-DQB1

正式符号：HLA-DQB1

正式名称：主要组织相容性复合体，II类，DQβ1

基因ID：3119

生物体：智人

其他别名：DADB-249P12.2,CELIAC1,HLA-DQB,IDDM1

其他指称：HLA II类组织相容性抗原，DQβ1链；MHC DQβ；MHC II类DQβ链；MHC II类HLA-DQβ糖蛋白；MHC II类抗原DQB1；MHC II类抗原HLA-DQ-β-1；MHC 2类抗原；淋巴细胞抗原

核苷酸序列：转录变异体2

NCBI索引序列：NM_001243961.1

位置：NM_001243961

查询号：NM_001243961

版本:NM_001243961.1 GI:345461080

SEQ ID NO:101

蛋白质序列:同种型2

NCBI索引序列：NP_001230890.1

位置：NP_001230890

查询号：NP_001230890

版本:NP_001230890.1 GI:345461081

SEQ ID NO:102

核苷酸序列：转录变异体3

NCBI索引序列：NM_001243962.1

位置：NM_001243962

查询号：NM_001243962 XM_003846474 XM_003846475

版本:NM_001243962.1 GI:345461078

SEQ ID NO:103

蛋白质序列:同种型1

NCBI索引序列：NP_001230891.1

位置：NP_001230891

查询号：NP_001230891 XP_003846522 XP_003846523

版本:NP_001230891.1 GI:345461079

SEQ ID NO:104

核苷酸序列：转录变异体1

NCBI索引序列：NM_002123.4

位置：NM_002123

查询号：NM_002123 XM_001722253 XM_001723447

版本:NM_002123.4 GI:345461082

SEQ ID NO:105

蛋白质序列:同种型1

NCBI索引序列：NP_002114.3

位置：NP_002114

查询号：NP_002114 XP_001722305 XP_001723499

版本:NP_002114.3 GI:150418002

SEQ ID NO:106

HLA-DRA

正式符号：HLA-DRA

正式名称：主要组织相容性复合体，II类，DRα

基因ID：3122

生物体：智人

其他别名：DASS-397D15.1,HLA-DRA1,MLRW

其他指称：HLA II类组织相容性抗原，DRα链；MHC细胞表面糖蛋白；MHC II类抗原DRA；组织相容性抗原HLA-DRα

核苷酸序列：

NCBI索引序列：NM_019111.4

位置：NM_019111

查询号：NM_019111

版本:NM_019111.4 GI:301171411

SEQ ID NO:107

蛋白质序列:

NCBI索引序列：NP_061984.2

位置：NP_061984

查询号：NP_061984

版本:NP_061984.2 GI:52426774

SEQ ID NO:108

HNRNPM

正式符号：HNRNPM

正式名称：异质性胞核核糖核蛋白M

基因ID：4670

生物体：智人

其他别名：CEAR,HNRNPM4,HNRPM,HNRPM4,HTGR1,NAGR1,hnRNP M

其他指称：CEA受体；N-乙酰葡糖胺受体1；异质性胞核核糖核蛋白M4；hnRNA-结合蛋白M4

核苷酸序列：转录变异体1

NCBI索引序列：NM_005968.4

位置：NM_005968

查询号：NM_005968

版本:NM_005968.4 GI:345091004

SEQ ID NO:109

蛋白质序列:同种型a

NCBI索引序列：NP_005959.2

位置：NP_005959

查询号：NP_005959

版本:NP_005959.2 GI:14141152

SEQ ID NO:110

核苷酸序列：转录变异体2

NCBI索引序列：NM_031203.3

位置：NM_031203

查询号：NM_031203

版本:NM_031203.3 GI:345091007

SEQ ID NO:111

蛋白质序列:同种型b

NCBI索引序列：NP_112480.2

位置：NP_112480

查询号：NP_112480

版本:NP_112480.2 GI:157412270

SEQ ID NO:112

HPRT1

正式符号：HPRT1

正式名称：次黄嘌呤磷酸核糖转移酶1

基因ID：3251

生物体：智人

其他别名：HGPRT,HPRT

其他指称：HGPRTase；次黄嘌呤鸟嘌呤磷酸核糖基转移酶

核苷酸序列：

NCBI索引序列：NM_000194.2

位置：NM_000194

查询号：NM_000194

版本:NM_000194.2 GI:164518913

SEQ ID NO:113

蛋白质序列:

NCBI索引序列：NP_000185.1

位置：NP_000185

查询号：NP_000185

版本:NP_000185.1 GI:4504483

SEQ ID NO:114

HSP90B1

正式符号：HSP90B1

正式名称：热休克蛋白90kDaβ(Grp94)，成员1

基因ID：7184

生物体：智人

其他别名：ECGP,GP96,GRP94,TRA1

其他指称：94kDa葡萄糖调节蛋白；内质蛋白；内皮细胞(HBMEC)糖蛋白；热休克蛋白90kDaβ成员1；胁迫诱导的肿瘤排斥抗原gp96；肿瘤排斥抗原(gp96)1；肿瘤排斥抗原1

核苷酸序列：

NCBI索引序列：NM_003299.2

位置：NM_003299

查询号：NM_003299

版本:NM_003299.2 GI:399567818

SEQ ID NO:115

蛋白质序列:

NCBI索引序列：NP_003290.1

位置：NP_003290

查询号：NP_003290

版本:NP_003290.1 GI:4507677

SEQ ID NO:116

HSPH1

正式符号：HSPH1

正式名称：热休克105kDa/110kDa蛋白1

基因ID：10808

生物体：智人

其他别名：RP11-173P16.1,HSP105,HSP105A,HSP105B,NY-CO-25

其他指称：抗原NY-CO-25；热休克105kDα；热休克105kDβ；热休克105kDa蛋白1；热休克110kDa蛋白；热休克蛋白105kDa

核苷酸序列：

NCBI索引序列：NM_006644.2

位置：NM_006644

查询号：NM_006644

版本:NM_006644.2 GI:42544158

SEQ ID NO:117

蛋白质序列:

NCBI索引序列：NP_006635.2

位置：NP_006635

查询号：NP_006635

版本:NP_006635.2 GI:42544159

SEQ ID NO:118

IGHM

正式符号：IGHM

正式名称：免疫球蛋白重链恒定区μ

基因ID：3507

生物体：智人

其他别名：AGM1,MU,VH

其他指称：无

核苷酸序列：mRNA变异体1

ENA序列参引编号:X17115.1

>ENA|X17115|X17115.1人IgM重链完整序列的mRNA：位置:1..1000

SEQ ID NO:119

蛋白质序列:同种型1

UniProtKB/Swiss-Prot参引编号:P01871-1

>sp|P01871|IGHM_HUMAN IgμC链区域OS＝Homo Sapiens

GN＝IGHM PE＝1 SV＝3

SEQ ID NO:120

核苷酸序列：mRNA变异体2

ENA序列参引编号:X57086.1

>ENA|X57086|X57086.1智人IgM重链恒定结构域的mRNA：位

置:1..1000

SEQ ID NO:121

蛋白质序列:同种型2

UniProtKB/Swiss-Prot参引编号:P01871-2

>sp|P01871-2|IGHM_HUMAN IgμC链区域同种型2 OS＝Homo

sapiens:GN＝IGHM

SEQ ID NO:122

IGLC1

正式符号：IGLC1

正式名称：免疫球蛋白λ恒定区1(Mcg标志物)

基因ID：3537

生物体：智人

其他别名：IGLC

其他指称：无

核苷酸序列：mRNA变异体1

ENA序列参引编号:CAA36047.1

>ENA|CAA36047|CAA36047.1智人(人)假定蛋白：位置:1..320

SEQ ID NO:123

核苷酸序列：mRNA变异体2

ENA序列参引编号:AAA59106.1

>ENA|AAA59106|AAA59106.1智人(人)部分免疫球蛋白λ轻链C区

域:位置:1..315

SEQ ID NO:124

蛋白质序列:

UniProtKB/Swiss-Prot参引编号:P0CG04

>sp|P0CG04|LAC1_HUMAN Igλ-1C链区域OS＝Homo sapiens

GN＝IGLC1PE＝1SV＝1

SEQ ID NO:125

ITGB7

正式符号：ITGB7

正式名称：整联蛋白，β7

基因ID：3695

生物体：智人

其他别名：无

其他指称：肠归巢受体β亚基；整联蛋白β7亚基；整联蛋白β-7

核苷酸序列：

NCBI索引序列：NM_000889.1

位置：NM_000889

查询号：NM_000889

版本:NM_000889.1 GI:4504776

SEQ ID NO:126

蛋白质序列:

NCBI索引序列：NP_000880.1

位置：NP_000880

查询号：NP_000880

版本:NP_000880.1 GI:4504777

SEQ ID NO:127

LCP1

正式符号：LCP1

正式名称：淋巴细胞胞液蛋白1(L-丝束蛋白)

基因ID：3936

生物体：智人

其他别名：RP11-139H14.1,CP64,L-PLASTIN,LC64P,LPL,PLS2

其他指称：L-丝束蛋白(淋巴细胞胞液蛋白1)(LCP-1)(LC64P)；LCP-1；淋巴细胞胞液蛋白-1(纤溶酶)；bA139H14.1(淋巴细胞胞液蛋白1(L-丝束蛋白))；丝束蛋白2；丝束蛋白-2

核苷酸序列：

NCBI索引序列：NM_002298.4

位置：NM_002298

查询号：NM_002298

版本:NM_002298.4 GI:195546923

SEQ ID NO:128

蛋白质序列:

NCBI索引序列：NP_002289.2

位置：NP_002289

查询号：NP_002289

版本:NP_002289.2 GI:167614506

SEQ ID NO:129

LETM1

正式符号：LETM1

正式名称：亮氨酸拉链EF-hand结构域跨膜蛋白1

基因ID：3954

生物体：智人

其他别名：none

其他指称：LETM1和EF-hand结构域蛋白1，线粒体；Mdm38同源物；亮氨酸拉链-EF-hand-结构域跨膜蛋白1

核苷酸序列：

NCBI索引序列：NM_012318.2

位置：NM_012318

查询号：NM_012318

版本:NM_012318.2 GI:194595498

SEQ ID NO:130

蛋白质序列:

NCBI索引序列：NP_036450.1

位置：NP_036450

查询号：NP_036450

版本:NP_036450.1 GI:6912482

SEQ ID NO:131

LMNA

正式符号：LMNA

正式名称：核纤层蛋白A/C

基因ID：150330

生物体：智人

其他别名：RP11-54H19.1,CDCD1,CDDC,CMD1A,CMT2B1,EMD2,FPL,FPLD,FPLD2,HGPS,IDC,LDP1,LFP,LGMD1B,LMN1,LMNC,LMNL1,PRO1

其他指称：70kDa核纤层蛋白；核纤层蛋白；类核纤层蛋白A/C 1；prelamin-A/C；肾癌抗原NY-REN-32

核苷酸序列：转录变异体4

NCBI索引序列：NM_001257374.1

位置：NM_001257374

查询号：NM_001257374

版本:NM_001257374.1 GI:383792149

SEQ ID NO:132

蛋白质序列:同种型D

NCBI索引序列：NP_001244303.1

位置：NP_001244303

查询号：NP_001244303

版本:NP_001244303.1 GI:383792150

SEQ ID NO:133

核苷酸序列：转录变异体2

NCBI索引序列：NM_005572.3

位置：NM_005572

查询号：NM_005572

版本:NM_005572.3 GI:153281091

SEQ ID NO:134

蛋白质序列:同种型C

NCBI索引序列：NP_005563.1

位置：NP_005563

查询号：NP_005563

版本:NP_005563.1 GI:5031875

SEQ ID NO:135

核苷酸序列：转录变异体1

NCBI索引序列：NM_170707.3

位置：M_170707

查询号：NM_170707

版本:NM_170707.3 GI:383792147

SEQ ID NO:136

蛋白质序列:同种型A

NCBI索引序列：NP_733821.1

位置：NP_733821

查询号：NP_733821

版本:NP_733821.1 GI:27436946

SEQ ID NO:137

核苷酸序列：转录变异体3

NCBI索引序列：NM_170708.3

位置：NM_170708

查询号：NM_170708

版本:NM_170708.3 GI:383792148

SEQ ID NO:138

蛋白质序列:同种型A-δ10

NCBI索引序列：NP_733822.1

位置：NP_733822

查询号：NP_733822

版本:NP_733822.1 GI:27436948

SEQ ID NO:139

MGEA5

正式符号：MGEA5

正式名称：脑膜瘤表达抗原5(透明质酸酶)

基因ID：10724

生物体：智人

其他别名：MEA5,NCOAT,OGA

其他指称：O-GlcNAcase；双功能蛋白NCOAT；脑膜瘤透明质酸酶；脑膜瘤表达的抗原5；核质O-GlcNAcase和乙酰基转移酶

核苷酸序列：转录变异体2

NCBI索引序列：NM_001142434.1

位置：NM_001142434

查询号：NM_001142434

版本:NM_001142434.1 GI:215490055

SEQ ID NO:140

蛋白质序列:同种型b

NCBI索引序列：NP_001135906.1

位置：NP_001135906

查询号：NP_001135906

版本:NP_001135906.1 GI:215490056

SEQ ID NO:141

核苷酸序列：转录变异体1

NCBI索引序列：NM_012215.3

位置：NM_012215

查询号：NM_012215

版本:NM_012215.3 GI:215490054

SEQ ID NO:142

蛋白质序列:同种型a

NCBI索引序列：NP_036347.1

位置：NP_036347

查询号：NP_036347

版本:NP_036347.1 GI:11024698

SEQ ID NO:143

MTHFD1

正式符号：MTHFD1

正式名称：亚甲基四氢叶酸脱氢酶(NADP+依赖性)1,亚甲基四氢叶酸环水解酶，甲酰四氢叶酸合成酶

基因ID：4522

生物体：智人

其他别名：MTHFC,MTHFD

其他指称：5,10-亚甲基四氢叶酸脱氢酶，5,10-亚甲基四氢叶酸环水解酶，10-甲酰四氢叶酸合成酶；C-1-四氢叶酸合成酶，胞质；C1-THF合成酶；胞质C-1-四氢叶酸合成酶

核苷酸序列：

NCBI索引序列：NM_005956.3

位置：NM_005956

查询号：NM_005956

版本:NM_005956.3 GI:222136638

SEQ ID NO:144

蛋白质序列:

NCBI索引序列：NP_005947.3

位置：NP_005947

查询号：NP_005947

版本:NP_005947.3 GI:222136639

SEQ ID NO:145

MX1

正式符号：MX1

正式名称：粘病毒(流感病毒)抗性1，干扰素诱导蛋白p78(小鼠)

基因ID：4599

生物体：智人

其他别名：IFI-78K,IFI78,MX,MxA

其他指称：干扰素诱导的GTP-结合蛋白Mx1；干扰素-凋控抗性GTP-结合蛋白MxA；粘液瘤抗性蛋白1

核苷酸序列：转录变异体1

NCBI索引序列：NM_001144925.1

位置：NM_001144925

查询号：NM_001144925

版本:NM_001144925.1 GI:222136618

SEQ ID NO:146

蛋白质序列:所有变异体编码相同的蛋白

NCBI索引序列：NP_001138397.1

位置：NP_001138397

查询号：NP_001138397

版本:NP_001138397.1 GI:222136619

SEQ ID NO:147

核苷酸序列：转录变异体3

NCBI索引序列：NM_001178046.1

位置：NM_001178046

查询号：NM_001178046

版本:NM_001178046.1 GI:295842577

SEQ ID NO:148

蛋白质序列:所有变异体编码相同的蛋白

NCBI索引序列：NP_001171517.1

位置：NP_001171517

查询号：NP_001171517

版本:NP_001171517.1 GI:295842578

SEQ ID NO:149

核苷酸序列：转录变异体2

NCBI索引序列：NM_002462.3

位置：NM_002462

查询号：NM_002462

版本:NM_002462.3 GI:222136616

SEQ ID NO:150

蛋白质序列:所有变异体编码相同的蛋白

NCBI索引序列：NP_002453.2

位置：NP_002453

查询号：NP_002453

版本:NP_002453.2 GI:222136617

SEQ ID NO:151

OSBP

正式符号：OSBP

正式名称：氧类固醇结合蛋白

基因ID：5007

生物体：智人

其他别名：OSBP1

其他指称：氧类固醇-结合蛋白1

核苷酸序列：

NCBI索引序列：NM_002556.2

位置：NM_002556

查询号：NM_002556

版本:NM_002556.2 GI:34485728

SEQ ID NO:152

蛋白质序列:

NCBI索引序列：NP_002547.1

位置：NP_002547

查询号：NP_002547

版本:NP_002547.1 GI:4505531

SEQ ID NO:153

P4HB

正式符号：P4HB

正式名称：脯氨酰4-羟化酶，β多肽

基因ID：5034

生物体：智人

其他别名：DSI,ERBA2L,GIT,P4Hbeta,PDI,PDIA1,PHDB,PO4DB,PO4HB,PROHB

其他指称：细胞甲状腺激素-结合蛋白；胶原脯氨酰4-羟化酶β；谷胱甘肽-胰岛素转氢酶；p55；原胶原-脯氨酸，2-酮戊二酸4-双加氧酶(脯氨酸4-羟化酶)，β多肽；脯氨酰4-羟化酶亚基β；蛋白质二硫键异构酶家族A，成员1；蛋白质二硫键异构酶-关联1；蛋白质二硫键异构酶/氧化还原酶；蛋白质二硫键-异构酶；原胶原羟化酶；甲状腺激素-结合蛋白p55

核苷酸序列：

NCBI索引序列：NM_000918.3

位置：NM_000918

查询号：NM_000918

版本:NM_000918.3 GI:121256637

SEQ ID NO:154

蛋白质序列:

NCBI索引序列：NP_000909.2

位置：NP_000909

查询号：NP_000909

版本:NP_000909.2 GI:20070125

SEQ ID NO:155

PCNA

正式符号：PCNA

正式名称：增殖细胞核抗原

基因ID：5111

生物体：智人

其他别名：无

其他指称：DNA聚合酶δ辅助蛋白；细胞周期蛋白

核苷酸序列：转录变异体1

NCBI索引序列：NM_002592.2

位置：NM_002592

查询号：NM_002592

版本:NM_002592.2 GI:33239449

SEQ ID NO:156

蛋白质序列:两种变异体编码相同的蛋白

NCBI索引序列：NP_002583.1

位置：NP_002583

查询号：NP_002583

版本:NP_002583.1 GI:4505641

SEQ ID NO:157

核苷酸序列：转录变异体2

NCBI索引序列：NM_182649.1

位置：NM_182649

查询号：NM_182649

版本:NM_182649.1 GI:33239450

SEQ ID NO:158

蛋白质序列:两种变异体编码相同的蛋白

NCBI索引序列：NP_872590.1

位置：NP_872590

查询号：NP_872590

版本:NP_872590.1 GI:33239451

SEQ ID NO:159

PDCL3

正式符号：PDCL3

正式名称：类光导蛋白3

基因ID：79031

生物体：智人

其他别名：HTPHLP,PHLP2A,PHLP3,VIAF,VIAF1

其他指称：IAP-关联因子VIAF1；VIAF-1；phPL3；光导蛋白类蛋白；病毒IAP-关联因子1

核苷酸序列：

NCBI索引序列：NM_024065.4

位置：NM_024065

查询号：NM_024065

版本:NM_024065.4 GI:163310761

SEQ ID NO:160

蛋白质序列:

NCBI索引序列：NP_076970.1

位置：NP_076970

查询号：NP_076970

版本:NP_076970.1 GI:13129044

SEQ ID NO:161

PDIA4

正式符号：PDIA4

正式名称：蛋白质二硫键异构酶家族A，成员4

基因ID：9601

生物体：智人

其他别名：ERP70,ERP72,ERp-72

其他指称：ER蛋白70；ER蛋白72；内质网驻留蛋白70；内质网驻留蛋白72；蛋白质二硫键异构酶相关的蛋白(钙-结合蛋白，肠相关)；蛋白质二硫键异构酶-关联4；蛋白质二硫键异构酶A4

核苷酸序列：

NCBI索引序列：NM_004911.4

位置：NM_004911

查询号：NM_004911

版本:NM_004911.4 GI:157427676

SEQ ID NO:162

蛋白质序列:

NCBI索引序列：NP_004902.1

位置：NP_004902

查询号：NP_004902

版本:NP_004902.1 GI:4758304

SEQ ID NO:163

PEA15

正式符号：EA15

正式名称：星形胶质细胞富集磷蛋白15

基因ID：8682

生物体：智人

其他别名：RP11-536C5.8,HMAT1,HUMMAT1H,MAT1,MAT1H,PEA-15,PED

其他指称：15kDa星形胶质细胞中富集的磷蛋白；星形胶质细胞中富集的磷蛋白，15kD；星形胶质细胞磷蛋白PEA-15；小鼠MAT-1致癌基因的同源物；糖尿病富集的磷蛋白

核苷酸序列：

NCBI索引序列：NM_003768.3

位置：NM_003768

查询号：NM_003768NM_013287

版本:NM_003768.3 GI:208431812

SEQ ID NO:164

蛋白质序列:

NCBI索引序列：NP_003759.1

位置：NP_003759

查询号：NP_003759NP_037419

版本:NP_003759.1 GI:4505705

SEQ ID NO:165

PSMA2

正式符号：PSMA2

正式名称：蛋白酶体(prosome,macropain)亚基，α型，2

基因ID：5683

生物体：智人

其他别名：HC3,MU,PMSA2,PSC2

其他指称：macropain亚基C3；多催化内肽酶复合物亚基C3；蛋白酶体成分C3；蛋白酶体亚基HC3；蛋白酶体亚基α型-2

核苷酸序列：

NCBI索引序列：NM_002787.4

位置：NM_002787

查询号：NM_002787

版本:NM_002787.4 GI:156071494

SEQ ID NO:166

蛋白质序列:

NCBI索引序列：NP_002778.1

位置：NP_002778

查询号：NP_002778

版本:NP_002778.1 GI:4506181

SEQ ID NO:167

PSME1

正式符号：PSME1

正式名称：蛋白酶体(prosome,macropain)激活剂亚基1(PA28α)

基因ID：5720

生物体：智人

其他别名：IFI5111,PA28A,PA28α,REGα

其他指称：11S调节子复合物α亚基；11S调节子复合物亚基α；29-kD MCP激活剂亚基；IGUP I-5111；REG-α；多催化蛋白酶活化剂亚基1；干扰素γ上调I-5111蛋白；干扰素-γIEF SSP 5111；干扰素-γ-诱导蛋白5111；蛋白酶激活剂28亚基α；蛋白酶激活剂复合物亚基1；蛋白酶激活剂亚基-1

核苷酸序列：转录变异体1

NCBI索引序列：NM_006263.2

位置：NM_006263

查询号：NM_006263

版本:NM_006263.2 GI:30581139

SEQ ID NO:168

蛋白质序列:同种型1

NCBI索引序列：NP_006254.1

位置：NP_006254

查询号：NP_006254

版本:NP_006254.1 GI:5453990

SEQ ID NO:169

核苷酸序列：转录变异体2

NCBI索引序列：NM_176783.1

位置：NM_176783

查询号：NM_176783

版本:NM_176783.1 GI:30581140

SEQ ID NO:170

蛋白质序列:同种型2

NCBI索引序列：NP_788955.1

位置：NP_788955

查询号：NP_788955

版本:NP_788955.1 GI:30581141

SEQ ID NO:171

PDIA4

正式符号：RPL13

正式名称：核糖体蛋白L13

基因ID：6137

生物体：智人

其他别名：OK/SW-cl.46,BBC1,D16S444E,D16S44E,L13

其他指称：60S核糖体蛋白L13；OK/SW-cl.46；乳腺基础保守蛋白1

核苷酸序列：转录变异体1

NCBI索引序列：NM_000977.3

位置：NM_000977

查询号：NM_000977

版本:NM_000977.3 GI:341604764

SEQ ID NO:172

蛋白质序列:同种型1

NCBI索引序列：NP_000968.2

位置：NP_000968

查询号：NP_000968

版本:NP_000968.2 GI:15431297

SEQ ID NO:173

核苷酸序列：转录变异体3

NCBI索引序列：NM_001243130.1

位置：NM_001243130

查询号：NM_001243130

版本:NM_001243130.1 GI:341604767

SEQ ID NO:174

蛋白质序列:同种型2

NCBI索引序列：NP_001230059.1

位置：NP_001230059

查询号：NP_001230059

版本:NP_001230059.1 GI:341604768

SEQ ID NO:175

核苷酸序列：转录变异体4

NCBI索引序列：NM_001243131.1

位置：NM_001243131

查询号：NM_001243131

版本:NM_001243131.1 GI:341604769

SEQ ID NO:176

蛋白质序列:同种型3

NCBI索引序列：NP_001230060.1

位置：NP_001230060

查询号：NP_001230060

版本:NP_001230060.1 GI:341604770

SEQ ID NO:177

核苷酸序列：转录变异体2

NCBI索引序列：NM_033251.2

位置：NM_033251

查询号：NM_033251

版本:NM_033251.2 GI:341604766

SEQ ID NO:178

蛋白质序列:同种型1

NCBI索引序列：NP_150254.1

位置：NP_150254

查询号：NP_150254

版本:NP_150254.1 GI:15431295

SEQ ID NO:179

RPS15

正式符号：RPS15

正式名称：核糖体蛋白S15

基因ID：6209

生物体：智人

其他别名：RIG,S15

其他指称：40S核糖体蛋白S15；鼠胰岛素瘤同源物；胰岛素瘤蛋白

核苷酸序列：

NCBI索引序列：NM_001018.3

位置：NM_001018

查询号：NM_001018NM_001080831

版本:NM_001018.3 GI:71284430

SEQ ID NO:180

蛋白质序列:

NCBI索引序列：NP_001009.1

位置：NP_001009

查询号：NP_001009NP_001074300

版本:NP_001009.1 GI:4506687

SEQ ID NO:181

SEC61A1

正式符号：SEC61A1

正式名称：Sec61α1亚基(酿酒酵母(S.cerevisiae))

基因ID：29927

生物体：智人

其他别名：HSEC61,SEC61,SEC61A

其他指称：Sec61α-1；蛋白转运蛋白SEC61α亚基；蛋白转运蛋白Sec61亚基α；蛋白转运蛋白Sec61亚基α同种型1；sec61同源物

核苷酸序列：

NCBI索引序列：NM_013336.3

位置：NM_013336

查询号：NM_013336NM_015968

版本:NM_013336.3 GI:60218911

SEQ ID NO:182

蛋白质序列:

NCBI索引序列：NP_037468.1

位置：NP_037468

查询号：NP_037468NP_057052

版本:NP_037468.1 GI:7019415

SEQ ID NO:183

SEPT2

正式符号：SEPT2

正式名称：septin 2

基因ID：4735

生物体：智人

其他别名：DIFF6,NEDD5,Pnutl3,hNedd5

其他指称：NEDD-5；神经前体细胞表达的发育性下调蛋白5；神经前体细胞表达的，发育性下调蛋白5；septin-2

核苷酸序列：转录变异体1

NCBI索引序列：NM_001008491.1

位置：NM_001008491

查询号：NM_001008491

版本:NM_001008491.1 GI:56549635

SEQ ID NO:184

蛋白质序列:

NCBI索引序列：NP_001008491.1

位置：NP_001008491

查询号：NP_001008491

版本:NP_001008491.1 GI:56549636

SEQ ID NO:185

核苷酸序列：转录变异体3

NCBI索引序列：NM_001008492.1

位置：NM_001008492

查询号：NM_001008492

版本:NM_001008492.1 GI:56549637

SEQ ID NO:186

蛋白质序列:

NCBI索引序列：NP_001008492.1

位置：NP_001008492

查询号：NP_001008492

版本:NP_001008492.1 GI:56549638

SEQ ID NO:187

核苷酸序列：转录变异体4

NCBI索引序列：NM_004404.3

位置：NM_004404

查询号：NM_004404

版本:NM_004404.3 GI:56550108

SEQ ID NO:188

蛋白质序列:

NCBI索引序列：NP_004395.1

位置：NP_004395

查询号：NP_004395

版本:NP_004395.1 GI:4758158

SEQ ID NO:189

核苷酸序列：转录变异体2

NCBI索引序列：NM_006155.1

位置：NM_006155

查询号：NM_006155

版本:NM_006155.1 GI:56549639

SEQ ID NO:190

蛋白质序列:

NCBI索引序列：NP_006146.1

位置：NP_006146

查询号：NP_006146

版本:NP_006146.1 GI:56549640

SEQ ID NO:191

SERPINB9

正式符号：SERPINB9

正式名称：丝氨酸蛋白酶抑制剂肽酶抑制剂，进化枝B(卵白蛋白)，成员9

基因ID：5272

生物体：智人

其他别名：CAP-3,CAP3,PI-9,PI9

其他指称：胞浆抗蛋白水解酶3；肽酶抑制剂9；蛋白酶抑制剂9(卵白蛋白型)；丝氨酸(或半胱氨酸)蛋白酶抑制剂，进化枝B(卵白蛋白)，成员9；丝氨酸蛋白酶抑制剂B9；丝氨酸蛋白酶抑制剂，进化枝B，成员9

核苷酸序列：

NCBI索引序列：NM_004155.5

位置：NM_004155

查询号：NM_004155

版本:NM_004155.5 GI:380254460

SEQ ID NO:192

蛋白质序列:

NCBI索引序列：NP_004146.1

位置：NP_004146

查询号：NP_004146

版本:NP_004146.1 GI:4758906

SEQ ID NO:193

SMC4

正式符号：SMC4

正式名称：染色体结构维持蛋白4

基因ID：10051

生物体：智人

其他别名：CAP-C,CAPC,SMC-4,SMC4L1,hCAP-C

其他指称：SMC蛋白4；SMC4染色体结构维持蛋白4-类1；XCAP-C同源物；染色体关联多肽C；染色体结构维持蛋白4

核苷酸序列：转录变异体2

NCBI索引序列：NM_001002800.1

位置：NM_001002800

查询号：NM_001002800

版本:NM_001002800.1 GI:50658062

SEQ ID NO:194

蛋白质序列:

NCBI索引序列：NP_001002800.1

位置：NP_001002800

查询号：NP_001002800

版本:NP_001002800.1 GI:50658063

SEQ ID NO:195

核苷酸序列：转录变异体1

NCBI索引序列：NM_005496.3

位置：NM_005496

查询号：NM_005496

版本:NM_005496.3 GI:50658064

SEQ ID NO:196

蛋白质序列:

NCBI索引序列：NP_005487.3

位置：NP_005487

查询号：NP_005487

版本:NP_005487.3 GI:50658065

SEQ ID NO:197

SPTAN1

正式符号：SPTAN1

正式名称：血影蛋白，α，非红血细胞1

基因ID：6709

生物体：智人

其他别名：EIEE5,NEAS,SPTA2

其他指称：α-II血影蛋白；α-胞影蛋白；胞影蛋白α链；血影蛋白α链，非红血细胞1；血影蛋白，非红系细胞α链，血影蛋白,非红系细胞α亚基

核苷酸序列：转录变异体1

NCBI索引序列：NM_001130438.2

位置：NM_001130438

查询号：NM_001130438

版本:NM_001130438.2 GI:306966130

SEQ ID NO:198

蛋白质序列:同种型1

NCBI索引序列：NP_001123910.1

位置：NP_001123910

查询号：NP_001123910

版本:NP_001123910.1 GI:194595509

SEQ ID NO:199

核苷酸序列：转录变异体3

NCBI索引序列：NM_001195532.1

位置：NM_001195532

查询号：NM_001195532

版本:NM_001195532.1 GI:306966131

SEQ ID NO:200

蛋白质序列:同种型3

NCBI索引序列：NP_001182461.1

位置：NP_001182461

查询号：NP_001182461

版本:NP_001182461.1 GI:306966132

SEQ ID NO:201

核苷酸序列：转录变异体2

NCBI索引序列：NM_003127.3

位置：NM_003127

查询号：NM_003127

版本:NM_003127.3 GI:306966129

SEQ ID NO:202

蛋白质序列:同种型2

NCBI索引序列：NP_003118.2

位置：NP_003118

查询号：NP_003118

版本:NP_003118.2 GI:154759259

SEQ ID NO:203

STX6

正式符号：STX6

正式名称：突触融合蛋白(Syntaxin)6

基因ID：10228

生物体：智人

其他别名：N/A

其他指称：ntaxin-6

核苷酸序列：

NCBI索引序列：NM_005819.4

位置：NM_005819

查询号：NM_005819

版本:NM_005819.4 GI:58294156

SEQ ID NO:204

蛋白质序列:

NCBI索引序列：NP_005810.1

位置：NP_005810

查询号：NP_005810

版本:NP_005810.1 GI:5032131

SEQ ID NO:205

TJP2

正式符号：TJP2

正式名称：紧密连接蛋白2

基因ID：9414

生物体：智人

其他别名：RP11-16N10.1,C9DUPq21.11,DFNA51,DUP9q21.11,X104,ZO2

其他指称：弗里德赖希共济失调区域基因X104(紧密连接蛋白ZO-2)；地区ZO-2；紧密连合2；紧密连合蛋白2

核苷酸序列：转录变异体5

NCBI索引序列：NM_001170414.2

位置：NM_001170414

查询号：NM_001170414

版本:NM_001170414.2 GI:358679293

SEQ ID NO:206

蛋白质序列:同种型5

NCBI索引序列：NP_001163885.1

位置：NP_001163885

查询号：NP_001163885

版本:NP_001163885.1 GI:282165800

SEQ ID NO:207

核苷酸序列：转录变异体4

NCBI索引序列：NM_001170415.1

位置：NM_001170415

查询号：NM_001170415

版本:NM_001170415.1 GI:282165803

SEQ ID NO:208

蛋白质序列:同种型4

NCBI索引序列：NP_001163886.1

位置：NP_001163886

查询号：NP_001163886

版本:NP_001163886.1 GI:282165804

SEQ ID NO:209

核苷酸序列：转录变异体3

NCBI索引序列：NM_001170416.1

位置：NM_001170416

查询号：NM_001170416

版本:NM_001170416.1 GI:282165809

SEQ ID NO:210

蛋白质序列:同种型3

NCBI索引序列：NP_001163887.1

位置：NP_001163887

查询号：NP_001163887

版本:NP_001163887.1 GI:282165810

SEQ ID NO:211

核苷酸序列：转录变异体6

NCBI索引序列：NM_001170630.1

位置：NM_001170630

查询号：NM_001170630

版本:NM_001170630.1 GI:282165705

SEQ ID NO:212

蛋白质序列:同种型6

NCBI索引序列：NP_001164101.1

位置：NP_001164101

查询号：NP_001164101

版本:NP_001164101.1 GI:282165706

SEQ ID NO:213

核苷酸序列：转录变异体1

NCBI索引序列：NM_004817.3

位置：NM_004817

查询号：NM_004817

版本:NM_004817.3 GI:282165795

SEQ ID NO:214

蛋白质序列:同种型1

NCBI索引序列：NP_004808.2

位置：NP_004808

查询号：NP_004808

版本:NP_004808.2 GI:42518070

SEQ ID NO:215

核苷酸序列：转录变异体2

NCBI索引序列：NM_201629.3

位置：NM_201629

查询号：NM_201629

版本:NM_201629.3 GI:318067950

SEQ ID NO:216

蛋白质序列:同种型2

NCBI索引序列：NP_963923.1

位置：NP_963923

查询号：NP_963923

版本:NP_963923.1 GI:42518065

SEQ ID NO:217

TPM4

正式符号：TPM4

正式名称：原肌球蛋白4

基因ID：7171

生物体：智人

其他别名：N/A

其他指称：TM30p1；原肌球蛋白α-4链；原肌球蛋白-4

核苷酸序列：转录变异体1

NCBI索引序列：NM_001145160.1

位置：NM_001145160

查询号：NM_001145160

版本:NM_001145160.1 GI:223555974

SEQ ID NO:218

蛋白质序列:同种型1

NCBI索引序列：NP_001138632.1

位置：NP_001138632

查询号：NP_001138632

版本:NP_001138632.1 GI:223555975

SEQ ID NO:219

核苷酸序列：转录变异体2

NCBI索引序列：NM_003290.2

位置：NM_003290

查询号：NM_003290

版本:NM_003290.2 GI:223555973

SEQ ID NO:220

蛋白质序列:同种型2

NCBI索引序列：NP_003281.1

位置：NP_003281

查询号：NP_003281

版本:NP_003281.1 GI:4507651

SEQ ID NO:221

TSN

正式符号：TSN

正式名称：转位蛋白(translin)

基因ID：7247

生物体：智人

其他别名：BCLF-1,C3PO,RCHF1,REHF-1,TBRBP,TRSLN

其他指称：RISC启动子的成分3；重组热点关联因子(recombination hotspotassociated factor)；重组热点-结合蛋白；睾丸脑-RNA结合蛋白

核苷酸序列：转录变异体2

NCBI索引序列：NM_001261401.1

位置：NM_001261401

查询号：NM_001261401

版本:NM_001261401.1 GI:386869379

SEQ ID NO:222

蛋白质序列:同种型2

NCBI索引序列：NP_001248330.1

位置：NP_001248330

查询号：NP_001248330

版本:NP_001248330.1 GI:386869380

SEQ ID NO:223

核苷酸序列：转录变异体1

NCBI索引序列：NM_004622.2

位置：NM_004622

查询号：NM_004622

版本:NM_004622.2 GI:20302160

SEQ ID NO:224

蛋白质序列:同种型1

NCBI索引序列：NP_004613.1

位置：NP_004613

查询号：NP_004613

版本:NP_004613.1 GI:4759270

SEQ ID NO:225

TUBA4A

正式符号：TUBA4A

正式名称：微管蛋白，α4a

基因ID：7277

生物体：智人

其他别名：H2-Α,TUBA1

其他指称：微管蛋白H2-α；微管蛋白α-1链；微管蛋白α-4A链；微管蛋白，α1(睾丸特异性)

核苷酸序列：

NCBI索引序列：NM_006000.1

位置：NM_006000

查询号：NM_006000

版本:NM_006000.1 GI:17921988

SEQ ID NO:226

蛋白质序列:

NCBI索引序列：NP_005991.1

位置：NP_005991

查询号：NP_005991

版本:NP_005991.1 GI:17921989

SEQ ID NO:227

TXNDC5

正式符号：TXNDC5

正式名称：硫氧还蛋白结构域含蛋白5(内质网)

基因ID：81567

生物体：智人

其他别名：RP1-126E20.1,ENDOPDI,ERP46,HCC-2,PDIA15,STRF8,UNQ364

其他指称：ER蛋白46；内质网蛋白ERp46；内质网驻留蛋白46；内皮蛋白质二硫键异构酶；蛋白质二硫键异构酶家族A，成员15；硫氧还蛋白结构域-含蛋白5；硫氧还蛋白相关蛋白p46

核苷酸序列：转录变异体3

NCBI索引序列：NM_001145549.2

位置：NM_001145549

查询号：NM_001145549

版本:NM_001145549.2 GI:313482855

SEQ ID NO:228

蛋白质序列:同种型3

NCBI索引序列：NP_001139021.1

位置：NP_001139021

查询号：NP_001139021

版本:NP_001139021.1 GI:224493972

SEQ ID NO:229

核苷酸序列：转录变异体1

NCBI索引序列：NM_030810.3

位置：NM_030810

查询号：NM_030810

版本:NM_030810.3 GI:313482856

SEQ ID NO:230

蛋白质序列:同种型1前体

NCBI索引序列：NP_110437.2

位置：NP_110437

查询号：NP_110437

版本:NP_110437.2 GI:42794771

SEQ ID NO:231

TXNL1

正式符号：TXNL1

正式名称：类硫氧还蛋白1

基因ID：9352

生物体：智人

其他别名：TRP32,TXL-1,TXNL,Txl

其他指称：32kDa硫氧还蛋白相关蛋白；硫氧还蛋白类蛋白1；硫氧还蛋白相关32kDa蛋白；硫氧还蛋白-相关蛋白1

核苷酸序列：转录变异体1

NCBI索引序列：NM_004786.2

位置：NM_004786

查询号：NM_004786

版本:NM_004786.2 GI:215422360

SEQ ID NO:232

蛋白质序列:

NCBI索引序列：NP_004777.1

位置：NP_004777

查询号：NP_004777

版本:NP_004777.1 GI:4759274

SEQ ID NO:233

VIM

正式符号：VIM

正式名称：波形蛋白

基因ID：431

生物体：智人

其他别名：RP11-124N14.1

其他指称：N/A

核苷酸序列：

NCBI索引序列：NM_003380.3

位置：NM_003380

查询号：NM_003380

版本:NM_003380.3 GI:240849334

SEQ ID NO:234

蛋白质序列:

NCBI索引序列：NP_003371.2

位置：NP_003371

查询号：NP_003371

版本:NP_003371.2 GI:62414289

SEQ ID NO:235

YWHAG

正式符号：YWHAG

正式名称：酪氨酸3-单加氧酶/色氨酸5-单加氧酶激活蛋白，γ多肽基因ID：7532

生物体：智人

其他别名：14-3-3GAMMA

其他指称：14-3-3γ；14-3-3蛋白γ；KCIP-1；蛋白激酶C抑制蛋白1

核苷酸序列：

NCBI索引序列：NM_012479.3

位置：NM_012479

查询号：NM_012479

版本:NM_012479.3 GI:194733744

SEQ ID NO:236

蛋白质序列:

NCBI索引序列：NP_036611.2

位置：NP_036611

查询号：NP_036611

版本:NP_036611.2 GI:21464101

SEQ ID NO:237

ZNF207

正式符号：ZNF207

正式名称：锌指蛋白207

基因ID：7756

生物体：智人

其他别名：N/A

其他指称：N/A

核苷酸序列：转录变异体2

NCBI索引序列：NM_001032293.2

位置：NM_001032293

查询号：NM_001032293

版本:NM_001032293.2 GI:148839356

SEQ ID NO:238

蛋白质序列:同种型b

NCBI索引序列：NP_001027464.1

位置：NP_001027464

查询号：NP_001027464

版本:NP_001027464.1 GI:73808090

SEQ ID NO:239

核苷酸序列：转录变异体3

NCBI索引序列：NM_001098507.1

位置：NM_001098507

查询号：NM_001098507

版本:NM_001098507.1 GI:148612834

SEQ ID NO:240

蛋白质序列:同种型c

NCBI索引序列：NP_001091977.1

位置：NP_001091977

查询号：NP_001091977

版本:NP_001091977.1 GI:148612835

SEQ ID NO:241

核苷酸序列：转录变异体1

NCBI索引序列：NM_003457.3

位置：NM_003457

查询号：NM_003457

版本:NM_003457.3 GI:148839312

SEQ ID NO:242

蛋白质序列:同种型a

NCBI索引序列：NP_003448.1

位置：NP_003448

查询号：NP_003448

版本:NP_003448.1 GI:4508017

SEQ ID NO:243

VI.本发明的诊断/预后用途

本发明提供用于诊断受试者中广泛性发育障碍的方法，例如但不限于自闭症或阿尔茨海默病。本发明还提供用于预后受试者是否易于发展出广泛性发育障碍，例如自闭症或阿尔茨海默病的方法。本发明进一步提供了预后广泛性发育障碍，例如但不限于自闭症或阿尔茨海默病，对治疗处理的响应。这些方法中采用本发明的标志物，其在本文中鉴定出，并列在表2-6中。

在本发明的一些实施方案中，在本发明的方法中使用一种或多种生物标志物。如本文中使用的，术语“一种或多种生物标志物”想要指在所公开的生物标志物列表中有至少一种生物标志物被测定，并且在多个实施方案中，在所述列表中的多于一种的生物标志物可被测定，例如2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65种、多于65种，或者列表中的所有生物标志物被测定。在一个实施方案中，将一组生物标记物用于本发明的方法中，使得所述组的生物标志物包括2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65种、超过65种，或者包括列表中的所有生物标志物。在一个实施方案中，所述列表中的生物标志物中的两种或更多，三种或更多、四种或更多、六种或更多、七种或更种、八种或更多、九种或更多、十种或更多、15种或更多、20种或更多、25种或更多、30种或更多、35种或更多、40种或更多、45种或更多、60种或更多、65种或更多、或者全部被用于本发明的方法中。

任何合适的分析方法可被用于本发明的方法中来(直接或间接)测定样品中生物标志物的表达水平。在一个实施方案中，观察到生物标志物的表达水平较之于生物标志物的对照表达水平的差异。在一个实施方案中，所述差异大于用于确定生物标志物表达水平的方法的的检测限。在另一个实施方案中，所述差异大于或等于所述测定方法的标准误差，例如，所述差异比所述测定方法的标准误差大至少约2、约3、约4、约5、约6、约7、约8、约9、约10、约15、约20、约25、约100、约500或约1000倍。在一个实施方案中，样品中所述生物标志物相对于对照表达水平的表达水平使用参数或非参数的描述性统计、比较、回归分析等测定。

在一个实施方案中，受试者样品中所述生物标志物的表达水平相对于对照检测，并且差异比所述生物标志物在对照或正常样品中的表达水平高或低约5％、约10％、约15％、约20％、约25％、约30％、约40％、约50％、约60％、约70％、约80％或约90％。

在一个实施方案中，受试者样品中所述生物标志物的表达水平的差异相对于对照检测，并且所述差异比所述生物标志物在对照或正常样品中的表达水平高或低约1.1、约1.2、约1.3、约1.4、约1.5、约1.6、约1.7、约1.8、约1.9、约2、约3、约4、约5、约6、约7、约8、约9、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约9或约100倍。

在多于一种标志物被检测的实施方案中，每种标志物具有不同的表达差异，或者所有的标志物具有等同的最低水平的调节，例如与各生物标志物在对照或正常样品中的表达水平相比，每种被检测的标志物被上调或下调至少约1.1、约1.2、约1.3、约1.4、约1.5、约1.6、约1.7、约1.8、约1.9、约2、约3、约4、约5、约6、约7、约8、约9、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95或约100倍。

受试者样品中生物标志物——例如表2-6中的一种或多种标志物——的表达水平可以通过任何不同的技术和方法来测定，其将样品中的生物标志物转化成可被检测和/或定量的部分。这种方法的非限制性的实例包括使用检测蛋白质的免疫学方法、蛋白质纯化方法、蛋白质功能或活性测定、核酸杂交法、核酸逆转录法以及核酸扩增法、免疫印迹法，Western印迹法、RNA印迹法、电子显微镜、质谱如MALDI-TOF和SELDI-TOF、免疫沉淀、免疫荧光、免疫组织化学、酶联免疫吸附测定(ELISA)例如扩增ELISA、定量血液基础分析，例如血清ELISA，定量尿液基础分析、流式细胞术、Southern杂交、阵列分析等，以及它们的组合或子组合来分析样品。

在一个实施方案中，样品中生物标志物的表达水平通过检测生物标志物基因的转录多核苷酸或其部分，例如mRNA或cDNA来确定。可使用RNA提取技术将RNA从细胞中提取出来，包括，例如使用酸苯酚/异硫氰酸胍(RNAzol B：生物合成)提取法、RNeasy RNA制备试剂盒(Qiagen公司)或PAXgene(PreAnalytix，瑞士)。利用核糖核酸杂交的典型测定形式包括核转录活性测定(nuclear run-on assay)、RT-PCR、定量PCR分析、RNA酶保护测定法(Melton et al.,Nuc.Acids Res.12:7035)、RNA印迹和原位杂交。mRNA样品分析的其它合适系统包括微阵列分析(例如，利用Affymetrix的微阵列系统或者Illumina的BeadArray技术)。

在一个实施方案中，生物标志物的表达水平使用核酸探针确定。本文中使用的术语“探针”是指任何能够选择性地结合至特定生物标志物的分子。探针可以由本领域技术人员合成，或者来自于合适的生物学制备过程。探针可以通过加入或引入标记物特异性地设计成被标记的。可以用作探针的分子的实例包括但不限于RNA、DNA、蛋白质、抗体和有机分子。

如上文所述，分离的mRNA可以用于杂交或扩增实验，包括但不限于Southern或Northern分析，聚合酶链反应(PCR)分析和探针阵列。一种确定mRNA水平的方法包括将分离的mRNA与能够杂交至生物标志物mRNA的核酸分子(探针)接触。核酸探针可以是，例如全长cDNA或其部分，例如长度为至少约7、10、15、20、25、30、35、40、45、50、100、250或约500个核苷酸且足以在合适的杂交条件下特异性地杂交至生物标志物基因组DNA上的寡核苷酸。在一个特定的实施方案中，探针与生物标志物基因组DNA在严格条件下结合。这种严格条件——例如在约45℃下在6×氯化钠/柠檬酸钠(SSC)中杂交，随后在50-65℃下在0.2×SSC，0.1％SDS中洗涤一次或多次——是本领域技术人员已知的，并且可见于Current Protocols inMolecular Biology,Ausubel et al.,eds.,John Wiley&Sons,Inc.(1995)，第2、4和6部分，其教导通过引用纳入本文。其他严格条件可见于Molecular Cloning:A Laboratory Manual,Sambrook et al.,Cold Spring Harbor Press,Cold SpringHarbor,N.Y.(1989)第7、9和11章，其教导通过引用纳入本文。

在一个实施方案中，mRNA被固定在固体表面并与探针接触，例如通过将在琼脂糖凝胶上运行分离的mRNA并将mRNA从凝胶中转移至膜，例如硝酸纤维素膜上。在另一个实施方案中，探针固定在固体表面，例如在Affymetrix的基因芯片阵列上，并将探针与mRNA接触。本领域技术人员可以容易地调整mRNA检测方法用来确定生物标志物mRNA的水平。

样品中生物标志物的表达水平还可以使用这样的方法来确定，所述方法涉及采用例如样品中的mRNA的核酸扩增和/或反转录酶(以制备cDNA)，例如通过RT-PCR(实验方案示于Mullis,1987年的美国专利No.4,683,202)、连接酶链反应(Barany(1991)Proc.Natl.Acad.Sci.USA 88:189-193)，自维持序列扩增(Guatelli et al.(1990)Proc.Natl.Acad.Sci.USA 87:1874-1878)、转录扩增系统(Kwoh et al.(1989)Proc.Natl.Acad.Sci.USA 86:1173-1177)，Q-β复制酶(Lizardi et al.(1988)Bio/Technology 6:1197)、滚环复制(Lizardiet al.,美国专利No.5,854,033)或任何其他核酸扩增方法，随后检测扩增的分子。这些方法对于检测以非常低数量存在的核酸分子尤其有用。在本发明的特定的方面，生物标志物的表达水平通过定量荧光RT-PCR(例如TaqMan^TM系统)测定。这种方法通常使用对于生物标志物特异的寡核苷酸引物对。针对已知序列设计特异的寡核苷酸引物的方法是本领域已知的。

生物标志物mRNA的表达水平可以使用膜印迹(例如用于杂交分析，例如Northern杂交、Southern杂交、点杂交等中使用的)来监测，或者使用微孔、样品管、凝胶、珠或纤维(或者任何固体支持物，包括结合的核酸)。参见，例如美国专利No.5,770,722、5,874,219、5,744,305、5,677,195和5,445,934，其涉及这些测定的全部内容通过引用纳入本文。生物标志物表达水平的确定也可包括使用溶液中的核酸探针。

在本发明的一个实施方案中，微阵列被用于检测生物标志物的表达水平。微阵列由于在不同的实验中的可重现性而特别适合于此目的。DNA微阵列提供一种同时测定大量基因的表达水平的方法。每个阵列由附着于固相支持物的捕获探针的可重现图案组成。标记的RNA或DNA与阵列上的互补探针杂交，之后由激光扫描检测。阵列上的每个探针的杂交强度被测定，并转换成代表相对基因表达水平的定量数值。参见例如美国专利No.6,040,138、5,800,992、6,020,135、6,033,860和6,344,316，其涉及这些测定的全部内容通过引用纳入本文。高密度的寡核苷酸阵列特别适用于确定样品中大量RNA的基因表达图谱。

生物标志物的表达也可在蛋白质水平上直接或间接进行测定，其使用检测由所述生物标志物的mRNA编码的蛋白质产物的检测试剂。例如，如果特异性地结合待检测的生物标志物蛋白质产物的抗体试剂是可得的，则这种抗体试剂可被用于检测受试者样品中生物标志物的表达水平，其使用诸如免疫组化、ELISA法、流式细胞仪分析等的技术进行。

其他已知的用于在蛋白质水平上检测生物标志物的方法包括下列方法，例如电泳、毛细管电泳、高效液相色谱法(HPLC)、薄层色谱(TLC)、超扩散色谱等，或各种免疫学方法如液体或凝胶沉淀反应、免疫扩散(单或双)、免疫电泳、放射免疫测定(RIA)、酶联免疫吸附测定(ELISA)、免疫荧光测定法和免疫印迹。

样品中的蛋白质可使用多种技术分离，包括本领域技术人员已知的那些。所采用的蛋白质分离方法可以是例如，描述于Harlow和Lane的专著(Harlow and Lane,1988,Antibodies:A Laboratory Manual,Cold Spring HarborLaboratory Press,Cold Spring Harbor,New York)中的那些。

在一个实施方案中，抗体、或抗体片段被用于诸如Western印迹或免疫荧光技术的方法中以检测所表达的蛋白质。用于确定本发明生物标志物表达的抗体是市售可得的。

抗体或蛋白质可以被固定到固相支持物上以进行Western印迹和免疫荧光技术。合适的固相支持物或载体包括任何能够结合抗原或抗体的支持物。已知的支持物或载体包括玻璃、聚苯乙烯、聚丙烯、聚乙烯、葡聚糖、尼龙、淀粉酶、天然和改性纤维素、聚丙烯酰胺、辉长岩以及磁铁矿。

本领域技术人员已知用来结合抗体或抗原的许多其他合适的载体，并且能够调整这些支持物以用于本发明中。例如，从细胞中分离的蛋白质可以进行聚丙烯酰胺凝胶电泳，并固定在固相支持物、例如硝酸纤维素上。然后，所述支持物可以用合适的缓冲液洗涤，之后使用以可检测方式标记的抗体处理。然后，固相支持物可以用所述缓冲液再次洗涤以除去未结合的抗体。之后，固相支持物中结合的标记物的量可通过常规方法检测。使用电泳技术检测蛋白质的方法是本领域技术人员已知的(总体上参见R.Scopes(1982)Protein Purification,Springer-Verlag,N.Y.；Deutscher,(1990)Methods inEnzymology Vol.182:Guide to Protein Purification,Academic Press,Inc.,N.Y.)。

其他标准方法包括本领域技术人员公知的免疫测定技术，并且可以在Principles And Practice Of Immunoassay,2nd Edition,Price and Newman,eds.,MacMillan(1997)and Antibodies,A Laboratory Manual,Harlow and Lane,eds.,Cold Spring Harbor Laboratory,Ch.9(1988)中找到。

在本发明的一个实施方式中，使用蛋白质组学方法，例如质谱。质谱是一种由电离化合物以产生带电分子(或其片段)，并测量它们的质荷比所组成的分析技术。在一个典型的质谱过程中，从受试者获得的样品被加样至质谱，其成分(例如生物标记物)被不同的方法(例如通过使用电子束的撞击它们)离子化，从而形成的带电粒子(离子)。该颗粒的荷质比从离子通过电磁场的运动来计算。

例如，可以使用基质辅助激光解吸/电离飞行时间质谱法(MALDI-TOFMS)或表面增强激光解吸电离子-飞行时间质谱法(SELDI-TOF MS)来确定生物标志物在蛋白质水平上的表达水平，其涉及将生物学样品，例如血清应用至蛋白质结合芯片((Wright,G.L.,Jr.,et al.(2002)Expert Rev Mol Diagn2:549；Li,J.,et al.(2002)Clin Chem 48:1296；Laronga,C.,et al.(2003)Disbiomarkers 19:229；Petricoin,E.F.,et al.(2002)359:572；Adam,B.L.,et al.(2002)Cancer Res 62:3609；Tolson,J.,et al.(2004)Lab Invest 84:845；Xiao,Z.,et al.(2001)Cancer Res 61:6029)。

此外，体内测定生物标志物表达水平的技术包括向受试者引入直接针对生物标志物的标记抗体，其结合至生物标志物并将生物标志物转化成可检测的分子。如上所讨论的，受试者中可检测生物标志物的存在情况、水平或甚至是位置均可以通过标准的成像技术检测。

总地说来，在要检测生物标志物的表达水平和对照的差异的情况下，优选的是在具有广泛性发育障碍(例如自闭症或阿尔茨海默病)的受试者样品中生物标志物的表达水平与对照样品中生物标志物的量的差异尽可能地大。虽然该差异可以小到该方法用于确定表达水平的检测限，但优选的是该差异大于该方法的检测限，或者大于测定方法的标准误差，且优选比测定方法的标准误差大至少约2-、约3-、约4-、约5-、约6-、约7-、约8-、约9-、约10-、约15-、约20-、约25-、约100-、约500-或1000-倍。

获自具有广泛性发育障碍(例如自闭症或阿尔茨海默病)的受试者的任何合适的样品可以用于测定生物标志物(例如表2-6中所述的一种或多种标志物)的表达水平，包括表达的缺失。例如，样品可以是任何体液或其成分，例如组分或者提取物，如从受试者获得的血液、血浆、淋巴液、滑液、囊液、尿液、乳头吸出物、或活检收集的体液、羊水、房水、玻璃体液、胆汁、血液、乳汁、脑脊髓液、耳垢、乳糜、囊液、内淋巴、粪便、胃酸、胃液、粘液、心包液、淋巴液、腹腔液、血浆、胸膜液、脓、唾液、皮脂、精液、汗水、血清、痰、滑液、关节组织或体液、泪液或阴道分泌物。在通常的情况下，体液可以是从受试者获得的血液或其成分，包括全血或其成分，包括血浆、血清、血细胞如红细胞、白细胞和血小板。在另一种典型的情况下，体液可以是滑液、关节组织或体液，或者任何其他反映出广泛性发育障碍(例如自闭症或阿尔茨海默病)的样品。样品也可以是获自受试者的任何组织或其成分，结缔组织、淋巴组织或肌肉组织。

从受试者获得样品的技术或方法是本领域已知的，包括例如通过口腔拭子或漱口剂；抽血；获得活检来获取样品，或者获得患有广泛性发育障碍(例如自闭症或阿尔茨海默病)的受试者的其他样品。分离体液的组分或者组织样品(例如细胞或RNA或DNA)可以通过使用多种技术实现。在样品获得后，其可以被进一步加工。

预测医学

本发明涉及预测医学领域，其中诊断分析、预后分析、药物基因组学和监测临床试验被用于预后(预测)的目的，从而预防性地治疗个体。因此，本发明的一个方面涉及用于测定一种或多种标志物蛋白质或核酸的表达水平的诊断分析，以确定个体是否有发生广泛性发育障碍，例如但不限于自闭症或阿尔茨海默病的危险。这些分析可用于预后或预测的目的，从而在疾病发病前预防性治疗个体。

本发明的再另一个方面涉及在临床试验中监测药剂(例如，施用以治疗广泛性发育障碍或广泛性发育障碍的症状药物或其他化合物)对本发明的标志物的表达或活性的影响。在下面的章节中更详细地描述这些和其它试剂。

A、诊断分析

用于检测在生物样品中标志物蛋白质或核酸存在或不存在的示例性方法包括从测试对象获得生物样品(例如，广泛性发育障碍相关的组织或体液)和将生物样品与能够检测多肽或核酸(例如，mRNA、基因组DNA或cDNA)的化合物或试剂相接触。因此，本发明的检测方法可以用于，例如，在体外生物样品中和在体内检测mRNA、蛋白质、cDNA或基因组DNA。例如，用于检测mRNA的体外技术包括Northern杂交和原位杂交。用于检测标志物蛋白质的体外技术包括酶联免疫吸附分析(ELISA法)、Western印迹、免疫沉淀和免疫荧光。用于检测基因组DNA的体外技术包括Southern杂交。用于检测mRNA的体内技术包括聚合酶链反应(PCR)、Northern杂交和原位杂交。此外，用于检测标志物蛋白质的体内技术包括向受试者体内引入针对该蛋白质或其片段的标记抗体。例如，可以用其在受试者中的存在和位置可以通过标准的成像技术检测的放射性标记来标记该抗体。

这种诊断和预后分析的一般原理涉及在适当条件下和经过足够允许标志物和探针相互作用和结合的时间制备其中可以包含标志物和探针的样品或反应混合物，从而形成可以从反应混合物中被去除和/或检测的复合物。可以以各种不同的方式进行这些分析。

例如，进行这样的分析的一种方法涉及将标志物或探针锚定在固相载体(也称为基底)上，和在反应结束时检测锚定固相上的目标标志物/探针复合物。在这样的方法的一个实施方式中，可以将用来测定标志物的存在和/或浓度的来自受试者的样品锚定到载体或固相支持物上。在另一个实施方式中，相反的情况是可能的，其中探针可以被锚定到固相上和可以允许来自受试者的样品作为该分析的未锚定组分进行反应。

有许多已建立的方法用于将测定组分锚定到固相上。这些包括，但不限于，通过生物素和抗生蛋白链菌素的偶联被固定的标志物或探针分子。可以使用本领域中已知的技术(例如，生物素化试剂盒，Pierce Chemicals,Rockford,IL)从生物素-NHS(N-羟基琥珀酰亚胺)制备这样的生物素化分析成分，并固定在抗生蛋白链菌素涂布的96孔板(Pierce Chemical)的孔中。在某些实施方式中，可以预先制备并存储具有固定的分析成分的表面。

用于这些分析的其它合适的载体或固相支持物包括能够结合标志物或探针所属的分子种类的任何材料。众所周知的支持物或载体包括，但不限于，玻璃、聚苯乙烯、尼龙、聚丙烯、尼龙、聚乙烯、葡聚糖、淀粉酶、天然和改性的纤维素、聚丙烯酰胺、辉长岩和磁铁矿。

为了用上述的方法进行分析，将非固定的成分添加到第二成分被锚定于其上的固相上。反应完成后，可以在使得所形成的任何复合物将保持固定在固相上的条件下移除(例如，通过洗涤)未复合的成分。检测锚定在固相上的标志物/探针复合物可以通过本文中概述的多种方法来完成。

在优选的实施方式中，当探针是未锚定的分析成分时，其可以用本文所讨论的并且是本领域技术人员公知的可检测标记直接或间接地标记以用于检测和分析读出的目的。

也可能不经过进一步的处理或任一成分(标志物或探针)的标记而直接检测标志物/探针复合物形成，例如，通过利用荧光能量转移的技术(参见，例如，Lakowicz等，5,631,169号美国专利；Stavrianopoulos等，4,868,103号美国专利)。第一“供体”分子上的荧光团标记经选择以使得在用适当波长的入射光激发时，其发射的荧光能量将被第二“受体”分子上的荧光标记吸收，其随之能够由于所吸收的能量而发荧光。交替地，“供体”蛋白质分子可以简单地利用色氨酸残基的自然荧光能量。选择发射不同光波长的标记，这样可以将“受体”分子标记与“供体”的标记区分开来。由于标记之间的能量转移效率与分隔分子的距离有关，可以对分子之间的空间关系进行评估。在分子间发生结合的情况下，在分析中“受体”分子标记的荧光发射应该是最大的。可以通过本领域中公知的标准荧光检测装置(例如，使用荧光计)很方便地测量FET结合事件。

在另一个实施方式中，可以通过利用如实时生物分子相互作用分析(BIA)的技术在不标记任何分析成分(探针或标志物)的情况下完成探针识别标志物的能力的测定(见，例如，Sjolander,S.和Urbaniczky,C.,1991,Anal.Chem.63:2338-2345和Szabo等,1995,Curr.Opin.Struct.Biol.5:699-705)。如本文所用的“BIA”或“表面等离子体激元共振”是用于研究实时生物特异性相互作用而不标记任何的相互作用物的技术(例如，BIAcore)。在结合表面处的质量变化(结合事件的表示)导致表面附近的光的折射率的改变(表面等离激元共振(SPR)的光学现象)，从而产生可检测的信号，该信号可以用作生物分子之间的实时反应的指示。

或者，在另一个实施方式中，可以用标志物和探针作为液相中的溶质进行类似的诊断和预测分析。在这样的分析中，通过多种标准技术中的任何一种，包括但不限于：差速离心法、色谱法、电泳和免疫沉淀，将复合的标志物和探针与未复合的成分分离。在差速离心中，由于复合物根据其不同尺寸和密度而具有的不同的沉降平衡，可通过一系列的离心步骤将标志物/探针复合物与未复合的分析成分分离(参见，例如，Rivas,G.和Minton,A.P.,1993,Trends Biochem Sci.18(8):284-7)。也可以利用标准的色谱技术将复合的分子与未复合的分子分离。例如，凝胶过滤色谱法基于大小分离分子，并例如，通过利用柱形式的适当凝胶过滤树脂，可以将相对较大的成分与相对较小的未复合的成分分离。类似地，可利用与未复合的成分相比标记/探针复合物相对不同的电荷性质将复合物与未复合的成分区分开，例如，通过利用离子交换色谱树脂。这样的树脂和色谱技术是本领域的技术人员众所周知的(见，例如，Heegaard，NH，1998，J.Mol.Recognit.Winter 11(1-6):141-8；Hage,D.S.和Tweed,S.A.J Chromatogr B Biomed Sci Appl 1997 Oct10；699(1-2):499-525)。也可以使用凝胶电泳将复合的分析成分与未结合的成件分离(见，例如，Ausubel等编辑，Current Protocols in Molecular Biology,John Wiley&Sons,New York,1987-1999)。在该技术中，例如，根据大小或电荷分离蛋白质或核酸复合物。为了在电泳过程中维持结合相互作用，非变性凝胶基质材料和没有还原剂存在的条件通常是优选的。对于特定的分析适当的条件和其成分是本领域的技术人员众所周知的。

在特定实施方式中，可以使用在本领域中已知的方法，通过原位和体外形式在生物样品中测定标志物mRNA的水平。术语“生物样品”意在包括从受试者分离的组织、细胞、生物流体及其分离物，以及受试者中存在的组织、细胞和体液。许多表达检测方法使用分离的RNA。对于体外方法，可以利用任何不是针对mRNA的分离而选择的RNA分离技术用于从细胞中纯化RNA(见，例如，Ausubel等编辑，Current Protocols in Molecular Biology,John Wiley&Sons,New York 1987-1999)。此外，可以通过在本技术领域的技术人员公知的技术很容易地处理大量的组织样品，如，例如，Chomczynski(1989，4,843,155号美国专利)的单步RNA分离方法。

分离的mRNA可被用于杂交或扩增分析中，其包括，但不限于，Southern或Northern分析、聚合酶链反应分析和探针阵列。用于mRNA水平检测的一个优选的诊断方法包括将分离的mRNA与核酸分子(探针)接触，该核酸分子(探针)可以与待检测的基因所编码的mRNA杂交。该核酸探针可以是，例如，全长cDNA或其一部分，如长度至少为7、15、30、50、100、250或500个核苷酸和足以在严格条件下与编码本发明标志物的mRNA或基因组DNA特异性杂交的寡核苷酸。此处描述了本发明的诊断分析法中使用的其它合适的探针。mRNA与探针的杂交表明所关注的标志物正被表达。

在一种形式中，mRNA被固定在固体表面上并与探针接触，例如通过在琼脂糖凝胶上运行分离的mRNA和将mRNA从凝胶中转移到膜(如硝酸纤维素)上。在替代的形式中，探针被固定在固体表面上，并且mRNA与探针接触，例如，在Affymetrix基因芯片阵列中。本领域技术人员可以很容易地将已知的mRNA检测方法适应用于检测本发明的标志物所编码的mRNA的水平。

用于测定样品中的mRNA标志物的水平的替代方法涉及核酸扩增的过程，例如，通过RT-PCR(试验实施方式在Mullis，1987，4,683,202号美国专利中给出)、连接酶链反应(Barany,1991,Proc.Natl.Acad.Sci.USA,88:189-193)、自持序列复制(Guatelli等，1990,Proc.Natl.Acad.Sci.USA87:1874-1878)、转录扩增系统(Kwoh等，1989,Proc.Natl.Acad.Sci.USA86:1173-1177)、Q-β复制酶(Lizardi等,1988,Bio/Technology 6:1197)、滚环复制(Lizardi等，5,854,033号美国专利)或任何其他的核酸扩增方法，随后用本领域技术人员熟知的技术检测扩增的分子。如果这样的分子以非常低的数量存在，这些检测方案对核酸分子的检测是特别有用的。如本文所用的，扩增引物被定义为可以与基因的5'或3'区域(分别是正负链，或反之亦然)退火并包含其间的短区域的一对核酸分子。在一般情况下，扩增引物长度是从约10至30个核苷酸且和侧邻约50至200个核苷酸长度的区域。在适当条件下和使用适当的试剂，这样的引物允许扩增含有引物侧邻的核苷酸序列的核酸分子。

对于原位方法，不需要在检测前分离mRNA。在这样的方法中，使用已知的组织学方法制备/处理细胞或组织样品。然后将样品固定在支持物上，通常是载玻片上，和然后与可以与编码标志物的mRNA杂交的探针接触。

作为基于标志物的绝对表达水平进行测定的一种替代方法，可以基于标志物的标准化表达水平进行测定。通过将其表达水平与非标志物的基因(例如，组成型表达的管家基因)的表达进行比较来校正标志物的绝对表达水平而使表达水平标准化。用于标准化的合适的基因包括管家基因，例如肌动蛋白基因或上皮细胞特异性基因。这种标准化允许在一个样品(例如，患者样品)与另一样品(例如，非患者样品)中或者来自不同来源的样品之间表达水平的比较。

或者表达水平可提供为相对表达水平。为确定标志物的相对表达水平，在测定关注的样品的表达水平之前，测定10个或更多个样品，优选50个或更多个样品的正常与广泛性发育障碍细胞分离物的标志物表达水平。测定在该多个样品中分析的各个基因的平均表达水平，且将其用作标志物的基线表达水平。然后将对于测试样品测定的标志物的表达水平(绝对表达水平)除以对该标志物获得的平均表达值。这提供了相对表达水平。

优选地，在基线测定中所用的样品来自正常的健康对照细胞，例如来自未患有广泛性发育障碍的受试者的细胞。细胞来源的选择取决于相对表达水平的用途。使用在正常组织中建立的表达作为平均表达评分有助于验证分析的标志物是否是广泛性发育障碍特异性的(相对于正常细胞)。此外，随着更多的数据被积累，平均表达值可以被修正，从而提供基于累积的数据的改进的相对表达值。

在本发明的另一个实施方式中，检测标志物蛋白质。用于检测本发明的标志物蛋白质的一种优选的试剂是能够结合这种蛋白质或其片段的抗体，优选具有可检测标记的抗体。抗体可以是多克隆的，或更优选单克隆的。可以使用完整的抗体或者其片段或衍生物(例如，Fab或F(ab')₂)。关于探针或抗体的术语“标记的”意图包含通过将可检测物质与探针或抗体偶联(即物理连接)直接标记探针或抗体，以及通过与直接标记的另一种试剂的反应性间接标记探针或抗体。间接标记的实例包括用荧光标记的第二抗体检测第一抗体和用生物素末端标记DNA探针以使得其可以用荧光标记的抗生蛋白链菌素检测。

可以使用本领域的技术人员公知的技术从细胞分离蛋白质。所使用的蛋白质分离方法可以是，例如，如Harlow和Lane(Harlow和Lane，1988,Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,New York)中所描述的那些。

可以采用多种形式来检测样品是否含有结合给定抗体的蛋白质。这些形式的例子包括，但不限于，酶免疫分析法(EIA)、放射免疫分析(RIA)、Western印迹分析和酶联免疫吸附试验(ELISA)。技术人员可以很容易地将已知的蛋白质/抗体检测方法适应用于测定细胞是否表达了本发明的标志物。

在一种形式中，可以在如Western印迹或免疫荧光技术的方法中使用抗体或者抗体片段或衍生物来检测所表达的蛋白质。在这类用途中，通常优选的是在固相支持物上固定抗体或蛋白质。合适的固相支持物或载体包括能结合抗原或抗体的任何支持物。众所周知的支持物或载体包括玻璃、聚苯乙烯、聚丙烯、聚乙烯、葡聚糖、尼龙、淀粉酶、天然和修饰的纤维素、聚丙烯酰胺、辉长岩和磁铁矿。

本领域技术人员知道用于结合抗体或抗原的许多其它合适的载体，且能够使这样的支持物适应用于本发明。例如，可以在聚丙烯酰胺凝胶电泳上运行从广泛性发育障碍细胞中分离的蛋白质，并固定到固相支持物如硝酸纤维素上。然后，可以用合适的缓冲液洗涤支持物，接着用可检测地标记的抗体进行处理。然后可以用缓冲液第二次洗涤固相支持物以除去未结合的抗体。然后，可以通过常规方法检测固相支持物上的结合标记的量。

本发明还包括用于检测生物样品中标志物蛋白质或核酸的存在的试剂盒。这种试剂盒可用于测定患者是否患有广泛性发育障碍或发展广泛性发育障碍的风险增高。例如，该试剂盒可以包含能够检测生物样品中的标志物蛋白质或核酸的标记的化合物或试剂，以及用于测定样品中蛋白质或mRNA量的手段(例如，结合蛋白质或其片段的抗体，或结合编码该蛋白质的DNA或mRNA的寡核苷酸探针)。试剂盒还可以包括解释使用试剂盒获得的结果的说明。

对于基于抗体的试剂盒，试剂盒可以包括，例如：(1)结合于标志物蛋白质的第一抗体(例如，连接于固相支持物)，以及任选地，(2)结合蛋白质或第一抗体且与可检测的标记偶联的不同的第二抗体。

对于基于寡核苷酸的试剂盒，该试剂盒可以包含，例如：(1)寡核苷酸，例如可检测地标记的寡核苷酸，其与编码标志物蛋白质的核酸序列杂交，或(2)用于扩增标志物核酸分子的一对引物。该试剂盒还可以包含，例如，缓冲剂、防腐剂或蛋白质稳定剂。该试剂盒可以进一步包含用于检测可检测标记所需的成分(例如，酶或底物)。该试剂盒还可以包含可进行测定和与测试样品比较的对照样品或一系列对照样品。试剂盒中的各种成分可以封闭在单个容器中，且所有的各种不同容器可以与用于解释使用试剂盒进行分析的结果的说明一起置于单一的包装内。

B、药物基因组学

本发明的标志物也可用作药物基因组学标志物。如本文所用的，“药物基因组学标志物”是其表达水平与特定的临床药物反应或在患者体内的易感性相关的客观生化标志物(参见，例如，McLeod等(1999)Eur.J.Cancer 35(12):1650-1652)。药物基因组学标志物表达的存在或量与患者的预测响应和更具体地与患者的障碍对采用特定的药物或药物种类的疗法的预测响应相关。通过评估在患者体内一种或多种药物基因组学标志物的存在或表达量，最适合患者的或预计将有更大程度的成功的药物治疗可以被选择。例如，基于在患者中特异性癌症标志物所编码的RNA或蛋白质的存在或量，可以选择被优化用于很可能存在于患者中的特定广泛性发育障碍的治疗的药物或治疗过程。因此利用药物基因组学标志物允许选择或设计对于各个患者的最适合治疗而不用尝试不同的药物或方案。

药物基因组学的另一个方面涉及改变身体作用于药物的方式的遗传学状态。这些药物遗传学状态可作为罕见的缺陷或作为多态性存在。例如，葡萄糖-6-磷酸脱氢酶(G6PD)缺陷是一种常见的遗传性酶病，其中主要临床并发症是摄入氧化剂药物(抗疟疾药物、磺胺类药物、止痛药、硝基呋喃)和食用蚕豆后的溶血。

作为说明性的实施方式，药物代谢酶的活性是药物作用的强度和持续时间的主要决定因素。药物代谢酶(如N-乙酰基转移酶2(NAT2)和细胞色素P450酶CYP2D6和CYP2C19)的基因多态性的发现已经给为什么有些患者在服用了标准和安全剂量的药物后无法获得预期的药物效果或表现出过大的药物反应和严重的毒性提供了一个解释。这些多态性在人群中表现为两种表型，强代谢者(EM)和弱代谢者(PM)。PM的患病率在不同人群中不同。例如，编码CYP2D6的基因是高度多态性的，并已在PM中确定了几种突变，其中所有这些都导致功能性CYP2D6的缺失。当他们接受标准剂量时，CYP2D6和CYP2C19弱代谢者非常经常地发生过大的药物反应和副作用。如果代谢产物是活性的治疗成分，PM不显示治疗效应，如由可待因的CYP2D6形成代谢产物吗啡介导的可待因镇痛效果所证明的。另一个极端是所谓的超快代谢者，其对标准剂量无反应。最近，超快代谢的分子基础已被确定为是由于CYP2D6基因的扩增。

因此，可以测定在个体中本发明的标志物的表达水平，从而选择用于该个体的治疗或预防性治疗的适当药剂。此外，药物遗传学研究可用于将编码药物代谢酶的多态性等位基因的基因分型应用于识别个体的药物反应表型。当这一知识被应用至定剂量或药物选择时，可避免不良反应或治疗失败，且因此当治疗具有本发明标志物的表达的调节子的受试者时提高治疗或预防的效率。

C、监测临床试验

监测药剂(如，药物化合物)对本发明的标志物的表达水平的影响不仅可以被应用于基本的药物筛选，而且可以应用于临床试验。例如，可以在受试者接受广泛性发育障碍治疗的临床试验中，监测试剂影响标志物的表达的有效性。在优选的实施方式中，本发明提供了用于监测用药剂(例如，激动剂、拮抗剂、拟肽、蛋白质、肽、核酸、小分子或其他的药物候选物)治疗受试者的有效性的方法，包括以下步骤：(i)在施用药剂前，从受试者获得给药前样品；(ii)检测给药前样品中本发明的一个或多个选择的标志物的表达水平；(iii)从受试者获得一个或多个给药后样品；(iv)检测给药后样品中标志物的表达水平；(v)将给药前样品中标志物的表达水平与一个或多个给药后样品中标志物的表达水平相比较；及(vi)相应地改变药剂对受试者的施用。例如，在治疗过程中增加的标志物基因的表达可以表明无效的剂量和需要提高剂量。相反，标志物基因的表达下降可以表明有效的治疗和无需改变剂量。

D、阵列

本发明还包括含有本发明的标志物的阵列。该阵列可用于分析在阵列中的一个或多个基因的表达。在一个实施方式中，该阵列可以用于分析在组织中的基因表达以确定阵列中的基因的组织特异性。以这种方式，高达约7600个基因可以被同时用于表达的分析。这允许开发显示在一种或多种组织中特异性表达的一组基因的图谱。

除了这样的定性测定，本发明还允许基因表达定量。因此，不仅组织特异性，而且可确定在组织中一组基因的表达水平的。因此，基因可以基于其本身的组织表达和在该组织中的表达水平被分组。这可用于，例如，确定组织之间或组织中的基因表达的关系。因此，一个组织可以被扰动，且可确定对第二组织中基因表达的影响。在这方面，响应于生物刺激的一种细胞类型对另一种细胞类型的影响可以被确定。这样的确定可用于，例如，了解基因表达水平上细胞-细胞相互作用的影响。如果药剂被治疗性地施用以处理一种细胞类型，但对另一种细胞类型具有不希望的效应，则本发明提供了用于确定不希望的效应的分子基础并因此提供共同施用对抗试剂或以其他方式处理不希望的效应的机会的分析方法。类似地，即使在单一的细胞类型中，可以在分子水平上确定不希望的生物效应。因此，可以确定和抵消试剂对靶基因以外的表达的影响。

在另一个实施方式中，阵列可以用来监视阵列中一个或多个基因的表达的时间过程。这可能在各种生物背景下发生，如本文所公开的，例如广泛性发育障碍的发生，广泛性发育障碍的进展，以及过程，如与广泛性发育障碍相关的细胞转化。

阵列也可用于确定基因的表达对同一细胞中或不同细胞中的其他基因的表达的影响。这在最终或下游靶标不能被调节的情况下提供了例如，用于治疗干预的其他分子靶标的选择。

阵列也可用于确定在正常和异常的细胞中的一种或多种基因的差异表达模式。这提供了可以作为诊断或治疗性干预的分子靶标的一组基因。

VII.获取样品的方法

在本发明的方法中有用的样品包括表达本发明的标志物的任何组织、细胞、组织活检或体液样品。在一个实施方式中，样品可以是组织、细胞、全血、血清、血浆、口腔刮取物、唾液、脑脊液、尿、大便或支气管肺泡灌洗液。在一种实施方式中，组织样品是广泛性发育障碍样品，包括脑组织样品。

可以通过多种本领域中已知的技术从受试者获得身体样品，包括，例如，通过使用活组织检查或通过刮取或擦拭一个区域或通过利用针头吸取体液。收集各种身体样品的方法在本领域中是众所周知的。

适用于检测和定量本发明的标志物的组织样品可以是新鲜的、冷冻的或根据本技术领域的技术人员已知的方法固定的。合适的组织样品优选被切片和置于显微镜载片上作进一步分析。另外，固体样品，即，组织样品，可以被溶解和/或均质化，并随后作为可溶性提取物进行分析。

在一个实施方式中，使用，例如，液态氮或二氟二氯甲烷冷冻新得到的组织活检样品。冷冻样品被安装用于使用，例如，OCT切片，并在低温恒温器中连续切片。连续的切片被收集在玻璃显微镜载片上。对于免疫组化染色，切片可涂覆有，例如，铬明矾、明胶或聚-L-赖氨酸以确保切片粘着到载片上。在另一个实施方式中，在切片之前固定和包埋样品。例如，组织样品可以在，例如，福尔马林中固定，连续脱水，并包埋在，例如，石蜡中。

一旦得到样品，可以使用在本领域中已知适合用于检测和定量分析本发明的标志物的任何方法(无论是在核酸或在蛋白质水平上)。这类方法是众所周知的，且包括但不限于Western印迹、Northern杂交、Southern杂交、免疫组织化学、ELISA例如，扩ELISA、免疫沉淀、免疫荧光、流式细胞术、免疫细胞化学、质谱分析例如，MALDI-TOF和SELDI-TOF、核酸杂交技术、核酸逆转录方法和核酸扩增方法。在特定的实施方式中，使用例如，与这些蛋白质特异性结合的抗体在蛋白质水平上检测本发明标志物的表达。

样品可能需要被改变以使本发明的标志物易于被抗体结合。在免疫细胞化学或免疫组织化学方法的特定方面，载片可被转移到预处理缓冲液中和任选地加热以增加抗原可达性。加热预处理缓冲液中的样品迅速地破坏了细胞的脂质双层，和使得抗原(可以是新鲜标本中的情况，但通常不是发生在固定标本中的情况)更易于为抗体结合。本文中可互换地使用术语“预处理缓冲液”和“制备缓冲液”，其指用于制备用于免疫染色的细胞学或组织学样品，尤其是通过提高本发明标志物用于抗体结合的可达性的缓冲液。预处理缓冲液可以包含pH特异性的盐溶液、聚合物、洗涤剂或者非离子或阴离子表面活性剂，例如，乙氧基化的阴离子型或非离子型表面活性剂、链烷酸或烷氧基化物或甚至这些表面活性剂的共混物或甚至使用胆汁盐。预处理缓冲液可以是，例如，0.1％至1％的脱氧胆酸，钠盐的溶液、或月桂醇醚-13-羧酸酯钠(例如，Sandopan LS)或和乙氧基化的阴离子复合物的溶液。在一些实施方式中，预处理缓冲液也可以被用作载片存储缓冲液。

使本发明的标志物蛋白质更易于为抗体结合的任何方法可以被用在本发明的实践中，包括本领域中已知的抗原修复方法。参见，例如，Bibbo等(2002)Acta.Cytol.46:25-29；Saqi等(2003)Diagn.Cytopathol.27:365-370；Bibbo等(2003)Anal.Quant.Cytol.Histol.25:8-11，其各自的全部内容通过引用并入本文。

在预处理以增加标志物蛋白质的可达性之后，可以使用合适的封闭剂，例如，如过氧化物酶封闭剂，如过氧化氢来封闭样品。在一些实施方式中，可以使用蛋白质封闭剂封闭样品以防止抗体的非特异性结合。蛋白质封闭剂可以包含，例如，纯化的酪蛋白。然后将抗体(特别是特异性结合本发明的标志物的单克隆抗体或多克隆抗体)与样品一起孵育。本领域的技术人员将会理解，在某些情况下，可以通过检测患者样品中本发明的标志物蛋白质上的多个表位而得到更准确的诊断或预后。因此，在具体的实施方式中，使用针对本发明标志物的不同表位的至少两个抗体。在使用超过一个抗体时，可以依次将这些抗体作为单独的抗体试剂添加到单一样品中，或作为抗体混合物同时加入。或者，可以将各单个抗体添加到来自同一病人的单独样品中，并汇集所得到的数据。

用于检测抗体结合的技术在本技术领域是众所周知的。可以通过使用产生可检测信号的化学试剂检测结合本发明标志物的抗体，其中该可检测的信号对应于抗体结合的水平，和因此对应于标志物蛋白质的表达水平。在本发明的免疫组织化学或免疫细胞化学方法中，通过使用与标记的聚合物偶联的第二抗体来检测抗体结合。标记的聚合物的例子包括但不限于聚合物-酶偶联物。这些复合物中的酶通常被用于催化发色团沉积在抗原-抗体结合位点处，从而导致对应于目的生物标志物的表达水平的细胞染色。特别感兴趣的酶包括，但不限于，辣根过氧化物酶(HRP)和碱性磷酸酶(AP)。

在本发明的特定免疫组织化学或免疫细胞化学方法中，通过使用与第二抗体偶联的HRP-标记的聚合物检测抗体与本发明标志物的结合。也可以通过使用结合单克隆抗体或多克隆抗体的物种特异性探针试剂以及结合物种特异性探针试剂的与HRP偶联的聚合物检测抗体结合。使用任何发色团对载片进行抗体结合的染色，例如，发色团3,3-二氨基联苯胺(DAB)，然后用苏木精和任选地上蓝剂(例如氢氧化铵或TBS/Tween-20)复染。其它合适的发色团包括，例如，3-氨基-9-乙基咔唑(AEC)。在本发明的一些方面，通过细胞学学和/或病理学家显微镜检验载片以评估细胞染色，例如，荧光染色(即，标志物表达)。或者，可以通过自动显微镜检或借助于帮助识别阳性染色细胞的计算机软件人工检验样品。

可以通过将抗标志物抗体与可检测物质偶联来促进抗体结合的检测。可检测物质的实例包括各种酶、辅基、荧光材料、发光材料、生物发光材料和放射性材料。合适的酶的例子包括辣根过氧化物酶、碱性磷酸酶、β-半乳糖苷酶或乙酰胆碱酯酶；合适的辅基复合体的例子包括抗生蛋白链菌素/生物素和抗生物素蛋白/生物素；合适的荧光材料的例子包括伞形酮、荧光素、异硫氰酸荧光素、若丹明、二氯三嗪基胺荧光素、丹磺酰氯或藻红蛋白；发光材料的例子包括鲁米诺；生物发光材料的例子包括萤光素酶、虫萤光素和水母发光蛋白；且合适的放射性物质的例子包括¹²⁵I、¹³¹I、³⁵S、¹⁴C或³H。

在本发明的一个实施方式中，按上述方法制备冷冻样品，和随后用针对本发明标志物的抗体染色，该抗体使用，例如，Tris-缓冲盐水(TBS)稀释至适当的浓度。通过将载片在生物素化的抗免疫球蛋白中温育检测初级抗体。这个信号可以任选地放大和用抗原的二氨基联苯胺沉淀使其可视化。此外，载片可以任选地用，例如，苏木精复染以使细胞可视化。

在另一个实施方式中，用针对本发明标志物的抗体染色固定和包埋的样品，并对冰冻切片如上所述进行复染。此外，可任选地用试剂处理样品以放大信号，从而可视化抗体染色。例如，可利用生物素-酪胺(tyramide)的过氧化物酶催化的沉积，生物素-酪胺随后与过氧化物酶偶联的抗生蛋白链菌素反应(催化信号放大(CSA)系统，DAKO，Carpinteria，CA)。

基于组织的分析(即，免疫组织化学)是检测和定量本发明标志物的优选的方法。在一个实施方式中，可以通过免疫组织化学确定是否存在本发明的标志物。在一个实施方式中，免疫组织化学分析使用低浓度的抗标志物抗体，以使得缺乏标志物的细胞不染色。在另一个实施方式中，本发明的标志物是否存在使用利用了高浓度的抗标志物抗体的免疫组织化学方法测定，以使得缺乏标志物蛋白质的细胞重度染色。不染色的细胞包含突变的标志物而不能产生可抗原识别的标志物蛋白质，或者是其中调节标志物水平的途径失调的细胞，从而导致可忽略的标志物蛋白质的稳态表达。

本领域的技术人员将认识到，用于实施本发明方法的特定抗体的浓度将取决于如结合时间、抗体对于本发明标志物的特异性水平和样品制备方法等因素而变化。此外，当使用多个抗体时，所需要的浓度可能受样品被施用于抗体上的顺序影响，例如，作为混合物同时施加或作为单独的抗体试剂顺序地施加。此外，用于可视化抗体与本发明标志物的结合的检测化学作用还必须进行优化以产生所需的信噪比。

在本发明的一个实施方式中，将蛋白质组学的方法，例如，质谱法，用于检测和定量本发明的标志物蛋白质。例如，其中涉及将生物样品(如血清)应用于蛋白质结合芯片的基质辅助激光解析/电离飞行时间质谱法(MALDI-TOF MS)或表面增强激光析/电离飞行时间质谱法(SELDI-TOFMS)(Wright,G.L.,Jr.等(2002)Expert Rev Mol Diagn 2:549；Li,J.等(2002)Clin Chem 48:129；Laronga,C.等(2003)Dis Markers 19:229；Petricoin,E.F.等(2002)359:572；Adam,B.L.等(2002)Cancer Res 62:3609；Tolson,J.等(2004)Lab Invest 84:845；Xiao,Z.等(2001)Cancer Res 61:6029)可用于检测和定量PY-Shc和/或p66-Shc蛋白。质谱方法被描述于，例如，5,622,824、5,605,798和5,547,835号美国专利中，其各自的全部内容并入本文作为参考。

在其它实施方式中，在核酸水平检测本发明标志物的表达。用来评估表达的基于核酸的技术在本领域中是众所周知的，并包括，例如，测定来自受试者样品中标志物mRNA的水平。许多表达检测方法使用分离的RNA。任何不是针对mRNA的分离选择的RNA分离技术可以用于从表达本发明标志物的细胞纯化RNA(参见，例如，Ausubel等编，(1987-1999)Current Protocolsin Molecular Biology(John Wiley&Sons,New York))。此外，可以使用那些本领域的技术人员熟知的技术如，例如，ChomczynskiP(1989，4,843,155号美国专利)的单步RNA分离过程，很容易地处理大量组织样品。

术语“探针”是指能够选择性地结合本发明标志物(例如，核苷酸转录本和/或蛋白质)的任何分子。探针可以由本技术领域的技术人员合成，或来自于适当的生物制剂。探针可以特别地设计为被标记的。可以被用作探针的分子的实例包括，但不限于，RNA、DNA、蛋白质、抗体和有机分子。

分离的mRNA可以被用在杂交或扩增分析中，其包括但不限于，Southern或Northern分析、聚合酶链反应分析和探针阵列。用于检测mRNA水平的一种方法涉及将分离的mRNA与可以与标志物mRNA杂交的核酸分子(探针)相接触。该核酸探针可以是，例如，全长cDNA或其一部分，如至少为7、15、30、50、100、250或500个核苷酸长度和足以在严格条件下与标志物基因组DNA特异性杂交的寡核苷酸。

在一个实施方式中，mRNA被固定在固体表面上，并与探针接触，例如通过在琼脂糖凝胶上运行分离的mRNA，和将mRNA从凝胶转移到膜上，如硝酸纤维素。在替代的实施方式中，探针被固定在固体表面上，并将mRNA与探针接触，例如，在Affymetrix基因芯片阵列中。熟练的技术人员可以很容易地将已知的mRNA检测方法适应用于检测标志物mRNA的水平。

用于确定样品中标志物mRNA的水平的替代方法涉及核酸扩增的过程，例如，通过RT-PCR(Mullis，1987年，4,683,202号美国专利中公开的实验实施方式)、连接酶链反应(Barany(1991)Proc.Natl.Acad.Sci.USA88:189-193)、自持的序列复制(Guatelli等(1990)Proc.Natl.Acad.Sci.USA87:1874-1878)、转录扩增系统(Kwoh等(1989)Proc.Natl.Acad.Sci.USA86:1173-1177)、Q-β复制(Lizardi等(1988)Bio/Technology 6:1197)、滚环复制(Lizardi等人，5,854,033号美国专利)或任何其他的核酸扩增方法，随后使用本领域的技术人员熟知的技术检测扩增的分子。如果这样的分子以非常低的数量存在，则这些检测方案对于核酸分子的检测是特别有用的。在本发明的特定方面中，通过定量荧光RT-PCR(即，TaqMan^TM系统)评估标志物的表达。这类方法通常利用对于本发明的标志物特异性的寡核苷酸引物对。设计对于已知序列特异性的寡核苷酸引物的方法是本领域中众所周知的。

可以使用膜印迹(如用于杂交分析中的，例如Northern印迹、Southern印迹、点印迹等)或微孔、样品管、凝胶、珠或纤维(或任何包含结合的核酸的固体支持物)监测本发明标志物的表达水平。见5,770,722、5,874,219、5,744,305、5,677,195和5,445,934号美国专利，其通过引用的方式并入本文。检测标志物的表达也可包括使用在溶液中的核酸探针。

在本发明的一个实施方式中，微阵列被用于检测本发明标志物的表达。因为不同的实验之间的可重复性，微阵列特别适合用于此目的。DNA微阵列提供了一种用于同时测量大量基因的表达水平的方法。各个阵列由可附着到固体支持物上的捕获探针的重复图案组成。标记的RNA或DNA与在阵列的上互补探针杂交，然后通过激光扫描检测。阵列上各个探针的杂交强度被确定并转换为代表相对基因表达水平的定量值。见6,040,138、5,800,992和6,020,135、6,033,860和6,344,316号美国专利，他们通过引证引入本文。高密度寡核苷酸阵列对于测定样品中大量RNA的基因表达谱是特别有用的。

使用本发明的方法(其可包括本领域技术人员已知的回归分析的方法)可以利用本发明磷酸化标志物的量和/或标志物量的数学关系来计算在进行广泛性发育障碍状态治疗的受试者中广泛性发育障碍复发的风险，对于广泛性发育障碍正在接受治疗的受试者的生存，广泛性发育障碍是否是侵袭性的、治疗方案对于治疗广泛性发育障碍的功效等。例如，适当的回归模型包括但不限于，CART(例如，Hill,T和Lewicki,P.(2006)“STATISTICS Methods andApplications”StatSoft,Tulsa,OK)、Cox(例如，www.evidence-based-medicine.co.uk)、指数、正态和对数正态(例如，www.obgyn.cam.ac.uk/mrg/statsbook/stsurvan.html)、逻辑(例如，www.en.wikipedia.org/wiki/Logistic_regression或http://faculty.chass.ncsu.edu/garson/PA765/logistic.htm)、参数、非参数、半参数(例如，www.socserv.mcmaster.ca/jfox/Books/Companion)、线性(例如，www.en.wikipedia.org/wiki/Linear_regression或http://www.curvefit.com/linear_regression.htm)或加性(例如，www.en.wikipedia.org/wiki/Generalized_additive_model或http://support.sas.com/rnd/app/da/new/dagam.html)。

在一个实施方式中，回归分析包括磷酸化标志物的量。在另一个实施方式中，回归分析包括标志物数学关系。在再另一实施方式中，磷酸化标志物的量和/或标志物数学关系的回归分析可以包括附加的临床和/或分子协变量。这种临床协变量包括但不限于，淋巴结状态、肿瘤阶段、肿瘤分级、肿瘤大小、治疗方案，如化疗和/或放射治疗、临床结果(例如，复发、疾病特异性生存率、治疗失败)和/或随诊断后时间变化的临床结果、治疗开始后的时间和/或完成治疗后的时间。

在另一个实施方式中，使用本发明的方法(其可包括本领域技术人员已知的回归分析)可以用磷酸化标志物的量，和/或所述标志物的数据关系来计算正在治疗肿瘤病症的受试者中肿瘤病症的复发的风险、正在治疗肿瘤病症的受试者的存活率、肿瘤病症是否是侵袭性的、治疗方案在治疗肿瘤病症中的效果等。例如，合适的回归模型包括但不限于CART(例如Hill,T,andLewicki,P.(2006)"STATISTICS Methods and Applications"StatSoft,Tulsa,OK)，Cox(例如www.evidence-based-medicine.co.uk)、指数、正态和对数正态(例如，www.obgyn.cam.ac.uk/mrg/statsbook/stsurvan.html)、逻辑(例如www.en.wikipedia.org/wiki/Logistic_regression或http://faculty.chass.ncsu.edu/garson/PA765/logistic.htm)、参数、非参数、半参数(例如www.socserv.mcmaster.ca/jfox/Books/Companion)、线性(例如www.en.wikipedia.org/wiki/Linear_regression或http://www.curvefit.com/linear_regression.htm)或加性(例如www.en.wikipedia.org/wiki/Generalized_additive_model或http://support.sas.com/rnd/app/da/new/dagam.html)。

在一个实施方案中，回归分析包括磷酸化标志物的量。在另一个实施方式中，回归分析包括标志物数学关系。在再另一实施方式中，磷酸化标志物的量和/或标志物数学关系的回归分析可以包括附加的临床和/或分子协变量。这种临床协变量包括但不限于，淋巴结状态、肿瘤阶段、肿瘤分级、肿瘤大小、治疗方案，如化疗和/或放射治疗、临床结果(例如，复发、疾病特异性生存率、治疗失败)和/或随诊断后时间变化的临床结果、治疗开始后的时间和/或完成治疗后的时间。

VIII、试剂盒

本发明还提供了组合物和试剂盒，其用于预后疾病或障碍、障碍的复发或正在接受障碍(例如广泛性发育障碍，例如自闭症和阿尔茨海默病)治疗的受试者的生存率。这些试剂盒包括以下的一种或多种：特异性结合本发明的标志物的可检测抗体、特异性结合本发明的标志物的可检测核酸、用于获得和/或制备受试者目标组织样品用于染色的试剂和使用说明。

本发明的试剂盒可任选地包含可用于执行本发明的方法的附加成分。通过举例的方式，试剂盒可以包含适于退火互补的核酸或用于将抗体与其特异性结合的蛋白质相结合的液体(如SSC缓冲液)、一个或多个样品室、说明材料(其描述了本发明方法的性能)和组织特异性对照/标准品。

IX、筛选分析

本发明的靶标包括但不限于本文中描述的基因和蛋白质。用于识别所鉴定的标志物的调节子的筛选分析描述如下。

本发明还提供了用于识别调节子，即，候选或测试化合物或试剂(如蛋白质、肽、拟肽、类肽、小分子或其他药物)的方法(在此也称为“筛选分析”)，该调节子用于通过调节本发明标志物的表达和/或活性来调节疾病细胞的状态。这些分析典型地包括本发明的标志物和一个或多个分析成分之间的反应。其它成分可以是测试化合物本身，或测试化合物和本发明标志物的天然结合伴体的组合。通过试验(如本文所述的那些)鉴定的化合物可能例如，用于调节(例如，抑制、缓解、治疗或预防)所述疾病。

可以从任何可得来源得到用于本发明的筛选试验中的测试化合物，包括天然和/或合成化合物的系统的文库。测试化合物也可以通过本领域中已知的组合文库方法中的众多途径中的任何一种获得，包括：生物学文库、类肽文库(具有肽的功能，但具有新型的非肽主链的分子的文库，该非肽主链具有对酶降解抗性但仍然保持活性；见，例如，Zuckermann等，1994,J.Med.Chem.37:2678-85)；空间可定址平行的固相或液相文库；需要去卷积的合成文库方法；“一珠一化合物”文库方法；和采用亲和层析选择的合成文库方法。生物学文库和类肽文库途径限于肽文库，而其他四个途径适用于肽、非肽低聚物或化合物的小分子文库(Lam,1997,Anticancer Drug Des.12:145)。

可以在现有技术中找到用于合成分子文库的方法的例子，例如：DeWitt等(1993)Proc.Natl.Acad.Sci.U.S.A.90:6909；Erb等(1994)Proc.Natl.Acad.Sci.USA 91:11422；Zuckermann等(1994).J.Med.Chem.37:2678；Cho等(1993)Science 261:1303；Carrell等(1994)Angew.Chem.Int.Ed.Engl.33:2059；Carell等(1994)Angew.Chem.Int.Ed.Engl.33:2061；和Gallop等(1994)J.Med.Chem.37:1233。

化合物的文库可以存在于溶液中(例如，Houghten，1992,Biotechniques13:412-421)或珠(Lam,1991,Nature 354:82-84)、芯片(Fodor,1993,Nature364:555-556)、细菌和/或孢子(Ladner的5,223,409号美国专利)、质粒(Cull等1992,Proc Natl Acad Sci USA 89:1865-1869)或噬菌体(Scott和Smith，1990,Science 249:386-390；Devlin,1990,Science 249:404-406；Cwirla等，1990,Proc.Natl.Acad.Sci.87:6378-6382；Felici,1991,J.Mol.Biol.222:301-310；Ladner，同上)上。

本发明的筛选方法包括将细胞，例如疾病细胞与测试化合物接触，并确定测试化合物调节细胞中本发明的标志物的表达和/或活性的能力。可如本文所述地测定本发明的标志物的表达和/或活性。

在另一实施方式中，本发明提供用于筛选候选物或测试化合物的分析方法，其是本发明标志物或其生物活性部分的底物。在再另一实施方式中，本发明提供用于筛选候选物或测试化合物的分析方法，该候选物或测试化合物结合本发明的标志物或其生物活性部分。可以例如，通过将测试化合物与放射性同位素或酶标记偶联以使得化合物与标志物的结合可以通过检测复合物中标记的标志物化合物而测定来完成测试化合物直接结合标志物的能力的测定。例如，可以用¹³¹I、¹²⁵I、³⁵S、¹⁴C或³H直接或间接地标记化合物(例如，标志物底物)，并通过射电辐射的直接计数或通过闪烁计数检测放射性同位素。或者，可以用，例如，辣根过氧化物酶、碱性磷酸酶或荧光素酶酶学标记分析成分，并通过测定适当的底物向产物的转化而检测酶标记。

本发明还涉及由上述筛选分析识别的新型药剂。因此，进一步在适当的动物模型中使用如本文所述的识别的试剂在本发明的范围之内。例如，可以在动物模型中使用如本文所述地识别的能够调节本发明标志物的表达和/或活性的试剂，以确定用该试剂进行治疗的疗效、毒性或副作用。或者，可以在动物模型中使用如本文所述被识别的试剂以确定这种试剂的作用机制。此外，本发明涉及通过如上所述的方法识别的新型药剂用于如上所述的治疗。

X.疾病状态的治疗

本发明提供治疗广泛性发育障碍、或广泛性发育障碍的症状的方法，该方法通过向有需要的受试者(例如哺乳动物，如人)给药一种或多种表2-6中所列的蛋白质而进行。在一个实施方案中，所述广泛性发育障碍是自闭症。在另一个实施方案中，所述广泛性发育障碍是本文中描述的任一种病症。

本发明的一个方面提供了一种治疗、缓解症状、抑制进展或预防受试者广泛性发育障碍的方法，所述方法包括向有需要的受试者给药治疗有效量的药物组合物，其包含如表2-6中所列的一种或多种标志物。在一个实施方案中，所述标志物是蛋白质或其片段。在一个实施方案中，所述标志物是核酸，例如RNA或DNA，其编码或表达蛋白质标志物或其片段。适用于这种方法的所述标志物在本文中进一步详细描述。

本发明的另一个方面提供一种治疗、缓解症状、抑制进展或预防受试者的广泛性发育障碍的方法，所述方法包括向有需要的受试者给药治疗有效量的药物组合物，其包含调节表2-6中所列标志物的一种或多种的表达或活性的药剂。

在一个实施方案中，调节表2-6中所列的一种或多种标志物的表达的药剂通过使用本文中描述的任一项筛选方法来鉴定。在一个实施方案中，所述药剂抑制表2-6中所列的一种或多种标志物的表达或活性。在一个实施方案中，所述药剂提高表2-6中所列的一种或多种标志物的表达或活性。

本发明还提供一种测定治疗方案对于治疗受试者的广泛性发育障碍或广泛性发育障碍的症状的效果的方法，所述方法包括：(1)在向受试者给药至少一部分治疗方案之前，确定表2-6中所列的一种或多种标志物在从受试者获得的第一生物学样品中存在的表达水平，其中使用转化标志物的试剂以使所述标志物可被检测；(2)在向受试者给药至少一部分治疗方案之后，确定表2-6中所列的一种或多种标志物存在于获自所述受试者的第二生物学样品的表达水平，其中使用试剂转化标志物以使该标志物可被检测；(3)比较向受试者给药至少一部分治疗方案之前，表2-6中所列的一种或多种标志物存在于获自该受试者的第一样品中的表达水平与向受试者给药至少一部分治疗方案之后，表2-6中所列的一种或多种标志物存在于获自所述受试者的第二生物学样品的表达水平；以及(4)评估治疗方案对于治疗广泛性发育障碍或广泛性发育障碍的症状是否有效。

在一个实施方案中，与第一样品相比，第二样品中一种或多种标志物的表达水平的调节是治疗方案对于治疗受试者广泛性发育障碍或广泛性发育障碍的症状是否有效的指示。在一个实施方案中，一种或多种标志物在第二样品中与第一样品中表达水平相似是治疗方案对于治疗受试者广泛性发育障碍或广泛性发育障碍的症状没有效果的指示。

在一些实施方案中，在第二样品中表达水平朝向正常或对照表达水平的调节，例如比在第一样品中的表达水平更接近正常或对照表达水平，是治疗方案对于治疗受试者广泛性发育障碍或广泛性发育障碍的症状有效的指示。

在一个实施方案中，受试者正在接受针对广泛性发育障碍的治疗。在一些实施方案中，所述方法还包括向所述治疗方案被确认为对于治疗受试者广泛性发育障碍或广泛性发育障碍的症状有效的受试者继续给药治疗方案，和/或向所述治疗方案被确认为对于治疗受试者广泛性发育障碍或广泛性发育障碍的症状没有效果的受试者停止给药方案。

本发明的另一个方面提供一种鉴定用于治疗受试者的广泛性发育障碍或广泛性发育障碍的症状的化合物的方法，该方法包括：(1)将生物学样品与测试化合物接触；(2)确定一种或多种表2-6中所列的生物标志物存在于该生物学样品中的表达水平和或活性；(3)将所述一种或多种标志物在该生物学样品中的表达水平和/或活性与在未接触测试化合物对照样品中的表达水平和/或活性比较；以及(4)选择调节该一种或多种生物标志物在生物学样品中的表达水平和/或活性的测试化合物，由此鉴定出用于治疗受试者广泛性发育障碍或广泛性发育障碍的症状的化合物。

在一个实施方案中，生物学样品从患有广泛性发育障碍或具有广泛性发育障碍症状的受试者获得。在一个实施方案中，所述受试者是人。在一个实施方案中，所述生物学样品是受试者的组织或生物学流体，所述受试者患有广泛性发育障碍或具有广泛性发育障碍症状。在一个实施方案中，所述生物学样品包括细胞，例如受试者的原生细胞或用于体外测试的固定细胞。

在一个实施方案中，所述测试化合物上调表2-6中所列的一种或多种标志物的表达和/或活性。在一个实施方案中，所述测试化合物下调表2-6中所列的一种或多种标志物的表达和/或活性。在一个实施方案中，所述测试化合物调节表2-6中所列的一种或多种标志物的表达和/或活性使其接近、类似或与对照样品中的表达水平相同。

本发明的另一个方面提供一种使用治疗方案治疗具有广泛性发育障碍的受试者的方法，所述方法包括以下步骤：选择这样的受试者，其响应于所述治疗方案表现出表2-6中所列的一种或多种标志物的表达水平相对于对照标志物的表达水平受到调节；以及向所述受试者给药治疗有效量的治疗方案。

本发明进一步通过以下实施例进行说明，这些实施例不应被理解为限定性的。在本申请全文中引用的公开专利和专利申请在此通过引用纳入本文。

对本发明的举例说明：

实施例1：被鉴定为相对于正常样品在自闭症中独特地上调或下调的蛋白质

使用如上所述的平台技术，采用自闭症患者和自闭症患者的正常的未患病父母或兄弟姐妹的淋巴母细胞进行研究，以鉴定出在自闭症疾病状态下独特地被上调或下调的蛋白质。由四位自闭症患者和五位未患病的对照获得的淋巴母细胞的样品(见图9)通过使用获自Coriell Cell Repositories(403HaddonAvenue Camden,New Jersey 08103)的细胞系来制备。这些研究的结果使用如上文所述平台技术内的数据处理进行分析。

这些研究的结果鉴定出诸如SPTAN1、HSP90B1、GLUD1和CORO1A的蛋白质，其为整体差异网络中枢/节点，与来自自闭症患者的正常的未患病父母或兄弟姐妹的样品相比，它们在自闭症患者的样品中被独特地上调或下调(参见图10)。此外，该研究鉴定出在SPTAN1、HSP90B1、GLUD1和CORO1A网络内的如下蛋白质，与来自自闭症患者的正常的未患病父母或兄弟姐妹的样品相比，它们在自闭症患者的样品中被独特地上调或下调。

表2

这些结果表示，诸如SPTAN1、HSP90B1、SERPINB9、LETM1、CUX1、EIF3G、LCP1、CORO1A、ANXA6、CAPG、APMAP、COTL1、FKBP4、DIABLO、HLA-DRA、HLA-DQB1、FKBP4、IGLC1、TXNDC5、GLUD1、PCNA、PDIA4和MGEA5的蛋白质可以作为用于诊断广泛性发育障碍(例如自闭症)的标志物，用于鉴定发展出广泛性发育障碍(例如自闭症)的倾向或风险，以及作为可用于开发广泛性发育障碍(例如自闭症)的药物疗法的靶点。

血影蛋白A2(Spectrin A2，SPTAN1)被鉴定为受自闭症影响的分子实体之一。SPTAN1是一种在非红细胞中表达的蛋白质，也被称作“收缩蛋白A2”。SPTAN1的突变与West综合征，例如髓鞘化低下，四肢麻痹及发展迟缓有关。异常的血影蛋白特征在自闭症患者的大脑和淋巴细胞中是明显的。SPTAN1的位置接近TSC1的位置。SPTAN1的表达影响T-细胞的成熟和CD4/CD8的比例。SPTAN1在T细胞活化中具有特征聚集分布。

冠蛋白1A(Coronin 1A，CORO1A)被鉴定为是自闭症网络的中枢。CORO1A是参与信号转导、凋亡、基因调控途径的一种肌动蛋白结合蛋白。CORO1A在T细胞存活活化和迁移中发挥关键作用。CORO1A的突变与T细胞离开胸腺相关，导致外周缺陷(peripheral deficiency)。CORO1A的变异与重症联合免疫缺陷和ADHD有关。

GLUD1是一种线粒体特异蛋白，其在氨解毒中具有重要的作用。在GLUD1被鉴定为在自闭症患者样品中被调节的基础上，在自闭症血浆中观察到的氨水平增加可能是由于线粒体功能障碍，例如GLUD1功能障碍。GLUD1的活性受ATP水平的影响。

HSP90B1是一种ER特异性热休克蛋白，其为GRP成员。HSP90B1是一种整联蛋白的主要伴侣，并且是T和B淋巴细胞增殖调节因子。HSP90B1与被报道为与自闭症相关的基因相互作用。

实施例2：被疾病状态驱动并且被鉴定为自闭症和阿尔茨海默病共有的分子实体

使用上文所述的平台技术对来自于自闭症或阿尔茨海默病患者的，和来自于正常的对照个体(例如所述自闭症和/或阿尔茨海默病患者的未患病的父母或兄弟姐妹)的淋巴母细胞进行研究，以鉴定出相对于对照被独特地上调或下调的，且自闭症和/或阿尔茨海默病患者共有的蛋白质。由四位自闭症患者和五位未患病的对照获得的淋巴母细胞的样品(见图9)，以及由四位阿尔茨海默病患者和四位健康对照(年龄和性别匹配)的淋巴母细胞的样品通过使用从Coriell Cell Repositories(403Haddon Avenue Camden,New Jersey08103)获得的细胞系来制备。这些研究的结果使用如上文所述平台技术内的数据处理进行分析。

这些研究的结果鉴定出诸如以下蛋白，它们在自闭症或阿尔茨海默病患者中共同被调节的，例如相对于未患病个体(例如自闭症或阿尔茨海默病患者的未患病的父母或兄弟姐妹)的正常对照样品上调或下调。参见图11。

表3

这些结果表示，诸如HBA2、AHSG、LMNA、P4HB、TXNDC5、VIM、DDX39A、ZNF207、EIF3G、HPRT1、PEA15、IGHM、MX1、ETFB、EIF3L、TPM4、GTF2I、TUBA4A、RPS15、HLA-A、TXNL1、PSME1、TSN、FARSA、MTHFD1和HSPH1的蛋白质可以作为用于诊断广泛性发育障碍(例如自闭症和/或阿尔茨海默病)的标志物，用于鉴定发展出广泛性发育障碍(例如自闭症和/或阿尔茨海默病)的倾向或风险，以及作为可用于开发广泛性发育障碍(例如自闭症和/或阿尔茨海默病)的药物疗法的靶点。

实施例3：使用探寻式生物发现平台技术鉴定的自闭症谱系障碍(ASD)的新生物标志物

申请人在本文中已采用新的方法，将细胞生物学和多组学平台的优势结合在探寻式发现平台技术，以鉴定出自闭症谱系障碍(ASD)、例如自闭症的新的生物标志物。开发出并采用了自闭症谱系障碍(特别是自闭症)的细胞模型系统，其包含由患者获得的淋巴母细胞细胞系用作代表自闭症障碍的细胞模型。这些细胞用或不用MIM处理，以捕获广泛性发育障碍(例如自闭症)中独特的病理学蛋白组改变。开发出一个2D-nanoLC-MSMS工作流以对细胞的和分泌的多肽/蛋白质进行绘制和相对定量。当在该实施例中仅进行蛋白质组学分析时，在平台技术中可以容易地采用并分析多个数据输出，包括来自于流式细胞仪的数据、细胞基础测定的数据(例如线粒体ATP和ROS测定)，以及功能基因组学平台(例如单核苷酸多态性(SNP)数据)，以提供深入的生物学读数。对所有在本实施例中获得的数据(即蛋白组学数据)输入基于AI的REFS^TM信息平台，以研究体外、体内和计算机模拟的一致的数据趋势。通过使用该方法，开发出与疾病表型相关的细胞信号网络的分子指纹，由此反映出导致疾病(例如广泛性发育障碍)发生和进展的决定分子改变的机理。使用该方法从因果关系网络鉴定出了多个新的生物标志物。此外，通过使用细胞功能读数，例如线粒体ATP、生物能量、ROS等，确定了驱动病理生理学细胞行为的标志物。总地说来，本文描述的方法为鉴定可用于自闭症谱系障碍(ASD)的诊断和患者分层的生物标志物提供了坚固的基石。

图8描绘了所采用的具体实验方法的一个实施例。简言之，淋巴母细胞采样自闭症患者和正常的未患病的父母或兄弟姐妹。来自四位自闭症患者和五位未患病对照的淋巴母细胞的样品(见图9)通过使用从Coriell CellRepositories(403Haddon Avenue Camden,New Jersey 08103)获得的细胞系来制备。对所述样品进行组学分析，例如2D-nanoLC-MSMS蛋白质组学分析。多组学样品分析读数被输入如上所述的基于AI的REFS信息学平台。差异的相互作用组学网络输出已鉴定出自闭症疾病状态中被独特表达的或调节/失调的生物标志物。

图12示出一个示例性模拟差异Δ网络，其将自闭症患者与正常未患病的父母或兄弟姐妹进行比较。该差异网络是仅基于所采集的数据重建的网络，也即没有使用在先的生物学知识来产生该网络。在该网络中，鉴定出ASD病理生理学的三个关键“中枢”或“调节子”，并在图12中强调示出。

对于第一中枢(如图13所示)，父节点血影蛋白A2(SPTAN1)在细胞信号传导和外周神经髓鞘中有重要作用。SPTAN1的显性负突变引起Western综合征，具有脑髓鞘化低下，不良的视觉注意力，痉挛性四肢瘫痪和发育迟缓。报道称在脑和淋巴母细胞中有特征性的异常血影蛋白。目前没有文献报道SPTAN1在自闭症中的作用。但是，之前有报道髓鞘在自闭症中的作用。对于子节点突触融合蛋白-6(STX6)，尚未有报道将STX6与自闭症关联起来。有报道STX6突变参与毒素吸收有关，以及参与另一种神经退行性疾病，进行性核上性麻痹(Progressive supranuclear,PSP)。有报道子节点整联蛋白β7(ITGB7)在自闭症儿童中与他们的正常兄弟姐妹中是差异化表达的(参见Hu et al.BMC Genomics 2006；Szatmari et al.,Nat Genet.2007)。对于相邻节点SERPINB9，其与丝氨酸蛋白酶抑制剂，分支(SPTAN1)具有多个共同的子节点，微阵列研究报道了该基因在自闭症患者相比于他们的正常兄弟姐妹表达发生下调(Hu et al.Autism Res.2009)。

图14中示出了第二个中枢，谷氨酸脱氢酶1(GLUD1)，其为父节点。GLUD1是线粒体基质酶，并且其在氮和谷氨酸代谢中，以及在大脑能量平衡上具有重要作用。已有报道在自闭症儿童中在发病的早期阶段GLUD1发生上调(Gregg et al.,Genomics.2008)。在自闭症患者血浆中增加氨浓度被认为是由于线粒体功能障碍。经由CNV分析，子节点GLUD1、EIF3B和RPL3均关联至自闭症表型。GLUD1的相邻节点Septin 2(SEPT2)的上调也在自闭症发病早期被检测到(Gregg et al.,Genomics.2008)。经由CNV分析，GLUD1的子节点EIF3B和RPL3与自闭症表型基因相关。

图15中示出了第三中枢，冠蛋白-1A(CORO1A)，其是父节点。CORO1A参与信号传导、线粒体凋亡、T细胞介导的免疫和基因调控。CORO1A的突变与重症联合免疫缺陷和ADHD有关。子节点粪卟啉原Ⅲ氧化酶(CPOX)是一种线粒体内膜酶。CPOX可能与线粒体呼吸链疾病有关。在一些自闭症患者中，观察到CPOX失调与大量卟啉排泄相关。尿卟啉水平作为汞暴露的指标，因为尿卟啉与汞暴露正相关。

这些研究的结果鉴定出包括SPTAN1、GLUD1和CORO1A是整体差异性网络中枢/节点，与在自闭症患者的正常的未患病父母或兄弟姐妹的样品中相比，他们在自闭症患者样品中独特地表达或调节/失调。此外，研究鉴定出以下在SPTAN1、GLUD1和CORO1A网络中(分别列在下表4-6中)的标志物，与在自闭症患者的正常的未患病父母或兄弟姐妹的样品中相比，他们在自闭症患者样品中独特地表达或调节/失调。

表4

表5

表6

这些结果表明，诸如SPTAN1、STX6、ITGB7、CPSF6、DDX6、SERPINB9、PSMA2、SMC4、GLUD1、SEPT2、OSBP、AHSA1、ERAP1、FKBP4、RPL13、PDCL3、EIF3B、AP1S1、CORO1A、YWHAG、HNRNPM、ERP44、CPOX、EIF4A2、SEC61A1、TJP2、LETM1和GET4的蛋白质可以作为用于诊断广泛性发育障碍(例如自闭症和/或自闭症谱系障碍)的标志物，用于鉴定发展出广泛性发育障碍(例如自闭症和/或阿尔茨海默病)的倾向或风险，以及作为可用于开发广泛性发育障碍(例如自闭症和/或自闭症谱系障碍)的药物疗法的靶点。

总之，该实施例中使用的探寻式发现平台技术仅由数据驱动。基于AI的网络工程使得复杂的数据挖掘能够理解相互作用和因果关系。基于探寻式“组学”的平台可靠地推导出细胞情报。在本实施例中鉴定出的一些标志物之前被报道与自闭症相关这一事实证实了该平台技术是有效的，并且在该自闭症平台技术中采用的细胞模型提供了用于鉴定可用于自闭症谱系下诊断和患者分层的生物标志物的坚固的基础。基于AI的网络工程方法到平台技术中采用的数据挖掘作为推断因果关系的手段了产生可操作的生物智能。在图12-15中所示的对于自闭症的示例性自闭症因果关系相互作用网络鉴定出了几种新的生物标志物和潜在的自闭症治疗靶点。本文描述的探寻式发现平台技术使得人们对病理生理学有增强的理解，由此可以促进广泛性发育障碍(包括自闭症谱系障碍)的治疗和生物标志物的识别。

等同方案

在不使用超出常规实验的情况下，本领域技术人员会认识到或者能够确定许多与本文中描述的具体实施方案和方法等同的方案。这样的等同方案也涵盖在如本发明下述权利要求的范围中。

Claims

1.一种评估受试者是否患有广泛性发育障碍的方法，该方法包括：

(1)确定表2-6中所列的一种或多种标志物在从所述受试者获得的生物学样品中的表达水平，其中使用试剂转化该标志物以使该标志物可检测；

(2)将从受试者获得的生物学样品中所述一种或多种标志物的表达水平与对照样品中所述一种或多种标志物的表达水平进行比较；和

(3)评估受试者是否患有广泛性发育障碍，其中，在从受试者获得的生物学样品中所述一种或多种标志物的表达水平相对于对照样品中所述一种或多种标志物的表达水平的调节是所述受试者患有广泛性发育障碍的指示。

2.一种预测受试者是否倾向于发展出广泛性发育障碍的方法，该方法包括：

(1)确定表2-6中所列的一种或多种标志物在从受试者获得的生物学样品中的表达水平，其中使用试剂转化该标志物以使该标志物可检测；

(3)预测受试者是否倾向于发展出广泛性发育障碍，其中，在从受试者获得的生物学样品中所述一种或多种标志物的表达水平相对于对照样品中所述一种或多种标志物的表达水平的调节是所述受试者倾向于发展出广泛性发育障碍的指示。

3.一种预测受试者广泛性发育障碍的严重程度的方法，该方法包括：

(3)评估受试者的广泛性发育障碍的严重程度，其中，在从受试者获得的生物学样品中所述一种或多种标志物的表达水平相对于对照样品中所述一种或多种标志物的表达水平的调节是所述受试者的广泛性发育障碍严重程度的指示。

4.一种监测受试者中广泛性发育障碍或广泛性发育障碍症状的进展的方法，该方法包括：

(1)确定第一次从受试者获得的第一生物学样品中存在的表2-6中所列的一种或多种标志物的表达水平，其中使用试剂转化该标志物以使该标志物可检测；

(2)确定晚些时候第二次从受试者获得的第二生物学样品中存在的表2-6中所列的一种或多种标志物的表达水平，其中使用试剂转化该标志物以使该标志物可检测；

(3)将表2－6中列出的一种或多种标志物在第一次获自受试者的第一样品中的表达水平与所述一种或多种标志物在晚些时候第二次获自受试者的第二样品中的表达水平进行比较；以及

(4)监测广泛性发育障碍的进展，其中所述一种或多种标志物在第二样品中相比于在第一样品中的表达水平的调节是受试者广泛性发育障碍或广泛性发育障碍症状的进展的指示。

5.权利要求1-4中任一项所述的方法，还包括为被鉴定患有广泛性发育障碍的或易于发展出广泛性发育障碍的受试者选择治疗方案。

6.权利要求1-5任一项的方法，还包括向被鉴定患有广泛性发育障碍的或易于发展出广泛性发育障碍的受试者给药治疗方案。

7.权利要求4的方法，还包括向广泛性发育障碍的进展被确认为减少、延迟或减轻的受试者继续给药的持续治疗方案。

8.一种评估用于治疗受试者的广泛性发育障碍或广泛性发育障碍的症状的治疗方案的效果的方法，该方法包括：

(4)评估治疗方案对于治疗广泛性发育障碍或广泛性发育障碍的症状是否有效，其中一种或多种标志物在第二样品中的表达水平较之于在第一样品中的表达水平的调节是治疗方案对于治疗广泛性发育障碍或广泛性发育障碍的症状有效的指示。

9.权利要求8所述的方法，还包括向所述给药方案被确定为对于治疗广泛性发育障碍或广泛性发育障碍的症状有效的受试者连续给药该治疗方案，或者中止对所述给药方案被确定为对于治疗其广泛性发育障碍或广泛性发育障碍的症状无效的受试者给药该治疗方案。

10.一种鉴定用于治疗受试者的广泛性发育障碍或广泛性发育障碍的症状的化合物的方法，该方法包括：

(1)将生物学样品与测试化合物接触；

(2)确定一种或多种表2-6中所列的生物标志物存在于该生物学样品中的表达水平；

11.权利要求1-10任一项的方法，其中所述广泛性发育障碍是自闭症谱系障碍。

12.权利要求1-10任一项的方法，其中所述广泛性发育障碍是孤独症。

13.权利要求1-10任一项的方法，其中所述广泛性发育障碍是阿尔茨海默病。

14.权利要求1-10任一项的方法，其中所述广泛性发育障碍是自闭症和阿尔茨海默病。

15.权利要求1-10任一项的方法，其中所述广泛性发育障碍是艾斯伯格症候群。

16.权利要求1-10任一项的方法，其中所述广泛性发育障碍是广泛发育障碍非其他特定型。

17.权利要求1-10任一项的方法，其中所述受试者患有广泛性发育障碍。

18.权利要求1-10任一项的方法，其中所述受试者显示出广泛性发育障碍的亚综合表现。

19.权利要求1-10任一项的方法，其中所述受试者疑似患有或倾向于发展出广泛性发育障碍。

20.权利要求1-19任一项的方法，其中所述一种或多种标志物的表达水平在核酸水平上测定。

21.权利要求20的方法，其中所述一种或多种标志物的表达水平通过检测RNA确定。

22.权利要求20的方法，其中所述一种或多种标志物的表达水平通过检测mRNA、miRNA或hnRNA确定。

23.权利要求20的方法，其中所述一种或多种标志物的表达水平通过检测DNA确定。

24.权利要求20的方法，其中所述一种或多种标志物的表达水平通过检测cDNA确定。

25.权利要求20的方法，其中所述一种或多种标志物的表达水平通过使用选自聚合酶链式反应(PCR)扩增反应、反转录PCR分析、定量反转录PCR分析、免疫印迹分析、RNAase保护测定、数字RNA检测/定量，以及其组合或亚组合的技术确定。

26.权利要求20的方法，其中确定所述一种或多种标志物的表达水平包括采用抗体实施免疫测定。

27.权利要求1-19中任一项的方法，其中所述一种或多种标志物包括蛋白质。

28.权利要求27的方法，其中所述蛋白质使用结合所述一种或多种标志物中的至少一种的结合蛋白来测定。

29.权利要求27的方法，其中所述结合蛋白包括特异性结合至该蛋白的抗体或其抗原结合片段。

30.权利要求29的方法，其中所述抗体或其抗原结合片段选自鼠抗体、人抗体、人源化抗体、双特异性抗体、嵌合抗体、Fab、Fab’、F(ab’)₂、scFv、SMIP、亲和小体、avimer、versabody、纳体、域抗体、以及上述任一种的抗原结合片段。

31.权利要求29的方法，其中所述抗体或其抗原结合片段包括标记物。

32.权利要求31的方法，其中所述标记物选自放射标记物、生物素标记物、发色团、荧光团和酶。

33.权利要求1-32中任一项所述的方法，其中所述一种或多种标志物的表达水平通过使用选自如下的技术来确定：免疫测定、蛋白质印迹分析、放射免疫测定、免疫荧光测定、免疫沉淀、平衡透析、免疫扩散、电化学发光免疫测定法(ECLIA)、ELISA测定法、聚合酶链式反应、免疫聚合酶链式反应，以及它们的组合或它们的子组合。

34.权利要求33的方法，其中所述免疫测定包括基于溶液的免疫测定法，选自电化学发光、化学发光、荧光化学发光、荧光偏振、以及时间分辨荧光。

35.权利要求33的方法，其中所述免疫测定包括夹心免疫测定法，选自电化学发光，化学发光和荧光化学发光。

36.前述权利要求中任一项的方法，其中所述样品包括从受试者获得的体液或其组成部分。

37.权利要求36的方法，其中所述体液选自血液、血清、滑液、淋巴、血浆、尿液、羊水、房水、玻璃体液、胆汁、乳汁、脑脊髓液、耳垢、乳糜、囊液、淋巴液、粪便、胃酸、胃液、粘液、乳头吸出物、心包液、淋巴液、腹水、胸膜液、脓、唾液、皮脂、精液、汗水、血清、痰、泪液、阴道分泌物和从活检收集的体液。

38.前述权利要求中任一项的方法，其中所述样品包括从受试者获得的组织或细胞，或其组成部分。

39.一种治疗、减轻症状、抑制进展、或预防受试者的广泛性发育障碍的方法，该方法包括向有需要的受试者给药治疗有效量的包含表2-6中所列的一种或多种标志物的药物组合物。

40.一种治疗、减轻症状、抑制进展或预防受试者的广泛性发育障碍的方法，该方法包括向有需要的受试者给药治疗有效量的包含调节表2-6所列一种或多种标志物的表达或活性的药剂的药物组合物。

41.权利要求40的方法，其中所述药剂抑制表2-6中所列的一种或多种标志物的表达或活性。

42.权利要求40的方法，其中所述药剂增强表2-6中所列的一种或多种标志物的表达或活性。

43.一种鉴定调节表2-6中所列的一种或多种标志物的表达或活性的药剂的方法，包括：

(1)将一种或多种标志物与测试药剂接触，

(2)检测与测试药剂接触的所述一种或多种标志物的表达或活性，

(3)将所述一种或多种与测试药剂接触的标志物的表达或活性与未接触测试试剂对照的表达或活性相比较，以及

(4)鉴定出调节所述一种或多种标志物的表达或活性的试剂。

44.权利要求43的方法，其中所述药剂下调表2-6所列的一种或多种标志物中的至少一种。

45.权利要求44的方法，其中所述药剂上调表2-6所列的一种或多种标志物中的至少一种。

46.一种治疗、减轻症状、抑制进展或预防受试者的广泛性发育障碍的方法，该方法包括向有需要的受试者给药治疗有效量的包含根据权利要求43的方法鉴定出的药剂的药物组合物。

47.前述权利要求中任一项的方法，其中所述受试者是人类受试者。