CN102272327A

CN102272327A - 通过序列分析监测状况的方法

Info

Publication number: CN102272327A
Application number: CN2009801537567A
Authority: CN
Inventors: M·法哈姆; T·威利斯
Original assignee: Mlc Dx Inc
Current assignee: Adaptive Biotechnologies Corp; Sequenta Inc
Priority date: 2008-11-07
Filing date: 2009-11-09
Publication date: 2011-12-07
Anticipated expiration: 2029-11-09
Also published as: US9217176B2; US20110207617A1; GB2483810A; WO2010053587A3; ES2453066T3; GB201009641D0; US20130017957A1; US20180112278A1; US20190062848A1; JP5798926B2; US20160230236A1; GB2497007B; US9228232B2; CA2742380A1; EP2719774B8; GB2477439A; GB2477439B; US11001895B2; EP2364368B1; US8795970B2

Abstract

需要用于确定患病(包括自身免疫病和癌症)患者的诊断和预后的改进的方法。本发明提供利用DNA测序鉴别自身免疫病和其它疾病患者的个体化生物标志物的方法。鉴别的生物标志物可以用来确定患有自身免疫病或其它疾病的受试者的疾病状态。

Description

通过序列分析监测状况的方法

交叉参考

本申请要求2008年11月7日提交的美国专利申请No.61/112,693的优先权，该美国专利申请在此引入作为参考。

发明背景

免疫系统包括先天性和适应性免疫系统。先天性免疫系统包括利用一般方法识别外来病原体的细胞和机制。先天性免疫涉及的细胞包括中性白细胞、自然杀伤细胞、巨噬细胞、单核细胞、嗜酸性粒细胞、肥大细胞和树突细胞。这些细胞发挥吞噬作用以及释放许多可杀死侵入病原体的化学物质。另外，这些细胞参与先天性免疫防御机制，包括补体级联和炎症。最后，这些细胞中的一些参与在适应性免疫系统中起作用的抗原呈递过程。

适应性免疫系统发展为攻击它们的靶标上的特定特征。发生对特定靶标的一种应答给宿主提供了它的“记忆”，使其如果再一次出现则引发更强的应答。通常，任何蛋白质或多糖能够作为适应性免疫应答细胞的一些亚群或其产物的靶标，该产物识别靶标上的特异性表位。适应性免疫应答被分为两类：体液和细胞介导的免疫应答，B细胞和T细胞分别在这些应答中起特异性作用。

由于自身免疫病涉及适应性免疫系统的一些成分对自身靶标的识别，已经研究了适应性免疫系统的方面以帮助诊断和预后。已经使用标准免疫学技术，通过寻找循环自身抗体研究了体液免疫系统。自身抗体如抗核、抗dsDNA和类风湿因子，已经对几种疾病进行了鉴别。这些抗体本身可能不是致病性的，它们在体内识别的靶标也不必然与在体外检测的相同；然而，这些水平的测定有助于诊断，并且在有些情况下具有一定的预后和治疗意义。

研究自身免疫病中的适应性免疫系统的另外一种方法是基于对适应性免疫细胞的多样性的分析。适应性免疫细胞的激活导致它们的克隆扩增。这一克隆扩增的证据通常通过从血液RNA或DNA扩增编码抗原识别区的核酸序列的部分来获得。例如，扩增具有T细胞受体β链(类似于抗体重链)的特异性V区段的序列的PCR引物用来扩增连接至特定V区段的J区段或J和D区段。当存在多样的细胞群时，预期扩增片段，具有大小略微不同的扩增子的分布，但是克隆扩增导致特定大小被富集，因此在凝胶上显示为更强的带。在被称为谱型分析(spectratyping)的技术中，每个V区段与J和D区段一起扩增，以评估这些扩增子中的任一种是否显示克隆扩增。

谱型分析方法的一个问题是许多不同的序列可能具有相同的长度，因此无法区分。因此，该技术只能分辨出显著的克隆扩增。需要改进诊断和帮助自身免疫病预后和自身免疫疾病状态以及免疫系统起中心作用的其它疾病的方法。

尽管在对免疫系统进行谱型分析中另外的特异性在允许更好地预测它对人类健康的影响方面具有重要的应用，如果开发了允许鉴别疾病过程涉及的特定T和B细胞的方法，即使这些特定序列以前从未被观察到，仍将具有更大的应用。免疫系统的巨大多样性提供了潜在有用的细胞的巨大储备，而且对试图使用该所有组成成分用于预测目的的研究人员提出了挑战。针对抗原的任何单序列是可能涉及特定个体中的疾病过程和/或与之相关的大量序列之一。鉴别特定个体中的许多细胞中的哪些与疾病过程相关的方法对于人类健康是特别有价值的。

发明内容

在一个方面，提供了一种确定T细胞和/或B细胞中的重组(recombined)DNA序列谱的方法，包括：从受试者获得包含T细胞和/或B细胞的样品，从所述细胞空间上分离基因组DNA的个体分子；对所述空间上分离的基因组DNA的个体分子进行测序，和确定来自所述样品的不同序列的水平，以产生所述重组DNA序列谱。

在另一方面，提供了一种确定T细胞和/或B细胞中的重组DNA序列谱的方法，包括：从受试者获得包含T细胞和/或B细胞的样品，从所述细胞空间上分离基因组DNA的个体分子，扩增所述基因组DNA的个体分子，对所述扩增的DNA进行测序，以及确定来自所述样品的不同序列的水平，以产生所述重组DNA序列谱。

在另一方面，提供了一种确定T细胞和/或B细胞中的重组DNA序列谱的方法，包括：从受试者获得包含T细胞和/或B细胞的样品，从所述细胞扩增基因组DNA，空间上分离所述扩增的DNA的个体分子，对所述空间上分离的扩增DNA的个体分子进行测序，以及确定来自所述样品的不同序列的水平，以产生所述重组DNA序列谱。

在另一方面，提供了一种确定T细胞和/或B细胞中的重组DNA序列谱的方法，包括：从受试者获得包含T细胞和/或B细胞的样品，从所述细胞扩增基因组DNA，空间上分离所述扩增的DNA的个体分子，再扩增所述扩增的DNA分子，对所述再扩增的DNA分子进行测序，以及确定来自所述样品的不同序列的水平，以产生所述重组DNA序列谱。

在另一方面，提供了一种确定T细胞和/或B细胞中的序列谱的方法，包括：从受试者获得包含T细胞和/或B细胞的样品，逆转录来自所述细胞的RNA以形成cDNA，空间上分离所述cDNA的个体分子，任选地再扩增所述空间上分离的个体cDNA的个体分子，对所述cDNA和/或再扩增的cDNA进行测序；以及确定来自所述样品的不同序列的水平，以产生所述重组DNA序列谱。

在另一方面，提供了一种确定T细胞和/或B细胞中的重组DNA序列谱的方法，包括：从受试者获得包含T细胞和/或B细胞的样品；空间上分离所述样品中的个体细胞，对来自所述细胞的个体核酸分子进行测序；以及确定来自所述样品的不同序列的水平，以产生所述重组DNA序列谱。

在一个实施方案中，所述扩增和/或再扩增包括PCR、多重PCR、TMA、NASBA或LAMP。在另一实施方案中，所述空间上分离包括在用来转化细菌的载体中亚克隆所述DNA或cDNA，在固体支持体上两维地分离所述DNA或cDNA，在含有微团的溶液中三维地分离所述DNA或cDNA，或利用微反应室分离分子。在另一实施方案中，所述扩增和/或再扩增是通过携带亚克隆的DNA或cDNA的细菌的生长，DNA或cDNA在载玻片上的扩增，或DNA或cDNA在珠上的扩增。

在另一实施方案中，所述测序包括双脱氧测序。在另一实施方案中，所述测序包括利用可逆终止的标记核苷酸进行合成测序。在另一实施方案中，所述测序包括检测核苷酸掺入的焦磷酸释放。在另一实施方案中，所述测序包括与标记寡核苷酸探针文库的等位基因特异性杂交。在另一实施方案中，所述测序包括合成测序，该合成测序利用与标记寡核苷酸探针文库的等位基因特异性杂交，随后连接所述探针。在另一实施方案中，所述测序包括实时监测聚合步骤过程中标记核苷酸的引入。

在另一实施方案中，所述重组DNA序列包含T细胞受体基因和/或免疫球蛋白基因。在另一实施方案中，所述测序包括对免疫球蛋白和/或T细胞受体基因的全克隆序列的亚群进行测序。

在另一实施方案中，所述全克隆序列的亚群包括免疫球蛋白或T细胞受体基因的V-D连接、D-J连接、免疫球蛋白或T细胞受体基因的完整可变区、抗原识别区、或互补决定区3(CDR3)。在另一实施方案中，所述T细胞受体基因包含T细胞受体β基因。在另一实施方案中，所述免疫球蛋白基因包含免疫球蛋白重链基因。在另一实施方案中，所述扩增或再扩增包含多条互补于V区段的引物和一条互补于C区段的引物。在另一实施方案中，所述扩增或再扩增包含多条互补于V区段的引物和多条互补于C区段的引物。

在另一实施方案中，所述多条互补于V区段的引物包含对于各V区段的至少三条不同的引物，所述多条互补于C区段的引物包含至少1、至少2、至少3、至少4、至少5或至少6条引物。

在另一实施方案中，所述T或B细胞是总T和B细胞的亚群。在另一实施方案中，所述T细胞的亚群是CD4+，CD8+细胞或CD27^高细胞。在另一实施方案中，所述样品包含至少100,000个、至少500,000个、至少750,000个或至少1,000,000个T细胞。

在另一实施方案中，所述测序包括至少1000阅读/运行、至少10,000阅读/运行、至少100,000阅读/运行或至少1,000,000阅读/运行。在另一实施方案中，所述测序包括每阅读产生约30bp、约40bp、约50bp、约60bp、约70bp、约80bp、约90bp、约100bp、约110或约120bp。

在另一实施方案中，当受试者处于自身免疫病的发作状态(flarestate)时采集所述样品。在另一实施方案中，从患有或怀疑患有系统性红斑狼疮的受试者采集所述样品。

在另一方面，提供了一种确定受试者的一个或多个相关克隆型的方法，包括：通过对来自受试者的至少一个样品的个体、空间上分离的分子进行核酸测序产生一个或多个克隆型谱，其中所述至少一个样品与疾病的第一状态有关，以及基于所述一个或多个克隆型谱确定受试者中的一个或多个相关克隆型。

在一个实施方案中，所述至少一个样品来自受疾病影响的组织。在另一实施方案中，所述一个或多个相关克隆型的确定包括比较来自至少两个样品的克隆型谱。

在另一实施方案中，疾病的第一状态是疾病的高峰状态。在另一实施方案中，所述一个或多个相关克隆型存在于疾病的高峰状态。在另一实施方案中，所述一个或多个相关克隆型在疾病的高峰状态不存在。在另一实施方案中，所述一个或多个相关克隆型在疾病的高峰状态时高。在另一实施方案中，所述一个或多个相关克隆型在疾病的高峰状态时低。

在另一实施方案中，所述样品包含T细胞和/或B细胞。在另一实施方案中，所述T细胞和/或B细胞包含T细胞和/或B细胞的亚群。在另一实施方案中，所述T细胞和/或B细胞的亚群通过与标志物相互作用而富集。在另一实施方案中，所述标志物是T细胞和/或B细胞的亚群上的细胞表面标志物。在另一实施方案中，所述T细胞和/或B细胞的亚群与特异性存在于疾病中的抗原相互作用。

在另一实施方案中，所述疾病是系统性红斑狼疮或多发性硬化。

在另一方面，提供了一种开发算法的方法，该算法能够预测来自患病受试者的任何样品中的一个或多个相关克隆型，该方法包括：a)从一组样品产生多个克隆型谱，其中该样品与所述疾病有关，b)从这组样品鉴别一个或多个相关克隆型，c)利用来自b)中鉴别的一个或多个相关克隆型的序列参数和/或功能数据来开发能够预测来自患病受试者的任何样品中的相关克隆型的算法。

在一个实施方案中，这组样品获自一个或多个受疾病影响的组织。

在另一实施方案中，所述一个或多个相关克隆型的鉴别包括比较来自至少两个样品的克隆型谱。

在另一实施方案中，所述功能数据包括T细胞和/或B细胞表面上的标志物的结合能力或T细胞或B细胞与抗原的相互作用。

在另一实施方案中，所述序列参数包括核酸序列和预测的氨基酸序列。

在另一实施方案中，样品来自一个或多个处于疾病高峰期的个体。在另一实施方案中，所述一个或多个相关克隆型在疾病的高峰状态时存在。在另一实施方案中，所述一个或多个相关克隆型在疾病的高峰状态处于高水平。在另一实施方案中，所述一个或多个相关克隆型在疾病的高峰状态处于低水平。在另一实施方案中，一个或多个相关克隆型在疾病的高峰状态时不存在。在另一实施方案中，所述疾病是系统性红斑狼疮或多发性硬化。

在另一实施方案中，提供了一种发现个体的一个或多个相关克隆型的方法，该方法包括：将来自个体样品的克隆型谱输入一种算法，并利用该算法确定个体的一个或多个相关克隆型。在一个实施方案中，所述算法是能够预测来自患病受试者的任何样品中的一个或多个相关克隆型的算法，包括通过以下方式开发所述算法：a)从一组样品产生多个克隆型谱，其中该样品与所述疾病有关，b)从这组样品鉴别一个或多个相关克隆型，c)利用b)中鉴别的一个或多个相关克隆型的序列参数和/或功能数据来开发能够预测患病受试者的任何样品中的相关克隆型的算法。

在一个实施方案中，所述样品在疾病的高峰状态时获得。在另一实施方案中，样品取自受疾病影响的组织。

在另一方面，提供了产生计算疾病活动性得分的算法的方法，包括：开发使用一组因素将相关克隆型水平组合为疾病活动性得分的算法，比较该疾病活动性得分与关于疾病状态的临床数据，以及优化该因素，以最大化临床数据与疾病活动性得分之间的相关性。

在一个实施方案中，提供了监测个体疾病状态的方法，包括：a)从来自个体的样品确定克隆型谱，b)将来自a)的克隆型谱信息输入到计算疾病活动性得分的算法中，其中，该算法是如下产生的：开发使用一组因子将相关克隆型水平组合为疾病活动性得分的算法，比较疾病活动性得分与关于疾病状态的临床数据，以及优化所述因子以最大化临床数据与疾病活动性得分之间的相关性，和c)使用计算疾病活动性得分的算法产生预示个体疾病状态的得分。

在另一实施方案中，监测个体疾病状态的方法还包括确定个体中的一个或多个相关克隆型，并将一个或多个相关克隆型信息输入到一种算法中。

在另一实施方案中，所述确定个体中的一个或多个相关克隆型包括：a)通过对来自受试者的至少一个样品的空间上分离的个体分子进行核酸测序，产生一个或多个克隆型谱，其中所述至少一个样品与疾病的第一状态相关，和b)基于一个或多个克隆型谱确定受试者中的一个或多个相关克隆型。

在另一实施方案中，所述确定个体中的一个或多个相关克隆型包括：a)将来自个体样品的克隆型谱输入到能够预测一个或多个相关克隆型的算法中，其中所述能够预测一个或多个相关克隆型的算法是通过以下方式开发的：i)从一组样品产生多个克隆型谱，其中该样品与所述疾病有关，ii)从这组样品鉴别一个或多个相关克隆型，iii)利用ii)中鉴别的一个或多个相关克隆型的序列参数和/或功能数据来开发能够预测患病受试者的任何样品中的相关克隆型的算法，和c)利用能够预测一个或多个相关克隆型的算法来确定该个体的一个或多个相关克隆型。

参考引用

本说明书中提到的所有出版物、专利和专利申请都在此引入作为参考，如同每个单独的出版物、专利或专利申请具体且分别地引入作为参考。

附图说明

本发明的新特征在所附权利要求书中详细阐明。通过参考以下说明应用本发明原理的示例性实施方案的详述和附图，可以更好地理解本发明的特征和优点，在附图中：

图1是本发明用于确定克隆型谱的方法的一个实施方案的流程图。

图2显示用于扩增TCRβ基因的PCR方案。

图3显示使用图2中的方案扩增的待测序的PCR产物。

图4A和4B说明用于扩增同种型序列的PCR方案。

图5说明多重扩增的可重复性。

图6说明多重扩增具有最小的扩增偏性。

图7说明IgH序列的多重扩增的琼脂糖凝胶电泳。

图8A显示使用Accuprime和作为输入模板的对应于500ng RNA的cDNA，两个重复样品中每个克隆型的频率的log₁₀。

图8B显示使用作为输入模板的对应于500ng RNA的cDNA和Accuprime(X轴)或高保真Taq(Y轴)，每个克隆型的频率的log₁₀。

图8C显示使用作为输入模板的对应于50ng RNA的cDNA和Accuprime(X轴)或高保真Taq(Y轴)，每个克隆型的频率的log₁₀。

说明通过发现研究确定算法的流程图。

图9说明在扩增反应中连接两个序列以形成一个扩增子的方案的一个实施方案。关于同一样品(例如细胞)中存在这两个序列的信息然后可以保留，即使它们与来自其它样品的一组序列混合。

图10说明连接两个序列的扩增方案的另一实施方案。

图11说明连接两个序列的扩增方案的另一实施方案。

图12A和12B说明使通过PCR连接两个序列的反应多重化的方案。

图13A-13D说明将三个序列连接在一起的方案。

图14说明使用校准试验发现相关克隆型的流程图。

图15说明使用群体研究发现相关克隆型的流程图。

图16说明使用群体研究和校准试验发现相关克隆型的流程图。

图17说明能够预测样品中的相关克隆型的算法。

图18说明产生用于计算免疫负荷(Immune Load)的监测算法的流程图。

图19说明进行监测试验而不进行校准试验的流程图。

图20说明进行采用校准试验的监测试验的流程图。

发明详述

概述

总体上，本发明包括将核酸测序技术应用于监测适应性免疫细胞的所有组成成分(repertoire)的任务以对免疫系统进行谱分析(profiling)的方法。产生的免疫系统的谱(profile)可用于诊断疾病和紊乱，以及用于诊断疾病和紊乱的状态。本发明的免疫谱分析方法可以用于监测疾病和紊乱和评价疾病和紊乱的治疗。可以应用本发明的方法的这些疾病和紊乱包括自身免疫病，包括系统性红斑狼疮(SLE)、多发性硬化(MS)、类风湿性关节炎(RA)和强直性脊柱炎。本发明的方法可以用于诊断、监视和治疗移植排斥和免疫老化。此外，本发明的免疫谱型分析方法可以用于诊断、监视和治疗其它与免疫系统相关的疾病，包括癌症和传染病。

对扩增的个体分子进行测序可以区分不同的序列，因此具有检测克隆扩增的量变的灵敏性。总体上，在本发明的一个实施方案中，提供了确定T细胞和/或B细胞中的重组DNA序列谱的方法。该方法可以包括以下步骤：从受试者分离样品，一轮或多轮核酸扩增，空间上分离个体核酸，和对核酸进行测序。核酸可以是DNA或RNA。T细胞和/或B细胞中的重组DNA序列可以被称为克隆型(clonotype)。

在一个方面，提供了确定受试者或个体中的一个或多个相关克隆型的方法。在另一方面，提供了开发能够预测来自患病受试者的任何样品中的一个或多个相关克隆型的算法的方法。在另一方面，提供了使用能够预测来自受试者的任何样品中的一个或多个相关克隆型的算法发现个体的一个或多个相关克隆型的方法。在另一方面，提供了产生计算疾病活动性得分的算法的方法。在另一方面，提供了监测个体的疾病状态的方法。

I.确定克隆型谱的方法

A.概述

本发明的方法可以用来产生来自受试者的样品中的重组DNA序列谱或克隆型。

在一个实施方案中，提供了一种确定T细胞和/或B细胞中的重组DNA序列谱的方法，包括从受试者获得包含T细胞和/或B细胞的样品，从所述细胞分离基因组DNA的个体分子，对分离的基因组DNA的个体分子进行测序，以及确定来自该样品的不同序列的水平，以产生所述重组DNA序列谱。

在另一实施方案中，提供了一种确定T细胞和/或B细胞中的重组DNA序列谱的方法，包括：从受试者获得包含T细胞和/或B细胞的样品，从所述细胞分离基因组DNA的个体分子，扩增所述基因组DNA的个体分子，对所述扩增的DNA进行测序，以及确定来自所述样品的不同序列的水平，以产生所述重组DNA序列谱。

在另一实施方案中，提供了一种确定T细胞和/或B细胞中的重组DNA序列谱的方法，包括：从受试者获得包含T细胞和/或B细胞的样品，从所述细胞扩增基因组DNA，分离所述扩增的DNA的个体分子，对所述分离的扩增DNA的个体分子进行测序，以及确定来自所述样品的不同序列的水平，以产生所述重组DNA序列谱。

在另一实施方案中，提供了一种确定T细胞和/或B细胞中的重组DNA序列谱的方法，包括：从受试者获得包含T细胞和/或B细胞的样品，从所述细胞扩增基因组DNA，分离所述扩增的DNA的个体分子，再扩增所述扩增的DNA分子，对所述再扩增的DNA分子进行测序，以及确定来自所述样品的不同序列的水平，以产生所述重组DNA序列谱。

在另一实施方案中，提供了一种确定T细胞和/或B细胞中的重组DNA序列谱的方法，包括：从受试者获得包含T细胞和/或B细胞的样品，从所述样品分离RNA，逆转录来自所述细胞的RNA以形成cDNA，分离所述cDNA的个体分子，任选地再扩增所述cDNA，对所述cDNA或再扩增的DNA的所述分离的个体分子进行测序，以及确定来自所述样品的不同序列的水平，以产生所述重组DNA序列谱。

在另一实施方案中，提供了一种确定T细胞和/或B细胞中的重组DNA序列谱的方法，包括：从受试者获得包含T细胞和/或B细胞的样品，从所述样品分离RNA的个体分子，对RNA的个体分子进行测序，以及确定来自所述样品的不同序列的水平，以产生所述重组DNA序列谱。

B.受试者和样品

1.受试者

本发明的方法可以使用来自受试者或个体(例如患者)的样品。受试者可以是患者，例如，自身免疫病患者。受试者可以是传染病或癌症患者。受试者可以是哺乳动物，例如，人类。受试者可以是雄性或雌性。受试者可以是婴儿、儿童或成人。

2.样品

本发明的方法中使用的样品可包括，例如，来自受试者的体液，包括围绕胎儿的羊水、眼房水、胆汁、血液和血浆、耵聍(耳垢)、Cowper液或射精前液、乳糜、食糜、女性喷射液、间隙液、淋巴、月经、乳汁、粘液(包括鼻涕和痰)、胸水、脓、唾液、皮脂(皮油)、精液、血清、汗、泪、尿、阴道润滑液、呕吐物、水、粪便、内体液，包括脑和脊髓周围的脑脊液，骨关节周围的滑液，细胞内液是细胞内的流体，和玻璃体液，即眼球内的流体。在一个实施方案中，样品是血液样品。血液样品可以是大约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5或5.0mL。当受试者患有多发性硬化时，样品可以是脑脊液(CSF)，当受试者患有类风湿性关节炎时，样品可以是滑液，当受试者患有系统性红斑狼疮时，样品可以是皮肤(或其它器官)活检组织。在一个实施方案中，可以从可获得的最可能反映病理学的体液/组织确定克隆型，随后监测构成不同体液例如血液的克隆型的水平。

样品可以在疾病不活动时分析。

样品可以由卫生人员获得，例如，内科医生、医生助理、护士、兽医师、皮肤科医生、风湿科医生、牙科医生、急救医士或外科医生。样品可以由研究技术员获得。可以获得一种以上的来自受试者的样品。

样品可以是活检组织，例如，皮肤活检组织。活检组织可以来自，例如，脑、肝、肺、心脏、结肠、肾或骨髓。本领域技术人员使用的任何活检技术都可以用于从受试者分离样品。例如，活检可以是开放活检，其中使用全身麻醉。活检可以是闭合活检，其中形成比切开活检更小的切口。活检可以是中心活检或切开活检，其中切除组织的一部分。活检可以是切除活检，其中试图切除整个病变(lesion)。活检可以是细针抽吸活检，其中用针头移除组织或流体样品。

样品可以包括免疫细胞。免疫细胞可以包括T细胞和/或B细胞。T细胞(T淋巴细胞)包括，例如，表达T细胞受体的细胞。T细胞包括辅助T细胞(效应T细胞或Th细胞)、细胞毒性T细胞(CTL)、记忆T细胞和调节性T细胞。样品在某些应用(例如，定义相关T细胞的校准试验)中可以包括单个细胞，或者更通常至少1,000个、至少10,000个、至少100,000个、至少250,000个、至少500,000个、至少750,000个或至少1,000,000个T细胞。

B细胞包括，例如，血浆B细胞、记忆B细胞、B1细胞、B2细胞、边缘区B细胞和滤泡B细胞。B细胞能够表达免疫球蛋白(抗体、B细胞受体)。样品在某些应用(例如，定义相关B细胞的校准试验)中可以包括单个细胞，或者更通常至少1,000个、至少10,000个、至少100,000个、至少250,000个、至少500,000个、至少750,000个或至少1,000,000个B细胞。

样品可以包括核酸，例如，DNA(例如，基因组DNA或线粒体DNA)或RNA(例如，信使RNA或微RNA)。核酸可以是不含细胞的DNA或RNA。在本发明的方法中，来自可以被分析的受试者的RNA或DNA的量包括，例如，在某些应用(例如，校准试验)中低至单个细胞，以及多至1000万个细胞或更多，转化为6pg-60ug范围的DNA，和大约1pg-10ug的RNA。

C.分离、扩增和再扩增核酸的方法

1.TCR和BCR基因的特征

由于鉴别的重组存在于每个个体适应性免疫细胞的DNA以及它们的相关RNA转录物中，RNA或DNA可以用本发明的方法测序。来自T细胞或B细胞的重组序列也可以被称为克隆型。DNA或RNA可能对应于来自T细胞受体(TCR)基因或编码抗体的免疫球蛋白(Ig)基因的序列。例如，DNA和RNA可能对应于编码TCR的α、β、γ或δ链的序列。在大多数T细胞中，TCR是由α-链和β-链组成的异二聚体。TCRα链通过VJ重组产生，β链受体通过V(D)J重组产生。对于TCRβ链，在人类中有48个V区段、2个D区段和13个J区段。几个碱基可能缺失，另外一些可以在两个连接的每一个处添加(称为N和P核苷酸)。在大多数T细胞中，TCR由γ和δdelta链组成。TCRγ链通过VJ重组产生，TCRδ链通过V(D)J重组产生(Kenneth Murphy，Paul Travers，和MarkWalport，Janeway’s Immunology 7th edition，Garl和Science，2007，在此引入作为参考)。

在本发明的方法中分析的DNA和RNA可对应于编码具有恒定区(α，δ，ε，γ或μ)的重链免疫球蛋白(IgH)或具有恒定区λ或κ的轻链免疫球蛋白(IgK或IgL)的序列。每个抗体具有两个相同的轻链和两个相同的重链。每条链由恒定区(C)和可变区组成。对于重链，可变区由可变区段(V)、多样性区段(D)和连接(J)区段组成。基因组中存在几种不同的编码这些区段的每个类型的序列。特定VDJ重组事件在B细胞发育过程中发生，标记该细胞，产生特异性重链。轻链中的多样性以类似的方式产生，除了没有D区因此只存在VJ重组以外。体细胞突变通常靠近重组位点发生，引起几个核苷酸的添加或缺失，进一步提高了B细胞产生的重链和轻链的多样性。B细胞产生的抗体的可能的多样性因此是不同重链和轻链的产物。重链和轻链的可变区贡献形成抗原识别(或结合)区或位点。向该多样性中增加体细胞超突变过程，该过程可能在发生针对某些表位的特异性应答后发生。在该过程中，在能够识别特定表位的那些B细胞中发生突变，导致在可能能够更强地结合特定表位的抗体中具有较大的多样性。所有这些因素都对B细胞产生的抗体的丰富多样性具有贡献。可能产生几十亿种，也许超过万亿种不同的抗体。产生T细胞多样性的基本前提类似于B细胞产生抗体的前提。T细胞和B细胞活化的成分是它们与外来表位的结合。特定细胞的活化导致产生更多相同类型的细胞，导致克隆扩增。

互补决定区(CDR)或超可变区是能够与抗原互补的抗原受体(例如，T细胞受体和免疫球蛋白)的可变域中的序列。每个抗原受体的链含有三个CDR(CDR1、CDR2和CDR3)。形成T细胞(α和β)和免疫球蛋白(IgH和IgK或IgL)的两个多肽贡献了三个CDR的形成。

由TCRβ编码的CDR1和CDR2的部分位于47个功能性V区段之一内。CDR的大部分多样性在CDR3中发现，多样性在T淋巴细胞发育过程中通过体细胞重组事件产生。

在个体之间和个体之内存在多种多样的BCR。BCR由编码抗体重链和轻链的两个基因IgH和IgK(或IgL)组成。结合抗原和MHC分子的三个互补决定区(CDR)序列在IgH和IgK(或IgL)中具有最高的多样性。由IgH编码的CDR1和CDR2的部分位于44个功能性V区段之一内。幼稚B细胞中的大部分多样性通过B淋巴细胞发育过程中的体细胞重组事件在CDR3产生中出现。重组可以产生具有V、D和J区段各一个的分子。在人类中，存在44个V区段、27个D区段和6个J区段；因此，理论上存在超过7,000种组合的可能性。在小部分BCR(约5％)中，发现了两个D区段。此外，几个碱基可能缺失，其它几个可能在两个连接的每一个处添加(称为N和P核苷酸)，产生高度的多样性。在B细胞激活后，发生通过体细胞超突变的亲和力成熟过程。在该过程中，激活的B细胞的后代细胞在整个基因中积累不同的体细胞突变，在CDR区具有较高的突变浓度，导致产生对抗原具有较高亲和力的抗体。因此，多个引物可以用来在体细胞超突变后扩增序列。除了体细胞超突变以外，激活的B细胞经历同种异型转换过程。具有相同可变区段的抗体取决于恒定区段可能具有不同的形式(同种型)。所有幼稚B细胞表达IgM(或IgD)，而激活的B细胞主要表达IgG，但也表达IgM、IgA和IgE。这种从IgM(和/或IgD)到IgG、IgA或IgE的表达转换通过重组事件发生，导致一种细胞专门产生特定的同种型。IgM、IgD和IgE各有一个区段，IgA有两个区段，IgG有四个区段。

2.扩增反应

聚合酶链反应(PCR)能够用来从细胞集合扩增相关区域。转录介导的扩增(TMA)可以用来从靶核酸产生RNA扩增子。来自每个细胞的核酸可以分别分析，因为每个细胞携带其自身独特的特征标志(signature)。

TCRβ或免疫球蛋白序列可以在使用至少一条与C区退火的引物和一条或多条与一个或多个V区段退火的引物的多重反应中从核酸扩增(图2和图4)。在多重反应中与V区段退火的引物数可以是，例如，至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79或80。在多重反应中与V区段退火的引物数可以是，例如，10-60、20-50、30-50、40-50、20-40、30-40或35-40。引物可以与不同的V区段退火。对于IgH基因，由于V区段中体细胞突变的可能性，可以使用多条与各V区段退火的引物；例如，每个V区段1、2、3、4或5条引物。在多重反应中与C区段退火的引物数可以包括，例如，至少1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在多重反应中与C区段退火的引物数可以是1-10、2-9、3-8、4-7、3-8或3-6。TCR或免疫球蛋白基因的扩增可以如实施例3和/或实施例4所述发生。

将要扩增的区域可包括完全克隆序列或克隆序列的一部分，包括免疫球蛋白或T细胞受体基因的V-D连接、D-J连接，免疫球蛋白或T细胞受体基因的完全可变区，抗原识别区，或CDR，例如，互补决定区3(CDR3)。

TCR或免疫球蛋白序列可以利用第一和第二扩增步骤扩增。不同扩增步骤各自可包括不同的引物。不同的引物可引入在免疫基因序列中原始不存在的序列。例如，扩增过程可以向扩增的TCR或免疫球蛋白序列的5’和/或3’末端添加一个或多个标签(图3)。标签可以是便于扩增DNA的后续测序的序列。标签可以是促进扩增序列与固体支持体结合的序列。

其它扩增方法可以不使用V区中的任何引物。而是可能使用来自C区段的特异性引物，另一端(5’)可以使用通用引物。通用引物可以通过不同方法，包括充分描述的链转换方法，在cDNA合成中附加。类似地，通用引物可以通过包括连接在内的不同的方法附加在cDNA后。

本发明方法中可以使用的其它核酸扩增手段包括，例如，反转录PCR、实时PCR、定量实时PCR、数字PCR(dPCR)、数字乳液PCR(dePCR)、克隆PCR、扩增片段长度多态性PCR(AFLP PCR)、等位基因特异性PCR、装配PCR、不对称PCR(其中为选择的链使用极大过量的引物)、菌落PCR、解旋酶依赖的扩增(HDA)、热启动PCR、反转PCR(IPCR)、原位PCR、长PCR(大于大约5千碱基的DNA的延伸)、多重PCR、巢式PCR(使用一对以上的引物)、单细胞PCR、降落PCR、环介导的等温PCR(LAMP)和基于核酸序列的扩增(NASBA)。其它扩增方案包括：连接酶链反应、Branch DNA扩增、滚环扩增、环到环(Circle to Circle)扩增、SPIA扩增、通过捕获和连接的靶标扩增(TACL)扩增和RACE扩增。

样品中的RNA信息可以通过利用逆转录转化为cDNA。逆转录反应中可以使用PolyA引物、随机引物和/或基因特异性引物。

从基因组扩增DNA(或通过逆转录RNA扩增cDNA形式的核酸)后，各核酸分子可以被分离，任选地再扩增，然后分别测序。

可以在本发明的方法中用于扩增的聚合酶包括，例如，Taq聚合酶、AccuPrime聚合酶或Pfu。使用的聚合酶的选择可以基于是优选保真度还是效率。

在一个实施方案中，分离样品中的个体细胞。来自每个分离的细胞的两个或多个序列可以连接在一起。例如，来自个体细胞的TCRα和TCRβ基因或IgH和IgK基因的序列可以例如通过扩增方案(图9-13)或连接方案连接。对于分离的细胞，连接的TCRα和TCRβ或IgH和IgK序列可以任选地再扩增。连接的扩增产物可以任选地在扩增后再合并。

3.分离个体核酸的方法

从集合体分离核酸的方法包括将核酸亚克隆到DNA载体中，并转化细菌(细菌克隆)，在固体物质(例如，载玻片)上以两维方式空间上分离该分子，在含微团的溶液中以三维方式空间上分离该分子(如可以使用油乳剂实现，在固体表面如珠上固定分子或不固定分子)，或者使用微反应室，例如，在微流体或纳米液体芯片中。可以利用稀释确保在给定体积、空间区域、珠或反应室中平均存在一个分子。

实时PCR、picogreen染色、纳米流体电泳(例如LabChip)或UV吸光度测量可以在开始的步骤中使用，以判断可扩增材料的功能量。

重新扩增核酸的方法包括分离的用核酸转化的菌落的细菌生长，在载玻片上扩增(例如，PCR群落(polonies))，和在珠上扩增。可以利用相同的方法扩增和重新扩增核酸，或者可以利用不同的方法扩增和重新扩增核酸。

在某些实施方案中，亚克隆步骤包括通过扩增或连接步骤将通用引物附着到DNA或RNA上的步骤。然后利用该引物扩增所述克隆并作为引物杂交识别序列用于测序(图2)。

在其它实施方案中，从细胞亚群分析核酸。可以使用分离细胞的方法，例如通过使用细胞表面标志物。例如，细胞可以通过细胞分选流式细胞术、流动分选、荧光激活细胞分选(FACS)、基于珠的分离如磁性细胞分选(MACS；例如，使用抗体包被的磁性颗粒)、基于大小的分离(例如，筛，障碍阵列，或过滤器)、在微流装置中的分选、基于抗体的分离、沉降、亲和力吸附、亲和提取或密度梯度离心来分离。细胞可以通过激光捕获显微切割纯化。分选可以基于细胞大小、形态学或细胞内或细胞外标志。分离或分选肿瘤细胞的方法例如记载在Nagrath S.等人.(2007)Nature 450：1235-1239；美国专利Nos.6008002，7232653和7332288；PCT公布No.WO2008157220A1；和美国专利申请Nos.US20080138805A1和US20090186065；和Rosenberg R.等人.(2002)Cytometry 49：150-158，每篇文献均在此全文引入作为参考。

细胞亚群可以是T细胞和/或B细胞亚群。T细胞亚群可以是CD4+、CD8+或CD27^高细胞。

荧光激活细胞分选(FACS)利用光散射和荧光特征来分选细胞。例如利用核酸探针或偶联至荧光染料的抗体可以将荧光性质赋予细胞。细胞悬浮液可以形成流动液体流。细胞流形成液滴，每滴含有大约一个细胞。在液流形成液滴前，测量每个细胞的荧光特征。在荧光强度测量前将电荷置于电荷环上，相反的电荷由从液流破裂的液滴携带。带电荷的液滴通过两个高压偏转板，所述高压偏转板使液滴基于它们的电荷转向到不同容器中。电荷可以直接施加到淮流上，破裂的滴保持与液流相同指标的电荷。该液流然后在液滴破裂后恢复中性。

FACS中可以使用直接或间接免疫荧光。在直接免疫荧光中，抗体直接偶联到荧光染料上。在间接免疫荧光中，第一抗体是未标记的，第二抗体偶联到荧光染料上。

在一个实施方案中，来自样品的个体细胞可以被分离。来自细胞中两个基因的序列信息可以连接在一起。例如，样品可以来自自身免疫病患者，来自样品的空间上分离细胞的TCRα和TCRβ基因的序列信息可以通过例如扩增方案或连接方案物理连接在一起。连接的TCRα和TCRβ序列可以任选地被扩增和/或与来自其它细胞的连接的序列合并。连接的序列可替代地可以用于IgH和IgK或用于IgH和IgL。

C.测序技术

本领域技术人员已知的任何核酸测序技术可以在本发明的方法中使用。DNA测序技术包括使用标记的终止剂或引物和在板或毛细管中凝胶分离的经典双脱氧测序反应(Sanger法)，使用可逆终止的标记核苷酸的合成测序，焦磷酸测序，454测序，与标记寡核苷酸探针文库的等位基因特异性杂交，使用与标记克隆文库的等位基因特异性杂交随后进行连接的合成测序，在聚合步骤过程中掺入标记的核苷酸的实时监测，聚合酶群落测序，和SOLiD测序。分离的分子的测序最近已经通过使用聚合酶或连接酶的连续或单延伸反应以及通过与探针文库的单或连续差异杂交得到证实。这些反应已经对许多克隆序列平行进行，包括在超过1亿个平行序列的当前的商业应用中得到证明。这些测序方法因此可以用来研究T细胞受体(TCR)和/或B细胞受体(BCR)的所有组成成分。

本发明的方法中使用的测序技术每次运行可以产生至少1000个阅读，每次运行至少10,000个阅读，每次运行至少100,000个阅读，每次运行至少500,000个阅读，或每次运行至少1,000,000个阅读。

本发明的方法中使用的测序技术每次阅读可以产生大约30bp、约40bp、约50bp、约60bp、约70bp、约80bp、约90bp、约100bp、约110、约120bp per read、约150bp、约200bp、约250bp、约300bp、约350bp、约400bp、约450bp、约500bp、约550bp或约600bp。

本发明的方法中使用的测序技术每次阅读可以产生至少30、40、50、60、70、80、90、100、110、120、150、200、250、300、350、400、450、500、550或600bp。

1.True单分子测序

可以在本发明的方法中使用的测序技术包括，例如，Helicos Ture单分子测序(tSMS)(Harris T.D.等人.(2008)Science 320：106-109)。在tSMS技术中，DNA样品被裂解为大约100-200个核苷酸的链，向每个DNA链的3’端添加polyA序列。每条链通过添加荧光标记的腺苷核苷酸进行标记。DNA链然后与流动池表面杂交，流动池表面含有上百万个固定在流动池表面上的寡聚-T捕获位点。模板可以为大约1亿模板/cm²的密度。流动池然后装载在仪器例如HeliScope^TM测序仪中，激光照射流动池表面，显示每个模板的位置。CCD相机可以将流动池表面上的模板位置作图。然后切割并洗掉模板荧光标记。通过引入DNA聚合酶和荧光标记的核苷酸开始测序反应。寡聚-T核酸作为引物。聚合酶以模板指导的方式向引物中掺入标记的核苷酸。除去聚合酶和未掺入的核苷酸。已经指导荧光标记的核苷酸掺入的模板通过流动池表面成像检测。成像后，切割步骤除去荧光标记，使用其它的荧光标记的核苷酸重复该过程，直到达到希望的阅读长度。在每个核苷酸添加步骤收集序列信息。

2.454测序

本发明的方法中可以使用的DNA测序技术的另一个实例是454测序(Roche)(Margulies，M等人.2005，Nature，437，376-380)。454测序包括两个步骤。在第一步中，DNA被剪切为大约300-800个碱基对的片段，将这些片段平端化。然后将寡核苷酸衔接子连接到这些片段的末端。衔接子作为片段扩增和测序的引物。这些片段可以使用例如含有5’-生物素标签的衔接子B连接到DNA捕获珠例如链霉亲和素包被的珠上。在油-水乳液的小滴内PCR扩增附着到珠上的片段。结果是在每个珠上克隆扩增的DNA片段的多个拷贝。在第二步中，珠捕获在孔中(皮升大小)。对每个DNA片段平行进行焦磷酸测序。添加一个或多个核苷酸产生光信号，光信号被测序仪中的CCD相机记录。信号强度与掺入的核苷酸数成比例。

焦磷酸测序利用在核苷酸添加后释放的焦磷酸(PPi)。PPi在腺苷5’磷酸硫酸的存在下被ATP硫酸化酶转化为ATP。萤光素酶利用ATP将萤光素转化为氧萤光素，该反应产生可被检测和分析的光。

3.SOLiD测序

可以在本发明的方法中使用的DNA测序技术的另一个实例是SOLiD技术(Applied Biosystems)。在SOLiD测序中，基因组DNA被剪切为片段，衔接子连接到该片段的5’和3’端，产生片段文库。或者，可以如下引入内部衔接子：将衔接子连接到片段的5’和3’端，环化该片段，消化环化的片段，以产生内部衔接子，并将衔接子连接到得到的片段的5’和3’端，以产生配对的文库。然后，在含有珠、引物、模板和PCR成分的微反应器中制备克隆珠群体。PCR后，使模板变性，珠富集，以分离珠与延伸的模板。对选择的珠上的模板进行3’修饰，该修饰允许结合到载玻片上。

序列可以通过部分随机寡核苷酸的连续杂交和连接来确定，该寡核苷酸具有通过特定荧光团识别的中心确定的碱基(或碱基对)。记录颜色后，切割并除去连接的寡核苷酸，然后重复该过程。

4.SOLEXA测序

能够在本发明的方法中使用的测序技术的另一个实例是SOLEXA测序(Illumina)。SOLEXA测序基于使用折回PCR和锚定引物在固体表面上扩增DNA。基因组DNA被片段化，向片段的5’和3’端添加衔接子。附着到流动池通道表面的DNA片段延伸并桥式扩增。片段变为双链，双链分子变性。在多个固相扩增循环后进行变性可在流动池的每个通道中产生相同模板的大约1,000个拷贝的单链DNA分子的几百万个簇。使用引物、DNA聚合酶和四种荧光团标记的、可逆终止的核苷酸进行连续测序。核苷酸掺入后，利用激光激发荧光团，并捕捉图像，记录第一个碱基的身份。除去3’终止子和来自每个掺入的碱基的荧光团，重复掺入、检测和鉴别步骤。

5.SMRT测序

可以在本发明方法中使用的测序技术的另一个实例包括PacificBiosciences的单分子实时(SMRT^TM)技术。在SMRT中，四个DNA碱基中的每一个连接到四种不同的荧光染料的一种上。这些染料是磷酸连接的(phospholinked)。单个DNA聚合酶用模板单链DNA单分子在零模式波导(ZMW)底部固定。ZMW是一种限制结构，它使得能够相对于快速扩散到SMW之内和之外(微秒)的荧光核苷酸背景观察DNA聚合酶引起的单核苷酸掺入。核苷酸掺入正在延伸的链中需要几毫秒的时间。在该时间中，激发荧光标记，产生荧光信号，并切去荧光标签。染料的相应荧光的检测表明掺入了哪个碱基。重复该过程。

6.纳米孔(Nanopore)测序

可以在本发明方法中使用的测序技术的另一个实例是纳米孔测序(Soni GV和Meller A.(2007)Clin Chem 53：1996-2001)。纳米孔是直径数量级为1纳米的小孔。纳米孔浸没在导电流体中并在其上施加电势导致由于离子通过纳米孔传导引起轻微的电流。电流量对纳米孔的大小敏感。当DNA分子通过纳米孔时，DNA分子上的每个核苷酸不同程度地阻塞了纳米孔。因此，当DNA分子通过纳米孔时通过纳米孔的电流的变化代表了DNA序列的读取。

7.化学敏感的场效应晶体管阵列测序

可以在本发明方法中使用的测序技术的另一个实例涉及对序列DNA使用化学敏感的场效应晶体管(chemFET)阵列(例如，如美国专利申请公布No.20090026082所述)。在该技术的一个实例中，DNA分子可以置于反应室内，模板分子可以与结合到聚合酶的测序引物杂交。一个或多个三磷酸在测序引物3’端向新核酸链的掺入可以通过chemFET根据电流的变化来检测。阵列可以具有多个chemFET传感器。在另一个实例中，单核酸可以附着到珠上，核酸可以在珠上扩增，各个珠可以转移到chemFET阵列上的各个反应室，每个室具有chemFET传感器，核酸可以被测序。

8.使用电子显微镜测序

可以在本发明方法中使用的测序技术的另一个实例涉及使用电子显微镜(Moudrianakis E.N.和Beer M..Proc Natl Acad Sci U S A.1965Mar；53：564-71)。在该技术的一个实例中，各个DNA分子用能够用电子显微镜区别的金属标签标记。这些分子然后在扁平表面上拉伸，并使用电子显微镜成像以测量序列。

此处所述的测序技术中的任一种都可以在本发明的方法中使用。

D.TCR和BCR所有组成成分的测序方法

可以读取来源于单分子或来源于单分子扩增的序列。可以在固体表面上或在水/油乳液的小区室中平行进行单分子的上百万个独立扩增。待测序的DNA样品可以充分稀释和/或分散，以在每个区室中获得一个分子。这种稀释后可以进行DNA扩增，以生成原DNA序列的拷贝并产生都具有相同序列的分子“簇”。这些簇然后可以进行测序。一个运行中可以产生几百万个阅读。可以从扩增序列特定链的5’末端开始产生序列，和/或可以从互补序列的5’末端开始产生序列。在优选实施方案中，产生来自链的序列，即，配对末端阅读。

原DNA序列中特定序列的普遍存在然后可以通过计数多少簇携带该序列来测量。原样品中更普遍存在的序列导致含有特定序列的更多区室和更多簇。

扩增方案中可以使用一些方法来确保测量的DNA序列的频率匹配原样品中DNA序列的频率。这些方法可包括确保PCR引物浓度足够高，以驱动每个循环中的每个杂交反应至饱和，调节各引物浓度以使不同序列的差异扩增最小化，等等。

可以使用算法来确定测序仪产生的哪些序列来源于DNA序列。单独测定的序列(阅读)可以彼此补充，含有通过扩增和/或通过测序引入的错误。可以使用算法将阅读组合在一起，以更精确地确定起始材料中DNA序列的频率。

从包含DNA或RNA的血液样品原始扩增的IgH和/或TCRβ可以获得百万个或更多的测序阅读。特定IgH或TCRβ序列的阅读数与血液样品中特定克隆型的频率有关。因此，可以确定每个克隆型的量。如果特定患者的致病克隆型已知，它们的水平可以通过这种测序方法精确地确定。

在本发明的某些实施方案中，提取DNA分子集合，包括来自一个或多个受试者免疫细胞TCR和BCR区的基因组DNA或逆转录的RNA的代表，任选地以一种方式扩增，使得每个分子可以使用一个或多个上述测序技术测序，以能够检测受试者中序列的存在和频率。

可以对免疫球蛋白或T细胞受体基因的不同区域进行测序。在一些实施方案中，可以对可变区的完整序列进行测序，以鉴别和量化克隆型。

可以对完全克隆序列的独特亚群测序。在一些实施方案中，对包含VD和DJ连接的核苷酸测序，以独特地鉴别和量化克隆型。在其它实施方案中，可以被测序的片段是完整可变区。在另一实施方案中，对抗原识别区或互补决定区3(CDR3)测序。可以扩增含有完整CDR3或完整可变区的片段，以允许对含有V、D和J区段的部分的CDR3测序。

扩增产物上的一个或多个标签可以用于对免疫球蛋白或T细胞受体基因测序。一个或多个与标签退火的引物可以用于测序反应中。扩增的分子的不同部分可以在单独的反应中测序，测序结果可以拼凑在一起，以产生该分子的部分或完整序列。

在一个实施方案中，只扩增和测序CDR3。CDR3的扩增和测序可以使用对于一个或多个V区段序列特异性的引物(以及C区段中扩增子的另一侧上的一个或多个引物)完成。用于每个V区段的引物可以在一个或多个扩增反应中使用，导致序列的所有组成成分扩增。序列的所有组成成分然后可以混合并在扩增或不扩增的情况下进行分离，并使用所述的任何测序技术测序。当在分开的管中使用各种V引物进行扩增时，由于PCR饱和，携带不同V区段的分子数可以被“标准化”。例如，如果一个特定V区段具有一次或几次克隆扩增，导致其代表多于其它区段，该信息可以被删除或减少，因为对于每个区段的PCR反应可能趋向饱和或接近饱和。实时PCR可以用来量化各V区段存在多少。可以对全长CDR3测序，或者可以对序列CDR3的一部分测序。

在一个实施方案中，只分析克隆型的亚群。这可以通过使用对克隆型亚群特异性的引物例如V区段特异性引物扩增来完成。独特的克隆型可以通过利用提供完全连接性的长连续阅读测序来鉴别。在一些实施方案中，当存在几个感兴趣的序列时，仅在一个连接上的短阅读长度长度能够产生简并标签，它们对于特定克隆型是独特的，但是在多个克隆型之间共有。例如跨过V/J连接的测序可以将具有相同V/J的所有序列合计为一个克隆型，而与D区段无关。关于所有区段的全部连接性的信息允许区别例如可能具有相同的V和J区段但是连接到不同D区段上的序列。

当只存在V和D(例如，抗体的轻链或TCR的α亚基)时可以进行相同的分析。TCR和BCR的全部多样性结合入这两个亚基。然而，可以对两个亚基的序列进行分析。

当产生克隆型谱时可以考虑测序和/或扩增产生的错误。例如，参见实施例5。

可以从DNA或RNA进行初始扩增(例如，在转化为cDNA后)。

II.确定相关克隆型、疾病活动性得分的方法和用于确定任一个或两个的算法

A.相关与非相关克隆型

T和B细胞受体序列的大量组成成分对于发现与特定人类健康结果相关的个体细胞发出了挑战。在许多情况下，有意义的克隆型的序列对于所研究的个体是独特的。本发明的方法提供用于区别a)相关克隆型(可以是其水平与疾病相关的克隆型)和b)非相关克隆型(可以是其水平与疾病无关的克隆型)的手段。在一个实施方案中，相关克隆型可以显示与疾病正相关或负相关。在另一实施方案中，在疾病的高峰状态存在但是在疾病的非高峰状态不存在的克隆型可以是相关克隆型(与疾病正相关)。在另一实施方案中，在疾病的高峰状态(或阶段)比在疾病非高峰状态更丰富的克隆型(即，以较高分子水平存在)可以是相关克隆型(与疾病正相关)。在另一实施方案中，在疾病的高峰状态不存在但是在疾病的非高峰状态存在的克隆型可以是相关克隆型(与疾病负相关)。在另一实施方案中，在疾病的高峰状态比在疾病的非高峰状态更少的克隆型可以是相关克隆型(与疾病负相关)。在另一实施方案中，个体的相关克隆型通过算法确定。

B.使用校准试验不使用群体研究发现相关和非相关克隆型

在本发明的该实施方案中，通过观察某些样品中存在的与疾病状态相关的克隆型来鉴别相关克隆型(例如，参见图14)。这种状态可以是来自疾病高峰状态时的样品的血液(例如来自急性发作期的MS或狼疮患者的血液样品)，或是假定富含与个体疾病相关的T和B细胞的受影响的组织。这些组织的例子可以是具有肾脏炎症的狼疮患者的肾活检组织、发作期MS患者的CSF、类风湿性关节炎患者的滑液、或癌症患者的肿瘤样品。在所有这些实例中，组织可能将含有与疾病有关的相关T和B细胞(虽然不一定是致病因素)。值得注意的是，如果利用该方法鉴别与疾病相关的克隆型，它们将只与检测其样品的个体相关。结果，将需要特定校准试验，以使用该方法鉴别任何患有疾病的特定个体中的相关克隆型。

在一个实施方案中，提供了确定受试者中的一个或多个相关克隆型的方法。该方法可以包括以下步骤：a)通过对来自受试者的至少一个样品的空间上分离的个体分子进行核酸测序，产生一个或多个克隆型谱，其中所述至少一个样品与疾病的第一状态有关，和b)基于所述一个或多个克隆型谱确定受试者中的一个或多个相关克隆型。

在一个实施方案中，至少一个样品来自于受疾病影响的组织。在另一实施方案中，所述确定一个或多个相关克隆型包括比较来自至少两个样品的克隆型谱。在另一实施方案中，疾病的第一状态是疾病的高峰状态。在另一实施方案中，一个或多个相关克隆型在疾病的高峰状态时存在。在另一实施方案中，一个或多个相关克隆型在疾病的高峰状态时不存在。在另一实施方案中，一个或多个相关克隆型在疾病的高峰状态时高。在另一实施方案中，一个或多个相关克隆型在疾病的高峰状态时低。在另一实施方案中，样品包含T细胞和/或B细胞。在另一实施方案中，T细胞和/或B细胞包含T细胞和/或B细胞的亚群。在另一实施方案中，T细胞和/或B细胞的亚群通过与标志物相互作用来富集。在另一实施方案中，所述标志物是位于T细胞和/或B细胞亚群上的细胞表面标志物。在另一实施方案中，T细胞和/或B细胞亚群与疾病中特异性存在的抗原相互作用。

在一个实施方案中，所述疾病是自身免疫病。在另一实施方案中，所述自身免疫病是系统性红斑狼疮、多发性硬化、类风湿性关节炎或强直性脊柱炎。

C.使用群体研究发现相关和非相关克隆型

在一个实施方案中，提供了一种使用群体研究鉴别相关克隆型的方法(例如，参见图15)。群体研究的应用在于允许归纳关于具有已知疾病状态后果的个体中已经确定的相关克隆型的具体信息，以允许在将来所有受试者中鉴别这些相关克隆型，而不需要校准试验。可以利用对特定一组相关克隆型的了解来提取关于在将来的受试者中关联的克隆型的相似属性(参数)的规则。

在一个实施方案中，本发明包括以下方法，该方法包括在样品的研究中对免疫细胞的所有组成成分进行测序来鉴别相关和非相关克隆型，所述样品来自患病患者和任选的健康对照，来自不同时间，在疾病患者的情况下来自通过临床数据表征的疾病过程的不同的(和已知的)状态。所述疾病可以是，例如，自身免疫病。其水平与这些不同状态的疾病的量度相关的克隆型可以用来开发一种算法，该算法能够预测与疾病相关的一大组序列的身份，在所有个体中这些克隆型不同于与疾病无关的克隆型。不同于校准试验的情况，相关序列不需要存在于发现研究中，而是可以基于这些序列预测。例如，相关序列可以是TCR基因DNA序列，其与在发现研究中鉴别的克隆型的DNA序列编码相同的氨基酸序列。此外，可以预测一个或多个相关克隆型的算法可以用来鉴别来自任何个体的样品中的克隆型，并且对于特定个体绝不是独特的，从而允许在新的样品中预测相关克隆型，而不需要事先知道该个体中存在的克隆型。

在一个方面，提供一种开发预测患病受试者的任何样品中一个或多个相关克隆型的算法的方法，包括：a)从一组样品产生多个克隆型谱，其中该样品与疾病相关，b)从一组样品鉴别一个或多个相关克隆型，c)利用b)中鉴别的一个或多个相关克隆型的序列参数和/或功能数据开发能够预测来自患病受试者的任何样品中的相关克隆型的算法。

在一个实施方案中，这组样品采自一个或多个受疾病影响的组织。

在另一实施方案中，鉴别一个或多个相关克隆型包括比较来自至少两个样品的克隆型谱。在另一实施方案中，功能数据包括T细胞和/或B细胞中的标志物的结合能力或T细胞或B细胞与抗原的相互作用。在另一实施方案中，所述序列参数包含核酸序列和预测的氨基酸序列。在另一实施方案中，样品来自一个或多个处于疾病高峰阶段的个体。在另一实施方案中，所述一个或多个相关克隆型存在于疾病的高峰状态。在另一实施方案中，所述一个或多个相关克隆型在疾病的高峰状态处于高水平。在另一实施方案中，一个或多个相关克隆型在疾病的高峰状态处于低水平。在另一实施方案中，一个或多个相关克隆型在疾病的高峰状态不存在。

在一个实施方案中，所述疾病是自身免疫病。在另一实施方案中，所述身免疫病是系统性红斑狼疮、多发性硬化、类风湿性关节炎或强直性脊柱炎。

在另一方面，提供了一种发现个体的一个或多个相关克隆型的方法，包括：a)将来自个体样品的克隆型谱输入到一个算法中，和b)使用该算法确定个体的一个或多个相关克隆型。该算法可以是通过以下方法开发的算法：a)从一组样品产生多个克隆型谱，其中所述样品与疾病相关，b)从这组样品鉴别一个或多个相关克隆型，和c)利用b)中鉴别的一个或多个相关克隆型的序列参数和/或功能数据开发能够预测来自患病受试者的任何样品中的相关克隆型的算法。

D.使用校准试验结合群体研究发现相关和非相关克隆型

在本发明的一个实施方案中，使用校准试验结合群体研究鉴别相关克隆型(例如，参见图17)。在该实施方案中，群体研究不产生允许预测任何样品中的克隆型的算法，而是可以开发一种算法来预测来自其特定校准克隆型谱已经产生的受试者的任何样品中的相关克隆型(例如，参见图16)。一个实例是开发一种算法，该算法将基于从任何疾病阶段的血液样品测定的克隆型谱预测狼疮患者的相关克隆型，其首先在临床发作期进行血液检验，用来校准该算法。

在该实施方案中，本发明包括通过在样品研究中对免疫细胞的所有组成成分进行测序来鉴别相关和非相关克隆型的方法，所述样品来自患病患者和任选的健康对照，来自不同时间，在患病患者的情况下来自以临床数据表征的疾病过程的不同的(和已知的)状态。在第一状态与第二状态时以不同频率(或水平)发现的克隆型然后用于开发一种算法，该算法预测在第一疾病状态下每个个体的所有组成成分中发现的哪些序列与每个个体中的后一疾病状态相关，它们不同于该个体中与疾病无关的序列。不同于单独的校准试验的情况，相关序列可以是发现在疾病状态之间不同的所有序列的亚群。也可能相关克隆型在校准样品中未发现，但是如果它们在未来的样品中出现，则基于该算法预测其相关。作为一个例子，与校准样品中发现的克隆型编码相同的氨基酸序列的克隆型可以基于群体研究得到的算法预测是相关克隆型。不同于以前的实施方案，开发该算法是为了基于校准克隆型谱预测相关克隆型，该校准克隆型谱是个体中产生的克隆型谱，将对于该个体预测该相关克隆型中哪个处于疾病的特定状态。在该实施方案中，该算法不能用于产生特定个体中的相关克隆型，直到已经检测特定校准克隆型谱。在特定受试者中检测该校准谱之后，可以基于该个体中克隆型谱的检测预测所有后续相关克隆型。

在另一方面，提供了一种发现个体的一个或多个相关克隆型的方法，该方法包括：a)将个体样品的克隆型谱输入一个算法中，和b)利用该算法确定个体的一个或多个相关克隆型。该算法可以是通过以下方法开发的算法：a)从一组样品产生多个克隆型谱，其中所述样品与疾病相关，b)从这组样品鉴别一个或多个相关克隆型，和c)利用b)中鉴别的一个或多个相关克隆型的序列参数和/或功能数据开发能够预测来自患病受试者的任何样品中的相关克隆型的算法。在一个实施方案中，样品在疾病的高峰状态采集。在另一实施方案中，样品采自受疾病影响的组织。

E.可以用来预测相关克隆型的序列相关的参数

为了进行群体研究，可以使用训练组通过检测能够区分相关克隆型与不相关克隆型的各个参数理解相关克隆型的特征。这些参数包括使用的序列或特定V、D和J区段。在一个实施方案中，已知特定V区段更可能与某些疾病相关，如果特定疾病的克隆型可能识别相关表位并因此可能具有序列相似性通常是这样。进一步的实施方案中包括的其它参数包括鉴别的体细胞超突变的程度和处于发作高峰时的克隆型水平及其在疾病相对不活动时的水平。可以预测相关克隆型的其它参数包括但不限于：1)包括V或J区、组合VJ、DJ区中的短序列的序列基序；2)克隆型的序列长度；3)克隆型水平，包括绝对水平(每百万个分子的克隆数)或等级水平；4)与其它克隆型的氨基酸和核酸序列相似性：其它高度相关克隆型的频率，包括具有沉默变化的那些(编码相同氨基酸的核苷酸差异)或具有保守氨基酸变化的那些；5)对于BCR，克隆型中的体细胞突变水平和/或由于体细胞突变而与一些种系克隆型不同的独特克隆型的数目；6)其相关蛋白具有类似的三维结构的克隆型。

F.改进相关克隆型确定的功能数据

进一步的实施方案将利用功能数据来帮助鉴别相关克隆型。例如，含有某些在含有相关克隆型的细胞中富含的标志物的T细胞和/或B细胞可以通过如FACS或MACS的标准方法捕获。在另一实施方案中，标志物是细胞表面标志物。在另一实施方案中，T细胞和/或B细胞对与病理学或受影响组织有关的抗原的反应性将是克隆型的病理相关性的良好的证据。

在另一实施方案中，可以合成候选克隆型的序列，并置于完整TCR或BCR的背景中，评价相关反应性。或者，不同序列的扩增的片段可以用作噬菌体、核糖体或RNA展示技术的输入。可以为具有相关反应性的序列选择这些技术。选择之前和之后的测序结果的比较可以鉴别那些具有反应性、因此可能是病理性的克隆。在另一实施方案中，特定展示技术(例如噬菌体、核糖体或RNA展示)可以以阵列形式使用。携带来自TCR或BCR的个体序列(例如CDR3序列)的个体分子(或这些个体分子的扩增)可以排列为噬菌体、核糖体或RNA。然后可以研究特定抗原，以确定编码结合它们的肽的序列。结合与疾病相关的抗原的肽可能是病理性的。

G.产生免疫负荷算法

可以利用算法计算免疫负荷(例如，参见图18)。免疫负荷可以用来作出临床决定。使用实验获得(例如，包含来自第一疾病状态的受试者的样品和来自第二疾病状态的受试者的样品的实验)的数据，可以开发将关于相关和非相关克隆型水平的信息组合为一个得分(免疫负荷)的算法。然后可以调节该算法的参数，以将免疫负荷和临床数据之间的相关性最大化。例如，临床数据可以是疾病严重程度的临床量度(例如，多发性硬化患者的MRI的病变程度)。

产生免疫负荷算法中使用的相关克隆型可以利用如上所述的校准试验、群体研究或校准试验和群体研究产生。

可以与相关克隆型结合考虑的一些因素有相关克隆型的数目、它们的水平、它们的变化率(速率)和速度的变化率(加速度)。将要评价的其它因素包括发作高峰和不活动的疾病状态时的克隆型水平。

在一个实施方案中，产生的免疫负荷与自身免疫病有关。这种负荷可以被称为自身免疫负荷(AutoImm Load)。

在一个方面，提供了一种产生计算疾病活动性得分的算法的方法，包括：a)开发一种算法，该算法使用一组因素将相关克隆型水平组合为疾病活动性得分，b)比较疾病活动性得分与关于疾病状态的临床数据，和c)优化这些因素，以将临床数据与疾病活动性得分之间的相关性最大化。

H.使用负荷算法监测疾病

1.不使用校准试验监测疾病

在本发明的一个实施方案中，使用群体研究确定克隆型和免疫负荷算法(例如，参见图19)。免疫负荷可以直接使用，而不需首先校准个体患者。该试验可以在患者处于任何疾病状态时进行。该试验可以用来基于以上开发的算法产生特定相关和非相关克隆型。然后可以使用群体研究中产生的第二算法计算免疫负荷。该得分然后可以在临床上使用。

在另一方面，提供了一种监测个体的疾病状态的方法，包括：a)从受试者的样品确定克隆型谱，b)将a)获得的克隆型谱信息输入一种算法，和c)使用该算法产生可预测个体的疾病状态的得分。该算法可以是通过以下方法产生的算法：a)开发一种算法，该算法使用一组因素将相关克隆型水平组合为疾病活动性得分，b)比较疾病活动性得分与关于疾病状态的临床数据，和c)优化这些因素，以使临床数据与疾病活动性得分之间的相关性最大化。

2.使用校准试验监测疾病

在本发明的一个实施方案中，使用校准试验或校准试验和群体研究确定相关克隆型和免疫负荷算法(例如，参见图20)。免疫负荷可以在诊所使用，首先进行校准试验。该试验可以在患者处于类似于产生免疫负荷算法中使用的相关和非相关克隆型的研究中使用的第一状态的状态时进行。例如，该状态可以是自身免疫病的发作状态，如果这是免疫负荷算法如何产生的。该校准试验然后可以用来产生将在后续疾病监测试验中使用的特定相关和非相关克隆型。在治疗该患者的稍后时间点，对患者进行另一个试验，并且可以使用发现研究中产生的算法和该患者的特定校准试验中产生的克隆型水平的列表计算免疫负荷。该免疫负荷得分然后可以在临床上使用。

在另一方面，提供了一种监测个体的疾病状态的方法，包括：a)从受试者的样品确定克隆型谱，b)将a)获得的克隆型谱信息输入一种算法，和c)使用该算法产生可预测个体的疾病状态的得分。该算法可以是通过以下方法产生的算法：a)开发一种算法，该算法使用一组因素将相关克隆型水平组合为疾病活动性得分，b)比较疾病活动性得分与关于疾病状态的临床数据，和c)优化这些因素，以使临床数据与疾病活动性得分之间的相关性最大化。在另一实施方案中，该方法还可包括通过本发明的任何方法确定个体中的一个或多个相关克隆型，和将一个或多个相关克隆型的信息输入该算法中。

3.与免疫负荷应用有关的其它因素

对于不同的患者，相同的免疫负荷可能意味着不同的含义。举例来说，需要考虑患者的全部临床现象。从检验角度，在作出临床决定时除免疫负荷水平以外还可以考虑速率(免疫负荷随时间的变化率)和加速度(速率随时间的变化率)。例如，如果自身免疫负荷得分升高(高速率)，则可以预测自身免疫病的初期发作。

可以集成到负荷得分例如自身免疫负荷得分中的其它检验包括，例如，红细胞沉降率(ESR)、C反应蛋白(CRP)水平、抗-ds DNA、其它自身抗体滴度、补体水平、尿蛋白水平、尿蛋白/肌酸酐比值、肌酸酐水平、血尿素氮(BUN)水平、血小板水平、WBC计数、血细胞比容(Hct)、Hb、尿分析结果。可以集成的与SLE相关的其它检验包括，例如，CD27水平、CD27++细胞水平、INF-反应性基因(Baechler，EC等人.(2003)Proc.Natl.Acad.Sci.100：2610-2615)和趋化因子得分(BauerJW等人.(2009)Arthritis Rheum.60：3098-3107)。与狼疮无关的其它检验包括，例如，促甲状腺激素(TSH)检验、三碘甲腺原氨酸(T3)检验、甲状腺素(T4)检验、肝功能试验(LFT)、其它自身抗体、钙网蛋白检验、乳铁蛋白检验和滑液分析。其它检验可以包括成像试验，包括，例如，MRI、CT-扫描、X-射线和超声。

III.确定疾病状态

因为免疫系统是人类健康的中心，检测免疫应答的能力在医学中具有广泛应用。本发明教导了使用免疫系统理解当被免疫系统介导时的基础疾病状态的能力。这允许一组非常有效的诊断和预后应用，这些应用使用免疫谱提示多种临床后果的风险，并且允许医生更有效地干预。

A.免疫谱分析在自身免疫病治疗中的应用

本发明的方法可以用来诊断和治疗受试者的自身免疫病。自身免疫病涉及逃脱提供自身免疫性的普通过程和攻击身体组织某些靶标的适应性免疫细胞。自身免疫病包括，例如，急性播散性脑脊髓炎、阿狄森病、强直性脊柱炎、抗磷脂抗体综合征、自身免疫溶血性贫血、自身免疫性肝炎、自身免疫性内耳病、贝赛特病、大疱性类天疱疮、乳糜泻、美洲锥虫病、慢性阻塞性肺疾病、皮肌炎、1型糖尿病、肺出血肾炎综合征、格雷夫斯病、格-巴二氏综合征、桥本甲状腺炎、化脓性汗腺炎、特发性血小板减少性紫癜、间质性膀胱炎，多发性硬化、重症肌无力、神经性肌强直、寻常型天疱疮、恶性贫血、多肌炎、原发性胆汁性肝硬变、类风湿性关节炎、硬皮病、系统性红斑狼疮、舍格伦综合征和脉管炎综合征。这些自身免疫病的阶段可以用本发明的方法诊断。可以根据自身免疫病的阶段建议对受试者的治疗。

关于患有自身免疫病或怀疑患有自身免疫病的受试者的临床信息可以用来确定疾病状态(或自身免疫负荷)。临床信息可以用来鉴别与疾病状态相关的克隆型谱的模式。临床信息可以包括，例如，身高、体重、虹膜色、年龄、性别、种族、血压、LDL胆固醇水平、HDL胆固醇水平、家族史和分子标志物信息。

临床信息可以包括一个或多个自身免疫的症状。对于自身免疫性肝炎，症状可以包括疲劳、肝大、黄疸、瘙痒、皮疹、关节痛、腹部不适、蜘蛛痣、恶心、呕吐、食欲减退、黑尿、大便苍白或灰色。对于皮肌炎(DM)，症状可以包括疹(面、颈、肩、胸上部、肘、膝、指关节和后背上的斑驳的、蓝紫色的变色)伴随的或以前的肌无力、吞咽困难、肌痛、疲劳、体重减轻和低热。对于格雷夫斯病，症状可以包括能量消耗引起的体重减轻、食欲增加、心率和血压和震颤、神经质和出汗。对于桥本甲状腺炎，症状可以包括精神和身体上的迟缓、对冷的较高敏感性、体重增加、皮肤粗糙、甲状腺肿。对于混合性结缔组织病(MCTD)，症状可以包括系统性红斑狼疮(SLE)、硬皮病和硬皮病的特征。对于大疱性类天疱疮(BP)，症状可以包括轻度的搔痒性风团到严重水疱和感染、口或食道大疱。对于天疱疮，症状可以包括皮肤和粘膜起疱。对于恶性贫血，症状可以包括呼吸短促、疲劳、苍白、心动过速、食欲不振、腹泻、手足发麻和麻木、口疮和不稳定步态。对于多肌炎(PM)，症状可以包括肌无力、吞咽困难和肌痛。对于原发性胆汁性肝硬变(PBC)，症状可以包括疲劳和瘙痒。对于硬皮病(系统性硬化病)、症状可以包括手指和手肿胀和浮肿、皮肤增厚、手指上的皮肤溃疡、手部关节强直、疼痛、咽喉痛和腹泻。对于舍格伦综合征，症状可以包括眼口干燥、血管性甲状腺肿、吞咽或说话困难、不正常的味觉或嗅觉、口渴和舌溃疡。对于系统性红斑狼疮(SLE))，症状可以包括发热、体重减轻、脱发、口鼻疮、不适、疲劳、精神病发作和症状、类似于RA的关节炎症、鼻和颊上的蝶形皮疹、手足对冷的极度敏感。对于脉管炎综合征，例如，韦格纳肉芽肿、特发性新月体性肾小球肾炎(ICGN)、显微多动脉炎(MPA)、肺-肾综合征(PRS)，症状可以包括疲劳、虚弱、发热、关节痛、腹痛、肾脏问题和神经系统问题。临床信息可以来自于一个或多个时间点的一个或多个受试者。

临床信息可以包括关于自身免疫病患者对该患者接受的一个或多个治疗的应答的信息。

以下对具体自身免疫病讨论了自身免疫负荷的临床应用。本发明的另一实施方案涉及免疫谱分析试验与其它已经用于检测这些疾病的疾病活动性的标志物的组合，以使试验具有更高的灵敏度和特异性。其它分子标识物或标志物可以用于计算负荷算法或用于确定疾病状态。分子标识物可以包括核酸、蛋白质、碳水化合物和脂质，核酸或蛋白质的表达谱。分子标识物可以是人或非人来源的(例如，细菌)。标识物或标志物可以通过包括以下的技术确定，例如，比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达谱分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附测定(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹分析、Southern印迹分析、SDS-PAGE、凝胶电泳和Northern印迹分析。

对于系统性红斑狼疮，标志物可以包括红细胞沉降率(ESR)水平、C反应蛋白(CRP)水平、抗-ds DNA、其它自身抗体滴度、补体水平、尿蛋白水平、尿蛋白/肌酸酐比值、肌酸酐水平、血尿素氮(BUN)水平、血小板水平、WBC计数、血细胞比容(Hct)、Hb和尿分析结果。可以集成的例如与SLE有关的其它检验包括，例如，CD27水平、CD27++细胞水平、INF-反应性基因和趋化因子得分。

1.系统性红斑狼疮(SLE)

本发明的方法可以用来确定系统性红斑狼疮(SLE或狼疮)的状态或阶段。SLE是严重的自身免疫病，通常影响年轻成人(大多为女性)。其特征在于可能影响许多器官的炎性过程，包括皮肤、关节、肾、肺、心脏和中枢神经系统，导致频繁的失能和有时死亡。该疾病遵循非常不可预测的过程，其标志为发作期后的缓解静止期。然而，被诊断为SLE的患者由风湿科医生定期观察，并用多种正式药物治疗。这些药物包括胆固醇如泼尼松和其它免疫抑制剂，如Cellcept(骁悉)(吗替麦考酚酯(mycophenolate mofetil))。这些药物可以减轻器官损伤，但是它们具有明显的副作用，包括感染和不育的风险。一些症状的不可靠性(例如，疼痛和疲劳)和不可预测的疾病过程使得调整用药剂量变得困难，导致一些患者的过度治疗和另一些患者的治疗不足。结果，SLE的治疗对医生提出了明显的治疗挑战。

有大量标准方法可供临床医生使用，以评价SLE的活动性。疾病状态可以通过观察疾病的临床症状来测量。这些方法包括评价体征(例如，皮疹)和症状(例如，关节痛和疲劳)以及实验室结果(例如，尿蛋白/肌酸酐比、抗-ds DNA抗体和血细胞计数)。然而，这些临床标志可能是疾病状态的滞后的指标，这些患者可能只在治疗数周或数月后应答。此外，在一些情况中，症状可能难以精确评价(例如，疼痛和疲劳)。其它炎症标志，例如抗-ds DNA抗体、补体水平(例如，C3)、C反应蛋白(CRP)和红细胞沉降率(ESR)通常缺乏特异性和/或灵敏性。侵入性方法如肾活检对于常规使用来说不实用。结果临床医生对其患者进行非常频繁的检验，不需对疾病状态有完全的测量。临床症状和实验室评价集成在如系统性红斑狼疮疾病活动性指数(SLEDAI)和医生总体评价(PGA)的测量中。这些测量在临床实践中不常规进行，在几个临床情况中通常不足。

自身免疫负荷在对SLE进行治疗性干预中的应用的具体实例在实施例部分更详细地讨论，同时有确定自身免疫负荷的具体研究。

2.多发性硬化(MS)

本发明的方法也可以用来确定多发性硬化(MS)的状态或阶段。MS是影响脑和脊髓(中枢神经系统)的自身免疫病。其症状不同，因为每个攻击的位置和严重程度可能不同。发作可能持续数天、数周或数月。这些发作与症状减轻或无症状期(缓解)交替。该疾病通常复原(复发)。但是，该疾病可能继续恶化，而没有缓解期。

因为脑或脊髓任何部分中的神经可能被损伤，多发性硬化患者可能在身体的许多部位具有症状。肌肉症状包括，例如，平衡缺失、麻木或许多区域的感觉异常、肌肉痉挛引起的疼痛、臂或腿的疼痛、运动臂或腿的问题、步行问题、协调和进行小移动的问题、言语急促不清或难以理解、一条或多条臂或腿的震颤、不受控制的肌肉群痉挛(肌痉挛状态)和一条或多条臂或腿的虚弱。

眼症状包括，例如，复视、眼不适、不受控制的眼快速运动和视力丧失(在一个时间通常影响一只眼)。

其它脑和神经症状包括，例如，注意广度缩小、判断力下降、记忆减退、抑郁或沮丧感、头晕和平衡问题、面部疼痛、听觉丧失和疲劳。

肠和膀胱症状包括，例如，便秘、排尿开始困难、尿频、大便泄漏、强排尿冲动和尿泄漏(失禁)。

现在还没有已知的多发性硬化的治愈。但是，有一些疗法可以延缓该疾病。治疗的目的是控制症状和帮助患者维持正常的生活质量。

用来延缓多发性硬化进展的药物包括，例如，帮助控制免疫系统的免疫调节剂，包括干扰素(Avonex，Betaseron或Rebif)、单克隆抗体(Tysabri)、格拉默醋酸盐(glatiramer acetate)(Copaxone)、米托蒽醌(Novantrone)、米托蒽醌、硫唑嘌呤(Imuran)、环磷酰胺(Cytoxan)和那他珠单抗(Tysabri)。类固醇类可以用来降低攻击的严重程度。

控制症状的药物可包括，例如，减轻肌肉痉挛的药物如力奥来素(Baclofen)、替扎尼定(Zanaflex)或苯二氮杂

，减少泌尿问题的胆碱能药物，用于心情和行为症状的抗抑郁药，和用于疲劳的金刚烷胺。

MS影响女性超过男性。该疾病最常在20到40岁之间开始，但是在任何年龄可见。MS由髓鞘的损伤引起，髓鞘是围绕神经细胞的保护套。当该神经套受损时，神经冲动减慢或停止。MS是一种进行性疾病，意味着神经损伤(神经变性)随时间变得恶化。MS多快恶化因人而异。神经损伤由炎症引起。炎症在自身的免疫细胞攻击神经系统时发生。炎症的反复发作可以沿脑和脊髓任何区域发生。研究人员没有确定是什么引发了炎症。最常见的理论指向病毒或遗传缺陷，或者两者的组合。MS在北欧、北美、南澳大利亚和新西兰(New Zeal)比在其它地区更可能发生，地理学研究表明可能涉及环境因素。具有MS家族史的人和生活在较高发病率地理区域的人具有较高的患病风险。

MS的症状可能模拟许多其它神经系统疾病的症状。该疾病的诊断是通过排除其它疾病进行的。被称为复发缓解型(relapsing-remitting)的MS形式的患者可能具有至少两次攻击的历史，这两次攻击间为一段缓解或无症状期。如果中枢神经系统的两个不同部分的功能(如异常反射)在不同时间降低，医疗保健提供者可能怀疑MS。神经学检查可显示在身体一个区域降低的或在身体许多部分扩散的神经功能。

诊断多发性硬化的试验包括，例如，脑脊液检验，包括CSF寡克隆带分析、头部MRI扫描、腰椎穿刺术(脊髓穿刺)、神经功能研究(诱发电位试验)和脊柱MRI。

象其它自身免疫病一样，MS遵循不可预测的病程，具有急性发作和缓解期。有越来越多的治疗，每一个都具有从严重(体重增加和抑郁)到危及生命(全血细胞减少症和PML感染)的副作用、在不同患者中可变的有效性和高成本。同时，MS疾病活动性缺乏高度精确的和特异性的常规检测使得有效施用治疗的挑战变得复杂。临床发作可以由长时间期限(在早期疾病中最多数年)隔开，甚至没有治疗。另外，可以应用的药物治疗降低了复发的可能性，但是没有完全预防。因此，疾病活动性难以评价，因此没有足够的疾病活动性短期检测用来通过测量复发的次数或严重程度检测特定治疗在特定患者中是否显示效力。仅有的可用于监测疾病活动性的其它试验是借助造影增强剂和钆显示的跟踪病变状态的脑MRI。然而，这种成像只是提供了脑部损伤的综合检查，缺乏特异性和时间分辨率。试图在短于一年的时间尺度上使用MRI成像追踪病程是不实际的，这是由于成本、缺乏特异性和过度造影剂暴露的危险。结果，患者通常以高成本长时间治疗，没有任何有效的反馈能使医生改变给药和/或增加治疗的转换。

3.类风湿性关节炎(RA)

这些方法可以用来检测类风湿性关节炎患者的疾病状态。类风湿性关节炎(RA)是一种慢性的、全身性的炎性疾病，它可以影响许多组织和器官，但是主要攻击关节，导致炎性滑膜炎，炎性滑膜炎通常进展为关节软骨破坏和关节强直。类风湿性关节炎也可以产生肺、心包、侧甲和巩膜的弥散性炎症，也导致结节性病变，最常发生在皮肤下的皮下组织。尽管类风湿性关节炎的原因未知，但是自身免疫在慢性和进展中起关键作用。

世界上大约1％的人口受到类风湿性关节炎的困扰，女性三倍于男性。发病在40和50岁之间最常见，但是任何年龄的人都可能患病。它可能是失能性的和疼痛的疾病，可能导致机能和运动性大大受损。RA主要根据症状和体重诊断，但是也可以通过血液检验(特别是被称为类风湿因子的检验)和X射线诊断。诊断和长期控制一般由擅长于关节和结缔组织疾病的风湿科医生进行。

可以使用各种治疗。非药物治疗包括物理治疗、矫形器和职业疗法。镇痛(止痛药)和消炎药，包括类固醇类，可以用来抑制症状，而疾病改善抗风湿药(DMARD)可以用来抑制或中止免疫过程和预防长期损伤。最近，新的生物制品组增加了治疗选项。

当临床上怀疑RA时，可以进行免疫学研究，如检测类风湿因子(RF，一种特异性抗体)的存在。阴性RF不排除RA；而关节炎被称为血清阴性的。在大约15％的患者中是这样。在疾病的第一年，类风湿因子更可能是阴性的，某些个体随时间转变为血清阳性的。RF也见于其它疾病，例如舍格伦综合征，并且见于健康人口的大约10％中，因此该试验不是非常特异的。

由于这种低特异性，已知开发了新的血清学检验，其检测所谓的抗瓜氨酸蛋白抗体(ACPA)的存在。象RF一样，这些试验只在所有RA病例中的一部分(67％)中是阳性的，但是如果不存在RA则极少阳性，其特异性大约为95％。对于RF，在许多病例中存在ACPA的证据，甚至在临床疾病开始之前。

最常见的ACPA试验是抗-CCP(环瓜氨酸肽)检测和抗MCV试验(抗突变型瓜氨酸波形蛋白抗体)。最近，已经发展了用于早期检测RA的血清学重点照护检验(POCT)。该试验结合了类风湿因子的检测和用于诊断类风湿性关节炎的抗MCV，显示72％的灵敏性99.7％的特异性。

也可以进行几种其它血液检验来考虑关节炎的其它原因，如全身性红斑狼疮。红细胞沉降率(ESR)、C反应蛋白、全血计数、肾功能、肝酶和其它免疫学试验(例如，抗核抗体/ANA)全都在此阶段进行。升高的铁蛋白水平可以揭示血色沉着病、模拟RA，或者是斯蒂尔病的体征，该病是一种血清阴性的、通常为青少年的、类风湿的变型。

术语疾病改善抗风湿药(DMARD)最初的意思是一种影响生物学指标如ESR和血红蛋白和自身抗体水平的药物，但是现在通常用来指降低骨和软骨损伤率的药物。已经发现DMARD产生持久的有症状的缓解，并且延迟或中止进展。这是有意义的，因为这样的损伤通常是不可逆的。消炎药和镇痛药改善疼痛和强直，但是不会阻止关节损伤或减缓疾病进展。

在风湿科医生之间越来越认为在疾病的极早期阶段发生关节的永久性损伤。过去，经常只使用消炎药开始治疗，并在临床上和使用X射线评价进展。如果有开始发生关节损伤的证据，则开出更强的DMARD。超声和MRI是更灵敏的关节成像方法，并且已经证明关节损伤比以前所认为的更早地在更多患者中发生。X射线检查正常者通常具有通过超声检查能够检测到、X射线检查无法证明的病变。现在的目的是在发生损伤前治疗。

关于早期开始DMARD为什么有益于防止结构关节损伤可能有其它原因。从疾病的最早阶段，关节被免疫系统细胞浸润，免疫系统细胞彼此发出信号，这种方式可能涉及多种正反馈回路(长期以来观察到单皮质类固醇注射可能长期消除特定关节的滑膜炎)。用有效的DMARD(如氨甲喋呤)尽可能早地中断该过程在以后数年似乎改善了RA的后果。症状发生后延迟治疗短至数个月可能导致长期的较差的后果。因此，当患者对治疗响应最强并且收益最大时，在建立早期关节炎的最有效的治疗方面特别有意义。

用来治疗关节炎的传统小分子药物包括，例如，化学合成的DMARD：硫唑嘌呤、环孢菌素(环孢菌素A)、D-青霉胺、金盐、羟氯喹、来氟米特、氨甲喋呤(MTX)、米诺环素和柳氮磺吡啶(SSZ)。细胞毒性药物包括环磷酰胺。

最常见的不良反应涉及肝脏和骨髓毒性(MTX、SSZ、来氟米特、硫唑嘌呤、金化合物、D-青霉胺)、肾毒性(环孢菌素A、肠胃外金盐、D-青霉胺)、肺炎(MTX)、变应性皮肤反应(金化合物，SSZ)、自身免疫性(D-青霉胺、SSZ、米诺环素)和感染(硫唑嘌呤、环孢菌素A)。羟氯喹可能导致眼毒性，尽管极为少见，并且因为羟氯喹不影响骨髓或肝脏，它通常被认为是毒性最小的DMARD。遗憾的是，羟氯喹不是非常有效，并且其本身通常不足以控制症状。

生物制剂(biologics)可以通过遗传工程生产，包括，例如，肿瘤坏死因子α(TNFα)阻断剂—依那西普(Enbrel)、英利昔单抗(Remicade)、阿达木单抗(Humira)、白介素1(IL-1)阻断剂—阿那白滞素(Kineret)、B细胞单克隆抗体—利妥昔单抗(Rituxan)、T细胞共刺激阻断剂—阿巴西普(Orencia)、白介素6(IL-6)阻断剂—托珠单抗(一种抗-IL-6受体抗体)(RoActemra，Actemra)。

抗炎剂包括，例如，糖皮质激素类，非甾体抗炎药(NSAID，大多数也用作镇痛药)。镇痛药包括，例如，局部应用对乙酰氨基酚(在美国和加拿大为醋氨酚)、阿片类、地普喹酮和利多卡因。

治疗RA的挑战在于以下事实：该疾病是长期慢性疾病，可导致攻击性的失能，对此现有大量治疗，其中每一种都具有明显的缺点。许多DMARD使患者具有明显的副作用，包括严重感染、癌症或甚至自身免疫病的风险升高。此外，生物学来源的药物非常昂贵，并且患者遭受频繁的感染。

对患者开始治疗的医生面临许多可能的选择。一旦患者开始治疗就希望得到快速的反馈，以理解患者是否响应在临床表现出现以前选择的该治疗。成像不灵敏，并且昂贵，许多血液标志物如CRP缺乏足够的灵敏度。使医生能够快速确定疾病状态的检验将使他或她能够将治疗快速调整至更有效的治疗，使患者避免另外的关节损伤，并更有效地使用可以采用的昂贵的治疗。

没有经历任何急性发作的患者从开始治疗起实际上可能仍然经历进行性的关节炎性损伤，在临床上没有表现出来。使医生能够区别该状态与背景的试验将允许调整治疗以尝试使患者更接近没有经历进行性关节损伤的状态。

在控制MS患者中如何使用自身免疫负荷的具体实例在本文实施例部分进一步详细描述。

4.强直性脊柱炎

所述方法可以用来检测强直性脊柱炎的疾病活动性。强直性脊柱炎(AS，来自希腊语ankylos，弯曲；spondylos，脊柱)，以前被称为别赫捷列夫病和Marie Strümpell病，是脊椎关节炎的一种形式，是一种慢性的、炎性的关节炎和自身免疫病。它主要影响脊柱的关节和骨盆中的骶髂(sacroilium)，引起脊柱的最终融合。它是具有强遗传倾向的脊椎关节病的成员。完全融合导致脊柱完全强直，这种情况被称为竹节样脊柱。

典型的患者是年轻男性，年龄为18-30，此时疾病的症状首先出现，脊柱下部、有时整个脊柱具有慢性疼痛和僵硬，通常疼痛涉及骶髂关节的臀部一侧或另一侧或大腿背侧。受影响的男性多于女性，比例大约为3∶1，疾病在男性中比在女性中通常有更疼痛的过程。在病例的40％中，强直性脊柱炎与眼部炎症有关(虹膜睫状体炎和葡萄膜炎)，引起变红、眼痛、视力损失、飞蚊症和畏光。另外一种常见的症状是全身疲劳，有时恶心。可能发生较少见的主动脉炎、顶端肺纤维化和骶神经根鞘的膨胀。对于所有血清阴性脊柱关节病，可能发生指甲的翘起(甲松离)。

没有直接的试验能够诊断AS。脊柱的临床检查和X射线研究，显示特征性的脊柱变化和骶髂关节炎，是主要的诊断工具。X-射线诊断的缺点是在平片X射线发现X射线明显变化之前AS的体征和症状通常已经出现了长达8-10年，这意味着在可以引入充分的治疗之前已经有长达10年的延迟。早期诊断的选择是骶髂关节的X线断层照相术和磁共振成像，但是这些检查的可靠性仍不清楚。Schober检查是在检查过程中进行的一种有用的腰椎弯曲的临床测量。

在急性炎症期间，AS患者有时显示血液C反应蛋白(CRP)浓度升高和红细胞沉降率(ESR)升高，但是有许多AS患者的CRP和ESR率不升高，因此正常的CRP和ESR结果不总是对应于一个人实际存在的炎症程度。有时AS患者具有正常水平结果，然而在其体内存在明显的炎症。

强直性脊柱炎(AS，来自希腊语ankylos，弯曲，弯曲；spondylos，脊柱)，以前被称为别赫捷列夫病、别赫捷列夫综合征和Marie Strümpell病，是脊椎关节炎的一种形式，是一种慢性的、炎性的关节炎和自身免疫病。它主要影响脊柱的关节和骨盆中的骶髂，引起脊柱的最终融合。

它是具有强遗传倾向的脊椎关节病的成员。完全融合导致脊柱完全强直，这种情况被称为竹节样脊柱。

有三种主要类型的药物用于治疗强直性脊柱炎：1)消炎药，包括NSAID如布洛芬、保泰松、吲哚美辛、萘普生和COX-2抑制剂，它们减轻炎症和疼痛。临床证据也已证明阿片类镇痛药在减轻AS患者经常经历的慢性疼痛类型中非常有效，特别是随时间释放的制剂。2)DMARD如环孢菌素、氨甲喋呤、柳氮磺吡啶和皮质类固醇，用来通过免疫抑制减轻免疫系统应答；3)TNFα阻断剂(拮抗剂)如依那西普、英利昔单抗和阿达木单抗(也被称为生物制剂)，用于治疗AS并且是AS中的有效的免疫抑制剂，如其它自身免疫病中一样。

已经证明TNFα阻断剂是最有前途的治疗药物，延缓大多数临床病例的AS进展，帮助许多患者获得炎症和疼痛的显著的减轻，尽管不是根除。也证明它们不仅在治疗关节关节炎而且在治疗与AS有关的脊柱关节炎中非常有效。它的缺点除了通常费用较高以外，还包括提高了感染的风险。由于这个原因，用于任何TNF-α阻断剂的方案包括在开始治疗前检查结核病(如Mantoux或Heaf)。在复发性感染，甚至复发性喉咙痛的情况中，由于涉及免疫抑制，可能对治疗产生怀疑。建议施用TNF药物的患者限制他们接触携带或可能携带病毒(如感冒或流感病毒)或可能具有细胞或真菌感染的他人。

AS产生在健康人群中非常常见的症状。例如，主诉严重背痛的患者不一定经历AS发作，而是可能仅具有普通的背痛。医生被迫在没有非常准确地判断疾病状态的情况下作出是否用具有潜在严重副作用的昂贵的药物治疗这些症状的决定。CRP和ESR无法非常准确地判断疾病状态。同时，未治疗的疾病的过程可能导致使人虚弱的长期脊柱损伤。这种状态导致困难的临床挑战和使用明显的过度治疗。反映疾病活动性的客观测量的可用性可能对AS患者的控制具有很大帮助。

B.免疫谱分析在癌症检测中的应用

这些方法可以用来检测癌症风险。癌症已经成为工业化国家中首要的死亡原因。因此，癌症的治疗方法有非常大的需求。正在尝试许多癌症治疗方法，包括开发新的小分子药物以及针对肿瘤的抗体。

已经提出的一组方法是免疫疗法。肿瘤监视是免疫系统细胞的功能之一。有几种类型的肿瘤抗原能被免疫系统识别。第一类包括通过肿瘤中的体细胞突变(点突变或易位)新产生的抗原。另一类包括来自只在不表达MHC分子的雄性生殖细胞中表达的蛋白质的抗原。许多肿瘤中基因表达的失调可能使这些抗原中的某一些被表达。第三类包括来自只在特定组织中表达的蛋白质的抗原。第四类包括在肿瘤组织中显著过度表达的抗原。最后，第五类包括由异常翻译后修饰产生的抗原。

肿瘤的一种性质是它们逃脱免疫系统的有效清除的能力。据认为肿瘤中获得的新的突变使其从平衡期(其中肿瘤未完全消除，但是其生长被抑制)转至逃脱期，此时肿瘤生长而不受免疫系统的有效控制。肿瘤利用许多机制来逃脱免疫系统。这些机制包括缺乏特异性抗原性肽，或者能够激活T细胞的共刺激分子。其它机制包括肿瘤分泌抑制T细胞的因子和通过产生分隔肿瘤与淋巴细胞的物理屏障产生肿瘤诱导的特殊部位。正在研究并以多种方式测试诱导免疫系统以更好地对抗肿瘤作为治疗癌症的策略。一种方法是过继性T细胞治疗。该方法集中在通过分离浸润肿瘤和/或与特定肿瘤抗原反应的细胞鉴别靶向肿瘤抗原的T细胞。这些T细胞可以在增强其有效性的条件下在体外生长，例如使用IL-2和/或抗原呈递细胞。扩增的细胞然后回输到患者血液中。另外一种方法是使用含有肿瘤特异性TCR的逆转录病毒。这些逆转录病毒可能输注到患者的特定细胞中，这些细胞后来分泌逆转录病毒，使其感染T细胞，然后T细胞开始表达肿瘤特异性TCR。最后，一种常用的方法是采用疫苗接种。该治疗方法的前提是用一种或多种肿瘤抗原免疫患者，该肿瘤抗原将刺激免疫系统对抗肿瘤的能力。免疫通常使用如卡介苗(BCG)等佐剂进行。该方法已经成功用于预防病毒诱导的癌症，如通过预防由HPV-16和HPV-18诱导的宫颈癌的能力所显现的。但是，很少成功用于治疗其它肿瘤。

癌症死亡率已经发生了较大的改善，这是由于可以获得更好的早期检测方法，例如导致乳腺癌和宫颈癌的死亡率降低。肿瘤的可突变性使得它们的早期治疗比晚期检测时更加有效。传统上，寻找癌症检测生物标志物通常包括寻找在癌症中高度表达并且在正常组织中低水平表达或不存在的标志物。这导致鉴定了几种肿瘤标志物，如PSA。癌症早期检测的一个问题是当生物标志物的检测最困难时，即，肿瘤非常小时，发生癌症检测的最大价值。因此，为了有能够区别具有小肿瘤的患者与没有肿瘤的受试者的有效癌症检测生物标志物，需要肿瘤和正常组织之间的表达有巨大差异，这是由于肿瘤和正常组织之间的大小有大的差异。另外，标志物需要有效地“溢出”至血液或其它体液，以允许使用非创伤性技术进行检测。

本发明教导了一种新的利用免疫细胞应答的癌症检测机制。在这点上，通过检测肿瘤本身产生的标志物无法实现癌症的检测，但是通过对肿瘤的免疫系统应答可以检测到。特别是，TCR和/或BCR谱可以提供关于身体是否对肿瘤具有应答的了解。这可以改善使用现有的生物标志物的一些问题。首先，免疫应答是一种扩增信号，它可以被较早地检测到。其次，淋巴细胞经常地通过血液，因此相关生物标志物可能比传统肿瘤生物标志物更容易地存在于外周血中并可被检测到。最后，正常组织产生的“背景”生物标志物的问题大大减少。T和/或B细胞的高度多样性提供了一种高灵敏度和特异性的检测相关生物标志物的方法，特别是最近可获得高通量DNA测序方法。利用对癌症的免疫系统应答的检测方法通过免疫治疗的保证调节了归于该领域的基础。但是，两种应用的风险可能非常不同。利用对癌症的免疫应答进行检测不需要特异性克隆型在治疗肿瘤中有效，而是需要与对肿瘤的免疫应答相关。

本发明的另一实施方案涉及免疫谱分析试验与其它已经用于检测癌症的标志物的组合，以使试验具有更高的灵敏度和特异性。其它分子标识物或标志物可以用于计算负荷算法或用于确定疾病状态。分子标识物可以包括核酸、蛋白质、碳水化合物和脂质，核酸或蛋白质的表达谱。分子标识物可以是人或非人来源的(例如，细菌)。标识物或标志物可以通过包括以下的技术确定，例如，比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达概况分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附测定(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹分析、Southern印迹分析、SDS-PAGE、凝胶电泳和Northern印迹分析。

C.免疫谱分析在移植医学中的应用

这些方法可以用来检测移植器官的免疫排斥。器官移植已经成为美国每年进行的超过25,000例实体器官(肾、肝、心脏、胰和肺)移植和超过15,000例骨髓移植的医疗的不可或缺的部分。这些通常是在三级护理中心进行的复杂的手术。为了最小化移植排斥的风险，患者通常被长期置于免疫抑制下，使得他们具有癌症和感染的危险。此外，许多移植物被急性排斥或在移植数年后排斥。尽管存在这些问题，器官移植仍然是重要的治疗方式，因为器官衰竭患者几乎没有其它选择。

实体器官移植排斥的发生主要是由于适应性免疫系统对移植的器官的应答。这是由于移植物中存在被宿主免疫系统识别的同种异体抗原。排斥可以在三个不同的阶段发生。第一个是在移植几分钟内的超急性期，其中预先形成的抗体引起对移植物的应答。第二个是在移植后前几周或前几个月发生的急性排斥。最后一个是可以在移植后数年发生的慢性排斥。考虑到这些危险，已经小心使供体和接受体之间的免疫原性差异最小化。例如，当供体和接受体的ABO亚型匹配以及检测交叉匹配(确定接受者是否具有与供体的白细胞反应的抗体)时，超急性反应的危险大大降低。类似地，进行主要组织相容性(MHC)的仔细匹配以减少急性排斥。但是，由于MHC分子具有非常高的多态性，非常难以发现确定完美的匹配。单卵双胎具有完美的MHC匹配。类似地，1/4同胞预期具有完美的MHC匹配。根据临床试验具有可检测到的相同的等位基因的无关个体通常由于在常规临床实践中检测不到的其它多态性位点具有差异。但是，甚至来自同胞的完美的MHC匹配，仍然存在明显的排斥风险，这是因为存在次要组织相容性抗原，实际上超过一半的移植物非常常见地发生急性排斥。

人们可以想象更具攻击性的MHC基因座检测以及鉴定和匹配次要组织相容性抗原将显著改善移植排斥和可能的存活率。可以获得的供体器官数量有限的事实使得该任务不切实际，因为更具攻击性的测试可能显著延迟用于每名患者的适当移植物的鉴定。因此，在移植领域发生的许多进展为使用免疫抑制剂预防和治疗排斥。当前有许多药物用于该目的，包括：硫唑嘌呤、皮质类固醇类、环孢菌素、他克莫司、麦考酚酸、西罗莫司、莫罗单抗-CD3、单克隆抗CD25抗体、单克隆抗CD20抗体和钙神经素抑制剂。

骨髓移植最常用于白血病和淋巴瘤的治疗。一般而言，接受者经历攻击性的放射和/或化学治疗方案，以在移植之前降低肿瘤的负荷。来自供体的成熟T细胞可以在被称为移植物抗宿主病(GVHD)的相反排斥中攻击一些宿主组织。这通常表现为疹、腹泻和肝病。MHC的仔细匹配可以改善但不能消除该问题。一种方案是在体外排除供体骨髓中最终引起GVHD的成熟T细胞。一个问题是引起GVHD的相同的现象可能通过移植物抗白血病效应引起骨髓移植的一些治疗效果，其中供体T细胞攻击剩余的癌细胞。另外，供体T细胞的排除可以使患者暴露于免疫缺陷的风险。因此，当考虑这些方法时，需要平衡风险和利益。因此通常用免疫抑制剂治疗患者以预防以及治疗GVHD。

现有的骨髓控制，对于实体器官移植更是如此，严重依赖于使用强免疫抑制剂的治疗。然而，由于这些药物具有明显的危险，它们以平衡风险和利益的方式使用。但是，由于特定患者在特定时间的危险没有很好地理解，用对平均患者平衡了风险和收益的剂量治疗患者。可以预测未来排斥事件的试验可能潜在地非常有助于在它们需要的适当时间调整对患者的治疗。这可导致免疫抑制剂量的减少，或者某些患者同时改善了排斥率和有希望的移植物存活。

本发明的另一实施方案涉及免疫谱分析试验与其它已经用于检测移植排斥的标志物的组合，以使试验具有更高的灵敏度和特异性。其它分子标识物或标志物可以用于计算负荷算法或用于确定疾病状态。分子标识物可以包括核酸、蛋白质、碳水化合物和脂质，核酸或蛋白质的表达谱。分子标识物可以是人或非人来源的(例如，细菌)。标识物或标志物可以通过包括以下的技术确定，例如，比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达概况分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附测定(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹分析、Southern印迹分析、SDS-PAGE、凝胶电泳和Northern印迹分析。

D.免疫谱分析在治疗感染中的应用

这些方法已经用于指导感染的治疗，特别是在这些感染可能以活动和潜伏状态存在时。过去一个世纪用于治疗传染病的抗生素的出现对预期寿命产生了极大的影响。在过去十年中，分子诊断学技术已经在传染病的诊断和控制中发挥了快速提高的作用。核酸扩增提供的出色的灵敏性和特异性使得能够将这些技术应用到越来越多的应用中。许多应用用于诊断评价传染原的存在或不存在。例如，性传播疾病的检测通常由采用核酸扩增技术的分子检测进行。另一组应用涉及评价已经诊断的传染原感染患者的“载量”。一个例子是评估已经诊断为AIDS的患者中的HIV病毒载量。该检查帮助医生确定患者的疾病状态，因此可以对使用的治疗方案的有效性提供指导。

有时不仅有助于考虑传染原的水平，而且有助于考虑对传染原的免疫应答。在临床实践中常规使用对感染的免疫应答的一个例子是乙型肝炎。乙型肝炎检测的一个方面依赖于通过检测乙型肝炎抗原或者通过核酸扩增试验检测传染原。另外，常规临床实践中通常检测针对乙型肝炎病毒的不同抗体的存在。抗-HBc IgM的存在通常在急性感染条件下发生，抗-HBc IgG的出现表明感染是慢性的。类似地，抗-HBs抗体的出现表示清除了感染。

在本发明的一个实施方案中，评价对感染的免疫应答的价值同时具有分子检测的灵敏性和特异性。这特别可用于其中传染原在体内保持潜伏的慢性传染病。TCR和/或BCR谱可以用来评价对感染的免疫应答。测序可以用来获得TCR和/或BCR谱，以允许高灵敏性和特异性地检测特定克隆型。为了确定与疾病相关的特异性的克隆型，设想了几种方法。

本发明的另一实施方案涉及免疫谱分析试验与其它已经用于检测传染物的标志物的组合，以使试验具有更高的灵敏度和特异性。其它分子标识物或标志物可以用于计算负荷算法或用于确定疾病状态。分子标识物可以包括核酸、蛋白质、碳水化合物和脂质，核酸或蛋白质的表达谱。分子标识物可以是人或非人来源的(例如，细菌)。标识物或标志物可以通过包括以下的技术确定，例如，比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达概况分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附测定(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹分析、Southern印迹分析、SDS-PAGE、凝胶电泳和Northern印迹分析。

E.免疫谱分析在治疗衰老患者中的应用

这些方法已经用于监测老年人的免疫系统的状态。老年人的免疫系统减弱，被称为免疫衰老，这影响他们对感染应答和对疫苗产生有效应答的能力(Weinberger等人.，2008)。从老年人中肺炎引起的高死亡率(Office for National Statistics，2005)和他们对医源性感染如艰难梭菌(Clostridium difficile)和甲氧西林抗性金黄色葡萄球菌的易感性(HealthProtection Agency，2008)可以清楚地看出这一点。此外，免疫系统能力的下降被认为解释了老年人中升高的癌症比例。另外，免疫衰老可能导致具有显著炎性过程成分的老年人的其它主要疾病，如阿尔茨海默病和心脏病。预测哪些个体最可能处于这些致死性后果的危险中的能力在老年科医生做出关于接种、攻击性感染治疗和住院的临床决定时是有用的。

先天性和适应性免疫系统的许多方面在免疫衰老中改变。T细胞丧失反应性，巨噬细胞具有降低的抗原呈递能力和改变的细胞因子分泌，自然杀伤细胞具有降低的毒性，滤泡树突细胞不能有效地呈递抗原，中性白细胞失去吞噬细胞能力。较小的幼稚T和B细胞集合和记忆和效应细胞集合导致T和B细胞所有组成成分的多样性降低，导致适应性免疫系统对新抗原应答的能力降低。特别是，与巨细胞病毒(CMV)有关的T细胞所有组成成分大大增加，并且总T细胞所有组成成分中的多达45％可能与它有关。已经注意到这些扩增在百岁以上老人中较不明显。

研究提示免疫标志物可能预测老年人中的存活率。已经证明B细胞所有组成成分的多样性程度预测至少一个群体中的老年人的存活率。即使TCR和BCR多样性的这些总体差异表明预测临床结果，但是这些标志物缺乏特异性。所有组成成分数据的更深入的分析可以提供显著更高的预测精确性。例如，对CMV具有反应性的扩增可能具有与其它扩增不同的显著性。

在本发明的一个实施方案中，来自在外周血中发现的T和B细胞的RNA可以从其病历已随访数年的衰老患者的纵向组群中采集。可以对这些组群中的每一个在他们的病历中的几个时间点扩增TCR和TCR基因和IgH、IgK和IgL基因。长期存活患者的谱与短期存在的患者进行比较。首先，可以获得多样性的全面测量。这不仅包括鉴别的不同的克隆型的数目，而且包括它们的多样性。例如，V、D、J区段的使用在两组中是相同还是一组在其使用方面更有限制？例如，两个样品可以具有相同的独立克隆型数目，但是两个样品之一的克隆型不覆盖许多V区段。逻辑上预测与其克隆型分布在所有V区段之间的其它样品相比，该样品在响应新抗原方面多能性更差。

除了整体多样性以外，将确定是否可以根据一些序列参数与短期存活患者的克隆型比较来区别长期存活患者中扩增的克隆型。通过观察响应于特定抗原的克隆型可以补充该方法。例如，由于可以获得的证据，CMV响应性克隆型的鉴别可能具有预测能力。在发现研究中捕获CMV反应性T细胞克隆型可以从一组老年健康患者进行。可以研究这些克隆型的序列以鉴别能够区别它们与其它克隆型的参数。使用上述纵向群组通过使用CMV克隆型的该预测算法，可以评价添加该信息是否能够提高从非长期存活患者中预测长期存活患者的能力。

本发明的另一实施方案涉及免疫谱分析试验与其它已经用于检测老年人群健康的标志物的组合，以使试验具有更高的灵敏度和特异性。其它分子标识物或标志物可以用于计算负荷算法或用于确定疾病状态。分子标识物可以包括核酸、蛋白质、碳水化合物和脂质，核酸或蛋白质的表达谱。分子标识物可以是人或非人来源的(例如，细菌)。标识物或标志物可以通过包括以下的技术确定，例如，比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达概况分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附测定(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹分析、Southern印迹分析、SDS-PAGE、凝胶电泳和Northern印迹分析。

F.免疫谱分析在给予疫苗中的应用

这些方法已经用于给予疫苗。疫苗接种的应用导致多种生物的感染率极大降低。一种具有显著的健康影响，在美国每年导致超过30,000例死亡的传染病是流感。流感疫苗接种每年都要进行，因为毒株快速突变。该疾病的大多数严重后遗症发生在老年人中。遗憾的是，老年人通常经历免疫衰老，这使得他们对疫苗接种的反应性不足。

为了区别对疫苗接种具有反应性的患者与对疫苗接种没有反应性的患者，需要进行发现研究。在该人群中，可以从一组具有已知流感后果的流感疫苗接种患者(即，他们是否后来被预防感染)中获得接种前和接种后(在一组或多组时间)血液样品。TCR和/或BCR序列可以从这些样品中获得。确定在每名患者中疫苗接种后富集的克隆型。在对疫苗接种有反应的患者中富含的克隆型然后与一组对照克隆型(例如，同一组患者中的其余克隆型)进行比较，以区别相关克隆型与其它克隆型。然后利用预测这些克隆型的算法来预测对疫苗接种没有应答的患者之间的相关克隆型。没有应答的患者可能与有应答的患者产生类型相同但水平较低的克隆型。或者，可能无应答者产生不同类别的克隆型。在无应答者中鉴别的相关克隆型的数目可以区别这两个可能性。

使用鉴别的相关克隆型，然后建立一种算法，以产生用于预测免疫可能性的得分。来自疫苗应答者和无应答者的谱的数据用来产生该算法。该算法然后可以用来利用从免疫后获得的样品预测的相关克隆型预测下一患者中免疫的可能性。通过应用也是在发现研究中产生的另一算法进行预测。它可以任选地由来自预先校准的数据进行辅助(或代替)，以将对相关克隆型的搜索限制为免疫后富集的那些。

本发明的另一实施方案涉及免疫谱分析试验与其它已经用于检测对疫苗接种的应答的标志物的组合，以使试验具有更高的灵敏度和特异性。其它分子标识物或标志物可以用于计算负荷算法或用于确定疾病状态。分子标识物可以包括核酸、蛋白质、碳水化合物和脂质，核酸或蛋白质的表达谱。分子标识物可以是人或非人来源的(例如，细菌)。标识物或标志物可以通过包括以下的技术确定，例如，比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达概况分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附测定(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹分析、Southern印迹分析、SDS-PAGE、凝胶电泳和Northern印迹分析。

G.免疫谱分析在监测免疫超敏反应(变态反应)中的应用

适应性免疫系统已经进展为响应与病原体有关的抗原。如同自身免疫病中一样，免疫系统有时可能具有错误的靶标。在自身免疫病中，免疫系统针对自身抗原，而在超敏反应中，它产生对有害的刺激物如药物、粉尘和食物的应答。超敏反应非常常见，多达50％的美国人口对环境刺激物具有变态反应，并且它是由药物引起的。超敏反应分为4类。I型超敏反应是速发型超敏反应，由IgE介导。II型超敏反应通常是由于IgG抗体与细胞表面结合的抗原结合引起的。例如，与细胞表面结合的无害的药物可以使细胞成为碰巧具有这些抗体的患者中的抗药物IgG的靶标。III型超敏反应是由抗原-抗体复合物在组织上的沉积引起的。这发生在例如抗原量大导致小免疫复合物不能被有效清除、而是沉积在血管壁上时。IV型超敏反应是由T细胞介导的迟发型超敏反应。I型和IV型超敏反应对人类健康具有最大的影响。

在I型超敏反应中，患者通过产生抗无害抗原(变应原)的IgE抗体而对该抗原致敏。后来暴露于变应原诱导IgE-结合细胞如肥大细胞和嗜碱性粒细胞的活化。一旦被活化，这些细胞就通过分泌储存的化学物质和合成细胞因子、白三烯和前列腺素诱导炎性过程而引起变应性反应。变应原的剂量和进入途径决定了变态反应的程度，其程度可能从变应性鼻炎的症状到过敏反应中的危害生命的循环衰竭。通常急性I型反应之后为另一个晚期阶段，该晚期阶段在产生的许多病理性过程中起作用。T辅助细胞和其它炎性细胞的募集的晚期基本上是IV型超敏反应。一些I型变态反应包括季节性鼻炎结膜炎(花粉症)、食物变态反应、药物诱导的过敏反应、特应性皮炎(湿疹)和哮喘。这些是具有流行性升高的非常常见的病症，引起高成本以及发病率和死亡率。例如，哮喘是一种慢性疾病，它影响到美国人口的大约7％，每年导致约4,000例死亡。这些疾病中的一些具有一些相关的方面。例如，特应性皮炎患者具有显著提高的患哮喘的危险。食物变态反应可以引起呕吐和腹泻，但是也可以在相当数目的患者-30,000名—中导致过敏反应，在美国每年导致约200例死亡。激活鼻中粘膜下肥大细胞引起变应性鼻炎症状的的某些相同变应原也可以激活下呼吸道中的肥大细胞，引起支气管紧缩，这是哮喘的一种典型的症状。一些IV型超敏反应是接触性皮炎(例如，毒葛)、慢性鼻炎、慢性哮喘和乳糜泻。乳糜泻是一种由非IgE介导的食物变态反应引起的慢性病。它是由针对谷蛋白的变应性应答引起的小肠疾病，谷蛋白是小麦和其它食物中存在的一种成分。超过95％的乳糜泻患者具有特定的MHC II类等位基因，HLA-DQ2。

超敏反应的治疗不同，但是它们通常具有两个方面：急性治疗和慢性控制或预防。这些病症中的一些可能是危害生命的(过敏反应和急性哮喘)并且引起直接医学关注。慢性控制通常包括试图避免特定变应原。当变应原能够清楚地鉴别时(例如，对坚果过敏)，这可能是有效的，但是当变应原广泛存在于环境中时，如花粉或粉尘，这可能是困难的。因此，药物慢性治疗通常用于这些疾病中的一些疾病(例如，哮喘和变应性鼻炎)。当患者重新暴露于变应原时，最终测试治疗控制的有效性水平。因此一些患者可能过度治疗或治疗不足。理想地，可以采用评价疾病活动性和患者倾向于发生超敏反应的程度的试验。这种试验将允许根据个体患者需要调整治疗。

实施例

实施例1

确定自身免疫病患者中重组DNA的序列

血液样品采自自身免疫病患者。CD4+和CD8+细胞使用抗体包被的磁珠从血液样品中分离。PCR用来扩增T细胞受体β基因的完整可变区。将扩增的片段亚克隆到载体中，并转化细菌，以分离DNA片段。培养细菌，以扩增DNA，利用双脱氧测序对T细胞受体β基因的可变区测序，以鉴别克隆型。测序信息用来产生患者的克隆型谱。一种类似的方法显示在图1中。

实施例2

确定自身免疫病的状态

脑脊液(CSF)和血液样品采自多发性硬化发作高峰的患者。CD4+细胞从CSF和血液中分离，T细胞受体β基因的CDR3通过PCR扩增。将扩增的片段亚克隆到载体中，并转化细菌，以分离DNA片段。培养细菌，以扩增DNA，利用双脱氧测序对T细胞受体β基因的可变区进行测序，以鉴别克隆型。测序信息用来产生患者的克隆型谱。

另一份血液样品在患者处于多发性硬化的相对不活动状态时采集。重复如上所述的相同程序以产生克隆型谱。病理性克隆型被确定为在高峰发作时高而在不活动状态时明显下降的克隆型。另一份血液样品采自处于稍后状态的患者。在此时，只有一部分T细胞受体β基因CDR3区被扩增，然后测序。该亚群含有病理性克隆型。确定各种克隆型的水平以评估患者的疾病状态。

实施例3

TCRβ所有组成成分分析：扩增和测序策略

为了研究TCR所有组成成分的扩增，分析TCRβ链。该分析包括扩增、测序和分析TCRβ序列。一个引物为AGCGACCTCGGGTGGGAACA，互补于Cβ1和Cβ2中的共同序列，有34个V引物(表1)能够扩增全部48个V区段。Cβ1或Cβ2在自J/C连接的位置10和14彼此不同。用于Cβ1和Cβ2的引物将在位置16bp终止，并且对于Cβ1或Cβ2应当没有偏性。

34个V引物从BIOMED-2小组发表的一组原始引物修饰而来，以扩增全部48个V区段和他们发表的国际ImMunoGeneTics信息系统定义的全部等位基因(http://imgt.cines.fr/)。

BIOMED-2引物已经多重使用以鉴别淋巴细胞增生性疾病中的克隆形成能力。

表1.互补于不同V家族的引物序列

V区段家族	引物序列
		V20-1	AACTATGTTTTGGTATCGTCAGT
V29-1	TTCTGGTACCGTCAGCAAC
		V9，5-1，5-6，5-5，5-8，5-4A	AGTGTATCCTGGTACCAACAG
V9，5-1，5-6，5-5，5-8，5-4B	AGTGTGTACTGGTACCAACAG
		V9，5-1，5-6，5-5，5-8，5-4C	ACTGTGTCCTGGTACCAACAG
V9，5-1，5-6，5-5，5-8，5-4D	AGTGTGTCCTGGTACCAACAG
		V9，5-1，5-6，5-5，5-8，5-4E	TCTGTGTACTGGTACCAACAG
V7-3，7-6，7-9，7-2，7-4A	CCCTTTACTGGTACCGACAG
		V7-3，7-6，7-9，7-2，74B	GCCTTTACTGGTACCGACAG
V7-3，7-6，7-9，7-2，7-4C	CCCTTTACTGGTACCGACAAA
		V7-8，16A	TTTTGGTACCAACAGGTCC
V7-8，16B	TTTTGGTACCAACAGGCCC
		V 7-7	AACCCTTTATTGGTATCAACAG
V4-1，4-3，4-2A	CGCTATGTATTGGTACAAGCA
		V4-1，4-3，4-2B	GGCAATGTATTGGTACAAGCA
V12-3，12-4，12-5	TTTCTGGTACAGACAGACCATGA
		V3-1	TACTATGTATTGGTATAAACAGGACTC
V25-1	CAAAATGTACTGGTATCAACAA
		V28，10-3，6-2，6-3，6-1，6-6，24-1A	ATGTTCTGGTATCGACAAGACC
V28，10-3，6-2，6-3，6-1，6-6，24-1B	ATGTACTGGTATCGACAAGACC
		V6-4，6-9A	TGCCATGTACTGGTATAGACAAG
V6-4，6-9B	ATACTTGTCCTGGTATCGACAAG
		V10-1，10-2，6-5，6-9，6-8，27A	ATATGTTCTGGTATCGACAAGA
V10-1，10-2，6-5，6-9，6-8，27B	ATATGTCCTGGTATCGACAAGA
		V10-1，10-2，6-5，6-9，6-8，27C	ACATGTCCTGGTATCGACAAGA
V14	TAATCTTTATTGGTATCGACGTGT
		V19	GCCATGTACTGGTACCGACA
V18	TCATGTTTACTGGTATCGGCAG
		V30	CAACCTATACTGGTACCGACA
V11-1，11-3，11-2A	CATGCTACCCTTTACTGGTACC
		V11-1，11-3，11-2B	CACAATACCCTTTACTGGTACC
V2	ATACTTCTATTGGTACAGACAAATCT
		V13	CACTGTCTACTGGTACCAGCA
V15	CGTCATGTACTGGTACCAGCA

使用34个合成序列测试引物在扩增中的应用。合成序列在一侧含有一个寡核苷酸的序列，在另一侧含有C引物的互补序列。在两个引物之间是对应于限制酶切位点Cla I的6bp。所有合成序列都用适当的引物扩增，通过Cla I消化证实扩增产物是扩增合成序列的结果，而不是通过引物二聚体的形成。

Illumina基因组分析仪是选择的测序平台。在每个泳道中，可以进行约1500万个阅读。每个泳道运行12个人样品和96个小鼠样品，利用序列标签区别一个样品与另一个样品的阅读。可以进行两阶段扩增筛选，如图2所示。如图2A所示，第一PCR在一侧使用20bp引物，该引物的3’末端为从J/C连接开始的16个碱基，并且完全互补于Cβ1和Cβ2的两个等位基因。在第二PCR中，在模板的同一侧，使用一个引物，该引物在其3’末端具有最靠近J/C连接的10个碱基的序列，然后是具有自J/C连接的位置15-31的序列的17bp，然后是P5序列。该引物被称为C10-17-P5。P5在簇形成中起作用。当C10-17-P5引物与第一PCR产生的模板退火时，在模板中产生4bp的环(位置11-14)，因为引物与最接近J/C连接的10个碱基的序列和自J/C连接的位点15-31的碱基杂交。位置11-14的成环消除了携带Cβ1或Cβ2的模板的扩增差异。最终，使用引物进行测序，该引物互补于最接近J/C连接的10个碱基的序列和自J/C连接的位点15-31的碱基(该引物被称为C’)。C10-17-P5引物可以被HPLC纯化，以确保所有扩增材料都具有在簇形成中能够有效使用的完整末端。

在图2B中，显示V引物上的突出端的长度为14bp。较短的突出端对第一PCR可能有帮助。另一方面，对于第二PCR，在第一PCR中使用的V引物中具有尽可能长的突出端可能是有利的，因为第二PCR将从该序列引发。第二PCR中非常低效的引发可能引起最终数据中的代表的限制。

研究了支持有效的第二PCR的突出端的最小大小。制备了两个系列的V引物(用于两个不同的V区段)，它们具有从10到30bp、梯级为2bp的突出端大小。使用合适的合成序列，使用该系列中的每个引物进行第一PCR，并进行凝胶电泳以显示所有扩增的片段。为了检测第二PCR扩增的效率，使用来自不同第一PCR反应的PCR产物作为模板，并使用Read2-tag1-P7和Read2-tag2-P7作为引物，进行SYBR green实时PCR。使用全部4个系列的实时数据获得了一致的图片(2个第一PCR使用两个不同的V区段，两个第二PCR使用含有两个不同标签的不同的引物)。在突出端大小10和14bp之间效率提高。然而，在突出端超过14bp时效率没有提高或仅有很小的提高。当突出端变为小到14bp时，效率保持较高，因为高引物浓度使得14bp足以在大大高于其解链温度的温度下引发模板。同时，特异性得以保持，因为模板不全是cDNA，而是低复杂性的PCR产物，其中所有分子都具有14bp突出端。

如图2B所示，第一PCR使用34个不同的V引物，所述引物与模板的另一侧退火，并且在5’尾含有共同的14bp突出端。14bp是Illumina测序引物之一(称为Read 2引物)的部分序列。同一侧的第二扩增引物包括P7序列、标签和Read 2引物序列(该引物被称为Read2_tagX_P7)。P7序列用于簇形成。Read 2及其互补序列用于分别对V区段和标签测序。产生一组96个这样的具有标签的引物，从1到96编号(见下)。这些引物可以进行HPLC纯化，以确保所有扩增材料都具有可以有效用于簇形成的完整的末端。

如上所述，第二阶段引物C-10-17-P5(图2A)与第一阶段PCR产生的模板具有中断的同源性。验证了使用该引物的扩增效率。C-10-17-P5的一个替代引物，称为CsegP5，与第一阶段C引物具有完全同源性，并且具有携带P5的5’尾。使用C-10-17-P5和CsegP5扩增第一阶段PCR模板的效率通过进行实时PCR来比较。在几个重复中，发现使用C-10-17-P5引物的PCR与使用CsegP5引物的PCR在效率上没有差异或只有很小的差异。

图2所示的2-阶段扩增产生的分子具有一般用于Illumina测序仪的如图3所示的结构。两个与该分子的最远部分退火的引物，Illumina引物P5(AATGATACGGCGACCACCGAG)和P7(CAAGCAGAAGACGGCATACGAGAT)，用于分子的固相扩增(簇形成)。每个分子进行三个序列阅读。使用C’引物进行100bp的第一个阅读，该引物具有适合于Illumina测序过程的解链温度。第二个阅读只有6bp长，只用于鉴别样品标签的目的。它是使用Illumina标签引物(AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC)产生的。最终阅读为Read 2引物，即一种Illumina引物，具有序列GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT。使用该引物，将产生在V区段的100bp阅读，开始于第一PCR V引物序列。

设计了区别在相同测序泳道中运行的不同样品的一组6bp序列标签，其中每个标签不同于该组中的其它所有标签，有至少2处不同。如果存在测序错误的话，这2处不同阻止了阅读被错误分配给错误的样品。为了比较标签进行的比对容许空位，因此测序引起的一个缺失或插入错误也不会将阅读分配给错误的样品。在选择标签中额外的特征是限制单碱基运行(4个A或T和3个G或C)以及与Illumina引物没有相似性。在使用其中96个的前提下总共产生了143个标签。

已经使用从血液样品获得的cDNA，使用全部34个不同的引物，进行了实时PCR。不同的引物获得不同的Ct值。每个PCR产物进行凝胶电泳，证实有一条带。另外，将全部34个引物合并，进行PCR，再次获得了一条PCR带。

扩增优化

多重扩增可以使用所有V区段。扩增不同序列的一个问题是不同序列的相对扩增效率，以及不同序列的初始相对量在最终扩增物质中的保持。相对扩增效率可以被再分为不同引物序列的不同效率以及使用相同引物扩增不同序列的不同的效率。效率差异可能是由于不同的引物序列。优化该反应以试图获得保持通过不同V区段引物扩增的序列的相对丰度的扩增。其中一些引物是相关的，因此许多引物可能“串扰”，扩增与之不完全匹配的模板。可以优化条件，使得每个模板可以以类似的方式扩增，而与哪个引物扩增无关。换句话说，如果有两个模板，则在1,000倍扩增后，两个模板都可以扩增大约1,000倍，与对于模板之一，扩增产物的一半由于串扰携带不同引物没有关系。在测序数据的后续分析中，引物序列将从分析中消除，因此与扩增中使用哪种引物无关，只要这些模板同样地扩增即可。

由于cDNA中每个模板的量未知，使用34个单路PCR反应从cDNA产生了标准组。这些反应中的每一个的产物包含多个具有一个V引物的序列。对不同的产物仔细定量，以产生一组相同浓度的标准。使用全部34个引物的集合，使用该引物集合并使用每个标准序列作为模板进行34个实时PCR。理想地，通过实时PCR，全部34个标准显示相等的扩增效率。这提示每个序列相等地扩增，即使串扰的存在使其不清楚哪些引物正在进行扩增。这种优化符合具有相等扩增的目的，与并入扩增产物的实际引物无关。如根据提高扩增效率所预期的，提高总引物集合浓度显著缩小了动态范围。此外，对于似乎比平均值更有效扩增的模板，集合中完全匹配的引物的浓度降低。相反，对于无效扩增的模板，完全匹配的引物的浓度升高。这种优化证明了所有模板都在平均扩增的2倍内扩增。

理想地，第一PCR具有少量的循环，以使不同引物引起的差别扩增最小化。使用一对引物进行第二扩增，因此差别扩增的问题最小。1％的第一PCR直接进行第二PCR。在两个扩增之间使用的35个循环(等同于没有100倍稀释步骤的约28个循环)足以显示稳定的扩增，无论循环的分解是1个主循环和34个次循环，还是25个主循环和10个次循环。即使理想地在第一PCR中只进行1个循环可以降低扩增偏性，也存在其它考虑。其中一方面是代表性(representation)。在起始输入量相对于最终获得的阅读数不过量时，这起作用。例如，如果获得1,000,000个阅读，并且开始于1,000,000个输入分子，则只取100,000个分子的代表进行第二扩增将会降低估计原样品中不同物质的相对丰度的精确度。两个步骤之间的100倍稀释意味着代表性将降低，除非第一PCR扩增产生明显多于100个分子。这翻译为最少8个循环(256倍)，但是更合适地为10个循环(约1,000倍)。替代方案是将超过1％的第一PCR进行第二PCR，但是由于第一PCR中使用的引物的高浓度，高稀释倍数可以用来确保这些引物不干扰扩增和恶化序列之间的扩增偏性。另一种替代方案是增加纯化或酶步骤，以从第一PCR中消除引物，以允许更小的稀释倍数。在该实施例中，第一PCR是10个循环，第二PCR是25个循环。

测试高保真酶

具有较高保真度的酶可以用来使错误最小化。该试验已经使用Taq聚合酶优化。为了验证Accuprime以及Taq高保真度的应用，使用Taq聚合酶、Accuprime或Taq高保真度以及引物集合扩增了cDNA。每个扩增的物质然后用作34个实时PCR的模板，每个实时PCR使用34个V引物之一和1个C引物。量化模板的相对量。在Accuprime、Taq高保真度和Taq中发现了每个模板的浓度之间的高相关性(r²＞0.95)，证实了这些高保真酶的应用。

扩增条件的验证

使用引物集合，对没有cDNA背景的标准模板进行优化。目的是在cDNA混合物中获得这些结果的验证。为了显示再现性，一式两份使用寡核苷酸集合扩增cDNA。在两个扩增的每一个中定量34个产物中的每一个。如图5所示，再现性非常出色。

对于图5，使用合并的TCRβ引物和C引物和一个作为模板的cDNA样进行两个第一PCR反应。使用实时PCR评估用34个V引物中的每一个(和一个C引物)可扩增的模板扩增材料中每一个的相对丰度。使用两个扩增产物中的每一个作为模板，在每个反应中使用C引物和一个V引物进行34个不同的实时PCR反应。对于两个样品，使用所有的V引物，通过实时PCR确定的相对丰度具有高度再现性，表明多重扩增高度可再现。使用一个多重扩增产物作为模板的每个实时PCR扩增的循环数(Ct值)显示在X轴上，使用第二多重扩增产物作为模板显示在Y轴上。

为了评估扩增偏性，可以使用类似的技术。可以使用cDNA作为模板使用寡核苷酸集合来扩增。然后通过34个不同引物中的每一个(与C区段引物)扩增的模板的量可以使用实时PCR定量，并且该量可以与使用相同引物从cDNA扩增的量进行比较。然而，由于存在串扰，即使扩增产物中的内部序列和cDNA之间的相对丰度相同，使用该读数也可能检测到大的差异。为了克服该问题，设计了12个寡核苷酸，它们当与C区段引物一起使用时能够扩增V区段引物内部的序列。如果适当地进行优化，则这些内部序列的浓度在cDNA和扩增产物之间应当变化很小。这显示在图6中。

对于图6，使用cDNA样品作为模板用于使用合并的TCRβ引物和C引物的多重扩增。使用C引物和用于初始扩增的V引物下游的引物(称为内部引物)，以来自多重扩增的物质为模板，评估不同序列的相对丰度。类似地，实时PCR用来评估这些相同的序列在cDNA中的相对丰度。如果多重扩增具有大的偏性，则扩增物中的相对丰度可能与cDNA中明显不同。从图6中可见，观察到高相关，证明了多重扩增中的最小扩增偏性。使用内部引物的实时PCR扩增中的每一个的循环数(Ct值)和作为模板的cDNA和多重扩增产物分别显示在X和Y轴上。

TCRβ测序

进行6个多重扩增，其中使用集合的寡核苷酸和一个作为模板的cDNA样品。每个扩增使用Accuprime进行三次，另外3个使用高保真Taq。使用每种酶的两个扩增使用对应于500ng初始RNA的cDNA，使用每种酶的一个扩增使用少10倍的cDNA。对于6个反应中的每一个，进行第一和第二PCR，扩增的物质利用Illumina平台和上述方案进行测序。从每一侧获得100bp序列。使用下述相同概念进行数据的主要分析。

为了评价试验的可再现性，确定在重复两次的实验中克隆型水平是否一致。如图8A-C所示，当使用相同的酶和起始输入cDNA量时获得高相关性(2个比较中的每一个具有r²＝0.944)。当使用不同的酶时，相关性变差(对于4个可能的组合，相关性中值为r²＝0.931)，并且当使用2种酶扩增较小的输入cDNA(对应于仅50ng RNA)时，只有适度降低(r²＝0.924)。

对于图8，鉴定每个样品中相同的序列。然后处理测序错误，使用序列的主要分析章节中描述的普通方法，某些克隆型合并形成较大的克隆型。然后对每个样品计算克隆型的计数。一部分克隆型(未显示在图中)存在于一个样品中而不存在于另一个样品中，这可能是由于该算法将它们与一个样品中的另一种克隆型合并而不与其它的合并。然后比较样品中克隆型的频率，即，其计数除以该样品获得的阅读总数。例如，如果对于具有1,000,000个阅读的样品中的克隆型观察到1,000个计数，则其频率计算为0.1％。图8A显示使用Accuprime和对应于作为输入模板的500ng RNA的cDNA，两个重复样品中每个克隆型的频率的log₁₀。这些重复之间的相关性(r²)为0.944。图8B显示使用对应于500ng RNA的cDNA作为输入模板和Accuprime(X轴)或高保真Taq(Y轴)，每个克隆型的频率的log₁₀。与该组合进行4次比较，相关性中值为r²＝0.931。图中所示的一个具有r²＝0.929。图8C显示使用作为输入模板的对应于50ng RNA的cDNA和Accuprime(X轴)或高保真Taq(Y轴)，每个克隆型的频率的log₁₀。观察到的相关性为r²＝0.924。

这些结果证实了试验的可再现性，并且符合当比较不同的酶时再现性变差的预期。当使用更少量的输入cDNA时观察到进一步的减少，这反映了输入材料中较低的代表性导致在反映血液中不同克隆型的相对丰度时较差的精确性。另外，可能相关性的某些减少是由于较低输入需要额外的扩增(10倍)，但是这可能是次要效果，因为存在扩增的高再现性的证据。

实施例4

IgH所有组成成分分析：扩增和测序策略

TCRβ和IgH中CDR3的扩增之间的一个差异是，由于IgH中存在体细胞突变的可能性，在IgH的研究中每个V序列将要使用多个引物。对于每个V区段将使用三个不同的引物。引物在避开CDR的区域中，CDR具有最高的体细胞突变。进行三个不同的扩增反应。在每个反应中，每个V区段用三个引物之一扩增，并且全部使用相同的C区段引物。每个反应中的引物距V-D连接有几乎相同的距离。假定V区段的最后位置为0，则第一组引物(A)在大致-255处具有3’末端，第二组(B)在大致-160处具有3’末端，第三组(C)在-30处具有3’末端。由于几个V区段之间的同源性，为了扩增全部48个V区段和许多已知的等位基因(如国际ImMunoGeneTics信息系统定义的，http://imgt.cines.fr/)，需要23、33和32个分别在A、B和C框架内的引物。引物列表在表2、3和4中显示。

表2框架A引物

表3用于框架B的引物

表4用于框架C的引物

在C区段侧，在它们之间具有一个碱基差异的两个序列(GCCAGGGGGAAGACCGATGG，和GCCAGGGGGAAGACGGATGG)覆盖IgG的四个区段和多个已知的等位基因。使用类似于用于TCRβ基因的PCR的两个阶段的方案。在V侧，使用在每个V引物上的相同的5’14bp突出端。在第二PCR中，使用在V侧上的相同的Read2-tagX-P7引物。在C侧，使用类似于用于TCRβ扩增的策略来避免不同的IgG区段和它们的已知等位基因之间的变异。引物序列(AATGATACGGCGACCACCGAGATCTGGG AAG ACGAT GG GCCCTT GGT GGA)包含C区段位置3-19和21-28的序列，它跳过位置20和P5序列，位置20在不同IgG等位基因的至少一个中具有不同碱基，P5序列可用于形成簇，如图4所示。

3个框架内的所有引物成功用于从cDNA扩增单带。类似地，在第一PCR中使用三个引物集合的第一和第二PCR策略显示一条带，如图7所示。

对于图7，使用cDNA作为模板使用对应于3个框架的3个引物集合进行多重PCR。在第一和第二PCR后，产物在琼脂糖凝胶上电泳。A表示来自框架A的寡聚物集合的PCR产物。类似地，B和C表示集合B和C的产物。M是标准物泳道。使用所有3个集合获得具有适当大小的单带。

最终，对一个样品的3个不同的反应以等摩尔比混合，并进行测序。测序使用两个Illumina引物从两个方向进行。从每一侧测序100bp。与TCR的相比，BCR的包含D+J区段的最大种系序列长大约30bp。因此，如果在连接处(N和P核苷酸)核苷酸去除和添加的净结果对于IgH和TCRβ产生类似的分布，预计C区段后平均90bp、最大120bp的序列足以到达V区段的3’。因此，在大多数情况下，来自C引物的序列足以到达V区段。从Illumina衔接子之一测序应当鉴别使用的V区段以及鉴别V区段中的体细胞超突变。V区段的不同片段将根据该序列来自于三个扩增反应中的哪一个进行测序。BCR的完整序列可以从来自于不同扩增反应的不同阅读进行比对。从一端开始的显示完整CDR3序列的测序反应将大大提高不同阅读的精确比对。

实施例5

人序列数据的主要分析

对于每个患者样品，各获得100bp配对末端阅读的大约100万高质量阅读。假定这100万个阅读是独立的，来源于从100万个或更多的细胞获得的100万个或更多的RNA分子。低质量的阅读将被去除。

预期将有大约1％的错误率。错误可能是由于逆转录酶、PCR过程中或测序过程中的扩增。将使用用于PCR步骤的防错酶；因此测序错误(～1％)将是错误的主要来源，因为PCR错误率低于0.1％。在存在瓶颈的情况下，PCR与逆转录酶错误的相关性将极大地放大。例如，如果以超过100,000个RNA分子开始，或者不同分子操作步骤之一不无效使得有效分子群体为100,000，则可能发生瓶颈。在这些情况下，在许多簇中可能由于PCR或逆转录酶而发生相同的错误。

将获得TCRβ和IgH的数据。由于IgH中的体细胞超突变和扩增策略的不同，TCRβ和IgH的主要分析将略有不同。

TCRβ

在一端，将使用C’区段引物测序。将被测序的V区段的长度取决于增加的N+P核苷酸的长度。考虑到增加的核苷酸的平均数，对V区段的约40个核苷酸进行测序。另一端使用Illumina测序引物P7。将获得V引物序列的20bp和随后V区段序列的80bp的序列。

阅读将与种系V区段(包括不同的已知等位基因)进行比对，以将V区段分配给每个阅读。基本不匹配任何V区段的阅读将从进一步的分析阅读中排除。基本匹配被定义为不超过5个错误的情况。考虑到1％的随机错误率，预期该方案将排除＜1％的由于错误引起的阅读。其余的序列将分配给具有最高匹配的V区段。扩增同一家族的V区段的引物通常与它们之间的一个或几个碱基差异高度相关。这些引物可能“串扰”，扩增其它家族成员。因此，测序阅读的开始(引物)可以是不同于其余阅读所属V区段的V区段。这些情况将被容许，并且不会计为错误。

评价从V区段末端到C区段开始的序列。该序列被称为DJ区。该序列平均为60个碱基，非常小的一部分大到90个碱基。在大多数情况下可能能够分配J区段，因为靠近C区段的末端可能被保留。另一方面，D区段可能难以分配，因为其大小较小(15-16bp)，并且在两个末端都发生修剪和添加。需要注意的是当分配J区段时能够预测D和C区段。在分配该区段后，将定义DJ区的序列。由于两个原因，错误使得该分析比C和V区段比对更加复杂。首先，DJ比对中的错误可能发生在排列的两个阅读的任一个中，从而有效倍增了一个阅读与数据库序列的比对的错误率。

另外，C或V比对中的一个碱基的差异可以容易归因于错误(除了以前未描述的V种系等位基因的极少情况以外)，与V区段具有一个碱基差异的序列可以分配为具有V区段的序列。另一方面，尚不清楚两个DJ区阅读之间一个碱基的差异是由于错误还是由于两个克隆型之间的真正的序列差异。存在两种可能性：阅读属于相同的克隆型但是具有错误，或者存在两种或多种不同的克隆型。当它们由于测序错误而出现的几率低时，克隆型将被称为不同的，因为它们被频繁观察或者因为它们在太多碱基上不同。

预期PCR错误将集中在PCR早期循环中突变的一些碱基上。预计测序错误分布在许多碱基中，尽管它总体上是随机的，因为错误可能具有一定的系统偏性。假定一些碱基具有较高几率的测序错误，如5％(平均值的5倍)。考虑到这些假设，测序错误成为主要的错误类型。区别PCR错误与高度相关克隆型的发生将在分析中起作用。由于确定存在两个或更多高度相关的克隆型的生物学意义，将采用保守方法进行这种检出(calls)。将考虑检测足够的次要克隆型，以便高置信度(即99.9％)地确保存在一个以上的克隆型。例如对于以100个拷贝/1,000,000存在的克隆型，将比所谓的独立克隆型14倍或更多倍地检测到次要变体。类似地，对于以1,000个拷贝/1,000,000存在的克隆型，可以比所谓的独立克隆型74倍或更倍地检测到次要变体。使用每个测序碱基获得的碱基质量得分可以增强这种算法。如果质量得分与错误率之间的关系如上得到验证，则可以不使用对于所有碱基的保守的5％错误率，而可以使用质量得分来决定检出独立克隆型需要的阅读数。可以使用所有阅读中特定碱基的质量得分中值，或者更严格地，在给出每个阅读中特定碱基的质量得分的情况下，可以计算成为错误的可能性，然后可以组合这些概率(假定独立)以估计该碱基的可能的测序错误数。结果，对于具有不同质量得分的不同碱基，将有不同的反对测序错误假设的阈值。例如，对于以1,000个拷贝/1,000,000存在的克隆型，如果错误概率分别为0.01和0.05，次要变体当以22和74倍检测出时被称为独立的。

在将太频繁发生因而不是由于错误引起的克隆型指定为独特的或独立的之后，将考虑允许将克隆型由于在太多碱基中的差异而指定为独立克隆型的标准。预期少于0.1％的时间，两个阅读在它们之间的60bp中将有超过4个错误。因此，这将用作认为两个克隆为独立的或不同的截止值。将要使用的算法如下。将注意到具有最大计数数的克隆型(克隆型1)，并将确定是否存在任何其它的克隆型与克隆型1具有相同的V区段并在DJ区中具有4个或更少的碱基差异。如果鉴别到超过一种这样的克隆型，首先评价这些克隆型中的最大者。上述规则将用于决定是将该克隆型指定为独立克隆型还是与主要克隆型相同。如果它不被指定为独立克隆型，则它将作为具有克隆型1的序列而被计数。在这种训练结束时，将获得所有克隆型的序列和计数。该方法确保克隆型在不为独立克隆型时不被指定为独立的。然而，一些真正独立的克隆型可能被错误分类(与主要克隆型有少量差异，不常见)为相同的。与两种克隆型在不是独立克隆型时认为其为独立的情况相比，这种错误类型将有更低的伤害性。

IgH

对于C区段末端的测序，将使用Illumina引物。将要测序的第一个碱基是C区段引物，随后是C区段的0-2个碱基，然后是DJ区。引物序列将确定特定阅读属于哪个同种型。所有或大多数DJ序列可以通过从C区段侧阅读获得。预期DJ区平均为80bp。因此，100bp阅读将包括C区段引物和平均DJ区。一些DJ区可能大至120bp，它们的完全阅读可能包括来自V区的测序数据(不计数在同一IgH中发现两个D区段的情况)。

最初将考虑从C区段获得的DJ区的序列。将计数每个独特序列的数目。如对于TCRβ所讨论的，相关序列中的一部分可能来自于同一克隆型，但具有一些测序和PCR错误。为了指定两个克隆型为不同的，需要确定该差异是否非常不可能通过PCR错误产生。将使用如上所述相同的方案，该方案要求最小数目的次要克隆型的独立观察或最小数目的两个克隆型之间的差异。将使用与对于TCRβ所述相同的规则来确保＜0.1％的克隆型被错误分类为不同的。

从V区测序将使用Illumina引物进行。每个V区段将使用3个不同的引物。引物将置于大致-200、大致-100和大致-30处。第一个测序的碱基是V引物序列，然后是更多的V区段碱基。特定阅读将分配给特定V区段的三个引发框之一。首先通过研究引物序列进行分配，因为该引物具有不能改变的已知的序列。相同家族的引物有时可能具有一定的“串扰”，从而扩增同一家族中高度相关的序列。该引物将用来分配该家族。该家族区段之间的特定V区段将通过鉴别与测序阅读最相似的家族V序列来确定。IgH中的V区段可能在抗体亲和力成熟过程中具有体细胞突变，因此将允许比TCRβ更高比例的与种系序列的差异。已经观察到在VDJ区中具有超过25个突变(～10％)的抗体。阅读将被分配给具有最接近的序列的V区段的框架，只要它与之具有＞85％的同源性。将使用上述相同的方案评价相关的克隆型是否为独立的。特别是对于将被认为是不同的克隆型和由于体细胞突变而不是由于错误的克隆型，它们需要是充分频繁的或者在它们之间具有足够的变异，以确保少于0.1％的克隆型在不是不同克隆型时被错误分类为不同的。

对于确定具有第三个框架(最靠近VD连接)的阅读，将确定配对末端阅读之间的重叠序列。不与V区段对齐的碱基将与第一阅读的互补序列比对，以确定重叠。用于第三框架的引物将离开该连接大约30bp。因此，如果V是完整的，可以使用大约50bp序列到达VD连接(20bp引物+30bp)，100bp阅读将允许50bp在该连接之后被阅读。这是在VD连接后阅读的碱基的最小预期数，因为V中一些碱基的缺失将允许在该连接后更长的阅读。甚至对于最长的DJ区，预计在来自配对阅读的序列之间有10bp重叠。预计最长的DJ区为120bp，其80bp预计从C区段阅读，50bp从V区的另一方向阅读，导致在配对阅读之间有10bp的重叠。

从C引物阅读相同序列但是具有相同V区段的不同框架的克隆型成为用于在相同克隆型合并的候选者。如果在从V区段的不同框架获得的序列之间存在重叠，则使用与上述相同的规则确定克隆型是否是独立的。

作为上述分析的结果，可以计数每个克隆型的阅读数。鉴别出来自相同家族的、彼此仅由于体细胞突变而不同的克隆型。这些体细胞突变可能限制于只来自一个框架、超过一个框架、或DJ区中的V区段阅读中的序列。

实施例6

SLE患者样品中的TCR和IgH所有组成成分分析

首先检测是否存在与患者的疾病活动性相关的克隆型。其次，定义区别与疾病相关的克隆型和与疾病无关的克隆型的一组序列特征和/或细胞表面标志物。第三，确定克隆型分析提供临床有用的信息的程度，如与短期(例如，3个月)结果的相关性。

1.与疾病相关的克隆型的存在

有两个主要任务：鉴别相关克隆型和由它们的水平测定疾病活动性。这些任务可以在临床条件下对于每名患者分两个步骤进行：

1)可以进行校准试验以确定特定患者的相关克隆型的身份。这可以通过对每名患者在发作高峰时测序IgH和TCRβRNA(或来自单细胞的连接的TCRα-TCRβ序列)进行，此时相关克隆型水平可以达到其最高水平。

2)可以在校准试验之后的时间点进行监测试验以确定相关克隆型的水平。这可以通过测序IgH和TCRβRNA和确定已在同一患者的校准样品中鉴别的特定相关克隆型的水平进行。相关克隆型的水平用来计算这些时间点的疾病活动性。

如上所述的扩增、测序和主要分析开发将用来评价患者样品。具体地，评价一组系统性红斑狼疮(SLE)患者，这些患者具有一年的随访期和在此期间的系列血液样品。这些患者由Johns Hopkins Medical School的Michele Petri博士每3个月观察一次，共一年，疾病活动性的临床检查，包括系统性红斑狼疮疾病活动性指数(SLEDAI)、医生总体评价(PGA)以及多项实验室检验，包括C3(补体3)和抗-ds DNA水平，可用于所有患者的所有随访。给予患者的药物包括强的松、硫酸羟氯喹(plaquenil)、NSAID、NSAID型、乙酰水杨酸(ASA)剂量、波立维、利尿剂、ACE-抑制剂或血管紧张肽受体阻断剂(ARBs)、Ca通道阻滞剂、去炎松和甲强龙。研究在随访期间至少一次有疾病活动性明显改变的患者，该疾病活动性改变根据SLEDAI的3点变化或PGA的1点变化定义。总共有181名患者(总共815个血液样品)满足这些标准。来自所有这些血液样品的RNA进行多重PCR，该PCR使用上述引物扩增包括IgH和TCRβ中的CDR3的序列。所有扩增的物质都进行测序(至百万阅读)，并确定不同克隆型的丰度。

使用临床数据、测序，可鉴别区别其水平与疾病活动性有关的克隆型和其水平与疾病活动性无关的克隆型的特征。其次，将开发出一种使用血液IgH和TCRβ谱确定疾病活动性的算法。

2.相关克隆型的特征的鉴别

预期与疾病相关的克隆型将在高疾病活动性时提高。但是，不是所有在高疾病活动性点时富含的克隆型都必然与疾病相关。例如，在特定患者中，在高疾病活动性点时可能有10个富含的克隆型，但是只有5个与疾病相关。为了鉴别这些相关的克隆型，将研究明显与疾病相关的克隆型亚群和明显与疾病无关的另一组克隆型。将研究区别这两类克隆型的特征。

在该实验设计中，所有患者在一年的随访期将具有至少一个明显的疾病活动性改变。将分析每名患者在疾病活动性高峰时获得的IgH和TCR克隆型。在具有最高克隆型水平的那些中选择相关和不相关克隆型组。因此第一步是定义高水平的克隆型。选择进入分析的克隆型的具体标准包括克隆型的频率秩和克隆型水平(每百万个中的克隆型阅读数)的组合，以及克隆型不属于低频率克隆型分布的证据。

来自每个患者样品的这组克隆型，被称为高普遍性克隆型(HPC)，将进一步分析。评价这些克隆型中的每一个的水平与临床量度之间的相关性。计算SLEDAI得分与克隆型水平的相关性。对于每名患者，有4-5个研究点可以用来评价SLEDAI与每个HPC水平的相关性。将研究这些获得的相关性的分布。预期大部分HPC与SLEDAI具有低相关性。研究在高相关端点是否相对于预计随机产生的值过量。例如，使用4和5个数据点，预期约2.5％和约0.6％的相关水平(r²)将偶然＞0.9。较高比例的r²＞0.9的HPC表示存在与疾病相关的克隆型。除了比较相关克隆型数与随机期望值以外，还将进行排列分析(permutation analysis)，其中计算一名患者的SLEDAI得分与另一患者的个体HPC水平之间的相关性。这种排列产生的相关性的分布可以用作“背景”相关性。(为了确保其有效性，将证实不同患者之间的SLEDAI之间几乎没有相关性)。在高相关端点的过度相关，例如，r²＞0.9，将表示存在与疾病相关的克隆型。挑出最高相关的克隆型作为相关克隆型组。因为已知偶然相关性高于组阈值的HPC数(根据使用随机假设的计算或通过上述排列分析)，定义相关克隆型的阈值可以设置为使得具有10％的假发现率，即相关克隆型组中的10％被偶然相关。挑出与SLEDAI得分极低相关的一组HPC。它们将用作不相关克隆型。这两组克隆型可以进一步分析，以鉴别可以区别它们的特征。然后可以在新的样品中寻找这些特征，以确定这些样品中可能与疾病活动性相关的克隆型。然后可以检测这些克隆型的血液水平以确定疾病活动性。

在疾病活动性变化之前克隆型水平可能已经变化的前提引出一个问题。因此可能通过试图只研究与SLEDAI高度相关的HPC，可以去除比SLEDAI更早变化的临床上有用的克隆型。将挑出另一组与改良SLEDAI(MSLEDAI)得分相关的克隆型。除了在显著变化之前紧邻的研究点以外，在所有研究点，MSLEDAI与SLEDAI相同。对于这些数据点，MSLEDAI得分是该研究点和下一研究点之间的SLEDAI得分之间的平均值。在SLEDAI之前改变的克隆型可能显示与MSLEDAI的相关性优于与SLEDAI的相关性。计算过量的与MSLEDAI高相关的HPC数目比通过随机或排列产生的预期值可提供更多的信息。

然后鉴别区别相关克隆型与非相关克隆型的特征。该分析将以用于与SLEDAI或MSLEDAI相关的克隆型的方式进行。在任一种情况下，这些特征组的目的将是正确地概括这种分类，以能够在下一组样品中鉴别相关克隆型。预期每名患者将具有独特的一组相关克隆型，但是训练研究将设计为从校准样品(高疾病活动性)产生预测相关克隆型的规则。可以测试两个普通类型的参数：从测序数据本身获得的参数，和可能使用额外实验的参数。额外实验可以包括评价具有不同细胞表面或其它标志物的不同细胞。以下是将要研究的少数参数类型：

1)序列基序：该基序可以是与关联的克隆型相关的特定V或J区、组合VJ、或DJ区中的短序列。

2)克隆型的大小。

3)水平：绝对水平(每百万个中的阅读数)或等级水平。

4)与其它克隆型的相似性：其它高度相关克隆型的存在，如具有沉默变化(编码相同氨基酸的核苷酸差异)的那些或具有保守氨基酸变化的那些。

5)对于BCR，克隆型中的体细胞突变的水平和/或因体细胞突变而与某些种系克隆型不同的独特克隆型的数目。

将分别研究这些参数中的每一个与相关克隆型的相关性。0.05的阈值(未对多测试修正)设置为消除对相关克隆型预测不可能有贡献的因素。由于多个参数，进行许多测试以偶然产生多个阳性结果。但是，该步骤的主要目的是过滤参数至较小的组。阳性参数组然后用于产生分类两组克隆型的算法。使用机器学习算法，其使用不同参数分类两组克隆型。为了最小化过度拟合的风险，将使用交叉验证技术。使用该算法，每个克隆型将得到对应于其为相关克隆型的可能性的得分。然后设置阈值，以将高于它的克隆型分类为相关的，而将低于它的分类为不相关的。分类精确度可以通过交叉验证技术估计；例如，将克隆型置于相等的组和使用除一组以外的所有克隆型的算法中。最后一组(测试组)中的克隆型然后使用利用其余克隆型获得的算法分类。这经过与组数相同的次数的迭代，在每次迭代中，除了一个组以外的所有组用于训练，一个组被分类。算法的精确度可以由不同迭代中不同分类的平均精确度估计。值得注意的是，在所有这些迭代中，确切的算法略微不同。因此分类的精确度是一个估计值，因为它不是基于最终算法，而是基于使用除了一个之外的所有克隆型的训练数据产生的一组相关算法。

最后，产生对不同的相关克隆型组训练的两个算法：一个与SLEDAI相关，另一个与MSLEDAI相关。即使训练组中的克隆型是不同的，得到的算法可能非常不同也可能不会非常不同，这取决于这些克隆型实际上是否来自两个不同的群体。比较这些算法。另外，这些算法将用来鉴别最初不存在于训练组中的相关克隆型。在两个算法中鉴别的克隆型将进行比较，如果两个训练组中的最初的克隆型来自同一群体，则鉴别的克隆型可能非常相似。除非算法的结果非常相似，将进行两个算法以鉴别相关克隆型，以检测狼疮疾病活动性。

其它实验方法可以提高测序在鉴别与疾病相关的克隆型中的能力。相关克隆型可能在具有某些表面或其它标志物的细胞中富含。例如已知具有高水平CD27的B细胞存在于活动性狼疮患者中，因此可能该相关克隆型在CD27细胞群体中富含。如果证实这是真实的，相关克隆型的预测可以通过富集具有高水平CD27的细胞来改进。特别是，可以对来自血液样品中所有B细胞以及来自具有高水平CD27的B细胞的IgH序列进行测序反应。预计相关克隆型存在于高CD27群体中的频率高于存在于所有血液样品中的频率。

3.使用IgH和TCRβ谱确定狼疮疾病活动性

上节描述了用来鉴别相关克隆型特征的基于克隆型的分析。另外，对于该分析，只使用所有HPC中的一部分清楚地将克隆型指定为相关的或不相关的。该节描述在患者水平上的分析，其目的是计算疾病活动性的量度，称为自身免疫(AI)得分。按照上节开发的算法将用于在所有HPC中鉴别相关克隆型。确定这些相关HPC的水平。相关克隆型的水平可以对TCR克隆型的总数以及对预测与疾病不相关的HPC标准化。这些相关克隆型在不同时间点的水平用来计算在这些不同时间点的AI得分。

在具有一个以上的相关克隆型的患者中，将组合关于这些不同克隆型的水平的信息。另外，将集成来自IgH和TCRβ克隆型的数据。将尝试不同的进行组合的算法。例如，将研究平均值、中值、总和和最高相关克隆型水平。克隆型水平可以是其简单线性阅读计数、其对数或一些其它转换。它可能是相关和非相关克隆型之间的差异。此外，可以利用加权平均值的方法。加权可以基于将要关联的克隆型的可能性。

为了评价哪个模型是最佳的，评价所有模型以鉴别在AI得分和SLEDAI得分之间产生最高相关性的那个模型。对于该分析，对从所有患者的所有研究点获得的所有数据，在SLEDAI与AI得分之间进行相关。为了估计和改善过度拟合的程度，使用交叉验证技术。测定的相关水平反映了AI和SLEDAI得分之间的“横断”(cross sectional)关系。除了SLEDAI以外，研究患者的其它临床量度如C3和抗-ds DNA抗体水平以及尿蛋白/血清肌酸酐与累及血液系统的患者的肾脏表现和血细胞计数之间的相关。这种相关可能是由于患者被分类为高和低疾病活动性，并且不一定是与患者的SLEDAI得分相关的AI的反映。为了证明这一点，进行“纵向”评价。

4.纵向分析

在纵向分析中，评价两个普通问题：一个研究点的AI得分是否预测同一时间点的疾病活动性，和在一个研究点的AI得分是否预测后一点的疾病活动性，例如，3个月后的下一研究点。

在同一研究点AI和SLEDAI得分之间的关系将以两种方式评价。首先，计算每名患者中AI和SLEDAI之间的相关性，然后计算患者相关水平的平均值和中值。如果在上述横断分析中发现的相关是由于高和低疾病活动性患者的分类，而不是改变个体患者内的疾病活动性，则个体患者中的纵向相关可能较低。患者相关水平的高中值提示AI反映个体患者水平的SLEDAI得分。除了AI和SLEDAI得分的相关性以外，评价AI与其它有关量度如C3和抗-ds DNA抗体的相关，以及患者的尿蛋白/血清肌酸酐与累及血液系统的患者的肾脏表现和血细胞计数。

证明AI得分测量个体患者中疾病活动性变化的能力的另一个方法是测定其区别同一患者的高疾病活动性与低疾病活动性的精确度。对于181名患者中的每一名，选择两个研究点，此时SLEDAI处于最高(称为HDAP，高疾病活动性点)和最低水平(称为LDAP，低疾病活动性点)。比较所有HDAP的AI的分布与所有LDAP的AI的分布，并计算不同的p-值。另外，评价每名患者中HDAP时的AI高于LDAP时的AI的频率。如果AI不随个体患者的疾病活动性改变，则预期HDAP时的AI比LDAP时的AI仅高50％。进行另一种分析，其中确定HDAP时的AI的时间分数比LDAP时的AI的时间分数高有意义的差异(即，高于可能的AI变异)。为了测定AI的波动，将使用所有患者的所有研究点，可以计算SLEDAI值的不同箱元(bin)的AI的标准差(和相对标准差)。这将在所有患者中产生相对标准差(AI-RSDall)，该值可能或可能不依赖于SLEDAI(即，在不同的SLEDAI值时AI-RSDall可能是不同的)。可以计算AI-RSDall中HDAP时的AI比LDAP时的AI高特定数值(例如，2)的患者的比例。可能存在一些系统偏性，其中某些患者中计算的AI始终高于(或低于)从SLEDA得分预测的。因此，AI-RSDall是患者内的AI的固有波动以及具有相似SLEDAI的患者的AI的系统差异的组合。可以通过计算具有相似SLEDAI值的研究点之间的AI得分的标准差(和相对标准差)(＜2点差异)，计算患者内的AI的固有波动。可以计算所有患者中的相对标准差的中值(AI-RSDpt-med)。然后可以评价AI-RSDpt-med中HDAP时的AI比LDAP时的AI高特定数值(例如，2)的患者的比例。

在证明个体患者中的AI实际上随SLEDAI波动后，将评价AI是否能够在下一研究点，3个月后，预测SLEDAI。为了进行该评价，可以定量时间0的AI得分与时间+3个月的SLEDAI得分之间的相关水平。该相关性可以在患者水平上计算，然后可以获得患者相关性中值。另一种证明AI预测不久的将来的疾病活动性的能力的方法是评价AI在预测未来3个月的疾病活动性中的灵敏性和特异性。在临床上，当前控制良好的那些患者可以与控制不好的患者区别开。特定时间的患者状态将被分类为两个类别之一：较差控制(PC)和包括在3个月中将有高疾病活动性(SLEDAI＞6点)和/或发作(SLEDAI提高3点)的患者，和良好控制(GC)和包括在3个月中将有低或中疾病活动性(SLEDAI＜6)和/或疾病活动性显著降低(SLEDAI降低3点)的患者。然后可以评价分类灵敏度，并用不同的AI阈值获得特异性。可以提前3个月产生ROC曲线，该曲线描绘AI在预测患者状态(PC或GC)中的表现。该试验获得的表现将与包括SLEDAI、抗-ds DNA和C3水平在内的标准临床量度进行比较。

也进行评价AI在预测3个月后SLEDAI得分的变化方面的能力的分析。使用来自所有患者的所有研究点的数据，AI和SLEDAI得分之间的关系可以作图，以如上所述鉴别“横断”相关水平。这确定了相同研究点的SLEDAI和AI之间的关系。这种关系将与允许用AI得分预测SLEDAI得分(或相反)的方程拟合。如果AI预测发作，则某研究点1的SLEDAI的变化之前将为时间点0的AI变化。因此，如果在点0和1之间发生发作，点0的AI得分(被称为AImeas)将高于基于研究点0的SLEDAI预期的值(称为AIexp)。另一方面，研究点0和研究点1之间的疾病活动性没有变化，点0时的AI得分将非常类似于根据研究点0时的SLEDAI预测的。相对AI变化(Rel-AI-diff)可以通过将AImeas和AIexp的差除以AImeas计算。AI在预测3个月后SLEDAI显著变化方面的灵敏性和特异性可以通过使用不同的Rel-AI-diff阈值进行评价。阈值可以是双向的，因此如果特定研究点的Rel-AI-diff高于特定阈值，则预测发作，类似地，如果低于特定阈值，则预期SLEDAI显著降低。另一方面，当一个研究点的Rel-AI-diff介于阈值和其负数之间时，预期疾病活动性没有显著变化。可以使用许多不同的Rel-AI-diff阈值生成显示灵敏度和假阳性的平衡(trade)的ROC曲线。类似的ROC曲线可以使用包括SLEDAI、抗-ds DNA和C3水平的标准临床量度生成。

如果AI的波动在不同的SLEDAI值时变化，将改进上述分析。上节描述了AI-RSDall和AI-RSDpt-med的计算，并提到了评估它们是否在不同的SLEDAI值变化。如果是这样，则可以如上所述进行ROC分析，但是使用不同的Rel-AI-diff阈值，使用不同的AI-RSDall和AI-RSDpt-med的阈值。将比较通过使用标准临床量度(包括SLEDAI、抗-ds DNA和C3水平)获得的表现。

在上述分析中，试图从点0的AI得分预测点1的SLEDAI。可能除了点0的绝对水平以外，AI从点-1到0的变化将在预测点1的SLEDAI中提供信息。例如，考虑一名患者，其在研究点-1的AI得分为X-1，在点0的AI得分升高到略微高于X-1的新值X0。与在研究点-1和0时AI稳定在X0的患者相比，该患者可能具有较高的在点1发作的可能性。AI的概念改变，或者将并入速度以产生改进的AI(MAI)得分。为了在点0时产生MAI，将需要点-1和点0的AI得分，因此每名患者一个数据点将不会使MAI与它相关。将优化将速率并入AI计算中以获得MAI的特定公式。这种优化可以通过3个月后对MAI和SLEDAI相关性的最大化进行。交叉验证设计将用来评价和控制过度拟合的程度。可以对所有样品的数据点进行相关，也可以在患者水平上进行，并且可以估计所有患者之间的相关性中值。后一种方法改善了有些患者具有太低或太高AI得分的系统偏性的问题。使用MAI，可以进行对于AI提到的相同类型的ROC分析来评估它在3个月后预测SLEDAI的能力。首先，类似于对于AI所描述的，可以进行分析来显示在点0的MAI在点1区别PC和GC状态的能力。另外，也可以进行类似于对于AI所述评估点0时MAI的能力的分析，以预测点0和点1之间的显著的疾病活动性改变(SLEDAI上的3点改变)。对于这后一种分析，可以使用不同的Rel-AI-diff、AI-RSDall或AI-RSDpt-med阈值。MAI的性能将与AI的性能进行比较，以确定速度系数的增加是否有用。

所述研究的一个问题是在研究的随访期间对不同患者进行治疗改变。这可能使疾病活动性的预测变得复杂。例如，考虑两名在点0具有相同AI得分的患者，这些患者中的一名同时具有药物的减少。该患者在点1的疾病活动性提高的可能性可能高于在点0时未改变用药的患者。这可能导致对AI的表现的低估。一种缓解方法是从研究中去除具有显著用药改变的所有点。另一种方法是改变AI得分以包括患者是否具有用药改变和产生用药改变的AI。因此在使用两名患者的上述实例中，用药改变的那个将具有较高的用药改变的AI。

5.与其它预测性标志物的集成

疾病活动性标志物的预测能力可以被最大化。因此，测试与其它标志物集成的TCR/BCR所有组成成分信息的预测能力。这些标志物包括临床使用的标准标志物，如抗-ds DNA和C3水平。也包括其它发表的标志物。例如，使用与将要使用的患者相同的一组患者，已经表明一组趋化因子具有一定的预测能力。将评价这组是否提高TCR和BCR所有组成成分的预测能力。第一步是将AI得分与其它量度集成以产生扩展的AI(EAI)得分。可以评估进行该集成的不同的方式，这可以通过3个月后EAI和SLEDAI的相关性的最大化进行优化。交叉验证设计将用来评估和控制过度拟合的程度。使用EAI，3个月后预测疾病活动性的能力将通过它区别GC与PCR的能力进行评价，以预测疾病活动性的变化。测量疾病活动性和疾病活动性变化的表现可以通过如上所述的ROC分析来描述。

6.验证

与样品数相比，所检测的变量数较高。这可能有助于过度拟合，开始时希望的结果在后来的研究中无法验证。在训练中将使用交叉验证方法来测量过度拟合的程度。然而，对一组独立样品的验证将涉及后来的工作。这不是该提议的一部分，但是该标志物可以是临床适用的。使用以上获得的数据，可以确定AI、MAI或EAI是否应该被验证和计算感兴趣的量度的特定方式。一种具体的算法将用于验证。另外，将指定一个或多个具体端点。AI的灵敏性和特异性可以根据3个月后区别GC与PC的能力进行评估，以评价AI预测疾病活动性的能力。在另一个实例中，可以评价使用特定Rel-AI-diff阈值，AI在3个月中预测显著疾病活动性改变的灵敏性和特异性。

实施例7

测定SLE患者对药物治疗的应答

本发明的方法将用于测量SLE患者对药物治疗的应答。确定给予具有严重副作用的昂贵药物的SLE患者对药物是否有反应在患者护理和使护理具有成本效益中有意义。疾病活动性的许多临床指标不准确地和在最多几个月的延时后对治疗有反应。在此期间，疾病可能进展，副作用可能对治疗增加问题。对药物反应的快速了解将使患者能够更快速地转换至更有效的治疗。

在该实施例中，一名以前被诊断为狼疮的35岁的女性非裔美国人定期看风湿科医生。每个季度除了实验室检查(包括C3、抗-ds DNA抗体水平检测、血细胞计数和尿分析)以外还通过综合临床评估来评价该患者的疾病状态，在一次看病期间，患者主诉皮肤损伤和疲劳，并且尿分析显示蛋白尿和/或细胞管型的证据。风湿科医生让该患者看肾脏科医生，进行肾活检来评价肾脏的炎性状态，并进行血清肌酸酐和24小时尿蛋白：肌酸酐比检查来评价肾功能损伤的程度。肾活检证明弥散性狼疮肾炎，而尿蛋白：肌酸酐检测显示肾病综合征的证据(尿蛋白：肌酸酐比为3.6)。基于该信息，作出急性狼疮肾炎的诊断，患者开始药物治疗疗程。在此时有几种可能的药物可以选择。通常使用免疫调节剂如吗替麦考酚酯(Cellcept)，尽管有时在严重的情况中开出诸如氨甲喋呤、硫唑嘌呤(Imuran)、环磷酰胺(cytoxan)等药物。利妥昔单抗(Rituxan)有时也用作第二或第三选择。这些药物之一通常与系统性类固醇如强的松或甲基强的松龙联合使用，以抑制急性症状。因此，开出吗替麦考酚酯每天150mg以及60mg强的松。由于类固醇类有许多副作用，包括骨质疏松、高血糖、体重增加和其它长期Cushingoid症状的危险，如果临床症状允许，患者的强的松剂量在大约6周逐渐减小。

要确定的第一个问题是患者对治疗是否有反应，因此，类固醇剂量是否能够适当减少。因此，在此期间，观察患者的血清肌酸酐以及尿蛋白和肌酸酐，以确保患者对药物治疗有反应。可以进行频繁的肾活检来检测炎性损伤是否被逆转；然而，常规使用肾活检带来太大的风险，并且由于侵入性太强而不实用。目前用于评价炎性状态的基于血液的标志物在这种决定中的应用受限，因为它们与基础疾病的相关性不够，具有增加的副作用并伴随有高剂量的类固醇。血清和尿功能标志物在检测炎性状态时可能具有一定的滞后，因此在这些标志物显示明确的改变之前，类固醇可以逐渐减少，因此扩大了肾发作期。在这些病例中由更灵敏的标志物指示的较慢的逐渐减少可缩短发作期，防止对肾脏组织的进一步损伤。在类固醇减少至大约10mg的维持剂量后，患者可能显示持续升高的尿蛋白水平和高尿蛋白：肌酸酐比为2，医生必须决定是否从Cellcept转换为另外一种药物。有利于此的争论是持续的肾功能损失的证据，但没有精确的炎性肾状态的测量，可能难以知道疾病本身是否缓解，具有一定水平的不可逆肾损伤，导致这些持续的蛋白尿水平。现有的基于血液的标志物不能提供完全的信息，进一步的肾活检不实用。对疾病状态的精确的基于血液的测量将有助于该决定。

在这种情况下，自身免疫负荷对评价对治疗的反应将非常有帮助，这是通过单独测量疾病活动性或与疾病活动性的其它标志物结合。用于自身免疫负荷的算法将使用上述研究开发。用来计算自身免疫负荷的相关克隆型使用校准试验测量。该校准试验使用来自疾病活动性高峰时例如治疗开始时的患者的血液进行。校准试验使用血液进行，或者使用受到影响的组织(例如肾活检或皮肤活检)进行。在后来评估对治疗的反应的时间，将采集血液样品，并与校准试验一起使用，以测量自身免疫负荷。这将用于作出治疗决定。如果相关克隆型来源于群体研究，则不需要校准试验，评估对治疗的反应时进行的血液检验足以测量自身免疫负荷，以指导治疗决定。

实施例8

确定SLE患者逐渐减少或终止治疗的适当时间

本发明的方法可以用来确定适当的时间来逐渐减小或停止对SLE患者的治疗。除了疾病活动性的临床测量可能显示的滞后以外，进一步的困难在于这些测量缺乏灵敏性。但是如果太早逐渐减少治疗，亚临床疾病可以导致疾病的重新发作。因此，免疫抑制剂治疗过程的时间一般大大长于平均患者所需的时间，以确保平均患者的再次发作的危险较低，而仍然可能长到分布的尾端。因此，导致副作用和成本的显著的过度治疗在大多数患者中存在，而一些患者发生治疗不足，导致潜在的可预防的再次发作。能够测量预测再次发作危险的亚临床活动性的一种方法将允许基于这些测量而不是依赖设计的过度治疗逐渐减少治疗。

在该实施例中，来自实施例7的患者应用强的松和吗替麦考酚酯6个月，尿蛋白：肌酸酐比回到0.5的水平。该水平仍然在健康个体的预期基线水平之上，但是不清楚该水平不是由于一定的不可逆的肾损伤。其它临床炎症检验是正常的，而且该患者没有报告任何其它症状。同时，该患者具有中度水平的呕吐和体重增加，这是药物的可能的副作用，传统上具有严重的长期副作用。医生面临困难的决定：平衡过快逐渐减少Cellcep和/或类固醇的担心，这可能导致肾脏炎症恢复，并且由于药物治疗可能发生进一步的长期不可逆的肾损伤和不良反应。不进行肾活检而对疾病状态的明确评价将在作出该决定中起作用。推荐减少类固醇，通过反复的类固醇试验，导致相同临床状况的复发。实际上，该问题在患者缓解和患者应用类固醇或免疫调节剂的任何时间都发生。

自身免疫负荷在这种情况下非常有助于评价是否逐渐减少治疗，这是通过单独测量疾病活动性或与疾病活动性的其它标志物结合。用于自身免疫负荷的算法将使用上述研究开发。用来计算自身免疫负荷的相关克隆型使用校准试验测量。该校准试验使用来自疾病活动性高峰时例如治疗开始时的患者的血液进行。校准试验使用血液进行，或者使用受到影响的组织(例如肾活检或皮肤活检)进行。在后来评估疾病活动性水平的时间，将采集血液样品，并与校准试验一起使用，以测量自身免疫负荷。这将用于作出治疗决定以及评价患者是否具有任何可检测的疾病活动性。如果相关克隆型来源于群体研究，则不需要校准试验，评估对治疗的反应时进行的血液检验足以测量自身免疫负荷，以指导治疗决定。

实施例9

SLE患者中发作的预测

治疗SLE患者的一个挑战的代表是在没有警告的情况下发作的事实，从而阻碍了医生预防性地治疗疾病的努力。在开始治疗前等待发作的发生使患者可能具有破坏性的临床症状，可能涉及昂贵的和不便的住院，并且可能引起长期器官损伤，同时也需要侵入性的治疗性干预，这本身具有副作用。更多希望的方案是治疗方案，其中在亚临床阶段检测发作，此时可以主动地给予治疗，减少患者的明显痛苦，导致比较便宜的住院，并且最终使患者具有更好的长期预后。

来自实施例7的患者从上述急性发作中恢复，除了Plaquinil和低剂量的5mg强的松以外，患者的所有治疗逐渐减少。但是，该患者仍然处于另一炎性状况的高风险中。因此，该患者将在风湿科医生的看视下，风湿科医生继续跟踪患者的临床症状和实验室检查。遗憾的是，这些症状和检查不能早期预报即将来临的发作，直到患者实际上已经表现出发作的临床症状并且序列本身重复。亚临床活动性提高的高度特异性标志物可包括在患者的常规临床评价中，以检测明确的发作体征，其可在随后的1-3个月内达到临床上可检测的阶段。较早地开始治疗可以使发作的严重性较低，并可以使治疗具有较少的长期器官损伤，或者与目前相比使用较少的类固醇。

自身免疫负荷在这种情况下非常有助于评价初期发作的可能性，这是通过单独测量疾病活动性或与疾病活动性的其它标志物结合。这种得分本身或该得分增加率(速率)或加速度可以用来评价进展为发作的可能性。用于自身免疫负荷的算法将使用上述研究开发。用来计算自身免疫负荷的相关克隆型使用校准试验测量。该校准试验使用来自疾病活动性高峰时例如治疗开始时的患者的血液进行。校准试验使用血液进行，或者使用受到影响的组织(例如肾活检或皮肤活检)进行。在后来评估对治疗的反应的时间，将采集血液样品，并与校准试验一起使用，以测量自身免疫负荷。这可用于作出治疗决定。如果相关克隆型来源于群体研究，则不需要校准试验，评估发作危险时进行的血液检验足以测量自身免疫负荷，以指导治疗决定。

实施例10

评估SLE患者的主观症状的客观测量

SLE影响许多器官，并产生许多潜在的症状，包括在健康人群中非常常见的症状。例如，如果SLE患者主诉头痛，头痛可能是CNS狼疮的体征或者可能是由于普通头痛。类似地，如果SLE患者主诉在一段时间内变差的疲劳，则变差的疲劳可能是由于其疾病的恶化，或者可能是由于抑郁或其它原因。反映疾病活动性的客观测量的可用性可能对于SLE患者的控制具有很大的帮助。

实施例7中的患者因主诉头痛、疲劳和难以专注而看风湿科医生。患者的头痛是复发性的，并且使用Mortrin治疗只是暂时性好转。患者的SLE在其它方面良好地控制。患者生命中的相关心理社会应激物包括她正在办理离婚。医生当面对具有非SLE特有的和在普通人群中常见的症状的SLE患者时将左右为难。患者是否患有CNS狼疮？或者她是否具有其症状的其它常见原因如抑郁？目前的实验室检查还缺乏用来区别这些可能性的灵敏性和特异性。测量SLE疾病活动性的可靠的检查可以常规应用，以帮助区别这两种可能性。

自身免疫负荷在这种情况下非常有助于单独地客观评价疾病活动性或与疾病活动性的其它标志物结合。用于自身免疫负荷的算法将使用上述研究开发。用来计算自身免疫负荷的相关克隆型使用校准试验测量。该校准试验使用来自疾病活动性高峰时例如治疗开始时的患者的血液进行。校准试验使用血液进行，或者使用受到影响的组织(例如肾活检或皮肤活检)进行。在后来评估客观疾病活动性的时间，将采集血液样品，并与校准试验一起使用，以测量自身免疫负荷。这将用于作出治疗决定。如果相关克隆型来源于群体研究，则不需要校准试验，评估客观疾病活动性时进行的血液检验足以测量自身免疫负荷，以指导治疗决定。

实施例11：

测量MS患者对药物治疗的反应

如上所述，MS治疗中的一个主要挑战是测量患者是否对药物治疗有反应以及反应如何。在疾病的进展期和晚期，有临床评估如扩充失能状态得分(EDSS)，它测量该疾病引起的身体损伤的程度。但是，这些评估无法在早期或疾病复发/缓解时使用。复发前后的临床参数可以用来评价疾病的进展，但是它们是大概的和滞后的指标，因为患者在复发之间可能经过数年，在此期间极少有证据能够从临床评价中获得。最后，脑部成像如钆增强的MRI可以用来检查脑部病变。MS患者一般每年进行这种MRI。然而，这些图像缺乏特异性。此外，作为对综合脑损伤的测量，它们不是对当前疾病活动性的良好的测量，而是反映了病史及其对脑的影响。

尽管事实上现有的MS临床治疗方案是被诊断为复发缓解型疾病的患者应当继续治疗，以延迟进行性疾病的发生，但是批准的药物治疗MS的越来越多的方面使得缺乏生物学反馈逐渐成为问题。以上所示的批准的MS治疗药物的列表越来越长，因为对MS治疗的大量投资开始取得成果。这些药物中的每一个都具有严重的副作用，并且其给药非常昂贵，每年的治疗成本为30,000-100,000美元。未得到很好控制的患者将很快转变为进行性疾病，这种进行性疾病使人衰弱，并且导致昂贵的医疗干预，包括住院和长期护理。因此，可以使患者在治疗的早期接受最佳治疗。

临床应用实施例

患者概况：一名30岁女性因单眼视力缺损伴有疼痛来到医院。对她进行神经学评估和腰椎穿刺获得脑脊液，用来评估是否存在克隆T细胞。她也进行了脑MRI。基于这些检查，诊断为MS。给她开出每次注射Betaseron 250mcg，每隔一天自行皮下注射一次。在6个月后的随访时，该患者主诉抑郁和体重增加。没有向医生报告进一步的神经学事件。医生现在面对临床困境。医生是否应当坚持以前的治疗？是否应当使用新的治疗？是否应当进行再进行MRI？这会导致额外的费用并使患者额外暴露于造影剂。医生是否应当等到下一次例行MRI显示新的病变？医生是否应当等待观察是否再发生发作？明确地确定该疾病是否是活动性的将有利于所有这些决定。

自身免疫负荷在这种情况下非常有助于评价对治疗的反应，这是通过单独测量疾病活动性或与疾病活动性的其它标志物结合。用于自身免疫负荷的算法将使用上述研究开发。用来计算自身免疫负荷的相关克隆型使用校准试验测量。该校准试验使用来自疾病活动性高峰时例如治疗开始时的患者的血液进行。校准试验使用血液进行，或者使用受到影响的组织(例如肾活检或皮肤活检)进行。在后来评估对治疗的反应的时间，将采集血液样品，并与校准试验一起使用，以测量自身免疫负荷。这将用于作出治疗决定。如果相关克隆型来源于群体研究，则不需要校准试验，评估对治疗的反应时进行的血液检验足以测量自身免疫负荷，以报告治疗决定。

实施例12：

MS发作的预测

如在所有自身免疫病中，发作的改善是治疗的一个主要目标。不仅发作使患者虚弱并且导致昂贵的治疗，而且更加相信每次发作都会促进更长期的不可逆的疾病进展。可以利用几种疗法来控制初期的发作，如静脉注射甲基强的松龙或口服强的松。这些药物具有明显的副作用，因此在没有活动性发作的证据的情况下不予开出。与随后的临床发作有关的日益增加的亚临床活动性的测量可用来指导这种主动的发作治疗，这可导致较短的和伤害性较低的发作。另外，有一些疗法已经证明具有减少发作的高临床效果，它们具有非常明显的和致命的副作用的风险。一种这样的药物是Tysabri，已经证明该药物导致临床后果改善并且提高了致死性脑感染如PML的危险。这些危险降低了当其它药物证明不再控制进展时这些药物作为最后治疗的价值，并且限制了这些药物作为慢性治疗的价值。能够预测发作状态何时开始的检测可提高这些药物的应用，因为它们能够以类似于类固醇的方式使用，用来控制急性发作期，同时使致死性副作用的危险降至最小。

临床应用实施例

实施例11的患者使用Betaseron 3年，并报告持续一周的临床发作。在这一年末患者的MRI显示明显的新的病变(多个分离的大小可变的卵形、垂直该向T2W和FLAIR高密度病变(斑块)，在T1W图像上以相同低强度出现，在T2W图像上为高强度，累及双侧室周及皮质下白质区，包括calloso-septal界面)。医生担心该患者在接下来12个月期间处于发作的高危险。存在临床困境。医生是否要等待进一步的临床症状来干预额外的治疗？医生是否应当转换治疗？如果需要，是否应当采用另一类注射剂如克帕松或者是否应当使用新的一类治疗如Tysabri？是否应当使用类固醇？能够监测亚临床疾病活动性和显示疾病何时增加和何时可能发作的试验可用来帮助作出这些临床决定。

自身免疫负荷在这种情况下非常有助于评价发作的危险，这是通过单独测量疾病活动性或与疾病活动性的其它标志物结合。用于自身免疫负荷的算法将使用本发明所述的研究开发。用来计算自身免疫负荷的相关克隆型使用校准试验测量。该校准试验使用来自疾病活动性峰值时例如治疗开始时的患者的血液进行。校准试验使用血液进行，或者使用受到影响的组织(例如CSF)进行。在后来评价发作危险的时间，将采集血液样品，并与校准试验一起使用，以测量自身免疫负荷。这可以用来作出治疗决定。如果相关克隆型来源于群体研究，则不需要校准试验，评估发作危险时的血液检验足以测量自身免疫负荷，以指导治疗决定。

实施例13

监测MS的治疗依从性

由于在疾病早期临床症状相对较少发生，患者与他或她的医生之间的相互交流不是非常频繁。同时，给予的治疗对于患者来说既昂贵又不方便，涉及可能导致疼痛反应的自行注射和副作用。因此存在对治疗方案的显著的不依从性，由于患者与医生之间的相互交流不经常，医生难以对其进行监测。能够检测亚临床疾病状态的试验将使医生和患者都能够经常看到基础疾病的控制情况。这些方法在HIV患者中已经证明非常有效地促使他们继续有效治疗。每个季度进行的血液检查将使医生能够了解患者并确定疾病状态。

自身免疫负荷在这种情况下非常有助于评价对治疗的依从性，这是通过单独测量疾病活动性或与疾病活动性的其它标志物结合。用于自身免疫负荷的算法将使用此处所述的研究开发。用来计算自身免疫负荷的相关克隆型使用校准试验测量。该校准试验使用来自疾病活动性峰值时例如治疗开始时的患者的血液进行。校准试验使用血液进行，或者使用受到影响的组织(例如CSF)进行。在后来评价治疗依从性的时间，将采集血液样品，并与校准试验一起使用，以测量自身免疫负荷。这可以用来作出治疗决定以及更好地指导患者更好地依从。如果相关克隆型来源于群体研究，则不需要校准试验，评估治疗依从性时的血液检验足以测量自身免疫负荷，以指导治疗决定。

实施例14

小鼠TCRβ和IgH序列的扩增

将开发用于小鼠TCRβ和IgH的扩增和测序方案，该方案类似于为人类开发的方案。应用使不同序列的扩增效率差异最小化的类似方法，以及类似的采用突起(spikes)的验证技术和上述5’RACE技术。cDNA最小输入量将用类似于人类样品所述的方法确定。小鼠和人类的扩增方案的一个不同是小鼠TCRβ的两个C区段在最靠近J/C连接的50bp中没有任何多态性。因此，在该方案中，用于第一阶段扩增的引物将置于位点25-50，用于第二阶段扩增的引物将置于位点1-25，并且该引物将具有5’尾，用于含有P5序列的后一引物。不同的序列将提高特异性，并且除了多态性不需要“环出”任何碱基以外，与用于人类的策略类似。

实施例15

小鼠序列数据的主要分析

将用于小鼠数据分析的分析框架类似于以上对于人类数据所述的分析框架。一个不同是小鼠样品测序的深度低于人类样品。预期来自小鼠的血液样品为100μl。在100μl血液中，有大约100K个淋巴细胞，因此测序深度大大高于100K不会显著地提高精度。因此，每个小鼠样品仅获得100K阅读。即使小鼠的阅读数小于人类，也将采样较大比例的小鼠总淋巴细胞和血液淋巴细胞。小鼠总淋巴细胞数预计比人类少3个数量级以上。类似地，当与使用10ml人类血液获得的采样(0.2％)相比时，100μl血液将提供更好的小鼠血液中的淋巴细胞采样(～10％)。

实施例16

小鼠SLE模型中的IgH和TCR所有组成成分分析

小鼠SLE模型将用于研究TCR/BCR所有组成成分和疾病活动性之间的关系。小鼠模型将是具有来自NZM2410的sle1和sle3基因座的B6。这些B6.sle1.sle3(BSS)小鼠以自发的方式发展为SLE样肾炎。研究了三个类型的组。对于所有研究点，将获得血液BUN、肌酸酐和抗核自身抗体、尿蛋白和肌酸酐水平。将确定血液TCR/BCR所有组成成分产生的得分是否与这些检测的肾病指标很好地相关。第一组类似于所述的人类组，其中除肾功能评估外还采集纵向血液样品。具体地，每月观察7只BSS小鼠直到第8个月。最后，处死这些小鼠，除了血液以外，还分析脾脏和肾组织。作为对照，5只B6小鼠以类似的方式进行评估。第二组为横断组(cross sectional)，其中不同组动物在特定时间处死，并在此时分析脾脏、肾脏和血液样品。具体地，5只B6小鼠将每月处死，并分析血液、脾脏和肾脏。作为对照，两只B6对照小鼠以同样的方式评估。最后，第三组在发病后用类固醇治疗，之后定期进行肾炎评估和获得血液样品。具体地，在4个月大时，20只患病小鼠用类固醇处理，然后在接下来的4个月每两周采集血液进行TCR/BCR所有组成成分分析和肾功能评价。作为对照，5只BSS小鼠用安慰剂处理并以类似的方式观察。TCR和BCR所有组成成分分析将在所有研究点(即不同的时间点和同一时间点的不同的组织)进行。该分析如上所述将涉及两阶段PCR、测序过程和主要数据分析。

实施例17

与小鼠SLE相关的克隆型的鉴别和动力学

首先，鉴别一组与肾功能相关的克隆型。作为肾功能的量度，可以使用尿蛋白/肌酸酐比、血清肌酸酐或BUN水平。在第一和第三组中，可以评价每个HPC克隆型的血液水平与三个量度中的每一个的相关性。以类似于所述用于人类的方式，可以评价与1、2或全部3个肾功能量度高度相关的克隆型数目相对于随机预期(或排列检测)是否有巨大提高。考虑到随机预期，将挑出相关性阈值，其中相关性水平高于该阈值的克隆型中只有10％预计偶然具有观察到的相关性水平(10％假发现)。这些克隆型将集中于，并且该组将被定义为“相关克隆型”。

除了这种用来鉴别相关克隆型的统计学方法以外，可以通过富集肾组织中的特定克隆型的“功能性”方法将克隆型鉴定为与疾病相关。通过该功能性方法，一组可能与疾病有关的克隆型可能在第2组中被鉴别，它们将被称为功能鉴别的相关克隆型。可以评估相关克隆型的“统计学”定义和“功能性”定义之间的重叠程度。第1组和第3组在最后的时间点采集肾样品。可以评估在这些肾样品中富含的克隆型是否存在于血液中和与肾功能具有较高相关性的克隆型之间。

然后可以估计相关克隆型(统计学和功能性鉴别的)的动力学。例如，使用来自第2组的数据，它们的水平上升和下降(如果有的话)的时程将在三个区室中评估：肾脏、血液和脾脏。

在统计学鉴别的相关克隆型中，相关克隆型的亚群将根据它们与肾功能的相关性进行鉴别。相关克隆型可以在不知道肾功能数据的情况下进行鉴别。换句话说，可以理解区别疾病的相关克隆型与无关克隆型的特征。为此，一组与肾功能低相关的克隆型将被确定为对照的不相关克隆型。

与疾病相关的克隆型的特征

在鉴别两组克隆型—相关的和不相关的—后，寻找区别这两组的特征。使用统计学和功能性鉴别的相关克隆型进行单独和组合分析。将评估在人类中研究的相同类型的特征，例如克隆型水平、特定序列基序的存在和其它有关克隆型的序列。如对于人类研究所述，存在显著的过度拟合的风险，因此需要使用交叉验证技术或单独的训练和测试组。

小鼠实验的一个应用是细胞的可获得性允许评估相关克隆型是否在特定细胞亚型中富含。将研究相关克隆型是否在某些细胞亚型中富含；可以从全套淋巴细胞和富含相关克隆型的特定亚型测序，该富含标准可以用作区别相关克隆型与其它疾病无关克隆型的额外的特征。为了知道富含哪些细胞亚型克隆型，使用两种方法：假说驱动的(hypothesisdriven)和无假说的(hypothesis free)。第一种是在一组样品中尝试T或B细胞上的一打候选表面标志物。例如，一个候选物是用于选择活化T细胞的T细胞上的CD69。对于B细胞，研究表明活动性SLE中CD27^高细胞增多，因此是可能富含相关克隆型的细胞标志物的良好候选物。在这些实验的每一个中，特定细胞亚型通过FACS纯化。然后对来自淋巴细胞的完全互补物的cDNA以及来自通过FACS从不同样品集合中纯化的淋巴细胞的cDNA进行测序反应。评估与FACS纯化的亚群相比，两组相关和非相关克隆型是否以不同的比例存在于淋巴细胞的完全互补物中。具有大差异的标志物可用于鉴别相关克隆型。除了序列参数外将使用具有这些标志物的细胞的亚型中克隆型的富含检测相关克隆型。

在无假说方法中，将寻找在具有相关克隆型的细胞中与在其它细胞中差别表达的标志物。将选择少数其中特定TCR克隆型明显与疾病相关的例子，并将挑选高度富含克隆型的例子，它代表大多数具有相同V区段的克隆型。使用针对特定V区段的抗体(抗所有V区段的抗体可以购买得到)进行FACS，以选择高度富含携带相关克隆型的细胞的群体。可以由这些细胞制备RNA，所有基因的表达可以通过进行阵列实验来研究。作为对照，可以使用来自淋巴细胞的总RNA和/或来自FACS纯化的携带另一无关V区段的细胞的RNA。可以寻找最大区别从具有相关克隆型的FACS纯化的V区段获得的样品与对照的标志物。可以发现区别两个群体的标志物，包括表面标志物(因为使用表面蛋白质更易于进行FACS)。如果观察来自几只小鼠的样品的一致的RNA标志物，将在蛋白质水平上进行验证。使用相同的样品，针对标志蛋白的抗体将在FACS试验中使用，以纯化携带标志蛋白的细胞。可以检测一种以上的标志物，以提高验证它们之一的机会。来自纯化的细胞的TCR和/或BCR将被测序。如果RNA结果在蛋白质水平上保持，则相关克隆型应当在纯化的细胞亚群中富含。验证RNA结果在蛋白质水平上仍然保持后，将在其它样品中验证该结果。未进行阵列分析的样品将使用标志蛋白质抗体进行FACS分析。对纯化的细胞的TCR和/或BCR进行测序。评估相关克隆型是否在使用特异性标志物的抗体纯化的细胞中富含。这将验证标志物在鉴别相关克隆型中的应用。

实施例18

使用IgH和TCRβ所有组成成分测量疾病活动性

以上用于相关克隆型的算法可用于根据它们的序列和/或标志物鉴别第1和3组所有样品的相关克隆型。使用每名患者中相关克隆型的水平，可以产生与肾功能量度相关的AI得分。如上所述，存在过度拟合的风险，需要使用交叉验证技术和/或单独的训练和测试组。AI与肾功能量度的相关性可以以横断(cross sectional)方式(所有小鼠的所有研究点)评价。当肾功能改变时也可以评价个体小鼠中AI得分是否改变的问题。这可以通过以类似于对于人类所述的方式比较来自相同动物的高和低肾功能的AI进行评价。

实施例19

来自同一细胞的序列的连接

可以从同一细胞扩增两个序列，在扩增中它们可以连接形成一个扩增子。即使连接的序列与来自其它样品的序列集合混合，关于这两个序列在同一细胞中存在的信息随后仍然可以保留。

这种连接方案的一个实例是评估TCR的多样性。TCR的多样性由TCRα和TCRβ中每一个的多样性产生。另外，细胞中TCRα和TCRβ的组合显著增加了多样性。然而，当从具有多种T细胞的样品中提取核酸时，与TCRβ相同的细胞中存在哪种TCRα的信息丢失。允许保留该信息的方法在此提供。该方法包括在独特的区室中分离细胞，以共价连接开始时分离的扩增子的方式扩增希望的序列，和任选地混合所有扩增的序列用于以后的分析。可以想到几种方法来将每个细胞置于区室中。例如，一种方法是将细胞置于微滴或微团乳液中，它们可以在PCR中使用。这些微滴可以以定向方式填充或随机填充，使得大部分微滴含有最多一个细胞。也可以使用细胞分选来将单细胞置于PCR容器中。然后可以在每个微滴中进行核酸扩增。

方案1

如图9所示，序列1可以使用引物1和引物2扩增。引物2携带不与基因组序列互补的5’突出端序列(图9A，细线)。类似地，序列2可以使用引物3和引物4扩增(图9A)。引物3携带互补于引物2的突出端序列的5’突出端序列(图9A，细虚线)。在该图中，代表两个互补序列的两个突出端(或两个连接序列)以细线绘出；一个序列表示为实线，其互补序列表示为虚线。其它互补序列以相同的纯色绘出：序列1和2分别为黑色和灰色。

用引物1-4扩增后，两个扩增产物中的每一个在一端具有连接序列，两个产物可以彼此退火，链可以延伸以形成完全双链的分子(图9B)。该分子现在具有彼此连接的序列1和2，然后可以用引物1和4扩增(图9C)。

所有4个引物可以同时置于反应中以实现序列连接和扩增。加入低浓度的引物2和3可能是有利的。低浓度的引物2和3将确保两个个体序列扩增子在反应早期达到饱和，从而使连接的扩增子在反应后期在PCR反应中占优势。这将导致最终反应相对于个体序列扩增子具有高浓度的连接的扩增子。

方案1(a)

方案1(a)是方案1的变型，其中连接序列与引物2序列相同(图10)。序列1可以使用引物1和引物2扩增，在引物上没有突出序列(图10A)。引物3携带互补于引物2的5’突出端序列(图10A)。序列2可以使用引物3和引物4扩增，产生互补于序列1的连接序列(图10A)。其它互补序列可以绘制具有相同的颜色：序列1和2分别为黑色和灰色。

在用引物1-4扩增后，两个产物通过引物2序列彼此退火，链可以延伸以形成完全双链的分子(图10B)。该分子现在具有彼此连接的序列1和2，然后可以使用引物1和4扩增(图10C)。

方案2

图11示出的方案2是与方案1类似的方案，区别在于使用不与基因组互补的序列实现最终扩增。该方法的一个优点是可以选择引发序列为用于扩增的理想序列，而没有脱靶扩增。在互补于将要扩增的基因组序列的引物不理想时这可能是有帮助的。通过使用不互补于基因组的引物扩增，可以使用低浓度的引物1-4，使脱靶扩增最小化。也可以将方案2改变为多重方案，其中使用超过一对引物而不导致多个引物相互作用。将要连接的每对序列具有其自身独特的4个引物，这些引物不需要为高浓度。一对扩增引物可以扩增所有连接的序列对(图11C)。

序列1可以使用引物1和引物2扩增(图11A)。引物1和2在其5’端携带不与基因组序列互补的独特的突出端序列(图11A，分别为点线和细线)。类似地，序列2可以使用引物3和引物4扩增(图11A)。引物3和4在其5’端携带不与基因组序列互补的独特的突出端序列(图11A)。引物1和4上的突出端被标记为“Amp 1”(点线)和“Amp 2”(波形线)，是不与最终用于扩增的基因组互补的序列(图11A)。类似于方案1，引物2(细线)和引物3(细/虚线)的突出端是彼此互补的连接序列。其它互补序列绘制为具有相同颜色：序列1和序列2分别为黑色和灰色。

在用引物1-4扩增后，两个扩增产物中的每一个在一端具有连接序列，并且两个产物可以彼此退火，链可以延伸以形成完全双链的分子(图11B)。该分子现在具有彼此连接的序列1和2，然后可以使用引物5和6扩增(图11C)。

任选地，开始时可以使用引物1-4，两个序列连接后可以添加引物5和6。更优选的实施方案将在第一步中添加所有引物。再更优选的实施方案开始时存在所有引物，引物1-4的浓度低于引物5和6。这允许在一步中发生完全连接和扩增。引物2和3的低浓度将确保两个个体序列扩增子在反应早期达到饱和，从而使得连接的扩增子在反应后期在PCR反应中占优势。这将导致最终反应中相对于个体序列扩增子具有高浓度的连接的扩增子。此外，引物1-4的低浓度使得在这些引物的质量低于引物5和6时可能发生的任何脱靶扩增最小化。

使用引物5和6进行扩增能够更有效地多重化(图12)。一对引物(引物5和6)可以用来扩增所有连接的序列。该连接序列可以以不同的方式设计用于不同的应用。图12所示的实施例用于两对将要连接的序列，但是该方案可以进一步延伸到序列的10’s、100’s或1000’s。如果有一组基因对将要连接(例如，TCRα与TCRβ和IgH与IgK)，则用于每对的连接序列可能不同。在该实施例中，对于TCRα和β的连接测序将不同于IgH和IgK，如粗虚线(TCRα和TCRβ)或细虚线(IgH与IgK)所示(图12A)。该实施例中所有扩增的序列以相同的颜色显示。用于所有连接序列的扩增引物将是相同的引物：如图11所示的5和6。在其它应用中，如果没有特异性配对则可以使用相同的连接序列。

也想到可以连接2个以上的序列。例如3个或更多的序列可以连接在一起(图13A-13D)。为了产生连接3个序列的分子，一个产物在其末端可以具有两个不同的连接序列，每个连接一个产物(图13A)。在所示的实施例中，序列2具有两个连接序列。引物3的连接序列允许通过引物2的连接序列(连接序列互补对LS1)连接序列1。类似地，引物4的连接序列允许通过引物5的连接序列(连接序列互补对2，LS2)连接序列3(图13A)。在另一个循环中，整个序列2成为连接序列1和序列3的连接序列。互补于引物1和6的Amp1和Amp 2序列在与连接的序列1-3形成分子后能够扩增。

实施例20

结肠癌患者中转移性复发的监测

许多在可治疗阶段能够检测到的癌症仍然存在患者发生转移性肿瘤复发的危险。这样的复发通常在晚期和不可治疗的阶段检测到，并且可能对于患者是致命的。这种情况的一个例子是复发的结肠癌。尽管有越来越具攻击性的结肠癌筛选程序，结肠癌代表了美国最常见的恶性肿瘤之一。每年大约有150,000名患者在严重的但是可治疗的阶段(II期和II期)被诊断为结肠癌。这些患者通过肿瘤切除术及随后的化疗过程治疗。尽管这些治疗通常有效，但是这些患者在治疗后数年内仍然有相当大的几率发生原发性肿瘤的转移性复发。例如，50％的III期患者在手术后5年内复发。这些复发可能是孤立的(例如在结肠或肝脏中)或者是多病灶的。在任一种情况中，但是特别是在孤立的情况下，早期检测可以在使成功治疗(手术和/或化疗)机会最大化方面起作用。

目前有两种检测用于治疗后监视。腹部和胸部CT扫描用来确定这些图像上可见的肿瘤。这些扫描一般在治疗后的前5年以6-12个月的间隔进行。尽管这些扫描可以显示早期阶段的恶性肿瘤，但是其临床有效性仍有争议。这些扫描的缺点包括高昂的费用和它们使患者接受显著量的辐射，而辐射本身可以导致进一步的肿瘤。另外一种基于血液的检验已经证明具有一定的价值：CEA检测。该抗体检测测定血清中的对某些结肠肿瘤特异性的蛋白质水平。CEA检测的缺点是缺乏灵敏性(＜60％的CT扫描阳性的患者具有阳性CEA检测)。

在本发明的该实施方案中，从切除的原发肿瘤获得的淋巴细胞用来发展免疫谱，该免疫谱可用来增加基于血液的检测对于早期癌症复发的灵敏性。在切除肿瘤中发现的淋巴细胞的TCR(和/或BCR)可以被扩增和测序。在肿瘤样品中富含的克隆型可能与对肿瘤的免疫应答相关。随后从患者采血可以用来评价这些克隆型的水平。这些克隆型水平的升高可以指示对肿瘤复发的免疫应答。在此情况中，免疫应答的检测可能比肿瘤标志物本身的检测更灵敏。

使用校准试验检测癌症复发的发现研究

设想可以进行发现研究以基于血液TCR(和/或BCR)谱确定检测复发的可能性。切除的肿瘤样品以及具有已知后果的患者的随访血液样品可以用于该研究。来自所有这些样品的TCR(和/或BCR)可以进行测序。相关克隆型的候选物是存在于肿瘤样品的TCR(和/或BCR)数据中的那些。由于在该训练研究中具有已知的后果，人们可以使用标准交叉验证技术设计一种模型，该模型基于不同的克隆型水平产生得分(复发风险)。这种复发得分因此可以在新患者中计算，其计算是通过测量切除的肿瘤中的克隆型(校准点)和在监视复发的后一时间在同一患者的血液中发现的克隆型的数据。使用肿瘤数据使该分析中考虑的血液中存在的克隆型数大大减少。

使用校准试验和群体研究检测癌症复发的发现研究

可能不是肿瘤标本中富含的全部克隆型都与对肿瘤的免疫应答相关。可能有某些淋巴细胞由于有利的炎性条件而局部扩增。在本发明的另一实施方案中，可以使用相同的样品进行发现研究，但是该研究用来确定区别“相关”与“不相关”克隆型的参数。这些参数可以包括1)序列基序：该基序可以是特定的V或J区、组合VJ、或与关联的克隆型相关的DJ区的短序列；2)克隆型的大小；3)水平：绝对水平(每百万个中的阅读数)或等级水平；4)与其它克隆型的相似性：其它高度相关克隆型的存在，如具有沉默变化的那些(编码相同氨基酸的核苷酸差异)或具有保守氨基酸改变的那些；5)对于BCR，克隆型中的体细胞突变水平和/或由于体细胞突变而与一些种系克隆型不同的独特克隆型的数目；6)携带特异性标志物的细胞的存在。该研究然后得到可以基于特定肿瘤样品中存在的一组特定的克隆型预测血液中哪些克隆型可能与癌症复发相关的算法。这些克隆型然后可以用来以如上所述相同的方式发展复发风险的得分。

使用群体研究检测癌症复发的发现研究

在本发明的另一实施方案中，在切除的肿瘤中检测的克隆型用来产生预测尚未见到的样品中的相关克隆型的模型。该模型也可以用来以类似于上述的方式产生复发风险得分。在该模型中，不需要检测接受复发监视的新患者的切除的癌组织中的克隆型，而是可以通过简单地检测给定血液样品中的克隆型评估复发风险。

使用群体研究检测原发性结肠癌的发现研究

作为扩展，设想使用相同的方法可以实现原发性癌症的检测。对于原发性癌症，没有切除的肿瘤可用于富集相关的克隆型。但是，甚至在肿瘤切除数据存在下，想到需要用额外的序列和其它参数来鉴定相关克隆型并最终产生癌症检测可能性的得分。因此通过扩展，如果算法具有足够的预测性，则人们能够在没有来自切除的肿瘤的数据的情况下从血液(或其它体液)检测癌症。在本发明的该实施方案中，在诊断原发性癌症之前需要获得使用来自患者的血液样品的发现研究。以类似于以上所述的方式，可以确定参数(序列和其它)以预测与对肿瘤的免疫系统应答相关的克隆型。然后可以利用一个模型产生预测结肠癌进展危险的癌症危险性得分。该算法然后可以用于新患者的血液样品，以检测原发性结肠癌的危险。

实施例21

监测心脏移植患者中的排斥

心脏移植是相对不常见的手术，因为器官的供应非常有限。在世界上每年进行3,500例心脏移植。每个手术都非常昂贵，并且使用的器官是无价的。结果，接受这些器官的患者非常积极地治疗。为了在使用免疫抑制剂干预可能有效时确定对捐献器官的免疫反应的状态，对患者进行定期心脏活检以检测器官的炎症。基于这些检测，可以给予免疫抑制剂的攻击性过程。这些手术具有几个限制。作为侵入性手术，它们使患者具有危险。此外，它们也是昂贵的，并且只能以不频繁的间隔进行。基于一组11个测试基因的表达谱(Allomap)的血液基检查已经显示在检测器官排斥方面非常灵敏，但是用作活检的替代手段则缺乏足够的灵敏性，而是用于决定何时进行活检。在本发明的一个实施方案中，TCR(和/或BCR)谱用来评价“排斥”状态和产生预测特定期限内排斥可能性的排斥风险得分。设想可以进行发现研究以根据血液TCR(和/或BCR)谱确定排斥的可能性。这可以在临床上用来指导正在使用的免疫抑制剂治疗。

使用群体研究发现相关克隆型

在本发明的该实施方案中，可以使用具有已知临床后果的具有血液样品的移植后患者群体。来自所有这些样品的TCR(和/或BCR)可以进行测序，并且个体克隆型与排斥后果的相关可以用来区别相关与不相关克隆型。随后，可以得出区别这两类克隆型的参数。这些参数可包括1)序列基序：该基序可以是特定的V或J区、组合VJ、或与关联的克隆型相关的DJ区的短序列；2)克隆型的大小；3)水平：绝对水平(每百万个的阅读数)或等级水平；4)与其它克隆型的相似性：其它高度相关克隆型的存在，如具有沉默变化的那些(编码相同氨基酸的核苷酸差异)或具有保守氨基酸改变的那些；5)对于BCR，克隆型中的体细胞突变水平和/或由于体细胞突变而与一些种系克隆型不同的独特克隆型的数目；6)携带特异性标志物的细胞的存在。如果研究样品具有移植物的活检样品，特别是如果它处于主动排斥中，则将进行一种替代的或补充的定义相关和非相关克隆型的方法。预期在此时将有相关克隆型的极高富集。区别这些与其它克隆型的参数可以如上所述鉴别。

来自血液样品的谱数据然后用来预测排斥的可能性。由于该训练研究中后果已知，人们可以使用标准交叉验证技术设计一种模型，该模型根据不同克隆型的水平产生排斥风险得分。基于特定点的新的血液样品中TCR(和/或BCR)的谱，可以产生与排斥可能性有关的排斥风险得分。

使用校准试验发现相关克隆型

在另一实施方案中，可以对每名患者使用校准试验实施鉴别相关克隆型的方法。该方法涉及移植后采集的第一活检样品。移植后移植物的活检材料的存在提供了分析活检样品的TCR以鉴别根据该样品中普遍存在的那些定义的相关克隆型的可能性。然后可以检测血液中的这组克隆型，并对排斥可能性产生得分。产生排斥风险得分的算法通过发现研究产生，该研究类似于上述使用可获得的临床数据和相关克隆型水平产生近似于排斥可能性的排斥风险得分的研究。

在该实施方案中，将使用来自移植后第一次活检的材料进行特定校准试验，但是进一步的活检可以被替换为使用血液样品，该血液样品的克隆型能够与该校准试验一起使用，以测量排斥风险得分。

除了移植物活检外，人们可以使用移植前的血液样品作为另一个校准点。普遍存在于该样品中的克隆型不可能与排斥相关，而是代表患者以前所遇到的抗原的历史。因此，当考虑移植后的血液样品时，人们在确定相关克隆型时可以减去在移植前存在的克隆型。这些克隆型然后可以用来产生排斥风险模型。

在该实施方案中，可以使用两个校准试验：一个在移植前，一个来自移植后的活检。这些校准然后可以与血液检查获得的克隆型一起使用，以检测排斥风险。

使用校准试验和群体研究发现相关克隆型

在另一实施方案中，相关克隆型的鉴别可以通过组合上述方法来实现。具体地，可以通过使用群体研究产生预测相关克隆型的算法来实现。另外，可以使用移植物活检和/或移植前血液样品通过来自相同患者的校准数据来实现。一个更优选的实施方案使用两种方法：群体建立的算法和个体校准，以最精确地鉴别相关克隆型。然后使用这些克隆型的水平产生排斥风险得分，以通过使用群体研究作为训练组预测排斥的可能性。

在该实施方案中可以使用两个校准试验：一个在移植前，一个来自移植后的活检。这些校准然后可以与血液检查获得的克隆型一起使用，以检测排斥风险。

GVHD的预测可以以非常类似的方法进行，使用相同的群体研究的概念来产生预测相关克隆型的算法。“阴性”校准也可以从移植前的供体样品产生。使用该算法和校准的方法可能更能预测相关克隆型。根据相关克隆型水平计算GVHD可能性得分的算法可以通过如上所述的方法使用群体研究产生。该算法然后可以用于预测下一组患者中的GVHD的可能性。

实施例22

监测用那他珠单抗治疗的MS患者中的PML感染

本发明的一个实施方案使用TCR和/或BCR谱来检测MS患者中的亚临床进行性多病灶脑白质病(PML)。PML是一种严重的且通常致死的疾病，它通过杀死合成髓磷脂的少突神经胶质细胞引起通常快速进展的脱髓鞘疾病。它是由JC病毒引起的，该病毒以潜伏状态存在于人群中的大多数中。在一部分免疫抑制人群(例如，AIDS)中，病毒被再激活，导致发展为这种严重的疾病。另外，有些使用药物进行免疫抑制的患者如移植后患者也可能发展为PML。某些具体药物已经与特定患者群体中PML的危险相关联。例如，那他珠单抗(Tysabri)与多发性硬化(MS)患者中超过10例PML的发展有关，导致它在一段时间内退市。公认那他珠单抗比其它FDA批准的用于治疗多发性硬化的药物更有效，但是由于担心发展PML其应用受到限制。一旦怀疑有PML，可以进行血浆去除术来降低患者中的药物浓度。MS和PML的症状之间的重叠有时可能延误PML的检测。迫切需要亚临床PML的早期检测。

这些克隆型可以从来自一些患者已发展PML的群体的血液样品中鉴别。该群体可以用来鉴别与后来的PML发展相关的克隆型。由于这些克隆型可以获得，可以产生一种算法，该算法鉴别能够区别这些与其它克隆型的参数。

使用群体研究发现相关克隆型

在这种情况下，产生一种算法来预测与PML的发生相关的克隆型。该算法可以用一组被认为与疾病相关的克隆型训练。在本发明的该实施方案中，可以在发现研究中使用来自具有JC病毒潜伏感染的患者群体的血液(或其它体液)样品，这些患者中的一些继续发展PML。来自所有这些样品的TCR(和/或BCR)可以进行测序，并且个体克隆型与传染原再激活后果的相关性可以用来区别相关的与非相关的克隆型。可以确定区别这两类克隆型的参数。这些参数可包括1)序列基序：该基序可以是特定的V或J区、组合VJ、或与关联的克隆型相关的DJ区的短序列；2)克隆型的大小；3)水平：绝对水平(每百万个的阅读数)或等级水平；4)与其它克隆型的相似性：其它高度相关克隆型的存在，如具有沉默变化的那些(编码相同氨基酸的核苷酸差异)或具有保守氨基酸改变的那些；5)对于BCR，克隆型中的体细胞突变水平和/或由于体细胞突变而与一些种系克隆型不同的独特克隆型的数目；6)携带特异性标志物的细胞的存在。一种替代的或补充的定义相关和非相关克隆型的方法来自于一组对同一传染原产生免疫应答的患者。这些患者中富含的克隆型(特别是比免疫应答前处于显著更高水平的那些)可以被认为是相关的，并可以确定区别它们与其它克隆型的参数。

类似地，相关克隆型可以从具有活动性PML的患者的样品鉴别，或者来自体外研究，以鉴别对JC病毒抗原有反应的克隆型。响应性的克隆型可以来源于一个或多个可能是健康的或者可能感染传染原的受试者。这些克隆型可以被认为是相关的，并且可以确定区别它们与其它克隆型的参数。

在发现研究中来自样品的谱数据然后用于预测再激活的可能性。由于该训练研究中的后果已知，人们可以使用标准交叉验证技术设计一种模型，该模型根据不同克隆型的水平产生PML风险得分。因此基于特定点的血液样品中TCR(和/或BCR)的谱，可以产生与再激活可能性有关的得分。该算法现在可以使用来自新患者的数据来预测患者的相关克隆型以及产生对于再激活可能性的PML风险得分。

以非常相似的方式，可以研究其它与感染相关的后果。例如，除了潜伏感染的再激活以外，人们可以评价感染的清除。此外，基于TCR和/或BCR所有组成成分，人们可能能够评价对特定传染原具有免疫性的可能性。

实施例23

监测潜伏感染的再激活

在另一实施方案中，TCR和BCR谱分析可以用来监测感染，该感染具有急性感染期，随后是潜伏期和再激活。这些疾病的实例包括乙型肝炎和丙型肝炎以及疱疹病毒。早期预测感染是希望的。

使用校准试验发现相关克隆型

在另一实施方案中，可以对每名患者使用校准试验实施鉴别相关克隆型的方法。在患者对传染原产生免疫应答的前一时间点来自同一患者的生物样品的存在可以用来鉴别相关克隆型。然后可以检测血液中的这组克隆型，并对再激活可能性产生再激活风险得分。产生该得分的算法通过发现研究产生，该研究类似于上述使用可获得的临床数据和相关克隆型计数产生近似于再激活可能性的再激活风险得分的研究。为了使用该得分，在临床实践中在急性感染期从新的患者获得样品。该数据将与潜伏期采集的后续样品一起使用，以为了临床目的测量再激活风险。

使用校准试验和群体研究发现相关克隆型

在另一实施方案中，相关克隆型的鉴别可以通过组合上述方法来实现。具体地，可以通过使用群体研究产生预测相关克隆型的算法来实现。相关克隆型可以从具有已知感染后果的患者和/或一组对传染原具有主动免疫应答的患者的群体研究获得，和/或从体外实验获得，以鉴别与传染原具有反应性的克隆型。另外，可以通过来自同一患者的校准数据实现，其中使用对相关传染原具有主动免疫应答时的较早的数据点。一个更优选的实施方案使用两种方法：群体建立的算法和个体校准，以最精确地鉴别相关克隆型。然后使用这些克隆型的水平产生再激活风险得分，以通过使用群体研究作为训练组预测再激活的可能性。为了使用该得分，对在诊所在急性感染期从新的患者采集的样品进行谱分析。该数据将与潜伏期采集的后续样品一起使用，以为了临床目的测量再激活风险。可以使用类似的结构研究传染原清除和/或对它的免疫。

实施例24

在免疫治疗过程中监测变应性应答

变应性鼻炎是一种常见的疾病，它影响到美国人口中的大约11％。它一般是对花粉或粉尘的变态反应。消除这种暴露是困难的，它需要不懈的努力。用于慢性鼻炎的最常见的治疗是解充血药、抗组胺药和鼻用类固醇。在严重的病例中进行免疫治疗。免疫治疗的目的是使患者脱敏。首先，使用许多潜在的变应原进行攻击，以确定患者与之反应的特定变应原。然后在数月至数年的时间里给患者注射剂量逐渐提高的变应原，直到达到维持剂量，然后继续治疗几年。患者一般在3-6个月内可感觉到症状改善，但是也可能晚到12-18个月，但是大部分患者没有从这种治疗中受益或者复发。缓慢增加剂量的一个原因是如果患者在充分脱敏之前给予高剂量的变应原，则会有过敏反应的危险。

在本发明的一个实施方案中，TCR(和/或BCR)谱用来评价变应性鼻炎的疾病状态并产生变态反应得分，该变态反应得分能够预测患者在暴露于相关变应原时产生变应性应答的倾向性。设想可以进行发现研究以根据血液TCR(和/或BCR)谱确定变应性应答的可能性。这可以用于调整免疫治疗。可能的临床决定可以是如果认为无效则中断治疗，继续注射方案，或加速治疗以更快地达到维持剂量。

使用群体研究发现相关克隆型

在本发明的该实施方案中，可以使用进行免疫治疗的变应性鼻炎患者群体，他们具有已知的临床后果，并采集血液样品。来自所有这些样品的TCR(和/或BCR)可以进行测序，并且各克隆型与变态反应后果的相关性可以用来区别相关克隆型与非相关克隆型。随后，可以得到能够区别两类克隆型的参数。这些参数可以包括：1)序列基序：该基序可以是与关联的克隆型相关的特定V或J区、组合VJ、或DJ区中的短序列；2)克隆型的大小；3)水平：绝对水平(每百万的阅读数)或等级水平；4)与其它克隆型的相似性：其它高度相关克隆型的存在，如具有沉默变化(编码相同氨基酸的核苷酸差异)的那些或具有保守氨基酸变化的那些；5)对于BCR，克隆型中的体细胞突变的水平和/或因体细胞突变而与某些种系克隆型不同的独特克隆型的数目；6)带有特异性标志物的细胞的存在。定义相关和非相关克隆型的替代或补充方法将使用来自特定变应原阳性患者的阳性变态反应试验材料的活检。在变应原注射部位预期存在相关克隆型的高富集。区别这些与其它克隆型的参数可以如前所述鉴别。

来自血液样品的谱数据然后用来预测变态反应状态。由于该训练研究中后果已知，人们可以使用标准交叉验证技术设计一种模型，该模型根据不同克隆型的水平产生变态反应得分。由于特定点的新的血液样品中TCR(和/或BCR)的分布，可以产生变态反应得分，以估计该患者倾向于产生变应性应答的程度。

使用校准试验发现相关克隆型

在另一个实施方案中，可以对每名患者使用校准试验实施鉴别相关克隆型的方法。该方法涉及来自从患者取得的具有阳性变应原应答的部位的活检样品。这可以来自初始变态反应检测，进行该检测是为了确定患者响应的特定变应原，或来自任何进一步治疗注射的部位的样品。这可以进行一次以上以确保在有些表位扩散的情况下检查适当的克隆型。来自这些活检样品的TCR和/或BCR可以用来鉴别相关克隆型，如样品中普遍存在的那些所定义的。然后可以检测血液中的这组克隆型，并对变态反应应答的可能性产生得分。产生变态反应得分的算法通过发现研究产生，该研究类似于上述使用可获得的临床数据和相关克隆型水平产生估计变态反应状态的变态反应得分的研究。

使用校准试验和群体研究发现相关克隆型

在另一实施方案中，通过上述方法的组合可以实现相关克隆型的鉴别。特别是，这可以通过使用群体研究产生预测相关克隆型的算法来实现。另外，也可以使用具有阳性变应原应答的部位的活检通过来自相同患者的校准数据实现。一个更优选的实施方案使用两种方法：群体建立的算法和个体校准，以最精确地鉴别相关克隆型。然后使用这些克隆型的水平产生变态反应得分，以通过使用群体研究作为训练组预测变态反应的状态。

本发明的优选实施方案已经在此显示和描述，但是对本领域技术人员明显的是这些实施方案只是作为举例提供。在不背离本发明的情况下，本领域技术人员可以想到大量变化、改变和替换。应当理解，此处所述的本发明实施方案的各种替代方案可以用于实施本发明。以下权利要求旨在定义本发明的范围，从而覆盖这些权利要求和其等同物的范围内的方法和结构。

Claims

1.一种确定T细胞和/或B细胞中的重组DNA序列谱的方法，包括：

a.从受试者获得包含T细胞和/或B细胞的样品；

b.从所述细胞空间上分离基因组DNA的个体分子；

c.对所述空间上分离的基因组DNA的个体分子进行测序；

d.确定来自所述样品的不同序列的水平，以产生所述重组DNA序列谱。

2.一种确定T细胞和/或B细胞中的重组DNA序列谱的方法，包括：

a.从受试者获得包含T细胞和/或B细胞的样品；

b.从所述细胞空间上分离基因组DNA的个体分子；

c.扩增所述基因组DNA的个体分子；

d.对所述扩增的DNA进行测序；和

e.确定来自所述样品的不同序列的水平，以产生所述重组DNA序列。

3.一种确定T细胞和/或B细胞中的重组DNA序列谱的方法，包括：

a.从受试者获得包含T细胞和/或B细胞的样品；

b.从所述细胞扩增基因组DNA；

c.空间上分离所述扩增的DNA的个体分子；

d.对所述空间上分离的扩增DNA的个体分子进行测序；和

e.确定来自所述样品的不同序列的水平，以产生所述重组DNA序列谱。

4.一种确定T细胞和/或B细胞中的重组DNA序列谱的方法，包括：

a.从受试者获得包含T细胞和/或B细胞的样品；

b.从所述细胞扩增基因组DNA；

c.空间上分离所述扩增的DNA的个体分子；

d.再扩增所述扩增的DNA分子；

e.对所述再扩增的DNA分子进行测序；和

f.确定来自所述样品的不同序列的水平，以产生所述重组DNA序列谱。

5.一种确定T细胞和/或B细胞中的重组DNA序列谱的方法，包括：

a.从受试者获得包含T细胞和/或B细胞的样品；

b.逆转录所述细胞的RNA以形成cDNA；

c.空间上分离所述cDNA的个体分子；

d.任选地再扩增所述空间上分离的个体cDNA分子；

e.对所述cDNA和/或再扩增的cDNA进行测序；和

6.一种确定T细胞和/或B细胞中的重组DNA序列谱的方法，包括：

a.从受试者获得包含T细胞和/或B细胞的样品；

b.空间上分离所述样品中的个体细胞；

c.对来自所述细胞的个体核酸分子进行测序；和

7.权利要求1-5中任一项的方法，其中所述扩增和/或再扩增包括PCR、多重PCR、TMA、NASBA或LAMP。

8.权利要求1-5中任一项的方法，其中所述空间上分离包括将所述DNA或cDNA亚克隆到用来转化细菌的载体中，在固体支持体上二维分离所述DNA或cDNA，在含微团的溶液中三维分离所述DNA或cDNA，或使用微反应室分离分子。

9.权利要求1-5中任一项的方法，其中所述扩增和/或再扩增是通过携带亚克隆的DNA或cDNA的细菌的生长，DNA或cDNA在载玻片上的扩增，或DNA或cDNA在珠上的扩增。

10.权利要求1-6中任一项的方法，其中所述测序包括双脱氧测序。

11.权利要求1-6中任一项的方法，其中所述测序包括使用可逆终止的标记核苷酸合成测序。

12.权利要求1-6中任一项的方法，其中所述测序包括检测核苷酸掺入的焦磷酸释放。

13.权利要求1-6中任一项的方法，其中所述测序包括与标记的寡核苷酸探针文库的等位基因特异性杂交。

14.权利要求1-6中任一项的方法，其中所述测序包括合成测序，该合成测序是利用与标记寡核苷酸探针文库的等位基因特异性杂交，随后连接所述探针。

15.权利要求1-6中任一项的方法，其中所述测序包括实时监测聚合步骤过程中标记核苷酸的引入。

16.权利要求1-6中任一项的方法，其中所述重组DNA序列包含T细胞受体基因和/或免疫球蛋白基因。

17.权利要求1-6中任一项的方法，其中所述测序包括对免疫球蛋白和/或T细胞受体基因的全克隆序列的亚群进行测序。

18.权利要求17的方法，其中所述全克隆序列的亚群包括免疫球蛋白或T细胞受体基因的V-D连接、D-J连接、免疫球蛋白或T细胞受体基因的完整可变区、抗原识别区、或互补决定区3(CDR3)。

19.权利要求17的方法，其中所述T细胞受体基因包含T细胞受体β基因。

20.权利要求17的方法，其中所述免疫球蛋白基因包含免疫球蛋白重链基因。

21.权利要求1-6中任一项的方法，其中所述扩增或再扩增包含多个互补于V区段的引物和一个互补于C区段的引物。

22.权利要求1-6中任一项的方法，其中所述扩增或再扩增包含多个互补于V区段的引物和多个互补于C区段的引物。

23.权利要求22的方法，其中所述多个互补于V区段的引物包含至少三个不同的用于每个V区段的引物，多个互补于C区段的引物包含至少1个、至少2个、至少3个、至少4个、至少5个或至少6个引物。

24.权利要求1-6中任一项的方法，其中所述T细胞和/或B细胞是总T细胞和/或B细胞的亚群。

25.权利要求24的方法，其中所述T细胞的亚群是CD4+，CD8+细胞或CD27^高细胞。

26.权利要求1-6中任一项的方法，其中所述样品包含至少100,000个、至少500,000个、至少750,000个或至少1,000,000个T细胞。

27.权利要求1-6中任一项的方法，其中所述测序包括至少1000阅读/运行、至少10,000阅读/运行、至少100,000阅读/运行或至少1,000,000阅读/运行。

28.权利要求1-6中任一项的方法，其中所述测序包括每个阅读产生约30bp、约40bp、约50bp、约60bp、约70bp、约80bp、约90bp、约100bp、约110或约120bp。

29.权利要求1-6中任一项的方法，其中所述样品当受试者处于自身免疫病的发作状态时采集。

30.权利要求1-6中任一项的方法，其中所述样品从患有或怀疑患有系统性红斑狼疮的受试者采集。

31.一种确定受试者的一个或多个相关克隆型的方法，包括：

a.通过对来自受试者的至少一个样品的空间上分离的个体分子进行核酸测序，产生一个或多个克隆型谱，其中所述至少一个样品与疾病的第一状态有关，和

b.基于所述一个或多个克隆型谱确定受试者中的一个或多个相关克隆型。

32.权利要求31的方法，其中所述至少一个样品来自受疾病影响的组织。

33.权利要求31的方法，其中所述确定一个或多个相关克隆型包括比较来自至少两个样品的克隆型谱。

34.权利要求31的方法，其中所述疾病的第一状态是疾病的高峰状态。

35.权利要求34的方法，其中所述一个或多个相关克隆型存在于疾病的高峰状态。

36.权利要求34的方法，其中所述一个或多个相关克隆型在疾病的高峰状态不存在。

37.权利要求34的方法，其中所述一个或多个相关克隆型在疾病的高峰状态时高。

38.权利要求34的方法，其中所述一个或多个相关克隆型在疾病的高峰状态时低。

39.权利要求31的方法，其中所述样品包含T细胞和/或B细胞。

40.权利要求39的方法，其中所述T细胞和/或B细胞包含T细胞和/或B细胞的亚群。

41.权利要求40的方法，其中所述T细胞和/或B细胞的亚群通过与标志物相互作用而富集。

42.权利要求41的方法，其中所述标志物是T细胞和/或B细胞的亚群上的细胞表面标志物。

43.权利要求39的方法，其中所述T细胞和/或B细胞的亚群与特异性存在于疾病中的抗原相互作用。

44.权利要求31的方法，其中所述疾病是系统性红斑狼疮或多发性硬化。

45.一种开发算法的方法，该算法能够预测患病患者的任何样品中的一个或多个相关克隆型，该方法包括：

a.从一组样品产生多个克隆型谱，其中该样品与所述疾病有关，

b.从这组样品鉴别一个或多个相关克隆型，

c.利用来自b)中鉴别的一个或多个相关克隆型的序列参数和/或功能数据来开发能够预测患病患者的任何样品中的相关克隆型的算法。

46.权利要求45的方法，其中所述一组样品获自一个或多个受疾病影响的组织。

47.权利要求45的方法，其中所述一个或多个相关克隆型的鉴别包括比较来自至少两个样品的克隆型谱。

48.权利要求45的方法，其中所述功能数据包括T细胞和/或B细胞表面上的标志物的结合能力或T细胞或B细胞与抗原的相互作用。

49.权利要求45的方法，其中所述序列参数包括核酸序列和预测的氨基酸序列。

50.权利要求45的方法，其中所述样品来自一个或多个处于疾病高峰期的个体。

51.权利要求50的方法，其中所述一个或多个相关克隆型在疾病的高峰状态时存在。

52.权利要求50的方法，其中所述一个或多个相关克隆型在疾病的高峰状态时处于高水平。

53.权利要求50的方法，其中所述一个或多个相关克隆型在疾病的高峰状态时处于低水平。

54.权利要求50的方法，其中所述一个或多个相关克隆型在疾病的高峰状态时不存在。

55.权利要求45的方法，其中所述疾病是系统性红斑狼疮或多发性硬化。

56.一种发现个体的一个或多个相关克隆型的方法，该方法包括：

a.将来自个体的样品的克隆型谱输入权利要求45的算法中，和

b.利用该算法确定对于该个体的一个或多个相关克隆型。

57.权利要求56的方法，其中所述样品在疾病的高峰状态时采集。

58.权利要求56的方法，其中所述样品采自受疾病影响的组织。

59.一种产生计算疾病活动性得分的算法的方法，包括：

a.开发一种算法，该算法使用一组因素将相关克隆型的水平组合为疾病活动性得分，

b.比较所述疾病活动性得分与关于疾病状态的临床数据，和

c.优化这些因素，以将临床数据与疾病活动性得分之间的相关性最大化。

60.监测个体的疾病状态的方法，包括：

a.从来自个体的样品确定克隆型谱，

b.将来自a)的克隆型谱信息输入到算法中，该算法计算权利要求59中产生的疾病活动性得分，和

c.使用计算疾病活动性得分的算法产生预示个体疾病状态的得分。

61.权利要求60的方法，还包括确定个体中的一个或多个相关克隆型，并将一个或多个相关克隆型的信息输入到算法中。

62.权利要求61的方法，其中所述确定个体中的一个或多个相关克隆型包括：

a.通过对来自受试者的至少一个样品的各个空间上分离的分子进行核酸测序，产生一个或多个克隆型谱，其中所述至少一个样品与疾病的第一状态相关，和

63.权利要求61的方法，其中所述确定个体中的一个或多个相关克隆型包括：

a.将来自个体的样品的克隆型谱输入到能够预测一个或多个相关克隆型的算法中，其中所述能够预测一个或多个相关克隆型的算法是通过以下方式开发的：

i.从一组样品产生多个克隆型谱，其中该样品与疾病有关，

ii.从这组样品鉴别一个或多个相关克隆型，

iii.利用来自ii)中鉴别的一个或多个相关克隆型的序列参数和/或功能数据来开发能够预测患病患者的任何样品中的相关克隆型的算法，和

b.利用能够预测一个或多个相关克隆型的算法确定对于该个体的一个或多个相关克隆型。

64.权利要求61的方法，其中所述疾病是系统性红斑狼疮或多发性硬化。