CN104520440A

CN104520440A - 用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法

Info

Publication number: CN104520440A
Application number: CN201380022986.6A
Authority: CN
Inventors: H·S·罗宾斯; C·S·卡尔森; R·J·利文斯顿; R·O·埃默森; A·谢伍德
Original assignee: Adaptive Biotechnologies Corp
Current assignee: Adaptive Biotechnologies Corp
Priority date: 2012-05-08
Filing date: 2013-05-08
Publication date: 2015-04-15
Anticipated expiration: 2033-05-08
Also published as: WO2013169957A1; US20150017652A1; US10214770B2; HK1206789A1; MX2014013443A; US20160319340A1; ES2582554T3; EP3091089B1; CN107586832A; JP2015523057A; IL235417A0; JP5756247B1; CA2872468C; EP2831276A1; AU2013259544B2; PL2831276T3; RU2014143942A; CY1117899T1; PT2831276T; JP6385889B2

Abstract

本发明描述了用于使一组高度异质的寡核苷酸引物的DNA扩增效率标准化的组合物和方法，所述寡核苷酸引物通常可用于扩增一组异质的DNA模板，所述DNA模板含有编码T细胞受体(TCR)或免疫球蛋白(IG)的重排淋巴样细胞DNA。本发明所公开的实施例可用于克服在利用扩增引物亚组过程中的非期望的偏倚，所述非期望的偏倚导致对扩增产物进行多重高通量测序以定量样品中的独特TCR或Ig编码基因组时的不精确。本发明提供了供用作扩增引物组的校准用标准品的组合物，所述组合物包含基本上等摩尔量的多种多样性的模板寡核苷酸。本发明还提供了用于在扩增期间识别和修正偏倚引物效率的方法。

Description

用于测量和校准多重PCR反应中的扩增偏倚的组合物和方法

相关领域的描述

适应性免疫系统采用若干策略生成T-和B-细胞抗原受体(即适应性免疫受体)的组库，其具有足够的多样性以识别众多的潜在病原体。T细胞识别与各种癌症或传染性生物体相关的众多抗原的能力由其T细胞抗原受体(TCR)赋予，所述受体是来自TCRA基因座的α(alpha)链与来自TCRB基因座的β(beta)链的异二聚体，或来自TCRG基因座的γ(gamma)链与来自TCRD基因座的δ(delta)链的异二聚体。构成这些链的蛋白质由DNA编码，所述DNA在淋巴样细胞中采用独特的重排机制以便生成极其多样的TCR。该多亚基免疫识别受体与CD3复合体相连并结合于由主要组织相容性复合体(MHC)类别I或MHC类别II蛋白质递呈在抗原递呈细胞(APC)表面上的肽。TCR结合于APC上的抗原肽是T细胞活化过程的中心事件，T细胞活化在免疫突触处T细胞与APC之间的接触点处发生。

每个TCR肽均含有可变互补决定区(CDR)以及骨架区(FR)和恒定区。αβT细胞的序列多样性主要由α和β链可变结构域的第三互补决定区(CDR3)环的氨基酸序列决定，所述多样性分别是β链基因座中的可变(V_β)基因区段、多样性(D_β)基因区段与连接(J_β)基因区段之间重组以及α链基因座中的类似V_α基因区段与J_α基因区段之间重组的结果。TCRα和β链基因座中的多个此类基因区段的存在使得能够编码大量不同的CDR3序列。TCR基因重排过程期间V_β-D_β、D_β-J_β和V_α-J_α接合部处核苷酸的独立添加和缺失进一步增加了CDR3序列多样性。在这方面，免疫能力源于TCR的多样性。

γδTCR异二聚体与αβTCR不同之处在于其编码的受体与先天免疫系统紧密相互作用并以非HLA依赖性方式识别抗原。TCRγδ在发育早期表达，并具有特化的解剖分布、独特的病原体和小分子特异性，以及广谱的先天和适应性细胞相互作用。TCRγV和J区段表达的偏倚模式在个体发生早期建立。因此，成体组织中的多样TCRγ组库是在环境暴露于病原体和有毒分子造成的刺激之后大量外周扩增的结果。

免疫球蛋白(Ig或IG)，本文也称为B细胞受体(BCR)，是由B细胞表达的蛋白质，所述蛋白质由四条多肽链组成，即来自IGH基因座的两条重链(H链)以及来自IGK或IGL基因座的两条轻链(L链)，从而形成H₂L₂结构。H和L链各自包含三个涉及抗原识别的互补决定区(CDR)，以及骨架区和恒定结构域，这与TCR类似。Ig的H链最初使用IGM或IGD恒定区外显子表达为膜结合同工型，但在抗原识别后恒定区可类别转换为若干另外的同种型，包括IGG、IGE和IGA。与TCR一样，个体内的初始Ig的多样性主要由高变互补决定区(CDR)决定。与TCRB类似，H链的CDR3结构域由V_H、D_H和J_H基因区段的组合连接所形成。Ig基因重排过程期间V_H-D_H、D_H-J_H和V_H-J_H接合部处核苷酸的独立添加和缺失进一步增加了高变结构域序列多样性。与TCR不同，在初始B细胞最初识别抗原后整个重排IG基因的体细胞高频突变(SHM)进一步提高了Ig序列多样性。SHM的过程不受限于CDR3，因此可将变化引入骨架区、CDR1和CDR2、以及体细胞重排的CDR3的生殖系序列中。

由于适应性免疫系统部分地通过表达独特TCR或BCR的细胞的克隆性扩增来起作用，准确测量每个T细胞或B细胞克隆的总丰度的变化对于理解适应性免疫应答的动态是重要的。例如，健康人体具有数百万独特的重排TCRβ链，每条链在健康个体的大致万亿T细胞中的数百至数千克隆T细胞中携带。利用高通量测序方面的进步，最近出现了分子免疫学的新领域以对巨大TCR和BCR组库进行谱图分析。用于对重排的适应性免疫受体基因序列测序并用于适应性免疫受体克隆型确定的组合物和方法在U.S.A.N.13/217,126、U.S.A.N.12/794,507、PCT/US2011/026373和PCT/US2011/049012中有所描述，它们全部以引用方式并入本文。

到目前为止，已采用了若干不同策略来对编码适应性免疫受体的核酸以高通量方式定量地测序，并且这些策略的区别可在于例如用于扩增CDR3编码区的方法以及对基因组DNA(gDNA)或信使RNA(mRNA)测序的选择。

对mRNA测序是比对gDNA测序更可能简便的方法，因为mRNA剪接事件去除了J与C区段之间的内含子。这允许在C区使用通用3'PCR引物扩增具有不同V区和J区的适应性免疫受体(例如，TCR或Ig)。对于每种TCRβ而言，例如十三个J区段均小于60个碱基对(bp)长。因此，剪接事件导致编码TCRβ恒定区的相同多核苷酸序列(不论使用的是哪些V和J序列)在小于100bp重排VDJ接合部内。然后可使用与mRNA的多聚A尾互补的多聚dT引物、随机小引物(通常为六聚物或九聚物)或C区段特异性寡核苷酸，将剪接的mRNA逆转录为互补DNA(cDNA)。这应产生TCRcDNA的无偏文库(因为所有cDNA均用相同寡核苷酸引发，不论是多聚dT、随机六聚物，还是C区段特异性寡核苷酸)，然后可对所述无偏文库测序以获得有关每种重排中使用的V和J区段以及CDR3特异性序列的信息。此类测序可使用单种、跨CDR3的长读段(“长读段”)技术，或者可替代地涉及使用片段库和较高通量较短序列读段进行的较长序列的鸟枪法拼接。

然而，基于mRNA测序来对表达特定重排TCR(或Ig)的样品中的细胞数量定量的尝试难以说明，因为每个细胞潜在地表达不同数量的TCRmRNA。例如，体外活化的T细胞每个细胞拥有的mRNA数量是静止期T细胞的10-100倍。到目前为止，有关不同功能状态的T细胞的TCR mRNA的相对量的信息非常有限，因此大量mRNA的定量不一定能准确测量携带每种克隆TCR重排的细胞的数量。

另一方面，大多数T细胞具有一个有效重排的TCRα和一个有效重排的TCRβ基因(或两个重排的TCRγ和TCRδ)，并且大多数B细胞具有一个有效重排的Ig重链基因和一个有效重排的Ig轻链基因(IGK或IGL)，因此样品中的编码TCR或BCR的基因组DNA的定量应分别与样品中的T或B细胞的数量直接关联。编码适应性免疫受体链中的任何一种或多种的多核苷酸的基因组测序有利地需要以等同效率扩增取自受试者淋巴样细胞的含DNA样品中存在的许多可能重排CDR3序列的所有序列，然后进行定量测序，使得可获得每个重排CDR3克隆型的相对丰度的定量量度。

然而，采用此类方法遇到了困难，因为使用多重PCR时不易对每个重排克隆实现等同的扩增和测序效率。例如，在TCRB处每个克隆采用54个可能的生殖系V区编码基因中的一个和13个可能的J区编码基因中的一个。V和J区段的DNA序列必需具有多样性，以生成多样性适应性免疫组库。该序列多样性使得不可能设计出将以等同亲和力退火至所有V区段(或J区段)的单个通用引物序列，并会产生复杂DNA样品，其中使用多重扩增和高通量测序同时定量多种分子物质的能力受到技术限制，而阻碍了所述样品中所含的多种不同序列的准确测定。

一种或多种因素可引起使测序数据输出与输入克隆型拷贝数之间的关联出现偏态的伪差，从而削弱了从基于TCRβ基因模板的高度多样集合的多重扩增的测序策略获得可靠定量数据的能力。这些伪差通常是多重扩增步骤过程中多样引物的不等同使用所引起。在使用多样扩增模板的多重反应中可出现随示差退火动力学而变的一种或多种寡核苷酸引物的此类偏倚利用，原因在于如下的一者或多者：模板和/或寡核苷酸引物的核苷酸碱基组成的差异、模板和/或引物长度的差异、所使用的具体聚合酶、扩增反应温度(例如，退火、延伸和/或变性温度)和/或其他因素(例如，Kanagawa,2003J.Biosci.Bioeng.96:317(Kanagawa，2003年，《生物学与生物工程杂志》，第96卷，第317页)；Day et al.,1996Hum.Mol.Genet.5:2039(Day等人，1996年，《人分子遗传学》，第5卷，第2039页)；Ogino et al.,2002J.Mol.Diagnost.4:185(Ogino等人，2002年，《分子诊断学杂志》，第4卷，第185页)；Barnard et al.,1998Biotechniques 25:684(Barnard等人，1998年，《生物技术》，第25卷，第684页)；Aird et al.,2011GenomeBiol.12:R18(Aird等人，2011年，《基因组生物学》，第12卷，第R18页))。

很明显，仍然需要改善的组合物和方法，其将允许以避免偏态结果的方式准确定量复杂样品中的适应性免疫受体编码DNA序列多样性，所述偏态结果诸如单独序列失实的过高占比或过低占比，原因在于在用于复杂模板DNA群体的多重扩增的寡核苷酸引物组中扩增特异性模板过程中的偏倚。本发明所述的实施例解决了该需求并提供了其他相关优点。

发明内容

本发明公开了一种用于使寡核苷酸引物组的扩增效率标准化的组合物，所述寡核苷酸引物组能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子，所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子，每种适应性免疫受体包含可变区和连接区，所述组合物包含多种模板寡核苷酸，所述模板寡核苷酸具有多种由如下通式表示的寡核苷酸序列：5'-U1-B1-V-B2-R-B3-J-B4-U2-3'[I]，其中：(a)V是包含适应性免疫受体可变(V)区编码基因序列或其互补序列的至少20个且不超过1000个连续核苷酸的多核苷酸，并且每种V多核苷酸包含独特的寡核苷酸序列；(b)J是包含适应性免疫受体连接(J)区编码基因序列或其互补序列的至少15个且不超过600个连续核苷酸的多核苷酸，并且每种J多核苷酸包含独特的寡核苷酸序列；(c)U1要么不存在，要么包含选自如下的寡核苷酸序列：(i)第一通用接头寡核苷酸序列和(ii)连接至第一通用接头寡核苷酸序列并位于其5'端的第一测序平台特异性寡核苷酸序列；(d)U2要么不存在，要么包含选自如下的寡核苷酸序列：(i)第二通用接头寡核苷酸序列和(ii)连接至第二通用接头寡核苷酸序列并位于其5'端的第二测序平台特异性寡核苷酸序列；(e)B1、B2、B3和B4各自独立地要么不存在，要么各自包含具有3-25个连续核苷酸的条形码序列的寡核苷酸B，其中B1、B2、B3和B4各包含一寡核苷酸序列，所述寡核苷酸序列独特地识别作为成对组合的(i)(a)的独特V寡核苷酸序列和(ii)(b)的独特J寡核苷酸序列；(f)R要么不存在，要么包含限制性酶识别位点，所述限制性酶识别位点包含不存在于(a)-(e)中的寡核苷酸序列，并且其中：(g)所述多种模板寡核苷酸包含至少a种或至少b种独特寡核苷酸序列，以较大者为准，其中a是受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是受试者中的独特适应性免疫受体J区编码基因区段的数量，并且所述组合物包含至少一种针对每种独特V多核苷酸的模板寡核苷酸以及至少一种针对每种独特J多核苷酸的模板寡核苷酸。

在一个实施例中，a为1至受试者的哺乳动物基因组中V基因区段的最大数量的数。在另一个实施例中，b为1至受试者的哺乳动物基因组中J基因区段的最大数量的数。在其他实施例中，a为1或者b为1。

在一些实施例中，所述多种模板寡核苷酸包含至少(a×b)种独特的寡核苷酸序列，其中a是哺乳动物受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是哺乳动物受试者中的独特适应性免疫受体J区编码基因区段的数量，并且所述组合物包含至少一种针对V区编码基因区段与J区编码基因区段的每种可能组合的模板寡核苷酸。在一个实施例中，J包含适应性免疫受体J区编码基因序列的恒定区。

在另一个实施例中，适应性免疫受体选自TCRB、TCRG、TCRA、TCRD、IGH、IGK和IGL。在一些实施例中，(a)的V多核苷酸编码TCRB、TCRG、TCRA、TCRD、IGH、IGK或IGL受体V区多肽。在其他实施例中，(b)的J多核苷酸编码TCRB、TCRG、TCRA、TCRD、IGH、IGK或IGL受体J区多肽。

在一些实施例中，终止密码子介于V与B2之间。

在一个实施例中，所述多种模板寡核苷酸中的每种模板寡核苷酸以基本上等摩尔量存在。在另一个实施例中，所述多种模板寡核苷酸具有选自如下的多种由通式(I)表示的序列：(1)所述多种由通式(I)表示的寡核苷酸序列，其中V和J多核苷酸具有在图5a-5l中作为TCRB V/J组1、TCRB V/J组2、TCRB V/J组3、TCRB V/J组4、TCRB V/J组5、TCRB V/J组6、TCRB V/J组7、TCRB V/J组8、TCRB V/J组9、TCRB V/J组10、TCRB V/J组11、TCRB V/J组12和TCRB V/J组13的68组TCRB V和J SEQ ID NO中的至少一组中示出的TCRB V和J序列；(2)所述多种由通式(I)表示的寡核苷酸序列，其中V和J多核苷酸具有在图6a和6b中作为TCRG V/J组1、TCRGV/J组2、TCRG V/J组3、TCRG V/J组4和TCRG V/J组5的14组TCRG V和J SEQ ID NO中的至少一组中示出的TCRG V和J序列；(3)所述多种由通式(I)表示的寡核苷酸序列，其中V和J多核苷酸具有在图7a-7m中作为IGHV/J组1、IGH V/J组2、IGH V/J组3、IGH V/J组4、IGH V/J组5、IGHV/J组6、IGH V/J组7、IGH V/J组8和IGH V/J组9的127组IGH V和JSEQ ID NO中的至少一组中示出的IGH V和J序列；(4)如SEQ ID NO:3157-4014中所示的所述多种由通式(I)表示的寡核苷酸序列；(5)如SEQ IDNO:4015-4084中所示的所述多种由通式(I)表示的寡核苷酸序列；(6)如SEQID NO:4085-5200中所示的所述多种由通式(I)表示的寡核苷酸序列；(7)如SEQ ID NO:5579-5821中所示的所述多种由通式(I)表示的寡核苷酸序列；(8)如SEQ ID NO:5822-6066所示的所述多种由通式(I)表示的寡核苷酸序列；以及(9)如SEQ ID NO:6067-6191中所示的所述多种由通式(I)表示的寡核苷酸序列。

在一些实施例中，V是包含适应性免疫受体V区编码基因序列或其互补序列的至少30、60、90、120、150、180或210个连续核苷酸的多核苷酸。在另一个实施例中，V是包含适应性免疫受体V区编码基因序列或其互补序列的不超过900、800、700、600或500个连续核苷酸的多核苷酸。

在其他实施例中，J是包含适应性免疫受体J区编码基因序列或其互补序列的至少16-30、31-60、61-90、91-120或120-150个连续核苷酸的多核苷酸。在另一个实施例中，J是包含适应性免疫受体J区编码基因序列或其互补序列的不超过500、400、300或200个连续核苷酸的多核苷酸。

在一些实施例中，每种模板寡核苷酸的长度小于1000、900、800、700、600、500、400、300或200个核苷酸。

在其他实施例中，所述组合物包含能够扩增编码一种或多种适应性免疫受体的重排核酸分子的一组寡核苷酸引物，所述寡核苷酸引物组包含复数a'种独特的V区段寡核苷酸引物和复数b'种独特的J区段寡核苷酸引物。在一些实施例中，a'为1至哺乳动物基因组中V基因区段的最大数量的数，并且b'为1至哺乳动物基因组中J基因区段的最大数量的数。在一个实施例中，a’为a。在另一个实施例中，b’为b。

在又一个实施例中，寡核苷酸引物组中的每种V区段寡核苷酸引物和每种J区段寡核苷酸引物能够特异性杂交至所述多种模板寡核苷酸中的至少一种模板寡核苷酸。在其他实施例中，每种V区段寡核苷酸引物包含与至少一种适应性免疫受体V区编码基因区段互补的至少15个连续核苷酸的核苷酸序列。在另一个实施例中，每种J区段寡核苷酸引物包含与至少一种适应性免疫受体J区编码基因区段互补的至少15个连续核苷酸的核苷酸序列。

在其他实施例中，所述组合物包含至少一种具有每种V区段寡核苷酸引物可与之特异性杂交的由通式(I)表示的寡核苷酸序列的模板寡核苷酸，以及至少一种具有每种J区段寡核苷酸引物可与之特异性杂交的由通式(I)表示的寡核苷酸序列的模板寡核苷酸。

本发明包括用于测定一组寡核苷酸引物的成员间的非均一核酸扩增潜能的方法，所述一组寡核苷酸引物能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子，所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子。所述方法包括用于如下目的步骤：(a)在多重PCR反应中扩增如本文所述的组合物以获得多种扩增的模板寡核苷酸；(b)对所述多种扩增的模板寡核苷酸进行测序，以对构成所述多种的每种独特模板寡核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸序列的出现频率；以及(c)将每种所述模板寡核苷酸序列的出现频率与预期分布进行比较，其中所述预期分布基于构成所述组合物的所述多种模板寡核苷酸的预定摩尔比，并且其中所述模板寡核苷酸序列的所述出现频率与所述预期分布之间的偏差指示所述寡核苷酸扩增引物组的成员间的非均一核酸扩增潜能。

在一个实施例中，预定摩尔比是等摩尔的。在另一个实施例中，预期分布包括由所述寡核苷酸引物组扩增的所述模板寡核苷酸组的均一扩增水平。在又一个实施例中，每种扩增的模板核酸分子的长度小于1000、900、800、700、600、500、400、300、200、100、90、80或70个核苷酸。

所述方法包括这样的步骤，所述步骤包括：对于相对于预期分布呈现非均一扩增潜能的所述寡核苷酸引物组的每个成员，调节所述寡核苷酸扩增引物组中的所述寡核苷酸引物成员的相对占比。在一个实施例中，调节包括增加所述寡核苷酸引物组中的所述成员的相对占比，从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。在另一个实施例中，调节包括减小所述寡核苷酸引物组中的所述成员的相对占比，从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。

在其他实施例中，所述寡核苷酸引物组不包括特异性杂交至V区假基因或孤独基因或者J区假基因或孤独基因的寡核苷酸引物。

所述方法还包括这样的步骤，所述步骤包括：对于相对于预期分布呈现非均一扩增潜能的所述寡核苷酸扩增引物组的每个成员，计算所扩增的模板核酸分子(所述成员促进其扩增)的成比例增加或减小的出现频率，从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。

本发明包括用于定量多种重排核酸分子的方法，所述重排核酸分子编码生物样品中的一种或多种适应性免疫受体，所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子，每种适应性免疫受体包含可变(V)区和连接(J)区，所述方法包括：(A)在多重聚合酶链式反应(PCR)中扩增重排核酸分子，所述反应包含：(1)来自包含哺乳动物受试者的淋巴样细胞的生物样品的重排核酸分子；(2)如本文所述的组合物，其中存在已知数量的具有独特寡核苷酸序列的所述多种模板寡核苷酸的每一者；(3)寡核苷酸扩增引物组，其能够扩增编码来自生物样品的一种或多种适应性免疫受体的重排核酸分子。

在一些实施例中，所述引物组包含：(a)基本上等摩尔量的多种V区段寡核苷酸引物，其各自独立地能够特异性杂交至至少一种编码适应性免疫受体V区多肽的多核苷酸或特异性杂交至其互补序列，其中每种V区段引物包含与至少一种功能性适应性免疫受体V区编码基因区段互补的至少15个连续核苷酸的核苷酸序列，并且其中所述多种V区段引物特异性杂交至组合物中存在的基本上所有功能性适应性免疫受体V区编码基因区段，以及(b)基本上等摩尔量的多种J区段寡核苷酸引物，其各自独立地能够特异性杂交至至少一种编码适应性免疫受体J区多肽的多核苷酸或特异性杂交至其互补序列，其中每种J区段引物包含与至少一种功能性适应性免疫受体J区编码基因区段互补的至少15个连续核苷酸的核苷酸序列，并且其中所述多种J区段引物特异性杂交至组合物中存在的基本上所有功能性适应性免疫受体J区编码基因区段。

在另一个实施例中，V区段寡核苷酸引物和J区段寡核苷酸引物能够在所述多重聚合酶链式反应(PCR)中促进如下的扩增：(i)组合物中的基本上所有模板寡核苷酸以产生大量扩增的模板寡核苷酸，所述大量扩增的模板核酸分子足以定量组合物中的模板寡核苷酸的多样性，以及(ii)生物样品中的基本上所有编码适应性免疫受体的重排核酸分子以产生大量扩增的重排DNA分子，所述大量扩增的重排核酸分子足以定量来自生物样品的DNA中的重排核酸分子的多样性。

在一个实施例中，所述多种扩增的模板寡核苷酸中和所述多种扩增的重排核酸分子中的每种扩增核酸分子的长度小于1000个核苷酸；(B)对所述扩增的模板寡核苷酸和所述扩增的重排核酸分子进行定量测序以定量(i)含有至少一种寡核苷酸条形码序列的扩增模板寡核苷酸的模板产物数量，以及(ii)缺少寡核苷酸条形码序列的扩增重排核酸分子的重排产物数量；(C)将(B)(i)的模板产物数量除以(A)(2)的具有独特寡核苷酸序列的所述多种模板寡核苷酸中的每一者的已知数量，来计算扩增因子；以及(D)将(B)(ii)的重排产物数量除以(C)中计算的扩增因子以定量样品中的独特适应性免疫受体编码重排核酸分子的数量。

在其他实施例中，样品中的独特适应性免疫受体编码重排核酸分子的定量数量是样品中的独特B细胞或独特T细胞基因组模板的数量。

本发明包括用于计算多重PCR测定法中的平均扩增因子的方法，所述方法包括：获得生物样品，所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子；使所述样品与构成如本文所述的组合物的已知量的模板寡核苷酸接触；在多重PCR反应中扩增模板寡核苷酸和来自哺乳动物受试者的淋巴样细胞的重排核酸分子，以获得多种扩增的模板寡核苷酸和多种扩增的重排核酸分子；对所述多种扩增的模板寡核苷酸进行测序，以对构成所述多种的每种独特模板寡核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸序列的出现频率；以及基于所述多种扩增的模板寡核苷酸的平均拷贝数和所述模板寡核苷酸的所述已知量，测定所述多重PCR反应的平均扩增因子。

所述方法还包括对来自哺乳动物受试者的淋巴样细胞的所述多种扩增的重排核酸分子进行测序，以对构成所述多种的每种独特重排核酸分子测定i)重排核酸分子序列和(ii)所述重排核酸分子序列的出现次数；以及基于所述多重PCR反应的平均扩增因子和所述重排核酸分子的所述出现次数，测定所述样品中的淋巴样细胞的数量。

在其他实施例中，所述方法包括测定所述样品中的淋巴样细胞的数量，其包括生成所述扩增重排核酸序列每一者的出现次数的总和并将所述总和除以所述平均扩增因子。在一些实施例中，所述已知量是每种所述模板寡核苷酸一个拷贝。在一个实施例中，100≤a≤500。在另一个实施例中，100≤b≤500。

提供了用于修正多重PCR扩增反应中的扩增偏倚的方法以定量生物样品中编码一种或多种适应性免疫受体的重排核酸分子，所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子，所述方法包括：(a)使所述样品与本文所述的组合物接触以生成模板加标样品，其中所述模板和所述重排核酸分子包含对应的V和J区序列；(b)在多重PCR反应中扩增所述模板加标样品，以获得多种扩增的模板寡核苷酸和多种扩增的编码多种适应性免疫受体的重排核酸分子；(c)对所述多种扩增的模板寡核苷酸测序，以对构成所述多种的每种独特模板寡核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸序列的出现频率；(d)对编码一种或多种适应性免疫受体的所述多种扩增的重排核酸分子进行测序，以对构成所述多种的编码所述多种适应性免疫受体的每种独特重排核酸分子测定i)重排核酸分子序列和(ii)所述重排核酸分子序列的出现频率；(e)将所述模板寡核苷酸序列的出现频率与预期分布进行比较，其中所述预期分布基于构成所述组合物的所述多种模板寡核苷酸的预定摩尔比，并且其中所述模板寡核苷酸序列的所述出现频率与所述预期分布之间的偏差指示所述寡核苷酸扩增引物组的成员间的非均一核酸扩增潜能；(f)生成由具有所述指示的非均一核酸扩增潜能的所述寡核苷酸扩增引物组的所述成员扩增的一组模板分子和重排核酸分子序列的一组修正值，其中所述修正值组修正所述多重PCR反应中的扩增偏倚；以及(g)任选地将所述修正值组应用于所述重排核酸分子序列的所述出现频率以修正所述多重PCR反应中的扩增偏倚。

本发明包括试剂盒，所述试剂盒包含：包含如下的试剂：包含如本文所述的多种模板寡核苷酸和一组寡核苷酸引物的组合物；用于测定能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子的所述寡核苷酸引物组的成员间的非均一核酸扩增潜能的使用说明，所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子。

在另一个实施例中，所述试剂盒包含用于修正具有非均一核酸扩增潜能的所述寡核苷酸引物组的一个或多个成员的使用说明。

在其他实施例中，所述试剂盒包含用于定量样品中独特适应性免疫受体编码重排核酸分子的数量的使用说明。

在参考下列具体实施方式和附图后，本文所述的发明实施例的这些和其他方面将显而易见。本说明书中提及的和/或申请资料表中列出的所有美国专利、美国专利申请公布、美国专利申请、国外专利、国外专利申请和非专利出版物均全文以引用方式并入本文，就如同每一篇被单独地并入一样。可根据需要修改本发明的各方面和实施例以采用各种专利、申请和出版物的概念以提供另外的实施例。

附图简述

参照下列描述和附图，本发明的这些和其他特征、方面和优点将变得更好理解，其中：

图1示出了供用于使能够扩增编码适应性免疫受体(TCR或BCR)的重排DNA的寡核苷酸引物组的扩增效率标准化的示例性模板寡核苷酸的示意图。U1、U2为通用接头寡核苷酸；B1-4为条形码寡核苷酸；V为可变区寡核苷酸；J为连接区寡核苷酸；R为限制性酶识别位点；S为任选的终止密码子。

图2示出了使用等摩尔(未调节)的一组52种PCR引物(SEQ IDNO:1753-1804)从标准化寡核苷酸模板组合物(以SEQ ID NO:872-1560示出的等摩尔的一组模板)扩增并在Illumina HiSeq^TM DNA测序仪上定量地测序的单独TCRB V基因区段序列的扩增后频率。不存在偏倚的频率计算为0.0188。

图3示出了使用TCRB V区特异性引物交叉扩增模板寡核苷酸后的定量测序结果。Y轴指示以来自相同引物组的其他引物的摩尔浓度的两倍(2X)存在于每个独立扩增反应中的单独扩增引物(SEQ ID NO:1753-1804)，所述引物组用于扩增标准化寡核苷酸模板组合物(以SEQ ID NO:872-1560示出的等摩尔的一组模板)；X轴未标记，但数据点以与Y轴相同的顺序提供，其中X轴代表由定量测序所识别的对应的扩增V基因模板。黑色方块指示在使用以相对于等摩尔浓度的所有其他引物的2X存在的相应引物时扩增水平没有变化；白色方块指示扩增的10倍增加；灰色方块指示0与10倍之间的扩增的中间程度(呈现灰度级梯度)。白色方块的对角线指示给定引物的2X浓度导致大多数引物的相应模板的扩增的约10倍增加。非对角白色方块指示某些引物能够对其退火和扩增的非对应模板。

图4示出了在调节引物利用偏倚之前使用等摩尔浓度的TCRB扩增引物组(SEQ ID NO:1753-1804)的所有成员(黑条，所有V区引物以等摩尔浓度存在)以及在调节多个单独引物浓度以补偿偏倚之后使用相同引物组(SEQID NO:1753-1804)(灰条，减小了高效引物的浓度并增加了低效引物的浓度，参见表6)从标准化寡核苷酸模板组合物(以SEQ ID NO:872-1560示出的等摩尔的一组模板)扩增的单独TCRB V基因区段序列的扩增后频率。通过在Illumina HiSeq^TM DNA测序仪上定量测序来测定扩增后频率。

图5a-5l示出了供在包含多种由通式5'-U1-B1-V-B2-R-B3-J-B4-U2-3'[I]表示的寡核苷酸序列的模板组合物中使用的TCRB V/J组(68V+13J)，其用于使寡核苷酸引物组的扩增效率标准化，所述寡核苷酸引物组能够扩增编码一种或多种人T细胞受体β(TCRB)链多肽的重排DNA。

图6a和6b示出了供在包含多种由通式5'-U1-B1-V-B2-R-B3-J-B4-U2-3'[I]表示的寡核苷酸序列的模板组合物中使用的TCRG V/J组(14V+5J)，其用于使寡核苷酸引物组的扩增效率标准化，所述寡核苷酸引物组能够扩增编码一种或多种人T细胞受体γ(TCRG)链多肽的重排DNA。

图7a-7m示出了供在包含多种由通式5'-U1-B1-V-B2-R-B3-J-B4-U2-3'[I]表示的寡核苷酸序列的模板组合物中使用的IGH V/J组(127V+9J)，其用于使寡核苷酸引物组的扩增效率标准化，所述寡核苷酸引物组能够扩增编码一种或多种人免疫球蛋白重(IGH)链多肽的重排DNA。

图8示出了如下的结果：计算添加到IGH序列的多重PCR扩增的模板组合物中的每个VJ对的扩增因子，然后取所有合成模板的扩增因子的平均值以估算所有合成模板分子的序列覆盖倍数。

图9示出了使用如本文所述的合成模板组合物和扩增因子估算的B细胞数量相对于用作天然DNA模板来源的B细胞的已知数量的图。

图10示出了1116种IGH VJ偏倚控制分子和243种IGH DJ偏倚控制分子中的每一者的PCR扩增前测序计数。

图11示出了针对相对扩增偏倚作图的合成TCRB VJ模板的TCRB引物迭代。

图12示出了针对相对扩增偏倚作图的合成IGH VJ模板的IGH引物迭代。

图13示出了V基因的27种合成IGH DJ模板的相对扩增偏倚。

图14a-d示出了55种合成TCRG VJ模板的TCRG引物迭代。在化学偏倚控制修正之前(图14a)、化学修正的第一次迭代(图14b)、化学修正的第二次迭代(图14c)和化学修正的最后迭代(图14d)测定TCRG VJ引物的相对扩增偏倚。

具体实施方式

在某些实施例中及如本文所述，本发明提供了组合物和方法，所述组合物和方法可用于对编码适应性免疫受体如免疫球蛋白(Ig)和/或T细胞受体(TCR)的重排基因的庞大且结构多样的群体进行可靠定量。这些重排基因可存在于含有来自受试者或生物源(包括人受试者)的淋巴样细胞的DNA的生物样品中。

如本文所用，“重排核酸分子”可包括从包含编码重排适应性免疫受体的序列的淋巴样细胞系直接或间接获得的任何基因组DNA、cDNA或mRNA。

本文公开了用于使复杂寡核苷酸引物组标准化和校准的出乎意料有利的方法，所述引物组用于多重核酸扩增反应，以由含有编码适应性免疫受体的重排基因的生物样品生成扩增重排DNA分子的群组，之后再对此类扩增的产物进行定量高通量测序。重排TCR和BCR(IG)编码DNA序列的多重扩增和高通量测序例如在如下文献中有所描述：Robins et al.,2009Blood 114,4099(Robins等人，2009年，《血液》，第114卷，第4099页)；Robinset al.,2010Sci.Translat.Med.2:47ra64(Robins等人，2010年，《科学转化医学》，第2卷，第47ra64页)；Robins et al.,2011J.Immunol.Meth.doi:10.1016/j.jim.2011.09.001(Robins等人，2011年，《免疫法杂志》，doi:10.1016/j.jim.2011.09.001)；Sherwood et al.2011Sci.Translat.Med.3:90ra61(Sherwood等人，2011年，《科学转化医学》，第3卷，第90ra61页)；U.S.A.N.13/217,126(美国公布No.2012/0058902)、U.S.A.N.12/794,507(美国公布No.2010/0330571)、WO/2010/151416、WO/2011/106738(PCT/US2011/026373)、WO2012/027503(PCT/US2011/049012)、U.S.A.N.61/550,311和U.S.A.N.61/569,118；因此这些公开内容以引用方式并入并且可进行修改以根据本文所述的实施例使用。

简而言之及根据非限制性理论，本发明的组合物和方法克服了在通过对多重核酸扩增产物测序来定量TCR和BCR基因多样性的当前方法中可出现的不准确性。为了适应生物样品中可存在的TCR和BCR基因模板序列的广泛多样性，多重扩增反应中使用的寡核苷酸引物组通常包含多种多样的序列长度和核苷酸组成(例如，GC含量)。因此，在给定的一组扩增反应条件下，不同引物退火至其同源模板序列并支持其同源模板序列的扩增的效率可明显不同，从而导致不同引物的非均一利用，从而不同扩增产物的相对定量占比中产生伪差偏倚。

例如，一些高效引物的相对过度利用导致某些扩增产物的过高占比，并且一些其他低效引物的相对过低利用导致某些其他扩增产物的过低占比。存在于含淋巴样细胞DNA的样品中的每种模板物质的相对量的定量测定(通过对扩增产物测序获得)可进而得出对于扩增前样品中的不同模板物质的实际相对占比而言失实的信息。在初步研究中，例如，观察到使用一组寡核苷酸引物的多重PCR未均一扩增TCRB V基因区段，所述寡核苷酸引物组被设计成能够从人淋巴样细胞DNA模板扩增每种可能的人TCRB可变(V)区基因的序列。相反，一些V基因区段被相对过度扩增(占总序列的约10％)并且其他V基因区段被相对过低扩增(占总序列的约4×10^-3％)；还可参见例如图2。

为了克服扩增引物亚群的此类偏倚利用的问题，本公开首次提供了用于使寡核苷酸引物组的成员的扩增效率标准化的模板组合物和方法，其中所述引物组能够扩增生物样品中编码多种适应性免疫受体(TCR或Ig)的重排DNA，所述生物样品包含来自淋巴样细胞的DNA。所述模板组合物包含多种如本文更详细描述的由通式(I)表示的多样性模板寡核苷酸：

5'-U1-B1-V-B2-R-B3-J-B4-U2-3' (I)

构成模板组合物的组成性模板寡核苷酸相对于单独模板寡核苷酸的核苷酸序列具有多样性。单独模板寡核苷酸从而可随大量可能的TCR或BCR可变(V)和连接(J)区多核苷酸间的显著序列变异，而彼此在核苷酸序列中大幅变化。单独模板寡核苷酸物质的序列也可随多样的多种模板内的特定模板中所包含的U1、U2、B(B1、B2、B3和B4)和R寡核苷酸的序列差异而彼此变化。

在某些实施例中，条形码寡核苷酸B(B1、B2、B3和B4)可独立地和任选地包含寡核苷酸条形码序列，其中所述条形码序列被选择为独特地识别特定的独特V寡核苷酸序列与特定的独特J寡核苷酸序列的特定成对组合。条形码寡核苷酸B1和B4及通用接头的相对定位有利地允许通过短序列读段和自动DNA测序仪(例如，Illumina HiSeq^TM或Illumina、或GeneAnalyzer^TM-2，加利福尼亚州圣地亚哥的亿明达公司(Illumina Corp.,SanDiego,CA))上的末端配对测序进行给定独特模板寡核苷酸的扩增产物的快速鉴定和定量。具体地讲，这些和相关实施例允许存在于扩增产物中的V和J序列的特异性组合的快速高通量测定，从而表征可存在于引物组中的每种V特异性引物和每种J特异性引物的相对扩增效率，所述引物组能够扩增样品中的重排TCR或BCR编码DNA。可通过较长的序列读段(任选包括延伸至B2的序列读段)实现扩增产物的种类和/或数量的验证。

在使用中，所述多种模板寡核苷酸中的每种模板寡核苷酸以基本上等摩尔量存在，其在某些优选实施例中包括制备物，其中所有寡核苷酸的摩尔浓度彼此相差1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25％以内。在如本文所提供的某些其他优选实施例中，当所有寡核苷酸的摩尔浓度彼此在一个数量级内时，模板寡核苷酸被认为以基本上等摩尔量存在，其包括制备物，其中任何给定的独特模板寡核苷酸物质可具有的最大摩尔浓度大于组合物中具有最低浓度的独特模板寡核苷酸物质所存在的摩尔浓度不超过1000、900、800、700、600、500、440、400、350、300、250、200、150、100、90、80、70、60、50、40或30％。

以类似的方式，本文所公开的某些实施例设想了用于扩增的寡核苷酸引物组，在所述引物组中，组分引物可以基本上等摩尔量提供。也如本文所述，根据某些其他实施例，可有意调节引物组中的一种或多种引物的浓度以便某些引物不以等摩尔量存在或不以基本上等摩尔量存在。

在优选实施例中本文所述的模板组合物可用作核酸扩增(例如，PCR)模板以表征寡核苷酸引物组，如复杂的可用于重排TCR或Ig基因的多重扩增的V区段和J区段寡核苷酸引物组，例如，如本文所提供的引物组，或如下文献中所述的任何引物组：Robins et al.,2009Blood 114,4099(Robins等人，2009年，《血液》，第114卷，第4099页)；Robins et al.,2010Sci.Translat.Med.2:47ra64(Robins等人，2010年，《科学转化医学》，第2卷，第47ra64页)；Robins et al.,2011J.Immunol.Meth.doi:10.1016/j.jim.2011.09.001(Robins等人，2011年，《免疫法杂志》，doi:10.1016/j.jim.2011.09.001)；Sherwood et al.2011Sci.Translat.Med.3:90ra61(Sherwood等人，2011年，《科学转化医学》，第3卷，第90ra61页)；U.S.A.N.13/217,126(美国公布No.2012/0058902)、U.S.A.N.12/794,507(美国公布No.2010/0330571)、WO/2010/151416、WO/2011/106738(PCT/US2011/026373)、WO2012/027503(PCT/US2011/049012)、U.S.A.N.61/550,311和U.S.A.N.61/569,118；等等。

优选地，用于使扩增效率标准化的模板组合物中的所有模板均为基本上相同长度的寡核苷酸，所述模板组合物在本文有所描述并且包含具有多样性序列和通式(I)通用结构的多种模板寡核苷酸。不希望受理论的束缚，一般认为在核酸扩增反应如聚合酶链式反应(PCR)中，模板DNA长度可通过影响引物与模板DNA分子之间的相互作用的动力学来影响寡核苷酸引物的扩增效率，引物可通过核苷酸碱基互补性经特异性核苷酸序列引导的杂交而退火至模板DNA分子。一般认为较长模板的操作效率低于相对较短的模板。在某些实施例中，本发明所公开的用于使寡核苷酸引物组的扩增效率标准化的模板组合物包含多种如本文所提供的由通式(I)表示的模板寡核苷酸，所述寡核苷酸引物组能够扩增编码多种TCR或BCR的重排DNA，其中所述模板寡核苷酸具有长度不超过1000、950、900、850、800、750、700、650、600、550、500、450、400、350、300、250、200、150或100个核苷酸(包括其间的所有整数值)的相同长度或基本上相同长度。

因此，为了使对多重扩增期间寡核苷酸引物利用的非期望偏倚的潜在贡献降低、消除或最小化，本文公开的优选实施例可采用多种模板寡核苷酸，其中具有序列多样性的多种模板寡核苷酸中的所有模板寡核苷酸具有基本上相同长度。当模板组合物中的所有(例如，100％)或大多数(例如，大于50％)此类寡核苷酸为各自具有完全相同数量的核苷酸的寡核苷酸，或其中模板组合物中的一种或多种模板寡核苷酸彼此长度差异不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90或100个核苷酸的情况下，多种模板寡核苷酸可具有基本上相同长度。根据本公开可以理解，即使在并非所有模板寡核苷酸具有完全相同长度的情况下，本文所述的组合物和方法仍然可用于测定以及任选用于修正一组寡核苷酸扩增引物各成员间的非均一核酸扩增潜能。

根据某些本发明所公开的实施例，(i)本发明所述的模板组合物的每种模板寡核苷酸以基本上等摩尔量提供，(ii)能够扩增编码多种适应性免疫受体的重排DNA的寡核苷酸引物组包含以基本上等摩尔量提供的多种V区段寡核苷酸引物，(iii)能够扩增编码多种适应性免疫受体的重排DNA的寡核苷酸引物组包含以基本上等摩尔量提供的多种J区段寡核苷酸引物，以及(iv)扩增随给定序列的起始模板的数量呈线性变化。

因此，可计算每种模板的扩增产物的预期产率并任意赋给100％的理论均一扩增水平值。在允许引物组在扩增反应中扩增模板寡核苷酸的序列之后，在不同扩增产物的相对比例间观察到的与基本等同的任何统计学显著偏差指示扩增期间存在引物利用的偏倚(即，不同效率)。换句话讲，所获得的不同扩增产物的相对量的定量差异指示并非引物组中的所有引物都以相当的效率扩增其各自的模板。某些实施例设想赋给高于和低于理论100％产率的容差范围，使得容差范围内的任何扩增水平值均可视为基本等同。

在某些此类实施例中，当产物产率全部处于相同数量级内(如，相差小于十倍)时，扩增产物产率的范围可视为基本上等同。在某些其他此类实施例中，当产物产率彼此相差不超过九倍、八倍、七倍、六倍、五倍、四倍或三倍时，扩增产物产率的范围可视为基本上等同。在某些其他实施例中，可视为处于可接受容差范围内的产物产率可比所计算的100％产率多或少多达1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、100或200％。

因为所述方法涉及使用已知技术测定每种扩增产物的核苷酸序列作为定量过程的一部分，因此可以鉴定负责扩增每种独特(如由序列所定义)产物的引物并且可相应调节(如，以统计学显著的方式增加或减少)其在引物组中的相对量。可相对于其他引物的浓度减少引物组中极其高效的引物的浓度，使得此类引物对本文所述模板组合物中的模板的特异性扩增的水平基本上等同于大多数引物所实现的扩增水平，所述大多数引物实现理论均一扩增水平，或实现处于可接受容差范围内的水平。可相对于其他引物的浓度增加引物组中低效的引物的浓度，使得此类引物对本文所述模板组合物中的模板的特异性扩增的水平基本上等同于大多数引物所实现的扩增水平，所述大多数引物实现理论均一扩增水平，或实现处于可接受容差范围内的水平。

因此及如本文所述，本发明从而提供了用于使被设计为扩增给定TCR或Ig链的完整组库的编码序列的寡核苷酸引物组的扩增效率标准化的模板组合物，用于测定此类引物组的成员间的非均一扩增效率(“非均一扩增潜能”)的方法，以及用于修正此类非均一扩增潜能的方法。通过提供本文所述的模板组合物作为可用来校准寡核苷酸引物组的标准品，并且在特定实施例中，在每种模板寡核苷酸以基本上等摩尔量存在使得可调节单独的引物浓度以产生结构多样的一系列扩增产物的基本上均一的扩增的情况下，本公开从而有利地克服了上述与单独引物效率偏倚相关的问题。

使用本文提供的组合物和方法，可将单独的引物鉴定为具有非均一扩增潜能，原因在于其促进非均一扩增，如相对于均一扩增水平而言特异性模板寡核苷酸的增加(如，以统计学显著的方式更大)或减少(如，以统计学显著的方式更低)扩增所证实的那样，尽管扩增反应中存在(i)彼此基本上等摩尔量的所有模板寡核苷酸、(ii)彼此基本上等摩尔量的所有V区段引物、以及(iii)彼此基本上等摩尔量的所有J区段引物。

然后可减少或增加此类引物的相对浓度以获得改良的完整引物组，其中所有引物不以相对于彼此基本上等摩尔量存在，以分别补偿相对于均一扩增水平增加或减少的扩增水平。然后可重新测试引物组其以均一扩增水平或在可接受容差范围内扩增本文所公开的模板组合物中的所有序列的能力。

可迭代地重复测试改良的引物组其扩增本文所公开的模板组合物的能力的过程直到所有产物均以均一扩增水平或在可接受容差范围内扩增为止，其中所有模板寡核苷酸均以彼此基本上等摩尔量提供。通过使用本文所公开的模板组合物的此类过程，可使寡核苷酸引物组的扩增效率标准化，其中所述引物组能够扩增生物样品中编码一种或多种适应性免疫受体的有效重排DNA，所述生物样品包含来自受试者淋巴样细胞的DNA。

此外或作为另外一种选择，根据本公开，可测定任何特定对的寡核苷酸扩增引物是否呈现非均一扩增潜能，如相对于大多数寡核苷酸扩增引物呈现的均一扩增水平所增加或减少的模板组合物扩增，然后可使用归一化调节因子分别计算每种此类扩增引物对所促进的扩增产物的成比例减少或增加的出现频率。本发明模板组合物从而在某些实施例中提供修正一组寡核苷酸扩增引物的成员间的非均一核酸扩增潜能的方法。

某些此类实施例可有利地允许对作为非均一扩增事件的结果所获得的数据进行修正、校准、标准化、归一化等。从而，本发明实施例允许对数据不准确性(如可由偏倚的寡核苷酸引物利用所引起)进行修正，而无需迭代地调节一种或多种扩增引物的浓度以及重复扩增本文所述的模板组合物的步骤。在可避免对扩增产物定量测序的步骤的重复的情况下，可从而获得有利的效率。然而，某些其他设想的实施例可采用此类迭代方法。

因此及如本文所述，本发明提供了用于使寡核苷酸引物组的扩增效率标准化的模板组合物，以及使用此类模板组合物测定寡核苷酸引物组的单独成员间的非均一核酸扩增潜能(如，偏倚)的方法。本文还描述了用于修正寡核苷酸引物组的各成员间的此类非均一核酸扩增潜能(如，偏倚)的方法。这些和相关实施例利用通过校准复杂寡核苷酸引物组所获得的之前未认识到的有益效果以使用具有本文所述特征的用于使扩增效率标准化的模板组合物补偿不期望的扩增偏倚，并且相对于之前所述的方法，可用于提高特异性克隆型TCR和/或Ig编码DNA序列可定量的准确性。

另外如上文指出及本文其他地方所述，在本公开之前，存在如下两者之间不令人满意且难以分辨的差异：(i)在含有来自受试者的淋巴样细胞DNA的生物样品中，具有独特序列的重排适应性免疫受体编码DNA模板的实际定量分布，以及(ii)在使用被设计用于扩增样品中的基本上所有有效重排适应性免疫受体基因的一组复杂的寡核苷酸扩增引物进行多重扩增后，此类模板的核酸扩增产物的相对占比。由于例如模板群体和扩增引物组两者的异质性，并且如本文所示，不同扩增引物的扩增效率的显著差异可为常见的，从而导致扩增反应后所获得和定量测序的扩增产物的相对比例呈明显偏态。

模板和引物

根据某些优选实施例，从而提供了用于使寡核苷酸引物组的扩增效率标准化的模板组合物，所述寡核苷酸引物组能够扩增生物样品中编码一种或多种适应性免疫受体的重排DNA(其在某些实施例中可以指有效重排DNA，但在某些其他实施例中不必如此限制)，所述生物样品包含来自受试者的淋巴样细胞的DNA，所述模板组合物包含多种由通式(I)表示的模板寡核苷酸：

5'-U1-B1-V-B2-R-B3-J-B4-U2-3' (I)

如本文所提供的。在某些优选实施例中，所述多种模板寡核苷酸中的每种模板寡核苷酸以基本上等摩尔量存在，其在某些实施例中及如上文所指出，可以指模板寡核苷酸中的每一者均以等摩尔浓度存在或以摩尔浓度计与等摩尔偏差不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、50、60、70、80、90、100或200％的摩尔浓度存在的组合物，并且在某些其他实施例中，可以指所有模板寡核苷酸均以彼此处于一个数量级内的摩尔浓度存在的组合物。所述多种模板可包含至少100、200、300、400、500、600、700、800、900、1000、1100或更多种分立的寡核苷酸物质(每一者均具有不同的核苷酸序列)，包括其间的每个中间整数值。

本文所公开的模板组合物从而包含多种由如下通式表示的模板寡核苷酸：

5'-U1-B1-V-B2-R-B3-J-B4-U2-3' [I]

其中，简而言之及如本文其他地方更详细阐述，根据某些优选实施例：

V是包含适应性免疫受体可变(V)区编码基因序列或其互补序列的至少20、30、60、90、120、150、180或210个且不超过1000、900、800、700、600或500个连续核苷酸的多核苷酸，并且在所述多种模板寡核苷酸序列的每一者中，V包含独特的寡核苷酸序列；

J是包含适应性免疫受体连接(J)区编码基因序列或其互补序列的至少15-30、31-60、61-90、91-120或120-150个且不超过600、500、400、300或200个连续核苷酸的多核苷酸，并且在所述多种模板寡核苷酸序列的每一者中，J包含独特的寡核苷酸序列；

U1和U2要么各自不存在，要么各自包含独立地具有选自如下的序列的寡核苷酸：(i)通用接头寡核苷酸序列和(ii)连接至通用接头寡核苷酸序列并位于其5'端的测序平台特异性寡核苷酸序列；

B1、B2、B3和B4各自独立地要么不存在，要么各自包含寡核苷酸B，寡核苷酸B包含3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000个连续核苷酸(包括其间的所有整数值)的寡核苷酸条形码序列，其中在所述多种模板寡核苷酸序列的每一者中，B包含一独特的寡核苷酸序列，所述独特的寡核苷酸序列独特地识别(i)模板寡核苷酸的独特V寡核苷酸序列和(ii)模板寡核苷酸的独特J寡核苷酸序列，或者识别作为成对组合的这二者；并且

R要么不存在，要么包含一限制性酶识别位点，所述限制性酶识别位点包含不存在于V、J、U1、U2、B1、B2、B3和B4中的寡核苷酸序列。

在一些实施例中，模板寡核苷酸组合物包含另外的非编码寡核苷酸或随机寡核苷酸。这些寡核苷酸可插入在通式I(5'-U1-B1-V-B2-R-B3-J-B4-U2-3')中的组分之间或之内的各个部分中，并且具有各种长度的大小。

在一个实施例中，a为1至受试者的哺乳动物基因组中V基因区段的最大数量的数。在另一个实施例中，b为1至受试者的哺乳动物基因组中J基因区段的最大数量的数。在其他实施例中，a为1或者b为1。在一些实施例中，a可在对于TCRA而言的1个V基因区段至54个V基因区段的范围内，对于TCRB而言的1-76个V基因区段的范围内，对于TCRG而言的1-15个V基因区段的范围内，对于TCRD而言的1-7个V基因区段的范围内，对于IGH而言的1-165个V基因区段的范围内，对于IGK而言的1-111个的范围内，或对于IGL而言的1-79个V基因区段的范围内。在其他实施例中，b可在对于TCRA而言的1个J个基因区段至61个J基因区段的范围内，对于TCRB而言的1-14个J基因区段的范围内，对于TCRG而言的1-5个J基因区段的范围内，对于TCRD而言的1-4个基因区段的范围内，对于IGH而言的1-9个J基因区段的范围内，对于IGK而言的1-5个J基因区段的范围内，或对于IGL而言的1-11个J基因区段的范围内。

下表列出了每个人适应性免疫受体基因座的V基因区段(a)和J基因区段(b)的数量，包括功能性V和J区段。

	V区段*	功能性V区段**	J区段*	功能性J区段**
					TCRA	54	45	61	50
TCRB	76	48	14	13
					TCRG	15	6	5	5
TCRD	7	7	4	4
					IGH	165	51	9	6
IGK	111	44	5	5
					IGL	79	33	11	7

*总共的可变和连接区段基因

**具有至少一个功能性等位基因的可变和连接区段基因

在一些实施例中，J多核苷酸包含适应性免疫受体J恒定区或其互补序列的至少15-30、31-60、61-90、91-120或120-150个并且不超过600、500、400、300或200个连续核苷酸。

在某些实施例中，所述多种模板寡核苷酸包含至少(a×b)种独特的寡核苷酸序列，其中a是受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是受试者中的独特适应性免疫受体J区编码基因区段的数量，并且所述组合物包含至少一种针对V区编码基因区段与J区编码基因区段的每种可能组合的模板寡核苷酸。

然而，本发明设想的发明并非旨在如此限制，使得在某些实施例中，可有利地使用明显更少数量的模板寡核苷酸。在a是受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是受试者中的独特适应性免疫受体J区编码基因区段的数量的这些和相关实施例中，构成所述多种模板寡核苷酸的独特寡核苷酸序列的最小数量可由a和b中的较大者决定，只要每种独特V多核苷酸序列和每种独特J多核苷酸序列存在于模板组合物中的至少一种模板寡核苷酸中即可。从而，根据某些相关实施例，模板组合物可包含针对每种独特V多核苷酸的至少一种模板寡核苷酸(例如，包括根据通式(I)的每种独特V多核苷酸的单种模板寡核苷酸)，以及针对每种独特J多核苷酸的至少一种模板寡核苷酸(例如，包括根据通式(I)的每种独特J多核苷酸的单种模板寡核苷酸)。

在某些其他实施例中，模板组合物包含扩增引物组中的每种寡核苷酸扩增引物可退火至其上的至少一种模板寡核苷酸。

即，在某些实施例中，模板组合物包含至少一种具有每种V区段寡核苷酸引物可与之特异性杂交的由通式(I)表示的寡核苷酸序列的模板寡核苷酸，以及至少一种具有每种J区段寡核苷酸引物可与之特异性杂交的由通式(I)表示的寡核苷酸序列的模板寡核苷酸。

根据此类实施例，能够扩增编码一种或多种适应性免疫受体的重排DNA的寡核苷酸引物组包含复数a'种独特的V区段寡核苷酸引物和复数b'种独特的J区段寡核苷酸引物。所述复数a'种V区段寡核苷酸引物各自独立地能够退火或特异性杂交至至少一种编码适应性免疫受体V区多肽的多核苷酸或至其互补序列，其中每种V区段引物包含与至少一种适应性免疫受体V区编码基因区段互补的至少15个连续核苷酸的核苷酸序列。所述复数b'种J区段寡核苷酸引物各自独立地能够退火或特异性杂交至至少一种编码适应性免疫受体J区多肽的多核苷酸或至其互补序列，其中每种J区段引物包含与至少一种适应性免疫受体J区编码基因区段互补的至少15个连续核苷酸的核苷酸序列。

在一些实施例中，a’与a相同(以上针对模板寡核苷酸所述)。在其他实施例中，b’与b相同(以上针对模板寡核苷酸所述)。

从而，在某些实施例中及还如本文其他地方所讨论，本发明模板组合物可与被设计用于扩增所有重排适应性免疫受体编码基因序列(包括未表达的那些基因序列)的扩增引物一起用于扩增反应，而在某些其他实施例中，模板组合物和扩增引物可被设计为使得不产生未表达的重排基因(例如，假基因、孤独基因)的扩增产物。因此应当理解，在某些实施例中，可有利地仅扩增重排适应性免疫受体编码基因的亚组，使得合适的扩增引物亚组可被设计且用于仅扩增所关注的那些重排V-J序列。相应地，在这些和相关实施例中，可使用本文所述的仅包含重排V-J重排序列的所关注亚组的模板组合物，只要所述模板组合物包含至少一种扩增引物组中的每种寡核苷酸扩增引物可退火至其上的模板寡核苷酸即可。模板组合物中的模板寡核苷酸的实际数量可从而随要使用的扩增引物组而在各设想的实施例间大幅变化。

例如，在某些相关实施例中，在模板组合物中，所述多种模板寡核苷酸可具有选自如下的多种由通式(I)表示的序列：(1)所述多种由通式(I)表示的寡核苷酸序列，其中多核苷酸V和J分别具有如图5a-5l中作为TCRB V/J组1、TCRB V/J组2、TCRB V/J组3、TCRB V/J组4、TCRB V/J组5、TCRBV/J组6、TCRB V/J组7、TCRB V/J组8、TCRB V/J组9、TCRB V/J组10、TCRB V/J组11、TCRB V/J组12和TCRB V/J组13示出的68组TCRBV和J SEQ ID NO中的至少一组中所示的TCRB V和J序列；(2)所述多种由通式(I)表示的寡核苷酸序列，其中多核苷酸V和J分别具有如图6中作为TCRG V/J组1、TCRG V/J组2、TCRG V/J组3、TCRG V/J组4和TCRGV/J组5示出的14组TCRG V和J SEQ ID NO中的至少一组中所示的TCRGV和J序列；以及(3)所述多种由通式(I)表示的寡核苷酸序列，其中多核苷酸V和J分别具有如图7中作为IGH V/J组1、IGH V/J组2、IGH V/J组3、IGH V/J组4、IGH V/J组5、IGH V/J组6、IGH V/J组7、IGH V/J组8和IGH V/J组9示出的127组IGH V和J SEQ ID NO中的至少一组中所示的IGH V和J序列。

在某些实施例中，V是编码适应性免疫受体V区或其互补序列的至少10-70个连续氨基酸的多核苷酸序列；J是编码适应性免疫受体J区或其互补序列的至少5-30个连续氨基酸的多核苷酸序列；U1和U2各自要么不存在，要么包含具有选自如下的核苷酸序列的寡核苷酸：(i)通用接头寡核苷酸序列和(ii)连接至通用接头寡核苷酸序列并位于其5'端的测序平台特异性寡核苷酸序列；B1、B2、B3和B4各自独立地要么不存在，要么各自包含寡核苷酸B，所述寡核苷酸B包含3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个连续核苷酸的寡核苷酸条形码序列，其中在所述多种寡核苷酸序列的每一者中，B包含一独特的寡核苷酸序列，所述独特的寡核苷酸序列识别作为成对组合的(i)独特V寡核苷酸序列和(ii)独特J寡核苷酸序列；并且R要么不存在，要么包含一限制性酶识别位点，所述限制性酶识别位点包含不存在于V、J、U1、U2、B1、B2、B3和B4中的寡核苷酸序列。在某些优选实施例中，所述多种模板寡核苷酸包含至少a种或b种独特的寡核苷酸序列，其中a是受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是受试者中的独特适应性免疫受体J区编码基因区段的数量，并且所述组合物包含多种模板寡核苷酸，所述多种模板寡核苷酸包含至少a种或b种(以较大者为准)独特的模板寡核苷酸序列，前提条件是包括与每种V区编码基因区段对应的至少一种V多核苷酸和与每种J区编码基因区段对应的至少一种J多核苷酸。

大量适应性免疫受体可变(V)区和连接(J)区基因序列作为核苷酸和/或氨基酸序列是已知的，包括TCR和Ig基因座的非重排基因组DNA序列，以及此类基因座处的有效重排DNA序列及其编码的产物，并且还包括这些基因座处的假基因，并且还包括相关孤独基因。参见例如，U.S.A.N.13/217,126、U.S.A.N.12/794,507、PCT/US2011/026373、PCT/US2011/049012。本领域已知的这些和其他序列可根据本公开用于将要包括在本发明提供的模板组合物中的模板寡核苷酸的设计和产生，其中所述模板组合物用于使寡核苷酸引物组的扩增效率标准化，以及用于能够扩增编码TCR或Ig多肽链的重排DNA的寡核苷酸引物组的设计和产生，所述重排DNA可存在于包含淋巴样细胞DNA的生物样品中。

在式(I)中，V是适应性免疫受体(例如，TCR或BCR)可变(V)区基因序列或其互补序列的至少30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400或450个且不超过1000、900、800、700、600或500个连续核苷酸的多核苷酸序列，并且在所述多种寡核苷酸序列的每一者中，V包含独特的寡核苷酸序列。人及其他物种的TCR和BCR V区基因的基因组序列是已知的并且可从公共数据库如Genbank获得；V区基因序列包含编码表达的重排TCR和BCR基因的产物的多核苷酸序列，并且还包含已在V区基因座中鉴定的假基因的多核苷酸序列。可掺入到本发明所公开的通式(I)模板中的多样性V多核苷酸序列在长度上、在核苷酸组成(例如，GC含量)上、以及在实际的线性多核苷酸序列上可宽泛变化，并且例如已知包括表现出特定序列多样性的“热点(hot spot)”或高变区。

通式(I)中的多核苷酸V(或其互补序列)包含TCR或BCR基因的特异性寡核苷酸引物组成员可特异性退火至其上的序列。能够扩增编码多种TCR或BCR的重排DNA的引物组在例如U.S.A.N.13/217,126、U.S.A.N.12/794,507、PCT/US2011/026373或PCT/US2011/049012等中有所描述，或如本文所述可设计为包含可特异性杂交至特定TCR或BCR基因座(例如，TCRα、β、γ或δ、或IgHμ、γ、δ、α或ε、或IgLκ或λ)中的每种独特V基因和每种J基因的寡核苷酸序列。例如，以举例说明而非限制的方式，能够扩增编码一种或多种TCR或BCR的重排DNA的寡核苷酸引物扩增组的寡核苷酸引物可通常包含15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个连续核苷酸或更多个的核苷酸序列，并且可特异性地退火至如本文所提供的V或J多核苷酸的15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个连续核苷酸的互补序列。在某些实施例中，引物可包含至少19、20、21、22、23、24、25、26、27、28、29或30个核苷酸，并且在某个实施例中，引物可包含不超过15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个连续核苷酸的序列。如本文所公开，还明确设想了其他长度的引物和引物退火位点。

通式(I)中每种多核苷酸V的整个多核苷酸序列可唯一地由来自每种不同V基因的连续核苷酸组成，但不是必需的。例如并根据某些实施例，在本文所述的模板组合物中，每种式(I)的多核苷酸V仅需具有至少一个区域，所述至少一个区域包含存在于一种V基因中并且引物组中的单种V区引物可特异性退火至其上的独特V寡核苷酸序列。从而，式(I)的V多核苷酸可包含天然存在的V基因序列(包括V假基因序列)的全部或任何规定部分(例如，至少15、20、30、60、90、120、150、180或210个连续核苷酸，或其间的任何整数值)，只要包括任何其他模板V多核苷酸中不含的至少一种独特V寡核苷酸序列区(引物退火位点)即可。

在某些实施例中可优选的是，存在于本文所述的模板组合物中的所述多种V多核苷酸具有模拟已知的天然存在V基因核苷酸序列的全长的长度，即使在特异性核苷酸序列在模板V区与任何天然存在的V基因之间有差别的情况下也是如此。本文所述的模板中的V区长度可与天然存在的V基因序列的长度相差不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20％。

式(I)中的V多核苷酸可从而在某些实施例中包含具有与典型V基因从其起始密码子到其CDR3编码区的长度相同或类似的长度的核苷酸序列，并且可以(但不是必需)包含编码CDR3区的核苷酸序列。CDR3编码核苷酸序列和序列长度可大幅变化并且已通过若干不同编号方案表征(例如，Lefranc,1999The Immunologist 7:132(Lefranc，1999年，《免疫学家》，第7卷，第132页)；Kabat et al.,1991In:Sequences of Proteins ofImmunological Interest,NIH Publication 91-3242(Kabat等人，1991年，载于：《具有免疫学重要性的蛋白质的序列》，NIH出版，第91-3242页)；Chothia et al.,1987J.Mol.Biol.196:901(Chothia等人，1987年，《分子生物学杂志》，第196卷，第901页)；Chothia et al.,1989Nature 342:877(Chothia等人，1989年，《自然》，第342卷，第877页)；Al-Lazikaniet al.,1997J.Mol.Biol.273:927(Al-Lazikani等人，1997年，《分子生物学杂志》，第273卷，第927页)；还可参见例如，Rock et al.,1994J.Exp.Med.179:323(Rock等人，1994年，《实验医学杂志》，第179卷，第323页)；Saada et al.,2007Immunol.Cell Biol.85:323(Saada等人，2007年，《免疫学和细胞生物学》，第85卷，第323页))。

简而言之，CDR3区通常跨越从V区段中的高度保守的半胱氨酸残基(由三核苷酸密码子TGY编码；Y＝T或C)延伸到TCR的J区段中的高度保守的苯丙氨酸残基(由TTY编码)或延伸到IGH中的高度保守的色氨酸(由TGG编码)的多肽部分。TCRB基因座中的超过90％的天然有效重排具有根据该标准介于24至54个核苷酸之间的CDR3编码长度，对应于介于9至17个编码的氨基酸之间。对于任何给定的TCR或BCR基因座，本发明所公开的合成模板寡核苷酸的CDR3长度可落在与95％的天然存在的重排相同的范围内。从而，例如，在用于使寡核苷酸引物组的扩增效率标准化的本文所述的模板组合物中，其中所述寡核苷酸引物组能够扩增编码多种TCRB多肽的重排DNA，V多核苷酸的CDR3编码区可具有24至54个核苷酸的长度，包括其间的每个整数。上述CDR3编码区的编号方案指示保守的半胱氨酸、苯丙氨酸和色氨酸密码子的位置，并且这些编号方案也可应用于假基因，其中编码这些保守的氨基酸的一个或多个密码子可被替换为编码不同氨基酸的密码子。对于不使用这些保守的氨基酸的假基因，可根据以上引用的既定CDR3序列位置编号方案中的一者相对于对应位置限定CDR3长度，在所述对应位置处将观察到保守的残基没有被置换。

在某些实施例中还可优选的是，存在于本文所述的模板组合物中的所述多种V多核苷酸具有模拟已知的天然存在V基因序列的全部核苷酸组成的核苷酸组成(例如，GC含量的百分比)，即使在特异性核苷酸序列不同的情况下也是如此。此类模板V区核苷酸组成可与天然存在的V基因序列的核苷酸组成相差不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20％。任选地及根据某些实施例，本文所述的模板寡核苷酸的V多核苷酸在通式(I)中的V的3'端处或附近包含终止密码子。

在式(I)中，J是包含适应性免疫受体连接(J)区编码基因序列或其互补序列的至少15-30、31-60、61-90、91-120或120-150个且不超过600、500、400、300或200个连续核苷酸的多核苷酸，并且在所述多种寡核苷酸序列的每一者中，J包含独特的寡核苷酸序列。

通式(I)中的多核苷酸J(或其互补序列)包含TCR或BCR基因特异性的寡核苷酸引物组成员可特异性退火至其上的序列。能够扩增编码多种TCR或BCR的重排DNA的引物组在例如U.S.A.N.13/217,126、U.S.A.N.12/794,507、PCT/US2011/026373、或PCT/US2011/049012等中有所描述，或如本文所述可设计为包含可特异性杂交至特定TCR或BCR基因座(例如，TCRα、β、γ或δ、或IgHμ、γ、δ、α或ε、或IgLκ或λ)中的每种独特V基因和每种独特J基因的寡核苷酸序列。

通式(I)中每种多核苷酸J的整个多核苷酸序列可唯一地由来自每种不同J基因的连续核苷酸组成，但不是必需的。例如并根据某些实施例，在本文所述的模板组合物中，每种式(I)的多核苷酸J仅需具有至少一个区域，所述至少一个区域包含存在于一种J基因中并且引物组中的单种V区引物可特异性退火至其上的独特J寡核苷酸序列。从而，式(I)的V多核苷酸可包含天然存在的V基因序列(包括V假基因序列)的全部或任何规定部分(例如，至少15、20、30、60、90、120、150、180或210个连续核苷酸，或其间的任何整数值)，只要包括任何其他模板J多核苷酸中不含的至少一种独特V寡核苷酸序列区(引物退火位点)即可。

在某些实施例中可优选的是，存在于本文所述的模板组合物中的所述多种J多核苷酸具有模拟已知的天然存在J基因核苷酸序列的全长的长度，即使在特异性核苷酸序列在模板J区与任何天然存在的J基因之间有差别的情况下也是如此。本文所述的模板中的J区长度可与天然存在的J基因序列的长度相差不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20％。

式(I)中的J多核苷酸可因此在某些实施例中包含具有与典型天然存在的J基因的长度相同或类似的长度的核苷酸序列，并且可包含(但不是必需的)编码CDR3区的核苷酸序列，如上文所讨论。

人及其他物种的TCR和BCR J区基因的基因组序列是已知的并且可从公共数据库如Genbank获得；J区基因序列包含编码表达的和未表达的重排TCR和BCR基因的产物的多核苷酸序列。可掺入到本发明所公开的通式(I)的模板中的多样性J多核苷酸序列在长度上、在核苷酸组成(例如，GC含量)上、以及在实际的线性多核苷酸序列上可宽泛变化。

技术人员可使用本领域中与每个TCR和Ig亚基的基因的V和J编码区的已公布基因序列相关的知识，基于本公开来选择用于构建本文所述的模板寡核苷酸和/或V区段和J区段寡核苷酸引物的本文所述的V和J序列的替代物。人适应性免疫受体序列的参考Genbank条目包括：TCRα:(TCRA/D):NC_000014.8(chr14:22090057..23021075)；TCRβ:(TCRB):NC_000007.13(chr7:141998851..142510972)；TCRγ:(TCRG):NC_000007.13(chr7:38279625..38407656)；免疫球蛋白重链，IgH(IGH):NC_000014.8(chr14:106032614..107288051)；免疫球蛋白轻链κ，IgLκ(IGK):NC_000002.11(chr2:89156874..90274235)；以及免疫球蛋白轻链λ，IgLλ(IGL):NC_000022.10(chr22:22380474..23265085)。小鼠适应性免疫受体基因座序列的参考Genbank条目包括：TCRβ:(TCRB):NC_000072.5(chr6:40841295..41508370)，以及免疫球蛋白重链，IgH(IGH):NC_000078.5(chr12:114496979..117248165)。

可进行模板和引物设计分析以及靶位点选择考虑，例如使用OLIGO引物分析软件和/或BLASTN 2.0.5算法软件(Altschul et al.,Nucleic Acids Res.1997,25(17):3389-402(Altschul等人，《核酸研究》，1997年，第25卷，第17期，第3389-3402页))或本领域可利用的其他类似程序进行。

因此，基于本公开及考虑到用于包含在本发明模板寡核苷酸中的这些已知的适应性免疫受体基因序列和寡核苷酸设计方法，本领域技术人员可设计多种V区特异性和J区特异性的多核苷酸序列，其各自独立地包含给定V和J基因分别特有的寡核苷酸序列。类似地，根据本公开及考虑到已知的适应性免疫受体序列，本领域技术人员还可设计引物组，所述引物组包含多种V区特异性和J区特异性的寡核苷酸引物，所述引物各自独立地能够退火至给定V和J基因分别特有的特异性序列，由此所述多种引物能够扩增给定适应性免疫受体编码基因座(例如，人TCR或IgH基因座)中的基本上所有V基因和基本上所有J基因。此类引物组允许在多重(例如，使用多种正向和反向引物对)PCR中生成第一端由重排V区编码基因区段编码并且第二端由J区编码基因区段编码的扩增产物。

通常及在某些实施例中，此类扩增产物可包含CDR3编码序列，但本发明并非旨在如此限制并设想了不包含CDR3编码序列的扩增产物。引物可被优选地设计用于产生扩增产物，所述扩增产物具有足够部分的如本文所述的V和J序列和/或V-J条形码(B)序列，使得通过对产物(扩增子)测序，可以基于每个基因区段特有的序列鉴定(i)特定V基因和(ii)特定J基因，在所述特定J基因附近V基因经历重排而产生功能性适应性免疫受体编码基因。通常及在优选实施例中，PCR扩增产物大小不会超过600个碱基对，这根据非限制理论将不包括来自非重排适应性免疫受体基因的扩增产物。在某些其他优选实施例中，扩增产物大小不会超过500、400、300、250、200、150、125、100、90、80、70、60、50、40、30或20个碱基对，如可有利地通过短序列读段提供序列不同的扩增子的快速、高通量定量。

在某些优选实施例中，所述多种模板寡核苷酸包含至少a种或至少b种独特寡核苷酸序列，以较大者为准，其中a是受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是受试者中的独特适应性免疫受体J区编码基因区段的数量，并且所述组合物包含至少一种针对每种独特V多核苷酸的模板寡核苷酸以及至少一种针对每种独特J多核苷酸的模板寡核苷酸。应当理解，因为模板寡核苷酸具有多种由通式(I)表示的寡核苷酸序列，其包含V多核苷酸并且也包含J多核苷酸，模板组合物可从而包含少于(a×b)种的独特寡核苷酸序列，但将包含至少a或b中较大个数的独特寡核苷酸序列。因此，所述组合物可提供每种独特V多核苷酸序列的至少一次出现和每种独特J多核苷酸序列的至少一次出现，其中在一些情况下特定独特V多核苷酸的至少一次出现将存在于其中可发现特定独特J多核苷酸的至少一次出现的相同模板寡核苷酸中。从而，例如，“每种独特V多核苷酸的至少一种模板寡核苷酸和每种独特J多核苷酸的至少一种模板寡核苷酸”在某些情况下可以指其中存在一种独特V多核苷酸和一种独特J多核苷酸的单一模板寡核苷酸。

还如本文其他地方所公开，在某些其他优选实施例中，模板组合物包含扩增引物组中的每种寡核苷酸扩增引物可退火至其上的至少一种模板寡核苷酸。因此，所述组合物可包含少于a或b种独特序列，例如，在扩增引物组可不包含针对每种可能的V和/或J序列的独特引物的情况下。

应当指出的是，某些实施例设想了用于使寡核苷酸引物组的扩增效率标准化的模板组合物，所述寡核苷酸引物组能够扩增生物样品中编码一种或多种适应性免疫受体的有效重排DNA，所述生物样品包含来自如本文提供的受试者的淋巴样细胞的DNA，其中模板组合物包含多种模板寡核苷酸，所述多种模板寡核苷酸具有多种如本文所述的由通式5'-U1-B1-V-B2-R-B3-J-B4-U2-3'(I)表示的寡核苷酸序列。根据这些和相关实施例及还如本文其他地方所述，能够扩增有效重排DNA的所述寡核苷酸扩增引物组可不包含特异性杂交至V区假基因或孤独基因或者J区假基因或孤独基因的任何寡核苷酸引物。因此，在此类实施例中，模板组合物将有利地不包含有通式(I)表示的模板寡核苷酸，其中独特V寡核苷酸序列和/或独特J寡核苷酸序列是V区假基因或孤独基因或者J区假基因或孤独基因分别特有的序列。

包含858种不同模板寡核苷酸的示例性TCRB模板组合物在序列表中以SEQ ID NO:3157-4014公开。包含871种不同模板寡核苷酸的另一个示例性TCRB模板组合物在序列表中以SEQ ID NO:1-871公开。包含689种不同模板寡核苷酸的另一个示例性TCRB模板组合物在序列表中以SEQ IDNO:872-1560公开。

包含70种不同模板寡核苷酸的示例性TCRG模板组合物在序列表中以SEQ ID NO:4015-4084公开。包含70种不同模板寡核苷酸的示例性TCRG模板组合物也在序列表中以SEQ ID NO:1561-1630公开。

包含1116种不同模板寡核苷酸的示例性IGH模板组合物在序列表中以SEQ ID NO:4085-5200公开。包含1116种不同模板寡核苷酸的示例性IGH模板组合物还在序列表中以SEQ ID NO:1805-2920公开。

本文还公开了供包含在具有多种由通式(I)表示的寡核苷酸序列的本文所述模板寡核苷酸中的V和J多核苷酸的示例性组。对于TCRB，所述多种模板寡核苷酸可具有多种由通式(I)表示的寡核苷酸序列，其中多核苷酸V和J分别具有如图5中作为TCRB V/J组1、TCRB V/J组2、TCRB V/J组3、TCRB V/J组4、TCRB V/J组5、TCRB V/J组6、TCRB V/J组7、TCRB V/J组8、TCRB V/J组9、TCRB V/J组10、TCRB V/J组11、TCRB V/J组12和TCRB V/J组13示出的68组TCRB V和J SEQ ID NO中的至少一组中所示的TCRB V和J序列。

对于TCRG，所述多种模板寡核苷酸可具有多种由通式(I)表示的寡核苷酸序列，其中多核苷酸V和J分别具有如图6中作为TCRG V/J组1、TCRGV/J组2、TCRG V/J组3、TCRG V/J组4和TCRG V/J组5示出的14组TCRG V和J SEQ ID NO中的至少一组中所示的TCRG V和J序列。

对于IGH，所述多种模板寡核苷酸可具有多种由通式(I)表示的寡核苷酸序列，其中多核苷酸V和J分别具有如图7中作为IGH V/J组1、IGH V/J组2、IGH V/J组3、IGH V/J组4、IGH V/J组5、IGH V/J组6、IGH V/J组7、IGH V/J组8和IGH V/J组9示出的127组IGH V和J SEQ ID NO中的至少一组中所示的IGH V和J序列。

引物

根据本公开，在包含多种V区段引物和多种J区段引物的寡核苷酸引物组中提供寡核苷酸引物，其中所述引物组能够扩增生物样品中编码适应性免疫受体的重排DNA，所述生物样品包含淋巴样细胞DNA。合适的引物组是本领域已知的并且在本文公开，例如，U.S.A.N.13/217,126、U.S.A.N.12/794,507、PCT/US2011/026373、或PCT/US2011/049012等中的引物组；或表1中所示的那些。在某些实施例中，引物组被设计为包含多种V序列特异性引物，其对于样品中的每种独特V区基因(包括假基因)而言包含可特异性退火至独特V区序列的至少一种引物；以及对于样品中的每种独特J区基因而言可特异性退火至独特J区序列的至少一种引物。

根据已知的TCR和BCR基因组序列，可通过常规方法实现引物设计。因此，引物组优选能够扩增可由TCR或BCR基因座中的DNA重排所产生的每种可能的V-J组合。还如下文所述，某些实施例设想了这样的引物组，其中一种或多种V引物可能能够特异性退火至可由两种或更多种V区共用但并非所有V区共有的“独特”序列，和/或其中一种或多种J引物可能能够特异性退火至可由两种或更多种J区共用但并非所有J区共有的“独特”序列。

在特定实施例中，用于本文所述组合物和方法中的寡核苷酸引物可包含至少约15个核苷酸长的核酸或由其组成，所述核酸具有与靶V或J区段的15个核苷酸长的连续序列(即，编码V区或J区多肽的基因组多核苷酸的部分)相同的序列或与之互补。长引物，例如，具有与靶V或J区编码多核苷酸区段的连续序列相同的序列或与之互补的序列的约16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45或50个核苷酸长的那些引物，也可用于某些实施例。设想本发明所述的寡核苷酸引物的所有中间长度可用于本文。如技术人员将认识到的，引物可具有添加的额外序列(例如，可不与靶V或J区编码多核苷酸区段相同或互补的核苷酸)，如限制性酶识别位点、用于测序的接头序列、条形码序列等等(参见，例如，本文表格和序列表中提供的引物序列)。因此，取决于具体应用或需要，引物的长度可更长，如长度为约55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、80、85、90、95、100或更多个核苷酸或更长。

还设想用于某些实施例中的是与本文示出了其核苷酸序列的寡核苷酸引物(包括序列表中示出的那些)具有高度序列同一性的适应性免疫受体V区段或J区段寡核苷酸引物变体。从而，在这些和相关实施例中，适应性免疫受体V区段或J区段寡核苷酸引物变体可与本文所公开的适应性免疫受体V区段或J区段寡核苷酸引物序列具有实质的同一性，例如，使用本文所述的方法(例如，使用标准参数的BLAST分析)与参考多核苷酸序列如本文所公开的寡核苷酸引物序列相比，此类寡核苷酸引物变体可具有至少70％的序列同一性，优选至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％或更高的序列同一性。本领域技术人员将认识到可通过考虑密码子简并性、阅读框定位等来适当地调节这些值以确定寡核苷酸引物变体退火至适应性免疫受体区段编码多核苷酸的相应能力。

通常，寡核苷酸引物变体将包含一个或多个置换、添加、缺失和/或插入，优选使得相对于本文具体示出的适应性免疫受体V区段或J区段寡核苷酸引物序列而言，变体寡核苷酸的退火能力不会大幅减弱。

表1以非限制性例子示出了能够扩增生物样品中编码TCRβ链(TCRB)的有效重排DNA的寡核苷酸引物组，所述生物样品包含来自受试者的淋巴样细胞的DNA。在该引物组中，J区段引物具有实质的序列同源性，因此可在不止一种靶J多核苷酸序列间充当交叉引物，但V区段引物被设计为特异性退火至V的CDR2区内的靶序列，因此是每个V区段特有的。然而，在紧密相关靶基因的家族内序列相同时的若干V引物情况下，存在例外(例如，在V区段的整个编码序列中V6-2和V6-3在核苷酸水平上是相同的，因此可具有单种引物TRB2V6-2/3)。

因此应当理解，在某些实施例中，可通过设计模板和/或引物以利用V和/或J序列中的某些已知相似点，而有利地减少模板组合物中的不同模板寡核苷酸的数量和/或引物组中的不同寡核苷酸引物的数量。从而，在这些和相关实施例中，如本文所述的“独特”寡核苷酸序列可包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种不同模板寡核苷酸所共用的特异性V多核苷酸序列和/或1、2、3、4、5、6、7、8、9、10、11、12或13种不同模板寡核苷酸所共用的特异性J多核苷酸序列，其中此类模板在序列上的彼此差异是除了所述共用的V和/或J序列的差异。

根据某些本发明设想的实施例，可能有用的是降低(例如，以统计学显著的方式减小)模板扩增偏倚，如一组扩增引物的成员间的非均一核酸扩增潜能，所述非均一核酸扩增潜能可由仅对于所有天然存在的V和J基因的有限亚组而言不等同的引物效率(例如，不等同的引物利用)所引起。例如，在分析参与免疫应答(无论是如在疫苗中对特异性抗原的免疫应答，还是如在自体免疫疾病中对组织的免疫应答)的TCR或BCR免疫组库中，可仅关注有效的TCR或IG重排。在此类情况下，经济上可能有利的是，仅对促使TCR或BCR编码DNA有效重排的那些V和J区段引物的非均一核酸扩增潜能进行识别和修正，不必花费精力修正假基因和孤独基因(即，已复制到其他染色体上的TCR或BCR V区编码区段)的非均一扩增。

在人IGH基因座中，例如ImmunoGeneTics(IMGT)数据库(M.-P.LeFranc,Université Montpellier,Montpellier,France(M.-P.LeFranc，蒙彼利埃大学，法国蒙彼利埃)；www.imgt.org)注释了165种V区段基因，其中26种是位于其他染色体上的孤独基因并且139种处于染色体14的IGH基因座中。在IGH基因座内的139种V区段中，51种具有至少一个功能性等位基因，而6种是失去至少一个高度保守氨基酸残基的ORF(开放阅读框)，并且81种是假基因。假基因可包含V区段，所述V区段含有V区段编码序列内的框内终止密码子、起始密码子与CDR3编码序列之间的移码、一个或多个重复元件插入以及关键区域如第一外显子或RSS的缺失。为了表征样品中的功能性IGH重排同时避免表征假基因和/或孤独基因的时间和费用，因此设想使用本文所述的合成模板寡核苷酸的亚组，其被设计为仅包含那些参与功能性重排的V区段以编码TCR或BCR，而不必合成或校准假基因序列特异性的扩增引物和模板寡核苷酸。从而获得尤其是对于时间和费用的有利效率。

表1.示例性寡核苷酸引物组(hsTCRB PCR引物)

名称

序列

SEQ ID NO:

TRBJ1-1	TTACCTACAACTGTGAGTCTGGTGCCTTGTCCAAA	1631
			TRBJ1-2	ACCTACAACGGTTAACCTGGTCCCCGAACCGAA	1632
TRBJ1-3	ACCTACAACAGTGAGCCAACTTCCCTCTCCAAA	1633
			TRBJ1-4	CCAAGACAGAGAGCTGGGTTCCACTGCCAAA	1634
TRBJ1-5	ACCTAGGATGGAGAGTCGAGTCCCATCACCAAA	1635
			TRBJ1-6	CTGTCACAGTGAGCCTGGTCCCGTTCCCAAA	1636
TRBJ2-1	CGGTGAGCCGTGTCCCTGGCCCGAA	1637
			TRBJ2-2	CCAGTACGGTCAGCCTAGAGCCTTCTCCAAA	1638
TRBJ2-3	ACTGTCAGCCGGGTGCCTGGGCCAAA	1639
			TRBJ2-4	AGAGCCGGGTCCCGGCGCCGAA	1640
TRBJ2-5	GGAGCCGCGTGCCTGGCCCGAA	1641
			TRBJ2-6	GTCAGCCTGCTGCCGGCCCCGAA	1642
TRBJ2-7	GTGAGCCTGGTGCCCGGCCCGAA	1643
			TRB2V10-1	AACAAAGGAGAAGTCTCAGATGGCTACAG	1644
TRB2V10-2	GATAAAGGAGAAGTCCCCGATGGCTATGT	1645
			TRB2V10-3	GACAAAGGAGAAGTCTCAGATGGCTATAG	1646
TRB2V6-2/3	GCCAAAGGAGAGGTCCCTGATGGCTACAA	1647
			TRB2V6-8	CTCTAGATTAAACACAGAGGATTTCCCAC	1648
TRB2V6-9	AAGGAGAAGTCCCCGATGGCTACAATGTA	1649
			TRB2V6-5	AAGGAGAAGTCCCCAATGGCTACAATGTC	1650
TRB2V6-6	GACAAAGGAGAAGTCCCGAATGGCTACAAC	1651
			TRB2V6-7	GTTCCCAATGGCTACAATGTCTCCAGATC	1652
TRB2V6-1	GTCCCCAATGGCTACAATGTCTCCAGATT	1653
			TRB2V6-4	GTCCCTGATGGTTATAGTGTCTCCAGAGC	1654
TRB2V24-1	ATCTCTGATGGATACAGTGTCTCTCGACA	1655
			TRB2V25-1	TTTCCTCTGAGTCAACAGTCTCCAGAATA	1656
TRB2V27	TCCTGAAGGGTACAAAGTCTCTCGAAAAG	1657
			TRB2V26	CTCTGAGAGGTATCATGTTTCTTGAAATA	1658
TRB2V28	TCCTGAGGGGTACAGTGTCTCTAGAGAGA	1659
			TRB2V19	TATAGCTGAAGGGTACAGCGTCTCTCGGG	1660
TRB2V4-1	CTGAATGCCCCAACAGCTCTCTCTTAAAC	1661
			TRB2V4-2/3	CTGAATGCCCCAACAGCTCTCACTTATTC	1662
TRB2V2P	CCTGAATGCCCTGACAGCTCTCGCTTATA	1663
			TRB2V3-1	CCTAAATCTCCAGACAAAGCTCACTTAAA	1664
TRB2V3-2	CTCACCTGACTCTCCAGACAAAGCTCAT	1665
			TRB2V16	TTCAGCTAAGTGCCTCCCAAATTCACCCT	1666
TRB2V23-1	GATTCTCATCTCAATGCCCCAAGAACGC	1667
			TRB2V18	ATTTTCTGCTGAATTTCCCAAAGAGGGCC	1668
TRB2V17	ATTCACAGCTGAAAGACCTAACGGAACGT	1669
			TRB2V14	TCTTAGCTGAAAGGACTGGAGGGACGTAT	1670
TRB2V2	TTCGATGATCAATTCTCAGTTGAAAGGCC	1671
			TRB2V12-1	TTGATTCTCAGCACAGATGCCTGATGT	1672
TRB2V12-2	GCGATTCTCAGCTGAGAGGCCTGATGG	1673
			TRB2V12-3/4	TCGATTCTCAGCTAAGATGCCTAATGC	1674
TRB2V12-5	TTCTCAGCAGAGATGCCTGATGCAACTTTA	1675
			TRB2V7-9	GGTTCTCTGCAGAGAGGCCTAAGGGATCT	1676
TRB2V7-8	GCTGCCCAGTGATCGCTTCTTTGCAGAAA	1677
			TRB2V7-4	GGCGGCCCAGTGGTCGGTTCTCTGCAGAG	1678
TRB2V7-6/7	ATGATCGGTTCTCTGCAGAGAGGCCTGAGG	1679

TRB2V7-2	AGTGATCGCTTCTCTGCAGAGAGGACTGG	1680
			TRB2V7-3	GGCTGCCCAACGATCGGTTCTTTGCAGT	1681
TRB2V7-1	TCCCCGTGATCGGTTCTCTGCACAGAGGT	1682
			TRB2V11-123	CTAAGGATCGATTTTCTGCAGAGAGGCTC	1683
TRB2V13	CTGATCGATTCTCAGCTCAACAGTTCAGT	1684
			TRB2V5-1	TGGTCGATTCTCAGGGCGCCAGTTCTCTA	1685
TRB2V5-3	TAATCGATTCTCAGGGCGCCAGTTCCATG	1686
			TRB2V5-4	TCCTAGATTCTCAGGTCTCCAGTTCCCTA	1687
TRB2V5-8	GGAAACTTCCCTCCTAGATTTTCAGGTCG	1688
			TRB2V5-5	AAGAGGAAACTTCCCTGATCGATTCTCAGC	1689
TRB2V5-6	GGCAACTTCCCTGATCGATTCTCAGGTCA	1690
			TRB2V9	GTTCCCTGACTTGCACTCTGAACTAAAC	1691
TRB2V15	GCCGAACACTTCTTTCTGCTTTCTTGAC	1692
			TRB2V30	GACCCCAGGACCGGCAGTTCATCCTGAGT	1693
TRB2V20-1	ATGCAAGCCTGACCTTGTCCACTCTGACA	1694
			TRB2V29-1	CATCAGCCGCCCAAACCTAACATTCTCAA	1695

在某些实施例中，如本文所述的V区段和J区段寡核苷酸引物被设计为包含核苷酸序列，使得在重排适应性免疫受体(TCR或Ig)基因的扩增产物的序列内存在足够的信息以独特地识别在重排适应性免疫受体基因座中产生扩增产物的特异性V和特异性J基因两者(例如，V基因重组信号序列(RSS)上游序列的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个碱基对，优选V基因重组信号序列(RSS)上游序列的至少约22、24、26、28、30、32、34、35、36、37、38、39或40个碱基对，并且在某些优选实施例中V基因重组信号序列(RSS)上游序列的大于40个碱基对，以及J基因RSS下游的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个碱基对，优选J基因RSS下游的至少约22、24、26、28或30个碱基对，并且在某些优选实施例中J基因RSS下游的大于30个碱基对)。

该特征与本领域所述的用于扩增TCR编码或Ig编码基因序列的寡核苷酸引物截然不同，后者主要依赖于仅用于检测存在或不存在V和J区段的适当大小产物的扩增反应(例如，PCR反应产物中存在特定大小的扩增子指示V或J区段存在，但无法提供所扩增PCR产物的序列，因此无法确认其身份，例如谱型分析的习惯作法)。

寡核苷酸(例如，引物)可通过任何合适的方法制备，包括按照诸如以下的方法直接化学合成：Narang et al.,1979,Meth.Enzymol.68:90-99(Narang等人，1979年，《酶学方法》，第68卷，第90-99页)的磷酸三酯法；Brown et al.,1979,Meth.Enzymol.68:109-151(Brown等人，1979年，《酶学方法》，第68卷，第109-151页)的磷酸二酯法；Beaucage et al.,1981,Tetrahedron Lett.22:1859-1862(Beaucage等人，1981年，《四面体快报》，第22卷，第1859-1862页)的二乙基亚磷酰胺法；以及美国专利No.4,458,066的固相载体法，所述文献各自以引用方式并入本文。寡核苷酸和修饰核苷酸的缀合物的合成方法的综述提供于Goodchild,1990,BioconjugateChemistry 1(3):165-187(Goodchild，1990年，《生物共轭化学》，第1卷，第3期，第165-187页)，其以引用方式并入本文。

如本文所用，术语“引物”是指能够在合适条件下充当DNA合成起始点的寡核苷酸。此类条件包括这样的条件，其中在存在适当缓冲液中及合适温度下的四种不同的三磷酸核苷和延伸试剂(例如，DNA聚合酶或逆转录酶)的情况下引发与核酸链互补的引物延伸产物的合成。

引物优选为单链DNA。引物的适当长度取决于引物的预期应用，但通常在6至50个核苷酸的范围内，或在某些实施例中，在15-35个核苷酸的范围内。短引物分子通常需要更冷的温度以与模板形成足够稳定的杂交复合体。引物不需要反映模板核酸的准确序列，但必须具有充分互补性以与模板杂交。用于扩增给定靶序列的合适引物的设计是本领域熟知的并且在本文引用的文献中有所描述。

如本文所述，引物可掺入另外的特征，所述特征允许引物的检测或固定但不改变引物的充当DNA合成起始点的基本特性。例如，引物可在5'端含有另外的核酸序列，所述另外的序列不杂交至靶核酸，但有利于扩增产物的克隆、检测或测序。与要杂交的模板充分互补的引物区在本文是指杂交区。

如本文所用，如果当用于足够严格条件下的扩增反应时引物首先杂交至靶核酸，则引物对于靶序列是特异性的。通常，如果引物-靶标双链体稳定性大于引物与样品中存在的任何其他序列之间形成的双链体的稳定性，则引物对于靶序列是特异性的。本领域技术人员将认识到各种因素如盐条件以及引物的碱基组成和错配的位置会影响引物的特异性，并且在许多情况下将需要引物特异性的常规实验确认。可选择杂交条件，在所述杂交条件下，引物可仅与靶序列形成稳定双链体。从而，在适当严格的扩增条件下使用靶标特异性引物能够选择性扩增包含靶引物结合位点的那些靶序列。

在特定实施例中，用于本文所述方法中的引物包含至少约15个核苷酸长的核酸或由其组成，所述核酸具有与靶V或J区段的15个核苷酸长的连续序列相同的序列或与之互补。长引物，例如具有与靶V或J区段的连续序列相同的序列或与之互补的序列的约16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45或50个核苷酸长的那些引物，也可用于某些实施例。设想前述引物的所有中间长度可用于本文。如技术人员将认识到的，引物可具有添加的另外序列(例如，可不与靶V或J区段相同或互补的核苷酸)，如限制性酶识别位点、用于测序的接头序列、条形码序列等等(参见，例如，本文和序列表中提供的引物序列)。因此，取决于具体应用或需要，引物的长度可更长，如长55、56、57、58、59、60、65、70、75个核苷酸或更长。例如，在一个实施例中，正向和反向引物均在5'端用与DNA测序仪相容的通用正向引物序列修饰。

通常，寡核苷酸引物变体将包含一个或多个置换、添加、缺失和/或插入，优选使得相对于本文具体示出的适应性免疫受体V区段或J区段寡核苷酸引物序列而言，变体寡核苷酸的退火能力不会大幅减弱。还如本文其他地方指出的，在优选实施例中，适应性免疫受体V区段和J区段寡核苷酸引物被设计为能够扩增包含CDR3编码区的重排TCR或IGH序列。

根据本文设想的某些实施例，用于本公开的多重PCR方法的引物可被功能性阻断以防止非T或B细胞序列的非特异性引发。例如，引物可通过如美国专利申请公布US2010/0167353中所述的化学修饰来阻断。根据某些本文所公开的实施例，在本发明多重PCR反应中使用此类阻断的引物涉及可具有其中DNA复制(即，引物延伸)被阻断的失活构型和其中DNA复制继续进行的活化构型的引物。当引物为单链时或者当引物特异性杂交至所关注的靶DNA序列但引物延伸仍然被连接于引物3'端或其附近的化学部分阻断时，存在引物的失活构型。

当引物杂交至所关注的靶核酸序列并随后被RNA酶H或另一种切割剂作用而移除3'阻断基团从而允许酶(例如，DNA聚合酶)催化扩增反应中的引物延伸时，存在引物的活化构型。不希望受理论的束缚，据信此类引物的杂交的动力学类似于二级反应，因此是混合物中的T细胞或B细胞基因序列浓度的函数。阻断的引物通过如下要求而使非特异性反应最小化：杂交至靶标，然后在引物延伸可继续进行之前切割。如果引物错误杂交至与所需靶序列相关但差别在于具有导致碱基错配的一个或多个非互补性核苷酸的序列，则抑制引物的切割，特别是当存在位于切割位点处或其附近的错配时。提高扩增保真度的该策略减少了此类位置处错误引发的频率，从而增加了反应的特异性。如技术人员将认识到的，可优化反应条件，特别是允许每个循环中的杂交和延伸的RNA酶H浓度和时间，以使当引物正确杂交至其真正靶序列时引物的高效切割，与当引物和模板序列(引物可对其不完全退火)之间存在错配时引物的不良切割之间的切割效率的差异最大化。

如US2010/0167353所述，本领域已知多个可位于寡核苷酸(例如，引物)的3'端处或其附近的阻断基团以防止延伸。可通过如下方式在3'端核苷酸处对引物或其他寡核苷酸进行修饰以防止或抑制DNA合成的起始：例如添加3'脱氧核糖核苷酸残基(例如，cordycepin)、2',3'-双脱氧核糖核苷酸残基、非核苷酸键或烷二醇修饰(美国专利No.5,554,516)。Wilk等人(1990Nucleic Acids Res.18(8):2065(1990年，《核酸研究》，第18卷，第8期，第2065页))和Arnold等人(美国专利No.6,031,091)也已描述了可用于抑制或阻断引物延伸的烷二醇修饰。合适阻断基团的另外例子包括3'羟基取代(例如，3'-磷酸、3'-三磷酸或3'-磷酸与醇如3-羟丙基的二酯)、2'3'-环磷酸、末端RNA碱基的2'羟基取代(例如，磷酸或空间上大体积的基团如三异丙基甲硅烷基(TIPS)或叔丁基二甲基甲硅烷基(TBDMS))。Laikhter等人在系列号为11/686,894的美国专利申请中描述了在寡核苷酸的3'端取代的2'-烷基甲硅烷基如TIPS和TBDMS，所述专利申请以引用方式并入本文。大体积的取代基也可掺入在寡核苷酸的3'端残基的碱基上以阻断引物延伸。

在某些实施例中，寡核苷酸可包含位于用于抑制引物延伸的阻断基团的上游(例如，5'端)的切割域。作为例子，切割域可为RNA酶H切割域，或切割域可为包含单个RNA残基的RNA酶H2切割域，或寡核苷酸可包含用一个或多个替代核苷对RNA碱基的替换。另外的示例性切割域在US2010/0167353中有所描述。

从而，多重PCR体系可使用40、45、50、55、60、65、70、75、80、85或更多种正向引物，其中每种正向引物与单种功能性TCR或Ig V区段或者功能性TCR或Ig V区段的小家族，例如TCR Vβ区段互补(参见例如，如表1所示的TCRBV引物，SEQ ID NO:1644-1695)，并且多重PCR体系可使用例如十三种反向引物，其各自对TCR或Ig J区段如TCR Jβ区段具有特异性(参见例如，表1中的TCRBJ引物，SEQ ID NO:1631-1643)。在另一个实施例中，多重PCR反应可使用各自对一种或多种功能性TCRγV区段具有特异性的四种正向引物和各自对一种或多种TCRγJ区段具有特异性的四种反向引物。在另一个实施例中，多重PCR反应可使用各自对一种或多种功能性V区段具有特异性的84种正向引物和各自对一种或多种J区段具有特异性的六种反向引物。

热循环条件可遵照本领域技术人员的方法。例如，在使用PCRExpress^TM热循环仪(英国阿什福德的Hybaid公司(Hybaid,Ashford,UK))时，可使用下列循环条件：95℃下15分钟循环1次，94℃下30秒、59℃下30秒和72℃下1分钟循环25至40次，然后72℃下10分钟循环一次。如技术人员将认识到的，可例如通过如下方式优化热循环条件：修改退火温度、退火时间、循环次数和延伸时间。如技术人员将认识到的，可优化引物和其他PCR试剂的用量以及PCR参数(例如，退火温度、延伸时间和循环次数)以实现所需的PCR扩增效率。

或者，在也在本文设想的某些相关实施例中，可使用“数字PCR”方法对样品中的靶基因组数定量，而无需标准曲线。在数字PCR中，在大量大于100个的微孔或液滴中进行单个样品的PCR反应，使得每个液滴扩增(例如，扩增产物的生成提供了微孔或液滴中存在至少一种模板分子的证据)或无法扩增(证明模板不存在于给定的微孔或液滴中)。通过简单地对阳性微孔的数量进行计数，可以直接对存在于输入样品中的靶基因组的数量进行计数。

数字PCR方法通常使用端点读数，而非在热循环反应的每次循环之后测量的常规定量PCR信号(参见例如，Pekin et al.,2011Lab.Chip11(13):2156(Pekin等人，2011年，《芯片实验室》，第11卷，第13期，第2156页)；Zhong et al.,2011Lab.Chip 11(13):2167(Zhong等人，2011年，《芯片实验室》，第11卷，第13期，第2167页)；Tewhey et al.,2009Nature Biotechnol.27:1025(Tewhey等人，2009年，《自然生物技术》，第27卷，第1025页)；2010Nature Biotechnol.28:178(2010年，《自然生物技术》，第28卷，第178页)；Vogelstein and Kinzler,1999Proc.Natl.Acad.Sci.USA 96:9236-41(Vogelstein和Kinzler，1999年，《美国国家科学院院刊》，第96卷，第9236-9241页)；Pohl and Shih,2004Expert Rev.Mol.Diagn.4(1)；41-7,2004(Pohl和Shih，2004年，《分子诊断学专家评论》，第4卷，第1期，第41-47页，2004年))。与传统PCR相比，dPCR具有下列优点：(1)不必依赖于参照品或标准品，(2)可通过增加PCR复制的总数来实现所需的准确度，(3)对抑制剂有很强耐受性，(4)能够分析复杂混合物，以及(5)提供对存在于样品中的拷贝数的线性响应，从而允许检测拷贝数的微小变化。因此，本文所述的组合物(例如，模板组合物和适应性免疫受体基因特异性寡核苷酸引物组)和方法中的任一者可适合用于此类数字PCR方法，例如ABI QuantStudio^TM12K Flex系统(加利福尼亚州卡尔斯巴德的生命技术公司(Life Technologies,Carlsbad,CA))、QX100^TMDroplet Digital^TM PCR系统(加利福尼亚州赫拉克勒斯的伯乐公司(BioRad,Hercules,CA))、QuantaLife^TM数字PCR系统(加利福尼亚州赫拉克勒斯的伯乐公司(BioRad,Hercules,CA))或RainDance^TM微液滴数字PCR系统(马萨诸塞州列克星敦的雷恩丹斯技术公司(RainDance Technologies,Lexington,MA))。

接头

本文所述的由通式(I)表示的模板寡核苷酸也可在某些实施例中包含第一通用接头寡核苷酸序列(U1)和第二通用接头寡核苷酸序列(U2)，或可缺少U1和U2中的任一者或两者。U1从而可要么不存在，要么包含具有选自如下的序列的寡核苷酸：(i)第一通用接头寡核苷酸序列和(ii)连接至第一通用接头寡核苷酸序列并位于其5'端的第一测序平台特异性寡核苷酸序列，并且U2可要么不存在，要么包含具有选自如下的序列的寡核苷酸：(i)第二通用接头寡核苷酸序列和(ii)连接至第二通用接头寡核苷酸序列并位于其5'端的第二测序平台特异性寡核苷酸序列。

U1和/或U2可例如包含通用接头寡核苷酸序列和/或测序平台特异性寡核苷酸序列，所述序列对所采用的单分子测序技术具有特异性，所述测序技术为例如：HiSeq^TM或GeneAnalyzer^TM-2(GA-2)系统(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))或另一种合适的仪器、试剂和软件的测序套件。包括此类平台特异性接头序列的在内使得能使用核苷酸测序方法如HiSeq^TM或GA2或等价方法，对包含多种不同的通式(I)模板寡核苷酸的本发明所述模板组合物进行直接定量测序。因此该特征有利地允许对模板组合物的定性和定量表征。

具体地讲，对模板组合物的所有组分直接测序的能力使得能验证所述多种模板寡核苷酸中的每种模板寡核苷酸以基本上等摩尔量存在。例如，可生成一组本发明所述的模板寡核苷酸，其在两端均具有通用接头序列，使得接头序列可用于在每种模板的每一端进一步掺入测序平台特异性寡核苷酸。

不希望受理论的束缚，可在少至变性、退火和延伸的两个循环中使用5'寡核苷酸(5'-平台序列-通用接头1序列-3')和3'寡核苷酸(5'-平台序列-通用接头2序列-3')，将平台特异性寡核苷酸添加到此类修饰的模板的末端，使得组分模板寡核苷酸中的每一者在模板组合物中的相对占比在数量上不会改变。独特的识别符序列(例如，条形码序列B，所述条形码序列B包含分别与单独的V和J区相关并从而识别它们的独特的V和B寡核苷酸序列，如本文所述)位于邻近接头序列的位置，从而允许在短序列读段中定量测序，以便按照存在的每种独特模板序列的相对量的标准来表征模板群体。

当此类直接定量测序指示一种或多种特定寡核苷酸在模板组合物的制备物中可能占比过高或占比过低时，可相应地进行模板组合物的调节以获得所有寡核苷酸均以基本上等摩尔量存在的模板组合物。然后，如在本发明所公开的用于测定和修正引物组成员间的非均一扩增潜能的方法中，可将所有寡核苷酸均以基本上等摩尔量存在的模板组合物用作扩增引物组的校准用标准品。

除了实例中所述和序列表中的示例性模板序列中所包括的接头序列(例如，在SEQ ID NO:1-1630的5'和3'端处)之外，熟悉本领域的技术人员在考虑本公开后，也可知道其他可用作通用接头序列的寡核苷酸序列，包括选择与存在于本文所述模板的其他部分中的序列不同的接头寡核苷酸序列。另外的接头序列的非限制性例子示于表2中并以SEQ ID NO:1710-1731示出。

表2.示例性的接头序列

条形码

如本文所述，某些实施例设想了将模板寡核苷酸序列设计成包含短签名序列(signature sequence)，所述短签名序列允许明确识别模板序列及从而明确识别负责扩增该模板的至少一种引物，而不必对整个扩增产物测序。在本文所述的由通式(I)表示的模板寡核苷酸中，B1、B2、B3和B4各自独立地要么不存在，要么各自包含寡核苷酸B，所述寡核苷酸B包含3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000或更多个连续核苷酸(包括其间的所有整数值)的寡核苷酸条形码序列，其中在所述多种模板寡核苷酸序列的每一者中，B包含一独特的寡核苷酸序列，所述独特的寡核苷酸序列独特地识别作为成对组合的(i)模板寡核苷酸的独特V寡核苷酸序列和(ii)模板寡核苷酸的独特J寡核苷酸序列。

从而，例如，具有条形码识别符序列的模板寡核苷酸可允许相对短的扩增产物序列读段，如不超过1000、900、800、700、600、500、400、300、200、100、90、80、70、60、55、50、45、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4个或更少核苷酸的条形码序列读段，然后将该条形码序列信息与相关V和J序列进行匹配，所述V和J序列被掺入进具有作为模板设计一部分的条形码的模板中。按照该方法，可通过高通量平行测序对大量扩增产物同时进行部分测序，以识别复杂引物组中造成扩增偏倚的引物。

示例性条形码可包含独特识别模板中的每种V多核苷酸的5、6、7、8、9、10、11、12、13、14、15或16个核苷酸的第一条形码寡核苷酸，和独特识别模板中的每种J多核苷酸的5、6、7、8、9、10、11、12、13、14、15或16个核苷酸的第二条形码寡核苷酸，以提供长度分别为10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31或32个核苷酸的条形码，但这些和相关实施例并非旨在如此限制。条形码寡核苷酸可包含任何长度的寡核苷酸序列，只要获得最小条形码长度使具有另外不同序列(例如，V和J序列)的两种或更多种模板寡核苷酸中不出现给定条形码序列即可。

从而，避免用于独特识别不同V-J序列配对的条形码间的此类冗余的最小条形码长度是X个核苷酸，其中4^x大于因具有非同一序列而呈现差异化的不同模板物质的数量。例如，对于本文以SEQ ID NO:1-871示出的871种模板寡核苷酸的组，最小条形码长度将为五个核苷酸，这允许1024种(即，大于871种)不同的可能五核苷酸序列的理论总数。实际上，条形码寡核苷酸序列读段长度可仅受限于要采用的核苷酸测序仪器的序列读段长度极限。对于某些实施例，当进行比对以使条形码寡核苷酸序列中的特定位置处匹配的核苷酸数最大化时，将区分开模板寡核苷酸的单独物质的不同条形码寡核苷酸应具有至少两个核苷酸不匹配(例如，最小汉明距离(hammingdistance)为2)。

在优选的实施例中，对于通式(I)的模板组合物内具有独特序列的每种不同模板寡核苷酸物质，B1、B2、B3和B4将是相同的。

技术人员将熟悉例如至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、70、80、90、100、200、300、300、500或更多个连续核苷酸(包括其间的任何整数值)的寡核苷酸条形码序列的设计、合成及掺入到较大寡核苷酸或多核苷酸构建体中。有关寡核苷酸条形码序列识别策略的设计与实现的非限制性例子，参见例如，de Carcer et al.,2011Adv.Env.Microbiol.77:6310(de Carcer等人，2011年，《应用与环境微生物学》，第77卷，第6310页)；Parameswaran et al.,2007Nucl.Ac.Res.35(19):330(Parameswaran等人，2007年，《核酸研究》，第35卷，第19期，第330页)；Roh et al.,2010Trends Biotechnol.28:291(Roh等人，2010年，《生物技术趋势》，第28卷，第291页)。

通常，将条形码放置在模板中其不能天然发现的位置处，即，条形码包含这样的核苷酸序列，其不同于可在靠近条形码所在位置的序列的附近发现的任何天然存在的寡核苷酸序列(例如，V和/或J序列)。根据本文所述的某些实施例，可包括此类条形码序列，作为本发明所公开的由通式(I)表示的模板寡核苷酸的元件B1、B2和/或B3。因此，本文所述的由通式(I)表示的模板寡核苷酸中的某些也可在某些实施例中包含条形码B1、B2和B3中的一者、两者或全部三者，而在某些其他实施例中，这些条形码中的一些或全部可不存在。在某些实施例中，所有条形码序列将具有相同或类似的GC含量(例如，GC含量相差不超过20％、或不超过19、18、17、16、15、14、13、12、11或10％)。

在根据某些本文所公开的实施例的模板组合物中，含条形码的元件B(例如，B1、B2、B3和/或B4)包含独特识别单种配对V-J组合的寡核苷酸序列。任选地及在某些实施例中，含条形码的元件B也可包含随机核苷酸，或至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30,、31、32、33、34、35、36、37、38、39、40、45、50、55、60、70、80、90、100、200、300、300、500或更多个连续核苷酸的随机多核苷酸序列，其位于独特识别每种特异性配对V-J组合的特异性条形码序列的上游和/或下游。当存在于特异性条形码序列的上游和下游时，随机核苷酸或随机多核苷酸序列彼此无关，即，它们可以(但不必)包含相同的核苷酸或相同的多核苷酸序列。

限制性酶位点

根据本文所公开的某些实施例，模板寡核苷酸可包含限制性内切核酸酶(RE)识别位点，其位于V与J序列之间并且不在模板寡核苷酸序列的其他地方出现。RE识别位点可任选地邻近识别V区序列的条形码位点。可出于多种目的任一者而包括RE位点，所述目的包括但不限于作为结构特征，可利用所述结构特征，通过将其与适当的限制性酶接触来选择性破坏模板。可能希望通过将本发明的模板寡核苷酸与合适的RE接触来选择性降解本发明的模板寡核苷酸，例如以便从其他组合物移除模板寡核苷酸，所述模板寡核苷酸可能已有意或意外引入到所述其他组合物中。或者，RE位点可有效用于对模板组合物中的模板寡核苷酸测序的过程，和/或用作模板寡核苷酸序列中的位置序列标记，而不论其是否被限制性酶切割。示例性RE位点是限制性酶Sal I所识别的寡核苷酸基序GTCGAC。大量另外的限制性酶及其各自的RE识别位点序列是本领域已知的并且可商购获得(例如，马萨诸塞州贝弗利的新英格兰生物实验室(New England Biolabs,Beverly,MA))。这些包括例如EcoRI(GAATTC)和SphI(GCATGC)。熟悉本领域的技术人员应当理解，多种此类RE识别位点中的任一者可掺入到本发明所公开的模板寡核苷酸的特定实施例中。

测序

可使用多种可用的高通量单分子测序仪器和系统中的任何一种进行测序。示例性测序系统包括边合成边测序系统，如亿明达基因组分析仪(Illumina Genome Analyzer)和相关仪器(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))、赫利克斯遗传分析系统(Helicos GeneticAnalysis System)(马萨诸塞州剑桥的赫利克斯生物科学公司(HelicosBioSciences Corp.,Cambridge,MA))、太平洋生物科学PacBio RS(PacificBiosciences PacBio RS)(加利福尼亚州门洛帕克的太平洋生物科学公司(Pacific Biosciences,Menlo Park,CA))或具有类似功能的其他系统。使用杂交至扩增的DNA分子内的限定区域的一组测序寡核苷酸来完成测序。测序寡核苷酸被设计成使得V和J编码基因区段可被基于本公开和根据可公开利用的数据库中出现的已知适应性免疫受体基因序列所生成的序列独特识别。参见例如，U.S.A.N.13/217,126、U.S.A.N.12/794,507、PCT/US2011/026373或PCT/US2011/049012。示例性TCRB J区测序引物示于表3中：

表3：TCRBJ测序引物

引物	序列	SEQ ID NO:
			>Jseq1-1	ACAACTGTGAGTCTGGTGCCTTGTCCAAAGAAA	1696
>Jseq1-2	ACAACGGTTAACCTGGTCCCCGAACCGAAGGTG	1697
			>Jseq1-3	ACAACAGTGAGCCAACTTCCCTCTCCAAAATAT	1698
>Jseq1-4	AAGACAGAGAGCTGGGTTCCACTGCCAAAAAAC	1699
			>Jseq1-5	AGGATGGAGAGTCGAGTCCCATCACCAAAATGC	1700
>Jseq1-6	GTCACAGTGAGCCTGGTCCCGTTCCCAAAGTGG	1701
			>Jseq2-1	AGCACGGTGAGCCGTGTCCCTGGCCCGAAGAAC	1702
>Jseq2-2	AGTACGGTCAGCCTAGAGCCTTCTCCAAAAAAC	1703
			>Jseq2-3	AGCACTGTCAGCCGGGTGCCTGGGCCAAAATAC	1704
>Jseq2-4	AGCACTGAGAGCCGGGTCCCGGCGCCGAAGTAC	1705
			>Jseq2-5	AGCACCAGGAGCCGCGTGCCTGGCCCGAAGTAC	1706
>Jseq2-6	AGCACGGTCAGCCTGCTGCCGGCCCCGAAAGTC	1707
			>Jseq2-7	GTGACCGTGAGCCTGGTGCCCGGCCCGAAGTAC	1708

术语“基因”意指DNA涉及产生多肽链如TCR或Ig多肽的全部或一部分的区段(例如，含CDR3的多肽)；其包含编码区之前和之后的区域“前导区和尾随区(trailer)”以及独立的编码区段(外显子)之间的间插序列(内含子)，并且也可包含调控元件(例如，启动子、增强子、阻遏蛋白结合位点等)，并且也可包含如本文所述的重组信号序列(RSS)。

本发明实施例的核酸(本文也称为多核苷酸)可为RNA的形式或DNA的形式，所述DNA包括cDNA、基因组DNA和合成DNA。DNA可为双链的或单链的，并且如果是单链的话，可为编码链或非编码(反义)链。根据本发明实施例使用的编码TCR或免疫球蛋白或其区域(例如，V区、D区段、J区、C区等)的编码序列可与本领域已知的任何给定TCR或免疫球蛋白基因区或多肽结构域(例如，V区结构域、CDR3结构域等)的编码序列相同，或者可为不同编码序列，由于遗传密码的冗余或简并性，所述不同编码序列编码相同TCR或免疫球蛋白区或多肽。

在某些实施例中，扩增J区编码基因区段可各自具有2、3、4、5、6、7、8、9、10或约15、20或更多个核苷酸的独特序列限定识别符标签，其位于相对于RSS位点的限定位置。例如，可在扩增TCRβCDR3编码区的Jβ区编码区段中在RSS位点下游的+11至+14的位置处使用四碱基标签。然而，这些和相关实施例不必如此限制并且还设想了其他相对短的核苷酸序列限定识别符标签，其可在J区编码基因区段中检测到并且基于其相对于RSS位点的位置限定。这些在不同适应性免疫受体编码基因座之间可有差别。

重组信号序列(RSS)由被12+/-1bp(“12-信号”)或23+/-1bp(“23-信号”)的间隔序列隔开的两条保守序列(七聚物5'-CACAGTG-3'和九聚物5'-ACAAAAACC-3')组成。已确定很多核苷酸位置对于重组是重要的，包括七聚物第一位和第二位处的CA二核苷酸，并且七聚物第三位处的C也显示出具有强烈偏好性，九聚物的第5、6、7位处的A核苷酸也是如此。(Ramsden等人，1994；Akamatsu等人，1994；Hesse等人，1989)。其他核苷酸的突变具有极小或不一致的效应。间隔序列虽然更可变化，但也对重组具有影响，并且单核苷酸替换显示出显著影响重组效率(Fanning等人，1996；Larijani等人，1999；Nadel等人，1998)。已描述了鉴别具有明显不同重组效率的RSS多核苷酸序列的标准(Ramsden等人，1994；Akamatsu等人，1994；Hesse等人，1989以及Cowell等人，1994)。因此，测序寡核苷酸可杂交至RSS位点下游位置+11至位置+14处的扩增J编码基因区段内的四碱基标签附近。例如，TCRB的测序寡核苷酸可被设计成退火至刚好在该“标签”下游观察到的共有核苷酸基序，使得序列读段开始的四个碱基将独特识别J编码基因区段(参见例如，WO/2012/027503)。

CDR3编码区(对于TCR，被定义为编码V区段的第二保守半胱氨酸与J区段的保守苯丙氨酸之间的TCR多肽的核苷酸)的平均长度为35+/-3个核苷酸。因此及在某些实施例中，使用V区段寡核苷酸引物与从特定TCR或IgH J区(例如，如本文所述的TCR Jβ、TCR Jγ或IgH JH)的J区段标签开始的J区段寡核苷酸引物进行的PCR扩增将几乎总是捕获50碱基对读段中的完整V-D-J接合部。IgH CDR3区(被定义为V区段中的保守半胱氨酸与J区段中的保守苯丙氨酸之间的核苷酸)的平均长度受约束程度不及TCRβ基因座处，但将通常在约10至约70个核苷酸之间。因此及在某些实施例中，使用V区段寡核苷酸引物与从IgH J区段标签开始的J区段寡核苷酸引物进行的PCR扩增将捕获100碱基对读段中的完整V-D-J接合部。

退火至错配模板序列并支持在其上的多核苷酸延伸的PCR引物被称为混杂引物(promiscuous primer)。在某些实施例中，TCR和Ig J区段反向PCR引物可被设计为使与测序寡核苷酸的重叠最小化，以便使多重PCR情况下的混杂引发最小化。在一个实施例中，TCR和Ig J区段反向引物可通过退火至共有剪接位点基序而锚定在3'端，同时与测序引物的重叠最小化。通常，可使用默认参数下的已知序列/引物设计与分析程序来选择TCR以及Ig V和J区段引物，以便在已知退火温度下在PCR中操作。

对于测序反应，示例性的IGHJ测序引物延伸三个核苷酸跨越保守的CAG序列，如WO/2012/027503中所述。

样品

可从中获得测试生物样品的受试者或生物源可为人或非人动物、或转基因的或克隆的或经组织工程改造(包括通过使用干细胞)的生物体。在本发明的某些优选实施例中，受试者或生物源可已知患有、或可疑似患有、或面临风险患有循环肿瘤或实体瘤或其他恶性病症、或自体免疫疾病、或炎性病症，并且在本发明的某些优选实施例中，受试者或生物源可已知没有此类疾病的风险或不存在此类疾病。

某些优选实施例设想了这样的受试者或生物源，其为人受试者，如已根据本领域公认的临床诊断标准诊断为患有癌症或存在形成或罹患癌症的风险的患者，所述临床诊断标准为例如美国马里兰州贝塞斯达的美国国家癌症研究所(U.S.National Cancer Institute(Bethesda,MD,USA))的那些标准或如下文献中所述：DeVita,Hellman,and Rosenberg's Cancer:Principles and Practice ofOncology(2008,Lippincott,Williams and Wilkins,Philadelphia/Ovid,New York)(DeVita、Hellman和Rosenberg，《癌症：肿瘤学原理与实践》，2008年，Lippincott、Williams和Wilkins，费城/纽约州奥维德)；Pizzo andPoplack,Principles and Practice of Pediatric Oncology(Fourth edition,2001,Lippincott,Williams and Wilkins,Philadelphia/Ovid,New York)(Pizzo和Poplack，《儿科肿瘤学的原理与实践》，第四版，2001年，Lippincott、Williams和Wilkins，费城/纽约州奥维德)；以及Vogelstein and Kinzler,TheGenetic Basis of Human Cancer(Second edition,2002,McGraw Hill Professional,New York)(Vogelstein和Kinzler，《人癌症的遗传基础》，第二版，2002年，麦格劳希尔专业出版，纽约)；某些实施例设想了根据此类标准而已知没有患有、形成或罹患癌症的风险的人受试者。

某些其他实施例设想了非人受试者或生物源，例如非人灵长目动物如猕猴、黑猩猩、大猩猩、长尾黑颚猴、红毛猩猩、狒狒或其他非人灵长动物，包括本领域已知可作为临床前模型(包括实体瘤和/或其他癌症的临床前模型)的此类非人受试者。某些其他实施例设想了作为哺乳动物的非人受试者，例如，小鼠、大鼠、兔、猪、绵羊、马、牛、山羊、沙鼠、仓鼠、豚鼠或其他哺乳动物；许多此类哺乳动物可为本领域已知作为包括循环肿瘤或实体瘤和/或其他癌症的某些疾病或障碍的临床前模型的受试者(例如，Talmadge et al.,2007Am.J.Pathol.170:793(Talmadge等人，2007年，《美国病理学杂志》，第170卷，第793页)；Kerbel,2003Canc.Biol.Therap.2(4Suppl 1):S134(Kerbel，2003年，《癌症生物学和疗法》，第2卷，第4期增刊1，第S134页)；Man et al.,2007Canc.Met.Rev.26:737(Man等人，2007年，《癌症与转移综述》，第26卷，第737页)；Cespedes et al.,2006Clin.Transl.Oncol.8:318(Cespedes等人，2006年，《临床与转化肿瘤学》，第8卷，第318页))。然而，实施例的范围并非旨在如此限制，使得还存在设想的其他实施例，其中受试者或生物源可为非哺乳类脊椎动物，例如另一种高等脊椎动物，或鸟类、两栖动物或爬行动物物种，或另一种受试者或生物源。

可通过如下方式提供生物样品：从受试者或生物源获得血样、活检标本、组织外植体、器官培养物、生物流体或者任何其他组织或细胞制备物。优选地，样品包含来自受试者或生物源的淋巴样细胞的DNA，以举例说明而非限制的方式，其可包含一个或多个TCR或BCR基因座处的重排DNA。在某些实施例中，可例如通过手术切除、穿刺活检或获得包含细胞混合物的测试生物样品的其他方式，从实体组织(例如，实体瘤)获得测试生物样品。

根据某些实施例，可能希望根据大量既定方法中的任何一种来分离淋巴样细胞(例如，T细胞和/或B细胞)，其中分离的淋巴样细胞是已从淋巴样细胞天然存在于其中的组织、环境或周围移除或分离的那些淋巴样细胞。从而可从生物样品，如从多种组织和生物流体样品(包括骨髓、胸腺、淋巴腺、淋巴结、外周组织和血液)获得B细胞和T细胞，但外周血液最容易获得。可对任何外周组织取样以检测B和T细胞的存在，并从而设想用于本文所述的方法。可从中获得适应性免疫细胞的组织和生物流体包括但不限于皮肤、上皮组织、结肠、脾脏、粘膜分泌物、口腔粘膜、肠粘膜、阴道粘膜或阴道分泌物、宫颈组织、神经节、唾液、脑脊液(CSF)、骨髓、脐带血、血清、浆膜液、血浆、淋巴液、尿液、腹水、胸膜液、心包液、腹膜液、腹腔液、培养基、条件培养基或灌洗液。在某些实施例中，可从血浆分离置换法样品(apheresis sample)分离适应性免疫细胞。可通过静脉切开术从受试者获得外周血样品。通过本领域技术人员已知的技术，例如通过密度梯度分离来分离外周血单核细胞(PBMC)。在某些实施例中，使用全部PBMC进行分析。

对于核酸提取，可使用本领域已知的方法和/或可商购获得的试剂盒，例如通过使用血液DNA小提试剂盒()，从细胞提取总基因组DNA。单个单倍体基因组的近似质量为3pg。优选地，使用至少100,000至200,000个细胞进行分析，即来自二倍体T或B细胞的约0.6至1.2μg DNA。使用PBMC作为来源，可估计T细胞的数量为总细胞的约30％。也可估计B细胞的数量为PBMC制备物中总细胞的约30％。

Ig和TCR基因座含有许多不同可变(V)基因区段、多样性(D)基因区段和连接(J)基因区段，这些基因区段在早期淋巴分化期间经历重排过程。Ig以及TCR V、D和J基因区段序列是本领域已知的并且可在公共数据库如GENBANK中获得。V-D-J重排由重组酶复合体介导，其中RAG1和RAG2蛋白质通过如下方式起到关键作用：在位于V基因区段下游、D基因区段两侧和J基因区段上游的重组信号序列(RSS)处识别和切割DNA。不适当的RSS可减少或甚至完全防止重排。重组信号序列(RSS)包含被12+/-1bp(“12-信号”)或23+/-1bp(“23-信号”)的间隔序列隔开的两个共有序列(七聚物5'-CACAGTG-3'和九聚物5'-ACAAAAACC-3')。在V区段和D区段的3'端处，RSS序列是七聚物(CACAGTG)-间隔序列-九聚物(ACAAAAACC)。在J区段和D区段的5'端处，RSS序列是九聚物(GGTTTTTGT)-间隔序列-七聚物(CACTGTG)，且在每种特异性基因区段的七聚物和九聚物序列中具有大量序列变异。

已确定很多核苷酸位置对于重组是重要的，包括七聚物第一位和第二位处的CA二核苷酸，并且七聚物第三位处的C也显示出具有强烈偏好性，九聚物的第5、6、7位处的A核苷酸也是如此。(Ramsden et.al 1994Nucl.Ac.Res.22:1785(Ramsden等人，1994年，《核酸研究》，第22卷，第1785页)；Akamatsu et.al.1994J.Immunol.153:4520(Akamatsu等人，1994年，《免疫学杂志》，第153卷，第4520页)；Hesse et.al.1989Genes Dev.3:1053(Hesse等人，1989年，《基因与发育》，第3卷，第1053页))。其他核苷酸的突变具有极小或不一致的效应。间隔序列虽然更可变化，但也对重组具有影响，并且已显示单核苷酸替换可显著影响重组效率(Fanninget.al.1996Cell.Immunol.Immumnopath.79:1(Fanning等人，1996年，《细胞免疫学与免疫病理学》，第79卷，第1页)；Larijani et.al 1999Nucl.Ac.Res.27:2304(Larijani等人，1999年，《核酸研究》，第27卷，第2304页)；Nadel et.al.1998J.Immunol.161:6068(Nadel等人，1998年，《免疫学杂志》，第161卷，第6068页)；Nadel et al.,1998J.Exp.Med.187:1495(Nadel等人，1998年，《实验医学杂志》，第187卷，第1495页))。已描述了识别具有显著不同的重组效率的RSS多核苷酸序列的标准(Ramsdenet.al 1994Nucl.Ac.Res.22:1785(Ramsden等人，1994年，《核酸研究》，第22卷，第1785页)；Akamatsu et.al.1994J.Immunol.153:4520(Akamatsu等人，1994年，《免疫学杂志》，第153卷，第4520页)；Hesse et.al.1989Genes Dev.3:1053(Hesse等人，1989年，《基因与发育》，第3卷，第1053页)以及Lee et al.,2003PLoS 1(1):E1(Lee等人，2003年，公共科学图书馆，第1卷，第1期，第E1页))。

Ig重链(IgH)、TCRβ(TCRB)和TCRδ(TCRD)基因处的重排过程通常以D到J重排开始，接着是V到D-J重排，而在Igκ(IgK)、Igλ(IgL)、TCRα(TCRA)和TCRγ(TCRG)基因处出现直接V到J重排。重排基因区段之间的序列通常以环形删除产物的形式缺失，所述环形删除产物也称为TCR删除环(TREC)或B细胞受体删除环(BREC)。

V、D和J基因区段的许多不同组合代表所谓的组合组库，其据估计对于Ig分子为约2×10⁶，对于TCRαβ为约3×10⁶，对于TCRγδ分子为约5×10³。在重排过程期间，在V、D和J基因区段的接合位点处，发生核苷酸的缺失和随机插入，从而产生高度多样的接合区，这些接合区对Ig和TCR分子的总组库具有显著贡献，估计为>10¹²种可能的氨基酸序列。

成熟B淋巴样细胞在生发中心通过体细胞高频突变(即，导致Ig分子亲和力成熟的过程)进行抗原识别后进一步扩充其Ig组库。体细胞高频突变过程集中于IgH和Ig轻链基因的V-(D-)J外显子，并且主要产生单核苷酸突变但有时也产生核苷酸的插入或缺失。体细胞突变的Ig基因通常也存在于成熟B细胞恶性肿瘤中。

在本文所述的某些实施例中，V区段和J区段引物可用于PCR反应以扩增测试生物样品中的重排TCR或BCR CDR3编码DNA区，其中每种功能性TCR或Ig V编码基因区段包含V基因重组信号序列(RSS)并且每种功能性TCR或Ig J编码基因区段包含J基因RSS。在这些和相关实施例中，每种扩增的重排DNA分子可包含(i)TCR或Ig V编码基因区段有义链的至少约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000(包括其间的所有整数值)或更多个连续核苷酸，其中至少约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或更多个连续核苷酸位于V基因RSS的5'端，和/或每种扩增的重排DNA分子可包含(ii)TCR或Ig J编码基因区段有义链的至少约10、20、30、40、50、60、70、80、90、100、200、300、400、500(包括其间的所有整数值)或更多个连续核苷酸，其中至少约10、20、30、40、50、60、70、80、90、100、200、300、400、500或更多个连续核苷酸位于J基因RSS的3'端。

扩增因子测定

除了使用用于使如本文所述的寡核苷酸扩增引物组的扩增效率标准化的本发明所公开的模板组合物之外，某些其他实施例还设想使用模板组合物来测定扩增因子，以便估计样品中的重排适应性免疫受体编码序列的数量。这些和相关实施例可能可用于对DNA样品中的适应性免疫受体编码序列的数量进行定量，所述DNA样品从淋巴样细胞获得，包括存在于细胞混合物中的淋巴样细胞，所述细胞混合物包含其中编码适应性免疫受体的DNA已经经历DNA重排的细胞，但样品也含有来自其中未发生此类重排的细胞(例如，非淋巴样细胞、未成熟细胞、间充质细胞、癌细胞等)的DNA。

可通过使用综合的V-J扩增引物组进行多重PCR，然后对扩增产物进行定量测序，来估计受试者中的给定类别的适应性免疫受体(例如，TCR或IG)的不同成员的总数。重排TCR和BCR(IG)编码DNA序列的多重扩增和高通量测序例如在如下文献中有所描述：Robins et al.,2009Blood 114,4099(Robins等人，2009年，《血液》，第114卷，第4099页)；Robinset al.,2010Sci.Translat.Med.2:47ra64(Robins等人，2010年，《科学转化医学》，第2卷，第47ra64页)；Robins et al.,2011J.Immunol.Meth.doi:10.1016/j.jim.2011.09.001(Robins等人，2011年，《免疫法杂志》，doi:10.1016/j.jim.2011.09.001)；Sherwood et al.2011Sci.Translat.Med.3:90ra61(Sherwood等人，2011年，《科学转化医学》，第3卷，第90ra61页)；U.S.A.N.13/217,126(美国公布No.2012/0058902)、U.S.A.N.12/794,507(美国公布No.2010/0330571)、WO/2010/151416、WO/2011/106738(PCT/US2011/026373)、WO2012/027503(PCT/US2011/049012)、U.S.A.N.61/550,311和U.S.A.N.61/569,118。

该方法通常涉及从淋巴样细胞的亚群进行DNA取样，所述淋巴样细胞为例如存在于血样中的淋巴样细胞，已知血样还含有缺少重排TCR或IG编码DNA的有核细胞。本发明的组合物和方法可允许改善此类样品中的重排TCR和IG编码DNA分子数量的测定的准确性和精确性。如本文所述，例如，通过用本发明模板组合物对DNA样品加标，提供内部扩增模板标准品以用于评估存在于多重扩增引物组中的各种寡核苷酸引物的相对效率。通过如此评估以已知量添加至扩增反应中的本发明人工模板组合物的扩增产物，可测定寡核苷酸扩增引物组的扩增因子(例如，乘积因子、归一化因子、比例因子或几何因子等)并且可随后用于计算样品中的天然DNA模板的数量。

又如，这些和相关实施例允许通过从淋巴样细胞和非淋巴样细胞(包括持续性淋巴瘤或白血病细胞)的混合制备物获得的样品中的重排TCR或IG编码DNA的定量检测，对淋巴瘤或白血病的微小残留病(MRD)进行定量。先前方法以恶性细胞数量来测定MRD，所述恶性细胞可按照样品中的细胞总数的比例来检测。相比之下，本发明方法允许估计样品中具有重排TCR或IG编码DNA的细胞的总数，使得恶性细胞(例如，具有特定TCR或IG重排的那些，如克隆型)可按照此类重排细胞的比例而非按照所有细胞的比例来定量。作为非限制性理论，据信因为来自患有或疑似患有MRD的受试者的临床样品中的所有重排细胞的占比通常非常低，本发明方法将显著改善MRD可被检测到的灵敏度，包括通过提高信噪比来改善此类灵敏度。

因此某些实施例从而提供了用于定量生物样品中编码一种或多种适应性免疫受体的重排DNA分子的方法，所述生物样品包含来自受试者的淋巴样细胞的DNA，每种适应性免疫受体包含可变区和连接区。简而言之，所述方法包括如下步骤：

(A)在使用能够扩增给定适应性免疫受体的基本上所有V-J编码组合的本文所述寡核苷酸扩增引物组的多重扩增反应中，扩增来自样品的DNA以获得扩增产物，所述样品中已添加已知量的用于使扩增效率标准化的本文所述模板组合物；

(B)对(A)的扩增产物定量测序以定量(i)模板扩增产物，其为本文所述模板组合物的扩增产物并且将是可检测的，因为其含有至少一种条形码寡核苷酸序列；和(ii)样品中的重排适应性免疫受体编码DNA序列的扩增产物，其将是可检测的，因为其含有特异性V和J序列但缺少寡核苷酸条形码序列；

(C)基于步骤(B)中获得的定量信息计算扩增因子；以及

(D)使用(C)的扩增因子通过计算来测定样品中的独特适应性免疫受体编码DNA分子的数量。

不希望受理论的束缚，根据这些和相关方法，在多重扩增反应中取样的重排TCR或IG编码DNA分子的数量得以测量。为此，测定序列覆盖值，例如针对每种输入(模板)分子所测定的输出序列读段的数量，并在所存在的不同模板寡核苷酸的全部数量中对其进行平均，以获得平均序列覆盖值。通过将(i)针对给定序列获得的读段的数量除以(ii)平均序列覆盖值，可计算在扩增反应开始时作为模板存在的重排分子的数量。

从而，例如，为了计算序列覆盖值，将已知量的本发明所公开的模板组合物的一组合成分子添加到每个PCR扩增中，所述合成模板具有式(I)5'U-B1-V-B2-R-(B3)-J-B4-U 3'的基本结构，其中每个V为具有匹配TCR或IG V基因序列的序列的300碱基对区段，并且J为具有匹配TCR或IG J基因的序列的100碱基对区段。B2为独特的条形码寡核苷酸序列，其独特地识别每个VJ对并且也将合成DNA模板的扩增产物(其将含有条形码序列)与淋巴样DNA样品所贡献的天然存在的生物模板DNA分子的扩增产物(其将缺少条形码序列)区分开。在该例中，式(I)的B3不存在。在PCR扩增和测序后，对每种所测序的合成分子(即，包含条形码序列的扩增产物)的数量进行计数。然后基于用于对扩增反应加标的起始合成模板分子的已知数量，计算合成分子的序列覆盖率。

例如，可将5000个合成的含条形码的模板分子(1100种独特的合成模板寡核苷酸序列(代表每个可能的VJ对)每者具有4-5个拷贝)的库添加至扩增反应。如果扩增产物包含匹配合成模板分子的50,000条序列，则获得了10X的序列覆盖值并且扩增因子为10。为了估计从样品获得的DNA中的天然VDJ重排模板分子的数量，则将天然模板的扩增产物(即，缺少任何条形码序列的扩增产物)的数量除以扩增因子。由于在该例中5000个合成分子是代表每种VJ对的1100种分子的复杂库，为增加准确性，可单独计算每种VJ对的扩增因子。然后可在所有合成分子中对扩增因子进行平均(图8)。方法的准确性和稳健性示于图9中并且细节在以下实例5中描述。

在替代实施例中，所述替代实施例与本部分的上文和下文中所述的相同，但例外的是差异在于合成模板分子的总库的亚组的使用，其以导致对样品的添加为不超过1拷贝的不同模板分子的亚组至样品的方式使用。普通技术人员熟知的泊松统计方法的应用被用于基于库的已知特性(例如，不同序列的总数和模板分子的浓度)测定要添加的模板的量。例如，将200-500个模板分子添加至扩增反应，使得存在于库中的模板分子亚组中的每一者具有平均不超过一拷贝。

因此，在这些实施例中，所述方法包括：(A)在多重聚合酶链式反应(PCR)中扩增DNA，所述反应包含：(1)来自包含受试者淋巴样细胞的生物样品的DNA；(2)权利要求1的模板组合物，其中存在已知数量的具有独特寡核苷酸序列的所述多种模板寡核苷酸中的每一者；(3)能够扩增来自生物样品的DNA中编码一种或多种适应性免疫受体的重排DNA的寡核苷酸扩增引物组，所述引物组包含：(a)基本上等摩尔量的多种V区段寡核苷酸引物，其各自独立地能够特异性杂交至至少一种编码适应性免疫受体V区多肽的多核苷酸或特异性杂交至其互补序列，其中每种V区段引物包含与至少一种功能性适应性免疫受体V区编码基因区段互补的至少15个连续核苷酸的核苷酸序列，并且其中所述多种V区段引物特异性杂交至模板组合物中存在的基本上所有功能性适应性免疫受体V区编码基因区段，以及(b)基本上等摩尔量的多种J区段寡核苷酸引物，其各自独立地能够特异性杂交至至少一种编码适应性免疫受体J区多肽的多核苷酸或特异性杂交至其互补序列，其中每种J区段引物包含与至少一种功能性适应性免疫受体J区编码基因区段互补的至少15个连续核苷酸的核苷酸序列，并且其中所述多种J区段引物特异性杂交至模板组合物中存在的基本上所有功能性适应性免疫受体J区编码基因区段，其中V区段和J区段寡核苷酸引物能够在所述多重聚合酶链式反应(PCR)中促进如下的扩增：(i)模板组合物中的基本上所有模板寡核苷酸以产生大量的扩增模板DNA分子，所述大量的扩增模板DNA分子足以定量模板组合物中的模板寡核苷酸的多样性，以及(ii)生物样品中的编码适应性免疫受体的基本上所有重排DNA分子以产生大量的扩增重排DNA分子，所述大量的扩增重排DNA分子足以定量来自生物样品的DNA中的重排DNA分子的多样性，并且其中所述大量的扩增模板DNA分子中和所述大量的扩增重排DNA分子中的每一扩增DNA分子的长度小于1000、900、800、700、600、500、400、300、200、100、90、80或70个核苷酸。

(B)对所述扩增的模板DNA分子中的每一者和所述扩增的重排DNA分子中的每一者的所有或足够的部分进行定量测序以定量(i)包含至少一种寡核苷酸条形码序列的扩增模板DNA分子的模板产物数量，以及(ii)缺少寡核苷酸条形码序列的扩增重排DNA分子的重排产物数量；

(C)将(B)(i)的模板产物数量除以(A)(2)的具有独特寡核苷酸序列的所述多种模板寡核苷酸中的每一者的已知数量，来计算扩增因子；以及

(D)将(B)(ii)的重排产物数量除以(C)中计算的扩增因子以定量样品中的独特适应性免疫受体编码DNA分子。

所设想的实施例并非旨在受限于上述方法，使得技术人员根据本公开将理解可采用的变型形式。替代方法例如可不使用本文所述的合成模板组合物作为DNA样品的多重PCR扩增中的加标对照模板，所述DNA样品含有重排淋巴样细胞TCR和/或IG编码DNA以及非重排DNA。相反，根据一种此类替代形式，可向使用V和J扩增引物的扩增反应中添加已知的一组寡核苷酸扩增引物，所述寡核苷酸扩增引物可扩增不同的高度保守基因组序列区。这些基因组对照引物可扩增DNA样品中存在的每个基因组，而不论其是否含有重排TCR和/或IG编码序列，而V和J引物可仅从具有重排VDJ区的基因组扩增产物。这两种类别的扩增产物分子之间的比率允许估计样品中的B细胞基因组总数。

除非特别说明为相反的意思，否则本发明某些实施例的实施将采用微生物学、分子生物学、生物化学、分子遗传学、细胞生物学、病毒学和免疫学技术中的常规方法，所述技术属于本领域技术，并且以下出于举例说明目的而对其中若干技术进行了引用。此类技术在文献中进行了充分阐述。参见例如，Sambrook,et al.,Molecular Cloning:A Laboratory Manual(3^rd Edition,2001)(Sambrook等人，《分子克隆实验指南》，第3版，2001年)；Sambrook,et al.,Molecular Cloning:A Laboratory Manual(2^nd Edition,1989)(Sambrook等人，《分子克隆实验指南》，第2版，1989年)；Maniatis etal.,Molecular Cloning:A Laboratory Manual(1982)(Maniatis等人，《分子克隆：实验指南》，1982年)；Ausubel et al.,Current Protocols in MolecularBiology(John Wiley and Sons,updated July 2008)(Ausubel等人，《现代分子生物学实验技术》，约翰·威利父子出版公司，2008年7月更新)；ShortProtocols in Molecular Biology:A Compendium of Methods from CurrentProtocols in Molecular Biology,Greene Pub.Associates and Wiley-Interscience(《精编分子生物学实验指南：现代分子生物学实验技术方法汇编》，格林出版公司与威利国际科学公司)；Glover,DNA Cloning:A Practical Approach,vol.I&II(IRL Press,Oxford Univ.Press USA,1985)(Glover，《DNA克隆：实用方法》，第I和II卷，IRL出版社，美国牛津大学出版社，1985年)；Current Protocols in Immunology(Edited by:John E.Coligan,Ada M.Kruisbeek,David H.Margulies,Ethan M.Shevach,Warren Strober 2001John Wiley&Sons,NY,NY)(《现代免疫学实验技术》，编辑：John E.Coligan、Ada M.Kruisbeek、David H.Margulies、Ethan M.Shevach、Warren Strober，2001年，约翰·威利父子出版公司，纽约州纽约市)；Real-Time PCR:CurrentTechnology and Applications,Edited by Julie Logan,Kirstin Edwards and NickSaunders,2009,Caister Academic Press,Norfolk,UK(《实时PCR：现代技术与应用》，由Julie Logan、Kirstin Edwards和Nick Saunders编辑，2009年，Caister学术出版社，英国诺福克)；Anand,Techniques for the Analysis ofComplex Genomes,(Academic Press,New York,1992)(Anand，《分析复杂基因组的技术》，学术出版社，纽约，1992年)；Guthrie and Fink,Guide toYeast Genetics and Molecular Biology(Academic Press,New York,1991)(Guthrie和Fink，《酵母遗传学与分子生物学指南》，学术出版社，纽约，1991年)；Oligonucleotide Synthesis(N.Gait,Ed.,1984)(《寡核苷酸合成》，N.Gait编辑，1984年)；Nucleic Acid Hybridization(B.Hames&S.Higgins,Eds.,1985)(《核酸杂交》，B.Hames和S.Higgins编辑，1985年)；Transcription and Translation(B.Hames&S.Higgins,Eds.,1984)(《转录和翻译》，B.Hames和S.Higgins编辑，1984年)；Animal CellCulture(R.Freshney,Ed.,1986)(《动物细胞培养》，R.Freshney编辑，1986年)；Perbal,A Practical Guide to Molecular Cloning(1984)(Perbal，《分子克隆实用指南》，1984年)；Next-Generation Genome Sequencing(Janitz,2008Wiley-VCH)(《下一代基因组测序》，Janitz，2008年，威利-VCH出版公司)；PCR Protocols(Methods in Molecular Biology)(Park,Ed.,3^rd Edition,2010Humana Press)(《PCR实验技术》(分子生物学方法)，Park编辑，第3版，2010年，胡马纳出版社)；Immobilized Cells And Enzymes(IRLPress,1986)(《固定化细胞和酶》，IRL出版社，1986年)；论文MethodsIn Enzymology(Academic Press,Inc.,N.Y.)(《酶学方法》，学术出版社，纽约)；Gene Transfer Vectors For Mammalian Cells(J.H.Miller and M.P.Caloseds.,1987,Cold Spring Harbor Laboratory)(《哺乳动物细胞的基因转移载体》，J.H.Miller和M.P.Calos编辑，1987年，冷泉港实验室)；Harlowand Lane,Antibodies,(Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1998)(Harlow和Lane，《抗体》，冷泉港实验室出版社，纽约冷泉港，1998年)；Immunochemical Methods In Cell And Molecular Biology(Mayer and Walker,eds.,Academic Press,London,1987)(《细胞与分子生物学中的免疫化学方法》，Mayer和Walker编辑，学术出版社，伦敦，1987年)；Handbook Of Experimental Immunology,Volumes I-IV(D.M.Weir andCC Blackwell,eds.,1986)(《实验免疫学手册》，第I-IV卷，D.M.Weir和CC Blackwell编辑，1986年)；Riott,Essential Immunology,6th Edition,(Blackwell Scientific Publications,Oxford,1988)(Riott，《基础免疫学》，第6版，布莱克威尔科学出版公司，牛津，1988年)；Embryonic Stem Cells:Methods and Protocols(Methods in Molecular Biology)(Kurstad Turksen,Ed.,2002)(《胚胎干细胞：方法与实验技术》(分子生物学方法)，KurstadTurksen编辑，2002年)；Embryonic Stem Cell Protocols:Volume I:Isolationand Characterization(Methods in Molecular Biology)(Kurstad Turksen,Ed.,2006)(《胚胎干细胞实验技术：第I卷：分离与表征》(分子生物学方法)，Kurstad Turksen编辑，2006年)；Embryonic Stem Cell Protocols:Volume II:Differentiation Models(Methods in Molecular Biology)(KurstadTurksen,Ed.,2006)(《胚胎干细胞实验技术：第II卷：分化模式》(分子生物学方法)，Kurstad Turksen编辑，2006年)；Human Embryonic Stem CellProtocols(Methods in Molecular Biology)(Kursad Turksen Ed.,2006)(《人胚胎干细胞实验技术》(分子生物学方法)，Kursad Turksen编辑，2006年)；Mesenchymal Stem Cells:Methods and Protocols(Methods in MolecularBiology)(Darwin J.Prockop,Donald G.Phinney,and Bruce A.Bunnell Eds.,2008)(《间充质干细胞：方法与实验技术》(分子生物学方法)，Darwin J.Prockop、Donald G.Phinney和Bruce A.Bunnell编辑，2008年)；Hematopoietic Stem Cell Protocols(Methods in Molecular Medicine)(Christopher A.Klug,and Craig T.Jordan Eds.,2001)(《造血干细胞实验技术》(分子生物学方法)，Christopher A.Klug和Craig T.Jordan编辑，2001年)；Hematopoietic Stem Cell Protocols(Methods in Molecular Biology)(Kevin D.Bunting Ed.,2008)(《造血干细胞实验技术》(分子生物学方法)，Kevin D.Bunting编辑，2008年)；Neural Stem Cells:Methods andProtocols(Methods in Molecular Biology)(Leslie P.Weiner Ed.,2008)(《神经干细胞：方法与实验技术》(分子生物学方法)，Leslie P.Weiner编辑，2008年)。

除非提供了明确定义，否则结合本文所述的分子生物学、分析化学、合成有机化学和医药化学利用的命名，以及本文所述的分子生物学、分析化学、合成有机化学和医药化学的实验室程序和技术是本领域熟知和常用的那些。标准技术可用于重组技术、分子生物学、微生物学、化学合成、化学分析、药物制备、配制和递送、以及患者治疗。

除非上下文另外要求，否则在本说明书和权利要求书通篇中，词语“包含”及其变型形式诸如“包括”和“具有”应以开放式包含的意义解释，即解释为“包括但不限于”。所谓“由...组成”意指包括，并通常限于紧接短语“由...组成”的任何事物。所谓“基本上由...组成”意指包括该短语之后所列的任何元素，并且限于不妨碍或促成所列元素的公开内容中指定的活性或作用的其他元素。从而，短语“基本上由...组成”指示所列元素是所需的或强制性的，但是其他元素是不需要的并且可存在或可不存在，具体取决于其是否影响所列元素的活性或作用。

在本说明书和随附权利要求书中，单数形式“一个”、“一种”和“所述”包括复数引用，除非所述内容明确地另外指明。如本文所用，在特定实施例中，术语“约”或“大约”当在数值之前时指示所述数值加上或减去5％、6％、7％、8％或9％的范围。在其他实施例中，术语“约”或“大约”当在数值之前时指示所述数值加上或减去10％、11％、12％、13％或14％的范围。在其他实施例中，术语“约”或“大约”当在数值之前时指示所述数值加上或减去15％、16％、17％、18％、19％或20％的范围。

本说明书通篇对“一个实施例”或“实施例”或“一个方面”的提及意指结合实施例所述的特定特征、结构或特性包括在本发明的至少一个实施例中。从而，短语“在一个实施例中”或“在实施例中”在本说明书通篇的各个地方的出现不一定全部都指相同实施例。此外，特定特征、结构或特性可以任何合适的方式在一个或多个实施例中组合。

实例

实例1：用于校准扩增引物偏倚控制的模板寡核苷酸的设计

在该实例和以下实例中，采用标准分子生物学和生物化学材料及方法，包括在如下文献中所述的技术：例如，Sambrook,et al.,Molecular Cloning:ALaboratory Manual(3^rd Edition,2001)(Sambrook等人，《分子克隆：实验指南》，第3版，2001年)；Sambrook,et al.,Molecular Cloning:A LaboratoryManual(2^nd Edition,1989)(Sambrook等人，《分子克隆：实验指南》，第2版，1989年)；Maniatis et al.,Molecular Cloning:A Laboratory Manual(1982)(Maniatis等人，《分子克隆：实验指南》，1982年)；Ausubel et al.,Current Protocols in Molecular Biology(John Wiley and Sons,updated July 2008)(Ausubel等人，《现代分子生物学实验技术》，约翰·威利父子出版公司，2008年7月更新)；Short Protocols in Molecular Biology:A Compendium ofMethods from Current Protocols in Molecular Biology,Greene Pub.Associatesand Wiley-Interscience(《精编分子生物学实验指南：现代分子生物学实验技术方法汇编》，格林出版公司与威利国际科学公司)；Glover,DNACloning:A Practical Approach,vol.I&II(IRL Press,Oxford Univ.Press USA,1985)(Glover，《DNA克隆：实用方法》，第I和II卷，IRL出版社，美国牛津大学出版社，1985年)；Anand,Techniques for the Analysis of ComplexGenomes,(Academic Press,New York,1992)(Anand，《分析复杂基因组的技术》，学术出版社，纽约，1992年)；Oligonucleotide Synthesis(N.Gait,Ed.,1984)(《寡核苷酸合成》，N.Gait编辑，1984年)；Nucleic AcidHybridization(B.Hames&S.Higgins,Eds.,1985)(《核酸杂交》，B.Hames和S.Higgins编辑，1985年)；Transcription and Translation(B.Hames&S.Higgins,Eds.,1984)(《转录和翻译》，B.Hames和S.Higgins编辑，1984年)；Perbal,A Practical Guide to Molecular Cloning(1984)(Perbal，《分子克隆实用指南》，1984年)；Next-Generation Genome Sequencing(Janitz,2008Wiley-VCH)(《下一代基因组测序》，Janitz，2008年，威利-VCH出版公司)；PCR Protocols(Methods in Molecular Biology)(Park,Ed.,3^rd Edition,2010Humana Press)(《PCR实验技术》(分子生物学方法)，Park编辑，第3版，2010年，胡马纳出版社)。

一组双链DNA(dsDNA)模板寡核苷酸被设计为校准用标准品，所述校准用标准品用作模拟指定适应性免疫受体(TCR或BCR)基因座处的所有可能V/J组合的对照模板。对于每个人TCR和BCR基因座，由RSS 5'端的已知基因组V区段序列和RSS 3'端的已知基因组J区段列表编制成列表。为了易于理解，根据5'到3'取向为从左读到右的惯例给出dsDNA模板的编码链序列。

模板寡核苷酸的通用结构的示意图示于图1中。为了用于多重背景下的每种独特模板寡核苷酸身份的交叉验证，将不同的16bp条形码寡核苷酸(B)掺入到每种模板中，其中条形码的第一8bp独特识别模板的V区段多核苷酸，并且条形码的第二8bp独特识别J区段。将该条形码的拷贝掺入三次：将(B3)掺入在外部接头(U2)与J区段序列(J)之间，使得采用标准Illumina或Ion引物的短单端读段可揭示每种模板寡核苷酸的V和J序列的独特组合的身份；将(B2)掺入在V与J区段之间，使得标准测序策略(例如，IlluminaGA-2或HiSeq^TM或)将捕获每种模板寡核苷酸中的V和J序列的独特组合；以及将(B3)掺入在V区段与其他外部接头(U1)之间，使得短成对端读段可确认每种模板寡核苷酸中的V和J序列的独特组合的身份，如果希望这样的话。

如图1所示，模板寡核苷酸序列以接头序列(U1)开始，所述接头序列(U1)能够在分子末端掺入测序平台特异性短寡核苷酸序列。在该例中，使用了Illumina Nextera^TM接头，但应当指出的是基本上任何稳健PCR引物对都将同样有效。作为示例性接头，寡核苷酸序列GCCTTGCCAGCCCGCTCAG[SEQ ID NO:1746]附接在U1的V区段末端(图1)，以保持与要加在标准Illumina寡核苷酸上的Nextera^TM Illumina接头(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))(CAAGCAGAAGACGGCATACGAGATCGGTCTGCCTTGCCAGCCCGCTC AG)[SEQ ID NO:1747]的相容性，所述标准Illumina寡核苷酸与单端或成对端Illumina测序流通池相容。

U1的紧接下游(其3'端)是条形码寡核苷酸ACACACGTGACACTCT[SEQ ID NO:1748]的第一拷贝(B1)。接下来，将固定长度的V区段序列掺入到模板寡核苷酸中，使模板组中的所有模板以天然RSS之前的给定数量碱基结束，以便模拟V区段处缺失固定数量碱基的天然TCR或BCR基因重排。在该例中最初在RSS之前有零个碱基缺失。为了使这些序列的可识别性最大化，然后对所有V区段多核苷酸序列进行修剪以移除邻近RSS的部分密码子，使得残余V区段序列与起始密码子处于框内。多样性V区段序列是序列表中所示的示例性模板寡核苷酸组中示出的那些(例如，SEQ IDNO:1-871中的TCRB模板寡核苷酸组的式(I)序列内的一组TCRB V区段；SEQ ID NO:872-1560中的TCRB模板寡核苷酸组的式(I)序列内的不同组TCRB V区段；SEQ ID NO:1561-1630中的TCRG模板寡核苷酸组的式(I)序列内的一组TCRG V区段)；单种示例性V多核苷酸如下：

TCTTATTTTCATAGGCTCCATGGATACTGGAATTACCCAGACACCAAAATACCTGGTCACAGCAATGGGGAGTAAAAGGACAATGAAACGTGAGCATCTGGGACATGATTCTATGTATTGGTACAGACAGAAAGCTAAGAAATCCCTGGAGTTCATGTTTTACTACAACTGTAAGGAATTCATTGAAAACAAGACTGTGCCAAATCACTTCACACCTGAATGCCCTGACAGCTCTCGCTTATACCTTCATGTGGTCGCACTGCAGCAAGAAGACTCAGCTGCGTATCTCTGCACCAGCAG[SEQ ID NO:1749]。

将终止密码子TGA框内掺入在每种模板寡核苷酸中的V多核苷酸序列的3'端，以确保模板寡核苷酸序列不会视为与它们污染生物样品的事件相关。在NDN正常情况下所处的V区段与J区段之间的终止密码子的下游，插入V/J识别符条形码序列B2(SEQ ID NO:1748)的第二拷贝。接下来，掺入Sal1限制性酶识别位点(R)序列GTCGAC；基于作为不天然存在于TCRBV或J区段基因组序列任何一者中的序列、赋予在需要时特异性破坏合成模板的能力、或用作识别合成序列的信息标记来选择该序列。B3位点在该形式的模板中为空。

将J多核苷酸(J)作为来自J基因区段的固定长度的序列(由天然RSS之后的固定碱基数测量)掺入以模拟天然重排，并且在本发明例子中延伸到J-C内含子。在该例中J区段缺失了零个碱基，但在其他模板寡核苷酸设计中，使用5bp的缺失以便为V-J接合部处的VJ条形码(B2)留出空间，同时使总J区段长度保持在天然范围内。示例性J多核苷酸是

ACTGAAGCTTTCTTTGGACAAGGCACCAGACTCACAGTTGTAGGTAAGACATTTTTCAGGTTCTTTTGCAGATCCGTCACAGGGAAAAGTGGGTCCACAG[SEQ ID NO:1750]。

J区段多核苷酸的下游是V/J条形码识别符寡核苷酸(SEQ ID NO:1748)的第三拷贝(B4)。示例性模板寡核苷酸序列即为以第二接头序列(U2)结束的序列，所述第二接头序列(U2)能够在分子末端掺入平台特异性序列。如上文所指出，Nextera^TM相容性接头(CTGATGGCGCGAGGGAGGC)[SEQ IDNO:1751]在U2的J区段末端上使用，其与Nextera^TM Illumina接头(AATGATACGGCGACCACCGAGATCTACACGCCTCCCTCGCGCCATCAG)[SEQ ID NO:1752]一起使用以允许添加在与单端或成对端流通池相容的标准Illumina测序寡核苷酸上。

制备根据本公开的示例性TCRB和TCRG模板寡核苷酸组，并且其具有以SEQ ID NO:1-1630示出的核苷酸序列。基于本文所公开的序列设计信息，由爱荷华州科拉尔维尔的集成DNA技术公司(Integrated DNATechnologies,Inc.(Coralville,IA))使用gBlocks^TM基因区段(Gene Fragments)化学物质，定制合成具有以SEQ ID NO:1-871和1561-1630示出的序列的模板寡核苷酸组。通过实例2所述的PCR拼接方法生成具有以SEQ ID NO:872-1560示出的序列的模板寡核苷酸组。

TCRB模板寡核苷酸(SEQ ID NO:1-871)。使用人TCRB V和J多核苷酸序列设计一组871种如下由通式(I)表示的模板寡核苷酸(其中B3不存在)：

5'-U1-B1-V-B2-R-(B3)-J-B4-U2-3' (I)。

每种模板寡核苷酸由495碱基对DNA分子组成。有义链序列以SEQ IDNO:1-871示出。

描绘该模板组的设计的示意图示于图1中。根据惯例，所述图表以5'到3'(左到右)方向描绘了寡核苷酸设计。“V区段”代表适应性免疫受体可变(V)区编码基因序列或其互补序列。“J区段”代表适应性免疫受体连接(J)区编码基因序列或其互补序列。U1和U2分别代表第一和第二通用接头寡核苷酸序列，其可任选还分别包含连接至第一和第二通用接头寡核苷酸序列并位于第一和第二通用接头寡核苷酸序列5'端的第一和第二测序平台特异性寡核苷酸序列。B1、B2和B4代表寡核苷酸条形码序列，其各自包含具有一独特寡核苷酸序列的寡核苷酸条形码序列，该独特寡核苷酸序列独特地识别作为成对组合的(i)独特的V区段序列和(ii)独特的J区段序列；在该实例中，B3不存在。

S代表在V的3'端可在框内或框外的任选终止密码子。R代表任选的限制性酶识别位点。在SEQ ID NO:1-871中，U1和U2接头包含如上文所述的19聚体(分别为SEQ ID NO:1746和1751)并且所有识别(V+J)的条形码(B)序列(B1,B2,B4)的长度为16个核苷酸；包含了终止密码子TGA和Sal1限制性酶识别位点(GTCGAC)。

TCRB模板寡核苷酸(SEQ ID NO:872-1560)。设计第二组689种模板寡核苷酸，其中根据通式(I)，V和J分别包含人TCRB V和J多核苷酸序列，U1和U2独立地包含不同限制性酶识别位点(R1和R3)，并且B1、B3和B4独立地不存在，从而获得通式(II)：

R1-V-B2-R2-J-R3 (II)

其中B2为8核苷酸条形码识别符(例如，如表7中所示的条形码序列)；R1、R2和R3分别为限制性酶识别位点EcoR1(GAATTC)、Sal1(GTCGAC)和Sph1(GCATGC)；并且V和J分别为如本文所述的V区和J区多核苷酸。每种模板寡核苷酸由239碱基对DNA分子组成。有义链序列以SEQ ID NO:872-1560示出。

TCRG模板寡核苷酸(SEQ ID NO:1561-1630)。使用人TCRG V和J多核苷酸序列设计第三组的70种由通式(I)表示的模板寡核苷酸。每种模板寡核苷酸由一495碱基对DNA分子组成。有义链序列以SEQ ID NO:1561-1630示出。TCRG模板的70-寡核苷酸组(SEQ ID NO:1561-1630)的细节具有代表性并且如下：

基于之前测定的基因组序列，人TCRG基因座显示出含有各自具有RSS序列的14个Vγ区段，因此被视为有能力重排。这14个Vγ区段包含已知能被表达的六个基因区段、被归类为具有开放阅读框的三个V区段以及五个V假基因。将Vγ基因区段连接至五个Jγ基因区段。为了包括14个V和5个J区段的所有可能V+J基因组合，设计代表所有可能VJ组合的70(5×14)种模板。每种模板符合通式(I)(5'-U1-B1-V-B2-R-(B3)-J-B4-U2-3')(图1)，从而包括九个部分，即19碱基对(bp)通用接头(U1)；16bp核苷酸标签(B1)，其独特识别V基因和J基因区段的每种成对组合；300bp的V基因特异性序列(V)；3bp终止密码子(S)；另一拷贝的16bp核苷酸标签(B2)；所有分子共有的6bp接合部标签(R)；不存在B3；100bp的J基因特异性序列(J)；第三拷贝的16bp核苷酸标签(B4)；以及19bp的通用接头序列(U2)。

使用寡核苷酸引物(表4；SEQ ID NO:1732-1745)单独地扩增70种模板(SEQ ID NO:1561-1630)中的每一者，所述寡核苷酸引物被设计为退火至通用接头序列(U1,U2)。

表4.TCRG扩增引物

使用LabChip GX^TM毛细管电泳系统(马萨诸塞州霍普金顿的卡利普生命科学公司(Caliper Life Sciences,Inc.,Hopkinton,MA)根据制造商使用说明来定量每种扩增模板寡核苷酸产物的所得浓度。如通过测序条形码B1所测定的，70种可能的V-J组合每一者的出现频率示于表5中。将70种扩增模板寡核苷酸制备物归一化为标准浓度，然后合并。

为验证所有70种模板寡核苷酸以基本上等摩尔浓度存在，使用Illumina HiSeq^TM测序平台根据制造商推荐，对所述库测序。简而言之，为将平台特异性寡核苷酸序列掺入合并的模板寡核苷酸中，设计了加尾引物，所述加尾引物退火至通用引发位点(U1,U2)并且具有如5'端的IlluminaNextera^TM接头序列尾部。然后进行七个循环的PCR反应以将Illumina接头退火至模板寡核苷酸。然后使用XP微珠(加利福尼亚州富勒顿的贝克曼库尔特公司(Beckman Coulter,Inc.,Fullerton,CA))在由制造商所推荐的条件下纯化PCR反应产物混合物。使用Illumina HiSEQ^TM测序仪(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))对PCR反应产物开始的60bp测序，并通过评估每种16bp分子条形码标签(B1)的频率进行分析。

计算70种不同模板寡核苷酸的组的基本上等摩尔的制备物以使得含有大约1.4％的所述组的每个成员，并且希望所有物质的阈值容差为加上或减去十倍频率(0.14-14％)。定量测序表明初始库内的70种接头修饰的模板寡核苷酸物质占比不均匀。

因此，进行单独模板寡核苷酸浓度的调节和定量测序步骤的重复，直到每种分子在阈值容差浓度(0.14-14％)内存在。

表5：预先扩增模板库中的每个TCRG VJ对(14个V×5个J)的扩增产物的相对占比(所指示的V-J组合的出现次数)

Jseg的计数
								B标签	TCRGJ	TCRGJ2	TCRGJP	TCRGJP1	TCRGJP2	#N/A	总计
TCRGV01	17	308	1315	741	822	44	3247
								TCRGV02	630	781	2394	2009	122	65	6001
TCRGV03	250	166	2119	157	1105	51	3848
								TCRGV04	777	37	2031	1490	1443	76	5854
TCRGV05	323	93	2571	716	150	63	3916
								TCRGV05P	294	1161	2946	1552	530	111	6594
TCRGV06	164	1280	1809	401	23	40	3717
								TCRGV07	16	234	1849	1697	93	78	3967
TCRGV08	2523	653	944	170	134	57	4481
								TCRGV09	55	1004	2057	124	228	42	3510
TCRGV10	351	690	814	384	466	36	2741
								TCRGV11	505	648	639	330	181	39	2342
TCRGVA	199	475	112	272	437	12	1507
								TCRGVB	210	20	423	874	917	24	2468
#N/A	77	118	309	150	106	531	1291
								总计	6391	7668	22332	11067	6757	1269	55484

实例2：TCRB V基因扩增偏倚的检测

该实例描述了如何通过如下方式组装通式(I)的689种人TCRB模板寡核苷酸的组：将各50-90个核苷酸的四种单链寡核苷酸拼接在一起产生模板组，所述模板组包含能够扩增人TCRB序列的一组寡核苷酸引物中的所有可能V-J组合的杂交靶标。然后使用所述组的模板寡核苷酸表征一组TCRB V和J扩增引物的相对扩增效率。

通过在标准PCR反应中将四种单链DNA引物“拼接”在一起，合成一组TCRB 689模板寡核苷酸，其含有代表人TCRB链的所有可能有效重排V和J组合的多核苷酸序列。简而言之，为每个TCRB V基因区段设计两种90bp片段(一种处于“正向”取向并且另一种处于“反向”)，为每个TCRB J基因区段设计一种90bp片段(处于“反向”取向)，并且50bp(正向)连接分子被设计为将V和J基因区段连接在一起。总计设计了52种V正向片段和52种V反向片段、13种J反向片段以及689种连接序列。与每种V基因区段对应的两种90bp片段(一种正向，一种反向)具有39bp的互补重叠序列。每种V反向片段的一端具有25bp的与50bp连接分子重叠的互补序列。每种连接序列中剩余的25bp是与J分子一端互补重叠的序列。所述分子被设计成使得互补序列彼此退火并形成双链DNA，Taq聚合酶可结合于所述双链DNA并酶促地延伸所述分子。

用以组装拼接分子的每个PCR反应使用QIAGEN多重PCR预混液(QIAGEN产品编号(part number)206145，加利福尼亚州瓦伦西亚的凯杰公司(Qiagen,Valencia,CA))、10％Q-溶液(Q-solution)(凯杰公司(QIAGEN))、以及四种单链寡核苷酸序列(两种TCRB V、一种TCRB J和一种连接序列，如上文所述)。两种外部分子(一种V正向片段和一种J反向片段)以各自均为1μM的终浓度添加，而两种内部分子(一种V反向片段和所述正向连接序列)各自以0.01μM的终浓度添加。热循环仪条件是：95℃下15分钟，接着是94℃下30秒、59℃下30秒和72℃下1分钟循环35次，然后72℃下10分钟循环1次。合成后，通过LabChip GX^TM毛细管电泳系统(马萨诸塞州霍普金顿的卡利普生命科学公司(Caliper Life Sciences,Inc.,Hopkinton,MA)根据制造商使用说明来定量分子，并且使用Caliper LabChipGX软件计算每个所得条带的浓度(以ng/μl计)。

689种TCRB模板寡核苷酸的所得组的核苷酸序列以SEQ ID NO:872-1560示出。在SEQ ID NO:872-1560中，每种不同的V区序列为一8个核苷酸的独特条形码序列识别，如表7种所示。将所有689种模板归一化为25ng/μl的标准浓度，然后合并。所得库用于本文所述的TCRB测定，以检测689模板寡核苷酸组(SEQ ID NO:872-1560)的扩增过程中TCRB扩增引物的偏倚(非均匀)利用。

689种模板中的每一者以实验上尽可能接近等摩尔浓度存在于模板寡核苷酸库中，并将所述库用作TCRB扩增PCR反应的模板，所述PCR反应使用52种包含Illumina接头相容性序列的TCRB V区引物(SEQ ID NO:1753-1804，表6)的等摩尔混合物，和13种TCRB J区引物(SEQ ID NO:1631-1643，表1)的等摩尔混合物。使用如表1(SEQ ID NO:1631-1695)所示的52种TCRB VβF(正向)引物的等摩尔库(“VF库”)和13种TCRB JβR(反向)引物的等摩尔库(“JR库”)扩增689种模板的库的成员。以1.0μM VF库(每种独特的TCRB VβF引物22nM)、1.0μM JR库(每种独特的TCRB JβR引物77nM)、1μM QIAGEN多重PCR预混液(QIAGEN产品编号206145，加利福尼亚州瓦伦西亚的凯杰公司(Qiagen Corp.,Valencia,CA))、10％Q-溶液(凯杰公司(QIAGEN))和16ng/μL基因组DNA(gDNA)设置聚合酶链式反应(PCR)(各50μL)。在C100热循环仪(美国加利福尼亚州赫拉克勒斯的伯乐实验室公司(Bio-Rad Laboratories,Hercules,CA,USA))中使用下列热循环条件：95℃下15分钟循环一次，94℃下30秒、59℃下30秒和72℃下一分钟循环25至40次，然后72℃下10分钟循环一次。为了对数百万的重排TCRβCDR3基因座进行取样，每文库进行12至20孔的PCR。如上文所指出的，V和J引物包含对应于Illumina测序用接头并与Illumina测序用接头相容的尾部。

在Illumina HiSeq^TM测序仪上对扩增产物定量测序。使用从J分子开始的标准J测序引物(表3)对每种产物分子的60碱基对区进行测序。反应产物中的每种TCRB序列的出现频率示于图2中，从图中可明显看出并非所有TCRB序列已扩增到可比较的程度。

表6：TCRB扩增引物

表7：用于识别SEQ ID NO:872-1560中的TCRB V区的条形码序列

8bp条形码的TCRBV区名称	核苷酸序列	SEQ ID NO
			TCRBV2_8bpBC	CAAGGTCA	SEQ ID NO:6375
TCRBV3-1_8bpBC	TACGTACG	SEQ ID NO:6376
			TCRBV4-1_8bpBC	TACGCGTT	SEQ ID NO:6377
TCRBV4-2_8bpBC	CTCAGTGA	SEQ ID NO:6378
			TCRBV4-3_8bpBC	GTGTCTAC	SEQ ID NO:6379
TCRBV5-1_8bpBC	AGTACCGA	SEQ ID NO:6380
			TCRBV5-3_8bpBC	TTGCCTCA	SEQ ID NO:6381
TCRBV5-4_8bpBC	TCGTTAGC	SEQ ID NO:6382

TCRBV5-5_8bpBC	TGGACATG	SEQ ID NO:6383
			TCRBV5-6_8bpBC	AGGTTGCT	SEQ ID NO:6384
TCRBV5-7_8bpBC	GTACAGTG	SEQ ID NO:6385
			TCRBV5-8_8bpBC	ATCCATGG	SEQ ID NO:6386
TCRBV6-1_8bpBC	TGATGCGA	SEQ ID NO:6387
			TCRBV6-2_8bpBC	GTAGCAGT	SEQ ID NO:6388
TCRBV6-3_8bpBC	GGATCATC	SEQ ID NO:6389
			TCRBV6-4_8bpBC	GTGAACGT	SEQ ID NO:6390
TCRBV6-5_8bpBC	TGTCATCG	SEQ ID NO:6391
			TCRBV6-6_8bpBC	AGGCTTGA	SEQ ID NO:6392
TCRBV6-7_8bpBC	ACACACGT	SEQ ID NO:6393
			TCRBV6-8_8bpBC	TCCACAGT	SEQ ID NO:6394
TCRBV6-9_8bpBC	CAGTCTGT	SEQ ID NO:6395
			TCRBV7-1_8bpBC	TCCATGTG	SEQ ID NO:6396
TCRBV7-2_8bpBC	TCACTGCA	SEQ ID NO:6397
			TCRBV7-3_8bpBC	CAAGTCAC	SEQ ID NO:6398
TCRBV7-4_8bpBC	TAGACGGA	SEQ ID NO:6399
			TCRBV7-6_8bpBC	GAGCGATA	SEQ ID NO:6400
TCRBV7-7_8bpBC	CTCGAGAA	SEQ ID NO:6401
			TCRBV7-8_8bpBC	ATGACACC	SEQ ID NO:6402
TCRBV7-9_8bpBC	CTTCACGA	SEQ ID NO:6403
			TCRBV9_8bpBC	CGTAGAGT	SEQ ID NO:6404
TCRBV10-1_8bpBC	TCGTCGAT	SEQ ID NO:6405
			TCRBV10-2_8bpBC	AGCTAGTG	SEQ ID NO:6406
TCRBV10-3_8bpBC	TGAGACCT	SEQ ID NO:6407
			TCRBV11-1_8bpBC	GATGGCTT	SEQ ID NO:6408
TCRBV11-2_8bpBC	GCATCTGA	SEQ ID NO:6409
			TCRBV11-3_8bpBC	GACACTCT	SEQ ID NO:6410
TCRBV12-3_8bpBC	TGCTACAC	SEQ ID NO:6411
			TCRBV12-4_8bpBC	TCAGCTTG	SEQ ID NO:6412
TCRBV12-5_8bpBC	TTCGGAAC	SEQ ID NO:6413
			TCRBV13_8bpBC	GCAATTCG	SEQ ID NO:6414
TCRBV14_8bpBC	CAAGAGGT	SEQ ID NO:6415
			TCRBV15_8bpBC	GAATGGAC	SEQ ID NO:6416
TCRBV16_8bpBC	AACTGCCA	SEQ ID NO:6417
			TCRBV17p_8bpBC	CCTAGTAG	SEQ ID NO:6418
TCRBV18_8bpBC	CTGACGTT	SEQ ID NO:6419
			TCRBV19_8bpBC	TGCAGACA	SEQ ID NO:6420
TCRBV20-1_8bpBC	AGTTGACC	SEQ ID NO:6421
			TCRBV24-1_8bpBC	GTCTCCTA	SEQ ID NO:6422
TCRBV25-1_8bpBC	CTGCAATC	SEQ ID NO:6423
			TCRBV27-1_8bpBC	TGAGCGAA	SEQ ID NO:6424
TCRBV28_8bpBC	TTGGACTG	SEQ ID NO:6425
			TCRBV29-1_8bpBC	AGCAATCC	SEQ ID NO:6426
TCRBV30_8bpBC	CGAACTAC	SEQ ID NO:6427

使用获得的用于生成如上所述的图2的数据，评估已被设计成退火至特异性V基因区段的每种扩增引物的交叉扩增能力(除基于退火序列互补性而特异性地为其设计引物的V基因区段之外的V基因区段扩增的能力)。制备52种独立的扩增引物库，其中每种引物库具有以等摩尔浓度合并的表6中的52种TCRB V区引物中的51种，并且第52种TCRB V区引物在所述库中以两倍于其他51种引物的摩尔浓度存在。制备单独的扩增引物库，使得针对52种V区引物中的每一者均存在一个库，在所述库中单种引物以两倍于其他引物的浓度存在，从而得到52种独特的引物库。随后设置52种单独的扩增反应，针对独特扩增引物库中的每一者设置一种，每种反应使用上述组的689种模板寡核苷酸(SEQ ID NO:872-1560)。模板寡核苷酸相对于彼此以等摩尔浓度存在。使用上述条件进行扩增和测序。结果示于图3中。

在图3中，黑色方块指示在使用以相对于等摩尔浓度的所有其他引物的2倍浓度存在的相应指示的TCRB V区特异性引物时扩增水平没有变化。白色方块指示扩增的10倍增加；灰色方块指示0与10倍之间的扩增的中间程度(呈现灰度级梯度)。对角线指示就受测试的大多数TCRB V区引物而言，给定引物的摩尔浓度加倍导致具有特异性退火靶序列的相应模板寡核苷酸的扩增的约10倍增加。非对角白色方块指示某些引物能够对其退火和扩增的非对应模板。

在一种或多种引物表现出显著大于或小于扩增潜能的可接受范围(例如，指定的均一扩增潜能范围)的扩增潜能的情况下，进行对单独的引物寡核苷酸浓度的进一步调节以及对模板扩增和定量测序步骤的重复，直到每种物质的产物分子均存在于所需的范围内，所述范围指示对扩增引物组内的引物间的非均一扩增潜能的修正。

因此，如表6中所指出的那样调节引物浓度，以便确定在图2和图3中明显看出的偏倚扩增结果是否能够通过分别增加或减少高效或低效扩增引物的相对存在而强烈降低。对于使用经调节引物组的多重PCR，V基因引物序列保持相同(在表6中报告的序列)，然而，如果引物对其模板的扩增不足，则每种引物的相对浓度增加(图3)；或如果引物对其模板的扩增过度，则每种引物的相对浓度减小(图3)。随后在PCR中使用扩增引物的经调节混合物以扩增模板组合物，所述模板组合物含有等摩尔量的用于生成图2和图3中的数据的所述689模板寡核苷酸组(SEQ ID NO:872-1560)。

如上所述执行扩增和定量测序，结果示于图4中，所述图将在所有扩增引物以等摩尔浓度存在时获得包含每种所指示的经扩增V区序列的产物的频率(黑条)与在将扩增引物的浓度调节至如表6中所指示的浓度之后获得的每种此类产物的频率(灰条)进行比较。

另外的hs-TCRB引物序列见于SEQ ID NO.6192-6264。

实例3：修正TCR扩增寡核苷酸引物组中的非均一扩增潜能(PCR偏倚)

设计多样的TCR扩增引物以扩增生物样品中的重排TCR V和J基因区段的每种可能组合，所述生物样品含有来自受试者的淋巴样细胞DNA。在多重PCR中使用含有等摩尔浓度的多样扩增引物的制备物以扩增多样模板组合物，所述组合物包含等摩尔浓度的根据式(I)的TCR特异性模板寡核苷酸，所述TCR特异性模板寡核苷酸具有至少一种代表TCR基因座的每种可能的V-J组合的模板。对扩增产物进行定量测序，并由独特识别每种V-J组合的每种16bp分子条形码序列(式(I)中的B)的出现频率获得每种独特V-J产物序列的出现频率。

对于TCRG，使用TCRG V-和J-特异性引物(SEQ ID NO:1732-1745，表4)扩增TCRG模板寡核苷酸(SEQ ID NO:1561-1630)。通过用五种J基因区段特异性引物的库单独地扩增八种TCRG V基因区段特异性引物中的每一者来识别分别成对的V引物的J引物独立性。在Illumina HiSeq^TM测序平台上对扩增产物进行定量测序，并且独特识别特异性V-J组合的内部16bp条形码序列(B)的出现频率允许对每种V-J对进行定量。通过执行逆反应，即通过用八种V基因区段特异性引物的库单独地扩增五种TCRG J基因区段引物中的每一者，来识别分别成对的J引物的V引物独立性。

为了测试TCRG V引物或J引物是否交叉扩增(例如，基因区段特异性引物是否非特异性地扩增(例如)以测试被特异性设计为扩增TCRG V7区段的V引物是否能够扩增TCRG V6和TCRG V7V基因区段两者)，生成了独立引物库，所述独立引物库含有等摩尔浓度的除了所述引物中一者之外的所有引物，并且随后将被省掉的引物以所有其他引物的两倍的摩尔浓度添加到所述库中。随后使用引物，使用分别在如本文所述通式(I)中的V和J多核苷酸中的TCRG V和J基因序列，对模板组合物进行扩增，所述模板组合物包含多种由通式(I)表示的模板寡核苷酸。定量测序揭示在单种扩增引物以引物库中所有其他引物的两倍浓度存在时在扩增产物间占比过高的任何一种或多种模板的种类。随后调节引物混合物以增加或减小一种或多种引物的相对浓度，从而获得在多轮迭代中处于可接受定量容差内的扩增频率。这样获得的经调节引物混合物被视为已进行了修正以降低引物组的成员间的非均一扩增潜能。

为了确定经修正的引物混合物在用于扩增来自受试者淋巴样细胞的生物样品中的重排TCR模板DNA时是否呈现无偏倚的扩增潜能，将如本文所述的人工模板组合物制备为所有VJ对以类似频率存在，且某些VJ对具有不同比率的相对占比。将每种类型的模板制备物作为扩增引物组的扩增模板单独测试，所述扩增引物组已进行了修正以降低引物组的某些成员间的非均一扩增潜能。对扩增产物的定量序列测定确定了特异性序列在模板制备物中的相对定量占比在特异性序列于扩增产物间的相对定量占比中得以反映。

作为上述迭代过程的替代，或除了其后是定量测序的此类迭代扩增步骤之外，还能够通过计算修正扩增偏倚。根据该计算方法，合成模板组合物中的模板寡核苷酸序列物质中的每一者的起始频率是已知的。通过定量测序来确定在PCR扩增后所获得的扩增产物间的寡核苷酸序列的这些物质中的每一者的频率。在PCR扩增之前模板寡核苷酸序列的相对频率与在PCR扩增之后它们的频率之间的差异为“PCR偏倚”。该差异为在扩增期间例如由于各种扩增引物间的扩增效率不同而引入的扩增偏倚。

如针对每种已知模板寡核苷酸序列所定量地测定，使用每种引物的PCR偏倚来计算扩增偏倚(归一化)因子，通过所述因子对观察到的每种扩增产物的频率进行修正以反映各自模板序列在模板组合物中的实际频率。如果使用本发明的模板组合物凭经验检测到扩增引物组的PCR偏倚在因子10以内，则在使用相同的扩增引物组对未知组合物DNA样品进行扩增时可通过计算修正所获得的扩增产物中的偏倚。由此获得了在对DNA样品中的模板物质进行定量过程中的改善准确性。

因为V和J引物凭经验进行测试并显示为独立的，所以可针对每种V物质并针对每种J物质推导出扩增偏倚因子，且每种VJ物质对的扩增因子是不必要的。因此，使用本发明的模板组合物导出针对每种V物质和J物质的扩增偏倚因子。通过本发明的方法，在PCR扩增之前模板组合物中的V和J基因序列的频率是已知的(或可基于对如所合成的模板组合物中的每种模板寡核苷酸物质的浓度的了解而计算)。在PCR扩增之后，使用定量测序来检测扩增产物中每种V和J基因区段序列的频率。对于每种序列，基因区段频率的差异为扩增偏倚：

初始频率/最终频率＝扩增偏倚因子

针对每种V基因区段和每种J基因区段计算扩增偏倚因子。一旦计算出这些扩增因子，就可将其应用于V和J基因的起始频率对于其而言是未知的样品。

在混合的模板群体(如从包含来自淋巴样细胞的DNA的生物源获得的复杂DNA样品，假定所述淋巴样细胞包含重排的适应性免疫受体编码DNA；或另外包含来自缺乏此类重排的其他细胞的DNA的复杂DNA样品)中，在每种V和J基因区段的起始频率未知的情况下，可使用已使用本发明的模板组合物进行表征的引物组的所计算扩增因子来修正残余的PCR扩增偏倚。对于所测序扩增产物分子的每一物质，基于序列相似性确定分子所使用的V和J基因。要修正扩增偏倚，将对分子进行测序的次数乘以修正V扩增因子和J扩增因子两者。所得的序列计数为通过计算“归一化的”组。

实例4：生成另外的模板组合物

另外的模板组合物基本上根据上述方法设计和制备。

V和J多核苷酸。生成了TCRB V和J多核苷酸序列以包含在本文所述的多种模板寡核苷酸中，并且所述TCRB V和J多核苷酸序列分别在68组TCRB V和J SEQ ID NO的组中示出，如在图5a-5l中作为TCRB V/J组1、TCRB V/J组2、TCRB V/J组3、TCRB V/J组4、TCRB V/J组5、TCRB V/J组6、TCRB V/J组7、TCRB V/J组8、TCRB V/J组9、TCRB V/J组10、TCRB V/J组11、TCRB V/J组12和TCRB V/J组13所示出的。

生成了TCRG V和J多核苷酸序列以包含在本文所述的多种模板寡核苷酸中，并且所述TCRG V和J多核苷酸序列分别在14组TCRG V和J SEQID NO的组中示出，如在图6a-6b中作为TCRG V/J组1、TCRG V/J组2、TCRG V/J组3、TCRG V/J组4和TCRG V/J组5所示出的。

生成了IGH V和J多核苷酸序列以包含在本文所述的多种模板寡核苷酸中，并且所述IGH V和J多核苷酸序列分别在127组IGH V和J SEQ ID NO的组中示出，如在图7a-7m中作为IGH V/J组1、IGH V/J组2、IGH V/J组3、IGH V/J组4、IGH V/J组5、IGH V/J组6、IGH V/J组7、IGH V/J组8和IGH V/J组9所示出的。

模板组合物。制备模板组合物，用于使TCRB扩增引物组的扩增效率标准化。所述组合物包含具有多种由通式(I)表示的寡核苷酸序列的多种模板寡核苷酸。包含858种不同模板寡核苷酸的TCRB模板组合物在序列表中以SEQ ID NO:3157-4014公开。

制备模板组合物，用于使TCRG扩增引物组的扩增效率标准化。所述组合物包含具有多种由通式(I)表示的寡核苷酸序列的多种模板寡核苷酸。包含70种不同模板寡核苷酸的TCRG模板组合物在序列表中以SEQ IDNO:4015-4084公开。

制备模板组合物，用于使IGH扩增引物组的扩增效率标准化。所述组合物包含具有多种由通式(I)表示的寡核苷酸序列的多种模板寡核苷酸。包含1116种不同模板寡核苷酸的IGH模板组合物在序列表中以SEQ ID NO:4085-5200公开。包含一组1116种模板寡核苷酸的IGH模板组合物还在序列表中以SEQ ID NO:1805-2920公开。

实例5：使用模板组合物测定扩增因子

该实例描述了在含有B细胞和成纤维细胞DNA的DNA样品的多重PCR扩增中使用本发明所述的模板寡核苷酸组合物作为“加标”合成模板，来对编码多种IG分子的重排DNA分子进行定量。

生物模板DNA：使用八份生物样品作为模板DNA的来源，其中每份生物样品含有相同量300ng的总基因组DNA(gDNA)，但(i)从B细胞提取的DNA与(ii)从人成纤维细胞提取的DNA的比例不同，所述人成纤维细胞为其中IG和TCR编码基因不重排的细胞类型。所述样品含有0、0.07、0.3、1、4、18、75或300ng B细胞gDNA，其中成纤维细胞gDNA是每种300nggDNA制备物的余量。制备每种样品的四份重复样。

合成的模板DNA：向每个PCR反应(如下)添加来自寡核苷酸模板组合物的5000个分子(每种序列4-5个分子)，所述寡核苷酸模板组合物包含1116种合成的IGH模板寡核苷酸分子(SEQ ID NO:4085-5200)的库。包含一组1116种模板寡核苷酸的IGH模板组合物还在序列表中作为SEQ IDNO:1805-2920公开。

PCR反应：PCR反应使用凯杰公司(QIAGEN)Multiplex Plus^TMPCR预混液(凯杰公司产品编号206152，加利福尼亚州瓦伦西亚凯杰公司(Qiagen,Valencia,CA))、10％Q-溶液(凯杰公司)和300ng生物模板DNA(上文所述)。添加合并的扩增引物，使得最终反应具有2μM的聚集体正向引物浓度和2μM的聚集体反向引物浓度。正向引物(SEQ ID NO:5201-5286)包括86种引物，这些引物在3'端处具有退火至IGH V区段编码序列的一大约20bp的区段并且在5'端处具有一大约20bp的通用引物pGEXf。反向引物(SEQ ID NO:5287-5293)包括J区段特异性引物的聚集体，所述J区段特异性引物在3'端处具有退火至IGH J区段编码序列的一大约20bp的区段，并且通用引物pGEXr位于J引物的5'端处。在C100热循环仪(美国加利福尼亚州赫拉克勒斯的伯乐实验室公司(Bio-Rad Laboratories,Hercules,CA,USA))中使用下列热循环条件：95℃下10分钟循环一次，94℃下30秒、63℃下30秒和72℃下一分钟循环30次，然后72℃下10分钟循环一次。每个反应一式四份地进行。

为了进行测序，在七个循环的PCR反应中将还包含8bp标签和6bp随机核苷酸组的Illumina接头(加利福利亚圣地亚哥的亿明达有限公司(Illumina Inc.,San Diego,CA))掺入到PCR反应产物的末端上。PCR试剂和条件如上所述，不同的是热循环条件，其为：95℃下5分钟，接着在95℃下30秒、68℃下90秒和72℃下30秒循环7次。在热循环之后，将反应保持在72℃下10分钟，并且引物为Illumina接头加尾引物(SEQ ID NO:5387-5578)。使用Illumina_PE_RD2引物在Illumina MiSEQ^TM测序仪上对样品测序。

结果：获得每份样品的序列数据，并且通过条形码寡核苷酸序列的存在来识别合成模板的扩增产物。对于每份样品，将模板产物的数量除以独特合成模板寡核苷酸序列的数量(1116)，得出样品的扩增因子。随后将每份品的生物模板的扩增产物总数量除以所述扩增因子来计算起始扩增反应中重排生物模板分子(如，VDJ重组)的数量，作为对独特B细胞基因组模板数量的估算。将具有标准偏差的平均值针对基于B细胞输入的重排生物模板分子的已知数量绘图(图9)。在图9中，点代表平均扩增因子，条代表整个四份重复样的标准偏差。使用如本文所述计算的扩增因子来估算VJ重排IG编码分子的数量(作为B细胞数量的代用值)产生了与至少低至100个B细胞的输入的已知B细胞数量相符的测定值。所估算的扩增因子值与观察到的扩增因子高度相关(图9，R²＝0.9988)。

实例6：IgH、IgL和IgK偏倚控制模板

IgH VJ模板寡核苷酸

在一个实施例中，生成并分析IgH VJ模板寡核苷酸。使用人的IgH V和J多核苷酸序列设计一组1134种由通式(I)表示的模板寡核苷酸。每种模板寡核苷酸由495碱基对DNA分子组成。IgH模板的1134-寡核苷酸组的细节具有代表性并且如下。

基于之前测定的基因组序列，人IgH基因座显示含有各自具有RSS序列的126个Vh区段，因此被视为有能力重排。这些126个Vh区段包含已知能被表达的52个基因区段、被归类为具有开放阅读框的5个V区段、以及69个V假基因。将Vh基因区段连接至9个Jh基因区段。为了包括126个V和9个J区段的所有可能V+J基因组合，设计代表所有可能VJ组合的1134(9×126)种模板。每种模板符合通式(I)(5'-U1-B1-V-B2-R-J-B4-U2-3')(图1)，从而包括九个部分，即19碱基对(bp)通用接头(U1)；16bp核苷酸标签(B1)，其独特识别V基因和J基因区段的每种成对组合；300bp的V基因特异性序列(V)；3bp终止密码子(S)；另一拷贝的16bp核苷酸标签(B2)；所有分子共有的6bp接合部标签(R)；不存在B3；100bp的J基因特异性序列(J)；第三拷贝的16bp核苷酸标签(B4)；以及19bp的通用接头序列(U2)。两个V区段与另两个V区段的核苷酸相同，因此不对其进行排序。这将所包含区段的数量从1134减少至1116。包含1116种不同模板寡核苷酸的IGH模板组合物在序列表中以SEQ ID NO:4085-5200公开。

使用被设计成退火至通用接头序列(U1,U2)的寡核苷酸引物单独地扩增所述1116种模板中的每一者。这些寡核苷酸序列可以是任何通用引物。对于本申请，使用通用引物编码的Nextera。

表8：包括在偏倚控制模板中的通用引物序列

引物名称	引物序列	SEQ ID NO
			pGEXF	GGGCTGGCAAGCCACGTTTGGTG	SEQ ID NO:6428
pGEXR	CCGGGAGCTGCATGTGTCAGAGG	SEQ ID NO:6429

通用引物序列可退火至本文所公开的任何引物序列。下面示出了包含通用引物序列的PCR引物的例子：

表9：具有通用序列(黑体且带下划线)的示例性IGH PCR引物

使用LabChip GX^TM毛细管电泳系统(马萨诸塞州霍普金顿的卡利普生命科学公司(Caliper Life Sciences,Inc.,Hopkinton,MA)根据制造商使用说明来定量每种扩增模板寡核苷酸产物的所得浓度。将1116种扩增模板寡核苷酸制备物归一化为标准浓度，然后合并。

为验证所有1116种模板寡核苷酸以基本上等摩尔浓度存在，使用Illumina MiSeq^TM测序平台根据制造商推荐，对所述库测序。为将平台特异性寡核苷酸序列掺入合并的模板寡核苷酸中，设计了加尾引物，所述加尾引物退火至通用引发位点(U1,U2)并且具有如5'端的Illumina^TM接头序列尾部。然后进行七个循环的PCR反应以将Illumina接头退火至模板寡核苷酸。然后使用XP微珠(加利福尼亚州富勒顿的贝克曼库尔特公司(Beckman Coulter,Inc.,Fullerton,CA))在由制造商所推荐的条件下纯化PCR反应产物混合物。使用Illumina MiSEQ^TM测序仪(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))对PCR反应产物开始的29bp测序，并通过评估每种16bp分子条形码标签(B1)的频率进行分析。

计算1116种不同模板寡核苷酸的组的基本上等摩尔的制备物以使得含有大约0.09％的所述组的每个成员，并且希望所有物质的阈值容差为加上或减去十倍频率(0.009％-0.9％)。定量测序表明初始库内的1116种接头修饰的模板寡核苷酸物质占比不均匀。

因此，进行单独模板寡核苷酸浓度的调节和定量测序步骤的重复，直到每种分子在阈值容差浓度(0.009–0.9％)内存在。

IgH DJ模板寡核苷酸

在另一个实施例中，生成并分析IgH DJ模板寡核苷酸。使用人的IgHD和J多核苷酸序列设计一组243种由通式(I)表示的模板寡核苷酸。每种模板寡核苷酸由一382碱基对DNA分子组成。IgH DJ模板寡核苷酸序列以SEQ ID NO:5579-5821示出。IgH模板的243-寡核苷酸组的细节具有代表性并且如下。

基于先前测定的基因组序列，人的IgH基因座显示为含有27个Dh区段。将27个Dh基因区段连接至9个Jh基因区段。为了包括27个D和9个J区段的所有可能D+J基因组合，设计代表所有可能DJ组合的243(9×27)种模板。每种模板符合通式(I)(5'-U1-B1-V-B2-R-J-B4-U2-3')(图1)，从而包括九个部分，即19碱基对(bp)通用接头(U1)；16bp核苷酸标签(B1)，其独特识别D基因和J基因区段的每种成对组合。然而，对于这些分子，将300bpV基因特异性序列(V)替换为182bp的D基因特异性序列的区段。该区段包含外显子核苷酸区段和内含子核苷酸区段两者。与其他分子类似，这些分子包括一3碱基对(bp)终止密码子(S)；另一拷贝的16bp核苷酸标签(B2)；所有分子共有的6bp接合部标签(R)；不存在B3；100bp的J基因特异性序列(J)；第三拷贝的16bp核苷酸标签(B4)；以及19bp通用接头序列(U2)。

使用被设计成退火至通用接头序列(U1,U2；参见表8)的寡核苷酸引物单独地扩增所述243种模板(SEQ ID NO:5579-5821)中的每一者。这些寡核苷酸序列可以是任何通用引物；对于本申请，使用通用引物编码的Nextera。

表10中示出了具有通用接头序列的PCR引物的例子。

表10：具有通用序列(黑体且带下划线)的示例性IgH DJ PCR引物

使用LabChip GX^TM毛细管电泳系统(马萨诸塞州霍普金顿的卡利普生命科学公司(Caliper Life Sciences,Inc.,Hopkinton,MA)根据制造商使用说明来定量每种扩增模板寡核苷酸产物的所得浓度。将243种扩增模板寡核苷酸制备物归一化为标准浓度，然后合并。

为验证所有243种模板寡核苷酸以基本上等摩尔浓度存在，使用Illumina MiSeq^TM测序平台根据制造商推荐，对所述库测序。为将平台特异性寡核苷酸序列掺入合并的模板寡核苷酸中，设计了加尾引物，所述加尾引物退火至通用引发位点(U1,U2)并且具有如5'端的Illumina^TM接头序列尾部。然后进行七个循环的PCR反应以将Illumina接头退火至模板寡核苷酸。然后使用XP微珠(加利福尼亚州富勒顿的贝克曼库尔特公司(Beckman Coulter,Inc.,Fullerton,CA))在由制造商所推荐的条件下纯化PCR反应产物混合物。使用Illumina MiSEQ^TM测序仪(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))对PCR反应产物开始的29bp测序，并通过评估每种16bp分子条形码标签(B1)的频率进行分析。

计算243种不同模板寡核苷酸的组的基本上等摩尔的制备物以使得含有大约0.4％的所述组的每个成员，并且希望所有物质的阈值容差为加上或减去十倍频率(0.04％-4.0％)。定量测序表明初始库内的243种接头修饰的模板寡核苷酸物质占比不均匀。

因此，进行单独模板寡核苷酸浓度的调节和定量测序步骤的重复，直到每种分子在阈值容差浓度(0.04–4.0％)内存在。在归一化后，将该组与1116IgH VJ偏倚控制组组合，以获得1359种模板的库。

图10示出了1116种IGH VJ偏倚控制分子和243种IGH DJ偏倚控制分子中的每一者的PCR扩增前测序计数的结果。各偏倚控制分子均沿x轴。所述组包括1116种IGH VJ偏倚控制分子和243种IGH DJ偏倚控制分子，总共1359个gblock。Y轴为每个单独gblock的序列计数。该计算提供对组合物的每个VJ对的扩增前占比的定量。使用该数据估算PCR扩增前样品与PCR扩增后样品之间的频率变化，以计算引物所引入的扩增偏倚。

IgL VJ模板寡核苷酸

在另一个实施例中，生成并分析IgL VJ模板寡核苷酸。使用人的IgL V和J多核苷酸序列设计一组245种由通式(I)表示的模板寡核苷酸。每种模板寡核苷酸由495碱基对DNA分子组成。IgL模板寡核苷酸以SEQ ID NO:5822-6066示出。IgL模板的245-寡核苷酸组的细节具有代表性并且如下。

基于之前测定的基因组序列，人IgL基因座显示出含有各自具有RSS序列的75个VL区段，因此被视为有能力重排。这些VL区段包括33个已知能被表达的基因区段、被归类为具有开放阅读框的5个V区段、以及37个V假基因。将VL基因区段连接至五个6JL基因区段。为了包括33个功能性V区段和6个J区段的所有可能的功能性且经表达的V+J基因组合，设计了代表所有可能的表达的VJ组合的204(6×33)种模板。此外，V假基因中的两个是可疑的；设计另外12(2×6)种VJ模板，得到总共216种模板。每种模板符合通式(I)(5'-U1-B1-V-B2-R-J-B4-U2-3')(图1)，从而包括九个部分，即19碱基对(bp)通用接头(U1)；16bp核苷酸标签(B1)，其独特识别V基因和J基因区段的每种成对组合；300bp的V基因特异性序列(V)；3bp终止密码子(S)；另一拷贝的16bp核苷酸标签(B2)；所有分子共有的6bp接合部标签(R)；不存在B3；100bp的J基因特异性序列(J)；第三拷贝的16bp核苷酸标签(B4)；以及19bp的通用接头序列(U2)。

使用被设计成退火至通用接头序列(U1,U2)的寡核苷酸引物单独地扩增所述216种模板中的每一者。这些寡核苷酸序列可以是任何通用引物；对于本申请，使用通用引物编码的Nextera。

使用LabChip GX^TM毛细管电泳系统(马萨诸塞州霍普金顿的卡利普生命科学公司(Caliper Life Sciences,Inc.,Hopkinton,MA)根据制造商使用说明来定量每种扩增模板寡核苷酸产物的所得浓度。将216种扩增模板寡核苷酸制备物归一化为标准浓度，然后合并。

为验证所有216种模板寡核苷酸以基本上等摩尔浓度存在，使用Illumina MiSeq^TM测序平台根据制造商推荐，对所述库进行测序。为将平台特异性寡核苷酸序列掺入合并的模板寡核苷酸中，设计了加尾引物，所述加尾引物退火至通用引发位点(U1,U2)并且具有如5'端的Illumina^TM接头序列尾部。然后进行七个循环的PCR反应以将Illumina接头退火至模板寡核苷酸。然后使用XP微珠(加利福尼亚州富勒顿的贝克曼库尔特公司(Beckman Coulter,Inc.,Fullerton,CA))在由制造商所推荐的条件下纯化PCR反应产物混合物。使用Illumina MiSEQ^TM测序仪(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))对PCR反应产物开始的29bp测序，并通过评估每种16bp分子条形码标签(B1)的频率进行分析。

计算216种不同模板寡核苷酸的组的基本上等摩尔的制备物以使得含有大约0.46％的所述组的每个成员，并且希望所有物质的阈值容差为加上或减去十倍频率(0.046％-4.6％)。定量测序表明初始库内的216种接头修饰的模板寡核苷酸物质占比均匀。

IgK VJ模板寡核苷酸

在一个实施例中，生成并分析IgK VJ模板寡核苷酸。使用人的IgK V和J多核苷酸序列设计一组560种由通式(I)表示的模板寡核苷酸。每种模板寡核苷酸由495碱基对DNA分子组成。IgK模板寡核苷酸的例子见于SEQID NO:6067-6191。IgK模板的560-寡核苷酸组的细节具有代表性并且如下。

基于之前测定的基因组序列，人IgK基因座显示出含有各自具有RSS序列的112个Vk区段，因此被视为有能力重排。这些112个Vk区段包含已知能被表达的46个基因区段、被归类为具有开放阅读框的8个V区段、以及50个V假基因。对于该IgK，仅分析表达的IgK VJ重排。将归类为假基因的基因和开放阅读框排除在外。将Vk基因区段连接至五个Jk基因区段。这留下了230(46×5)种VJ基因重排。为了包括46个功能性V区段和5个J区段的所有可能的功能性V+J基因组合，设计了代表所有可能的VJ组合的230(5×46)种模板。每种模板符合通式(I)(5'-U1-B1-V-B2-R-J-B4-U2-3')(图1)，从而包括九个部分，即19碱基对(bp)通用接头(U1)；16bp核苷酸标签(B1)，其独特识别V基因和J基因区段的每种成对组合；300bp的V基因特异性序列(V)；3bp终止密码子(S)；另一拷贝的16bp核苷酸标签(B2)；所有分子共有的6bp接合部标签(R)；不存在B3；100bp的J基因特异性序列(J)；第三拷贝的16bp核苷酸标签(B4)；以及19bp通用接头序列(U2)。

使用被设计成退火至通用接头序列(U1,U2)的寡核苷酸引物单独地扩增所述230种模板中的每一者。这些寡核苷酸序列可以是任何通用引物—对于本申请，使用通用引物编码的Nextera。

使用LabChip GX^TM毛细管电泳系统(马萨诸塞州霍普金顿的卡利普生命科学公司(Caliper Life Sciences,Inc.,Hopkinton,MA)根据制造商使用说明来定量每种扩增模板寡核苷酸产物的所得浓度。将230种扩增模板寡核苷酸制备物归一化为标准浓度，然后合并。

为验证所有230种模板寡核苷酸以基本上等摩尔浓度存在，使用Illumina MiSeq^TM测序平台根据制造商推荐，对所述库测序。简而言之，为将平台特异性寡核苷酸序列掺入合并的模板寡核苷酸中，设计了加尾引物，所述加尾引物退火至通用引发位点(U1,U2)并且具有如5'端的Illumina^TM接头序列尾部。然后进行七个循环的PCR反应以将Illumina接头退火至模板寡核苷酸。然后使用XP微珠(加利福尼亚州富勒顿的贝克曼库尔特公司(Beckman Coulter,Inc.,Fullerton,CA))在由制造商所推荐的条件下纯化PCR反应产物混合物。使用Illumina MiSEQ^TM测序仪(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))对PCR反应产物开始的29bp测序，并通过评估每种16bp分子条形码标签(B1)的频率进行分析。

计算230种不同模板寡核苷酸的组的基本上等摩尔的制备物以使得含有大约0.4％的所述组的每个成员，并且希望所有物质的阈值容差为加上或减去十倍频率(4.0％-0.04％)。定量测序表明初始库内的230种接头修饰的模板寡核苷酸物质占比均匀。

实例7：组合测定法

IgH DJ和IgH VJ组合测定法

在一些实施例中，期望对重排的IgH VDJ CDR3链和重排的IgH DJ链进行共同的扩增和测序。使用IgH DJ和IgH VJ模板生成模板库，以测试组合的IgH DJ和IgH VJ测定法。当合并时，最终库包括1116种VJ模板和243种DJ模板，得到总共1359种单独模板。包含1116种不同模板寡核苷酸的IgH VJ模板组合物在序列表中以SEQ ID NO:4085-5200公开。IgH DJ模板寡核苷酸序列以SEQ ID NO:5579-5821示出。

为验证所有1359种模板寡核苷酸以基本上等摩尔浓度存在，使用Illumina MiSeq^TM测序平台根据制造商推荐，对所述库测序。为将平台特异性寡核苷酸序列掺入合并的模板寡核苷酸中，设计了加尾引物，所述加尾引物退火至通用引发位点(U1,U2)并且具有如5'端的Illumina^TM接头序列尾部。然后进行七个循环的PCR反应以将Illumina接头退火至模板寡核苷酸。然后使用XP微珠(加利福尼亚州富勒顿的贝克曼库尔特公司(Beckman Coulter,Inc.,Fullerton,CA))在由制造商所推荐的条件下纯化PCR反应产物混合物。使用Illumina MiSEQ^TM测序仪(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))对PCR反应产物开始的29bp测序，并通过评估每种16bp分子条形码标签(B1)的频率进行分析。

计算1359种不同模板寡核苷酸的组的基本上等摩尔的制备物以使得含有大约0.073％的所述组的每个成员，并且希望所有物质的阈值容差为加上或减去十倍频率(0.73％-0.0073％)。定量测序表明初始库内的1359种接头修饰的模板寡核苷酸物质占比均匀。

IgL和IgK组合测定

在其他实施例中，期望对重排的IgL和IgK重排CDR3链进行共同扩增和测序。生成模板库以测试组合的IgL和IgK测定法(将IgL和IgK模板组合)。当合并时，最终库包括216种IgL模板和230种IgK模板，总计446种单独模板。IgL模板寡核苷酸以SEQ ID NO:5822-6066示出。

为验证所有446种模板寡核苷酸以基本上等摩尔浓度存在，使用Illumina MiSeq^TM测序平台根据制造商推荐，对所述库测序。简而言之，为将平台特异性寡核苷酸序列掺入合并的模板寡核苷酸中，设计了加尾引物，所述加尾引物退火至通用引发位点(U1,U2)并且具有如5'端的Illumina^TM接头序列尾部。然后进行七个循环的PCR反应以将Illumina接头退火至模板寡核苷酸。然后使用XP微珠(加利福尼亚州富勒顿的贝克曼库尔特公司(Beckman Coulter,Inc.,Fullerton,CA))在由制造商所推荐的条件下纯化PCR反应产物混合物。使用Illumina MiSEQ^TM测序仪(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))对PCR反应产物开始的29bp测序，并通过评估每种16bp分子条形码标签(B1)的频率进行分析。

计算446种不同模板寡核苷酸的组的基本上等摩尔的制备物以使得含有大约0.22％的所述组的每个成员，并且希望所有物质的阈值容差为加上或减去十倍频率(2.2％-0.022％)。定量测序表明初始库内的446种接头修饰的模板寡核苷酸物质占比均匀。

实例8：修正IGH扩增寡核苷酸引物组中的非均一扩增潜能(PCR偏倚)

设计多样的IgH扩增引物来扩增生物样品中的重排IgH V和J基因区段的每种可能的组合，所述生物样品含有来自受试者的淋巴样细胞DNA。在多重PCR中使用含有等摩尔浓度的多样扩增引物的制备物以扩增多样模板组合物，所述组合物包含等摩尔浓度的根据式(I)的IgH特异性模板寡核苷酸，所述IgH特异性模板寡核苷酸具有至少一种代表IgH基因座的每种可能的V-J组合的模板。对扩增产物进行定量测序，并由独特识别每种V-J组合的每种16bp分子条形码序列(式(I)中的B)的出现频率获得每种独特V-J产物序列的出现频率。

将多重PCR反应设计成扩增IgH基因座的所有可能的V和J基因重排，如通过IMGT合作所标注。参见Yousfi Monod M,Giudicelli V,ChaumeD,Lefranc.MP.IMGT/JunctionAnalysis:the first tool for the analysis of theimmunoglobulin and T cell receptor complex V-J and V-D-J JUNCTIONs.Bioinformatics.2004；20(suppl 1):i379-i385(Yousfi Monod M、Giudicelli V、Chaume D、Lefranc.MP，“IMGT/结合部分析：对免疫球蛋白和T细胞受体的复杂V-J和V-D-J接合部进行分析的第一工具”，《生物信息学》，2004年，第20卷(增刊1)，第i379-i385页)。基因座包括126个独特的V基因；52个功能基因、缺乏对功能关键的氨基酸的6个推定的开放阅读框和69个假基因；以及9个J基因、6个功能基因和3个假基因。对于一些V区段，用于引物退火的靶序列是相同的，从而允许用86种独特正向引物扩增所有126个V区段。相似地，7种独特反向引物退火至所有9个J基因。使用86种V正向引物(VF；对于V基因具有特异性)的等摩尔库和7种J反向引物(JR；对于J基因具有特异性)的等摩尔库扩增1116种模板的库，作为偏倚评估的基线。

以2.0μM VF、2.0μM JR库(集成DNA技术公司(Integrated DNATechnologies))、1μM QIAGEN Multiplex Plus PCR预混液(加利福尼亚州瓦伦西亚的凯杰公司(QIAGEN,Valencia,CA))、10％Q-溶液(凯杰公司(QIAGEN))和来自我们的合成IgH组库混合物的200,000个靶分子设置聚合酶链式反应(PCR)(各25μL)。在C100热循环仪(加利福尼亚州赫拉克勒斯的伯乐实验室公司(Bio-Rad Laboratories,Hercules,CA))中使用下列热循环条件：95℃下6分钟循环一次，95℃下30秒、64℃下120秒和72℃下90秒循环31次，然后72℃下3分钟循环一次。对于所有实验，将每种PCR条件重复三次。

在初始的偏倚评估后，进行实验以限定所有单独的引物扩增特性。为了测定VF和JR引物的特异性，制备含有单种VF引物与所有JR引物的86种混合物，以及含有单种JR引物与所有VF引物的7种混合物。使用这些引物组来扩增合成模板，并对所得文库进行测序，以便测量每种引物就靶标V或J基因区段而言的特异性，以及以便识别非靶标引发的情况。在所有其他等摩尔引物的环境中使用2倍和4倍浓度的每个单独的VF或JF的库(如，2x倍IgHV1-01+所有其他等摩尔VF和JR引物)执行滴定实验，以估算使引物浓度与观察到的模板频率相关的比例因子。

引物混合物优化

使用通过滴定引物(每次一种)导出的比例因子，开发出替代引物混合物，其中引物以不均匀的浓度组合以将扩增偏倚降至最低。随后使用改进的引物混合物来扩增模板库并测量残余扩增偏倚。重复迭代进行该过程，从而基于被该引物扩增的模板在上一轮的结果中是占比过高还是占比过低而适当地降低或增加每种引物浓度。在该迭代过程的每个阶段，通过计算动态范围(最大偏倚/最小偏倚)以及平方和(SS，基于log(偏倚)值计算)的量度来测定扩增偏倚的总程度，并且迭代进行调节引物浓度的过程，直到在迭代之间存在最低限度的改善。为了由等摩尔模板输入评估最终优化引物混合物的稳健性以及偏差的比例因子，我们使用IgH参考模板的高度不均匀混合物来测定对测序输出的影响。最终混合物显著优于等摩尔混合物。

实例9：修正TCRB扩增寡核苷酸引物组中的非均一扩增潜能(PCR偏倚)

设计多样的TCRB扩增引物来扩增生物样品中的重排TCRB V和J基因区段的每种可能的组合，所述生物样品含有来自受试者的淋巴样细胞DNA。在多重PCR中使用含有等摩尔浓度的多样扩增引物的制备物以扩增多样模板组合物，所述组合物包含等摩尔浓度的根据式(I)的TCRB特异性模板寡核苷酸，所述特异性模板寡核苷酸具有至少一个代表TCRB基因座的每种可能的V-J组合的模板。对扩增产物进行定量测序，并由独特识别每种V-J组合的每种16bp分子条形码序列(式(I)中的B)的出现频率获得每种独特V-J产物序列的出现频率。

将多重PCR反应设计成扩增TCRB基因座的所有可能V和J基因重排，如通过IMGT合作所标注。参见Yousfi Monod M,Giudicelli V,ChaumeD,Lefranc.MP.IMGT/JunctionAnalysis:the first tool for the analysis of theimmunoglobulin and T cell receptor complex V-J and V-D-J JUNCTIONs.Bioinformatics.2004；20(suppl 1):i379-i385(Yousfi Monod M、Giudicelli V、Chaume D、Lefranc.MP，“IMGT/结合部分析：对免疫球蛋白和T细胞受体的复杂V-J和V-D-J接合部进行分析的第一工具”，《生物信息学》，2004年，第20卷(增刊1)，第i379-i385页)。基因座包括67个独特的V基因。对于一些V区段，用于引物退火的靶序列是相同的，从而允许我们用60种独特正向引物扩增所有67个V区段。对于J基因座而言，13种独特的反向引物退火至13个J基因。使用60种V正向引物(VF；对于V基因具有特异性)的等摩尔库和13种J反向引物(JR；对于J基因具有特异性)的等摩尔库扩增868种模板的库，作为偏倚评估的基线。以3.0μM VF、3.0μMJR库(集成DNA技术公司(Integrated DNA Technologies))、1μM QIAGENMultiplex Plus PCR预混液(加利福尼亚州瓦伦西亚的凯杰公司(QIAGEN,Valencia,CA))、10％Q-溶液(凯杰公司(QIAGEN))和来自我们的合成TCRB组库混合物的200,000个靶分子设置聚合酶链式反应(PCR)(各25μL)。在C100热循环仪(加利福尼亚州赫拉克勒斯的伯乐实验室公司(Bio-Rad Laboratories,Hercules,CA))中使用下列热循环条件：95℃下5分钟循环一次，95℃下30秒、62℃下90秒和72℃下90秒循环31次，然后72℃下3分钟循环一次。对于所有实验，将每种PCR条件重复三次。

在初始的偏倚评估后，进行实验以限定所有单独的引物扩增特性。为了测定我们的VF和JR引物的特异性，制备含有单种VF引物与所有JR引物的60种混合物，以及含有单种JR引物与所有VF引物的13种混合物。使用这些引物组来扩增合成模板，并对所得文库进行测序，以便测量每种引物就靶标V或J基因区段而言的特异性，以及以便识别非靶标引发的情况。在所有其他等摩尔引物的环境中使用2倍和4倍浓度的每个单独的VF或JF的库(如，2x倍IgHV1-01+所有其他等摩尔VF和JR引物)执行滴定实验，以使我们能够估算使引物浓度与观察到的模板频率相关的比例因子。

引物混合物优化

使用通过滴定引物(每次一种)导出的比例因子，开发出替代引物混合物，其中引物以不均匀的浓度组合以将扩增偏倚降至最低。随后使用改进的引物混合物来扩增模板库并测量残余扩增偏倚。迭代进行该过程，从而基于被该引物扩增的模板在上一轮的结果中是占比过高还是占比过低而适当地降低或增加每种引物浓度。在该迭代过程的每个阶段，通过计算动态范围(最大偏倚/最小偏倚)以及平方和(SS，基于log(偏倚)值计算)的量度来测定扩增偏倚的总程度，并且迭代进行调节引物浓度的过程，直到在迭代之间存在最低限度的改善。最终混合物显著优于引物的等摩尔混合物。

图11示出了针对相对扩增偏倚作图的合成TCRB VJ模板的TCRB引物迭代。在化学偏倚控制修正之前(等摩尔引物(黑色))、化学修正后(优化引物(深灰色))以及化学和计算修正后(在计算调节之后(浅灰色))测定858种合成TCRB VJ模板的相对扩增偏倚。等摩尔引物的动态范围为264，四分位距为0.841，并且log(偏倚)的平方和为132。优化引物的动态范围为147，四分位距为0.581，并且log(偏倚)的平方和为50.7。修正引物(在计算调节之后)的动态范围为90.8，四分位距为0.248，并且log(偏倚)的平方和为12.8。

实例10：修正组合的IGH VJ和DJ扩增寡核苷酸引物组中的非均一扩增潜能(PCR偏倚)

设计多样的IgH扩增引物来扩增生物样品中的重排IgH V和J基因区段以及IgH D和J基因区段的每种可能的组合，所述生物样品含有来自受试者的淋巴样细胞DNA。在多重PCR中使用含有等摩尔浓度的多样扩增引物的制备物以扩增多样模板组合物，所述组合物包含等摩尔浓度的根据式(I)的IgH特异性模板寡核苷酸，所述IgH特异性模板寡核苷酸具有至少一种代表IgH基因座的每种可能的V-J组合以及IgH基因座的每种可能D-J组合的模板。对扩增产物进行定量测序，并由独特识别每种V-J和D-J组合的每种16bp分子条形码序列(式(I)中的B)的出现频率获得每种独特V-J和D-J产物序列的出现频率。

将多重PCR反应设计成扩增IgH基因座的所有可能V和J基因重排以及D和J基因重排，如通过IMGT合作所标注。基因座包括126个独特V基因；52个功能基因、缺乏对功能关键的氨基酸的6个推定的开放阅读框和69个假基因；以及9个J基因、6个功能和3个假基因。基因座还包括27个独特D基因。对于一些V区段，用于引物退火的靶序列是相同的，从而允许用86种独特正向引物扩增所有126个V区段。相似地，7种独特反向引物退火至所有9个J基因。对于D-J测定而言，引物被设计成退火至重排的–DJ杆。在B细胞发育期间，两个等位基因均经历D与J基因区段之间的重排，从而产生两个–DJ杆。–DJ杆包括J基因、一个N区和D基因。在DJ重排后，两个等位基因中的一个即V基因与–DJ杆一起重排，以编码CDR3基因区(VnDnJ)。为了扩增–DJ杆，将27种独特引物设计成退火至D基因外显子的内含子区域上游中的每个特异性D基因。这些区段虽然存在于–DJ杆中，但在V至-DJ重组后被切除。然而，未对J引物进行重新设计；DJ测定使用与VJ测定相同的J引物。

使用86种V正向引物(VF；对于V基因具有特异性)、27种D正向引物(DF；对于D基因具有特异性)的优化(混合物2-1)库和7种J反向引物(JR；对于J基因具有特异性)的等摩尔库扩增1359种模板的库，作为偏倚评估的基线。以1.0μM VF、1.0μM DF、2.0μM JR库(集成DNA技术公司(Integrated DNA Technologies))、1X QIAGEN Multiplex Plus PCR预混液(加利福尼亚州瓦伦西亚的凯杰公司(QIAGEN,Valencia,CA))、10％Q-溶液(凯杰公司(QIAGEN))和来自我们的合成IgH VJ和DJ组库混合物的200,000个靶分子设置聚合酶链式反应(PCR)(各25μL)。在C100热循环仪(加利福尼亚州赫拉克勒斯的伯乐实验室公司(Bio-Rad Laboratories,Hercules,CA))中使用下列热循环条件：95℃下6分钟循环一次，95℃下30秒、64℃下120秒和72℃下90秒循环31次，然后72℃下3分钟循环一次。对于所有实验，将每种PCR条件重复三次。

在初始的偏倚评估后，进行实验以限定所有单独的引物扩增特性。为了测定我们的DF和JR引物的特异性，制备含有单种DF引物与所有JR引物以及此前识别的优化VF库的27种混合物，以及含有单种JR引物与所有VF和DF引物的7种混合物。使用这些引物组来扩增合成模板，并对所得文库进行测序，以便测量每种引物就靶标V、D或J基因区段而言的特异性，以及以便识别非靶标引发的情况。

在所有其他引物—包括VF引物的优化混合物的环境内使用2倍和4倍浓度的每种单独的DF或JF的库(如，2x倍IgHD2-08+所有其他等摩尔DF、最佳VF的混合物，和JR引物)执行滴定实验，以使我们能够估算使引物浓度与观察到的模板频率相关的比例因子。

引物混合物优化

使用交叉扩增测试，DF引物被识别为发生交叉扩增。移除DF引物中的12种，从而导致最终库具有15种DF引物。使用通过滴定引物(每次一种)导出的比例因子，开发出替代引物混合物，其中引物以不均匀的浓度组合以将扩增偏倚降至最低。随后使用改进的引物混合物来扩增模板库并测量残余扩增偏倚。迭代进行该过程，从而基于被该引物扩增的模板在上一轮的结果中是占比过高还是占比过低而适当地降低或增加每种引物浓度。在该迭代过程的每个阶段，通过计算动态范围(最大偏倚/最小偏倚)以及平方和(SS，基于log(偏倚)值计算)的量度来测定扩增偏倚的总程度，并且迭代进行调节引物浓度的过程，直到在迭代之间存在最低限度的改善。最终的引物混合物具有比等摩尔引物混合物显著低的引物偏倚。

图12示出了针对相对扩增偏倚作图的合成IGH VJ模板的IGH引物迭代。在化学偏倚控制修正之前(等摩尔引物(黑色))、化学修正后(优化引物(深灰色))以及化学和计算修正后(在计算算计计算调节之后(浅灰色))测定1116种合成IGH VJ模板的相对扩增偏倚。等摩尔引物的动态范围为1130，四分位距为0.991，并且log(偏倚)的平方和为233。优化引物的动态范围为129，四分位距为0.732，并且log(偏倚)的平方和为88.2。计算调节之后的引物的动态范围为76.9，四分位距为0.545，并且log(偏倚)的平方和为37.9。

图13示出了V基因的27种合成IGH DJ模板的相对扩增偏倚。V基因区段的相对扩增偏倚在三次引物迭代中示出：1)在化学偏倚控制修正之前(黑色)，2)化学修正的第一次迭代(白色)，以及3)化学修正的第二次迭代后(浅灰色)。

实例11：TCRG VJ引物迭代

在其他实施例中，测试TCRG VJ引物在多次引物迭代中的相对扩增偏倚。图14a-d示出了55种合成TCRG VJ模板的TCRG引物迭代。在化学偏倚控制修正(图14a)、化学修正的第一次迭代(图14b)、化学修正的第二次迭代(图14c)和化学修正的最后迭代(图14d)之前测定TCRG VJ引物的相对扩增偏倚。

实例12：替代性的偏倚控制和加标方法

在其他实施例中，可使用替代方法来测定扩增偏倚。所述方法的两个主要目标如下：(1)消除BCR或TCR基因的多重PCR扩增中的扩增偏倚，和(2)估算起始模板中的B或T细胞分数。

所述方法包括从一组细胞开始，所述细胞包含从包含B和/或T细胞的样品提取的DNA或cDNA(mRNA)。在包含细胞的样品中，使用本领域中的标准方法提取DNA。

将提取的DNA分为多份，并放入不同的PCR孔中。在一些实施例中，使用一个孔的全容量，或可以使用数千个孔。在一个实施例中，针对PCR使用188个孔(两个96孔板)。每个孔中的TCR或BCR模板的数量应当稀少，使得在同一个孔中很难具有来自同一克隆型的多种分子。

所述方法随后包括使用同一组多重引物分别在每个孔中对DNA进行扩增。可使用本文所述的多组引物。如上所述，将条编码方法应用于每个孔中具有相同条形码序列的扩增分子。例如，每个孔获得其自身的条形码。

随后在高通量测序机器上对所述分子测序，所述测序机具有足量的扩增BCR或TCR序列，以通过序列识别所使用的V和J链，以及条形码序列。

每个孔具有平均拷贝数。由于每种克隆型在孔中出现一次，所以该模板相对于平均值的量是该V-J组合的偏倚。由于V和J偏倚是独立的，所以不必使用每种V-J组合来测定偏倚。随后使用这些相对偏倚来要么重新设计扩增严重不足或扩增严重过度的引物，要么对引物浓度进行滴定以增大或减小扩增。整个过程使用新的一批引物重复，并迭代以继续减小偏倚。

在任何迭代循环之后，可应用一组计算因子(相对扩增因子)来消除偏倚。可通过引物变化和/或计算修正来减小偏倚。

所述方法包括由类似的测定计算有核细胞的分数。对于每个孔，识别每种克隆型，并针对每个克隆确定测序读段的数量。在一些实施例中，模板的数量无需稀少。通过如上所述的偏倚控制因子修正每个克隆的读段计数。

生成经修正读段计数的柱状图，并且该图具有主要模式(扩增因子)。该模式通过检测(基于对第一大峰的识别)、或通过傅里叶变换或其他已知方法来识别。

将每个孔中的经修正读段的总数量除以该孔的扩增因子。这是处于所述孔中的TCR或BCR基因组模板的估算数量。来自样品的BCR或TCR的总数量为来自所有孔的数量的总和。在PCR之前测量每个孔中的基因组总数量。这可通过纳米微滴(nanodrop)或用于定量DNA的其他已知方法来完成。将DNA的测得重量除以双链基因组的重量(例如，在人体中为约6.2皮克)。

样品中的B细胞或T细胞的分数是将样品中BCR或TCR的总数量除以添加至反应的双链DNA分子的总数量。结果需要细微的修正，因为一小部分T细胞的两个等位基因均发生了重排。该修正因子对于αβT细胞为大约15％，对于B细胞为大约10％。对于γδT细胞，几乎全部细胞的两个等位基因均发生了重排，使得修正因子为2。

这些另外的方法可测定BCR或TCR基因的多重PCR扩增中的扩增偏倚，并用于估算起始模板中的B或T细胞的分数。

可将上文所述的各种实施例组合，以提供另外的实施例。本说明书中提及的和/或申请资料表中列出的所有美国专利、美国专利申请公布、美国专利申请、国外专利、国外专利申请和非专利出版物均全文以引用方式并入本文。如果有必要，可修改实施例的各方面以采用各种专利、申请和出版物的概念，从而提供另外的实施例。

可根据以上具体实施方式对实施例进行这些和其他更改。一般来讲，在以下权利要求书中，所用的术语不应解释为将权利要求限制于本说明书和权利要求书中所公开的具体实施例，而应解释为包括所有可能的实施例，连同此类权利要求赋予其权利的等同物的整个范围。因此，权利要求书不受本公开限制。

非正式的序列表

hs-IgH-DJ的偏倚控制序列(243种序列)

hs-IGL的偏倚控制序列

hs-IgK的偏倚控制序列

hs-TCRB-P10的引物序列

hs-IGH-D的引物序列

IGK和IGL的引物序列

Claims

1.一种用于使寡核苷酸引物组的扩增效率标准化的组合物，所述寡核苷酸引物组能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子，所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子，每种适应性免疫受体包含可变区和连接区，所述组合物包含：

多种模板寡核苷酸，其具有多种由如下通式表示的寡核苷酸序列：

5'-U1-B1-V-B2-R-B3-J-B4-U2-3' [I]

其中：

(a)V是包含适应性免疫受体可变(V)区编码基因序列或其互补序列的至少20个且不超过1000个连续核苷酸的多核苷酸，并且每种V多核苷酸包含独特的寡核苷酸序列；

(b)J是包含适应性免疫受体连接(J)区编码基因序列或其互补序列的至少15个且不超过600个连续核苷酸的多核苷酸，并且每种J多核苷酸包含独特的寡核苷酸序列；

(c)U1要么不存在，要么包含选自如下的寡核苷酸序列：(i)第一通用接头寡核苷酸序列和(ii)连接至第一通用接头寡核苷酸序列并位于其5'端的第一测序平台特异性寡核苷酸序列；

(d)U2要么不存在，要么包含选自如下的寡核苷酸序列：(i)第二通用接头寡核苷酸序列和(ii)连接至第二通用接头寡核苷酸序列并位于其5'端的第二测序平台特异性寡核苷酸序列；

(e)B1、B2、B3和B4各自独立地要么不存在，要么各自包含具有3-25个连续核苷酸的条形码序列的寡核苷酸B，其中B1、B2、B3和B4各包含一寡核苷酸序列，所述寡核苷酸序列独特地识别作为成对组合的(i)(a)的独特V寡核苷酸序列和(ii)(b)的独特J寡核苷酸序列；

(f)R要么不存在，要么包含具有不存在于(a)-(e)中的寡核苷酸序列的限制性酶识别位点，

并且其中：

(g)所述多种模板寡核苷酸包含至少a种或至少b种独特寡核苷酸序列，以较大者为准，其中a是所述受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是所述受试者中的独特适应性免疫受体J区编码基因区段的数量，并且所述组合物包含至少一种针对每种独特V多核苷酸的模板寡核苷酸和至少一种针对每种独特J多核苷酸的模板寡核苷酸。

2.根据权利要求1所述的组合物，其中a的范围为1至所述受试者的哺乳动物基因组中V基因区段的最大数量的数。

3.根据权利要求1或2中任一项所述的组合物，其中b的范围为1至所述受试者的哺乳动物基因组中J基因区段的最大数量的数。

4.根据权利要求1-3中任一项所述的组合物，其中a为1或b为1。

5.根据权利要求1所述的组合物，其中所述多种模板寡核苷酸包含至少(a×b)种独特的寡核苷酸序列，其中a是所述哺乳动物受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是所述哺乳动物受试者中的独特适应性免疫受体J区编码基因区段的数量，并且所述组合物包含至少一种针对V区编码基因区段与J区编码基因区段的每种可能组合的模板寡核苷酸。

6.根据权利要求1-5中任一项所述的组合物，其中J包含所述适应性免疫受体J区编码基因序列的恒定区。

7.根据权利要求1-6中任一项所述的组合物，其中所述适应性免疫受体选自TCRB、TCRG、TCRA、TCRD、IGH、IGK和IGL。

8.根据权利要求1-7中任一项所述的组合物，其中所述(a)的V多核苷酸编码TCRB、TCRG、TCRA、TCRD、IGH、IGK或IGL受体V区多肽。

9.根据权利要求1-8中任一项所述的组合物，其中所述(b)的J多核苷酸编码TCRB、TCRG、TCRA、TCRD、IGH、IGK或IGL受体J区多肽。

10.根据权利要求1-9中任一项所述的组合物，还包含V与B2之间的终止密码子。

11.根据权利要求1-10中任一项所述的组合物，其中所述多种模板寡核苷酸中的每种模板寡核苷酸以基本上等摩尔量存在。

12.根据权利要求1-11中任一项所述的组合物，其中所述多种模板寡核苷酸具有选自如下的多种由通式(I)表示的序列：

(1)所述多种由通式(I)表示的寡核苷酸序列，其中所述V和J多核苷酸具有在图5a-5l中作为TCRB V/J组1、TCRB V/J组2、TCRBV/J组3、TCRB V/J组4、TCRB V/J组5、TCRB V/J组6、TCRB V/J组7、TCRB V/J组8、TCRB V/J组9、TCRB V/J组10、TCRB V/J组11、TCRB V/J组12和TCRB V/J组13的68组TCRB V和J SEQ ID NO中的至少一组中示出的TCRB V和J序列；

(2)所述多种由通式(I)表示的寡核苷酸序列，其中所述V和J多核苷酸具有在图6a和6b中作为TCRG V/J组1、TCRG V/J组2、TCRG V/J组3、TCRG V/J组4和TCRG V/J组5的14组TCRGV和J SEQ ID NO中的至少一组中示出的TCRG V和J序列；

(3)所述多种由通式(I)表示的寡核苷酸序列，其中所述V和J多核苷酸具有在图7a-7m中作为IGH V/J组1、IGH V/J组2、IGH V/J组3、IGH V/J组4、IGH V/J组5、IGH V/J组6、IGH V/J组7、IGH V/J组8和IGH V/J组9的127组IGH V和J SEQ ID NO中的至少一组中示出的IGH V和J序列；

(4)如SEQ ID NO:3157-4014中所示的所述多种由通式(I)表示的寡核苷酸序列；

(5)如SEQ ID NO:4015-4084中所示的所述多种由通式(I)表示的寡核苷酸序列；

(6)如SEQ ID NO:4085-5200中所示的所述多种由通式(I)表示的寡核苷酸序列；

(7)如SEQ ID NO:5579-5821中所示的所述多种由通式(I)表示的寡核苷酸序列；

(8)如SEQ ID NO:5822-6066中所示的所述多种由通式(I)表示的寡核苷酸序列；以及

(9)如SEQ ID NO:6067-6191中所示的所述多种由通式(I)表示的寡核苷酸序列。

13.根据权利要求1-12中任一项所述的组合物，其中V是包含所述适应性免疫受体V区编码基因序列或其互补序列的至少30、60、90、120、150、180或210个连续核苷酸的多核苷酸。

14.根据权利要求1-13中任一项所述的组合物，其中V是包含适应性免疫受体V区编码基因序列或其互补序列的不超过900、800、700、600或500个连续核苷酸的多核苷酸。

15.根据权利要求1-14中任一项所述的组合物，其中J是包含适应性免疫受体J区编码基因序列或其互补序列的至少16-30、31-60、61-90、91-120或120-150个连续核苷酸的多核苷酸。

16.根据权利要求1-15中任一项所述的组合物，其中J是包含适应性免疫受体J区编码基因序列或其互补序列的不超过500、400、300或200个连续核苷酸的多核苷酸。

17.根据权利要求1-16中任一项所述的组合物，其中每种模板寡核苷酸的长度小于1000、900、800、700、600、500、400、300或200个核苷酸。

18.根据权利要求1-17中任一项所述的组合物，还包含：能够扩增编码一种或多种适应性免疫受体的重排核酸分子的一组寡核苷酸引物，所述寡核苷酸引物组包含复数a'种独特的V区段寡核苷酸引物和复数b'种独特的J区段寡核苷酸引物。

19.根据权利要求18所述的组合物，其中a'的范围为1至所述哺乳动物基因组中V基因区段的最大数量的数，并且b'的范围为1至所述哺乳动物基因组中J基因区段的最大数量的数。

20.根据权利要求19所述的组合物，其中a’为a。

21.根据权利要求19所述的组合物，其中b’为b。

22.根据权利要求18-21中任一项所述的组合物，其中所述寡核苷酸引物组中的每种V区段寡核苷酸引物和每种J区段寡核苷酸引物能够特异性杂交至所述多种模板寡核苷酸中的至少一种模板寡核苷酸。

23.根据权利要求18-22中任一项所述的组合物，其中每种V区段寡核苷酸引物包含与至少一种适应性免疫受体V区编码基因区段互补的至少15个连续核苷酸的核苷酸序列。

24.根据权利要求18-23中任一项所述的组合物，其中每种J区段寡核苷酸引物包含与至少一种适应性免疫受体J区编码基因区段互补的至少15个连续核苷酸的核苷酸序列。

25.根据权利要求18-24中任一项所述的组合物，其中所述组合物包含至少一种具有每种V区段寡核苷酸引物可与之特异性杂交的由通式(I)表示的寡核苷酸序列的模板寡核苷酸，以及至少一种具有每种J区段寡核苷酸引物可与之特异性杂交的由通式(I)表示的寡核苷酸序列的模板寡核苷酸。

26.一种用于测定一组寡核苷酸引物的成员中的非均一核酸扩增潜能的方法，所述一组寡核苷酸引物能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子，所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子，所述方法包括：

(a)在多重PCR反应中扩增根据权利要求18-25中任一项所述的组合物，以获得多种扩增的模板寡核苷酸；

(b)对所述多种扩增的模板寡核苷酸进行测序，以对构成所述多种的每种独特模板寡核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸序列的出现频率；以及

(c)将每种所述模板寡核苷酸序列的出现频率与预期分布进行比较，其中所述预期分布基于构成所述组合物的所述多种模板寡核苷酸的预定摩尔比，并且其中所述模板寡核苷酸序列的所述出现频率与所述预期分布之间的偏差指示所述寡核苷酸扩增引物组的成员间的非均一核酸扩增潜能。

27.根据权利要求26所述的方法，其中所述预定摩尔比是等摩尔。

28.根据权利要求27所述的方法，其中所述预期分布包括由所述寡核苷酸引物组扩增的所述模板寡核苷酸组的均一扩增水平。

29.根据权利要求26所述的方法，其中每种扩增的模板核酸分子的长度小于1000、900、800、700、600、500、400、300、200、100、90、80或70个核苷酸。

30.根据权利要求26-29中任一项所述的方法，还包括：对于相对于所述预期分布呈现非均一扩增潜能的所述寡核苷酸引物组的每个成员，调节所述寡核苷酸扩增引物组中的所述寡核苷酸引物成员的相对占比。

31.根据权利要求30所述的方法，其中调节包括增加所述寡核苷酸引物组中的所述成员的相对占比，从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。

32.根据权利要求30所述的方法，其中调节包括降低所述寡核苷酸引物组中的所述成员的相对占比，从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。

33.根据权利要求26-32中任一项所述的方法，其中所述寡核苷酸引物组不包括特异性杂交至V区假基因或孤独基因或者杂交至J区假基因或孤独基因的寡核苷酸引物。

34.根据权利要求26-33中任一项所述的方法，还包括：对于相对于所述预期分布呈现非均一扩增潜能的所述寡核苷酸扩增引物组的每个成员，计算由所述成员促进其扩增的所述扩增的模板核酸分子的成比例增加或减小的出现频率，从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。

35.一种用于定量生物样品中的编码一种或多种适应性免疫受体的多种重排核酸分子的方法，所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子，每种适应性免疫受体包含可变(V)区和连接(J)区，所述方法包括：

(A)在多重聚合酶链式反应(PCR)中扩增重排核酸分子，所述反应包含：

(1)来自所述生物样品的重排核酸分子，所述生物样品包含所述哺乳动物受试者的淋巴样细胞，

(2)如权利要求1-17中任一项所述的组合物，其中存在已知数量的所述多种具有独特寡核苷酸序列的模板寡核苷酸中的每一种，

(3)寡核苷酸扩增引物组，所述寡核苷酸扩增引物组能够扩增来自所述生物样品的编码一种或多种适应性免疫受体的重排核酸分子，所述引物组包含：

(a)基本上等摩尔量的多种V区段寡核苷酸引物，所述引物各自独立地能够特异性杂交至编码适应性免疫受体V区多肽的至少一种多核苷酸或特异性杂交至其互补序列，其中每种V区段引物包含与至少一种功能性适应性免疫受体V区编码基因区段互补的至少15个连续核苷酸的核苷酸序列，并且其中所述多种V区段引物特异性杂交至所述组合物中存在的基本上所有功能性适应性免疫受体V区编码基因区段，以及

(b)基本上等摩尔量的多种J区段寡核苷酸引物，所述引物各自独立地能够特异性杂交至编码适应性免疫受体J区多肽的至少一种多核苷酸或特异性杂交至其互补序列，其中每种J区段引物包含与至少一种功能性适应性免疫受体J区编码基因区段互补的至少15个连续核苷酸的核苷酸序列，并且其中所述多种J区段引物特异性杂交至所述组合物中存在的基本上所有功能性适应性免疫受体J区编码基因区段，

其中所述V区段和J区段寡核苷酸引物能够在所述多重聚合酶链式反应(PCR)中促进：(i)所述组合物中的基本上所有模板寡核苷酸的扩增，以产生大量的扩增模板寡核苷酸，所述大量的扩增模板核酸分子足以定量所述组合物中的所述模板寡核苷酸的多样性，以及(ii)所述生物样品中的基本上所有编码适应性免疫受体的重排核酸分子的扩增，以产生大量的扩增重排DNA分子，所述大量的扩增重排核酸分子足以定量来自所述生物样品的所述DNA中的所述重排核酸分子的多样性，

并且其中所述多种扩增模板寡核苷酸中和所述多种扩增重排核酸分子中的每种扩增核酸分子的长度小于1000个核苷酸；

(B)对所述扩增模板寡核苷酸和所述扩增重排核酸分子进行定量测序以定量(i)含有至少一种寡核苷酸条形码序列的扩增模板寡核苷酸的模板产物数量，以及(ii)缺少寡核苷酸条形码序列的扩增重排核酸分子的重排产物数量；

(C)将(B)(i)的所述模板产物数量除以(A)(2)的所述多种具有独特寡核苷酸序列的模板寡核苷酸中的每一种的已知数量，来计算扩增系数；以及

(D)将(B)(ii)的所述重排产物数量除以(C)中计算的所述扩增系数以定量所述样品中的独特适应性免疫受体编码重排核酸分子的数量。

36.根据权利要求35所述的方法，其中所述样品中的独特适应性免疫受体编码重排核酸分子的所述定量数量是所述样品中的独特B细胞或独特T细胞基因组模板的数量。

37.一种用于计算多重PCR测定中的平均扩增系数的方法，包括：

获得生物样品，所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子；

将所述样品与已知量的构成如权利要求18-25中任一项所述的组合物的模板寡核苷酸接触；

在多重PCR反应中扩增所述模板寡核苷酸和来自所述哺乳动物受试者的淋巴样细胞的所述重排核酸分子，以获得多种扩增的模板寡核苷酸和多种扩增的重排核酸分子；

对所述多种扩增的模板寡核苷酸进行测序，以对构成所述多种的每种独特模板寡核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸序列的出现频率；以及

基于所述多种扩增的模板寡核苷酸的平均拷贝数和所述模板寡核苷酸的所述已知量，测定所述多重PCR反应的所述平均扩增系数。

38.根据权利要求37所述的方法，还包括：

对来自所述哺乳动物受试者的淋巴样细胞的所述多种扩增的重排核酸分子进行测序，以对构成所述多种的每种独特重排核酸分子测定i)重排核酸分子序列和(ii)所述重排核酸分子序列的出现次数；以及

基于所述多重PCR反应的所述平均扩增系数和所述重排核酸分子的所述出现次数，测定所述样品中的淋巴样细胞的数量。

39.根据权利要求38所述的方法，其中测定所述样品中的淋巴样细胞的数量包括生成每种所述扩增重排核酸序列的所述出现次数的总和并将所述总和除以所述平均扩增系数。

40.根据权利要求37所述的方法，其中所述已知量是每种所述模板寡核苷酸一个拷贝。

41.根据权利要求40所述的方法，其中100≤a≤500。

42.根据权利要求40所述的方法，其中100≤b≤500。

43.一种用于修正多重PCR扩增反应中的扩增偏倚以定量生物样品中编码一种或多种适应性免疫受体的重排核酸分子的方法，所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子，所述方法包括：

(a)将所述样品与根据权利要求18-25中任一项所述的组合物接触，以生成模板加标样品，其中所述模板和所述重排核酸分子包含对应的V和J区序列；

(b)在多重PCR反应中扩增所述模板加标样品，以获得多种扩增的模板寡核苷酸和多种扩增的编码多种适应性免疫受体的重排核酸分子；

(c)对所述多种扩增的模板寡核苷酸进行测序，以对构成所述多种的每种独特模板寡核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸序列的出现频率；

(d)对编码一种或多种适应性免疫受体的所述多种扩增重排核酸分子进行测序，以对构成所述多种的编码所述多种适应性免疫受体的每种独特重排核酸分子测定i)重排核酸分子序列和(ii)所述重排核酸分子序列的出现频率；

(e)将所述模板寡核苷酸序列的所述出现频率与预期分布进行比较，其中所述预期分布基于构成所述组合物的所述多种模板寡核苷酸的预定摩尔比，并且其中所述模板寡核苷酸序列的所述出现频率与所述预期分布之间的偏差指示所述寡核苷酸扩增引物组的成员间的非均一核酸扩增潜能；

(f)生成由具有所述指示的非均一核酸扩增潜能的所述寡核苷酸扩增引物组的所述成员扩增的一组模板分子和重排核酸分子序列的一组修正值，其中所述一组修正值修正所述多重PCR反应中的扩增偏倚；以及

(g)任选地将所述一组修正值应用于所述重排核酸分子序列的所述出现频率以修正所述多重PCR反应中的扩增偏倚。

44.一种试剂盒，包括：

试剂，所述试剂包含：如权利要求18-25中任一项所述的包含多种模板寡核苷酸和一组寡核苷酸引物的组合物；

测定所述寡核苷酸引物组的成员间的非均一核酸扩增潜能的操作指南，所述寡核苷酸引物组能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子，所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子。

45.根据权利要求44所述的试剂盒，还包括修正具有非均一核酸扩增潜能的所述寡核苷酸引物组的一个或多个成员的操作指南。

46.根据权利要求44所述的试剂盒，还包括定量所述样品中独特适应性免疫受体编码重排核酸分子的数量的操作指南。