CN103289994B

CN103289994B - 用于扩增T细胞受体α链CDR3编码序列的引物组合物及其用途

Info

Publication number: CN103289994B
Application number: CN201210055230.9A
Authority: CN
Inventors: 张瑞芳; 刘晓; 洪雪玉; 郑春婷; 苏政; 张俊杰
Original assignee: BGI Shenzhen Co Ltd
Current assignee: Shenzhen Huada Institute Of Life Sciences; BGI Shenzhen Co Ltd
Priority date: 2012-03-05
Filing date: 2012-03-05
Publication date: 2015-08-05
Anticipated expiration: 2032-03-05
Also published as: CN103289994A; HK1186210A1

Abstract

本发明涉及用于扩增T细胞受体α链CDR3编码序列的引物组合物及其用途。其中，用于扩增T细胞受体α链CDR3编码序列的引物组合物包括：第一引物组，其由至少一种V区引物组成，该至少一种V区引物的每一种均包含与至少一个V基因片段互补的序列；以及第二引物组，其由至少一种J区引物组成，该至少一种J区引物的每一种均包含与至少一个J基因片段互补的序列。利用该引物组合物，能够有效地对T细胞受体α链CDR3编码序列进行富集，从而为对T细胞受体α链的CDR3进行深入研究提供了便利的工具。

Description

用于扩增T细胞受体α链CDR3编码序列的引物组合物及其用途

技术领域

本发明涉及生物技术领域。具体地，本发明涉及用于扩增T细胞受体α链CDR3编码序列的引物组合物及其用途。更具体地，本发明涉及用于扩增T细胞受体α链CDR3编码序列的引物组合物，富集T细胞受体α链CDR3编码序列的方法，构建T细胞受体α链CDR3编码序列的测序文库的方法，确定T细胞受体α链CDR3编码序列的序列信息的方法，确定个体免疫状态的方法以及确定个体免疫状态的系统。

背景技术

免疫系统是机体抵御病原菌入侵与免疫调节的重要系统，对其进行研究有很重要的意义。免疫球蛋白、T细胞受体(TCR)和HLA(人类白细胞抗原)是人类基因组中最活跃的免疫大分子，决定和反映了人和环境的相互作用。免疫大分子的多样性使得机体能识别无数的外来物质和清除体内产生的部分代谢物。免疫大分子多样性产生的机制主要有基因重排、体细胞突变、非模板核苷酸的插入与缺失等。其中，T细胞受体的多样性主要是通过人外周血T细胞主要表达的T细胞受体的α链和β链的重排引起的，而T细胞受体α链重排引起的T细胞受体α链CDR3编码序列的多样性能较好地代表T细胞受体的多样性甚至个人的免疫状态，因此，对T细胞受体α链CDR3编码序列进行研究，意义重大。

然而，目前对于T细胞受体α链CDR3编码序列的研究仍有待改进。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。为此，本发明的一个目的在于提出一种能够有效地对T细胞受体α链CDR3编码序列进行富集的手段。

根据本发明的一个方面，本发明提供了一种用于扩增T细胞受体α链CDR3编码序列的引物组合物。根据本发明的实施例，该引物组合物包括第一引物组，所述第一引物组由至少一种V区引物组成，所述至少一种V区引物的每一种均包含与至少一个V基因片段互补的序列；以及第二引物组，所述第二引物组由至少一种J区引物组成，所述至少一种J区引物的每一种均包含与至少一个J基因片段互补的序列。利用该引物组合物，能够有效地对T细胞受体α链CDR3编码序列进行富集，从而为对T细胞受体α链的CDR3进行深入研究提供了便利的工具。

根据本发明的又一方面，本发明提供了一种构建T细胞受体α链CDR3编码序列的测序文库的方法。根据本发明的实施例，该方法包括以下步骤：根据前面所述的方法，获得富集所述T细胞受体α链CDR3编码序列的扩增产物；以及针对所述扩增产物，构建DNA测序文库，所述DNA测序文库构成所述T细胞受体α链CDR3编码序列的测序文库。由此，可以在对T细胞受体α链CDR3编码序列进行富集的基础上，构建可以用于测序的测序文库。

根据本发明的再一方面，本发明提出了一种确定T细胞受体α链CDR3编码序列的序列信息的方法。根据本发明的实施例，该方法包括以下步骤：根据前面所述的方法，构建T细胞受体α链CDR3编码序列的测序文库；以及对所述T细胞受体α链CDR3编码序列的测序文库进行测序，以便确定所述T细胞受体α链CDR3编码序列的序列信息。

根据本发明的又一方面，本发明提供了一种确定个体免疫状态的方法。根据本发明的实施例，该方法包括以下步骤：根据前面所述的方法，对所述个体的T细胞受体α链CDR3编码序列进行测序，以便获得由多个测序数据构成的测序结果；以及基于所述测序结果，确定所述个体的免疫状态。通过该方法，能够有效地获得个体的T细胞受体α链CDR3编码序列的序列信息，从而可以有效地确定个体免疫状态。

根据本发明的另一方面，本发明提出了一种确定个体免疫状态的系统。根据本发明的实施例，该系统包括：T细胞受体α链CDR3编码序列富集装置，所述T细胞受体α链CDR3编码序列富集装置中设置有前面所述的引物组合物，以便对所述个体的核酸样本富集T细胞受体α链CDR3编码序列；文库构建装置，所述文库构建装置与所述T细胞受体α链CDR3编码序列富集装置相连，以便针对所述经过富集的T细胞受体α链CDR3编码序列构建T细胞受体α链CDR3编码序列的测序文库；测序装置，所述测序装置与所述文库构建装置相连，用于对所述T细胞受体α链CDR3编码序列的测序文库进行测序，以便获得由多个测序数据构成的测序结果；以及分析装置，所述分析装置与所述测序装置相连，用于基于测序结果，确定所述个体的免疫状态。由此，利用该系统，能够有效地实施前述确定个体免疫状态的方法，从而能够有效地确定个体的免疫状态。

根据本发明的又一方面，本发明供出了一种试剂盒。根据本发明的实施例，该试剂盒中设置有前面所述的引物组合物。由此，该试剂盒能够用于检测T细胞受体α链的V-J重排，或者用于检测T细胞受体α链CDR3的编码序列。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1：显示了根据本发明一个实施例的对T细胞受体α链CDR3编码序列进行富集和测序的流程示意图；

图2：显示了根据本发明一个实施例的用于确定个体的免疫状态的系统结构示意图；

图3：显示了根据本发明一个实施例的多重PCR产物琼脂糖凝胶电泳结果；以及

图4：显示了根据本发明一个实施例的对T细胞受体α链CDR3编码序列进行测序后，所得到的V-J基因片段配对分布及丰度的结果示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。需要说明的是在本文中所使用的术语“第一”、“第二”等仅用于方便描述目的，而不能理解为指示或暗示相对重要性。在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

根据本发明的一个方面，本发明提出了一种用于扩增T细胞受体α链CDR3编码序列的引物组合物。根据本发明的实施例，该引物组合物包括第一引物组和第二引物组。其中，第一引物组由至少一种V区引物组成，所述第二引物组由至少一种J区引物组成。在本文中所使用的术语“V区引物”指的是这样的一种引物，其能够特异性地识别T细胞受体α链家族中的V基因片段，从而可以引导进行聚合酶链式反应，由此第一引物组中所包含的V区引物的每一种均包含与至少一个V基因片段互补的序列。类似的，在本文中所使用的术语“J区引物”指的是这样的一种引物，其能够特异性地识别T细胞受体α链家族中的J基因片段，从而可以引导进行聚合酶链式反应，由此第二引物组中所包含的J区引物的每一种均包含与至少一个J基因片段互补的序列。进而，在V区引物和J区引物的引导下，可以通过扩增反应例如PCR扩增，从含有T细胞受体α链CDR3编码序列的核酸样本中特异性地扩增包含V基因片段和J基因片段的编码序列。由于T细胞受体α链的CDR3是由V、J基因片段重排产物所编码的，因而通过特异性识别V基因片段和J基因片段的引物，即第一引物组和第二引物组，能够有效地从包含CDR3编码序列的核酸样本中扩增获得CDR3编码序列的扩增产物，在T细胞受体α链中，CDR3是V-J重排的产物，因而通过采用根据本发明实施例的引物组合物，能够高特异性地从样本中扩增富集获得CDR3的编码序列，从而能够减少其它非特异性序列的产生。从而能够实现对T细胞受体α链CDR3编码序列的有效富集，进而为针对T细胞受体α链CDR3进行深入研究提供了便利的工具。

根据本发明的实施例，V区引物和J区引物在PCR扩增过程中的作用，并不受特别限制。根据本发明的一个具体示例，V区引物可以作为正义链引物，J区引物可以作为反义链引物。发明人发现，通过如此设置V区引物和J区引物，能够进一步提高将引物组合物用于富集T细胞受体α链CDR3编码序列时的富集效率。根据本发明的实施例，上述引物组合物能够适用的T细胞受体类型，不受特别限制，本领域技术人员可以根据研究需要，选择适当的T细胞受体作为研究对象。根据本发明的一个实施例，所述T细胞受体为人类T细胞受体。由此，可以有效地将引物组合物用于对人类T细胞受体α链CDR3编码序列进行富集，从而可以有效地用于对人体免疫状况进行研究。

另外，根据本发明的实施例，可以通过对V区引物和J区引物的序列进行选择，实现一条引物可以识别多种V基因片段，从而可以进一步提高扩增的效率，减少引物的数目，降低成本。根据本发明的一个实施例，第一引物组的至少一种引物包含与多个V基因片段的保守区互补的序列。由此，可以在减少引物的数量的同时，提高对T细胞受体α链CDR3编码序列进行富集的效率，发明人还发现，这样操作能够提高各CDR3编码序列扩增的均一性，从而能够真实地反映CDR3编码序列在宿主中的分布比例。类似的，根据本发明的一个实施例，第二引物组的至少一种包含与多个J基因片段的保守区互补的序列。由此，可以在减少引物的数量的同时，提高对T细胞受体α链CDR3编码序列进行富集的效率，发明人还发现，这样操作能够提高各CDR3编码序列扩增的均一性，从而能够真实地反映CDR3编码序列在宿主中的分布比例。

具体地，根据本发明的实施例，针对人类T细胞受体α链CDR3的序列特征，本发明提供了一组V区引物和一组J区引物，其序列和名称分别总结如下：

根据本发明的实施例，本发明的V区引物和J区引物能够区分各亚家族，且能够更直观地呈现基因重排后V-J配对的情况和V基因的使用偏好性，此外，引物合成容易，错配率低、特异性高，且所有引物的退火温度接近，从而能够降低扩增的偏向性。

发明人惊奇地发现，采用上述具体的引物序列，能够全面覆盖人类T细胞受体CDR3的全部亚家族，包括发现新的CDR3亚家族，从而能够全面的富集人类T细胞受体CDR3编码序列，另外，发明人还发现通过采用上述引物序列，能够同时在一个PCR反应体系中进行多重引物PCR(有时也称为“多重PCR”)，能够有效地对样本中所包含的CDR3编码序列进行扩增，并且能够保证各CDR3编码序列扩增的均一性，从而能够真实地反映CDR3编码序列在宿主中的分布比例。根据本发明的实施例，多重引物PCR的退火温度可以为60摄氏度。发明人惊奇地发现，当退火温度为60摄氏度时，多重引物PCR扩增CDR3的效率得到显著提高。

由此，与现有技术相比，本发明含有可扩增IMGT数据库T细胞受体α链CDR3序列所有V区基因和J区基因的特异性引物，可以最全面的富集人类T细胞受体α链CDR3的编码序列，扩增出来的产物能够区分T细胞受体α链的各个亚家族，且同一模板不会被两组引物特异性结合扩增。本发明中的引物能更好的呈现机体免疫大分子的集合与分布，对找到与疾病相关的信息或者免疫系统变化的信息具有更可靠的作用。

根据本发明的又一方面，本发明提供了一种富集T细胞受体α链CDR3编码序列的方法。根据本发明的实施例，该方法可以包括以下步骤：首先提供核酸样本，该核酸样本中包含编码T细胞受体α链CDR3的核酸序列；接下来，利用前面所述的引物组合物，以所提供的核酸样本作为模板，进行PCR扩增，如前所述，基于引物组合物的特点，可以通过PCR扩增获得扩增产物，该扩增产物中富集了T细胞受体α链CDR3编码序列。利用该方法，能够有效地对T细胞受体α链CDR3编码序列进行扩增，从而能够有效地实现对T细胞受体α链CDR3编码序列的富集。

根据本发明的实施例，核酸样本的来源不受特别限制。本领域技术人员可以根据研究需要，选择可以获得核酸样本的来源。例如为了研究某一组织的特有免疫状态，可以从该组织或其附近提取免疫细胞作为核酸样本的来源。根据本发明一个实施例，可以采用从人外周血能够分离含有上述核酸样本的单个核细胞，并且通过分离核酸来获得上述核酸样本。由此，提供核酸样本的步骤可以进一步包括：首先，从人外周血分离外周血单个核细胞；接下来，从外周血单个核细胞提取核酸样本。由此，能够有效地获得含有编码T细胞受体α链CDR3的核酸序列的核酸样本，从而，可以进一步提高富集T细胞受体α链CDR3编码序列的效率。根据本发明的一个具体示例，外周血来源于正常人。本领域技术人员可以通过任何常规的手段从外周血中提取外周血单个核细胞。根据本发明的一个实施例，可以通过密度梯度离心分离所述外周血单个核细胞。并且可以采用常规的手段从所分离的外周血单个核细胞中提取基因组DNA和总RNA作为用于扩增的核酸样本。由此，可以方便快捷且低成本地获得核酸样本。本领域技术人员能够理解的是，当采用总RNA作为核酸样本进行扩增时，根据实验需要，可以首先通过逆转录将总RNA转换为cDNA。

根据本发明的实施例，上述PCR的类型并不受特别限制，即可以依次进行多次PCR反应，也可以在一个PCR体系中完成多轮PCR扩增。根据本发明的一个实施例，PCR扩增为多重引物PCR扩增。由此，可以同时在一个反应体系中完成对目标序列，即多种T细胞受体α链CDR3编码序列的扩增，并且能够保证各T细胞受体α链CDR3编码序列扩增的均一性，从而能够真实地反映各T细胞受体α链CDR3编码序列的真实相对比。根据本发明的一些实施例，多重引物PCR扩增的退火温度为60摄氏度。根据本发明的具体示例，在进行PCR扩增之后，可以进一步包括通过选自琼脂糖凝胶电泳、磁珠纯化和纯化柱纯化的至少一种分离纯化所得到的扩增产物。由此，可以提高扩增产物的纯度，从而提高富集T细胞受体α链CDR3编码序列的效率。根据本发明的一个实施例，扩增产物的长度可以为100-200bp。由此，可以进一步提高扩增产物中CDR3编码序列的纯度，从而提高富集T细胞受体α链CDR3编码序列的效率。

根据本发明的另一方面，本发明提供了一种构建T细胞受体α链CDR3编码序列的测序文库的方法。根据本发明的实施例，该方法可以包括以下步骤：首先，根据前面所述的方法，获得富集所述T细胞受体α链CDR3编码序列的扩增产物。接下来，针对所得到的扩增产物，构建DNA测序文库，该DNA测序文库可以作为T细胞受体α链CDR3编码序列的测序文库。由此，能够在对T细胞受体α链CDR3编码序列进行富集的基础上，构建可以用于测序的测序文库。

根据本发明的实施例，针对扩增产物构建DNA测序文库的方法并不受特别限制。根据本发明的一个实施例，针对扩增产物，构建DNA测序文库可以进一步包括：

首先，对扩增产物进行末端修复，以便获得经过末端修复的扩增产物。根据本发明的一个实施例，所述末端修复是利用Klenow片段、T4 DNA聚合酶和T4多核苷酸激酶进行的，其中Klenow片段具有5’→3’聚合酶活性和3’→5’外切酶活性，但缺少5’→3’外切酶活性。由此，可以进一步提高末端修复的效率，从而可以进一步提高构建测序文库的效率。

接下来，对经过末端修复的扩增产物进行3’端添加碱基A，以便获得3’末端添加碱基A的扩增产物。根据本发明的一个实施例，利用Klenow(3’-5’exo-)对经过末端修复的扩增产物进行3’端添加碱基A。由此，可以进一步提高在扩增产物的3’末端添加碱基A的效率，从而可以进一步提高构建测序文库的效率。

接着，将所得到的3’末端添加碱基A的扩增产物与接头相连，以便获得连接产物。根据本发明的一个实施例，将具有粘性末端A的扩增产物与接头相连是利用T4 DNA连接酶进行的。由此，可以进一步提高扩增产物与接头连接的效率，从而可以进一步提高构建测序文库的效率。

接下来，对所得到的连接产物进行PCR扩增，以便获得第二扩增产物。

最后，将所得到的第二扩增产物进行纯化回收，以便获得回收产物，所得到的回收产物构成DNA测序文库。根据本发明的实施例，对第二扩增产物进行纯化回收的方法并不受特别限制，根据本发明的具体实例，可以通过选自琼脂糖凝胶电泳、磁珠纯化和纯化柱纯化的至少一种分离纯化所第二扩增产物。由此，可以进一步提高构建测序文库的效率。

由此，可以有效地构建测序文库，从而便于后续的测序及进一步分析。

根据本发明的再一方面，本发明提出了一种确定T细胞受体α链CDR3编码序列的序列信息的方法。根据本发明的实施例，该方法可以包括以下步骤：

首先，根据前面所述的方法，构建T细胞受体α链CDR3编码序列的测序文库。

接下来，对T细胞受体α链CDR3编码序列的测序文库进行测序，以便确定T细胞受体α链CDR3编码序列的序列信息。根据本发明的实施例，可以利用选自Hiseq2000、SOLiD、454和单分子测序装置的至少一种进行测序。由此，能够高通量高精度地对所得到的T细胞受体α链CDR3编码序列的测序文库进行测序，从而进一步提高了确定T细胞受体α链CDR3编码序列的序列信息的方法的效率。

免疫组库作为多样性的免疫细胞在一个个体内某一时刻的总和，它反应了个体遗传因素、抗原接触史和个体时刻的免疫调控。免疫组库能用于疾病相关研究，对疾病机理进行探讨，可作为寻找生物标记物的一个有效手段，免疫组库的研究结果可以促进对更多疾病的早期诊断，治疗甚至预防。目前已有相关研究表明IgH、T细胞受体与免疫系统疾病的发生有一定关系，某一种克隆的增多或减少直接影响疾病的发生和进展。由此，根据本发明的再一方面，本发明提供了一种确定个体免疫状态的方法。根据本发明的实施例，该方法可以包括以下步骤：首先，根据前面所述的方法，对个体的T细胞受体α链CDR3编码序列进行测序，以便获得由多个测序数据构成的测序结果；以及基于所得到的测序结果，确定该个体的免疫状态。通过该方法，能够有效地获得个体的T细胞受体α链CDR3编码序列的序列信息，从而可以有效地确定个体免疫状态。在本文中所使用的术语“免疫状态”应作广义理解，其是指任何可以通过T细胞受体α链CDR3编码序列的序列信息反映出的免疫信息。根据本发明的一个实施例，基于所得到的测序结果，确定个体的免疫状态可以进一步包括：将所得到的测序结果与对照序列进行比对，以便确定个体中所包含的T细胞受体α链CDR3的亚家族类型，以及各亚家族类型的相对比例。由此，可以有效地判断个体免疫系统的组成和分布情况，从而能够有效地确定个体的免疫状态。此外，根据本发明的实施例，可以对个体进行多次监控，判断T细胞受体α链CDR3的亚家族类型，以及各亚家族类型的相对比例随时间的变化。为此，根据本发明的一个实施例，可以在多个不同的时间点，从相同的个体提取样品，并分别根据前面所述的方法，获得多个测序结果；以及将所得的多个测序结果进行比对，以便确定个体中T细胞受体α链CDR3亚家族类型以及相对比例的变化。由此，可以基于不同时间点的样品的测序结果的比对，有效地确定个体中T细胞受体α链CDR3亚家族类型以及相对比例的变化，从而能够更加有效地判断个体的免疫状态。由此，可以在不同时间对同一个体或多个个体进行采样，分析例如疾病前后或某种特定事件、时期前后个体免疫组库的变化，了解个体对特定事件、在特定时期的免疫系统变化。例如，能够从单一克隆水平知道当前样本的细致变化，从而寻找与疾病发生发展史相关的信息。

根据本发明的又一方面，本发明提供了一种确定个体免疫状态的系统。根据本发明的实施例，参考图2，该确定个体免疫状态的系统1000包括T细胞受体α链CDR3编码序列富集装置100、文库构建装置200、测序装置300以及分析装置400。其中，T细胞受体α链CDR3编码序列富集装置100中设置有前面所述的引物组合物，以便对个体的核酸样本富集T细胞受体α链CDR3编码序列。文库构建装置200与T细胞受体α链CDR3编码序列富集装置100相连，以便针对经过富集的T细胞受体α链CDR3编码序列构建T细胞受体α链CDR3编码序列的测序文库。根据本发明的实施例，关于针对扩增产物，构建测序文库的方法和流程，本领域技术人员可以根据不同的测序技术进行适当选择，关于流程的细节，可以参见测序仪器的厂商例如Illumina公司所提供的规程，例如参见Illumina公司MultiplexingSample Preparation Guide(Part#1005361；Feb 2010)或Paired-End SamplePrep Guide(Part#1005063；Feb 2010)，通过参照将其并入本文。在本文中所使用的术语“相连”应作广义理解，既可以是直接相连，也可以是间接相连，只要能够实现上述功能上的衔接即可。测序装置300与文库构建装置200相连，用于对T细胞受体α链CDR3编码序列的测序文库进行测序，以便获得由多个测序数据构成的测序结果。分析装置400与测序装置300相连，用于基于测序结果，确定个体的免疫状态。由此，利用该系统，能够有效地实施前述确定个体免疫状态的方法，从而有效地确定个体的免疫状态。根据本发明的一个实施例，分析装置400可以进一步包括比对单元，比对单元中存储有对照序列，用于将测序结果与对照序列进行比对，以便确定个体中所包含的T细胞受体α链CDR3的亚家族类型，以及各亚家族类型的相对比例。根据本发明的实施例，可以在分析装置400中预存对照序列信息，也可以采用分析装置400与远程数据库(图中未显示)相连进行联网操作的方法，将测序结果与对照序列进行比对。由此，可以通过将测序结果与对照序列例如已知的免疫基因组数据库IMGT进行比对，确定T细胞受体CDR3的亚家族类型分布以及各亚家族类型的相对比例，从而进一步提高确定个体免疫状态的效率。

根据本发明的另一方面，本发明还提供了一种试剂盒。利用该试剂盒可以有效地检测T细胞受体α链CDR3的编码序列，从而能够有效地确定个体的免疫状态。根据本发明的实施例，该试剂盒可以包含根据前面所述的引物组合物。由此，根据本发明的一个实施例，该试剂盒可以用于检测T细胞受体α链的V-J重排。根据本发明的具体示例，本发明的试剂盒还可以用于检测T细胞受体α链CDR3的编码序列。根据本发明的实施例，在该试剂盒中，第一引物组和第二引物组可以设置在不同的容器中，也可以设置在相同的容器中以组合物的方式存在。

下面参考具体实施例，对本发明进行说明，需要说明的是，这些实施例仅仅是说明性的，而不能理解为对本发明的限制。

若未特别指明，实施例中所采用的技术手段为本领域技术人员所熟知的常规手段，可以参照《分子克隆实验指南》第三版或者相关产品进行，所采用的试剂和产品也均为可商业获得的。未详细描述的各种过程和方法是本领域中公职的常规方法，所用试剂的来源、商品名以及有必要列出其组成成分者，均在首次出现时标明，其后所用相同试剂如无特殊说明，均以首次标明的内容相同。

一般方法：

参考图1，在本发明实施例中采用的富集人T细胞受体α链CDR3编码序列、构建测序文库和测序的方法主要包括：

1、从人外周血分离单个核细胞(PBMC)

抽取正常人外周血，具体地，用含抗凝剂的无菌采血管进行采血，然后利用Ficoll-Paque PLUS或Percoll淋巴细胞分离液进行密度梯度离心分离PBMC。

2、提取核酸样本

即提取基因组DNA或总RNA，具体地，利用蛋白酶K消化或者酚氯仿抽提的方法提取基因组DNA；利用Trizol法提取总RNA。

3、引物设计

分别以IMGT数据库中的T细胞受体α链CDR3的序列为参考序列，在T细胞受体α链CDR3的靠近FR3区域的最后一个氨基酸C之前设计引物，设计的引物易合成，上下游引物的退火温度差异不大，可以减少扩增偏向性，扩增出来的产物能够区分T细胞受体α链各个亚家族。所得到的引物序列如SEQ ID NO：1-89所示，前面已经对这些引物进行了详细描述，在此不再赘述。

4、多重PCR扩增

以上述核酸样本为模板，使用上面步骤设计的引物组合物进行多重PCR扩增，以便获得富集T细胞受体α链CDR3编码序列的扩增产物。然后，利用琼脂糖凝胶电泳以及MiniElutePCR纯化试剂盒(Qiagen)回收纯化扩增产物。其中，当以总RNA为模板时，需要先将RNA逆转录为cDNA。

5、构建测序文库

5.1、末端修复及3’末端添加碱基A

将回收纯化的扩增产物通过T4 DNA聚合酶、Klenow片段和T4多核苷酸激酶等酶的作用以dNTP为作用底物进行末端修复，获得经过末端修复的扩增产物。然后利用Klenow片段(3’-5’exo-)聚合酶及dATP在经过末端修复的扩增产物的3’末端添加碱基A，以便获得3’末端添加碱基A的扩增产物。然后，利用MiniElute PCR纯化试剂盒(Qiagen)回收纯化3’末端添加碱基A的扩增产物。

5.2、接头连接

将所得到的3’末端添加碱基A的扩增产物在T4 DNA连接酶的作用下与接头进行连接，以便获得连接产物。然后，利用琼脂糖凝胶电泳以及MiniElute PCR纯化试剂盒(Qiagen)回收纯化连接产物。

5.3、PCR扩增

以连接产物为模板，加入通用PCR引物和测序引物，用Phusion酶进行PCR扩增，以便获得第二扩增产物。然后，利用琼脂糖胶电泳回收纯化第二扩增产物，以便获得回收产物，该回收产物构成DNA测序文库。

6、测序及分析

将上述获得的DNA测序文库经安捷伦2100检测和Q-PCR定量后，利用Hiseq2000测序平台进行测序，以便获得由多个测序数据构成的测序结果，然后，以IMGT上T细胞受体α链CDR3的序列作为参考序列，对测序结果进行分析。

实施例1：

1.分离人外周血单个核细胞

1)取健康人新鲜外周血5ml于15ml的离心管中，并添加5ml PBS，混匀，然后将其靠管壁缓慢加入到装有6ml的单核细胞分离液的50ml离心管中，1,800rpm离心15min。

2)吸取单核细胞层于新的15ml离心管中，加入三倍体积的PBS，轻轻混匀，1,800rpm离心10min，弃上清，获得沉淀。

3)用1ml的PBS将上述沉淀重悬，然后转移至新的1.5ml EP管中，1,800rpm离心10min，弃上清，获得沉淀。

4)用100μl的PBS将上述步骤获得的沉淀重悬，则单核细胞提取完成。

2.核酸样本提取

利用DNA提取试剂盒(Qiagen)提取人外周血单个核细胞基因组DNA，具体地，包括：

1)将20μl QIAGEN蛋白酶加入200μl单核细胞样品中，混匀。

2)将200μl缓冲液AL加入样品中，充分混匀，56℃孵育10分钟。

3)加入200μl无水乙醇，充分混匀，将混合物转移到吸附柱上，8000r/m离心1分钟，弃废液。

4)然后加入500μl缓冲液AW1，8000r/m离心1分钟，弃废液。

5)再加入500ml缓冲液AW2，8000r/m离心1分钟，弃废液。

6)然后全速(14000r/m)空甩1分钟。

7)再加入200μl缓冲液AE，室温静置1分钟，8000r/m离心1分钟，以便提取获得DNA，保存于-20℃，备用。

3.多重PCR扩增

以上一步得到的DNA作为模板，采用具有SEQ ID NO：1-39所示的核苷酸序列的V区引物组成的第一引物组和具有SEQ ID NO：40-89所示的核苷酸序列的J区引物组成的第二引物组，进行多重PCR扩增。

具体地，首先，将浓度均为100μM的39种V区引物各取1μl混合，然后加11μl的水稀释混匀，以便获得第一引物组，则获得的第一引物组中各V区引物的浓度均为2μM。然后，同样将浓度均为100μM的50种J区引物各取1μl混合，以便获得第二引物组，则获得的第二引物组中各J区引物的浓度均为2μM。

然后，按下表的配比，配制多重PCR扩增的反应体系：

组分	体积(μl)
		2×QIAGEN Mutiplex PCR master mix	25
第一引物组	5
		第二引物组	5
5×Q溶液	5
		无RNA水	9

DNA	1
		总体积	50

然后，将配制好的反应体系按以下反应条件进行PCR扩增：

由此，获得扩增产物。

然后，将扩增产物进行2％琼脂糖凝胶电泳，并切取10-200bp的胶(如图3所示)，并用QIAquick Gel纯化试剂盒(Qiagen)对其进行纯化回收，然后将回收产物溶于34μl的洗脱缓冲液，备用。

4.末端修复

将上一步得到的扩增产物，按下表中的配比于1.5ml离心管中配制末端修复反应体系：

扩增产物	32μl
		10×多聚核苷酸激酶缓冲液	10μl
dNTP溶液(每种10mM)	3μl
		T4 DNA聚合酶	5μl
双蒸水	44μl
		Klenow片段	1μl
T4多聚核苷酸激酶	5μl
		总体积	100μl

然后将离心管放置于调至20℃的Thermomixer(Eppendorf)上反应30min，以便获得经过末端修复的扩增产物，然后利用QIAquick PCR纯化试剂盒(Qiagen)将经过末端修复的扩增产物进行纯化，最后将其溶于34μl洗脱缓冲液中，备用。

5.3’末端添加碱基A

将经过末端修复的扩增产物，按下表中的配比于1.5ml离心管中配制3’末端添加碱基A的反应体系：

经过末端修复的扩增产物	32μl
		10×blue缓冲液	5μl

dATP(稀释为1mM，GE公司)	10μl
		Klenow(3’-5’exo-)	3μl
总体积	50μl

然后将离心管放置于调至37℃的Thermomixer(Eppendorf)上反应30min，以便获得3’末端添加碱基A的的扩增产物，然后利用MiniElute PCR纯化试剂盒(Qiagen)将3’末端添加碱基A的的扩增产物进行纯化，最后将其溶于20μl洗脱缓冲液中，备用。

6.连接接头

将3’末端添加碱基A的的扩增产物，按下表中的配比于1.5ml离心管中配制接头连接的反应体系：

3’末端添加碱基A的的扩增产物	18μl
		2×Rapid连接缓冲液	25μl
PEI-接头(接头1和接头2，50μM)	4μl
		T4DNA连接酶(Rapid，L603-HC-L)	3μl
总体积	50μl

其中PEI-接头的序列为：

接头1：TACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO：90)；

接头2：5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCAC(SEQ ID NO：91)。

然后将离心管放置于调至20℃的Thermomixer(Eppendorf)上反应15min，以便获得连接产物，然后利用MiniElute PCR纯化试剂盒(Qiagen)将连接产物进行纯化，最后将其溶于28μl洗脱缓冲液中，备用。

7.PCR扩增

将上一步得到的连接产物，按下表中的配比配制PCR反应体系：

连接产物	12.5μl
		P1公用引物	1μl
标签7引物(Primer index 7)	1μl
		双蒸水	10.5μl
2×phusion master mix	25μl
		总体积	50μl

P1公用引物：

AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO：92)；

标签7引物(Primer index7)：

CAAGCAGAAGACGGCATACGAGATTCAAGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT(SEQ ID NO：93)。

然后，将配制好的反应体系于PCR仪上进行PCR反应，以便获得第二扩增产物，其中PCR反应条件为：

然后，利用QIAquick PCR纯化试剂盒(Qiagen)纯化回收200-300bp的第二扩增产物，以便获得回收产物，该回收产物构成DNA测序文库。然后，将获得的测序文库样品溶于20μl洗脱缓冲液。

8.文库检测

利用Agilent 2100 Bioanalyzer analysis system检测获得的测序文库中插入片段大小及含量；利用Q-PCR精确定量该文库的浓度。

9.测序与数据分析

文库检测合格后将按照双末端151个碱基的读长在Hiseq2000测序仪上进行测序及序列分析。

具体地，将检测合格的文库按照Q-PCR浓度在Hiseq-2000测序平台上采用边合成边测序的方法进行序列测定。为了将来源于不同样本制备的DNA文库在测序后区分开来，将6bp或8bp的标签序列通过接头或者PCR引物引入到片段的一侧，以便将不同文库直接混合后上机测序。测序时，先用SP1引物对样品DNA的一端进行测序，再用SP2引物对样品DNA的另一端进行测序。

然后，对获得的测序结果进行数据分析，其中分析数据时参考的序列为IMGT上TCRA的参考序列。具体地，首先对测序所得的原始数据进行基本分析，其主要包括以下步骤：对进行原始数据进行数据处理，通过接头或PCR引物上的序列标签区分不同样本的文库数据，对测序所得的原始数据进行去污染、去接头和去低质量过滤，以便确定reads；然后，将reads与IMGT数据库的参考序列进行V、J基因比对、分析，结果见下表1以及图4：

表1：reads分析比对结果

此外，图4显示了所有的V基因亚家族与J基因亚家族重排后相互配对和各种VJ配对分布以及CDR3的丰度。如图4所示，左侧坐标是J基因全部亚家族的分类，横坐标是V基因的每一种亚家族分类，两坐标相交点是V-J基因配对产生的一种CDR3序列，右侧颜色带指示每一方格的颜色深浅，代表每种V-J配对的丰度。从图4中可以看出，使用本发明提供的引物组合物能够全面地富集人类T细胞受体CDR3的序列，扩增出来的产物能够区分T细胞受体α链的各个亚家族。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

Claims

1.一种用于扩增T细胞受体α链CDR3编码序列的引物组合物，其特征在于，包括：

第一引物组，所述第一引物组由39种V区引物组成，所述39种V区引物的核酸序列分别如SEQ ID NO：1-39所示；以及

第二引物组，所述第二引物组由50种J区引物组成，所述50种J区引物的核苷酸序列分别如SEQ ID NO：40-89所示，

其中，

所述V区引物是正义链引物，所述J区引物是反义链引物，

所述T细胞受体为人类T细胞受体。

2.一种富集T细胞受体α链CDR3编码序列的方法，其特征在于，包括以下步骤：

提供核酸样本，所述核酸样本中包含编码T细胞受体α链CDR3的核酸序列；以及

利用权利要求1所述的引物组合物，以所述核酸样本作为模板，进行PCR扩增，以便获得富集所述T细胞受体α链CDR3编码序列的扩增产物。

3.根据权利要求2所述的方法，其特征在于，进一步包括：

从人外周血分离外周血单个核细胞；以及

从所述外周血单个核细胞提取所述核酸样本。

4.根据权利要求3所述的方法，其特征在于，所述外周血来源于正常人。

5.根据权利要求3所述的方法，其特征在于，通过密度梯度离心分离所述外周血单个核细胞。

6.根据权利要求2所述的方法，其特征在于，所述PCR扩增为多重引物PCR扩增。

7.根据权利要求6所述的方法，其特征在于，所述多重引物PCR扩增的退火温度为60摄氏度。

8.根据权利要求2所述的方法，其特征在于，进一步包括通过选自琼脂糖凝胶电泳、磁珠纯化和纯化柱纯化的至少一种分离纯化所述扩增产物。

9.根据权利要求2所述的方法，其特征在于，所述扩增产物的长度为100-200bp。

10.一种构建T细胞受体α链CDR3编码序列的测序文库的方法，其特征在于，包括以下步骤：

根据权利要求2-9任一项所述的方法，获得富集所述T细胞受体α链CDR3编码序列的扩增产物；以及

针对所述扩增产物，构建DNA测序文库，所述DNA测序文库构成所述T细胞受体α链CDR3编码序列的测序文库。

11.根据权利要求10所述的方法，其特征在于，针对所述扩增产物，构建DNA测序文库进一步包括：

对所述扩增产物进行末端修复，以便获得经过末端修复的扩增产物；

对所述经过末端修复的扩增产物进行3’端添加碱基A，以便获得3’末端添加碱基A的扩增产物；

将所述3’末端添加碱基A的扩增产物与接头相连，以便获得连接产物；

对所述连接产物进行PCR扩增，以便获得第二扩增产物；以及

将所述第二扩增产物进行纯化回收，以便获得回收产物，所述回收产物构成所述DNA测序文库。

12.根据权利要求11所述的方法，其特征在于，所述末端修复是利用Klenow片段、T4 DNA聚合酶和T4多核苷酸激酶进行的，所述Klenow片段具有5’→3’聚合酶活性和3’→5’外切酶活性，但缺少5’→3’外切酶活性。

13.根据权利要求11所述的方法，其特征在于，利用Klenow(3’-5’exo-)对所述经过末端修复的扩增产物进行3’端添加碱基A。

14.根据权利要求11所述的方法，其特征在于，将所述具有粘性末端A的扩增产物与接头相连是利用T4 DNA连接酶进行的。

15.根据权利要求11所述的方法，其特征在于，通过选自琼脂糖凝胶电泳、磁珠纯化和纯化柱纯化的至少一种分离纯化所述第二扩增产物。

16.一种确定T细胞受体α链CDR3编码序列的序列信息的方法，其特征在于，包括以下步骤：

根据权利要求10-15任一项所述的方法，构建T细胞受体α链CDR3编码序列的测序文库；以及

对所述T细胞受体α链CDR3编码序列的测序文库进行测序，以便确定所述T细胞受体α链CDR3编码序列的序列信息。

17.根据权利要求16所述的方法，其特征在于，利用选自Hiseq2000、SOLiD、454和单分子测序装置的至少一种进行所述测序。

18.一种确定个体免疫状态的系统，其特征在于，包括：

T细胞受体α链CDR3编码序列富集装置，所述T细胞受体α链CDR3编码序列富集装置中设置有权利要求1所述的引物组合物，以便对所述个体的核酸样本富集T细胞受体α链CDR3编码序列；

文库构建装置，所述文库构建装置与所述T细胞受体α链CDR3编码序列富集装置相连，以便针对所述经过富集的T细胞受体α链CDR3编码序列构建T细胞受体α链CDR3编码序列的测序文库；

测序装置，所述测序装置与所述文库构建装置相连，用于对所述T细胞受体α链CDR3编码序列的测序文库进行测序，以便获得由多个测序数据构成的测序结果；以及

分析装置，所述分析装置与所述测序装置相连，用于基于所述测序结果，确定所述个体的免疫状态。

19.根据权利要求18所述的系统，其特征在于，所述分析装置进一步包括比对单元，所述比对单元中存储有对照序列，用于将所述测序结果与所述对照序列进行比对，以便确定所述个体中所包含的T细胞受体α链CDR3的亚家族类型，以及各亚家族类型的相对比例。

20.一种试剂盒，其特征在于，所述试剂盒中设置有权利要求1所述的引物组合物。

21.根据权利要求20所述的试剂盒，其特征在于，所述试剂盒用于检测T细胞受体α链的V-J重排。

22.根据权利要求20所述的试剂盒，其特征在于，所述试剂盒用于检测T细胞受体α链CDR3的编码序列。