CN113999891A

CN113999891A - 用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的方法、一组引物和试剂盒

Info

Publication number: CN113999891A
Application number: CN202111095486.8A
Authority: CN
Inventors: 张镇海; 余学清; 唐海培; 曾惠昆; 汪启龙; 朱燕; 陈青云; 蓝春红; 关俊杰; 谢文汐
Original assignee: Guangdong General Hospital
Current assignee: Guangdong General Hospital
Priority date: 2021-09-17
Filing date: 2021-09-17
Publication date: 2022-02-01
Anticipated expiration: 2041-09-17
Also published as: CN113999891B

Abstract

本发明提供了用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的方法、一组引物和试剂盒：基于多重PCR文库制备方法，针对BCR的重链和轻链各自设计了一套引物，能扩增目前已发现的所有IgG、IgM、IgA、IgD、IgE、IgK和/或IgL的不同等位基因。该方法在逆转录过程中加入3’端UMI，然后在第一轮PCR过程中加入5’端UMI，使每条扩增的模板分子两端被独特配对的UMI序列标记，然后用特异性外侧Barcode引物进行第二轮PCR扩增。利用此方法构建文库获得的测序数据，可以在分析过程中利用配对UMI的丰度分布甄别并去除高通量测序数据中样本内嵌合体序列，从而获取更为准确的免疫组库数据。

Description

用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的方法、一组引物和试剂盒

技术领域

本发明属于生物技术领域，尤其是涉及高度准确地制备免疫组库高通量测序文库的方法、一组引物和试剂盒及其在下一代测序中的应用。

背景技术

B细胞是体液免疫的重要执行者，其细胞膜表面受体BCR及分泌的抗体是行使特异性免疫功能的重要分子。个体或组织内的所有BCR和抗体的集合称为抗体组库。抗体组库非常庞大且极其复杂。在B细胞发育过程中，胚系V(D)J基因重组及V-D和D-J连接区域碱基插入或缺失赋予了抗体组库极高多样性，形成了识别各种抗原的具有独特互补决定区3(CDR3)的幼稚B细胞的BCR。在接受抗原刺激后，幼稚B细胞表达激活诱导的胞苷脱氨酶AID并发生克隆扩增，诱导BCR发生体细胞超突变(SHM)及类型转换(CSR)，进而形成特异性识别和中和各种抗原，特别是那些入侵的病原体和体内积累的自身抗原的B细胞及抗体。此外，有限的高度同源的胚系V(D)J基因的重组导致抗体序列非常相似。因此，定量如此复杂多样的抗体组库面临巨大挑战。目前，抗体组库相关研究在多个领域展现出巨大应用前景，如包括病毒中和抗体及治疗性抗体在内的高亲和抗原特异性抗体的挖掘、疫苗的开发、B细胞恶性肿瘤的检测和机体免疫状态的监测，准确阐述并定量如此庞大而又高度相似的抗体组库是推进其在各领域应用的关键。

B细胞免疫组库测序，实际上是检测B细胞上负责识别并特异结合抗原的膜表面免疫球蛋白，我们称为B-cell receptor(BCR)，BCR是由两条重链和两条轻链组成。编码BCR的4个基因簇V(可变区)、D(高变区)、J(编码蛋白连接V、C区的结合区)、C(恒定区)，B细胞通过V(D)J重组，使BCR基因序列极为丰富，但每个B细胞只表达一种特定的BCR，也就是只能识别一种抗原。

随着高通量抗体组库测序技术(Rep-seq)的发展，研究者可以一次性获得数以千万的抗体序列，这为深入解析抗体组库带来了希望。但是，由于抗体序列高度相似，在Rep-seq文库制备和测序过程中极易发生模板转换和聚合酶链式反应(PCR)介导的重组，产生具有错配及插入和缺失的嵌合抗体序列，因而误导CDR-H3序列的分析，并被误认为是克隆扩增和成熟过程中自然发生的SHM的结果，进而误导抗体成熟路径分析及抗原特异性抗体的寻找。我们研究发现升高退火温度和降低PCR循环数可减少嵌合体序列的产生。但是现有的实验技术和测序分析方法均无法分辨及去除测序数据中的样本内嵌合体序列，这对样本内的多样性定量分析产生了极大的干扰。

Rep-seq产生的嵌合抗体序列可分为三类：文库间嵌合抗体序列、样本间嵌合抗体序列和样本内嵌合抗体序列。文库间和样本间嵌合抗体序列可以顺利去除，如通过用双端index标记每个库并根据index的配对信息去除库间嵌合抗体序列，通过用双端条形码(Barcode)标记每个样本并根据配对Barcode去除样本间嵌合抗体序列。虽然有研究表明研究利用序列比对可以识别少量已知序列扩增形成的样本内嵌合抗体序列，但由于彼此高度相似的胚系V(D)J基因经体细胞重组产生了极其多样又高度相似的抗体，导致无法从序列上区分嵌合抗体序列与真实抗体序列。虽然嵌合抗体序列对抗体组库特征分析及高亲和性抗体寻找的不利影响一直被广泛关注，但目前仍无法明确定量并去除Rep-seq数据中的样本内嵌合抗体序列。

发明内容

针对现有技术中嵌合体序列产生存在的不足之处，本发明设计了一种全新的免疫组库测序文库构建方法，能甄别并去除样本内嵌合体序列，达到真正还原免疫组库真实情况的目的。

本发明的目的在于去除测序数据中的嵌合体序列而提供一种高度准确的免疫组库测序文库的构建方法；设计能扩增目前已发现的人和C57BL6小鼠的所有IgH和IgK的不同等位基因的引物集。除非另外定义，本文中使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同意义。

在本文中，引物序列中的字母“N”选自碱基A、T、C和G中的任意一种；引物序列中的字母“R”选自碱基A和G中的任意一种；引物序列中的字母“W”选自碱基A和T中的任意一种；引物序列中的字母“Y”选自碱基C和T中的任意一种；引物序列中的字母“S”选自碱基C和G中的任意一种；引物序列中的字母“B”选自碱基T、C和G中的任意一种。

一方面，本发明提供了一种甄别样本内嵌合体序列的免疫组库高通量测序文库的构建方法。其特点在于，基于多重PCR文库制备方法，同时引入双端UMI(unique molecularidentifier，由随机碱基组成，本发明设计的UMI的结构为NNNNNNNN，全长为8bp，其随机数目为4⁸个，具有极好的随机性)和双端Barcode(12bp的可变序列和4bp的固定碱基ACTG)特异性标记模板链分子，使得每个样本被特异的双端Barcode标记，样本内每个模板分子被特异的双端UMI标记，通过后续分析测序结果中配对Barcode以区分样本间的嵌合体序列，通过分析配对UMI的丰度分布以甄别样本内的嵌合体序列，从而获取更为准确的免疫组库信息。

为了实现上述目的，本发明采取如下的用于去除样本内嵌合体序列的免疫组库高通量测序文库的构建方法：以带有下游Barcode及UMI的BCR亚型特异性引物(ISP)逆转录合成带特异性下游Barcode及UMI标记的cDNA第一链，然后利用带上游Barcode及UMI的上游引物进行1个循环的PCR，产物纯化后利用配对的Barcode引物进行第二轮25循环的PCR。

本发明公开了一种用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的方法，所述方法按照以下步骤进行：

(1)提取样本中的总RNA；

(2)利用带有下游Barcode和UMI的BCR亚型特异性引物ISP对步骤(1)中的总RNA进行逆转录，合成并纯化带特异性下游Barcode及UMI标记的cDNA第一链；

(3)利用带有上游Barcode和UMI的上游引物对纯化的cDNA第一链进行第一轮RCR扩增，经纯化后获得第一轮扩增产物；

(4)利用配对的上游Barcode引物和下游Barcode引物对第一轮扩增产物进行第二轮RCR扩增，经纯化后获得第二轮扩增产物。

进一步地，UMI长8bp由随机碱基组成，其碱基序列为NNNNNNNN，Barcode为12bp的可变序列和4bp的固定碱基ACTG。

进一步地，所述方法还包括：(5)将测序接头连接到纯化的第二轮扩增产物的两端。

进一步地，在步骤(2)中，在逆转录后，先进行RNase H消化，然后再进行纯化cDNA第一链。

进一步地，所述样本选自人类和动物的外周血、健康组织和病变组织。

进一步地，步骤(4)中配对的上游Barcode引物和下游Barcode引物为SEQ ID NO：63-64。

进一步地，步骤(2)中带有下游Barcode和UMI的BCR亚型特异性引物ISP包括SEQID NO：11-15、23和35，步骤(3)中带有上游Barcode和UMI的上游引物包括SEQ ID NO：1-10、16-22、24-34。

进一步地，步骤(2)中的ISP包括SEQ ID NO：49-54、62，步骤(3)中的上游引物包括SEQ ID NO：36-48、55-61。

本发明还公开了一组用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的引物，所述引物包括带有下游Barcode和UMI的BCR亚型特异性引物ISP、带有上游Barcode和UMI的上游引物以及配对的上游Barcode引物和下游Barcode引物，UMI由随机碱基组成，长8bp，其碱基序列为NNNNNNNN，Barcode为12bp的可变序列和4bp的固定碱基ACTG。

进一步地，配对的上游Barcode引物和下游Barcode引物为SEQ ID NO：63-64。

进一步地，带有下游Barcode和UMI的BCR亚型特异性引物ISP包括SEQ ID NO：11-15、23和35，带有上游Barcode和UMI的上游引物包括SEQ ID NO：1-10、16-22、24-34。

进一步地，带有下游Barcode和UMI的BCR亚型特异性引物ISP包括SEQ ID NO：49-54、62，带有上游Barcode和UMI的上游引物包括SEQ ID NO：36-48、55-61。

本发明还公开了一种用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的试剂盒，其特征在于，所述试剂盒包括一组用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的引物，所述引物包括带有下游Barcode和UMI的BCR亚型特异性引物ISP、带有上游Barcode和UMI的上游引物以及配对的上游Barcode引物和下游Barcode引物，UMI由随机碱基组成，长8bp，其碱基序列为NNNNNNNN，Barcode为12bp的可变序列和4bp的固定碱基ACTG。

本发明技术效果：(1)本发明基于多重PCR文库制备方法，同时引入双端UMI和双端Barcode特异性标记模板链分子，使得每个样本被特异的双端Barcode标记，样本内每个模板分子被特异的双端UMI标记，通过后续分析测序结果中配对Barcode以区分样本间的嵌合体序列，通过分析配对UMI的丰度分布以甄别样本内的嵌合体序列，从而获取更为准确的免疫组库信息；(2)本发明以带有下游Barcode及UMI的BCR亚型特异性引物逆转录合成带特异性下游Barcode及UMI标记的cDNA第一链，然后利用带上游Barcode及UMI的上游引物进行1个循环的PCR，以实现对样本内的每一条模板分子标记特异性配对的UMI分子；(3)本发明针对人和C57BL6小鼠BCR的重链及轻链各自设计了一套引物，能扩增目前已发现的所有IgG、IgM、IgA、IgD、IgE、IgK和/或IgL的不同等位基因；(4)本发明通过分析测序结果中相同序列的配对UMI的种类数，可以校正多重PCR各引物的偏好性，实现对每个DNA分子进行定量，从而获得更准确的免疫组库信息。

附图说明

图1为在逆转录及第二链cDNA合成过程中加双端Barcode和双端UMI，随后通过通用引物扩增，以实现无偏差扩增的文库构建流程图。

图2为人类幼稚B细胞BCR组库文库DNA胶图。

图3为人类幼稚B细胞BCR组库文库质控图。

图4为生物信息学分析流程图。

图5为C57bl/6小鼠BCR组库文库DNA胶图。

具体实施方式

以下实施例的说明只是用于帮助理解本发明的方法及其核心思想，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以对本发明进行若干改进和修饰，这些改进和修饰也落入本发明权利要求的保护范围内。对所公开的实施例的下述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其他实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例中，而是可以应用于符合与本文所公开的原理和新颖特点相一致的更宽的范围。

实施例中未注明具体技术或条件，按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。

实施例1：样本RNA的获得

1.利用EDTA抗凝管采集人类外周血，通过密度梯度离心分离人类外周血单核细胞(PBMC)；

2.利用人类幼稚B细胞分选试剂盒(Stemcell，17254)分选获得人类幼稚B细胞

3.计数人类外周血单核细胞以及幼稚B细胞并提取总RNA(Qiagen，74106)，浓度如表7。

表7

实施例2：人类BCR组库文库构建

利用实施例1中获得的总RNA为模板，用带有下游Barcode及UMI的BCR亚型特异性引物逆转录合成cDNA第一链，然后利用带上游Barcode及UMI的leader区及V基因特异性引物的混合物进行1个循环的PCR，实现对样本内的每一条模板分子标记特异性配对的UMI，随后利用上下游Barcode引物进行无偏差扩增，示意图如图1，具体过程如下：

1.逆转录合成cDNA

使用带有下游Barcode及UMI的BCR亚型特异性引物(SEQ ID NO：11-15、23和35)进行逆转录，具体如下：

a.按照表8配置混合体系，并在PCR仪上进行反应，反应程序为：65℃，5min，反应程序结束后立马把产物放于冰上3min。

表8

注：ISP引物为SEQ ID NO：11-15、23和35。

b.按照表9配置混合体系，并在PCR仪上进行反应，反应程序为：42℃，2min。

表9

c.向上述反应体系中加入1μl SuperScript II Reverse Transcriptase(ThermoFisher，18064071)，吹打混匀后，在PCR仪上进行反应，反应程序为：42℃50min，70℃15min。

2.cDNA纯化

(1)往上述反应体系中各加入0.2μl RNase H(10U/μl)，并在PCR仪上进行反应，消化与cDNA杂合的RNA，反应程序为：37℃20min；

(2)加入1.8倍体积的AMPure XP磁珠(Beckman，A63881)，充分混匀后孵育5分钟，然后置于磁力架5分钟，用70％乙醇洗涤两遍，晾干5分钟，加水充分重悬并孵育5分钟，然后置于磁力架5分钟，吸取上清，得到产物1(即第一链cDNA)。

3.第一次PCR反应

a.按表10配置PCR反应体系：

表10

注：Primer mix为带有上游Barcode及UMI的leader区及V基因特异性引物的混合物(SEQ ID NO：1-10、16-22、24-34。)，2xKAPA HiFiHotStartReadyMix(Roche，KK2602)。

b.PCR仪设置如表11：

表11

4.双链DNA纯化

往上述两种PCR体系中分别加入0.8倍体积的SPRISelect磁珠(Beckman，B23318)，充分混匀后孵育5分钟，然后置于磁力架5分钟，用80％乙醇洗涤两遍，晾干5分钟，加水充分重悬并孵育5分钟，然后置于磁力架5分钟，吸取上清，得到产物2。

5.第二次PCR反应

(1)按表12配置PCR反应体系：

表12

注：Primer F即为上游Barcode引物SEQ ID NO：63，Primer R即为下游Barcode引物SEQ ID NO：64。

(2)PCR仪设置如表13：

表13

6.凝胶电泳及纯化

PCR产物跑胶鉴定(幼稚B细胞IgM扩增产物，图2)，将约为500bp大小的目的条带割胶，利用DNA纯化柱(MACHEREY-NAGEL，740609.25)纯化后得到产物3。浓度如表14：

表14

7.测序接头连接

(1)计算需要建库测序样本的摩尔质量，根据拟获得的数据量调整建库所需的产物量，利用建库试剂盒(PerkinElmer，NOVA-5149-01)将测序接头连接到产物3的两端。

(2)加入0.6倍体积的SPRISelect磁珠，充分混匀后孵育5分钟，然后置于磁力架5分钟，用80％乙醇洗涤两遍，晾干5分钟，加水充分重悬并孵育5分钟，然后置于磁力架5分钟，吸取上清，得到产物4，进行质控并测序，质控图如图3。

实施例3：去除人类幼稚B细胞抗体组库测序数据中的嵌合体序列

通过生物信息学分析流程去除实施例2中的人类幼稚B细胞抗体组库测序数据中的嵌合体序列，具体如图4。

1.下机数据通过配对Barcode识别和去除样本间嵌合抗体序列；

2.基于UMI对的丰度分布去除服从poisson分布的样本内嵌合抗体序列；

3.根据CDR3s和UMI对重新聚类并建立一致性序列，消除在PCR和高通量测序中引入的碱基错误，得到真实的抗体序列。

去除嵌合体及构建一致性序列前后测序数据量如表15。

表15

实施例4：C57bl/6小鼠抗体组库文库构建

以C57bl/6小鼠的外周血、脾脏、骨髓的总RNA为模板，用带有下游Barcode及UMI的BCR亚型特异性引物逆转录合成cDNA第一链，然后利用带上游Barcode及UMI的V基因特异性引物的混合物进行1个循环的PCR，实现对样本内的每一条模板分子标记特异性配对的UMI，随后利用上下游Barcode引物进行无偏差扩增，示意图如图1，具体过程如下：

1.提取RNA

(1)解剖小鼠并采集外周血、脾脏、骨髓；

(1)利用RNeasy试剂盒提取总RNA，浓度如表16。

表16

2.逆转录合成cDNA

使用带有下游Barcode及UMI的ISP(SEQ ID NO：49-54、62)进行逆转录，具体如下：

a.按照表17配置混合体系，并在PCR仪上进行反应，反应程序为：65℃，5min，反应程序结束后立马把产物放于冰上3min。

表17

注：ISP引物为SEQ ID NO：49-54、62。

b.按照表18配置混合体系，并在PCR仪上进行反应，反应程序为：42℃，2min。

表18

c.向上述反应体系中加入1μl SuperScript II Reverse Transcriptase，吹打混匀后，在PCR仪上进行反应，反应程序为：42℃50min，70℃15min。

3.cDNA纯化

(2)加入1.8倍体积的AMPure XP磁珠，充分混匀后孵育5分钟，然后置于磁力架5分钟，用70％乙醇洗涤两遍，晾干5分钟，加水充分重悬并孵育5分钟，然后置于磁力架5分钟，吸取上清，得到产物1(即第一链cDNA)。

4.第一次PCR反应

a.按表19配置PCR反应体系：

表19

注：Primer mix为带有上游Barcode及UMI的IgHV或IgKV基因特异性引物的混合物(SEQ ID NO：36-48、55-61)。

b.PCR仪设置如表20：

表20

5.双链DNA纯化

往上述两种PCR体系中分别加入0.8倍体积的SPRISelect磁珠，充分混匀后孵育5分钟，然后置于磁力架5分钟，用80％乙醇洗涤两遍，晾干5分钟，加水充分重悬并孵育5分钟，然后置于磁力架5分钟，吸取上清，得到产物2。

6.第二次PCR反应

(1)按表21配置PCR反应体系：

表21

(2)PCR仪设置如表22：

表22

7.凝胶电泳及纯化

PCR产物跑胶鉴定(如图5)，将约为500bp大小的目的条带割胶，利用DNA纯化柱纯化后得到产物3。浓度如表23：

表23

8.测序接头连接

(1)计算需要建库测序样本的摩尔质量，根据拟获得的数据量调整建库所需的产物量，利用建库试剂盒将测序接头连接到产物3的两端。

(2)加入0.6倍体积的SPRISelect磁珠，充分混匀后孵育5分钟，然后置于磁力架5分钟，用80％乙醇洗涤两遍，晾干5分钟，加水充分重悬并孵育5分钟，然后置于磁力架5分钟，吸取上清，得到产物4，进行质控并测序。

<110>广东省人民医院

<120>用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的方法、一组引物和试剂盒

<160> 64

<170> 电子序列表制作及校验工具V1.0

<210> 1

<211> 42

<212> DNA

<213> 人工序列

<400> 1

cgccaagtgt ctatgcnnnn nnnncaggtc accttgaggg ag 42

<210> 2

<211> 42

<212> DNA

<213>人工序列

<400> 2

cgccaagtgt ctatgcnnnn nnnncaggtg cagctggtgc ag 42

<210> 3

<211> 46

<212> DNA

<213>人工序列

<400> 3

cgccaagtgt ctatgcnnnn nnnncaggtg cagctacagc agtggg 46

<210> 4

<211> 46

<212> DNA

<213>人工序列

<400> 4

cgccaagtgt ctatgcnnnn nnnncaggtg cagctgcagg agtcgg 46

<210> 5

<211> 47

<212> DNA

<213>人工序列

<400> 5

cgccaagtgt ctatgcnnnn nnnncaggtc cagctggtgc agtctgg 47

<210> 6

<211> 46

<212> DNA

<213>人工序列

<400> 6

cgccaagtgt ctatgcnnnn nnnnttaaaa ggtgtccagt gtgagg 46

<210> 7

<211> 45

<212> DNA

<213>人工序列

<400> 7

cgccaagtgt ctatgcnnnn nnnncaggta cagctgcagc agtca 45

<210> 8

<211> 47

<212> DNA

<213>人工序列

<400> 8

cgccaagtgt ctatgcnnnn nnnncaggtg cagctggtgg agtctgg 47

<210> 9

<211> 44

<212> DNA

<213>人工序列

<400> 9

cgccaagtgt ctatgcnnnn nnnncaacta caggtgccca ctcc 44

<210> 10

<211> 45

<212> DNA

<213>人工序列

<400> 10

cgccaagtgt ctatgcnnnn nnnngaggtg cagctggtgg agtct 45

<210> 11

<211> 46

<212> DNA

<213>人工序列

<400> 11

agccgacaac cttacgnnnn nnnncccttg gtggargcct gargag 46

<210> 12

<211> 46

<212> DNA

<213>人工序列

<400> 12

agccgacaac cttacgnnnn nnnngcggat gcactcccct gargag 46

<210> 13

<211> 46

<212> DNA

<213>人工序列

<400> 13

agccgacaac cttacgnnnn nnnnctggtc ggggatgcct gargag 46

<210> 14

<211> 46

<212> DNA

<213>人工序列

<400> 14

agccgacaac cttacgnnnn nnnngccttg gtgggtgcct gargag 46

<210> 15

<211> 46

<212> DNA

<213>人工序列

<400> 15

agccgacaac cttacgnnnn nnnnctctgt gtggaggcct gargag 46

<210> 16

<211> 44

<212> DNA

<213>人工序列

<400> 16

cgccaagtgt ctatgcnnnn nnnngagatt gtgatgaccc agac 44

<210> 17

<211> 44

<212> DNA

<213>人工序列

<400> 17

cgccaagtgt ctatgcnnnn nnnngatatt gtgatgactc agtc 44

<210> 18

<211> 44

<212> DNA

<213>人工序列

<400> 18

cgccaagtgt ctatgcnnnn nnnnaatttc cagatgactc agtc 44

<210> 19

<211> 44

<212> DNA

<213>人工序列

<400> 19

cgccaagtgt ctatgcnnnn nnnngaaata gtgatgacgc agtc 44

<210> 20

<211> 44

<212> DNA

<213>人工序列

<400> 20

cgccaagtgt ctatgcnnnn nnnngacatc gtgatgaccc agtc 44

<210> 21

<211> 44

<212> DNA

<213>人工序列

<400> 21

cgccaagtgt ctatgcnnnn nnnngaaacg acactcacgc agtc 44

<210> 22

<211> 44

<212> DNA

<213>人工序列

<400> 22

cgccaagtgt ctatgcnnnn nnnngacatc cagttgaccc agtc 44

<210> 23

<211> 50

<212> DNA

<213>人工序列

<400> 23

agccgacaac cttacgnnnn nnnngatgaa gacagatggt gcagccacag 50

<210> 24

<211> 44

<212> DNA

<213>人工序列

<400> 24

cgccaagtgt ctatgcnnnn nnnncagtct gtgctgactc agcc 44

<210> 25

<211> 44

<212> DNA

<213>人工序列

<400> 25

cgccaagtgt ctatgcnnnn nnnntcctat gagctgactc agcc 44

<210> 26

<211> 44

<212> DNA

<213>人工序列

<400> 26

cgccaagtgt ctatgcnnnn nnnntcctct gagctgactc agct 44

<210> 27

<211> 45

<212> DNA

<213>人工序列

<400> 27

cgccaagtgt ctatgcnnnn nnnntcctcc atgctgactc aggag 45

<210> 28

<211> 44

<212> DNA

<213>人工序列

<400> 28

cgccaagtgt ctatgcnnnn nnnntcctct gggccaactc aggt 44

<210> 29

<211> 44

<212> DNA

<213>人工序列

<400> 29

cgccaagtgt ctatgcnnnn nnnncagcct gtgctgactc aatc 44

<210> 30

<211> 45

<212> DNA

<213>人工序列

<400> 30

cgccaagtgt ctatgcnnnn nnnncaggct gtggtgactc aggag 45

<210> 31

<211> 44

<212> DNA

<213>人工序列

<400> 31

cgccaagtgt ctatgcnnnn nnnnggtgac ccaggagcca tcgt 44

<210> 32

<211> 44

<212> DNA

<213>人工序列

<400> 32

cgccaagtgt ctatgcnnnn nnnncaggca gggctgactc agcc 44

<210> 33

<211> 44

<212> DNA

<213>人工序列

<400> 33

cgccaagtgt ctatgcnnnn nnnnctcagt gtccgggtct cctg 44

<210> 34

<211> 44

<212> DNA

<213>人工序列

<400> 34

cgccaagtgt ctatgcnnnn nnnnaattct atgctgactc agcc 44

<210> 35

<211> 48

<212> DNA

<213>人工序列

<400> 35

agccgacaac cttacgnnnn nnnnccttgt tggcttgrag ctcctcag 48

<210> 36

<211> 44

<212> DNA

<213>人工序列

<400> 36

cgccaagtgt ctatgcnnnn nnnngaggtc cagcttcagc agtc 44

<210> 37

<211> 44

<212> DNA

<213>人工序列

<400> 37

cgccaagtgt ctatgcnnnn nnnncatgtc caactgcagc agcc 44

<210> 38

<211> 44

<212> DNA

<213>人工序列

<400> 38

cgccaagtgt ctatgcnnnn nnnngaggtg cagcttgttg agtc 44

<210> 39

<211> 44

<212> DNA

<213>人工序列

<400> 39

cgccaagtgt ctatgcnnnn nnnngaagtg cagctgttgg agac 44

<210> 40

<211> 44

<212> DNA

<213>人工序列

<400> 40

cgccaagtgt ctatgcnnnn nnnncaggct tatctacagc agtc 44

<210> 41

<211> 44

<212> DNA

<213>人工序列

<400> 41

cgccaagtgt ctatgcnnnn nnnncaggtg cagctgaagg agtc 44

<210> 42

<211> 44

<212> DNA

<213>人工序列

<400> 42

cgccaagtgt ctatgcnnnn nnnngaggtg aagcttctcc agtc 44

<210> 43

<211> 44

<212> DNA

<213>人工序列

<400> 43

cgccaagtgt ctatgcnnnn nnnngaggtg aagctggtgg agtc 44

<210> 44

<211> 44

<212> DNA

<213>人工序列

<400> 44

cgccaagtgt ctatgcnnnn nnnngaagtg aagcttgagg agtc 44

<210> 45

<211> 44

<212> DNA

<213>人工序列

<400> 45

cgccaagtgt ctatgcnnnn nnnngatgtg aacctggaag tgtc 44

<210> 46

<211> 47

<212> DNA

<213>人工序列

<400> 46

cgccaagtgt ctatgcnnnn nnnncaggtt attctgaaag agtctgg 47

<210> 47

<211> 44

<212> DNA

<213>人工序列

<400> 47

cgccaagtgt ctatgcnnnn nnnncagatc cagttggtac agtc 44

<210> 48

<211> 44

<212> DNA

<213>人工序列

<400> 48

cgccaagtgt ctatgcnnnn nnnncaggtt cagctgcagc agtc 44

<210> 49

<211> 47

<212> DNA

<213>人工序列

<400> 49

agccgacaac cttacgnnnn nnnnaggggc cagtggatag achgatg 47

<210> 50

<211> 47

<212> DNA

<213>人工序列

<400> 50

agccgacaac cttacgnnnn nnnnagggac caagggatag acagatg 47

<210> 51

<211> 48

<212> DNA

<213>人工序列

<400> 51

agccgacaac cttacgnnnn nnnnaggggg aagacatttg ggaaggac 48

<210> 52

<211> 47

<212> DNA

<213>人工序列

<400> 52

agccgacaac cttacgnnnn nnnnggagtg tcagtgggta gatggtg 47

<210> 53

<211> 47

<212> DNA

<213>人工序列

<400> 53

agccgacaac cttacgnnnn nnnntgcact ctgagaggag gaacatg 47

<210> 54

<211> 47

<212> DNA

<213>人工序列

<400> 54

agccgacaac cttacgnnnn nnnngtagag ctgagggttc ctgatag 47

<210> 55

<211> 44

<212> DNA

<213>人工序列

<400> 55

cgccaagtgt ctatgcnnnn nnnngatgtt gtgatgaccc agac 44

<210> 56

<211> 44

<212> DNA

<213>人工序列

<400> 56

cgccaagtgt ctatgcnnnn nnnngaaatt gtgctcaccc agtc 44

<210> 57

<211> 44

<212> DNA

<213>人工序列

<400> 57

cgccaagtgt ctatgcnnnn nnnngacatt gtgatgaccc agtc 44

<210> 58

<211> 44

<212> DNA

<213>人工序列

<400> 58

cgccaagtgt ctatgcnnnn nnnngaaatt gtgctgactg tgtc 44

<210> 59

<211> 44

<212> DNA

<213>人工序列

<400> 59

cgccaagtgt ctatgcnnnn nnnngaaaca actgtgaccc agtc 44

<210> 60

<211> 44

<212> DNA

<213>人工序列

<400> 60

cgccaagtgt ctatgcnnnn nnnngacatc cagatgacac agtc 44

<210> 61

<211> 44

<212> DNA

<213>人工序列

<400> 61

cgccaagtgt ctatgcnnnn nnnnaatatc caggtgatcc agtc 44

<210> 62

<211> 47

<212> DNA

<213>人工序列

<400> 62

agccgacaac cttacgnnnn nnnnggatgg tgggaagatg gatacag 47

<210> 63

<211> 47

<212> DNA

<213>人工序列

<400> 63

cgccaagtgt ctatgc 16

<210> 64

<211> 47

<212> DNA

<213>人工序列

<400> 64

agccgacaac cttacg 16

Claims

1.一种用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的方法，其特征在于，所述方法按照以下步骤进行：

(1)提取样本中的总RNA；

2.根据权利要求1所述的方法，其特征在于，UMI由随机碱基组成，长8bp，其碱基序列为NNNNNNNN，Barcode为12bp的可变序列和4bp的固定碱基ACTG。

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

(5)将测序接头连接到纯化的第二轮扩增产物的两端。

4.根据权利要求1所述的方法，其特征在于，在步骤(2)中，在逆转录后，先进行RNase H消化，然后再进行纯化cDNA第一链。

5.根据权利要求1所述的方法，其特征在于，所述样本选自人类和动物的外周血、健康组织和病变组织。

6.根据权利要求1所述的方法，其特征在于，步骤(4)中配对的上游Barcode引物和下游Barcode引物为SEQ ID NO：63-64。

7.根据权利要求6所述的方法，其特征在于，步骤(2)中带有下游Barcode和UMI的BCR亚型特异性引物ISP包括SEQ ID NO：11-15、23和35，步骤(3)中带有上游Barcode和UMI的上游引物包括SEQ ID NO：1-10、16-22、24-34。

8.根据权利要求6所述的方法，其特征在于，步骤(2)中的ISP包括SEQ ID NO：49-54、62，步骤(3)中的上游引物包括SEQ ID NO：36-48、55-61。

9.一组用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的引物，其特征在于，所述引物包括带有下游Barcode和UMI的BCR亚型特异性引物ISP、带有上游Barcode和UMI的上游引物以及配对的上游Barcode引物和下游Barcode引物，UMI长8bp由随机碱基组成，其碱基序列为NNNNNNNN，Barcode为12bp的可变序列和4bp的固定碱基ACTG。

10.根据权利要求9所述的引物，其特征在于，配对的上游Barcode引物和下游Barcode引物为SEQ ID NO：63-64。

11.根据权利要求10所述的引物，其特征在于，带有下游Barcode和UMI的BCR亚型特异性引物ISP包括SEQ ID NO：11-15、23和35，带有上游Barcode和UMI的上游引物包括SEQ IDNO：1-10、16-22、24-34。

12.根据权利要求10所述的引物，其特征在于，带有下游Barcode和UMI的BCR亚型特异性引物ISP包括SEQ ID NO：49-54、62，带有上游Barcode和UMI的上游引物包括SEQ ID NO：36-48、55-61。

13.一组用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的试剂盒，其特征在于，所述试剂盒包括权利要求9-12之一所述的引物。