CN110734958A - 一种单分子标签免疫组库高通量测序文库构建方法 - Google Patents
一种单分子标签免疫组库高通量测序文库构建方法 Download PDFInfo
- Publication number
- CN110734958A CN110734958A CN201910972360.0A CN201910972360A CN110734958A CN 110734958 A CN110734958 A CN 110734958A CN 201910972360 A CN201910972360 A CN 201910972360A CN 110734958 A CN110734958 A CN 110734958A
- Authority
- CN
- China
- Prior art keywords
- seq
- primer
- immune repertoire
- throughput sequencing
- sequencing library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012165 high-throughput sequencing Methods 0.000 title claims abstract description 23
- 238000010276 construction Methods 0.000 title abstract description 10
- 238000006243 chemical reaction Methods 0.000 claims description 41
- 238000000034 method Methods 0.000 claims description 26
- 238000012163 sequencing technique Methods 0.000 claims description 25
- 230000004048 modification Effects 0.000 claims description 17
- 238000012986 modification Methods 0.000 claims description 17
- 230000003321 amplification Effects 0.000 claims description 11
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 11
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 claims description 10
- 238000012408 PCR amplification Methods 0.000 claims description 8
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 claims description 5
- 230000011987 methylation Effects 0.000 claims description 5
- 238000007069 methylation reaction Methods 0.000 claims description 5
- 125000000446 sulfanediyl group Chemical group *S* 0.000 claims description 5
- 238000010839 reverse transcription Methods 0.000 claims description 4
- 239000002299 complementary DNA Substances 0.000 claims description 2
- 239000002131 composite material Substances 0.000 claims description 2
- 230000035484 reaction time Effects 0.000 claims description 2
- 238000001514 detection method Methods 0.000 abstract description 8
- 238000005516 engineering process Methods 0.000 abstract description 5
- 108020004414 DNA Proteins 0.000 description 22
- 239000000047 product Substances 0.000 description 22
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 21
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 12
- 239000012264 purified product Substances 0.000 description 9
- 101100519158 Arabidopsis thaliana PCR2 gene Proteins 0.000 description 7
- 210000004369 blood Anatomy 0.000 description 7
- 239000008280 blood Substances 0.000 description 7
- 239000002096 quantum dot Substances 0.000 description 7
- 238000000246 agarose gel electrophoresis Methods 0.000 description 6
- 239000011324 bead Substances 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 238000010802 RNA extraction kit Methods 0.000 description 3
- 238000010804 cDNA synthesis Methods 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 238000010828 elution Methods 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000004445 quantitative analysis Methods 0.000 description 3
- 239000003161 ribonuclease inhibitor Substances 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 150000001413 amino acids Chemical class 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000002055 immunohistochemical effect Effects 0.000 description 2
- 238000007403 mPCR Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 101150102573 PCR1 gene Proteins 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明属于医学检测领域,具体涉及一种单分子标签免疫组库高通量测序文库构建方法。本发明利用类似5’RACE的SMART技术和特异性引物,可特异性捕获并无偏好扩增人源RNA中所有低丰度TCRα、TCRβ、BCR重链H、BCR轻链L、BCR轻链K的整个CDR区域(可以单独捕获扩增其中一项,也可以同时捕获扩增所有项目),并采取一种简单高效的方式对其进行高通量测序文库的构建,从而进行TCR和BCR免疫组库分析。
Description
技术领域
本发明属于医学检测领域,具体涉及一种单分子标签免疫组库高通量测序文库构建方法。
背景技术
免疫组库是指在任意指定时间点、个体内所有特异性不同的T淋巴细胞和B淋巴细胞克隆的总和。免疫组库测序是运用高通量测序技术来研究TCR或BCR编码基因多样性的一项技术,通过该技术可以反应T/B细胞克隆变化与疾病的关系,此方法目前在肿瘤、自身免疫性疾病、感染性疾病及移植等多个领域得到广泛应用。
DNA和RNA均可成为免疫组库的研究对象。但是,以DNA作为免疫组库测序模板有以下缺点:①扩增过程使用大量的引物对,但是引物之间不可能完美地匹配扩增,易产生非真实性的重组序列;②J-C区之间存在大量内含子使其下游引物必须位于J区;③引物设计来自已知的参考序列,无法捕获未知的序列。使用RNA作为模板建库,下游引物可以选自C区,具有高度的敏感性,而且使用一对引物即可从低丰度的转录本中快速扩增cDNA的5’末端,可最大限度避免PCR扩增偏好性,并且可以捕获未知的转录本。但是其也具有不可忽视的缺陷,例如,采用RACE方法进行建库,其生成的文库只包含可变区的一部分,只能对免疫组库的TCR或BCR,或部分亚型进行建库,并不能称为真正的免疫组库。
中国专利201410442470.3以全血mRNA为模板,基于5’RACE方法进行建库,但是只能单一检测TCR-β免疫组库,并不能检测TCR-α和BCR免疫组库,并且在PCR过程中会引入错配。
中国专利201510488029.3以cfDNA为模板,采用多重PCR扩增技术,能够实现BCR H链和TCRβ链的免疫组库检测,但是一方面由于多重PCR本身的技术缺点,会偏好性地扩增某个区域,会存在非特异性扩增,另一方面此专利并没有对TCR-α和BCR的轻链进行检测,不能说是完整的免疫组库。
除此之外,还有利用5’RACE或类似5’RACE方法进行建库的方法,但多是利用dTPrimer进行RT,然后进行两次PCR,最后再连接测序接头进行建库。这些方法,只能利用具有Poly A尾的RNA进行RT,对低丰度的转录本有局限性。
发明内容
本发明的目的是提供单分子标签免疫组库高通量测序文库构建方法。
根据本发明具体实施方式的单分子标签免疫组库高通量测序文库构建方法,所述方法包括以下步骤:
(1)提取样本总RNA;
(2)以步骤(1)得到的总RNA为模板,先后加入RT1引物、单分子标签进行逆转录和模板转换反应,得到带单分子标签的cDNA;
(3)以一链合成物为模板,加入TS-index引物和RT2引物,进行半巢式扩增,特异性扩增目标区域,并添加测序接头,得到带单分子标签的DNA;
(4)将特异性扩增产物分选纯化后,加入P7接头引物、P5接头引物,进行PCR扩增,得到测序文库。
优选地,所述步骤(2)中,所述的单分子标签的序列如SQE ID NO.1所示。
优选地,步骤(2)中,所述单分子标签的3’末端还连接有多个简并碱基,所述简并碱基的个数为1-20个。
优选地,所述简并碱基为原始碱基和/或修饰碱基,所述修饰碱基包括硫代修饰、甲基化修饰、LNA修饰和/或次黄嘌呤修饰。
优选地,所述RT1引物包括如SEQ ID NO.2、SEQ ID NO.3、SEQ ID NO.4、SEQ IDNO.5、SEQ ID NO.6、SEQ ID NO.7、SEQ ID NO.8、SEQ ID NO.9、和/或SEQ ID NO.10所示的序列。
优选地,所述RT2引物包括如SEQ ID NO.11、SEQ ID NO.12、SEQ ID NO.13、SEQ IDNO.14、SEQ ID NO.15、SEQ ID NO.16和/或SEQ ID NO.17所示的序列。
优选地,所述RT2引物的3’末端还连接有原始碱基或修饰碱基,其中,所述修饰碱基包括硫代修饰、甲基化修饰、LNA修饰和/或次黄嘌呤修饰。
优选地,步骤(3)中,所述TS-index引物的序列如SEQ ID NO.18所示。
优选地,TS-index引物3’端部分碱基可以与带单分子标签的TS-3G引物模板转换后的接头互补,5’端包含P7结合序列、Index序列和Read 2测序序列。
优选地,步骤(4)中,P7接头引物的序列如SEQ ID NO.19或SEQ ID NO.18所示,P5接头引物的序列如SEQ ID NO.20所示。
优选地,步骤(2)中,所述逆转录反应的反应温度为25-50℃,反应时间为30-90min。
优选地,所述样本包括人源TCRα、TCRβ、BCR重链H、BCR轻链L、BCR轻链K的CDR区域。
优选地,所述方法适用的技术平台为第二代测序平台。
优选地,本发明所用的引物序列如下:
注:其中Index-I7为illumina中公开的现有技术。
本发明的有益效果为:
本发明可特异性捕获并无偏好扩增人源RNA中所有低丰度TCRα、TCRβ、BCR重链H、BCR轻链L、BCR轻链K的整个CDR区域(可以单独捕获扩增其中一项,也可以同时捕获扩增所有项目),并采取一种简单高效的方式对其进行高通量测序文库的构建,从而进行TCR和BCR免疫组库分析。
本发明的构建免疫组库文库方法可以用于Roche、Illumina、ThermoFisher、Pacific Biosciences、华大基因、Oxford Nanopore Technologies、华因康、瀚海基因等高通量测序平台。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1显示免疫组库文库构建原理图;
图2显示免疫组库文库构建实验流程图;
图3显示本发明实施例1中1.5%琼脂糖凝胶电泳文库检测结果;
图4显示本发明实施例2中1.5%琼脂糖凝胶电泳文库检测结果;
图5显示本发明实施例3中1.5%琼脂糖凝胶电泳文库检测结果。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
以Illumina平台为例,结合实施例对本发明进一步说明。
本发明免疫组库文库构建方法的原理图和实验流程图分别如图1和图2所示:
首先获得总RNA,然后取一定量的总RNA,先后加入RT1引物组、单分子标签引物TS-3G-N和相应的反应试剂,在一定温度条件下反应合成带单分子标签的一链产物。
取获得的一链产物,加入特异性扩增引物RT2和P7接头引物,加入PCR1反应的试剂,按照相应的反应条件,扩增特异性的完整免疫组库。
最后通过PCR2,给获得的完整免疫组库添加上接头,获得两端分别包含P5和P7序列的上机免疫组库文库。
本发明所用引物如下:
1.免疫组库特异性PCR引物组RT1的序列见表1:
表1 RT1引物组序列
引物类型 | 引物名称 | 引物序列(5’->3’) |
TCRα | TCR-RT1-A | GTCTAGCACAGTTTTGTC |
TCRβ | TCR-RT1-B | GTATCTGGAGTCATTGA |
BCR H | BCR-RT1-IGHA | AGGCAGGCGATGACCACGTT |
BCR H | BCR-RT1-IGHG | CTTGACCAGGCAGCCCAGGGCCGCTGTG |
BCR H | BCR-RT1-IGHE | AGTCACGGAGGTGGCATTGGAGGGAATGT |
BCR H | BCR-RT1-IGHM | AGGGGGAAAAGGGTTGGGGCGGATGCACT |
BCR H | BCR-RT1-IGHD | TGGGGAACACATCCGGAGCCTTGGTGGGT |
BCR K | BCR-RT1-IGK | GCTCATCAGATGGCGGGAAGATGAAGA |
BCR L | BCR-RT1-IGL | TCACGGCTCCCGGGTAGAAGTCACTTATG |
使用过程中可以将引物组RT1中的一类或几类的组合应用。
采用半巢式策略,进一步特异性合成扩增目标片段,RT2和RT1一起使用,双重校对,大大提高特异性。免疫组库特异性PCR引物组RT2序列见表2:
表2 RT2引物组序列
引物组RT2选择性和引物RT1组的同一类型的一类或几类的组合使用。
将RT1引物与RT2引物组合可用于构建不同的文库,具体如下表:
序号 | 构建的文库类型 | 选择的RT1引物 | 选择的RT2引物 |
1 | TCRα | TCR-RT1-A | TCR-RT2-A |
2 | TCRβ | TCR-RT1-B | TCR-RT2-B |
3 | BCR H | BCR-RT1-IGHA/D/E/G/M | BCR-RT2-IGHJ |
4 | BCR K | BCR-RT1-IGK | BCR-RT2-IGKJ 1/2/3 |
5 | BCR L | BCR-RT1-IGL | BCR-RT2-IGLJ |
如果想同时构建TCRα和TCRβ文库,只需将序号1和2的引物混合一起即可,比如TCR-RT1-A和TCR-RT1-B混合做为RT1引物,TCR-RT2-A和TCR-RT2-B混合作为RT2引物,其它情况以此类推。
带单分子标签的TS-3G-N引物序列:
5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNNNNNX-3'。
其中,“N”代表简并碱基,单分子标签可以是1-20个的简并碱基组成,并不是只有这里列出的12个“N”,“N”的数量为1-20中任意自然数。同时,“N”不但可以是原始碱基,而且可以是修饰碱基,碱基修饰包括硫代、甲基化、LNA、次黄嘌呤等。
TS-index序列:
5'-CAAGCAGAAGACGGCATACGAGAT[Index-I7]GTGACTGGAGTTCAGACGTGT-3';
P7序列:5'-CAAGCAGAAGACGGCATACGAGAT-3';
P5接头引物(TS-Primer1)序列:
5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC-3'。
实施例1采用健康人全血RNA进行BCR重链H建库测序
1.1人源总RNA提取
按照全血总RNA提取试剂盒提取步骤进行总RNA的提取。
1.2 RT预处理
将总RNA与RT1引物进行预处理,按下表配制反应体系,混匀,置PCR仪上72℃处理3min,反应后立即置冰上2min。
组分 | 加入量 |
Total RNA | 10~1000ng |
RT1引物组(BCR-RT1-IGHA/D/E/G/M) | 1μl |
NF水 | 补至9μl |
1.3 First-strand cDNA合成和模板转换
在步骤1.2预处理的9μl反应物中,按下表加入RT反应试剂,进行First-strandcDNA合成和模板转换。
组分 | 体积(μL) |
5×First-strand Buffer | 4 |
DTT | 2 |
dNTP | 2 |
TS-3G-N(单分子标签) | 1 |
RNase Inhibitor | 1 |
RT酶 | 1 |
总体积 | 20 |
其中,TS-3G-N选择8个简并碱基作为分子标签,共有4的8次方种分子标签,可以标记65536种克隆型,序列为:
5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNX-3';
混匀瞬离后,PCR仪上25-50℃反应30-90min,70℃反应15min终止反应,得到产物A。
1.4 PCR扩增特异性的的完整免疫组库
取产物A,按下表配制反应体系,进行PCR反应。
组分 | 体积(μL) |
产物A | 20 |
2×KAPA HiFi HotStart ReadyMix | 25 |
RT2引物组(BCR-RT2-IGHJ) | 1 |
TS-Index | 1 |
NF水 | 3 |
总体积 | 50 |
PCR结束后使用AMPure XP beads分选纯化,保留500bp~1000bp的产物,用24μLNF水进行洗脱,得到产物B。
1.5 PCR2获得上机的免疫组库文库
按下表配制PCR2反应体系,并进行PCR反应:
PCR结束后,使用AMPure XP beads片段纯化,用30μL NF水进行洗脱。取其中5μL纯化产物进行1.5%琼脂糖凝胶电泳检测。取2μL纯化产物进行Qubit定量,按照MiSeq测序仪操作流程进行文库变性、稀释以及测序。
文库电泳检测分析结果。结果如图3所示,文库主条带在600bp-700bp之间,条带明亮清晰,与预期结果一致。
对纯化产物进行Qubit定量分析,结果显示,Qubit浓度为30.46ng/μl,构建的文库达到上机要求浓度,可用于上机测序。
通过生信分析和数据比对,上机结果数据统计见下表:
Metrics | RBCRH_L001 |
Total sequencing reads | 3634560 |
Successfully aligned reads | 3475150(95.61%) |
TRA chains | 20(0%) |
TRB chains | - |
IGH chains | 3475068(100%) |
IGK chains | 52(0%) |
IGL chains | 20(0%) |
clonotype count | 53380 |
MIGS_TOTAL | 333020 |
MIGS_GOOD_TOTAL | 63780 |
clonotype count with MIGS | 26810 |
结果如上表所示,文库的数据95.61%能够匹配上,而且匹配上的数据几乎完全是BCR重链H,结果特异性非常好。通过单分子标签,可以使克隆型数从53380降低到26810,降低了49.8%,说明单分子标签具有很强的校正能力。
文库测序的各免疫组库类型数据量排前10克隆结果见下表:
从克隆型结果结果看,本发明完整捕获了BCR重链的CDR3区,并且没有频率特别高的克隆型,这符合健康人的免疫组库的结果,表明结果正确。
特别地,数据分析时不引入分子标签分析,会出现下表所示的结果:
序号1和2的数据CDR3区几乎一致,只有其中一个碱基“C”变成了“T”,导致氨基酸编码由“P”变成了“L”,所以认为是两种克隆。但是通过引入分子标签,我们可以发现1和2的分子标签一致,说明由同一模板扩增而来,是同一种克隆,其中2号序列只占了极少部分,说明“T”是由于PCR扩增产生的错误。以上数据说明单分子标签对于结果的校正起到了非常重要的作用,这也解释了为什么加了分子标签分析后,克隆型数目会变少,因为单分子标签去除了很多误判的结果。
实施例2采用健康人全血RNA进行BCR轻链K和L建库测序
2.1人源总RNA提取
按照全血总RNA提取试剂盒提取步骤进行总RNA的提取。
2.2RT预处理
将总RNA与RT1引物进行预处理,按下表配制反应体系,混匀,置PCR仪上72℃处理3min,反应后立即置冰上2min。
组分 | 加入量 |
Total RNA | 10~1000ng |
RT1引物组(BCR-RT1-IGK/IGL) | 1μl |
NF水 | 补至9μl |
2.3First-strand cDNA合成和模板转换
在步骤2.2预处理的9μl反应物中,按下表加入RT反应试剂,进行First-strandcDNA合成和模板转换。
组分 | 体积(μL) |
5×First-strand Buffer | 4 |
20mM DTT | 2 |
10mM dNTP | 2 |
TS-3G-N(单分子标签) | 1 |
RNase Inhibitor | 1 |
RT酶 | 1 |
总体积 | 20 |
其中,TS-3G-N选择12个简并碱基作为分子标签,共有4的12次方种分子标签,可以标记16777216种克隆型,序列为:
5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNNNNNX-3'。
混匀瞬离后,PCR仪上25-50℃反应30-90min,70℃反应15min终止反应,得到产物A。
2.4 PCR扩增特异性的的完整免疫组库
取产物A,按下表配制反应体系,进行PCR反应。
组分 | 体积(μL) |
产物A | 20 |
2×KAPA HiFi HotStart ReadyMix | 25 |
RT2引物组(BCR-RT2-IGK/IGL) | 1 |
TS-Index | 1 |
NF水 | 3 |
总体积 | 50 |
PCR结束后使用AMPure XP beads分选纯化,保留500bp~1000bp的产物,用24μLNF水进行洗脱,得到产物B。
2.5 PCR2获得上机的免疫组库文库
按下表配制PCR2反应体系,并进行PCR反应:
PCR结束后,使用AMPure XP beads片段纯化,用30μL NF水进行洗脱。取其中5μL纯化产物进行1.5%琼脂糖凝胶电泳检测。取2μL纯化产物进行Qubit定量,按照MiSeq测序仪操作流程进行文库变性、稀释以及测序。
文库电泳检测分析结果。结果如图4所示,文库主条带在500bp-600bp之间,条带明亮清晰,与预期结果一致。
对纯化产物进行Qubit定量分析,结果如下:
样品 | Qubit浓度(ng/μL) |
RBCRK_L001 | 40.75 |
RBCRL_L001 | 34.61 |
因此,构建的文库达到上机要求浓度,可用于上机测序。
上机数据统计见下表:
Metrics | RBCRK_L001 | RBCRL_L001 |
Total sequencing reads | 2768769 | 3904325 |
Successfully aligned reads | 2711911(97.95%) | 3774167(96.67%) |
TRA chains | - | 81(0%) |
TRB chains | 10(0%) | 64(0%) |
IGH chains | 84(0%) | 610(0.02%) |
IGK chains | 2711827(100%) | 341(0.01%) |
IGL chains | - | 3773074(99.97%) |
clonotype count | 26617 | 33439 |
MIGS_TOTAL | 225871 | 235186 |
MIGS_GOOD_TOTAL | 49619 | 72104 |
clonotype count with MIGS | 14218 | 19257 |
结果表明,轻链K和轻链L文库的数据几乎完全能够匹配上,而且匹配上的数据几乎完全是BCR轻链,结果特异性好。通过单分子标签,可以使克隆型数分别降低了46.58%和42.41%,说明单分子标签具有很强的校正能力。
文库测序的各免疫组库类型数据量排前10克隆结果见下表:
从克隆型结果看,本发明完整捕获了BCR轻链的CDR3区,并且没有频率特别高的克隆型,符合健康人的免疫组库的结果,表明结果正确。
特别地,数据分析时不引入分子标签分析,会出现下表所示的结果:
序号1和2的数据CDR3区几乎一致,只有其中一个碱基“A”变成了“T”,导致氨基酸编码由“Y”变成了“F”,所以认为是两种克隆。但是通过引入分子标签,本发明发现1和2的分子标签一致,说明由同一模板扩增而来,是同一种克隆,其中2号序列只占了极少部分,说明“T”是由于PCR扩增产生的错误。同理,序号3和4也是同一情况,通过分子标签,本发明证明它们其实是同一种克隆,碱基“A”是碱基“G”在PCR扩增时产生的错误扩增。以上两组数据说明,单分子标签对于结果的校正起到了非常重要的作用,也解释加了分子标签分析后克隆型数目变少的原因,因为单分子标签去除了很多误判的结果。
实施例3采用健康人全血RNA进行TCRα/β、BCR重链H、轻链K和L建库测序
3.1人源总RNA提取
按照全血总RNA提取试剂盒提取步骤进行总RNA的提取。
3.2 RT预处理
将总RNA与RT1的所有引物进行预处理,按下表配制反应体系,混匀,置PCR仪上72℃处理3min,反应后立即置冰上2min。
组分 | 加入量 |
Total RNA | 10~1000ng |
RT1引物组(TCR&BCR-RT1-所有引物) | 1μl |
NF水 | 补至9μl |
3.3 First-strand cDNA合成和模板转换
在步骤3.2预处理的9μl反应物中,按下表加入RT反应试剂,进行First-strandcDNA合成和模板转换。
组分 | 体积(μL) |
5×First-strand Buffer | 4 |
20mM DTT | 2 |
10mM dNTP | 2 |
TS-3G-N(单分子标签) | 1 |
RNase Inhibitor | 1 |
RT酶 | 1 |
总体积 | 20 |
其中,TS-3G-N选择12个简并碱基作为分子标签,共有4的12次方种分子标签,可以标记16777216种克隆型,序列为:
5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNNNNNX-3'。
混匀瞬离后,PCR仪上25-50℃反应30-90min,70℃反应15min终止反应,得到产物A。
3.4 PCR扩增特异性的的完整免疫组库
取产物A,按下表配制反应体系,进行PCR反应。
组分 | 体积(μL) |
产物A | 20 |
2×KAPA HiFi HotStart ReadyMix | 25 |
RT2引物组(TCR&BCR-RT2所有引物) | 1 |
TS-Index | 1 |
NF水 | 3 |
总体积 | 50 |
PCR结束后使用AMPure XP beads分选纯化,保留500bp~1000bp的产物,用24μLNF水进行洗脱,得到产物B。
3.5 PCR2获得上机的免疫组库文库
按下表配制PCR2反应体系,并进行PCR反应:
组分 | 体积(μL) |
产物B | 23 |
2×KAPA HiFi HotStart ReadyMix | 25 |
P5接头引物(TS-Primer1) | 1 |
P7 | 1 |
总体积 | 50 |
PCR结束后,使用AMPure XP beads片段纯化,用30μL NF水进行洗脱。取其中5μL纯化产物进行1.5%琼脂糖凝胶电泳检测。取2μL纯化产物进行Qubit定量,按照MiSeq测序仪操作流程进行文库变性、稀释以及测序。
文库电泳检测分析如图5所示,文库主条带在600bp-800bp之间,条带明亮清晰,与预期结果一致。
对纯化产物进行Qubit定量分析,结果显示,Qubit浓度为60.12ng/μl,构建的文库达到上机要求浓度,可用于上机测序。
上机数据统计见下表:
结果如上表所示,文库数据95.21%的reads能够匹配上,而且TRA、TRB、IGH、IGK、IGL的数据量相差不多,说明本发明方法的均一性好、特异性好。通过单分子标签,可以使克隆型数从31679减少到了24211,降低了23.57%,本发明的单分子标签具有很强的校正能力。
文库测序的各免疫组库类型数据量排前5的克隆结果见下表:
从克隆型结果看,本发明完整捕获了免疫组库的CDR3区,并且各种亚型没有频率特别高的克隆型,这符合健康人的免疫组库的结果,表明结果正确。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
序列表
<110> 湖南大地同年生物科技有限公司
<120> 一种单分子标签免疫组库高通量测序文库构建方法
<141> 2019-10-13
<160> 20
<170> SIPOSequenceListing 1.0
<210> 1
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gtgactggag ttcagacgtg tgctcttccg atct 34
<210> 2
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gtctagcaca gttttgtc 18
<210> 3
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gtatctggag tcattga 17
<210> 4
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
aggcaggcga tgaccacgtt 20
<210> 5
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
cttgaccagg cagcccaggg ccgctgtg 28
<210> 6
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
agtcacggag gtggcattgg agggaatgt 29
<210> 7
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
agggggaaaa gggttggggc ggatgcact 29
<210> 8
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
tggggaacac atccggagcc ttggtgggt 29
<210> 9
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gctcatcaga tggcgggaag atgaaga 27
<210> 10
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tcacggctcc cgggtagaag tcacttatg 29
<210> 11
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gtgactggag ttcagacgtg tgctcttccg atctgtcact ggatttagag tc 52
<210> 12
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gtgactggag ttcagacgtg tgctcttccg atcttgcttc tgatggctca aacac 55
<210> 13
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
acactctttc cctacacgac gctcttccga tctcttcggg gatgctgagg agacggtg 58
<210> 14
<211> 70
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
acactctttc cctacacgac gctcttccga tctcttacgt ttaaattcta ctcacgtttg 60
atttccacct 70
<210> 15
<211> 69
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
acactctttc cctacacgac gctcttccga tctcttacga gacagatgta cttacgtttg 60
atatccact 69
<210> 16
<211> 63
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
acactctttc cctacacgac gctcttccga tctcttactg aaaaatgctt acgtttaatc 60
tcc 63
<210> 17
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
acactctttc cctacacgac gctcttccga tctctgcctt gggctgacct aggac 55
<210> 18
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
caagcagaag acggcatacg agatgtgact ggagttcaga cgtgt 45
<210> 19
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
caagcagaag acggcatacg agat 24
<210> 20
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
aatgatacgg cgaccaccga gatctacact ctttccctac acgac 45
Claims (12)
1.一种单分子标签免疫组库高通量测序文库构建方法,其特征在于,所述方法包括以下步骤:
(1)提取样本总RNA;
(2)以步骤(1)得到的总RNA为模板,先后加入RT1引物、单分子标签进行逆转录和模板转换反应,得到带单分子标签的cDNA;
(3)以一链合成物为模板,加入TS-index引物和RT2引物,进行半巢式扩增,特异性扩增目标区域,并添加测序接头,得到带单分子标签的DNA;
(4)将特异性扩增产物分选纯化后,加入P7接头引物、P5接头引物,进行PCR扩增,得到测序文库。
2.根据权利要求1所述的单分子标签免疫组库高通量测序文库构建方法,其特征在于,步骤(2)中,所述的单分子标签的序列如SQE ID NO.1所示。
3.根据权利要求2所述的单分子标签免疫组库高通量测序文库构建方法,其特征在于,步骤(2)中,所述单分子标签的3’末端还连接有多个简并碱基,所述简并碱基的个数为1-20个。
4.根据权利要求3所述的单分子标签免疫组库高通量测序文库构建方法,其特征在于,所述简并碱基为原始碱基和/或修饰碱基,所述修饰碱基包括硫代修饰、甲基化修饰、LNA修饰和/或次黄嘌呤修饰。
5.根据权利要求1所述的单分子标签免疫组库高通量测序文库构建方法,其特征在于,步骤(2)中,所述RT1引物包括如SEQ ID NO.2、SEQ ID NO.3、SEQ ID NO.4、SEQ ID NO.5、SEQ ID NO.6、SEQ ID NO.7、SEQ ID NO.8、SEQ ID NO.9、和/或SEQ ID NO.10所示的序列。
6.根据权利要求1所述的单分子标签免疫组库高通量测序文库构建方法,其特征在于,步骤(3)中,所述RT2引物包括如SEQ ID NO.11、SEQ ID NO.12、SEQ ID NO.13、SEQ IDNO.14、SEQ ID NO.15、SEQ ID NO.16和/或SEQ ID NO.17所示的序列。
7.根据权利要求6所述的单分子标签免疫组库高通量测序文库构建方法,其特征在于,所述RT2引物的3’末端还连接有原始碱基或修饰碱基,其中,所述修饰碱基包括硫代修饰、甲基化修饰、LNA修饰和/或次黄嘌呤修饰。
8.根据权利要求1所述的单分子标签免疫组库高通量测序文库构建方法,其特征在于,步骤(3)中,所述TS-index引物的序列如SEQ ID NO.18所示。
9.根据权利要求1所述的单分子标签免疫组库高通量测序文库构建方法,其特征在于,步骤(4)中,P7接头引物的序列如SEQ ID NO.19或SEQ ID NO.18所示,P5接头引物的序列如SEQ ID NO.20所示。
10.根据权利要求1-9任一项所述的单分子标签免疫组库高通量测序文库构建方法,其特征在于,步骤(2)中,所述逆转录反应的反应温度为25-50℃,反应时间为30-90min。
11.根据权利要求1-9任一项所述的单分子标签免疫组库高通量测序文库构建方法,其特征在于,所述样本包括人源TCRα、TCRβ、BCR重链H、BCR轻链L、BCR轻链K的CDR区域。
12.根据权利要求1所述的单分子标签免疫组库高通量测序文库构建方法,其特征在于,所述方法适用的技术平台为第二代测序平台。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910972360.0A CN110734958A (zh) | 2019-10-13 | 2019-10-13 | 一种单分子标签免疫组库高通量测序文库构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910972360.0A CN110734958A (zh) | 2019-10-13 | 2019-10-13 | 一种单分子标签免疫组库高通量测序文库构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110734958A true CN110734958A (zh) | 2020-01-31 |
Family
ID=69268872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910972360.0A Pending CN110734958A (zh) | 2019-10-13 | 2019-10-13 | 一种单分子标签免疫组库高通量测序文库构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110734958A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111662970A (zh) * | 2020-06-29 | 2020-09-15 | 武汉菲沙基因信息有限公司 | 一种bcr免疫组库全长扩增的三代建库测序方法 |
CN113667716A (zh) * | 2021-08-27 | 2021-11-19 | 北京医院 | 基于滚环扩增的测序文库构建方法及其应用 |
CN117126921A (zh) * | 2023-10-26 | 2023-11-28 | 立凌生物制药(苏州)有限公司 | 一种检测t细胞和b细胞免疫组库的建库方法及其引物和试剂盒 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105087789A (zh) * | 2015-08-10 | 2015-11-25 | 北京吉因加科技有限公司 | 一种检测血浆cfDNA中BCR和TCR免疫组库的方法 |
CN106755410A (zh) * | 2016-12-23 | 2017-05-31 | 孙涛 | 一种基于高通量测序同时检测t细胞和b细胞免疫组库的方法 |
CN109136329A (zh) * | 2018-08-13 | 2019-01-04 | 湖南大地同年生物科技有限公司 | 一种单分子标签tcr免疫组库高通量测序文库的构建方法 |
-
2019
- 2019-10-13 CN CN201910972360.0A patent/CN110734958A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105087789A (zh) * | 2015-08-10 | 2015-11-25 | 北京吉因加科技有限公司 | 一种检测血浆cfDNA中BCR和TCR免疫组库的方法 |
CN106755410A (zh) * | 2016-12-23 | 2017-05-31 | 孙涛 | 一种基于高通量测序同时检测t细胞和b细胞免疫组库的方法 |
CN109136329A (zh) * | 2018-08-13 | 2019-01-04 | 湖南大地同年生物科技有限公司 | 一种单分子标签tcr免疫组库高通量测序文库的构建方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111662970A (zh) * | 2020-06-29 | 2020-09-15 | 武汉菲沙基因信息有限公司 | 一种bcr免疫组库全长扩增的三代建库测序方法 |
CN111662970B (zh) * | 2020-06-29 | 2023-05-05 | 武汉菲沙基因信息有限公司 | 一种bcr免疫组库全长扩增的三代建库测序方法 |
CN113667716A (zh) * | 2021-08-27 | 2021-11-19 | 北京医院 | 基于滚环扩增的测序文库构建方法及其应用 |
CN113667716B (zh) * | 2021-08-27 | 2023-12-15 | 北京医院 | 基于滚环扩增的测序文库构建方法及其应用 |
CN117126921A (zh) * | 2023-10-26 | 2023-11-28 | 立凌生物制药(苏州)有限公司 | 一种检测t细胞和b细胞免疫组库的建库方法及其引物和试剂盒 |
CN117126921B (zh) * | 2023-10-26 | 2024-01-26 | 立凌生物制药(苏州)有限公司 | 一种检测t细胞和b细胞免疫组库的建库方法及其引物和试剂盒 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107586832B (zh) | 用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法 | |
CN110734958A (zh) | 一种单分子标签免疫组库高通量测序文库构建方法 | |
CN109593757B (zh) | 一种探针及其适用于高通量测序的对目标区域进行富集的方法 | |
CN110129415B (zh) | 一种ngs建库分子接头及其制备方法和用途 | |
CN105986015B (zh) | 一种基于高通量测序的多样本的一个或多个靶序列的检测方法和试剂盒 | |
CN111363783B (zh) | 一种基于特有识别序列的t细胞受体库高通量测序文库构建及测序数据分析方法 | |
CN106995836B (zh) | 二代测序样品前处理的引物和方法以及试剂盒 | |
CN107779495B (zh) | T细胞抗原受体多样性测序文库的构建方法以及试剂盒 | |
CN109486923B (zh) | 多重扩增子测序用引物系统、其应用以及测序文库的构建方法 | |
CN108998508B (zh) | 扩增子测序文库的构建方法及引物组和试剂盒 | |
CN109593758B (zh) | 多重引物组及利用该引物组基于高通量测序构建人类b细胞免疫组库的方法 | |
CN110863056A (zh) | 一种人类dna精准分型的方法、试剂和应用 | |
CN110603327A (zh) | Pcr引物对及其应用 | |
CN111748637A (zh) | 一种用于亲缘关系分析鉴定的snp分子标记组合、多重复合扩增引物组、试剂盒及方法 | |
CN111269909A (zh) | 一种转录组建库的方法、试剂和应用 | |
CN112359101A (zh) | 一种质检寡核苷酸交叉污染的方法 | |
CN109415768B (zh) | 可变区序列文库构建方法、测序方法及其试剂盒 | |
KR101969905B1 (ko) | 염기서열분석을 위한 라이브러리용 프라이머 세트 및 라이브러리 제조방법 | |
CN117551771A (zh) | 一种用于检测肿瘤低频突变的单端锚定多重pcr扩增子文库的构建方法和试剂盒 | |
CN111005075B (zh) | 用于双样本共建测序文库的y型接头和双样本共建测序文库的方法 | |
CN108707653B (zh) | 构建可变区序列文库试剂盒及可变区序列的测序方法 | |
WO2018089944A1 (en) | Method and system for fragment assembly and sequence identification | |
CN111304309A (zh) | 一种测序平台标签序列污染的检测方法 | |
CN114774517A (zh) | 一种人免疫组库测序的方法及试剂盒 | |
CN110184326B (zh) | 一种tpp核糖开关序列引物和肠道菌群分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200131 |