CN111662970A - 一种bcr免疫组库全长扩增的三代建库测序方法 - Google Patents
一种bcr免疫组库全长扩增的三代建库测序方法 Download PDFInfo
- Publication number
- CN111662970A CN111662970A CN202010603495.2A CN202010603495A CN111662970A CN 111662970 A CN111662970 A CN 111662970A CN 202010603495 A CN202010603495 A CN 202010603495A CN 111662970 A CN111662970 A CN 111662970A
- Authority
- CN
- China
- Prior art keywords
- bcr
- amplification
- sequencing
- full
- primer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003321 amplification Effects 0.000 title claims abstract description 76
- 238000003199 nucleic acid amplification method Methods 0.000 title claims abstract description 76
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 61
- 238000010276 construction Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 23
- 239000002299 complementary DNA Substances 0.000 claims abstract description 16
- 238000002156 mixing Methods 0.000 claims abstract description 16
- 239000012634 fragment Substances 0.000 claims abstract description 15
- 108091093088 Amplicon Proteins 0.000 claims abstract description 8
- 238000007671 third-generation sequencing Methods 0.000 claims abstract description 7
- 230000002194 synthesizing effect Effects 0.000 claims abstract 3
- 239000002773 nucleotide Substances 0.000 claims description 15
- 125000003729 nucleotide group Chemical group 0.000 claims description 15
- 238000010839 reverse transcription Methods 0.000 claims description 14
- 239000002096 quantum dot Substances 0.000 claims description 7
- 238000011534 incubation Methods 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 6
- 238000011002 quantification Methods 0.000 claims description 5
- 108091035707 Consensus sequence Proteins 0.000 claims description 3
- 238000012408 PCR amplification Methods 0.000 claims description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 2
- 238000007689 inspection Methods 0.000 claims description 2
- 239000013614 RNA sample Substances 0.000 claims 2
- 239000000523 sample Substances 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 7
- 230000009471 action Effects 0.000 abstract description 3
- 210000004958 brain cell Anatomy 0.000 abstract 1
- 238000012216 screening Methods 0.000 abstract 1
- 108091008875 B cell receptors Proteins 0.000 description 67
- 108020004414 DNA Proteins 0.000 description 44
- 238000006243 chemical reaction Methods 0.000 description 28
- 210000003719 b-lymphocyte Anatomy 0.000 description 7
- 239000011324 bead Substances 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 108090000623 proteins and genes Proteins 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 108091034057 RNA (poly(A)) Proteins 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 239000000427 antigen Substances 0.000 description 4
- 108091007433 antigens Proteins 0.000 description 4
- 102000036639 antigens Human genes 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 101150049556 Bcr gene Proteins 0.000 description 3
- 108060002716 Exonuclease Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 239000012149 elution buffer Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 102000013165 exonuclease Human genes 0.000 description 3
- 230000008707 rearrangement Effects 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 230000003844 B-cell-activation Effects 0.000 description 1
- 230000005971 DNA damage repair Effects 0.000 description 1
- 101100193633 Danio rerio rag2 gene Proteins 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 101100193635 Mus musculus Rag2 gene Proteins 0.000 description 1
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 1
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 1
- 102000001183 RAG-1 Human genes 0.000 description 1
- 108060006897 RAG1 Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 230000028996 humoral immune response Effects 0.000 description 1
- 230000008105 immune reaction Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 238000005580 one pot reaction Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Biochemistry (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- General Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Immunology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种BCR免疫组库全长扩增的三代建库测序方法,步骤包括:1)根据BCR一致性序列的恒定区设计与合成引物;2)通过Oligo dT引物和BCR Template Switching Oligo引物的作用下合成第一链cDNA;3)BCR cDNA的全长第一轮和第二轮的扩增;4)BCR全长扩增子片段混样;5)文库构建;6)进行三代测序。本发明通过在BCR恒定区的保守区域设计多重引物,覆盖整个BCR的全长序列。在进行BCR序列扩增时,为进一步提高3’端扩增的有效性,设计了多组半巢式引物,通过半巢式引物的匹配筛选即可获得覆盖整个BCR全长的扩增子片段。通过PacBio建库流程,在扩增子的两端添加带有barcode的测序接头,即可进行PacBio测序,通过拆分与数据校正后获得准确率在99%以上的HiFi Reads。
Description
技术领域
本发明涉及基因测序技术领域,尤其涉及一种BCR免疫组库全长扩增的三代建库测序方法。
背景技术
B细胞受体(B cell receptor,BCR)是B细胞抗原识别决定性表面分子,其本质是一种膜表面免疫球蛋白(membrane immunoglobulin,mIg)。BCR具有抗原结合特异性,每个个体的BCR多样性高达5x10^13,构成容量巨大的BCR库,赋予个体识别各种抗原、产生特异性抗体的巨大潜能。
BCR的结构包括2条重链和2条轻链(κ和λ)。BCR的重链(heavy chain,H)由65~100种可变区(VH)、2种多变区(DH)、6种结合区(JH)和恒定区(CH)四部分基因片段组成;轻链(light chain,L)由可变区、结合区和恒定区三部分基因片段组成。发育过程中的B细胞在重组酶(RAG1、RAG2)作用下,形成了多样性高达1~2×10^11的BCR。同时,由其形成互补决定区(complementarities determining region,CDR):CDR1、CDR2和CDR3区氨基酸序列的多样性,特别是编码CDR3的基因,由于其位于轻链V、J或重链V、D、J片段的连接处,可以通过V(D)J的重排和(或)两个基因片段的连接间丢失或插入数个核苷酸,进一步增加BCR的多样性,而形成具有功能的BCR编码基因(B细胞克隆)。
BCR测序是通过高通量测序技术检测靶向扩增后的BCR重链和轻链,全面解析BCR基因重排碱基序列,以及各序列的丰度的测序技术。BCR测序常用于评价各种免疫相关疾病和遗传性突变引起的某个物种所有B细胞或特定B细胞激活介导的细胞免疫反应中BCR基因重排碱基序列,以及各序列的丰度,用于研究不同B细胞克隆的转录情况和相互间关系,从而揭示更深层次的B细胞功能特异性,继而解释体液免疫应答耐受以及高频突变在B细胞应答识别抗原异常等相关生命现象。传统的BCR测序都是采用使用Illumina的测序仪进行2×300bp或2×150bp的双端测序方法来对BCR进行测序,该方法的测序准确率高,但对于部分长度超过600bp的BCR序列,该方法仅能获得两端的序列,会存在中间部分关键可变区序列缺失的问题。
PacBio公司正式推出Sequel II新一代测序系统后,依赖于PacBio SMRT测序技术独有的CCS测序模式,能够通过滚环测序提升reads准确度,同时结合聚合酶试剂的优化,酶读长大幅提升,在获得高精准度HiFi reads的同时能够保证10kb以上的插入片段读长,将解决原有的Illumina等二代测序平台下无法完整覆盖整个片段区域的问题。通过进行HiFi测序,可以获得准确性达到99%以上的长读长序列,用于BCR精确分组、BCR重链轻链匹配等应用中。
因此有必要针对三代测序平台,研究一种简单快速的BCR免疫组库全长扩增的建库测序方法,利用三代测序的优势,结合特殊的扩增手段,在达到以上目的的同时,以克服传统测序方法带来的缺陷。
发明内容
本发明在结合PacBio测序平台的优势基础上,开发出根据BCR免疫组库全长扩增的建库测序方法,经证实该方法快速、特异和有效。
为了达到上述目的,本发明提出一种BCR免疫组库全长扩增的三代建库测序方法,包括以下步骤:
1.合成cDNA第一链
将Oligo dT逆转录引物与样本RNA的poly(A)结合;再通过BCR TemplateSwitching Oligo逆转录合成cDNA。
进一步地,所述Oligo dT逆转录引物核苷酸序列如SEQ ID NO:1所示;
进一步地,所述逆转录合成过程为poly(A)结合产物在Single Cell RT Buffer、Single Cell RT Enzyme Mix及无核酸酶水条件下42℃孵育75min,再加入BCR TemplateSwitching Oligo引物,42℃孵育15min;
进一步地,所述BCR Template Switching Oligo引物基于BCR免疫组库一致性序列设计并合成;
进一步地,所述BCR Template Switching Oligo引物的核苷酸序列如SEQ ID NO:2所示。
2.BCR cDNA的全长扩增
cDNA第一链在5’端通用引物和3’端引物组一的条件下进行第一轮扩增反应;然后在5’端通用引物和3’端引物组二的条件下进行第二轮扩增反应。
进一步地,所述5’端通用引物和3’端引物均基于BCR免疫组库一致性序列设计;所述3’端引物覆盖整个BCR的全长序列,位置基于BCR恒定区的保守区域;
进一步地,所述3’端引物组一包含20条引物;所述引物组二包含10组引物,每组2条;
进一步地,所述5’端通用引物的核苷酸序列如SEQ ID NO:3所示;
进一步地,所述3’端引物组一的20条引物的核苷酸序列如SEQ ID NO:4-SEQ IDNO:23所示;所述3’端引物组二的核苷酸序列如SEQ ID NO:24-43所示,所述10组引物分别为SEQ ID NO:24-25、SEQ ID NO:26-27、SEQ ID NO:28-29、SEQ ID NO:30-31、SEQ ID NO:32-33、SEQ ID NO:34-35、SEQ ID NO:36-37、SEQ ID NO:38-39、SEQ ID NO:40-41、SEQ IDNO:42-43;
进一步地,所述第一轮扩增反应为在20条混合引物条件下进行扩增:在HiFiFidelity Buffer、dNTP Mix、HiFi Enzyme及无核酸酶水条件下进行孵育:98℃保持2min;然后98℃保持20s、65℃保持15s、72℃保持45s,共18个循环;72℃保持5min;
进一步地,所述第二轮扩增过程将所述引物组二的10组引物分别单独并进行扩增;所述第二轮扩增反应为在HiFi Fidelity Buffer、dNTP Mix、HiFi Enzyme及无核酸酶水条件下进行孵育:98℃保持2min;然后98℃保持20s、65℃保持15s、72℃保持30s,共20个循环;72℃保持5min。
3.BCR全长扩增子片段混样
根据Qubit定量结果,将同一样本的不同扩增产物进行等量混样,所述混样后的总量在1ug以上,用于后续建库。
4.文库构建
末端修复并加A后,连接与A末端匹配的带barcode的测序接头,消化不完整的文库,纯化后获得目的文库。
进一步地,所述末端修复加A步骤为取全基因组扩增子样本,在DNA DamageRepair Buffer、End Prep Enzyme体系下,20℃孵育30min;然后进行磁珠纯化、洗脱获得;
进一步地,所述消耗不完整文库方法为使用外切酶III和外切酶VII进行消耗。
5.进行三代测序
对获得的文库进行Qubit定量,获得文库浓度,取文库进行片段大小对比;分析合格后的文库在PacBio Sequel II测序平台上进行混合测序。
与现有技术相比,本发明的有益效果为:
1)本发明的方法直接使用总RNA进行逆转录反应,无需先富集具有poly(A)结构的mRNA,在样本总要求上可以达到非常低的水平,样本量达到10ng以上即可进行逆转录与后续的扩增测序;
2)本方法使用链转换原理,在使用d(T)引物进行逆转录至5’末端后,可转换延伸链至5’端核苷酸,在cDNA链上引入5’端引物结合位点,通过一步反应简化了实验流程。同时,在5’端核苷酸上加入了12碱基的UMI序列,可以校正扩增反应导致的偏好性,实现准确定量;
3)本方法针对不同类型的BCR序列,基于BCR的恒定区设计了可覆盖整个BCR基因的半巢式扩增引物,在第一轮扩增时使用的3’端特异性引物可以特异性的扩增富集特定类型的BCR片段,在第二轮扩增时,使用3’端内部引物,可以进一步的富集BCR序列,使扩增富集效果更优异,经过两轮半巢式PCR扩增富集后,测序数据中BCR序列的比例可以达到70%以上,极大的提供了测序数据中BCR序列的比例;
4)本方法通过将第一轮扩增的3’端特异性引物混合为引物混池的方法进行扩增,将需要10个单独的扩增反应简化为仅需要1个扩增反应,极大的简化了实验操作,提高了实验效率。同时,在第二轮扩增时采用单独的引物进行可以防止不同引物扩增效率产生扩增偏差,使测序数据可以均匀的覆盖各目标区域;
5)在测序平台上采用PacBio平台,可以充分发挥PacBio三代测序的长读长优势,同时准确率也可以达到Q20以上,无需拼接即可实现BCR序列的直接读取,可精确进行BCR序列的分类与BCR序列轻重链的匹配。
附图说明
图1为BCR免疫组库全长扩增原理示意图。
图2为BCR全长扩增序列PacBio建库流程示意图。
图3为不同BCR片段扩增电泳图。
图4为文库检测峰图。
具体实施方式
下面结合实施例对本发明作进一步详细的描述,但本发明的实施方式不限于此。
本发明的BCR免疫组库全长扩增流程及原理示意图如图1所示,具体原理如下:
1.采用逆转录引物d(T)与RNA转录本的3’端的poly(A)结合,进行逆转录反应,逆转录至5’端末端时会额外添加3~5个C碱基,额外添加的C碱基可以和加入的5’端核苷酸序列结合;
2.在5’端核苷酸结合后,逆转录酶会继续以5’端为模板进行延伸,至5’端核苷酸的末端;
3.以cDNA第一链为模板,加入3’端特异引物与5’端引物后进行第一轮扩增富集;
4.加入3’端内部引物与5’端引物后进行第二轮扩增富集,获得BCR全长扩增序列。
基于以上原理的BCR全长扩增序列PacBio建库流程示意图如图2所示。
实施例1:引物的合成
本发明设计的引物序列可以在各引物合成公司进行合成,如上海生工,提供的引物序列如表1所示。
表1:设计引物的序列
其中,BCR Template Switching Oligo引物、5’端通用引物均为基于不同类型的BCR免疫组库恒定区的一致性序列设计;3’端特异性引物基于保守区域设计得来的,覆盖整个BCR免疫组库的全长序列。
另外,Oligo dT引物中V为简并碱基,代表G、A、C三种之一;BCR TemplateSwitching Oligo引物中[dN(12)]表示为12个碱基UMI标签序列,由12个随机碱基组成,为用于校正扩增的偏好性,即Template Switching Oligo引物核苷酸序列为:
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNNNNNGTACGGGGG,N代表A、T、C、G四种之一。
以上引物中其他简并碱基代表的碱基分别如下:
简并碱基 | 正常碱基 |
R | A/G |
Y | C/T |
K | G/T |
S | G/C |
实施例2:总RNA中cDNA第一链的合成
实验步骤中使用到的引物合成于上海生工,将引物统一稀释至10uM。第一步进行cDNA第一链合成的项目实施例操作如下:
1)Oligo dT逆转录引物与poly(A)结合
表2:
轻弹混匀,瞬时离心,70℃孵育5min后立即置于冰上。
2)逆转录合成cDNA第一链
配制如下反应:
表3:
轻弹混匀,瞬时离心,42℃孵育75min。反应完成后立即置于冰上,加入1uL的BCRTemplate Switching Oligo,轻弹混匀,瞬时离心,42℃孵育15min。
实施例3:BCR cDNA的全长扩增
BCR cDNA的全长扩增包括两轮半巢式扩增反应,第一轮扩增进行BCR序列的初步富集,扩增序列的条带单一性较差,第二轮扩增时采用内部的巢式引物,进一步提高扩增的特异性,使扩增条带单一。
1)BCR cDNA全长的第一轮PCR扩增
取一新的0.2mL PCR管,加入如下试剂:
表4:
充分混匀,瞬时离心,置于PCR仪上进行PCR反应:98℃孵育2min;98℃孵育20s、65℃孵育15s、72℃孵育45s,共18个循环;然后72℃孵育5min。
反应结束后可以在-20℃冰箱长期保存。
在第一次扩增PCR反应开始时,温度达到98℃,此时温度已经达到了RNA链解链所需的温度,因此RNA链在扩增反应开始时发生了解链。
2)BCR cDNA全长的第二轮PCR扩增
取一新的0.2mL PCR管,加入如下试剂:
表5:
10组混合引物均需要单独进行扩增,可以提高扩增反应的稳定性。
充分混匀,瞬时离心,置于PCR仪上进行PCR反应:98℃孵育2min;98℃孵育20s、65℃孵育15s、72℃孵育30s、共20个循环;然后72℃孵育5min。
反应结束后进行电泳检测图如图3所示,可以看到明显的单一扩增条带。
按照AMPure磁珠的使用说明对扩增产物进行磁珠纯化,最后使用10μL洗脱缓冲液洗脱,取1μL纯化产物,使用无核酸酶水稀释5倍后进行Qubit定量。
实施例4:BCR全长扩增子片段混样
根据Qubit定量结果,将同一样本的不同扩增产物进行等量混样,要求混样后的总量在1ug以上,用于后续建库。对于仅关注某些特殊BCR全长序列的应用,可以仅挑选部分扩增产物进行混样后测序。
实施例5:文库构建
1)末端修复
取1ug的全基因组扩增子样本,进行末端修复反应体系的配制,配制如下反应:
表6:
充分混匀,瞬时离心,20℃孵育30min。
反应完成后,按照AMPure磁珠的使用说明进行1X磁珠纯化,去除反应时加入的酶与Buffer,最后使用14μL洗脱缓冲液洗脱,获得片段末端加A的粘性末端。
2)连接带barcode的测序接头
通过末端修复与加A后,在加入具有与A末端匹配的带barcode的测序接头,在连接酶的作用下即可实现接头的连接。同时,由于酶切与连接反应存在一定的效率问题,需要使用外切酶III和外切酶VII将结构不完整的文库消化掉。具体实施例的操作流程如下:
进行连接反应,反应体系如下:
表7:
混匀,瞬时离心,20℃孵育60min,反应结束后65℃孵育10min,置于冰上。
进行外切酶消化,反应体系如下:
表8:
混匀,瞬时离心,37℃孵育60min,置于冰上。按照AMPure磁珠的使用说明进行磁珠纯化,最后使用20μL洗脱缓冲液洗脱,获得的适用于PacBio测序平台的哑铃型的环状文库。
实施例6:文库质检与上机测序
取1μL文库进行Qubit定量,获得文库浓度;取1μL文库进行安捷伦2100的片段大小分析,文库检测峰图如图4所示,从图中可以看出,PCR扩增出来的DNA目的条带长度与目的片段的大小一致,文库大小也与目的片段大小相符,说明制备的文库合格。
由以上实施例获得的BCR全长扩增文库在PacBio Sequel II测序平台上进行混合测序,每个样本获得了约30G的测序数据,说明文库质量合格且可获得符合测序要求的数据。
将测序的CCS数据进行一致性校正后,获得了质量值在Q20以上的BCR全长一致性序列,经过与BCR数据库进行比对后,获得了每个样本测序数据中的BCR序列比例。从以下统计列表可以看出,在未进行BCR扩增富集时,测序数据中的BCR序列在1%以下,当经过本发明的方法进行富集后,测序获得的数据有70%以上为BCR的序列,表明本发明可以显著的对BCR序列进行富集,实现BCR全长序列的测序。
附本实施例中BCR全长扩增测序数据分析的比例数据,见表9。
表9:
本发明并不仅仅限于说明书和实施方式中所描述,因此对于熟悉领域的人员而言可容易地实现另外的优点和改进,故在不背离权利要求及等同范围所限定的一般概念的精神和范围的情况下,本发明并不限于特定的细节、代表性的方案和这里示出与描述的图示示例。
序列表
<110> 武汉菲沙基因信息有限公司
<120> 一种BCR免疫组库全长扩增的三代建库测序方法
<141> 2020-06-24
<160> 43
<170> SIPOSequenceListing 1.0
<210> 1
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
tttttttttt tttttttttt tttttttttt v 31
<210> 2
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnnnngtac ggggg 55
<210> 3
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
tcagacgtgt gctcttccga tct 23
<210> 4
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tgagttccac gacaccgtca 20
<210> 5
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
agtcctgagg actgtaggac a 21
<210> 6
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
aagccccggg tgctgctgat gt 22
<210> 7
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ttctttgttg ccgttggggt gct 23
<210> 8
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ggcctctctg ggatagaagt t 21
<210> 9
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gtccttgctg tcctgctc 18
<210> 10
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
ctgctatctg ccttccaggc 20
<210> 11
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gtktggtggt ctccactc 18
<210> 12
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gtgatggagt cgggaaggaa gt 22
<210> 13
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
tctttgttgc cgttggggtg ctg 23
<210> 14
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
acgctgctga gggagtagag t 21
<210> 15
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
ttgtccacct tggtgttgct gg 22
<210> 16
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
gaagtttctg gcggtcacg 19
<210> 17
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
tcagctggct gctcgtggtg taca 24
<210> 18
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
gttgaagctc tttgtgacgg 20
<210> 19
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
ctgatgggtg acttcgcag 19
<210> 20
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
tcaggctcag rtagctgctg 20
<210> 21
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
tttggagggt ktggtggtct cca 23
<210> 22
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
gcaagctgat ggtggcatag 20
<210> 23
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
ggctggtaag gtcatagttg tc 22
<210> 24
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
aagacsgatg ggcccttggt 20
<210> 25
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
aagtagtcct tgaccaggca g 21
<210> 26
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
acggggaatt ctcacaggag a 21
<210> 27
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
tgatggagtc gggaaggaag t 21
<210> 28
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
aagacagatg gtgcagccac a 21
<210> 29
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
acaacagagg cagttccaga t 21
<210> 30
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
aggagggygg gaacagagtg a 21
<210> 31
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
agacacacca gtgtggcctt gt 22
<210> 32
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
gttggggcgg atgcactcc 19
<210> 33
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
aattctcaca ggagacgagg 20
<210> 34
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
agtagtcctt gaccaggcag cc 22
<210> 35
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
ggaaggtgtg cacgccgctg gtc 23
<210> 36
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
gcgggaagac cttgggg 17
<210> 37
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
cgctccaggt cacactgagt gg 22
<210> 38
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
ctgctttgct cagcgtcagg 20
<210> 39
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
ctgtaggtgc tgtccttgct 20
<210> 40
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
atctgccttc caggccactg tca 23
<210> 41
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
tgttggcttg ragctcctca g 21
<210> 42
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
ggtcaccatc accggctccg 20
<210> 43
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
ggcagcccag agtcacgg 18
Claims (10)
1.一种BCR免疫组库全长扩增的三代建库测序方法,其特征在于,包括如下步骤:
S1.RNA样本通过BCR Template Switching Oligo引物逆转录合成cDNA第一链,所述BCRTemplate Switching Oligo引物包含12个碱基UMI标签序列;
S2.在5’端通用引物条件下,利用3’端引物对BCR cDNA全长进行第一轮和第二轮PCR扩增;所述第一轮扩增包含20条引物;所述第二轮扩增包含10组引物,每组2条;
S3.BCR全长扩增子片段混样;
S4.通过末端修复后,连接测序接头,获得文库;
S5.进行三代测序。
2.根据权利要求1所述的一种BCR免疫组库全长扩增的三代建库测序方法,其特征在于:
所述步骤S1中引物及所述S2中5’端通用引物基于BCR免疫组库一致性序列设计并合成;
所述步骤S2中的3’端引物基于BCR免疫组库一致性序列恒定区的保守区域设计并合成,所述引物覆盖整个BCR序列。
3.根据权利要求1所述的一种BCR免疫组库全长扩增的三代建库测序方法,其特征在于:
所述步骤S1中:所述BCR Template Switching Oligo引物的核苷酸序列如SEQ ID NO:2所示;
所述步骤S2中:所述5’端通用引物的核苷酸序列如SEQ ID NO:3所示;所述第一轮扩增的引物的核苷酸序列如SEQ ID NO:4-SEQ ID NO:23所示;所述第二轮扩增的10组引物的核苷酸序列分别为SEQ ID NO:24-25、SEQ ID NO:26-27、SEQ ID NO:28-29、SEQ ID NO:30-31、SEQ ID NO:32-33、SEQ ID NO:34-35、SEQ ID NO:36-37、SEQ ID NO:38-39、SEQ ID NO:40-41、SEQ ID NO:42-43。
4.根据权利要求1所述的一种BCR免疫组库全长扩增的三代建库测序方法,其特征在于,所述步骤S1逆转录前将Oligo dT引物与RNA样本的polyA结合,所述Oligo dT引物核苷酸序列如SEQ ID NO:1所示。
5.根据权利要求1所述的一种BCR免疫组库全长扩增的三代建库测序方法,其特征在于,所述步骤S2中:
所述第一轮扩增利用所述20条引物的混合物进行扩增;
所述第二轮扩增利用所述10组引物分别单独进行扩增。
6.根据权利要求1所述的一种BCR免疫组库全长扩增的三代建库测序方法,其特征在于,所述步骤S2中:
所述第一轮扩增孵育条件为:98℃保持2min;然后98℃保持20s、65℃保持15s、72℃保持45s,共18个循环;72℃保持5min;
所述第二轮扩增孵育条件为:98℃保持2min;然后98℃保持20s、65℃保持15s、72℃保持30s,共20个循环;72℃保持5min。
7.根据权利要求1所述的一种BCR免疫组库全长扩增的三代建库测序方法,其特征在于,所述步骤S3根据Qubit定量结果,将同一样本的不同扩增产物进行等量混样,所述混样后的总量在1ug以上。
8.根据权利要求1所述的一种BCR免疫组库全长扩增的三代建库测序方法,其特征在于,所述步骤S4为:通过末端修复与加A后,再加入测序接头;所述测序接头为与A末端匹配的带barcode的测序接头。
9.根据权利要求1所述的一种BCR免疫组库全长扩增的三代建库测序方法,其特征在于,所述步骤S5中所述三代测序前还包括文库质检:取所述步骤S5获得的文库进行Qubit定量,获得文库浓度,取文库进行片段的大小对比,合格后进行测序。
10.根据权利要求1所述的一种BCR免疫组库全长扩增的三代建库测序方法,其特征在于,所述步骤S5中所述三代测序使用PacBio Sequel II测序平台。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010603495.2A CN111662970B (zh) | 2020-06-29 | 2020-06-29 | 一种bcr免疫组库全长扩增的三代建库测序方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010603495.2A CN111662970B (zh) | 2020-06-29 | 2020-06-29 | 一种bcr免疫组库全长扩增的三代建库测序方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111662970A true CN111662970A (zh) | 2020-09-15 |
CN111662970B CN111662970B (zh) | 2023-05-05 |
Family
ID=72390286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010603495.2A Active CN111662970B (zh) | 2020-06-29 | 2020-06-29 | 一种bcr免疫组库全长扩增的三代建库测序方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111662970B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114277091A (zh) * | 2021-09-17 | 2022-04-05 | 广东省人民医院 | 一种构建高质量免疫组库文库的方法 |
CN117126921A (zh) * | 2023-10-26 | 2023-11-28 | 立凌生物制药(苏州)有限公司 | 一种检测t细胞和b细胞免疫组库的建库方法及其引物和试剂盒 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109056077A (zh) * | 2018-09-13 | 2018-12-21 | 武汉菲沙基因信息有限公司 | 一种适用于PacBio测序平台的扩增子混样测序文库构建方法 |
CN109136329A (zh) * | 2018-08-13 | 2019-01-04 | 湖南大地同年生物科技有限公司 | 一种单分子标签tcr免疫组库高通量测序文库的构建方法 |
CN109593758A (zh) * | 2018-12-26 | 2019-04-09 | 山东艾克韦生物技术有限公司 | 多重引物组及利用该引物组基于高通量测序构建人类b细胞免疫组库的方法 |
CN110257476A (zh) * | 2019-05-31 | 2019-09-20 | 南方医科大学南方医院 | 一种甄别样品间交叉反应的免疫组库高通量测序文库的构建方法 |
CN110734958A (zh) * | 2019-10-13 | 2020-01-31 | 湖南大地同年生物科技有限公司 | 一种单分子标签免疫组库高通量测序文库构建方法 |
-
2020
- 2020-06-29 CN CN202010603495.2A patent/CN111662970B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109136329A (zh) * | 2018-08-13 | 2019-01-04 | 湖南大地同年生物科技有限公司 | 一种单分子标签tcr免疫组库高通量测序文库的构建方法 |
CN109056077A (zh) * | 2018-09-13 | 2018-12-21 | 武汉菲沙基因信息有限公司 | 一种适用于PacBio测序平台的扩增子混样测序文库构建方法 |
CN109593758A (zh) * | 2018-12-26 | 2019-04-09 | 山东艾克韦生物技术有限公司 | 多重引物组及利用该引物组基于高通量测序构建人类b细胞免疫组库的方法 |
CN110257476A (zh) * | 2019-05-31 | 2019-09-20 | 南方医科大学南方医院 | 一种甄别样品间交叉反应的免疫组库高通量测序文库的构建方法 |
CN110734958A (zh) * | 2019-10-13 | 2020-01-31 | 湖南大地同年生物科技有限公司 | 一种单分子标签免疫组库高通量测序文库构建方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114277091A (zh) * | 2021-09-17 | 2022-04-05 | 广东省人民医院 | 一种构建高质量免疫组库文库的方法 |
CN114277091B (zh) * | 2021-09-17 | 2024-02-27 | 广东省人民医院 | 一种构建高质量免疫组库文库的方法 |
CN117126921A (zh) * | 2023-10-26 | 2023-11-28 | 立凌生物制药(苏州)有限公司 | 一种检测t细胞和b细胞免疫组库的建库方法及其引物和试剂盒 |
CN117126921B (zh) * | 2023-10-26 | 2024-01-26 | 立凌生物制药(苏州)有限公司 | 一种检测t细胞和b细胞免疫组库的建库方法及其引物和试剂盒 |
Also Published As
Publication number | Publication date |
---|---|
CN111662970B (zh) | 2023-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5665547A (en) | Methods of comparing levels or amounts of mRNAs | |
CN109593757B (zh) | 一种探针及其适用于高通量测序的对目标区域进行富集的方法 | |
CN111363783B (zh) | 一种基于特有识别序列的t细胞受体库高通量测序文库构建及测序数据分析方法 | |
CN111662970A (zh) | 一种bcr免疫组库全长扩增的三代建库测序方法 | |
CN101812494B (zh) | 一种长pcr步移试剂盒及其使用方法和应用 | |
EP2626433B1 (en) | Method for linking nucleic acids in a microsome from endoplasmatic reticuli | |
CN108103164B (zh) | 一种利用多重荧光竞争性pcr检测拷贝数变异的方法 | |
CN106995836B (zh) | 二代测序样品前处理的引物和方法以及试剂盒 | |
CN107779495B (zh) | T细胞抗原受体多样性测序文库的构建方法以及试剂盒 | |
CN103725674A (zh) | 一种在大肠杆菌中一步法合成dna片段并组装合成基因的方法 | |
US20220155319A1 (en) | Use of nanoexpression to interrogate antibody repertoires | |
CN113005121A (zh) | 接头元件、试剂盒及其相关应用 | |
CN110603327A (zh) | Pcr引物对及其应用 | |
WO2018113799A1 (zh) | 构建简化基因组文库的方法及试剂盒 | |
CN110734958A (zh) | 一种单分子标签免疫组库高通量测序文库构建方法 | |
CN110331446A (zh) | Dna甲基化标志物筛查试剂盒及方法 | |
CN111005075B (zh) | 用于双样本共建测序文库的y型接头和双样本共建测序文库的方法 | |
CN109411011B (zh) | 一种引物组的设计方法及其应用 | |
CN111455023A (zh) | 适用于PacBio平台的全长扩增子快速建库方法、引物及测序方法 | |
EP3918091A1 (en) | Method of sequencing nucleic acid with unnatural base pairs | |
CN115961007A (zh) | 一种利用简并引物扩增进行全基因组分子标记开发的方法 | |
CN114934096A (zh) | 用于实施免疫组库测序的组合物及试剂盒和测序方法 | |
CN105255875B (zh) | 一种用于hla基因分型的试剂盒和方法 | |
CN111979298A (zh) | 一种用于mgi/bgi平台ngs文库制备的接头及其应用 | |
CN106047912B (zh) | 一种新的基因克隆方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A third-generation library construction and sequencing method for full-length amplification of BCR immune libraries Granted publication date: 20230505 Pledgee: Guanggu Branch of Wuhan Rural Commercial Bank Co.,Ltd. Pledgor: WUHAN FRASERGEN INFORMATION CO.,LTD. Registration number: Y2024980021037 |