CN113999891A - 用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的方法、一组引物和试剂盒 - Google Patents
用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的方法、一组引物和试剂盒 Download PDFInfo
- Publication number
- CN113999891A CN113999891A CN202111095486.8A CN202111095486A CN113999891A CN 113999891 A CN113999891 A CN 113999891A CN 202111095486 A CN202111095486 A CN 202111095486A CN 113999891 A CN113999891 A CN 113999891A
- Authority
- CN
- China
- Prior art keywords
- barcode
- umi
- primer
- upstream
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000012165 high-throughput sequencing Methods 0.000 title claims abstract description 16
- 238000012163 sequencing technique Methods 0.000 claims abstract description 25
- 238000010839 reverse transcription Methods 0.000 claims abstract description 14
- 238000011144 upstream manufacturing Methods 0.000 claims description 50
- 230000003321 amplification Effects 0.000 claims description 18
- 239000002299 complementary DNA Substances 0.000 claims description 18
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 18
- 238000000746 purification Methods 0.000 claims description 12
- 102100034343 Integrase Human genes 0.000 claims description 6
- 210000005259 peripheral blood Anatomy 0.000 claims description 5
- 239000011886 peripheral blood Substances 0.000 claims description 5
- 101710203526 Integrase Proteins 0.000 claims description 4
- 239000002773 nucleotide Substances 0.000 claims description 4
- 125000003729 nucleotide group Chemical group 0.000 claims description 4
- 241001465754 Metazoa Species 0.000 claims description 2
- 230000029087 digestion Effects 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 1
- 230000002055 immunohistochemical effect Effects 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 7
- 230000008569 process Effects 0.000 abstract description 6
- 238000009826 distribution Methods 0.000 abstract description 5
- 238000002360 preparation method Methods 0.000 abstract description 4
- 108700028369 Alleles Proteins 0.000 abstract description 3
- 238000012216 screening Methods 0.000 abstract description 2
- 238000012408 PCR amplification Methods 0.000 abstract 1
- 108020004414 DNA Proteins 0.000 description 71
- 238000003752 polymerase chain reaction Methods 0.000 description 37
- 239000000047 product Substances 0.000 description 24
- 108091008875 B cell receptors Proteins 0.000 description 22
- 238000006243 chemical reaction Methods 0.000 description 21
- 210000003719 b-lymphocyte Anatomy 0.000 description 16
- 239000000203 mixture Substances 0.000 description 14
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 12
- 238000010276 construction Methods 0.000 description 10
- 239000000427 antigen Substances 0.000 description 8
- 238000002156 mixing Methods 0.000 description 8
- 108091007433 antigens Proteins 0.000 description 7
- 102000036639 antigens Human genes 0.000 description 7
- 239000011324 bead Substances 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- 238000005406 washing Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 238000011740 C57BL/6 mouse Methods 0.000 description 5
- 108090000623 proteins and genes Proteins 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000003908 quality control method Methods 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 3
- 101150117115 V gene Proteins 0.000 description 3
- 238000007605 air drying Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 101000933320 Homo sapiens Breakpoint cluster region protein Proteins 0.000 description 2
- 101100437372 Mus musculus Bcr gene Proteins 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 238000003766 bioinformatics method Methods 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 210000004602 germ cell Anatomy 0.000 description 2
- 210000003297 immature b lymphocyte Anatomy 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000000392 somatic effect Effects 0.000 description 2
- 210000000952 spleen Anatomy 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 101150033839 4 gene Proteins 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 102000019260 B-Cell Antigen Receptors Human genes 0.000 description 1
- 108010012919 B-Cell Antigen Receptors Proteins 0.000 description 1
- 101150049556 Bcr gene Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 101000595467 Homo sapiens T-complex protein 1 subunit gamma Proteins 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 108091007491 NSP3 Papain-like protease domains Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 description 1
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 description 1
- 102100036049 T-complex protein 1 subunit gamma Human genes 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 230000027455 binding Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000000432 density-gradient centrifugation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 102000051878 human BCR Human genes 0.000 description 1
- 230000004727 humoral immunity Effects 0.000 description 1
- 230000036737 immune function Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1096—Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6858—Allele-specific amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的方法、一组引物和试剂盒:基于多重PCR文库制备方法,针对BCR的重链和轻链各自设计了一套引物,能扩增目前已发现的所有IgG、IgM、IgA、IgD、IgE、IgK和/或IgL的不同等位基因。该方法在逆转录过程中加入3’端UMI,然后在第一轮PCR过程中加入5’端UMI,使每条扩增的模板分子两端被独特配对的UMI序列标记,然后用特异性外侧Barcode引物进行第二轮PCR扩增。利用此方法构建文库获得的测序数据,可以在分析过程中利用配对UMI的丰度分布甄别并去除高通量测序数据中样本内嵌合体序列,从而获取更为准确的免疫组库数据。
Description
技术领域
本发明属于生物技术领域,尤其是涉及高度准确地制备免疫组库高通量测序文库的方法、一组引物和试剂盒及其在下一代测序中的应用。
背景技术
B细胞是体液免疫的重要执行者,其细胞膜表面受体BCR及分泌的抗体是行使特异性免疫功能的重要分子。个体或组织内的所有BCR和抗体的集合称为抗体组库。抗体组库非常庞大且极其复杂。在B细胞发育过程中,胚系V(D)J基因重组及V-D和D-J连接区域碱基插入或缺失赋予了抗体组库极高多样性,形成了识别各种抗原的具有独特互补决定区3(CDR3)的幼稚B细胞的BCR。在接受抗原刺激后,幼稚B细胞表达激活诱导的胞苷脱氨酶AID并发生克隆扩增,诱导BCR发生体细胞超突变(SHM)及类型转换(CSR),进而形成特异性识别和中和各种抗原,特别是那些入侵的病原体和体内积累的自身抗原的B细胞及抗体。此外,有限的高度同源的胚系V(D)J基因的重组导致抗体序列非常相似。因此,定量如此复杂多样的抗体组库面临巨大挑战。目前,抗体组库相关研究在多个领域展现出巨大应用前景,如包括病毒中和抗体及治疗性抗体在内的高亲和抗原特异性抗体的挖掘、疫苗的开发、B细胞恶性肿瘤的检测和机体免疫状态的监测,准确阐述并定量如此庞大而又高度相似的抗体组库是推进其在各领域应用的关键。
B细胞免疫组库测序,实际上是检测B细胞上负责识别并特异结合抗原的膜表面免疫球蛋白,我们称为B-cell receptor(BCR),BCR是由两条重链和两条轻链组成。编码BCR的4个基因簇V(可变区)、D(高变区)、J(编码蛋白连接V、C区的结合区)、C(恒定区),B细胞通过V(D)J重组,使BCR基因序列极为丰富,但每个B细胞只表达一种特定的BCR,也就是只能识别一种抗原。
随着高通量抗体组库测序技术(Rep-seq)的发展,研究者可以一次性获得数以千万的抗体序列,这为深入解析抗体组库带来了希望。但是,由于抗体序列高度相似,在Rep-seq文库制备和测序过程中极易发生模板转换和聚合酶链式反应(PCR)介导的重组,产生具有错配及插入和缺失的嵌合抗体序列,因而误导CDR-H3序列的分析,并被误认为是克隆扩增和成熟过程中自然发生的SHM的结果,进而误导抗体成熟路径分析及抗原特异性抗体的寻找。我们研究发现升高退火温度和降低PCR循环数可减少嵌合体序列的产生。但是现有的实验技术和测序分析方法均无法分辨及去除测序数据中的样本内嵌合体序列,这对样本内的多样性定量分析产生了极大的干扰。
Rep-seq产生的嵌合抗体序列可分为三类:文库间嵌合抗体序列、样本间嵌合抗体序列和样本内嵌合抗体序列。文库间和样本间嵌合抗体序列可以顺利去除,如通过用双端index标记每个库并根据index的配对信息去除库间嵌合抗体序列,通过用双端条形码(Barcode)标记每个样本并根据配对Barcode去除样本间嵌合抗体序列。虽然有研究表明研究利用序列比对可以识别少量已知序列扩增形成的样本内嵌合抗体序列,但由于彼此高度相似的胚系V(D)J基因经体细胞重组产生了极其多样又高度相似的抗体,导致无法从序列上区分嵌合抗体序列与真实抗体序列。虽然嵌合抗体序列对抗体组库特征分析及高亲和性抗体寻找的不利影响一直被广泛关注,但目前仍无法明确定量并去除Rep-seq数据中的样本内嵌合抗体序列。
发明内容
针对现有技术中嵌合体序列产生存在的不足之处,本发明设计了一种全新的免疫组库测序文库构建方法,能甄别并去除样本内嵌合体序列,达到真正还原免疫组库真实情况的目的。
本发明的目的在于去除测序数据中的嵌合体序列而提供一种高度准确的免疫组库测序文库的构建方法;设计能扩增目前已发现的人和C57BL6小鼠的所有IgH和IgK的不同等位基因的引物集。除非另外定义,本文中使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同意义。
在本文中,引物序列中的字母“N”选自碱基A、T、C和G中的任意一种;引物序列中的字母“R”选自碱基A和G中的任意一种;引物序列中的字母“W”选自碱基A和T中的任意一种;引物序列中的字母“Y”选自碱基C和T中的任意一种;引物序列中的字母“S”选自碱基C和G中的任意一种;引物序列中的字母“B”选自碱基T、C和G中的任意一种。
一方面,本发明提供了一种甄别样本内嵌合体序列的免疫组库高通量测序文库的构建方法。其特点在于,基于多重PCR文库制备方法,同时引入双端UMI(unique molecularidentifier,由随机碱基组成,本发明设计的UMI的结构为NNNNNNNN,全长为8bp,其随机数目为48个,具有极好的随机性)和双端Barcode(12bp的可变序列和4bp的固定碱基ACTG)特异性标记模板链分子,使得每个样本被特异的双端Barcode标记,样本内每个模板分子被特异的双端UMI标记,通过后续分析测序结果中配对Barcode以区分样本间的嵌合体序列,通过分析配对UMI的丰度分布以甄别样本内的嵌合体序列,从而获取更为准确的免疫组库信息。
为了实现上述目的,本发明采取如下的用于去除样本内嵌合体序列的免疫组库高通量测序文库的构建方法:以带有下游Barcode及UMI的BCR亚型特异性引物(ISP)逆转录合成带特异性下游Barcode及UMI标记的cDNA第一链,然后利用带上游Barcode及UMI的上游引物进行1个循环的PCR,产物纯化后利用配对的Barcode引物进行第二轮25循环的PCR。
本发明公开了一种用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的方法,所述方法按照以下步骤进行:
(1)提取样本中的总RNA;
(2)利用带有下游Barcode和UMI的BCR亚型特异性引物ISP对步骤(1)中的总RNA进行逆转录,合成并纯化带特异性下游Barcode及UMI标记的cDNA第一链;
(3)利用带有上游Barcode和UMI的上游引物对纯化的cDNA第一链进行第一轮RCR扩增,经纯化后获得第一轮扩增产物;
(4)利用配对的上游Barcode引物和下游Barcode引物对第一轮扩增产物进行第二轮RCR扩增,经纯化后获得第二轮扩增产物。
进一步地,UMI长8bp由随机碱基组成,其碱基序列为NNNNNNNN,Barcode为12bp的可变序列和4bp的固定碱基ACTG。
进一步地,所述方法还包括:(5)将测序接头连接到纯化的第二轮扩增产物的两端。
进一步地,在步骤(2)中,在逆转录后,先进行RNase H消化,然后再进行纯化cDNA第一链。
进一步地,所述样本选自人类和动物的外周血、健康组织和病变组织。
进一步地,步骤(4)中配对的上游Barcode引物和下游Barcode引物为SEQ ID NO:63-64。
进一步地,步骤(2)中带有下游Barcode和UMI的BCR亚型特异性引物ISP包括SEQID NO:11-15、23和35,步骤(3)中带有上游Barcode和UMI的上游引物包括SEQ ID NO:1-10、16-22、24-34。
进一步地,步骤(2)中的ISP包括SEQ ID NO:49-54、62,步骤(3)中的上游引物包括SEQ ID NO:36-48、55-61。
本发明还公开了一组用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的引物,所述引物包括带有下游Barcode和UMI的BCR亚型特异性引物ISP、带有上游Barcode和UMI的上游引物以及配对的上游Barcode引物和下游Barcode引物,UMI由随机碱基组成,长8bp,其碱基序列为NNNNNNNN,Barcode为12bp的可变序列和4bp的固定碱基ACTG。
进一步地,配对的上游Barcode引物和下游Barcode引物为SEQ ID NO:63-64。
进一步地,带有下游Barcode和UMI的BCR亚型特异性引物ISP包括SEQ ID NO:11-15、23和35,带有上游Barcode和UMI的上游引物包括SEQ ID NO:1-10、16-22、24-34。
进一步地,带有下游Barcode和UMI的BCR亚型特异性引物ISP包括SEQ ID NO:49-54、62,带有上游Barcode和UMI的上游引物包括SEQ ID NO:36-48、55-61。
本发明还公开了一种用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的试剂盒,其特征在于,所述试剂盒包括一组用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的引物,所述引物包括带有下游Barcode和UMI的BCR亚型特异性引物ISP、带有上游Barcode和UMI的上游引物以及配对的上游Barcode引物和下游Barcode引物,UMI由随机碱基组成,长8bp,其碱基序列为NNNNNNNN,Barcode为12bp的可变序列和4bp的固定碱基ACTG。
进一步地,配对的上游Barcode引物和下游Barcode引物为SEQ ID NO:63-64。
进一步地,带有下游Barcode和UMI的BCR亚型特异性引物ISP包括SEQ ID NO:11-15、23和35,带有上游Barcode和UMI的上游引物包括SEQ ID NO:1-10、16-22、24-34。
进一步地,带有下游Barcode和UMI的BCR亚型特异性引物ISP包括SEQ ID NO:49-54、62,带有上游Barcode和UMI的上游引物包括SEQ ID NO:36-48、55-61。
本发明技术效果:(1)本发明基于多重PCR文库制备方法,同时引入双端UMI和双端Barcode特异性标记模板链分子,使得每个样本被特异的双端Barcode标记,样本内每个模板分子被特异的双端UMI标记,通过后续分析测序结果中配对Barcode以区分样本间的嵌合体序列,通过分析配对UMI的丰度分布以甄别样本内的嵌合体序列,从而获取更为准确的免疫组库信息;(2)本发明以带有下游Barcode及UMI的BCR亚型特异性引物逆转录合成带特异性下游Barcode及UMI标记的cDNA第一链,然后利用带上游Barcode及UMI的上游引物进行1个循环的PCR,以实现对样本内的每一条模板分子标记特异性配对的UMI分子;(3)本发明针对人和C57BL6小鼠BCR的重链及轻链各自设计了一套引物,能扩增目前已发现的所有IgG、IgM、IgA、IgD、IgE、IgK和/或IgL的不同等位基因;(4)本发明通过分析测序结果中相同序列的配对UMI的种类数,可以校正多重PCR各引物的偏好性,实现对每个DNA分子进行定量,从而获得更准确的免疫组库信息。
附图说明
图1为在逆转录及第二链cDNA合成过程中加双端Barcode和双端UMI,随后通过通用引物扩增,以实现无偏差扩增的文库构建流程图。
图2为人类幼稚B细胞BCR组库文库DNA胶图。
图3为人类幼稚B细胞BCR组库文库质控图。
图4为生物信息学分析流程图。
图5为C57bl/6小鼠BCR组库文库DNA胶图。
具体实施方式
以下实施例的说明只是用于帮助理解本发明的方法及其核心思想,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。对所公开的实施例的下述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例中,而是可以应用于符合与本文所公开的原理和新颖特点相一致的更宽的范围。
实施例中未注明具体技术或条件,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。
实施例1:样本RNA的获得
1.利用EDTA抗凝管采集人类外周血,通过密度梯度离心分离人类外周血单核细胞(PBMC);
3.计数人类外周血单核细胞以及幼稚B细胞并提取总RNA(Qiagen,74106),浓度如表7。
表7
实施例2:人类BCR组库文库构建
利用实施例1中获得的总RNA为模板,用带有下游Barcode及UMI的BCR亚型特异性引物逆转录合成cDNA第一链,然后利用带上游Barcode及UMI的leader区及V基因特异性引物的混合物进行1个循环的PCR,实现对样本内的每一条模板分子标记特异性配对的UMI,随后利用上下游Barcode引物进行无偏差扩增,示意图如图1,具体过程如下:
1.逆转录合成cDNA
使用带有下游Barcode及UMI的BCR亚型特异性引物(SEQ ID NO:11-15、23和35)进行逆转录,具体如下:
a.按照表8配置混合体系,并在PCR仪上进行反应,反应程序为:65℃,5min,反应程序结束后立马把产物放于冰上3min。
表8
注:ISP引物为SEQ ID NO:11-15、23和35。
b.按照表9配置混合体系,并在PCR仪上进行反应,反应程序为:42℃,2min。
表9
c.向上述反应体系中加入1μl SuperScript II Reverse Transcriptase(ThermoFisher,18064071),吹打混匀后,在PCR仪上进行反应,反应程序为:42℃50min,70℃15min。
2.cDNA纯化
(1)往上述反应体系中各加入0.2μl RNase H(10U/μl),并在PCR仪上进行反应,消化与cDNA杂合的RNA,反应程序为:37℃20min;
(2)加入1.8倍体积的AMPure XP磁珠(Beckman,A63881),充分混匀后孵育5分钟,然后置于磁力架5分钟,用70%乙醇洗涤两遍,晾干5分钟,加水充分重悬并孵育5分钟,然后置于磁力架5分钟,吸取上清,得到产物1(即第一链cDNA)。
3.第一次PCR反应
a.按表10配置PCR反应体系:
表10
注:Primer mix为带有上游Barcode及UMI的leader区及V基因特异性引物的混合物(SEQ ID NO:1-10、16-22、24-34。),2xKAPA HiFiHotStartReadyMix(Roche,KK2602)。
b.PCR仪设置如表11:
表11
4.双链DNA纯化
往上述两种PCR体系中分别加入0.8倍体积的SPRISelect磁珠(Beckman,B23318),充分混匀后孵育5分钟,然后置于磁力架5分钟,用80%乙醇洗涤两遍,晾干5分钟,加水充分重悬并孵育5分钟,然后置于磁力架5分钟,吸取上清,得到产物2。
5.第二次PCR反应
(1)按表12配置PCR反应体系:
表12
注:Primer F即为上游Barcode引物SEQ ID NO:63,Primer R即为下游Barcode引物SEQ ID NO:64。
(2)PCR仪设置如表13:
表13
6.凝胶电泳及纯化
PCR产物跑胶鉴定(幼稚B细胞IgM扩增产物,图2),将约为500bp大小的目的条带割胶,利用DNA纯化柱(MACHEREY-NAGEL,740609.25)纯化后得到产物3。浓度如表14:
表14
7.测序接头连接
(1)计算需要建库测序样本的摩尔质量,根据拟获得的数据量调整建库所需的产物量,利用建库试剂盒(PerkinElmer,NOVA-5149-01)将测序接头连接到产物3的两端。
(2)加入0.6倍体积的SPRISelect磁珠,充分混匀后孵育5分钟,然后置于磁力架5分钟,用80%乙醇洗涤两遍,晾干5分钟,加水充分重悬并孵育5分钟,然后置于磁力架5分钟,吸取上清,得到产物4,进行质控并测序,质控图如图3。
实施例3:去除人类幼稚B细胞抗体组库测序数据中的嵌合体序列
通过生物信息学分析流程去除实施例2中的人类幼稚B细胞抗体组库测序数据中的嵌合体序列,具体如图4。
1.下机数据通过配对Barcode识别和去除样本间嵌合抗体序列;
2.基于UMI对的丰度分布去除服从poisson分布的样本内嵌合抗体序列;
3.根据CDR3s和UMI对重新聚类并建立一致性序列,消除在PCR和高通量测序中引入的碱基错误,得到真实的抗体序列。
去除嵌合体及构建一致性序列前后测序数据量如表15。
表15
实施例4:C57bl/6小鼠抗体组库文库构建
以C57bl/6小鼠的外周血、脾脏、骨髓的总RNA为模板,用带有下游Barcode及UMI的BCR亚型特异性引物逆转录合成cDNA第一链,然后利用带上游Barcode及UMI的V基因特异性引物的混合物进行1个循环的PCR,实现对样本内的每一条模板分子标记特异性配对的UMI,随后利用上下游Barcode引物进行无偏差扩增,示意图如图1,具体过程如下:
1.提取RNA
(1)解剖小鼠并采集外周血、脾脏、骨髓;
(1)利用RNeasy试剂盒提取总RNA,浓度如表16。
表16
2.逆转录合成cDNA
使用带有下游Barcode及UMI的ISP(SEQ ID NO:49-54、62)进行逆转录,具体如下:
a.按照表17配置混合体系,并在PCR仪上进行反应,反应程序为:65℃,5min,反应程序结束后立马把产物放于冰上3min。
表17
注:ISP引物为SEQ ID NO:49-54、62。
b.按照表18配置混合体系,并在PCR仪上进行反应,反应程序为:42℃,2min。
表18
c.向上述反应体系中加入1μl SuperScript II Reverse Transcriptase,吹打混匀后,在PCR仪上进行反应,反应程序为:42℃50min,70℃15min。
3.cDNA纯化
(1)往上述反应体系中各加入0.2μl RNase H(10U/μl),并在PCR仪上进行反应,消化与cDNA杂合的RNA,反应程序为:37℃20min;
(2)加入1.8倍体积的AMPure XP磁珠,充分混匀后孵育5分钟,然后置于磁力架5分钟,用70%乙醇洗涤两遍,晾干5分钟,加水充分重悬并孵育5分钟,然后置于磁力架5分钟,吸取上清,得到产物1(即第一链cDNA)。
4.第一次PCR反应
a.按表19配置PCR反应体系:
表19
注:Primer mix为带有上游Barcode及UMI的IgHV或IgKV基因特异性引物的混合物(SEQ ID NO:36-48、55-61)。
b.PCR仪设置如表20:
表20
5.双链DNA纯化
往上述两种PCR体系中分别加入0.8倍体积的SPRISelect磁珠,充分混匀后孵育5分钟,然后置于磁力架5分钟,用80%乙醇洗涤两遍,晾干5分钟,加水充分重悬并孵育5分钟,然后置于磁力架5分钟,吸取上清,得到产物2。
6.第二次PCR反应
(1)按表21配置PCR反应体系:
表21
注:Primer F即为上游Barcode引物SEQ ID NO:63,Primer R即为下游Barcode引物SEQ ID NO:64。
(2)PCR仪设置如表22:
表22
7.凝胶电泳及纯化
PCR产物跑胶鉴定(如图5),将约为500bp大小的目的条带割胶,利用DNA纯化柱纯化后得到产物3。浓度如表23:
表23
8.测序接头连接
(1)计算需要建库测序样本的摩尔质量,根据拟获得的数据量调整建库所需的产物量,利用建库试剂盒将测序接头连接到产物3的两端。
(2)加入0.6倍体积的SPRISelect磁珠,充分混匀后孵育5分钟,然后置于磁力架5分钟,用80%乙醇洗涤两遍,晾干5分钟,加水充分重悬并孵育5分钟,然后置于磁力架5分钟,吸取上清,得到产物4,进行质控并测序。
<110>广东省人民医院
<120>用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的方法、一组引物和试剂盒
<160> 64
<170> 电子序列表制作及校验工具V1.0
<210> 1
<211> 42
<212> DNA
<213> 人工序列
<400> 1
cgccaagtgt ctatgcnnnn nnnncaggtc accttgaggg ag 42
<210> 2
<211> 42
<212> DNA
<213>人工序列
<400> 2
cgccaagtgt ctatgcnnnn nnnncaggtg cagctggtgc ag 42
<210> 3
<211> 46
<212> DNA
<213>人工序列
<400> 3
cgccaagtgt ctatgcnnnn nnnncaggtg cagctacagc agtggg 46
<210> 4
<211> 46
<212> DNA
<213>人工序列
<400> 4
cgccaagtgt ctatgcnnnn nnnncaggtg cagctgcagg agtcgg 46
<210> 5
<211> 47
<212> DNA
<213>人工序列
<400> 5
cgccaagtgt ctatgcnnnn nnnncaggtc cagctggtgc agtctgg 47
<210> 6
<211> 46
<212> DNA
<213>人工序列
<400> 6
cgccaagtgt ctatgcnnnn nnnnttaaaa ggtgtccagt gtgagg 46
<210> 7
<211> 45
<212> DNA
<213>人工序列
<400> 7
cgccaagtgt ctatgcnnnn nnnncaggta cagctgcagc agtca 45
<210> 8
<211> 47
<212> DNA
<213>人工序列
<400> 8
cgccaagtgt ctatgcnnnn nnnncaggtg cagctggtgg agtctgg 47
<210> 9
<211> 44
<212> DNA
<213>人工序列
<400> 9
cgccaagtgt ctatgcnnnn nnnncaacta caggtgccca ctcc 44
<210> 10
<211> 45
<212> DNA
<213>人工序列
<400> 10
cgccaagtgt ctatgcnnnn nnnngaggtg cagctggtgg agtct 45
<210> 11
<211> 46
<212> DNA
<213>人工序列
<400> 11
agccgacaac cttacgnnnn nnnncccttg gtggargcct gargag 46
<210> 12
<211> 46
<212> DNA
<213>人工序列
<400> 12
agccgacaac cttacgnnnn nnnngcggat gcactcccct gargag 46
<210> 13
<211> 46
<212> DNA
<213>人工序列
<400> 13
agccgacaac cttacgnnnn nnnnctggtc ggggatgcct gargag 46
<210> 14
<211> 46
<212> DNA
<213>人工序列
<400> 14
agccgacaac cttacgnnnn nnnngccttg gtgggtgcct gargag 46
<210> 15
<211> 46
<212> DNA
<213>人工序列
<400> 15
agccgacaac cttacgnnnn nnnnctctgt gtggaggcct gargag 46
<210> 16
<211> 44
<212> DNA
<213>人工序列
<400> 16
cgccaagtgt ctatgcnnnn nnnngagatt gtgatgaccc agac 44
<210> 17
<211> 44
<212> DNA
<213>人工序列
<400> 17
cgccaagtgt ctatgcnnnn nnnngatatt gtgatgactc agtc 44
<210> 18
<211> 44
<212> DNA
<213>人工序列
<400> 18
cgccaagtgt ctatgcnnnn nnnnaatttc cagatgactc agtc 44
<210> 19
<211> 44
<212> DNA
<213>人工序列
<400> 19
cgccaagtgt ctatgcnnnn nnnngaaata gtgatgacgc agtc 44
<210> 20
<211> 44
<212> DNA
<213>人工序列
<400> 20
cgccaagtgt ctatgcnnnn nnnngacatc gtgatgaccc agtc 44
<210> 21
<211> 44
<212> DNA
<213>人工序列
<400> 21
cgccaagtgt ctatgcnnnn nnnngaaacg acactcacgc agtc 44
<210> 22
<211> 44
<212> DNA
<213>人工序列
<400> 22
cgccaagtgt ctatgcnnnn nnnngacatc cagttgaccc agtc 44
<210> 23
<211> 50
<212> DNA
<213>人工序列
<400> 23
agccgacaac cttacgnnnn nnnngatgaa gacagatggt gcagccacag 50
<210> 24
<211> 44
<212> DNA
<213>人工序列
<400> 24
cgccaagtgt ctatgcnnnn nnnncagtct gtgctgactc agcc 44
<210> 25
<211> 44
<212> DNA
<213>人工序列
<400> 25
cgccaagtgt ctatgcnnnn nnnntcctat gagctgactc agcc 44
<210> 26
<211> 44
<212> DNA
<213>人工序列
<400> 26
cgccaagtgt ctatgcnnnn nnnntcctct gagctgactc agct 44
<210> 27
<211> 45
<212> DNA
<213>人工序列
<400> 27
cgccaagtgt ctatgcnnnn nnnntcctcc atgctgactc aggag 45
<210> 28
<211> 44
<212> DNA
<213>人工序列
<400> 28
cgccaagtgt ctatgcnnnn nnnntcctct gggccaactc aggt 44
<210> 29
<211> 44
<212> DNA
<213>人工序列
<400> 29
cgccaagtgt ctatgcnnnn nnnncagcct gtgctgactc aatc 44
<210> 30
<211> 45
<212> DNA
<213>人工序列
<400> 30
cgccaagtgt ctatgcnnnn nnnncaggct gtggtgactc aggag 45
<210> 31
<211> 44
<212> DNA
<213>人工序列
<400> 31
cgccaagtgt ctatgcnnnn nnnnggtgac ccaggagcca tcgt 44
<210> 32
<211> 44
<212> DNA
<213>人工序列
<400> 32
cgccaagtgt ctatgcnnnn nnnncaggca gggctgactc agcc 44
<210> 33
<211> 44
<212> DNA
<213>人工序列
<400> 33
cgccaagtgt ctatgcnnnn nnnnctcagt gtccgggtct cctg 44
<210> 34
<211> 44
<212> DNA
<213>人工序列
<400> 34
cgccaagtgt ctatgcnnnn nnnnaattct atgctgactc agcc 44
<210> 35
<211> 48
<212> DNA
<213>人工序列
<400> 35
agccgacaac cttacgnnnn nnnnccttgt tggcttgrag ctcctcag 48
<210> 36
<211> 44
<212> DNA
<213>人工序列
<400> 36
cgccaagtgt ctatgcnnnn nnnngaggtc cagcttcagc agtc 44
<210> 37
<211> 44
<212> DNA
<213>人工序列
<400> 37
cgccaagtgt ctatgcnnnn nnnncatgtc caactgcagc agcc 44
<210> 38
<211> 44
<212> DNA
<213>人工序列
<400> 38
cgccaagtgt ctatgcnnnn nnnngaggtg cagcttgttg agtc 44
<210> 39
<211> 44
<212> DNA
<213>人工序列
<400> 39
cgccaagtgt ctatgcnnnn nnnngaagtg cagctgttgg agac 44
<210> 40
<211> 44
<212> DNA
<213>人工序列
<400> 40
cgccaagtgt ctatgcnnnn nnnncaggct tatctacagc agtc 44
<210> 41
<211> 44
<212> DNA
<213>人工序列
<400> 41
cgccaagtgt ctatgcnnnn nnnncaggtg cagctgaagg agtc 44
<210> 42
<211> 44
<212> DNA
<213>人工序列
<400> 42
cgccaagtgt ctatgcnnnn nnnngaggtg aagcttctcc agtc 44
<210> 43
<211> 44
<212> DNA
<213>人工序列
<400> 43
cgccaagtgt ctatgcnnnn nnnngaggtg aagctggtgg agtc 44
<210> 44
<211> 44
<212> DNA
<213>人工序列
<400> 44
cgccaagtgt ctatgcnnnn nnnngaagtg aagcttgagg agtc 44
<210> 45
<211> 44
<212> DNA
<213>人工序列
<400> 45
cgccaagtgt ctatgcnnnn nnnngatgtg aacctggaag tgtc 44
<210> 46
<211> 47
<212> DNA
<213>人工序列
<400> 46
cgccaagtgt ctatgcnnnn nnnncaggtt attctgaaag agtctgg 47
<210> 47
<211> 44
<212> DNA
<213>人工序列
<400> 47
cgccaagtgt ctatgcnnnn nnnncagatc cagttggtac agtc 44
<210> 48
<211> 44
<212> DNA
<213>人工序列
<400> 48
cgccaagtgt ctatgcnnnn nnnncaggtt cagctgcagc agtc 44
<210> 49
<211> 47
<212> DNA
<213>人工序列
<400> 49
agccgacaac cttacgnnnn nnnnaggggc cagtggatag achgatg 47
<210> 50
<211> 47
<212> DNA
<213>人工序列
<400> 50
agccgacaac cttacgnnnn nnnnagggac caagggatag acagatg 47
<210> 51
<211> 48
<212> DNA
<213>人工序列
<400> 51
agccgacaac cttacgnnnn nnnnaggggg aagacatttg ggaaggac 48
<210> 52
<211> 47
<212> DNA
<213>人工序列
<400> 52
agccgacaac cttacgnnnn nnnnggagtg tcagtgggta gatggtg 47
<210> 53
<211> 47
<212> DNA
<213>人工序列
<400> 53
agccgacaac cttacgnnnn nnnntgcact ctgagaggag gaacatg 47
<210> 54
<211> 47
<212> DNA
<213>人工序列
<400> 54
agccgacaac cttacgnnnn nnnngtagag ctgagggttc ctgatag 47
<210> 55
<211> 44
<212> DNA
<213>人工序列
<400> 55
cgccaagtgt ctatgcnnnn nnnngatgtt gtgatgaccc agac 44
<210> 56
<211> 44
<212> DNA
<213>人工序列
<400> 56
cgccaagtgt ctatgcnnnn nnnngaaatt gtgctcaccc agtc 44
<210> 57
<211> 44
<212> DNA
<213>人工序列
<400> 57
cgccaagtgt ctatgcnnnn nnnngacatt gtgatgaccc agtc 44
<210> 58
<211> 44
<212> DNA
<213>人工序列
<400> 58
cgccaagtgt ctatgcnnnn nnnngaaatt gtgctgactg tgtc 44
<210> 59
<211> 44
<212> DNA
<213>人工序列
<400> 59
cgccaagtgt ctatgcnnnn nnnngaaaca actgtgaccc agtc 44
<210> 60
<211> 44
<212> DNA
<213>人工序列
<400> 60
cgccaagtgt ctatgcnnnn nnnngacatc cagatgacac agtc 44
<210> 61
<211> 44
<212> DNA
<213>人工序列
<400> 61
cgccaagtgt ctatgcnnnn nnnnaatatc caggtgatcc agtc 44
<210> 62
<211> 47
<212> DNA
<213>人工序列
<400> 62
agccgacaac cttacgnnnn nnnnggatgg tgggaagatg gatacag 47
<210> 63
<211> 47
<212> DNA
<213>人工序列
<400> 63
cgccaagtgt ctatgc 16
<210> 64
<211> 47
<212> DNA
<213>人工序列
<400> 64
agccgacaac cttacg 16
Claims (13)
1.一种用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的方法,其特征在于,所述方法按照以下步骤进行:
(1)提取样本中的总RNA;
(2)利用带有下游Barcode和UMI的BCR亚型特异性引物ISP对步骤(1)中的总RNA进行逆转录,合成并纯化带特异性下游Barcode及UMI标记的cDNA第一链;
(3)利用带有上游Barcode和UMI的上游引物对纯化的cDNA第一链进行第一轮RCR扩增,经纯化后获得第一轮扩增产物;
(4)利用配对的上游Barcode引物和下游Barcode引物对第一轮扩增产物进行第二轮RCR扩增,经纯化后获得第二轮扩增产物。
2.根据权利要求1所述的方法,其特征在于,UMI由随机碱基组成,长8bp,其碱基序列为NNNNNNNN,Barcode为12bp的可变序列和4bp的固定碱基ACTG。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
(5)将测序接头连接到纯化的第二轮扩增产物的两端。
4.根据权利要求1所述的方法,其特征在于,在步骤(2)中,在逆转录后,先进行RNase H消化,然后再进行纯化cDNA第一链。
5.根据权利要求1所述的方法,其特征在于,所述样本选自人类和动物的外周血、健康组织和病变组织。
6.根据权利要求1所述的方法,其特征在于,步骤(4)中配对的上游Barcode引物和下游Barcode引物为SEQ ID NO:63-64。
7.根据权利要求6所述的方法,其特征在于,步骤(2)中带有下游Barcode和UMI的BCR亚型特异性引物ISP包括SEQ ID NO:11-15、23和35,步骤(3)中带有上游Barcode和UMI的上游引物包括SEQ ID NO:1-10、16-22、24-34。
8.根据权利要求6所述的方法,其特征在于,步骤(2)中的ISP包括SEQ ID NO:49-54、62,步骤(3)中的上游引物包括SEQ ID NO:36-48、55-61。
9.一组用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的引物,其特征在于,所述引物包括带有下游Barcode和UMI的BCR亚型特异性引物ISP、带有上游Barcode和UMI的上游引物以及配对的上游Barcode引物和下游Barcode引物,UMI长8bp由随机碱基组成,其碱基序列为NNNNNNNN,Barcode为12bp的可变序列和4bp的固定碱基ACTG。
10.根据权利要求9所述的引物,其特征在于,配对的上游Barcode引物和下游Barcode引物为SEQ ID NO:63-64。
11.根据权利要求10所述的引物,其特征在于,带有下游Barcode和UMI的BCR亚型特异性引物ISP包括SEQ ID NO:11-15、23和35,带有上游Barcode和UMI的上游引物包括SEQ IDNO:1-10、16-22、24-34。
12.根据权利要求10所述的引物,其特征在于,带有下游Barcode和UMI的BCR亚型特异性引物ISP包括SEQ ID NO:49-54、62,带有上游Barcode和UMI的上游引物包括SEQ ID NO:36-48、55-61。
13.一组用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的试剂盒,其特征在于,所述试剂盒包括权利要求9-12之一所述的引物。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111095486.8A CN113999891B (zh) | 2021-09-17 | 2021-09-17 | 用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的方法、一组引物和试剂盒 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111095486.8A CN113999891B (zh) | 2021-09-17 | 2021-09-17 | 用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的方法、一组引物和试剂盒 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113999891A true CN113999891A (zh) | 2022-02-01 |
CN113999891B CN113999891B (zh) | 2024-01-16 |
Family
ID=79921483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111095486.8A Active CN113999891B (zh) | 2021-09-17 | 2021-09-17 | 用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的方法、一组引物和试剂盒 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113999891B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109593758A (zh) * | 2018-12-26 | 2019-04-09 | 山东艾克韦生物技术有限公司 | 多重引物组及利用该引物组基于高通量测序构建人类b细胞免疫组库的方法 |
CN110241459A (zh) * | 2019-05-31 | 2019-09-17 | 南方医科大学南方医院 | 一种甄别样品间与独立样品自身交叉反应的免疫组库方法 |
CN110241460A (zh) * | 2019-05-31 | 2019-09-17 | 南方医科大学南方医院 | 一种甄别独立样品自身交叉反应的免疫组库方法 |
CN110257476A (zh) * | 2019-05-31 | 2019-09-20 | 南方医科大学南方医院 | 一种甄别样品间交叉反应的免疫组库高通量测序文库的构建方法 |
CN111575343A (zh) * | 2019-02-18 | 2020-08-25 | 北京全谱医学检验实验室有限公司 | 一种免疫组库测序文库的构建方法及试剂盒 |
CN112852936A (zh) * | 2020-06-24 | 2021-05-28 | 广州华银健康医疗集团股份有限公司 | 一种应用免疫组库测序方法分析样本淋巴细胞或浆细胞的方法及其应用及其试剂盒 |
-
2021
- 2021-09-17 CN CN202111095486.8A patent/CN113999891B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109593758A (zh) * | 2018-12-26 | 2019-04-09 | 山东艾克韦生物技术有限公司 | 多重引物组及利用该引物组基于高通量测序构建人类b细胞免疫组库的方法 |
CN111575343A (zh) * | 2019-02-18 | 2020-08-25 | 北京全谱医学检验实验室有限公司 | 一种免疫组库测序文库的构建方法及试剂盒 |
CN110241459A (zh) * | 2019-05-31 | 2019-09-17 | 南方医科大学南方医院 | 一种甄别样品间与独立样品自身交叉反应的免疫组库方法 |
CN110241460A (zh) * | 2019-05-31 | 2019-09-17 | 南方医科大学南方医院 | 一种甄别独立样品自身交叉反应的免疫组库方法 |
CN110257476A (zh) * | 2019-05-31 | 2019-09-20 | 南方医科大学南方医院 | 一种甄别样品间交叉反应的免疫组库高通量测序文库的构建方法 |
CN112852936A (zh) * | 2020-06-24 | 2021-05-28 | 广州华银健康医疗集团股份有限公司 | 一种应用免疫组库测序方法分析样本淋巴细胞或浆细胞的方法及其应用及其试剂盒 |
Non-Patent Citations (2)
Title |
---|
QILONG WANG: "Dual UMIs and Dual Barcodes With Minimal PCR Amplification Removes Artifacts and Acquires Accurate Antibody Repertoire", 《FRONTIERS IN IMMUNOLOGY》, vol. 12, pages 1 - 15 * |
曾惠昆: "去除抗体组库测序中嵌合体序列的方法研究", 《中国优秀硕士学位论文全文数据库》, no. 3, pages 006 - 377 * |
Also Published As
Publication number | Publication date |
---|---|
CN113999891B (zh) | 2024-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11591652B2 (en) | System and methods for massively parallel analysis of nucleic acids in single cells | |
US9567633B2 (en) | Method for detecting hydroxylmethylation modification in nucleic acid and use thereof | |
CN105886608B (zh) | ApoE基因引物组、检测试剂盒和检测方法 | |
CN110129415B (zh) | 一种ngs建库分子接头及其制备方法和用途 | |
CN106319639B (zh) | 构建测序文库的方法及设备 | |
CN109536579B (zh) | 单链测序文库的构建方法及其应用 | |
TW201321518A (zh) | 微量核酸樣本的庫製備方法及其應用 | |
CN109576346B (zh) | 高通量测序文库的构建方法及其应用 | |
WO2017028753A1 (zh) | 多重pcr引物及其应用 | |
CN108893464A (zh) | 一种免疫组库高通量测序文库的构建方法 | |
CN106755410A (zh) | 一种基于高通量测序同时检测t细胞和b细胞免疫组库的方法 | |
CN109486923B (zh) | 多重扩增子测序用引物系统、其应用以及测序文库的构建方法 | |
CN107779495B (zh) | T细胞抗原受体多样性测序文库的构建方法以及试剂盒 | |
CN109593758B (zh) | 多重引物组及利用该引物组基于高通量测序构建人类b细胞免疫组库的方法 | |
CN110042148A (zh) | 一种高效获取叶绿体dna测序数据的方法及其应用 | |
CN110734958A (zh) | 一种单分子标签免疫组库高通量测序文库构建方法 | |
CN113999891B (zh) | 用于构建去除样本内嵌合体序列的免疫组库高通量测序文库的方法、一组引物和试剂盒 | |
EP3615683B1 (en) | Methods for linking polynucleotides | |
CN107058484A (zh) | 一种应用于高通量测序同时检测t细胞和b细胞免疫组库的引物组合及试剂盒 | |
CN111534858B (zh) | 用于高通量测序的文库构建方法及高通量测序方法 | |
CN107937510A (zh) | 一种家族性恶化性房室传导阻滞基因诊断试剂盒 | |
CN106283198B (zh) | 用于单细胞全基因组重亚硫酸氢盐测序的文库构建方法 | |
WO2024077439A1 (zh) | 一种单细胞转录组及染色质可及性双组学测序文库构建方法及测序方法 | |
CN116515955B (zh) | 一种多基因靶向分型方法 | |
CN107794257A (zh) | 一种dna大片段文库的构建方法及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |