CN116670340A - 一种环化文库的快速构建方法及成环接头 - Google Patents
一种环化文库的快速构建方法及成环接头 Download PDFInfo
- Publication number
- CN116670340A CN116670340A CN202080107392.5A CN202080107392A CN116670340A CN 116670340 A CN116670340 A CN 116670340A CN 202080107392 A CN202080107392 A CN 202080107392A CN 116670340 A CN116670340 A CN 116670340A
- Authority
- CN
- China
- Prior art keywords
- loop
- linker
- forming
- joint
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 17
- 238000007363 ring formation reaction Methods 0.000 title abstract description 11
- 239000012634 fragment Substances 0.000 claims abstract description 34
- 230000000295 complement effect Effects 0.000 claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 21
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 7
- 238000012986 modification Methods 0.000 claims description 15
- 230000004048 modification Effects 0.000 claims description 15
- 229910019142 PO4 Inorganic materials 0.000 claims description 13
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims description 13
- 239000010452 phosphate Substances 0.000 claims description 13
- 238000000746 purification Methods 0.000 claims description 12
- 108060002716 Exonuclease Proteins 0.000 claims description 6
- 102000013165 exonuclease Human genes 0.000 claims description 6
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 claims description 2
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 claims description 2
- 230000029087 digestion Effects 0.000 claims description 2
- 108020004414 DNA Proteins 0.000 abstract description 22
- 102000003960 Ligases Human genes 0.000 abstract description 5
- 108090000364 Ligases Proteins 0.000 abstract description 5
- 230000008439 repair process Effects 0.000 abstract description 3
- 230000009471 action Effects 0.000 abstract description 2
- 125000005647 linker group Chemical group 0.000 description 42
- 239000000047 product Substances 0.000 description 23
- 150000007523 nucleic acids Chemical group 0.000 description 16
- 238000012163 sequencing technique Methods 0.000 description 15
- 102000039446 nucleic acids Human genes 0.000 description 12
- 108020004707 nucleic acids Proteins 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 11
- 102000053602 DNA Human genes 0.000 description 9
- 239000011324 bead Substances 0.000 description 9
- 239000000243 solution Substances 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 108091081548 Palindromic sequence Proteins 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 125000006292 cyclic linker group Chemical group 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 239000007984 Tris EDTA buffer Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000011049 filling Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 239000002077 nanosphere Substances 0.000 description 2
- 238000005580 one pot reaction Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000002604 ultrasonography Methods 0.000 description 2
- 239000005711 Benzoic acid Substances 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 238000007605 air drying Methods 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- -1 polytetrafluoroethylene Polymers 0.000 description 1
- 229920001343 polytetrafluoroethylene Polymers 0.000 description 1
- 239000004810 polytetrafluoroethylene Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012772 sequence design Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B80/00—Linkers or spacers specially adapted for combinatorial chemistry or libraries, e.g. traceless linkers or safety-catch linkers
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B70/00—Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Crystallography & Structural Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Plant Pathology (AREA)
- Immunology (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明属于生物技术领域,具体公开了一种环化文库构建方法及成环接头。所述方法包括:1)将DNA序列打断成片段;2)使所述打断的片段的两端形成3’端突出;3)利用成环接头将所述3’端突出的片段环化形成环状文库,所述成环接头为不完全配对且两端具有5’端突出的双链,所述成环接头的5’端突出与所述打断的片段的3’端突出互补。本发明通过对打断DNA片段的末修复和加A处理形成末端的A粘性末端,在与特别设计的接头T粘性末端互补形成环化结构,在连接酶的作用下完成缝隙处的连接。
Description
本发明属于生物技术领域,更具体而言,本发明提供了一种环化文库的快速构建方法及成环接头。
现阶段基于下一代测序技术(NGS)高通量测序的成熟建库产品众多。但是,这些建库产品普遍是基于常规的建库流程。常规的文库构建流程主要包括如下步骤:将基因组核酸链通过物理或者酶切的方式打断成片段;对打断的片段利用外切酶进行去末端修复,并补平片段两端使得两端均为平末端,然后再利用聚合酶在DNA的3’端加A,从而生成单碱基粘性末端;在3’端加A的片段的两端加上同样的接头。接头为一条核酸长链和一条短链互补配对而成,通过AT连接互补配对后通过连接酶连接缝隙;以连接接头的片段为模板,加入与接头链互补配对的核酸单链引物作为引物进行聚合酶链式反应;通过变性使模板的两条单链分离,在引物结合至对应单链后,分别将对应单链延伸成完全互补配对、一端为A接头、一端为B接头的双链目的产物;连接产物使用磁珠纯化的方式纯化回收;纯化回收得到的DNA双链产物经过变性后,获得单链DNA,使用环化辅助核酸单链引物和DNA单链5’末端的磷酸基团的筛选,将目标DNA单链环化;通过外切酶等方法的处理,去掉不需要和剩余的未环化单链;环化后产物通过磁珠纯化的方式纯化回收;环化后的单链环状核酸产物进入后续的测序步骤;经过滚环复制后形成核酸纳米球(DNB)进行核酸序列信息读取。这其中涉及到多个转管和纯化步骤,在操作简便性和建库时间方面有改进空间。
NGS高通量测序中使用的接头本身是一段特殊设计的DNA序列,接头上的特性序列信息在测序的时候作为测序的起始位点的序列与测序引物配对,通过引物的延伸,然后完成对后续序列信息的测定。通过连接等方法将接头连接在DNA片段两端,为了实现这种有方向的连接,同时避免接头间的相互连接,通常采用粘性末端接头的连接方式。传统的建库需要保证DNA双链两端都连接接头,并且需要通过纯化的方式去掉多余的接头产物。
随着许多国家开始进行国家级大队列居民测序服务,现有技术中需要操作简单且耗时短的环化文库建库方法。
发明内容
为了解决现有技术中存在的问题,本发明提出了一种环化文库的快速构建方法及成环接头。
因此,在一方面,本发明提供了一种环化文库构建方法,所述方法包括:
1)将DNA序列打断成片段;
2)使所述打断的片段的两端3’端突出;
3)利用成环接头将所述3’端突出的片段环化形成环状文库,所述成环接头为不完全配对且两端具有5’端突出的双链,所述成环接头的5’端突出与所述打断的片段的3’端突出互补。
在一个实施方案中,在1)中,所述DNA序列经过超声或者酶切打断成随机片段。
在一个实施方案中,所述打断的片段的3’端突出和所述成环接头的5’端突出长度为1-5nt,例如3nt或2nt,优选1nt。
在一个实施方案中,所述打断的片段的3’端突出为A,所述成环接头的5’端突出为T。
在一个实施方案中,在2)中,将所述打断的片段经外切酶、聚合酶和T4多聚核苷酸激酶的处理成5’磷酸化且3’多出A脱氧核苷酸的粘性末端。
在一个实施方案中,在3)中,所述不完全配对的双链包括在一条链上有缺口或者所述双链间有非匹配区。
在一个实施方案中,在3)中,所述双链间包括两段非匹配区,所述两段非匹配区之间包括用于区分样本的条形码序列。
在一个实施方案中,在3)中,所述成环接头包括如下的成环接头(a)或成环接头(b):
成环接头(a)包括一条长链和与所述长链两端配对的两条短链,所述长链5’端具有磷酸修饰,与所述长链3’端互补配对的短链的5’端具有磷酸修饰,互补形成的双链接头具有3’端T粘性末端,并包括8-12nt(例如10nt)的单链非互补区域,优选所述单链非互补区域包括用于区分样本的条形码序列;
成环接头(b)包括两条部分互补配对的双链,所述双链两端配对形成双链结构,所述双链结构具有5’端磷酸修饰和3’端T粘性末端,优选所述双链包括8-12nt(例如10nt)的互补部分,作为区分样本的条形码序列。
在一个实施方案中,在3)中,所述成环接头为成环接头(a),所述连接后的产物经过核酸外切酶消化,消化后产物经过一步纯化后得到环状文库。
在一个实施方案中,在3)中,所述成环接头为成环接头(b),所述连接后的产物经过变性得到环状文库。
在一个实施方案中,所述环化后的单链环状文库进入后续的测序步骤,即经过滚环复制后形成核酸纳米球(DNB)进行核酸序列信息读取。
在另一方面,本发明提供了一种环化文库构建的成环接头,所述成环接头为不完全配对且两端具有5’端突出的双链,所述成环接头的5’端突出与待环化片段的3’端突出互补。
在一个实施方案中,所述待环化片段的3’端突出和所述成环接头的5’端突出长度为1-5nt,例如3nt或2nt,优选1nt。
在一个实施方案中,所述待环化片段的3’端突出为A,所述成环接头的5’端突出为T。
在一个实施方案中,所述不完全配对的双链包括在一条链上有缺口或者所述双链间有非匹配区。
在一个实施方案中,所述双链间包括两段非匹配区,所述两段非匹配区之间包括用于区分样本的的条形码序列。
在一个实施方案中,所述成环接头包括如下的成环接头(a)或成环接头(b):
成环接头(a)包括一条长链和与所述长链两端配对的两条短链,所述长链5’端具有磷酸修饰,与所述长链3’端互补配对的短链的5’端具有磷酸修饰,互补形成的双链接头具有3’端T粘性末端,并包括8-12nt(例如10nt)的单链非互补区域,优选所述单链非互补区域包括用于区分样本的条形码序列;
成环接头(b)包括两条部分互补配对的双链,所述双链两端配对形成双链结构,所述双链结构具有5’端磷酸修饰和3’端T粘性末端,优选所述双链包括8-12nt(例如10nt)的互补部分,作为区分样本的条形码序列。
本发明通过特别设计的接头实现了环化文库的一步成环。本发明通过对打断DNA片段的末修复和加A处理形成末端的A粘性末端,在与特别设计的接头T粘性末端互补形成环化结构,在连接酶的作用下完成缝隙处的连接。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对附图作简单地介绍。显而易见地,下面描述中的附图仅仅涉及本发明的一些实施例。
图1示出了成环接头(a)的示意图:A为文库最终成环结构的序列信息,上部分为插入片段信息,下部分为接头序列信息,下划线序列信息为条形码信息;B、C和D为建库流程示意图。
图2示出了成环接头(b)的示意图:A为文库最终成环结构的序列信息,上部分为插入片段信息,下部分为接头序列信息,下划线非斜体序列信息为条形码信息,下划线斜体序列为特别设计条形码信息互补序列,下划线序列信息形成回文序列;B、C和D为建库流程示意图。
图3示出了以成环接头(a)进行实验的GC覆盖度信息(A),以成环接头(b)进行的实验的GC覆盖度信息(B)。
下面对本发明进行清楚、完整地描述。显然,所描述的实施方案仅仅是本发明的一部分实施方案,而不是全部的实施方案。基于本发明中的实施方案,本领域普通技术人员可以获得的所有其他实施方案,并且它们都属于本发明保护的范围。除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不旨在于限制本发明。
本发明解决了基于MGI传统建库方式(包括基因组DNA打断、打断DNB片段末修和末端加A、接头连接、PCR扩增、单链分离环化等步骤)中存在的建库时间长、操作简便性低和纯化损失的问题。针对现有技术中存在的问题,发明人从原理上进行改进,改变了通过常规加接头、扩增再进行环化的方式,设计了具有独特序列结构的连接接头,实现了接头连接和产物成环融合为一步反应,优化了反应体系和纯化步骤,大大缩短了构建环化文库的时间。
如图1所示,对于成环接头(a),A示出了文库最终成环结构的序列信息,上部分示出插入片段,下部分示出接头序列,下划线的序列表示条形码(barcode)序列;B、C和D示意性示出了建库流程。成环接头(a)由一条核酸长链和两条核酸短链互补配对而成,这种结构使得在成环后可以对两条核酸短链所在的链进行消化。所述成环接头长度是84bp,两条核酸短序列之间的相隔10bp。核酸长链5’端和在接头端的 短链的5’具有磷酸修饰,互补形成的双链DNA接头结构为3’多出T脱氧核苷酸的粘性末端,优选在接头中间有10bp为用于区分的单链条形码序列。双链DNA接头结构3’多出T脱氧核苷酸的粘性末端与打断DNA双链片段的3’多出A脱氧核苷酸的粘性末端互补配对后,可以通过连接酶进行连接。连接成环后,可以对所述连接产物进行消化产生单链文库或者直接进行DNB。
如图2所示,对于成环接头(b),A为文库最终成环结构的序列信息,上部分为插入片段信息,下部分为接头序列信息,下划线非斜体序列信息为条形码信息,下划线斜体序列为特别设计条形码信息互补序列,下划线序列信息形成回文序列;B、C和D示意性示出了建库流程。成环接头(b)由两条核酸长链互补配对而成,5’端具有磷酸修饰,互补形成的双链DNA接头结构为3’多出T脱氧核苷酸的粘性末端且接头中间存在非互补序列而形成∞的结构。所述成环接头长度是93bp,中间存在非互补序列而形成∞的结构的作用是可以是形成的环状接头的正反义链均可以在测序中被测得,同时减少接头二聚体的形成。非互补序列的长度为34bp,双链DNA接头结构3’多出T脱氧核苷酸的粘性末端可以与打断DNA双链片段的3’多出A脱氧核苷酸的粘性末端互补配对后,通过连接酶进行连接。连接成环后,可以对所述连接产物变性产生单链文库进行DNB。
本发明的设计创新在于环化接头的设计构造,针对双链DNA完成文库的构建,利用AT连接,序列设计适配MGI测序仪器。相较于传统的建库序列,往往需要在片段的两端连接双接头,而本发明的连接接头可以同时连接到片段的两端从而实现利用连接反应进行一步成环。利用本发明的环化接头跳过了传统建库的PCR和环化反应,于此同时也省略了纯化步骤,因此大大降低了整个建库流程的操作时间。同时每一步的反应保证在同一管中连续进行,避免了转管的操作和过程中的损失,最后进行一步纯化后产出环化文库。
提供以下实施例是为了更好地理解本发明。下述实施例中的试验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为自常规化试剂商店购买所得。应注意,上文的发明内容部分以及下文的详细描述仅为具体阐释本发明之目的,无意于以任何方式对本发明进行限制。在不背离本发明的精神和主旨的情况下,本发明的范围由随附的权利要求书确定。
实施例
实施例中使用的成环接头的序列如下:
成环接头(a)
长链a:
5’-AGTCGGAGGCCAAGCGGTCTTAGGAAGACAAxxxxxxxxxxCAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGACTT-3’,xxxxxxxxxx为条形码序列(SEQ ID NO.1)
短链1:5’-AGTCGGATCGTAGCCATGTCGTTCTGTGAGCCAAGGAGTTG-3’(SEQ ID NO.2)
短链2:5’-TTGTCTTCCTAAGACCGCTTGGCCTCCGACTT-3’(SEQ ID NO.3)成环接头(b)
长链b:
5’-AGTCGGAGGCCAAGCGGTCTTAGGAAGACAAxxxxxxxxxxYYYYYYYYYYCAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGACTT-3’(SEQ ID NO.4),xxxxxxxxxx为条形码序列,YYYYYYYYYY为条形码互补序列。
这里成环接头(b)的两条链都为长链b,即成环接头(b)的两端的匹配区和非匹配区互为镜像,中间的匹配区为回文序列。
接头退火操作:
订购后的接头使用TE回溶到100μM的浓度后,
对于成环接头(a),按照以下配方稀释后室温静置30分钟。合成10μM成环接头(a):
长链a(100μM) | 10μL |
短链1(100μM) | 10μL |
短链2(100μM) | 10μL |
5×STE buffer | 20μL |
水 | 50μL |
总计 | 100μL |
对于成环接头(b),按照以下配方稀释后室温静置30分钟。合成10μM成环接头(b):
长链b(100μM) | 20μL |
5×STE buffer | 20μL |
水 | 60μL |
总计 | 100μL |
来源:
1、基因组DNA打断:基因组DNA打断有多种方式,无论是物理超声法还是酶反应法,市场上有非常成熟的方案,本实施例采用的是物理超声打断法。
取96孔PCR板一块,加入一根聚四氟乙烯线,加入提取的基因组DNA 1μg,加入TE缓冲溶液或无酶水补齐80μl,将板封膜后至于E210超声打断仪上超声打断。
打断条件设置如下:
填充系数 | 20% |
剧烈度 | 5 |
脉冲系数 | 200 |
打断时间 | 35×4次 |
2、打断片段选择:可以采用磁珠纯化法或凝胶回收法,本实施例采用磁珠纯化法。取打断后的DNA,加入80μl Ampure XP磁珠,混匀后放置7-15min;置入磁力架后收集上清,在上清中加入40μl Ampure XP磁珠,混匀后放置7-15min;置入磁力架吸去上清,用75%乙醇洗磁珠两次;晾干后加入50μl TE缓冲溶液或无酶水,混匀后放置7-15min溶解回收产物。
3、末端修复加A:取上步骤回收产物100ng,补充TE体积至40μL按下表配制体系:配制如下表所示的反应混合液:
试剂名称 | 体积 |
无核酸酶的水 | 2.1μL |
10×PNK缓冲液 | 5μL |
5:1 dATP:dNTP | 0.6μL |
Klenow片段 | 0.1μL |
rTaq | 0.2μL |
T4 DNA聚合酶 | 2μL |
总量 | 10μL |
立即加入10μL末端修复反应液到40μl打断产物中,并进行以下反应。反应条件如下表所示:
处理条件 | 时间 |
37℃ | 30min |
65℃ | 15min |
4℃ | ∞ |
4、接头连接:反应结束,立即加入5μL成环接头(a)或成环接头(b),接头浓度为10μM。同时配制接头连接混合液,如下表:
试剂名称 | 体积 |
10×PNK缓冲液 | 3μL |
100mM ATP | 0.8μL |
无核酸酶的水 | 3.6μL |
50%PEG8000 | 16μL |
T4 DNA连接酶 | 1.6μL |
总量 | 25μL |
向末端修复产物加入适量接头之后,加入25μL接头连接混合液并进行以下反应。反应条件如下表所示:
处理条件 | 时间 |
23℃ | 30min |
4℃ | ∞ |
5、反应结束采用2×磁珠纯化,最终回溶于20μL TE溶液中。
6、DNB的制备和测序:具体的操作步骤可以参考MGI测序试剂盒说明书。以双链文库制备DNB。初步上机分析测序结果如下,以成环接头(a)进行实验的GC覆盖度信息如图3中A所示,以成环接头(b)进行实验的GC覆盖度信息如图3中B所示。
成环接头(a)
样本名 | 成环接头a |
过滤后读长数 | 1076236 |
过滤后碱基数(Mb) | 161.44 |
过滤后比例(%) | 52.62 |
比对率(%) | 11.1 |
特异性比率(%) | 98.26 |
重复数据率(%) | 0.83 |
错配比例(%) | 3.5 |
成环接头(b)
样本名 | 成环接头b |
过滤后读长数 | 16709122 |
过滤后碱基数(Mb) | 1754.46 |
过滤后比例(%) | 38.24 |
比对率(%) | 50.65 |
特异性比率(%) | 98.1 |
重复数据率(%) | 1.9 |
错配比例(%) | 1.86 |
结果分析:所有成环接头从原理上实现了针对现有技术的问题,改变了通过常规加接头、扩增再进行环化的方式,实现了接头连接和产物成环融合为一步反应,大大缩短了构建环化文库的时间。建库后的产物为环化产物,经过DNB制备后,可以直接上级测序,测序结果分析后可以发现:所有接头均可以成功建库测序,测序后的结果虽然数据上表现不是最好,但是本实验目的为验证接头设计在实验中的可行性和提供一定的示范例。因此实验数据结果很好的证明了本发明的接头设计重复满足发明需求并具有一定的可实施性。
以上应用了具体实例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。
Claims (10)
- 一种环化文库构建方法,所述方法包括:1)将DNA序列打断成片段;2)使所述打断的片段的两端3’端突出;3)利用成环接头将所述3’端突出的片段环化形成环状文库,所述成环接头为不完全配对且两端具有5’端突出的双链,所述成环接头的5’端突出与所述打断的片段的3’端突出互补。
- 根据权利要求1所述的方法,所述打断的片段的3’端突出为A,所述成环接头的5’端突出为T。
- 根据权利要求2所述的方法,在2)中,将所述打断的片段经外切酶、聚合酶和T4多聚核苷酸激酶的处理成5’磷酸化且3’多出A脱氧核苷酸的粘性末端。
- 根据权利要求1-3任一项所述的方法,在3)中,所述不完全配对的双链包括在一条链上有缺口或者所述双链间有非匹配区。
- 根据权利要求4所述的方法,在3)中,所述双链间包括两段非匹配区,所述两段非匹配区之间包括用于区分样本的条形码序列。
- 根据权利要求1-4任一项所述的方法,在3)中,所述成环接头包括如下的成环接头(a)或成环接头(b):成环接头(a)包括一条长链和与所述长链两端配对的两条短链,所述长链5’端具有磷酸修饰,与所述长链3’端互补配对的短链的5’端具有磷酸修饰,互补形成的双链接头具有3’端T粘性末端,并包括8-12nt(例如10nt)的单链非互补区域,优选所述单链非互补区域包括用于区分样本的条形码序列;成环接头(b)包括两条部分互补配对的双链,所述双链两端配对形成双链结构,所述双链结构具有5’端磷酸修饰和3’端T粘性末端,优选所述双链包括8-12nt(例如10nt)的互补部分,作为区分样本的条形码序列。
- 根据权利要求6所述的方法,在3)中,所述成环接头为成环接头(a),所述连接后的产物经过核酸外切酶消化,消化后产物经过一步纯化后得到环状文库;或者,所述成环接头为成环接头(b),所述连接后的产物经过变性得到环状文库。
- 一种构建环化文库的成环接头,所述成环接头为不完全配对且两端具有5’端突出结构的双链,所述成环接头5’端突出与待环化片段的3’端突出互补。
- 根据权利要求8所述的成环接头,所述不完全配对的双链包括在一条链上有缺口或者所述双链间有非匹配区;优选地,所述双链间包括两段非匹配区,所述两段非匹配区之间包括用于区分样本的条形码序列。
- 根据权利要求8或9所述的成环接头,所述成环接头包括如下的成环接头(a)或成环接头(b):成环接头(a)包括一条长链和与所述长链两端配对的两条短链,所述长链5’端具有磷酸修饰,与所述长链3’端互补配对的短链的5’端具有磷酸修饰,互补形成的双链接头具有3’端T粘性末端,并包括8-12nt(例如10nt)的单链非互补区域,优选所述单链非互补区域包括用于区分样本的条形码序列;成环接头(b)包括两条部分互补配对的双链,所述双链两端配对形成双链结构,所述双链结构具有5’端磷酸修饰和3’端T粘性末端,优选所述双链包括8-12nt(例如10nt)的互补部分,作为区分样本的条形码序列。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2020/140877 WO2022141061A1 (zh) | 2020-12-29 | 2020-12-29 | 一种环化文库的快速构建方法及成环接头 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116670340A true CN116670340A (zh) | 2023-08-29 |
Family
ID=82258757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080107392.5A Pending CN116670340A (zh) | 2020-12-29 | 2020-12-29 | 一种环化文库的快速构建方法及成环接头 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20240076657A1 (zh) |
EP (1) | EP4273307A4 (zh) |
CN (1) | CN116670340A (zh) |
WO (1) | WO2022141061A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024098178A1 (zh) * | 2022-11-07 | 2024-05-16 | 深圳华大智造科技股份有限公司 | 制备dna纳米球的反应体系及其应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102864498A (zh) * | 2012-09-24 | 2013-01-09 | 天津工业生物技术研究所 | 一种长片段末端文库的构建方法 |
US20180030532A1 (en) * | 2014-11-21 | 2018-02-01 | Bgi Shenzhen Co., Limited | Bubble-shaped adaptor element and method of constructing sequencing library with bubble-shaped adaptor element |
WO2018081666A1 (en) * | 2016-10-28 | 2018-05-03 | Silgentech Inc. | Methods of single dna/rna molecule counting |
CN112226821A (zh) * | 2020-10-16 | 2021-01-15 | 鲲羽生物科技(江门)有限公司 | 一种基于双链环化的mgi测序平台测序文库的构建方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG11201608486SA (en) * | 2014-04-11 | 2016-11-29 | Redvault Biosciences Lp | Systems and methods for clonal replication and amplification of nucleic acid molecules for genomic and therapeutic applications |
-
2020
- 2020-12-29 CN CN202080107392.5A patent/CN116670340A/zh active Pending
- 2020-12-29 US US18/259,978 patent/US20240076657A1/en active Pending
- 2020-12-29 WO PCT/CN2020/140877 patent/WO2022141061A1/zh active Application Filing
- 2020-12-29 EP EP20967409.2A patent/EP4273307A4/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102864498A (zh) * | 2012-09-24 | 2013-01-09 | 天津工业生物技术研究所 | 一种长片段末端文库的构建方法 |
US20180030532A1 (en) * | 2014-11-21 | 2018-02-01 | Bgi Shenzhen Co., Limited | Bubble-shaped adaptor element and method of constructing sequencing library with bubble-shaped adaptor element |
WO2018081666A1 (en) * | 2016-10-28 | 2018-05-03 | Silgentech Inc. | Methods of single dna/rna molecule counting |
CN112226821A (zh) * | 2020-10-16 | 2021-01-15 | 鲲羽生物科技(江门)有限公司 | 一种基于双链环化的mgi测序平台测序文库的构建方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2022141061A1 (zh) | 2022-07-07 |
EP4273307A1 (en) | 2023-11-08 |
US20240076657A1 (en) | 2024-03-07 |
EP4273307A4 (en) | 2024-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10400279B2 (en) | Method for constructing a sequencing library based on a single-stranded DNA molecule and application thereof | |
CN106795514B (zh) | 泡状接头及其在核酸文库构建及测序中的应用 | |
CN108138364B (zh) | 一种核酸单链环状文库的构建方法和试剂 | |
CN105400776B (zh) | 寡核苷酸接头及其在构建核酸测序单链环状文库中的应用 | |
EP0739422A1 (en) | Sequencing of nucleic acids | |
CN112708619B (zh) | Mgi平台的建库用接头、试剂盒及建库方法 | |
JP2001513639A (ja) | 複数のdna断片をアセンブリーする方法 | |
WO2016078096A1 (zh) | 使用鼓泡状接头元件构建测序文库的方法 | |
CN118222672A (zh) | 滚环扩增方法、测序文库制备方法及制得的dna纳米球 | |
CN110734967A (zh) | 一种接头组合物及其应用 | |
CN113502287A (zh) | 分子标签接头及测序文库的构建方法 | |
CN116670340A (zh) | 一种环化文库的快速构建方法及成环接头 | |
CN112585279A (zh) | 一种rna建库方法及试剂盒 | |
CN108624666B (zh) | 用于构建测序文库的接头核酸分子 | |
CA2298140A1 (en) | Detection and confirmation of nucleic acid sequences by use of oligonucleotides comprising a subsequence hybridizing exactly to a known terminal sequence and a subsequence hybridizing to an unidentified sequence | |
CN106715691B (zh) | 一种转座酶打断核酸并加接头的方法和试剂 | |
CN107794258A (zh) | 一种构建dna大片段文库的方法及其应用 | |
CN114808148A (zh) | 一种dna文库构建试剂盒、文库构建方法和应用 | |
CN112176422B (zh) | Rna文库的构建方法 | |
JP2003518953A (ja) | 核酸分析の方法 | |
WO2018081666A1 (en) | Methods of single dna/rna molecule counting | |
CN113136416A (zh) | 一种用于PacBio测序的文库构建方法 | |
CN108265047B (zh) | 用于dna片段的非特异性复制的方法及试剂盒 | |
CN107794574B (zh) | 一种构建dna大片段文库的方法及其应用 | |
CN117646059A (zh) | 构建甲基化文库的方法及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |