CN113462748A - Dna测序文库的制备方法及试剂盒 - Google Patents
Dna测序文库的制备方法及试剂盒 Download PDFInfo
- Publication number
- CN113462748A CN113462748A CN202110510000.6A CN202110510000A CN113462748A CN 113462748 A CN113462748 A CN 113462748A CN 202110510000 A CN202110510000 A CN 202110510000A CN 113462748 A CN113462748 A CN 113462748A
- Authority
- CN
- China
- Prior art keywords
- dna
- artificial sequence
- sequence
- joint
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供一种适用于华大智造MGISeq二代测序平台的DNA测序文库的制备方法及试剂盒,包括以下步骤:提供Tn5转座酶、第一接头和至少两种第二接头;将各第二接头分别与第一接头混合得到至少两种接头试剂,然后将各接头试剂分别与Tn5转座酶进行包埋,得到至少两种转座酶复合体试剂;将各转座酶复合体试剂分别与不同DNA样品混合进行片段化反应,然后将不同DNA样品的片段化产物混合,进行切口修复,并利用DNA磁珠分选纯化DNA片段化产物,得到DNA测序文库。本发明基于Tn5转座酶的高通量DNA样品混合建库的方法,可以节约大规模DNA样品的建库时间和成本,提高构建DNA测序文库的效率和准确性。
Description
技术领域
本发明涉及高通量测序领域,特别是涉及一种DNA测序文库的制备方法及试剂盒。
背景技术
高通量测序技术是基因测序领域的一次革命性技术创新,在基因组、转录组和表观基因组等研究领域已都开展了深入广泛的应用,极大地推动了生物医学、药物筛选和动植物遗传育种等相关领域的飞速发展。其中的DNA测序技术能用于任何生物体的DNA测序,可以检测几乎所有类型的基因组DNA变化,包括单核苷酸位点变异、插入和缺失,拷贝数变异和染色体畸变,在基因分型、致病变异发现、微生物鉴定等研究领域应用前景广阔。
DNA文库制备是高通量DNA测序的上游实验技术,高质量的文库是成功进行DNA测序的关键。根据使用的测序平台和文库类型不同,其具体实验步骤存在较大差异。首先,根据DNA样品片段化方式的不同,可将文库制备方法分为物理性机械打碎法和酶消化切割法。其中机械打断法常用超声破碎仪将DNA打碎成DNA小片段、再经过末端修复、连接测序接头和样品标签、PCR扩增和文库片段大小筛选等操作,即构建成完整的DNA测序文库,其实验过程繁琐,耗时较长。酶消化法则主要利用核酸外切酶或Tn5转座酶切割双链DNA。主流的商业化核酸外切酶主要包括NEBNext DNA双链片段化酶、KAPA片段化酶、DNase I和Endonuclease V等,其建库实验流程与机械打断法类似,并且价格高昂。经过突变的高活性的Tn5转座酶用于测序文库构建时,能将DNA片段化、末端修复、测序接头连接等多步反应转变为一步反应,与其他类型的DNA片段化酶相比,能显著地缩短建库时间。
DNA文库制备技术依然面临着很多挑战,繁琐的文库制备步骤导致二代测序不能广泛应用于急性疾病检测,基于PCR扩增的文库不能有效去除PCR所引入的错误,如何让高通量测序技术实现更快捷、更精准和更廉价地检测,是DNA测序文库制备技术继续研发的方向。例如,目前的Tn5转座酶建库方法需要经过PCR扩增过程才能使DNA片段化产物连接上样品标签和完整的测序接头,因此在DNA片段化、PCR扩增和扩增产物纯化、文库浓度测定等步骤均需单个样品分别操作,再按照每个样品所获得DNA文库的有效浓度和目标下机数据量进行混合后上机测序,无法实现多个样品混合建库,也不能有效去除PCR所引入的错误。
发明内容
基于此,有必要提供一种适于多样品混合建库且准确性较高的DNA测序文库的构建方法。
一种DNA测序文库的制备方法,包括以下步骤:
提供Tn5转座酶、第一接头和至少两种第二接头;所述第一接头的两条单链DNA的核苷酸序列分别如SEQ ID NO:1和SEQ ID NO:2所示,所述第二接头的一条单链DNA的核苷酸序列如SEQ ID NO:1所示,所述第二接头的另一条单链DNA包括从5’端至3’端依次连接的序列A、标签序列和序列B,所述序列A的核苷酸序列如SEQ ID NO:3所示,所述序列B的核苷酸序列如SEQ ID NO:4所示;
将各所述第二接头分别与所述第一接头混合得到至少两种接头试剂,然后将各所述接头试剂分别与所述Tn5转座酶进行包埋,得到至少两种转座酶复合体试剂;
将各所述转座酶复合体试剂分别与不同DNA样品混合进行片段化反应,然后将不同DNA样品的片段化反应产物混合,并进行切口修复,得到所述DNA测序文库。
本发明提供了一种适用于华大智造MGI测序平台的利用Tn5转座酶的DNA测序文库的制备方法,设计了Tn5转座酶特异识别的多种不同的接头序列,构建了多种不同的Tn5转座酶复合体试剂,可分别用于多个样品的DNA片段化反应,然后混合片段化反应后的DNA产物,即获得了多个样品的混合DNA测序文库,样品之间通过第二接头的标签序列区分。且本发明提供的DNA测序文库的制备方法无需经过传统的PCR扩增过程,可以确保在建库和测序过程中均没有PCR错误,将PCR无扩增错误的文库建库方法与MGI平台的无拷贝错误累积的DNB制备方法结合起来,能够避免PCR扩增引入的碱基错配和偏向性,更全面地覆盖基因组的复杂区域,同时能够避免PCR过程引发的核酸污染,有效地提高了测序数据的质量。因此,本发明基于Tn5转座酶的高通量DNA样品混合建库的方法,可以节约大规模DNA样品的建库时间和成本,提高构建DNA测序文库的效率和准确性。
在其中一个实施例中,所述片段化反应包括以下步骤:将DNA样品、所述转座酶复合体试剂和酶切缓冲液混合,于50℃~60℃孵育1~10min。
在其中一个实施例中,所述酶切缓冲液包括80mM~120mM三羟甲基甲胺基丙磺酸、20mM~50mM氯化镁和50wt%N,N-二甲基甲酰胺。
在其中一个实施例中,所述切口修复包括以下步骤:将所述片段化反应产物、DNA聚合酶和脱氧核苷三磷酸混合,于70℃~75℃孵育1~10min。
在其中一个实施例中,在所述切口修复的步骤之后,还包括以下步骤:采用磁珠对所述切口修复的产物进行分选纯化。
在其中一个实施例中,所述分选纯化包括以下步骤:将所述切口修复的产物与磁珠混合并孵育,然后弃去磁珠收集上清液,再加入磁珠孵育,然后弃去上清液收集磁珠,使用乙醇漂洗磁珠并干燥5~10min,然后加水孵育1~5min,收集上清液。
在其中一个实施例中,所述包埋包括以下步骤:将所述接头试剂与所述Tn5转座酶混合,于室温反应0.5~3小时。
本发明还提供了一种用于制备DNA测序文库的试剂盒,包括第一接头和至少两种第二接头,所述第一接头的两条单链DNA的核苷酸序列分别如SEQ ID NO:1和SEQ ID NO:2所示,所述第二接头的一条单链DNA的核苷酸序列如SEQ ID NO:1所示,所述第二接头的另一条单链DNA包括从5’端至3’端依次连接的序列A、标签序列和序列B,所述序列A的核苷酸序列如SEQ ID NO:3所示,所述序列B的核苷酸序列如SEQ ID NO:4所示。
在其中一个实施例中,所述标签序列选自SEQ ID NO:5~SEQ ID NO:100中的一种。
在其中一个实施例中,试剂盒还包括Tn5转座酶、DNA聚合酶、脱氧核苷三磷酸、无核酸酶水、酶切缓冲液和DNA纯化磁珠中的一种或多种。
附图说明
图1为实施例1中Agilent 2100生物分析仪检测DNA测序文库的片段长度分布图;
图2为实施例1中96个DNA样品混合建库及测序所获得的数据量分布图。
具体实施方式
为了便于理解本发明,下面将对本发明进行更全面的描述,并给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
一段DNA序列可以从原位上单独复制或断裂下来,环化后插入另一位点,并对其后的基因起调控作用,此过程即称转座。这段序列称跳跃基因或转座子。转座子是存在于染色体DNA上可自主复制和位移的基本单位。I型转座子转座中间体是RNA。I型转座子又被称为逆元件(Retro element),该型转座子会先被转录为RNA,然后该RNA被逆转录,再次成为DNA,才被插入到目标位点中。II型转座中间体是DNA,转座子序列的两端是两段直接重复序列,与它们接壤的是反向重复序列,即“回文”序列,然后才是中间的插入序列。执行转座功能的酶,通常由转座子编码,识别转座子两端的特异序列,能把转座子从相邻序列中脱离出来,再插入到新的DNA靶位点,无同源性要求。
Tn5转座子包括两端的反向重复序列和中间的转座基因。反向重复序列是转座酶结合的位置,中间的转座基因就是基因间来回跳跃的基因片段。转座发生时,两个转座酶(Tnp)分子结合到Tn5转座子的外末端(outside end,简称OE),形成两个Tnp-OE复合体,随后两个复合体联会,末端相互作用而二聚体化,形成由一个二聚体蛋白质和两分子DNA组成的联会复合体。形成该联会复合体后,Tnp才具有切割DNA的活性。形成这种结构有利于协同Tn5 DNA链的切割和转移,有利于防止Tnp只对转座子DNA链的一端进行切割。结合在左末端的Tnp负责催化右末端的磷酸二酯键水解,而结合在右末端的Tnp负责催化左末端的磷酸二酯键水解。活化Tnp水分子,此活化的水分子水解DNA链,在Tn5的两末端分别形成两个3’-OH亲核基团,该亲核基团进而攻击互补链形成发夹结构。随后另一活化的水分子水解该发夹结构,形成平末端的Tn5,整个联会复合体离开供体链,并结合到靶DNA上。Tn5的3’-OH亲核攻击靶序列,在转座子插入位点之间形成9bp的粘性末端,转座子的3’-OH同靶DNA的5’-P之间形成共价键,转座子就插入到靶序列之中。在DNA聚合酶的作用下补平缺口,转座子的两端形成9bp的正向重复序列。整个转座过程完成了基因从原始DNA被剪切之后粘贴在另一受体DNA的过程,实现了基因的“跳跃”。整个转座子序列并不是转座必须的,只需转座子的末端核心序列,转座酶便能将该部分序列插入并连接至基因组内;根据这个原理,将测序接头序列加入末端核心序列中,可简捷地完成文库构建。
本发明一实施例的一种DNA测序文库的制备方法,包括以下步骤S1~S3:
S1、提供Tn5转座酶、第一接头和至少两种第二接头。第一接头的两条单链DNA的核苷酸序列分别如SEQ ID NO:1和SEQ ID NO:2所示,第二接头的一条单链DNA的核苷酸序列如SEQ ID NO:1所示,第二接头的另一条单链DNA包括从5’端至3’端依次连接的序列A、标签序列和序列B,序列A的核苷酸序列如SEQ ID NO:3所示,序列B的核苷酸序列如SEQ ID NO:4所示。
S2、将各第二接头分别与第一接头混合得到至少两种接头试剂,然后将各接头试剂分别与Tn5转座酶进行包埋,得到至少两种转座酶复合体试剂。
S3、将各转座酶复合体试剂分别与不同DNA样品混合进行片段化反应,然后将不同DNA样品的片段化反应产物混合,并进行切口修复,得到DNA测序文库。
本发明提供了一种适用于华大智造MGI测序平台的利用Tn5转座酶的DNA测序文库的制备方法,设计了Tn5转座酶特异识别的多种不同的接头序列,构建了多种不同的Tn5转座酶复合体试剂,可分别用于多个样品的DNA片段化反应,然后混合片段化反应后的DNA产物,即获得了多个样品的混合DNA测序文库,样品之间通过第二接头的标签序列区分。且本发明提供的DNA测序文库的制备方法无需经过传统的PCR扩增过程,可以确保在建库和测序过程中均没有PCR错误,将PCR无扩增错误的文库建库方法与MGI平台的无拷贝错误累积的DNB制备方法结合起来,能够避免PCR扩增引入的碱基错配和偏向性,更全面地覆盖基因组的复杂区域,同时能够避免PCR过程引发的核酸污染,有效地提高了测序数据的质量。因此,本发明基于Tn5转座酶的高通量DNA样品混合建库的方法,可以节约大规模DNA样品的建库时间和成本,提高构建DNA测序文库的效率和准确性。
可以理解,根据DNA样品的数量,使用相应种类数量的第二接头分别与第一接头混合得到相应种类数量的接头试剂,然后将各接头试剂分别与Tn5转座酶进行包埋,即得到相应种类数量的转座酶复合体试剂,以分别用于不同DNA样品的片段化反应。
在一个具体示例中,每种第二接头的标签序列独立地选自SEQ ID NO:5~SEQ IDNO:100中的一种,从而可得到最多96种第二接头,最多可用于96种DNA样品混合建库。
在一个具体示例中,上述片段化反应包括以下步骤:将DNA样品、转座酶复合体试剂和酶切缓冲液混合,于50℃~60℃孵育1~10min。
在一个具体示例中,酶切缓冲液包括80mM~120mM三羟甲基甲胺基丙磺酸、20mM~50mM氯化镁和50wt%N,N-二甲基甲酰胺。
在一个具体示例中,上述切口修复包括以下步骤:将片段化反应产物、DNA聚合酶和脱氧核苷三磷酸混合,于70℃~75℃孵育1~10min。Tn5转座酶用于测序文库构建时,由于反应后接头与插入片段之间有9bp的切口,因此后续可通过DNA聚合酶和脱氧核苷三磷酸进行切口修复。
在一个具体示例中,在上述切口修复的步骤之后,还包括以下步骤:采用磁珠对切口修复的产物进行分选纯化。
具体地,分选纯化包括以下步骤:将切口修复的产物与磁珠混合并孵育,然后弃去磁珠收集上清液,再加入磁珠孵育,然后弃去上清液收集磁珠,使用乙醇漂洗磁珠并干燥5~10min,然后加水孵育1~5min,收集上清液。
在一个具体示例中,上述包埋包括以下步骤:将接头试剂与Tn5转座酶混合,于室温反应0.5~3小时。
本发明一实施例的用于制备DNA测序文库的试剂盒,包括第一接头和至少两种第二接头,所述第一接头的两条单链DNA的核苷酸序列分别如SEQ ID NO:1和SEQ ID NO:2所示,所述第二接头的一条单链DNA的核苷酸序列如SEQ ID NO:1所示,所述第二接头的另一条单链DNA包括从5’端至3’端依次连接的序列A、标签序列和序列B,所述序列A的核苷酸序列如SEQ ID NO:3所示,所述序列B的核苷酸序列如SEQ ID NO:4所示。
在一个具体示例中,标签序列选自SEQ ID NO:5~SEQ ID NO:100中的一种。
在一个具体示例中,试剂盒包括96种第二接头,其标签序列分别为SEQ ID NO:5~SEQ ID NO:100。
在一个具体示例中,试剂盒还包括Tn5转座酶、DNA聚合酶、脱氧核苷三磷酸、无核酸酶水、酶切缓冲液和DNA纯化磁珠中的一种或多种。
以下为具体实施例。
实施例1
一、Tn5转座酶制备
Tn5转座酶按照Amirali Kia等发表的文献(BMC Biotechnology.2017 17:6)中公开的方法进行制备,其核心实验步骤是克隆含有E54K和L372P突变的Tn5基因的编码序列插入携带Strep标签的表达载体pET11a。将该改造后的质粒转入大肠杆菌培养至OD值为0.5,加入100μM IPTG诱导剂,18℃诱导培养19小时,离心后去除上清液。使用TNE1缓冲液(100mMTris,pH 8.0,1M NaCl,1mM EDTA,1mM DTT)裂解破碎细菌,将细菌裂解后的上清液加载至Strep标签蛋白纯化预装柱(购自GE Healthcare公司),经洗涤后,洗脱回收Tn5转座酶。经统计,1L培养基大约回收5mg Tn5转座酶。
二、DNA样品制备
在猪场用耳缺钳采集猪的耳皮组织,放置于2mL离心管中,用75%酒精浸泡保存,之后运输至实验室,采用常规的动物组织DNA提取方法进行猪耳组织DNA的提取,之后进行琼脂糖电泳检测DNA质量,要求DNA样品的主条带清晰,且长度大于10kb。共提取96个不同个体的DNA样品,使用仪器Qubit测定上述DNA样品的浓度,之后将所有DNA样品的浓度稀释至100ng/μL备用。
三、接头序列合成
合成如下接头序列:
SEQ ID NO:1:
5’PHO-CTGTCTCTTATACACATCT
SEQ ID NO:2:
5’-GAACGACATGGCTACGATCCGACTTTCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3′
SEQ ID NO:3+标签序列+SEQ ID NO:4:
5′-TGTGAGCCAAGGAGTTGTTGTCTTC(NNNNNNNNNN)GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3′
其中NNNNNNNNNN表示测序样品的10bp标签序列,本发明的试剂盒中提供96种标签序列(详见下表),用于高通量测序后拆分不同样品的测序数据。
四、接头退火
用退火缓冲液将上述接头序列分别溶解至50μM。退火缓冲液购自上海碧云天生物技术有限公司(产品编号D0251)。
第一接头和第二接头退火的反应体系如下表所示,置于PCR仪内进行反应,条件为75℃反应15min,60℃反应10min,50℃反应10min,40℃反应10min,25℃反应30min,4℃保存。反应结束后,将96种带不同标签序列(SEQ ID NO:5~SEQ ID NO:100)的第二接头分别与第一接头等体积混合后混匀,分别命名为Adapter1~Adapter96,-20℃保存。
五、接头与Tn5转座酶包埋
在PCR管中依次添加如下表所示各反应组分,使用移液器吹吸混匀,置于室温反应2小时,将反应产物分别命名为Tn5-Adapter1~Tn5-Adapter96(96种不同的转座酶复合体试剂),-20℃保存。
Tn5转座酶 | 60μL×96 |
Adapter1~Adapter96 | 40μL×96 |
总计 | 100μL×96 |
六、DNA片段化及产物混池(DNA样品通量为96)
在室温解冻酶切缓冲液(100mM TAPS,25mM MgCl2,50wt%DMF),在96孔PCR板中,配制反应体系如下表所示,涡旋震荡1min后1000rpm离心1min。将PCR板置于PCR仪中,55℃孵育5min,之后从96孔板的每个孔中吸出10μL混合到一起,吹吸混匀,从中取出50μL至200μL PCR管中。
无核酸酶水 | 6μL |
酶切缓冲液 | 4μL |
Tn5-Adapter1~Tn5-Adapter96 | 5μL |
100ng/μL DNA(96个不同的DNA样品) | 5μL |
七、切口修复反应
在200μL PCR管中依次加入如下表所示各反应组分,用1mL移液器吹打混匀后瞬时离心,置于PCR仪中,72℃孵育3min,-20℃保存。
反应缓冲液(HiFi Fidelity Buffer) | 20μL |
高保真DNA聚合酶(HiFi DNA Polymerase) | 2μL |
脱氧核苷三磷酸 | 2μL |
无核酸酶水 | 26μL |
DNA片段化产物 | 50μL |
总计 | 100μL |
八、对混合DNA文库进行分选纯化
吸取DNA纯化磁珠(Vazyme品牌)60μL体积至100μL切口修复产物中,室温孵育2min后置于磁力架上,使磁珠与液体分离,待溶液澄清后转移上清至新的PCR管中,丢弃磁珠。吸取磁珠15μl体积至上清中,室温孵育2min后置于磁力架上,使磁珠与液体分离,待溶液澄清后移除上清。吸取70%乙醇200μL漂洗磁珠,空气干燥磁珠约5min。将反应管从磁力架上取出,加入20μL灭菌超纯水洗脱。使用移液器吹吸混匀,室温孵育2min后置于磁力架上,待溶液澄清后吸取18μL上清液至新的PCR管中,-20℃保存。
九、文库质量检测及上机测序
使用仪器Qubit检测了DNA文库浓度为10ng/μL。使用仪器Agilent 2100生物分析仪检测长度分布,结果显示所获得的DNA文库总长度分布范围350~1000bp,文库平均总长度约550bp(结果如图1所示)。DNA文库经检测合格后,将上一步骤所获得的文库加载至PE150芯片的1条lane上,使用MGISEQ-2000RS测序平台进行上机测序,测序实验方法按照MGISEQ-2000RS的高通量测序试剂套装使用说明书进行。
十、DNA测序数据统计分析
对测序下机数据进行标签序列拆分后统计分析每个样品的数据量,结果显示96个DNA样品的测序数据量大小在0.72G~2.57G之间(如图2所示),利用fastqc软件对96个DNA样品的测序数据进行质控,结果表明所有样品mapping上猪参考基因组的比率均超过97%、数据的Duplication比例均低于5%,每个文库插入片段的平均长度峰值在300bp~400bp之间。以上结果表明,利用本发明提供的DNA样品混合建库测序方法可方便快捷地得到数据均一度较好和质量较高的测序数据。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110> 温氏食品集团股份有限公司
<120> DNA测序文库的制备方法及试剂盒
<160> 100
<170> SIPOSequenceListing 1.0
<210> 1
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ctgtctctta tacacatct 19
<210> 2
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gaacgacatg gctacgatcc gactttcgtc ggcagcgtca gatgtgtata agagacag 58
<210> 3
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
tgtgagccaa ggagttgttg tcttc 25
<210> 4
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gtctcgtggg ctcggagatg tgtataagag acag 34
<210> 5
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
aagcgacatc 10
<210> 6
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
aaggctgatc 10
<210> 7
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
aatagttcat 10
<210> 8
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
aatctggtac 10
<210> 9
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
accgcgtatc 10
<210> 10
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
acctgcggtt 10
<210> 11
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
actacatgcc 10
<210> 12
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
actgaccgag 10
<210> 13
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
agacgtgtac 10
<210> 14
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
agcaacttac 10
<210> 15
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
aggcacgtac 10
<210> 16
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
aggtgatgcc 10
<210> 17
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
agtcttcact 10
<210> 18
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
agtgattcgc 10
<210> 19
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
agttcctact 10
<210> 20
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
agttgtacta 10
<210> 21
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
ataattgcta 10
<210> 22
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
atacaatccg 10
<210> 23
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
atagaccgtt 10
<210> 24
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
atcaccgtac 10
<210> 25
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
atcgcacact 10
<210> 26
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
atgagttgcc 10
<210> 27
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
attacgcgtt 10
<210> 28
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
attgaagcta 10
<210> 29
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
caatagtcat 10
<210> 30
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
cacgttacta 10
<210> 31
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
cagttgagga 10
<210> 32
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
ccatcaatgt 10
<210> 33
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
ccatcctgtt 10
<210> 34
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
ccatgtatca 10
<210> 35
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
ccgcacgttg 10
<210> 36
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
cctgaccttg 10
<210> 37
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
ccttagtact 10
<210> 38
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
cgagctgtac 10
<210> 39
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
cgatacaatc 10
<210> 40
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
cggtagttgt 10
<210> 41
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
cgtcttccat 10
<210> 42
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
cgtggtcact 10
<210> 43
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
cgttgatcta 10
<210> 44
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
ctactctgcc 10
<210> 45
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
ctattagtgt 10
<210> 46
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
ctattccgtt 10
<210> 47
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
ctccgacgtt 10
<210> 48
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
ctgtcctact 10
<210> 49
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
cttaatcttg 10
<210> 50
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
cttaccgact 10
<210> 51
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
gaacaatatc 10
<210> 52
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
gaacgacgtt 10
<210> 53
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
gaacgtgtgt 10
<210> 54
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
gaagctggtt 10
<210> 55
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
gaatcggcta 10
<210> 56
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
gaatggcatc 10
<210> 57
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
gattcctatc 10
<210> 58
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
gcctacagcc 10
<210> 59
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
gccttgagga 10
<210> 60
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
gcgcaatccg 10
<210> 61
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
gctatacgtt 10
<210> 62
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
gcttgatcgc 10
<210> 63
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
ggcgcaccta 10
<210> 64
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
ggctctcatc 10
<210> 65
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
ggcttccact 10
<210> 66
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
ggtccttatc 10
<210> 67
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
gtaggtcatc 10
<210> 68
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
gtataactca 10
<210> 69
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
gtccgtgact 10
<210> 70
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
gtctgattac 10
<210> 71
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
gtgaccgtca 10
<210> 72
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
gtggttatca 10
<210> 73
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
gttatcatac 10
<210> 74
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
gttggtcgag 10
<210> 75
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
tagtgcggtt 10
<210> 76
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
tcaccagcgc 10
<210> 77
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
tcaccttgcc 10
<210> 78
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
tcaggctcat 10
<210> 79
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
tcagttagga 10
<210> 80
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
tccattgatc 10
<210> 81
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
tcctgatgtt 10
<210> 82
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
tcgccagcat 10
<210> 83
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
tcggcactca 10
<210> 84
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
tcgtcctatc 10
<210> 85
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
tctattgact 10
<210> 86
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
tcttcctgga 10
<210> 87
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
tcttggcatc 10
<210> 88
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
tgaaccgtgt 10
<210> 89
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
tgataactac 10
<210> 90
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
tgcagagcat 10
<210> 91
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
tgcggctatc 10
<210> 92
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
tggagccgag 10
<210> 93
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
tgtgtgcgga 10
<210> 94
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
ttacataccg 10
<210> 95
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
ttaccgacat 10
<210> 96
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
ttagcaccta 10
<210> 97
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 97
ttgaaggact 10
<210> 98
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 98
ttgaggagcc 10
<210> 99
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 99
ttgccagtac 10
<210> 100
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 100
ttgtcggcat 10
Claims (10)
1.一种DNA测序文库的制备方法,其特征在于,包括以下步骤:
提供Tn5转座酶、第一接头和至少两种第二接头;所述第一接头的两条单链DNA的核苷酸序列分别如SEQ ID NO:1和SEQ ID NO:2所示,所述第二接头的一条单链DNA的核苷酸序列如SEQ ID NO:1所示,所述第二接头的另一条单链DNA包括从5’端至3’端依次连接的序列A、标签序列和序列B,所述序列A的核苷酸序列如SEQ ID NO:3所示,所述序列B的核苷酸序列如SEQ ID NO:4所示;
将各所述第二接头分别与所述第一接头混合得到至少两种接头试剂,然后将各所述接头试剂分别与所述Tn5转座酶进行包埋,得到至少两种转座酶复合体试剂;
将各所述转座酶复合体试剂分别与不同DNA样品混合进行片段化反应,然后将不同DNA样品的片段化反应产物混合,并进行切口修复,得到所述DNA测序文库。
2.根据权利要求1所述的制备方法,其特征在于,所述片段化反应包括以下步骤:将DNA样品、所述转座酶复合体试剂和酶切缓冲液混合,于50℃~60℃孵育1~10min。
3.根据权利要求2所述的制备方法,其特征在于,所述酶切缓冲液包括80mM~120mM三羟甲基甲胺基丙磺酸、20mM~50mM氯化镁和50wt%N,N-二甲基甲酰胺。
4.根据权利要求1所述的制备方法,其特征在于,所述切口修复包括以下步骤:将所述片段化反应产物、DNA聚合酶和脱氧核苷三磷酸混合,于70℃~75℃孵育1~10min。
5.根据权利要求1所述的制备方法,其特征在于,在所述切口修复的步骤之后,还包括以下步骤:采用DNA纯化磁珠对所述切口修复的产物进行分选纯化。
6.根据权利要求5所述的制备方法,其特征在于,所述分选纯化包括以下步骤:将所述切口修复的产物与DNA纯化磁珠混合并孵育,然后弃去磁珠收集上清液,再加入磁珠孵育,然后弃去上清液收集磁珠,使用乙醇漂洗磁珠并干燥5~10min,然后加水孵育1~5min,收集上清液。
7.根据权利要求1所述的制备方法,其特征在于,所述包埋包括以下步骤:将所述接头试剂与所述Tn5转座酶混合,于室温反应0.5~3小时。
8.一种用于制备DNA测序文库的试剂盒,其特征在于,包括第一接头和至少两种第二接头,所述第一接头的两条单链DNA的核苷酸序列分别如SEQ ID NO:1和SEQ ID NO:2所示,所述第二接头的一条单链DNA的核苷酸序列如SEQ ID NO:1所示,所述第二接头的另一条单链DNA包括从5’端至3’端依次连接的序列A、标签序列和序列B,所述序列A的核苷酸序列如SEQID NO:3所示,所述序列B的核苷酸序列如SEQ ID NO:4所示。
9.根据权利要求8所述的试剂盒,其特征在于,每种第二接头的所述标签序列独立地选自SEQ ID NO:5~SEQ ID NO:100中的一种。
10.根据权利要求8所述的试剂盒,其特征在于,还包括Tn5转座酶、DNA聚合酶、脱氧核苷三磷酸、无核酸酶水、酶切缓冲液和DNA纯化磁珠中的一种或多种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110510000.6A CN113462748A (zh) | 2021-05-11 | 2021-05-11 | Dna测序文库的制备方法及试剂盒 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110510000.6A CN113462748A (zh) | 2021-05-11 | 2021-05-11 | Dna测序文库的制备方法及试剂盒 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113462748A true CN113462748A (zh) | 2021-10-01 |
Family
ID=77870660
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110510000.6A Pending CN113462748A (zh) | 2021-05-11 | 2021-05-11 | Dna测序文库的制备方法及试剂盒 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113462748A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114836415A (zh) * | 2022-05-06 | 2022-08-02 | 南京诺唯赞生物科技股份有限公司 | 一种mgi平台转座酶双端标签文库的制备 |
CN116904445A (zh) * | 2023-09-12 | 2023-10-20 | 南京诺唯赞生物科技股份有限公司 | 一种mRNA富集方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019024341A1 (zh) * | 2017-11-27 | 2019-02-07 | 深圳华大生命科学研究院 | 一种体液游离dna的文库构建方法及其应用 |
US20190338279A1 (en) * | 2016-12-07 | 2019-11-07 | Mgi Tech Co., Ltd. | Method for constructing single cell sequencing library and use thereof |
CN111378718A (zh) * | 2018-12-28 | 2020-07-07 | 江苏金斯瑞生物科技有限公司 | 一种基因测序文库的构建方法 |
-
2021
- 2021-05-11 CN CN202110510000.6A patent/CN113462748A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190338279A1 (en) * | 2016-12-07 | 2019-11-07 | Mgi Tech Co., Ltd. | Method for constructing single cell sequencing library and use thereof |
WO2019024341A1 (zh) * | 2017-11-27 | 2019-02-07 | 深圳华大生命科学研究院 | 一种体液游离dna的文库构建方法及其应用 |
CN111386362A (zh) * | 2017-11-27 | 2020-07-07 | 深圳华大生命科学研究院 | 一种体液游离dna的文库构建方法及其应用 |
CN111378718A (zh) * | 2018-12-28 | 2020-07-07 | 江苏金斯瑞生物科技有限公司 | 一种基因测序文库的构建方法 |
Non-Patent Citations (1)
Title |
---|
ANDREW ADEY 等: "Rapid, low-input, low-bias construction of shotgun fragment libraries by high-density in vitro transposition", GENOME BIOLOGY, vol. 11, pages 119 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114836415A (zh) * | 2022-05-06 | 2022-08-02 | 南京诺唯赞生物科技股份有限公司 | 一种mgi平台转座酶双端标签文库的制备 |
CN116904445A (zh) * | 2023-09-12 | 2023-10-20 | 南京诺唯赞生物科技股份有限公司 | 一种mRNA富集方法 |
CN116904445B (zh) * | 2023-09-12 | 2023-12-29 | 南京诺唯赞生物科技股份有限公司 | 一种mRNA富集方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113166797B (zh) | 基于核酸酶的rna耗尽 | |
Dale et al. | From genes to genomes: concepts and applications of DNA technology | |
US20230056763A1 (en) | Methods of targeted sequencing | |
WO2018024082A1 (zh) | 一种串联rad标签测序文库的构建方法 | |
JP2022036975A (ja) | ナノポア技術を用いた短いdna断片の迅速な配列決定 | |
CN109593757B (zh) | 一种探针及其适用于高通量测序的对目标区域进行富集的方法 | |
CN110886021B (zh) | 一种单细胞dna文库的构建方法 | |
US9145580B2 (en) | Methods and compositions for enriching either target polynucleotides or non-target polynucleotides from a mixture of target and non-target polynucleotides | |
CN113088562A (zh) | 一种新型的低起始量dna甲基化建库方法 | |
CN109825552B (zh) | 一种用于对目标区域进行富集的引物及方法 | |
CN113462748A (zh) | Dna测序文库的制备方法及试剂盒 | |
WO2016164313A1 (en) | Methods and compositions for long-range haplotype phasing | |
CN112410331A (zh) | 带分子标签和样本标签的接头及其单链建库方法 | |
US20200255823A1 (en) | Guide strand library construction and methods of use thereof | |
CN115210370A (zh) | 使用重编程tracrRNA的RNA检测和转录依赖性编辑 | |
EP3927717A1 (en) | Guide strand library construction and methods of use thereof | |
CN116043337A (zh) | Dna甲基化标志物筛查试剂盒及方法 | |
Gelsinger et al. | Bacterial genome engineering using CRISPR-associated transposases | |
CN112941147A (zh) | 一种高保真靶标基因建库方法及其试剂盒 | |
CN116287124A (zh) | 单链接头预连接方法、高通量测序文库的建库方法及试剂盒 | |
CN113166809A (zh) | 一种dna甲基化检测的方法、试剂盒、装置和应用 | |
CN114507903A (zh) | 质粒测序方法 | |
CN113817723A (zh) | 一种多核苷酸及其标准品、试剂盒与用途 | |
CN111424069A (zh) | 适用于三代测序技术检测人长链非编码rna的样品处理方法 | |
CN112824534A (zh) | 对核酸的目标区域进行扩增的方法、建库和测序方法及试剂盒 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |