CN102864498B - 一种长片段末端文库的构建方法 - Google Patents

一种长片段末端文库的构建方法 Download PDF

Info

Publication number
CN102864498B
CN102864498B CN201210357019.2A CN201210357019A CN102864498B CN 102864498 B CN102864498 B CN 102864498B CN 201210357019 A CN201210357019 A CN 201210357019A CN 102864498 B CN102864498 B CN 102864498B
Authority
CN
China
Prior art keywords
lmp
library
fragment
adaptor
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210357019.2A
Other languages
English (en)
Other versions
CN102864498A (zh
Inventor
陈祖耕
姜楠
王萍
暴云娟
刘桂友
陈晓云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Institute of Industrial Biotechnology of CAS
Original Assignee
Tianjin Institute of Industrial Biotechnology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Institute of Industrial Biotechnology of CAS filed Critical Tianjin Institute of Industrial Biotechnology of CAS
Priority to CN201210357019.2A priority Critical patent/CN102864498B/zh
Publication of CN102864498A publication Critical patent/CN102864498A/zh
Application granted granted Critical
Publication of CN102864498B publication Critical patent/CN102864498B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种长片段末端文库的构建方法,包括:1)DNA随机打断、末端缺口补齐修复;2)制成A-Fragment步骤;3)将A-Fragment与LMP Adaptor进行粘性末端的连接;4)将LMP-Adaptor-Fragment用不少于两种的识别四个碱基的限制性内切酶消化;5)将获得的酶消化文库中的片段再次进行环化;6)将纯化后的环状分子用LMP Adaptor的引物进行扩增,扩增产物回收后完成LMP文库的构建。本发明的建库方法,只需要合成两条63 bp的寡核苷酸序列,进行简单的分子生物学连接、扩增等实验,获得的LMP文库两端带有测序引物序列,能够直接应用于二代测序。此外,由于二次环化后的片段中存在已知的限制性内切酶位点,能够快速分拣待测片段两端的序列,对测序数据进行有效筛选,去除嵌和序列。

Description

一种长片段末端文库的构建方法
技术领域
本发明属于分子生物学测序技术领域,具体涉及一种长片段末端文库(Long Mate Pair,LMP)的构建方法,以及该方法在基因组序列拼接,特别是 de novo 测序与组装中的有效应用。
背景技术
目前,二代测序方法已广泛的应用于基因组de novo拼接中,由于测序数据巨大且测序长度短,影响拼接质量的关键因素是基因组的重复序列(如微卫星序列,核糖体RNA序列,转座子序列等),重复单元的长度在几bp到几kb不等。构建多种不同长度插入片段的文库进行测序,可以跨越不同长度的重复序列,有效地改善基因组的拼接完整性和准确性。LMP基于基因组中较大跨度(2~10kb)片段两端序列的测序,解决大基因组和复杂基因组的组装问题,纠正重复序列造成的拼接错误,并能够发现基因组的结构变异,特别适用于新基因组测序(Denovo sequencing)。目前,几种(long mate pair文库构建的方法存在效率较低,实验过程复杂,不易控制,错误率较高,嵌合分子以及低文库复杂性等缺点。因此,简单有效的LMP方法对于新一代测序技术的发展与应用具有重要作用,但是目前仍然处于改善与探索的过程中。
发明内容
本发明的目的是提供一种长片段末端文库构建的方法,可以有效的减少文库构建的步骤,缩短文库构建的时间,提高文库构建的效率,从而弥补现有技术的不足。
本发明的方法,其步骤如下:
1)首先将基因组DNA随机打断,并将打断的DNA进行末端缺口补齐修复;
2)将修复的DNA片段的3′端加上脱氧腺苷酸A,制成A-Fragment;
3)将制成A-Fragment与3′端带有突出的脱氧胸甘酸T的 LMP Adaptor进行粘性末端的连接,获得环状的LMP-Adaptor-Fragment;
4)将去除了未环化的线性分子的LMP-Adaptor-Fragment用不少于两种的识别四个碱基的限制性内切酶消化adaptor以外的区域,获得相应的酶消化文库;
5)将步骤4)获得的酶消化文库中的片段进行末端缺口补齐修复后,按照步骤3)再次进行环化;
6)将步骤5)获得的环化产物用核酸外切酶消化去除未环化的线性分子;用纯化后的环状分子作为模版,LMP Adaptor的引物进行扩增,扩增产物回收后完成LMP文库的构建。
上述步骤1)将打断的DNA进行末端缺口补齐修复是用T4 DNA polymerase来进行的;
步骤4)中所述的识别四个碱基的限制性内切酶为Hha I、Nla III、Hpa II、Mse I或MluC I。
步骤6)中所述的LMP Adaptor的引物的序列为SEQ ID NO:1和2。
本发明的建库方法,只需要合成两条63 bp的寡核苷酸序列,进行简单的分子生物学连接、扩增等实验,获得的LMP文库两端带有测序引物序列,能够直接应用于二代测序。此外,由于二次环化后的片段中存在已知的限制性内切酶位点,能够快速分拣待测片段两端的序列,对测序数据进行有效筛选,去除嵌和序列。整个过程成本低,步骤简单,易于操作,重现性好。
具体实施方式
现结合实施例对本发明做进一步详细说明,实施例仅限于说明本发明,而非对本发明的限定。
实施例1   LMP文库的构建
1)首先将基因组DNA随机打断,并将打断的DNA进行末端缺口补齐修复;
首先将提取的基因组DNA用1.2%琼脂糖凝胶电泳检测DNA的完整性,Qubit(Invitrogen)进行定量定性分析,保证DNA的高质量,包括完整性和纯度。然后,取120 μl基因组DNA(20-35 ng/μl),用CovarisS220进行片段打碎,具体条件如下:7℃,mini blue tube,Duty Factor 20%,Peak Incident Power 3W,cycles per Burst 1000,900秒。超声打碎完成后,用1.2%琼脂糖凝胶电泳对2 Kb目的区域进行回收,对回收片段用T4 DNA polymerase进行末端修复, 200 μl体系包含如下的组分:100 μl 回收的2 Kb DNA片段,10 mM dNTP 8 μl, T4 DNA polymerase (3 U/μl)5 μl, PNK (poly nucleotide kinase) (10 U/μl) 1.5 μl; Klenow 片段(5 U/μl)3 μl,10 mM ATP 20μl,1×PNK缓冲液,20℃,反应30分钟,修复完成后的产物用Qiagen PCR cleanup kit进行纯化;
2)将修复的DNA片段的3′端加上脱氧腺苷酸A,制成A-Fragment;
将纯化后的修复片段的′端加单个“A”碱基,100 μl体系:10 mM dATP 1.5 μl , Klenow polymerase (exo-)(5 U/μl)2 μl,1×NEB Buffer 2,37℃温育30 min,随后用Qiagen PCR cleanup kit进行纯化,获得2kb Fragment-A基因文库;
3)将制成A-Fragment与3′端带有突出的脱氧胸甘酸T的 LMP Adaptor进行粘性末端的连接,获得环状的LMP-Adaptor-Fragment;
将Fragment-A基因组文库与带有3′端T突出的LMP Adaptor用T4 DNA连接酶于12℃孵育过夜,再用Qiagen PCR cleanup kit进行片段纯化,获得环状的LMP-Adaptor-Fragment文库,其中LMP Adaptor的正反序列如下:
5′pGATCGGAAGAGCACACGTCTGAACTCCAGTCACACACTCTTTCCCTACACGACGCTCTTCCGATCT
3′TCTAGCCTTCTCGTGTGCAGACTTGAGGTCAGTGTGTGAGAAAGGGATGTGCTGCGAGAAGGCTAG-p-5’
4)将去除了未环化的线性分子的LMP-Adaptor-Fragment用不少于两种的识别四个碱基的限制性内切酶消化adaptor以外的区域,获得相应的酶消化文库:
将获得的环状LMP-Adaptor-Fragment文库先后用T7核酸外切酶(T7exonuclease)和S1核酸酶(S1 nuclease)进行消化,除去未环化的线性分子,具体步骤如下:环状的LMP-Adaptor-Fragment文库100 μl(~500 ng),T7 exonuclease(10 U/μl)6 μl,1×反应缓冲液25 μl,总体积250 μl,37℃消化30分钟,70℃热激20分钟使酶失活,立刻冰浴;接着,T7 exonuclease消化后的DNA片段250 μl,3M NaCl 8.25 μl,S1 nuclease(25 U/μl)10 μl,37℃消化30分钟,Qiagen PCR cleanup kit进行片段纯化;
将纯化后的环状分子均分为两份,分别用Hpa II和Mse I两种限制性内切酶37℃消化2小时,1.2%琼脂糖凝胶电泳检测,获得片段主要集中1kb以下,Caliper LabChip XT DNA750 Kit进行300~500bp区域回收;
5)将步骤4)获得的酶消化文库中的片段进行末端缺口补齐修复后,按照步骤3)进行环化;
将步骤4)回收的纯化片段分别用T4 DNA快速连接酶室温(25℃)作用5分钟,进行DNA粘性末端环化,并除去未环化的线性分子,去除未环化的线性分子的方法参照步骤4)进行。
6)将步骤5)获得的环化产物用核酸外切酶消化去除未环化的线性分子;用纯化后的环状分子作为模版,LMP Adaptor的引物进行扩增,扩增产物回收后完成LMP文库的构建。
最后,将两份纯化好的环状分子混合作为模板,MP PCR1.0(核苷酸序列为SEQ ID No:1)和MP Index 1(核苷酸序列为SEQ ID No:2)为引物,高保真DNA聚合酶(Thermo Scientific PhusionHotStart II High-Fidelity DNA polymerase)进行PCR扩增:预变性98℃ 30s;98℃ 10s, 65℃ 10s,72℃ 30s,16个循环;后延伸72℃ 5min。PCR产物用Caliper LabChip XT DNA750 Kit进行400~600bp区域回收,最终获得LMP文库。 .
本发明方法构建的LMP文库的测序及其数据分析:
将上述LMP文库进行2x150bp的pair-end二代测序,利用cutadapt软件(http://code.google.com/p/cutadapt/)在测序read中寻找(2)中使用的限制性酶切位点,去掉该位点碱基,并筛除数据中长度较短(如<30 bp)的read对。结合其他插入片段较短(~200-600bp)文库二代测序的数据,利用velvet软件进行de novo基因组拼接。使用本发明的方法对嗜盐菌(Bacillus agargdhaerens)的基因组进行了长片段末端文库的构建,结果显示,本发明方法构建的LMP文库的加入可以有效地解决重复序列引起的拼接困难,纠正重复序列造成的拼接错误,构建更大的scaffold,将大基因组或复杂基因组组装的更为完整。基因组大小约为4M的菌株,仅用paired-end文库测序数据进行拼接得到136个contigs,加入LMP文库测序数据后,contigs减少到32个,完整性大大提高。

Claims (2)

1.一种长片段末端文库的构建方法,其特征在于,所述的方法的步骤如下:
1)首先将基因组DNA随机打断,并将打断的DNA进行末端缺口补齐修复;
2)将修复的DNA片段的3′端加上脱氧腺苷酸A,制成A-Fragment;
3)将制成的A-Fragment与3′端带有突出的脱氧胸苷酸T的LMPAdaptor进行粘性末端的连接,获得环状的LMP-Adaptor-Fragment;
所述的LMP Adaptor的正反序列如下:
5′-pGATCGGAAGAGCACACGTCTGAACTCCAGTCACACACTCTTTCCCTACACGACGCTCTTCCGATCT-3′
3′-TCTAGCCTTCTCGTGTGCAGACTTGAGGTCAGTGTGTGAGAAAGGGATGTGCTGCGAGAAGGCTAG-p-5′;
4)将去除了未环化的线性分子的LMP-Adaptor-Fragment用不少于两种的识别四个碱基的限制性内切酶消化adaptor以外的区域,获得相应的酶消化文库;
5)将步骤4)获得的酶消化文库中的片段进行末端缺口补齐修复后,按照步骤3)再次进行环化;
6)将步骤5)获得的环化产物用核酸外切酶消化去除未环化的线性分子;用纯化后的环状分子作为模版,LMP Adaptor的引物进行扩增,扩增产物回收后完成长片段末端文库的构建;
所述的步骤1)将打断的DNA进行末端缺口补齐修复是用T4DNApolymerase来进行的;
所述的步骤4)中所述的识别四个碱基的限制性内切酶为Hha I、Nla III、Hpa II、Mse I或MluC I。
2.如权利要求1所述的构建方法,其特征在于所述的步骤6)中的LMPAdaptor的引物的序列为SEQ ID NO:1和2。
CN201210357019.2A 2012-09-24 2012-09-24 一种长片段末端文库的构建方法 Expired - Fee Related CN102864498B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210357019.2A CN102864498B (zh) 2012-09-24 2012-09-24 一种长片段末端文库的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210357019.2A CN102864498B (zh) 2012-09-24 2012-09-24 一种长片段末端文库的构建方法

Publications (2)

Publication Number Publication Date
CN102864498A CN102864498A (zh) 2013-01-09
CN102864498B true CN102864498B (zh) 2014-07-16

Family

ID=47443619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210357019.2A Expired - Fee Related CN102864498B (zh) 2012-09-24 2012-09-24 一种长片段末端文库的构建方法

Country Status (1)

Country Link
CN (1) CN102864498B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103849617A (zh) * 2013-12-16 2014-06-11 复旦大学 用于基因组dna永久保存的接头及方法
CN106795650B (zh) * 2014-09-26 2021-03-09 深圳华大基因股份有限公司 Pf快速建库方法及其应用
CN107208314B (zh) * 2015-01-06 2020-06-16 深圳华大智造科技有限公司 一种单体型分型测序文库的构建方法、分型方法和试剂
WO2016124069A1 (zh) * 2015-02-04 2016-08-11 深圳华大基因研究院 一种构建长片段测序文库的方法
CN105002570B (zh) * 2015-07-21 2017-09-05 中国农业科学院深圳农业基因组研究所 一种一次制备多个dna大片段插入双末端测序文库的方法
CN107641838A (zh) * 2016-07-22 2018-01-30 深圳华大基因股份有限公司 用于第三代单分子测序的pcr产物测序文库构建方法
CN107794574B (zh) * 2016-08-31 2022-10-25 浙江安诺优达生物科技有限公司 一种构建dna大片段文库的方法及其应用
CN107273716B (zh) * 2017-05-03 2020-04-28 武汉菲沙基因信息有限公司 一种基于长片段进行骨架组装的方法
CN107475394B (zh) * 2017-08-31 2021-06-15 中国农业科学院农业基因组研究所 一种基于少量细胞全基因组染色质高分辨率构象技术eHi-C 2.0
EP3682025A1 (en) * 2017-09-14 2020-07-22 H. Hoffnabb-La Roche Ag Novel method for generating circular single-stranded dna libraries
EP4273307A1 (en) * 2020-12-29 2023-11-08 MGI Tech Co., Ltd. Method for rapidly constructing cyclized library and ring-forming linker
CN113088567B (zh) * 2021-03-29 2023-06-13 中国农业科学院农业基因组研究所 一种长片段dna分子结构柔性的表征方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070141594A1 (en) * 2005-10-11 2007-06-21 Biao Luo Method of producing short hairpin library
WO2007073165A1 (en) * 2005-12-22 2007-06-28 Keygene N.V. Method for high-throughput aflp-based polymorphism detection
CN101967684A (zh) * 2010-09-01 2011-02-09 深圳华大基因科技有限公司 一种测序文库及其制备方法、一种末端测序方法和装置
CN102212612A (zh) * 2011-03-23 2011-10-12 上海美吉生物医药科技有限公司 一种用于高通量454测序的双末端文库的构建方法
CN102628079A (zh) * 2012-03-31 2012-08-08 盛司潼 一种通过环化方式构建测序文库的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070141594A1 (en) * 2005-10-11 2007-06-21 Biao Luo Method of producing short hairpin library
WO2007073165A1 (en) * 2005-12-22 2007-06-28 Keygene N.V. Method for high-throughput aflp-based polymorphism detection
CN101967684A (zh) * 2010-09-01 2011-02-09 深圳华大基因科技有限公司 一种测序文库及其制备方法、一种末端测序方法和装置
CN102212612A (zh) * 2011-03-23 2011-10-12 上海美吉生物医药科技有限公司 一种用于高通量454测序的双末端文库的构建方法
CN102628079A (zh) * 2012-03-31 2012-08-08 盛司潼 一种通过环化方式构建测序文库的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A decade’s perspective on DNA sequencing technology;Elaine R. Mardis;《NATURE》;20110210;第470卷;198-203 *
DNA测序技术的发展历史与最新进展;解增言等;《生物技术通报》;20100831(第8期);64-70 *
Elaine R. Mardis.A decade’s perspective on DNA sequencing technology.《NATURE》.2011,第470卷198-203.
解增言等.DNA测序技术的发展历史与最新进展.《生物技术通报》.2010,(第8期),64-70.

Also Published As

Publication number Publication date
CN102864498A (zh) 2013-01-09

Similar Documents

Publication Publication Date Title
CN102864498B (zh) 一种长片段末端文库的构建方法
CN108138176B (zh) 使用基于核酸引导的核酸酶的系统捕获核酸
US11692213B2 (en) Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using CRISPR/Cas system proteins
US11999949B2 (en) Methods for targeted genomic analysis
CN109310784B (zh) 用于制备和使用指导核酸的方法和组合物
CN105463585B (zh) 基于单链dna分子构建测序文库的方法及其应用
CN105121655B (zh) 新型连接酶活性
US8728733B1 (en) Methyl-CpG island-associated genome signature tags
CN105986015B (zh) 一种基于高通量测序的多样本的一个或多个靶序列的检测方法和试剂盒
CN104153003A (zh) 一种基于illumina测序平台的大片段DNA文库的构建方法
CN102559918B (zh) 一种利用酶切延伸增加读长的测序方法
EP3325621B1 (en) Cloning of single-stranded nucleic acid
WO2012004203A1 (en) Method for nucleic acid sequencing
KR20210110790A (ko) 외가닥 dna의 합성방법
EP1616008B1 (en) Ligation-based synthesis of oligonucleotides with block structure
CN113136416B (zh) 一种用于PacBio测序的文库构建方法
CN113025689A (zh) 一种携带修饰的小rna的建库方法及其应用
WO2016058173A1 (zh) 一种用于核酸随机片段化的引物及核酸随机片段化方法
CN109868270B (zh) 低起始量的dna文库构建方法
Chutia et al. Recent developments in RACE-PCR for the full-length cDNA identification
CN116411049A (zh) 用于核酸恒温扩增反应的酶组合产品及其应用
CN101311275A (zh) 一种检测转基因品系特异性时品系特异性序列的扩增方法
CN105821067A (zh) 一种dna分子克隆方法
Derevianko et al. Identification of ancient remains through genomic sequencing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: TIANJIN INSTITUTE OF INDUSTRIAL BIOTECHNOLOGY, CHI

Free format text: FORMER OWNER: TIANJIN INSTITUTE OF INDUSTRIAL BIOTECHNOLOGY

Effective date: 20140410

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20140410

Address after: 300308, No. 32, seven West Road, Tianjin Airport Economic Zone, Dongli, Tianjin

Applicant after: Tianjin Institute of Industrial Biotechnology, Chinese Academy of Sciences

Address before: 300308 Tianjin District of Dongli City Airport Economic Zone West seven road No. 32

Applicant before: Tianjin Institute of Industrial Biotechnology

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140716

Termination date: 20140924

EXPY Termination of patent right or utility model