CN105579592B - 用于制备dna文库的dna接头分子以及生产它们的方法和用途 - Google Patents

用于制备dna文库的dna接头分子以及生产它们的方法和用途 Download PDF

Info

Publication number
CN105579592B
CN105579592B CN201480053727.4A CN201480053727A CN105579592B CN 105579592 B CN105579592 B CN 105579592B CN 201480053727 A CN201480053727 A CN 201480053727A CN 105579592 B CN105579592 B CN 105579592B
Authority
CN
China
Prior art keywords
dna
strand
modified
linker molecule
molecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201480053727.4A
Other languages
English (en)
Other versions
CN105579592A (zh
Inventor
彼得·黑恩
亚历山大·阿扎维
彼得·格吕内费尔德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kaijie Co ltd
Original Assignee
Kaijie Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kaijie Co ltd filed Critical Kaijie Co ltd
Publication of CN105579592A publication Critical patent/CN105579592A/zh
Application granted granted Critical
Publication of CN105579592B publication Critical patent/CN105579592B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及用于制备DNA文库的DNA接头分子以及生产它们的方法和它们的用途。本发明可用于分子生物学中的应用,特别是用于下一代测序(Next Generation Sequencing)和/或文库复用(Library Multiplexing)。本发明公开了包含双链多核苷酸分子的DNA接头分子,其中第一链的5’末端被修饰成使得没有用于激酶的结合位点,所述第一链的3’末端被修饰成不能发生连接,反向链的5’末端被修饰成使得没有用于激酶的结合位点,并且所述反向链的3’末端以游离羟基为特点(在最后一个核苷酸的3’位置处)。

Description

用于制备DNA文库的DNA接头分子以及生产它们的方法和用途
技术领域
本发明涉及用于制备DNA文库的DNA接头分子以及生产它们的方法和它们的用途。本发明可用于分子生物学中的应用,特别是用于下一代测序(Next GenerationSequencing)和/或文库复用(Library Multiplexing)。
背景技术
下一代测序(NGS)是用于确定DNA或RNA序列的核碱基序列的现代技术。NGS的优点(速度、经济效益、准确性)导致它在应对遗传信息的分析及其执行的所有学术机构中的占有率不断增长。几个全球性公司提供NGS解决方案,包括Roche、Life Technologies和Illumina。
为了在一次运行中对大量样品进行测序,可以将已知序列的条形码添加到确定样品并用于在测序后将序列指派到样品。
用于多路测序(同时对大量不同样品进行测序)的方法、组合物和试剂盒公开在WO2011156529 A2中。在一个反应室中对来自于两个或更多不同样品的多个靶多核苷酸进行测序并且通过条形码鉴定每个被测序的靶多核苷酸所源自的样品。
另一份公开了具有提高的样品通量的测序方法的文献是WO 2008061193 A2。其中将接头序列(被称为标签序列)连接到样品,随后将样品混合并测序。
WO 2013033721 A1公开了为多路DNA测序优化条形码设计的方法。
US 2013059762 A1提供了可用于样品中存在的一种或多种核酸的多路PCR的方法、组合物、试剂盒、系统和装置。具体来说,提供了各种不同的靶特异性引物,其允许选择性扩增一个或多个靶序列。因此,在平末端连接反应中将接头连接到靶序列。
在用于下一代测序(NGS)的DNA文库的制备期间,在大多数情况下通过物理或化学方法将高分子dsDNA片段化,并将特异性针对测序平台的接头序列连接到产生的DNA分子。一般来说,接头序列含有用于引物的结合位点,并可能含有条形码序列,其允许在混合物中测序多个带条形码的DNA文库(多路)并随后将关于相应条形码的测序信息指派到原始样品。
在可以进行这种接头序列与片段的连接之前,必须修复在片段化期间随机且不可预见地形成的DNA末端。通过聚合酶将突出的3’末端切除并将突出的5’末端填补成双链。随后,通过激酶将片段的5’末端磷酸化。随后,将在一侧是平末端以允许在那里连接并且在另一侧具有3’突出端以避免在那里连接的未磷酸化的DNA接头,在连接酶帮助下连接到产生的DNA分子。由于未磷酸化的接头序列的连接不在接头的5’末端处导致磷酸二酯键的形成,因此在连接后在DNA双链中留下缺口,失去的磷酸二酯键随后需要用能够进行缺口平移的酶封闭。
常用的接头序列不能被添加到末端修复混合物,这是因为末端修复混合物中的酶将修饰它们,使得连接的方向性丢失,并且将形成接头二聚体和寡聚体。
发明目的
本发明的目的是改良接头序列以使它们可以在文库制备开始时已被添加到片段化的DNA。本发明的另一个目的是避免接头二聚体和寡聚体的形成。
发明内容
本发明公开了DNA接头分子,其包含双链多核苷酸分子,其中
a.所述第一链的5’末端被修饰成使得第一核苷酸不含游离羟基并且在5’位置处没有游离磷酸基团,使得没有用于激酶的结合位点可用,
b.所述第一链的3’末端被修饰成使得最后一个核苷酸在3’位置处不含游离羟基,使得不能发生连接,
c.所述反向链的5’末端被修饰成使得第一核苷酸不含游离羟基并且在5’位置处没有游离磷酸基团,使得没有用于激酶的结合位点可用,并且
d.所述反向链的3’末端以游离羟基(在最后一个核苷酸的3’位置处)为特点。
第一链和反向链通过互补碱基配对彼此退火,没有任何突出端(平末端)。优选地,所述双链内的核苷酸,除了上面提到的3’和5’末端处的末端核苷酸之外,未被修饰。然而,不排除所述双链含有具有对抗核酸酶的提高的稳定性的核苷酸,特别是具有修饰的骨架例如硫代磷酸基团的核苷酸。优选地,两条链具有完全相同的长度(具有相同的核苷酸数目),其中反向链的核苷酸序列是第一链的核苷酸序列的反向互补体。
有利情况下,可以在DNA文库制备期间将符合本发明的DNA接头分子直接添加到片段化的DNA。与现有技术相反,在这里,在添加符合本发明的DNA接头分子之前和添加连接酶之前,不必失活末端修复酶。由于符合本发明的接头分子是平末端的,因此它们不是具有5’→3’聚合酶活性和3’→5’核酸外切酶活性的聚合酶例如T4 DNA聚合酶、T7 DNA聚合酶或Pfu聚合酶的底物。
此外,有利情况下,符合本发明的DNA接头分子被设计成使得酶连接只能在一个方向上发生(在反向链的3’末端的游离羟基处)。
当在本文中使用时,术语“游离羟基”是指-OH或去质子化的–O-。术语“游离磷酸基团”在本文中用于描述去质子化的磷酸酯(-OPO3 2-)、磷酸一氢酯或磷酸二氢酯。
当在本文中使用时,术语“聚合酶”是指DNA依赖性DNA聚合酶,优选为具有5’→3’聚合酶活性和3’→5’核酸外切酶活性并优选地没有5’→3’核酸外切酶活性的聚合酶。优选的聚合酶是能够产生平末端的酶,例如T4聚合酶、T7 DNA聚合酶或Pfu聚合酶。
当在本文中使用时,术语“激酶”是指多核苷酸5’-羟基激酶,其催化向多核苷酸分子的游离5’-羟基末端添加磷酸基团。优选的激酶是T4激酶或T7激酶。
当在本文中使用时,“多核苷酸分子”是由共价连接成链的13个或更多核苷酸单体构成的生物聚合物。
符合本发明的DNA接头分子优选地另外含有用于扩增和测序引物以及优选地条形码序列的结合位点。
条形码序列优选地具有3至20、更优选地4至8个碱基对的长度。优选地,条形码序列位于第一链的5’末端附近。
DNA接头分子优选地具有20至90、更优选地30至70、最优选地40至60个碱基对的长度。
第一和/或最后一个核苷酸不含游离羟基这一表述,意味着符合本发明的DNA接头分子被修饰成使得在两条链的5’末端处正常存在的羟基或磷酸基团以及在反向链的3’末端处正常存在的羟基被在这里称为“末端基团”的其它基团代替,这产生不是上述相应酶的底物的修饰的核苷酸。优选地,这些末端基团独立地选自氢、被取代或未取代的烷基、烷氧基氨基和其它已知的链终止物。不排除这些末端基团可以自身含有游离羟基或甚至游离磷酸基团,因为这些基团不是所述酶的底物。
符合本发明的DNA接头分子优选地被修饰成使得两条链的5’末端和第一链的3’末端含有链终止物。
用于3’末端以及5’末端的链终止物对于本领域技术人员来说是公知的。在反向链的5’末端和第一链的3’末端处,可以选择任何可能的链终止物来分别阻断游离的3’-OH或5’-OH。
用于第一链的3’末端的链终止物的优选实例是2’3’-双脱氧核苷酸(式1)或优选地如式2中所示的3’-修饰的脱氧核苷酸:
Figure BDA0000952733370000051
其中B=核碱基,优选地选自腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T),并且M选自NH2-L,其中L优选地选自直链或支链的C1至C6烷基,优选为C3或C4烷基,
其中
Figure BDA0000952733370000052
是连接到DNA接头分子的第一链的以3’→5’方向前进的核苷酸序列的共价键。
用于5’末端的链终止物的优选实例是醚化的脱氧核苷酸(式3)、4’-氨基-脱氧核苷酸(式4)和5’-氨基-脱氧核苷酸(式5),例如:
Figure BDA0000952733370000061
其中B=如上选择的核碱基,并且优选地R=C1至C3烷基,更优选为CH3
其中
Figure BDA0000952733370000062
是连接到DNA接头分子的第一链或反向链的以5’→3’方向前进的核苷酸序列的共价键。
优选地,两条链的5’末端彼此独立地被5’-OMe-脱氧核苷酸、最优选为5’-OMe脱氧胸苷(5’-OMeT)、末端5’-C3间隔基修饰和/或5’-D间隔基修饰进行修饰。这种修饰导致在被修饰的5’末端处不能通过多核苷酸激酶、特别是通过T4多核苷酸激酶进行磷酸化这一事实。有利情况下,两条链的5’末端保持未磷酸化,以避免接头二聚体和寡聚体的形成。
优选地,5’-C3间隔基或5’-D间隔基如下设计:
Figure BDA0000952733370000063
其中X选自–H、-OH、-ORx和卤素,优选地X是–OH或-ORx,更优选地X是–OH,
其中Rx是任选被取代和/或支链的C1至C3烷基残基,更优选地Rx是CH3
其中
Figure BDA0000952733370000064
是连接到DNA接头分子的第一链或反向链的以5’→3’方向前进的核苷酸序列的共价键。
Figure BDA0000952733370000071
5’-OMe脱氧胸苷酸(5’-O-甲基脱氧胸苷一磷酸,在这里也称为5’-OMeT)。
优选地,DNA接头分子的第一链的5’末端被5’间隔基或5’醚化的脱氧核苷酸(优选地符合式3)、优选为5’-O甲基脱氧核苷酸修饰。术语间隔基是指优选地具有1至6个碳原子的烃残基,优选为具有2至4个碳原子的烷二基,最优选为直链C3(5’-C3间隔基)。DNA接头分子的第一链的5’末端的修饰导致磷酸化、特别是通过T4多核苷酸激酶的磷酸化不可能进行这一事实。此外,优选的修饰对DNA双链的构象具有最小影响(空间位阻),以允许反向链的反应性游离3’-OH的高效连接。
最优选的5’-OMe脱氧核苷酸是5’-OMe脱氧胸苷酸(5’-OMeT)。通过5’-OMe脱氧胞苷酸(5’-O-甲基脱氧胞苷一磷酸)、5’-OMe脱氧腺苷酸(5’-O-甲基脱氧腺苷一磷酸)或5’-OMe脱氧鸟苷酸(5’-O-甲基脱氧鸟苷一磷酸)的修饰也是可能的。对于5’-OMe脱氧核苷酸修饰(或5’-氨基-脱氧核苷酸)来说,向DNA接头分子的反向链的3’-末端添加另外的互补脱氧核苷酸,使得在第一链的5’-末端处的修饰的核苷酸可以与这个互补核苷酸形成正常的、未稳定化的碱基对,以便不干扰随后的缺口修复。如果例如第一链的5’末端的修饰是5’-OMe胸苷(或5’-氨基脱氧胸苷一磷酸),则所述互补核苷酸是脱氧腺苷。
当用于文库制备时,符合本发明的DNA接头分子仅仅使用反向链的3’-末端连接到DNA片段的第一链的5’-磷酸化末端。在DNA接头的第一链的5’-末端与DNA片段的反向链的3’-OH之间保留缺口(由于DNA接头分子的第一链的5’末端修饰,所述5’末端不含游离磷酸基团)。所述缺口优选地随后使用具有5’→3’核酸外切酶活性和5’→3’聚合酶活性的聚合酶(如DNA聚合酶I),通过核苷酸切除修复(在这里也称为缺口修复)来修复,所述聚合酶切除5’-末端处的修饰核苷酸(优选为5’-OMeT)并将其用未修饰的核苷酸(优选为脱氧胸苷一磷酸)替换。优选地仍存在于样品中并有活性的连接酶随后将DNA片段的反向链的游离3’-羟基连接到DNA接头的第一链的被修复的5’-末端。
符合本发明的DNA接头分子的第一链的3’末端优选地被3’-C3间隔基或3’-氨基修饰物修饰。该修饰的3’末端对于连接酶来说被阻断,并且不能发生与5’磷酸化的DNA、优选为dsDNA分子的联结。
Figure BDA0000952733370000084
其中X选自–H、-OH、-ORx和卤素,优选地X是–OH或-ORx,更优选地X是–OH,
其中Rx是任选被取代和/或支链的C1至C3烷基残基,更优选地Rx是CH3
其中
Figure BDA0000952733370000085
是连接到DNA接头分子的第一链的以3’→5’方向前进的核苷酸序列的共价键。
本发明的另一部分是一种生产包含双链DNA分子的DNA接头分子的方法,所述方法具有下列步骤:
a.修饰所述第一链的5’末端,使得没有用于激酶的结合位点、特别是没有游离羟基并且没有游离磷酸基团可用,
b.修饰所述第一链的3’末端,使得没有游离羟基可用,并且不能与5’-磷酸化的dsDNA形成键,
c.修饰所述反向链的5’末端,使得没有用于激酶的结合位点、特别是没有游离羟基并且没有游离磷酸基团可用,
其中步骤a-c可以以任意顺序进行。
所述双链通常通过将通过标准寡核苷酸合成所合成的两条单链退火来获得。一般来说,通过将已经预先修饰过的构造部件用于寡核苷酸合成,为相应的3’和5’末端引入上述修饰。然而,术语修饰还包括在寡核苷酸合成后修饰相应的3’和5’末端这一(不太优选的)可能性,例如将带有游离5’-OH的标准5’-胸苷(更准确为脱氧胸苷一磷酸)转化成甲基醚以获得5’-OMeT。
优选的修饰在上文描述。
本发明的另一部分是一种产生DNA文库的方法,所述方法优选地包括下列步骤:
1.双链DNA的片段化,优选地通过物理或化学或酶学方法或其组合来进行,
2.所述片段化的双链DNA的末端修复,优选地在具有3’→5’核酸外切酶和5’→3’聚合酶活性的DNA聚合酶如T4-DNA聚合酶的帮助下进行,
3.所述片段化的双链DNA的5’末端的磷酸化,优选地通过多核苷酸激酶如T4多核苷酸激酶来进行,
4.符合本发明的DNA接头分子与所述片段化的、末端修复且5’磷酸化的双链DNA的连接,其中所述符合本发明的DNA接头分子在步骤2之前添加,并且优选地在连接之前不进行酶(特别是末端修复酶)的失活。
所述酶被添加到本领域已知的适合的缓冲剂中。步骤2和3可以平行进行,特别是通过添加聚合酶与激酶的混合物。两种酶一起在本文中也被称为“末端修复酶”。所述混合物相应地也被称为“末端修复酶混合物”。用于末端修复的聚合酶和激酶在同一缓冲剂中表现良好,所述缓冲剂优选地包含镁和缓冲物质例如TRIS-HCl,并优选地具有7至8之间的pH。这种缓冲剂进一步也被称为“末端修复缓冲剂”。为了进行末端修复,脱氧核苷三磷酸(优选为dATP、dTTP、dGTP和dCTP)也被添加到“末端修复缓冲剂”或分开添加。
符合本发明的DNA接头分子如上解释来构建,优选地包括一个或几个上述优选特点。优选地,在步骤2之前添加的DNA接头分子含有条形码序列。在步骤1中,可以在装置的单独仓室中平行地处理几个单独的DNA探针。优选地,向每个单独的DNA探针添加具有不同条形码的DNA接头分子。对于下一代测序来说,一般在连接条形码后将样品合并。这些条形码允许在测序后将序列指派到样品。
原则上,条形码接头可以在步骤1之后和步骤4之前或期间的每个时间点添加。
有利情况下,在进行末端修复和5’末端的磷酸化之前,符合本发明的DNA接头分子可能已被添加到片段化的DNA。这具有仅仅在步骤1中添加个性化探针的优点,所述个性化探针是片段化的DNA和具有条形码的符合本发明的DNA接头分子。这允许例如使用移液机器人将后续步骤自动化,因为在步骤2至4中优选地向所有样品添加相同的物质和体积。
在本领域中已知的流程中,在连接之前、末端修复和末端修复酶的失活之后,必须向样品直接手动添加少量(2μl或更少)个性化的条形码接头。按照本发明,可以避免这种易于产生误差的小体积的移液。
然而,在本发明中,可以在步骤1之后向每个样品添加条形码接头,并且随后的步骤可以完全从移液机器人进行。所述机器人可以被供应有通用的末端修复混合物和连接混合物,仅仅必须向每个样品添加相同的预设体积。这使不准确性和反应体积的损失降至最低。此外,所述机器人在每个移液步骤后不必更换移液头。
特别是对于DNA文库制备来说,优选地将第二个DNA接头分子连接到片段化的、末端修复且5’磷酸化的双链基因组DNA的另一个末端。该第二个DNA接头分子优选地含有反向引物序列,并且优选地是对每个探针来说相同的通用接头分子。所述第二个DNA接头分子是符合本发明的DNA接头分子或在本领域中使用的也包含双链多核苷酸分子的常用DNA接头分子。所述第二个DNA接头分子优选地包含具有修饰的骨架(例如硫代磷酸酯)的核苷酸。
优选地,所述第二个DNA接头分子是符合本发明的DNA接头分子(其中第一和反向链的5’末端和第一链的3’末端如上所述进行修饰)。作为通用接头分子,所述第二个DNA接头分子不必含有条形码,但优选地含有反向引物序列。有利的是,它也可以在步骤1之后添加。
如果所述第二个DNA接头分子(或通用接头分子)是符合本发明的DNA接头分子,这具有在进行连接之前不必失活酶、特别是末端修复酶的优点。
如果所述第二个DNA接头分子(或通用接头分子)是本领域已知的常用DNA接头分子,则必须在连接(步骤4)之前进行末端修复酶的失活,这优选地通过在高温下温育来进行,所述高温取决于所使用的酶,优选为超过60℃的温度。在这种情况下,所述第二个DNA接头分子在失活之后,优选地与连接酶一起在连接混合物中添加。
由于步骤1至3可以在另一个实验室中独立地进行,因此本发明还包括一种产生DNA文库的方法,所述方法包括将符合本发明的DNA接头分子连接到片段化的、末端修复且5’磷酸化的双链DNA的步骤,其中优选地在连接之前不进行酶、特别是末端修复酶的失活。
所述连接是平末端连接,其优选地在本领域中公知的条件(例如在室温下2h或16℃过夜)下进行。用于连接的优选的酶是T4 DNA连接酶。
在如上所解释的连接步骤后,优选地通过添加缺口修复酶、优选为具有5’→3’核酸外切酶活性和5’→3’聚合酶活性的DNA依赖性DNA聚合酶进行缺口修复(步骤5)。所述缺口修复酶优选为热稳定的,例如Taq聚合酶。通过优选地加热反应混合物,优选地到超过60℃的温度,将连接酶失活并同时激活末端修复酶。用于步骤4和步骤5的酶可以作为含有缺口修复酶和连接酶的混合物——“连接和缺口修复酶混合物”同时添加。有利情况下,“作为连接缓冲剂”用于步骤4和步骤5的缓冲物质可以与“末端修复缓冲剂”中的相同,例如TRIS-HCl,并优选地具有7至8之间的pH。所述“连接缓冲剂”优选地还含有镁。为了进行缺口修复,脱氧核苷三磷酸(优选为dATP、dTTP、dGTP和dCTP)也被添加到“连接缓冲剂”或分开添加。
用于产生DNA文库的DNA优选为基因组DNA。基因组DNA文库的显著特点之一在于基因组DNA文库基本上维持原始基因组(基因组DNA)上的一组基因或序列的拷贝数以及所述基因组DNA上所述一组基因或序列的丰度比。
本发明的另一个目的是用于产生DNA文库的试剂盒,其优选地用于执行上述产生DNA文库的方法,所述试剂盒包含:
i.符合本发明的DNA接头分子,
ii.优选地,对于末端修复来说:具有3’→5’核酸外切酶和5’→3’聚合酶活性的DNA聚合酶,以及脱氧核苷三磷酸(优选为dATP、dTTP、dGTP和dCTP),
iii.优选地,对于5’磷酸化来说:多核苷酸激酶,
iv.优选地,对于连接来说:连接酶,
v.优选地,如上所述的第二个DNA接头分子(优选为通用接头),
vi.优选地,对于缺口修复来说:具有5’→3’核酸外切酶活性的聚合酶,以及
vii.优选地,缓冲剂(如上所述,优选地包含镁和ATP)。
因此,所述试剂盒至少包含符合本发明的DNA接头分子,并且最优选地包含连接酶。
不同的酶优选地如上所述进行选择。
组分ii和iii优选地被提供成如上所定义的“末端修复酶混合物”,优选地与如上定义的“末端修复缓冲剂”一起或甚至与该缓冲剂混合。
组分iv和v优选地被提供成“连接和缺口修复酶混合物”、“末端修复酶混合物”,优选地与如上定义的“连接缓冲剂”一起或甚至与该缓冲剂混合。
如果未提供在缓冲剂中,所述试剂盒还可以含有作为“dNTP混合物”的脱氧核苷三磷酸(优选为dATP、dTTP、dGTP和dCTP)作为分开的组分。
本发明的另一部分是上述DNA接头分子或上述试剂盒的用途,其用于产生DNA文库,特别是用于下一代测序和/或文库复用领域中。符合本发明的DNA接头分子特别适合于与自动化溶液一起使用,因为它们允许非常简单和稳健的流程。
符合本发明的DNA接头修饰能够进行并促进文库复用,特别是在自动化流程中,这是因为在文库制备开始时带有条形码的接头可能已被手动添加到DNA(在进行末端修复和5’末端的磷酸化之前,添加到片段化的DNA),并且随后可以在移液机器人上进行文库制备。另一个有利特征在于末端修复酶的热失活不是必需的:末端修复的文库片段不被存在于末端修复混合物中的酶进一步修饰,并且符合本发明的DNA接头分子也不是那些酶的底物。那些酶在添加DNA连接酶之前的连接前失活不是必需的,并且连接可以在有活性的末端修复酶存在下进行。这允许极大缩短自动化文库制备流程,无需耗时的样品的加热和冷却。
本发明通过下列附图和实施例进行进一步描述,但本发明不限于它们。
图1示出了从现有技术状态已知的条形码接头,其被优化用于平末端连接,但是不能在末端修复期间或之前添加(并且不能在没有进行末端修复酶的失活的情况下添加)。在左侧示出了平末端连接位点。为了避免在3’位点上连接,第一链(SEQ ID No.9)具有3’突出端,其包含硫代磷酸酯修饰的核苷A*C*(以避免所述突出端的降解)。互补的反向链(SEQ IDNo.10)较短。两条链的5’是未磷酸化的(具有游离的5’OH),以减少接头二聚体的形成。条形码序列被下划线。
图2示出了符合本发明的条形码接头的实例。同样地在左侧示出了平末端连接位点。为了避免在3’位点上连接,将第一链(SEQ ID No.11)用M1修饰。将第一链的5’用M2修饰以避免磷酸化并减少接头二聚体和寡聚体的形成。将反向链(SEQ ID No.12)的5’用M3修饰以减少接头二聚体和寡聚体的形成。条形码序列被下划线。反向链的3’末端具有游离的3’-OH。
图3示出了符合本发明的修饰的条形码接头,其中第一链(SEQ ID No.13)的5’-修饰是5’-OMeT。为了产生平末端,反向链(SEQ ID No.14)在3’末端具有互补的A,其具有游离的3’-OH基团。
图4示出了使用标准流程和使用未修饰和修饰的DNA接头分子的新的(或改良的)文库制备流程产生的DNA文库的Ct值的比较,其中1A是参比。标识符1A至3E对应于表1(第一列)之一。
图5至11示出了在标准文库制备后(B)或在使用符合本发明的改良流程进行文库制备后(A),使用符合本发明的修饰的条形码接头(图6至11)或未修饰的条形码接头(图5)的DNA文库的片段尺寸分析。DNA文库使用Agilent High Sensitivity Chip,在下限和上限尺寸标志物(35-10380bp)之间的尺寸范围内定性。标识符1A至3E对应于表1之一。第一个峰(40bp)对应于未结合的接头分子。图5B和图6至11中的第二个峰对应于DNA文库。超过10.000bp的峰对应于残留的未剪切的基因组DNA。在图5A中,多峰图案对应于接头寡聚体,其在其它图中不存在。
实施例1:在标准流程和改良的文库制备流程中不同修饰的DNA接头分子的比较
为了试验DNA接头修饰的不同组合,合成了下列单链并在不同组合中应用:
表1:
Figure BDA0000952733370000161
术语“/5SpC3/”是指本文中所定义的如上所述的5’-C3间隔基,所述5’-C3间隔基是下式的1-羟基丙基-3-磷脂酰基终止物:
Figure BDA0000952733370000162
术语“/5dSp/”是指下式的作为5’-D间隔基的1,2-双脱氧核糖基-3-磷酸:
Figure BDA0000952733370000171
在本文中,术语“/3AmMO/”是指下式的作为3’-氨基修饰物的6-氨基己基-1-磷酸:
Figure BDA0000952733370000172
在本文中,“/3SpC3/”是下式的作为3’-C3间隔基的1-氧基-3-丙醇:
Figure BDA0000952733370000173
在本文中,“OMeT/”是具有下列化学结构的作为5’-末端修饰物的5'-O-甲基脱氧胸苷一磷酸:
Figure BDA0000952733370000174
在DNA文库制备标准流程(QIAGEN GeneReadTM Library Prep(L)手册03/2013)中,将修饰的接头链的不同组合与未修饰的接头序列(1A)平行使用。为此,每次制备将来自于大肠杆菌的1μg基因组DNA(gDNA)应用于末端修复反应中,所述基因组DNA已事先片段化到150个碱基对的长度。随后将酶热失活,并将不同修饰的接头组合与未修饰的通用接头X(第一链X_fwd:5'-GTAAAACGACGGCCAGT-3',SEQ ID No.15;反向链:X_rev:5'-ACTGGCCGTCGTTTTAC*T*T-3',SEQ ID No.16;*=硫代磷酸酯)一起应用于连接反应中。
在本实施例中,使用符合表1的下列接头组合:1A(未修饰的接头——现有技术)、2B、2C、2D、2E、3B、3E。
使用相同的接头分子组合,与标准流程平行地执行改良的文库制备流程。与标准流程相反,将条形码接头B2_Index_1与gDNA一起移液到末端修复感应中。在末端修复反应完成后,仅向连接加入通用接头X。
在下表中对两种文库制备流程(“新流程”和“标准流程”)进行说明。
表2:
Figure BDA0000952733370000191
在准备好末端修复反应后,将混合物在25℃温育20分钟,然后在70℃进行10分钟的酶失活步骤。接下来,通过将连接和缺口修复混合物、连接缓冲剂和dNTP与通用接头一起添加到末端修复的DNA,来准备连接和切口修复反应。将该混合物在25℃温育10分钟,然后在72℃温育5分钟。
得到的文库使用GeneReadTM尺寸选择(QIAGEN,Hilden,DE,截留尺寸100bp)进行纯化。纯化后,在接头定位引物帮助下通过定量实时PCR(qPCR)对得到的文库进行定量,并使用毛细管凝胶电泳分析样品的片段尺寸分布。
使用标准流程产生的DNA文库的Ct值的比较显示,在未修饰的接头分子1A与不同接头修饰(除了接头2C之外)之间没有显著差异。这一事实在图3中进行说明。它显示,符合本发明的接头修饰不影响接头分子的功能性。
使用标准流程与使用新流程相比产生的DNA文库的Ct值的比较显示,与标准流程后相比,在新流程后修饰的接头分子的Ct值相当或略微更好。与标准流程相比,当使用新流程时,未修饰的接头分子产生明显更差的Ct值,这表明在使用符合本发明的修饰的接头分子下的得率相当大地不依赖于所使用的文库制备流程。
使用Agilent BioAnalyzer高灵敏度DNA芯片比较得到的DNA文库的片段尺寸分布。对于标准流程来说,使用未修饰的(现有技术)和符合本发明的修饰的DNA接头时得到的DNA文库的片段尺寸分布是可比的。片段尺寸平均约为240bp(片段化后150bp的文库片段+90bp的接头分子)。对于使用新流程时使用符合本发明的修饰的DNA接头分子得到的文库来说,证实了同样的结果。
只有对于使用新流程时使用未修饰的接头分子得到的文库来说,可以在电泳图中在较低片段尺寸区域中看到清楚的峰。这显示(图5A)当在新流程中使用时,未修饰的接头分子发生二聚体化和寡聚体化,因此不适用于新流程。
接头二聚体和寡聚体使通过定量PCR进行的文库定量发生错误,并且另一方面它们在对文库进行测序时降低读取能力,这是因为它们随着DNA文库被扩增和测序而不含任何有用信息。
Figure IDA0000952733440000011
Figure IDA0000952733440000021
Figure IDA0000952733440000031
Figure IDA0000952733440000041
Figure IDA0000952733440000051
Figure IDA0000952733440000061

Claims (26)

1.一种DNA接头分子,其包含双链分子,其中
a.第一链的5’末端被修饰成使得第一核苷酸不含游离羟基并且在5’位置处没有游离磷酸基团,
b.所述第一链的3’末端被修饰成使得最后一个核苷酸在3’位置处不含游离羟基,
c.反向链的5’末端被修饰成使得第一核苷酸不含游离羟基并且在5’位置处没有游离磷酸基团,
d.所述反向链的3’末端以游离羟基为特点,
其中两条链的5’末端处和第一链的3’末端处的羟基被酯化或醚化。
2.权利要求1的DNA接头分子,其含有条形码序列以及用于扩增引物和测序引物的结合位点。
3.权利要求1的DNA接头分子,其特征在于它具有20至90个碱基对的长度。
4.权利要求1的DNA接头分子,其特征在于它具有40至70个碱基对的长度。
5.权利要求1的DNA接头分子,其特征在于它具有40至60个碱基对的长度。
6.权利要求1至5任一项的DNA接头分子,其特征在于通过附连5’-C3间隔基或5’-D间隔基对所述反向链的5’末端进行修饰。
7.权利要求1至5任一项的DNA接头分子,其特征在于通过附连5’-C3间隔基或5’-O-甲基脱氧核苷酸对所述第一链的5’末端进行修饰。
8.权利要求1至5任一项的DNA接头分子,其特征在于通过3’-C3间隔基或3’-氨基修饰物对所述第一链的3’末端进行修饰。
9.一种用于生产DNA接头分子的方法,所述DNA接头分子包含双链分子,所述方法具有下列步骤:
a.修饰第一链的5’末端,使得没有游离羟基和游离磷酸基团可用,
b.修饰所述第一链的3’末端,使得没有游离羟基可用,
c.修饰反向链的5’末端,使得没有游离羟基和游离磷酸基团可用,
其中两条链的5’末端处和第一链的3’末端处的羟基被酯化或醚化。
10.权利要求9的用于生产DNA接头分子的方法,其中所述第一链的5’末端的修饰通过附连5’-O-甲基脱氧胸苷一磷酸或5’-C3间隔基来实现。
11.权利要求9或10的用于生产DNA接头分子的方法,其中所述第一链的3’末端的修饰通过附连3’-C3间隔基或3’-氨基修饰物来实现。
12.权利要求9或10的用于生产DNA接头分子的方法,其中所述反向链的5’末端的修饰通过附连5’-C3间隔基或5’-D间隔基来实现。
13.一种产生DNA文库的方法,所述方法包括下列步骤:
1)双链DNA的片段化,
2)片段化的双链DNA的末端修复,
3)所述片段化的双链DNA的5’末端的磷酸化,
4)将权利要求1至8任一项的DNA接头分子与片段化的、末端修复且5’磷酸化的双链DNA连接,其中在步骤2之前添加权利要求1至8任一项的DNA接头分子。
14.权利要求13的产生DNA文库的方法,其中所述双链DNA的片段化通过物理或化学或酶学方法或其组合来进行。
15.权利要求13的产生DNA文库的方法,其中所述片段化的双链DNA的末端修复在具有3’→5’核酸外切酶和5’→3’聚合酶活性的DNA聚合酶的帮助下进行。
16.权利要求15的产生DNA文库的方法,其中所述DNA聚合酶为T4-DNA聚合酶。
17.权利要求13至16任一项的产生DNA文库的方法,其中所述片段化的双链DNA的5’末端的磷酸化通过多核苷酸激酶来进行。
18.权利要求17的产生DNA文库的方法,其中所述多核苷酸激酶为T4多核苷酸激酶。
19.一种产生DNA文库的方法,其包括将权利要求1至8任一项的DNA接头分子连接到片段化的、末端修复且5’磷酸化的双链DNA的步骤,其中在连接之前不进行酶的失活。
20.一种试剂盒,其包含:
-权利要求1至8任一项的DNA接头分子,以及
-具有5’→3’核酸外切酶活性的聚合酶。
21.权利要求20的试剂盒,其还包含:
-具有3’→5’核酸外切酶和5’→3’聚合酶活性的DNA聚合酶以及脱氧核苷三磷酸。
22.权利要求20的试剂盒,其还包含:
-多核苷酸激酶。
23.权利要求20的试剂盒,其还包含:
-连接酶。
24.权利要求20至23任一项的试剂盒,其还包含:
-缓冲剂。
25.权利要求1至8任一项的DNA接头分子或权利要求20至24任一项的试剂盒的用途,用于产生DNA文库。
26.权利要求1至8任一项的DNA接头分子或权利要求20至24任一项的试剂盒的用途,用于下一代测序和/或文库复用领域中。
CN201480053727.4A 2013-09-30 2014-09-29 用于制备dna文库的dna接头分子以及生产它们的方法和用途 Expired - Fee Related CN105579592B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP13186776 2013-09-30
EP13186776.4 2013-09-30
PCT/EP2014/070769 WO2015044412A1 (en) 2013-09-30 2014-09-29 Dna-adapter-molecules for the preparation of dna-libraries and method for producing them and use

Publications (2)

Publication Number Publication Date
CN105579592A CN105579592A (zh) 2016-05-11
CN105579592B true CN105579592B (zh) 2020-12-15

Family

ID=49304707

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480053727.4A Expired - Fee Related CN105579592B (zh) 2013-09-30 2014-09-29 用于制备dna文库的dna接头分子以及生产它们的方法和用途

Country Status (8)

Country Link
US (1) US20160289755A1 (zh)
EP (1) EP3052645B1 (zh)
JP (2) JP6422193B2 (zh)
CN (1) CN105579592B (zh)
CA (1) CA2921067A1 (zh)
ES (1) ES2717756T3 (zh)
TR (1) TR201904440T4 (zh)
WO (1) WO2015044412A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016168351A1 (en) * 2015-04-15 2016-10-20 The Board Of Trustees Of The Leland Stanford Junior University Robust quantification of single molecules in next-generation sequencing using non-random combinatorial oligonucleotide barcodes
CN106148513A (zh) * 2016-06-22 2016-11-23 杭州杰毅麦特医疗器械有限公司 一种游离dna文库构建方法及试剂盒
US20210115435A1 (en) * 2017-04-06 2021-04-22 Qing Wang Error-proof nucleic acid library construction method
WO2019084245A1 (en) * 2017-10-27 2019-05-02 Myriad Women's Health, Inc. METHODS AND COMPOSITIONS FOR PREPARING NUCLEIC ACID LIBRARIES
CN108060191B (zh) * 2017-11-07 2021-05-04 深圳华大智造科技股份有限公司 一种双链核酸片段加接头的方法、文库构建方法和试剂盒
DE102020216120A1 (de) * 2020-12-17 2022-06-23 Robert Bosch Gesellschaft mit beschränkter Haftung Ermittlung der Quantität und Qualität einer DNA-Bibliothek
CN113512767B (zh) * 2021-04-30 2022-09-23 天津诺禾致源生物信息科技有限公司 用于构建small RNA文库的接头、试剂盒及small RNA文库的构建方法
CN116254320A (zh) * 2022-12-15 2023-06-13 纳昂达(南京)生物科技有限公司 平末端双链接头元件、试剂盒及平末端建库方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102027130A (zh) * 2008-02-05 2011-04-20 霍夫曼-拉罗奇有限公司 配对末端测序法
WO2011133876A2 (en) * 2010-04-22 2011-10-27 Alnylam Pharmaceuticals, Inc. Oligonucleotides comprising acyclic and abasic nucleosides and analogs

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69737450T2 (de) * 1996-06-06 2007-11-29 Solexa, Inc., Hayward Sequenzierung durch ligation kodierter adapter
US6528257B1 (en) * 2000-07-07 2003-03-04 Council Of Scientific & Industrial Research Method for the simultaneous monitoring of individual mutants in mixed populations
GB0308851D0 (en) * 2003-04-16 2003-05-21 Lingvitae As Method
EP1574585A1 (en) * 2004-03-12 2005-09-14 Plant Research International B.V. Method for selective amplification of DNA fragments for genetic fingerprinting
WO2007145612A1 (en) * 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
EP2302070B1 (en) * 2005-06-23 2012-08-22 Keygene N.V. Strategies for high throughput identification and detection of polymorphisms
US7932029B1 (en) * 2006-01-04 2011-04-26 Si Lok Methods for nucleic acid mapping and identification of fine-structural-variations in nucleic acids and utilities
US20100035249A1 (en) * 2008-08-05 2010-02-11 Kabushiki Kaisha Dnaform Rna sequencing and analysis using solid support
EP2280080A1 (en) * 2009-07-31 2011-02-02 Qiagen GmbH Method of normalized quantification of nucleic acids using anchor oligonucleotides and adapter oligonucleotides
US8889350B2 (en) * 2010-03-26 2014-11-18 Swift Biosciences, Inc. Methods and compositions for isolating polynucleotides
US8883421B2 (en) * 2010-09-10 2014-11-11 New England Biolabs, Inc. Method for reducing adapter-dimer formation
SG11201405669XA (en) * 2012-03-13 2014-10-30 Swift Biosciences Inc Methods and compositions for size-controlled homopolymer tailing of substrate polynucleotides by a nucleic acid polymerase
US9957550B2 (en) * 2014-09-08 2018-05-01 BioSpyder Technologies, Inc. Attenuators

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102027130A (zh) * 2008-02-05 2011-04-20 霍夫曼-拉罗奇有限公司 配对末端测序法
WO2011133876A2 (en) * 2010-04-22 2011-10-27 Alnylam Pharmaceuticals, Inc. Oligonucleotides comprising acyclic and abasic nucleosides and analogs

Also Published As

Publication number Publication date
ES2717756T3 (es) 2019-06-25
JP2016534745A (ja) 2016-11-10
CN105579592A (zh) 2016-05-11
EP3052645B1 (en) 2019-01-09
US20160289755A1 (en) 2016-10-06
WO2015044412A1 (en) 2015-04-02
TR201904440T4 (tr) 2019-04-22
CA2921067A1 (en) 2015-04-02
JP6422193B2 (ja) 2018-11-14
JP2018196397A (ja) 2018-12-13
EP3052645A1 (en) 2016-08-10

Similar Documents

Publication Publication Date Title
CN105579592B (zh) 用于制备dna文库的dna接头分子以及生产它们的方法和用途
EP3814494B1 (en) High throughput assembly of nucleic acid molecules
JP6886962B2 (ja) Rnaシークエンシングライブラリーを生成する方法
CN110062809B (zh) 用于环状共有序列测序的单链环状dna文库
CN106460052B (zh) 双链核酸的合成
US20120003657A1 (en) Targeted sequencing library preparation by genomic dna circularization
CN108495938B (zh) 利用相位移区块合成条码化序列及其用途
EP2191011A1 (en) Method for sequencing a polynucleotide template
EP1991675A1 (en) End modification to prevent over-representation of fragments
WO2008015396A2 (en) Method of library preparation avoiding the formation of adaptor dimers
CN109312391B (zh) 生成用于单分子测序的单链环状dna文库的方法
CN108138175A (zh) 用于分子条形码编码的试剂、试剂盒和方法
CN111164219A (zh) 用于单分子测序样品制备的环化方法
CA3163353A1 (en) Controlled strand-displacement for paired-end sequencing
EP3956445B1 (en) Multiplex assembly of nucleic acid molecules
JP2024105356A (ja) 次世代配列決定ライブラリを調製するための核酸の標識化に有用なオリゴヌクレオチドが連結された三リン酸ヌクレオチド
CN111801427A (zh) 用于单分子的单链环状dna模板的产生
CN111315895A (zh) 用于产生环状单链dna文库的新型方法
KR20240024835A (ko) 비이드-기반 핵산의 조합 인덱싱을 위한 방법 및 조성물
WO2022251510A2 (en) Oligo-modified nucleotide analogues for nucleic acid preparation
CN113564235A (zh) 脱氧核糖寡核苷酸测序方法和试剂盒

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201215