CN114507708A - 一种制备长分子测序dna的方法 - Google Patents

一种制备长分子测序dna的方法 Download PDF

Info

Publication number
CN114507708A
CN114507708A CN202011278917.XA CN202011278917A CN114507708A CN 114507708 A CN114507708 A CN 114507708A CN 202011278917 A CN202011278917 A CN 202011278917A CN 114507708 A CN114507708 A CN 114507708A
Authority
CN
China
Prior art keywords
dna
fragment
small dna
linker
fragments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011278917.XA
Other languages
English (en)
Inventor
唐纳德·李
大卫·克莱姆
王莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202011278917.XA priority Critical patent/CN114507708A/zh
Publication of CN114507708A publication Critical patent/CN114507708A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及生物技术领域,具体地,涉及一种制备长分子测序DNA的方法。所述方法,包括以下步骤:1)改变小DNA片段的末端:将小DNA片段的突出末端变为平末端,然后在平末端增加额外的单碱基凸起;2)添加接头:向步骤1)处理后的小DNA片段中加入设计好的带有与处理后的小DNA片段单碱基凸起配对互补的接头;所述接头为一段寡核苷酸片段,该寡核苷酸片段与其互补寡核苷酸片段配对后形成的双链两端均带有单碱基,该单碱基与步骤1)处理后的小DNA片段的单碱基凸起互补配对;3)串联小DNA片段:通过添加的接头,首尾连接小DNA片段,将小DNA片段串联成长分子测序DNA。

Description

一种制备长分子测序DNA的方法
技术领域
本发明涉及生物技术领域,具体地,涉及一种制备长分子测序DNA的方法。该方法使得多种类型的样品适用于第三代长序列技术进行的DNA测序。这种制备方法可用于PCR扩增产物分析、植入前胚胎评估、血浆或尿液游离DNA评估、古DNA测序、病理标本遗传分析以及环境DNA分析。
背景技术
许多领域的基因分析都在使用高通量测序-通常被称为二代或新一代测序(NGS)。这种方式仅限于检测较小的序列(<300-400个碱基),如果目标是大的DNA分子,则需要进行相应的文库构建。二代测序最广泛的应用是分析小片段的降解DNA,二代测序还能对足量的DNA序列进行“标记”测序,以便能够特异性地匹配相应分子。后者大量应用在包括非侵入性产前诊断、福尔马林固定后石蜡包埋的病理标本DNA、环境DNA和最近癌症的游离DNA检测等领域,这时的基因和基因组测序往往涉及较长片段(300-400碱基)的DNA分析。与Sanger等传统单样本测序方法相比,NGS能够进行大规模并行分析,因此单次测序分析的成本降低。如需大量分子测序并统计验证和/或待测DNA为降解的小片段的情况下,二代测序技术尤其重要。
近年来,另一种DNA分析的方法逐渐发展起来。这就是三代测序,不同于NGS,三代测序需要大分子DNA作为底物,序列分析才能有效地进行。这些分子比通常NGS的DNA模板长100-1,000倍。虽然三代设备也能进行小分子测序,但使用长分子能提高测序效率。随着DNA分析越来越多地渗入常规的遗传应用,单次分析成本问题凸显,因此对测序效率提出了更高的要求。
NGS应用基本上被两个寡头垄断,测序价格也因为经济原因被人为抬高。三代测序如果能用于小分子DNA的检测就为降低由NGS主导的应用成本提供了可能性。这个应用的主要挑战在于如何获得适当大小的DNA标靶,有效地用于新的三代测序设备。
无创产前分析已成为现代妊娠管理的重要手段。针对高危妊娠传统选择只有3种:不产检,仅在出生时确认婴儿是否有问题;妊娠早期筛查(早期唐筛),是非侵入性的,对妊娠的风险很小;侵入性操作,如绒毛取样或羊水穿刺术,该选择存在流产和感染的风险。妊娠早期筛查是传统生化检测和超声检查相结合的方法,检出率虽为92%-94%,但特异性仅为5%。被怀疑为染色体病高风险后,患者会左右为难,因为即便进行了侵入性检查,也只会发现95%的“高风险”病例实际为阴性。患者犹豫是否应该进行侵入性检测,还会担心是否有可能因为侵入性检查的并发症而流产。这个数据提示95%的侵入性检查使用不当。侵入性检查是通过胎盘植入部位(CVS或绒毛膜绒毛穿刺)或羊水(羊膜穿刺术)的遗传学检测来评估胎儿的。由于只能在妊娠的特定时间通过外科手术的方法取样,因此相对于妊娠早期筛查,流产和感染风险增加了。
怀孕期间,胎儿-胎盘界面的细胞释放降解DNA进入母体循环血浆,增加了母体自身细胞/DNA降解背景的正常水平。降解DNA以一定水平(1-2ng游离DNA/毫升血浆)持续存在于血浆相。降解的DNA为120-400bp的片段—对于实现有效的三代测序分析来说太小了,但是很适合NGS-序列短且该平台有更高的通量负载能力。但是,如果有一种方法可以改变片段长度,使其可以有效地用于三代测序,就可能降低检测成本,并提供针对片段DNA的替代分析方法。要满足三代测序的要求,需要相当于约150-300个细胞量的游离DNA,假设游离DNA的平均片段为150bp,则需要大约40-80亿个来自染色体的DNA片段。而这些片段中只有一小部分(通常是300-2000万个片段)能用于NGS的最终分析。经过标准NGS文库制备和测序,这些片段可以匹配到特定的染色体上,分箱后便可以统计分析每个染色体(区域)的拷贝数平衡情况。二代测序可以评估胎儿DNA对游离DNA总量的相对贡献,从而确定胎儿染色体是否处于拷贝数相对平衡状态。这个方法被用于孕早期染色体问题的筛查,现在侵入性检测仅作为确认染色体问题的备选方法。由于高的敏感性和特异性,这种非侵入性检测降低了无效侵入性检测的数量及其导致的妊娠风险,同时释放了被孕早期筛查的假阳性结果所消耗的资源。
无创产前筛查(NIPS)通常通过分析片段化DNA中的一小部分来完成—分析结果足以确定原始染色体的来源,然后再通过数学方法计算染色体或其中的某些区域的比率是否改变。NIPS所需的设备和试剂由两家供应商控制,价格昂贵。此外,这一过程需要缴纳许可费,导致全球许多国家的人们无法承担总体成本。
这些片段通常为130bp-400bp的小DNA,有利于NGS分析,但不适合有效的第三代测序。如果这些碎片DNA能成为其他技术的有效模板,例如三代测序,那就可能降低成本,而这反过来又可以在较低的经济成本下扩大使用NIPS。
与怀孕一样,癌症也会向患者循环系统释放DNA。类似于NIPS,癌症筛查可以利用这些小片段的DNA测序来检测染色体失衡,识别存在的突变,甚至可能确诊癌症种类。对降解DNA进行经济有效的筛选可以降低大规模应用早期癌症检测的成本。
对于一些病理检查,唯一可用的DNA来源是福尔马林固定后的石蜡包块。这些标本的固定和制备导致DNA降解为小片段。一种可以使这些降解DNA用于广泛测试的技术将有机会扩大使用石蜡包块进行分析。
DNA在一个完整的细胞外经历裂解和降解,首先形成小片段,最后形成自由基。环境DNA常以降解片段的形式出现,因此也不适用于典型的三代测序分析。分析这种DNA为环境科学的研究提供了更多机会。
在一些人群研究中,分析感兴趣的染色体区域最有效的方法是首先通过捕获或扩增来丰富样本量,然后进行序列分析以获得细节信息。PCR产物大小可以变化,因此无论项目大小,任何能增强产物适用性的方法,使其适用于后续的高性价比序列分析,都是有用的。三代测序技术正在迅速发展,单次分析成本也在快速改变。作为最具成本效益的测序平台,需要一种方法来提高其利用各种形式DNA的能力,特别是小片段DNA。
发明内容
本发明的目的是针对现有技术存在的不足,提供一种制备长分子测序DNA的方法,本发明将小片段DNA转换为适合三代测序的DNA大小,满足测序底物的要求,以减少所有规模项目的成本负担并缩短处理过程。
本发明的制备长分子测序DNA的方法,改变每个DNA片段的末端,使它们与DNA连接过程相匹配。为每个片段添加特定标签(“条码”),使每个样本都能在分析过程中被辨识。这些条码可以实现不同样品在同一个测序分析运行中的多路复用。同样,混合物中的独立片段也可以通过这些特定条码在测序分析后被识别。
采用能够增强这些修饰DNA片段连接的条件,形成长度适合于三代测序分析的DNA片段。连接后的片段经测序,再通过生物信息学识别条码和软件修剪功能将它们去卷曲后恢复原始片段序列,这些原始片段序列再被定位到染色体特定位置,并采用统计学根据目的来识别结果。
本发明的具体技术方案如下:
本发明的制备长分子测序DNA的方法,包括以下步骤:
1)改变小DNA片段的末端:将小DNA片段的突出末端变为平末端,然后在平末端增加额外的单碱基凸起;
2)添加接头:向步骤1)处理后的小DNA片段中加入设计好的带有与处理后的小DNA片段单碱基凸起配对互补的接头;所述接头为一段寡核苷酸片段,该寡核苷酸片段与其互补寡核苷酸片段配对后形成的双链两端均带有单碱基,该单碱基与步骤1)处理后的小DNA片段的单碱基凸起互补配对;
3)串联小DNA片段:通过添加的接头,首尾连接小DNA片段,将小DNA片段串联成长分子测序DNA。
根据本发明所述的方法,其中优选地,步骤1)给小DNA片段增加额外的单碱基凸起为dA。
根据本发明所述的方法,其中优选地,步骤1)利用T4 DNA聚合酶、TaqDNA聚合酶、多核苷酸激酶、ATP和dNTP的混合物,在水溶液中修改小DNA片段,用dA给DNA加尾;孵育后,加热来终止反应混合物,使小DNA片段3’端留下单碱基A的尾巴。
根据本发明所述的方法,其中作为一种选择,所述接头为2-20个碱基的寡核苷酸片段,自身具有回文结构、发夹结构或茎环结构。进一步可选择的,所述接头的5’端磷酸化作为限制酶位点,和/或,所述接头序列在中心区域用dU进行修饰。
根据本发明所述的方法,其中优选地,步骤3)加入接头后,加入DNA连接酶与连接缓冲液,4~50℃孵育(优选20~37℃孵育),接头连接后酶失活,完成连接接头与小DNA片段串联。
根据本发明所述的方法,其中作为一种选择,所述小DNA片段为细胞内DNA分子在细胞外裂解或降解后的片段。
根据本发明所述的方法,其中优选地,所述小DNA片段碱基长度为130bp-400bp。
根据本发明所述的方法,其中作为一种选择,将制备长分子测序DNA的反应原料直接全部混合,将混合物乳化成水油微滴,将在水油微滴置于微滴PCR设备或微流体芯片内进行反应。
本还提供了一种测序方法,包括上述任一所述的制备长分子测序DNA的方法,将制备的长分子测序DNA进行测序分析。
本申请将原本效率低下的DNA模板转换为可以利用更新的DNA测序技术的形式。更新的DNA测序技术无法有效地对小型模板进行排序,与其他现有方法(如NGS)相比,尝试使用小型模板不会在成本或时间上带来优势。通过将这些小的,通常被降解的DNA片段转换为更长的连接形式,可以在诸如非侵入性检测等领域获得成本优势,并可以通过直接研究DNA修饰来改善癌症分析和诊断的机会。
附图说明
图1为本发明所设计接头的回文结构示意图;
图2为本发明所设计接头的发夹结构示意图;
图3为本发明所设计接头的茎环结构示意图;
图4为本发明所设计接头的5'磷酸化的限制酶位点示意图;
图5为本发明所设计经dU修饰接头的结构示意图;
图6为本发明实施例1制得长分子测序DNA产物凝胶图,其中1为目标产物,2为100bp ladder。
具体实施方式
下面结合实施例对本发明的技术方案进行详细说明。以下采用的试剂和生物材料如未特别说明,均为商业化产品。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。实施例中未作具体说明的分子生物学实验方法,均参照《分子克隆实验指南》(第三版)J.萨姆布鲁克一书中所列的具体方法进行,或者按照试剂盒和产品说明书进行。
本发明的技术方案的具体实施可以如下:
本发明的制备长分子测序DNA的方法,包括以下步骤:
1)改变小DNA片段的末端:将小DNA片段的突出末端变为平末端,然后在平末端增加额外的单碱基凸起;
2)添加接头:向步骤1)处理后的小DNA片段中加入设计好的带有与处理后的小DNA片段单碱基凸起配对互补的接头;所述接头为一段寡核苷酸片段,该寡核苷酸片段与其互补寡核苷酸片段配对后形成的双链两端均带有单碱基,该单碱基与步骤1)处理后的小DNA片段的单碱基凸起互补配对;
3)串联小DNA片段:通过添加的接头,首尾连接小DNA片段,将小DNA片段串联成长分子测序DNA。
根据权利要求1所述的方法,其中优选地,步骤1)给小DNA片段增加额外的单碱基凸起为dA。
进一步地,步骤1)利用T4 DNA聚合酶、TaqDNA聚合酶、多核苷酸激酶、ATP和dNTP的混合物,在水溶液中修改小DNA片段,用dA给DNA加尾;孵育后,加热来终止反应混合物,使小DNA片段3’端留下单碱基A的尾巴。
本发明所述的方法中,降解的DNA可能为平末端,但通常在双链的断面上有数目不等的3'或5'碱基突出。使用酶(+/-核苷酸混合物)将这些突出变为平末端,任何熟练于这门技术的人都能操作。此外,还能高效地形成一个额外的单碱基突起,通常是dA,有助于提高下一阶段的效率。本发明的将DNA的突出变为平末端的方法—可以是使用任何都具有去除和修复未配对DNA末端的活性的聚合酶(如DNA聚合酶、Klenow片段、Taq聚合酶、Vent聚合酶等)进行处理。此外,还可以使用专门只消化单链DNA的单链特异性外切酶。
根据本发明所述的方法,其中,所述接头为2-20个碱基的寡核苷酸片段,自身具有回文结构、发夹结构或茎环结构。进一步优选为4-12个碱基。
具体的,接头可以帮助整个串联过程,如果设计合理甚至可以成为样品标记物的一部分。理想的接头应该设计简单、成本低廉。一个长度为2-20个碱基的回文寡核苷酸(优选地,理想情况下为4-12个碱基)就比较合适用于小片段DNA的串联,并为每个片段(样本)添加一个特异标识符。作为回文结构,接头还会在适当的条件下自我组装,形成双链单位。如果回文寡核苷酸序列的一端有一个额外的碱基(最好是T碱基),那么自组装单元就可能结合到被修改和末端被修饰的DNA片段的突出部分。
例如,设计的回文结构可以为5’gatcatgatct3’(SEQ ID NO.1)(简单的自组装回文接头示例见图1)。这个结构可以自行组装,形成一个包含dT突起的双链接头-只有一个链能连接。变性和纯化会给串联子添加长尾。这个例子将为样品和片段识别提供一个特异的11bp条码。也可以使用更小(或更大)的条码。
或者,接头设计可以是携带T突出的能自我折叠的寡聚体。这些分子会形成一个茎环或发夹结构,可以连接到末端被修改(和加尾)的DNA片段-实质性形成一个单链突起,在适当时机变性后协助完成串联过程。(发夹或茎环接头的例子见图2或图3)。
例如,设计的发夹结构可以为5’gatcatgatct3’(SEQ ID NO.2),在适当的条件下,一个回文可以制备成发夹结构。在饱和的条件下,将这个发夹与DNA片段连接,将产生一个与混合物中其他片段相容的长尾片段,用于连接/串联。
具有回文结构的接头可以形成两种不同结构。而形成发夹的寡核苷酸只有一半的长度参与结构形成,因此该结构的熔点会比两个不同的DNA片段形成双链接头的熔点低。小片断DNA的温度稳定曲线与碱基排布的数量多少有关。例如,一个12个碱基长的接头最多只能形成一个6bp的双链发卡(可能更少,因为它需要通过180度的弯曲来与其配对的一半对齐)。如果两个寡聚核苷酸接头沿着全长排列,那么它们就具有12个配对碱基,需要比发夹更高的温度才能解聚。因此,通过控制接头组装阶段的温度,可以根据需要形成双链接头(较高的温度,用于形成发夹结构,双链接头或连接体涉及的温度将根据设计需要而变化调整,但通常在10℃至70℃的范围内)或发夹(高温后快速冷却到低温,发夹温度是特定发夹序列的函数。作为4-15个基础结构,发夹结构的熔点将高达50℃或60℃。通过将自组装寡核苷酸保持在发夹熔点以上但双链衔接子熔点以下的温度来增强双链衔接子,这个温度通常在10℃至70℃的范围内)。使用发夹或双链连接体作为形成连接体的接头都是可行的。用发夹接头进行连接,只会在片段的末端增加一个单链接头,而双链接头则有可能根据磷酸化的情况在两端各增加单链或双链。
在发夹结构中,由于被修复的片段两端都有一个可识别的A,一个带有T悬垂的接头可以进行配对(T-A),然后成为一个合适的底物,通过酶连接(如DNA连接酶)将片段永久连接。片段的新末端创造了更有效的粘末端片段以形成衔接子(即接头),因为它们比单个A修复末端更长。这种粘末端可以通过单接头的添加、通过限制性切割双链接头或通过添加不对称设计的裸露的粘连悬垂的连接体来实现。
或者作为一种选择,设计的颈环结构可以为5'gatcxxxxxgatct3',其中,x为a、t、g或c,且xxxxx部分为非回文结构。此结构两端的碱基是配对的,因此可以形成一个环形结构。结构上有一个T悬垂,用于连接到A悬垂片段。这可以扩展应用于具有非回文中心序列的接头,该中心序列能够形成特异的条码,从而形成一个茎环状接头。
其中作为一种选择,所述接头的5’端磷酸化作为限制酶位点,和/或,所述接头序列在中心区域用dU进行修饰。
具体的,根据不同串联方法的选择,接头还可以选择包含5'磷酸化的碱基或不被磷酸化的碱基。谨慎选择的接头DNA序列可能包括已知的II型限制酶位点。虽然这些适配体可以是4,5,6个或其他数目的碱基,优选是6个碱基,因为它们在基因组中普遍存在,并且在统计学上每1/4kb就会出现。任何限制步骤都不会根本改变最终片段的大小。
当然,也不一定必须是6个碱基对序列,它们在统计上比5个碱基对和4个碱基对出现的频率低,所以不会过分混淆片段末端的识别。常见的II型限制性酶有特定的识别序列,通常是4,5或6bps的回文序列,但并不总是。(也有酶可以识别更长的序列,如8、10或12bp,但这些是限制性酶的特殊亚类)。接头可以更长,因为许多限制性蛋白酶只需要识别一个最小的片段长度,以便酶结合并切割。
接头序列中可以包含5'磷酸化的限制酶位点,在饱和连接的条件下,这个接头序列能向DNA片段的两端添加一个独特的代码。经过限制酶的切割(之后纯化),片段可以通过两端4个碱基的突起连接或串联。
接头还可能包括三代测序设备可读的非经典碱基(如dU)。这些被修饰过的碱基序列可以帮助串联子连接区的生物信息学识别,从而定位原始基因片段序列。(含有经修饰的DNA残基接头的例子,请参见图5)。回文,发夹或茎环接头可以进一步用dU在中心区域进行修饰-这会在片段接头的内部区域形成独特信号,使片段标记更加明显。
进一步地,本发明涉及的回文结构、发夹结构与颈环结构可以任意的回文、发夹或颈环结构。因为任何回文体都会帮助连接体的自组装。尤其优选具有相应的限制性酶的结构。限制型的结构为片段连接提供了另一种方法。适用于本发明的其他回文、发夹或颈环结构的例子包括:GATC、GAATTC、GGATCC、AAGCTT、TCGA、CAGCTG、GATATC等等。其实很多成百上千个这样的限制性位点都是潜在的可用的,只要切割后产生一个粘性末端即可。
本发明中接头(衔接子)是设计好的序列,需要加在每个片段的两端。具体是通过连接酶的内置接头配对设计,使每个片段两端的接头可以配对,允许连接酶将片段永久连接在一起。为了使接头在测序应用中稳定并正常工作,这种永久连接是必要的。因此,一旦加入连接酶,那么如果是单链连接酶,那么相应的末端就会出现。
根据本发明所述的方法,其中,步骤3)加入接头后,加入DNA连接酶与连接缓冲液,4~50℃孵育(优选20~37℃孵育),接头连接后酶失活,完成连接接头与小DNA片段串联。DNA连接酶往往对温度敏感,可以在相对较低的温度下,在相当短的时间内失活--比会破坏片段的双链DNA更低的温度。当不需要或不想要连接时,失活是用来防止连接的。衔接子设计的改进可能意味着在未来我们可以避免失活步骤。最合适的失活温度取决于所用的特异性连接酶。这只能与任何衔接子的熔点一样高,因为更高的温度会融化DNA并产生单链材料,这对串联或测序是无用的。连接酶可在低至10℃或高至95℃的温度下失活。通常,我们优选失活温度为10℃至70℃。
串联过程可以由原始平末端片段完成,但效率非常低。此外,任何样品或样品中的任何片段都没有特异性的标识。之前在末端修改后的DNA片段和带有T末端的寡核苷酸接头设计上添加的突起碱基有助于将DNA接头添加到DNA片段上。谨慎选择DNA片段与寡核苷酸数量的相对比例会改变DNA连接反应后片段的相对比例,无论这些片段是否没接头,添加了单接头或双接头。
在步骤3)串联中,对于不需要被限制酶消化的串联方法,接头(包括驱动序列)在前一步中以预先确定的数量添加,延长孵育时间。加热使酶失活。
添加接头时如果想有利于双接头添加(接头加在每个DNA片段的两端),根据原来的接头设计,有两个选择。
对于磷酸化接头,加入接头后,修饰后的片段可以被限制酶消化。这些片段拥有了“粘末端”后,通过退火和连接可以形成很大的串联片段。片段浓度和连接时间的控制将影响最终串联子的长度。对于非磷酸化接头,只有1个接头臂被共价连接到DNA片段上。稍微加热就会使另一个未连接的接头臂与DNA片段分离,在串联过程中留下一个长“粘末端”供退火。如果新的单链臂随后被磷酸化,那么引物序列的重新退火和DNA连接将形成更长的串联片段。片段浓度和连接时间的控制将影响最终连接体的长度。还可以考虑使用耐热连接酶进行环状连接。
对于没有限制酶参与的接头延长方法,在接头加热到一定温度后,未连接的片段将被去除,然后进行产物纯化。纯化后的片段与连接酶混合孵育一段时间,然后酶失活。
对于需要限制酶消化的串联方案,在加入接头后,再加入适量的限制酶,混合物孵育特定的时间。酶被灭活,混合物被纯化。加入适量的驱动寡核苷酸,加入连接酶混合物,然后反应在一定时间内完成。失活连接酶。
上述限制性酶的方法是一种替代性的方法,通过在内部切割接头(衔接子),并裸露一些单链区域,来创造兼容的粘性末端悬垂,以连接片段。一旦双链接头被添加到每个片段末端,我们就需要一种方法来裸露末端,以允许片段连接在一起。如果添加了一个单链接头,那么末端已经是单链打开的,并且有粘性,所以能够将片段连接在一起。如果添加了一个双链接头,那么我们需要让末端成为单链,这样它们就成为片段连接的粘性末端。一个简单的打开末端的方法是将限制性酶位点加入到接头的设计中,然后用适当的酶进行切割,露出单链的粘性末端,为片段连接做好准备。
根据本发明所述的方法,其中,所述小DNA片段为细胞内DNA分子在细胞外裂解或降解后的片段。该小DNA片段碱基长度一般为130bp-400bp。
根据本发明所述的方法,其中作为一种选择,还可以将制备长分子测序DNA的反应原料直接全部混合,将混合物乳化成水油微滴,将在水油微滴置于微滴PCR设备或微流体芯片内进行反应。
接头连接的条件首先要利于单接头添加,进一步的DNA连接将形成更长的DNA片段。片段浓度和连接时间的控制将影响最终串联子的长度。
最好的分析片段是我们可以创建的最长的片段。根据DNA片段的浓度,粘性末端的类型,连接酶的浓度将决定最终的时间。它可以从少于1小时到超过24小时不等。在底物和酶充足的情况下,反应时间越长,串联长度越长。通常的连接酶浓度范围是0.1-1U/uL。
一般而言,串联是否均匀进行由片段浓度和连接时间决定。或者,可用于串联反应的片段数量也会影响最终片段的串联水平。为了便于分子的分离,可以在微反应中进行连接/串联步骤。达到这个目的最简单的方法是使用乳化连接。利用水/油乳液将反应混合物分装为微反应体积,并在适于连接的条件下对乳状液进行孵育。反应可以使用商品化的微滴PCR仪,但不能用常规的PCR反应试剂,连接反应试剂需要订制。即,这里不使用PCR试剂。本发明使用微滴反应用于微连接反应。通过将反应混合物封存到小的微反应体积,然后微滴中分散的大量片段将进行最大程度的连接。这不是本发明必要的过程,而是一种可以选择的改进或替代方法。连接试剂是DNA连接酶,可以永久地连接DNA--这些都可以使用常规的试剂和混合物。
根据本发明的方法,串联后的样品按照标准流程进行集中和DNA纯化。
本还提供了一种测序方法,包括上述任一所述的制备长分子测序DNA的方法,将制备的长分子测序DNA进行测序分析。
串联的片段将需要特定的驱动序列与第三代测序兼容。
这些驱动片段可以包括在原来的接头混合物中以一定比率存在,这将有利于在理想数量的片段串联时加个末端,形成理想大小的片段。在片段末端加入一个驱动序列将终止从该末端开始的串联,但允许另一端的串联继续,直到加入另一个驱动序列或反应条件耗尽。对于涉及到限制酶的串联,驱动序列要在串联反应之后添加。这个过程包括末端修改和连接,或者一套与能消化串联子的限制酶兼容的驱动序列。
测序之后,可以根据有或没有包含修改碱基的特异接头序列从较长的序列中去除其余片段。接头序列的出现表示一个片段的开始/结束。片段可以修剪并定位到参考DNA上。继而进行生物信息学分析。三代测序的数据输出允许准确定位片段的起始点和终止点以及确定片段的原始长度。这些细节有助于生物信息学衍生结果的解释。
驱动序列是使任何片段与测序过程兼容的因素。驱动序列必须在片段或连接体的至少一端,才能使其进行测序。所有的片段连接产物,无论它们是如何连接的,都需要一个驱动序列,使它们与测序过程兼容。所述驱动序列允许通过孔获取并启动测序-它们是设备特异性的。所述驱动序列是本领域公知的,测序设备自带的序列。
实施例1
1.DNA片段的制备
DNA来源可以包括血浆中的细胞游离DNA、尿液中的DNA、废培养基中的细胞游离DNA、天然样品如水中的DNA、感染部位的DNA。作为本发明的优选部分,样品制备的设计是为了避免使用PCR,因为PCR将破坏对诊断某些疾病状态很重要的天然DNA修饰。用于链接的DNA理论上可以是10bp-10Mb的任何大小的DNA片段。在本实施例中使用的小DNA来源是来自于λDNA的平均长度199bp的单倍扩增DNA片段。
A.纯化
i.在许多情况下,DNA不需要从其源液中进一步纯化,但在某些情况下可能需要浓缩。这可以用现有的DNA纯化系统(基于珠子或柱子)来完成,如Qiaquick、Cytiva、Promega和Sigma。这些纯化系统中的任何一个导致更浓缩的纯化DNA制备的系统都可以被认为是合适的。在一个优选的方法中,如果需要去除小的污染物,使用Sephadex G50的asimple脱盐过程也可能是合适的。
2.片段末端修复和加入'A'。
反应混合物可以由下列试剂组成
Figure BDA0002780057960000121
Figure BDA0002780057960000131
a)体积可能会根据初始样品量和最终所需体积而变化。
b)20℃孵育30分钟
修复后的DNA可以使用第1节DNA片段的制备中概述的任何方法进行纯化。
3.末端修复和加入‘a’
反应的混合物包括:
Figure BDA0002780057960000132
a)体积会根据模板的情况有所不同
b)37℃孵育30minutes
c)适当方法纯化
4.加入Linker
反应混合物包括:
Figure BDA0002780057960000133
在室温下孵育15分钟或根据需要孵育。
DNA可以由第1小节的任何合适方法进行纯化,或者连接酶用50℃,10分钟失活。
5.链接
A.单链linkers
i.将样品加热到与设计的单链linker退火相适应的温度--根据linker序列的GC含量,温度可从室温到30~50℃不等。
反应混合物包括:
Figure BDA0002780057960000141
20~50℃孵育30分钟到过夜。
B.限制性linkers
i.样本首先由适当的限制性酶消化(根据linker设计)
Figure BDA0002780057960000142
根据特定的限制性酶,选择孵育温度,孵育30分钟;
按照第1节的方法纯化DNA;
样品加热到与linker退火设计相适应的温度--从室温到30-50℃不等。
ii.反应体系包括:
Figure BDA0002780057960000143
在合适温度孵育30分钟到过夜
C.粘末端linkers
Figure BDA0002780057960000144
Figure BDA0002780057960000151
在合适温度孵育30分钟到过夜。
本实施例制得的长分子测序DNA产物如图6所示。
在本发明方法的优选变化中,为了提高效率,可通过如上制备混合液并形成油/反应混合乳液,以微体积(微滴)的方式进行连接。然后,延长连接孵化时间,以提高衔接子的效率,并允许反应进行到完成。孵化条件与标准连接条件一样。在适当的连接时间间隔结束时,可以用溶剂打碎乳液,收集水相进行测序准备。

Claims (10)

1.一种制备长分子测序DNA的方法,包括以下步骤:
1)改变小DNA片段的末端:将小DNA片段的突出末端变为平末端,然后在平末端增加额外的单碱基凸起;
2)添加接头:向步骤1)处理后的小DNA片段中加入设计好的带有与处理后的小DNA片段单碱基凸起配对互补的接头;所述接头为一段寡核苷酸片段,该寡核苷酸片段与其互补寡核苷酸片段配对后形成的双链两端均带有单碱基,该单碱基与步骤1)处理后的小DNA片段的单碱基凸起互补配对;
3)串联小DNA片段:通过添加的接头,首尾连接小DNA片段,将小DNA片段串联成长分子测序DNA。
2.根据权利要求1所述的方法,其特征在于,步骤1)给小DNA片段增加额外的单碱基凸起为dA。
3.根据权利要求1所述的方法,其特征在于,步骤1)利用T4 DNA聚合酶、TaqDNA聚合酶、多核苷酸激酶、ATP和dNTP的混合物,在水溶液中修改小DNA片段,用dA给DNA加尾;孵育后,加热来终止反应混合物,使小DNA片段3’端留下单碱基A的尾巴。
4.根据权利要求1所述的方法,其特征在于,所述接头为2-20个碱基的寡核苷酸片段,自身具有回文结构、发夹结构或茎环结构。
5.根据权利要求4所述的方法,其特征在于,所述接头的5’端磷酸化作为限制酶位点,和/或,所述接头序列在中心区域用dU进行修饰。
6.根据权利要求1所述的方法,其特征在于,步骤3)加入接头后,加入DNA连接酶与连接缓冲液,4~50℃孵育,接头连接后酶失活,完成连接接头与小DNA片段串联。
7.根据权利要求1-6任一所述的方法,其特征在于,所述小DNA片段为细胞内DNA分子在细胞外裂解或降解后的片段。
8.根据权利要求7所述的方法,其特征在于,所述小DNA片段碱基长度为130bp-400bp。
9.根据权利要求1-8任一所述的方法,其特征在于,将制备长分子测序DNA的反应原料直接全部混合,将混合物乳化成水油微滴,将在水油微滴置于微滴PCR设备或微流体芯片内进行反应。
10.一种测序方法,包括权利要求1-9任一所述的方法,将制备的长分子测序DNA进行测序分析。
CN202011278917.XA 2020-11-16 2020-11-16 一种制备长分子测序dna的方法 Pending CN114507708A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011278917.XA CN114507708A (zh) 2020-11-16 2020-11-16 一种制备长分子测序dna的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011278917.XA CN114507708A (zh) 2020-11-16 2020-11-16 一种制备长分子测序dna的方法

Publications (1)

Publication Number Publication Date
CN114507708A true CN114507708A (zh) 2022-05-17

Family

ID=81546344

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011278917.XA Pending CN114507708A (zh) 2020-11-16 2020-11-16 一种制备长分子测序dna的方法

Country Status (1)

Country Link
CN (1) CN114507708A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120238738A1 (en) * 2010-07-19 2012-09-20 New England Biolabs, Inc. Oligonucleotide Adapters: Compositions and Methods of Use
CN103305498A (zh) * 2012-03-06 2013-09-18 中国科学院上海生命科学研究院 在双链dna片段末端产生预定粘性末端的方法
CN107849607A (zh) * 2015-08-12 2018-03-27 香港中文大学 血浆dna的单分子测序
CN110036117A (zh) * 2016-12-16 2019-07-19 豪夫迈·罗氏有限公司 通过多联短dna片段增加单分子测序的处理量的方法
CN111712580A (zh) * 2017-11-21 2020-09-25 4贝思生物有限公司 用于扩增双链dna的方法和试剂盒
CN111868257A (zh) * 2018-03-02 2020-10-30 豪夫迈·罗氏有限公司 用于单分子测序的双链dna模板的生成

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120238738A1 (en) * 2010-07-19 2012-09-20 New England Biolabs, Inc. Oligonucleotide Adapters: Compositions and Methods of Use
CN103305498A (zh) * 2012-03-06 2013-09-18 中国科学院上海生命科学研究院 在双链dna片段末端产生预定粘性末端的方法
CN107849607A (zh) * 2015-08-12 2018-03-27 香港中文大学 血浆dna的单分子测序
CN110036117A (zh) * 2016-12-16 2019-07-19 豪夫迈·罗氏有限公司 通过多联短dna片段增加单分子测序的处理量的方法
CN111712580A (zh) * 2017-11-21 2020-09-25 4贝思生物有限公司 用于扩增双链dna的方法和试剂盒
CN111868257A (zh) * 2018-03-02 2020-10-30 豪夫迈·罗氏有限公司 用于单分子测序的双链dna模板的生成

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ILLUMINA PROPRIETARY: "Paired-End Sample Preparation Guide", ILLUMINA PROPRIETARY, 10 February 2010 (2010-02-10), pages 1 - 32 *

Similar Documents

Publication Publication Date Title
CN110036117B (zh) 通过多联短dna片段增加单分子测序的处理量的方法
US20240052403A1 (en) Linked ligation
US10801059B2 (en) Droplet-based linked-fragment sequencing
JP6542771B2 (ja) 核酸プローブ及びゲノム断片検出方法
CN110129415B (zh) 一种ngs建库分子接头及其制备方法和用途
US20240043921A1 (en) Methods of sequencing with linked fragments
WO2004065628A1 (en) Quantitative multiplex detection of nucleic acids
CA2945358A1 (en) Systems and methods for clonal replication and amplification of nucleic acid molecules for genomic and therapeutic applications
JP2002518060A (ja) ヌクレオチド検出法
US12098419B2 (en) Linked target capture and ligation
CN114096678A (zh) 多种核酸共标记支持物及其制作方法与应用
US20210147834A1 (en) Method for Identifying Gene Fusions by Circle cDNA Amplification
CN108300764B (zh) 一种建库方法及snp分型方法
CA2298140A1 (en) Detection and confirmation of nucleic acid sequences by use of oligonucleotides comprising a subsequence hybridizing exactly to a known terminal sequence and a subsequence hybridizing to an unidentified sequence
US10655162B1 (en) Identification of biomolecular interactions
CN114507708A (zh) 一种制备长分子测序dna的方法
EP4172357B1 (en) Methods and compositions for analyzing nucleic acid
TWI828636B (zh) 使用次世代定序儀之dna甲基化分析方法及特定dna片段群之濃縮方法
CN109207571B (zh) 一种检测核酸内切酶酶切位点的方法
CN106222164B (zh) 利用转座子酶进行体外核酸单向扩增的方法、组合物和试剂盒
US20240247309A1 (en) Linked target capture
US20240352518A1 (en) Methods for simultaneous mutation detection and methylation analysis
WO2024158848A1 (en) Methods and compositions for comprehensive genomic profiling
WO2024084440A1 (en) Nucleic acid enrichment and detection
CN117821567A (zh) 一种用于检测单细胞与目标基因座相互作用的dna片段的文库构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination