CN109844134A - 闭合线性dna的生产 - Google Patents

闭合线性dna的生产 Download PDF

Info

Publication number
CN109844134A
CN109844134A CN201780063788.2A CN201780063788A CN109844134A CN 109844134 A CN109844134 A CN 109844134A CN 201780063788 A CN201780063788 A CN 201780063788A CN 109844134 A CN109844134 A CN 109844134A
Authority
CN
China
Prior art keywords
dna
sequence
protokaryon
ala
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780063788.2A
Other languages
English (en)
Other versions
CN109844134B (zh
Inventor
T·艾迪
尼尔·波特
保罗·罗斯韦尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tower Wright Ip Ltd
Original Assignee
Tower Wright Ip Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB1613994.1A external-priority patent/GB201613994D0/en
Priority claimed from GBGB1621954.5A external-priority patent/GB201621954D0/en
Application filed by Tower Wright Ip Ltd filed Critical Tower Wright Ip Ltd
Priority to CN202310457342.5A priority Critical patent/CN116732145A/zh
Publication of CN109844134A publication Critical patent/CN109844134A/zh
Application granted granted Critical
Publication of CN109844134B publication Critical patent/CN109844134B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/113Telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/151Modifications characterised by repeat or repeated sequences, e.g. VNTR, microsatellite, concatemer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/30Oligonucleotides characterised by their secondary structure
    • C12Q2525/301Hairpin oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/30Oligonucleotides characterised by their secondary structure
    • C12Q2525/307Circular oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/119Strand displacement amplification [SDA]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/125Rolling circle

Abstract

本发明涉及用于生产闭合线性脱氧核糖核酸(DNA)的改良方法,尤其是用于在无细胞下酶促生产闭合线性DNA分子,优选使用闭合线性DNA作为DNA合成的模板。本发明还涉及新型的闭合线性DNA物质,其适合作为模板用在生产闭合线性DNA的改良方法中。另外,本发明还涉及所述方法的中间产物,原因是这能够使由模板生产的闭合线性DNA的数量大于现有技术已知的方法。

Description

闭合线性DNA的生产
技术领域
本发明涉及用于生产闭合线性脱氧核糖核酸(DNA)的改进方法,特别是用于无细胞的酶促生产闭合线性DNA分子,优选使用闭合线性DNA作为DNA合成模板。本发明还涉及新型的闭合线性DNA物质,适于作为模板用在生产闭合线性DNA的改进方法中。此外,本发明还涉及所述方法的中间产物,原因是这能够使由模板生产的闭合线性DNA的数量大于现有技术已知的方法。
背景技术
申请人以前曾在WO201/086626和WO2012/017210中描述过闭合线性DNA的无细胞生产;这些文件在此以引用方式并入。这些申请中描述的方法涉及使用DNA模板生产在每一端共价闭合的线性双链DNA(闭合线性DNA),其中DNA模板包括至少一个原核端粒酶(protelomerase)识别序列,并且其中模板使用至少一个DNA聚合酶进行扩增且使用一个原核端粒酶进行加工,以产生闭合的线性DNA。闭合线性DNA的闭合端各包括原核端粒酶识别序列的一部分。在列出的申请中包括使用闭合线性DNA作为模板,并且使用这种模板是有利的,因为这意味着在生产过程中浪费的试剂数量最少。通过使用这些方法,闭式线性DNA的小规模实验生产与闭合线性DNA模板配合得很好。然而,产量低于预期,且不足以制备商业上可行的闭合线性DNA量。
在上述方法中使用闭合线性DNA模板时,闭合线性DNA分子可被视为单链环形分子,如图5所示。通常情况下,本文所述的闭合线性DNA在序列上基本上是完全互补的,尽管结构可能会容忍一些微小的变异或"摇摆"。因此,闭合线性DNA在序列上可能至少为95%互补,或至少为96、97、98、99或100%互补。变性时,它实际上是一个圆形分子,包含彼此相邻的正向链(正义链或正链)和反向链(反义链或负链)两条链。这与质粒DNA形成对比,在后者之中互补序列(正链和负链)位于不同的圆形链上(图5中A与B相比)。
闭合线性DNA的独特结构意味着它比质粒更容易复性,因此用DNA聚合酶进行DNA扩增的寡核苷酸启动可能会带来更多的挑战。在使用的单引物结合到发夹内包含原核端粒酶识别序列的回文序列的情况下,尤其如此。闭合的线性DNA模板可以使用链置换聚合酶进行扩增,所述聚合酶启动产生包含DNA单链的串联体(concatamer),每个串联体包含DNA模板的多个重复单元,每个重复单元在序列上与闭合线性DNA模板的原始序列互补。然而,由于每个模板都包括正、负链,因此产生的串联体单链DNA包括作为"重复单元"的交替负链和正链序列。这可以与质粒的扩增进行比较,在质粒中,从环形模板(任一条链)产生的单链包括相反方向上同一序列的多个重复(即正义链复制为包含反义链的多个重复单元的串联体)。因此,作为质粒DNA模板和闭合线性DNA模板的链置换复制的结果而产生的串联体产物存在明显的结构差异。正是闭合线性DNA扩增产物的这些结构差异可能导致了闭合线性DNA的产生效率低。
由于最初由闭合线性DNA扩增而产生的串联体是DNA的单链,因此理论上它们可作为模板用于进一步引物结合和进一步复制。此步骤生成具有两个不同互补链的串联体,然后每条链均可能被置换以复制更多的新链。因此,"双链的"串联体包含DNA的两个不同的互补链。理论上,由于所使用的链置换聚合酶的性质,大量的扩增可能会从少量的初始模板产生。双链DNA串联体是重要的,因为这最终是在制备闭合线性DNA过程中使用的原核端粒酶的底物,如WO2010/086626和WO2012/017210等先前申请中所述。
然而,发明人已经确定,当闭合线性DNA被用作模板时,部分或大部分"产物"是作为DNA纳米花形成的,尽管舔加了原核端粒酶来切割双链串联体中的完整原核端粒酶识别序列并形成闭合线性DNA。这显示在图6中。包含交替的"正链"和"负链"的单链DNA实际上是自身互补的,因此很容易在内部折叠到被称为DNA纳米花的致密结构中。这些本质上是串联体DNA的长单链,其自身杂交,并且不再可用于利用原核端粒酶的启动或加工,因为链紧密地堆积在一起。这远远不是理想情况。闭合线性DNA生产的标准方法所需的是使用初始单链串联体DNA作为模板生产线性双链串联体,并且这种双链中间体可由原核端粒酶加工而成闭合线性DNA分子(图5中的步骤k)。完整的原核端粒酶识别序列由DNA的两条互补链以双链形式形成。
在闭合的线性DNA模板上作用的链置换聚合酶产生的DNA的初始单链的相邻正-负性质导致串联体的广泛内部杂交,以产生DNA纳米花(图6,步骤F)。这种紧凑的折叠DNA结构阻止了高效的寡核苷酸引物结合(图6,步骤G),而这是本领域现有方法所使用的将DNA纳米花转化为原核端粒酶能加工的线性双链串联体所必需的。
因此,需要一个改进的体外方法,以高DNA产量高效地扩增闭合的线性DNA模板,或者可选地以减少在闭合线性DNA的生产过程中产生的难以逾越的DNA纳米花,和/或增加已经形成的DNA纳米花转化为闭合的线性DNA。
发明概述
本发明涉及一种从闭合线性DNA模板体外无细胞生产闭合线性DNA的方法。与当前的方法相比,所述方法可以增强闭合线性DNA的生产。这显著提高了生产率,同时降低了生产闭合线性DNA的成本,特别是在更大的规模生产时。
因此,提供了一种无细胞生产闭合线性DNA分子的方法,所述方法包括:
(a)在至少一种引物存在下,使模板与链置换聚合酶在促进所述模板扩增的条件下接触,所述模板包含在每一端通过原核端粒酶识别序列的一部分共价闭合的线性双链DNA分子,并且包含至少一个茎环基序,所述引物能够特异性结合在所述茎环基序内部的引物结合位点;
(b)在促进闭合线性DNA生产的条件下,使(a)中产生的DNA与至少一种原核端粒酶接触。
任选地,该模板可以包含进一步的原核端粒酶识别序列,此外还可以包含位于闭合线性DNA模板的闭合端或帽上的原核端粒酶识别序列的那些部分。如果模板包含一个或多个额外的或进一步的原核端粒酶识别序列,则可将额外的原核端粒酶识别序列置于模板双链段的任何位置。优选地,这些额外的或进一步的原核端粒酶识别序列不同于至少一个茎环基序,并且与之分开。通过至少一个茎环基序,可以将额外的原核端粒酶识别序列与闭合线性DNA的一个或两个闭合端分开。
任选地,每个原核端粒酶识别序列或其部分可以是相同的序列或不同的序列,每个序列独立于另一个序列。不同的原核端粒酶将对不同的识别序列产生作用,并且因此生产闭合线性DNA需要适当的原核端粒酶。
根据第二个方面,本发明涉及一种在各端被原核端粒酶识别序列的部分共价闭合的线性双链DNA分子,其中所述线性双链DNA分子的序列包含至少一个茎环基序。
根据第三个方面,本发明涉及一种包含DNA单链的串联体DNA分子,所述单链包含串联共价连接在一起的DNA序列的两个或更多个相同单元,每个单元包含原核端粒酶识别序列的至少一部分和至少一个茎环结构或基序。任选地,串联体是在体外且无细胞的。任选地,该单元包括至少一个进一步的原核端粒酶识别序列。
根据第三个方面,可以提供包含DNA单链的串联体DNA分子,所述单链包含串联共价连接在一起的DNA序列的两个或更多个相同单元,每个单位包含至少一个茎环结构或基序,其任一侧侧接有原核端粒酶识别序列的至少一部分。任选地,所述部分由相同或不同的原核端粒酶识别。
根据第三个方面,茎环结构可以包括前面所描述的茎环基序序列的全部或部分。
进一步根据第三个方面,DNA序列的单元是本文定义的线性双链DNA分子的序列。
所描述的串联体DNA的单链可能形成链内的碱基对,但茎环结构的环除外。因此,串联体DNA的单链可能形成具有开放的单链环的DNA纳米花。因此,本发明延伸到本文所述的、折叠成纳米花的单链串联体。
根据第四个方面,提供了一种试剂盒,任选地适用于实施本发明的任一方面的方法,所述试剂盒包含:
(a)在各端通过原核端粒酶识别序列的一部分共价闭合的线性双链DNA分子,其中所述线性双链DNA分子的序列包含至少一个茎环基序;
(b)原核端粒酶;和任选地;
(c)桥接寡核苷酸。
该试剂盒还可包含DNA聚合酶和任选的引物。此外,该试剂盒还可包含任何一种或多种适当的缓冲液、核苷酸、焦磷酸酶和/或核酸酶。
根据本发明的任一方面,茎环基序是一个序列,其可以包含侧接在中心段的两条序列。茎环基序经设计而在适合二级结构形成的条件下形成茎环结构,例如当序列存在于DNA单链中时,即没有结合的互补但不同的第二链。不同链有它们自己的3'和5'末端。任选地,所述条件是本发明方法中使用的扩增条件,并且下面将进一步介绍实例条件。
根据本发明的任一方面或实施方案,基序的中心段经设计而在侧翼序列聚在一起时作为单链DNA而在环外;或者通过自身互补碱基对形成茎或通过使用桥接寡核苷酸。
根据本发明的任一方面或实施方案,茎环基序或茎环结构可包括引物结合位点。这个引物结合位点在基序或结构的中心段内,并因此在单链段内。任选地,引物结合位点周围有中心段内的1或2个相邻单链序列。
根据本发明的任一方面或实施方案,茎环基序或结构可包括在中心段侧翼的两个侧接序列,其任选地经设计而自身互补或经设计而与桥接寡核苷酸互补。
根据本发明的任一方面或实施方案,茎环基序或结构可以相邻于或接近于原核端粒酶识别序列的一部分,其中所述部分位于线性DNA分子的共价闭合端内。任选地,茎环基序或结构的序列通过多达100个碱基与原核端粒酶识别序列的部分中形成模板分子闭合端的一端分开。在存在额外原核端粒酶目标序列的情况下,这些序列可与茎环基序相邻或与它们分开。
根据本发明的任一方面,DNA模板中可能包含两个或更多个茎环基序,并且因此在如先前定义的串联体中包含两个或更多个茎环结构。每个茎环基序可相邻于或者接近于闭合线性DNA分子的闭合端。
根据本发明的任一方面,模板的双链段内可包含一个或多个额外的原核端粒酶识别序列。所述额外的原核端粒酶识别序列与模板闭合端的序列不同,并且还与一个或多个茎环基序不同。
下文和权利要求书对其他实施方案作了说明。其他优点如下所述。
附图简要说明
本发明将在下面参照示例性实施方案和附图作进一步说明,其中:
图1显示了没有发夹结构的线性形式原核端粒酶TelN的原核端粒酶识别序列的序列。可以看出,原核端粒酶识别序列的第一部分(A)有与原核端粒酶识别序列的第二部分(B)互补的序列。在(在本例中)原核端粒酶识别序列的中心(D)是原核端粒酶对序列进行切割的位置,其位于telO序列(E)的中心。完整的原核端粒酶识别序列(C)由用于酶TelN的TelRL组成。
图2显示了在原核端粒酶TelN在识别序列处催化反应时,图1的序列发生了什么。序列在所示的位点(图1上为D)被切割,并且每个被切割的末端与相对链重新连接,形成两个独立的发夹结构;
图3描述了与图1相同的序列,但表明原核端粒酶识别序列的部分(A和B)可能形成内部发夹,而不是结合到原核端粒酶识别序列的另一部分,尽管是完整的(C);
图4显示了选择的原核端粒酶的完整的天然识别序列,显示了互补DNA的两条链的序列。显示了目标序列:SEQ ID NO:15的序列(大肠杆菌N15TelN原核端粒酶),SEQ ID NO:16的序列(克雷伯菌(Klebsiella)噬菌体Phi k02原核端粒酶),SEQ ID NO:17的序列(耶尔森菌(Yersinia)噬菌体PY54原核端粒酶),SEQ ID NO:1的序列(盐单胞菌(halomonas)噬菌体PhiHAP-1),SEQ ID NO:18的序列(弧菌(Vibrio)噬菌体VP882原核端粒酶),SEQ ID NO:19的序列(伯氏疏螺旋体(Borrelia burgdorferi)原核端粒酶),SEQ ID NO:21的序列(副溶血性弧菌(Vibrio parahaemolyticus)质粒Vp58.5原核端粒酶)的序列,以及SEQ ID NO:20的序列(根癌农杆菌(Agrobacterium tumefaciens)TelA原核端粒酶)。在同源原核端粒酶的最小序列长度要求已知的情况下,通过序列灰度阴影来表示,尽管酶可接受此核心识别序列中序列的某些变化。以粗体和带下划线表示的核苷酸显示回文序列中存在的缺陷。穿过序列的垂直线代表了完美反向序列的中心以及原核端粒酶切割和连接其特定识别序列的位点;
图5显示了利用单个特定的回文引物、闭合线性DNA模板和链置换DNA聚合酶以及TelN原核端粒酶,体外制备闭合线性DNA的理想的具体方法。A.闭合线性DNA模板。R和L表示TelN原核端粒酶识别序列的左、右臂的DNA序列。B.质粒DNA模板。C.启动模板的变性,形成圆形单链DNA。由于质粒DNA模板包含单链DNA的连环体状环,因此可以理解,单链环是无法分离的。这些"连环体"或拓扑学上相互连接的环不是共价连接的,但不能分离,因为它们是相互卷入的且均共价闭合。D.单个特定引物的结合。E-H.利用链置换DNA聚合酶从单链DNA模板的扩增。I-J.长的串联体双链DNA的形成,其包含由原核端粒酶结合序列(RL)分开的扩增模板的单一单元。K.与特异于RL序列的TelN原核端粒酶接触。原核端粒酶在RL位点上切割串联体DNA,并连接互补链以生成线性共价闭合DNA模板的扩增拷贝;
图6显示了与图5相同的方法,只是没有形成长的串联体双链DNA,而是将DNA的串联体单链折叠成DNA纳米花;A.闭合线性DNA模板;B-C.特定引物结合和通过链置换DNA聚合酶由单链DNA模板的扩增以及DNA的长串联体单链的形成,虽然两个引物种类显示在本实施方案中,他们是相同的,但所述方法可以利用两个或更多个不同的引物种类进行。D-E.特定引物结合到DNA的串联体单链以及其复制,导致在原核端粒酶识别序列的部分形成发夹。F-G.由DNA的串联体单链制备的DNA纳米花的形成,引物无法与之结合;
图7显示了与图5和图6相同的一般方法,不同之处是闭合线性DNA模板包含根据本发明的茎环基序。该茎环基序包含引物结合位点,并经过特别设计使得在基序的序列为单链时形成茎环结构;从而形成DNA的串联体单链。这使得纳米花具有"开环"结构,其中有引物结合位点。这使得引物退火并且链置换聚合酶迫使开放,并将纳米花转换为线性双链的串联体DNA,以加工成闭合的线性DNA。A.描述了在模板中引入引物,B.描述了引物的结合和扩增发生,C显示了单链的串联体DNA的生长,D和E显示了DNA的单链串联体的复制,F显示了DNA纳米花的形成,除了茎环基序迫使在纳米花中形成单链区域,使得能够进行进一步引物结合(G)。需要注意的是,所示的实施方案涉及使用两个引物,但这种方法同样可以用一个特定的引物来实施;
图8描述了使用桥接寡核苷酸将茎环基序保持在开环结构中。这是茎环基序的一个替代性排列。桥接寡核苷酸特异性结合到茎环基序的侧翼序列,并挤出中心段成为单链DNA环。在本发明的方法中引入这种结构时,它使茎环基序的中心段单链化,从而将引物结合位点呈现给引物以特异性退火。A.使用桥接寡核苷酸在茎环基序内产生环的过程。B.引物与环结构中的引物结合位点的结合。C.使用桥接寡核苷酸引发茎环基序的环。
图9(A到D)描述了在图示描述的本申请中讨论的各种结构。图9A是闭合的线性DNA分子,分子的末端由原核端粒酶靶点序列的一部分形成。图9B是本申请所述的具有茎环基序的闭合的线性DNA。茎环由于DNA的相对段上存在的序列的互补性而配对。图9C显示了由DNA单链形成的DNA纳米花,该DNA单链在互补序列之间已经形成了链内碱基对。图9D显示了与9C相同的结构,并在序列中添加了一个茎环基序。这导致在DNA纳米花内部形成茎环的配对,从而允许引物退火和在所示方向上启动DNA合成。
图10A显示了实施例1中使用的所引入茎环的线性序列。这还显示了实施例1中使用的引物,并显示了环中的结合位置。图10B是由不同引发策略产生的扩增产物的TelN消化物的0.8%琼脂糖凝胶的照片;
图11描述了实施例1中使用的载体的质粒图。描述了各种组件。
图12描述了闭合线性DNA模板的示例性结构,该结构包括由茎环基序分开的来自两个不同原核端粒酶的识别序列(S1表示由于茎环基序而在一个位置产生的互补茎环配对,且S2表示由于另一个可相同也可不同的茎环基序而在不同位置产生的第二个茎环配对,其中引入了引物结合序列。引物可以经设计结合到所述配对的任一者。线性DNA的闭合端由相同原核端粒酶识别序列的两个部分形成,在本实施例中,是原核端粒酶A。另一对原核端粒酶B识别序列存在于双链段内部,作为能够被原核端粒酶B切割和连接的完整位点。序列1、2、3和4应理解为可以是相同原核端粒酶或不同原核端粒酶的混合物的原核端粒酶识别序列。
图13显示了一个示例的茎环基序15-0-15-10的结构,引发位点保持于开放构型。命名方案是茎的长度(ST)(15)、第一个间隔的长度(SP)(0)、引发位点的长度(P)(15)、第二个间隔的长度(SP)(10)。引物可以结合到上链。标记为"反向"的环是相对链上的相同序列,引物结合到下链。该方案可以针对所描述的任何元件使用任何适当的序列长度。
图14描述了使用图12的模板时本发明一个方面的方法。图的中心分子显示了图12所示模板的滚环扩增所产生的双链串联体产物段。在这种情况下,从图12中描述的模板滚离的单链已通过合成互补链而转化为双链串联体,这是由于使用了茎环基序而促成的。这个图描述了茎环基序作为支持开放单链段的互补茎序列,该单链段可用于引物结合和通过链置换DNA聚合酶的进一步扩增。在这种情况下,原核端粒酶识别序列1和2都是用于原核端粒酶A的序列,而原核端粒酶识别序列3和4都是用于原核端粒酶B的序列。原核端粒酶识别序列A和B都能被各自的原核端粒酶切割和连接。原核端粒酶A()的切割(上图)产生与模板相同的闭合线性DNA,如图12所示。原核端粒酶B()的切割和连接(下图)产生由原核端粒酶B识别序列加帽的闭合线性DNA,并且不含原核端粒酶A识别序列和茎环基序。此外,还产生了非常短的废物闭合线性DNA(Zl),其也由原核端粒酶B识别序列加帽并引入了茎环基序和单个原核端粒酶A识别序列。因此,技术人员可以通过改变加入到方法中的原核端粒酶来选择产生何种产物。S1表示由于茎环基序而在一个位置产生的互补的茎环配对,且S2表示由于另一个可相同或不同的茎环基序而在不同位置产生的第二茎环配对。
图15显示了通过对图12所示的闭合线性DNA模板进行滚环扩增而产生的一段单链串联体产物。此图显示了如果单链串联体在互补DNA链的合成过程中不立即转化成双链,则他们如何能够在内部折叠而形成纳米花。通过用原核端粒酶B处理,以这种方式由闭合线性DNA模板形成的具有额外原核端粒酶识别序列的DNA纳米花能够被直接转化为包含靶点序列的闭合线性DNA。这种闭合线性DNA产物不包含任何茎环序列或原核端粒酶A识别序列(序列1和2)。应该注意的是,该图中没有描述第二茎环结构,因为这些被认为不会在巢式端形成,因为发明人认为相邻的互补序列在分离一个序列之前杂交。一小部分的末端可允许形成茎环,但所描述的结构更有可能且在能量学上是有利的。该图显示了一个使用唯一引物的实施方案。如果使用替代引物(即用于不同的茎环),则可形成替代的副产物(本实施方案中的Z2)。
图16描绘了显示由单链串联体形成的纳米花的成功切割和双链串联体的切割的凝胶。泳道“B”是用TelN切割的滚环复制的产物,显示了双链串联体(图14上约~300bp和zl)和纳米花(图15上~150bp和Z2)以及闭合线性DNA产物(~1600bp)的切割的废产物。泳道“A”显示利用VP8.5对相同反应物的切割,显示了孔中的全长模板产物(~1900bp)和更多未切割的DNA。泳道BX和AX显示了利用外切酶孵育的结果。
图17显示了实施例2中使用的质粒的图(proTLx-K B5X4A4 eGFP15-0-15-10),其中描述了关键组分。TelRL和VP58.5分别代表了原核端粒酶TelN和VP58.5的识别序列。描述为15-0-15-10-15且位于telRL和VP58.5之间的序列代表了包含开放引物结合位点的茎环基序(参见图13)。
发明详述
本发明涉及用于从闭合线性DNA模板合成或扩增闭合线性DNA的改进的无细胞方法,。
闭合线性DNA模板
用于本发明方法的DNA模板具有某些相关的特征,下文将对此作进一步说明。闭合线性DNA,即线性双链共价闭合DNA分子,通常包括具有共价闭合的末端(即发夹末端)的线性双链DNA部分。发夹连接线性双DNA链的末端,这样,如果分子完全变性,将产生单链的环状DNA分子。
出于本发明的目的,共价闭合端或发夹包含内部互补的序列,因为它们包含了原核端粒酶识别序列的一部分或一段。在发夹的顶点(末端或转角)内的碱基可能无法形成碱基对,归因于在该点上给予DNA链上的构象压力。图3显示,在原核端粒酶识别序列的部分的顶端,至少有2个碱基对被认为可能不形成碱基对,但具体构象尚不清楚,可能会根据DNA所被维持的条件以及发夹周围的确切序列而波动。因此,2个或更多的碱基尽管是互补的却由于所涉及的结构扭曲而可能无法形成配对。图2显示了由原核端粒酶TelN对TelRL位点的作用而产生的发夹。在发夹长度范围内的非互补碱基的一些"摇摆(wobble)"不会影响结构。摇摆可能是回文的断裂,但序列可能仍然是互补的。然而,优选发夹的序列是完全自我互补的。如果在回文中有"摇摆",则在其适当的原核端粒酶识别序列发挥作用的每个原核端粒酶将在闭合的线性DNA的末尾产生两个不同的发夹。图2说明了这一点,生成了"R"和"L"发夹。
互补性描述了序列中(5'到3')每个多核苷酸的碱基是如何与反平行(3'到5')链上的互补碱基形成氢键配对的A与T(或U)和C与G,所述反向平行链可以是相同的链(内部互补序列)或在不同的链上。本定义适用于本发明的任何方面或实施方案。优选发夹中的序列为90%互补,优选为91%、92%、93%、94%、95%、96%、98%、99%或100%互补。
因此,DNA模板包括在每端都用原核端粒酶识别序列的一部分封闭的线性双链DNA。每一端都可以由针对相同或不同原核端粒酶的原核端粒酶识别序列形成。这些部分可以被命名为第一和第二原核端粒酶识别序列,并且这些形成了闭合线性DNA模板的末端。
除了在闭合端的那些(第一和第二原核端粒酶识别序列)外,DNA模板还可以包括进一步的原核端粒酶识别序列。这些进一步的原核端粒酶识别序列位于闭合线性DNA的双链段。在双链段内可以存在一个、两个或更多个原核端粒酶识别序列。这些序列可以被命名为第三、第四、第五、第六或"第n"个原核端粒酶识别序列。每一个都可能是针对相同或不同酶的原核端粒酶识别序列。优选额外的或进一步的原核端粒酶识别序列不同于用于给闭合线性DNA模板末端加帽的那些(第一和第二原核端粒酶识别序列,其独立地相同或不同-图12中两者显示为相同且标记为"a")。
额外的原核端粒酶识别序列可以位于闭合线性DNA模板的双链DNA区段的任意点。额外的原核端粒酶识别序列与茎环基序不同,它们不是同一个实体,因为原核端粒酶识别序列不能折叠形成本文定义的茎环。如果存在额外的原核端粒酶识别序列,则优选它们通过茎环基序与模板的闭合端分离。在本实施方案中,优选存在两个额外的原核端粒酶识别序列,它们是相同的或不同的,并且它们通过茎环基序与模板DNA的闭合端分离。
因此,示例性模板包括线性双链DNA分子,其通过第一和第二原核端粒酶识别序列的一部分而在每一端共价闭合;并包括至少两个茎环基序和至少第三和第四原核端粒酶识别序列,其中所述茎环基序的第一者是在第一和第三原核端粒酶识别序列之间,并且所述茎环基序的第二者是在第四和第二原核端粒酶识别序列之间。换句话说,每个茎环基序都位于闭合线性DNA的加帽端和额外的原核端粒酶识别序列之间。如图12所示。
原核端粒酶识别序列是任意DNA序列,其在DNA序列中的存在可以使其被原核端粒酶的酶促活性转化为闭合线性DNA。换句话说,原核端粒酶对双链DNA的裂解和再连接是原核端粒酶识别序列形成共价闭合线性DNA所需要的。通常情况下,原核端粒酶识别序列包含回文序列,即具有双重旋转对称性的双链DNA序列,也在本文中描述为反向重复。反向重复的长度根据产生原核端粒酶的特定生物而不同。回文或反向重复可能是完全的或不完全的。完整的原核端粒酶识别序列优选包括长度至少为14个碱基对的双链回文(反向重复)序列。
更详细地说,完整的原核端粒酶识别序列是由其同源原核端粒酶识别和切割的,并可以显示为第一DNA序列和互补的第二DNA序列的双链,其中第一DNA序列包含原核端粒酶识别序列的正向(或有义)部分,第二DNA序列包含所述原核端粒酶识别序列的反向(或反义)部分。一旦识别序列被切割,留下的是原核端粒酶识别序列的一段或一部分。所述段或部分优选是整个序列的单链,当与它的互补序列配对时,其形成双链形式的完整识别序列。因此,该段可以是原核端粒酶识别序列的正向(或有义)部分或反向(或反义)部分。
原核端粒酶识别序列的第一或第二部分的长度由同源原核端粒酶识别的最小序列确定,以便结合、切割和重新连接游离端。图4描述了几个完整的原核端粒酶识别序列,并且每条链代表同源原核端粒酶的识别序列的部分。同源原核端粒酶的原核端粒酶识别序列的部分的长度可能相同或接近相同,因为它们能够退火形成双链体。原核端粒酶识别序列的每个部分的长度可以是20到100个碱基,更特别是30到100个碱基的长度。
如图1所示,尽管归因于这些部分的序列的互补性而使原核端粒酶识别序列(C)的两个部分(A和B)形成了双链体,但由于原核端粒酶识别序列的回文性质,每个部分都会由于识别序列的所述部分内的内部自身互补序列而具有折叠成发夹的能力。如图3所示。
根据本发明的闭合线性DNA模板包括线性双链DNA中的茎环基序的序列。正如本文所使用的,茎环基序是一个允许在适当的条件下形成茎环结构的序列。茎环基序的序列可以包括侧翼具有两个额外序列的中央部分。
茎环基序的序列可以包括形成茎环的环结构的中心段。因此,这个中心段(环)被设计成单链,且不与基序内的任何其他碱基互补。这个中央段的长度可以是任何适当数量的碱基,但优选中央段(以及由此的环)是5至50个碱基,特别是5至40个碱基,更特别是5至30个碱基,甚至更特别是10至25个碱基长度。中央段以及由此的环可以是5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个残基(碱基)的长度。
优选地,基序或环的中心段包括引物结合位点的序列。引物结合位点是核苷酸序列的区域,在该区域中引物结合或退火以开始复制。引物归因于其序列互补性而特异性退火到引物结合位点。引物结合位点的设计可以使引物退火,所述引物与引物结合位点的一部分或一段互补,参见例如图10A。或者,引物结合位点和引物的长度可以相同。引物设计以及由此的引物结合位点的序列将在下面进一步详细讨论。引物结合位点的长度至少为5个残基,但长度可为5至50个残基(碱基)。理想情况下,引物结合位点的长度为5至30或5至20个残基,任选地为5至16个残基的长度。引物结合位点的长度可至少为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个残基。优选引物结合位点形成中心段的一部分或一段,并与至少一个序列相接,该序列将引物结合位点与侧翼序列分开。相接的序列可以存在于引物结合位点的3'或5'侧,或者可以存在于引物结合位点的两侧。相接的序列可以是任何合适的长度,且每个相接的序列都是独立的----即,如果存在的话,则引物结合位点的两侧的相接序列的存在、长度或性质可以不同。每个相接序列的长度可达50个残基,优选达40个残基,可达30个残基或达20个残基,最优选为15个残基。因此,相接序列的长度可以至少为1、2、3、4、5、6、7、8、9、10、11、12、131、14、15、16、17、18、19或20个残基(碱基)。
图13描述了具有15-0-15-10格式且引发位点处于开放构型的示例性茎环结构。命名方案是茎的长度(15)、第一间隔的长度(0)、引发位点的长度(15)、第二间隔的长度(10)。可以理解,可以使用不同于所描述的长度的元件来遵循这种格式。
在一个实施例中,归因于DNA单链内的分子内碱基配对,可能会出现茎环结构。在这种情况下,当同一条链的两个区域(通常在相对方向读取时核苷酸序列互补)碱基配对从而形成在未配对环中结束的双链段,就会出现茎环。或者,在第二个实施方案中,茎环基序可以包括由寡核苷酸桥接分子发挥作用的序列,其迫使DNA的一段形成单链环。
茎环基序的序列可包括位于中心非互补环部分两侧的两个互补区域。互补性如之前定义。因此,例如,茎环基序的序列读为(5'到3'):5'侧翼序列、中心段、3'侧翼序列。当3'侧翼序列被读为3'到5'时,5'和3'侧翼序列是互补的。这使得侧翼序列能够彼此碱基配对,并形成一个双链,其中中心段以环的方式出现作为它们之间的单链。在本实施方案中,侧翼序列的长度相同或非常相似。侧翼序列的长度优选为至少5个残基(碱基),或长度至少为6、7、8、9或10个残基。侧翼序列的长度可达10、15、20、25、30、35、40、45或50个残基。如果侧翼序列被设计为自身互补,则应理解,双链部分的稳定性取决于其长度、其包含的错配数(少量是可容忍的)以及配对区域的碱基组成。鸟嘌呤和胞嘧啶之间的配对有三个氢键,与只有两个氢键的腺嘌呤-胸腺嘧啶配对相比更稳定。本领域技术人员理解,如何设计茎环基序的序列从而使所形成的结构稳定。可以使用整合DNA技术低聚分析仪(The Integrated DNATechnologies Oligoanalyzer),来确定茎环结构的适用性。3.1版可获自https://www.idtDNA.com/calc/analyzer。
在另一个实施方案中,中心段两侧的序列设计为至少部分与桥接寡核苷酸互补。互补性如之前定义。在本实施方案中,侧翼序列被设计成在一起作为结合到桥接寡核苷酸的本质上连续的序列,迫使中心段在侧翼序列之间环出。因此,在本实施方案中,侧翼序列被设计成与桥接寡核苷酸在序列上互补。侧翼序列的长度优选为至少5个残基(碱基),或长度至少为6、7、8、9或10个碱基。侧翼序列的长度可达10、15、20、25、30、35、40、45或50个残基。因此,茎环基序的序列能够在适当的条件下,在该序列中和/或其互补序列中形成茎环。这样的条件可以包括在DNA单链中存在茎环基序的序列,例如在模板复制过程中产生的单链。可形成茎环的替代条件是由pH、温度和离子环境的变化介导的变性/复性条件。优选地,茎环形成的条件是用于扩增DNA模板的条件,从而茎环结构在其通过DNA聚合酶引入到合成的DNA单链后立即形成或不久后形成。
本领域技术人员理解,当在模板中出现时,茎环基序的序列将同时出现在正向(有义)和反向(反义)链上(作为镜像图像/互补序列)。在闭合线性DNA模板中,正向和反向链由DNA的一个圆形链形成。
当在本发明的方法中复制模板时,复制有义序列而提供反义序列,复制反义序列而提供有义序列。因此,在模板和复制的DNA中,均总是存在茎环基序序列的有义版本和反义版本。复制的DNA是单链串联体,它将在同一DNA链上包含有义和反义序列。
有义序列和反义序列都可能能够形成茎环结构。在闭合线性DNA模板中,这可能会产生配对的茎环结构,如图9B所示,每一对都位于闭合线性DNA的双链部分的相对侧。在复制的DNA中,单链串联体、配对茎环结构也可如图9D所示形成。这些配对的茎环用于在归因于正在复制的DNA序列的性质而形成的DNA纳米花内维持开放的引发位点。
引物可以设计成结合到"引物结合位点"的有义或反义版本。本发明的方法至少需要一个引物。任选地,引物结合位点的序列在茎环基序的有义版本/序列内处于正确的格式(方向)。因此,一种选择是引物退火至来自茎环基序的序列的有义版本上的引物结合位点。显然,系统可以反向设计,并且引物可以设计成能够结合到茎环基序序列的反义版本上的引物结合位点。由于两者均存在于模板和复制的DNA两者中,因此这两个序列都可用于退火。因此,当本发明的方法是用唯一的引物种类进行时,可以设计引物为退火到引物结合位点的有义或反义版本。如果本发明的方法是用两个或更多个引物来执行的,则每个引物都可以单独设计为结合到茎环基序序列的有义或反义版本。
茎环基序序列包括形成单链环的序列。如此,应该注意的是,茎环基序不是原核端粒酶识别序列的一部分,因为它不包括环的序列。因此,茎环基序不同于所述原核端粒酶识别序列或其一部分,并且因此不同于闭合线性DNA的闭合端或加帽端。
闭合线性DNA可包含一个或多个包含茎环基序的序列,因此可包含2、3、4、5、6、7、8、9或10个此类基序。所包含的茎环基序可在闭合线性DNA部分的任何适当位置。任选地,所包含的茎环基序序列相邻于原核端粒酶识别序列的部分,该部分形成共价闭合的末端。在这种情形下“相邻”可以是在原核端粒酶识别序列的部分的末端的1-100残基以内,任选在原核端粒酶识别序列部分的末端的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个残基以内。或者,两个实体可以彼此接近,即距离最多25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或最多100个碱基(可从原核端粒酶识别序列部分的末尾到茎环基序的开头测量,反之亦然)。
闭合线性DNA模板还可以包括双链序列中的任何序列,无论是自然来源的还是人工的。它可以包括至少一个加工酶靶点序列,如一、二、三、四或更多的加工酶靶点。这样的靶点序列可使DNA在合成后任选地被进一步加工。加工酶是识别其靶点并加工DNA的酶。加工酶靶点序列可以是限制性酶的靶序列。限制性酶,即限制性内切核酸酶,与目标序列结合,并在特定位点上切割。加工酶靶点序列可以是重组酶的靶点。重组酶定向催化对每个重组酶特异性的短(30-40核苷酸)靶点序列之间的DNA交换反应。重组酶的例子包括Cre重组酶(以loxP为靶点序列)和FLP重组酶(具有短翻转酶识别靶(FRT)位点)。加工酶靶点序列可以是位点特异性整合酶的靶点,如phiC31整合酶。
加工酶靶点序列可以是RNA聚合酶的靶点序列,因此DNA成为多肽合成的模板。在这种情况下,加工酶靶点是启动子,优选真核启动子。
除了模板封闭的两端存在的序列外,闭合线性DNA模板还可以包括一个或多个进一步的原核端粒酶识别序列。这些序列可以是任何原核端粒酶识别序列,但优选不同于模板闭合线性端中使用的第一和第二原核端粒酶识别序列。它们也可以是相同或彼此不同的。优选存在至少两个额外的原核端粒酶识别序列,并成对包括在闭合线性DNA的双链段中。这对原核端粒酶识别序列(第三和第四序列)可以位于闭合线性DNA模板中期望序列的侧翼。优选这个期望的序列不包括本文定义的茎环基序。所期望的序列可以包括表达盒或任何其他感兴趣的序列。所期望的序列可以是通过使用本发明方法生产的闭合线性DNA的序列。在这种情况下,第三和第四原核端粒酶识别序列对于形成闭合线性DNA的闭合端是必要的,具有形成双链段的所期望的序列。第三和第四序列的位置可以相邻于茎环基序或在其附近。在一个实施方案中,茎环基序将原核端粒酶识别序列与最近的闭合端分离。在另一个实施方案中,有一对额外的原核端粒酶识别序列,并且每个序列都通过茎环基序与闭合端分离。
闭合线性DNA模板可以包括表达盒,所述表达盒包括与编码感兴趣蛋白的序列有效连接的真核启动子和任选的真核转录终止序列,由以上组成,或基本由以上组成。"启动子"是启动和调节多核苷酸转录的核苷酸序列。"有效连接"是指元件的排列,其中这样描述的组件被安排为执行其通常的功能。因此,有效连接到核酸序列的给定启动子在适当的酶存在时能够影响该序列的表达。术语"有效连接"旨在包括启动子元件和感兴趣的DNA序列的任何允许在转录复合体识别启动子元件时启动感兴趣DNA序列转录的间距或朝向。
DNA模板可以是任何合适的长度。特别地,DNA模板可达100kb,或可达50kb(千碱基),或可达40kb,或可达30kb。优选地,DNA模板可以是100b(碱基)到100kb,200b到40kb,更优选200b到30kb,最优选1kb到15kb。
本发明方法中使用的闭合线性DNA模板是独特的。因此,根据第三方面,本发明涉及在每个末端由原核端粒酶识别序列的部分共价闭合的双链DNA分子,其中所述线性双链DNA分子的序列至少包括一个茎环基序。所有这些元件都已在上面定义。在适当的条件下,茎环基序导致闭合线性DNA的双链段内存在一对茎环结构,如图9B中所图示的分子。闭合线性DNA模板可能包括额外的原核端粒酶识别序列,如前面所定义。
上述定义的DNA模板可通过本领域已知的任何方法以足以在本发明方法中使用的数量提供。例如,模板可以由PCR、模板延伸或任何制备DNA的合成方法生成。
扩增和加工
根据本发明,提供了一种从闭合线性DNA模板生产闭合线性DNA的方法。所述模板可以如本文先前所述定义。
根据第一个方面,本发明涉及一种用于生产闭合线性DNA分子的体外无细胞方法,包括:
(a)在至少一种引物存在下,使模板与链置换聚合酶在促进所述模板扩增的条件下接触,所述模板包含在每一端通过第一和第二原核端粒酶识别序列的部分共价闭合的线性双链DNA分子,并且还包含至少一个茎环基序,所述引物能够特异性结合在所述茎环基序内部的序列;
(b)在促进闭合线性DNA生产的条件下,使(a)中生产的DNA与至少一种原核端粒酶接触。
除了第一和第二序列外,DNA模板可以任选地包括进一步的原核端粒酶识别序列。优选地,这些额外的原核端粒酶识别序列与至少一个茎环基序不同且分开。额外的原核端粒酶识别序列可以通过至少一个茎环基序与闭合线性DNA的一个或两个闭合端分开。这些可以被标记为第三、第四等原核端粒酶识别序列。
任选地,每个原核端粒酶识别序列或其部分可以是相同的序列或不同的序列,彼此相互独立。不同的原核端粒酶将作用于不同的识别序列,并且因此生产闭合线性DNA需要合适的原核端粒酶。
DNA模板与至少一个链置换聚合酶接触。可以使用一、二、三、四或五种不同的链置换聚合酶。链置换式聚合酶可以是任何合适的聚合酶,从而合成DNA聚合物。
聚合酶可以非常稳定,从而在工艺条件下,长时间孵育而不会显著降低其活性。因此,酶优选在包括但不限于温度和pH在内的一系列工艺条件下具有长的半衰期。还优选聚合酶具有一个或多个适合制造工艺的特性。
聚合酶优选具有高保真度,例如通过具有校读活性。此外,优选聚合酶显示对dNTP和DNA的高可加工性、高链置换活性和低Km。优选聚合酶不显示与其校读活性无关的DNA外切酶活性。
技术人员可以通过与商业上可获得的聚合酶所显示的特性比较来确定某一给定聚合酶是否显示出上文定义的特性,所述商业上可获得的聚合酶例如phi29(New EnglandBiolabs,Inc.,Ipswich,MA,US),Deep (New England Biolabs,Inc.)和嗜热脂肪芽胞杆菌(Bacillus stearothermophilus)(Bst)DNA聚合酶I(New England Biolabs,Inc.)。在提到高加工性时,这通常表示与模板的每个结合/分离中聚合酶所添加的核苷酸的平均数量,即从单个结合事件获得的引物延伸的长度。
优选的链置换型聚合酶为phi29、Deep Vent和Bst DNA聚合酶I或任何其变体。"链置换"描述了聚合酶在合成过程中遇到双链DNA区域时置换互补链的能力。因此,通过置换互补链和合成新的互补链,该模板被扩增。因此,在链置换复制过程中,新复制的链将被移位,以为聚合酶复制进一步的互补链让道。当引物或单链模板的3'游离端退火到模板上的互补序列时,扩增反应就会启动(两者都是引发事件)。当DNA合成继续进行,并且如果它遇到进一步的引物或退火至模板的其他链,聚合酶置换其并继续其链伸长。链置换产生DNA的新合成的单链,其可作为一个模板,用于更多的引发事件。新合成的DNA的引发导致了超分枝以及产物的高产率。应该理解的是,链置换扩增方法不同于基于PCR的方法之处在于,变性循环对于有效DNA扩增并不重要,因为双链DNA并不妨碍新DNA链的持续合成。链置换扩增可能只需要一个初始轮的加热、使初始模板变性(如果是双链)、使引物退火至引物结合位点(如果使用)。据此,扩增可以被描述为等温的,因为不需要进一步加热或冷却。相比之下,PCR方法需要在扩增过程中进行变性循环(即将温度提高到94摄氏度或以上)以熔解双链DNA并提供新的单链模板。在链置换过程中,聚合酶将取代已经合成的DNA的链。此外,它将使用新合成的DNA作为模板,确保DNA的快速扩增。
本发明方法中使用的链置换聚合酶优选具有至少20kb的加工性,更优选为至少30kb、至少50kb或至少70kb或更大。在一个实施方案中,链置换DNA聚合酶具有与phi29DNA聚合酶相当或大于phi29DNA聚合酶的加工性。
在本发明的方法中发生链置换复制。在链置换复制过程中,模板通过置换已经复制的链(其已由聚合酶的作用合成)来扩增模板,接着置换另一条链,而所述另一条链可以是双链模板的原始互补链,或新合成的互补链,后者是在较早的退火至模板的引物上由聚合酶作用合成的。因此,模板的扩增可以通过另一链的链置换复制来置换所复制的链而发生。这个过程可以描述为链置换扩增或链置换复制。
优选的链置换复制方法是滚环扩增/复制(RCA)。术语RCA描述了RCA型聚合酶在延长杂交引物的同时能够围绕圆形DNA模板链不断发展的能力。闭合线性DNA模板可以变性以形成单链圆形DNA。从此种环的扩增导致形成线性产物,该线性产物是DNA的单链且具有串联连接的扩增DNA的多个重复。从这些链进行进一步复制可直接导致超支化(hyperbranching)。DNA模板的序列(单个单元)在线性产物内多次重复。这些多重复单元中的每一个都是相同的,并且是串联的。从闭合线性DNA链置换扩增的初始产物是DNA的串联体单链,其极性被认为与闭合线性DNA模板的原始极性相反。然而,由于每个闭合线性模板同时并排包含正链和负链,通过扩增产生的DNA的串联体单链在每个单个单元中包括交替的负链和正链序列。所产生的DNA的这些线性单链可以作为多个杂交、引物延伸和链置换事件的基础,导致形成串联体双链DNA产物(2个单独的互补链),其也包括由聚合酶扩增的单个单元(模板)的多个重复。因此,在串联体双链DNA产物中,都有每个扩增的"单个单元"DNA的多个拷贝。RCA聚合酶特别优选用于本发明的方法中。RCA型链置换复制方法的产物可能需要加工以释放单个单元DNA。如果需要DNA的单个单元,则这是期望的。
为了进行扩增,DNA模板也与一个或多个引物接触。引物特异于DNA模板中包含的一个或多个序列,特别是位于茎环基序的中央段(或环)中的引物结合位点。因此,引物是特异的,这表示它们具有与引物结合位点互补的序列。互补性如之前定义。归因于闭合线性DNA模板的互补性质,本发明的方法中可以使用单个特异引物。这意味着每个模板都包含茎环基序的正向(有义)和反向(反义)序列,确保所产生的DNA产物也将有茎环基序的反向(反义)和正向(有义)版本。如前所述,正确的方向可以是茎环基序序列的有义或反义版本。
引物可以是未加标签的,或可能包含一个或多个标签,例如放射性核素或荧光染料。引物还可包括化学修饰,通常使引物具有改良的耐水解性。例如,引物可优选包括一个或多个硫代磷酸酯连接。引物可以是任何合适的寡核苷酸,包括DNA引物、核糖核酸(RNA)引物或锁核酸(LNA)引物,或其任何合适的杂合物。通常可以根据温度考虑事项(即能够在扩增步骤中使用的温度下结合至模板)而选择引物长度/序列。同样,引物结合位点的设计也考虑到了这些事项。
此外,引物可以使用引发酶原位合成。在这个版本中,可以提供引发酶,从而在茎环基序的开放中央段构建引物。因此,也可以间接地向模板和聚合酶提供引物。
DNA模板与聚合酶以及一个或多个引物的接触可发生在促进引物退火至DNA模板的条件下。这些条件包括允许引物杂交的单链DNA的存在。这些条件还包括允许引物退火至模板的温度和缓冲液。根据引物的性质,可以选择适当的退火/杂交条件。本发明中使用的优选退火条件的实例包括缓冲液、30mm Tris-HCl pH 7.5、20mm KCl、8mm MgCl2。退火可以在使用加热变性后通过逐渐冷却到所需的反应温度进行。替代的变性事件包括使用特定浓度的离子。
通常,本发明的引物只与闭合线性DNA模板中的引物结合位点结合或特异性结合。引物长度可以变化,例如12、15、18、20或30个碱基不同。引物的长度可为6至30、12至30、18至30或25至30个碱基。
引物设计和制备的常规方法可用于生产能够与任何所包含的引物结合位点特异性结合的引物。通常可以根据温度考虑事项(例如能够在扩增步骤中使用的温度下结合至模板)来选择引物的长度/序列。
任选地,本发明的引物在其变性而与互补序列分离后有效地结合至DNA模板。标准扩增方法中的变性通常涉及高温"熔融"步骤。因此,引物可以通过其熔融温度(或Tm)来定义,Tm是双链核苷酸分离成单链的温度。但是,可以使用其他变性方法,这些方法在下文中讨论。
一旦引物退火或结合至引物结合位点,就可以开始DNA模板的扩增。在通过另一条链的链置换复制对所复制的链进行置换而促进所述模板扩增的条件下,而对退火至模板的引物进行孵育。这些条件包括使用任何允许扩增DNA的温度,通常在20至90摄氏度之间。优选的温度范围可在约20至约40摄氏度,或约25至约35摄氏度。
通常,根据特定聚合酶具有最佳活性的温度选择适当的温度。这些信息通常是可以获得的,这是技术人员公知常识的一部分。例如,在使用phi29DNA聚合酶时,合适的温度范围为约25至约35摄氏度,优选约30摄氏度。技术人员能够常规地确定用于根据本发明方法的有效扩增的合适温度。例如,所述方法可以在温度范围内进行,并且可以监测扩增的DNA的产率,以确定给定聚合酶的最佳温度范围。扩增可以在恒温下进行,并且优选所述方法是等温的。由于优选链置换扩增,因此无需改变温度来分离DNA链。因此,所述方法可以是一个等温过程。
通常,为了合成DNA,聚合酶需要核苷酸的供应。核苷酸是核酸的单体或单个单元,并且核苷酸由含氮碱基、五碳糖(核糖或脱氧核糖)和至少一个磷酸基团组成。任何合适的核苷酸都可以使用。含氮碱基可以是腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。含氮碱基也可以是修饰的碱基,如5-甲基胞嘧啶(m5C)、假尿嘧啶(Ψ)、二氢尿吡啶(D)、肌苷(I)和7-甲基鸟苷(m7G)。
优选五碳糖是脱氧核糖,从而核苷酸是脱氧核苷酸。核苷酸可以是脱氧核苷三磷酸的形式,表示为dNTP。这是本发明的优选实施方案。合适的dNTP可包括dATP(三磷酸脱氧腺苷)、dGTP(三磷酸脱氧鸟苷)、dTTP(三磷酸脱氧胸苷)、dUTP(三磷酸脱氧尿嘧啶)、dCTP(三磷酸脱氧腺苷)、dITP(三磷酸脱氧肌苷)、dXTP(三磷酸脱氧黄嘌呤)及其衍生物和修饰版本。优选dNTP包括一个或多个dATP、dGTP、dTTP或dCTP,或其修饰版本或衍生物。优选使用dATP、dGTP、dTTP和dCTP或其修饰版本的混合物。
促进闭合线性DNA模板扩增的其他条件包括存在金属离子、适当的缓冲剂/pH值和酶性能或稳定性所需的其他因素。合适的条件包括用于提供本领域已知的聚合酶活性的任何条件。
例如,反应混合物的pH可以在3至12之间,优选5至9或约7,例如约7.9。通过使用一个或多种缓冲剂,pH可以保持在此范围内。这些缓冲剂包括但不限于MES、Bis-Tris、ADA、ACES、PIPES、MOBS、MOPS、MOPSO、Bis-Tris丙烷、BES、TES、HEPES、DIPSO、TAPSO、Trizma、HEPPSO、POPSO、TEA、EPPS、Tricine、Gly-Gly、n,n-二(羟乙基)甘氨酸、HEPBS、TAPS、AMPD、TABS、AMPSO、CHES、CAPSO、AMP、CAPS、CABS、磷酸盐、柠檬酸-磷酸氢钠、柠檬酸-柠檬酸钠、乙酸钠-乙酸、咪唑和碳酸钠-碳酸氢钠。
虽然热的应用(暴露在95℃几分钟)被用来变性双链DNA,但也可以使用更适合DNA合成的其他方法。通过暴露在高或低pH环境中,或在阳离子不存在或存在非常低的浓度时,如在去离子水中,双链DNA可以容易地变性。聚合酶需要将短的寡核苷酸引物序列结合到DNA模板的单链区域,以启动其复制。这种相互作用的稳定性以及因此的DNA扩增效率可能特别受到金属阳离子浓度的影响,特别是二价阳离子,如Mg2+离子,这可能被视为所述方法的一个组成部分。
扩增条件也可以包括金属离子。反应混合物还可包括金属的盐,例如但不限于二价金属离子的盐:镁(Mg2+)、锰(Mn2+)、钙(Ca2+)、铍(Be+)、锌(Zn2+)和钽(Sr2+),或单价金属离子的盐,包括但不限于锂(Li+)、钠(Na+)或钾(K+)。盐可包括氯化物、乙酸盐和硫酸盐。其他可能包括的盐是铵盐,特别是硫酸铵。
去污剂也可以包括在扩增条件中。合适去污剂的例子包括Triton X-100、Tween20及其任何一种的衍生物。稳定剂也可包括在反应混合物中。任何合适的稳定剂都可以使用,特别是牛血清白蛋白(BSA)和其他稳定蛋白。通过添加松弛DNA并使模板变性更容易的试剂,也可以改善反应条件。这类试剂包括,例如,二甲基亚砜(DMSO)、甲酰胺、甘油和甜菜碱。DNA凝聚剂也可包括在反应混合物中。这类制剂包括,例如,聚乙二醇或阳离子脂质或阳离子聚合物。
应该理解的是,技术人员能够根据自己的公知常识,使用这些额外的组件和条件,来修饰和优化本发明方法的扩增和孵育条件。同样,特定试剂的具体浓度也可以根据本领域以前的例子来选择,并在公知常识的基础上进一步优化。例如,可以优化反应混合物中存在的聚合酶量。这可能包括在DNA合成过程中进一步添加聚合酶到反应混合物中。作为进一步的例子,DNA模板的数量可以优化。这可能包括在DNA合成过程中进一步添加DNA模板到反应混合物中。
例如,在本领域基于滚环扩增的方法中使用的合适反应缓冲液是50mMTris HCl,pH 7.5、10mM MgCl2、20mM(NH4)2SO4、5%甘油、0.2mM BSA、1mM dNTP。本发明RCA扩增中使用的优选反应缓冲液是30mM Tris-HCl pH7.4、30mM KCl、7.5mM MgCl2、10mM(NH4)2SO4、4mMDTT、2mM dNTP。该缓冲液特别适合与phi29RCA聚合酶一起使用。
扩增条件还可以包括使用一种或多种额外的蛋白质。DNA模板可在至少一种焦磷酸酶存在的情况下进行扩增,如酵母无机焦磷酸酶。可以使用二、三、四、五或更多不同的焦磷酸酶。这些酶能够在链复制过程中降解由聚合酶自dNTP产生的焦磷酸酯。焦磷酸酯在反应中的积累会导致DNA聚合酶的抑制,降低DNA扩增的速度和效率。焦磷酸酶可以将焦磷酸酯分解为非抑制性磷酸酯。本发明方法中使用的焦磷酸酶的一个合适例子是酿酒酵母(Saccharomyces cerevisiae)焦磷酸酶,可从New England Biolabs,Inc.商业上获得。
任何单链结合蛋白(SSBP)都可以在本发明的方法中使用,以稳定单链DNA。SSBP是活细胞的重要组成部分,参与涉及ssDNA的所有过程,如DNA复制、修复和重组。在这些过程中,SSBP与短暂形成的ssDNA结合,并且可能有助于稳定ssDNA结构。在本发明方法中使用的合适SSBP的实例是T4基因32蛋白,可从New England Biolabs Inc.商业上获得。
在作用于与模板结合的引物时,聚合酶发挥作用以产生多个重复且相同的串联连接的所述DNA模板的单元,或被描述为DNA的串联体单链。该串联体包含模板的串联连接的多个相同重复。链可延至100kb。这种串联体是单链的,但可以理解,串联体可以通过链内碱基配对而很好地形成二级结构,从而形成双链序列的部分。考虑到优选模板(闭合线性DNA)包括并排的互补序列,可能会形成链内碱基对。同一条链内的这些互补序列可能相互退火,形成序列的双链。但是,茎环基序阻止了环或中心段的内部碱基配对。正是在用于本文定义的扩增的条件下,优选茎环基序的序列形成二级结构,允许将中心段作为单链DNA环出,防止该序列与内部互补序列碱基配对。这种具有茎环结构的串联体允许模板的进一步复制,因为它允许一个或多个引物退火至扩增的初始产物,并使DNA的互补链能够被合成。串联体DNA的单链仍可以形成DNA纳米花,但在环中保留单链序列。因此,这些环提供了合适的结构或位点,在该结构或位点中放置引物结合位点,允许DNA聚合酶使用串联体DNA的单链作为模板。本发明方法的核心是,产生包含两个不同的互补DNA链的串联体,因为这是闭合线性DNA产生之前的最后中间产物。
具有茎环结构的串联体单链DNA形成了本发明的第三个方面。因此,本发明还提供了串联体单链DNA,其包含串联的共价连接在一起的DNA序列的两个或更多个相同单元,每个单元至少包含一个原核端粒酶识别序列的部分和至少一个茎环结构。
本文所描述的串联体单链DNA可以包括多个重复单元,每个单元都是本文定义的线性双链DNA的序列。因此,每个单元均可以包含两个原核端粒酶识别序列的部分(可以是相同的或不同的序列)和至少一个茎环基序,以形成茎环结构。如果模板中存在额外的原核端粒酶识别序列,则这些序列也将存在于每个单元中的串联单链DNA中,如模板中所示。优选单链串联体将包括茎环基序,其任一侧测接有原核端粒酶识别序列的部分。应该理解,每个原核端粒酶识别序列均作为部分而存在,因为串联体是单链的。在一个实施方案中,茎环基序侧接有不同的原核端粒酶识别序列的部分。可以理解,这些侧翼序列确实可以用任何适当长度的间隔序列来分隔。
如先前定义的,优选形成的茎环结构在闭合线性DNA模板的茎环基序内。任选地,茎环结构可以通过互补的侧翼序列退火形成茎结构而形成。然后,中央段在茎的两端之间作为单链DNA环出。优选茎环结构包括引物结合位点,任选的在中央段内。环结构是至关重要的,因为它保持序列的一部分处于单链形式,并防止引物结合位点与串联体DNA单链内的其互补序列形成链内碱基配对。因此,环或中央段内的引物结合位点对引物结合保持打开和自由。
茎环结构作为含有茎环基序的闭合线性DNA模板的扩增结果而占据主导地位,因为它是在其反向互补序列合成之前形成的。这可以通过仔细选择茎中残基的序列来增强,以确保存在强大的碱基配对。该领域的技术人员都知道确保在单链DNA中存在特定二级结构的技术。此类序列的设计如前面对模板本身所讨论的那样。
DNA串联体单链(该链是由聚合酶作用于模板而产生的)中单链环的存在允许一个或多个引物退火至引物结合位点,并允许生成与初始链互补的DNA链,从而产生具有两个不同的互补链的DNA串联体(双链的串联体DNA)。然后,每一条链都可以用作进一步的模板,或者双链的串联体DNA可以用作一个或多个原核端粒酶的底物。
优选在促进DNA串联体单链内形成茎环结构的条件下进行扩增步骤。这样的条件可以简单的是针对扩增优化的那些,因为这些倾向于有利于维持单链结构。在此类情况下,归因于碱基配对,形成了衍生自包含互补侧翼区域的茎环基序的茎环结构。或者,这些条件可以包括添加一种或多种促进在单链DNA串联体内形成环结构的试剂。这包括添加桥接寡核苷酸。这些寡核苷酸是短的(长度为1至100,优选为1至90、1至80、1至70、1至60、1至50、1至40、1至30、1至20或1至10个碱基)寡核苷酸,其序列与茎环基序的序列内的侧翼区域互补。理想情况下,桥接寡核苷酸由两部分形成,第一部分与第一侧翼序列互补,第二部分与第二侧翼序列互补。任选地,这两部分之间没有间隙,但在备选实施方案中,它们由1-50个残基分开,或者可选地由1至40、1至30、1至20、1至10或1至5个残基分开。因此,桥接寡核苷酸可以使茎环基序的两个侧翼序列在一起或接近于在一起,迫使中心段环出而形成单链环。互补性如之前所定义。
桥接寡核苷酸可以是任何合适的核酸。优选桥接寡寡核苷酸不能通过DNA聚合酶进行延伸,例如,它包括防止延伸的修饰碱基。任选地,桥接寡核苷酸包括一种核酸类型,这种核酸比DNA本身更强烈地退火至DNA,例如锁核酸(LNA)或RNA。
本领域技术人员能够利用残基之间的互补性来设计适当的核苷酸和寡核苷酸用于本发明。因此,设计各种引物结合位点和引物对,使用此设计茎环基序或茎环结构的序列,是常规的。进一步的桥接寡寡核苷酸和侧翼序列可以进行适当的设计。该领域的技术人员将知道常规教科书,如Molecular Biology of the Gene,第7版,沃森等,2014年,在此通过引用并入。
除了扩增步骤外,本发明的闭合线性DNA扩增方法还包括用于产生闭合线性DNA的加工步骤。在促进闭合线性DNA产生的条件下,所扩增的DNA与至少一种原核端粒酶接触。这种基于原核端粒酶的简单加工步骤优于用于生产闭合线性DNA分子的其他方法。扩增和加工步骤可以同时或并发进行。然而,优选扩增和加工步骤按顺序进行,在扩增步骤之后进行加工步骤(即在所扩增的DNA上)。
原核端粒酶是任何能够切割和重新连接包含原核端粒酶识别序列的模板以产生共价闭合线性DNA分子的多肽。因此,原核端粒酶具有DNA切割和连接功能。具有原核端粒酶类型活性的酶也被描述为端粒解离酶(例如在伯氏疏螺旋体菌(Borrelia burgdorferi)中)。原核端粒酶的典型底物是环形双链DNA。如果该DNA包含完整的原核端粒酶识别序列,则所述酶可以在该序列切割DNA,并将末端连接在一起,形成线性双链共价闭合的DNA分子。上文讨论了对原核端粒酶识别序列的要求。如上文所述,给定多肽由包含原核端粒酶识别序列的模板催化产生线性闭合DNA的能力可以利用本领域所述的任何合适的检测方法来确定。
闭合线性DNA的产生可能需要使用至少一种原核端粒酶。本发明的方法可包括使用多于一种原核端粒酶,如两种不同的原核端粒酶,闭合线性DNA分子的每一端各一种。如果在DNA模板中使用额外的原核端粒酶识别序列,则需要更多的原核端粒酶进行加工,并且技术人员可以根据所需的结果做出适当的选择。图14和15描述了该方法和各种潜在产物的变化。加工可以从双链的双链体或折叠成纳米花的单链串联体进行。
合适的原核端粒酶的例子包括来自噬菌体的那些,如来自海水盐单胞菌(Halomonas aquamarina)的phiHAP-1(SEQ ID NO:1和2)、来自小肠结肠炎耶尔森氏菌(Yersinia enterocolytica)的PY54(SEQ ID NO:3和4),来自产酸克雷伯菌(Klebsiellaoxytoca)的phiK02(SEQ ID NO:5和6),来自弧菌属的VP882(SEQ ID NO:7和8)、来自副溶血性弧菌(Vibrio parahaemolyticus)的Vp58.5(SEQ ID NO:13和14)和来自大肠杆菌的N15(SEQ ID NO:9和10),或任意其变种。特别优选使用噬菌体N15原核端粒酶或其变种。该酶也被称为TelN。这些酶在WO2012/017210中进一步描述,其通过引用并入本文。
本发明的方法可以使用闭合线性DNA模板来实施,该模板仅在模板的闭合端包含原核端粒酶识别序列的部分。在这种情况下,需要针对每端的同族原核端粒酶,以将使用本发明方法产生的双链串联体DNA转换为闭合线性DNA产物。在某些情况下,同一原核端粒酶对该任务是足够的,因为每端都是同一原核端粒酶识别序列的部分。
在可选的实施方案中,本发明的方法可以使用闭合线性DNA模板来实施,该模板不仅具有给模板末端加帽的原核端粒酶识别序列的部分(第一和第二序列),而且还具有额外的原核端粒酶识别序列(如第三和第四序列)。如前面所讨论的,优选在DNA模板中包含至少两个额外的原核端粒酶识别序列。优选地,这些是在闭合线性DNA模板中与模板的加帽端用至少一个茎环基序分离。因此,示例的闭合线性DNA模板可具有序列(也可参见图12):
帽1–茎环1–PTS 3–序列–PTS4–茎环2–帽2
其中帽1是第一原核端粒酶序列的部分;
第一和第二茎环基序是相同或不同的;
PTS3和PTS4是相同或不同的第三和第四原核端粒酶识别序列;
帽2是第二原核端粒酶序列的部分;和
序列是包含到闭合线性DNA产物中的目标序列。
原核端粒酶识别序列1和2可以是相同的或不同的,但优选不同于原核端粒酶识别序列3和4。
这些序列可以彼此相邻,彼此接近,或者由插入序列分隔。
由具有额外的原核端粒酶识别序列的闭合线性DNA模板扩增而产生的单链DNA串联体也可形成DNA纳米花。图15中描述了这一点,以及加工这些纳米花的方法。
因此,由具有额外的原核端粒酶识别序列的模板扩增产生的DNA纳米花也将包含这些序列。本发明人已经设计了一种允许从单链DNA串联体直接释放闭合线性DNA产物的方法,所述单链DNA串联体优选形成链内碱基对和双链,并折叠成纳米花。这种方法并不依赖于形成单独的DNA互补链,以在加工前形成DNA双链,并且因此没有必要尝试重新引发折叠的单链DNA。因此,如果在模板中包含额外的原核端粒酶识别序列,这些序列则在折叠的单链串联体中复制,并且存在完整的双链体原核端粒酶识别序列作为原核端粒酶的靶标。在这种情况下,可将扩增的DNA与针对额外原核端粒酶识别序列的同族原核端粒酶接触,并释放闭合线性DNA。这种方法的副产物是小型的闭合线性DNA,在线性DNA部分包含茎环基序(见图15)。
这种从DNA纳米花释放闭合线性DNA的方法很有吸引力,因为它允许对反应结束时留下的任何纳米花进行"清理",以防如引物、聚合酶或核苷酸等反应组分的用尽。它还允许产生闭合线性DNA分子,其仅存在目标序列,茎环基序去除,而这对于某些状况是不期望的。此外,额外的原核端粒酶序列可用于加工双链串联体,如图14所示,这释放相同的产品,但具有不同的副产物。
发明者认为,可执行本发明的方法,从而从双链DNA串联体和单链DNA串联体(两者均已经由闭合线性DNA模板扩增)产生闭合线性DNA,并且因此可根据模板和酶的选择而在实践中实施图14和15的组合。它允许通过改变在扩增的DNA中添加的原核端粒酶从而改变获得的产品,来选择所需的产品。技术人员理解,可以简单地进行选择以添加针对形成模板的帽的第一和第二原核端粒酶识别序列的原核端粒酶(一种或多种),和/或添加针对形成闭合线性DNA的双链体段的部分的额外的(例如第三和第四)原核端粒酶识别序列的原核端粒酶(一种或多种)。
因此,从DNA模板扩增的DNA优选在促进闭合线性DNA产生的条件下,用至少一种原核端粒酶孵育。换句话说,这些条件促进了包含原核端粒酶识别序列的双链体DNA的切割和再连接,从而形成具有发夹端的共价闭合线性DNA。促进闭合线性DNA生产的条件包括使用任何允许生产闭合线性DNA的温度,通常在20至90摄氏度之间。温度优选在25至40摄氏度之间,例如约25至约35摄氏度,或约30摄氏度。根据与DNA聚合酶的温度条件有关的上文所列原则,选择针对特定原核端粒酶的适当温度。适用于具有SEQ ID NO:15的大肠杆菌噬菌体TelN原核端粒酶的适宜温度为约25至约35摄氏度,例如约30摄氏度。促进闭合性线性DNA产生的条件还包括存在双DNA串联体,其中原核端粒酶识别序列的两个部分形成了原核端粒酶可发挥作用的完整位点。
促进闭合线性DNA生产的条件还包括存在原核端粒酶和适当的缓冲剂/pH和酶性能或稳定性所需的其他因素。合适的条件包括用于提供本领域已知的原核端粒酶活性的任何条件。例如,在使用大肠杆菌噬菌体TelN原核端粒酶时,合适的缓冲液可以是20mm TrisHCl,pH7.6;5mM CaCl2;50mM谷氨酸钾;0.1mM EDTA;1mM二硫醇(DTT)。还可以从针对DNA聚合酶列出的那些中选择保持最佳活性和稳定性的试剂和条件。
在一些实施方案中,原核端粒酶的活性条件可以使用与DNA扩增和/或茎环结构形成相同的条件。特别地,当同时或并发进行原核端粒酶对DNA的扩增和加工时,描述了相同条件的使用。在其他实施方案中,如果用于提供最佳DNA聚合酶活性的条件导致亚最佳的原核端粒酶活性,则可能需要改变反应条件。去除特定的制剂和改变反应条件可以通过过滤、透析和本领域已知的其他方法实现。技术人员能够容易地确定允许最佳的DNA聚合酶活性和/或原核端粒酶活性的条件。
在特别优选的实施方案中,为了用于通过链置换聚合酶(优选phi29)扩增DNA,DNA扩增是在与以下基本相同的条件或者基本由以下组成的条件下进行的:35mM Tris-HCl、50mM KC1、14mM MgCl2、10mM(NH4)2S04、4mM DTT、1mM dNTP,温度25至35摄氏度,例如约30摄氏度。然后,优选用TelN进行原核端粒酶的加工步骤,和/或优选是在与以下基本相同的条件或者基本由以下组成的条件下进行的:20mM Tris HCl,pH 7.6;5mM CaCl2;50mM谷氨酸钾;0.1mM EDTA;1mM二硫醇(DTT),温度25至35摄氏度,例如约30摄氏度。
在利用原核端粒酶的作用产生闭合线性DNA后,本发明的闭合线性DNA扩增方法可进一步包括纯化线性共价闭合DNA产物的步骤。类似地,根据本发明的其他方法扩增的DNA也可以被纯化。通常进行上面提到的纯化以去除任何不期望的产物。纯化可以通过本领域已知的任何适当手段进行。例如,扩增DNA或线性共价闭合DNA的加工可包括酚/氯仿核酸纯化或使用选择性结合核酸的色谱柱,例如Qiagen市售的那些。技术人员可以常规确定用于分离扩增DNA的合适的纯化技术。
本发明还涉及适于实施任何方面或实施方案的方法的试剂盒,所述试剂盒包括:
(a)在各端通过原核端粒酶识别序列的部分共价闭合的线性双链DNA分子,其中所述线性双链DNA分子的序列包含至少一个茎环基序;
(b)一种或多种原核端粒酶;和任选地;
(c)桥接寡核苷酸。
所述试剂盒可包含上文所述的闭合线性DNA模板,其包括具有额外的原核端粒酶识别序列的那些。
所述试剂盒还可包括一个或多个以下组分:DNA聚合酶、引物、适当的缓冲液、核苷酸、金属阳离子、焦磷酸酶和/或核酸酶。线性双链DNA分子可以是本文所述的任何此类分子。
本发明的序列:
盐单胞菌(Halomonas)噬菌体PhiHAP-1原核端粒酶核酸序列(SEQ ID NO:l)
盐单胞菌噬菌体PhiHAP-1原核端粒酶氨基酸序列(SEQ ID NO:2)
耶尔森菌(Yersinia)噬菌体PY54原核端粒酶核酸序列(SEQ ID NO:3)
耶尔森菌噬菌体PY54原核端粒酶氨基酸序列(SEQ ID NO:4)
克雷伯菌(Klebsiell)噬菌体phiKO2原核端粒酶核酸序列(SEQ ID NO:5)
克雷伯菌噬菌体phiKO2原核端粒酶氨基酸序列(SEQ ID NO:6)
弧菌噬菌体VP882原核端粒酶核酸序列(SEQ ID NO:7)
弧菌噬菌体VP882原核端粒酶氨基酸序列(SEQ ID NO:8)
大肠杆菌(Escherichia coli)噬菌体N15端粒酶(telN)和次级免疫抑制子(cA)核酸序列(SEQ ID NO:9)
大肠杆菌噬菌体N15端粒酶氨基酸序列(SEQ ID NO:10)
来自农杆菌(Agrobacterium tumefaciens)菌株C58天然基因序列TelA的原核端粒酶TelA(1329bp)(SEQ ID NO:11)
TelA蛋白序列(SEQ ID NO:12)
Gp40VP58.5核苷酸序列(SEQ ID NO:13)
弧菌:gp40蛋白[弧菌噬菌体VP58.5]氨基酸(SEQ ID NO 14)
大肠杆菌噬菌体N15原核端粒酶识别序列(SEQ ID NO 15)
克雷伯菌噬菌体phiK02原核端粒酶识别序列(SEQ ID NO 16)
小肠结肠炎耶尔森氏菌噬菌体PY54原核端粒酶识别序列(SEQ ID NO:17)
弧菌噬菌体VP882原核端粒酶识别序列(SEQ ID NO:18)
伯氏疏螺旋体原核端粒酶识别序列(SEQ ID NO:19)
农杆菌菌株C58原核端粒酶识别序列(SEQ ID NO:20)
GP40VP58.5识别序列:(SEQ ID NO:21)
农杆菌菌株C58原核端粒酶核心识别序列(SEQ ID NO 22):
茎环序列:以每个部分的核苷酸长度的格式:茎,间隔,引物结合位点,间隔,茎(即,对于SEQ ID 25,茎是25个碱基对的长度,没有间隔到形成引物结合位点的15个碱基):
SEQ ID 23:25-0-15-0-25
SEQ ID NO.24:25-5-15-5-25
SEQ ID NO.25:25-10-15-0-25
SEQ ID NO.26:25-0-15-10-25
SEQ ID NO.27:15-0-15-0-15
SEQ ID NO.28:15-5-15-5-15
SEQ ID NO.29:15-10-15-0-15
SEQ ID NO.30:15-0-15-10-15
SEQ ID NO.31:图10a茎环
SEQ ID NO:32:4至11引物图10a
SEQ ID NO:33:3至12引物图10a
SEQ ID NO:34:2至13引物图10a
SEQ ID NO:35:1到14引物图10a
SEQ ID NO:36:0到15引物图10a
SEQ ID NO:37:N0-11/short1引物
现在,本发明将参照几个非限制性实施例来描述:
实施例
材料和方法
QubitTM荧光计—使用荧光染料以检测样品中的单链(SS)/双链(ds)DNA、RNA或蛋白质。以宽范围dsDNA检测模式使用时,它可以准确地定量样品中的dsDNA,而不会受到诸如引物的ssDNA或dNTP的干扰。
聚乙二醇8000(PEG8000)—Thermofisher Scientific,水-Sigma Aldrich,无核酸酶、去离子且无菌的(分子生物学级)dNTP(锂盐)-Bioline,储备浓度100mM,各种引物-Oligofactory,TelN-Enzymatics,Φ29DNA-Enzymatics,Xbal-NEB,ApaLI-NEB,T5核酸外切酶-NEB,核酸外切酶III-Enzymatics,焦磷酸酶-Enzymatics,蛋白酶K-Sigma Aldrich,10xTLG缓冲成分:300mM Tris(pH7.9);300mM KCl;20mM DTT;50mM(NH4)2SO4;75mM MgCl2-Sigma Aldrich。
实施例1
从质粒模板产生茎环闭合线性DNA。下文表1显示了质粒proTLx-KB5X4eGFP 53SL(见图11)扩增的条件。RCA反应设置在室温下,并按所指示的顺序添加试剂。在聚丙烯管中进行反应,并在30℃下孵育过夜。
质粒模板扩增的原始串联体产物与3μM原核端粒酶TelN在30℃孵育10分钟。然后加入750U/ml Xbal(NEB),并将DNA在37℃孵育3小时,然后添加500U/ml的核酸外切酶III(Enzymatics)并在37℃再孵育2小时。然后将反应在500mM NaCl/100mM MgCl2缓冲液中稀释2倍,加入2.5%(w/v)聚乙二醇8000(PEG8000)。这在4,500g离心10分钟,上清液回收。在上清液中加入2.5%的PEG8000(最终浓度5%)和进一步离心步骤后,将产生的上清液丢弃,用5ml 100%乙醇洗涤沉淀物。DNA通过离心重新沉淀,丢弃乙醇,将DNA重悬在水中。将含有茎环的闭合线性DNA(db_eGFP 53SL)储存在-20℃,用于下面描述的实验
茎环闭线性DNA的扩增
实验表明,对于使用结合回文原核端粒酶TelN靶点序列的单引物进行的闭合线性DNA扩增,补充dNTP是不可能增加产量的(见表2)。这是由于随着单链滚离DNA模板,形成了高度折叠的串联体DNA(纳米花)。这种高度折叠的结构使得引发和进一步的dNTP引入更加困难,妨碍了DNA纳米花转化为双链串联体。
为了确定茎环引发是否有利于闭合线性DNA扩增,在具有引入的茎环(db_eGFP53SL)的dbDNA模板和对该区域特异的引物上进行了反应。表3显示了进行茎环dbDNA扩增的条件。
反应设置在室温下,并按指示的顺序添加试剂,然后在30℃孵育过夜。对特异于所引入的茎环的5种不同引物进行了测试(参见图10b),以确定在闭合线性DNA模板中的初始环引发后,是否有可能在串联体茎环中引发(和随后的DNA扩增)。反应在16、40、64小时补充有2.5mM dNTP,并且根据制造商的说明,使用QubitTM荧光定量在15.5、39.5、63.5和87.5小时测定DNA的浓度(dsDNA的值列于表4中)。在第3天,还采集了每个反应的8μl样品进行凝胶分析,并用10μM原核端粒酶TelN进行消化。为了进行凝胶分析,样品加热到75℃ 2分钟,然后使用标准程序在0.8%的琼脂糖凝胶上进行分离。
表3显示了扩增的闭合线性DNA在向反应供给dNTP后dsDNA反应产率。与标准的闭合线性DNA扩增(表2)相比,可以看出,对于所有测试的引物,dsDNA产物的产率随着dNTP的添加而增加。这表明,通过扩增闭合线性DNA模板(db_eGFP 53SL)而产生的串联体产物是可引发的,并被进一步扩增从而产生更多的dsDNA产物。图10B显示dsDNA产物通过TelN原核端粒酶处理转化为闭合线性DNA(db_eGFP 53SL)。这表明,所有引物都是特异的,并能够产生期望的闭合线性DNA终产品(具有包括的茎环基序)。
实施例2
从质粒模板产生具有额外的原核端粒酶识别序列的闭合线性DNA
下文表4显示了质粒proTLx-K B5X4A4eGFP 15-0-15-10(见图17)扩增的条件。RCA反应设置在室温下,并按指示的顺序添加试剂。反应在聚丙烯管中进行,并在30℃孵育过夜。
质粒模板proTLx-K B5X4A4eGFP 15-0-15-10-15扩增的原始串联体产物用4μM原核端粒酶VP58.5在30℃孵育10分钟。然后加入200U/ml的ApaLI(NEB),DNA在37℃孵育3小时,然后添加200U/ml的核酸外切酶III(Enzymatics)和50U/ml T5核酸外切酶(NEB),并在37℃再孵育3小时。加2μl/ml蛋白酶K(Sigma),反应在37℃孵育过夜。然后反应于500mMNaCl/100mM MgCl2缓冲液中稀释2倍,加入2.5%(w/v)聚乙二醇8000(PEG8000)。这在4,500g离心10分钟,上清液回收。在上清液中加入2.5%的PEG8000(最终浓度5%)和进一步离心步骤后,将产生的上清液丢弃,用5ml 100%乙醇洗涤沉淀物。DNA通过离心重新沉淀,乙醇丢弃并将DNA重悬在水中。闭合线性DNA模板存储在-20℃,并用于下面描述的实验
实施例3
包括额外的原核端粒酶识别序列的闭合线性DNA的扩增
从本质上讲,本实施例中使用的闭合线性DNA模板包括图12所示的通用结构。原核端粒酶A识别序列对闭合线性DNA进行加帽,同时不同的原核端粒酶B识别序列在双链段内作为完整位点存在并且能够被同族原核端粒酶切割和连接。两个原核端粒酶识别位点紧密相临,但被茎环基序分离,该基序包含开放的单链区域,该区域用于结合寡核苷酸引物以启动模板的扩增。通过滚环、链置换DNA聚合酶扩增该模板产生两种类型的串联体DNA产物:单链串联体,其由于其内部序列互补性而可以折叠成如图15所示的纳米花,和双链串联体,其中互补DNA链是在从纳米花茎环基序引发和扩增后合成的。这类似于实施例1中描述的标准茎环闭式线性DNA。然而,使用具有额外的原核端粒酶识别序列的闭合线性DNA(图12)相比于标准的茎环闭合线性DNA模板(图9B)有许多优点。通过参考图14和15,使用原核端粒酶B处理将从单链串联体和双链串联体切除闭合线性DNA(用原核端粒酶B识别位点的部分加帽的)。在闭合线性DNA的标准滚环扩增反应中(包括实施例1中描述的茎环变体),可以大量产生的单链串联体通常是废产物。因此,使用具有额外的原核端粒酶识别序列的闭合线性DNA模板可以更有效地生成标准闭合线性DNA,并允许去除茎环基序以及第一和第二原核端粒酶识别序列,这些序列之前形成了模板的闭合端。
在本实施方案中,原核端粒酶A和B可以是任何能够切割和连接DNA的原核端粒酶或其他酶,只要它们是具有不同识别序列的两种不同的酶。在下面描述的实验数据中,原核端粒酶A为VP58.5且原核端粒酶B为TelN。
实验描述:除模板浓度为1mg/l外,按照实施例2进行了扩增。该反应也如上处理,减去ApaLI添加和孵育。反应被一分为二,其中一半用VP58.5处理,另一半用TelN代替。
产物在0.8%琼脂糖凝胶上电泳,以检查其尺寸;图16显示了原核端粒酶切割阶段,其显示TelN(泳道B)和VP58.5(泳道A)裂解和连接的预期产物和副产物,以及核酸外切酶阶段(分别是泳道BX和AX),其显示“开放”副产物消化的进程,其中闭合线性DNA构建物保持完整。如从图14和15所示的反应原理图中可预期的,在TelN处理的串联体DNA的孔中留下的纳米花DNA比VP58.5处理过的物质少。这是因为TelN将双链和单链(纳米花)DNA均转化为所期望的闭合线性DNA产物。这种闭合线性DNA产物没有茎环或VP58.5识别序列,因为TelN的作用切割“内部”原核端粒酶靶位点而移除了这些实体,在图中标示为"B"或"3"和"4"。该结果也反应在核酸外切酶处理后与泳道AX相比的泳道BX中。
序列表
<110> 塔驰莱特IP有限公司(Touchlight IP Limited)
<120> 闭合线性DNA的生产
<130> P7639WO1
<150> GB1613994.1
<151> 2016-08-16
<150> GB1621954.5
<151> 2016-12-22
<160> 37
<170> PatentIn version 3.3
<210> 1
<211> 1563
<212> DNA
<213> 海水盐单胞菌(Halomonas aquamarina)噬菌体phiHAP-1
<220>
<221> misc_feature
<222>
<223> 原核端粒酶
<400> 1
atgagcggtg agtcacgtag aaaggtcgat ttagcggaat tgatagagtg gttgctcagc 60
gagatcaaag agatcgacgc cgatgatgag atgccacgta aagagaaaac caagcgcatg 120
gcgcggctgg cacgtagctt caaaacgcgc ctgcatgatg acaagcgccg caaggattct 180
gagcggatcg cggtcacgac ctttcgccgc tacatgacag aagcgcgcaa ggcggtgact 240
gcgcagaact ggcgccatca cagcttcgac cagcagatcg agcggctggc cagccgctac 300
ccggcttatg ccagcaagct ggaagcgctc ggcaagctga ccgatatcag cgccattcgt 360
atggcccacc gcgagctgct cgaccagatc cgcaacgatg acgacgctta tgaggacatc 420
cgggcgatga agctggacca tgaaatcatg cgccacctga cgttgagctc tgcacagaaa 480
agcacgctgg ctgaagaggc cagcgagacg ctggaagagc gcgcggtgaa cacggtcgag 540
atcaactacc actggttgat ggagacggtt tacgagctgc tgagtaaccg ggagagaatg 600
gtcgatgggg agtatcgcgg ctttttcagt tacctagcgc ttgggctggc gctggccacc 660
gggcgtcgct cgatcgaggt gctgaagacc ggacggatca cgaaggtggg cgagtatgag 720
ctggagttca gcggccaggc gaaaaagcgc ggcggcgtcg actatagcga ggcttaccac 780
atttataccc tggtgaaagc tgacctggtg atcgaagcgt gggatgagct tcgctcgctg 840
ccggaagctg ctgagctgca gggcatggac aacagcgatg tgaaccgccg cacggcgaag 900
acgctcaaca cgctcactaa gcggatcttt aacaacgatg agcgcgtttt caaggacagc 960
cgggcgatct gggcgcggct ggtgtttgag ctgcacttct cgcgcgacaa gcgctggaag 1020
aaagtcaccg aggacgtgtt ctggcgtgag atgctggggc atgaggacat ggatacacag 1080
cgcagctacc gcgcctttaa aatcgactac gacgagccgg atcaagccga ccaggaagat 1140
tacgaacacg ctagccgcct cgccgcgctg caggcgctgg acggccatga gcagcttgag 1200
agcagcgacg cccaggcgcg tgtgcatgcc tgggtgaaag cgcagatcga gcaggagcct 1260
gacgcgaaaa ttacgcagtc tctgatcagc cgggagctgg gcgtttatcg ccctgccata 1320
aaagcgtacc tggagctggc gcgagaggcg ctcgacgcgc cgaacgtcga tctggacaag 1380
gtcgcggcgg cagtgccgaa ggaagtagcc gaggcgaagc cccggctgaa cgcccaccca 1440
caaggggatg gcaggtgggt cggggtggct tcaatcaacg gggtggaagt tgcacgggtg 1500
ggcaaccagg caggccggat cgaagcgatg aaagcggcct ataaagcggc gggtgggcgc 1560
tga 1563
<210> 2
<211> 520
<212> PRT
<213> 海水盐单胞菌(Halomonas aquamarina)噬菌体phiHAP-1
<220>
<221> MISC_FEATURE
<222>
<223> 原核端粒酶
<400> 2
Met Ser Gly Glu Ser Arg Arg Lys Val Asp Leu Ala Glu Leu Ile Glu
1 5 10 15
Trp Leu Leu Ser Glu Ile Lys Glu Ile Asp Ala Asp Asp Glu Met Pro
20 25 30
Arg Lys Glu Lys Thr Lys Arg Met Ala Arg Leu Ala Arg Ser Phe Lys
35 40 45
Thr Arg Leu His Asp Asp Lys Arg Arg Lys Asp Ser Glu Arg Ile Ala
50 55 60
Val Thr Thr Phe Arg Arg Tyr Met Thr Glu Ala Arg Lys Ala Val Thr
65 70 75 80
Ala Gln Asn Trp Arg His His Ser Phe Asp Gln Gln Ile Glu Arg Leu
85 90 95
Ala Ser Arg Tyr Pro Ala Tyr Ala Ser Lys Leu Glu Ala Leu Gly Lys
100 105 110
Leu Thr Asp Ile Ser Ala Ile Arg Met Ala His Arg Glu Leu Leu Asp
115 120 125
Gln Ile Arg Asn Asp Asp Asp Ala Tyr Glu Asp Ile Arg Ala Met Lys
130 135 140
Leu Asp His Glu Ile Met Arg His Leu Thr Leu Ser Ser Ala Gln Lys
145 150 155 160
Ser Thr Leu Ala Glu Glu Ala Ser Glu Thr Leu Glu Glu Arg Ala Val
165 170 175
Asn Thr Val Glu Ile Asn Tyr His Trp Leu Met Glu Thr Val Tyr Glu
180 185 190
Leu Leu Ser Asn Arg Glu Arg Met Val Asp Gly Glu Tyr Arg Gly Phe
195 200 205
Phe Ser Tyr Leu Ala Leu Gly Leu Ala Leu Ala Thr Gly Arg Arg Ser
210 215 220
Ile Glu Val Leu Lys Thr Gly Arg Ile Thr Lys Val Gly Glu Tyr Glu
225 230 235 240
Leu Glu Phe Ser Gly Gln Ala Lys Lys Arg Gly Gly Val Asp Tyr Ser
245 250 255
Glu Ala Tyr His Ile Tyr Thr Leu Val Lys Ala Asp Leu Val Ile Glu
260 265 270
Ala Trp Asp Glu Leu Arg Ser Leu Pro Glu Ala Ala Glu Leu Gln Gly
275 280 285
Met Asp Asn Ser Asp Val Asn Arg Arg Thr Ala Lys Thr Leu Asn Thr
290 295 300
Leu Thr Lys Arg Ile Phe Asn Asn Asp Glu Arg Val Phe Lys Asp Ser
305 310 315 320
Arg Ala Ile Trp Ala Arg Leu Val Phe Glu Leu His Phe Ser Arg Asp
325 330 335
Lys Arg Trp Lys Lys Val Thr Glu Asp Val Phe Trp Arg Glu Met Leu
340 345 350
Gly His Glu Asp Met Asp Thr Gln Arg Ser Tyr Arg Ala Phe Lys Ile
355 360 365
Asp Tyr Asp Glu Pro Asp Gln Ala Asp Gln Glu Asp Tyr Glu His Ala
370 375 380
Ser Arg Leu Ala Ala Leu Gln Ala Leu Asp Gly His Glu Gln Leu Glu
385 390 395 400
Ser Ser Asp Ala Gln Ala Arg Val His Ala Trp Val Lys Ala Gln Ile
405 410 415
Glu Gln Glu Pro Asp Ala Lys Ile Thr Gln Ser Leu Ile Ser Arg Glu
420 425 430
Leu Gly Val Tyr Arg Pro Ala Ile Lys Ala Tyr Leu Glu Leu Ala Arg
435 440 445
Glu Ala Leu Asp Ala Pro Asn Val Asp Leu Asp Lys Val Ala Ala Ala
450 455 460
Val Pro Lys Glu Val Ala Glu Ala Lys Pro Arg Leu Asn Ala His Pro
465 470 475 480
Gln Gly Asp Gly Arg Trp Val Gly Val Ala Ser Ile Asn Gly Val Glu
485 490 495
Val Ala Arg Val Gly Asn Gln Ala Gly Arg Ile Glu Ala Met Lys Ala
500 505 510
Ala Tyr Lys Ala Ala Gly Gly Arg
515 520
<210> 3
<211> 1854
<212> DNA
<213> 小肠结肠炎耶尔森氏菌(Yersinia enterolytica)噬菌体PY54
<220>
<221> misc_feature
<222>
<223> 原核端粒酶
<400> 3
atgaaaatcc attttcgcga tttagttagt ggtttagtta aagagatcga tgaaatagaa 60
aaatcagacc gggcgcaggg tgacaaaact cggcgttatc agggcgcggc cagaaagttc 120
aaaaatgccg tgtttatgga taaacggaaa tatcgcggta acggtatgaa gaatagaata 180
tcgttaacaa catttaataa atatttaagt cgagcacgtt ctcggtttga agaaaggctt 240
caccatagtt ttcctcaatc tatagcaact atctcaaata aatatcctgc attcagcgaa 300
ataataaaag atctggataa tagacccgct catgaagtta gaataaaact taaagaatta 360
ataactcatc ttgaatccgg tgttaattta ttagaaaaaa taggtagctt agggaaaata 420
aaaccatcta cagctaaaaa aatagttagc ttaaaaaaaa tgtacccatc atgggctaat 480
gatctagata ctttaattag tactgaagat gctacagaat tacaacaaaa gttagagcaa 540
gggaccgacc tacttaacgc attacattct ctaaaagtaa accatgaagt tatgtatgca 600
ttaacgatgc agccttctga cagagctgca ttaaaagcta ggcatgacgc tgcccttcac 660
tttaaaaagc gtaacatcgt acctatcgat tatcccggct atatgcaacg aatgacggac 720
atactacatc ttccagatat agcttttgaa gattcgatgg catcacttgc ccctttagca 780
tttgctctag cagctgctag cggtcgcaga caaattgaaa tactaattac tggtgagttt 840
gacgccaaaa ataaaagcat cattaaattt tctggacaag caaaaaaaag aatggccgtt 900
tcaggtggac attatgaaat atacagtcta attgactcag agctattcat tcaacggtta 960
gagtttttac gttctcatag ctcaatactt cgattacaaa atttggaaat agcacatgat 1020
gaacatcgta ctgaactatc tgttattaac ggttttgtag ccaaaccttt aaatgatgca 1080
gcaaaacagt tctttgtcga tgacagaaga gtatttaaag atacccgtgc aatttacgct 1140
cgcatagcat atgaaaaatg gtttagaaca gatcctcgct gggcgaagtg cgacgaagat 1200
gttttcttct ctgaattatt aggccatgac gacccagata ctcagctggc atataaacaa 1260
ttcaagctgg taaatttcaa tccaaaatgg acacctaata tatcagatga aaaccctcgg 1320
ttagctgcac ttcaagagct tgacaatgat atgcccggcc tagcacgtgg cgatgcggca 1380
gttcgcatac atgagtgggt taaagagcaa ctggcgcaga accctgcggc aaaaataact 1440
gcataccaaa tcaagaaaaa tttaaattgt cgaaatgact tggccagccg atacatggca 1500
tggtgtgctg acgcgctagg ggttgttatt ggtgatgatg gacaggcaag gccagaagaa 1560
ctcccaccat cgctcgtgct tgatattaac gctgatgaca ctgacgctga agaagatgaa 1620
atagaggaag actttactga tgaggaaata gacgacaccg aattcgacgt atcagataac 1680
gccagtgatg aagataagcc cgaagataaa cctcgctttg cagcaccaat tcgtagaagt 1740
gaggactctt ggctgattaa atttgaattt gctggcaagc aatatagctg ggagggtaat 1800
gccgaaagtg ttatcgatgc gatgaaacaa gcatggactg aaaatatgga gtaa 1854
<210> 4
<211> 617
<212> PRT
<213> 小肠结肠炎耶尔森氏菌(Yersinia enterolytica)噬菌体PY54
<220>
<221> MISC_FEATURE
<222>
<223> 原核端粒酶
<400> 4
Met Lys Ile His Phe Arg Asp Leu Val Ser Gly Leu Val Lys Glu Ile
1 5 10 15
Asp Glu Ile Glu Lys Ser Asp Arg Ala Gln Gly Asp Lys Thr Arg Arg
20 25 30
Tyr Gln Gly Ala Ala Arg Lys Phe Lys Asn Ala Val Phe Met Asp Lys
35 40 45
Arg Lys Tyr Arg Gly Asn Gly Met Lys Asn Arg Ile Ser Leu Thr Thr
50 55 60
Phe Asn Lys Tyr Leu Ser Arg Ala Arg Ser Arg Phe Glu Glu Arg Leu
65 70 75 80
His His Ser Phe Pro Gln Ser Ile Ala Thr Ile Ser Asn Lys Tyr Pro
85 90 95
Ala Phe Ser Glu Ile Ile Lys Asp Leu Asp Asn Arg Pro Ala His Glu
100 105 110
Val Arg Ile Lys Leu Lys Glu Leu Ile Thr His Leu Glu Ser Gly Val
115 120 125
Asn Leu Leu Glu Lys Ile Gly Ser Leu Gly Lys Ile Lys Pro Ser Thr
130 135 140
Ala Lys Lys Ile Val Ser Leu Lys Lys Met Tyr Pro Ser Trp Ala Asn
145 150 155 160
Asp Leu Asp Thr Leu Ile Ser Thr Glu Asp Ala Thr Glu Leu Gln Gln
165 170 175
Lys Leu Glu Gln Gly Thr Asp Leu Leu Asn Ala Leu His Ser Leu Lys
180 185 190
Val Asn His Glu Val Met Tyr Ala Leu Thr Met Gln Pro Ser Asp Arg
195 200 205
Ala Ala Leu Lys Ala Arg His Asp Ala Ala Leu His Phe Lys Lys Arg
210 215 220
Asn Ile Val Pro Ile Asp Tyr Pro Gly Tyr Met Gln Arg Met Thr Asp
225 230 235 240
Ile Leu His Leu Pro Asp Ile Ala Phe Glu Asp Ser Met Ala Ser Leu
245 250 255
Ala Pro Leu Ala Phe Ala Leu Ala Ala Ala Ser Gly Arg Arg Gln Ile
260 265 270
Glu Ile Leu Ile Thr Gly Glu Phe Asp Ala Lys Asn Lys Ser Ile Ile
275 280 285
Lys Phe Ser Gly Gln Ala Lys Lys Arg Met Ala Val Ser Gly Gly His
290 295 300
Tyr Glu Ile Tyr Ser Leu Ile Asp Ser Glu Leu Phe Ile Gln Arg Leu
305 310 315 320
Glu Phe Leu Arg Ser His Ser Ser Ile Leu Arg Leu Gln Asn Leu Glu
325 330 335
Ile Ala His Asp Glu His Arg Thr Glu Leu Ser Val Ile Asn Gly Phe
340 345 350
Val Ala Lys Pro Leu Asn Asp Ala Ala Lys Gln Phe Phe Val Asp Asp
355 360 365
Arg Arg Val Phe Lys Asp Thr Arg Ala Ile Tyr Ala Arg Ile Ala Tyr
370 375 380
Glu Lys Trp Phe Arg Thr Asp Pro Arg Trp Ala Lys Cys Asp Glu Asp
385 390 395 400
Val Phe Phe Ser Glu Leu Leu Gly His Asp Asp Pro Asp Thr Gln Leu
405 410 415
Ala Tyr Lys Gln Phe Lys Leu Val Asn Phe Asn Pro Lys Trp Thr Pro
420 425 430
Asn Ile Ser Asp Glu Asn Pro Arg Leu Ala Ala Leu Gln Glu Leu Asp
435 440 445
Asn Asp Met Pro Gly Leu Ala Arg Gly Asp Ala Ala Val Arg Ile His
450 455 460
Glu Trp Val Lys Glu Gln Leu Ala Gln Asn Pro Ala Ala Lys Ile Thr
465 470 475 480
Ala Tyr Gln Ile Lys Lys Asn Leu Asn Cys Arg Asn Asp Leu Ala Ser
485 490 495
Arg Tyr Met Ala Trp Cys Ala Asp Ala Leu Gly Val Val Ile Gly Asp
500 505 510
Asp Gly Gln Ala Arg Pro Glu Glu Leu Pro Pro Ser Leu Val Leu Asp
515 520 525
Ile Asn Ala Asp Asp Thr Asp Ala Glu Glu Asp Glu Ile Glu Glu Asp
530 535 540
Phe Thr Asp Glu Glu Ile Asp Asp Thr Glu Phe Asp Val Ser Asp Asn
545 550 555 560
Ala Ser Asp Glu Asp Lys Pro Glu Asp Lys Pro Arg Phe Ala Ala Pro
565 570 575
Ile Arg Arg Ser Glu Asp Ser Trp Leu Ile Lys Phe Glu Phe Ala Gly
580 585 590
Lys Gln Tyr Ser Trp Glu Gly Asn Ala Glu Ser Val Ile Asp Ala Met
595 600 605
Lys Gln Ala Trp Thr Glu Asn Met Glu
610 615
<210> 5
<211> 1923
<212> DNA
<213> 克雷伯菌(Klebsiella)噬菌体phiKO2
<220>
<221> misc_feature
<222>
<223> 原核端粒酶
<400> 5
atgcgtaagg tgaaaattgg tgagctaatc aattcgcttg tgagcgaggt cgaggcaatc 60
gatgcctctg atcgtccgca aggcgataaa acgaagaaaa ttaaagccgc agcattaaaa 120
tataagaatg cattatttaa tgacaaaaga aagtttcgcg gtaaaggttt agaaaaaaga 180
atttctgcca acacgttcaa ctcgtatatg agtcgggcaa ggaaaagatt tgatgataga 240
ttgcatcata actttgaaaa gaatgtaatt aaactatcag aaaaatatcc tttatatagt 300
gaagaattat cttcgtggct ttctatgcct gcggcatcaa ttagacagca tatgtcaaga 360
ttgcaagcca agctaaaaga gataatgcca ttggcagaag acttatccaa tataaagatt 420
ggtacaaaaa atagcgaagc aaaaataaat aaactcgcta ataaatatcc tgaatggcaa 480
ttcgctatta gtgatttaaa tagcgaagat tggaaggata aaagagatta tctttataaa 540
ctattccaac aaggttcttc gctcctggaa gacttgaata acctgaaagt aaaccatgag 600
gttctctatc atctgcagct tagttctgcc gagcgaacct ctatccagca gcgctgggcc 660
aacgtcctca gcgagaaaaa gcgcaacgtt gtcgtgattg actatccgcg ctatatgcag 720
gccatctacg atataatcaa caagcctata gtttcgttcg atttgactac tcgtcgtggt 780
atggccccgc tggcgttcgc ccttgccgcg ctatctggtc gccgaatgat tgaaatcatg 840
ctccagggtg aattttccgt cgcaggtaaa tatacagtaa cattcctggg gcaagctaaa 900
aaacgctcgg aagataaagg tatatcaagg aaaatatata ccttatgcga cgctacttta 960
tttgttagtt tggtaaatga acttcgctca tgccccgctg ctgcggattt tgatgaagta 1020
ataaaaggat atggcgaaaa tgacactcgc tcagaaaatg ggcgtattaa tgcaattctc 1080
gctacagctt ttaatccgtg ggtaaaaact ttcttaggcg atgaccgccg cgtttataaa 1140
gatagccgcg ctatttacgc ccgtattgcc tatgaaatgt tcttccgcgt tgaccctcgg 1200
tggaagaatg ttgatgagga tgtattcttc atggagattc tcggccatga cgatgaaaac 1260
acccaactgc actataagca gtttaaattg gctaacttct ccagaacatg gcgaccaaat 1320
gtcggcgagg agaatgcccg cctagcggcg ctgcaaaagc tggatagcat gatgccagat 1380
tttgccaggg gcgacgccgg ggttcgtatt catgagaccg tgaagcagct ggtggagcag 1440
gacccatcga taaaaatcac aaacagcacc ctgcgaccgt ttaacttcag taccaggctg 1500
attcctcgct acctggagtt tgccgccgat gcattgggcc agttcgtcgg tgaaaatggg 1560
caatggcaac tgaaggatga ggcgcctgca atagtcctgc ctgatgagga aattcttgag 1620
cctatggacg acgtcgatct cgatgacgaa aaccatgatg atgaaacgct ggatgacgat 1680
gagatcgaag tggacgaaag cgaaggagag gaactggagg aagcgggcga cgctgaagag 1740
gccgaggtgg ctgaacagga agagaagcac cctggcaagc caaactttaa agcgccgagg 1800
gataatggcg atggtaccta catggtggaa tttgaattcg gtggccgtca ttacgcctgg 1860
tccggtgccg ccggtaatcg ggtagaggca atgcaatctg cctggagtgc ctacttcaag 1920
tga 1923
<210> 6
<211> 640
<212> PRT
<213> 克雷伯菌(Klebsiella)噬菌体phiKO2
<220>
<221> MISC_FEATURE
<222>
<223> 原核端粒酶
<400> 6
Met Arg Lys Val Lys Ile Gly Glu Leu Ile Asn Ser Leu Val Ser Glu
1 5 10 15
Val Glu Ala Ile Asp Ala Ser Asp Arg Pro Gln Gly Asp Lys Thr Lys
20 25 30
Lys Ile Lys Ala Ala Ala Leu Lys Tyr Lys Asn Ala Leu Phe Asn Asp
35 40 45
Lys Arg Lys Phe Arg Gly Lys Gly Leu Glu Lys Arg Ile Ser Ala Asn
50 55 60
Thr Phe Asn Ser Tyr Met Ser Arg Ala Arg Lys Arg Phe Asp Asp Arg
65 70 75 80
Leu His His Asn Phe Glu Lys Asn Val Ile Lys Leu Ser Glu Lys Tyr
85 90 95
Pro Leu Tyr Ser Glu Glu Leu Ser Ser Trp Leu Ser Met Pro Ala Ala
100 105 110
Ser Ile Arg Gln His Met Ser Arg Leu Gln Ala Lys Leu Lys Glu Ile
115 120 125
Met Pro Leu Ala Glu Asp Leu Ser Asn Ile Lys Ile Gly Thr Lys Asn
130 135 140
Ser Glu Ala Lys Ile Asn Lys Leu Ala Asn Lys Tyr Pro Glu Trp Gln
145 150 155 160
Phe Ala Ile Ser Asp Leu Asn Ser Glu Asp Trp Lys Asp Lys Arg Asp
165 170 175
Tyr Leu Tyr Lys Leu Phe Gln Gln Gly Ser Ser Leu Leu Glu Asp Leu
180 185 190
Asn Asn Leu Lys Val Asn His Glu Val Leu Tyr His Leu Gln Leu Ser
195 200 205
Ser Ala Glu Arg Thr Ser Ile Gln Gln Arg Trp Ala Asn Val Leu Ser
210 215 220
Glu Lys Lys Arg Asn Val Val Val Ile Asp Tyr Pro Arg Tyr Met Gln
225 230 235 240
Ala Ile Tyr Asp Ile Ile Asn Lys Pro Ile Val Ser Phe Asp Leu Thr
245 250 255
Thr Arg Arg Gly Met Ala Pro Leu Ala Phe Ala Leu Ala Ala Leu Ser
260 265 270
Gly Arg Arg Met Ile Glu Ile Met Leu Gln Gly Glu Phe Ser Val Ala
275 280 285
Gly Lys Tyr Thr Val Thr Phe Leu Gly Gln Ala Lys Lys Arg Ser Glu
290 295 300
Asp Lys Gly Ile Ser Arg Lys Ile Tyr Thr Leu Cys Asp Ala Thr Leu
305 310 315 320
Phe Val Ser Leu Val Asn Glu Leu Arg Ser Cys Pro Ala Ala Ala Asp
325 330 335
Phe Asp Glu Val Ile Lys Gly Tyr Gly Glu Asn Asp Thr Arg Ser Glu
340 345 350
Asn Gly Arg Ile Asn Ala Ile Leu Ala Thr Ala Phe Asn Pro Trp Val
355 360 365
Lys Thr Phe Leu Gly Asp Asp Arg Arg Val Tyr Lys Asp Ser Arg Ala
370 375 380
Ile Tyr Ala Arg Ile Ala Tyr Glu Met Phe Phe Arg Val Asp Pro Arg
385 390 395 400
Trp Lys Asn Val Asp Glu Asp Val Phe Phe Met Glu Ile Leu Gly His
405 410 415
Asp Asp Glu Asn Thr Gln Leu His Tyr Lys Gln Phe Lys Leu Ala Asn
420 425 430
Phe Ser Arg Thr Trp Arg Pro Asn Val Gly Glu Glu Asn Ala Arg Leu
435 440 445
Ala Ala Leu Gln Lys Leu Asp Ser Met Met Pro Asp Phe Ala Arg Gly
450 455 460
Asp Ala Gly Val Arg Ile His Glu Thr Val Lys Gln Leu Val Glu Gln
465 470 475 480
Asp Pro Ser Ile Lys Ile Thr Asn Ser Thr Leu Arg Pro Phe Asn Phe
485 490 495
Ser Thr Arg Leu Ile Pro Arg Tyr Leu Glu Phe Ala Ala Asp Ala Leu
500 505 510
Gly Gln Phe Val Gly Glu Asn Gly Gln Trp Gln Leu Lys Asp Glu Ala
515 520 525
Pro Ala Ile Val Leu Pro Asp Glu Glu Ile Leu Glu Pro Met Asp Asp
530 535 540
Val Asp Leu Asp Asp Glu Asn His Asp Asp Glu Thr Leu Asp Asp Asp
545 550 555 560
Glu Ile Glu Val Asp Glu Ser Glu Gly Glu Glu Leu Glu Glu Ala Gly
565 570 575
Asp Ala Glu Glu Ala Glu Val Ala Glu Gln Glu Glu Lys His Pro Gly
580 585 590
Lys Pro Asn Phe Lys Ala Pro Arg Asp Asn Gly Asp Gly Thr Tyr Met
595 600 605
Val Glu Phe Glu Phe Gly Gly Arg His Tyr Ala Trp Ser Gly Ala Ala
610 615 620
Gly Asn Arg Val Glu Ala Met Gln Ser Ala Trp Ser Ala Tyr Phe Lys
625 630 635 640
<210> 7
<211> 1617
<212> DNA
<213> 弧菌属(Vibrio sp.)噬菌体VP882
<220>
<221> misc_feature
<222>
<223> 原核端粒酶
<400> 7
atgagcggcg aaagtagaca aaaggtaaac ctcgaggagt taataaatga gctcgtcgag 60
gaggtgaaaa ccatcgatga caatgaggcg attactcggt ctgaaaaaac caagttgatc 120
accagggcgg cgactaaatt caagaccaag ctgcacgacg ataagcgccg gaaggatgcg 180
accagaatcg ctctgagcac ctatcgtaag tacatgacaa tggccagggc agcagttact 240
gagcagaact ggaaacacca cagtctcgag cagcagatag agcggctggc caaaaagcac 300
ccgcaatacg ctgagcagct ggtggccatc ggggccatgg ataacatcac cgagttgcgc 360
ctggcgcatc gcgacctcct gaagagcatc aaggacaacg atgaagcctt cgaggatatc 420
cgcagcatga agttagacca cgaggtaatg cgccatctga cgctacccag tgcgcaaaag 480
gcgagactgg cagaggaagc cgccgaggcg ttgaccgaga agaaaaccgc cacggtcgac 540
atcaactatc acgagctgat ggccggcgtg gtggagctgt tgaccaagaa gaccaagacg 600
gtcggcagcg acagcaccta cagcttcagc cggctggcgc ttggtattgg cctggctacc 660
ggtcgtcgtt ctatcgagat actgaagcag ggcgagttca aaaaggtgga tgagcagcgg 720
ctcgagttct ctggccaagc gaaaaagcgc ggcggtgccg actattcaga gacctatacc 780
atttacaccc tggtcgactc cgacctggta ctgatggcgc tgaagaacct gcgagagttg 840
ccagaagttc gcgcactgga tgagtacgac caactgggcg agattaagcg gaacgacgcc 900
atcaataaac gctgtgcaaa aacgctcaac caaaccgcca agcagttctt tggcagcgac 960
gagcgcgtgt tcaaagatag tcgtgccatc tgggcgcgtc tggcttatga gttgtttttt 1020
caacgtgatc cgcgctggaa aaagaaagac gaggacgttt tctggcagga gatgctgggc 1080
cacgaggaca tcgagactca gaaagcctat aagcaattca aggtcgacta cagcgaacct 1140
gagcagccgg tgcacaagcc tggcaaattt aagagcagag ctgaagccct cgcggcgctc 1200
gactcaaatg aggacattac cacccgctca tccatggcca agatccacga ctgggtgaaa 1260
gagcgtattg cggaagaccc cgaggcgaac atcacacagt cactcatcac ccgggaactg 1320
ggctcaggcc gtaaggtgat caaggactac ctcgacctgg ctgacgatgc ccttgctgtg 1380
gtgaatactc ctgtcgatga cgcagtcgtc gaggttccag ctgatgtgcc ggcagcagaa 1440
aaacagccga agaaagcgca gaagcccaga ctcgtggctc accaggttga tgatgagcac 1500
tgggaagcct gggcgctggt ggaaggcgag gaggtggcca gggtgaaaat caagggcacc 1560
cgcgttgagg caatgacagc cgcatgggag gccagccaaa aggcactcga tgactaa 1617
<210> 8
<211> 538
<212> PRT
<213> 弧菌属(Vibrio sp.)噬菌体VP882
<220>
<221> MISC_FEATURE
<222>
<223> 原核端粒酶
<400> 8
Met Ser Gly Glu Ser Arg Gln Lys Val Asn Leu Glu Glu Leu Ile Asn
1 5 10 15
Glu Leu Val Glu Glu Val Lys Thr Ile Asp Asp Asn Glu Ala Ile Thr
20 25 30
Arg Ser Glu Lys Thr Lys Leu Ile Thr Arg Ala Ala Thr Lys Phe Lys
35 40 45
Thr Lys Leu His Asp Asp Lys Arg Arg Lys Asp Ala Thr Arg Ile Ala
50 55 60
Leu Ser Thr Tyr Arg Lys Tyr Met Thr Met Ala Arg Ala Ala Val Thr
65 70 75 80
Glu Gln Asn Trp Lys His His Ser Leu Glu Gln Gln Ile Glu Arg Leu
85 90 95
Ala Lys Lys His Pro Gln Tyr Ala Glu Gln Leu Val Ala Ile Gly Ala
100 105 110
Met Asp Asn Ile Thr Glu Leu Arg Leu Ala His Arg Asp Leu Leu Lys
115 120 125
Ser Ile Lys Asp Asn Asp Glu Ala Phe Glu Asp Ile Arg Ser Met Lys
130 135 140
Leu Asp His Glu Val Met Arg His Leu Thr Leu Pro Ser Ala Gln Lys
145 150 155 160
Ala Arg Leu Ala Glu Glu Ala Ala Glu Ala Leu Thr Glu Lys Lys Thr
165 170 175
Ala Thr Val Asp Ile Asn Tyr His Glu Leu Met Ala Gly Val Val Glu
180 185 190
Leu Leu Thr Lys Lys Thr Lys Thr Val Gly Ser Asp Ser Thr Tyr Ser
195 200 205
Phe Ser Arg Leu Ala Leu Gly Ile Gly Leu Ala Thr Gly Arg Arg Ser
210 215 220
Ile Glu Ile Leu Lys Gln Gly Glu Phe Lys Lys Val Asp Glu Gln Arg
225 230 235 240
Leu Glu Phe Ser Gly Gln Ala Lys Lys Arg Gly Gly Ala Asp Tyr Ser
245 250 255
Glu Thr Tyr Thr Ile Tyr Thr Leu Val Asp Ser Asp Leu Val Leu Met
260 265 270
Ala Leu Lys Asn Leu Arg Glu Leu Pro Glu Val Arg Ala Leu Asp Glu
275 280 285
Tyr Asp Gln Leu Gly Glu Ile Lys Arg Asn Asp Ala Ile Asn Lys Arg
290 295 300
Cys Ala Lys Thr Leu Asn Gln Thr Ala Lys Gln Phe Phe Gly Ser Asp
305 310 315 320
Glu Arg Val Phe Lys Asp Ser Arg Ala Ile Trp Ala Arg Leu Ala Tyr
325 330 335
Glu Leu Phe Phe Gln Arg Asp Pro Arg Trp Lys Lys Lys Asp Glu Asp
340 345 350
Val Phe Trp Gln Glu Met Leu Gly His Glu Asp Ile Glu Thr Gln Lys
355 360 365
Ala Tyr Lys Gln Phe Lys Val Asp Tyr Ser Glu Pro Glu Gln Pro Val
370 375 380
His Lys Pro Gly Lys Phe Lys Ser Arg Ala Glu Ala Leu Ala Ala Leu
385 390 395 400
Asp Ser Asn Glu Asp Ile Thr Thr Arg Ser Ser Met Ala Lys Ile His
405 410 415
Asp Trp Val Lys Glu Arg Ile Ala Glu Asp Pro Glu Ala Asn Ile Thr
420 425 430
Gln Ser Leu Ile Thr Arg Glu Leu Gly Ser Gly Arg Lys Val Ile Lys
435 440 445
Asp Tyr Leu Asp Leu Ala Asp Asp Ala Leu Ala Val Val Asn Thr Pro
450 455 460
Val Asp Asp Ala Val Val Glu Val Pro Ala Asp Val Pro Ala Ala Glu
465 470 475 480
Lys Gln Pro Lys Lys Ala Gln Lys Pro Arg Leu Val Ala His Gln Val
485 490 495
Asp Asp Glu His Trp Glu Ala Trp Ala Leu Val Glu Gly Glu Glu Val
500 505 510
Ala Arg Val Lys Ile Lys Gly Thr Arg Val Glu Ala Met Thr Ala Ala
515 520 525
Trp Glu Ala Ser Gln Lys Ala Leu Asp Asp
530 535
<210> 9
<211> 4055
<212> DNA
<213> 大肠杆菌(Escherichia coli)噬菌体N15
<220>
<221> misc_feature
<222>
<223> 原核端粒酶TelN
<400> 9
catatgcact atatcatatc tcaattacgg aacatatcag cacacaattg cccattatac 60
gcgcgtataa tggactattg tgtgctgata aggagaacat aagcgcagaa caatatgtat 120
ctattccggt gttgtgttcc tttgttattc tgctattatg ttctcttata gtgtgacgaa 180
agcagcataa ttaatcgtca cttgttcttt gattgtgtta cgatatccag agacttagaa 240
acgggggaac cgggatgagc aaggtaaaaa tcggtgagtt gatcaacacg cttgtgaatg 300
aggtagaggc aattgatgcc tcagaccgcc cacaaggcga caaaacgaag agaattaaag 360
ccgcagccgc acggtataag aacgcgttat ttaatgataa aagaaagttc cgtgggaaag 420
gattgcagaa aagaataacc gcgaatactt ttaacgccta tatgagcagg gcaagaaagc 480
ggtttgatga taaattacat catagctttg ataaaaatat taataaatta tcggaaaagt 540
atcctcttta cagcgaagaa ttatcttcat ggctttctat gcctacggct aatattcgcc 600
agcacatgtc atcgttacaa tctaaattga aagaaataat gccgcttgcc gaagagttat 660
caaatgtaag aataggctct aaaggcagtg atgcaaaaat agcaagacta ataaaaaaat 720
atccagattg gagttttgct cttagtgatt taaacagtga tgattggaag gagcgccgtg 780
actatcttta taagttattc caacaaggct ctgcgttgtt agaagaacta caccagctca 840
aggtcaacca tgaggttctg taccatctgc agctaagccc tgcggagcgt acatctatac 900
agcaacgatg ggccgatgtt ctgcgcgaga agaagcgtaa tgttgtggtt attgactacc 960
caacatacat gcagtctatc tatgatattt tgaataatcc tgcgacttta tttagtttaa 1020
acactcgttc tggaatggca cctttggcct ttgctctggc tgcggtatca gggcgaagaa 1080
tgattgagat aatgtttcag ggtgaatttg ccgtttcagg aaagtatacg gttaatttct 1140
cagggcaagc taaaaaacgc tctgaagata aaagcgtaac cagaacgatt tatactttat 1200
gcgaagcaaa attattcgtt gaattattaa cagaattgcg ttcttgctct gctgcatctg 1260
atttcgatga ggttgttaaa ggatatggaa aggatgatac aaggtctgag aacggcagga 1320
taaatgctat tttagcaaaa gcatttaacc cttgggttaa atcatttttc ggcgatgacc 1380
gtcgtgttta taaagatagc cgcgctattt acgctcgcat cgcttatgag atgttcttcc 1440
gcgtcgatcc acggtggaaa aacgtcgacg aggatgtgtt cttcatggag attctcggac 1500
acgacgatga gaacacccag ctgcactata agcagttcaa gctggccaac ttctccagaa 1560
cctggcgacc tgaagttggg gatgaaaaca ccaggctggt ggctctgcag aaactggacg 1620
atgaaatgcc aggctttgcc agaggtgacg ctggcgtccg tctccatgaa accgttaagc 1680
agctggtgga gcaggaccca tcagcaaaaa taaccaacag cactctccgg gcctttaaat 1740
ttagcccgac gatgattagc cggtacctgg agtttgccgc tgatgcattg gggcagttcg 1800
ttggcgagaa cgggcagtgg cagctgaaga tagagacacc tgcaatcgtc ctgcctgatg 1860
aagaatccgt tgagaccatc gacgaaccgg atgatgagtc ccaagacgac gagctggatg 1920
aagatgaaat tgagctcgac gagggtggcg gcgatgaacc aaccgaagag gaagggccag 1980
aagaacatca gccaactgct ctaaaacccg tcttcaagcc tgcaaaaaat aacggggacg 2040
gaacgtacaa gatagagttt gaatacgatg gaaagcatta tgcctggtcc ggccccgccg 2100
atagccctat ggccgcaatg cgatccgcat gggaaacgta ctacagctaa aagaaaagcc 2160
accggtgtta atcggtggct tttttattga ggcctgtccc tacccatccc ctgcaaggga 2220
cggaaggatt aggcggaaac tgcagctgca actacggaca tcgccgtccc gactgcaggg 2280
acttccccgc gtaaagcggg gcttaaattc gggctggcca accctatttt tctgcaatcg 2340
ctggcgatgt tagtttcgtg gatagcgttt ccagcttttc aatggccagc tcaaaatgtg 2400
ctggcagcac cttctccagt tccgtatcaa tatcggtgat cggcagctct ccacaagaca 2460
tactccggcg accgccacga actacatcgc gcagcagctc ccgttcgtag acacgcatgt 2520
tgcccagagc cgtttctgca gccgttaata tccggcgcac gtcggcgatg attgccggga 2580
gatcatccac ggttattggg ttcggtgatg ggttcctgca ggcgcggcgg agagccatcc 2640
agacgccgct aacccatgcg ttacggtact gaaaactttg tgctatgtcg tttatcaggc 2700
ccgaagttct tctttctgcc gccagtccag tggttcaccg gcgttcttag gctcaggctc 2760
gacaaaagca tactcgccgt ttttccggat agctggcaga acctcgttcg tcacccactt 2820
gcggaaccgc caggctgtcg tcccctgttt caccgcgtcg cggcagcgga ggattatggt 2880
gtagagacca gattccgata ccacatttac ttccctggcc atccgatcaa gtttttgtgc 2940
ctcggttaaa ccgagggtca atttttcatc atgatccagc ttacgcaatg catcagaagg 3000
gttggctata ttcaatgcag cacagatatc cagcgccaca aaccacgggt caccaccgac 3060
aagaaccacc cgtatagggt ggctttcctg aaatgaaaag acggagagag ccttcattgc 3120
gcctccccgg atttcagctg ctcagaaagg gacagggagc agccgcgagc ttcctgcgtg 3180
agttcgcgcg cgacctgcag aagttccgca gcttcctgca aatacagcgt ggcctcataa 3240
ctggagatag tgcggtgagc agagcccaca agcgcttcaa cctgcagcag gcgttcctca 3300
atcgtctcca gcaggccctg ggcgtttaac tgaatctggt tcatgcgatc acctcgctga 3360
ccgggatacg ggctgacaga acgaggacaa aacggctggc gaactggcga cgagcttctc 3420
gctcggatga tgcaatggtg gaaaggcggt ggatatggga ttttttgtcc gtgcggacga 3480
cagctgcaaa tttgaatttg aacatggtat gcattcctat cttgtatagg gtgctaccac 3540
cagagttgag aatctctata ggggtggtag cccagacagg gttctcaaca ccggtacaag 3600
aagaaaccgg cccaaccgaa gttggcccca tctgagccac cataattcag gtatgcgcag 3660
atttaacaca caaaaaaaca cgctggcgcg tgttgtgcgc ttcttgtcat tcggggttga 3720
gaggcccggc tgcagatttt gctgcagcgg ggtaactcta ccgccaaagc agaacgcacg 3780
tcaataattt aggtggatat tttaccccgt gaccagtcac gtgcacaggt gtttttatag 3840
tttgctttac tgactgatca gaacctgatc agttattgga gtccggtaat cttattgatg 3900
accgcagcca ccttagatgt tgtctcaaac cccatacggc cacgaatgag ccactggaac 3960
ggaatagtca gcaggtacag cggaacgaac cacaaacggt tcagacgctg ccagaacgtc 4020
gcatcacgac gttccatcca ttcggtattg tcgac 4055
<210> 10
<211> 631
<212> PRT
<213> 大肠杆菌(Escherichia coli)噬菌体N15
<220>
<221> misc_feature
<222>
<223> 原核端粒酶序列Tel N
<400> 10
Met Ser Lys Val Lys Ile Gly Glu Leu Ile Asn Thr Leu Val Asn Glu
1 5 10 15
Val Glu Ala Ile Asp Ala Ser Asp Arg Pro Gln Gly Asp Lys Thr Lys
20 25 30
Arg Ile Lys Ala Ala Ala Ala Arg Tyr Lys Asn Ala Leu Phe Asn Asp
35 40 45
Lys Arg Lys Phe Arg Gly Lys Gly Leu Gln Lys Arg Ile Thr Ala Asn
50 55 60
Thr Phe Asn Ala Tyr Met Ser Arg Ala Arg Lys Arg Phe Asp Asp Lys
65 70 75 80
Leu His His Ser Phe Asp Lys Asn Ile Asn Lys Leu Ser Glu Lys Tyr
85 90 95
Pro Leu Tyr Ser Glu Glu Leu Ser Ser Trp Leu Ser Met Pro Thr Ala
100 105 110
Asn Ile Arg Gln His Met Ser Ser Leu Gln Ser Lys Leu Lys Glu Ile
115 120 125
Met Pro Leu Ala Glu Glu Leu Ser Asn Val Arg Ile Gly Ser Lys Gly
130 135 140
Ser Asp Ala Lys Ile Ala Arg Leu Ile Lys Lys Tyr Pro Asp Trp Ser
145 150 155 160
Phe Ala Leu Ser Asp Leu Asn Ser Asp Asp Trp Lys Glu Arg Arg Asp
165 170 175
Tyr Leu Tyr Lys Leu Phe Gln Gln Gly Ser Ala Leu Leu Glu Glu Leu
180 185 190
His Gln Leu Lys Val Asn His Glu Val Leu Tyr His Leu Gln Leu Ser
195 200 205
Pro Ala Glu Arg Thr Ser Ile Gln Gln Arg Trp Ala Asp Val Leu Arg
210 215 220
Glu Lys Lys Arg Asn Val Val Val Ile Asp Tyr Pro Thr Tyr Met Gln
225 230 235 240
Ser Ile Tyr Asp Ile Leu Asn Asn Pro Ala Thr Leu Phe Ser Leu Asn
245 250 255
Thr Arg Ser Gly Met Ala Pro Leu Ala Phe Ala Leu Ala Ala Val Ser
260 265 270
Gly Arg Arg Met Ile Glu Ile Met Phe Gln Gly Glu Phe Ala Val Ser
275 280 285
Gly Lys Tyr Thr Val Asn Phe Ser Gly Gln Ala Lys Lys Arg Ser Glu
290 295 300
Asp Lys Ser Val Thr Arg Thr Ile Tyr Thr Leu Cys Glu Ala Lys Leu
305 310 315 320
Phe Val Glu Leu Leu Thr Glu Leu Arg Ser Cys Ser Ala Ala Ser Asp
325 330 335
Phe Asp Glu Val Val Lys Gly Tyr Gly Lys Asp Asp Thr Arg Ser Glu
340 345 350
Asn Gly Arg Ile Asn Ala Ile Leu Ala Lys Ala Phe Asn Pro Trp Val
355 360 365
Lys Ser Phe Phe Gly Asp Asp Arg Arg Val Tyr Lys Asp Ser Arg Ala
370 375 380
Ile Tyr Ala Arg Ile Ala Tyr Glu Met Phe Phe Arg Val Asp Pro Arg
385 390 395 400
Trp Lys Asn Val Asp Glu Asp Val Phe Phe Met Glu Ile Leu Gly His
405 410 415
Asp Asp Glu Asn Thr Gln Leu His Tyr Lys Gln Phe Lys Leu Ala Asn
420 425 430
Phe Ser Arg Thr Trp Arg Pro Glu Val Gly Asp Glu Asn Thr Arg Leu
435 440 445
Val Ala Leu Gln Lys Leu Asp Asp Glu Met Pro Gly Phe Ala Arg Gly
450 455 460
Asp Ala Gly Val Arg Leu His Glu Thr Val Lys Gln Leu Val Glu Gln
465 470 475 480
Asp Pro Ser Ala Lys Ile Thr Asn Ser Thr Leu Arg Ala Phe Lys Phe
485 490 495
Ser Pro Thr Met Ile Ser Arg Tyr Leu Glu Phe Ala Ala Asp Ala Leu
500 505 510
Gly Gln Phe Val Gly Glu Asn Gly Gln Trp Gln Leu Lys Ile Glu Thr
515 520 525
Pro Ala Ile Val Leu Pro Asp Glu Glu Ser Val Glu Thr Ile Asp Glu
530 535 540
Pro Asp Asp Glu Ser Gln Asp Asp Glu Leu Asp Glu Asp Glu Ile Glu
545 550 555 560
Leu Asp Glu Gly Gly Gly Asp Glu Pro Thr Glu Glu Glu Gly Pro Glu
565 570 575
Glu His Gln Pro Thr Ala Leu Lys Pro Val Phe Lys Pro Ala Lys Asn
580 585 590
Asn Gly Asp Gly Thr Tyr Lys Ile Glu Phe Glu Tyr Asp Gly Lys His
595 600 605
Tyr Ala Trp Ser Gly Pro Ala Asp Ser Pro Met Ala Ala Met Arg Ser
610 615 620
Ala Trp Glu Thr Tyr Tyr Ser
625 630
<210> 11
<211> 1329
<212> DNA
<213> 农杆菌(Agrobacterium tumefaciens)菌株C58
<220>
<221> misc_feature
<222>
<223> 原核端粒酶TelA
<400> 11
atgctcgccg caaaacgaaa aacaaaaaca ccggtcctcg tggaacgcat cgatcaattc 60
gtcggccaga tcaaagaggc gatgaaaagc gacgacgctt cgcgaaacag gaaaatccgc 120
gatctgtggg atgccgaggt ccgctatcat ttcgataatg gccgcacgga aaagacgctc 180
gaactttaca tcatgaaata tcgcaatgcg ctgaaggccg aattcggccc gaagagcacc 240
ccgctagcca tctgcaacat gaagaagctg cgcgagcgcc tgaacaccta tattgcccgg 300
ggcgattatc ccaagacagg cgtggcgacg tcgattgtcg aaaaaatcga gcgggcggag 360
ttcaacaccg ccggccgcaa acccacggtt ctccttcgca tagccgattt cattgccgcg 420
atgaacggca tggacgcgaa gcaggacatg caggctctgt gggacgcaga aatcgccatc 480
atgaacggcc gcgcccagac gacgatcatt tcctacatca ccaaatatcg caacgccatc 540
cgggaagcct tcggtgacga ccatccgatg ctgaagatcg ccaccggcga tgccgcgatg 600
tatgacgagg cccgccgggt gaagatggag aagatcgcca acaagcatgg cgcgctcatc 660
acattcgaga actaccggca ggttctgaaa atctgcgagg attgtctcaa gtccagcgat 720
cccctgatga tcggcatcgg cctcatcggc atgacgggac gccgacccta tgaagtcttc 780
acccaggcgg aattttcacc tgcaccctat ggcaagggag tttccaaatg gagcatcctg 840
ttcaacggtc aggccaagac gaaacagggc gagggcacga aattcgggat tacctatgaa 900
attcctgtcc tgacgcgctc cgaaaccgtg ctggctgcct ataagcgcct gcgcgaaagc 960
ggacagggaa aattatggca tggcatgtcg atcgacgatt tttcctcgga aacccgcctg 1020
ctgctgcgcg acacggtttt taacctgttc gaggatgtct ggccaaagga agagcttccc 1080
aagccctatg gcctcagaca cctctatgcc gaagtggcct atcacaattt cgcgccaccc 1140
catgtcacca agaacagcta tttcgccgcc attcttggcc acaacaataa cgacctcgaa 1200
acgtcgctgt cctatatgac ctatacgctg ccggaagacc gcgacaatgc gctggcgcgc 1260
ctgaagcgga ccaatgagcg gacattgcag caaatggcga cgatcgcgcc cgtgtcccgc 1320
aagggatga 1329
<210> 12
<211> 442
<212> PRT
<213> 农杆菌(Agrobacterium tumefaciens)菌株C58
<220>
<221> MISC_FEATURE
<222>
<223> 原核端粒酶TelA
<400> 12
Met Leu Ala Ala Lys Arg Lys Thr Lys Thr Pro Val Leu Val Glu Arg
1 5 10 15
Ile Asp Gln Phe Val Gly Gln Ile Lys Glu Ala Met Lys Ser Asp Asp
20 25 30
Ala Ser Arg Asn Arg Lys Ile Arg Asp Leu Trp Asp Ala Glu Val Arg
35 40 45
Tyr His Phe Asp Asn Gly Arg Thr Glu Lys Thr Leu Glu Leu Tyr Ile
50 55 60
Met Lys Tyr Arg Asn Ala Leu Lys Ala Glu Phe Gly Pro Lys Ser Thr
65 70 75 80
Pro Leu Ala Ile Cys Asn Met Lys Lys Leu Arg Glu Arg Leu Asn Thr
85 90 95
Tyr Ile Ala Arg Gly Asp Tyr Pro Lys Thr Gly Val Ala Thr Ser Ile
100 105 110
Val Glu Lys Ile Glu Arg Ala Glu Phe Asn Thr Ala Gly Arg Lys Pro
115 120 125
Thr Val Leu Leu Arg Ile Ala Asp Phe Ile Ala Ala Met Asn Gly Met
130 135 140
Asp Ala Lys Gln Asp Met Gln Ala Leu Trp Asp Ala Glu Ile Ala Ile
145 150 155 160
Met Asn Gly Arg Ala Gln Thr Thr Ile Ile Ser Tyr Ile Thr Lys Tyr
165 170 175
Arg Asn Ala Ile Arg Glu Ala Phe Gly Asp Asp His Pro Met Leu Lys
180 185 190
Ile Ala Thr Gly Asp Ala Ala Met Tyr Asp Glu Ala Arg Arg Val Lys
195 200 205
Met Glu Lys Ile Ala Asn Lys His Gly Ala Leu Ile Thr Phe Glu Asn
210 215 220
Tyr Arg Gln Val Leu Lys Ile Cys Glu Asp Cys Leu Lys Ser Ser Asp
225 230 235 240
Pro Leu Met Ile Gly Ile Gly Leu Ile Gly Met Thr Gly Arg Arg Pro
245 250 255
Tyr Glu Val Phe Thr Gln Ala Glu Phe Ser Pro Ala Pro Tyr Gly Lys
260 265 270
Gly Val Ser Lys Trp Ser Ile Leu Phe Asn Gly Gln Ala Lys Thr Lys
275 280 285
Gln Gly Glu Gly Thr Lys Phe Gly Ile Thr Tyr Glu Ile Pro Val Leu
290 295 300
Thr Arg Ser Glu Thr Val Leu Ala Ala Tyr Lys Arg Leu Arg Glu Ser
305 310 315 320
Gly Gln Gly Lys Leu Trp His Gly Met Ser Ile Asp Asp Phe Ser Ser
325 330 335
Glu Thr Arg Leu Leu Leu Arg Asp Thr Val Phe Asn Leu Phe Glu Asp
340 345 350
Val Trp Pro Lys Glu Glu Leu Pro Lys Pro Tyr Gly Leu Arg His Leu
355 360 365
Tyr Ala Glu Val Ala Tyr His Asn Phe Ala Pro Pro His Val Thr Lys
370 375 380
Asn Ser Tyr Phe Ala Ala Ile Leu Gly His Asn Asn Asn Asp Leu Glu
385 390 395 400
Thr Ser Leu Ser Tyr Met Thr Tyr Thr Leu Pro Glu Asp Arg Asp Asn
405 410 415
Ala Leu Ala Arg Leu Lys Arg Thr Asn Glu Arg Thr Leu Gln Gln Met
420 425 430
Ala Thr Ile Ala Pro Val Ser Arg Lys Gly
435 440
<210> 13
<211> 1668
<212> DNA
<213> 副溶血弧菌(Vibrio parahaemolyticus)噬菌体Vp58.5 Gp40
<220>
<221> misc_feature
<222>
<223> 原核端粒酶
<400> 13
atgaaactaa ctgacggaat ggaccgcaca aagtacatcg ttaaagcggc caaacatatc 60
caagaagaag gtcaagaaaa gggacctaaa tacatcactg accgctgcgg tcgtgtcgct 120
aaggatgagc acaaacgtct tggctgggtt gtggaccagg tgtcaggtga gctggccagc 180
aatccacaaa tcagccataa ccactatatc aatcttatga ataattaccg tagagccatc 240
aaggccctag ggtataagca tcaccaaata gaaaagacat tagtaacttt tatcaataaa 300
tatcaagaat atagacctga aatagcagag atgctggacc catctttgcc aattgatacc 360
ttgagagaga atgtgatcct tctgaaatca caggccaggt caaaaagtga atttcgtagt 420
gacctgcttg gtcttcgcat tgagtttcac ctctactatc tgtttgaacc aaagggcatt 480
gcaaccgata agcgcaaaga gcaagtaaaa gaagcgttga atgaaaagca tgagaacgtc 540
atcaagataa atggcgatca catcaaggaa ctggccacaa aaattctgtc agaaaaggac 600
ccgtcatata cagaccttgc agttggcctt gctcttgcga ctggccgtcg agctaatgag 660
attatgaaga ctgccagctt taagaaatca ggtgaacggt cgcttatgtt tgagggacag 720
ctaaaaaccc ataaccgata cctgtttgaa gaaattggag catacgagat accttgtatt 780
gttgattcag acttagtaat taaaggattg aaattattaa gaaaaaaaac aggagcggaa 840
atcctggaat atactgatgt cactggacgt acagttaaaa aggctgttgc tgacggcgac 900
actaaggacc tgagacacaa tgatgcagtc aaccttcggt tcactgcatc acttaaccag 960
agagtcaagg ccatactagg ccatggagag tttagtttca ggacctgtcg ggccatctat 1020
gtcgaaatag cattccatga gttcagacat aacggagaat cgaaagcggc cttccgtagc 1080
agagttcttg gccactcagg tggtgataaa tcaacacaga accactatga ggggtttgag 1140
cttgattcca aggtggaaac catcggtgtg gttgatatgg gccaaaacga ggctgacaag 1200
tcatacaaca agcaactgct gaagcacctg gagcaatacg atgcaacaat tgcagcctat 1260
ctgagagcgc ctaactggaa acacattcat gattggctaa aagaccaggt gaaaaacggc 1320
ctgcagcttg accaaataac cacaagctat ctgagaaaaa tgtgcatcat caacaacaaa 1380
agcctcaatg caaacaccat cgccaagtac ctggaaacat tgaacctaga taaggttcca 1440
gcagagcaag aggaaagcca tcaggaagaa ctggagcagg aagaagatca gaaagtgtca 1500
tggccaaaag ctaaagacat taaggtccag tctaaaaaag aaggtgatat gtggcatgtc 1560
tggactgagg ttaacggaat gcggtgggaa aattggtcta aaggtagaaa aacagaagct 1620
gtgaaggcat tgcgacaaca atatgagagg gaatcagcgg aaatgtaa 1668
<210> 14
<211> 555
<212> PRT
<213> 副溶血弧菌(Vibrio parahaemolyticus)噬菌体Vp58.5 Gp40
<220>
<221> MISC_FEATURE
<222>
<223> 原核端粒酶
<400> 14
Met Lys Leu Thr Asp Gly Met Asp Arg Thr Lys Tyr Ile Val Lys Ala
1 5 10 15
Ala Lys His Ile Gln Glu Glu Gly Gln Glu Lys Gly Pro Lys Tyr Ile
20 25 30
Thr Asp Arg Cys Gly Arg Val Ala Lys Asp Glu His Lys Arg Leu Gly
35 40 45
Trp Val Val Asp Gln Val Ser Gly Glu Leu Ala Ser Asn Pro Gln Ile
50 55 60
Ser His Asn His Tyr Ile Asn Leu Met Asn Asn Tyr Arg Arg Ala Ile
65 70 75 80
Lys Ala Leu Gly Tyr Lys His His Gln Ile Glu Lys Thr Leu Val Thr
85 90 95
Phe Ile Asn Lys Tyr Gln Glu Tyr Arg Pro Glu Ile Ala Glu Met Leu
100 105 110
Asp Pro Ser Leu Pro Ile Asp Thr Leu Arg Glu Asn Val Ile Leu Leu
115 120 125
Lys Ser Gln Ala Arg Ser Lys Ser Glu Phe Arg Ser Asp Leu Leu Gly
130 135 140
Leu Arg Ile Glu Phe His Leu Tyr Tyr Leu Phe Glu Pro Lys Gly Ile
145 150 155 160
Ala Thr Asp Lys Arg Lys Glu Gln Val Lys Glu Ala Leu Asn Glu Lys
165 170 175
His Glu Asn Val Ile Lys Ile Asn Gly Asp His Ile Lys Glu Leu Ala
180 185 190
Thr Lys Ile Leu Ser Glu Lys Asp Pro Ser Tyr Thr Asp Leu Ala Val
195 200 205
Gly Leu Ala Leu Ala Thr Gly Arg Arg Ala Asn Glu Ile Met Lys Thr
210 215 220
Ala Ser Phe Lys Lys Ser Gly Glu Arg Ser Leu Met Phe Glu Gly Gln
225 230 235 240
Leu Lys Thr His Asn Arg Tyr Leu Phe Glu Glu Ile Gly Ala Tyr Glu
245 250 255
Ile Pro Cys Ile Val Asp Ser Asp Leu Val Ile Lys Gly Leu Lys Leu
260 265 270
Leu Arg Lys Lys Thr Gly Ala Glu Ile Leu Glu Tyr Thr Asp Val Thr
275 280 285
Gly Arg Thr Val Lys Lys Ala Val Ala Asp Gly Asp Thr Lys Asp Leu
290 295 300
Arg His Asn Asp Ala Val Asn Leu Arg Phe Thr Ala Ser Leu Asn Gln
305 310 315 320
Arg Val Lys Ala Ile Leu Gly His Gly Glu Phe Ser Phe Arg Thr Cys
325 330 335
Arg Ala Ile Tyr Val Glu Ile Ala Phe His Glu Phe Arg His Asn Gly
340 345 350
Glu Ser Lys Ala Ala Phe Arg Ser Arg Val Leu Gly His Ser Gly Gly
355 360 365
Asp Lys Ser Thr Gln Asn His Tyr Glu Gly Phe Glu Leu Asp Ser Lys
370 375 380
Val Glu Thr Ile Gly Val Val Asp Met Gly Gln Asn Glu Ala Asp Lys
385 390 395 400
Ser Tyr Asn Lys Gln Leu Leu Lys His Leu Glu Gln Tyr Asp Ala Thr
405 410 415
Ile Ala Ala Tyr Leu Arg Ala Pro Asn Trp Lys His Ile His Asp Trp
420 425 430
Leu Lys Asp Gln Val Lys Asn Gly Leu Gln Leu Asp Gln Ile Thr Thr
435 440 445
Ser Tyr Leu Arg Lys Met Cys Ile Ile Asn Asn Lys Ser Leu Asn Ala
450 455 460
Asn Thr Ile Ala Lys Tyr Leu Glu Thr Leu Asn Leu Asp Lys Val Pro
465 470 475 480
Ala Glu Gln Glu Glu Ser His Gln Glu Glu Leu Glu Gln Glu Glu Asp
485 490 495
Gln Lys Val Ser Trp Pro Lys Ala Lys Asp Ile Lys Val Gln Ser Lys
500 505 510
Lys Glu Gly Asp Met Trp His Val Trp Thr Glu Val Asn Gly Met Arg
515 520 525
Trp Glu Asn Trp Ser Lys Gly Arg Lys Thr Glu Ala Val Lys Ala Leu
530 535 540
Arg Gln Gln Tyr Glu Arg Glu Ser Ala Glu Met
545 550 555
<210> 15
<211> 56
<212> DNA
<213> 大肠杆菌(Escherichia coli)噬菌体N15
<220>
<221> misc_feature
<222>
<223> 原核端粒酶靶点序列
<400> 15
tatcagcaca caattgccca ttatacgcgc gtataatgga ctattgtgtg ctgata 56
<210> 16
<211> 50
<212> DNA
<213> 克雷伯菌(Klebsiella)噬菌体phiK02
<220>
<221> misc_feature
<222>
<223> 原核端粒酶靶点序列
<400> 16
cagcacacaa cagcccatta tacgcgcgta taatgggcta ttatgtgctg 50
<210> 17
<211> 52
<212> DNA
<213> 小肠结肠炎耶尔森氏菌(Yersinia enterolytica)噬菌体PY54
<220>
<221> misc_feature
<222>
<223> 原核端粒酶靶点序列
<400> 17
tagtcaccta tttcagcata ctacgcgcgt agtatgctga aataggttac tg 52
<210> 18
<211> 90
<212> DNA
<213> 弧菌属(Vibrio sp.)噬菌体VP882
<220>
<221> misc_feature
<222>
<223> 原核端粒酶靶点序列
<400> 18
gggatcccgt tccatacata catgtatcca tgtggcatac tatacgtata gtatgccgat 60
gttacatatg gtatcattcg ggatcccgtt 90
<210> 19
<211> 38
<212> DNA
<213> 伯氏疏螺旋体菌(Borrelia burgdorferi)
<220>
<221> misc_feature
<222>
<223> 原核端粒酶靶点序列
<400> 19
tactaaataa atattatata tataattttt tattagta 38
<210> 20
<211> 50
<212> DNA
<213> 农杆菌(Agrobacterium tumefaciens)菌株C58
<220>
<221> misc_feature
<222>
<223> 原核端粒酶靶点序列
<400> 20
gcgatcgatc ataataacaa tatcatgata ttgttattgt aatcgatcgc 50
<210> 21
<211> 56
<212> DNA
<213> 副溶血弧菌(Vibrio parahaemolyticus)噬菌体Vp58.5 Gp40
<220>
<221> misc_feature
<222>
<223> 原核端粒酶靶点序列
<400> 21
aacctgcaca ggtgtacata tagtctaatt agactatatg tacacctgtg caggtt 56
<210> 22
<211> 26
<212> DNA
<213> 农杆菌(Agrobacterium tumefaciens)菌株C58
<220>
<221> misc_feature
<222>
<223> 原核端粒酶靶点序列
<400> 22
aataacaata tcatgatatt gttatt 26
<210> 23
<211> 65
<212> DNA
<213> 人工序列(Artificial)
<220>
<221>
<222>
<223> 茎环基序
<400> 23
gggcggtcgg ctgcgcgcgt gggccaagtc tccctacaag ggcccacgcg cgcagccgac 60
cgccc 65
<210> 24
<211> 75
<212> DNA
<213> 人工序列(Artificial)
<220>
<221>
<222>
<223> 茎环基序
<400> 24
gggcggtcgg ctgcgcgcgt gggccaaaaa aagtctccct acaagaaaaa ggcccacgcg 60
cgcagccgac cgccc 75
<210> 25
<211> 75
<212> DNA
<213> 人工序列(Artificial)
<220>
<221>
<222>
<223> 茎环基序
<400> 25
gggcggtcgg ctgcgcgcgt gggccaaaaa aaaaaaagtc tccctacaag ggcccacgcg 60
cgcagccgac cgccc 75
<210> 26
<211> 75
<212> DNA
<213> 人工序列(Artificial)
<220>
<221>
<222>
<223> 茎环基序
<400> 26
gggcggtcgg ctgcgcgcgt gggccaagtc tccctacaag aaaaaaaaaa ggcccacgcg 60
cgcagccgac cgccc 75
<210> 27
<211> 45
<212> DNA
<213> 人工序列(Artificial)
<220>
<221>
<222>
<223> 茎环基序
<400> 27
gggcggtcgg gtgcgaagtc tccctacaag cgcacccgac cgccc 45
<210> 28
<211> 55
<212> DNA
<213> 人工序列(Artificial)
<220>
<221>
<222>
<223> 茎环基序
<400> 28
gggcggtcgg gtgcgaaaaa aagtctccct acaagaaaaa cgcacccgac cgccc 55
<210> 29
<211> 55
<212> DNA
<213> 人工序列(Artificial)
<220>
<221>
<222>
<223> 茎环基序
<400> 29
gggcggtcgg gtgcgaaaaa aaaaaaagtc tccctacaag cgcacccgac cgccc 55
<210> 30
<211> 55
<212> DNA
<213> 人工序列(Artificial)
<220>
<221>
<222>
<223> 茎环基序
<400> 30
gggcggtcgg gtgcgaagtc tccctacaag aaaaaaaaaa cgcacccgac cgccc 55
<210> 31
<211> 41
<212> DNA
<213> 人工序列(Artificial)
<220>
<221>
<222>
<223> 茎环基序图10a
<400> 31
aaatataaac ctaaagtctc cctacaagta agtttatatt t 41
<210> 32
<211> 7
<212> DNA
<213> 人工序列(Artificial)
<220>
<221>
<222>
<223> 引物
<400> 32
tagggag 7
<210> 33
<211> 9
<212> DNA
<213> 人工序列(Artificial)
<220>
<221>
<222>
<223> 引物
<400> 33
gtagggaga 9
<210> 34
<211> 11
<212> DNA
<213> 人工序列(Artificial)
<220>
<221>
<222>
<223> 引物
<400> 34
tgtagggaga c 11
<210> 35
<211> 13
<212> DNA
<213> 人工序列(Artificial)
<220>
<221>
<222>
<223> 引物
<400> 35
ttgtagggag act 13
<210> 36
<211> 15
<212> DNA
<213> 人工序列(Artificial)
<220>
<221>
<222>
<223> 引物
<400> 36
cttgtaggga gactt 15
<210> 37
<211> 11
<212> DNA
<213> 人工序列(Artificial)
<220>
<221>
<222>
<223> 引物
<400> 37
gcgtataatg g 11

Claims (20)

1.一种无细胞生产闭合线性脱氧核糖核酸(DNA)分子的方法,所述方法包括:
(a)在至少一种引物存在下,使模板与链置换聚合酶在促进所述模板扩增的条件下接触,所述模板包含在每一端通过原核端粒酶识别序列的部分共价闭合的线性双链DNA分子,并且还包含至少一个茎环基序,所述引物能够特异性结合在所述茎环基序内的引物结合位点;
(b)在促进闭合线性DNA生产的条件下,使(a)中生产的DNA与至少一种原核端粒酶接触。
2.如权利要求1所述的方法,其中所述茎环基序的序列包含被两条序列侧接的中心段。
3.如权利要求1或权利要求2所述的方法,其中茎环基序的中心段的序列包含引物结合位点,其任选地与相邻序列形成中心段的部分。
4.如前述权利要求任一项所述的方法,其中形成茎环基序的所述序列相邻于或者接近于模板的共价闭合端内的原核端粒酶识别序列的部分。
5.如前述权利要求任一项所述的方法,其中所述茎环基序的序列能够在促进形成茎环结构的条件下形成该二级结构。
6.如权利要求5所述的方法,其中茎环基序的序列包含在侧翼序列内的允许形成茎环的自身互补序列。
7.如权利要求5所述的方法,其中茎环基序的序列包含在侧翼序列内的与桥接寡核苷酸互补的序列。
8.如前述权利要求任一项所述的方法,其中所述共价闭合端的每一个均包含不同原核端粒酶识别序列的部分。
9.如前述权利要求任一项所述的方法,其中所述模板包含一个或多个额外的原核端粒酶识别序列。
10.如权利要求9所述的方法,其中所述模板包含两个额外的原核端粒酶识别序列,任选地,其中各额外的原核端粒酶识别序列通过至少一个茎环基序与模板的闭合端分开。
11.一种线性双链DNA分子,其在各端被原核端粒酶识别序列的部分共价闭合,其中所述线性双链DNA分子的序列包含至少一个茎环基序。
12.如权利要求11所述的线性双链DNA分子,其中所述茎环基序如权利要求2至7任一项中所述。
13.如权利要求11或12所述的线性双链DNA分子,其中所述分子包含一个或多个额外的原核端粒酶识别序列。
14.如权利要求13所述的线性双链DNA分子,其中所述额外的原核端粒酶识别序列通过至少一个茎环基序与闭合端分开。
15.一种DNA的串联体单链,其包含串联共价连接在一起的DNA序列的两个或更多个相同单元,每个单元包含原核端粒酶识别序列的至少一部分和至少一个茎环结构。
16.如权利要求15所述的DNA的串联体单链,其中DNA序列的各单元均包含用于如权利要求11或权利要求12所述的线性双链DNA分子的序列。
17.如权利要求15或权利要求16所述的DNA的串联体单链,其中所述DNA的串联体单链与茎环结构形成纳米花。
18.一种试剂盒,其适于实施权利要求1至10任一项所述的方法,所述试剂盒包含:
(a)在各端通过原核端粒酶识别序列的部分共价闭合的线性双链DNA分子,其中所述线性双链DNA分子的序列包含至少一个茎环基序;
(b)原核端粒酶;和任选地;
(c)桥接寡核苷酸。
19.如权利要求18所述的试剂盒,其中所述模板如权利要求11至14任一项中所定义。
20.如权利要求18或19所述的试剂盒,还包含DNA聚合酶和任选的引物。
CN201780063788.2A 2016-08-16 2017-08-16 闭合线性dna的生产 Active CN109844134B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310457342.5A CN116732145A (zh) 2016-08-16 2017-08-16 闭合线性dna的生产

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GBGB1613994.1A GB201613994D0 (en) 2016-08-16 2016-08-16 Production of closed linear DNA
GB1613994.1 2016-08-16
GB1621954.5 2016-12-22
GBGB1621954.5A GB201621954D0 (en) 2016-12-22 2016-12-22 Closed linear DNA production
PCT/GB2017/052413 WO2018033730A1 (en) 2016-08-16 2017-08-16 Closed linear dna production

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202310457342.5A Division CN116732145A (zh) 2016-08-16 2017-08-16 闭合线性dna的生产

Publications (2)

Publication Number Publication Date
CN109844134A true CN109844134A (zh) 2019-06-04
CN109844134B CN109844134B (zh) 2023-05-05

Family

ID=59702752

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202310457342.5A Pending CN116732145A (zh) 2016-08-16 2017-08-16 闭合线性dna的生产
CN201780063788.2A Active CN109844134B (zh) 2016-08-16 2017-08-16 闭合线性dna的生产

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202310457342.5A Pending CN116732145A (zh) 2016-08-16 2017-08-16 闭合线性dna的生产

Country Status (7)

Country Link
US (2) US11505821B2 (zh)
EP (2) EP3500682B1 (zh)
CN (2) CN116732145A (zh)
DK (1) DK3500682T3 (zh)
ES (1) ES2813324T3 (zh)
LT (1) LT3500682T (zh)
WO (1) WO2018033730A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113201583A (zh) * 2021-04-29 2021-08-03 中国科学院大学宁波生命与健康产业研究院 恒温条件下合成核酸的方法及试剂盒和应用
CN116606834A (zh) * 2023-04-10 2023-08-18 天津中合基因科技有限公司 多种具有切割连接活性的原端酶及其应用

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10077459B2 (en) 2016-05-04 2018-09-18 General Electric Company Cell-free protein expression using rolling circle amplification product
US10590452B2 (en) * 2017-12-20 2020-03-17 University Of Seoul Industry Cooperation Foundation DNA-Mn hybrid particles and method of manufacturing the same
GB201905651D0 (en) * 2019-04-24 2019-06-05 Lightbio Ltd Nucleic acid constructs and methods for their manufacture
EP3792367A1 (en) 2019-09-11 2021-03-17 Universität Bielefeld Method for the production of raav and method for the in vitro generation of genetically engineered, linear, single-stranded nucleic acid fragments containing itr sequences flanking a gene of interest
SG11202110571YA (en) * 2019-10-25 2021-10-28 Illumina Cambridge Ltd Methods for generating, and sequencing from, asymmetric adaptors on the ends of polynucleotide templates comprising hairpin loops
JP2023506631A (ja) * 2019-12-20 2023-02-17 キージーン ナムローゼ フェンノートシャップ 共有結合で閉端された核酸分子末端を使用したngsライブラリー調製
JP2023511991A (ja) * 2020-01-31 2023-03-23 ティリス セラピューティクス,エセ.エレ. 閉じた直鎖dnaを作製するためのプロセス
CA3181680A1 (en) 2020-06-12 2021-12-16 University Of Rochester Encoding and expression of ace-trnas
CN112080475B (zh) * 2020-07-30 2022-02-11 扬州大学 一种副溶血性弧菌噬菌体及其在检测副溶血性弧菌大流行株活细胞含量中的应用
GB202014751D0 (en) * 2020-09-18 2020-11-04 Lightbio Ltd Targeting vector
GB202108176D0 (en) 2021-06-08 2021-07-21 Touchlight Ip Ltd Vector
IL308705A (en) 2021-06-08 2024-01-01 Touchlight Ip Ltd LENTIVIRAL vector
WO2022272297A1 (en) 2021-06-25 2022-12-29 Oxford Biomedica Solutions Llc Adeno-associated virus packaging systems
WO2023114901A2 (en) 2021-12-15 2023-06-22 Oxford Biomedica Solutions Llc Methods and compositions for the production of adeno-associated virus
WO2023122525A1 (en) 2021-12-20 2023-06-29 Zoetis Services Llc Compositions and methods for prevention of piscine myocarditis
WO2023122523A1 (en) 2021-12-20 2023-06-29 Zoetis Services Llc Compositions and methods for expressing antigens on cell membrane
WO2023122526A1 (en) 2021-12-20 2023-06-29 Zoetis Services Llc Use of interferon as an adjuvant in vaccines
WO2023154788A2 (en) * 2022-02-10 2023-08-17 Code Biotherapeutics, Inc. Enhanced dna dendrimers and methods of use thereof
WO2023220729A2 (en) * 2022-05-13 2023-11-16 Flagship Pioneering Innovations Vii, Llc Double stranded dna compositions and related methods
EP4293101A1 (en) 2022-06-14 2023-12-20 Asklepios Biopharmaceutical, Inc. Reactor with temperature control and method of using the same
WO2024059486A1 (en) 2022-09-12 2024-03-21 Zoetis Services Llc Method of administration of aquaculture vaccines

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101313067A (zh) * 2005-11-25 2008-11-26 莫洛根股份公司 以rna干扰特异性抑制基因表达的dna构建体
CN101384721A (zh) * 2006-02-13 2009-03-11 孟山都技术有限公司 选择和稳定dsRNA构建体
CN102084001A (zh) * 2008-03-28 2011-06-01 加利福尼亚太平洋生物科学股份有限公司 用于核酸测序的组合物和方法
CN102301010A (zh) * 2009-01-30 2011-12-28 触光基因学有限公司 闭合线状dna的制备
CN103080337A (zh) * 2010-08-04 2013-05-01 触光基因学有限公司 利用回文序列生产闭合线性dna
WO2014020154A1 (en) * 2012-08-03 2014-02-06 Alacris Theranostics Gmbh Method for nucleic acid amplification
US20140329282A1 (en) * 2011-09-06 2014-11-06 Gen-Probe Incorporated Closed nucleic acid structures
WO2016034849A1 (en) * 2014-09-05 2016-03-10 Touchlight Genetics Limited Synthesis of dna

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4628679B2 (ja) * 2002-04-09 2011-02-09 協和発酵キリン株式会社 Gdp−フコースの輸送に関与する蛋白質の活性が低下または欠失した細胞
US9404147B2 (en) * 2011-12-19 2016-08-02 Gen-Probe Incorporated Closed nucleic acid structures

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101313067A (zh) * 2005-11-25 2008-11-26 莫洛根股份公司 以rna干扰特异性抑制基因表达的dna构建体
CN101384721A (zh) * 2006-02-13 2009-03-11 孟山都技术有限公司 选择和稳定dsRNA构建体
CN102084001A (zh) * 2008-03-28 2011-06-01 加利福尼亚太平洋生物科学股份有限公司 用于核酸测序的组合物和方法
CN102301010A (zh) * 2009-01-30 2011-12-28 触光基因学有限公司 闭合线状dna的制备
CN103080337A (zh) * 2010-08-04 2013-05-01 触光基因学有限公司 利用回文序列生产闭合线性dna
US20140329282A1 (en) * 2011-09-06 2014-11-06 Gen-Probe Incorporated Closed nucleic acid structures
WO2014020154A1 (en) * 2012-08-03 2014-02-06 Alacris Theranostics Gmbh Method for nucleic acid amplification
WO2016034849A1 (en) * 2014-09-05 2016-03-10 Touchlight Genetics Limited Synthesis of dna

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
许进等: "DNA计算机原理、进展及难点(Ⅲ):分子生物计算中的数据结构与特性", 《计算机学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113201583A (zh) * 2021-04-29 2021-08-03 中国科学院大学宁波生命与健康产业研究院 恒温条件下合成核酸的方法及试剂盒和应用
CN113201583B (zh) * 2021-04-29 2022-02-08 国科宁波生命与健康产业研究院 恒温条件下合成核酸的方法及试剂盒和应用
CN116606834A (zh) * 2023-04-10 2023-08-18 天津中合基因科技有限公司 多种具有切割连接活性的原端酶及其应用

Also Published As

Publication number Publication date
US20230272461A1 (en) 2023-08-31
US20190185924A1 (en) 2019-06-20
DK3500682T3 (da) 2020-08-24
CN109844134B (zh) 2023-05-05
CN116732145A (zh) 2023-09-12
ES2813324T3 (es) 2021-03-23
EP3500682B1 (en) 2020-07-08
US11505821B2 (en) 2022-11-22
EP3500682A1 (en) 2019-06-26
EP3763823A1 (en) 2021-01-13
WO2018033730A1 (en) 2018-02-22
LT3500682T (lt) 2020-10-26
ES2813324T8 (es) 2021-03-31

Similar Documents

Publication Publication Date Title
CN109844134A (zh) 闭合线性dna的生产
US11390904B2 (en) Nanopore-based method and double stranded nucleic acid construct therefor
JP6745599B2 (ja) 分子の作製
KR102623312B1 (ko) Ruvc 도메인이 존재하는 효소
US9834774B2 (en) Methods and compositions for rapid seamless DNA assembly
CA2751470C (en) Template-independent ligation of single-stranded dna
CN103827318B (zh) 用于操作生物分子的方法
CN107532210A (zh) Dna合成的方法
JP2019107015A (ja) リガーゼ支援核酸環状化及び増幅
US20070015182A1 (en) Generation of single-strand circular DNA from linear self-annealing segments
KR102278495B1 (ko) Dna 생산 방법 및 dna 단편 연결용 키트
HUE027961T2 (en) Transposon final preparations and methods for modifying nucleic acids
US9376698B2 (en) Mutant DNA polymerases
CN110446783A (zh) 环状dna的复制或扩增方法
CN109415718A (zh) 环状dna的扩增方法
US20230257805A1 (en) Methods for ligation-coupled-pcr
JP7313645B2 (ja) Rna検出方法
EP2733208B1 (en) Method for large-scale synthesis of long-chain nucleic acid molecule
WO2023076952A1 (en) Enzymes with hepn domains
CN101535478B (zh) 核酸扩增方法
US9988659B1 (en) In vivo conversion of nucleosides in plasmid DNA
JP7348197B2 (ja) 鋳型切り換え機構を通じて核酸ライブラリを調製するためのシステムと方法
JP4942160B2 (ja) RecAタンパク質を利用した核酸の等温増幅法
WO2019014359A2 (en) POLYMERASE CHAIN TRANSCRIPTION (PCT): EXPONENTIAL SYNTHESIS OF RNA AND MODIFIED RNA
Ahrabi et al. Whole genome amplification: Use of advanced isothermal method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Hampton

Applicant after: TOUCHLIGHT GENETICS LTD.

Address before: London

Applicant before: TOUCHLIGHT GENETICS LTD.

GR01 Patent grant
GR01 Patent grant