本申请含有序列表,其已以ASCII格式电子提交,并且在此通过引用整体并入。于2017年6月16日创建的所述ASCII副本,命名为316478-1_SL.txt,且大小为5,663字节。
发明详述
下述详述是示例性的,并且不预期限制本发明或本发明的用途。在说明书各处,特定术语的例示应该被视为非限制性的实例。除非上下文另有明确说明,否则单数形式“a”、“an”和“the”包括复数对象。如本文在说明书和权利要求各处所使用的,近似语言可以应用于修饰任何定量表示,其可以在不导致与之有关的基本功能的变化的情况下允许变化。相应地,由术语如“约”修饰的值并不限于所指定的精确值。除非另有说明,否则在说明书和权利要求中使用的表示成分数量、性质例如分子量、反应条件等等的所有数字应理解为在所有情况下由术语“约”修饰。相应地,除非指示相反,否则在下述说明书和所附权利要求中所阐述的数值参数是近似值,其可以根据寻求通过本发明获得的所需性质而变。必要时,已提供了范围,并且这些范围包括其间的所有子范围。为了更清楚和简明地描述且指出本发明的主题,对于在下述描述和所附权利要求中使用的特定术语提供了下述定义。
如本文使用的,术语“核苷”指其中核酸碱基(核碱基)与糖部分连接的糖基胺化合物。“核苷酸”指核苷磷酸。核苷酸可以使用对应于其如表1中描述的核苷的字母表字母(字母名称)表示。例如,A指示腺苷(含有核碱基腺嘌呤的核苷),C指示胞苷,G指示鸟苷,U指示尿苷,且T指示胸苷(5-甲基尿苷)。N表示随机核苷,且dNTP指脱氧核糖核苷三磷酸。N可以是A、C、G或T/U中的任一个。
表1:各种核苷酸的字母名称。
符号字母 |
由符号字母表示的核苷酸 |
G |
G |
A |
A |
T |
T |
C |
C |
U |
U |
N |
G或A或T/U或C |
如本文使用的,术语“核苷酸类似物”指与天然存在的核苷酸在结构上相似的化合物。核苷酸类似物可以具有改变的磷酸酯主链、糖部分、核碱基或其组合。核苷酸类似物可以是天然核苷酸、合成核苷酸、修饰的核苷酸或替代替换部分(例如肌苷)。一般地,具有改变的核碱基的核苷酸类似物尤其赋予不同的碱基配对和碱基堆积特性。如本文使用的,术语“LNA(锁核酸)核苷酸”指核苷酸类似物,其中核苷酸的糖部分含有锁定在模仿核糖核酸(RNA)的糖构象中的二环呋喃糖单元。从脱氧核糖核苷酸(或核糖核苷酸)到LNA核苷酸的结构变化从化学角度来看受到限制,即在2′位置和4′位置处的碳原子之间引入另外的键(例如2'-C,4'-C-氧基亚甲基键;参见例如,Singh,S. K.等人,Chem. Comm.,4,455−456,1998,或Koshkin,A. A.等人,Tetrahedron,54,3607−3630,1998.)。LNA核苷酸中的呋喃糖单元的2′和4′位置可以通过O-亚甲基(例如,氧基-LNA:2′-O,4′-C-亚甲基-β-D-呋喃核糖基核苷酸)、S-亚甲基(硫代-LNA)或NH-亚甲基部分(氨基-LNA)等等连接。此类键限制了呋喃糖环的构象自由。LNA寡核苷酸展示针对互补的单链RNA和互补的单链或双链DNA增强的杂交亲和力。LNA寡核苷酸可以诱导A型(RNA样)双链体构象。PNA的主链由通过肽键连接的重复N-(2-氨基乙基)-甘氨酸单元组成。各种嘌呤和嘧啶碱基通过亚甲基桥(-CH2-)和羰基(-(C =O)-)连接至主链。PNA像肽一样描绘,其中N末端在第一个(左侧)位置处,且C末端在最后一个(右侧)位置处。PNA寡聚物在与互补DNA结合中显示更大的特异性,结合效率和特异性也适用于PNA/RNA双链体。PNA不容易被核酸酶或蛋白酶识别,使得其对通过酶的降解有抵抗力。PNA在广泛的pH范围内也是稳定的。具有改变的磷酸-糖主链的核苷酸类似物(例如,PNA、LNA)经常尤其修饰链特性,例如二级结构的形成。字母名称前的星号(*)符号指示由该字母指定的核苷酸是硫代磷酸酯修饰的核苷酸。例如,*N表示硫代磷酸酯修饰的随机核苷酸,“atN”表示随机核苷酸,其中核苷酸可以是2-氨基dA、2-硫代-dT、正常G或正常C中的任一个。字母名称前的加号(+)符号指示由该字母指定的核苷酸是LNA核苷酸。例如,+A表示腺苷LNA核苷酸,且+N表示锁定的随机核苷酸(即,随机的LNA核苷酸)。
如本文使用的,术语“修饰的核苷酸”指具有修饰的核苷酸,其中另外的部分附着至核苷酸(例如,生物素化的核苷酸)。修饰可以面向大沟或小沟。修饰的核苷酸是用于将功能基团酶促引入目的核酸靶内的方便工具。对核碱基大沟的修饰允许对于嘧啶的5位置和嘌呤的7位置的更好的掺入效率。通常,所需的修饰通过接头引入核苷酸(例如,生物素部分经由接头附着至核苷酸)。附着至修饰位点的接头臂的柔性可以影响核苷酸利用。例如,刚性线性接头在核酸扩增时提供了更好的dNTP掺入。接头臂的长度在扩增过程中修饰的dNTP的掺入中也发挥了作用。例如,经常通过将5-氨基烯丙基-dCTP和5-氨基烯丙基-dUTP与含生物素的接头缀合,以制备生物素化的核苷酸,来制备生物素化的核苷酸。接头的位置和长度也影响关于四种dNTP各自的功能基团引入。与具有较长接头臂的核苷酸相比,具有较短接头臂的修饰的dNTP是用于扩增反应的更好的底物。
如本文使用的,术语“寡核苷酸”指核苷酸的寡聚物。如本文使用的,术语“核酸”指核苷酸的聚合物。如本文使用的,术语“序列”指寡核苷酸或核酸的核苷酸序列。在说明书自始至终,每当寡核苷酸或核酸由字母序列表示时,核苷酸从左到右按5´→3´次序。寡核苷酸或核酸可以是DNA、RNA或其类似物(例如硫代磷酸酯类似物)。寡核苷酸或核酸还可以包括修饰的碱基和/或主链(例如,修饰的磷酸酯键或修饰的糖部分)。对核酸赋予稳定性和/或其它优点的合成主链的非限制性实例可以包括硫代磷酸酯键、肽核酸、锁核酸、木糖核酸或其类似物。
如本文使用的,术语“引物”指短的线性寡核苷酸,其与靶核酸序列(例如,待扩增的DNA模板)杂交以引发核酸合成反应。引物可以是RNA寡核苷酸、DNA寡核苷酸或嵌合序列。引物可以含有天然、合成或修饰的核苷酸。凭经验确定引物长度的上限和下限两者。关于引物长度的下限是当在核酸扩增反应条件下与靶核酸杂交时形成稳定的双链体所需的最小长度。在此类杂交条件下,非常短的引物(通常小于3个核苷酸长)不与靶核酸形成热力学稳定的双链体。上限经常由在靶核酸中除预定的核酸序列外的区域中具有双链体形成的可能性来确定。一般地,合适的引物长度在约3个核苷酸长至约40个核苷酸长的范围内。
如本文使用的,术语“随机引物”指通过以下生成的引物序列的混合物:以使得给定位置可以由任何可能的核苷酸或其类似物(完全随机化)组成的方式,随机化寡核苷酸序列中的任何给定位置处的核苷酸。因此,随机引物是寡核苷酸序列的随机混合物,其由序列内核苷酸的每一种可能的组合组成。例如,六聚体随机引物可以由序列NNNNNN或(N)6表示。六聚体随机DNA引物由4种DNA核苷酸A、C、G和T的每一种可能的六聚体组合组成,导致包含46(4,096)个独特的六聚体DNA寡核苷酸序列的随机混合物。当靶核酸的序列未知或用于执行全基因组扩增反应时,随机引物可以有效地用于引发核酸合成反应。取决于引物的浓度,随机引物还可以有效引发且产生双链滚环扩增(RCA)产物,而不是单链RCA产物。
如本文使用的,术语“滚环扩增(RCA)”指经由滚环机制扩增环状核酸模板(例如,单链/双链DNA环)的核酸扩增反应。滚动扩增反应通过引物与经常为单链的环状核酸模板杂交而启动。核酸聚合酶然后通过环绕环状核酸模板连续前进,以反复不断地复制核酸模板的序列(滚环机制),延伸与环状核酸模板杂交的引物。滚环扩增通常产生包含环状核酸模板序列的串联重复单元的多联体。滚环扩增可以是显示出线性扩增动力学的线性RCA(LRCA)(例如,使用单个特异性引物的RCA),或者可以是显示出指数扩增动力学的指数RCA(ERCA)。滚环扩增也可以使用多重引物执行(多重引发的滚环扩增或MPRCA),导致高分支的多联体。例如,在双重引发的RCA中,一个引物可以如在线性RCA中一样与环状核酸模板互补,而另一个可以与RCA产物的串联重复单元核酸序列互补。因而,双重引发的RCA可以作为具有指数扩增动力学的链反应前进,其特征在于涉及两个引物和两条链的多重杂交、引物延伸和链置换事件的系列级联。这经常生成多联体双链核酸扩增产物的离散集合。可以使用合适的核酸聚合酶(例如Phi29 DNA聚合酶)在等温条件下在体外执行RCA。合适的聚合酶具有链置换DNA合成能力。
如本文使用的,术语“表达序列”指具有蛋白质表达能力的DNA序列。换言之,表达序列是表达能力单元,其包括与一个或多个开放读码框(ORF)可操作地连接的至少一个启动子。一个或多个ORF可以编码一种或多种相同或不同的蛋白质。在一些情况下,表达序列可以包括与多于一个ORF可操作地连接的一个启动子。例如,表达序列可以包括与两个不同ORF功能性连接的启动子,一个ORF编码抗体的重链,且另一个编码抗体的轻链。表达序列可以进一步包括序列如不依赖于帽的翻译元件(CITE),用于帮助有效的蛋白质表达。
一个或多个实施方案涉及用于在无真核细胞的表达系统(例如,体外转录和翻译系统或IVTT)中表达蛋白质的方法。在一个实施方案中,通过双链多联体DNA(例如,通过滚环扩增生成的RCA产物DNA)的体外转录和翻译来表达蛋白质。这些体外转录和翻译反应产生缺乏完整细胞的任何污染的蛋白质产物。此类蛋白质的生成在包括结构和功能蛋白质组学在内的大量应用中可能是需要的。此类蛋白质的无细胞表达对于治疗应用可能是特别期望的。
无细胞表达一般涵盖两种模式:(1)在单个反应(例如,偶联的IVTT)中制备mRNA和蛋白质,和(2)在第一反应中制备mRNA,并且将所得到的mRNA产物加入第二个单独的翻译反应(例如,连接的IVTT)中。双链多联体DNA,例如双链RCA产物DNA可以用于任一模式(1)或(2)。例如,在一个实施方案中,可以将RCA产物提供给偶联的体外转录-翻译反应,其中RCA产物DNA被转化为mRNA,并且mRNA在单个反应混合物中同时被表达为蛋白质,所述单个反应混合物能够产生RNA和蛋白质。在另一个实施方案中,可以将RCA产物提供给连接的转录-翻译反应,其中RCA产物DNA首先在转录反应混合物中被转化为mRNA,然后将生成的mRNA加入翻译反应混合物中用于蛋白质表达。在一些实施方案中,提供给偶联的体外转录-翻译反应或连接的转录-翻译反应的RCA产物衍生自DNA小环。
在一个实施方案中,用于体外转录和翻译的方法包括以下步骤:使双链多联体DNA与无真核细胞的表达系统接触,并且在无真核细胞的表达系统中由双链多联体DNA在体外表达蛋白质。该双链多联体DNA包含多个串联重复序列。多个串联重复序列各自包含表达序列,所述表达序列包含启动子、不依赖于帽的翻译元件(CITE)和ORF。无真核细胞的表达系统中的双链多联体DNA的最终浓度在约0.1 ng/μL至约35 ng/μL的范围内。图1和3-5示出了使用不同浓度的双链多联体DNA作为模板用于体外转录和翻译反应的不同蛋白质的无细胞表达。在一些实施方案中,双链多联体DNA是双链滚环扩增(RCA)产物。在一些实施方案中,RCA产物DNA衍生自最简单的表达序列。最简单的表达序列(小环)的一个实施方案显示于图2中。图2示出了包含转录终止子(p11A + T7终止子)的最简单的表达序列,所述转录终止子包括聚A序列p11A,其中p11A表示11个腺嘌呤残基。
在一些实施方案中,多个串联重复序列各自包含至少一个表达序列。在此类实施方案中,至少一个表达序列包含至少一个启动子、至少一个CITE和至少一个ORF。在一些实施方案中,多个串联重复序列各自包含两个或更多个表达序列。两个或更多个表达序列可以编码相同的蛋白质或不同的蛋白质。在一些实施方案中,表达序列包括与至少一个ORF功能性连接的至少一个启动子。例如,在一个方面,在表达序列中,一个启动子功能性连接至一个ORF,如图6A和图6B中示意性示出的。在另一个方面,在表达序列中,一个启动子功能性连接至两个不同的ORF,如图6C中示意性示出的。在一些实施方案中,表达序列可以包括与两个或更多个ORF功能性连接的两个或更多个启动子。
进一步参考图6A-C,图6A示出了包括两个表达序列的串联重复序列,其中两个表达序列编码相同的蛋白质。在另一个实例中,图6B示出了包括两个表达序列的串联重复序列,其中第一表达序列编码第一蛋白质,且第二表达序列编码第二蛋白质,所述第一蛋白质不同于所述第二蛋白质。在图6A和图6B两者中,所示的表达序列包括功能性连接至不依赖于帽的翻译元件(例如,IRES)和单个ORF的启动子。
图6C示出了包括编码两种不同蛋白质的两个ORF的表达序列。在图6C中,表达序列包括与两个不同的ORF可操作地连接的启动子,所述ORF各自编码彼此不同的蛋白质。在这个实例中,单个启动子经由不依赖于帽的翻译元件功能性连接至两个ORF。ORF各自包括翻译起始和翻译终止序列。需要具有翻译中止或终止序列,否则可能合成无限的多蛋白,这是不期望的。然而,转录终止密码子对于第一个ORF可能是任选的,导致在转录时生成多顺反子mRNA。在此类情况下,可以选择第一ORF和第二ORF之间的间插序列,使得在IVTT时,即使产生单个多顺反子mRNA,它也可以翻译成两种不同的蛋白质。
在图6C中,一个启动子与IRES和两个ORF(例如,第一ORF和第二ORF)功能性偶联。第一ORF编码第一蛋白质,且第二ORF编码与第一蛋白质不同的第二蛋白质。ORF各自包括翻译起始和翻译终止序列。在图6C所示的表达序列转录后产生多顺反子mRNA。通过第一ORF的翻译的第一蛋白质合成,随后可以是核糖体滑向第二ORF的第二翻译起始序列,以启动来自第二ORF的第二蛋白质的合成。这可以通过在第一ORF和第二ORF之间掺入“自切割序列”来实现。合适的自切割序列,例如病毒P2A基序,促进从一个单一mRNA产生两种或更多种蛋白质。
如上所述,在不存在IRES元件的情况下,可以将“自切割” 2A肽掺入多顺反子序列内,以在翻译时从相同的mRNA产生等摩尔水平的多个基因。这些2A肽通常通过使核糖体跳过在2A元件的C末端处的肽键合成而起作用,导致在2A序列的末端与下一个下游肽的起始之间的分开。“切割”发生在C末端上存在的甘氨酸和脯氨酸残基之间,意指上游顺反子具有加入末端中的几个另外的残基,而下游顺反子以脯氨酸起始。四种不同的2A肽,例如SEQ.ID. No. 1-4(表2),通常用于真核细胞中的自切割目的。
表2:代表性的2A肽序列。
SEQ. ID. No. |
肽 |
氨基酸序列 |
1 |
T2A |
(GSG)EGRGSLLTCGDVEENPGP |
2 |
P2A |
(GSG)ATNFSLLKQAGDVEENPGP |
3 |
E2A |
(GSG)QCTNYALLKLAGDVESNPGP |
4 |
F2A |
(GSG)VKQTLNFDLLKLAGDVESNPGP |
在一个或多个实施方案中,双链多联体DNA是双链RCA产物DNA。RCA产物DNA可以是具有串联重复序列的线性或分支的多联体。在一些实施方案中,可以采用多个(例如两个)单独的双链多联体DNA,其中所述单独的双链多联体DNA各自包括编码不同蛋白质的表达序列。例如,可以采用两个RCA产物DNA,其中第一RCA产物DNA包括编码第一蛋白质的第一表达序列,且第二RCA产物DNA包括编码第二蛋白质的第二表达序列,其中所述第一蛋白质不同于所述第二蛋白质。双链多联体DNA,例如RCA产物DNA,可以包含修饰的核苷酸、核苷酸类似物或其组合。
在一些实施方案中,双链多联体DNA包含核苷酸类似物(例如,硫代磷酸化的核苷酸)或修饰的核苷酸(例如,生物素化的核苷酸)。双链多联体DNA可以包括但不限于生物素化的核苷酸、硫代磷酸化的核苷酸、含肌苷的核苷酸、LNA核苷酸、PNA核苷酸、2-氨基-脱氧腺苷、2-硫代-脱氧胸苷、聚阳离子核苷酸或其组合。在一些实施方案中,双链多联体DNA的每个串联重复序列包含核苷酸类似物。
在一些实施方案中,双链多联体DNA包含硫代磷酸化的核苷酸。硫代磷酸化的核苷酸包括硫代磷酸化的dNTP,例如α-S-dATP或α-S-dTTP。术语“硫代磷酸化的”核苷酸在下文中可互换地用作“硫醇化的”核苷酸。在一些实施方案中,双链多联体DNA,例如RCA产物DNA,可以内部被硫醇化(具有α-硫代-dNTP)。在一些实施方案中,为了生成内部被硫醇化的双链多联体DNA,RCA反应补充有硫代磷酸化的核苷酸。将硫代磷酸化的核苷酸掺入dNTP混合物内,用于在扩增过程中将硫醇化的碱基随机掺入RCA产物DNA内。在一些其它实施方案中,可以通过采用硫醇化的引物序列用于RCA反应,来生成包含硫代磷酸化的核苷酸的RCA产物DNA(例如,硫醇化,具有α-硫代-dNTP)。在某些实施方案中,双链多联体DNA包含生物素化的核苷酸,其可以用于将双链多联体DNA缀合至底物,例如链霉抗生物素蛋白附着的珠。通过使用生物素化的引物执行RCA反应,可以生成生物素化的双链多联体DNA。一般在与链霉抗生物素蛋白附着的珠缀合之前,纯化所得到的生物素化的RCA产物DNA,以去除过量的生物素化的引物。可以将纯化的生物素化的RCA产物DNA与链霉抗生物素蛋白珠混合,以将RCA产物DNA缀合到链霉抗生物素蛋白珠上。
常规地,对于使用无原核细胞表达系统的IVTT反应,例如使用大肠杆菌细胞裂解产物的IVTT反应,每微升IVTT反应需要5-10 ng的模板DNA。对于使用原生动物细胞裂解产物的IVTT反应,需要至少35 ng/µL质粒DNA用于充分的蛋白质表达。然而,对于使用真核或哺乳动物细胞裂解产物(例如HeLa或CHO细胞裂解产物)的IVTT反应,多于40 ng/µL的质粒DNA已照常规用于较高的无细胞蛋白质表达产率。用于真核IVTT反应的此类大数量的质粒DNA的生成经常是劳力密集的,且并非成本有效的。相比之下,与质粒DNA相比,甚至当显著更低浓度的双链多联体DNA用于反应时,所需蛋白质的无真核细胞表达的效率也明显更高。在一些实施方案中,无真核细胞的表达系统中的双链多联体DNA的最终浓度在约0.5 ng/μL至约20 ng/μL的范围内。在某些实施方案中,无真核细胞的表达系统中的双链多联体DNA的最终浓度在约5 ng/μL至约20 ng/μL的范围内。在一些其它实施方案中,无真核细胞的表达系统中的双链多联体DNA的最终浓度在约2 ng/μL至约10 ng/μL的范围内。在一些实施方案中,无真核细胞的表达系统中的双链多联体DNA的最终浓度在约3 ng/μL至约7 ng/μL的范围内。在一个示例性的实施方案中,无真核细胞的表达系统中的双链多联体DNA的最终浓度为约5 ng/μL。
观察到与使用较高浓度的双链多联体DNA(例如,在25μL IVTT反应中大于1 µg的RCA产物DNA)作为模板相比,通过使用较低浓度的双链多联体DNA(例如,在25μL IVTT反应中0.125 μg的RCA产物DNA),真核裂解产物中的无细胞蛋白质表达出乎意料地得到改善。例如,应用比由IVT试剂盒建议的更高浓度的包含TurboGFP基因的RCA DNA模板(例如2 μg或3μg),导致无细胞蛋白质表达系统中更低产率的TurboGFP蛋白,如图1中所示。然而,当RCA产物DNA以低于根据IVT试剂盒方案的建议浓度的浓度(例如500 ng、250 ng和125 ng)使用时,观察到无细胞TurboGFP蛋白的表达升高(图1)。使用硫代磷酸化和非硫代磷酸化的RCA产物DNA的结果是可比的,其中来自硫代磷酸化的RCA产物DNA的蛋白质表达略微更佳。与从RCA产物DNA获得的结果形成对比,在相同的IVTT实验条件下,蛋白质产率与质粒DNA模板的浓度成比例地降低。例如,与使用1μg的质粒DNA作为模板相比,500ng的质粒DNA(根据制造商的IVT方案的2x稀释)产生更少的TurboGFP蛋白(图1)。因此,与IVTT反应中的质粒DNA模板相比,在较低浓度的RCA产物DNA模板下获得无细胞蛋白质表达的显著改善,这是没有预料到的。与IVTT反应动力学的一般趋势相比,随着RCA产物DNA模板的浓度降低,无细胞蛋白质表达的趋势增加(图1)也是出乎意料的,其中在典型的IVTT反应中无细胞蛋白质表达与模板DNA浓度成正比。
一般地,随着IVTT反应体积的增加,需要更高量的DNA模板。例如,1步Human High-Yield Maxi IVT试剂盒配制用于2 mL的反应体积。根据试剂盒方案,对于IVTT实验中的有效蛋白质表达,需要40ng/μl质粒DNA模板的最终浓度(即,80 μg的质粒DNA/2mL反应体积)。为了进一步放大此类反应体积,需要更高总量的质粒DNA,其进一步增加了成本、制备时间和劳力。例如,4mL反应体积将需要总共160μg的质粒DNA,以满足40ng/μL模板的最终浓度。此外,在反应规模超出的情况下,IVTT反应的数目将并行增加。由于RCA DNA对于无细胞蛋白质表达在~5ng/µL下有效,因此需要大约20 µg的总RCA DNA,而不是80µg的总质粒DNA,以实现80x25 µL的各个反应。因此,对于无细胞蛋白质表达需要较少量的RCA产物DNA作为模板,对于反应体积放大、反应体积规模超出和模板成本控制是有利的。
为了增强来自无哺乳动物细胞提取物中的体外转录和翻译反应的蛋白质产率,经常需要去除废弃物,因为它不利地影响翻译机制。这照常规使用透析膜来完成。进一步地,放大IVTT反应体积,以使透析系统内的组分浓度达到最大。相应地,模板DNA也被显著放大,以维持在放大的IVTT反应体积中所需的模板DNA浓度。然而,DNA模板通常对于基于溶液的IVTT反应丧失。为了解决此类关注且增强IVTT蛋白产率,可以将DNA模板固定到底物上,以从基于溶液的IVTT反应中回收DNA模板。在一些实施方案中,使固定的DNA模板在连续流下暴露于无细胞表达系统,使得以连续的方式从固定的DNA模板产生蛋白质。
在一个或多个实施方案中,该方法进一步包括将双链多联体DNA固定到底物上。用于固定双链多联体DNA模板的底物可以选自磁性颗粒、琼脂糖珠、玻璃底物、聚合物底物或金属底物。磁性颗粒可以是磁珠或磁性叶轮。底物可以是玻璃试管、培养皿、多孔板、微流体装置/系统、分析装置/系统,或它们的部分,其中所述双链多联体DNA可以固定到底物上。
可通过各种方法将双链多联体DNA固定到底物上。例如,在一个实施方案中,双链多联体DNA包含生物素化的核苷酸。在此类实施方案中,可以通过生物素-链霉抗生物素蛋白相互作用,将双链多联体DNA固定到链霉抗生物素蛋白包被的底物上。将双链多联体DNA固定到链霉抗生物素蛋白包被的底物上的步骤在使双链多联体DNA与无真核细胞的表达系统接触之前执行。在将双链多联体DNA固定到底物上之后,将无真核细胞的蛋白质表达系统加入固定的双链多联体DNA中,其充当体外无细胞蛋白质表达的模板。实施例4清楚地证实了来自RCA产物DNA的无细胞表达,所述RCA产物DNA由DNA小环生成(参见图2),并且进一步固定到链霉抗生物素蛋白珠上,其中所述RCA产物DNA是生物素化的。在这个实施例中,将RCA产物固定到链霉抗生物素蛋白珠上。
在一些实施方案中,该方法进一步包括在体外表达蛋白质后,从包含真核表达系统的反应混合物中回收固定的双链多联体DNA。在此类实施方案中,在表达蛋白质之后,可以将含有表达的所需蛋白质和剩余的无真核细胞的表达系统的混合物转移到不同的容器中。固定的双链多联体DNA在其随后用于随后的IVTT反应之前可以进行洗涤(例如,使用洗涤缓冲液)。
在一个或多个实施方案中,回收的固定的双链多联体DNA可以在一个或多个随后的无细胞表达系统中再使用。回收的固定的双链多联体DNA可以再使用,伴随或不伴随一个或多个洗涤步骤,以去除由先前的无细胞表达系统携带的任何杂质。
在一些实施方案中,双链多联体DNA的多个串联重复序列各自包含表达序列,所述表达序列包含启动子、CITE和ORF,其中所述CITE包含内部核糖体进入位点(IRES)、翻译增强元件(TEE)或其组合。在一些实施方案中,用作双链多联体DNA模板的RCA产物DNA包含IRES序列作为CITE。本领域已知的合适的IRES或TEE序列的众多实例可以用作CITE,包括衍生自病毒的那些或活生物内的天然序列。即使当与质粒DNA的浓度相比,RCA产物DNA的浓度明显更低时,IRES序列的存在也在无真核细胞的表达系统中驱动有效的翻译(如图1中所示)。IRES元件的RNA折叠可以影响翻译效率的调节。在一些实施方案中,对于有效翻译,优化无细胞蛋白质表达系统例如HeLa细胞裂解产物的组分,使得它确保IRES元件的有效RNA折叠。
表达序列包含一个或多个ORF,其中ORF各自包括翻译起始序列和翻译终止序列。在某些实施方案中,ORF包含密码子优化的序列、纯化标签序列、衍生自IRES的用于增强核糖体识别的氨基末端肽融合序列、蛋白酶切割位点、信号肽或其组合。纯化标签序列可以用于表达蛋白质的纯化。在一个或多个实施方案中,双链多联体DNA的多个串联重复序列各自中的表达序列的ORF包含用于增强翻译的密码子优化的序列。为了生成密码子优化的序列,密码子偏倚、背景密码子偏好和/或个别密码子偏好是一般考虑的一些因素。
ORF的密码子优化序列增强了RCA产物DNA中的表达序列的翻译速率或质量。密码子优化一般通过增加目的基因的mRNA稳定性或翻译效率来改善蛋白质表达。基因的功能性也可以通过优化定制设计基因内的密码子使用得到增加。在一些密码子优化实施方案中,物种中的低频率密码子可以替换为具有高频率的密码子。例如,低频率的密码子UUA可以替换为关于亮氨酸的高频率的密码子CUG。在进一步的密码子优化实施方案中,可以使用代表在氨基酸饥饿期间大量负载的tRNA的密码子。密码子优化可以增加mRNA的稳定性,并且因此改变蛋白质翻译或蛋白质折叠的速率。进一步地,密码子优化可以定制转录和翻译控制,修饰核糖体结合位点或稳定mRNA降解位点。
在一些实施方案中,ORF可以包括用于表达蛋白质的纯化的标签序列。标签序列可以是亲和标签、用于蛋白酶切割的识别序列或其组合。亲和标签可以用于重组蛋白质的快速纯化和检测。亲和标签可以包括多组氨酸标签(his6)(SEQ ID NO:8)、谷胱甘肽S-转移酶标签(GST)、血凝素(HA)、myc(衍生自c-myc基因产物)、FLAG(由八个氨基酸Asp-Tyr-Lys-Asp-Asp-Asp-Asp-Lys(SEQ ID NO:9)组成,包括肠激酶切割位点)或其组合。尽管融合标签帮助所需蛋白质的快速纯化或检测,但标签可能不被视为重组蛋白质的永久固定物或结构域。因此,对于重组蛋白质结构和功能的高度分析研究经常需要去除融合标签。可以通过使用另一种类型的标签,例如蛋白酶切割标签,从蛋白质中去除用于纯化的标签。蛋白酶切割标签可以用于切割特定蛋白质或肽序列内的独特肽键。蛋白酶切割标签可以包括例如PreScission蛋白酶标签(GE Healthcare)或凝血酶蛋白酶标签(GE Healthcare)。
在一个或多个实施方案中,多个串联重复序列各自进一步包括聚A序列、内含子序列、转录终止序列、绝缘子序列或其组合。在一些实施方案中,串联重复序列各自进一步包括转录终止序列和聚腺苷酸化位点,其中所述转录终止序列和聚腺苷酸化位点一般位于DNA模板中的基因的3′末端处。转录终止序列在新合成的mRNA中提供了信号,以启动从转录复合物中释放mRNA的过程,其也有助于所需蛋白质产物的有效翻译。
与衍生自质粒DNA的RCA产物相比,衍生自小环的RCA产物中的无效转录终止的效应在很大程度上是无关紧要的。在一些情况下,必须使用限制性酶消化含有目的基因的质粒DNA,以产生紧在基因后的双链DNA断裂,以防止当RCA产物衍生自质粒时,转录前进超过该点。如果发生失控转录(run-off transcription),则将转录含有许多编码序列和非编码序列(包括用于复制起点、抗生素选择的序列,以及用于宿主细胞中选择、筛选和/或增殖质粒的附属序列)的质粒的其它区段。当以未消化的状态使用时,衍生自质粒DNA的RCA产物可能经由转录通读产生不需要的mRNA种类,其具有产生连同目的蛋白质(或以比目的蛋白质更大的量)的蛋白质污染物的风险。然而,衍生自小环的RCA产物中的弱转录终止可能仍生成靶上mRNA。因而,与衍生自质粒或PCR扩增质粒DNA的RCA产物相比,来自衍生自DNA小环的RCA产物的无细胞蛋白产率更佳。即使当衍生自DNA小环的RCA产物完全不含转录终止序列时,也观察到了类似的表达益处,这是出乎意料的结果。这些RCA产物通过生成顺反子mRNA种类的串联重复来改善无细胞蛋白质表达,其中mRNA的每个顺反子包含所需的靶基因。顺反子的串联重复依次又可以改善mRNA的稳定性,特别是当不存在转录终止信号时,并且促成所需蛋白质产物的更高翻译通量。
在用于体外转录和翻译的方法的一个或多个实施方案中,该方法包括以下步骤:提供环状DNA,经由DNA环的RCA生成双链多联体DNA,并且使生成的双链多联体DNA在体外与无真核细胞的表达系统接触,以经由转录和翻译从双链多联体DNA表达蛋白质。无真核细胞的表达系统中的双链多联体DNA的最终浓度在约0.1 ng/μL至35 ng/μL的范围内。在一些实施方案中,在与无真核细胞的表达系统接触之前,纯化双链多联体DNA。可以通过双链DNA模板的分子内连接来生成DNA小环。在一个或多个实施方案中,由DNA小环生成的双链RCA产物DNA可以是线性或分支的多联体。
在一些实施方案中,由环状DNA生成的双链多联体RCA产物DNA的最终浓度在约0.5至20 ng/μL的范围内。在一些其它实施方案中,在无真核细胞的表达系统中由环状DNA生成的双链多联体RCA产物DNA的最终浓度在约3 ng/μL至约7 ng/μL的范围内。在某些实施方案中,在无真核细胞的表达系统中由环状DNA生成的双链多联体RCA产物DNA的最终浓度在约5ng/μL至约7 ng/μL的范围内。在一个示例性的实施方案中,在无真核细胞的表达系统中由DNA环生成的双链多联体RCA产物DNA的最终浓度为约5 ng/μL。实施例3、图2和3显示了对于在无真核细胞的裂解产物中的所需蛋白质表达,由DNA环生成的RCA产物DNA的需求是质粒DNA的1/4至1/8。
由DNA小环生成的用于IVTT反应的双链RCA产物DNA,可以是线性或分支的多联体。DNA小环基本上由最简单的表达序列组成,所述最简单的表达序列基本上由启动子、不依赖帽的翻译元件和ORF组成。因此,由DNA小环生成的线性或分支的多联体(双链RCA产物DNA)基本上由最简单的表达序列的串联重复组成。最简单的表达序列的ORF是含有特定目的基因的核酸序列。最简单的表达序列还可以含有特定目的基因表达所需的最小遗传元件或序列(例如,增强子序列)。
在一个或多个实施方案中,最简单的表达序列的ORF包含密码子优化的序列、纯化标签序列、蛋白酶切割位点或其组合。为了生成密码子优化的序列,密码子偏倚、背景密码子偏好和/或个别密码子偏好是一般考虑的因素。如所指出的,在一些实施方案中,最简单的表达序列进一步基本上由转录终止序列组成。
DNA小环的不依赖于帽的翻译元件(CITE)包含内部核糖体进入位点(IRES)、翻译增强元件(TEE)或其组合。最简单的表达序列可以进一步含有绝缘子序列、聚A序列、转录终止序列或其组合。它可以另外含有实质上不影响双链多联体RCA产物DNA的体外转录和/或翻译的序列。例如,它可以进一步包括序列,例如翻译增强子序列、绝缘子序列、内含子序列或转录终止序列。然而,最简单的表达序列和所得到的双链RCA产物不包括可能负面影响RCA产物的体外转录和翻译的任何另外序列。
可以采用本领域已知的合适启动子的众多实例,包括例如T7 RNA聚合酶启动子序列。同样地,合适的核糖体结合位点的众多实例是本领域已知的,包括例如内部核糖体进入位点(IRES)、聚A束、物种不依赖性翻译前导序列(SITS)、Kozak共有序列和夏因-达尔加诺序列。绝缘子序列一般增强核糖体结合或翻译启动的效率。合适的绝缘子序列的众多实例存在于本领域中,包括例如编码天然IRES ORF的翻译的N末端或聚组氨酸束的序列。最简单的表达序列可以进一步包括前启动子序列、用于蛋白酶切割或核苷酸切割的序列、用于蛋白质纯化的序列或其组合。选择最简单的表达序列,使得它不含有阻碍或抑制所需蛋白质产物的转录和/或翻译或以其它方式使蛋白质产生更麻烦的任何序列。
最简单的表达序列缺乏在宿主细胞中增殖质粒所需的任何无关序列。例如,RCA产物排除任何无关序列,例如复制起点,抗生素选择基因或在宿主细胞中克隆、选择、筛选和/或复制所需的任何其它附属序列。RCA产物中的此类无关序列的存在实质上影响无细胞蛋白质表达中的转录和/或翻译。“无关序列”包括对于所需蛋白质的编码或表达不是必需的序列。无关序列可以包括用于在宿主细胞中选择、筛选和/或增殖质粒的附属序列,例如lacZ、β-半乳糖苷酶。无关序列可以包括用于复制起点的序列、抗生素选择基因、用于插入基因的合适的限制性位点例如多克隆位点或其组合。无关序列可以进一步包含对于克隆到宿主细胞内或在宿主细胞中检测所需的任何其它序列。
双链多联体RCA产物DNA序列可以包含硫代磷酸化的核苷酸、生物素化的核苷酸或其组合。在某些实施方案中,基本上由最简单的表达序列的串联重复组成的双链多联体RCA产物DNA包含生物素化的核苷酸。在此类实施方案中,该方法进一步包括在双链多联体DNA与无真核细胞的表达系统接触之前,将包括生物素化的核苷酸的双链多联体DNA固定到底物上,其中所述底物是链霉抗生物素蛋白包被的底物。该方法进一步包括在从双链多联体DNA在体外表达蛋白质之后,从无真核细胞的表达系统中回收固定的双链多联体DNA。该方法进一步包括对于随后的IVTT反应再使用回收的双链多联体DNA模板,其基本上由最简单的表达序列的串联重复组成。
用于无细胞转录反应中的RNA聚合酶(例如,T7 RNA聚合酶)一般需要双链DNA启动子序列,用于有效结合DNA编码序列。RNA聚合酶与双链DNA启动子序列的有效结合启动了有效的转录。因此,对于有效的体外转录和翻译需要促进双链RCA产物生成的RCA反应条件。
在一些实施方案中,在与无真核细胞的表达系统接触之前,需要提纯生成的双链多联体DNA。在一些实施方案中,在前进至使用真核细胞提取物的无细胞表达之前,可以将RCA产物DNA分离(例如,通过沉淀),以从反应介质中去除盐或任何其它污染物,例如引物或较小的片段化DNA。在一些实施方案中,将双链RCA产物DNA提供给无细胞表达系统,而无需任何进一步处理。例如,RCA产物DNA可以在扩增后直接加入无细胞系统中,而无需任何进一步的限制性消化。
最简单的表达序列包括启动子序列,其存在于待转录的目的基因的上游(5′)。DNA依赖性RNA聚合酶与双链DNA启动子区结合,以启动基因转录。各种合适的RNA聚合酶是本领域已知的,并且包括仅具有一个亚基的那些(例如,来自噬菌体如T3和T7以及线粒体的那些),以及衍生自细菌和真核生物的多结构域RNA聚合酶。RNA聚合酶可能进一步需要另外的蛋白质辅因子用于有效转录。
在无细胞转录-翻译反应的一些实施方案中,从细胞中提取生物分子转录/翻译机制,并且用于体外翻译。转录和翻译所需的组成、酶的比例和构件块由这种无细胞提取物提供。通过转录合成的mRNA在翻译反应中表达,其在无细胞提取物中产生靶蛋白。在体外表达反应中,蛋白质合成在无细胞提取物中,而不是在培养的细胞内发生(来自细胞的提取材料在本文中可以被称为“无细胞提取物”或“细胞提取物”,其不含有任何完整细胞)。细胞提取物一般含有细胞的细胞溶质和细胞器组分。无细胞提取物可以供应无细胞转录和翻译所需的全部或大部分分子,例如核糖体、翻译因子、tRNA和氨基酸、酶促辅因子和能源、以及蛋白质折叠所必需的细胞组分。在体外蛋白质表达反应中,蛋白质合成在无细胞提取物中,而不是在培养的完整细胞内发生。
如所指出的,在一些实施方案中,无细胞表达系统包含真核细胞提取物,其中所述细胞提取物衍生自单细胞生物(例如原生动物、酵母细胞、昆虫细胞)或多细胞生物(例如昆虫细胞、哺乳动物细胞,包括人细胞)。合适的真核细胞提取物包括但不限于兔网织红细胞裂解产物(RRL)、小麦胚芽提取物、昆虫细胞裂解产物(例如SF9或SF21)、哺乳动物裂解产物(例如CHO)、人裂解产物(例如HeLa)、或原生动物裂解产物(例如利什曼原虫(Leishmania))。
衍生自RCA产物DNA的mRNA可以加入真核细胞提取物中,或在真核细胞提取物内产生。用于RCA反应的DNA模板可以是合成DNA或天然DNA。DNA模板可以是环状DNA模板。在一个示例性的实施方案中,线性核酸模板的环化通过酶促反应来完成,例如,通过与连接酶例如DNA连接酶一起温育。在一些实施方案中,DNA小环模板包括最简单的表达序列。用于体外转录-翻译的RCA产物可能是完整的、未降解的状态。
滚环扩增反应经常采用试剂例如引物、聚合酶和游离核苷酸(dNTP)。在一些实施方案中,RCA可以通过以下执行:使双链DNA小环与包含随机引物混合物的引物溶液接触,以形成核酸模板-引物复合物;使核酸模板-引物复合物与DNA聚合酶和脱氧核糖核苷三磷酸接触;并且扩增核酸模板。扩增反应中采用的核酸聚合酶可以是校读核酸聚合酶。可以通过使用本领域已知的任何DNA链置换聚合酶来执行RCA,所述聚合酶包括但不限于Phi29 DNA聚合酶。扩增反应混合物可以进一步包括另外的试剂,例如合适的扩增反应缓冲液。
在一些实施方案中,可以预处理核酸扩增反应中使用的每种试剂,以去除任何污染性核酸。在一些实施方案中,试剂的预处理包括在紫外线辐射的存在下温育试剂。在一些其它实施方案中,通过在核酸酶及其辅因子(例如,金属离子)的存在下温育试剂,使试剂去污染。合适的核酸酶包括但不限于核酸外切酶,例如核酸外切酶I或核酸外切酶III。在一些实施方案中,通过在不存在dNTP的情况下与二价金属离子(例如,镁或锰离子)一起温育,可以使用于DNA扩增反应的校读DNA聚合酶去污染。
RCA反应可以使用随机引物混合物执行。在一些实施方案中,特异性引物用于RCA反应。也可以使用包含一种或多种核苷酸类似物的引物序列。在一个或多个实施方案中,使用包含核苷酸类似物的随机引物混合物执行RCA。在一些实施方案中,使用含有核苷酸类似物的dNTP执行RCA。核苷酸类似物可以是肌苷、锁核酸(LNA)核苷酸、肽核酸(PNA)核苷酸、硫醇化的核苷酸、2-氨基-脱氧腺苷、2-硫代-脱氧胸苷、聚阳离子核苷酸、Zip核酸(ZNA)、聚阳离子修饰的核苷酸或其组合。在一个或多个实施方案中,随机引物混合物具有序列+N+N(atN)(atN)(atN)*N (SEQ ID NO:6) (AT六聚体引物)。在一些实施方案中,核酸酶抗性引物(例如,在适当位置处包含硫代磷酸酯基的引物序列)用于扩增反应(例如NNNN*N*N)。在一些实施方案中,DNA小环的扩增采用随机六聚体或六聚体引物+N+N(atN)(atN)(atN)*N(SEQ ID NO:6) (AT六聚体引物)。
在扩增反应期间,在脱氧核糖核苷三磷酸(dNTP)或其修饰的配对物的存在下,通过聚合酶复制DNA模板,例如DNA小环,其基本上由最简单的表达序列组成。核酸模板扩增中采用的游离核苷酸可以包括天然核苷酸(例如,dATP、dGTP、dCTP或dTTP)或其修饰的类似物。在一些实施方案中,反应混合物补充有硫醇化的dNTP。硫醇化的dNTP可以包括但不限于α-S-dGTP、α-S-dCTP、α-S-dATP和α-S-dTTP。硫醇化的dNTP例如α-S-dATP或α-S-dTTP可以加入dNTP混合物内,用于将硫醇化的碱基随机掺入RCA产物内。
在一些实施方案中,使用在约10 μM至约10 mM的范围内的dNTP的最终浓度执行RCA。在RCA反应的一个或多个实施方案中,dNTP浓度小于10mM。在这些实施方案中,dNTP的浓度保持低于10 mM,以避免由RCA产物的水凝胶形成,并且在低于或等于反应缓冲液中存在的二价阳离子(例如,Mg2+)的量的浓度下保持。在高浓度dNTP的存在下扩增后,可能发生水凝胶形成,其可能进一步使下游操作(例如RCA产物的移液和加工)复杂化。当在RCA反应中使用50 mM或更高的dNTP浓度时,可以观察到水凝胶形成。
可以使用商购可得的RCA扩增试剂盒,例如illustra™ TempliPhiTMAmplification Kit(GE Healthcare),来执行RCA。TempliPhi滚环扩增采用修饰的随机引物,其提供更高的灵敏度和扩增平衡。在一些实施方案中,核酸酶抗性引物用于RCA反应。由于高浓度的模板DNA是本文的体外转录和翻译方法所需要的,因此使用RCA可以实现更平衡的DNA扩增,伴随更快的动力学和更高的产率。
可以使用各种方法来制备用于与本发明的方法一起使用的DNA小环模板。在一些实施方案中,线性DNA模板可以被环化,以生成DNA小环模板。在一个示例性的实施方案中,线性DNA模板的环化可以通过酶促反应来实现,例如,通过与连接酶例如DNA连接酶一起温育。在一些实施方案中,线性DNA模板的末端与核酸序列杂交,使得末端非常接近。然后与连接酶一起温育可能实现杂交的线性DNA模板的环化,以生成DNA小环。合适的DNA小环模板也可以通过以下生成:使用适当的PCR引物PCR扩增较大的DNA(例如,基因组DNA或来自DNA文库的DNA)的一部分,随后为PCR产物的环化。也可以通过合适的线性寡核苷酸的化学合成,随后为合成的寡核苷酸的环化,来生成DNA小环。在一些实施方案中,合成的线性寡核苷酸可以基本上由最简单的表达序列组成,并且经由DNA连接酶实现环化,以生成DNA小环。
一种或多种所述方法可以进一步包括纯化、分析和/或定量DNA小环的步骤。可以在扩增反应之前执行双链DNA小环的分离或纯化和/或污染物的去除,所述污染物例如酶或非连接形式的DNA。可以采用用于核酸纯化、分析或定量的任何合适的技术。非限制性实例包括沉淀、过滤、亲和捕获、凝胶电泳、测序或HPLC分析。例如,环状核酸的纯化可以通过亲和捕获来实现。在一些实施方案中,该方法可以进一步包括所生成的DNA小环的处理。所生成的DNA小环的后处理可以根据预期用途而不同。
实施例:
除非另有说明,否则实施例中描述的成分从普通化学品供应商商购可得。实施例部分中使用的一些缩写扩展如下:“mg”:毫克;“ng”:纳克;“pg”:皮克;“fg”:飞克;“mL”:毫升;“mg/mL”:毫克/毫升;“mM”:毫摩尔;“mmol”:毫摩尔;“pM”:皮摩尔;“pmol”:皮摩尔;“μL”:微升;“min.”:分钟和“h.”:小时。
材料:使用人和CHO裂解产物的1-Step Coupled IVT试剂盒、pCFE-GFP对照载体和Quant-IT PicoGreen®双链DNA测定试剂盒购自ThermoFisher,Waltham,MA,USA。MICROCON®离心过滤器和链霉抗生物素蛋白磁珠购自Sigma-Aldrich,St. Louis,MI,USA。PstI酶购自New England Biolabs,Ipswich,MA,USA。Typhoon可变模式成像仪得自GE Healthcare,Piscataway,NJ,USA。SpectraMax M5 Microplate Reader来自Molecular Devices,LLC。
实施例1:RCA产物DNA的生成
RCA产物DNA通过RCA反应从环状DNA模板(质粒阳性对照,例如pCFE-GFP,或具有最简单的表达序列的DNA小环)生成。质粒阳性对照pCFE-GFP作为1-Step Human Coupled IVT试剂盒的部分购买。这种纯化的质粒包含脑心肌炎病毒(EMCV)的内部核糖体进入位点(IRES),并且编码TurboGFP蛋白。
DNA小环的生成:
关于EGFP的最简单的表达序列在计算机上设计,并且在体外合成。最简单的表达序列主要含有T7启动子和+1序列(所得到的mRNA的5′-非翻译区的第一个核糖位置),随后为与EGFP编码区融合的IRES序列。在最简单的表达序列的设计过程中,包括各种另外的非编码参数和编码参数,包括T7前启动子序列、T7 phi10启动子茎环、翻译增强元件(TEE)、核糖体结合序列、用于增强核糖体结合的绝缘子序列、用于增强核糖体启动的绝缘子序列、T7转录终止序列、聚腺苷酸化序列、肽前导序列或蛋白酶切割位点。可以对于密码子使用进一步优化最简单的表达序列。代表性的最简单的表达序列作为SEQ ID No. 5列出(表3)。SEQID No. 5的最简单的表达序列序贯地包含T7启动子、EMCV IRES、翻译起始密码子、EMCV多蛋白ORF的翻译N末端(融合至EGFP,其已进行密码子优化)、翻译终止密码子、聚A束和T7转录终止子序列。
表3:DNA序列表。
使用DNA合成仪(Integrated DNA Technologies,Inc.)合成线性双链DNA,其中在5′和3′末端处具有独特的限制性位点(分别为BamHI和BglII)。为了产生DNA小环,用两种核酸内切酶消化双链DNA,以产生互补的粘性突出端。使用T4 DNA连接酶连接这种消化的DNA。使用包含20 U BamH1、10 U BglII、400 U T4连接酶、1 mM ATP、100 μg/mL牛血清白蛋白(BSA)、100 mM NaCl、10 mM MgCl2、50mM Tris-HCl pH 7.5和10 mM二硫苏糖醇(DTT)的反应混合物,序贯地或同时(例如,在同一管中)进行限制性消化和连接步骤。随后用核酸外切酶I和核酸外切酶III处理所有连接产物(DNA小环),以消化任何剩余的线性DNA片段。通过使连接产物在80°C下温育20分钟,使核酸外切酶热失活。在核酸外切酶的热失活后,将10μl(10 ng的环状DNA)的完成的连接反应变性,然后直接(无需中间纯化)用于使用Phi29 DNA聚合酶的等温RCA反应。
滚环扩增(RCA):
环状DNA模板(例如,质粒或DNA小环)的RCA产生具有输入DNA序列的串联重复的高分子量、高分支的多联体。在添加环状DNA模板(质粒或小环)或dNTP之前,将RCA试剂,包括水、反应缓冲液、引物和DNA聚合酶在30°C下预净化60分钟,以使脱靶扩增降到最低。在一些实施方案中,通过使引物-核苷酸混合物与核酸外切酶I、核酸外切酶III和单链DNA结合蛋白(SSB蛋白)的组合一起温育,使包含核酸外切酶抗性引物和核苷酸的引物-核苷酸混合物去污染。在一些实施方案中,通过任选地在核酸外切酶的存在下(如果所使用的DNA聚合酶包括非校读DNA聚合酶)与二价阳离子(例如,Mg2+)一起温育,使含有链置换DNA聚合酶的酶混合物去污染。随后使用去污染的酶和引物-核苷酸混合物执行环状DNA模板的扩增。例如,使含有200 ng的Phi29 DNA聚合酶的聚合酶溶液与0.1单位的核酸外切酶III一起在5 μL的50 mM HEPES缓冲液(pH=8.0)中温育,所述缓冲液含有15 mM KCl、20 mM MgCl2、0.01%Tween-20和1 mM TCEP。温育在30℃下执行约60分钟,或在4°C下执行12小时。将去污染的Phi29 DNA聚合酶溶液转移到冰浴中,然后用于靶RCA测定中,而无需核酸外切酶III的先前失活。
使用随机六聚体或序列为+N+N(at N)(at N)(at N)*N(AT六聚体,SEQ. ID. No.6)的六聚体引物,执行环状DNA(质粒或DNA小环)的扩增,其中“N”表示随机核苷酸(即,N可以是A、C、G或T/U中的任一个),“at N”表示2-氨基dA、2-硫代-dT、正常G或正常C中的任一个,字母名称前的加号(+)符号指示由该字母指定的核苷酸是锁核酸(LNA)核苷酸,并且字母前的星号(*)符号指示由该字母指定的核苷酸是硫代磷酸酯修饰的核苷酸。在一些实施方案中,使用具有序列生物素-NNNN*N*N(SEQ. ID. No. 7)的生物素化的六聚体执行环状DNA的扩增,其中“N”表示随机核苷酸(即,N可以是A、C、G或T/U中的任一个),并且字母前的星号(*)符号指示由该字母指定的核苷酸是硫代磷酸酯修饰的核苷酸。对于所有RCA反应,dNTP浓度维持低于1mM(通常为400-800 μM),以避免扩增的RCA产物DNA的水凝胶形成,其可能潜在地使RCA产物DNA的下游可用性复杂化。
通过使预净化的RCA试剂与环状DNA模板和核苷酸混合物在30°C下温育约16小时或960分钟,执行DNA扩增反应。对于滚环扩增,扩增反应混合物包含40 μM引物、400 μMdNTP(dATP、dCTP、dGTP、dTTP各自为400 μM);~1-30 ng的环状DNA模板(质粒或DNA小环)、20ng/μL phi29 DNA聚合酶、50 mM HEPES(pH = 8.0)、30 mM KCl、20 mM MgCl2、2.5%(w/v)PEG-8000、0.01%(v/v)Tween-20和1 mM TCEP。在温育结束时,通过将反应混合物在65℃下加热10分钟,使反应混合物中的Phi29 DNA聚合酶失活。在一些实例中,硫醇化的dATP以相对于dNTP溶液内的非硫醇化的dATP的1:40比率补充(例如0.01mM α-S-dATP)。
RCA产物DNA由衍生自SEQ ID No. 5的DNA小环生成。为了生成DNA小环,用BamHI和BglII消化SEQ ID No. 1的DNA模板,并且通过连接进行环化。使用pCFE-GFP质粒和DNA小环的RCA反应在三种不同的测试条件下执行:(i)使用随机六聚体和dNTP,(ii)使用AT-六聚体引物和dNTP;以及(iii)使用AT六聚体和与硫醇化的dATP混合的dNTP。所有RCA反应都包含0.4mM dNTP(dNTP和任选地硫醇化的dATP的最终浓度)和40μM引物(随机六聚体、AT六聚体或生物素化的六聚体),不同之处在于对于一些反应,硫代磷酸化的dATP以相对于非硫醇化的dATP的1:40比率添加(例如0.01mM α-S-dATP)。使用Quant-It™ Picogreen®双链DNA测定试剂盒(ThermoFisher Inc.),定量来自100μL的总RCA反应体积的RCA产物。还执行了限制性DNA产物的琼脂糖凝胶电泳,并且将电泳条带的强度与具有已知DNA浓度的标准进行比较。
实施例2:在无真核细胞的提取物中表达由质粒DNA生成的RCA产物DNA
1-Step Human Coupled IVT试剂盒包括pCFE-GFP作为阳性对照载体,其含有脑心肌炎病毒(EMCV)的内部核糖体进入位点(IRES),并且编码TurboGFP蛋白。由于已知IRES序列的RNA折叠显著影响翻译效率的调节,因此已对于EMCV IRES活性优化1步体外转录-翻译(IVTT)试剂盒内的组分。
如实施例1中所述,在硫醇化的dATP的存在或不存在下,使用AT引物(SEQ. ID.No.6)通过RCA扩增pCFE-GFP对照载体。根据制造商的说明执行使用1-Step Coupled IVT的体外转录-翻译测定。将1微克的RCA产物DNA(无需任何中间纯化)加入Hela细胞裂解产物中(25μL最终体积),并且在Eppendorf ThermoMixer®中在30°C下温育6小时,以执行RCA产物DNA的体外转录和翻译(IVTT)。在荧光定量之前,使翻译的无细胞TurboGFP蛋白在4°C下温育过夜。使用SpectraMax M5 Microplate Reader,使含有通过IVTT生成的TurboGFP蛋白的4倍稀释样品(在PBS中)经受荧光测量。活性无细胞TurboGFP蛋白的荧光在482 nm处测量,并且与作为参考的纯化的绿色荧光蛋白(GFP)(BioVision,Inc)进行比较。以μg/mL为单位计算总的无细胞TurboGFP蛋白产率。图1显示了当无需任何中间提纯或纯化而直接应用于Hela裂解产物时,实际上从RCA产物不产生荧光TurboGFP。
由于RCA反应组分可能抑制IRES介导的IVTT翻译以去除RCA反应组分,因此通过加入0.04体积的500 mM EDTA和0.1体积的7.5 M乙酸铵来沉淀RCA产物DNA,并且通过涡旋混合。向该混合物中加入3.5体积的95%乙醇(在室温、25°C下)并且重新混合,然后在室温下在微量离心机中以20,000g使RCA产物DNA形成团块20分钟。使用移液管将上清液小心地从管中移出,而不接触DNA团块。然后将大约200 µL的70%乙醇(室温)加入团块中,经受涡旋以混合,然后在20,000g下再次离心5分钟。小心地去除上清液而不接触团块。在DNA团块以20,000g的速度在微量离心机中重新旋转3分钟后,去除最后的痕量乙醇(小心避免过度干燥,其可能致使RCA DNA不溶解)。然后将DNA团块重悬浮于0.1 M TE缓冲液(10mM Tris,pH7.5,0.1 mM EDTA)中,并且在用于无细胞表达反应中之前贮存于4℃下。
随后使用Hela细胞裂解产物确定使用纯化的RCA DNA的无细胞蛋白质表达。将1微克的纯化的RCA DNA加入Hela细胞裂解产物中,并且根据制造商方案,使用1-Step HumanCoupled IVT试剂盒执行IVTT测定。图1显示了当1 μg RCA DNA用于IVTT反应时,来自RCA产物DNA的TurboGFP蛋白产率可比较地低于质粒DNA。在IVTT反应中以2x或3x的更高浓度应用RCA产物DNA(2 μg和3 μg)导致TurboGFP蛋白的甚至更低的产率(如图1中所示)。当RCA DNA相对于由1-Step Human Coupled IVT试剂盒建议的浓度稀释2x、4x和8x(500-125 ng)并且用于IVTT时,观察到无细胞TurboGFP蛋白产率增加,其在图1中呈现。由于IVTT总反应体积为25 µL,RCA模板DNA的最终浓度在5-20 ng/µL之间的范围内。无细胞表达结果在硫醇化和非硫醇化的RCA产物DNA之间是可比较的。相比之下,当质粒DNA用作模板时,在质粒DNA稀释后,IVTT中的无细胞蛋白质表达产率降低。例如,与1μg的质粒DNA相比,0.5μg的质粒DNA模板(2x稀释)产生更少的TurboGFP蛋白,如图1中所示。
实施例3:使用由DNA小环生成的RCA产物DNA的无细胞蛋白质表达
来自实施例2(图1)的数据显示,当RCA产物DNA用作使用HeLa细胞裂解产物的IVTT测定的模板时,与质粒DNA相比,需要1/4至1/8的RCA产物DNA浓度用于最佳的蛋白质表达。通过使用由DNA小环生成的RCA产物DNA用于IVTT反应,进一步确认这个观察。制备了由DNA小环模板生成的RCA产物DNA,并且用于比较通过IVTT的蛋白质表达。如实施例1中所述,将编码EGFP蛋白的DNA序列(SEQ ID No. 5)连接以形成小环,并且在硫醇化的dATP的存在下,使用AT引物通过RCA进行扩增。将RCA产物DNA进行系列稀释,以生成具有不同浓度的RCA产物DNA样品。将不同浓度的RCA产物DNA加入25μL的1-Step Human Coupled IVT反应混合物中,并且在Eppendorf ThermoMixer中在30°C下温育6小时,伴随以300rpm的温和振荡。在荧光分析之前,允许生成的IVTT产物(无细胞的EGFP蛋白)在4℃下折叠过夜。通过SDS-PAGE分离大约4μL的IVTT产物(图3),并且使用488nm Typhoon可变模式成像仪(GE Healthcare)在凝胶中检测天然荧光蛋白。图4证实了大约125ng的RCA产物DNA在HeLa细胞裂解产物中产生EGFP的最大无细胞表达,这与实施例2使用由质粒DNA模板生成的RCA产物DNA的结果一致。如图4中所示,在RCA产物DNA表达产率中观察到高斯分布。因而,图4示出了从0.5-1微克的输入RCA DNA以及8-16纳克的输入RCA DNA生成几乎等价量的蛋白质。图4进一步显示,即使当输入RCA DNA的量(例如0.5微克和16纳克的输入)之间的差异大于96%时,无细胞蛋白质表达也是几乎相同的。为了对照目的,从1微克的pCFE-GFP质粒(根据试剂盒制造商的说明)合成TurboGFP蛋白,以比较相对荧光输出。总之,图3和图4显示了从环状模板(图2的DNA小环构建体)生成的RCA产物DNA的需求是在无真核细胞裂解产物中所需蛋白质表达的质粒DNA的1/4至1/8。
实施例4:来自由DNA小环生成的磁珠缀合的RCA产物DNA的无细胞表达
由实施例3的DNA小环序列(SEQ ID No. 5)生成的生物素化的RCA产物DNA缀合到链霉抗生物素蛋白珠上,并且用于HeLa细胞提取物中的体外转录和翻译。使用生物素化的六聚体引物(SEQ ID. No. 7)或非生物素化的AT六聚体(SEQ ID. No. 6)引物,通过RCA扩增DNA小环(SEQ ID No. 5),并且所得到的扩增产物通过PicoGreen测定进行定量。在一些实施方案中,在珠缀合之前,使用MICROCON离心过滤器对所得到的粗制RCA产物进行预纯化,以去除过量的生物素化的六聚体引物。将粗制或纯化的RCA产物DNA与链霉抗生物素蛋白珠混合,以达到大约24ng或50ng捕获的RCA产物DNA/微升珠的潜力。通过用PstI消化链霉抗生物素蛋白珠,并且通过PicoGreen测定定量释放的DNA的量,来确认缀合到链霉抗生物素蛋白珠上的RCA产物DNA的相对量。表3中呈现了来自代表性的珠制备方案的定量结果。在使用磁体收集对PBS中的珠进行广泛洗涤后,将固定体积(2.8μL)的珠转移到1-Step HumanCoupled IVT反应(25μL)内,并且通过SDS-PAGE凝胶中的天然荧光比较无细胞的EGFP翻译(图5)。使用488nm Typhoon可变模式成像仪,对EGFP荧光进行成像(凝胶内)。图5证实了当通过生物素-链霉抗生物素蛋白偶联以5ng/微升IVTT反应混合物的估计模板浓度捕获到链霉抗生物素蛋白珠上时,从DNA小环生成的RCA产物DNA有效地产生荧光EGFP。将生物素化的RCA产物DNA有效地偶联到链霉抗生物素蛋白珠上,而无需中间纯化的任何需求。如预期的,使用与非生物素化的AT引物一起温育的珠观察到很少的至不存在的无细胞的EGFP表达。与粗制备过程(参见图5的泳道2)相比,使用MICROCON过滤器去除过量的六聚体引物促成更高的非特异性表达(参见图5的泳道3)。为了对照目的,从1微克的pCFE-GFP质粒DNA(根据试剂盒制造商的说明)合成TurboGFP,以比较相对荧光输出。
表3:在无细胞表达之前的RCA产物DNA珠制剂的定量估计
前述实施例示出了本发明的一些特点,并且是从多种多样的所有可能的实施方案中选择的实施方案。本发明可以以其它特定形式体现,而不脱离其精神或基本特征。尽管本文仅示出且描述了本发明的某些特点,但鉴于本公开的益处,本领域的技术人员将能够进行修饰/改变以优化参数。前述实施方案因此在所有方面被视为说明性的,而不是对于本文所述的发明进行限制。必要时,已提供了范围,并且这些范围包括其间的所有子范围。