CN102421791A

CN102421791A - 稳定化逆转录酶融合蛋白

Info

Publication number: CN102421791A
Application number: CN2010800201231A
Authority: CN
Inventors: A·M·拉姆博维茨; S·摩尔; G·摩尔; E·加尼姆
Original assignee: TAXAS SYSTEM, University of, Regents of
Current assignee: TAXAS SYSTEM, University of, Regents of; University of Texas System
Priority date: 2009-03-04
Filing date: 2010-03-04
Publication date: 2012-04-18
Also published as: JP2015193666A; IL214913A0; US20160289652A1; US10113156B2; WO2010102085A3; US20120009630A1; US10858636B2; WO2010102085A2; CA2754476A1; EP2403941A2; AU2010221284A1; AU2010221284B2; JP5882064B2; JP2012519489A; US20180346890A1; BRPI1009221A2; MX2011009205A; EP2403941B1; EP2403941A4; ZA201107207B

Abstract

本发明描述稳定化逆转录酶融合蛋白，其包含与稳定剂蛋白连接的热稳定逆转录酶。将稳定剂蛋白与热稳定逆转录酶连接使融合蛋白稳定并可帮助其纯化、提供增加的溶解度、允许长期储存或者允许用于更加苛刻的条件例如较高温度下。稳定化逆转录酶融合蛋白也可包含稳定剂蛋白和热稳定逆转录酶之间的接头。稳定化逆转录酶融合蛋白适合用于核酸扩增方法，例如逆转录聚合酶链式反应和其他包括cDNA合成的应用。

Description

稳定化逆转录酶融合蛋白

继续申请数据

本申请要求于2009年3月4日提交的美国临时申请序号61/157,332的权益，上述申请通过引用结合到本文中。

政府资助

本工作至少部分受到来自美国国家卫生研究院卫生与公众服务部补助金号GM37949-22的支持。美国政府可拥有本发明中的特定权利。

发明背景

逆转录聚合酶链式反应缩写为RT-PCR，是用于扩增RNA的公知技术。在RT-PCR中，将RNA链逆转录成互补DNA(cDNA)，接着在聚合酶链式反应中使用DNA聚合酶扩增互补DNA。在该方法的第一步中，使用脱氧核糖核苷酸磷酸和逆转录酶连同DNA引物从RNA模板制备cDNA。

从RNA模板合成cDNA可受到RNA二级和三级结构的阻碍，RNA二级和三级结构由RNA链中的螺旋和各种其他种类的扭结组成。RNA二级和三级结构可通过在较高温度下(例如，高于50℃)进行反应或者通过加入变性添加剂来减少。然而，变性添加剂的加入是不合乎需要的，因为它经常降低逆转录酶活性。较高温度还通过降低非特异性引物结合提供增加DNA合成特异性的优点。遗憾的是，只有有限数量的能在高温下起作用的逆转录酶是目前可用的，并且它们表现出相对低保真度DNA聚合。例如，市售禽类成髓细胞性白血病病毒逆转录酶包含RNA酶H活性，并可在37℃起作用，但具有仅约1.7×10^-4的保真度。RNA酶H活性与DNA聚合酶活性和引物结合位点竞争，因此cDNA产出较低。因此，需要能够在较高温度下进行逆转录的逆转录酶，包括那些具有高保真度和持续合成能力的逆转录酶。这样的酶是有益的，因为较高温度减少阻碍性RNA二级和三级结构，并通过允许使用较长和更特异的引物来增加逆转录的特异性。

发明概述

在一个方面，本发明提供一种稳定逆转录酶(RT)融合蛋白，其包含与稳定剂蛋白连接的热稳定逆转录酶。在稳定化逆转录酶融合蛋白的一个实施方案中，热稳定逆转录酶是细菌逆转录酶。在另一个实施方案中，细菌逆转录酶是II组内含子衍生的逆转录酶。热稳定细菌逆转录酶的实例包括细长热聚球蓝细菌(Thermosynechococcuselongatus)逆转录酶和嗜热脂肪土芽孢杆菌(Geobacillusstearothermophilus)逆转录酶。在另一个实施方案中，热稳定逆转录酶表现出高保真度cDNA合成。在又一个实施方案中，热稳定逆转录酶包含多肽，所述多肽具有与选自SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5的序列实质上相似的序列同一性。

稳定化逆转录酶融合蛋白包含稳定剂蛋白，当与逆转录酶连接时，其增加热稳定逆转录酶的保存期限和/或热稳定性和/或溶解度。在特定实施方案中，稳定剂蛋白是亲和蛋白或溶解度增加蛋白(例如，麦芽糖结合蛋白或N-利用物质A蛋白)。在另外的实施方案中，稳定剂蛋白通过用不带电氨基酸置换特定的带电氨基酸来修饰。

稳定化逆转录酶融合蛋白也可包含接头肽，其将热稳定逆转录酶与稳定剂蛋白连接。在一些实施方案中，该接头肽是非可切割接头，而在其他实施方案中，它是非可切割刚性接头。在一些实施方案中，接头肽由1-20个氨基酸组成，而在其他实施方案中，接头肽由1-5个或3-5个氨基酸组成。例如，刚性非可切割接头肽可包含5个丙氨酸氨基酸。

在另外的实施方案中，稳定化逆转录酶融合蛋白具有包含多肽的氨基酸序列，所述多肽具有与选自SEQ ID NO：6、SEQ ID NO：7、SEQ ID NO：8、SEQ ID NO：9或SEQ ID NO：10的序列实质上相似的氨基酸序列同一性。在一些实施方案中，稳定化逆转录酶融合蛋白是能够在约45℃至约65℃的温度下以2.0×10^-5以下的错误频率进行逆转录的高保真度逆转录酶。在另外的实施方案中，稳定化逆转录酶融合蛋白能够在高达约81℃的温度下进行实质水平的逆转录。

本发明的另一个方面提供一种从RNA分子制备cDNA的方法，其包括如下步骤：(a)向RNA分子中加入引物核苷酸序列，和(b)在足以合成与RNA分子的全部或部分互补的cDNA分子的条件下，在一种或多种修饰或未修饰的脱氧核糖核苷三磷酸或双脱氧核糖核苷三磷酸和稳定化逆转录酶融合蛋白存在下孵育RNA分子，所述稳定化逆转录酶融合蛋白包含与稳定剂蛋白连接的热稳定逆转录酶。在特定实施方案中，热稳定逆转录酶通过接头肽(例如非可切割接头肽或刚性非可切割接头肽)与稳定剂蛋白连接。优选地，逆转录在这样的温度范围内进行：其中，RNA包含实质上减少量的阻碍性稳定二级或三级结构。该方法的实施方案包括其中热稳定逆转录酶是II组内含子衍生的逆转录酶的方法。在该方法的另外的实施方案中，热稳定逆转录酶包含：多肽，其具有与和选自SEQ ID NO：1、SEQ IDNO：2、SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5的序列实质上相似的氨基酸序列同一性；由1-20个氨基酸组成的非可切割接头；和稳定剂蛋白是亲和蛋白或溶解度增加蛋白。在该方法其他的实施方案中，在约45℃至约65℃的温度下以2.0×10^-5以下的错误频率进行逆转录。

本发明的另一方面提供一种用于生产稳定化逆转录酶融合蛋白的DNA表达载体，所述DNA表达载体包含编码多肽的核酸，所述多肽具有与选自SEQ ID NO：6、SEQ ID NO：7、SEQ ID NO：8、SEQID NO：9或SEQ ID NO：10的序列实质上相似的氨基酸序列同一性。

本发明的另一方面提供一种生产稳定化逆转录酶融合蛋白的方法，其包括如下步骤：(a)培养包含用于生产稳定化逆转录酶融合蛋白的DNA表达载体的宿主细胞，所述载体包含编码多肽的核酸，所述多肽具有与选自SEQ ID NO：6、SEQ ID NO：7、SEQ ID NO：8、SEQ ID NO：9或SEQ ID NO：10的序列实质上相似的氨基酸序列同一性；(b)表达由DNA表达载体编码的稳定化逆转录酶融合蛋白；和(c)从宿主细胞分离稳定化逆转录酶融合蛋白。

稳定化逆转录酶融合蛋白可促进在较高温度下的cDNA合成和/或具有较高的持续合成能力和/或允许使用较长、更稳定的引物，所述引物增加逆转录的特异性(即保真度)。因此，本发明的稳定RT融合蛋白可用于多种应用，例如研究应用。

应该理解，前述一般说明和下述详细说明都只是例示性和解释性的，且不限制要求保护的本发明。

附图简述

图1是通过刚性接头与麦芽糖结合蛋白结合的细长热聚球蓝细菌逆转录酶的氨基酸序列表(SEQ ID NO：6)。氨基酸残基1-367代表修饰的麦芽糖结合蛋白(SEQ ID NO：11)；氨基酸残基368-372代表刚性接头(SEQ ID NO：12)；和氨基酸残基373-935代表TeI4c ORF(SEQ ID NO：1)。

图2是通过刚性接头与麦芽糖结合蛋白结合的细长热聚球蓝细菌逆转录酶的氨基酸序列表(SEQ ID NO：7)。氨基酸残基1-367代表麦芽糖结合蛋白(SEQ ID NO：11)；氨基酸残基368-372代表刚性接头(SEQ ID NO：12)；和氨基酸残基373-935代表TeI4f ORF(SEQ IDNO：2)。

图3是通过刚性接头与麦芽糖结合蛋白结合的细长热聚球蓝细菌逆转录酶的氨基酸序列表(SEQ ID NO：8)。氨基酸残基1-367代表麦芽糖结合蛋白(SEQ ID NO：11)；氨基酸残基368-372代表刚性接头(SEQ ID NO：12)；和氨基酸残基373-935代表TeI4h^* ORF(SEQ IDNO：3)。

图4是通过刚性接头与麦芽糖结合蛋白结合的嗜热脂肪土芽孢杆菌逆转录酶的氨基酸序列表(SEQ ID NO：9)。氨基酸残基1-367代表麦芽糖结合蛋白(SEQ ID NO：11)；氨基酸残基368-372代表刚性接头(SEQ ID NO：12)；和氨基酸残基373-1008代表嗜热脂肪土芽孢杆菌GsI1 ORF(SEQ ID NO：4)。

图5是通过刚性接头与麦芽糖结合蛋白结合的嗜热脂肪土芽孢杆菌逆转录酶的氨基酸序列表(SEQ ID NO：10)。氨基酸残基1-367代表麦芽糖结合蛋白(SEQ ID NO：11)；氨基酸残基368-372代表刚性接头(SEQ ID NO：12)；和氨基酸残基373-792代表嗜热脂肪土芽孢杆菌GsI2 ORF(SEQ ID NO：5)。

图6是在pMAL表达构建体中细长热聚球蓝细菌的逆转录酶的MalE-TeI4c开放阅读框(ORF)刚性融合体的核苷酸序列表(SEQ IDNO：13)。

图7是在pMAL表达构建体中细长热聚球蓝细菌逆转录酶的MalE-TeI4f ORF刚性融合体的核苷酸序列表(SEQ ID NO：14)。

图8是在pMAL表达构建体中细长热聚球蓝细菌逆转录酶的MalE-TeI4h^* ORF刚性融合体的核苷酸序列表(SEQ ID NO：15)。

图9是在pMAL表达构建体中嗜热脂肪土芽孢杆菌逆转录酶的MalE-GsI1 ORF刚性融合体的核苷酸序列表(SEQ ID NO：16)。

图10是在pMAL表达构建体中嗜热脂肪土芽孢杆菌逆转录酶的MalE-GsI2 ORF刚性融合体的核苷酸序列表(SEQ ID NO：17)。

图11提供显示在不同温度下逆转录酶(RT)活性的聚(rA)/寡(dT)₄₂测定的图。测定的酶是MalE-RF-GsI1、MalE-RF-GsI2、MalE-RF-TeI4c、MalE-RF-TeI4f、MalE-RF-TeI4h^*、LtrA和MalE-RF-LtrA。通过将RT(对于TeI4c为50nM、而对于所有其他RT为100nM)与100nM聚(rA)/寡(dT)₄₂和5μl[α-³²P]-dTTP(3,000Ci/mmol)一起在75mM KCl、10mM MgCl₂、20mM Tris-HCl，pH 7.5和1mMDTT中孵育进行反应。在所示温度下在反应介质中预孵育RT和聚(rA)/寡(dT)₄₂1分钟后，通过加入[α-³²P]-dTTP开始反应，孵育被证实在线性范围内的时间(对于TeI4c RT为90秒、且对于所有其他RT为5分钟)，并通过加入EDTA至终浓度为250mM停止反应。[α-³²P]-dTTP聚合成高分子量材料通过以下步骤定量：将反应产物点于Whatman DE81层析纸(GE Health care Biosciences Corp)上，用0.3MNaCl和0.03M柠檬酸钠洗涤，并用PhosphorImager扫描以定量与过滤器结合的放射性，如在材料和方法中所述。该图显示作为反应温度的函数的与过滤器结合的放射性。

图12显示II组内含子RT和融合蛋白的示意图。12(A)部分提供II组内含子编码的RT和逆转录病毒RT的比较。II组内含子RT通过由L1.LtrB内含子编码的LtrA蛋白例示，通常包含4个主要结构域：带保守序列区组RT-1-7的RT、X/拇指、DNA结合(D)和DNA内切核酸酶(En)。II组内含子RT的RT和拇指结构域与通过HIV-1 RT例示的逆转录病毒RT的同源，但由于N末端延伸以及保守RT序列区组上游(RT-0)和之间的插入(例如，LtrA中的RT-2a、3a、4a和7a以及拇指结构域插入t_i；Blocker等，RNA 11，14-28，2005)而较大。逆转录病毒RT的拇指结构域的三个α螺旋特征的位置对于LtrA和HIV-RT均显示。在本工作中使用的II组内含子RT除了缺少En结构域的GsI2 RT之外都包含En结构域。12(B)部分显示II组内含子RT融合蛋白。II组内含子RT(IEP)与融合的N末端MalE或NusA溶解度标签一起表达。最初构建体在通过带TEV蛋白酶切割位点(下划线)的柔性接头与RT的N末端融合的表达载体pMalE-c2t中包含MalE溶解度标签。在图11中测试的这些最初构建体的变体包含缺失TEV蛋白酶切割位点的PMalE-c2t接头。改进的构建体使用修饰的MalE或NusA标签，该标签通过包含5个丙氨酸残基(下划线)的刚性接头与RT的N末端融合。修饰的MalE标签具有的带电氨基酸残基改变为丙氨酸(斜体)，且修饰的NusA标签缺失两个C末端氨基酸残基。

图13提供显示带不同刚性融合接头或溶解度标签序列的MalE-RF-TeI4c RT衍生物的RT活性的图。图13(A)提供显示在60℃的RT活性的条形图。如图11使用50nM蛋白和100nM聚(rA)/寡(dT)₄₂并孵育90秒，进行与MalE-RF-TeI4c RT(左条)或包含不同标签或接头序列的变体(右面的条)的反应。值是三次测定的平均，误差条表示标准差。图13(B)提供显示NusA-RF-TeI4c RT的RT活性的温度曲线的图。如图11使用50nM蛋白和100nM聚(rA)/寡(dT)₄₂并在所示温度下孵育2分钟，测定RT活性。y轴显示各蛋白(图A)或作为反应温度函数的NusA-RF-TeI4c RT(图B)的与过滤器(PhosphorImager单元)结合的放射性。

图14提供图和放射自显影图，其提供在不同温度下通过MalE-RF-TeI4c、MalE-RF-GsI2和SuperScript III RT活性进行cDNA合成的比较。在图(A-C)中，底物是带退火的5’-标记的37-nt引物的转录自AflIII消化的pBS KS(+)的531-nt RNA，而在图(D-F)中，底物是带退火的5’-标记的44-nt DNA引物的1.2-kb kanR RNA。通过在以下中将100nM退火的模板/引物与200nM酶孵育来进行反应：对于MalE-RF-TeI4c RT(图A和D)和MalE-RF-GsI2 RT(图B和E)，在100mM KCl、20mM Tris HCl pH 7.5、10mM MgCl₂和10mM DTT中，而对于SuperScript III RT(图C和F)，在制造商的缓冲液中。通过加入dNTP至终浓度为1.25mM开始反应，在所示温度下孵育30分钟，并通过加入0.1％SDS/250mM EDTA(终浓度)终止反应，然后苯酚-CIA萃取。通过在变性的6％聚丙烯酰胺凝胶中电泳分析产物，干燥凝胶并用PhosphorImager定量。在各图中，顶部和底部放射自显影图分别显示包含全长产物(箭头)和未延伸或部分延伸引物的凝胶部分，而条形图基于PhosphorImager定量显示延伸至全长cDNA的引物百分比。“？”表示在全长产物的定量中未使用的未鉴定条带。使用5’-标记的10-bp梯条带(Invitrogen^TM)作为大小标记物。两种模板引物底物的示意图示于图的底部。

图15是1.2-kb kanR RNA模板的核苷酸序列表(SEQ ID NO：21)。

图16提供从qRT-PCR获得的半对数图，以比较在不同温度下通过MalE-RF-TeI4c RT和SuperScript III RT进行cDNA合成的量。通过MalE-RF-TeI4c RT或SuperScript III RT(SSIII RT)使用带退火引物P078(Tm＝80℃)的1.2-kb kanR RNA合成cDNA，并用nt 188-257和nt 562-634处的引物/探针组检测(用引物组nt 188-257检测的数据示于图中，用引物组nt 562-634获得的数据示于图17中)。qPCR扩增曲线显示荧光(ΔRN)对循环数的半对数图。对于每个样品，分析两个孔并绘于各扩增图中。通过MalE-RF-TeI4c RT或SuperScript IIIRT进行的各cDNA合成反应的循环阈(C_T)值(荧光越过阈值0.4的循环)示于曲线下方。较低的C_T值显示较大数量的合成cDNA。

图17提供从qRT-PCR获得的半对数图，以比较通过MalE-RF-TeI4c RT和SuperScript III RT进行cDNA合成的持续合成能力。通过MalE-RF-TeI4c RT或SuperScript III RT使用带退火引物P078(Tm＝80℃)的1.2-kb kanR RNA合成cDNA，并用nt 188-257和nt562-634处的引物/探针组检测。cDNA样品在60℃(A、B)和65℃(C、D)获得。对于每个样品，分析三个重复并绘于各扩增图中。平均拷贝数得自定量和稀释的pET9质粒的标准曲线。如对于MalE-RF-TeI4c RT所看到的，用两种引物组检测相似数量的cDNA拷贝显示大部分cDNA延伸至接近RNA模板的末端，这表明高持续合成能力。如对于SuperScript III RT所看到的，相比更靠近3’端(nt 562-634)的引物组，用接近5’端(nt 188-257)的引物组检测的较低数量的cDNA拷贝表明，RT脱落或以某种其它方式被妨碍，而不到达RNA模板的5’端。

图18是NusA溶解度增加蛋白的氨基酸序列表(SEQ ID NO：38)。

发明详述

除非另外定义，本文使用的所有技术和科学术语具有与本发明所属领域普通技术人员通常理解的相同的含义。本发明说明书中使用的术语仅用于描述具体实施方案，并非旨在限制本发明。本文提及的所有公开出版物、专利申请、专利和其他参考文献通过引用以其整体结合到本文中。

定义

如本发明说明书和所附权利要求中所用，除非上下文明确地另外指出，否则单数形式旨在也包括复数形式。另外，通过端点对数值范围的描述包括该范围内包含的所有数值(例如，1-5包括1、1.5、2、2.75、3、3.80、4、5等)。

本文所用“多肽”指氨基酸多聚体，且不表示氨基酸多聚体的具体长度。因此，例如术语肽、寡肽、蛋白、抗体和酶包含在多肽的定义内。该术语亦包括带表达后修饰的多肽，表达后修饰例如糖基化(例如糖加成)、乙酰化、磷酸化等。

本文所用“分离的”多肽或多核苷酸指从其天然环境中移走的、使用重组技术生产的或者化学或酶合成的多肽或多核苷酸。优选地，本发明的多肽或多核苷酸是纯化的，即基本上不含任何其他多肽或多核苷酸和相关细胞产物或其他杂质。

本文所用“氨基酸”指具有下述通式的化合物：NH₂-CRH-COOH，其中侧链R是H或有机基团。当R是有机基团时，R可不同且是极性的或非极性的(即疏水的)。贯穿本申请使用下列缩写：A＝Ala＝丙氨酸、T＝Thr＝苏氨酸、V＝Val＝缬氨酸、C＝Cys＝半胱氨酸、L＝Leu＝亮氨酸、Y＝Tyr＝酪氨酸、I＝Ile＝异亮氨酸、N＝Asn＝天冬酰胺、P＝Pro＝脯氨酸、Q＝Gln＝谷氨酰胺、F＝Phe＝苯丙氨酸、D＝Asp＝天冬氨酸、W＝Trp＝色氨酸、E＝Glu＝谷氨酸、M＝Met＝甲硫氨酸、K＝Lys＝赖氨酸、G＝Gly＝甘氨酸、R＝Arg＝精氨酸、S＝Ser＝丝氨酸、H＝His＝组氨酸。除非另外指出，本文使用的术语“氨基酸”亦包括仍然保留通式的氨基酸衍生物。

核苷酸的组成为，通过磷酯键与戊糖(RNA中是核糖、且DNA中是脱氧核糖)连接的磷酸基团，戊糖继而与有机碱基连接。核酸的单体单元是核苷酸。天然存在的DNA和RNA各包含四种不同的核苷酸：具有腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶碱基的核苷酸存在于天然存在的DNA中，而具有腺嘌呤、鸟嘌呤、胞嘧啶和尿嘧啶碱基的核苷酸存在于天然存在的RNA中。碱基腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶和尿嘧啶通常分别缩写成A、G、C、T和U。

核苷酸包括游离的一磷酸、二磷酸和三磷酸形式(即磷酸基团分别具有一个、两个或三个磷酸部分)。因此，核苷酸包括核糖核苷三磷酸(例如ATP、UTP、CTG和GTP)和脱氧核糖核苷三磷酸(例如dATP、dCTP、dITP、dGTP和dTTP)，以及其衍生物。核苷酸亦包括双脱氧核糖核苷三磷酸(ddNTP，包括ddATP、ddCTP、ddGTP、ddITP和ddTTP)及其衍生物。

“实质上相似”意指给定核酸或氨基酸序列与参比序列共有至少85％、更优选至少90％和甚至更优选至少95％的同一性。此外，总的来说，仅描述或编码其中在保守区中作出仅保守置换的蛋白的序列实质上相似。优选地，实质上相似的序列亦保留多肽的独特活性。通常视为保守置换的置换是在脂肪族氨基酸Ala、Val、Leu和Ile中的彼此置换、羟基残基Ser和Thr的互换、酸性残基Asp和Glu的交换、酰胺残基Asn和Gln之间的置换、碱性残基Lys和Arg的交换以及芳香残基Phe、Tyr间的置换。

本文所用“启动子”指介导由RNA聚合酶进行的转录的起始的DNA序列。转录启动子可包含若干下述不同序列元件中的一个或多个：1)存在于转录起始位点的序列元件；2)存在于转录起始位点上游的序列元件和；3)转录起始位点下游的序列元件。各个序列元件作为DNA上的位点起作用，RNA聚合酶和促进RNA聚合酶定位到DNA上的转录因子与该位点结合。

本文所用术语“聚合酶链式反应”(“PCR”)指在基因组DNA混合物中增加靶序列区段浓度而无克隆或纯化的方法。例如参见Bartlett等，Methods MoI.Biol.226：3-6(2003)，其提供PCR及其进展的综述。该用于扩增靶序列的方法通常由以下步骤组成：将大量过量的两条寡核苷酸引物引入包含所需靶序列的DNA混合物中，然后是在DNA聚合酶存在下的系列精确的热循环。两条引物与其各自的双链靶序列的链互补。为了实现扩增，使混合物变性，然后引物与其在靶分子内的互补序列退火。退火以后，用聚合酶延伸引物以形成新的互补链对。变性、引物退火和聚合酶延伸的步骤可重复多次，以获得高浓度的扩增的所需靶序列区段。除非另外指明，本文所用PCR亦包括PCR的变体，例如等位基因特异性PCR、不对称PCR、热启动PCR、连接介导PCR、多重PCR、逆转录PCR或者本领域技术人员所知的任何其他PCR变体。

如本说明书所用，不管在过渡性短语还是在权利要求主体中，术语“包含”和“包括”应解释为具有开放式含义。换言之，术语应解释为与短语“至少具有”或者“至少包含”同义。当用于方法语境时，术语“包括”意指该方法至少包括列举的步骤，但可包括另外的步骤。当用于化合物或组合物语境时，术语“包含”意指化合物或组合物包含至少列举的特征或组分，但亦可包含另外的特征或组分。

本文所用“融合蛋白”指具有至少两个共价连接的异源多肽的蛋白，其中一个多肽来自一个蛋白序列或结构域，而另一个多肽来自另一个蛋白序列或结构域。

稳定化逆转录酶融合蛋白

本发明提供稳定化逆转录酶融合蛋白，其包含与稳定剂蛋白连接的热稳定逆转录酶。在许多实施方案中，热稳定逆转录酶通过接头肽与稳定剂蛋白连接。然而，热稳定逆转录酶和稳定剂蛋白也可相互直接融合。包含融合蛋白的多肽优选从N末端到C末端连接。然而，逆转录酶和稳定剂蛋白可按任一顺序连接在一起。例如，两个肽序列可从C端到N端连接或者从N端到C端连接。在一些实施方案中，接头肽包含在逆转录酶和稳定剂蛋白的连接C末端和N末端之间。

将稳定剂蛋白与热稳定逆转录酶连接可提供一个或多个优点。稳定化逆转录酶融合蛋白可具有一个或多个下述优点：(a)在高温下增加稳定性；(b)较高的持续合成能力；(c)增加溶解度，和/或(d)较高的保真度。在一些实施方案中，本发明的逆转录酶可具有多个以上列出的性质。例如，稳定化逆转录酶融合蛋白可具有增加的热稳定稳定性和增加的保真度。优点有时可源自彼此。例如，通过提供增加的溶解度，由于溶解先前不溶的高保真度热稳定逆转录酶，稳定化逆转录酶融合蛋白可提供能够提供增加的转录保真度的产物。在融合蛋白中使用稳定剂蛋白亦可提供其他优点，例如增加蛋白表达和改进蛋白折叠。在稳定剂蛋白和热稳定逆转录酶之间包含接头肽可进一步增强这些优点。

如本文所述，稳定化逆转录酶融合蛋白包含热稳定逆转录酶和稳定剂蛋白。稳定化逆转录酶融合蛋白亦可包含接头肽。例如，稳定化逆转录酶融合蛋白可具有分别示于图1-5的SEQ ID NO：6、SEQID NO：7、SEQ ID NO：8、SEQ ID NO：9或SEQ ID NO：10中所示的氨基酸序列。备选地，稳定化逆转录酶融合蛋白可具有与SEQ IDNO：6、SEQ ID NO：7、SEQ ID NO：8、SEQ ID NO：9或SEQ ID NO：10中所示的一个或多个序列实质上相似的氨基酸序列。与序列6-10提供的融合蛋白“实质上相似”的稳定化逆转录酶融合蛋白氨基酸序列将分享至少85％同一性、更优选90％同一性和甚至更优选95％同一性，并仅包括保守区中的保守氨基酸置换。

热稳定逆转录酶

本发明提供包含热稳定逆转录酶的逆转录酶融合蛋白。术语“逆转录酶”(即RNA指导的DNA聚合酶)指一组具有逆转录酶活性的酶(即催化从RNA模板合成DNA)。通常，这样的酶包括但不限于逆转录病毒逆转录酶、逆转录转座子逆转录酶和细菌逆转录酶(例如II组内含子衍生的逆转录酶)，以及其突变体、变体或衍生物。细菌逆转录酶的实例包括乳酸乳球菌(Lactococcus lactis)逆转录酶、细长热聚球蓝细菌逆转录酶或嗜热脂肪土芽孢杆菌逆转录酶。更多细菌逆转录酶参见Simon等，Nucleic Acids Research，36，第7219-29页(2008)以及Kojima和Kanehisa，Molecular Biology and Evolution，25，第1395-04页(2008)，其描述许多类别的逆转录酶(即尤其逆转录子、II组内含子和产生多样性的逆转录元件)。逆转录酶主要用于将RNA转录为cDNA，cDNA可接着被克隆到载体中用于进一步操作或者用于多种扩增方法，例如聚合酶链式反应、基于核酸序列的扩增(NASBA)、转录介导的扩增(TMA)、自动维持序列复制(3SR)、多样化引物延伸反应、5’RACE、化学修饰的检测或者其他需要使用RNA模板合成DNA的技术。

术语“热稳定的”指酶或蛋白质(例如逆转录酶)抗热灭活的能力。这样的酶通常获自已经进化成在高温环境中生长的喜温生物(即嗜热生物)。本文所用嗜热生物是具有45℃以上的最佳生长温度和通常70℃以上的最高生长温度的生物。通常，热稳定酶比一般的酶(例如来自嗜温生物的酶)对热灭活更具抗性。因此，热稳定逆转录酶的核酸合成活性可通过热处理下降到某种程度，但比不上来自嗜温生物的逆转录酶的下降。“热稳定的”亦指酶在高于38℃的温度下有活性，优选在约38-100℃之间，且更优选在约40-81℃之间。特别优选温度范围是约45℃至约65℃。

在一些实施方案中，在核酸合成混合物中于90℃被加热30秒后，热稳定逆转录酶保留其至少50％(例如至少60％、至少70％、至少80％、至少90％或至少95％)的核酸合成活性。与此相反，一般逆转录酶在高温下将不起作用，在这种热处理后失去其大部分核酸合成活性。热稳定逆转录酶也通常具有较高的最佳核酸聚合温度。

一些逆转录酶是热稳定的，因此在基于PCR的核酸合成中常用的温度下实质上仍有活性。这提供了能够在单一反应环境中进行逆转录和DNA扩增二者的优点。这样的温度视反应参数而不同，反应参数包括pH、模板和引物核苷酸组成、引物长度和盐浓度。热稳定逆转录酶包括细长热聚球蓝细菌(Te)RT、嗜热脂肪土芽孢杆菌(Gs)RT、这些RT的修饰形式、以及禽类成髓细胞性白血病病毒(AMV)RT、莫洛尼鼠白血病病毒(M-MLV)RT和人免疫缺陷病毒(HIV)RT的工程改造变体。可预期从生活在高温环境(即高于37℃)生物中获得的逆转录酶在生物的生存温度和合理程度以上的温度下稳定。

一类特别适合在稳定化逆转录酶融合蛋白中使用的逆转录酶是II组内含子衍生的逆转录酶。许多II组内含子衍生的逆转录酶是已知的。例如参见Zimmerly实验室网址的Mobile Group II Introns(可动II组内含子)，其描述105种全长II组内含子衍生的逆转录酶。该网站的使用参见Dai等，Nucleic Acids Research，31，第424-26页(2003)。

在特定实施方案中，热稳定逆转录酶是由II组内含子编码的酶。II组内含子RT通常由四个保守结构域组成：RT(其包含是逆转录病毒RT的手指和手掌区域特征的七个保守序列区组(RT1-7))；X，至少部分对应于逆转录病毒RT的拇指结构域的为RNA剪接活性所需的区)；D，参与DNA靶位点识别的DNA结合结构域；和En，切割DNA靶位点以产生逆转录引物的DNA内切核酸酶结构域(图12A；Blocker等，RNA 11，14-28，2005)。En结构域在一些II组内含子RT中缺失，这些RT改为使用DNA复制叉处的新生链以引发逆转录(Zhong等，EMBO J.22，4555-4565，2003)。由于N末端延伸、附加的N末端保守序列区组(RT-0)以及在RT和X/拇指结构域的保守序列区组之间的插入(部分为非-LTR-逆转录转座子RT所共有)，因此II组内含子RT的RT和X/拇指结构域比逆转录病毒RT的大。已表明，II组内含子和相关RT的较大尺寸的RT和拇指结构域使与模板RNA的结合能够更紧密，得到在逆转录过程中更高的持续合成能力和保真度。与逆转录病毒RT不同，II组内含子RT缺少RNA酶H结构域并通常具有很低的依赖DNA的DNA聚合酶活性(Smith等，Genes and Development 19，2477-2487，2005)。

II组内含子编码一类已知其自剪接反应的RNA。在特定的体外条件下，II组内含子编码的RNA可在无蛋白帮助下将其自身从前体mRNA切除并将它们侧翼的外显子连接在一起。剪接反应机制与核前mRNA内含子的剪接相似。许多II组内含子亦编码逆转录酶(RT)开放阅读框(ORF)并且是活性可动元件。ORF通常存在于II组内含子编码的RNA的DIV结构域中。II组内含子RT通过稳定催化活性RNA结构辅助RNA剪接，并然后在核糖核蛋白(RNP)中保持与切除内含子RNA结合，该核糖核蛋白通过称为“反向归巢(retrohoming)”的过程促进内含子移动性。反向归巢通过其中RNP中的切除内含子RNA直接插入DNA靶位点中并通过RT逆转录的机制发生。在反向归巢期间，II组内含子促进内含子靶向合适DNA序列，II组内含子RT必须生产内含子RNA的精确cDNA拷贝，内含子RNA通常2-2.5kb长且折叠成高度稳定和致密的二级和三级结构。因此，II组内含子RT必须具有高的持续合成能力和保真度，以便完成其生物学功能。II组内含子衍生的RT亦缺乏RNA酶H活性，其可以是有益的，因为RNA酶H特异降解RNA:DNA杂合体的RNA，使任何RNA仅能够复制一次并可导致降低的全长cDNA产率。

基于到目前为止评价的II组内含子衍生的逆转录酶，这些RT通常表现相对高的保真度和高的持续合成能力。逆转录酶的保真度指在RNA逆转录成DNA期间核苷酸参入的可靠性，其中较高的保真度描述低数量错误(例如，错参)的核苷酸复制。较高的特异性可通过使用较长和更特异的引物提供，这要求在较高温度下进行逆转录的能力。例如，II组内含子衍生的逆转录酶可提供2.0×10^-5以下的错误频率的逆转录，其中错误频率表示发生的核苷酸复制错误相对无错误发生的核苷酸复制事件的数量的比例。高保真度转录的其他实例包括1×10^-4、7.5×10^-5、5×10^-5、2.5×10^-5、1×10^-5和5×10^-6的错误频率。关于II组内含子衍生的RT的高保真度的进一步描述，参见Conlan等，Nucleic Acids Research，33，第5262-70页(2005)。

合适II组内含子衍生的逆转录酶的实例包括SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4和SEQ ID NO：5所示的逆转录酶，其获自细长热聚球蓝细菌(TeI4c、f和h^*)和嗜热脂肪土芽孢杆菌(GsI1和GsI2)。这些序列示于图1-5。本发明亦涵盖与SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4和SEQ ID NO：5所示的那些实质上相似的II组内含子衍生的逆转录酶。与由序列1-5提供的逆转录酶“实质上相似”的逆转录酶将分享至少85％同一性、更优选90％同一性和甚至更优选95％同一性，且将仅包含保守区中的保守氨基酸置换。一些II组内含子衍生的RT的热稳定性示于图11中，其表明，当如图11所示评价时，包含SEQID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4和SEQ IDNO：5所示的逆转录酶的稳定化逆转录酶融合蛋白具有比嗜温L1.LtrB逆转录酶高的热稳定性，而不管嗜温L1.LtrB逆转录酶是否是融合蛋白的一部分。嗜温L1.LtrB单独或者作为融合蛋白的一部分均显示约35℃的最佳温度。

正如本文所提及的，亦可使用热稳定II组内含子衍生的RT的修饰形式。例如，SEQ ID NO：3(TeI4h^*RT)不表示天然形式的逆转录酶，而是活性位点从氨基酸序列YAGD改变为氨基酸序列YADD的衍生物，以便更接近地相似其他活性II组内含子衍生的RT的活性位点。

给定氨基酸序列与参比序列“实质上相似”的量可例如通过使用序列分析软件比较序列信息来测定，序列分析软件如BLAST 2搜索算法的Blastp程序，版本2.2.10，如Tatusova等(FEMSMicrobiology Letters，174，第247-50页(1999))描述，并可通过万维网在美国国家生物技术信息中心(National Center for BiothechnologyInformation)网站分子数据库(Molecular Database)板块的BLAST下获得。优选地，所有BLAST2搜索参数使用默认值，包括矩阵＝BLOSUM62；开放空位罚分＝11、延伸空位罚分＝1、空位x下降＝50、期望值＝10、字长＝3和任选过滤器开。在使用BLAST搜索算法比较两个氨基酸序列中，结构相似性称为“相似性”，而结构同一性称作“同一性”。

氨基酸同一性在候选多肽和参比氨基酸序列间比较的情况下定义，且通过比对两条氨基酸序列(即候选氨基酸序列和参比氨基酸序列)的残基以优化沿其序列长度的相同氨基酸数量来测定；在进行比对时允许两条序列之一或二者中的空位，但是每条序列中的氨基酸必须仍然保持其正确次序。

支持II组内含子衍生的逆转录酶的结构-功能关联的信息是可得到的。例如参见对细菌逆转录酶的RT结构域进行分类和比对的Simon等，Nucleic Acids Research，36，第7219-29页(2008)，和提供显示七个保守结构域和42个保守位置的82个RT序列比对的Xiong等，EMBO J.，9，第3353-62页(1990)。亦参见Blocker等，RNA，11，第14-28页(2005)，其提供乳酸乳球菌L1.LtrB内含子RT(LtrA蛋白)的三维模型，描述蛋白酶剪切位点和保守区，并提供LtrA相对于HIV-1RT的序列比对分析。因此，多种与SEQ ID NO.6-10所示的那些实质上相似的稳定化逆转录酶融合蛋白可容易地通过保守区外氨基酸的修饰和已知保守区内仅保守氨基酸修饰来获得。

在一个实施方案中，本发明提供具有逆转录酶活性的稳定化逆转录酶融合蛋白，其在高温(即高于37℃)具有比相应的未结合逆转录酶长的半寿期。在一些实施方案中，本发明逆转录酶的半寿期在50℃可为5分钟以上，且优选为10分钟以上。在一些实施方案中，本发明的逆转录酶可具有等于或大于约25分钟的半寿期(例如在50℃)，优选等于或大于约50分钟，更优选等于或大于约100分钟，以及最优选等于或大于约200分钟。

稳定剂蛋白

本发明的稳定化逆转录酶融合蛋白亦包含稳定剂蛋白。本文定义的稳定剂蛋白是形成融合蛋白一部分的蛋白，其起增加融合蛋白整体稳定性的作用。稳定性包括蛋白保持其构象和活性的能力。另外，稳定剂蛋白优选增加融合蛋白的溶解度，如本文就溶解度增加蛋白的进一步描述。这对于II组内含子衍生的RT可特别有帮助，已发现II组内含子衍生的RT在RNP中的它们通常与之紧密结合的内含子RNA不存在时表达差且不溶(Vellore等Appl.Environ.Microbiol.70，7140-7147，2004；Ng等，Gene 393，137-144，2007)。有效稳定剂蛋白包括这样的蛋白：其包含独立折叠结构域和/或不折叠成可影响蛋白聚集倾向的长寿命错折叠中间体。提供独立折叠结构域的蛋白参见Janin等，Progress in Biophysics and Molecular Biology，42，第21-78页(1983)，而不折叠成长寿命错折叠中间体的蛋白参见Idicula等，Protein Science，14，第582-592页(2005)。例如，稳定剂蛋白可以是包含50个以上氨基酸的蛋白。在其他实施方案中，稳定剂蛋白可以是包含100个以上氨基酸的更大的蛋白。如本文提供的麦芽糖结合蛋白和NusA蛋白所例示，稳定剂蛋白亦可具有约250个氨基酸至约400个氨基酸的大小。稳定剂蛋白亦可是热稳定蛋白。

稳定剂蛋白亦可是或者包含亲和蛋白。本文所用术语亲和蛋白指存在其容易获得的配体的蛋白，该配体表现对该蛋白的高结合常数(即“亲和力”)。亲和蛋白通常用于亲和标签的作用。如本领域技术人员已知的，亲和蛋白可在融合蛋白中提供以有助于通过例如亲和纯化(其中标签与亲和柱内的配体结合)等技术纯化与亲和蛋白连接或融合的蛋白。合适的亲和蛋白是本领域已知的。例如参见Waugh，D.，Trends in Biotechnology，23，第316-320页(2005)，其描述许多合适的亲和蛋白，包括谷胱甘肽S-转移酶、麦芽糖结合蛋白、FLAG标签肽、生物素接纳体肽、链霉亲和素结合肽和钙调蛋白结合肽。对于制备和使用包含亲和蛋白的融合蛋白，例如参见美国专利号5,643,758、5,654,176和7,001,745。

稳定剂蛋白亦可为溶解度增加蛋白。重组表达的融合蛋白在其宿主细胞和/或在随后的方法应用中可表现低溶解度，这可通过在融合蛋白中包含溶解度增加蛋白而改良，该溶解度增加蛋白实质上增加水环境中的融合蛋白溶解度。一些使用的溶解度增加蛋白亦是亲和蛋白，并因此可描述为溶解度增加亲和蛋白。溶解度增加蛋白的实例包括糖结合蛋白，例如阿拉伯糖结合蛋白、壳多糖结合蛋白、纤维素结合蛋白和麦芽糖结合蛋白。溶解度增加蛋白的其他实例包括由Novagen提供的NusA和Dsb溶解度标签以及Invitrogen^TM提供的溶解度增加标签(SET)。Harrision已经证明NusA溶解度标签提供非常高的溶解度，而Dsb的溶解度增加由Collins-Racie描述。参见Harrison，R.G.，inNovations，11，第4-7页(2000)，和Collins-Racie等，Biotechnology，13，第982-87页(1995)。

在一些实施方案中，稳定剂蛋白例如溶解度增加蛋白或者亲和蛋白可被修饰以改进其性能。与蛋白的正常野生型序列相比，修饰可包括提供稳定剂蛋白的蛋白序列内氨基酸的一个或多个置换、插入或缺失。例如，稳定剂蛋白(例如亲和蛋白或溶解度增加蛋白)可通过在蛋白的特定区域中使用不带电氨基酸置换带电氨基酸来修饰。带电氨基酸包括具有带正电或带负电侧链的氨基酸。具有带正电侧链的氨基酸的实例包括精氨酸、组氨酸、赖氨酸等。具有带负电侧链的氨基酸的实例包括天冬氨酸和谷氨酸等。不带电氨基酸包括但不限于丙氨酸、丝氨酸、苏氨酸、谷氨酰胺、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸和酪氨酸。例如，麦芽糖结合蛋白可通过用丙氨酸置换一个或多个带电氨基酸而修饰。

合适亲和蛋白的实例包括SEQ ID NO：11所示的麦芽糖结合蛋白氨基酸序列(示于图1-5)和与SEQ ID NO：11实质上相似的序列。应注意，当亲和蛋白的修饰不是必需时，SEQ ID NO：11所示的麦芽糖结合蛋白被修饰为在近C末端用丙氨酸置换三个带电氨基酸。另一种合适蛋白(在该情况下为增溶蛋白)是N-利用物质A(NusA)蛋白，其具有图18所示SEQ ID NO：38中所示的氨基酸序列。在本发明另外的实施方案中，本文描述包含麦芽糖结合蛋白的融合蛋白可用N-利用物质A蛋白置换麦芽糖结合蛋白。

接头肽

在一些实施方案中，稳定化逆转录酶融合蛋白亦包含位于稳定剂蛋白和热稳定逆转录酶之间的接头肽。优选地，接头肽是非可切割接头肽。“位于...之间”是指接头肽通过化学键(例如，酰胺键)与稳定剂蛋白和逆转录酶各自的N末端或C末端连接，如本文关于融合蛋白的描述。例如，接头肽可通过酰胺键与稳定剂蛋白的C末端区和热稳定逆转录酶的N末端区连接。非可切割意指接头肽不容易对蛋白酶切割易感。

在另外的实施方案中，接头肽是刚性接头肽；即相对非柔性肽接头。刚性接头肽不要求完全缺乏柔性，而是比柔性接头肽如富甘氨酸肽接头柔性少。由于其相对缺乏柔性，刚性接头肽降低通过刚性接头肽连接在一起的两个蛋白结构域(在当前情况下是稳定剂蛋白和热稳定逆转录酶)的运动。提供有序链(例如α螺旋结构)的接头肽可提供刚性接头肽。例如，精氨酸、亮氨酸、谷氨酸、谷氨酰胺和甲硫氨酸都显示出相对高的螺旋接头结构倾向。然而，包含许多脯氨酸残基的非螺旋接头也可表现显著的刚性。刚性接头的实例包括聚赖氨酸和聚-DL-丙氨酸聚赖氨酸。刚性肽接头的进一步描述由Wriggers等，Biopolymers，80，第736-46页(2005)提供。此外，刚性接头肽在由George等，Protein Engineering，15，第871-79页(2003)描述的接头数据库中描述。优选地，刚性接头肽也是非可切割接头肽，即非可切割刚性接头肽。

优选相对短的多肽用作接头肽。例如，接头肽可包含1-20个氨基酸。接头肽亦可包含1-15个、1-10个、1-5个或3-5个氨基酸。可用作接头肽的具体序列实例包括由丙氨酸氨基酸形成的二肽、三肽、四肽和五肽。一种合适的刚性接头肽是AAAAA(SEQ ID NO：12)，而另一种合适刚性接头肽是AAAEF(SEQ ID NO：18)。在融合蛋白中使用接头肽(例如刚性接头肽)可提供一个或多个优点。例如，虽然未旨在受理论束缚，但是据相信刚性接头肽的使用可通过降低融合蛋白两部分相对彼此的运动量来稳定融合蛋白。虽然可使用非常短(即1或2个氨基酸)的接头，但优选使用包含3-5个氨基酸的接头。

接头肽可以是通过蛋白酶可切割或非可切割的。亲和蛋白通常在融合蛋白中使用可切割肽与另一个蛋白相连，以便可移除亲和蛋白。然而，由于本文描述的理由，在本发明中稳定剂蛋白(例如亲和蛋白)保持与逆转录酶结合。因此，一般优选接头肽是非可切割的。然而，可切割接头可用于一些实施方案。例如，如果在后续步骤期间除去稳定剂蛋白是合乎需要的，且在使用融合蛋白过程中避免暴露于蛋白酶切割，那么可使用对蛋白酶切割易感的可切割接头，包括刚性可切割接头肽。

稳定化逆转录酶融合蛋白的使用

本发明也提供从RNA(例如mRNA、rRNA、tRNA和miRNA)制备cDNA的方法，其为其他方法例如逆转录聚合酶链式反应(RT-PCR)所需。本文所用术语“RT-PCR”指RNA序列的复制和扩增。在该方法中，逆转录与PCR结合，例如，如美国专利号5,322,770中所述。在RT-PCR中，RNA模板由于酶的逆转录酶活性转变成cDNA，然后使用相同或不同酶的聚合活性扩增。

在本发明的实践中，cDNA分子的制备可通过：在有助于通过组合物的酶作用逆转录核酸分子以形成cDNA分子(单链或双链)的条件下，将使用本领域公知方法获自细胞、组织或器官的一种或多种核酸分子(例如RNA)与本发明的组合物混合。因此，本发明的方法包括：(a)将一种或多种核酸模板(优选一种或多种RNA或mRNA模板，例如RNA分子群体)与本发明的稳定RT融合蛋白混合，和(b)在足以允许一种或者多种核酸模板的全部或部分的cDNA合成的条件下孵育混合物。

在一个方面，方法包括如下步骤：(a)将引物加入RNA分子中，和(b)在足以合成与RNA模板的全部或部分互补的cDNA分子的条件下，在一种或多种脱氧核糖核苷三磷酸或者双脱氧核糖核苷三磷酸和包含与稳定剂蛋白连接的热稳定逆转录酶的稳定化逆转录酶融合蛋白的存在下孵育RNA分子。将引物加入RNA分子中可包括使引物与RNA分子杂交。在一些实施方案中，稳定化逆转录酶融合蛋白亦可包含将稳定剂蛋白与热稳定逆转录酶连接的接头肽。优选地，逆转录在其中RNA包含实质上减少量的阻碍性稳定二级或三级结构的温度范围内进行。这可以是约45℃至约85℃的温度，其中更优选的温度范围是约45℃至约65℃。这亦可描述成其中RNA不形成显著量的稳定二级或三级结构的温度范围。由于II组内含子衍生的RT的高保真度和其他优点，可优选使用它们。例如，稳定化逆转录酶融合蛋白可包含：II组内含子衍生的逆转录酶，其具有与选自SEQID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4或SEQ IDNO：5的序列实质上相似的氨基酸序列同一性；由1-20个氨基酸组成的非可切割接头；和稳定剂蛋白包含溶解度增加蛋白或亲和蛋白。稳定化逆转录酶融合蛋白亦可包含稳定剂肽和逆转录酶之间的接头肽，其可具有1-20个氨基酸的长度，可以是非可切割接头或者可以是刚性接头。方法实施方案可以2.0×10^-5以下的错误频率进行逆转录。特别是在约45℃至约65℃的温度下。

稳定化逆转录酶融合蛋白亦可在用于其他应用。例如，稳定RT融合蛋白可用于克隆差别表达的mRNA 5’末端；一种称为cDNA末端快速扩增(RACE)的方法及其变体，例如RNA配体介导的RACE(RLM-RACE)。稳定RT融合蛋白亦可用于RNA中的化学足迹作图、差示RT-PCR(其使得能够分析细胞群体中的基因表达)和用于医学诊断的原位PCR。

稳定化逆转录酶融合蛋白的制备

包含编码稳定化逆转录酶融合蛋白的核酸分子的表达载体可用于在重组宿主细胞中稳定化逆转录酶融合蛋白的高水平表达。表达载体可包括但不限于克隆载体、修饰的克隆载体、特别设计的质粒或病毒。多种表达载体可用于在合适细胞类型中表达重组稳定化逆转录酶融合蛋白序列。例如，细菌载体、哺乳动物载体、真菌载体和昆虫载体可分别用于在细菌、哺乳动物细胞、真菌细菌和昆虫细胞中表达。

稳定化逆转录酶融合蛋白可通过获得能够表达稳定化逆转录酶融合蛋白的核苷酸序列和接着在宿主细胞中表达该核苷酸序列来制备。由宿主细胞表达的稳定化逆转录酶融合蛋白可接着使用多种本领域技术人员已知的技术纯化，部分取决于宿主细胞的性质。

本发明能够表达稳定化逆转录酶融合蛋白的核苷酸序列可使用多种本领域技术人员已知的方法制备。例如，核苷酸序列可使用其中组合有不同接头、逆转录酶和稳定剂蛋白的重组质粒制备，如本文实施例1所述。

本发明亦涉及用包含能够表达稳定化逆转录酶融合蛋白的核酸分子的载体转化或转染的宿主细胞。重组宿主细胞可为原核的或真核的，包括但不限于，细菌例如大肠杆菌，真菌细胞例如酵母，哺乳动物细胞包括但不限于牛、猪、猴和啮齿动物来源的细胞系；和昆虫细胞包括但不限于果蝇和蚕衍生的细胞系。这样的重组宿主细胞可在合适条件下培养以生产稳定化逆转录酶融合蛋白或生物学等价的形式。如本文所定义，术语“宿主细胞”不旨在包括在转基因人、人胎儿或人胚胎体内的宿主细胞。

如上文所示，包含编码稳定化逆转录酶融合蛋白的DNA的表达载体可用于在重组宿主细胞中表达稳定化逆转录酶融合蛋白。因此，本发明另一方面是用于在重组宿主细胞中表达稳定化逆转录酶融合蛋白的方法，包括：(a)将包含核酸的载体引入合适宿主细胞中，该核酸包含编码稳定化逆转录酶融合蛋白的核苷酸序列，其中稳定化逆转录酶融合蛋白包含与稳定剂蛋白直接连接或通过接头连接的热稳定逆转录酶，和(b)在允许表达稳定化逆转录酶融合蛋白的条件下培养宿主细胞。稳定化逆转录酶融合蛋白可改变以包含本文描述的任何特征，例如包含与热稳定逆转录酶和稳定剂蛋白连接的接头肽。

在稳定化逆转录酶融合蛋白在宿主细胞中表达之后，可回收稳定化逆转录酶融合蛋白以提供纯化的稳定逆转录酶融合蛋白。若干蛋白纯化方法可用且适合使用。例如，参见本文提供的实施例2。重组蛋白可通过分级盐析、离子交换层析、大小排阻层析、羟基磷灰石吸附层析和疏水作用层析的不同组合或单独应用来从细胞裂解物和萃取物中纯化。本发明一些实施方案中亲和标签的使用可有助于纯化蛋白。例如，稳定化逆转录酶融合蛋白可通过使用由对融合蛋白的逆转录酶或稳定剂蛋白部分特异的单克隆或多克隆抗体制成的免疫亲和柱与其他细胞蛋白分离。可使用加热从在高温下不稳定并将因此沉淀的宿主蛋白中分离稳定化逆转录酶融合蛋白。

能够表达稳定RT融合蛋白的核酸可装配到表达盒中，该表达盒包含设计用于在宿主细胞中提供融合蛋白的有效表达的序列。该盒优选包含编码稳定化逆转录酶融合蛋白的开放阅读框，以及与其有效连接的相关转录和翻译控制序列，例如启动子和终止序列。例如，开放阅读框可包含编码多肽的核酸，该多肽具有与选自分别示于图1-5的SEQ ID NO：6、SEQ ID NO：7、SEQ ID NO：8、SEQ IDNO：9或SEQ ID NO：10的序列实质上相似的氨基酸序列同一性。在一个优选实施方案中，启动子是用于在大肠杆菌中表达的T7或tac启动子，但是本领域技术人员将认识到可使用许多其他已知启动子中的任一种。大肠杆菌还具有不依赖和依赖rho的终止子，并可使用T7聚合酶用于快速DNA复制。在真核细胞中，包含聚腺苷酸化位点将有助于mRNA的正确加工。

开放阅读框亦可包含分别如图6-10所示的SEQ ID NO：13、SEQ ID NO：14、SEQ ID NO：15、SEQ ID NO：16和SEQ ID NO：17中所示的多核苷酸序列。备选地，开放阅读框可包含与SEQ ID NO：13、SEQ ID NO：14、SEQ ID NO：15、SEQ ID NO：16和SEQ ID NO：17所示的那些实质上相似的多核苷酸序列。在此特定的上下文中，术语“实质上相似”指核苷酸序列变体，其中可互换使用编码相同氨基酸的密码子，使得核苷酸序列将仍导致对应于SEQ ID NO：6-10的氨基酸序列的翻译。稳定化逆转录酶融合蛋白开放阅读框多核苷酸优选与选自SEQ ID NO：13、SEQ ID NO：14、SEQ ID NO：15、SEQ ID NO：16和SEQ ID NO：17的多核苷酸序列具有至少约80％同一性、至少约90％同一性、至少约95％同一性或至少约98％同一性。

核苷酸同一性在候选稳定化逆转录酶融合蛋白开放阅读框与选自SEQ ID NO：13、SEQ ID NO：14、SEQ ID NO：15、SEQ ID NO：16和SEQ ID NO：17的多核苷酸序列之间比较的情况下定义，且通过比对两个多核苷酸的残基以优化沿其序列长度的相同核苷酸数来测定。在进行比对时允许两个序列之一或二者中的空位，以便优化共有核苷酸的数量，但是各序列中的核苷酸必须仍保持其正确次序。优选地，两个核苷酸序列使用BLAST 2搜索算法的Blastn程序比较，如Tatusova等(FEMS Microbiology Letters，174，第247-50页(1999))所述，并可通过万维网在美国国家生物技术信息中心网站分子数据库板块的BLAST下获得。优选地，所有BLAST 2搜索参数使用默认值，包括匹配奖励＝1、错配罚分＝-2、开放空位罚分＝5、延伸空位罚分＝2、空位x下降＝50、期望值＝10、字长＝11和任选过滤器开。在使用BLAST搜索算法比较两个核苷酸序列中，核苷酸同一性称为“同一性”。

关于从核苷酸序列制备蛋白，应当注意四种可能核苷酸碱基的“三联体”密码子可以超过60种变体形式存在。因为这些密码子提供仅20种不同氨基酸(以及转录起始和终止)的信息，所以一些氨基酸可由多于一种密码子编码，一种称为密码子冗余的现象。因此，用于制备稳定化逆转录酶融合蛋白特定氨基酸序列的核苷酸序列可颇为不同，视使用的具体密码子而定。由于未完全理解的原因，备选密码子不一致地存在于不同细胞类型的内源DNA中，在特定类型的细胞中某些密码子存在天然序位或“优选”。因此，在一些实施方案中，选择用于表达稳定化逆转录酶融合蛋白的密码子可通过使用导致高水平表达的特定密码子来优化。

依据本发明，稳定化逆转录酶融合蛋白表达盒插入到载体中。载体优选质粒载体或腺病毒载体，但是亦可使用与启动子连接的线性DNA或其他载体，例如腺伴随病毒或修饰的痘苗病毒、逆转录病毒载体或慢病毒载体。特别优选使用大肠杆菌质粒载体。

以下提供由本发明人为开发和评价稳定化逆转录酶融合蛋白而进行的工作的详细说明。

II组内含子RT作为MalE融合蛋白的表达及纯化

表现差蛋白的表达和溶解度有时可通过融合高度可溶蛋白改善，高度可溶蛋白例如麦芽糖结合蛋白(MalE)或N利用物质A(NusA)(Nallamsetty等，Protein Expression and Purification 45，175-182，2005)。此外MalE标签使得能够通过直链淀粉亲和层析容易地纯化蛋白。本发明人因此测试II组内含子RT是否可作为MalE融合体表达和纯化。最初，MalE标签通过pMal-c2t表达载体中的TEV蛋白酶可切割接头与RT的N末端融合(图12B)。若干细长热聚球蓝细菌II组内含子RT的MalE-RT融合蛋白在大肠杆菌中表达良好，并可通过包括聚乙烯亚胺(PEI)沉淀除去核酸，然后直链淀粉亲和层析和肝素琼脂糖层析的步骤纯化。此外，纯化后立即测定的未切割MalE-RT融合蛋白具有高热稳定RT活性。然而，对于热聚球蓝细菌(Thermosynechococcus)蛋白，这些蛋白的产量＜0.2mg/l。另外，当通过TEV蛋白酶切割除去MalE标签时，RT立刻形成不溶沉淀，而如果保持标签未切割，那么即便在保存于冰上或瞬间冷冻于50％甘油中时，MalE-RT融合蛋白也逐渐失去RT活性并在数天内降解。后者的发现是出人意外的，因为在溶解度标签的存在下正确折叠的蛋白在切除标签后趋于保持可溶(Nallamsetty等，Protein Expression andPurification 45，175-182，2005)。在存在而非不存在连接的MalE标签的情况下有活性的II组内含子RT似乎是例外。稳定剂蛋白必须保持与热稳定逆转录酶连接的发现表明，其在保持热稳定逆转录酶可溶和活性中起积极作用。

为了克服这些困难，本发明人测试是否可通过非可切割刚性接头将MalE标签与蛋白连接使II组内含子RT稳定在活性形式。该MalE-刚性融合体通常具有3-5个丙氨酸残基的接头区，以及在MalE标签的C末端用丙氨酸置换带电氨基酸残基的改变(Smyth等，Genesand Development 19，2477-2487，2003)。这些刚性融合体接头降低构象异质性，使带有连接的接头的蛋白能够结晶用于结构测定(Smyth等，同上)。对于本文测试的MalE-RF-RT融合体，将pMal-c2t的MalE/接头区TVDEALKDAQTNS₃N₁₀LENLYFQGEF(SEQ ID NO：19)修饰为TVDAALAAAQTAAA(SEQ ID NO：20)，并称为MalE-RF(刚性融合体)标签(图12B)。

为了快速确定MalE-RF标签是否影响II组内含子RT的活性，本发明人测试MalE-RF-RT是否可支持体内反向归巢。对于初始测试，所选RT是由乳酸乳球菌L1.LtrB内含子编码的LtrA蛋白，和是由热稳定细长热聚球蓝细菌TeI4h内含子编码的RT的活化衍生物的TeI4h^* RT。在37℃反向归巢测定中，MalE-RF-LtrA蛋白以20％的效率相比天然LtrA 86％的效率支持反向归巢，而在48℃反向归巢测定中，MalE-RF-TeI4h^*蛋白以87％的效率相比未融合TeI4h^*蛋白100％的效率支持反向归巢；参见表1。因此，两种MalE-RF-RT均显著保持以高但稍微降低的效率支持反向归巢的能力，而不管连接的麦芽糖结合蛋白刚性接头序列存在与否。这些发现表明，蛋白保留实质上为反向归巢所需的所有活性水平，包括RT活性、RNA剪接活性和DNA内切核酸酶活性。该移动性测定提供对活性II组内含子RT的合宜筛查。

表1：不同RT的反向归巢效率

RT	效率
		TeI4h^*(48℃)	100％
MalE-RF-TeI4h^*(48℃)	87％
		LtrA(37℃)	86％
MalE-RF-LtrA(37℃)	20％

按照先前对于L1.LtrB内含子(LtrA蛋白)(Guo等Science 289，452-457，2000，Karberg等Nature Biotech.19，1162-1167，2001)和TeI4h^*所述，在大肠杆菌HMS174(DE3)中进行反向归巢测定。Cap^R内含子供体质粒使用T7lac启动子来表达ΔORF内含子(I-ΔORF)，其带有在DIV中的短侧翼5’和3’外显子(分别是E1和E2)的和T7启动子，然后是E2下游的RT ORF。Amp^R受体质粒包含用于无启动子tet^R基因的上游克隆的内含子(连接的E1-E2序列)的靶位点。在所示温度下用IPTG(对于LtrA和MalE-RF-LtrA为0.1mM，而对于TeI4h^*和MalE-RF-TeI4h^*为0.5mM)诱导内含子表达1小时。携带T7启动子的内含子反向归巢到靶位点中激活tet^R基因的表达，使能够选择Tet^R+Amp^R菌落。反向归巢效率以(Amp^R+Tet^R)/Amp^R菌落的比率计算。

受这些发现鼓舞，本发明人构建质粒，其中若干II组内含子RT在pMal-c2t载体中与通过刚性接头与蛋白N末端融合的MalE标签一起表达。测试的RT包括其支持反向归巢的能力先前已利用上文质粒测定测试的若干细长热聚球蓝细菌II组内含子RT，以及先前难以以高产率和活性纯化的与II组内含子RT相关的两种嗜热脂肪土芽孢杆菌II组内含子RT(Vellore等，Appl.Environ.Microbiol.70，7140-7147，2004；Ng等，Gene 393，137-144，2007)。在一些构建体中，本发明人加入另外的C末端His6-标签以在纯化中富集全长蛋白。MalE-RF-RT融合蛋白在大肠杆菌中表达，并通过包括核酸的PEI沉淀后直链淀粉亲和层析和肝素琼脂糖层析的步骤纯化。对于有C末端His6-标签的构建体，包括另外的Ni柱层析步骤。将蛋白质对着带50％甘油的纯化缓冲液透析，瞬间冷冻并保存在-80℃。终蛋白制剂纯度＞95％，产量为0.5-2.2mg/ml，并且它们的RT活性在保存至少六个月后未减少。

RT测定

为了评价它们的热稳定性，本发明人首先在25-77℃的温度下测定融合体来自细长热聚球蓝细菌的MalE-RF-TeI4c、MalE-RF-TeI4h^*和MalE-RF-TeI4f以及来自嗜热脂肪土芽孢杆菌的MaIE-RF-GsI1和MaIE-RF-GsI2的RT活性。这些最初的测定通过使用聚(rA)/寡(dT)₄₂作为模板-引物底物并定量³²P-dTTP到高分子量材料的聚合来进行。使用相对长的42-nt dT引物，以便其在较高温度(计算的Tm＝69℃)下可仍与聚(rA)模板退火。有和没有N末端MalE-RF标签的LtrA蛋白作为嗜温RT对照平行测定(图11)。尽管在带或不带MalE刚性融合体标签的情况下LtrA蛋白具有约35℃的最佳温度，但是另外五个MalE-RF-RT具有45-61℃的较高最佳温度。两个最具活性和热稳定的RT MaIE-RF-GsI2和MalE-RF-TeI4c具有61℃的最佳温度，并在70℃保持实质活性(其中测定可受引物-模板碱基配对稳定性的限制)。两种RT中，MalE-RF-TeI4c具有最高活性，且以相比其他RT(100nM，5分钟)低的蛋白浓度(50nM)和短的时间(90秒)测定，以便保持在线性范围内。MalE-RF-TeI4c蛋白的测试显示，包含可影响MalE标签构象的麦芽糖(10μM-1mM)对RT活性即便有也是具有很小的影响。

改变标签和接头对RT活性的影响

为了测定标签和接头的最佳特性，本发明人构建MalE-RF-TeI4cRT的变体。纯化MalE-RF-TeI4c RT(左条)和变体蛋白(右侧的条)，并如上所述用聚(rA)/寡(dT)₄₂测定RT活性(图13A)。MalE-RF-TeI4c具有其中3个带电氨基酸残基改变为丙氨酸的修饰MalE标签(MalE(mod))和与RT的N末端连接的5个丙氨酸残基的接头。其中5个丙氨酸残基接头被除去或缩短至1或2个丙氨酸残基的变体具有实质的但降低的RT活性，如同其中用野生型MalE(MalE(WT))替代修饰的MalE标签的变体(图13A)。其中MalE(WT)标签后面是缺失TEV蛋白酶切割位点的pMal-c2t接头的TeI4c变体亦具有实质的但降低的RT活性(图13A)。其中野生型MalE标签与TeI4c RT的C末端连接的变体在大肠杆菌中表达不充分，大概反映没有MalE标签在先表达时，新生TeI4c RT不能正确折叠。最后，带有与NusA(N利用物质蛋白)而非MalE融合的N末端刚性融合体的变体具有实质上热稳定的RT活性(图13A和B)。

cDNA合成的温度特征

图14显示在不同温度下使用带与其3’端退火的DNA引物的体外转录RNA模板合成cDNA的测定，其将两种热稳定II组内含子RT(MalE-RF-TeI4c和MalE-RF-GsI2)与市售RT SuperScript III(Invitrogen^TM)作比较，据报道该市售RT在55℃有活性(Potter等Focus(Invitrogen Newsletter)25.1，19-24，2003)。一种模板是从带退火的³²P标记的37-nt DNA引物的Afllll-消化的pBS KS(+)合成的531-nt体外转录体(图14A-C)，而另一种模板是带³²P标记的44-nt DNA引物的1.2-kb kanR RNA(SEQ ID NO：21；示于图15)(图14D-E)。在所示温度下孵育反应30分钟，并通过在变性6％聚丙烯酰胺凝胶中电泳分析产物。在各图中，顶部和底部放射自显影图分别显示包含全长产物的凝胶和包含未延伸或部分延伸的引物的凝胶，而条形图显示延伸至全长cDNA的引物百分比。

对于531-nt RNA模板，MalE-RF-TeI4c RT具有61-81℃的最佳全长cDNA合成温度。MalE-RF-GsI2 RT在37-69℃的温度合成全长cDNA，而SuperScript III RT在高于57℃的温度下没有活性(图14A-C)。对于1.2kb RNA模板，MalE-RF-TeI4c RT和MalE-RF-GsI2 RT分别具有61-81℃和61-69℃的最佳温度，而SuperScript III RT在高于57℃的温度下仍没有活性(图14D-E)。

通过qRT-PCR分析cDNA合成

除了凝胶分析之外，本发明人使用qRT-PCR来比较通过MalE-RF-TeI4c RT和SuperScript III RT使用1.2-kb RNA模板合成的cDNA量。本发明人首先比较在50-75℃的温度下产生的全长cDNA量(图16)。在六个不同温度下，在包含作为模板的5×10⁸拷贝的kanR RNA、200nM MalE-RF-TeI4c或200U的SuperScript III RT的反应中合成用于qPCR的cDNA 30分钟。根据制造商的说明书进行使用SuperScript III的反应。将包含除dNTP外的全部组分的反应混合物在所需温度下预孵育2分钟，并通过加入dNTP开始反应。30分钟后，通过在干冰上迅速冷却终止反应。在qPCR反应中使用5μl部分的各cDNA合成物，qPCR反应包含TaqMan

Gene Expression混合物和位于卡那霉素RNA的nt 188-257和562-634的两种正向、反向和双重标记引物探针混合物。使用最接近RN的5’端(nt 188-257)的引物组，在所有测试温度下，MalE-RF-TeI4c RT的循环阈(C_T)值显著低于SuperScript III RT的(图16)，表明MalE-RF-TeI4c已经合成更大量的延伸至接近RNA模板5’端的cDNA。特别地，合成cDNA的量在55-65℃的温度下差异最显著，在所述温度下SuperScript III的活性迅速下降。

为了比较MalE-RF-TeI4c RT和SuperScript III RT合成cDNA的持续合成能力，用两种不同的扩增子引物/探针组分析在60和65℃获得的相同cDNA样品：检测920-nt长的cDNA的188-257和检测546nt长的cDNA的562-634(图17)。在该情况下，将cDNA样品的循环阈值结果针对用Novagen

双链DNA质粒载体pET9a获得的标准曲线绘图，以测定拷贝数当量。对于188-257扩增子引物/探针组，在60℃用MalE-RF-4c TeI4c RT检测到972,815拷贝，而用SuperScript RT检测到64,456拷贝(约15倍差异)，而在65℃该比率上升至732,559对661(约1100倍差异)。此外，在两种温度下，MalE-RF-TeI4c RT在通过两种引物组检测的cDNA拷贝数上显示很小差异，显示MalE-RF-TeI4c RT主要合成全长cDNA，表明高持续合成能力。相反，在两种温度下，SuperScript III RT显示通过188-257引物组相比562-634引物组检测到少的较长cDNA数量，表明该RT在到达RNA的5’端前脱离或以其它方式被妨碍，导致合成较短的cDNA。

通过TeI4c RT和TeI4h^*RT参入核苷酸的保真度

TeI4h^* RT和TeI4c RT(即天然II组内含子RT，不是稳定RT融合蛋白)的固有保真度首先通过对已在大肠杆菌质粒测定中经历反向归巢的内含子测序来评价(表2)。TeI4h^* RNA促进的TeI4h^*-ΔORF内含子RNA反向归巢的最大错误频率在37和48℃分别是1.6×10^-5和4.1×10^-6。TeI4c RT由“孪生内含子”(其中一个II组内含子(TeI3c)插入到另一个(TeI4c)中的构型)的外侧内含子编码，且可有效移动两个内含子。TeI4c RT促进的TeI3c或TeI4c反向归巢的最大错误频率在48℃是1.1×10^-5和2.2×10^-5。这些错误频率类似于先前对L1.LtrB内含子RT(LtrA)促进的L1.LtrB内含子反向归巢评价的错误频率(37℃约10^-5)(Conlan等，Nucl.Acids Res.33，5262-5270，2005)。

表2.通过反向归巢期间核苷酸错参频率测定的

II组内含子RT的保真度

RT	TeI4h^*	TeI4h^*	TeI4c	TeI4c
					内含子	TeI4h^*-ΔORF	TeI4h^*-ΔORF	TeI3c-ΔORF	TeI4c-ΔORF
温度(℃)	37	48	48	48
					测序的Nt	244,253	244,980	265,858	537,354
突变	4	1	3	12
					错误频率	1.6×10^-5	4.1×10^-6	1.1×10^-5	2.2×10^-5

用表达所示内含子和RT的供体质粒以及包含无启动子tet^R基因上游克隆的内含子靶位点(连接的E1-E2)序列的受体质粒在大肠杆菌HMS174(DE3)中进行反向归巢。在选择Tet^R菌落后，已整合到受体质粒靶位点中的内含子通过菌落PCR分别使用用于5’-和3’-整合连接的引物Rsense(5’-ACAAATAGGGGTTCCGCGCAC；SEQ ID NO：22)和Te680rc(5’-GTTGGTGACCGCACCAGT；SEQ ID NO：23)以及Te420f(5’-AACGCGGTAAGCCCGTA；SEQ ID NO：24)和Rev2pBRR(5’-AATGGACGATATCCCGCA；SEQ ID NO：25)扩增。然后对PCR片段测序。表2显示用于反向归巢的诱导温度、测序的内含子核苷酸总量、突变的数量(错误)和错误频率。

以下用于制备和表征稳定RT融合蛋白的方法实施例被包括用于阐述目的，并不旨在限制本发明的范围。

实施例

实施例1：重组质粒

pMalE-TeI4c、pMalE-TeI4f、pMalE-TeI4h^*在表达载体pMal-c2t中包含克隆到tac启动子之后的带融合N末端MalE标签的所示可动II组内含子的RT ORF。pMal-c2t是pMal-c2x的衍生物(New EnglandBiolabs，Ipswich MA)，其中MalE和表达的蛋白之间的Xa因子蛋白酶切割位点置换为TEV蛋白酶切割位点(Kristelly等，ActaCrystallogr D Biol Crystallogr.59，1859-1862，2003)。TeI4h^*RT是天然TeI4h RT的衍生物，其中RT-5中的YAGD模体置换为YADD。在pET11(TeI4f)、pUC19(TeI4c)或pACD2X(TeI4h^*)中包含克隆的T.elongatus菌株BP1 II组内含子的重组质粒先前已描述。pMalE-RT质粒通过以下步骤得自这些最初的构建体：用附带限制性位点的引物进行PCR扩增RT ORF，然后将PCR产物克隆到pMal-c2t的相应位点中(TeI4c RT、EcoRI和PstI位点；TeI4f RT、BamHI位点；TeI4h^* RT、BamHI和PstI位点)。重组质粒表示的pMalE-RF-蛋白(例如pMalE-RF-TeI4c)通过QuikChange PCR方法使用Accuprime聚合酶(Invitrogen，Makarova等，BioTechniques 29，970-972，2000)将TEV-蛋白酶可切割接头(TVDEALKDAQTNS₃N₁₀LENLYFQG；SEQID NO：19)置换为刚性接头(TVDAALAAAQTAAAAA；SEQ ED NO：20)而得自相应的pMalE-RT质粒。

带不同接头的pMalE-RF-TeI4c衍生物通过PCR诱变使用QuikChange方法构建。MalE标签通过以下步骤与pMal-c2t中的TeI4c ORF的C末端融合：分别用引入5’EcoRI位点和3’PstI位点的引物扩增pMal-c2t的MalE区段和用引入5’NdeI位点和3’EcoRI位点的基因特异性引物扩增pMalE-TeI4c的TeI4c ORF，并将片段克隆到用NdeI和PstI消化的pMal-c2t。

pNusA-RF-TeI4c-His表达TeI4c RT以及通过刚性接头与蛋白融合的N末端NusA标签和C末端His6标签，其通过用附带SacII和KpnI位点的引物PCR扩增pMAL-TeI4c的TeI4c RT ORF并将所得PCR产物克隆到pET-50b(+)(Novagen)的相应位点之间来构建。然后使用PCR诱变将NusA的最后两个带电残基(D和E)、已有接头和两个N末端His6标签之一(NICWFGDEATSGSGH₆；SEQ ID NO：26)置换为刚性接头序列(NICWFGAAAAA；SEQ ID NO：27)。通过PCR诱变除去第二个N末端His6标签，并通过QuikChange PCR将His6标签与TeI4c RT的C末端融合。

pMalE-GsIl和pMalE-GsI2通过以下步骤构建：通过使用扩增内含子和附带的BamHI和XbaI位点(GsI1)或BamHI位点(GsI2)的引物的PCR来PCR扩增嗜热脂肪土芽孢杆菌菌株10基因组DNA(获自Greg Davis(Sigma-Aldrich))的RT ORF，然后将PCR产物克隆到pMal-c2t的相应位点之间。GsI1是IIB2亚组内含子，其插入到嗜热脂肪土芽孢杆菌recA基因中并与先前所述的在嗜热土芽孢杆菌(Geobacillus kaustophilus)(Chee等，Gene 363，211-220，2005)和热溶芽孢杆菌(Bacillus caldolyticus)(Ng等，Gene 393，137-144，2007)的recA基因中编码RT的II组内含子相关。克隆的GsI1 RT ORF被证实对应于基因组序列(CP001794)。GsI2是在嗜热脂肪土芽孢杆菌基因组中的多拷贝中发现的IIC组内含子。克隆的GsI2 RT ORF对应于嗜热脂肪土芽孢杆菌基因组中GsI2的六个全长拷贝之一的基因组序列(CP001794)，并与Vellore等(Appl.Environ.Microbiol.70，7140-7147，2004)克隆的RT ORF具有三个氨基酸序列改变。相应的pMalE-RF-RT构建体通过如上所述QuikChange PCR得自pMalE-RT构建体。

pMalE-LtrA通过使用附带BamHI和HindIII位点的引物PCR扩增pImp-2的LtrA ORF(Saldanha等，Biochemistry 38，9069-9083，1999)并接着将PCR产物克隆到pMal-c2t的相应位点之间来构建，且pMalE-RF-LtrA通过如上所述QuikChange PCR得自pMalE-LtrA。

实施例2：蛋白纯化

为了表达pMalE-RT或pMalE-RF-RT构建体，用表达质粒转化大肠杆菌Rosetta 2/pRARE(Novagen，EMD Biosciences，Gibbstown NJ)或ScarabXpress/pRARE T7lac(Scarabgenomics，Madison WI)，并于37℃在TB或LB培养基中培养到对数中期(O.D.₆₀₀＝0.8)。通过将异丙基β-D-1-硫代吡喃型半乳糖苷(IPTG；终浓度1mM)加入对数中期细胞(pMalE-RF-TeI4c、TeI4f、TeI4h^*、GsI1和GsI2)，或通过在自诱导培养基(包含0.2％乳糖、0.05％葡萄糖、0.5％甘油、24mM(NH₄)₂SO₄、50mM KH₂PO₄、50mM Na₂HPO₄的LB)(pMalE-LtrA和pMalE-RF-LtrA)中培养细胞，来诱导表达。在任一情况下，在18-25℃诱导约24小时，之后通过离心沉淀细胞、在缓冲液A(20mMTris-HCl，pH 7.5，0.5M KCl或NaCl，1mM EDTA，1mM二硫苏糖醇(DTT))中重悬，并在-80℃冷冻。

为了纯化MalE-RF-TeI4c、TeI4f、TeI4h^*及其衍生物，解冻细胞悬液，在冰上用溶菌酶(1mg/mL；Sigma)处理15分钟，通过干冰冷冻-解冻三次，以60％的振幅、脉冲(burst)间隔10秒在冰上超声处理(Branson 450 Sonifier，Branson Ultrasonics，Danbury CT)3或4个10秒脉冲或一个30秒脉冲，并在4℃以18,500x g离心30分钟。核酸通过加入聚乙烯亚胺(PEI)至终浓度为0.1％沉淀，并在Avanti J-E离心机(Beckman Coulter，Brea CA)的J16.25转子中在4℃以15,000x g离心15分钟。将所得上清液施加于直链淀粉柱(10-ml柱体积；Amylose High-Flow(New England Biolabs)，在缓冲液A中平衡)，用5倍柱体积的各包含0.5M、1.5M或0.5M KCl的缓冲液A洗涤柱，然后用包含10mM麦芽糖的缓冲液A洗脱。将蛋白流分合并，并进一步通过肝素琼脂糖柱(3串联1-ml柱；GE Healthcare BiosciencesCorp.)纯化，该柱已在包含KCl(对于MalE-RF-4c、4f、4h^*、MalE-LtrA和MalE-RF-LtrA为100mM；对于MaIE-RF-GsI1或GsI2为50mM)、1mM EDTA、1mM DTT、10％甘油的20mM Tris-HCl，pH7.5中预平衡。蛋白以相同缓冲液施加到肝素琼脂糖柱上，并用40倍柱体积从上柱浓度到2M KCl的梯度洗脱。蛋白在约800mM KCl下洗脱。合并峰流分，并相对20mM Tris-HCl，pH 7.5，0.5M KCl，1mM EDTA，1mM DTT和50％甘油透析，以便储存。冷冻蛋白显示RT活性至少六个月未降低。

除了核酸用0.2％PEI沉淀，和从直链淀粉柱洗脱的蛋白在最终肝素琼脂糖柱之前还用镍柱纯化之外，类似地纯化具有N末端MalE标签和C末端His6-标签的MaIE-RF-GsI1蛋白。用结合缓冲液(500mM KCl，20mM Tris-HCl pH 7.5，40mM咪唑和10％甘油)平衡镍柱(5ml HisTrapTM HP Nickel Sepharose；GE Healthcare Biosciences，Piscataway NJ)，将直链淀粉柱的合并蛋白流分上镍柱，用10倍柱体积的结合缓冲液洗涤，用5倍柱体积的洗脱缓冲液(500mM KCl，20mM Tris-HCl pH 7.5，400mM咪唑和10％甘油)洗脱，并将上清液直接上到肝素琼脂糖柱上。合并来自肝素琼脂糖柱的峰流分，相对20mM Tris-HCl，pH 7.5，0.5M KCl，50％甘油透析，并如上所述储存。

对于NusA蛋白融合体，用0.5mM IPTG在18℃诱导大肠杆菌ScarabXpress/pRARE T7lac细胞48小时，并重悬到镍缓冲液A(20mM Tris pH 7.5，500mM KCl，30mM咪唑，10％甘油)中。在如上所述裂解细胞后，通过加入终浓度为0.2％的聚乙烯亚胺从裂解液中沉淀核酸，然后在10,000x g离心15分钟。将上清液施加到用镍缓冲液A预平衡的5-ml镍-琼脂糖柱，然后用包含500mM咪唑的镍缓冲液A洗脱。合并蛋白流分，并直接上到两个相连的1-ml肝素琼脂糖柱上，该肝素琼脂糖柱已用20mM Tris pH 7.5，100mM KCl，1mM DTT，1mM EDTA和20％甘油预平衡。用20倍柱体积的0.1-1.5M KCl梯度洗脱蛋白，并合并峰流分，相对20mM Tris-HCl，pH7.5，0.5M KCl，1mM EDTA，1mM DTT，50％甘油透析，并如上所述储存。

实施例3：逆转录酶分析

在不同温度下的RT活性通过使用聚(rA)/寡(dT)₄₂作为模板-引物定量32^P-dTTP的参入来测定。在不同温度下(25-77℃)，将RT(50nM MalE-RF-TeI4c RT或100nM所有其他RT)与100nM聚(rA)/寡(dT)₄₂一起在1x RT缓冲液(75mM KCl，10mM MgCl₂，20mM Tris-HCl，pH 7.5和1mM DTT)中预孵育，并通过加入5μCi[α-³²P]-dTTP(3,000Ci/mmol；Perkin Elmer，Waltham MA)开始反应。在线性范围内孵育反应多次，并通过加入EDTA至终浓度为250mM来终止反应。将反应产物点于Whatman DE81层析纸(10×7.5-cm纸张；GEHealthcare)上，在0.3M NaCl和0.03M柠檬酸钠中洗涤三次，并用PhosphorImager(Typhoon Trio Variable Mode Imager；GE Healthcare)扫描以定量结合放射性。

其他RT测定使用带退火的DNA寡核苷酸引物的RNA模板。RNA模板是从使用T7 Megscript试剂盒(Ambion，Applied Biosystems，Austin，TX)转录的AflIII消化的pBluescript KS(+)合成的531-nt体外转录体或者购自Promega(Promega，Madison WI)的1.2-kb kanRRNA。根据制造商说明书在37℃进行体外转录4小时。在用TurboDNase I(5分钟，37℃)消化DNA模板后，用苯酚∶氯仿∶异戊醇(25∶24∶1；苯酚-CIA)萃取RNA，并通过两个循环的凝胶过滤穿过Sephadex G-50(Sigma，St Louis MO)离心柱纯化。通过使用Nanodrop(Thermo Scientific，Wilmington，DE)测定RNA浓度。将RNA储存于Milli-Q-级H₂O中，并储存于-20℃。

与RNA的3’端互补的DNA寡核苷酸引物通过IDT合成(Coralville，IA；AflIII引物：5′-CCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCG；SEQ IDNO：28；P078卡那霉素Rev 5′-GGTGGACCAGTTGGTGATTTTGAACTTTTGCTTTGCCACGGAAC；SEQ ID NO：29)。引物浓度通过A₂₆₀测定。根据制造商说明书用T4多核苷酸激酶(New England Biolabs)对引物进行5’³²P标记，且游离核苷酸通过凝胶过滤穿过Sephadex G-25柱除去。将引物与模板以1.0∶1.1的摩尔比混合，并通过在变温设置(ramp setting)为10％的GeneAmp 9700 PCR仪中加热到82℃持续2分钟后冷却到室温来退火。

为了cDNA合成的凝胶分析，将100nM退火的模板/引物与200nM酶一起在100mM KCl，20mM Tris HCl pH 7.5，10mM MgCl₂和1mM DTT(对于MalE-RF-TeI4c RT)中和10mM NaCl，20mMTris HCl pH 7.5，10mM MgCl₂和1mM DTT(对于MalE-RF-GsI2 RT)中孵育。通过分别加入dNTP和MgCl₂至终浓度为1.25mM和10mM开始反应，在所示温度下孵育30分钟，并通过加入0.1％SDS/250mM EDTA(终浓度)终止反应，然后苯酚-CIA萃取。通过在变性6％聚丙烯酰胺凝胶中电泳来分析产物，干燥凝胶并用PhosphorImager定量。5’标记的10-bp梯条带(Invitrogen^TM)用作大小标记物。

实施例4：定量实时聚合酶链式反应(qPCR)

用于qPCR分析的cDNA在对单独试验指定的温度下在包含1XRT缓冲液(75mM KCl，10mM MgCl₂，20mM Tris-HCl，pH 7.5)、1mM DTT、5×10⁸kanR RNA拷贝、200nM MalE-RF-TeI4c RT和1mM dNTP的20μl反应物中产生30分钟。根据制造商说明书进行使用SuperScript III(Invitrogen)的平行反应。在不同的温度下孵育反应2分钟并通过加入dNTP开始。在孵育30分钟后，通过干冰迅速冷冻反应物以停止反应。5μl cDNA反应物用于qPCR。

qPCR分析在带光学盖的96孔板内进行，其中各孔包含由12.5μl的2X TaqMan

Gene Expression Master Mix(Applied Biosystems，Foster City，CA)、7.5μl正向、反向和双重标记的探针混合物(单独购自Integrated DNA Technologies，Coralville，IA的寡核苷酸)和5μlcDNA模板组成的25μl反应混合物。使用9600仿真模式(emulationmode)方案(50℃2分钟，95℃10分钟，接着循环共计45个95℃15秒和60℃60秒的循环)，在7900HT Fast Real-Time PCR System(Applied Biosystems)中孵育混合物。使用Applied BiosystemsSequence Detection System Software，版本2.2或2.3收集并分析数据。

使用Novagen

双链DNA质粒载体pET9a(EMD Chemicals)定量kanR cDNA水平。pET9a载体包含kanR编码序列(碱基3523-4335)，并在每个引物/探针结合位点与Promega 1.2-kb kanR RNA具有100％序列同源性。纯化的和定量的pET9a DNA载体首先稀释成1×10⁹拷贝/μl等分贮备物，并储存-20℃。对于每次运行，解冻新鲜贮备物并接着连续稀释以产生在qPCR中使用的定量标准曲线。然后将cDNA样品的循环阈值结果相对标准曲线绘图，以测定拷贝数当量。

使用的引物是：

P078卡那霉素RT-1107R 5’-

GGTGGACCAGTTGGTGATTTTGAACTTTTGCTTTGCCACGGAAC-3’，SEQ ID NO：29(Tm＝80℃)

引物组nt 188-257：

正向--P029 kan-188F：5’-GGGTATAAATGGGCTCGCG-3’；SEQ ID NO：30

反向--P030 kan-257R：5’-CGGGCTTCCCATACAATCG-3’；SEQ ID NO：31

Taqman Probe--P031 kan-213T：5’(6-羧基荧光素(6FAM))-TCGGGCAATCAGGTGCGACAATC-3’；(Iowa Black FQ；黑色非荧光猝灭剂)；SEQ ID NO：32

扩增子70bp

5’GGGTATAAATGGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTATCG ATTGTATGGGAAGCCCG-3’；SEQ ID NO：33

引物组(nt 562-634)：

正向--P001 kan-562F：5’CGCTCAGGCGCAATCAC-3’；SEQ IDNO：34

反向--P002 kan-634R：5’CCAGCCATTACGCTCGTCAT-3’；SEQ ID NO：35

Taqman Probe--P003 kan-581T：5’(6-FAM)-

ATGAATAACGGTTTGGTTGATGCGAGTGA-3’-(TAMRA)；SEQ ID NO：36

扩增子73bp

5’CGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGA TGACGAGCGTAATGGCTGG-3’；SEQ IDNO：37

实施例5：反向归巢测定

在LB培养基上培养的大肠杆菌HMS174(DE3)(Novagen^TM)中进行反向归巢测定，在LB培养基中加入下列浓度的抗生素：氨苄青霉素，100μg/ml；氯霉素，25μg/ml；四环素，25μg/ml。内含子供体质粒pACD2X衍生物(San Filippo等，Journal of Molecular Biology，324，933-951，2002)携带cap^R标记，并使用T7lac启动子来表达ΔORF内含子(I-ΔORF)，其带有DIV中的短侧翼5’和3’外显子(分别是E1和E2)和T7启动子，然后是E2下游的RT ORF。受体质粒pBRR-tet的衍生物(Guo等，Science 289，452-457，2000；Karberg等，NatureBiotech.19，1162-1167，2001)携带amp^R标记，并包含用于无启动子tet^R基因上游克隆的内含子(连接的E1-E2序列)的靶位点。无启动子tet^R基因通过插入携带T7启动子的内含子激活，使能够选择Tet^R+Amp^R菌落。为了测定，将细胞用Cap^R供体质粒和Amp^R受体质粒转化，接种到5mL含氯霉素和氨苄青霉素的LB培养基中，并在37℃振荡(200rpm)培养过夜。将小部分(50μl)过夜培养物接种到5mL含相同抗生素的新鲜LB培养基中，并如上所述培养1小时。接着在表1文字中对各实验指定的条件下用IPTG诱导细胞1小时。接着将培养物置于冰上，用冰冷LB稀释并以不同稀释物接种于含氨苄青霉素或氨苄青霉素+四环素的LB琼脂上。在37℃孵育平板过夜后，将移动效率计算为(Tet^R+Amp^R)/Amp^R菌落比。

权利要求书(按照条约第19条的修改)

1.一种稳定化逆转录酶融合蛋白，包含与稳定剂蛋白连接的热稳定逆转录酶。

2.权利要求1的稳定化逆转录酶融合蛋白，其中所述热稳定逆转录酶包含细菌逆转录酶。

3.权利要求2的稳定化逆转录酶融合蛋白，其中所述细菌逆转录酶包含II组内含子衍生的逆转录酶。

4.权利要求3的稳定化逆转录酶融合蛋白，其中所述细菌逆转录酶是细长热聚球蓝细菌逆转录酶或嗜热脂肪土芽孢杆菌逆转录酶。

5.权利要求1的稳定化逆转录酶融合蛋白，其中所述热稳定逆转录酶包含与选自SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5的序列有至少85％氨基酸序列同一性的多肽。

6.权利要求1的稳定化逆转录酶融合蛋白，其中所述稳定剂蛋白包含亲和蛋白或溶解度增加蛋白。

7.权利要求6的稳定化逆转录酶融合蛋白，其中所述稳定剂蛋白包含麦芽糖结合蛋白或N-利用物质A蛋白。

8.权利要求6的稳定化逆转录酶融合蛋白，其中所述稳定剂蛋白通过将带电氨基酸置换为不带电氨基酸而修饰。

9.权利要求1的稳定化逆转录酶融合蛋白，其中所述热稳定逆转录酶与所述稳定剂蛋白通过接头肽连接。

10.权利要求9的稳定化逆转录酶融合蛋白，其中所述接头肽是非可切割接头肽。

11.权利要求10的稳定化逆转录酶融合蛋白，其中所述非可切割接头肽是刚性接头肽。

12.权利要求10的稳定化逆转录酶融合蛋白，其中所述接头肽由1-20个氨基酸组成。

13.权利要求10的稳定化逆转录酶融合蛋白，其中所述接头肽由1-5个氨基酸组成。

14.权利要求10的稳定化逆转录酶融合蛋白，其中所述接头肽由3-5个氨基酸组成。

15.权利要求11的稳定化逆转录酶融合蛋白，其中所述刚性接头肽由SEQ ID NO：12组成。

16.权利要求1的稳定化逆转录酶融合蛋白，其中所述融合蛋白具有包含多肽的氨基酸序列，所述多肽与选自SEQ ID NO：6、SEQID NO：7、SEQ ID NO：8、SEQ ID NO：9或SEQ ID NO：10的序列有至少85％氨基酸序列同一性。

17.权利要求1的稳定化逆转录酶融合蛋白，其中所述稳定化逆转录酶融合蛋白能够在约45℃至约65℃的温度下以2.0×10^-5以下的错误频率进行逆转录。

18.一种从RNA分子制备cDNA的方法，所述方法包括以下步骤：

(a)将引物核苷酸序列加入RNA分子中

(b)在足以合成与所述RNA分子的全部或部分互补的cDNA分子的条件下，在一种或多种脱氧核糖核苷三磷酸或双脱氧核糖核苷三磷酸和包含与稳定剂蛋白连接的热稳定逆转录酶的稳定化逆转录酶融合蛋白存在下孵育所述RNA分子。

19.权利要求18的方法，其中所述热稳定逆转录酶与所述稳定剂蛋白通过非可切割接头肽连接。

20.权利要求18的方法，其中在所述RNA具有实质上减少量的阻碍性稳定二级或三级结构的温度范围内进行逆转录。

21.权利要求18的方法，其中所述热稳定逆转录酶是II组内含子衍生的逆转录酶。

22.权利要求19的方法，其中所述热稳定逆转录酶包含：与选自SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5的序列有至少85％氨基酸序列同一性的多肽；由1-20个氨基酸组成的非可切割接头；和所述稳定剂蛋白包含亲和蛋白或溶解度增加蛋白。

23.权利要求18的方法，其中在约45℃至约65℃的温度下以2.0×10^-5以下的错误频率进行逆转录。

24.一种用于生产稳定化逆转录酶融合蛋白的DNA表达载体，包含编码多肽的分离核酸，所述多肽与选自SEQ ID NO：6、SEQ IDNO：7、SEQ ID NO：8、SEQ ID NO：9或SEQ ID NO：10的序列有至少85％氨基酸序列同一性。

25.一种生产稳定化逆转录酶融合蛋白的方法，包括以下步骤：

(a)培养包含权利要求24的DNA表达载体的宿主细胞；

(b)表达由所述DNA表达载体编码的稳定化逆转录酶融合蛋白；和

(c)从所述宿主细胞中分离所述稳定化逆转录酶融合蛋白。

Claims

一种稳定化逆转录酶融合蛋白，包含与稳定剂蛋白连接的热稳定逆转录酶。
权利要求1的稳定化逆转录酶融合蛋白，其中所述热稳定逆转录酶包含细菌逆转录酶。
权利要求2的稳定化逆转录酶融合蛋白，其中所述细菌逆转录酶包含II组内含子衍生的逆转录酶。
权利要求3的稳定化逆转录酶融合蛋白，其中所述细菌逆转录酶是细长热聚球蓝细菌逆转录酶或嗜热脂肪土芽孢杆菌逆转录酶。
权利要求1的稳定化逆转录酶融合蛋白，其中所述热稳定逆转录酶包含与选自SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5的序列有至少85％氨基酸序列同一性的多肽。
权利要求1的稳定化逆转录酶融合蛋白，其中所述稳定剂蛋白包含亲和蛋白或溶解度增加蛋白。
权利要求6的稳定化逆转录酶融合蛋白，其中所述稳定剂蛋白包含麦芽糖结合蛋白或N-利用物质A蛋白。
权利要求6的稳定化逆转录酶融合蛋白，其中所述稳定剂蛋白通过将带电氨基酸置换为不带电氨基酸而修饰。
权利要求1的稳定化逆转录酶融合蛋白，其中所述热稳定逆转录酶与所述稳定剂蛋白通过接头肽连接。
权利要求9的稳定化逆转录酶融合蛋白，其中所述接头肽是非可切割接头肽。
权利要求10的稳定化逆转录酶融合蛋白，其中所述非可切割接头肽是刚性接头肽。
权利要求10的稳定化逆转录酶融合蛋白，其中所述接头肽由1-20个氨基酸组成。
权利要求10的稳定化逆转录酶融合蛋白，其中所述接头肽由1-5个氨基酸组成。
权利要求10的稳定化逆转录酶融合蛋白，其中所述接头肽由3-5个氨基酸组成。
权利要求11的稳定化逆转录酶融合蛋白，其中所述刚性接头肽由SEQ ID NO：12组成。
权利要求1的稳定化逆转录酶融合蛋白，其中所述融合蛋白具有包含多肽的氨基酸序列，所述多肽与选自SEQ ID NO：6、SEQID NO：7、SEQ ID NO：8、SEQ ID NO：9或SEQ ID NO：10的序列有至少85％氨基酸序列同一性。
权利要求1的稳定化逆转录酶融合蛋白，其中所述稳定化逆转录酶融合蛋白能够在约45℃至约65℃的温度下以2.0×10^-5以下的错误频率进行逆转录。
一种从RNA分子制备cDNA的方法，所述方法包括以下步骤：

(a)将引物核苷酸序列加入RNA分子中

(b)在足以合成与所述RNA分子的全部或部分互补的cDNA分子的条件下，在一种或多种脱氧核糖核苷三磷酸或双脱氧核糖核苷三磷酸和包含与稳定剂蛋白连接的热稳定逆转录酶的稳定化逆转录酶融合蛋白存在下孵育所述RNA分子。
权利要求18的方法，其中所述热稳定逆转录酶与所述稳定剂蛋白通过非可切割接头肽连接。
权利要求18的方法，其中在所述RNA具有实质上减少量的阻碍性稳定二级或三级结构的温度范围内进行逆转录。
权利要求18的方法，其中所述热稳定逆转录酶是II组内含子衍生的逆转录酶。
权利要求19的方法，其中所述热稳定逆转录酶包含：与选自SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5的序列有至少85％氨基酸序列同一性的多肽；由1-20个氨基酸组成的非可切割接头；和所述稳定剂蛋白包含亲和蛋白或溶解度增加蛋白。
权利要求18的方法，其中在约45℃至约65℃的温度下以2.0×10^-5以下的错误频率进行逆转录。
一种用于生产稳定化逆转录酶融合蛋白的DNA表达载体，包含编码多肽的分离核酸，所述多肽与选自SEQ ID NO：6、SEQ IDNO：7、SEQ ID NO：8、SEQ ID NO：9或SEQ ID NO：10的序列有至少85％氨基酸序列同一性。
一种生产稳定化逆转录酶融合蛋白的方法，包括以下步骤：

(a)培养包含权利要求24的DNA表达载体的宿主细胞；

(b)表达由所述DNA表达载体编码的稳定化逆转录酶融合蛋白；和

(c)从所述宿主细胞中分离所述稳定化逆转录酶融合蛋白。