CN110325641B

CN110325641B - 基于无机多磷酸盐的能量再生的无细胞表达系统

Info

Publication number: CN110325641B
Application number: CN201880014094.4A
Authority: CN
Inventors: 亚历山大·科格林; 迈克尔·亨伯特
Original assignee: Ntxbio LLC
Current assignee: Ntxbio LLC
Priority date: 2016-12-30
Filing date: 2018-01-02
Publication date: 2020-10-27
Anticipated expiration: 2038-01-02
Also published as: ES2921017T3; EP3562940B1; US11136586B2; IL267687A; KR20190104181A; JP7015836B2; BR112019013694A2; IL267687B; EP3562940A1; AU2018205001B2; AU2018205001A1; WO2018126287A1; EP3562940A4; DK3562940T3; US20190309311A1; JP2020504615A; CN110325641A; KR102136353B1

Abstract

本发明涉及一种体外无细胞表达系统，该系统包含一种新型无机多磷酸盐基能量再生系统。在某些实施方案中，本发明包括无细胞表达系统，该系统使用双酶系统从无机多磷酸盐中再生细胞能量源ATP。在该实施方案中，该双酶系统可包括热稳定的腺苷激酶和/或多磷酸激酶。

Description

基于无机多磷酸盐的能量再生的无细胞表达系统

本申请要求2016年12月30日提交的美国临时申请编号62/440,975的优先权。上述申请的整个说明书、附图和序列表通过引用整体并入本文。

技术领域

本发明涉及无细胞表达系统，该反应混合物含有体外转录/翻译机制所必需的所有无细胞反应组分、氨基酸、核苷酸及提供能量并且是蛋白质合成所必需的代谢组分。本发明进一步涉及体外无细胞表达系统，其结合了新型无机多磷酸盐基能量再生系统，其可以产生更高产量的主题表达产物，例如蛋白质。本发明进一步涉及用于体外无细胞基因表达的装置。另外，本发明涉及一种新的基于无机多磷酸盐的能量再生系统，其可以结合到诊断应用和/或测定中。

背景技术

无细胞表达系统(也称为体外转录/翻译、无细胞蛋白表达、无细胞翻译或无细胞蛋白质合成)代表了一种分子生物学技术，使研究人员能够在体外表达功能性蛋白质或其他靶分子。与基于细菌或组织培养细胞的体内技术相比，体外蛋白质表达相当快，因为它不需要基因转染、细胞培养或广泛的蛋白质纯化。这种系统的另一个优点是，通常待表达的靶蛋白可能对宿主细胞有毒，或者通常与细胞表达不相容，这使得体内系统即使不是完全无效的蛋白质表达载体，也非实际。

更具体地来说，无细胞表达系统在不使用活细胞的情况下产生靶分子和复合物，例如各种核糖核酸和蛋白质。典型的无细胞表达系统可利用从细胞裂解物中发现的生物组分/装置含有一种或多种靶基因的脱氧核糖核酸中产生靶分子。典型的无细胞表达系统反应的常见组分可包括通常源自细胞培养裂解物的提取物、ATP等能量来源、氨基酸供应源、镁等辅因子，以及具有期望的基因的核酸合成模板，该模板通常为以质粒合成模板或线性表达(或合成)模板(LET或LST)形式的模板。细胞提取物可以通过裂解目的细胞并通过离心或其他沉淀方法除去细胞壁、脱氧核糖核酸基因组和其他碎片而获得。裂解物或细胞提取物的剩余部分可含有表达靶分子所需的必需细胞机制。

常见的无细胞表达系统涉及无细胞蛋白质合成。为了产生一种或多种目的蛋白质，典型的无细胞蛋白质合成系统利用从微生物、植物或动物细胞的粗裂解物中产生能量和蛋白质合成所必需的催化组分的集合。粗裂解物包含脱氧核糖核酸到核糖核酸转录、核糖核酸到蛋白质翻译、蛋白质折叠和能量代谢的必要元件(例如核糖体、氨酰基-tRNA合成酶、翻译起始和延伸因子、核糖体释放因子、核苷酸回收酶、代谢酶、分子伴侣、折叠酶等)。目前使用的常见细胞提取物由大肠杆菌、兔网织红细胞、小麦胚芽和昆虫细胞，甚至哺乳动物细胞制成。

除了无细胞表达系统的许多优势之外，先前已有的若干障碍限制了它们作为蛋白质生产技术的用途。这些障碍包括活性蛋白质合成的反应持续时间短、蛋白质生产率低、反应规模小、正确折叠含有多个二硫键的蛋白质的能力有限，以及它作为“黑盒”科学的最初发展。传统的无细胞表达系统中的一个显著限制是难以提供转录/翻译所需的蛋白质合成的强烈能量和底物需求，而没有化学环境中的有害伴随变化。此外，昂贵的试剂成本，特别是核苷酸和二次能源形式的高能磷酸盐化学品，限制了这种传统无细胞表达系统的实际用途。

体外无细胞表达系统的主要限制因素之一是能量再生。例如，在引发无细胞蛋白质合成后，其通常继续产生直至其中一种基质(例如ATP、半胱氨酸等)耗尽，或副产物积累(例如无机磷酸盐)达到抑制浓度。因此，任何无细胞表达系统不能有效地再生合适的能量源会成为一种降低系统的总运行时间和最终产量限制因素。此外，由于高水平的ATP实际上可能抑制蛋白质表达，因此其除了非常昂贵之外，简单地将额外的ATP添加到无细胞表达系统中是不切实际的。

为了解决这些问题，传统的无细胞表达系统依赖于添加补充能量源，能量源主要为磷酸烯醇丙酮酸和丙酮酸激酶，或肌酸磷酸盐和肌酸激酶，或其他类似化合物的形式。然而，这种能量补充具有显著的局限性。首先，底物丙酮酸激酶和肌酸激酶在体外条件下仅具有功能有限的寿命，并且它们的反应副产物丙酮酸对体外翻译是抑制的。其次，如上所述，这些底物显著增加了体外应用的成本。第三，已经证明酶丙酮酸激酶和肌酸激酶在降解/不活动之前仅具有三到四倍的有限总转换数，这进一步限制了它们作为能量再生源的有用性。蛋白质“周转”或转换数(也称为K_cat)可以定义为单个催化位点对于给定的酶浓度将执行的每秒底物分子的化学转化的最大数量。结果，由于其较差的转换数，必须大量添加丙酮酸激酶和肌酸激酶，这限制了体外应用的运行时间，同时还增加了成本。

在一个更具体的例子中，尽管已确定丙酮酸激酶具有低至个位数的总转换数和副产物丙酮酸是翻译反应的抑制剂，目前基于大肠杆菌的无细胞系统仍主要依赖于肌酸磷酸/肌酸激酶或磷酸烯醇丙酮酸和丙酮酸激酶作为主要的能量再生系统。在这种情况下，本发明的细胞能量再生系统不仅与传统的无细胞表达系统相去甚远，而且实际上代表了对本领域已知的传统无细胞表达系统的可证明的改进。

因此，具有更长的反应持续时间和增加的蛋白质合成速率，从而最终产生更高的蛋白质产率等的更加高能效和稳健的无细胞表达系统更加被需要。实际上，上述的无细胞表达系统的问题，尤其是这些系统内的能量再生，代表了对其有效且经济的解决方案的长期需求。尽管可能已经具备实施要素，但在某种程度上可能缺乏满足这种需求的实际尝试。这可能是由于本领域普通技术人员未能充分理解或理解所涉及的问题和挑战的性质。由于缺乏了解，满足这些长期需求的尝试可能未能有效地解决这里确定的一个或多个问题或挑战。这些尝试甚至可能已经偏离了本发明技术所采用的技术方向，并且甚至可能导致本发明技术的成就在某种程度上被认为是该领域中某些人采取的方法的意外结果。

如下所述，本发明的技术克服了传统无细胞表达系统的局限性，特别是它们的能量使用限制，同时实现了具备更长的反应持续时间和更高的产物收率的真正的高能效且稳健的体外无细胞表达系统的目标。

发明内容

整体来说，本发明的技术涉及无细胞表达系统。本发明的其中一个目的是提供无细胞表达的方法，其包括新的组合物，和具有更长的反应时间、更高的反应效率和改进后的反应稳定性，并最终产生更高产率的所需表达产物的装置和程序。

本发明的另一个目的是提供一种改进后的无细胞表达系统，其在一个实施方案中可以包括新的系统和能量再生方法。例如，在一个优选的实施方案中，本发明的技术可包括体外无细胞表达系统，其结合了新型无机多磷酸盐基能量再生系统。在该优选实施方案中，可以通过添加从选择的细菌菌株中分离和纯化的无机多磷酸盐和协同高效激酶蛋白来实现能量再生。这些激酶蛋白可以在无细胞表达系统内驱动细胞能量源ATP的高效化学再生。这种改进后的能量再生使无细胞表达系统拥有持续活性，从而使主题表达产物(例如蛋白质)产出更高产量。

在某些实施方案中，该无机多磷酸盐基能量再生系统可以应用于多种无细胞表达系统。例如，在一个优选的实施方案中，新型能量再生系统可以使化学能量消耗之前，具有更长的系统运行时间和来自无细胞翻译系统的更高产率的表达产物，例如蛋白质。

本发明技术的另一个目的可涉及能量依赖性过程和/或诊断测定。具体来说，本发明的技术可包括改进的体外ATP依赖性过程和/或具有基于无机多磷酸盐的能量再生系统的测定。在一个优选的实施方案中，本发明的能量再生系统可包括体外ATP依赖性蛋白质活性测定法，其具有基于无机多磷酸盐的能量再生系统。在该实施方案中，可以通过添加从选择的细菌菌株分离和纯化的协同高效激酶蛋白来实现测定内的能量再生。这些激酶蛋白可以在ATP依赖性测定中驱动ATP的高效化学再生。该实施方案使化学能耗尽之前，具有更长的测定运行时间，其反之也可以改进测定性能和灵敏度。

本发明技术的其他目的可包括从某些细菌菌株中鉴定、分离、纯化和/或修饰核糖核酸聚合酶蛋白，所述细菌菌株在如本文所述的无细胞体外系统中表现出增加的稳定性、热稳定性和酶活性和/或更新。在一个实施方案中，热稳定的细菌核糖核酸聚合酶可以使来自脱氧核糖核酸构建体的信使核糖核酸的生物合成具有更高的稳定性并且高于传统温度，这可以帮助基因组或粘粒脱氧核糖核酸在特定的启动子控制下或不受其控制的解折叠。在一个优选的实施方案中，这种高度稳定的核糖核酸聚合酶可用于在无细胞表达系统中产生表达产物，例如体外转录、体外互补脱氧核糖核酸产生和体外转录/翻译表达系统。这种高度稳定的核糖核酸聚合酶可用于具有特定酶的无细胞表达系统，以再生能量来源/底物，如三磷酸尿苷、三磷酸鸟苷和/或三磷酸胞苷，以及如本文所述的无机多磷酸盐能量再生系统。在该实施方案中，核糖核酸聚合酶蛋白质的增加的稳定性可使本文所述的无细胞表达系统具有更多的运行时间和更高的产率。

本发明的另一个目的是提供一种或多种遗传修饰的细菌菌株，其可以优化用于无细胞表达系统。此类修正的实例可包括对某些具有蛋白水解、核糖核酸酶和/或孢子形成活性等的基因的消除。另外的实施方案可包括过表达某些西格玛因子的基因工程细菌，所述西格玛因子可促进线性聚合酶链式反应产物的体外启动子识别以及核糖核酸聚合酶的上调。

本发明的另一个目的可以提供一种新的无细胞表达系统生长培养基。在某些实施方案中，本发明涉及可用于无细胞表达系统的修饰的生长培养基。这种新型培养基可以在不存在有毒金属盐和/或金属离子螯合剂的情况下培殖最佳细菌。

本发明技术的其他目的由以下的公开内容、附图和权利要求进行阐述。

附图说明

说明书的附图展示了本发明的一个或多个实施例，并与说明书一起用于解释本发明技术的某些方面。附图仅用于说明本发明的一个或多个优选实施例，但不应被用于限制本发明的解释。

图1a：图1是展示了本发明的一个实施方案中的耐热无细胞表达系统发酵罐的概略图；

图1b：展示了其一个实施方案中的无细胞表达系统发酵器的总图；

图2a：展示了其一个实施方案中的Gst AdK表达载体；

图2b：展示了其一个实施方案中的TaqPPK表达载体；

图3：添加到天然核糖核酸聚合酶蛋白亚基和RpoD的其他氨基酸的列表。

图4：利用Gst AdK/PPK偶联能量再生系统证明ATP再生的ATP酶荧光素酶测定。数据具体显示：A行：每个孔中200行标准ATP酶荧光素酶测定中的10μM ATP；B行：10μM ATP，标准PEP/PK条件(200μM PEP，0.02U/ml PK)，C行：10μM ATP，PPK/Gst AdK比例(4：1)总计1μg/ml；D行：10uM ATP，比例PPK/Gst AdK(1：1)总计1ug/ml；E行：10uM ATP，比例PPK/Gst AdK(1：4)总计1ug/ml；柱1-3：1ul(10mg/ml多磷酸盐)；第4-6列：3ul(10mg/ml多磷酸盐)；第7-9列：6μl(10mg/ml多磷酸盐)；柱10-12：10ul(10mg/ml多磷酸盐)。在Tecan读板器中的96孔板中连续记录所有反应137分钟(每个孔的X轴)。记录总相对发光并显示每个孔(Y轴)。

图5：在与图4相同的条件下，ATP酶荧光素酶测定反应以ATP、PEP/PK和Gst AdK/PPK PPi系统的基于荧光素酶/D-荧光素的ATP酶测定的相对发光的所有记录数据点的线性表示呈现。连续记录392分钟(X轴)。相对发光(相同的比例、相同的读数、相同的板)由Y轴表示。随着时间的推移，所有三个系统的分离变得非常明显。

图6：基于荧光素酶/D-荧光素的ATP酶测定中相对发光的对数表示，作为3次重复的所有记录数据点(5次独立实验)的平均值：200μl测定中的10μM ATP，具有PEP的10μMATP/PK条件(200uM PEP，0.02U/ml PK)，10uM ATP，比率PPK/AdK(4：1)总计1ug/ml蛋白质和3ul(10mg/ml多磷酸盐)。在1008分钟后记录实验以获得额外的数据点。所有平板都留在读板器中以防止光漂白。

图7：证明重组蛋白Gst AdK和TaqPPK的分离和纯化。

图8：显示不同多磷酸盐浓度下的ATP能量再生系统。

图9：荧光素酶测定显示解偶联的ATP能量产生反应产物。

图10：荧光素酶测定中使用的Gst AdK/TaqPPK ATP能量再生系统的一般反应方案。

图11：协同Gst AdK和TaqPPK酶从无机多磷酸盐和一磷酸腺苷作为底物来源产生ATP能量。

图12：文献和重组PPK蛋白质序列的比较；

图13a-b：是无细胞表达生物反应器，用于体内无细胞表达系统的其中一个实施例。

图14：是用于在其一个实施方案中产生细胞培养物的细胞培养装置。

具体实施方式

本发明包含各种方面，这些方面可以以不同方式组合。以下说明列出了一些元件并描述了本发明的一些实施例。这些元件与初始实施例一起列出，但是它们可以以任何方式和任何数量组合从而产生另外的实施例。本发明不局限于本文所述的各种示例和优选实施例中的系统、技术和应用。此外，本说明应被认为支持和包含具有任何数量的所公开元件的所有各种实施例、系统、技术、方法、装置和应用的描述和权利要求，其中每个元件可被单独使用，也可以是此实施例或后续任何应用中所有元件的排列和组合。

目前的技术包括基于无机多磷酸盐的新型能量再生，其具有无细胞表达系统的应用，包括但不限于：具有例如细胞提取物和/或补充底物的体外转录系统和提供UTP,GTP，CTP调节的酶；体外翻译系统；体外(ATP依赖性)蛋白活性测定系统；和组合的体外转录/翻译系统。

在某些实施方案中，在无细胞表达系统中使用的此类能量协同基因产物可包括但不限于腺苷激酶(AdK)和/或多磷酸激酶(PPK)。

通常，PPK催化ATP和无机多磷酸盐的可逆形成：

通常，Adk催化腺嘌呤核苷酸的相互转化，即2个ADP可以被转换成一个ATP和一个AMP。

在一些情况下，这种能量协同基因产物通常可以是热稳定的，在另一些情况下，基因修饰用于无细胞表达系统。该AdK/PPK偶联能量调节系统可用于无细胞表达系统，以及其他ATP依赖性反应，诊断应用和/或测定。

如下文详述，AdK/PPK能量调节系统可包括衍生自各种来源的AdK和/或PPK蛋白，如各种细菌种类以及重组表达。因此，虽然在一些实施方案中，某些AdK和/或PPK基因或蛋白质可被具体识别，但是应当注意，AdK和/或PPK的识别通常可以包括所有AdK和/或PPK基因或蛋白质及其同源物、旁系同源物和直系同源物以及所有转基因的版本。这种遗传修饰可以包括可以增强蛋白质活性的突变，例如一个或多个点突变。

在一个实施方案中，本发明技术可包括从选定的细菌物种中鉴定和分离一种或多种能量协同基因产物。一般参见图4，该优选的实施方案可以利用上文概述的技术从嗜热脂肪土芽孢杆菌的gDNA克隆AdK。另外，PPK可以从来自大肠杆菌(ecPPK)的gDNA(序列9)克隆，或者如下所述，在该优选的实施方案中，PPK可以从嗜热和/或耐热细菌中克隆和/或修饰，如水生栖热菌(TaqPPK)。

例如，在一个优选的实施方案中，源自嗜热脂肪芽孢杆菌gDNA从大约20ml过夜培养物中被分离出来。gDNA可以通过沉淀嗜热脂肪芽孢杆菌培养物并使用例如市售试剂盒(例如Macherey-Nagel NuceloSpin Microbial DNA Kit)被分离。然后可以使用乙醇沉淀浓缩gDNA。这通常可以通过向含有gDNA的溶液中加入盐和乙醇来实现，所述沉淀gDNA可以再次沉淀，例如，用离心机沉淀，然后重悬于不含DNA酶/RNase的水中。可以通过如上所述的类似方法分离和浓缩从水生栖热菌中分离出含有PPK基因的gNDA。

与上面引用的描述所类似的，在一个优选的实施方案中，可以使用特异性引物克隆Gst AdK和/或TaqPPK，所述特异性引物可以基于每个基因的核苷酸序列进行设计。在该实施方案中，可以产生正向和反向引物，其包含用于将主题基因引入选定的表达载体的特定限制性位点。在一个优选的实施方案中，可以产生正向和反向引物，其含有限制性位点以将Gst AdK和/或TaqPPK基因特异性地引入IBA StarGate表达载体中。来自Gst和大肠杆菌的主题引物和gDNA可以进行单独的聚合酶链式反应(PCR)以分别扩增Gst AdK和/或TaqPPK基因。在一个实施方案中，Gst AdK和/或ecPPK基因的单独PCR可以分别使用标准MasterMix反应和50ng分别从嗜热脂肪芽孢杆菌和大肠杆菌分离的输入gDNA(表1)进行。

在一个优选的实施方案中，热稳定的PPK酶可以衍生自水生栖热菌(TaqPPK)，并且可以进一步在本发明的无细胞表达系统中与通常在上文的Gst AdK(SEQ ID NO.8)偶联。在该实施方案中，PPK文献蛋白质序列(序列10；图12)用于反向翻译成DNA。然后对该序列进行大肠杆菌密码子优化，并将该基因亚克隆到pET151/D-TOPO中进行表达(图2b)。在该实施方案中，对来自水生栖热菌的亚克隆PPK基因(通常鉴定为TaqPPK)进行遗传修饰，以在N-末端含有额外的非天然存在的氨基酸。这些额外的非天然存在的氨基酸包括：1)6xHis-标签；2)V5表位标签和3)TEV切割位点(序列11)。如表2所示，这三种遗传修饰是pET151骨架的一部分，可能有助于表达和纯化。TaqPPK在BL21(DE3)中表达，并使用本文一般描述的方法纯化。

在一个实施方案中，可以分离已经通过PCR过程扩增的Gst AdK和TaqPPK基因DNA序列。在一个优选的实施方案中，可以在1％溴化乙锭琼脂糖凝胶上分析PCR反应，并且可以通过工业中已知的琼脂糖凝胶提取和/或PCR纯化方法分离Gst AdK和/或PPK基因，例如Macherey-Nagel NucleoSpin Gel和/或PCR清理。然后可以将这些分离的基因插入合适的递送载体中。例如，在一个实施方案中，先前产生的基因片段和选择的载体，在该实施方案中是合适的载体(分别参见例如图2a-b)，可以用选择的限制酶消化并通过例如连接而连接。3：1T4 DNA连接酶反应，可以商品名Thermo Fisher Scientific Rapid DNA LigationKit购得。应当注意，对于这个和所有其他实施方案，可以将每个基因片段分别连接到单独的递送载体中并转化到选择的细菌菌株或其他合适的细胞中。其他实施方案可以包括将多个基因片段连接到递送载体中并转化到待共表达的选择细菌菌株中。

在该实施方案中，连接的Gst AdK和TaqPPK基因和质粒载体可以单独或共同转化到选定的细菌菌株中。在一个优选的实施方案中，可以将单个连接的载体转化到具有高转化效率的Top 10感受态大肠杆菌中。在该实施方案中，Top10感受态大肠杆菌可以包括recA基因中的突变，其可以减少DNA重组促进质粒载体稳定性，并且可以进一步包括endA基因敲除，其可以降低非特异性内切核酸酶活性，从而改善质粒载体的产量和质量。

成功转化的细菌可以通过阳性基因检测PCR或其他已知方法进行鉴定，随后可以在生长的细菌菌落内培养产生质粒载体的多个拷贝。在一个优选的实施方案中，质粒载体DNA可以被分离并转化到另一种选择的细菌菌株中。在一个优选的实施方案中，可以将制备的质粒载体DNA转化到大肠杆菌的高表达菌株中，例如BL21(DE3)，以获得最佳的蛋白质表达。

在一个实施方案中，本发明的技术可包括各自具有选定分子标签的Gst AdK和TaqPPK蛋白的单独表达。在该实施方案中，Gst AdK和/或PPK蛋白可各自配置成含有poly-His或His-6标签，其可以在以后用于蛋白质纯化。在该实施方案中，可以检测和纯化表达的Gst AdK和/或PPK蛋白，因为在适当的缓冲条件下，组氨酸残基串与几种类型的固定化金属离子如镍、钴和铜等结合。

在一个实施方案中，被标记的Gst AdK(序列8)和/或TaqPPK(序列11)蛋白质可以单独表达和纯化。在该优选实施方案中，单独的His-6标记的Gst AdK和/或PPK蛋白可以在大肠杆菌的BL2 1(DE3)菌株中表达。在该实施方案中，大肠杆菌的BL21(DE3)菌株可以在NYZ培养基中培养，其可以缺少乳糖，因乳糖可以诱导某些蛋白酶，而可能潜在地降解任何表达的蛋白质，并降低总产率。蛋白质可以在细菌生长的特定光密度(OD)下被诱导表达。在一个优选的实施方案中，在光密度大约0.7时，蛋白质可以在30-32℃下，时长6-8小时，通过加入0.25mM异丙基β-D-1-硫代吡喃半乳糖苷(IPTG)被诱导表达。IPTG是一种模仿异乳糖的分子试剂，一种可触发质粒载体DNA中lac操纵子的转录乳糖代谢物，其从而诱导蛋白质表达，在此情况下其主题基因分别是可能是在乳糖操纵基因控制下的Gst AdK和/或TaqPPK基因。

在该优选实施方案中，各个BL21(DE3)培养物可被裂解，裂解物可通过带金属离子的树脂进行制备。各个裂解物可以通过带镍的IMAC树脂，其中Gst AdK和/或TaqPPK蛋白上的His-6标签可以与树脂上固定的镍离子结合。非结合和非特异性结合蛋白可能被去除，在该实施方案中，通过添加SmM咪唑，可以除去非结合和非特异性结合蛋白，同时Gst AdK和TaqPPK蛋白保持与树脂结合。同样，如上所述，Gst AdK和TaqPPK蛋白质纯化步骤可以通过上述蛋白质纯化步骤分别完成。

Gst AdK和/或TaqPPK蛋白而后可以通过加入300mM咪唑或其他已知方法单独洗脱。蛋白质的存在可以通过SDS-PAGE证明，并且FPLC UV-谱可以另外显示蛋白质纯度。在一个优选的实施方案中，单独纯化的蛋白质可以在体外转录/翻译相容的缓冲条件下储存，Gst AdK浓度为13mg/ml，PPK浓度为10mg/ml，并储存在-20℃,以备后用。

此外，可以进行ATP测定以在多磷酸盐存在下验证Gst AdK和/或PPK蛋白的功能。这种测定可以量化三磷酸腺苷(ATP)的数量以及ATP产生。ATP(参见图6)是腺嘌呤核苷酸，其由在糖部分酯化的三个磷酸基团组成，存在于所有活细胞中。腺苷三磷酸参与代谢过程以及RNA和蛋白质合成的能量产生。

在一个优选的实施方案中，无机多磷酸盐，在这种情况下是多磷酸钠，可以作为体外ATP依赖性系统中的系统的能量来源提供。可以将分离和纯化的Gst AdK和/或TaqPPK添加到该无细胞表达系统中。在一个优选的实施方案中，可将Gst AdK至TaqPPK添加至无细胞表达系统或其他测定，诊断或系统，其中与TaqPPK相比，Gst AdK与TaqPPK的比率可包括更高量的Gst AdK。在一个实施方案中，Gst AdK与TaqPPK可以以约3:1-4:1的近似摩尔比添加到该系统中。应该理解，这种比例仅仅是示例性的，其他比例也在本发明的范围内。例如，在其他实施方案中，Gst AdK至TaqPPK可以以近似摩尔比添加至该系统，包括但不限于1：1，2：1，3：1，5：1，5：1,7：1，8：1，9：1，10：1等。

如图8中所示，在另一个优选的实施方案中，可以将分离和纯化的Gst AdK和/或TaqPPK与一定量的无机多磷酸盐一起加入到该无细胞表达系统中。在一个实施方案中，该量的无机多磷酸盐可包含最佳的多磷酸盐浓度范围。在该优选实施方案中，这种最佳多磷酸盐浓度范围通常定义为保持反应平衡稳定的无机多磷酸盐(PPi)的浓度。在该优选的实施方案中，最佳多磷酸盐浓度范围可以是约0.2-2mg/ml PPi。

如上所述，PPK可以从多磷酸盐和AMP中合成ADP。在该优选实施方案中，Gst AdK和PPK的偶联作用可以通过将两个ADP转化为一个ATP和一个腺苷一磷酸(AMP)来从系统中除去二磷酸腺苷(ADP)：

该反应可快速驱动PPK对ADP生成的平衡反应：

在该系统中，较高浓度的AMP的存在可进一步推动TaqPPK对ADP的反应。

同样，如图4-6所示，在ATP测定分析中，与传统的PEP/PK能量产生系统相比，PPK/AdK能量(ATP)再生系统的ATP再生速率增高。在一些实施方案中，与可比条件下的传统PEP/PK系统相比，初始ATP转化率可以高约10倍。另外，在图4-6中进一步展示的Gst AdK和PPK可具有更高的总转换数，从而使长时间可检测的ATP再生，在该实施方案中其长达12小时。

TaqPPK的结合可进一步使可检测的ATP再生超过12小时。这种ATP再生周转率显著高于上述传统的体外ATP再生系统。在其他实施方案中，Gst AdK和/或TaqPPK可以包括改善的盐耐受性，允许盐浓度的持续酶活性和/或将抑制其他AdK蛋白的周转。因此，可以看出Gst AdK和TaqPPK(以及AdK和/或PPK及其同源物来自各种其他细菌，包括但不限于嗜热和/或耐热微生物菌株)在多磷酸盐存在下如何在无细胞表达系统中协同作用以再生细胞能量来源ATP：

本发明技术的某些实施方案可包括具有改进的能量再生系统的无细胞表达系统。在一个优选的实施方案中，无细胞表达系统，例如体外转录和/或翻译系统可以配置为包括无机多磷酸盐能量再生能力，其可以进一步包括来自选择的细菌菌株的热稳定RNA聚合酶(RNAP)。

在一个优选的实施方案中，嗜热脂肪土芽孢杆菌中的RNAP亚基α(序列1)，β(序列2)，β'和/或β'(最优生产技术)(分别为序列3和序列4)，Δ(序列5)，ω(序列6)在用于无细胞蛋白质表达系统中被鉴定、克隆、纯化和制备。应注意的是，嗜热脂肪芽孢杆菌是革兰氏阳性嗜热细菌，其特征在于其内细胞膜和厚细胞壁。嗜热脂肪芽孢杆菌是一种杆状厌氧菌，存在于嗜热生境中，如热通风口或温泉。

来自嗜热脂肪芽孢杆菌(Gst RNAP)的RNAP可以如本文一般描述的那样被鉴定、克隆、表达然后纯化。在该实施方案中，Gst RNAP可以比来自非极端微生物细菌例如大肠杆菌的标准RNAP更稳定。Gst RNAP可具有改善的热稳定性以及改善的动力学稳定性，使得其可以在体外系统中比在传统无细胞表达系统中使用的其他RNAP变体更长时间地催化mRNA的产生。

在一个优选的实施方案中，热稳定的Gst RNAP可以被克隆和转化为高表达大肠杆菌菌株。该热稳定的Gst RNAP可以被克隆、分离和纯化，然后在靶遗传物质(例如含有一个或多个选择基因的质粒和/或线性DNA)存在下引入无细胞表达系统，并允许产生选择的基因的mRNA转录物。在一个实施方案中，这些mRNA转录物可以引入细菌或其他细胞提取物或与细菌或其他细胞提取物组合。提取物可能含有DNA到RNA转录、RNA到蛋白质翻译、蛋白质折叠和能量代谢的必要元素。如上所述，在该实施方案中，可以将分离和纯化的TaqPPK和Gst AdK加入到如无细胞表达系统的细胞提取物中，以及在蛋白质翻译期间加入一定量的一种或多种多磷酸盐以提供改善ATP再生的机制。

在该优选实施方案中，靶mRNA转录物的翻译可以产生一种或多种选择蛋白，与此同时TaqPPK、Gst AdK和多磷酸盐的协同活性提供增强的ATP再生，使无细胞表达系统具有更长的运行时间，如果需要，其也可能在更高的温度下，具有能产生总体更高的蛋白质产量更高的转换数。在该实施方案中，高度稳定的Gst RNAP的存在允许mRNA转录物的产生具有更长的运行时间，在可能更高的温度下而不变性，并且具有更高的转换数，从而导致更高的mRNA转录物并最终在无细胞表达系统内产生蛋白质。

本发明还涉及改进的体外转录/翻译系统，通常被称为无细胞表达系统。在一个实施方案中，该无细胞表达系统可包括一种或多种经遗传修饰的嗜热或耐热细菌菌株，其可开发用于无细胞提取物制备。在一个优选的实施方案中，遗传修饰的嗜热细菌菌株可以被开发，例如土芽孢杆菌菌株，并用于无细胞(CF)提取物制备和体外转录/翻译。与大肠杆菌(35-37℃)相比，土芽孢杆菌菌株通常表现出高生长温度(52-55℃)。该热差异产生了更高的蛋白质稳定性和CF提取物制剂中更高蛋白质密度的耐受性。此外，土芽孢杆菌菌株的嗜热特性可以使其他酶和酶功能的稳定性增加，例如但不限于：氨基酸-合酶、核糖体、DNA依赖性RNA聚合酶、西格玛因子、和ATP再生和糖酵解酶。

土芽孢杆菌属的细菌对CF提取物制剂也是有利的。在特定条件下，作为厚壁菌门，它们是氧气耐受的或严格需氧的。厌氧嗜热菌的处理、发酵和提取制剂可能明显更复杂、更昂贵，且由于大气的氧化条件而具有与酶稳定性相关的额外不确定性。此外，由于土芽孢杆菌对人类没有已知的健康影响，因此适合从CF系统生产临床材料。

关于本发明的遗传修饰的土芽孢杆菌菌株，通过遗传分析预测并证明核糖体结合位点(RBS)与大肠杆菌蛋白质表达菌株的表达构建体的标准RBS相同或相当，这使优选实施方案中的本发明技术能够保留和利用现有的遗传构建体。

在另一个优选的实施方案中，本发明的遗传修饰的土芽孢杆菌菌株显示出对tRNA密码子使用的有利覆盖。在一个实施方案中，使用具有tRNA群体分布的专有软件工具进行生物信息学分析，以鉴定覆盖所有或大多数所有潜在密码子的菌株，以防止由于稀有或未覆盖的tRNA密码子导致的体外翻译反应停滞。该土芽孢杆菌菌株的提取物也可以利用纯化的大肠杆菌tRNA，其被菌株的氨基酸合酶识别。这使密码子覆盖得以完整且几乎相等分布。该实施方案考虑了不同菌株的tRNA密码子使用的自然不均等分布，例如嗜热脂肪土芽孢杆菌和嗜热栖热菌，考虑到热力学平衡分布。

如上所述，在一个优选的实施方案中，遗传修饰的细菌菌株被开发用于无细胞表达系统。在一个优选的实施方案中，土芽孢杆菌菌株被遗传修饰以除去和/或降低某些酶的表达，并在发酵过程中组成性地过量产生酶以促进CF提取物制剂的使用(该遗传修饰的菌株有时通常称为“土芽孢杆菌CF”)。在该实施方案中，菌株被进行遗传修饰以敲除强蛋白酶OmpT-同源物，RNase1和DNA-甲基化依赖性DNA酶。在该实施方案中，通过从细菌基因组中选择性除去这些基因的转录控制来完成遗传敲除修饰。同时也可以采用其他敲除方法，因为它们通常是本领域已知和了解的。该实施方案通过遗传修饰(敲低)降低培养密度依赖性孢子形成操纵子的活性以减缓孢子形成过程并增加培养物中的细菌密度，从而产生更高的效率和改善的CF提取物产量。

同样，如上文所述，在某些实施方案中，遗传修饰的细菌菌株被开发以过表达σ因子RpoD，以识别特异性启动子从线性PCR产物中获得有利的体外转录。在一个优选的实施方案中，对土芽孢杆菌CF进行遗传修饰以在菌株发酵过程中过表达σ因子RpoD。这种基因修饰的RpoD过表达使该σ因子的表达升高至高于σ70的天然细胞浓度，这反过来导致转基因土芽孢杆菌菌株中细菌RNAP的浓度增加。最后，遗传修饰的细菌土芽孢杆菌菌株显示出与本领域已知的大肠杆菌蛋白质表达菌株相当的生长速率。使用经遗传修饰的土芽孢杆菌菌株进行CF提取物制备的其他优点包括：1)高生长温度(约52-55℃)，其显著减少培养物的潜在污染；2)“用过的”发酵培养基简单且无害，减少了对废物处理的需要，正如厌氧嗜热菌需要的一样。

在另外的实施方案中，细胞提取物可以从许多不同的微生物中产生。例如，细胞提取物可以从大肠杆菌(ECE)，兔网织红细胞(RRL)，小麦胚芽(WGE)和昆虫细胞(ICE)，甚至哺乳动物细胞(MC)产生。在另外的实施方案中，细胞提取物从微藻中产生。这样的实施方案是有优势的，因为细菌不提供识别和去除内含子的任何机制。另一方面，像纳米氯化物这样的微藻具有内含子并且细胞机器将它们去除-这使之自然成为微藻细胞提取物的组成部分，进而使得本发明适用于植物蛋白和其他表达的产物。

如本文所述，体外无细胞表达是指在包含生物提取物和/或确定的无细胞反应组分的反应混合物或溶液中无细胞合成多肽。反应混合物可以包含模板或遗传模板，用于生产大分子，例如DNA，mRNA等；用于合成的大分子的单体，例如氨基酸、核苷酸等，以及合成所必需的辅因子，酶和其他试剂，例如核糖体、tRNA、聚合酶、转录因子等。无细胞合成反应和/或细胞三磷酸腺苷(ATP)能量再生系统组分可以以分批、连续流动或半连续流动的方式进行/添加。

如上所述，本发明可适用于许多测定和其他诊断应用。例如，在一个实施方案中，添加双酶Adk/PPK以及PPi和AMP可以使任何ATP能量依赖性测定或诊断应用(例如荧光素酶测定)内的ATP再生。在一个优选的实施方案中，第一量的Gst AdK和第一量的TaqPPK可以与第一量的PPi和第一量AMP一起加入ATP依赖性测定或诊断中。在该优选实施方案中，与传统的能量补充技术相比，其可以实现细胞ATP能量再生，从而优化测定和/或诊断运行时间、输出、灵敏度以及由于组分的廉价性质而导致的损失成本。上述每个组件也可以在指定的时间过程中被进一步补充。

这种ATP依赖性应用的实例可包括但不限于可能有益于差向异构酶、脱水酶、NADPH-水合物-脱水酶、纤维素酶、染色质重塑酶、ATP依赖性肽连接酶、DNA连接和传统的无细胞表达系统的能量依赖性光反应或酶反应。本发明的系统可用于生成：合成酶、磷酸化过程、CoA依赖性酶(洗涤剂，香料工业)、Deaminoacide酰胺(Deala-Deala-Ligases)。

如上所述，在本发明的一个实施方案中，具有偶联的Adk/PPK能量再生系统的无细胞表达系统可包括添加无机多磷酸盐(PPi)。在另一个实施方案中，具有偶联的Adk/PPK能量再生系统的无细胞表达系统可以包括添加第一量的PPi，而其他实施方案可以包括添加多个量的PPi。在该实施例中，可以以预定的时间间隔添加多个量的PPi。

在一个优选的实施方案中，具有偶联的AdK/PPK能量再生系统的无细胞表达系统可以包括足以将能量调节反应维持在近似平衡状态的，和/或产生最大或所需水平的ATP的浓度范围。在另一个优选的实施方案中，具有偶联的AdK/PPK能量再生系统的无细胞表达系统可以包含约0.1至50mg/m IPPi或更高的浓度。在另一个优选的实施方案中，具有偶联的AdK/PPK能量再生系统的无细胞表达系统可以包含足以将能量调节反应保持在近似平衡状态的浓度范围，该范围大约在0.3-4mg/nilPPi之间。

在另一个优选的实施方案中，具有偶联的AdK/PPK能量再生系统的无细胞表达系统可以包括足以将能量调节反应维持在近似平衡状态的浓度范围，该范围大约在0.2-2mg/ml PPi之间。在另一个优选的实施方案中，具有偶联的AdK/PPK能量再生系统的无细胞表达系统可以包括足以将能量调节反应保持在近似平衡状态的浓度范围，该范围大约在0.5-0.6mg/ml PPi之间。当然，基于无细胞表达反应的大小、持续时间和能量需求，可以根据需要按比例放大或缩小所有这些比例。在一些其他实施方案中，功能范围还可以不包括额外的PPi或0mg/ml。

如图I3a-b所示，在一个实施方案中，本发明涉及无细胞表达生物反应器(22)(参见元件10-20)。在此情况下应当注意，这种双反应器仅作为用于本发明的多个无细胞系统。本发明的生物反应器可以使无细胞在高于传统温度下表达，并且可以配置在例如进料反应溶液中以分批、连续或半连续的方式运行。

再次参考图14，在该实施方案中，本发明可以进一步包括无细胞培养装置(21)(参见元件1-9)。该细胞培养装置可以被配置以在某些优选的实施方案中培养嗜热细菌。在优选的实施方案中，发酵容器可以是可移除的并且可单独地高压灭菌。另外，该无细胞培养装置(21)可以被配置以适应需氧生物以及厌氧生物的生长。此外，无细胞表达生物反应器(22)和无细胞培养装置(21)都可以容纳各种细胞培养物，例如微藻、植物细胞等。

在此情况下应当注意，以下无细胞蛋白质表达系统本质上是示例性的，并且不同的构型和系统可以与上述无机多磷酸盐能量再生系统结合。此外，新型无机多磷酸盐能量再生系统可以适用于各种已知的无细胞表达系统，并且可以进一步配置成适应性试剂盒。

因为本发明涉及遗传改变的生物的生产并涉及重组DNA技术，所以本文在此陈述以下定义以帮助描述本发明。本文所用的术语“分离的”、“纯化的”或“生物学纯的”是指实质上或基本上不含通常在天然状态下或在制备材料时伴随材料的组分的材料。在一个示例性实施方案中，纯度和均一性通过如聚丙烯酰胺凝胶电泳或高效液相色谱法等分析化学技术测定。作为制剂中存在的主要物种的核酸或特定细菌基本上是纯化的。在一个示例性实施方案中，术语“纯化的”表示在电泳凝胶中实质上产生一条带的核酸或蛋白质。通常，分离的核酸或蛋白质具有以范围表示的纯度水平。该组分的纯度范围的下限为约60％、约70％或约80％，纯度范围的上限为约70％、约80％、约90％或约90％以上。

如本文所用的术语“核酸”是指核糖核苷酸或脱氧核糖核苷酸的聚合物。通常，“核酸”聚合物以单链或双链形式存在，但也有包含三个或更多个链的结构。术语“核酸”包括天然存在的核酸聚合物以及包含已知核苷酸类似物或修饰的主链残基或键的核酸，其可以是合成的、天然存在的和非天然存在的，其具有与参考核酸相似的结合特性，其以与参考核苷酸相似的方式代谢。示例性类似物包括但不限于硫代磷酸酯、氨基磷酸酯、甲基膦酸酯、手性-甲基膦酸酯、2-O-甲基核糖核苷酸和肽-核酸(PNA)。“DNA”、“RNA”、“多核苷酸”、“多核苷酸序列”、“寡核苷酸”、“核苷酸”、“核酸”、“核酸分子”、“核酸序列”、“核酸片段”和““分离的核酸片段”在本文中可互换使用。对于核酸来说，其大小以千碱基(kb)或碱基对(bp)给出。估计值通常来自琼脂糖或丙烯酰胺凝胶电泳，来自测序的核酸，或来自公开的DNA序列。对于蛋白质，其大小以千道尔顿(kDa)或氨基酸残基数给出。蛋白质大小通过凝胶电泳、测序蛋白质、衍生氨基酸序列或公布的蛋白质序列进行估算。

除非另有说明，否则特定核酸序列还隐含其保守修饰的变体(例如简并密码子替代)、互补(或补体)序列和反向互补序列以及明确指出的序列。具体来说，简并密码子替代可以通过产生被混合碱基和/或脱氧肌苷残基替代的第三位置的其中一个或多个选定(或所有)密码子序列来实现(参见例如Batzeret al.，Nucleic Acid Res.19：5081(1991)；Ohtsukaet al.，J.Biol.Chem.260：2605-2608(1985)；和Rossoliniet al.，Mol.Cell.Probes 8：91-98(1994))。

除了编码氨基酸的核苷酸密码子的简并性质之外，多核苷酸中的改变致使在给定位点产生化学上等同的氨基酸，但不影响编码的多肽的功能特性，这在本领域中是众所周知的。“保守氨基酸替代”被预测为最不干扰参考多肽性质的那些替代。换句话说，保守氨基酸替代基本上保留了参照蛋白的结构和功能。因此，氨基酸丙氨酸(疏水性氨基酸)的密码子可以被编码另一种疏水性较低的残基(如甘氨酸)或更疏水的残基(如缬氨酸，亮氨酸或异亮氨酸)的密码子替代。类似地，导致一个带负电的残基替换为另一个的变化，例如天冬氨酸替代谷氨酸，或一个带正电荷的残基取代另一个，例如精氨酸或组氨酸的赖氨酸，也被预期产生功能等同的蛋白质或多肽。示例性保守氨基酸替代是本领域普通技术人员已知的。保守氨基酸替代通常保持(a)替代区域中多肽骨架的结构，例如，作为β折叠或α螺旋构象，(b)在取代位点处分子的电荷或疏水性，和/或(c)侧链的大部分。

同源性可以通过使用计算成对序列比对的任何同源性比较软件来确定(例如，同源性百分比、序列同一性和序列相似性)。如本文所用，在两个核酸或多肽序列中的“序列同一性”或“同一性”包括参照的两个序列中的残基，其在比对时是相同的。当使用蛋白质序列同一性百分比参考时，不相同的残基位置通常因保守氨基酸替代而不同，其中氨基酸残基替代具有相似化学性质的其他氨基酸残基(例如电荷或疏水性)，因此其未改变分子的功能特性。当序列在保守替代方面不同时，可以向上调整序列同一性百分比以校正替代的保守性质。因这种保守替代而不同的序列具有“序列相似性”或“相似性”。进行这种调节的方法是本领域技术人员所熟知的。通常，这涉及将保守替代评分为部分而非完全错配，从而增加序列同一性百分比。因此，例如，当给予相同的氨基酸得分为1并且给予非保守置换得分为零时，保守置换被给予0和1之间的得分。保守置换的得分根据如Henikoff S和Henikoff JG等的算法来进行计算。[来自蛋白质块的氨基酸取代基质Proc.Natl.Acad.Sci.U.S.A.1992,89(22):10915-9]。

根据一个具体实施方案，同源序列与本文所述的序列(核酸或氨基酸)至少60％、65％、70％、75％、80％、85％、90％、95％、99％相似或甚至相同。本发明的某些实施方案中可能包含序列1-22的相似性在50％-99％之间的同源序列。

如本文所用，术语“引物”是指能够在合适条件下充当DNA合成起始点的寡核苷酸。这些条件包括在四种不同的核苷三磷酸和在适当的缓冲液中和在合适的温度下延伸的试剂(例如，DNA聚合酶或逆转录酶)的存在下诱导与核酸链互补的引物延伸产物的合成的条件。

引物优选是单链DNA。引物的合适的长度取决于引物的预期用途，但通常为约6至225个核苷酸，包括中间范围，例如15至35个核苷酸，18至75个核苷酸和25至150个核苷酸。短引物分子通常需要较低的温度以与模板形成足够稳定的杂合复合物。引物不需要反映模板核酸的确切序列，但必须足够互补以与模板杂交。用于扩增给定靶序列的合适引物的设计是本领域所熟知的并且在本文引用的文献中有所描述。

如本文所用，“聚合酶”是指催化核苷酸聚合的酶。“DNA聚合酶”催化脱氧核糖核苷酸的聚合。已知的DNA聚合酶包括Pyrococcus ftiriosus(Pfu)DNA聚合酶、大肠杆菌DNA聚合酶I、T7 DNA聚合酶和Thermus aquaticus(Taq)DNA聚合酶等。“RNA聚合酶”催化核糖核苷酸的聚合。前述DNA聚合酶的实例也称为DNA依赖性DNA聚合酶。RNA依赖性DNA聚合酶也属于DNA聚合酶的范围。逆转录酶包括由逆转录病毒编码的病毒聚合酶，是RNA依赖性DNA聚合酶的一个例子。RNA聚合酶(“RNAP”)的已知实例包括T3 RNA聚合酶、T7 RNA聚合酶、SP6RNA聚合酶和大肠杆菌RNA聚合酶等。上述RNA聚合酶的实例也称为DNA依赖性RNA聚合酶。任何上述酶的聚合酶活性可通过本领域熟知的方法测定。

本文所用的术语“反应混合物”或“无细胞反应混合物”是指含有进行给定反应所必需的试剂的溶液。无细胞表达系统“反应混合物”或“反应溶液”通常含有粗制或部分纯化的提取物(例如来自细菌、植物细胞、微藻、真菌或哺乳动物细胞)核苷酸翻译模板，以及相配的用于从翻译模板促进无细胞蛋白质合成的反应缓冲液。在一些方面，CF反应混合物可包括外源RNA翻译模板。在其他方面，CF反应混合物可包括编码开放阅读框的DNA表达模板，所述开放阅读框可操作地连接至DNA依赖性RNA聚合酶的启动子元件。在这些其他方面，CF反应混合物还可以包括DNA依赖性RNA聚合酶，以指导编码开放阅读框的RNA翻译模板的转录。在这些其他方面，额外的NTP和二价阳离子辅因子可以包括在CF反应混合物中。如果反应混合物含有使反应所需的所有试剂，则称认为是完全的反应混合物，如果反应混合物仅含有必要试剂的一部分则被认为是不完全的反应混合物。对于本领域普通技术人员来说，为了方便、储存稳定性或调整依赖于应用的组分，反应组分通常作为单独的溶液储存，每个溶液含有总组分的子集，浓缩、反应组分在反应前合并，形成完全的反应混合物。此外，对本领域普通技术人员来说，反应组分的分开包装是为了商业化的需要，并且有用的商业试剂盒可包含本发明反应组分的任何子集。此外，对普通技术人员来说，反应混合物中的一些组分，虽然在某些实施方案中使用，但不是产生无细胞表达产物所必需的。

术语“无细胞表达产物”可以是通过无细胞表达系统产生的任何生物产物。

术语“约”或“大约”是指在一个或多个值的统计学上有意义的范围内，例如规定的浓度、长度、分子量、pH、时间范围、温度、压力或体积。这样的值或范围可以在给定值或范围的一个数量级内，通常在20％之内，更通常在10％之内，甚至更通常在5％之内。“约”或“近似”所包含的可允许变化将取决于所研究的特定系统。除非另有说明，否则术语“包含”、“具有”、“包括”和“含有”应被解释为开放式术语(即，意味着“包括但不限于”)。

除非本文另有说明，则本文中对数值范围的描述仅旨在用作单独提及落入该范围内的每个单独值的简写方法，并且包括限定该范围的端点边界，且如这里单独列举的一样，每个单独的值在说明书中被描述。

术语“重组”或“基因修饰的”当与参考例如细胞，或核酸、蛋白质或载体一起使用时，表明细胞、生物体、核酸、蛋白质或载体已被引入的异源核酸或蛋白质修饰、或被天然核酸或蛋白质改变、或细胞来源于如此修饰的细胞。因此，例如，重组细胞可以表达在细胞的天然(非重组或野生型)形式中未发现的基因，或表达异常表达、过表达、表达不足或完全不表达的天然基因。

如本文所用，术语“转化”或“遗传修饰的”是指一种或多种核酸分子到细胞中的转移。当核酸分子稳定复制时，微生物被转导到细菌或细胞或生物体中的核酸分子“转化”或“遗传修饰”。如本文所用，术语“转化”或“遗传修饰的”包括可以将核酸分子引入细胞或生物体(例如细菌)的所有技术。

如本文所用，术语“启动子”是指DNA区域，其可以位于转录起点的上游，并且可以参与RNA聚合酶和其他蛋白质的识别和结合以起始转录。启动子可以与编码序列可操作地连接以在细胞中表达，或启动子可以与编码信号序列的核苷酸序列可操作地连接，所述信号序列可以与编码序列可操作地连接以在细胞中表达。

当用于提及调节序列和编码序列时，术语“可操作地连接”是指调节序列影响连接的编码序列的表达。“调节序列”或“控制元件”是指影响转录、RNA加工或稳定性的时间和水平/量、或相关编码序列的翻译的核苷酸序列。调节序列可包括启动子、翻译领导者序列、内含子、增强、茎环结构、阻遏物或结合序列、终止序列、多腺苷酸化识别序列，例如，特定的调节序列可以位于与其可操作地连接的编码序列的上游和/或下游。而且，与编码序列可操作连接的特定调节序列可位于双链核酸分子的相关互补链上。

如本文所用，术语“基因组”是指在细胞核内发现的染色体DNA，并且还指在细胞的亚细胞组分内发现的细胞器DNA。应用于细菌的术语“基因组”是指细菌细胞内的染色体和质粒。在本发明的一些实施方案中，可以将DNA分子引入细菌中，使得DNA分子整合到细菌的基因组中。在这些和进一步的实施方案中，DNA分子可以是染色体整合的或位于稳定质粒中稳定质粒中的。

术语“基因”或“序列”是指可操作地连接到能够以某种方式调节基因产物(例如多肽或功能性RNA)表达的适当调节序列的编码区。基因包括编码区(开放阅读框、ORF等)之前(上游)和之后(下游)的DNA的非翻译调节区(例如启动子、增强子、阻遏物等)以及在适用的情况下，各个编码区(即外显子)之间的间插序列(即内含子)。本文所用的术语“结构基因”意指转录成mRNA的DNA序列，然后将其翻译成特定多肽特有的氨基酸序列。

如本文所用的术语“表达”或“编码序列的表达”(例如基因或转基因)是指核酸转录单元(包括例如基因组DNA或cDNA)被转化为细胞的可操作的、非操作的或结构的部分的编码信息的过程，其通常包括蛋白质的合成。基因表达可能受外部信号的影响；例如，将细胞、组织或生物体暴露于增加或减少基因表达的试剂。基因的表达也可以在从DNA到RNA到蛋白质的途径中的任何地方受到调节。基因表达的调节例如通过控制作用于转录、翻译、RNA转运和加工，中间分子例如mRNA的降解，或通过特定蛋白质分子的活化、失活、区室化或降解后发生或其组合等实现。基因表达可以通过本领域已知的任何方法在RNA水平或蛋白质水平中测量，方法包括但不限于Northern印迹、RT-PCR、Western印迹、或体外、原位或体内蛋白质活性测定。

术语“载体”是指可以将DNA、RNA、蛋白质或多肽引入宿主的一些方法。待引入宿主的多核苷酸、蛋白质和多肽本质上可以是治疗性的或预防性的，可编码的或是抗原，其有各种类型的载体。载体的类型包括病毒、质粒、噬菌体、粘粒和细菌。

“表达载体”是能够在选定的宿主细胞或生物体中复制的核酸。表达载体可以作为自主结构复制，或者可以整体或部分整合到宿主细胞染色体或细胞器的核酸中，或者它用作穿梭机以将外来DNA递送到细胞，因此与宿主细胞基因组一起复制。因此，表达载体是能够在选定的宿主细胞、细胞器或生物体中复制的多核苷酸，例如质粒、病毒、人工染色体、核酸片段，以及表达载体上被转录并翻译成细胞、细胞器、生物体内的多肽或蛋白质的某些基因(包括目的基因)，或是本领域已知的任何合适的构建体，其包含“表达盒”。相反，如本文实施例中所述，“盒”是含有本发明表达载体部分的多核苷酸。盒的使用有助于表达载体的组装。表达载体是复制子，例如质粒、噬菌体、病毒、嵌合病毒或粘粒，并且含有与表达控制序列可操作连接的所需多核苷酸序列。

与本文一般性描述的无细胞表达系统中表达的蛋白质相关的术语“表达产物”可互换使用，其通常指具有多于约5个氨基酸的任何肽或蛋白质。多肽可以与外源同源，或者可以是外源的，这意味着它们对于衍生无细胞提取物的生物是异源的，即外源的，例如在无细胞提取物中产生的人蛋白、植物蛋白、病毒蛋白、酵母蛋白等。

“无细胞提取物”或“裂解物”可以衍生自多种生物和/或细胞，包括细菌、嗜热细菌、耐热细菌、古细菌、厚壁菌门、真菌、藻类、微藻、植物细胞培养物和植物悬浮培养物。

如本文所用，单数形式“一”、“和”和“该”包括复数指示物，除非上下文另有明确说明。因此，例如，“一个细胞”指的是多个这样的细胞，“培养物”指的是一种或多种培养物及本领域技术人员已知的等同物等等。除非另有明确说明，否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。

通过参考以下实施例的一般性描述，本发明将更容易被理解，所述实施例仅用于说明本发明实施方案的某些方面。因为本领域技术人员可从以上学说和以下实施例中认识到，其他技术和方法可以满足权利要求并且可以在不脱离要求保护的发明的范围的情况下使用，所以实施例不旨在限制本发明。实际上，虽然已经参考其优选实施例具体展示和描述了本发明，但是本领域技术人员将理解，在不偏离所附权利要求所包含的本发明范围的情况下，可以在其中对形式和细节进行各种更改。

实施例

实施例1：从嗜热脂肪芽孢杆菌产生的热稳定的Gst RNAP

在该优选实施方案中，本发明人已经证明来自嗜热脂肪芽孢杆菌(Gst RNAP)的RNA聚合酶可以从分离自嗜热脂肪芽孢杆菌培养物的基因组DNA(gDNA)中克隆。在该实施方案中，约20ml的嗜热脂肪芽孢杆菌可以在过夜培养物中被培养，然后用离心机等沉淀。在这种情况下，可以使用市售的gDNA纯化试剂盒，例如Macherey-Nagel NuceloSpin MicrobialDNA Kit等，将gDNA分离。然后可以使用乙醇沉淀将gDNA浓缩。这通常可以通过向含有gDNA的溶液中加入盐和乙醇来实现，所述gDNA可以沉淀gDNA，其可以再次用离心机等沉淀，然后重悬于无DNase/RNase水中。

在该优选实施方案中，Gst RNAP的亚基可以通过特异性引物被克隆，所述特异性引物可以是基于每个基因的核苷酸序列所设计的。将亚基基因导入表达载体的含有特定限制性位点正向和反向引物可以被使用。在一个优选的实施方案中，可产生含有限制性位点以将亚基基因特异性地引入IBA StarGate表达载体的正向和反向引物。接下来，可以对主题引物和gDNA进行聚合酶链式反应(PCR)以扩增Gst RNAP亚基基因。在一个优选的实施方案中，PCR可以在标准MasterMix反应和50ng从嗜热脂肪芽孢杆菌分离的输入gDNA进行。

如上所述，可能是由于内部限制性位点的存在，Gst RNAP亚基被优选为优化的基因序列。参考表1所示，Gst RNAP亚基β'(opt)(序列4)可以以与上述类似的方式被鉴定和克隆。参考表1所示，转录因子，在这种情况下为RpoD(序列7)，可以在市售密码子优化的基因合成(Invitrogen)中使用，并直接克隆到表达载体中。

在一个实施方案中，经由PCR过程扩增的Gst RNAP亚基DNA序列可以被分离。在一个优选的实施方案中，PCR反应可以在1％溴化乙锭琼脂糖凝胶上被分析，并且亚基片段可以通过工业中已知的琼脂糖凝胶提取和/或PCR纯化方法被分离，方法如Macherey-NagelNucleoSpin Gel和PCR Clean-up等。然后可以这些基因片段被插入合适的递送载体中。例如，在一个实施方案中，先前产生的基因片段和选择的载体，在该实施方案中是市售的StarGate载体(参见图2)，可以用选择的限制酶消化，并通过例如3：1T4 DNA连接酶反应连接，该反应可以以商品名Thermo Fisher Scientific Rapid DNA Ligation Kit购得。

接下来，在该实施方案中，可以将连接的基因片段和质粒载体转化到选定的细菌菌株中。在一个优选的实施方案中，可以将连接的载体转化到细菌大肠杆菌中，特别是Top10感受态大肠杆菌，其可以配置为高转化率。在该实施方案中，Top10感受态大肠杆菌可以包括recA基因中的突变，其可以减少DNA重组促进质粒载体稳定性，并且可以进一步包括endA基因敲除，其可以降低非特异性内切核酸酶活性，从而改善质粒载体的产量和质量。

成功转化的细菌可以通过阳性基因检测PCR或其他已知方法等进行鉴定，随后可以培养以在生长的细菌菌落内产生质粒载体的多个拷贝。在一个优选的实施方案中，可以分离质粒载体DNA并将其转化到另一种选择的细菌菌株中。在一个优选的实施方案中，可以将制备的质粒载体DNA亚转化到大肠杆菌的高表达菌株中，例如BL21(DE3)，以获得最佳的蛋白质表达。

在一个实施方案中，一种或多种表达的RNAP亚基蛋白可以配置有分子标签。现在参考图3，RNAPβ'(opt)亚基可以配置为含有poly-His或His-6标签，其可以在以后用于蛋白质纯化。在该实施方案中，表达的His-标记的RNAPβ'(opt)亚基可以被纯化和检测，因为在适当的缓冲条件下，组氨酸残基串与几种类型的固定化金属离子，包括镍、钴和铜等结合：

在一个实施方案中，Gst RNAP可以被表达和纯化标记。在该优选实施方案中，His-6标记的β'(opt)亚基可以在大肠杆菌的BL2I(DE3)菌株中表达。在该实施方案中，大肠杆菌的BL21(DE3)菌株可以在NYZ培养基中培养，其中可以缺少可以诱导某些蛋白酶的乳糖，所述蛋白酶可能潜在地降解任何表达的蛋白质，降低总产率。蛋白质表达可以在细菌生长的特定光密度(OD)下被诱导。在优选的实施方案中，在OD 0.7情况下，可以通过在30-32℃下加入0.25mM异丙基-β-D-1-硫代半乳糖吡喃糖苷(IPTG)6-8小时来诱导蛋白质表达。EPTG是一种模拟异乳糖的分子试剂，一种乳糖代谢物，其触发质粒载体DNA中lac操纵子的转录，从而在lac操纵子的控制下诱导Gst RNAP亚基基因的蛋白质表达(参见图2a)。

在该优选实施方案中，BL12(DE3)培养物可以被裂解并制备裂解物并使其通过带金属离子的树脂。该裂解物可以通过带Ni的IMAC树脂，其中β'(opt)亚基上的His-6标签可以与树脂上固定的镍离子结合。在该实施方案中，通过添加SmM咪唑可以进一步除去非结合和非特异性结合蛋白，而β'(opt)亚基保持与树脂结合。

接下来，可能发生剩余Gst RNAP亚基的表达和分离。在一个优选的实施方案中，可以制备剩余Gst RNAP亚基的蛋白质表达菌株的组合裂解物，并与β'(opt)负载的树脂一起培育约2-3小时。通过加入5mM咪唑可以再次除去非结合和非特异性结合蛋白。表达的亚基可以组装形成通过β'(opt)亚基与树脂结合的RNAP复合物，然后可以通过加入300mM咪唑或其他已知方法洗脱组装的Gst RNAP。Gst RNAP的装配可以通过SDS-PAGE证明，并进一步在-20℃下以10mg/ml的浓度存储在体外转录/翻译相容的缓冲液条件中以备后用。此外，可以进行蛋白质活性测定以验证GSt RNAP复合物的组装和功能。mRNA转录物的存在表明了成功的Gst RNAP分离和组装。在一个实施方案中，可以进行25μl测定，包括：

-每种核糖核酸三磷酸核苷4mM(rNTP)；

-250ngDNA；

-2μI GstRNAP；

-20U RNase抑制剂；和

-5μI 5x反应缓冲液

实施例2：Gst AdK/TagPPK的分离和纯化

本发明的发明人演示了Gst AdK和TaqPPK的分离和纯化，该纯化的蛋白质用于如下所述的后续测定中。具体来说，是使用如本文一般描述的方法表达和分离Gst AdK和TaqPPK。参考图7，在4-20％SDS PAGE上分析纯化的重组蛋白。并用考马斯染料来将凝胶染色。

具体来说，纯化蛋白质的等分试样的纯度和正确大小是在SDS PAGE上进行分析。先前测试纯化的PPK蛋白(PPK)用作重组TaqPPK(PPK级分1-3)的批次纯化的额外大小标记。从纯化柱洗脱的所有级分都被证明是纯的并且显示出约74kDa的正确大小。纯化的Gst AdK不显示污染蛋白，并且具有约25kDa的正确大小。

实施例3：偶联的AdK/PPK ATP能量再生

本发明的发明人通过商业上可获得的ATP测定试验证明了本发明的偶联AdK/PPKATP再生能力。此处，本发明人使用Life technologies、D-Luciferin、A22066来验证ATP再生中Gst AdK和/或PPK蛋白(在该实施方案中其源自大肠杆菌)的功能性。

在该实施方案中，除了标准的200μI测定组分外，还可以将以下材料添加到测定中，其结果在图4-6中进行展示。

i)10μM ATP

ii)5μl Gst AdK

iii)源自大肠杆菌的5μI PPK(仅限示例)

iv)50μl多磷酸盐(1mg/ml储备液)

如图4-6所示，这些数据通常证明了本发明的AdK/PPK-PPi ATP能量再生系统的增强的ATP再生能力，以及其对单独的ATP的改进，以及传统的PEP/PK能量补充。具体而言，数据明确将以下物质分离：最低：ATP，中间：PEP/PK，以及上限：AdK/PPK-PPi。

实施例4：可变多磷酸盐浓度下的AdK/PPK能量再生

本发明人证明，通过商业上可获得的ATP测定分析，可以在可变的多磷酸盐浓度下实现偶联的Gst AdK/TaqPPK能量再生。具体而言，标准反应设置的PPi添加量不同。荧光素酶信号(RLU)依时间(分钟)进行测定。

如图8所示，确定保持反应平衡的一个浓度范围约为0.2-2mg/ml PPi。确定其他浓度范围以维持反应的平衡。具体地，确定这样的范围在0.1-4mg/ml PPi和/或0.5-0.6mg/ml和/或0.1-7mg/ml之间。如图8所示，在功能范围内发现了一些额外的ATP再生，包括但不限于约0-48mg/ml和更高。

在一个实施方案中，用于100荧光素酶测定的标准反应设置可包括：

同样，如图8所示，ATP再生持续超过五小时，此时测量停止。如图所示，本发明人证明PPi的更高或更低输入可能干扰Gst AdK/TaqPPK的稳定反应循环，并且虽然起作用，但不会导致最高水平的连续能量再生。当然，这样的范围是近似值而不是限制性的。

实施例5：AMP/PPi中解偶联的AdK/PPK ATP能量再生

本发明人证明Gst AdK/TaqPPK系统可以用廉价材料(例如PPi和AMP)作为源产生能量(ATP)。为了进一步证实这种新型ATP再生系统，本发明人将Gst AdK/TaqPPK的反应与荧光素酶测定分离。具体来说，本发明人首先使用纯化的Gst AdK和TaqPPK ATP蛋白从AMP/PPi中产生ATP，纯化该反应并使用样品进行荧光素酶测定-如上所述，其需要ATP发光。

如图9所示，本发明人表明，只有具有所有反应组分的标准装置为荧光素酶发光反应提供了足够的ATP。具有单个化合物/酶或其组合缺失的对照不能为成功的荧光素酶反应提供ATP。由于在该测定中ATP能量未再生，荧光素酶信号随时间下降，并在约7分钟后几乎达到背景，此时所有先前产生的ATP已经用完。

实施例6：通过Gst AdK/TaqPPK从AMP/PPi产生ATP能量及其再生

本发明人通过Gst AdK/TaqPPK能量再生系统的至少一个实施方案证明了AMP和PPI产生的ATP能量以及ATP再生。具体地，本发明人进行荧光素酶测定，用AMP代替通常需要的ATP，并添加能量再生系统组分，即Gst AdK，TaqPPK和PPi。在对照实验中，本发明人省略了每种组分及其组合。

Gst AdK/TaqPPK ATP能量再生系统的反应方案，在使用ATP的荧光素酶反应发光的背景下，由图10进行展示。在第一步中，ADP在PPK的不可逆反应中产生，AMP和PPi为反应来源。PPP和AdK可将ADP转化为ATP，两者均在可逆反应中，以保持AMP，ADP和ATP的平衡。而后荧光素酶使用ATP转化荧光素并发光。

如图11所示，标准能量再生系统组分在足够的ATP支持发光反应后显示出增加的荧光素酶信号(RLU)。信号随时间增加，直到大约7小时后达到最大值。缺少能量再生系统的控制反应不显示任何RLU。因此，本发明人证明，它是偶联的或协同的Gst AdK和TaqPPK酶，其从廉价的多磷酸盐和AMP作为底物来源产生能量(ATP)。本发明人能够测量发光反应约20小时(未示出)，进一步证明了发明人的新系统中可以进行稳健的能量再生。

实施例7：无细胞提取物制备

本发明人开发了一种基于转基因无生物(无GMO)、纯化大豆蛋白胨和无动物源材料(无ASM)酪蛋白胰蛋白胨的确定的无毒无害培养基，用于发酵遗传修饰的土芽孢杆菌菌株。该培养基不需要添加潜在有毒的金属盐或金属离子螯合剂(例如三腈乙酸等)，用于遗传修饰的土芽孢杆菌菌株的有效发酵。发酵温度范围可以设定并保持稳定在约52-55℃，但也可以考虑使用更大的温度范围。培养物可以保持在约7.2-7.6的pH，尽管也可以考虑使用更大的pH范围。可根据需要添加10mM的HEPES缓冲液。根据需要，可以添加无毒的硅氧烷基消泡剂用于受控发酵过程。

在发酵过程的不同阶段从生长培养物中分离核糖体RNA(rRNA)，并将其浓度确定为每个培养单元的核糖体浓度的量度。在新鲜培养基中生长6-7小时后可以观察到最大浓度的rRNA。在一些实施方案中，培养物可以在多个阶段以不断增加的体积生长，并且将最终长到7.5L的培养物接种至OD₆₀₀0.5,并在52-55℃和pH7.2-7.6及最终OD₆₀₀2.5-2.8的情况下生长6-8小时。

裂解物在-80℃下从收集的洗涤细胞(3x)中单次冷冻/解冻循环后制备。在冷冻/解冻循环后，将细胞重悬于含有RNase和蛋白酶抑制剂(1.25：1细胞与缓冲液比例)的HEPES缓冲盐水缓冲液中，并在2-4℃下使用已确认的方案进行少于5分钟(10秒“开”，30秒“关闭循环)的超声破碎。使用的裂解缓冲液CF-L1是无毒的、无害的。通过离心从裂解液中去除颗粒物(12,000g，4℃，10分钟)，并对无毒的储存缓冲液CF-St进行透析，CF-St的成分与反应缓冲液CF-1相似，但含有20％v/v甘油，不含蛋白酶抑制剂。通常不需要进行30分钟流动反应(在250rpm和30℃下在密闭管中振荡)和另外的离心(相同条件)以进一步澄清提取物。通过在mLB/CS培养基、NB、ISP、血脑琼脂的琼脂平板上划线裂解物样品和沉淀的碎片来确定潜在的存活细菌和/或细菌和真菌污染物，并在30℃和55℃下温育。细胞破裂率始终高于99.95％(<1幸存者/200μl重悬浮的碎片和<1菌落形成单位(CFU)/mL裂解物)。在一个实施方案中，7.5L发酵罐的加工可产生约30ml的提取物。当然，基于操作者的期望和/或需要，这些量/体积可以相应地按比例放大和/或缩小。

澄清的裂解物的总RNA提取可用于确定核糖体浓度。通过UV/Vis光谱测定裂解物的总蛋白质浓度，并且始终在150-160mg/mL的范围内。将裂解物的等分试样储存在-80℃并且可以稳定6个月或更长时间，如通过确定提取物的稳定性(无沉淀)和一致的Cas9-sfGFP构建体的体外转录/翻译速率所证明的(确定通过UV/Vis吸收和荧光测量)。裂解物和体外转录/翻译反应可维持在pH 7.8-8.0的近似范围内。CF反应条件的盐浓度可以变化。每个裂解物批次可以通过Cas9-sfGFP线性构建体的体外转录/翻译活性(产生具有一致折叠的较大蛋白质)和荧光素酶构建体(酶活性)来评估。

实施例8：利用遗传修饰的土芽孢杆菌菌株产生的无细胞提取物

如上所述，本发明人观察到σ因子RpoD(来自土芽孢杆菌)的过表达上调了大肠杆菌和土芽孢杆菌的细菌培养物中的细菌RNA聚合酶(RNAP)。产生重组遗传构建体以在Geobacilli中组成型表达RpoDx，为一种工程化形式。确定遗传构建体的功能可靠性和蛋白质表达水平，并使用将sfGFP构建体转化到相同的土芽孢杆菌菌株中，并通过制备的裂解物的510nm荧光读数进行监测。

本发明人进一步利用RliIII启动子与细菌RNAP一起进行体外转录。在一些实施方案中可以使用用于更严格的RpoD/启动子识别的重组修饰的RhIII启动子。或者，如果例如将T7 RNAP聚合酶添加到CF反应中，则可以使用T7启动子。在一些实施方案中，可以使用与来自噬菌体T7的天然RNAP相比具有一个或多个单点突变的专有遗传修饰的T7 RNAP(T7x)。这种点突变可以使双链DNA更快熔化，并增加RNAP与单链模板DNA的复合稳定性。在该实施方案中，与商业T7-RNAP相比，T7x可以引起显著的更少的不完整转录物并产生始终更高的mRNA浓度。本发明人已经证明，对于长度高达45,000个碱基的构建体，两种RNAP都具有可靠的，可重复的和可预测的结果。

实施例9：具有新型ATP能量再生系统的体外无细胞表达系统

如上所述，在某些实施方案中，本发明涉及无细胞表达系统，其中使用双酶系统从无机多磷酸盐再生细胞能量源ATP。在证明从大肠杆菌(ecPPK或PPK)克隆并产生的同源酶观察到多磷酸盐水解活性后，利用来自嗜热水生菌(TaqPPK)的热稳定多磷酸激酶(PPK)开发了该系统的一种酶。除了报道的从霍乱弧菌中分离的PPK活性外，TaqPPK和ecPPK优选从AMP和水解的无机多磷酸盐(iPPi)产生ADP。对于第二个酶促步骤，然后通过热稳定的腺苷激酶(AdK)重排两个ADP分子以形成一个单位的ATP和AMP。

该系统已经证明其可以有效地运行至少32小时，这可以通过在将荧光素酶添加到10nM AMP，150μg/荧光素，1mg/ml iPPi和催化量的酶的溶液中后测量荧光素发光来确定。Gst AdK/TaqPPK对的总酶转换数被确定至少为300。该酶环可以保持活性至少72小时，且至多1周或更长。在一个实施方案中，进料溶液中的ATP浓度可以保持在稳定的1.5mM ATP。本发明人进一步证明TaqPPK可具有约3,000的最大总转换数，因此，允许在本发明的无细胞表达系统中进一步降低TaqPPK的蛋白质浓度。这可以防止或最小化多磷酸盐的随机水解，其通过将焦磷酸盐积聚到无细胞反应而引起反馈抑制，同时产生/维持所需水平的ATP。

这种新的能量再生特性是重要的，因为目前基于E.coli的无细胞系统主要依赖于肌酸磷酸/肌酸激酶或磷酸烯醇丙酮酸(PEP)和丙酮酸激酶(PK)作为主要的能量再生系统，尽管已经确定PK具有低个位数的总转换数，副产物丙酮酸是翻译反应的抑制剂。以这种方式，本发明不仅说明了这种传统的无细胞表达系统，而且实际上代表了本领域已知的传统无细胞表达系统的可证明的改进。

本发明人的无细胞表达系统的氧化还原电位可以通过山梨糖醇脱氢酶(SDH)稳定。在一个实施方案中，该SDH可以是热稳定的(tSDH)(这种t指定通常适用于本文提及的其他分子)。使用340nm吸收NADH与纯化蛋白质样品的酶促测定表明，与逆反应相比，山梨糖醇和NAD/NAD(P)与果糖和NADH/NAD(P)H的前向转变快8倍。本发明人从嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus)克隆并产生了这种遗传修饰的热稳定酶，其也被优化用于在大肠杆菌中表达。如前所述的大肠杆菌(Gst SDH)，其可以与200mM山梨糖醇一起加入到进料溶液中。反应产物还通过糖酵解提供额外的能量资源，并且不会在反应混合物中积累。

在某些实施方案中，无细胞表达系统可以包括无细胞反应体积的5ml的初始体积，和用于进料溶液的80ml，以确保容器中的连续交换和均相反应条件。可以进一步考虑0.5ml和2升反应体积之间和更高反应体积的无细胞表达系统。

实施例10：建立无细胞表达系统反应

在一个实施方案中，可以在进料室和反应室中用TRIS-乙酸盐缓冲液(CF-1)将CF系统调节并稳定在pH7.9-8.0的范围内。反应容器中裂解物的最终浓度可以在100-110mg/ml总蛋白质之间，而模板DNA(或者也作为预运行RNA/RNAP反应一起)与辅因子，氨基酸和核苷酸一起加入裂解物。进料溶液含有相同浓度的核苷酸和所有天然氨基酸。辅因子、山梨糖醇和上述酶也被加入进去。下面提供了详细的材料清单，通常可称为无细胞反应组分。另外，可以包括双酶ATP再生系统的一般组分。一个优选实施方案中的这些组分可包括但不限于一定量的Gst AdK，一定量的TaqPPK，和/或一定量的PPi，和/或一定量的AMP。另外的实施方案可包括一定量的Gst SDH和山梨糖醇。

该示例性无细胞反应可在约35-37℃的培养箱中进行，而反应器在约-300rpm下搅拌16小时。在某些实施方案中，组合的体外转录/翻译反应的该反应设置或反应混合物可适于产生靶蛋白超过3天。在一个示例性实施方案中，本发明的无细胞表达系统可提供产生蛋白质超过36小时的稳定性。

在具体实施方案中，无细胞反应组分可包括但不限于：

-氨基酸

-多磷酸盐

-三乙酸盐

-Mg(OAC)₂

-K⁺-谷氨酸盐

-氨基乙酸

-氯化钠

-氯化钾

-氯化镁

-DTT

-辛基B-糖苷

-NAD(在系统中转换为NADH)

-NADP(在系统中转化为NADPH)

-山梨糖醇

-FADH(由NADH/FADH细胞过程再生)

-ATP

-各种GTP，UTP，CTP

-CoA

-PLP

-SAM

在一个具体实施方案中，无细胞反应组分可包括但不限于：

-每种天然氨基2mM

-1mg/ml多磷酸盐

-5mM三乙酸盐

-4mM Mg(OAc)₂

-12mM K⁺-谷氨酸盐

-1mM氨基乙酸酯

-100mM氯化钠

-10mM氯化钾

-5mM氯化镁

-0.1毫升DTT

-0.2％辛基-b-糖苷

-0.8mM NAD(在系统中转换为NADH)

-0.4mM NADP(在系统中转换为NADPH)

-200mM山梨糖醇

-0.5mM FADH(通过NADH/FADH细胞过程再生)

-1.5mM ATP

-每种1mM GTP，UTP，CTP

-1mM CoA

-2mM PLP

-0.2mM SAM

任何无细胞反应组分的所有量、浓度、体积和比例仅是示例性的，因为它们可以基于待产生的反应体积、持续时间或表达产物以及其他变量而变化。无细胞反应组分可以进一步包括但不限于转录/翻译机制所必需的所有其他组分，如氨基酸、核苷酸、提供能量的代谢组分和合成所必需的组分，无论是否由细胞提取物提供，和/或添加到细胞提取物中。无细胞反应组分可以进一步包括对可以使用的细菌、藻类、微藻古菌、真菌和/或冷冻菌的菌株特异的量的tRNA。例如，在上述实施方案中，可以加入天然土芽孢杆菌tRNA。另外，无细胞反应组分可以进一步包括可以克服由稀有密码子引起的翻译停滞的tRNA质量。例如，在一些实施方案中，来自大肠杆菌mre600的tRNA可以包括在无细胞反应中以克服由于稀有密码子引起的翻译停滞。

实施例11：通过体外无细胞表达高效产生破伤风梭菌E88破伤风神经毒素

作为示例性实施方案，本发明人利用如本文所述的利用偶联的Gst AdK/TaqPPKATP能量再生的本发明的无细胞表达系统的至少一个实施方案，证明了Tentoxilysin(破伤风神经毒素)的体外表达。

Tentoxilysin(TetNT)天然产生为150kDa的单链蛋白质。TetNT在内肽酶基序上，M232HELIHVL239，与Zn²⁺阳离子配位，其中能够在A457和S458之间进行全长多肽的蛋白水解切割。两个半胱氨酸残基(C439和C467)的选择性氧化在两条链之间形成二硫键，并允许活性破伤风毒素蛋白复合物的形成与短链，M1-A457，和长链，S458-A 1319。然后该蛋白质由破伤风梭菌的天然产生菌株选择性地输出。

TetNT是内化的Zn²⁺依赖性内肽酶，其水解通过毒素/神经节苷脂受体复合物形成，Gln76和Phe77之间的突触小泡蛋白-2。突触小泡上的突触小泡蛋白-2受体的水解阻止了抑制性神经递质γ-氨基丁酸(GABA)释放到突触间隙中。除了其他症状之外，这最终导致的严重肌肉痉挛为病人所述的破伤风症状。TetX基因定位于破伤风梭菌E88基因组中并且在大肠杆菌蛋白质表达质粒CTC_p60上已被进一步编码。基因产物已被克隆并表达，作为异源蛋白质以确认蛋白质活性并进行高分辨率结构蛋白质研究。TetNT的潜在N-乙酰基-b-神经氨酸修饰活性为本领域所知晓的。

根据FDA的规定，目前适用于人类疫苗接种的tetX类毒素来自活性破伤风梭菌培养。通过加入硫酸铝和硫酸铵引起的絮凝从活性培养物中除去完全折叠和输出的毒素。随后通过添加甲醛使提取的毒素失活以获得适于接种疫苗的类毒素。FDA建议但不要求采用SDS-PAGE、FPLC或HPLC配置文件和纯化形式的质量控制措施。

目前已知的已建立的分离和制备方案存在风险。这些风险已得到FDA的承认，该机构仅建议7岁及以上儿童及成人接种破伤风疫苗。接种疫苗可使感染破伤风梭菌的风险降低5％。基于发酵生产Tet类毒素的最大挑战是控制甲醛浓度以确保毒素的完全失活和最终产品中可导致40％的所有疫苗接种无效类毒素浓度的控制。

作为示例性实施方案，这些挑战和生产限制可以通过用本发明的基于体外转录/翻译的生产方法代替发酵过程来解决。孢子和任何其他菌落形成体的遗留物不存在，并确保活性药物成分(API)的完全无菌。在整个过程中监测总蛋白质浓度，并且可以通过标准实验室方法控制最终产物。

本发明人生成了TetNT表达的遗传构建体。在该实施方案中，遗传构建体被设计用于基因合成，具体来说，遗传构建体被作为线性PCR模板进料到体外转录/翻译或无细胞表达反应中。在一些实施方案中，在本发明的无细胞表达系统中使用线性DNA可能是优选的，因为它不能转移、不能重新组合、复制或转染。线性遗传构建体可包括以下基本构型：((启动子)-(RBS)-(起始)(表达产物裂解位点-检测标签+纯化标签)(停止)。在一个具体实施方案中，该配置可包括:(启动子)-(RBS)-(起始)(TetNT TEV mCherry H6)(停止)。

在该实施方案中，启动子可包括：RhIII启动子序列(序列18)，或者T7启动子序列(序列19)。RBS(核糖体结合位点)可以衍生自与土芽孢杆菌序列(序列20)一致的T7基因噬菌体(当然，除了这些示例性实施例之外，可以使用许多启动子)。重组TetNT基因可包括序列21。在该重组TetNT基因中，终止序列被去除。最后，TEVsite、mCherry、His6可包括序列22，并再次从mCherry移除停止。应当注意的是，虽然作为单独的序列提供，但遗传构建体可以作为一般描述的DNA的单个线性PCR片段呈现。

在这种情况下，出于安全性考虑，在优选的实施方案中，编码全长破伤风毒素的DNA基因合成可以作为两个单独的环状构建体进行，其将在实验室中重组为单个质粒用于扩增。例如，编码TetNT轻链(序列12)的第一构建体具有自催化蛋白酶位点(序列13)且能形成二硫键的半胱氨酸。第二种构建体将编码TetNT重链(序列14)，其含有部分整合的TEV位点(序列15)和mCherry-His6(序列16)。虽然重组蛋白质作为单独的遗传构建体和氨基酸序列呈现，但是这样的序列可以是单个构建体的一部分，其最终产生单个线性多肽(序列17)，其可以对应于多核苷酸序列，作为PCR扩增的线性DNA构建体。另外的实施方案可包括可形成单个线性多肽的不同构建体。

本发明人通过无细胞蛋白质合成进一步利用先前描述的双酶ATP再生系统证明了全长150kDa前毒素的表达，且在该具体实施方案中，通过细胞表达全长150kDa原毒素。根据所述条件，无细胞蛋白质合成可以在5ml反应器中进行。反应进程可以通过标记的mCherry的日光荧光监测，其具有587nm的激发波长和红移荧光。在没有观察到蛋白质浓度的进一步增加之后，反应容器的内容物将被转移到50ml反应管中。获得的反应时间和蛋白质浓度可以连续测定。

含有乳糖、200mM NaCl、1mM DTT的10mM HEPES的pH8.0缓冲液可以被加入，以将反应混合物稀释10倍。向该溶液中加入1-2mL的Ni-IDA树脂，并在约20-25℃下在有限的搅拌下温育1小时。该树脂的结合能力可足以达到60mg His6标记的蛋白质。在His6标记的原毒素与树脂结合后，树脂被收集，并除去上清液洗涤缓冲液。荧光将立即证实上清液中不存在TetNT前毒素。

收集的带有蛋白质的树脂可以用pH8.0的含有乳糖、200mM NaCl的50ml HEPES缓冲液洗涤，并在环境温度下在没有还原剂的情况下孵育。在暴露于各种浓度的O₂(从2％到大气压)和不同时间且不存在还原剂的情况下，自发折叠/重折叠及氧化天然二硫键的形成将在TetNT的长链内和TetNT的长链和短链之间引发。

在折叠/重折叠之后，ZnCl₂被加入到最终浓度为2mM的蛋白质溶液中。这激活内部自身蛋白水解活性以切割树脂吸附的TetNT的长链和短链之间的肽键。最初可以使用在20-25℃下约2小时的温育时间。到目前为止，毒素是惰性的，因为具有mCherry和His6标签的工程化修饰将由于其天然靶标的识别和结合位点的空间位阻而阻止其活性。此外，树脂的珠粒尺寸显著增加了总粒径，并降低了蛋白质被雾化或吸收的风险。易于检测的mCherry荧光有助于跟踪蛋白质并防止在此阶段不必要的暴露或意外处置潜在有毒物质。缓冲液可以被交换以除去所有未形成二硫键的不完全折叠的毒素片段，并且其从溶液中除去ZnCl₂。

纯化的His6标记的TEV蛋白酶可以被加入到反应混合物中，且样品在约20-25℃下温育数小时。TEV蛋白酶也可以被吸附到树脂上并保持结合，而活化的破伤风毒素通过裂解TEV蛋白酶位点从树脂中释放。通过淬灭mCherry荧光，该过程可以被监测，因为TEV位点的切割与mCherry的缺失N-末端重叠，并且所得到的荧光蛋白的部分解折叠。在没有检测到荧光之后，仍然带有未折叠的mCherry-His6和TEV-His6蛋白酶的树脂被收集，并且上清液应该在无菌和所需的缓冲液中仅含有纯TetNT。

本发明人可以用专有的抗Tet Fab测试上清液，以确认ELISA和蛋白质印迹测定中的正确蛋白质折叠，而SDS-PAGE和FPLC图谱则用于确认样品的纯度。在确定蛋白质浓度后，所需量的甲醛可以被加入以获得灭活的类毒素。可以进一步进行动物试验以确定有效剂量以确认最终样品中正确折叠和活性蛋白质的程度。当然，如上所述，该协议本质上是示例性的。本领域普通技术人员将认识到，可以类似地使用这样的方案，而无需过度实验来产生来自其他梭菌属以及其他感兴趣的蛋白质的类似蛋白质。

参考文献：

本文引用了以下参考文献：

[1]Carlson,Erik D.et al."Cell-Free Protein Synthesis:ApplicationsCome of Age."Biotechnology advances 30.5(2012):1185-1194.PMC.Web.1Jan.2018.

序列表

本申请包含序列表，该序列表已经以ASCII格式电子提交，并且被本文引用。在某些情况下，本说明书中提供了氨基酸的单字母名称，而以电子提交的格式提供了三字母名称。美国临时申请号62/440,975中公开的所有先前序列数据在此引入作为参考。

表1：序列表

序列1

SGSSMIEIEKPKIETVELSEDAKYGKFVVEPLERGYGTTLGNSLRRILLSSLPGAAVTSVQIDGVLHEFSTIDGVVEDVTAIILNIKKLALKIYSDEEKTLEIDVQGEGVVTAADITHDSDVEILNPDLHIATLAEGGRLRMRMTAKRGRGYVPAEANKREDQPIGVIPIDSIYTPVSRVSYQVENTRVGQVTDYDKLTIDVWTDGSIGPKEAISLGAKILTEHLNIFVGLTDEAQNAEIMVEKEDDQKEKVLEMTIEELDLSVRSYNCLKRAGINTVQELTQKTEEDMMKVRNLGRKSLEEVKAKLAELGLSLRKDDGRRAA

序列2

SGSSMTGRLVQYGRHRQRRSYARISEVLELPNLIEIQTSSYQWFLDEGLREMFREISPIEDFSGNLSLEFIDYSLGEPKYTVEEAKERDVTYAAPLRVKVRLINKETGEVKEQDVFMGDFPLMTETGTFIINGAERVIVSRLVRSPSVYYSDKVDKNGKRGYSATVIPNRGAWLEYETDAKDVVYVRIDRTRKLPVTVLLRALGFSSDQEIIDLLGDNEYLRNTLEKDNTDSTEKALIEIYERLRPGEPPTLENAKNLLASRFFDPKRYDLASVGRYKINKKLHIKNRLFNQRLAETIIDPETKEVIAEAGAMIDRRTLNRLLPYLEKGVGLQTYRPAEGVVDGDISVQTIKIYAPNDPDGEKVINVIGNGFIAEDVKHITPADIIASISYFFNLLHGVGDTDDIDHLGNRRLRSVGELLQNQFRIGLSRMERVVRERMSIQDTNTITPQQLINIRPVIAAIKEFFGSSQLSQFMDQTNPLAELTHKRRLSALGPGGLTRERAGFEVRDVHYSHYGRMCPIETPEGPNIGLINSLSTYAKVNKFGFIETPYRRVDPETGRVTDQIDYLTADEEDNYVVAQANVPLAEDGTFLEENVVARFRGENIVVKRDRVDYMDVSPKQVVSAATACIPFLENDDSNRALMGANMQRQAVPLLEPEAPIVGTGMEYVSAKDSGAAVICKHRGIVERVEAKEIWVRRLIEVDGKEVKGDLDKYRLLKFVRSNQGTCYNQRPIVKKGDIVEKGEILADGPSMDKGELALGRNVLVAFMTWDGYNYEDAIIMSERLVKEDVYTSIHIEEYEAESRDTKLGPEEITRDIPNVGEDALKNLDERGIVRIGAEVKDGDLLVGKVTPKGMTELTAEERLLHAIFGEKAREVRDTSLRVPHGGGIVLDVKVFNREDGDELPPGVNQLVRVYIVQKRKISEGDKMAGRHGNKGVISRILPEEDMPFLPDGTPIDIMLNPLGVPSRMNIGQVFELHLGMAAKKLGLHIASPVFDGATEEDVWNILEEAGLARDAKTVLYDGRTGEPFDNRVSVGIMYMIKLAHMVDDKLHARSTGPYSLVTQQPLGGKAQFGGQRFGEMEVWALEAYGAAYTLQEILTVKSDDVVGRVKTYEAIVKGENIPEPGVPESFKVLIKELQSLGMDVTILTSDEQEVNMENFDDDDDHAPDAIMVDVKPAEREEAGEEKDAVTKEGRRAA

序列3

SGSSMLDVNKFEYMKIGLASPEKIRSWSYGEVKKPETINYRTLKPEKDGLFERIFGPTKDWECHCGKYKRVRYKGVVCDRCGVEVTRSKVRRERMGHIELAAPVSHIWYFKGIPSRMGLVLDMSPRALEEVIYFASYVVTDPGDTPLEKKQLLSEKEYRAYREKYGQSFQASMGAEAIKKLLQDIDLDKEVAALKEELKTAQGQRRARIIKRLEVLEAFRSSGNDPAWMVLDVLPVIPPELRPMVQLDGGRFATSDLNDLYRRVINRNNRLKRLLDLGAPNIIVQNEKRMLQEAVDALIDNGRRGRPVTGPGNRPLKSLSHMLKGKKGRFRQNLLGKRVDYSGRSVIVVGPNLKMYQCGLPKEMALELFKPFVMKELVERGLAHNIKSAKRKIERVHPEVWDVLEDVIKEHPVLLNRAPTLHRLGIQAFEPTLVEGRAIRLHPLVCTAYNADFDGDQMAVHVPLSAEAQAEARLLMLAAQNILNPKDGKPVVTPSQDMVLGNYYLTMEREGAIGEGMVFKDTDEALLAYHNGYVHLHSRIAIHAGSLKNETFTEEQNNKLLLTTVGKLIFNEILPNSFPYINEPTTENIEGRTPDKYFLDKGVNVREEIRKRELVPPFKKKVLGQIIAEVFKRFKITETSKMLDRMKDLGFQYSTKAGITIGVADIVVLPEKQEILDEAQAKVDTVLKQFRRGLITDEERYERVISIWSAAKDKIQDRLMKSLDKRNPIFMMSDSGARGNASNFTQLAGMRGLMANPAGRIIELPIKSSFREGLTVLEYFISTHGARKGLADTALKTADSGYLTRRLVDVAQDVIVREEDCGTDRGILARALTDGTEVVVKLEERLVGRYAHKTVRHPETGEVIVRKDEMITEDIANEIIKAGITEVWIRSVFACNTRHGVCKKCYGRNMATGMDVEVGEAVGIIAAQSIGEPGTQLTMRTFHTGGVAGDDITQGLPRVQELFEARNPKGQAVISEIDGTVISINETRDNQYEIVVQSEVETRTYVAPYNARLKVEEGQRVERGQELTEGSVDPKQLLRVRDITSVQEYLLREVQKVYRMQGVEISDKHIEVMVRQMLRKVRVIDAGDTDVLPGTLLDVHQFTDVNAKALREGKRPATARQVLLGITKASLETDSFLSAASFQETTRVLTDAAIKGKRDELLGLKENVIIGKLVPAGTGMARYRKVKPAVKKETAGGTVSSKGRRAA

序列4

SGSSMLDVNKFEYMKIGLASPEKIRSWSYGEVKKPETINYRTLKPEKDGLFCERIFGPTKDWECHCGKYKRVRYKGVVCDRCGVEVTRSKVRRERMGHIELAAPVSHIWYFKGIPSRMGLVLDMSPRALEEVIYFASYVVTDPGDTPLEKKQLLSEKEYRAYREKYGQSFQASMGAEAIKKLLQDIDLDKEVAALKEELKTAQGQRRARIIKRLEVLEAFRSSGNDPAWMVLDVLPVIPPELRPMVQLDGGRFATSDLNDLYRRVINRNNRLKRLLDLGAPNIIVQNEKRMLQEAVDALIDNGRRGRPVTGPGNRPLKSLSHMLKGKKGRFRQNLLGKRVDYSGRSVIVVGPNLKMYQCGLPKEMALELFKPFVMKELVERGLAHNIKSAKRKIERVHPEVWDVLEDVIKEHPVLNRAPTLHRLGIQAFEPTLVEGRAIRLHPLVCTAYNADFDGDQMAVHVPLSAEAQAEARLLMLAAQNILNPKDGKPVVTPSQDMVLGNYYLTMEREGAIGEGMVFKDTDEALLAYHNGYVHLHSRIAIHAGSLKNETFTEEQNNKLLLTTVGKLIFNEILPNSFPYINEPTTENIEGRTPDKYFLDKGVNVREEIRKRELVPPFKKKVLGQIIAEVFKRFKITETSKMLDRMKDLGFQYSTKAGITIGVADIVVLPEKQEILDEAQAKVDTVLKQFRRGLITDEERYERVISIWSAAKDKIQDRLMKSLDKRNPIFMMSDSGARGNASNFTQLAGMRGLMANPAGRIIELPIKSSFREGLTVLEYFISTHGARKGLADTALKTADSGYLTRRLVDVAQDVIVREEDCGTDRGILARALTDGTEVVVKLEERLVGRYAHKTVRHPETGEVIVRKDEMITEDIANEIIKAGITEVWIRSVFACNTRHGVCKKCYGRNMATGMDVEVGEAVGIIAAQSIGEPGTQLTMRTFHTGGVAGDDITQGLPRVQELFEARNPKGQAVISEIDGTVISINETRDNQYEIVVQSEVETRTYVAPYNARLKVEEGQRVERGQELTEGSVDPKQLLRVRDITSVQEYLLREVQKVYRMQGVEISDKHIEVMVRQMLRKVRVIDAGDTDVLPGTLLDVHQFTDVNAKALREGKRPATARQVLLGITKASLETDSFLSAASFQETTRVLTDAAIKGKRDELLGLKENVIIGKLVPAGTGMARYRKVKPAVKKETAGGTVSSKGRRAA

序列5

SGSSMSLQQQYSPEELQEMSFVELANLILLDKREALPFDQLVREAAALAGISEEEMEARLAQYYTDLNIDGRFICVGENVWGRAWYPFDQTEDETVTIVKPKKKKKALDDEYDEYDELLEDEDLDYDDLDEYDEEELELDEDELLEDEEFDLDEDVAFDDDILGDEEFELGDAPLDEELDLEEPEEDEGRRAA

序列6

SGSSMLYPSIDLLMQKVDSKYKLVTVVAKRARELQDGAELMVKKPVSKKFVGQALEEIAGDKVELVEEEKGRRAA

序列7

MHHHHHHGKPIPNPLLGLDSTENLYFQGIDPFTMAEKPAQSKQAEAAGESLEQVKEQLAELGKKRGILTYEEIAERLSGFDLDSDQMDEYYEYLAEQGIEVISESDLEADPDIDDLAKEEEFDLNDLSVPPGVKINDPVRMYLKEIGRVPLLSAEEEIELAKRIEQGDEEAKRRLTEANLRLVVSIAKRYVGRGMLFLDLIQEGNMGLIKAVEKFDYRKGYKFSTYATWWIRQAITRAIADQARTIRIPVHMVETINKLIRVQRQLLQDLGREPTPEEIAEEMDLTPEKVREILKIAQEPVSLETPIGEEDDSHLGDFIEDQDATSPSEHAAYELLKEQLEDVLDTLTDREENVLRLRFGLDDGRTRTLEEVGKVFGVTRERIRQIEAKALRKLRHPSRSKRLKDFLE

序列8

SGSSMNLVLMGLPGAGKGTQAGKIVEAYGIPHISTGDMFRAAIKEGTPLGLQAKQYMDRGDLVPDELQAKQYMDRGDLVPDEGFLLDGFPRTVAQAEALETLLSEIGRKLDYVIHIDVRQEVLMERLTGRRICRNCGATYHLVFHPPAKPGVCDKCGGDLYQRPDNEATVANRLEVNMKQMKLLLDFYEQKGYLRHINGEQEMEKVFADICEVLGGLARGRRAA

序列9

SGSSMGQEKLYIEKELSWLSFNERVLQEAADKSNPLIERMRFLGIYSNNLDEFYKVRFAELKRRIIISEEQGSNSHSRHLLGKIQSRVLKADQEFDGLYNELLLEMARNQIFLINERQLSVNQQNWLRHYFKQYLRQHITPILINPDTDLVQFLKDDYTYLAVEIIRGDTIRYALLEIPSDKVPRFVNLPPEAPRRRKPMILLDNILRYCLDDIFKGFFDYDALNAYSMKMTRDAEYDLVHEMEASLMELMSSSLKQRLTAEPVRFVYQRDMPNALVEVLREKLTISRYDSIVPGGRYHNFKDFINFPNVGKANLVNKPLPRLRHIWFDKAQFRNGFDAIRERDVLLYYPYHTFEHVLELLRQASFDPSVLAIKINIYRVAKDSRIIDSMIHAAHNGKKVTVVVELQARFDEEANIHWAKRLTEAGVHVIFSAPGLKIHAKLFLISRKENGEVVRYAHIGTGNFNEKTARLYTDYSLLTADARITNEVRRVFNFIENPYRPVTFDYLMVSPQNSRRLLYEMVDREIANAQQGLPSGITLKLNNLVDKGLVDRLYAASSSGVPVNLLVRGMCSLIPNLEGISDNIRAISIVDRYLEHDRVYIFENGGDKKVYLSSADWMTRNIDYRIEVATPLLDPRLKQRVLDIIDILFSDTVKARYIDKELSNRYVPRGNRRKVRAQLAIYDYIKSLEQPEGRRAA

序列10

MRLLPEESWLQFNRRVLRQSERPDFPLLERMRFLAIWNRNLDEFFAARIAKPFLKHRGSAHLRLLKEAEDQARLAEGRYRALLAEAAPHLKILEPEELDDLDWLYFRVFLAEVVVPKTDLIAWEAAKEASHGALYFASEDHLVRLPQDLPRLLKVPGREGTYVRLGALMRARSDLFLPRESPLYEFRVLRLLESERARADWDELAQALEGRQEGLSTLLVAERGFPKGWLEGLQEALGLLPEEVILLSPPLNLTLVETLVAEGPSRWRFPPLEPKRPRAFMKNPLKRLQEKDLVLYHPFEDYAALERFAEAALSEEVEEVYATLYRIGEANPLAEALIQAARAGKRVHVLLEPRARFDELLNLSWYLRFLRAGVAVLPLSERKVHAKALLLLTQKGGYAHLGTGNYNPQNGRQYTDFSLFTARKEVVMEVAEFFRALQEGRTPRLNLLKTGEAIQELLLEHIRAESHPKGRILLKCNHLTDPALLEALARAADKGARVDLIVRSTLTLLHPRFRARSLVGRFLEHARVAAFYQGGRWALYLTSADLMPRNFQNRFELLFPVLDKEGKAKVLEVLKRQLKDDRNAFLLSPKGETPLWGGRHDAQRILAW

序列11

MHHHHHHGKPIPNPLLGLDSTENLYFQGIDPFTMRLLPEESWLQFNRRVLRQSERPDFPLLERMRFLAIWNRNLDEFFAARIAKPFLKHRGSEAHLRLLKEAEDQARLAEGRYRALLAEAAPHLKILEPEELDDLDWLYFRVFLAEVVVPKTDLIAWEAAKEASHGALYFASEDHLVRLPQDLPRLLKVPGREGTYVRLGALMRARSDLFLPRESPLYEFRVLRLLESERARADWDELAQALEGRQEGLSTLLVAERGFPKGWLEGLQEALGLLPEEVILLSPPLNLTLVETLVAEGPSRWRFPPLEPKRPRAFMKNPLKRLQEKDLVLYHPFEDYAALERFAEAALSEEVEEVYATLYRIGEANPLAEALIQAARAGKRVHVLLEPRARFDELLNLSWYLRFLRAGVAVLPLSERKVHAKALLLLTQKGGYAHLGTGNYNPQNGRQYTDFSLFTARKEVVMEVAEFFRALQEGRTPRLNLLKTGEAIQELLLEHIRAESHPKGRILLKCNHLTDPALLEALARAADKGARVDLIVRSTLTLLHPRFRARSLVGRFLEHARVAAFYQGGRWALYLTSADLMPRNFQNRFELLFPVLDKEGKAKVLEVLKRQLKDDRNAFLLSPKGETPLWGGRHDAQRIAW

序列12

MPITINNFRYSDPVNNDTIIMMEPPYCKGLDIYYKAFKITDRIWIVPERYEFGTKPEDFNPPSSLIEGASEYYDPNYLRTDSDKDRFLQTMVKLFNRIKNNVAGEALLDKIINAIPYLGNSYSLLDKFDTNSNSVSFNLLEQDPSGATTKSAMLTNLIIFGPGPVLNKNEVRGIVLRVDNKNYFPCRDGFGSIMQMAFCPEYVPTFDNVIENITSLTIGKSKYFQDPALLLMHELIHVLHGLYGMQVSSHEIIPSKQEIYMQHTYPISAEELFTFGGQDANLISIDIKNDLYEKTLNDYKAIANKLSQVTSCNDPNIDIDSYKQIYQQKYQFDKDSNGQYIVNEDKFQILYNSIMYGFTEIELGKKFNIKTRLSYFSMNHDPVKIPNLLDDTIYNDTEGFNIESKDLKSEYKGQNMRVNTNAFRNVDGSGLVSKLIGLCKKIIPPTNIRENLYNRTA

序列13

MHELIHVL

序列14

SLTDLGGELCIKIKNEDLTFIAEKNSFSEEPFQDEIVSYNTKNKPLNFNYSLDKIIVDYNLQSKITLPNDRTTPVTKGIPYAPEYKSNAASTIEIHNIDDNTIYQYLYAQKSPTTLQRITMTNSVDDALINSTKIYSYFPSVISKVNQGAQGILFLQWVRDIIDDFTNESSQKTTIDKISDVSTIVPYIGPALNIVKQGYEGNFIGALETTGVVLLLEYIPEITLPVIAALSIAESSTQKEKIIKTIDNFLEKRYEKWIEVYKLVKAKWLGTVNTQFQKRSYQMYRSLEYQVDAIKKIIDYEYKIYSGPDKEQIADEINNLKNKLEEKANKAMININIFMRESSRSFLVNQMINEAKKQLLEFDTQSKNILMQYIKANSKFIGITELKKLESKINKVFSTPIPFSYSKNLDCWVDNEEDIDVILKKSTILNLDINNDIISDISGFNSSVITYPDAQLVPGINGKAIHLVNNESSEVIVHKAMDIEYNDMFNNFTVSFWLRVPKVSASHLEQYGTNEYSIISSMKKHSLSIGSGWSVSLKGNNLIWTLKDSAGEVRQITFRDLPDKFNAYLANKWVFITITNDRLSSANLYINGVLMGSAEITGLGAIREDNNITLKLDRCNNNNQYVSIDKFRIFCKALNPKEIEKLYTSYLSITFLRDFWGNPLRYDTEYYLIPVASSSKDVQLKNITDYMYLTNAPSYTNGKLNIYYRRLYNGLKFIIKRYTPNNEIDSFVKSGDFIKLYVSYNNNEHIVGYPKDGNAFNNLDRILRVGYNAPGIPLYKKMEAVKLRDLKTYSVQLKLYDDKNASLGLVGTHNGQIGNDPNRDILIASNWYFNHLKDKILGCDWYFVPTDEGWTNDGSA

序列15

ENLYFQS

序列16

GSGSNGSSGSVSMAIIKEFMRFKVHMEGSVNGHEFEIEGEGEGRPYEGTQTAKLKVTKGGPLPFAWDILSPQFMYGSKAYVKHPADIPDYLKLSFPEGFKWERVMNFEDGGVVTVTQDSSLQDGEFIYKVKLRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIKQRLKLKDGGHYDAEVKTTYKAKKPVQLPGAYNVNIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYRSGGGHHHHHHGDL

序列17

MPITINNFRYSDPVNNDTIIMMEPPYCKGLDIYYKAFKITDRIWIVPERYEFGTKPEDFNPPSSLIEGASEYYDPNYLRTDSDKDRFLQTMVKLFNRIKNNVAGEALLDKIINAIPYLGNSYSLLDKFDTNSNSVSFNLLEQDPSGATTKSAMLTNLIIFGPGPVLNKNEVRGIVLRVDNKNYFPCRDGFGSIMQMAFCPEYVPTFDNVIENITSLTIGKSKYFQDPALLLMHELIHVLHGLYGMQVSSHEIIPSKQEIYMQHTYPISAEELFTFGGQDANLISIDIKNDLYEKTLNDYKAIANKLSQVTSCNDPNIDIDSYKQIYQQKYQFDKDSNGQYIVNEDKFQILYNSIMYGFTEIELGKKFNIKTRLSYFSMNHDPVKIPNLLDDTIYNDTEGFNIESKDLKSEYKGQNMRVNTNAFRNVDGSGLVSKLIGLCKKIIPPTNIRENLYNRTASLTDLGGELCIKIKNEDLTFIAEKNSFSEEPFQDEIVSYNTKNKPLNFNYSLDKIIVDYNLQSKITLPNDRTTPVTKGIPYAPEYKSNAASTIEIHNIDDNTIYQYLYAQKSPTTLQRITMTNSVDDALINSTKIYSYFPSVISKVNQGAQGILFLQWVRDIIDDFTNESSQKTTIDKISDVSTIVPYIGPALNIVKQGYEGNFIGALETTGVVLLLEYIPEITLPVIAALSIAESSTQKEKIIKTIDNFLEKRYEKWIEVYKLVKAKWLGTVNTQFQKRSYQMYRSLEYQVDAIKKIIDYEYKIYSGPDKEQIADEINNLKNKLEEKANKAMININIFMRESSRSFLVNQMINEAKKQLLEFDTQSKNILMQYIKANSKFIGITELKKLESKINKVFSTPIPFSYSKNLDCWVDNEEDIDVILKKSTILNLDINNDIISDISGFNSSVITYPDAQLVPGINGKAIHLVNNESSEVIVHKAMDIEYNDMFNNFTVSFWLRVPKVSASHLEQYGTNEYSIISSMKKHSLSIGSGWSVSLKGNNLIWTLKDSAGEVRQITFRDLPDKFNAYLANKWVFITITNDRLSSANLYINGVLMGSAEITGLGAIREDNNITLKLDRCNNNNQYVSIDKFRIFCKALNPKEIEKLYTSYLSITFLRDFWGNPLRYDTEYYLIPVASSSKDVQLKNITDYMYLTNAPSYTNGKLNIYYRRLYNGLKFIIKRYTPNNEIDSFVKSGDFIKLYVSYNNNEHIVGYPKDGNAFNNLDRILRVGYNAPGIPLYKKMEAVKLRDLKTYSVQLKLYDDKNASLGLVGTHNGQIGNDPNRDILIASNWYFNHLKDKILGCDWYFVPTDEGWTNDGSAENLYFQSGSGSNGSSGSVSMAIIKEFMRFKVHMEGSVNGHEFEIEGEGEGRPYEGTQTAKLKVTKGGPLPFAWDILSPQFMYGSKAYVKHPADIPDYLKLSFPEGFKWERVMNFEDGGVVTVTQDSSLQDGEFIYKVKLRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIKQRLKLKDGGHYDAEVKTTYKAKKPVQLPGAYNVNIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYRSGGGHHHHHHGDL

序列18

ATTCTGCAAAATCCTATTGTTTATCATACCTGATATAATGAAAAGATACGACACTAGGAGTGAATGGCCATG

序列19

TAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCC

序列20

CCTCTAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACC

序列21

ATGCCAATAACCATAAATAATTTTAGATATAGTGATCCTGTTAATAATGATACAATTATTATGATGGAGCCACCATACTGTAAGGGTCTAGATATCTATTATAAGGCTTTCAAAATAACAGATCGTATTTGGATAGTGCCGGAAAGGTATGAATTTGGGACAAAACCTGAAGATTTTAACCCACCATCTTCATTAATAGAAGGTGCATCTGAGTATTACGATCCAAATTATTTAAGGACTGATTCTGATAAAGATAGATTTTTACAAACCATGGTAAAACTGTTTAACAGAATTAAAAACAATGTAGCAGGTGAAGCCTTATTAGATAAGATAATAAATGCCATACCTTACCTTGGAAATTCATATTCCTTACTAGACAAGTTTGATACAAACTCTAATTCAGTATC/TTTTAATTTATCAGAACAAGACCCCAGTGGAGCAACTACAAAATCAGCAATGCTGACAAATTTAATAATATTTGGACCTGGGCCTGTTTTAAATAAAAATGAGGTTAGAGGTATTGTATTGAGGGTAGATAATAAAAATTACTTCCCATGTAGAGATGGTTTTGGTTCAATAATGCAAATGGCATTTTGCCCAGAATATATACCCACTTTTGATAATGTAATAGAAAATATTACGTCACTCACTATTGGCAAAAGCAAATATTTTCAAGATCCAGCATTACTATTAATGCACGAACTTATACATGTACTACATGGTTTATACGGAATGCAGGTATCAAGCCATGAAATTATTCCATCCAAACAAGAAATTTATATGCAGCATACATATCCAATAAGTGCTGAAGAACTATTCACTTTTGGCGGACAGGATGCTAATCTTATAAGTATTGATATAAAAAACGATTTATATGAAAAAACTTTAAATGATTATAAAGCTATAGCTAACAAACTTAGTCAAGTCACTAGCTGCAATGATCCCAACATTGATATTGATAGCTACAAACAAATATATCAACAAAAATATCAATTCGATAAAGATAGCAATGGACAATATATTGTAAATGAGGATAAATTTCAGATACTATATAATAGCATAATGTATGGTTTTACAGAGATTGAATTGGGAAAAAAATTTAATATAAAAACTAGACTTTCTTATTTTAGTATGAATCATGACCCTGTAAAAATTCCAAATTTATTAGATGATACAATTTACAATGATACAGAAGGATTTAATATAGAAAGCAAAGATCTGAAATCTGAATATAAAGGTCAAAATATGAGGGTAAATACAAATGCTTTTAGAAATGTTGATGGATCAGGCCTAGTTTCAAAACTTATTGGCTTATGTAAAAAAATTATACCACCAACAAATATAAGAGAAAATTTATATAATAGAACTGCATCATTAACAGATTTAGGAGGAGAATTATGTATAAAAATTAAAAATGAAGATTTAACTTTTATAGCTGAAAAAAATAGCTTTTCAGAAGAACCATTTCAAGATGAAACAGTTAGTTATAATACAAAAAATAAACCATTAAATTTTAATTATTCGCTAGATAAAATTATTTTAGATTATAATCTACAAAGTAAAATTACATTACCTAATGATAGGACAACCCCAGTTACAAAAGGAATTCCATATGCTCCAAAATATAAAAGTAATGCTGCAAGTACAATAGAAATACATAATATTGATGACAATACAATATATCAATATTTGTATGCTCAAAAATCTCCTACAACTCTACAAAGAATAACTATGACTAATTCTGTCGATGACGCATTAATAAATTCCACCAAAATATATTCATATTTTCCATCTGTAATCAGTAAAGTTAACCAAGGTGCACAAGGAATTTTATTCTTACAGTGGGTGAGAGATATAATTGATGATTTACCAATGAATCTTCACAAAAAACTACTATTGATAAAATTTCAGATGTATCCACTATTGTTCCTTATATAGGACCCGCATTAAACATTGTAAAACAAGGCTATGAGGGAAACTTTATAGGTGCTTTAGAAACTACCGGAGTGGTTTTATTATTGGAATATATTCCAGAAATTACTTTACCAGTAATTGCAGCTTTATCTATAGCAGAAAGTAGCACACAAAAAGAAAAGATAATAAAAACAATAGATAACTTTTTAGAAAAAAGATATGAAAAATGGATTGAAGTATATAAACTAATAAAAGCAAAATGGTTAGGCACAGTTAATACGCAATTCCAAAAAAGAAGTTATCAAATGTATAGATCTTTAGAATATCAAGTAGATGCAATAAAAAAAATAATAGACTATGAATATAAAATATATTCAGGACCTGATAAGGAACAAATTGCCGACGAAATTAATAATCTGAAAAACAAACTTGAAGAAAAGGCTAATAAAGCAATGATAAACATAAATATATTTATGAGGGAAAGTTCTAGATCATTTTTAGTTAATCAAATGATTAACGAAGCTAAAAAGCAGTTATTAGAGTTTGATACTCAAAGCAAAAATATTTTAATGCAGTATATAAAAGCAAATTCTAAATTTATAGGTATAACTGAACTAAAAAAATTAGAATCAAAAATAAACAAAGTTTTTTCAACACCAATTCCATTTTCTTATTCTAAAAATCTGGATTGTTGGGTTGATAATGAAGAAGATATAGATGTTATATTAAAAAAGAGTACAATTTTAAATTTAGATATTAATAATGATATTATATCAGATATATCTGGGTTTAATTCATCTGTAATAACATATCCAGATGCTCAATTGGTGCCCGGAATAAATGGCAAAGCAATACATTTAGTAAACAATGAATCTTCTGAAGTTATAGTGCATAAAGCTATGGATATTGAATATAATGATATGTTTAATAATTTTACCGTTAGCTTTTGGTTGAGGGTTCCTAAAGTATCTGCTAGTCATTTAGAACAATATGGCACAAATGAGTATTCAATAATTAGCTCTATGAAAAAATATAGTCTATCAATAGGATCTGGTTGGAGTGTATCACTTAAAGGTAATAACTTAATATGGACTTTAAAAGATTCCGCGGGAGAAGTTAGACAAATAACTTTTAGTGATTTATCTGATAAATTTAATGCTTATTTAGCAAATAAATGGGTTTTTATAACTATTACTAATGATAGATTATCTTCTGCTAATTTGTATATAAATGGAGTACTTATGAAAAATGCAGAAATTACCGGTTTAGGAGCTATTAGAGAGGATAATAATATAACATTAAAACTAGATAGATGTAATAATAATAATCAATACGTTTCTATTGATAAATTTAGGATATTTTGCAAAGCATTAAATCCAAAAGAGATTGAAAAATTATACACAAGTTATTTATCTATAACCTTTTTAAGAGACTTCTGGGGAAACCCTTTACGATATGATACAGAATATTATTTAATACCAGTAGCTTCTAGTTCTAAAGATGTTCAATTGAAAAATATAACAGATTATATGTATTTGACAAATGCGCCATCGTATACTAACGGAAAATTGAATATATATTATAGAAGGTTATATAGTGGACTAAAATTTATTATAAAAAGATATACACCTAATAATGAAATAGATTCTTTTGTTAAATCAGGTGATTTTATTAAATTATATGTATCATATAACAATAATGAGCACATTGTAGGTTATCCGAAAGATGGAAATGCCTTTAATAATCTTGATAGAATTCTAAGAGTAGGTTATAATGCCCCAGGTATCCCTCTTTATAAAAAAATGGAAGCAGTAAAATTGCGTGATTTAAAAACCTATTCTGTACAACTTAAATTATATGATGATAAAAATGCATCTTTAGGACTAGTAGGTATCCGTAATGGTCAAATAGGCAACGATCCAAATAGGGATATATTAATTGCAAGCAACTGGTACTTTAATCATTTAAAAGATAAAACTTTAACATGTGATTGGTACTTTGTACCTACAGATGAAGGATGGACAAATGATTAA

序列22

GAAAACCTGTACTTCCAATCCAATATTGGTAGTGGGAGCAACGGCAGCAGCGGATCCGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTCCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAAGCGGCCGCACTCGAGCACCACCACCACCACCACTGA

表2：重组TaqPPK的氨基酸序列显示：6xHis-标签：V5表位标签和TEV切割位点(序列11)

His6 V5 tag TEV ∨ TaqPPK

MHHHHHHGKPIPNPLLGLDSTENLYFQGIDPFTMRLLPEESWLQFNRRVLRQSERPDFPLLERMRFLAIWNRNLDEFFAARIAKPFLKHRGSEAHLRLLKEAEDQARLAEGRYRALLAEAAPHLKILEPEELDDLDWLYFRVFLAEVVVPKTDLIAWEAAKEASHGALYFASEDHLVRLPQDLPRLLKVPGREGTYVRLGALMRARSDLFLPRESPLYEFRVLRLLESERARADWDELAQALEGRQEGLSTLLVAERGFPKGWLEGLQEALGLLPEEVILLSPPLNLTLVETLVAEGPSRWRFPPLEPKRPRAFMKNPLKRLQEKDLVLYHPFEDYAALERFAEAALSEEVEEVYATLYRIGEANPLAEALIQAARAGKRVHVLLEPRARFDELLNLSWYLRFLRAGVAVLPLSERKVHAKALLLLTQKGGYAHLGTGNYNPQNGRQYTDFSLFTARKEVVMEVAEFFRALQEGRTPRLNLLKTGEAIQELLLEHIRAESHPKGRILLKCNHLTDPALLEALARAADKGARVDLIVRSTLTLLHPRFRARSLVGRFLEHARVAAFYQGGRWALYLTSADLMPRNFQNRFELLFPVLDKEGKAKVLEVLKRQLKDDRNAFLLSPKGETPLWGGRHDAQRILAW

序列表

<110> 耐特希生物有限公司

<120> 基于无机多磷酸盐的能量再生的无细胞表达系统

<130> 90125.00011

<150> 62/440,975

<151> 2016-12-30

<160> 22

<170> PatentIn version 3.5

<210> 1

<211> 323

<212> PRT

<213> Bacteria

<400> 1

Ser Gly Ser Ser Met Ile Glu Ile Glu Lys Pro Lys Ile Glu Thr Val

1 5 10 15

Glu Leu Ser Glu Asp Ala Lys Tyr Gly Lys Phe Val Val Glu Pro Leu

20 25 30

Glu Arg Gly Tyr Gly Thr Thr Leu Gly Asn Ser Leu Arg Arg Ile Leu

35 40 45

Leu Ser Ser Leu Pro Gly Ala Ala Val Thr Ser Val Gln Ile Asp Gly

50 55 60

Val Leu His Glu Phe Ser Thr Ile Asp Gly Val Val Glu Asp Val Thr

65 70 75 80

Ala Ile Ile Leu Asn Ile Lys Lys Leu Ala Leu Lys Ile Tyr Ser Asp

85 90 95

Glu Glu Lys Thr Leu Glu Ile Asp Val Gln Gly Glu Gly Val Val Thr

100 105 110

Ala Ala Asp Ile Thr His Asp Ser Asp Val Glu Ile Leu Asn Pro Asp

115 120 125

Leu His Ile Ala Thr Leu Ala Glu Gly Gly Arg Leu Arg Met Arg Met

130 135 140

Thr Ala Lys Arg Gly Arg Gly Tyr Val Pro Ala Glu Ala Asn Lys Arg

145 150 155 160

Glu Asp Gln Pro Ile Gly Val Ile Pro Ile Asp Ser Ile Tyr Thr Pro

165 170 175

Val Ser Arg Val Ser Tyr Gln Val Glu Asn Thr Arg Val Gly Gln Val

180 185 190

Thr Asp Tyr Asp Lys Leu Thr Ile Asp Val Trp Thr Asp Gly Ser Ile

195 200 205

Gly Pro Lys Glu Ala Ile Ser Leu Gly Ala Lys Ile Leu Thr Glu His

210 215 220

Leu Asn Ile Phe Val Gly Leu Thr Asp Glu Ala Gln Asn Ala Glu Ile

225 230 235 240

Met Val Glu Lys Glu Asp Asp Gln Lys Glu Lys Val Leu Glu Met Thr

245 250 255

Ile Glu Glu Leu Asp Leu Ser Val Arg Ser Tyr Asn Cys Leu Lys Arg

260 265 270

Ala Gly Ile Asn Thr Val Gln Glu Leu Thr Gln Lys Thr Glu Glu Asp

275 280 285

Met Met Lys Val Arg Asn Leu Gly Arg Lys Ser Leu Glu Glu Val Lys

290 295 300

Ala Lys Leu Ala Glu Leu Gly Leu Ser Leu Arg Lys Asp Asp Gly Arg

305 310 315 320

Arg Ala Ala

<210> 2

<211> 1198

<212> PRT

<213> Bacteria

<400> 2

Ser Gly Ser Ser Met Thr Gly Arg Leu Val Gln Tyr Gly Arg His Arg

1 5 10 15

Gln Arg Arg Ser Tyr Ala Arg Ile Ser Glu Val Leu Glu Leu Pro Asn

20 25 30

Leu Ile Glu Ile Gln Thr Ser Ser Tyr Gln Trp Phe Leu Asp Glu Gly

35 40 45

Leu Arg Glu Met Phe Arg Glu Ile Ser Pro Ile Glu Asp Phe Ser Gly

50 55 60

Asn Leu Ser Leu Glu Phe Ile Asp Tyr Ser Leu Gly Glu Pro Lys Tyr

65 70 75 80

Thr Val Glu Glu Ala Lys Glu Arg Asp Val Thr Tyr Ala Ala Pro Leu

85 90 95

Arg Val Lys Val Arg Leu Ile Asn Lys Glu Thr Gly Glu Val Lys Glu

100 105 110

Gln Asp Val Phe Met Gly Asp Phe Pro Leu Met Thr Glu Thr Gly Thr

115 120 125

Phe Ile Ile Asn Gly Ala Glu Arg Val Ile Val Ser Arg Leu Val Arg

130 135 140

Ser Pro Ser Val Tyr Tyr Ser Asp Lys Val Asp Lys Asn Gly Lys Arg

145 150 155 160

Gly Tyr Ser Ala Thr Val Ile Pro Asn Arg Gly Ala Trp Leu Glu Tyr

165 170 175

Glu Thr Asp Ala Lys Asp Val Val Tyr Val Arg Ile Asp Arg Thr Arg

180 185 190

Lys Leu Pro Val Thr Val Leu Leu Arg Ala Leu Gly Phe Ser Ser Asp

195 200 205

Gln Glu Ile Ile Asp Leu Leu Gly Asp Asn Glu Tyr Leu Arg Asn Thr

210 215 220

Leu Glu Lys Asp Asn Thr Asp Ser Thr Glu Lys Ala Leu Ile Glu Ile

225 230 235 240

Tyr Glu Arg Leu Arg Pro Gly Glu Pro Pro Thr Leu Glu Asn Ala Lys

245 250 255

Asn Leu Leu Ala Ser Arg Phe Phe Asp Pro Lys Arg Tyr Asp Leu Ala

260 265 270

Ser Val Gly Arg Tyr Lys Ile Asn Lys Lys Leu His Ile Lys Asn Arg

275 280 285

Leu Phe Asn Gln Arg Leu Ala Glu Thr Ile Ile Asp Pro Glu Thr Lys

290 295 300

Glu Val Ile Ala Glu Ala Gly Ala Met Ile Asp Arg Arg Thr Leu Asn

305 310 315 320

Arg Leu Leu Pro Tyr Leu Glu Lys Gly Val Gly Leu Gln Thr Tyr Arg

325 330 335

Pro Ala Glu Gly Val Val Asp Gly Asp Ile Ser Val Gln Thr Ile Lys

340 345 350

Ile Tyr Ala Pro Asn Asp Pro Asp Gly Glu Lys Val Ile Asn Val Ile

355 360 365

Gly Asn Gly Phe Ile Ala Glu Asp Val Lys His Ile Thr Pro Ala Asp

370 375 380

Ile Ile Ala Ser Ile Ser Tyr Phe Phe Asn Leu Leu His Gly Val Gly

385 390 395 400

Asp Thr Asp Asp Ile Asp His Leu Gly Asn Arg Arg Leu Arg Ser Val

405 410 415

Gly Glu Leu Leu Gln Asn Gln Phe Arg Ile Gly Leu Ser Arg Met Glu

420 425 430

Arg Val Val Arg Glu Arg Met Ser Ile Gln Asp Thr Asn Thr Ile Thr

435 440 445

Pro Gln Gln Leu Ile Asn Ile Arg Pro Val Ile Ala Ala Ile Lys Glu

450 455 460

Phe Phe Gly Ser Ser Gln Leu Ser Gln Phe Met Asp Gln Thr Asn Pro

465 470 475 480

Leu Ala Glu Leu Thr His Lys Arg Arg Leu Ser Ala Leu Gly Pro Gly

485 490 495

Gly Leu Thr Arg Glu Arg Ala Gly Phe Glu Val Arg Asp Val His Tyr

500 505 510

Ser His Tyr Gly Arg Met Cys Pro Ile Glu Thr Pro Glu Gly Pro Asn

515 520 525

Ile Gly Leu Ile Asn Ser Leu Ser Thr Tyr Ala Lys Val Asn Lys Phe

530 535 540

Gly Phe Ile Glu Thr Pro Tyr Arg Arg Val Asp Pro Glu Thr Gly Arg

545 550 555 560

Val Thr Asp Gln Ile Asp Tyr Leu Thr Ala Asp Glu Glu Asp Asn Tyr

565 570 575

Val Val Ala Gln Ala Asn Val Pro Leu Ala Glu Asp Gly Thr Phe Leu

580 585 590

Glu Glu Asn Val Val Ala Arg Phe Arg Gly Glu Asn Ile Val Val Lys

595 600 605

Arg Asp Arg Val Asp Tyr Met Asp Val Ser Pro Lys Gln Val Val Ser

610 615 620

Ala Ala Thr Ala Cys Ile Pro Phe Leu Glu Asn Asp Asp Ser Asn Arg

625 630 635 640

Ala Leu Met Gly Ala Asn Met Gln Arg Gln Ala Val Pro Leu Leu Glu

645 650 655

Pro Glu Ala Pro Ile Val Gly Thr Gly Met Glu Tyr Val Ser Ala Lys

660 665 670

Asp Ser Gly Ala Ala Val Ile Cys Lys His Arg Gly Ile Val Glu Arg

675 680 685

Val Glu Ala Lys Glu Ile Trp Val Arg Arg Leu Ile Glu Val Asp Gly

690 695 700

Lys Glu Val Lys Gly Asp Leu Asp Lys Tyr Arg Leu Leu Lys Phe Val

705 710 715 720

Arg Ser Asn Gln Gly Thr Cys Tyr Asn Gln Arg Pro Ile Val Lys Lys

725 730 735

Gly Asp Ile Val Glu Lys Gly Glu Ile Leu Ala Asp Gly Pro Ser Met

740 745 750

Asp Lys Gly Glu Leu Ala Leu Gly Arg Asn Val Leu Val Ala Phe Met

755 760 765

Thr Trp Asp Gly Tyr Asn Tyr Glu Asp Ala Ile Ile Met Ser Glu Arg

770 775 780

Leu Val Lys Glu Asp Val Tyr Thr Ser Ile His Ile Glu Glu Tyr Glu

785 790 795 800

Ala Glu Ser Arg Asp Thr Lys Leu Gly Pro Glu Glu Ile Thr Arg Asp

805 810 815

Ile Pro Asn Val Gly Glu Asp Ala Leu Lys Asn Leu Asp Glu Arg Gly

820 825 830

Ile Val Arg Ile Gly Ala Glu Val Lys Asp Gly Asp Leu Leu Val Gly

835 840 845

Lys Val Thr Pro Lys Gly Met Thr Glu Leu Thr Ala Glu Glu Arg Leu

850 855 860

Leu His Ala Ile Phe Gly Glu Lys Ala Arg Glu Val Arg Asp Thr Ser

865 870 875 880

Leu Arg Val Pro His Gly Gly Gly Ile Val Leu Asp Val Lys Val Phe

885 890 895

Asn Arg Glu Asp Gly Asp Glu Leu Pro Pro Gly Val Asn Gln Leu Val

900 905 910

Arg Val Tyr Ile Val Gln Lys Arg Lys Ile Ser Glu Gly Asp Lys Met

915 920 925

Ala Gly Arg His Gly Asn Lys Gly Val Ile Ser Arg Ile Leu Pro Glu

930 935 940

Glu Asp Met Pro Phe Leu Pro Asp Gly Thr Pro Ile Asp Ile Met Leu

945 950 955 960

Asn Pro Leu Gly Val Pro Ser Arg Met Asn Ile Gly Gln Val Phe Glu

965 970 975

Leu His Leu Gly Met Ala Ala Lys Lys Leu Gly Leu His Ile Ala Ser

980 985 990

Pro Val Phe Asp Gly Ala Thr Glu Glu Asp Val Trp Asn Ile Leu Glu

995 1000 1005

Glu Ala Gly Leu Ala Arg Asp Ala Lys Thr Val Leu Tyr Asp Gly

1010 1015 1020

Arg Thr Gly Glu Pro Phe Asp Asn Arg Val Ser Val Gly Ile Met

1025 1030 1035

Tyr Met Ile Lys Leu Ala His Met Val Asp Asp Lys Leu His Ala

1040 1045 1050

Arg Ser Thr Gly Pro Tyr Ser Leu Val Thr Gln Gln Pro Leu Gly

1055 1060 1065

Gly Lys Ala Gln Phe Gly Gly Gln Arg Phe Gly Glu Met Glu Val

1070 1075 1080

Trp Ala Leu Glu Ala Tyr Gly Ala Ala Tyr Thr Leu Gln Glu Ile

1085 1090 1095

Leu Thr Val Lys Ser Asp Asp Val Val Gly Arg Val Lys Thr Tyr

1100 1105 1110

Glu Ala Ile Val Lys Gly Glu Asn Ile Pro Glu Pro Gly Val Pro

1115 1120 1125

Glu Ser Phe Lys Val Leu Ile Lys Glu Leu Gln Ser Leu Gly Met

1130 1135 1140

Asp Val Thr Ile Leu Thr Ser Asp Glu Gln Glu Val Asn Met Glu

1145 1150 1155

Asn Phe Asp Asp Asp Asp Asp His Ala Pro Asp Ala Ile Met Val

1160 1165 1170

Asp Val Lys Pro Ala Glu Arg Glu Glu Ala Gly Glu Glu Lys Asp

1175 1180 1185

Ala Val Thr Lys Glu Gly Arg Arg Ala Ala

1190 1195

<210> 3

<211> 1207

<212> PRT

<213> Bacteria

<400> 3

Ser Gly Ser Ser Met Leu Asp Val Asn Lys Phe Glu Tyr Met Lys Ile

1 5 10 15

Gly Leu Ala Ser Pro Glu Lys Ile Arg Ser Trp Ser Tyr Gly Glu Val

20 25 30

Lys Lys Pro Glu Thr Ile Asn Tyr Arg Thr Leu Lys Pro Glu Lys Asp

35 40 45

Gly Leu Phe Glu Arg Ile Phe Gly Pro Thr Lys Asp Trp Glu Cys His

50 55 60

Cys Gly Lys Tyr Lys Arg Val Arg Tyr Lys Gly Val Val Cys Asp Arg

65 70 75 80

Cys Gly Val Glu Val Thr Arg Ser Lys Val Arg Arg Glu Arg Met Gly

85 90 95

His Ile Glu Leu Ala Ala Pro Val Ser His Ile Trp Tyr Phe Lys Gly

100 105 110

Ile Pro Ser Arg Met Gly Leu Val Leu Asp Met Ser Pro Arg Ala Leu

115 120 125

Glu Glu Val Ile Tyr Phe Ala Ser Tyr Val Val Thr Asp Pro Gly Asp

130 135 140

Thr Pro Leu Glu Lys Lys Gln Leu Leu Ser Glu Lys Glu Tyr Arg Ala

145 150 155 160

Tyr Arg Glu Lys Tyr Gly Gln Ser Phe Gln Ala Ser Met Gly Ala Glu

165 170 175

Ala Ile Lys Lys Leu Leu Gln Asp Ile Asp Leu Asp Lys Glu Val Ala

180 185 190

Ala Leu Lys Glu Glu Leu Lys Thr Ala Gln Gly Gln Arg Arg Ala Arg

195 200 205

Ile Ile Lys Arg Leu Glu Val Leu Glu Ala Phe Arg Ser Ser Gly Asn

210 215 220

Asp Pro Ala Trp Met Val Leu Asp Val Leu Pro Val Ile Pro Pro Glu

225 230 235 240

Leu Arg Pro Met Val Gln Leu Asp Gly Gly Arg Phe Ala Thr Ser Asp

245 250 255

Leu Asn Asp Leu Tyr Arg Arg Val Ile Asn Arg Asn Asn Arg Leu Lys

260 265 270

Arg Leu Leu Asp Leu Gly Ala Pro Asn Ile Ile Val Gln Asn Glu Lys

275 280 285

Arg Met Leu Gln Glu Ala Val Asp Ala Leu Ile Asp Asn Gly Arg Arg

290 295 300

Gly Arg Pro Val Thr Gly Pro Gly Asn Arg Pro Leu Lys Ser Leu Ser

305 310 315 320

His Met Leu Lys Gly Lys Lys Gly Arg Phe Arg Gln Asn Leu Leu Gly

325 330 335

Lys Arg Val Asp Tyr Ser Gly Arg Ser Val Ile Val Val Gly Pro Asn

340 345 350

Leu Lys Met Tyr Gln Cys Gly Leu Pro Lys Glu Met Ala Leu Glu Leu

355 360 365

Phe Lys Pro Phe Val Met Lys Glu Leu Val Glu Arg Gly Leu Ala His

370 375 380

Asn Ile Lys Ser Ala Lys Arg Lys Ile Glu Arg Val His Pro Glu Val

385 390 395 400

Trp Asp Val Leu Glu Asp Val Ile Lys Glu His Pro Val Leu Leu Asn

405 410 415

Arg Ala Pro Thr Leu His Arg Leu Gly Ile Gln Ala Phe Glu Pro Thr

420 425 430

Leu Val Glu Gly Arg Ala Ile Arg Leu His Pro Leu Val Cys Thr Ala

435 440 445

Tyr Asn Ala Asp Phe Asp Gly Asp Gln Met Ala Val His Val Pro Leu

450 455 460

Ser Ala Glu Ala Gln Ala Glu Ala Arg Leu Leu Met Leu Ala Ala Gln

465 470 475 480

Asn Ile Leu Asn Pro Lys Asp Gly Lys Pro Val Val Thr Pro Ser Gln

485 490 495

Asp Met Val Leu Gly Asn Tyr Tyr Leu Thr Met Glu Arg Glu Gly Ala

500 505 510

Ile Gly Glu Gly Met Val Phe Lys Asp Thr Asp Glu Ala Leu Leu Ala

515 520 525

Tyr His Asn Gly Tyr Val His Leu His Ser Arg Ile Ala Ile His Ala

530 535 540

Gly Ser Leu Lys Asn Glu Thr Phe Thr Glu Glu Gln Asn Asn Lys Leu

545 550 555 560

Leu Leu Thr Thr Val Gly Lys Leu Ile Phe Asn Glu Ile Leu Pro Asn

565 570 575

Ser Phe Pro Tyr Ile Asn Glu Pro Thr Thr Glu Asn Ile Glu Gly Arg

580 585 590

Thr Pro Asp Lys Tyr Phe Leu Asp Lys Gly Val Asn Val Arg Glu Glu

595 600 605

Ile Arg Lys Arg Glu Leu Val Pro Pro Phe Lys Lys Lys Val Leu Gly

610 615 620

Gln Ile Ile Ala Glu Val Phe Lys Arg Phe Lys Ile Thr Glu Thr Ser

625 630 635 640

Lys Met Leu Asp Arg Met Lys Asp Leu Gly Phe Gln Tyr Ser Thr Lys

645 650 655

Ala Gly Ile Thr Ile Gly Val Ala Asp Ile Val Val Leu Pro Glu Lys

660 665 670

Gln Glu Ile Leu Asp Glu Ala Gln Ala Lys Val Asp Thr Val Leu Lys

675 680 685

Gln Phe Arg Arg Gly Leu Ile Thr Asp Glu Glu Arg Tyr Glu Arg Val

690 695 700

Ile Ser Ile Trp Ser Ala Ala Lys Asp Lys Ile Gln Asp Arg Leu Met

705 710 715 720

Lys Ser Leu Asp Lys Arg Asn Pro Ile Phe Met Met Ser Asp Ser Gly

725 730 735

Ala Arg Gly Asn Ala Ser Asn Phe Thr Gln Leu Ala Gly Met Arg Gly

740 745 750

Leu Met Ala Asn Pro Ala Gly Arg Ile Ile Glu Leu Pro Ile Lys Ser

755 760 765

Ser Phe Arg Glu Gly Leu Thr Val Leu Glu Tyr Phe Ile Ser Thr His

770 775 780

Gly Ala Arg Lys Gly Leu Ala Asp Thr Ala Leu Lys Thr Ala Asp Ser

785 790 795 800

Gly Tyr Leu Thr Arg Arg Leu Val Asp Val Ala Gln Asp Val Ile Val

805 810 815

Arg Glu Glu Asp Cys Gly Thr Asp Arg Gly Ile Leu Ala Arg Ala Leu

820 825 830

Thr Asp Gly Thr Glu Val Val Val Lys Leu Glu Glu Arg Leu Val Gly

835 840 845

Arg Tyr Ala His Lys Thr Val Arg His Pro Glu Thr Gly Glu Val Ile

850 855 860

Val Arg Lys Asp Glu Met Ile Thr Glu Asp Ile Ala Asn Glu Ile Ile

865 870 875 880

Lys Ala Gly Ile Thr Glu Val Trp Ile Arg Ser Val Phe Ala Cys Asn

885 890 895

Thr Arg His Gly Val Cys Lys Lys Cys Tyr Gly Arg Asn Met Ala Thr

900 905 910

Gly Met Asp Val Glu Val Gly Glu Ala Val Gly Ile Ile Ala Ala Gln

915 920 925

Ser Ile Gly Glu Pro Gly Thr Gln Leu Thr Met Arg Thr Phe His Thr

930 935 940

Gly Gly Val Ala Gly Asp Asp Ile Thr Gln Gly Leu Pro Arg Val Gln

945 950 955 960

Glu Leu Phe Glu Ala Arg Asn Pro Lys Gly Gln Ala Val Ile Ser Glu

965 970 975

Ile Asp Gly Thr Val Ile Ser Ile Asn Glu Thr Arg Asp Asn Gln Tyr

980 985 990

Glu Ile Val Val Gln Ser Glu Val Glu Thr Arg Thr Tyr Val Ala Pro

995 1000 1005

Tyr Asn Ala Arg Leu Lys Val Glu Glu Gly Gln Arg Val Glu Arg

1010 1015 1020

Gly Gln Glu Leu Thr Glu Gly Ser Val Asp Pro Lys Gln Leu Leu

1025 1030 1035

Arg Val Arg Asp Ile Thr Ser Val Gln Glu Tyr Leu Leu Arg Glu

1040 1045 1050

Val Gln Lys Val Tyr Arg Met Gln Gly Val Glu Ile Ser Asp Lys

1055 1060 1065

His Ile Glu Val Met Val Arg Gln Met Leu Arg Lys Val Arg Val

1070 1075 1080

Ile Asp Ala Gly Asp Thr Asp Val Leu Pro Gly Thr Leu Leu Asp

1085 1090 1095

Val His Gln Phe Thr Asp Val Asn Ala Lys Ala Leu Arg Glu Gly

1100 1105 1110

Lys Arg Pro Ala Thr Ala Arg Gln Val Leu Leu Gly Ile Thr Lys

1115 1120 1125

Ala Ser Leu Glu Thr Asp Ser Phe Leu Ser Ala Ala Ser Phe Gln

1130 1135 1140

Glu Thr Thr Arg Val Leu Thr Asp Ala Ala Ile Lys Gly Lys Arg

1145 1150 1155

Asp Glu Leu Leu Gly Leu Lys Glu Asn Val Ile Ile Gly Lys Leu

1160 1165 1170

Val Pro Ala Gly Thr Gly Met Ala Arg Tyr Arg Lys Val Lys Pro

1175 1180 1185

Ala Val Lys Lys Glu Thr Ala Gly Gly Thr Val Ser Ser Lys Gly

1190 1195 1200

Arg Arg Ala Ala

1205

<210> 4

<211> 1207

<212> PRT

<213> Bacteria

<400> 4

Ser Gly Ser Ser Met Leu Asp Val Asn Lys Phe Glu Tyr Met Lys Ile

1 5 10 15

Gly Leu Ala Ser Pro Glu Lys Ile Arg Ser Trp Ser Tyr Gly Glu Val

20 25 30

Lys Lys Pro Glu Thr Ile Asn Tyr Arg Thr Leu Lys Pro Glu Lys Asp

35 40 45

Gly Leu Phe Cys Glu Arg Ile Phe Gly Pro Thr Lys Asp Trp Glu Cys

50 55 60

His Cys Gly Lys Tyr Lys Arg Val Arg Tyr Lys Gly Val Val Cys Asp

65 70 75 80

Arg Cys Gly Val Glu Val Thr Arg Ser Lys Val Arg Arg Glu Arg Met

85 90 95

Gly His Ile Glu Leu Ala Ala Pro Val Ser His Ile Trp Tyr Phe Lys

100 105 110

Gly Ile Pro Ser Arg Met Gly Leu Val Leu Asp Met Ser Pro Arg Ala

115 120 125

Leu Glu Glu Val Ile Tyr Phe Ala Ser Tyr Val Val Thr Asp Pro Gly

130 135 140

Asp Thr Pro Leu Glu Lys Lys Gln Leu Leu Ser Glu Lys Glu Tyr Arg

145 150 155 160

Ala Tyr Arg Glu Lys Tyr Gly Gln Ser Phe Gln Ala Ser Met Gly Ala

165 170 175

Glu Ala Ile Lys Lys Leu Leu Gln Asp Ile Asp Leu Asp Lys Glu Val

180 185 190

Ala Ala Leu Lys Glu Glu Leu Lys Thr Ala Gln Gly Gln Arg Arg Ala

195 200 205

Arg Ile Ile Lys Arg Leu Glu Val Leu Glu Ala Phe Arg Ser Ser Gly

210 215 220

Asn Asp Pro Ala Trp Met Val Leu Asp Val Leu Pro Val Ile Pro Pro

225 230 235 240

Glu Leu Arg Pro Met Val Gln Leu Asp Gly Gly Arg Phe Ala Thr Ser

245 250 255

Asp Leu Asn Asp Leu Tyr Arg Arg Val Ile Asn Arg Asn Asn Arg Leu

260 265 270

Lys Arg Leu Leu Asp Leu Gly Ala Pro Asn Ile Ile Val Gln Asn Glu

275 280 285

Lys Arg Met Leu Gln Glu Ala Val Asp Ala Leu Ile Asp Asn Gly Arg

290 295 300

Arg Gly Arg Pro Val Thr Gly Pro Gly Asn Arg Pro Leu Lys Ser Leu

305 310 315 320

Ser His Met Leu Lys Gly Lys Lys Gly Arg Phe Arg Gln Asn Leu Leu

325 330 335

Gly Lys Arg Val Asp Tyr Ser Gly Arg Ser Val Ile Val Val Gly Pro

340 345 350

Asn Leu Lys Met Tyr Gln Cys Gly Leu Pro Lys Glu Met Ala Leu Glu

355 360 365

Leu Phe Lys Pro Phe Val Met Lys Glu Leu Val Glu Arg Gly Leu Ala

370 375 380

His Asn Ile Lys Ser Ala Lys Arg Lys Ile Glu Arg Val His Pro Glu

385 390 395 400

Val Trp Asp Val Leu Glu Asp Val Ile Lys Glu His Pro Val Leu Asn

405 410 415

Arg Ala Pro Thr Leu His Arg Leu Gly Ile Gln Ala Phe Glu Pro Thr

420 425 430

Leu Val Glu Gly Arg Ala Ile Arg Leu His Pro Leu Val Cys Thr Ala

435 440 445

Tyr Asn Ala Asp Phe Asp Gly Asp Gln Met Ala Val His Val Pro Leu

450 455 460

Ser Ala Glu Ala Gln Ala Glu Ala Arg Leu Leu Met Leu Ala Ala Gln

465 470 475 480

Asn Ile Leu Asn Pro Lys Asp Gly Lys Pro Val Val Thr Pro Ser Gln

485 490 495

Asp Met Val Leu Gly Asn Tyr Tyr Leu Thr Met Glu Arg Glu Gly Ala

500 505 510

Ile Gly Glu Gly Met Val Phe Lys Asp Thr Asp Glu Ala Leu Leu Ala

515 520 525

Tyr His Asn Gly Tyr Val His Leu His Ser Arg Ile Ala Ile His Ala

530 535 540

Gly Ser Leu Lys Asn Glu Thr Phe Thr Glu Glu Gln Asn Asn Lys Leu

545 550 555 560

Leu Leu Thr Thr Val Gly Lys Leu Ile Phe Asn Glu Ile Leu Pro Asn

565 570 575

Ser Phe Pro Tyr Ile Asn Glu Pro Thr Thr Glu Asn Ile Glu Gly Arg

580 585 590

Thr Pro Asp Lys Tyr Phe Leu Asp Lys Gly Val Asn Val Arg Glu Glu

595 600 605

Ile Arg Lys Arg Glu Leu Val Pro Pro Phe Lys Lys Lys Val Leu Gly

610 615 620

Gln Ile Ile Ala Glu Val Phe Lys Arg Phe Lys Ile Thr Glu Thr Ser

625 630 635 640

Lys Met Leu Asp Arg Met Lys Asp Leu Gly Phe Gln Tyr Ser Thr Lys

645 650 655

Ala Gly Ile Thr Ile Gly Val Ala Asp Ile Val Val Leu Pro Glu Lys

660 665 670

Gln Glu Ile Leu Asp Glu Ala Gln Ala Lys Val Asp Thr Val Leu Lys

675 680 685

Gln Phe Arg Arg Gly Leu Ile Thr Asp Glu Glu Arg Tyr Glu Arg Val

690 695 700

Ile Ser Ile Trp Ser Ala Ala Lys Asp Lys Ile Gln Asp Arg Leu Met

705 710 715 720

Lys Ser Leu Asp Lys Arg Asn Pro Ile Phe Met Met Ser Asp Ser Gly

725 730 735

Ala Arg Gly Asn Ala Ser Asn Phe Thr Gln Leu Ala Gly Met Arg Gly

740 745 750

Leu Met Ala Asn Pro Ala Gly Arg Ile Ile Glu Leu Pro Ile Lys Ser

755 760 765

Ser Phe Arg Glu Gly Leu Thr Val Leu Glu Tyr Phe Ile Ser Thr His

770 775 780

Gly Ala Arg Lys Gly Leu Ala Asp Thr Ala Leu Lys Thr Ala Asp Ser

785 790 795 800

Gly Tyr Leu Thr Arg Arg Leu Val Asp Val Ala Gln Asp Val Ile Val

805 810 815

Arg Glu Glu Asp Cys Gly Thr Asp Arg Gly Ile Leu Ala Arg Ala Leu

820 825 830

Thr Asp Gly Thr Glu Val Val Val Lys Leu Glu Glu Arg Leu Val Gly

835 840 845

Arg Tyr Ala His Lys Thr Val Arg His Pro Glu Thr Gly Glu Val Ile

850 855 860

Val Arg Lys Asp Glu Met Ile Thr Glu Asp Ile Ala Asn Glu Ile Ile

865 870 875 880

Lys Ala Gly Ile Thr Glu Val Trp Ile Arg Ser Val Phe Ala Cys Asn

885 890 895

Thr Arg His Gly Val Cys Lys Lys Cys Tyr Gly Arg Asn Met Ala Thr

900 905 910

Gly Met Asp Val Glu Val Gly Glu Ala Val Gly Ile Ile Ala Ala Gln

915 920 925

Ser Ile Gly Glu Pro Gly Thr Gln Leu Thr Met Arg Thr Phe His Thr

930 935 940

Gly Gly Val Ala Gly Asp Asp Ile Thr Gln Gly Leu Pro Arg Val Gln

945 950 955 960

Glu Leu Phe Glu Ala Arg Asn Pro Lys Gly Gln Ala Val Ile Ser Glu

965 970 975

Ile Asp Gly Thr Val Ile Ser Ile Asn Glu Thr Arg Asp Asn Gln Tyr

980 985 990

Glu Ile Val Val Gln Ser Glu Val Glu Thr Arg Thr Tyr Val Ala Pro

995 1000 1005

Tyr Asn Ala Arg Leu Lys Val Glu Glu Gly Gln Arg Val Glu Arg

1010 1015 1020

Gly Gln Glu Leu Thr Glu Gly Ser Val Asp Pro Lys Gln Leu Leu

1025 1030 1035

Arg Val Arg Asp Ile Thr Ser Val Gln Glu Tyr Leu Leu Arg Glu

1040 1045 1050

Val Gln Lys Val Tyr Arg Met Gln Gly Val Glu Ile Ser Asp Lys

1055 1060 1065

His Ile Glu Val Met Val Arg Gln Met Leu Arg Lys Val Arg Val

1070 1075 1080

Ile Asp Ala Gly Asp Thr Asp Val Leu Pro Gly Thr Leu Leu Asp

1085 1090 1095

Val His Gln Phe Thr Asp Val Asn Ala Lys Ala Leu Arg Glu Gly

1100 1105 1110

Lys Arg Pro Ala Thr Ala Arg Gln Val Leu Leu Gly Ile Thr Lys

1115 1120 1125

Ala Ser Leu Glu Thr Asp Ser Phe Leu Ser Ala Ala Ser Phe Gln

1130 1135 1140

Glu Thr Thr Arg Val Leu Thr Asp Ala Ala Ile Lys Gly Lys Arg

1145 1150 1155

Asp Glu Leu Leu Gly Leu Lys Glu Asn Val Ile Ile Gly Lys Leu

1160 1165 1170

Val Pro Ala Gly Thr Gly Met Ala Arg Tyr Arg Lys Val Lys Pro

1175 1180 1185

Ala Val Lys Lys Glu Thr Ala Gly Gly Thr Val Ser Ser Lys Gly

1190 1195 1200

Arg Arg Ala Ala

1205

<210> 5

<211> 193

<212> PRT

<213> Bacteria

<400> 5

Ser Gly Ser Ser Met Ser Leu Gln Gln Gln Tyr Ser Pro Glu Glu Leu

1 5 10 15

Gln Glu Met Ser Phe Val Glu Leu Ala Asn Leu Ile Leu Leu Asp Lys

20 25 30

Arg Glu Ala Leu Pro Phe Asp Gln Leu Val Arg Glu Ala Ala Ala Leu

35 40 45

Ala Gly Ile Ser Glu Glu Glu Met Glu Ala Arg Leu Ala Gln Tyr Tyr

50 55 60

Thr Asp Leu Asn Ile Asp Gly Arg Phe Ile Cys Val Gly Glu Asn Val

65 70 75 80

Trp Gly Arg Ala Trp Tyr Pro Phe Asp Gln Thr Glu Asp Glu Thr Val

85 90 95

Thr Ile Val Lys Pro Lys Lys Lys Lys Lys Ala Leu Asp Asp Glu Tyr

100 105 110

Asp Glu Tyr Asp Glu Leu Leu Glu Asp Glu Asp Leu Asp Tyr Asp Asp

115 120 125

Leu Asp Glu Tyr Asp Glu Glu Glu Leu Glu Leu Asp Glu Asp Glu Leu

130 135 140

Leu Glu Asp Glu Glu Phe Asp Leu Asp Glu Asp Val Ala Phe Asp Asp

145 150 155 160

Asp Ile Leu Gly Asp Glu Glu Phe Glu Leu Gly Asp Ala Pro Leu Asp

165 170 175

Glu Glu Leu Asp Leu Glu Glu Pro Glu Glu Asp Glu Gly Arg Arg Ala

180 185 190

Ala

<210> 6

<211> 75

<212> PRT

<213> Bacteria

<400> 6

Ser Gly Ser Ser Met Leu Tyr Pro Ser Ile Asp Leu Leu Met Gln Lys

1 5 10 15

Val Asp Ser Lys Tyr Lys Leu Val Thr Val Val Ala Lys Arg Ala Arg

20 25 30

Glu Leu Gln Asp Gly Ala Glu Leu Met Val Lys Lys Pro Val Ser Lys

35 40 45

Lys Phe Val Gly Gln Ala Leu Glu Glu Ile Ala Gly Asp Lys Val Glu

50 55 60

Leu Val Glu Glu Glu Lys Gly Arg Arg Ala Ala

65 70 75

<210> 7

<211> 408

<212> PRT

<213> Bacteria

<400> 7

Met His His His His His His Gly Lys Pro Ile Pro Asn Pro Leu Leu

1 5 10 15

Gly Leu Asp Ser Thr Glu Asn Leu Tyr Phe Gln Gly Ile Asp Pro Phe

20 25 30

Thr Met Ala Glu Lys Pro Ala Gln Ser Lys Gln Ala Glu Ala Ala Gly

35 40 45

Glu Ser Leu Glu Gln Val Lys Glu Gln Leu Ala Glu Leu Gly Lys Lys

50 55 60

Arg Gly Ile Leu Thr Tyr Glu Glu Ile Ala Glu Arg Leu Ser Gly Phe

65 70 75 80

Asp Leu Asp Ser Asp Gln Met Asp Glu Tyr Tyr Glu Tyr Leu Ala Glu

85 90 95

Gln Gly Ile Glu Val Ile Ser Glu Ser Asp Leu Glu Ala Asp Pro Asp

100 105 110

Ile Asp Asp Leu Ala Lys Glu Glu Glu Phe Asp Leu Asn Asp Leu Ser

115 120 125

Val Pro Pro Gly Val Lys Ile Asn Asp Pro Val Arg Met Tyr Leu Lys

130 135 140

Glu Ile Gly Arg Val Pro Leu Leu Ser Ala Glu Glu Glu Ile Glu Leu

145 150 155 160

Ala Lys Arg Ile Glu Gln Gly Asp Glu Glu Ala Lys Arg Arg Leu Thr

165 170 175

Glu Ala Asn Leu Arg Leu Val Val Ser Ile Ala Lys Arg Tyr Val Gly

180 185 190

Arg Gly Met Leu Phe Leu Asp Leu Ile Gln Glu Gly Asn Met Gly Leu

195 200 205

Ile Lys Ala Val Glu Lys Phe Asp Tyr Arg Lys Gly Tyr Lys Phe Ser

210 215 220

Thr Tyr Ala Thr Trp Trp Ile Arg Gln Ala Ile Thr Arg Ala Ile Ala

225 230 235 240

Asp Gln Ala Arg Thr Ile Arg Ile Pro Val His Met Val Glu Thr Ile

245 250 255

Asn Lys Leu Ile Arg Val Gln Arg Gln Leu Leu Gln Asp Leu Gly Arg

260 265 270

Glu Pro Thr Pro Glu Glu Ile Ala Glu Glu Met Asp Leu Thr Pro Glu

275 280 285

Lys Val Arg Glu Ile Leu Lys Ile Ala Gln Glu Pro Val Ser Leu Glu

290 295 300

Thr Pro Ile Gly Glu Glu Asp Asp Ser His Leu Gly Asp Phe Ile Glu

305 310 315 320

Asp Gln Asp Ala Thr Ser Pro Ser Glu His Ala Ala Tyr Glu Leu Leu

325 330 335

Lys Glu Gln Leu Glu Asp Val Leu Asp Thr Leu Thr Asp Arg Glu Glu

340 345 350

Asn Val Leu Arg Leu Arg Phe Gly Leu Asp Asp Gly Arg Thr Arg Thr

355 360 365

Leu Glu Glu Val Gly Lys Val Phe Gly Val Thr Arg Glu Arg Ile Arg

370 375 380

Gln Ile Glu Ala Lys Ala Leu Arg Lys Leu Arg His Pro Ser Arg Ser

385 390 395 400

Lys Arg Leu Lys Asp Phe Leu Glu

405

<210> 8

<211> 224

<212> PRT

<213> Bacteria

<400> 8

Ser Gly Ser Ser Met Asn Leu Val Leu Met Gly Leu Pro Gly Ala Gly

1 5 10 15

Lys Gly Thr Gln Ala Gly Lys Ile Val Glu Ala Tyr Gly Ile Pro His

20 25 30

Ile Ser Thr Gly Asp Met Phe Arg Ala Ala Ile Lys Glu Gly Thr Pro

35 40 45

Leu Gly Leu Gln Ala Lys Gln Tyr Met Asp Arg Gly Asp Leu Val Pro

50 55 60

Asp Glu Leu Gln Ala Lys Gln Tyr Met Asp Arg Gly Asp Leu Val Pro

65 70 75 80

Asp Glu Gly Phe Leu Leu Asp Gly Phe Pro Arg Thr Val Ala Gln Ala

85 90 95

Glu Ala Leu Glu Thr Leu Leu Ser Glu Ile Gly Arg Lys Leu Asp Tyr

100 105 110

Val Ile His Ile Asp Val Arg Gln Glu Val Leu Met Glu Arg Leu Thr

115 120 125

Gly Arg Arg Ile Cys Arg Asn Cys Gly Ala Thr Tyr His Leu Val Phe

130 135 140

His Pro Pro Ala Lys Pro Gly Val Cys Asp Lys Cys Gly Gly Asp Leu

145 150 155 160

Tyr Gln Arg Pro Asp Asn Glu Ala Thr Val Ala Asn Arg Leu Glu Val

165 170 175

Asn Met Lys Gln Met Lys Leu Leu Leu Asp Phe Tyr Glu Gln Lys Gly

180 185 190

Tyr Leu Arg His Ile Asn Gly Glu Gln Glu Met Glu Lys Val Phe Ala

195 200 205

Asp Ile Cys Glu Val Leu Gly Gly Leu Ala Arg Gly Arg Arg Ala Ala

210 215 220

<210> 9

<211> 697

<212> PRT

<213> Bacteria

<400> 9

Ser Gly Ser Ser Met Gly Gln Glu Lys Leu Tyr Ile Glu Lys Glu Leu

1 5 10 15

Ser Trp Leu Ser Phe Asn Glu Arg Val Leu Gln Glu Ala Ala Asp Lys

20 25 30

Ser Asn Pro Leu Ile Glu Arg Met Arg Phe Leu Gly Ile Tyr Ser Asn

35 40 45

Asn Leu Asp Glu Phe Tyr Lys Val Arg Phe Ala Glu Leu Lys Arg Arg

50 55 60

Ile Ile Ile Ser Glu Glu Gln Gly Ser Asn Ser His Ser Arg His Leu

65 70 75 80

Leu Gly Lys Ile Gln Ser Arg Val Leu Lys Ala Asp Gln Glu Phe Asp

85 90 95

Gly Leu Tyr Asn Glu Leu Leu Leu Glu Met Ala Arg Asn Gln Ile Phe

100 105 110

Leu Ile Asn Glu Arg Gln Leu Ser Val Asn Gln Gln Asn Trp Leu Arg

115 120 125

His Tyr Phe Lys Gln Tyr Leu Arg Gln His Ile Thr Pro Ile Leu Ile

130 135 140

Asn Pro Asp Thr Asp Leu Val Gln Phe Leu Lys Asp Asp Tyr Thr Tyr

145 150 155 160

Leu Ala Val Glu Ile Ile Arg Gly Asp Thr Ile Arg Tyr Ala Leu Leu

165 170 175

Glu Ile Pro Ser Asp Lys Val Pro Arg Phe Val Asn Leu Pro Pro Glu

180 185 190

Ala Pro Arg Arg Arg Lys Pro Met Ile Leu Leu Asp Asn Ile Leu Arg

195 200 205

Tyr Cys Leu Asp Asp Ile Phe Lys Gly Phe Phe Asp Tyr Asp Ala Leu

210 215 220

Asn Ala Tyr Ser Met Lys Met Thr Arg Asp Ala Glu Tyr Asp Leu Val

225 230 235 240

His Glu Met Glu Ala Ser Leu Met Glu Leu Met Ser Ser Ser Leu Lys

245 250 255

Gln Arg Leu Thr Ala Glu Pro Val Arg Phe Val Tyr Gln Arg Asp Met

260 265 270

Pro Asn Ala Leu Val Glu Val Leu Arg Glu Lys Leu Thr Ile Ser Arg

275 280 285

Tyr Asp Ser Ile Val Pro Gly Gly Arg Tyr His Asn Phe Lys Asp Phe

290 295 300

Ile Asn Phe Pro Asn Val Gly Lys Ala Asn Leu Val Asn Lys Pro Leu

305 310 315 320

Pro Arg Leu Arg His Ile Trp Phe Asp Lys Ala Gln Phe Arg Asn Gly

325 330 335

Phe Asp Ala Ile Arg Glu Arg Asp Val Leu Leu Tyr Tyr Pro Tyr His

340 345 350

Thr Phe Glu His Val Leu Glu Leu Leu Arg Gln Ala Ser Phe Asp Pro

355 360 365

Ser Val Leu Ala Ile Lys Ile Asn Ile Tyr Arg Val Ala Lys Asp Ser

370 375 380

Arg Ile Ile Asp Ser Met Ile His Ala Ala His Asn Gly Lys Lys Val

385 390 395 400

Thr Val Val Val Glu Leu Gln Ala Arg Phe Asp Glu Glu Ala Asn Ile

405 410 415

His Trp Ala Lys Arg Leu Thr Glu Ala Gly Val His Val Ile Phe Ser

420 425 430

Ala Pro Gly Leu Lys Ile His Ala Lys Leu Phe Leu Ile Ser Arg Lys

435 440 445

Glu Asn Gly Glu Val Val Arg Tyr Ala His Ile Gly Thr Gly Asn Phe

450 455 460

Asn Glu Lys Thr Ala Arg Leu Tyr Thr Asp Tyr Ser Leu Leu Thr Ala

465 470 475 480

Asp Ala Arg Ile Thr Asn Glu Val Arg Arg Val Phe Asn Phe Ile Glu

485 490 495

Asn Pro Tyr Arg Pro Val Thr Phe Asp Tyr Leu Met Val Ser Pro Gln

500 505 510

Asn Ser Arg Arg Leu Leu Tyr Glu Met Val Asp Arg Glu Ile Ala Asn

515 520 525

Ala Gln Gln Gly Leu Pro Ser Gly Ile Thr Leu Lys Leu Asn Asn Leu

530 535 540

Val Asp Lys Gly Leu Val Asp Arg Leu Tyr Ala Ala Ser Ser Ser Gly

545 550 555 560

Val Pro Val Asn Leu Leu Val Arg Gly Met Cys Ser Leu Ile Pro Asn

565 570 575

Leu Glu Gly Ile Ser Asp Asn Ile Arg Ala Ile Ser Ile Val Asp Arg

580 585 590

Tyr Leu Glu His Asp Arg Val Tyr Ile Phe Glu Asn Gly Gly Asp Lys

595 600 605

Lys Val Tyr Leu Ser Ser Ala Asp Trp Met Thr Arg Asn Ile Asp Tyr

610 615 620

Arg Ile Glu Val Ala Thr Pro Leu Leu Asp Pro Arg Leu Lys Gln Arg

625 630 635 640

Val Leu Asp Ile Ile Asp Ile Leu Phe Ser Asp Thr Val Lys Ala Arg

645 650 655

Tyr Ile Asp Lys Glu Leu Ser Asn Arg Tyr Val Pro Arg Gly Asn Arg

660 665 670

Arg Lys Val Arg Ala Gln Leu Ala Ile Tyr Asp Tyr Ile Lys Ser Leu

675 680 685

Glu Gln Pro Glu Gly Arg Arg Ala Ala

690 695

<210> 10

<211> 608

<212> PRT

<213> Bacteria

<400> 10

Met Arg Leu Leu Pro Glu Glu Ser Trp Leu Gln Phe Asn Arg Arg Val

1 5 10 15

Leu Arg Gln Ser Glu Arg Pro Asp Phe Pro Leu Leu Glu Arg Met Arg

20 25 30

Phe Leu Ala Ile Trp Asn Arg Asn Leu Asp Glu Phe Phe Ala Ala Arg

35 40 45

Ile Ala Lys Pro Phe Leu Lys His Arg Gly Ser Ala His Leu Arg Leu

50 55 60

Leu Lys Glu Ala Glu Asp Gln Ala Arg Leu Ala Glu Gly Arg Tyr Arg

65 70 75 80

Ala Leu Leu Ala Glu Ala Ala Pro His Leu Lys Ile Leu Glu Pro Glu

85 90 95

Glu Leu Asp Asp Leu Asp Trp Leu Tyr Phe Arg Val Phe Leu Ala Glu

100 105 110

Val Val Val Pro Lys Thr Asp Leu Ile Ala Trp Glu Ala Ala Lys Glu

115 120 125

Ala Ser His Gly Ala Leu Tyr Phe Ala Ser Glu Asp His Leu Val Arg

130 135 140

Leu Pro Gln Asp Leu Pro Arg Leu Leu Lys Val Pro Gly Arg Glu Gly

145 150 155 160

Thr Tyr Val Arg Leu Gly Ala Leu Met Arg Ala Arg Ser Asp Leu Phe

165 170 175

Leu Pro Arg Glu Ser Pro Leu Tyr Glu Phe Arg Val Leu Arg Leu Leu

180 185 190

Glu Ser Glu Arg Ala Arg Ala Asp Trp Asp Glu Leu Ala Gln Ala Leu

195 200 205

Glu Gly Arg Gln Glu Gly Leu Ser Thr Leu Leu Val Ala Glu Arg Gly

210 215 220

Phe Pro Lys Gly Trp Leu Glu Gly Leu Gln Glu Ala Leu Gly Leu Leu

225 230 235 240

Pro Glu Glu Val Ile Leu Leu Ser Pro Pro Leu Asn Leu Thr Leu Val

245 250 255

Glu Thr Leu Val Ala Glu Gly Pro Ser Arg Trp Arg Phe Pro Pro Leu

260 265 270

Glu Pro Lys Arg Pro Arg Ala Phe Met Lys Asn Pro Leu Lys Arg Leu

275 280 285

Gln Glu Lys Asp Leu Val Leu Tyr His Pro Phe Glu Asp Tyr Ala Ala

290 295 300

Leu Glu Arg Phe Ala Glu Ala Ala Leu Ser Glu Glu Val Glu Glu Val

305 310 315 320

Tyr Ala Thr Leu Tyr Arg Ile Gly Glu Ala Asn Pro Leu Ala Glu Ala

325 330 335

Leu Ile Gln Ala Ala Arg Ala Gly Lys Arg Val His Val Leu Leu Glu

340 345 350

Pro Arg Ala Arg Phe Asp Glu Leu Leu Asn Leu Ser Trp Tyr Leu Arg

355 360 365

Phe Leu Arg Ala Gly Val Ala Val Leu Pro Leu Ser Glu Arg Lys Val

370 375 380

His Ala Lys Ala Leu Leu Leu Leu Thr Gln Lys Gly Gly Tyr Ala His

385 390 395 400

Leu Gly Thr Gly Asn Tyr Asn Pro Gln Asn Gly Arg Gln Tyr Thr Asp

405 410 415

Phe Ser Leu Phe Thr Ala Arg Lys Glu Val Val Met Glu Val Ala Glu

420 425 430

Phe Phe Arg Ala Leu Gln Glu Gly Arg Thr Pro Arg Leu Asn Leu Leu

435 440 445

Lys Thr Gly Glu Ala Ile Gln Glu Leu Leu Leu Glu His Ile Arg Ala

450 455 460

Glu Ser His Pro Lys Gly Arg Ile Leu Leu Lys Cys Asn His Leu Thr

465 470 475 480

Asp Pro Ala Leu Leu Glu Ala Leu Ala Arg Ala Ala Asp Lys Gly Ala

485 490 495

Arg Val Asp Leu Ile Val Arg Ser Thr Leu Thr Leu Leu His Pro Arg

500 505 510

Phe Arg Ala Arg Ser Leu Val Gly Arg Phe Leu Glu His Ala Arg Val

515 520 525

Ala Ala Phe Tyr Gln Gly Gly Arg Trp Ala Leu Tyr Leu Thr Ser Ala

530 535 540

Asp Leu Met Pro Arg Asn Phe Gln Asn Arg Phe Glu Leu Leu Phe Pro

545 550 555 560

Val Leu Asp Lys Glu Gly Lys Ala Lys Val Leu Glu Val Leu Lys Arg

565 570 575

Gln Leu Lys Asp Asp Arg Asn Ala Phe Leu Leu Ser Pro Lys Gly Glu

580 585 590

Thr Pro Leu Trp Gly Gly Arg His Asp Ala Gln Arg Ile Leu Ala Trp

595 600 605

<210> 11

<211> 641

<212> PRT

<213> Bacteria

<400> 11

Met His His His His His His Gly Lys Pro Ile Pro Asn Pro Leu Leu

1 5 10 15

Gly Leu Asp Ser Thr Glu Asn Leu Tyr Phe Gln Gly Ile Asp Pro Phe

20 25 30

Thr Met Arg Leu Leu Pro Glu Glu Ser Trp Leu Gln Phe Asn Arg Arg

35 40 45

Val Leu Arg Gln Ser Glu Arg Pro Asp Phe Pro Leu Leu Glu Arg Met

50 55 60

Arg Phe Leu Ala Ile Trp Asn Arg Asn Leu Asp Glu Phe Phe Ala Ala

65 70 75 80

Arg Ile Ala Lys Pro Phe Leu Lys His Arg Gly Ser Glu Ala His Leu

85 90 95

Arg Leu Leu Lys Glu Ala Glu Asp Gln Ala Arg Leu Ala Glu Gly Arg

100 105 110

Tyr Arg Ala Leu Leu Ala Glu Ala Ala Pro His Leu Lys Ile Leu Glu

115 120 125

Pro Glu Glu Leu Asp Asp Leu Asp Trp Leu Tyr Phe Arg Val Phe Leu

130 135 140

Ala Glu Val Val Val Pro Lys Thr Asp Leu Ile Ala Trp Glu Ala Ala

145 150 155 160

Lys Glu Ala Ser His Gly Ala Leu Tyr Phe Ala Ser Glu Asp His Leu

165 170 175

Val Arg Leu Pro Gln Asp Leu Pro Arg Leu Leu Lys Val Pro Gly Arg

180 185 190

Glu Gly Thr Tyr Val Arg Leu Gly Ala Leu Met Arg Ala Arg Ser Asp

195 200 205

Leu Phe Leu Pro Arg Glu Ser Pro Leu Tyr Glu Phe Arg Val Leu Arg

210 215 220

Leu Leu Glu Ser Glu Arg Ala Arg Ala Asp Trp Asp Glu Leu Ala Gln

225 230 235 240

Ala Leu Glu Gly Arg Gln Glu Gly Leu Ser Thr Leu Leu Val Ala Glu

245 250 255

Arg Gly Phe Pro Lys Gly Trp Leu Glu Gly Leu Gln Glu Ala Leu Gly

260 265 270

Leu Leu Pro Glu Glu Val Ile Leu Leu Ser Pro Pro Leu Asn Leu Thr

275 280 285

Leu Val Glu Thr Leu Val Ala Glu Gly Pro Ser Arg Trp Arg Phe Pro

290 295 300

Pro Leu Glu Pro Lys Arg Pro Arg Ala Phe Met Lys Asn Pro Leu Lys

305 310 315 320

Arg Leu Gln Glu Lys Asp Leu Val Leu Tyr His Pro Phe Glu Asp Tyr

325 330 335

Ala Ala Leu Glu Arg Phe Ala Glu Ala Ala Leu Ser Glu Glu Val Glu

340 345 350

Glu Val Tyr Ala Thr Leu Tyr Arg Ile Gly Glu Ala Asn Pro Leu Ala

355 360 365

Glu Ala Leu Ile Gln Ala Ala Arg Ala Gly Lys Arg Val His Val Leu

370 375 380

Leu Glu Pro Arg Ala Arg Phe Asp Glu Leu Leu Asn Leu Ser Trp Tyr

385 390 395 400

Leu Arg Phe Leu Arg Ala Gly Val Ala Val Leu Pro Leu Ser Glu Arg

405 410 415

Lys Val His Ala Lys Ala Leu Leu Leu Leu Thr Gln Lys Gly Gly Tyr

420 425 430

Ala His Leu Gly Thr Gly Asn Tyr Asn Pro Gln Asn Gly Arg Gln Tyr

435 440 445

Thr Asp Phe Ser Leu Phe Thr Ala Arg Lys Glu Val Val Met Glu Val

450 455 460

Ala Glu Phe Phe Arg Ala Leu Gln Glu Gly Arg Thr Pro Arg Leu Asn

465 470 475 480

Leu Leu Lys Thr Gly Glu Ala Ile Gln Glu Leu Leu Leu Glu His Ile

485 490 495

Arg Ala Glu Ser His Pro Lys Gly Arg Ile Leu Leu Lys Cys Asn His

500 505 510

Leu Thr Asp Pro Ala Leu Leu Glu Ala Leu Ala Arg Ala Ala Asp Lys

515 520 525

Gly Ala Arg Val Asp Leu Ile Val Arg Ser Thr Leu Thr Leu Leu His

530 535 540

Pro Arg Phe Arg Ala Arg Ser Leu Val Gly Arg Phe Leu Glu His Ala

545 550 555 560

Arg Val Ala Ala Phe Tyr Gln Gly Gly Arg Trp Ala Leu Tyr Leu Thr

565 570 575

Ser Ala Asp Leu Met Pro Arg Asn Phe Gln Asn Arg Phe Glu Leu Leu

580 585 590

Phe Pro Val Leu Asp Lys Glu Gly Lys Ala Lys Val Leu Glu Val Leu

595 600 605

Lys Arg Gln Leu Lys Asp Asp Arg Asn Ala Phe Leu Leu Ser Pro Lys

610 615 620

Gly Glu Thr Pro Leu Trp Gly Gly Arg His Asp Ala Gln Arg Ile Ala

625 630 635 640

Trp

<210> 12

<211> 457

<212> PRT

<213> Bacteria

<400> 12

Met Pro Ile Thr Ile Asn Asn Phe Arg Tyr Ser Asp Pro Val Asn Asn

1 5 10 15

Asp Thr Ile Ile Met Met Glu Pro Pro Tyr Cys Lys Gly Leu Asp Ile

20 25 30

Tyr Tyr Lys Ala Phe Lys Ile Thr Asp Arg Ile Trp Ile Val Pro Glu

35 40 45

Arg Tyr Glu Phe Gly Thr Lys Pro Glu Asp Phe Asn Pro Pro Ser Ser

50 55 60

Leu Ile Glu Gly Ala Ser Glu Tyr Tyr Asp Pro Asn Tyr Leu Arg Thr

65 70 75 80

Asp Ser Asp Lys Asp Arg Phe Leu Gln Thr Met Val Lys Leu Phe Asn

85 90 95

Arg Ile Lys Asn Asn Val Ala Gly Glu Ala Leu Leu Asp Lys Ile Ile

100 105 110

Asn Ala Ile Pro Tyr Leu Gly Asn Ser Tyr Ser Leu Leu Asp Lys Phe

115 120 125

Asp Thr Asn Ser Asn Ser Val Ser Phe Asn Leu Leu Glu Gln Asp Pro

130 135 140

Ser Gly Ala Thr Thr Lys Ser Ala Met Leu Thr Asn Leu Ile Ile Phe

145 150 155 160

Gly Pro Gly Pro Val Leu Asn Lys Asn Glu Val Arg Gly Ile Val Leu

165 170 175

Arg Val Asp Asn Lys Asn Tyr Phe Pro Cys Arg Asp Gly Phe Gly Ser

180 185 190

Ile Met Gln Met Ala Phe Cys Pro Glu Tyr Val Pro Thr Phe Asp Asn

195 200 205

Val Ile Glu Asn Ile Thr Ser Leu Thr Ile Gly Lys Ser Lys Tyr Phe

210 215 220

Gln Asp Pro Ala Leu Leu Leu Met His Glu Leu Ile His Val Leu His

225 230 235 240

Gly Leu Tyr Gly Met Gln Val Ser Ser His Glu Ile Ile Pro Ser Lys

245 250 255

Gln Glu Ile Tyr Met Gln His Thr Tyr Pro Ile Ser Ala Glu Glu Leu

260 265 270

Phe Thr Phe Gly Gly Gln Asp Ala Asn Leu Ile Ser Ile Asp Ile Lys

275 280 285

Asn Asp Leu Tyr Glu Lys Thr Leu Asn Asp Tyr Lys Ala Ile Ala Asn

290 295 300

Lys Leu Ser Gln Val Thr Ser Cys Asn Asp Pro Asn Ile Asp Ile Asp

305 310 315 320

Ser Tyr Lys Gln Ile Tyr Gln Gln Lys Tyr Gln Phe Asp Lys Asp Ser

325 330 335

Asn Gly Gln Tyr Ile Val Asn Glu Asp Lys Phe Gln Ile Leu Tyr Asn

340 345 350

Ser Ile Met Tyr Gly Phe Thr Glu Ile Glu Leu Gly Lys Lys Phe Asn

355 360 365

Ile Lys Thr Arg Leu Ser Tyr Phe Ser Met Asn His Asp Pro Val Lys

370 375 380

Ile Pro Asn Leu Leu Asp Asp Thr Ile Tyr Asn Asp Thr Glu Gly Phe

385 390 395 400

Asn Ile Glu Ser Lys Asp Leu Lys Ser Glu Tyr Lys Gly Gln Asn Met

405 410 415

Arg Val Asn Thr Asn Ala Phe Arg Asn Val Asp Gly Ser Gly Leu Val

420 425 430

Ser Lys Leu Ile Gly Leu Cys Lys Lys Ile Ile Pro Pro Thr Asn Ile

435 440 445

Arg Glu Asn Leu Tyr Asn Arg Thr Ala

450 455

<210> 13

<211> 8

<212> PRT

<213> Bacteria

<400> 13

Met His Glu Leu Ile His Val Leu

1 5

<210> 14

<211> 861

<212> PRT

<213> Bacteria

<400> 14

Ser Leu Thr Asp Leu Gly Gly Glu Leu Cys Ile Lys Ile Lys Asn Glu

1 5 10 15

Asp Leu Thr Phe Ile Ala Glu Lys Asn Ser Phe Ser Glu Glu Pro Phe

20 25 30

Gln Asp Glu Ile Val Ser Tyr Asn Thr Lys Asn Lys Pro Leu Asn Phe

35 40 45

Asn Tyr Ser Leu Asp Lys Ile Ile Val Asp Tyr Asn Leu Gln Ser Lys

50 55 60

Ile Thr Leu Pro Asn Asp Arg Thr Thr Pro Val Thr Lys Gly Ile Pro

65 70 75 80

Tyr Ala Pro Glu Tyr Lys Ser Asn Ala Ala Ser Thr Ile Glu Ile His

85 90 95

Asn Ile Asp Asp Asn Thr Ile Tyr Gln Tyr Leu Tyr Ala Gln Lys Ser

100 105 110

Pro Thr Thr Leu Gln Arg Ile Thr Met Thr Asn Ser Val Asp Asp Ala

115 120 125

Leu Ile Asn Ser Thr Lys Ile Tyr Ser Tyr Phe Pro Ser Val Ile Ser

130 135 140

Lys Val Asn Gln Gly Ala Gln Gly Ile Leu Phe Leu Gln Trp Val Arg

145 150 155 160

Asp Ile Ile Asp Asp Phe Thr Asn Glu Ser Ser Gln Lys Thr Thr Ile

165 170 175

Asp Lys Ile Ser Asp Val Ser Thr Ile Val Pro Tyr Ile Gly Pro Ala

180 185 190

Leu Asn Ile Val Lys Gln Gly Tyr Glu Gly Asn Phe Ile Gly Ala Leu

195 200 205

Glu Thr Thr Gly Val Val Leu Leu Leu Glu Tyr Ile Pro Glu Ile Thr

210 215 220

Leu Pro Val Ile Ala Ala Leu Ser Ile Ala Glu Ser Ser Thr Gln Lys

225 230 235 240

Glu Lys Ile Ile Lys Thr Ile Asp Asn Phe Leu Glu Lys Arg Tyr Glu

245 250 255

Lys Trp Ile Glu Val Tyr Lys Leu Val Lys Ala Lys Trp Leu Gly Thr

260 265 270

Val Asn Thr Gln Phe Gln Lys Arg Ser Tyr Gln Met Tyr Arg Ser Leu

275 280 285

Glu Tyr Gln Val Asp Ala Ile Lys Lys Ile Ile Asp Tyr Glu Tyr Lys

290 295 300

Ile Tyr Ser Gly Pro Asp Lys Glu Gln Ile Ala Asp Glu Ile Asn Asn

305 310 315 320

Leu Lys Asn Lys Leu Glu Glu Lys Ala Asn Lys Ala Met Ile Asn Ile

325 330 335

Asn Ile Phe Met Arg Glu Ser Ser Arg Ser Phe Leu Val Asn Gln Met

340 345 350

Ile Asn Glu Ala Lys Lys Gln Leu Leu Glu Phe Asp Thr Gln Ser Lys

355 360 365

Asn Ile Leu Met Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile

370 375 380

Thr Glu Leu Lys Lys Leu Glu Ser Lys Ile Asn Lys Val Phe Ser Thr

385 390 395 400

Pro Ile Pro Phe Ser Tyr Ser Lys Asn Leu Asp Cys Trp Val Asp Asn

405 410 415

Glu Glu Asp Ile Asp Val Ile Leu Lys Lys Ser Thr Ile Leu Asn Leu

420 425 430

Asp Ile Asn Asn Asp Ile Ile Ser Asp Ile Ser Gly Phe Asn Ser Ser

435 440 445

Val Ile Thr Tyr Pro Asp Ala Gln Leu Val Pro Gly Ile Asn Gly Lys

450 455 460

Ala Ile His Leu Val Asn Asn Glu Ser Ser Glu Val Ile Val His Lys

465 470 475 480

Ala Met Asp Ile Glu Tyr Asn Asp Met Phe Asn Asn Phe Thr Val Ser

485 490 495

Phe Trp Leu Arg Val Pro Lys Val Ser Ala Ser His Leu Glu Gln Tyr

500 505 510

Gly Thr Asn Glu Tyr Ser Ile Ile Ser Ser Met Lys Lys His Ser Leu

515 520 525

Ser Ile Gly Ser Gly Trp Ser Val Ser Leu Lys Gly Asn Asn Leu Ile

530 535 540

Trp Thr Leu Lys Asp Ser Ala Gly Glu Val Arg Gln Ile Thr Phe Arg

545 550 555 560

Asp Leu Pro Asp Lys Phe Asn Ala Tyr Leu Ala Asn Lys Trp Val Phe

565 570 575

Ile Thr Ile Thr Asn Asp Arg Leu Ser Ser Ala Asn Leu Tyr Ile Asn

580 585 590

Gly Val Leu Met Gly Ser Ala Glu Ile Thr Gly Leu Gly Ala Ile Arg

595 600 605

Glu Asp Asn Asn Ile Thr Leu Lys Leu Asp Arg Cys Asn Asn Asn Asn

610 615 620

Gln Tyr Val Ser Ile Asp Lys Phe Arg Ile Phe Cys Lys Ala Leu Asn

625 630 635 640

Pro Lys Glu Ile Glu Lys Leu Tyr Thr Ser Tyr Leu Ser Ile Thr Phe

645 650 655

Leu Arg Asp Phe Trp Gly Asn Pro Leu Arg Tyr Asp Thr Glu Tyr Tyr

660 665 670

Leu Ile Pro Val Ala Ser Ser Ser Lys Asp Val Gln Leu Lys Asn Ile

675 680 685

Thr Asp Tyr Met Tyr Leu Thr Asn Ala Pro Ser Tyr Thr Asn Gly Lys

690 695 700

Leu Asn Ile Tyr Tyr Arg Arg Leu Tyr Asn Gly Leu Lys Phe Ile Ile

705 710 715 720

Lys Arg Tyr Thr Pro Asn Asn Glu Ile Asp Ser Phe Val Lys Ser Gly

725 730 735

Asp Phe Ile Lys Leu Tyr Val Ser Tyr Asn Asn Asn Glu His Ile Val

740 745 750

Gly Tyr Pro Lys Asp Gly Asn Ala Phe Asn Asn Leu Asp Arg Ile Leu

755 760 765

Arg Val Gly Tyr Asn Ala Pro Gly Ile Pro Leu Tyr Lys Lys Met Glu

770 775 780

Ala Val Lys Leu Arg Asp Leu Lys Thr Tyr Ser Val Gln Leu Lys Leu

785 790 795 800

Tyr Asp Asp Lys Asn Ala Ser Leu Gly Leu Val Gly Thr His Asn Gly

805 810 815

Gln Ile Gly Asn Asp Pro Asn Arg Asp Ile Leu Ile Ala Ser Asn Trp

820 825 830

Tyr Phe Asn His Leu Lys Asp Lys Ile Leu Gly Cys Asp Trp Tyr Phe

835 840 845

Val Pro Thr Asp Glu Gly Trp Thr Asn Asp Gly Ser Ala

850 855 860

<210> 15

<211> 7

<212> PRT

<213> Bacteria

<400> 15

Glu Asn Leu Tyr Phe Gln Ser

1 5

<210> 16

<211> 252

<212> PRT

<213> Bacteria

<400> 16

Gly Ser Gly Ser Asn Gly Ser Ser Gly Ser Val Ser Met Ala Ile Ile

1 5 10 15

Lys Glu Phe Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly

20 25 30

His Glu Phe Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly

35 40 45

Thr Gln Thr Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe

50 55 60

Ala Trp Asp Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr

65 70 75 80

Val Lys His Pro Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro

85 90 95

Glu Gly Phe Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val

100 105 110

Val Thr Val Thr Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr

115 120 125

Lys Val Lys Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met

130 135 140

Gln Lys Lys Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro

145 150 155 160

Glu Asp Gly Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys

165 170 175

Asp Gly Gly His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys

180 185 190

Lys Pro Val Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp

195 200 205

Ile Thr Ser His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg

210 215 220

Ala Glu Gly Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Arg Ser

225 230 235 240

Gly Gly Gly His His His His His His Gly Asp Leu

245 250

<210> 17

<211> 1577

<212> PRT

<213> Bacteria

<400> 17

Met Pro Ile Thr Ile Asn Asn Phe Arg Tyr Ser Asp Pro Val Asn Asn

1 5 10 15

Asp Thr Ile Ile Met Met Glu Pro Pro Tyr Cys Lys Gly Leu Asp Ile

20 25 30

Tyr Tyr Lys Ala Phe Lys Ile Thr Asp Arg Ile Trp Ile Val Pro Glu

35 40 45

Arg Tyr Glu Phe Gly Thr Lys Pro Glu Asp Phe Asn Pro Pro Ser Ser

50 55 60

Leu Ile Glu Gly Ala Ser Glu Tyr Tyr Asp Pro Asn Tyr Leu Arg Thr

65 70 75 80

Asp Ser Asp Lys Asp Arg Phe Leu Gln Thr Met Val Lys Leu Phe Asn

85 90 95

Arg Ile Lys Asn Asn Val Ala Gly Glu Ala Leu Leu Asp Lys Ile Ile

100 105 110

Asn Ala Ile Pro Tyr Leu Gly Asn Ser Tyr Ser Leu Leu Asp Lys Phe

115 120 125

Asp Thr Asn Ser Asn Ser Val Ser Phe Asn Leu Leu Glu Gln Asp Pro

130 135 140

Ser Gly Ala Thr Thr Lys Ser Ala Met Leu Thr Asn Leu Ile Ile Phe

145 150 155 160

Gly Pro Gly Pro Val Leu Asn Lys Asn Glu Val Arg Gly Ile Val Leu

165 170 175

Arg Val Asp Asn Lys Asn Tyr Phe Pro Cys Arg Asp Gly Phe Gly Ser

180 185 190

Ile Met Gln Met Ala Phe Cys Pro Glu Tyr Val Pro Thr Phe Asp Asn

195 200 205

Val Ile Glu Asn Ile Thr Ser Leu Thr Ile Gly Lys Ser Lys Tyr Phe

210 215 220

Gln Asp Pro Ala Leu Leu Leu Met His Glu Leu Ile His Val Leu His

225 230 235 240

Gly Leu Tyr Gly Met Gln Val Ser Ser His Glu Ile Ile Pro Ser Lys

245 250 255

Gln Glu Ile Tyr Met Gln His Thr Tyr Pro Ile Ser Ala Glu Glu Leu

260 265 270

Phe Thr Phe Gly Gly Gln Asp Ala Asn Leu Ile Ser Ile Asp Ile Lys

275 280 285

Asn Asp Leu Tyr Glu Lys Thr Leu Asn Asp Tyr Lys Ala Ile Ala Asn

290 295 300

Lys Leu Ser Gln Val Thr Ser Cys Asn Asp Pro Asn Ile Asp Ile Asp

305 310 315 320

Ser Tyr Lys Gln Ile Tyr Gln Gln Lys Tyr Gln Phe Asp Lys Asp Ser

325 330 335

Asn Gly Gln Tyr Ile Val Asn Glu Asp Lys Phe Gln Ile Leu Tyr Asn

340 345 350

Ser Ile Met Tyr Gly Phe Thr Glu Ile Glu Leu Gly Lys Lys Phe Asn

355 360 365

Ile Lys Thr Arg Leu Ser Tyr Phe Ser Met Asn His Asp Pro Val Lys

370 375 380

Ile Pro Asn Leu Leu Asp Asp Thr Ile Tyr Asn Asp Thr Glu Gly Phe

385 390 395 400

Asn Ile Glu Ser Lys Asp Leu Lys Ser Glu Tyr Lys Gly Gln Asn Met

405 410 415

Arg Val Asn Thr Asn Ala Phe Arg Asn Val Asp Gly Ser Gly Leu Val

420 425 430

Ser Lys Leu Ile Gly Leu Cys Lys Lys Ile Ile Pro Pro Thr Asn Ile

435 440 445

Arg Glu Asn Leu Tyr Asn Arg Thr Ala Ser Leu Thr Asp Leu Gly Gly

450 455 460

Glu Leu Cys Ile Lys Ile Lys Asn Glu Asp Leu Thr Phe Ile Ala Glu

465 470 475 480

Lys Asn Ser Phe Ser Glu Glu Pro Phe Gln Asp Glu Ile Val Ser Tyr

485 490 495

Asn Thr Lys Asn Lys Pro Leu Asn Phe Asn Tyr Ser Leu Asp Lys Ile

500 505 510

Ile Val Asp Tyr Asn Leu Gln Ser Lys Ile Thr Leu Pro Asn Asp Arg

515 520 525

Thr Thr Pro Val Thr Lys Gly Ile Pro Tyr Ala Pro Glu Tyr Lys Ser

530 535 540

Asn Ala Ala Ser Thr Ile Glu Ile His Asn Ile Asp Asp Asn Thr Ile

545 550 555 560

Tyr Gln Tyr Leu Tyr Ala Gln Lys Ser Pro Thr Thr Leu Gln Arg Ile

565 570 575

Thr Met Thr Asn Ser Val Asp Asp Ala Leu Ile Asn Ser Thr Lys Ile

580 585 590

Tyr Ser Tyr Phe Pro Ser Val Ile Ser Lys Val Asn Gln Gly Ala Gln

595 600 605

Gly Ile Leu Phe Leu Gln Trp Val Arg Asp Ile Ile Asp Asp Phe Thr

610 615 620

Asn Glu Ser Ser Gln Lys Thr Thr Ile Asp Lys Ile Ser Asp Val Ser

625 630 635 640

Thr Ile Val Pro Tyr Ile Gly Pro Ala Leu Asn Ile Val Lys Gln Gly

645 650 655

Tyr Glu Gly Asn Phe Ile Gly Ala Leu Glu Thr Thr Gly Val Val Leu

660 665 670

Leu Leu Glu Tyr Ile Pro Glu Ile Thr Leu Pro Val Ile Ala Ala Leu

675 680 685

Ser Ile Ala Glu Ser Ser Thr Gln Lys Glu Lys Ile Ile Lys Thr Ile

690 695 700

Asp Asn Phe Leu Glu Lys Arg Tyr Glu Lys Trp Ile Glu Val Tyr Lys

705 710 715 720

Leu Val Lys Ala Lys Trp Leu Gly Thr Val Asn Thr Gln Phe Gln Lys

725 730 735

Arg Ser Tyr Gln Met Tyr Arg Ser Leu Glu Tyr Gln Val Asp Ala Ile

740 745 750

Lys Lys Ile Ile Asp Tyr Glu Tyr Lys Ile Tyr Ser Gly Pro Asp Lys

755 760 765

Glu Gln Ile Ala Asp Glu Ile Asn Asn Leu Lys Asn Lys Leu Glu Glu

770 775 780

Lys Ala Asn Lys Ala Met Ile Asn Ile Asn Ile Phe Met Arg Glu Ser

785 790 795 800

Ser Arg Ser Phe Leu Val Asn Gln Met Ile Asn Glu Ala Lys Lys Gln

805 810 815

Leu Leu Glu Phe Asp Thr Gln Ser Lys Asn Ile Leu Met Gln Tyr Ile

820 825 830

Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Leu Lys Lys Leu Glu

835 840 845

Ser Lys Ile Asn Lys Val Phe Ser Thr Pro Ile Pro Phe Ser Tyr Ser

850 855 860

Lys Asn Leu Asp Cys Trp Val Asp Asn Glu Glu Asp Ile Asp Val Ile

865 870 875 880

Leu Lys Lys Ser Thr Ile Leu Asn Leu Asp Ile Asn Asn Asp Ile Ile

885 890 895

Ser Asp Ile Ser Gly Phe Asn Ser Ser Val Ile Thr Tyr Pro Asp Ala

900 905 910

Gln Leu Val Pro Gly Ile Asn Gly Lys Ala Ile His Leu Val Asn Asn

915 920 925

Glu Ser Ser Glu Val Ile Val His Lys Ala Met Asp Ile Glu Tyr Asn

930 935 940

Asp Met Phe Asn Asn Phe Thr Val Ser Phe Trp Leu Arg Val Pro Lys

945 950 955 960

Val Ser Ala Ser His Leu Glu Gln Tyr Gly Thr Asn Glu Tyr Ser Ile

965 970 975

Ile Ser Ser Met Lys Lys His Ser Leu Ser Ile Gly Ser Gly Trp Ser

980 985 990

Val Ser Leu Lys Gly Asn Asn Leu Ile Trp Thr Leu Lys Asp Ser Ala

995 1000 1005

Gly Glu Val Arg Gln Ile Thr Phe Arg Asp Leu Pro Asp Lys Phe

1010 1015 1020

Asn Ala Tyr Leu Ala Asn Lys Trp Val Phe Ile Thr Ile Thr Asn

1025 1030 1035

Asp Arg Leu Ser Ser Ala Asn Leu Tyr Ile Asn Gly Val Leu Met

1040 1045 1050

Gly Ser Ala Glu Ile Thr Gly Leu Gly Ala Ile Arg Glu Asp Asn

1055 1060 1065

Asn Ile Thr Leu Lys Leu Asp Arg Cys Asn Asn Asn Asn Gln Tyr

1070 1075 1080

Val Ser Ile Asp Lys Phe Arg Ile Phe Cys Lys Ala Leu Asn Pro

1085 1090 1095

Lys Glu Ile Glu Lys Leu Tyr Thr Ser Tyr Leu Ser Ile Thr Phe

1100 1105 1110

Leu Arg Asp Phe Trp Gly Asn Pro Leu Arg Tyr Asp Thr Glu Tyr

1115 1120 1125

Tyr Leu Ile Pro Val Ala Ser Ser Ser Lys Asp Val Gln Leu Lys

1130 1135 1140

Asn Ile Thr Asp Tyr Met Tyr Leu Thr Asn Ala Pro Ser Tyr Thr

1145 1150 1155

Asn Gly Lys Leu Asn Ile Tyr Tyr Arg Arg Leu Tyr Asn Gly Leu

1160 1165 1170

Lys Phe Ile Ile Lys Arg Tyr Thr Pro Asn Asn Glu Ile Asp Ser

1175 1180 1185

Phe Val Lys Ser Gly Asp Phe Ile Lys Leu Tyr Val Ser Tyr Asn

1190 1195 1200

Asn Asn Glu His Ile Val Gly Tyr Pro Lys Asp Gly Asn Ala Phe

1205 1210 1215

Asn Asn Leu Asp Arg Ile Leu Arg Val Gly Tyr Asn Ala Pro Gly

1220 1225 1230

Ile Pro Leu Tyr Lys Lys Met Glu Ala Val Lys Leu Arg Asp Leu

1235 1240 1245

Lys Thr Tyr Ser Val Gln Leu Lys Leu Tyr Asp Asp Lys Asn Ala

1250 1255 1260

Ser Leu Gly Leu Val Gly Thr His Asn Gly Gln Ile Gly Asn Asp

1265 1270 1275

Pro Asn Arg Asp Ile Leu Ile Ala Ser Asn Trp Tyr Phe Asn His

1280 1285 1290

Leu Lys Asp Lys Ile Leu Gly Cys Asp Trp Tyr Phe Val Pro Thr

1295 1300 1305

Asp Glu Gly Trp Thr Asn Asp Gly Ser Ala Glu Asn Leu Tyr Phe

1310 1315 1320

Gln Ser Gly Ser Gly Ser Asn Gly Ser Ser Gly Ser Val Ser Met

1325 1330 1335

Ala Ile Ile Lys Glu Phe Met Arg Phe Lys Val His Met Glu Gly

1340 1345 1350

Ser Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu Gly Glu Gly

1355 1360 1365

Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys Val Thr Lys

1370 1375 1380

Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro Gln Phe

1385 1390 1395

Met Tyr Gly Ser Lys Ala Tyr Val Lys His Pro Ala Asp Ile Pro

1400 1405 1410

Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg

1415 1420 1425

Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp

1430 1435 1440

Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys Leu Arg

1445 1450 1455

Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr

1460 1465 1470

Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly

1475 1480 1485

Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly

1490 1495 1500

Gly His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys

1505 1510 1515

Pro Val Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp

1520 1525 1530

Ile Thr Ser His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu

1535 1540 1545

Arg Ala Glu Gly Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr

1550 1555 1560

Arg Ser Gly Gly Gly His His His His His His Gly Asp Leu

1565 1570 1575

<210> 18

<211> 72

<212> DNA

<213> Bacteria

<400> 18

attctgcaaa atcctattgt ttatcatacc tgatataatg aaaagatacg acactaggag 60

tgaatggcca tg 72

<210> 19

<211> 43

<212> DNA

<213> Bacteria

<400> 19

aatacgactc actatagggg aattgtgagc ggataacaat tcc 43

<210> 20

<211> 43

<212> DNA

<213> Bacteria

<400> 20

cctctagaaa taattttgtt taactttaag aaggagatat acc 43

<210> 21

<211> 3947

<212> DNA

<213> Bacteria

<400> 21

atgccaataa ccataaataa ttttagatat agtgatcctg ttaataatga tacaattatt 60

atgatggagc caccatactg taagggtcta gatatctatt ataaggcttt caaaataaca 120

gatcgtattt ggatagtgcc ggaaaggtat gaatttggga caaaacctga agattttaac 180

ccaccatctt cattaataga aggtgcatct gagtattacg atccaaatta tttaaggact 240

gattctgata aagatagatt tttacaaacc atggtaaaac tgtttaacag aattaaaaac 300

aatgtagcag gtgaagcctt attagataag ataataaatg ccatacctta ccttggaaat 360

tcatattcct tactagacaa gtttgataca aactctaatt cagtatcttt taatttatca 420

gaacaagacc ccagtggagc aactacaaaa tcagcaatgc tgacaaattt aataatattt 480

ggacctgggc ctgttttaaa taaaaatgag gttagaggta ttgtattgag ggtagataat 540

aaaaattact tcccatgtag agatggtttt ggttcaataa tgcaaatggc attttgccca 600

gaatatatac ccacttttga taatgtaata gaaaatatta cgtcactcac tattggcaaa 660

agcaaatatt ttcaagatcc agcattacta ttaatgcacg aacttataca tgtactacat 720

ggtttatacg gaatgcaggt atcaagccat gaaattattc catccaaaca agaaatttat 780

atgcagcata catatccaat aagtgctgaa gaactattca cttttggcgg acaggatgct 840

aatcttataa gtattgatat aaaaaacgat ttatatgaaa aaactttaaa tgattataaa 900

gctatagcta acaaacttag tcaagtcact agctgcaatg atcccaacat tgatattgat 960

agctacaaac aaatatatca acaaaaatat caattcgata aagatagcaa tggacaatat 1020

attgtaaatg aggataaatt tcagatacta tataatagca taatgtatgg ttttacagag 1080

attgaattgg gaaaaaaatt taatataaaa actagacttt cttattttag tatgaatcat 1140

gaccctgtaa aaattccaaa tttattagat gatacaattt acaatgatac agaaggattt 1200

aatatagaaa gcaaagatct gaaatctgaa tataaaggtc aaaatatgag ggtaaataca 1260

aatgctttta gaaatgttga tggatcaggc ctagtttcaa aacttattgg cttatgtaaa 1320

aaaattatac caccaacaaa tataagagaa aatttatata atagaactgc atcattaaca 1380

gatttaggag gagaattatg tataaaaatt aaaaatgaag atttaacttt tatagctgaa 1440

aaaaatagct tttcagaaga accatttcaa gatgaaacag ttagttataa tacaaaaaat 1500

aaaccattaa attttaatta ttcgctagat aaaattattt tagattataa tctacaaagt 1560

aaaattacat tacctaatga taggacaacc ccagttacaa aaggaattcc atatgctcca 1620

aaatataaaa gtaatgctgc aagtacaata gaaatacata atattgatga caatacaata 1680

tatcaatatt tgtatgctca aaaatctcct acaactctac aaagaataac tatgactaat 1740

tctgtcgatg acgcattaat aaattccacc aaaatatatt catattttcc atctgtaatc 1800

agtaaagtta accaaggtgc acaaggaatt ttattcttac agtgggtgag agatataatt 1860

gatgatttac caatgaatct tcacaaaaaa ctactattga taaaatttca gatgtatcca 1920

ctattgttcc ttatatagga cccgcattaa acattgtaaa acaaggctat gagggaaact 1980

ttataggtgc tttagaaact accggagtgg ttttattatt ggaatatatt ccagaaatta 2040

ctttaccagt aattgcagct ttatctatag cagaaagtag cacacaaaaa gaaaagataa 2100

taaaaacaat agataacttt ttagaaaaaa gatatgaaaa atggattgaa gtatataaac 2160

taataaaagc aaaatggtta ggcacagtta atacgcaatt ccaaaaaaga agttatcaaa 2220

tgtatagatc tttagaatat caagtagatg caataaaaaa aataatagac tatgaatata 2280

aaatatattc aggacctgat aaggaacaaa ttgccgacga aattaataat ctgaaaaaca 2340

aacttgaaga aaaggctaat aaagcaatga taaacataaa tatatttatg agggaaagtt 2400

ctagatcatt tttagttaat caaatgatta acgaagctaa aaagcagtta ttagagtttg 2460

atactcaaag caaaaatatt ttaatgcagt atataaaagc aaattctaaa tttataggta 2520

taactgaact aaaaaaatta gaatcaaaaa taaacaaagt tttttcaaca ccaattccat 2580

tttcttattc taaaaatctg gattgttggg ttgataatga agaagatata gatgttatat 2640

taaaaaagag tacaatttta aatttagata ttaataatga tattatatca gatatatctg 2700

ggtttaattc atctgtaata acatatccag atgctcaatt ggtgcccgga ataaatggca 2760

aagcaataca tttagtaaac aatgaatctt ctgaagttat agtgcataaa gctatggata 2820

ttgaatataa tgatatgttt aataatttta ccgttagctt ttggttgagg gttcctaaag 2880

tatctgctag tcatttagaa caatatggca caaatgagta ttcaataatt agctctatga 2940

aaaaatatag tctatcaata ggatctggtt ggagtgtatc acttaaaggt aataacttaa 3000

tatggacttt aaaagattcc gcgggagaag ttagacaaat aacttttagt gatttatctg 3060

ataaatttaa tgcttattta gcaaataaat gggtttttat aactattact aatgatagat 3120

tatcttctgc taatttgtat ataaatggag tacttatgaa aaatgcagaa attaccggtt 3180

taggagctat tagagaggat aataatataa cattaaaact agatagatgt aataataata 3240

atcaatacgt ttctattgat aaatttagga tattttgcaa agcattaaat ccaaaagaga 3300

ttgaaaaatt atacacaagt tatttatcta taaccttttt aagagacttc tggggaaacc 3360

ctttacgata tgatacagaa tattatttaa taccagtagc ttctagttct aaagatgttc 3420

aattgaaaaa tataacagat tatatgtatt tgacaaatgc gccatcgtat actaacggaa 3480

aattgaatat atattataga aggttatata gtggactaaa atttattata aaaagatata 3540

cacctaataa tgaaatagat tcttttgtta aatcaggtga ttttattaaa ttatatgtat 3600

catataacaa taatgagcac attgtaggtt atccgaaaga tggaaatgcc tttaataatc 3660

ttgatagaat tctaagagta ggttataatg ccccaggtat ccctctttat aaaaaaatgg 3720

aagcagtaaa attgcgtgat ttaaaaacct attctgtaca acttaaatta tatgatgata 3780

aaaatgcatc tttaggacta gtaggtatcc gtaatggtca aataggcaac gatccaaata 3840

gggatatatt aattgcaagc aactggtact ttaatcattt aaaagataaa actttaacat 3900

gtgattggta ctttgtacct acagatgaag gatggacaaa tgattaa 3947

<210> 22

<211> 801

<212> DNA

<213> Bacteria

<400> 22

gaaaacctgt acttccaatc caatattggt agtgggagca acggcagcag cggatccgtg 60

agcaagggcg aggaggataa catggccatc atcaaggagt tcatgcgctt caaggtgcac 120

atggagggct ccgtgaacgg ccacgagttc gagatcgagg gcgagggcga gggccgcccc 180

tacgagggca cccagaccgc caagctgaag gtgaccaagg gtggccccct gcccttcgcc 240

tgggacatcc tgtcccctca gttcatgtac ggctccaagg cctacgtgaa gcaccccgcc 300

gacatccccg actacttgaa gctgtccttc cccgagggct tcaagtggga gcgcgtgatg 360

aacttcgagg acggcggcgt ggtgaccgtg acccaggact cctccctcca ggacggcgag 420

ttcatctaca aggtgaagct gcgcggcacc aacttcccct ccgacggccc cgtaatgcag 480

aagaagacca tgggctggga ggcctcctcc gagcggatgt accccgagga cggcgccctg 540

aagggcgaga tcaagcagag gctgaagctg aaggacggcg gccactacga cgctgaggtc 600

aagaccacct acaaggccaa gaagcccgtg cagctgcccg gcgcctacaa cgtcaacatc 660

aagttggaca tcacctccca caacgaggac tacaccatcg tggaacagta cgaacgcgcc 720

gagggccgcc actccaccgg cggcatggac gagctgtaca agtaagcggc cgcactcgag 780

caccaccacc accaccactg a 801

Claims

1.一种适用于蛋白质表达的无细胞系统，包括：

-无细胞表达生物反应器，具有：

-含有耐热细菌的细胞提取物的反应混合物，所述耐热细菌的细胞提取物具有体外大分子合成所需的所有无细胞反应组分；

-至少一种核酸合成模板；

-一种细胞三磷酸腺苷能量再生系统，包括：

-一定量的热稳定的腺苷激酶；和

-一定量的热稳定的多磷酸激酶；

-一定量的无机多磷酸盐；和

-一定量的腺苷一磷酸；

-其中，所述腺苷激酶的量高于所述多磷酸激酶的量，所述腺苷激酶和所述多磷酸激酶协同作用以从所述无机多磷酸盐和所述腺苷一磷酸再生细胞三磷酸腺苷能量；

其中，所述腺苷激酶的氨基酸序列如SEQ ID NO.8所示，所述多磷酸激酶的氨基酸序列如SEQ ID NO.11所示。

2.如权利要求1所述的无细胞系统，还包含一定量的山梨糖醇-脱氢酶。

3.如权利要求1所述的无细胞系统，还包含从用于产生所述细胞提取物的相同类型的微生物中分离的一定量的tRNA。

4.如权利要求1所述的无细胞系统，其中所述至少一种核酸合成模板包含线性DNA模板。