CN109790558A

CN109790558A - 方法

Info

Publication number: CN109790558A
Application number: CN201780023087.6A
Authority: CN
Inventors: R·科尔曼; B·尼兰
Original assignee: Australian New South Innovation Co Ltd; Bergen Teknologioverforing AS
Current assignee: Australian New South Innovation Co Ltd; Bergen Teknologioverforing AS
Priority date: 2016-02-12
Filing date: 2017-02-10
Publication date: 2019-05-21
Also published as: JP2019504650A; GB201702275D0; KR20190006478A; AU2021201969B2; US20190048375A1; US10920256B2; IL261106A; EP3414334A1; US20210108239A1; AU2017218598B2; EA201891805A1; GB2552859A; CA3014109A1; GB201903649D0; CL2018002149A1; AU2021201969A1; BR112018016346A2; EP4279577A3; AU2017218598A1; US11566271B2

Abstract

本发明涉及在重组宿主细胞中制备新石房蛤毒素及其类似物和变体以及在生产新石房蛤毒素中的中间体的方法。新石房蛤毒素及其类似物和变体可用于生产药物组合物。

Description

方法

技术领域

本发明涉及新石房蛤毒素及其类似物的制备方法，以及在重组宿主细胞中产生新石房蛤毒素的中间体。新石房蛤毒素可以用于生产药物组合物。

背景技术

电压门控钠通道(VGSC)是完整的膜蛋白，其形成离子通道，通过细胞质膜传导钠离子(Na⁺)。它们在动作电位的启动中起着重要作用。

人们早就知道阻断这些通道可能有助于预防疼痛冲动的传递；现在已充分验证VGSC是用于治疗疼痛的靶标。特别地，目前正在镇痛药和麻醉剂的生产中研究许多VGSC拮抗剂。

石房蛤毒素和新石房蛤毒素两者都作为VGSC的特异性阻断剂。因此，这些化合物在治疗疼痛中可能是有用的。石房蛤毒素(SXT)也称为麻痹性贝类毒素(PST)，是由许多蓝藻(例如鱼腥藻(Anabaena)、丝囊藻属(Aphanizomenon)、拟柱孢藻属(Cylindrospermopsis)、鞘丝藻属(Lyngbya)、浮丝藻属(Planktothrix)、尖头藻属(Raphidiopsis)、双歧藻属(Scytonema))和甲藻(亚历山大藻(Alexandrium)、裸甲藻(Gymnodinium)和梨甲藻(Pyrodinium))产生的神经毒素。石房蛤毒素是迄今已知的最致命的非蛋白质神经毒素之一，并可逆地结合VGSC以导致瘫痪。它导致许多人类食物中毒事件，因为摄入了受污染的滤食性水生动物(例如甲壳类动物、软体动物、贝类)，这些动物会对毒素进行生物累积。

然而，存在许多SXT类似物包括新石房蛤毒素(它是SXT的N1-羟基化类似物)，虽然它们具有高特异性毒性，但当以低剂量施用时它们没有全身毒性。因此它们可能用作人类治疗剂。

2015年6月，德国制药商Grunenthal与智利公司Proteus S.A.和美国波士顿儿童医院开展合作以开发使用新石房蛤毒素作为局部麻醉和术后疼痛管理的新型麻醉剂。

还存在其它石房蛤毒素类似物的市场，例如膝钩藻毒素(gonyautoxin)，其已经临床测试为肌肉松弛剂。

Proteus S.A.已经提交了与从天然产生新石房蛤毒素和石房蛤毒素的细胞(例如蓝藻细胞)生产和收获新石房蛤毒素和石房蛤毒素相关的专利申请(例如US2015/0099879)。

Shimizu等首次提出了产生石房蛤毒素的生物合成途径(J.Am.Chem.Soc.(1984),106,6433–6434)。然而，直到2008年才首次鉴定石房蛤毒素(sxt)基因簇；这是在蓝藻拟柱孢藻(Cylindrospermopsis raciborskii)T3中(Kellmann等Appl.Environ.Microbiol.2008,74,4044–4053)。sxt基因簇由34个基因或开放阅读框(ORF)组成。基于Sxt蛋白的理论功能，这导致Kellmann等提出修订的(10步)用于产生石房蛤毒素的生物合成途径(参见本文的图1)。

其它四个sxt基因簇已经在不同的属中被鉴定：卷曲鱼腥藻(Anabaenacircinalis)131C和丝囊藻属(Aphanizomenon sp.)NH-5(Mihali等BMC Biochem.10,8(2009))；鞘丝藻(Lyngbyawollei)(Mihali等PloS One 6,e14657(2011))；和尖头藻(Raphidiopsis brookii)D9(Stucken,K.等PLoS ONE 5,e9235(2010))。然而值得注意的是，这些基因簇存在一些差异，包括缺少某些基因和其它基因重复。此外，sxt簇的结构在一些基因组中重新排列，导致石房蛤毒素类似物的生物合成。这使得用于产生石房蛤毒素和新石房蛤毒素的生物合成途径的阐明特别困难，因此通过重组途径防止石房蛤毒素和新石房蛤毒素的产生。

在Kellmann(2008)提出的途径中，提出第一步涉及sxtA基因产物。sxtA基因编码与聚酮化合物合酶(PKS)相关的多结构域蛋白。Kellmann提出SxtA催化精氨酸和一个甲基化乙酸酯单元的缩合以产生4-氨基-3-氧代-胍基庚烷(AOGH)中间体。提出该方法以逐步进行，并由SxtA的四个结构域催化。据说乙酰转移酶结构域选择性地将乙酰辅酶A连接到全酰基载体蛋白的泛乙酰基臂上。据说由第一个SxA结构域催化的乙酰基部分的SAM依赖性甲基化导致丙酸盐的形成。据说AOGH生物合成的最后一步是丙酸盐与精氨酸的缩合，由II类氨基转移酶结构域催化。AOGH用作由sxt基因簇的其它成员编码的下游酶生物合成石房蛤毒素的底物。然而，由于缺乏化学标准，未确认AOGH的结构。

尽管Tsuchiya及其同事最近已阐明AOGH的合成途径(Tsuchiya,S.等Org.Biomol.Chem.12,3016–3020(2014)；Tsuchiya,S.等Chem.Eur.J.21,7835–7840(2015))。该研究并没有研究SxtA或任何其它Sxt蛋白参与AOGH的生产。该步骤是石房蛤毒素和新石房蛤毒素生产中的关键步骤。

因此，总之目前可用于制备石房蛤毒素和新石房蛤毒素的唯一商业上可获得的高产量途径是将其与天然产生它的细胞(例如蓝藻)分离。

目前用于生产新石房蛤毒素的方法不能以制造所需药物组合物所需的量生产新石房蛤毒素。因此，存在对改进的生产新石房蛤毒素的方法的需要。

现在已经足够详细地阐明了用于生产新石房蛤毒素的生物合成途径以便能够通过重组途径生产新石房蛤毒素。特别地，在Kellmann(2008)鉴定的34个sxt基因或ORF中，已经鉴定了用于生产新石房蛤毒素所必需的那些。

现在已经发现，Kellmann(2008)提出的生物合成途径是不正确的，并且Kellmann途径是指一些对于重组生产新石房蛤毒素不必要的基因；Kellmann(2008)途径也未能提及一些生产新石房蛤毒素所必需的sxt基因。

因此，本发明首次提供了用于生产新石房蛤毒素及其类似物的重组途径，以及用于在新石房蛤毒素及其类似物的生产中生产各种中间体的重组途径。

本发明还有助于生产石房蛤毒素及其其它类似物，例如膝钩藻毒素。

发明内容

在一种实施方式中，本发明提供了用于生产新石房蛤毒素或其类似物的方法，该方法包括以下步骤：

(A)在反应介质中将以下底物与SxtA、B、D、G、H、I、S、T、U、V、W和X多肽接触：

(i)S-腺苷甲硫氨酸，

(ii)精氨酸，

(iii)乙酰辅酶A、丙二酰辅酶A或丙酰辅酶A，和

(iv)氨基甲酰磷酸酯

以及任选地

(B)从反应介质中分离和/或纯化新石房蛤毒素或其类似物。

优选地，该方法在宿主细胞中进行，所述宿主细胞包含编码所述Sxt多肽的核酸分子。

本发明还提供了在宿主细胞中生产石房蛤毒素或其类似物的方法，该方法包括以下步骤：

(A)在以下底物的存在下，在培养基中培养包含编码Sxt多肽A、B、D、G、H、I、S、T、U、V、W和X的核酸分子的宿主细胞：

(i)S-腺苷甲硫氨酸，

(ii)精氨酸，

(iii)乙酰辅酶A、丙二酰辅酶A或丙酰辅酶A，和

(iv)氨基甲酰磷酸酯

优选在适合生产新石房蛤毒素或其类似物的条件下。优选地，宿主细胞另外包含编码PPT酶的核酸分子。

优选地，该方法还包括从宿主细胞或培养基中分离和/或纯化新石房蛤毒素或其类似物的步骤。

如本文所用，术语“新石房蛤毒素”是指具有以下结构的化合物或其立体异构体：

宿主细胞可以是能够表达编码所有特定Sxt多肽的核酸分子的任何细胞。宿主细胞优选是重组宿主细胞。

如本文所用，术语“重组”是指宿主细胞不是野生型宿主细胞的事实，例如它们已通过引入一种或多种编码一种或多种特定Sxt多肽的核酸分子而被修饰。

宿主细胞可以是原核细胞或真核细胞。例如，宿主细胞可以是细菌细胞。细菌可以是革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌可以选自由放线菌(Actinobacteria)、厚壁菌门(Firmicutes)和柔膜菌门(Tenericutes)组成的组。革兰氏阴性细菌可以选自由产水菌门(Aquificae)、拟杆菌门/纤维杆菌门-绿菌门(Bacteroidetes/Fibrobacteres-Chlorobi)(FCB组)、异常球菌-栖热菌门(Deinococcus-Thermus)、梭杆菌门(Fusobacteria)、芽单胞菌门(Gemmatimonadetes)、硝化螺旋菌门(Nitrospirae)、浮霉菌门-疣微菌门/衣原体门(Planctomycetes-Verrucomicrobia/Chlamydiae)(PVC组)、变形菌门(Proteobacteria)、螺旋体门(Spirochaetes)和互养菌门(Synergistetes)组成的组。

优选地，宿主细胞是变形细菌门(Phylum Proteobacteria)；更优选为γ-变形菌类(Gammaproteobacteria)；更优选为肠杆菌(Enterobacteriaceae)科；甚至更优选为埃希氏菌(Escherichia)属。最优选地，宿主细胞为大肠杆菌(E.coli)种。在一些实施方式中，宿主细胞是假单胞菌(Pseudomonas)属。

也可以使用真核细胞，例如酵母细胞和哺乳动物细胞。由于新石房蛤毒素对许多真核细胞有毒，因此真核宿主细胞优选为对新石房蛤毒素毒性不敏感的宿主细胞。这些细胞可以是天然不易感的(例如酵母细胞)，或者它们可以工程化成不易感的(例如共表达新石房蛤毒素拮抗剂的哺乳动物细胞)。

或者，宿主细胞可以是不分泌新石房蛤毒素的宿主细胞，即产生的任何新石房蛤毒素保留在细胞内(从而防止其发挥其毒性作用)。宿主细胞也可以是植物细胞。

在一些实施方式中，宿主细胞是异养生物。宿主细胞可以是光合异养生物或化学异养生物。异养生物是一种不能固定碳并使用有机碳生长的生物。异养生物可以基于它们如何获得能量而进一步划分：如果异养生物利用光供能，那么它就是光合异养生物；如果异养生物使用化学能，那么它就是化学异养生物。在一些实施方式中，宿主细胞不是自养生物。自养生物可以是光合自养生物或化学自养生物。

新石房蛤毒素是由几种海洋甲藻和淡水蓝藻自然产生的。本发明不涉及由这种野生型宿主细胞种类天然产生新石房蛤毒素。因此，在本发明的一些实施方式中，宿主细胞不是甲藻或蓝藻。

特别地，宿主细胞优选不选自由蓝藻拟柱孢藻(Cylindrospermopsisraciborskii)、水华束丝藻(Anphanizomenon flos-aquae)、束丝藻(APh)依沙束丝藻(Aphanizomenon)(APh)、(issatschenkoi(usaceb)Proskina-Lavrenco)、柔细束丝藻(Aphanizomenon gracile(Lemm)Lemm)、卷曲鱼腥藻(Anabaena circinalis)、鞘丝藻(Lyngbya wollei)和塔玛亚历山大藻(Alexandrium tamarens)组成的组。

特别地，宿主细胞优选不选自由鱼腥藻(Anabaena)、束丝藻属(Aphanizomenon)、拟柱孢藻属(Cylindrospermopsis)、鞘丝藻属(Lyngbya)、浮丝藻属(Planktothrix)、尖头藻属(Raphidiopsis)、双歧藻属(Scytonema)和甲藻(亚历山大藻(Alexandrium)、裸甲藻(Gymnodinium)和梨甲藻(Pyrodinium))组成的组。

然而，宿主细胞可以是重组甲藻或重组蓝藻，例如与野生型甲藻或蓝藻相比已经被修饰的甲藻或蓝藻(例如通过添加一个或多个基因，优选通过添加一个或多个sxt基因)。宿主细胞包含和/或表达编码特定Sxt蛋白的核酸分子。

优选地，Sxt多肽和sxt基因获自蓝藻或甲藻。更优选地，Sxt多肽和sxt基因获自鱼腥藻(Anabaena)，丝囊藻属(Aphanizomenon)，拟柱孢藻属(Cylindrospermopsis)，鞘丝藻属(Lyngbya)，浮丝藻属(Planktothrix)，尖头藻属(Raphidiopsis)，双歧藻属(Scytonema)，亚历山大藻(Alexandrium)，裸甲藻(Gymnodinium)或梨甲藻(Pyrodinium)。甚至更优选地，Sxt多肽和sxt基因获自蓝藻拟柱孢藻(Cylindrospermopsisraciborskii)，水华束丝藻(Anphanizomenon flos-aquae)，束丝藻(APh)依沙束丝藻(Aphanizomenon)(APh)、(issatschenkoi(usaceb)Proskina-Lavrenco)、柔细束丝藻(Aphanizomenon gracile(Lemm)Lemm)，卷曲鱼腥藻(Anabaena circinalis)，鞘丝藻(Lyngbya wollei)或塔玛亚历山大藻(Alexandrium tamarens)。最优选地，Sxt多肽和sxt基因获自蓝藻拟柱孢藻(C.raciborskii)T3菌株。在一些实施方式中，Sxt多肽和sxt基因可以获自长孢鱼腥藻(Dolichosporum circinale)134C或微小亚历山大藻(A.minutum)。

编码特定Sxt蛋白的核酸分子可以是异源分子，即在野生型宿主细胞中不天然存在的分子。

如本文所用，术语SxtA优选是指具有SEQ ID NO：10中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有含四个催化结构域的聚酮合酶相关蛋白功能的序列：sxtA1：甲基转移酶；sxtA2：GNAT乙酰转移酶；sxtA3：酰基载体蛋白和sxtA4：II类氨基转移酶。

如本文所用，术语sxtA优选是指具有SEQ ID NO：11或12中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码含四个催化结构域的聚酮合酶相关蛋白的序列：sxtA1：甲基转移酶；sxtA2：GNAT乙酰转移酶；sxtA3：酰基载体蛋白和sxtA4：II类氨基转移酶。

如本文所用，术语SxtB优选是指具有SEQ ID NO：7中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有胞苷脱氨酶功能的序列。

如本文所用，术语sxtB优选是指具有SEQ ID NO：8或9中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码胞苷脱氨酶的序列。SxtB多肽也可以能够环化。

如本文所用，术语SxtC优选是指具有SEQ ID NO：4中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并编码调节亚基的序列。如本文所用，术语SxtC优选是指具有SEQ ID NO：5或6中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码调节亚基的序列。SxtC多肽也可以能够去氨基甲酰化。

如本文所用，术语SxtD优选是指具有SEQ ID NO：1中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有去饱和酶功能的序列。如本文所用，术语sxtD优选是指具有SEQ ID NO：2或3中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码去饱和酶的序列。

如本文所用，术语SxtE优选是指具有SEQ ID NO：13中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有伴侣样蛋白功能的序列。如本文所用，术语sxtE优选是指具有SEQ ID NO：14或15中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码伴侣样蛋白的序列。

如本文所用，术语SxtF优选是指具有SEQ ID NO：16中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有钠驱动多药和毒性化合物挤出蛋白功能的序列。如本文所用，术语sxtF优选是指具有SEQ ID NO：17或18中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码钠驱动多药和毒性化合物挤出蛋白的序列。

如本文所用，术语SxtG优选是指具有SEQ ID NO：19中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有脒基转移酶功能的序列。如本文所用，术语sxtG优选是指具有SEQ ID NO：20或21中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码脒基转移酶的序列。

如本文所用，术语SxtH优选是指具有SEQ ID NO：22中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有双加氧酶功能的序列。如本文所用，术语sxtH优选是指具有SEQ ID NO：23或24中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码双加氧酶的序列。SxtH多肽也可以能够C12羟基化。

如本文所用，术语SxtI优选是指具有SEQ ID NO：25中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有O-氨基甲酰基转移酶功能的序列。如本文所用，术语sxtI优选是指具有SEQ ID NO：26或27中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码O-氨基甲酰基转移酶的序列。

如本文所用，术语SxtJ优选是指具有SEQ ID NO：28中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性的序列。如本文所用，术语sxtJ优选是指具有SEQ IDNO：29或30中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性的序列。

如本文所用，术语SxtK优选是指具有SEQ ID NO：31中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性的序列。如本文所用，术语sxtK优选是指具有SEQ IDNO：32或33中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性的序列。sxtJ和sxtK通常与O-氨基甲酰基转移酶相关。它们可以是调节亚基和/或介导SxtI与其它蛋白或膜的结合。

如本文所用，术语SxtL优选是指具有SEQ ID NO：34中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有GDSL-脂肪酶功能的序列。如本文所用，术语sxtL优选是指具有SEQ ID NO：35或36中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码GDSL-脂肪酶的序列。SxtL多肽也可以能够去氨基甲酰化。

如本文所用，术语SxtM优选是指具有SEQ ID NO：37中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并且具有钠驱动多药和毒性化合物挤出蛋白功能的序列。如本文所用，术语sxtM优选是指具有SEQ ID NO：38或39中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码钠驱动多药和毒性化合物挤出蛋白的序列。

如本文所用，术语SxtN优选是指具有SEQ ID NO：40中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有磺基转移酶功能的序列。如本文所用，术语sxtN优选是指具有SEQ ID NO：41中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码磺基转移酶的序列。

如本文所用，术语SxtO优选是指具有SEQ ID NO：72中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有腺苷酰硫酸激酶功能的序列。如本文所用，术语sxtO优选是指具有SEQ ID NO：73中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码腺苷酰硫酸激酶的序列。SxtO多肽也可以能够PAPS生物合成。

如本文所用，术语SxtP优选是指具有SEQ ID NO：69中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有推定的石房蛤毒素结合蛋白功能的序列。如本文所用，术语sxtP优选是指具有SEQ ID NO：70或71中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码推定的石房蛤毒素结合蛋白的序列。

如本文所用，术语SxtQ优选是指具有SEQ ID NO：66中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性的序列。如本文所用，术语sxtQ优选是指具有SEQ IDNO：67或68中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性的序列。

如本文所用，术语SxtR优选是指具有SEQ ID NO：63中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有酰基辅酶A N-酰基转移酶功能的序列。如本文所用，术语sxtR优选是指具有SEQ ID NO：64或65中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码酰基辅酶A N-酰基转移酶的序列。

如本文所用，术语SxtS优选是指具有SEQ ID NO：57中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并且能够环氧化和环形成新石房蛤毒素前体的序列。如本文所用，术语sxtS优选是指具有SEQ ID NO：58或59中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并且能够环氧化和环形成新石房蛤毒素前体的序列。

如本文所用，术语SxtT优选是指具有SEQ ID N：54中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并且能够使新石房蛤毒素前体C-11羟基化的序列。如本文所用，术语sxtT优选是指具有SEQ ID NO：55或56中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并且能够使新石房蛤毒素前体C-11羟基化的序列。

如本文所用，术语SxtU优选是指具有SEQ ID NO：51中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有短链醇脱氢酶功能的序列。如本文所用，术语sxtU优选是指具有SEQ ID NO：52或53中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码短链醇脱氢酶的序列。SxtU多肽也可以能够C1还原。

如本文所用，术语SxtV优选是指具有SEQ ID NO：48中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有FAD依赖性琥珀酸脱氢酶/富马酸还原酶功能的序列。如本文所用，术语sxtV优选是指具有SEQ ID NO：49或50中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码FAD依赖性琥珀酸脱氢酶/富马酸还原酶的序列。SxtV多肽也可以编码双加氧酶还原酶。

如本文所用，术语SxtW优选是指具有SEQ ID NO：45中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有铁氧还蛋白功能的序列。如本文所用，术语sxtW优选是指具有SEQ ID NO：46或47中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码铁氧还蛋白的序列。SxtW多肽也可以编码电子载体。

如本文所用，术语SxtX优选是指具有SEQ ID NO：42中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并且能够使新石房蛤毒素N-1羟基化的序列。如本文所用，术语sxtX优选是指具有SEQ ID NO：43或44中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并且能够使新石房蛤毒素N-1羟基化的序列。

如本文所用，术语SxtY优选是指具有SEQ ID NO：74中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有磷酸依赖性转录调节子功能的序列。如本文所用，术语sxtY优选是指具有SEQ ID NO：75中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码磷酸依赖性转录调节子的序列。SxtY多肽也可以能够信号转导。

如本文所用，术语SxtZ优选是指具有SEQ ID NO：76中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有组氨酸激酶功能的序列。如本文所用，术语sxtZ优选是指具有SEQ ID NO：77中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码组氨酸激酶的序列。

一些sxt基因的功能和能力在图2、图3、图4A、图4B中进一步说明，其中可以看出一些能够将中间体X转化为中间体Y(其中X和Y是确定的中间体的结构)。

如本文所用，术语ORF5优选是指具有SEQ ID NO：60中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有噬藻体S-PM2蛋白CAF34141样蛋白功能的序列。ORF5在本领域中也称为ORF24。如本文所用，术语orf5优选是指具有SEQ ID NO：61或62中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码噬藻噬菌体S-PM2蛋白CAF34141样蛋白的序列。

优选地，宿主细胞另外包含和/或表达编码4'-磷酸泛酰巯基乙胺基转移酶(PPT酶)的核酸分子。如本文所用，术语PPT酶优选是指具有SEQ ID NO：78或90中给出的氨基酸序列的多肽或与其具有至少50％氨基酸序列同一性并具有磷酸泛酰巯基乙胺基转移酶功能的序列。如本文所用，术语PPT酶基因优选是指具有SEQ ID NO：79、80或89中给出的核苷酸序列的核酸分子或与其具有至少50％核苷酸序列同一性并编码磷酸泛酰巯基乙胺基转移酶的序列。优选地，PPT酶由枯草芽孢杆菌sfp基因(SEQ ID NO：89)编码。最优选地，PPT酶来自蓝藻拟柱孢藻(C.raciborskii)T3菌株。在一些实施方式中，可以去除PPT酶的前20个氨基酸的1-20(例如20)以增加PPT酶的溶解度。另外，可以将氨基酸序列中的第一个V改变为M。

优选地，核酸分子的核苷酸序列针对宿主细胞进行密码子优化。

Sxt多肽、ORF和PPT酶优选在本文中定义为与参考氨基酸序列具有至少50％的氨基酸序列同一性。优选地，Sxt、ORF和PPT酶多肽与特定的参考多肽具有至少60％、70％、80％、90％、95％、98％或99％的氨基酸序列同一性。sxt核酸分子、orf和PPT酶核酸分子在本文中优选定义为与参考核苷酸序列具有至少50％的核苷酸序列同一性。优选地，sxt、orf和PPT酶核酸分子与特定的参考核酸分子具有至少60％、70％、80％、90％、95％、98％或99％的核苷酸序列同一性。

核酸分子可以是DNA或RNA。使用BLAST比对方法可以获得百分比氨基酸序列同一性和核苷酸序列同一性(Altschul等(1997),"Gapped BLAST and PSI-BLAST:a newgeneration of protein database search programs",Nucleic Acids Res.25:3389-3402；and http://www.ncbi.nlm.nih.gov/BLAST)。优选地，使用标准或默认比对参数。标准蛋白-蛋白BLAST(blastp)可以用于在蛋白数据库中发现相似的序列。与其它BLAST程序一样，blastp旨在发现相似的局部区域。当序列相似性跨越整个序列时，blastp还将报告全局比对，这是蛋白鉴定目的的优选结果。优选地，使用标准或默认比对参数。在某些情况下，可以取消“低复杂度过滤器”。BLAST蛋白搜索也可以用BLASTX程序进行，得分＝50，字长＝3。为了获得用于比较目的的空位比对，可以如Altschul等(1997)Nucleic Acids Res.25:3389所述使用Gapped BLAST(BLAST 2.0中)。或者，PSI-BLAST(在BLAST 2.0中)可以用于执行检测分子之间的远距离关系的迭代搜索(参见Altschul等(1997)同上)。当使用BLAST、Gapped BLAST、PSI-BLAST时，可以使用各个程序的默认参数。关于核苷酸序列比较，可以使用MEGABLAST、不连续的megablast和blastn来实现该目标。优选地，使用标准或默认比对参数。MEGABLAST专门设计用于有效地发现非常相似序列之间的长对齐。不连续的MEGABLAST可以用于发现与本发明的核酸相似但不相同的核苷酸序列。BLAST核苷酸算法通过将查询分解为称为词的短子序列来发现相似的序列。该程序首先识别与查询词的准确匹配(词命中)。然后，BLAST程序以多个步骤扩展这些词命中以生成最终的空位比对。在一些实施方式中，BLAST核苷酸搜索可以用BLASTN程序进行，得分＝100，字长＝12。控制BLAST搜索灵敏度的重要参数之一是词大小。blastn比MEGABLAST更敏感的最重要原因是它使用较短的默认词大小(11)。因此，blastn在发现与其它生物的相关核苷酸序列的比对方面优于MEGABLAST。词大小可以在blastn中调整，并且可以从默认值减少到最小值7以提高搜索灵敏度。通过使用新引入的不连续的megablast页面(www.ncbi.nlm.nih.gov/Web/Newsltr/FallWinter02/blastlab.html)可以实现更灵敏的搜索。该页面使用的算法类似于Ma等报道的算法(Bioinformatics.2002Mar；18(3):440-5)。相比于要求精确的词匹配作为比对扩展的起源，不连续的megablast在较长的模板窗口中使用非连续的词。在编码模式中，通过集中于在第一和第二密码子位置处发现匹配而忽略第三位置中的错配来考虑第三基础摆动。使用相同的词大小在不连续的MEGABLAST中搜索比使用相同词大小的标准blastn更敏感和有效。不连续的megablast唯一的参数是：词大小：11或12；模板：16、18或21；模板类型：编码(0)、非编码(1)或两者(2)。

蓝藻拟柱孢藻(Cylindrospermopsis raciborskii)T3sxt基因的Sxt多肽序列可以从GenBank在登记号DQ787200下获得(http://www.ncbi.nlm.nih.gov/nuccore/DQ787200)。蓝藻拟柱孢藻(Cylindrospermopsis raciborskii)T3Sxt多肽的氨基酸序列在本文的附录“序列”部分中给出。然而，本发明不限于那些多肽的序列；本发明涵盖来自其它物种的多肽，其具有与所述蓝藻拟柱孢藻(Cylindrospermopsis raciborskii)T3多肽相同的功能。

在本发明的方法中，使底物与Sxt多肽A、B、D、G、H、I、S、T、U、V、W和X接触，或宿主细胞包含一种或多种编码此类多肽的核酸分子。在本发明的一些实施方式中，底物不与Sxt多肽A、B、D、G、H、I、S、T、U、V、W和X中的一种或多种接触，或宿主细胞不包含一种或多种编码此类多肽的核酸分子。在本发明方法的一些实施方式中，可以使用或不使用编码此类多肽的其它Sxt多肽或核酸分子。

如果本发明的方法确实使用特定的Sxt多肽，则底物将与该Sxt多肽接触和/或宿主细胞将包含编码这种多肽的核酸分子。如果本发明的方法不使用特定的Sxt多肽，则底物将不与该Sxt多肽接触和/或宿主细胞将不包含编码这种多肽的核酸分子。

在一些实施方式中，本发明的方法可以另外使用或不使用独立地选自由Sxt C、E、J、K、L和R组成的组中的一种或多种Sxt多肽，或编码此类多肽的核酸分子。优选地，本发明的方法另外使用选自由Sxt C、E、J、K、L和R(优选C和/或E)组成的组中的一种或多种Sxt多肽，或编码此类多肽的核酸分子。

在一些实施方式中，本发明的方法另外使用Sxt E或编码此类多肽的核酸分子。在其它实施方式中，本发明的方法另外不使用Sxt E或编码这种多肽的核酸分子。

在一些实施方式中，本发明的方法可以使用或不使用Sxt Q多肽或编码这种多肽的核酸分子。

在一些实施方式中，本发明的方法可以使用或不使用Sxt R多肽或编码这种多肽的核酸分子。

在一些实施方式中，本发明的方法可以使用或不使用ORF24多肽或编码这种多肽的核酸分子。

在其它实施方式中，本发明的方法可以使用或不使用独立地选自由Sxt F、M、N、O、P、Y、Z、ORF3、ORF4、ORF29、ORF34、OMPR或HISA组成的组中的一种或多种Sxt多肽，或编码此类多肽的核酸分子。优选地，本发明的方法不使用选自由Sxt F、M、N、O、P、Y、Z、ORF3、ORF4、ORF29、ORF34、OMPR或HISA组成的组中的一种或多种Sxt多肽，或编码此类多肽的核酸分子。

在本发明的一些实施方式中，本发明的方法可以使用或不使用独立地选自由以下组成的组中的一种或多种Sxt多肽(或编码此类多肽的核酸分子)：

可能需要Sxt ACT来制备石房蛤毒素(LWTX-1至-6)的鞘丝藻(Lyngbya wollei)特异性“weird”类似物。它们携带有甲基-乙酰酯侧链而不是氨基甲酰基侧链。

可能需要Sxt DIOX和Sxt SUL来制备C-11硫酸化毒素类似物，例如膝钩藻毒素1至4和C-1至C-4毒素。

可能需要SxtN1和SxtN2来制备各种N-磺基氨基甲酰基类似物(C-毒素)。来自蓝藻拟柱孢藻(C.raciborskii)T3的SxtN可能由于催化位点的突变而失活。

在其它实施方式中，本发明的方法可以使用或不使用独立地选自由ORF24、P和Q组成的组中的一种或多种Sxt多肽，或编码此类多肽的核酸分子。优选地，本发明的方法不使用选自由ORF24、P和Q组成的组的一种或多种Sxt多肽，或编码此类多肽的核酸分子。

本发明的宿主细胞可以使用标准分子生物学技术(例如Green&Sambrook，“Molecular Cloning：A Laboratory Manual”，Fourth Edition，2012)并参考本文公开的实施例来生产。

每种特定多肽的编码序列将与合适的调节元件可操作地结合，所述调节元件有助于在宿主细胞中产生特定的多肽。例如，每个编码序列将与合适的启动子和终止子元件可操作地连接。优选地，这些调节元件被优化用于宿主细胞。例如，如果宿主细胞是大肠杆菌，则优选使用大肠杆菌调节元件(例如启动子、终止子、核糖体结合序列)。

可以将一种或多种核酸分子整合到宿主细胞的基因组中。一种或多种核酸分子可以以质粒或载体的形式存在于宿主细胞中。优选地，所有特定核酸都整合到宿主细胞的基因组中。可以将一种或多种特定核酸插入宿主细胞基因组内的糖操纵子内。

核酸分子可以以操纵子或基因簇片段的形式存在，即编码一种以上的所需多肽。这些可以独立地转化到宿主细胞中。例如，第一核酸分子可以包含编码sxtA、sxtB和sxtC的开放阅读框；第二核酸分子可以包含编码sxtD、sxtE、sxtG、sxtH、sxtI、sxtJ、sxtK和sxtL的开放阅读框；第三核酸分子可以包含编码sxtQ、sxtR、orf24、sxtS、sxtT、sxtU、sxtV、sxtW和sxtX的开放阅读框；和/或第四核酸分子可以包含编码sxtF、sxtP和sxtM的开放阅读框。在一些实施方式中，第三核酸分子可以包含编码sxtQ、sxtR、sxtS、sxtT、sxtU、sxtV、sxtW和sxtX；或sxtS、sxtT、sxtU、sxtV、sxtW和sxtX的开放阅读框。

核酸分子还可以包含合适的选择标记(例如编码抗生素抗性的基因)。核酸分子还可以包含其它控制元件，使得一种或多种多肽的表达是可诱导的。在一些优选的实施方式中，SxtA的表达是可诱导的。

在本发明的一些实施方式中，一种或多种核酸分子或编码功能等同多肽的核酸分子可能已经内源性地存在于宿主细胞中(在宿主细胞基因组中或在内源质粒中)。

本发明还延伸至如本文定义的所有宿主细胞。特别地，本发明提供了宿主细胞，其包含编码独立地选自由A、B、D、G、H、I、S、T、U、V、W和X组成的组中的一种或多种Sxt多肽的核酸分子。宿主细胞可以另外包含或不包含编码独立地选自由Sxt C、E、J、K、L和/或R组成的组中的一种或多种Sxt多肽的核酸分子。宿主细胞可以另外包含或不包含编码Sxt Q的核酸分子。

宿主细胞可以另外包含或不包含编码独立地选自由Sxt F、M、N、O、P、Y、Z、ORF3、ORF4、ORF29、ORF34、OMPR或HISA组成的组中的一种或多种或所有Sxt多肽的一种或多种核酸分子。优选地，宿主细胞不包含编码选自由Sxt F、M、N、O、P、Y、Z、ORF3、ORF4、ORF29、ORF34、OMPR或HISA组成的组中的一种或多种或所有Sxt多肽的核酸分子。

反应介质和培养基为生产新石房蛤毒素或其类似物提供合适的条件。条件将还包括合适的pH和温度，这可以由技术人员容易地确定。在适于生产新石房蛤毒素或其类似物的条件下在培养基中培养宿主细胞。合适的培养基是本领域熟知的。这些将根据正在使用的宿主细胞进行选择。优选地，培养基将是水性介质。

用于生产新石房蛤毒素或其类似物或变体的起始底物是：

(i)S-腺苷甲硫氨酸，

(ii)精氨酸，

(iii)乙酰辅酶A，丙二酰辅酶A或丙酰辅酶A，和

(iv)氨基甲酰磷酸酯。

因此，在该方法开始时，需要在反应介质和培养基中获得合适浓度的上述底物。本领域技术人员可以容易地确定合适浓度的上述底物。可以将精氨酸容易地从周围的培养基中作为底物摄入到宿主细胞中。其它底物(即S-腺苷甲硫氨酸、乙酰辅酶A、丙二酰辅酶A、丙酰辅酶A和氨基甲酰磷酸酯)是不稳定的。优选地，在宿主细胞内以足够的量生产这些底物(它们存在于所有活细胞中)。如果需要，可以容易地修饰宿主细胞以本领域常规的方式增加这些底物的产量。

在本发明的一些实施方式中，该方法在14-24℃的温度进行；优选在16-22℃进行；甚至优选在约17、18、19、20或21℃进行；最优选在约19℃进行。

优选地，从反应或培养基中分离和/或纯化新石房蛤毒素。这种分离/纯化可以通过任何合适的方法进行。

在本发明的实施方式中，其中，所述方法在宿主细胞中进行，新石房蛤毒素将在宿主细胞中生产。因此可以将宿主细胞与培养基分离(例如通过过滤或离心)；然后可以裂解宿主细胞；和收获新石房蛤毒素。

可以通过在C-18反相树脂上的固相萃取从反应或培养基中分离新石房蛤毒素以除去疏水性化合物；新石房蛤毒素将以流通式(flow-through)出现。也可以使用在活性炭上使用阳离子交换树脂的固相萃取。对于进一步的纯化技术，可以参考US2015/0099879。

本发明还提供了生产如下定义的新石房蛤毒素的各种中间体的方法。这些方法可以在无细胞培养基中或在包含编码合适的Sxt多肽的核酸分子的宿主细胞中进行。

在其它实施方式中，本发明提供了生产式I化合物[中间体4]的方法：

其中，R是OH，该方法包括以下步骤：

(A)使式II化合物[中间体3]与Sxt S，和任选的α-酮戊二酸，以及任选的分子氧接触，

其中R是OH；以及(B)从反应介质中分离或纯化式I化合物。

本发明还提供了生产式I化合物[中间体4]的方法：

其中R是OH，该方法包括以下步骤：

(A)在使得生产Sxt S并且Sxt S将式II化合物转化为式I化合物的条件下，在式II化合物(中间体3)存在下在培养基中培养包含编码Sxt S的核酸分子的宿主细胞：

其中R是OH。

在其它实施方式中，本发明提供了生产式I化合物[中间体4']的方法：

其中R是OH，该方法包括以下步骤：

其中R是OH；以及(B)从反应介质中分离或纯化式I化合物。

本发明还提供了生产式I化合物[中间体4']的方法：

其中R是OH，该方法包括以下步骤：

其中R是OH。

在其它实施方式中，本发明提供了生产式I化合物[中间体5]的方法：

其中R是OH，该方法包括以下步骤：

(A)使式II化合物[中间体4]与Sxt D，和任选的NADH，以及任选的NADPH接触：

其中R是OH；以及

(B)从反应介质中分离或纯化式I化合物。

本发明还提供了生产式I化合物[中间体5]的方法：

其中R是OH，该方法包括以下步骤：

(A)在使得生产Sxt D并且Sxt D将式II化合物转化为式I的化合物的条件下，在式II化合物[中间体4]存在下在培养基中培养包含编码Sxt D的核酸分子的宿主细胞：

其中R是OH。

在其它实施方式中，本发明提供了生产式I化合物[中间体5']的方法：

其中R是OH，该方法包括以下步骤：

(A)使式II化合物[中间体4']与Sxt D，和任选的NADH，以及任选的NADPH接触：

其中R是OH；以及

(B)从反应介质中分离或纯化式I化合物。

本发明还提供了生产式I化合物[中间体5']的方法：

其中R是OH，该方法包括以下步骤：

(A)在使得生产Sxt D并且Sxt D将式II化合物转化为式I化合物的条件下，在式II化合物[中间体4']存在下在培养基中培养包含编码Sxt D的核酸分子的宿主细胞：

其中R是OH。

在其它实施方式中，本发明提供了生产式I化合物[中间体6]的方法，

其中R是OH，该方法包括以下步骤：

(A)使式II化合物[中间体5]与Sxt S，和任选的α-酮戊二酸，以及任选的分子氧接触：

其中R是OH；以及(B)从反应介质中分离或纯化式I化合物。

本发明还提供了生产式I化合物[中间体6]的方法：

其中R是OH，该方法包括以下步骤：

(A)在使得生产Sxt S并且Sxt S将式II化合物转化为式I化合物的条件下，在式II化合物[中间体5]的存在下在培养基中培养包含编码Sxt S的核酸分子的宿主细胞：

其中R是OH。

在其它实施方式中，本发明提供了生产式I化合物[中间体6']的方法：

其中R是OH，该方法包括以下步骤：

(A)使式II化合物[中间体5']与Sxt S，和任选的α-酮戊二酸，以及任选的分子氧接触：

其中R是OH；以及(B)从反应介质中分离或纯化式I化合物。

本发明还提供了生产式I化合物[中间体6']的方法：

其中R是OH，该方法包括以下步骤：

(A)在使得生产Sxt S并且Sxt S将式II化合物转化为式I化合物的条件下，在式II化合物[中间体5']存在下在培养基中培养包含编码Sxt S的核酸分子的宿主细胞：

其中R是OH。

在其它实施方式中，本发明提供了生产式I化合物[中间体7]的方法：

其中R是OH，该方法包括以下步骤：

(A)使式II化合物[中间体6]与Sxt S，和任选的α-酮戊二酸，以及任选的分子氧接触：

其中R是OH；以及(B)从反应介质中分离或纯化式I化合物。

本发明还提供了生产式I化合物[中间体7]的方法：

其中R是OH，该方法包括以下步骤：

(A)在使得生产Sxt S并且Sxt S将式II化合物转化为式I化合物的条件下，在式II化合物[中间体6]存在下在培养基中培养包含编码Sxt S的核酸分子的宿主细胞：

其中R是OH。

在其它实施方式中，本发明提供了生产式I化合物[中间体7']的方法：

其中R是OH，该方法包括以下步骤：

(A)使式II化合物[中间体6']与Sxt S，和任选的α-酮戊二酸，以及任选的分子氧接触：

其中R是OH；以及(B)从反应介质中分离或纯化式I化合物。

本发明还提供了生产式I化合物[中间体7']的方法：

其中R是OH，该方法包括以下步骤：

(A)在使得生产Sxt S并且Sxt S将式II化合物转化为式I化合物的条件下，在式II化合物[中间体6']存在下在培养基中培养包含编码Sxt S的核酸分子的宿主细胞：

其中R是OH。

本发明还涵盖上述方法，其中R是H。

本文所用的术语“新石房蛤毒素类似物”涵盖新石房蛤毒素的类似物和变体，例如下面提到的那些化合物(优选石房蛤毒素)。

如本文所公开的石房蛤毒素和新石房蛤毒素生物合成途径的阐明还使得能够生产各种石房蛤毒素、新石房蛤毒素和膝钩藻毒素变体，例如下文所示的变体(参考石房蛤毒素的结构)：

如本文所公开的石房蛤毒素和新石房蛤毒素生物合成途径的阐明还使得能够生产以下新石房蛤毒素类似物和变体(参考石房蛤毒素的结构如下所示)：

石房蛤毒素的分子结构。

麻痹性贝类毒素的天然衍生物(Oshima 1995)。使用的缩写是STX：石房蛤毒素；GTX：膝钩藻毒素；C：C-毒素；dc：脱氨基甲酰基；do：脱氧。

不寻常的石房蛤毒素衍生物的取代基。

(使用的缩写是LTX：鞘丝藻(Lyngbya wollei)毒素；GC：裸甲藻(Gymnodiniumcatenatum)毒素)。

来自金蛙(Atelopus zeteki)的zeteki毒素AB的分子结构(Yotsu-Yamashita等，2004)。

因此，在另一方面，本发明提供了生产如上表中定义的石房蛤毒素变体或其生产中的中间体的方法，该方法包含本文公开的用于生产新石房蛤毒素或新石房蛤毒素生产中的中间体的方法，其中，已经改进该方法以生产石房蛤毒素变体或其生产中的中间体。

例如，在石房蛤毒素的生产中，Sxt X多肽或sxt X基因的使用可能是不必要的，因为SxtX多肽负责新石房蛤毒素生产中的N1-羟基化步骤(并且石房蛤毒素是非N1-羟基化的)。

在C-11磺化以生产C-11硫酸化毒素(例如GTX-1至-4)之前，需要将碳C-11羟基化。这是由SxtDIOX所推定进行的。

磺基转移酶SxtN推定催化N-磺化以生产N-磺基氨基甲酰基毒素，例如GTX5/6和C1-4毒素。不确定这些反应在途径中的何处发生。然而，它们很可能在STX形成之前发生，即在中间体上而不是在途径的最终产物上发生。

在另一方面，本发明提供了用于生产新石房蛤毒素或其类似物或变体的方法，其中，所述方法另外包括使新石房蛤毒素或其类似物或变体与SxtN或SxtDIOX多肽接触的步骤。例如，宿主细胞可以是另外包含编码sxtN和/或sxtDIOX的基因的宿主细胞。

以这种方式，可以通过SxtN(通过氨基甲酰基侧链的硫酸化)将石房蛤毒素转化为GTX-5。类似地，可以通过SxtDIOX将石房蛤毒素转化为11-羟基石房蛤毒素。该步骤将在C-11硫酸化之前将石房蛤毒素转化为GTX-2/3(或将新石房蛤毒素转化为GTX-4/1)。

在给定菌株中生产的毒素阵列很可能是具有不同动力学(反应速度)并且通过各种修饰而改变对中间代谢物的松弛底物特异性的每种酶组合的结果。

中间体8通过O-氨基甲酰基转移酶SxtI转化为中间体9。中间体8以及中间体9均可以是双加氧酶SxtH和SxtT的底物，这些酶将中间体8转化为dcSTX并将中间体9转化为STX。类似的途径可能是neoSTX和dcneoSTX的生产。

中间体8向中间体9和脱氨基甲酰基毒素的转化，以及中间体9向石房蛤毒素的转化。

羟基化中间体8向羟基化中间体9和脱氨基甲酰基新石房蛤毒素的转化，以及羟基化中间体9向新石房蛤毒素的转化。

在又一个实施方式中，本发明提供了通过本发明的方法生产的新石房蛤毒素或其类似物。通过本发明的方法生产的新石房蛤毒素或其类似物可以进一步与无机或有机酸或碱转化为盐，特别是其药学上可接受的盐。

可用于此目的的酸包括盐酸、氢溴酸、硫酸、磺酸、甲磺酸、磷酸、富马酸、琥珀酸、乳酸、柠檬酸、酒石酸、马来酸、乙酸、三氟乙酸和抗坏血酸。适用于此目的的碱包括碱金属和碱土金属氢氧化物，例如氢氧化钠、氢氧化钾或氢氧化铯，氨和有机胺如二乙胺、三乙胺、乙醇胺、二乙醇胺、环己胺和二环己胺。形成盐的程序在本领域中是常规的。

通过本发明的方法或其盐生产的新石房蛤毒素或其类似物可以进一步配制用于药物组合物。因此，在另一方面，本发明提供了生产新石房蛤毒素或其类似物或其盐的方法，该方法另外包括在药物组合物中配制分离的或纯化的新石房蛤毒素或其盐的步骤。优选地，该步骤包括将分离的或纯化的新石房蛤毒素或其类似物或其盐与一种或多种药学上可接受的载体、佐剂和/或赋形剂组合。

特别地，根据本领域熟知的技术，可以将新石房蛤毒素或其类似物或其盐与一种或多种常规载体、稀释剂和/或赋形剂一起配制。药学上可接受的载体、佐剂和/或赋形剂可以是防腐剂。

该组合物可以适于口服施用或胃肠外施用，例如通过皮内、皮下、腹膜内、静脉内或肌内注射。因此，合适的药物形式包括普通或包衣片剂、胶囊、悬浮液和溶液，其含有活性组分以及任选地一种或多种常规惰性载体和/或稀释剂，例如玉米淀粉、乳糖、蔗糖、微晶纤维素、硬脂酸镁、聚乙烯吡咯烷酮、柠檬酸、酒石酸、水、水/乙醇、水/甘油、水/山梨糖醇、水/聚乙二醇、丙二醇、硬脂醇、羧甲基纤维素或脂肪物质如硬脂或任何上述物质的合适混合物。

或者，新石房蛤毒素或其盐可以配制用于局部施用，例如以凝胶、乳霜、乳液、糊剂等形式，例如包含新石房蛤毒素或其盐以及常规稀释剂、载体或赋形剂。

在其它实施方式中，新石房蛤毒素或其盐可以配制用于透皮施用。

附图说明

图1：由Kellmann(2008)提出的用于生产石房蛤毒素的先前生物化学途径。

图2-图3：两种修订的用于生产新石房蛤毒素的生物化学途径。在图2中，该途径涉及使用6-5-5元环中间体。

在图3中，该途径涉及使用5-5-5元环中间体，其转化为6-5-5环系统。

图4A-图4B：提出的生物化学途径，其显示在新石房蛤毒素的产生中在途径中的何处引入N-1羟基。-R基团表示可能发生羟基化的位置。

图5：IMAC后SxtA的SDS-PAGE。泳道1：含有SxtA(147kDa)的蛋白溶液；伴侣，DnaK和GroES，(分别为70kDa和60kDa)；Sfp，(27kDa)。泳道2：梯形精度+蛋白标准双色(BioRad)。

图6：SxtA-ACP结构域的磷酸泛酰巯基乙胺基化的MALDI-TOF-TOF分析。通过MALDI-TOF-TOF分析纯化的SxtA(a)和与Sfp(b)共表达的SxtA，各自的质量分别为14694Da和15034Da。340Da的差异对应于磷酸泛酰巯基乙胺基臂的附着。

图7：大肠杆菌转化体甲醇提取物的液相色谱-质谱。a)诱导(虚线)和非诱导(实线)提取物两者的总离子流色谱图。b)诱导(虚线)和非诱导(实线)提取物两者的m/z＝187.06的提取离子色谱图。c)ProgenesisQI统计分析，比较诱导(方形)和非诱导(圆形)的提取物之间m/z 187.06处分子离子的表达。d)诱导的提取物的质谱。

图8：将PPT酶基因构建体插入大肠杆菌的甘露醇操纵子中的方案。

图9A和图9B：(a)整合到乳糖操纵子中的sxt1，通过翻转酶重组除去卡那霉素盒。(b)整合到麦芽糖操纵子中的sxt2，通过翻转酶重组除去卡那霉素盒。(c)整合到木糖操纵子中的sxt3(所有基因)，通过翻转酶重组除去卡那霉素盒。(d)整合到蜜二糖操纵子中的sxt4，未除去卡那霉素盒。

图10：大肠杆菌BL21(DE3)T3PPT酶NSX3v1的细胞提取物中的中间体8的检测。

图11：大肠杆菌BL21(DE3)T3PPT酶NSX3v1的细胞提取物中的中间体8的MS/MS谱。

图12：新石房蛤毒素标准溶液(100nM)的精确质量LC-MS分析。m/z 316.13639(400mmu窗口)的选择离子监测色谱图显示在上图中，峰值的MS谱图和理论谱图分别显示在中间和下图中。保留时间(RT)、手动积分峰面积(MA)、信噪比(SN)在上图中给出。测量的质量、化学组成和质量误差(ppm)在中间和下图中给出。

图13：来自大肠杆菌BL21(DE3)sfp NSX3v3的提取物的精确质量LC-MS分析。m/z316.13639(400mmu窗口)的选择离子监测色谱图显示在上图中，峰值的MS谱图和理论谱图分别显示在中间和下图中。保留时间(RT)、手动积分峰面积(MA)、信噪比(SN)在上图中给出。测量的质量、化学组成和质量误差(ppm)在中间和下图中给出。

图14：通过各种细胞裂解方法从大肠杆菌BL21(DE3)pVB-sxtABC中回收中间体1。LC-MS分析在SIM模式下进行(m/z 187.15534，质量窗口为400mmu)。仪器响应以峰面积(每秒计数)给出。

图15：neoSTX相对于大肠杆菌sfp NSX3v4(sfp sxt123V4)的生产水平百分比。sfpsxt123V4的提取物中neoSTX的估计浓度为2.8nM。

图16：将来自在50ml TB培养基中的摇瓶培养物中生长的大肠杆菌BL21(DE3)sfp(阴性对照菌株)和BL21(DE3)sfp NSX3v3的钠通道阻断毒素neoSTX浓缩。每个条代表生物学重复。误差条表示相同提取物的4个重复MNBA测定的标准偏差。在从1.2g细胞沉淀物分析之前，通过弱阳离子交换固相萃取提取所有样品。浓度以nmol neoSTX/升给出。提取物中neoSTX的平均浓度为38.74nM(±7.8标准偏差)。

图17：由大肠杆菌BL21(DE3)sfp pVB-sxtA生产中间体1。sfp pVB：没有插入的pVB载体。sfp nat 8：具有天然sxtA密码子使用和RBS与起始密码子之间的8bp间隔区的pVB载体。sfp nat 10：具有天然sxtA密码子使用和RBS与起始密码子之间的10bp间隔区的pVB载体。sfp syn 8：具有合成sxtA基因(被密码子使用优化以在大肠杆菌中表达)和RBS与起始密码子之间的8bp间隔区的pVB载体。sfp syn 10：具有合成sxtA基因(被密码子使用优化以在大肠杆菌中表达)和RBS与起始密码子之间的10bp间隔区的pVB载体。

图18：大肠杆菌菌株中中间体8和neoSTX的生产。T3PPT：大肠杆菌T3PPT酶NSX3V1。NsPPT：大肠杆菌T3PPT酶NSX3V1pET28b-NsPPT，编码结节菌(Hodularia spumigena)磷酸泛酰巯基乙胺基转移酶。T3Ala18T3PPT酶：大肠杆菌T3PPT酶NSX3V1pET30b-Ala18T3PPT酶，编码T3PPT酶，其去除了前18个N-末端氨基酸以改善表达过程中的溶解度。用0.2mM IPTG和1mM甲苯甲酸诱导培养物，如图所示。

图19：使用石房蛤毒素作为底物的SxtN的磺基转移酶测定的LC色谱图、MS谱、MS/MS片段化(从上到下)。

图20：使用STX作为底物的双加氧酶测定(SxtDIOX)的LC色谱图、MS谱，MS/MS片段化(从上到下)。用箭头表示在测定(右)中表示羟基-STX产生而在对照(左)中不存在的峰。

具体实施方式

实施例

通过以下实施例进一步说明本发明，除非另有说明，其中份数和百分比均以重量计，度数为摄氏度。应当理解的是，这些实施例虽然表明了本发明的优选实施方式，但仅以说明的方式给出。从以上讨论和这些实施例中，本领域技术人员可以确定本发明的基本特征，并且在不脱离其精神和范围的情况下，可以对本发明进行各种改变和修饰以使其适应各种用途和条件。因此，除了本文所示和所述的那些之外，从前面的描述中本发明的各种修饰对于本领域技术人员而言是显而易见的。这些修饰也旨在落入所附权利要求的范围内。

本文所述的每篇参考文献的公开内容均以引用的方式整体并入本文。

实施例1：SxtA的生产

在pET28b中亚克隆sxtA和sfp

使用Velocity聚合酶(Bioline)从基因组DNA进行来自蓝藻拟柱孢藻(Cylindrospermopsis raciborskii)T3的sxtA和来自枯草芽孢杆菌(Bacillus subtilis)的sfp的PCR扩增。遵循制造商的方案，退火温度为55℃，sxtA和sfp的延伸时间分别为4分钟和1分钟(sxtA引物：正向5'-GGGCTTTCATATGTTACAAAAGATTAA-3'(SEQ ID NO：81)和反向5'-AAAGTATGCGGCCGCATGCTTGAGTAT-3'(SEQ ID NO：82)；sfp引物：正向5'-GGCATCCATGGGCAAGATTTACGGAA-3'(SEQ ID NO：83)和反向5'-GGCATCTCGAGTTATAAAAGCGCTTCG-3'(SEQ ID NO：84))。纯化PCR扩增子(DNA clean和浓缩剂5X试剂盒，ZymoResearch)并用NdeI/NotI(sxtA)或NcoI/XhoI(sfp；New England Biolabs)消化。将消化的产物纯化并连接到pET-28b(Novagen)中，用相同的酶切割，并通过琼脂糖凝胶电泳(DNA回收试剂盒，ZymoResearch)纯化。在电感受态大肠杆菌GB2005细胞中转化后，用通用引物T7启动子和T7终止子通过纯化质粒(PureLink Miniprep，Invitrogen)的PCR筛选阳性克隆。对插入物进行测序(Ramaciotti Center，UNSW，Australia)用于验证。

为了与sxtA共表达，使用Velocity聚合酶(Bioline)从pET28b::sfp扩增sfp基因，用于T7启动子和T7终止子的引物为(5'-GGTTAAGATCTGAAATTAATACGACTC-3'(SEQ ID NO：85)，5'-TTTTAAGATCTTTTCAGCAAAAAACCC-3'(SEQ ID NO：86))。遵循制造商的方案，退火温度为55℃，延伸时间为1分钟。纯化扩增子(DNA净化和浓缩剂5X试剂盒，ZymoResearch)并用BglII(New England Biolabs)消化。将消化的产物纯化并连接到pET28b::sxtA中，用相同的酶切割，并如前所述进行纯化。在电感受态大肠杆菌GB2005细胞中转化后，通过纯化质粒(PureLink Miniprep，Invitrogen)的PCR筛选阳性克隆。对插入物进行测序(RamaciottiCenter，UNSW,Australia)用于验证。

用sfp表达sxtA并纯化holo-SxtA

为了表达sxtA，将0.5mL含有pET28b::sxtA，sfp和pRARE质粒(Invitrogen)的过夜大肠杆菌BL21(DE3)转化体在50mL Lysogeny Broth(LB)培养基中传代培养并在30℃搅拌(200rpm)下温育直至在600nm处的光密度为0.8-1.0，所述培养基补充有50μg.mL^-1卡那霉素和30μg.mL^-1氯霉素。然后用200μM异丙基β-D-硫代半乳糖苷(IPTG)诱导培养物，并在18℃搅拌温育过夜，并通过离心(4000rpm，在4℃20分钟，Hitachi CR22GIII离心机，R10A5转子)沉淀。将细胞沉淀冷冻直至进一步纯化。

将沉淀的细胞重悬于10mL裂解缓冲液(20mM磷酸钠缓冲液，pH 7.4，500mM NaCl，20mM咪唑)中，并通过超声裂解(Branson Digital Sonifier M450，3mm探针，30％振幅，4℃3分钟，15秒通电和59秒关闭)。将得到的悬浮液离心(20000rpm，4℃下60分钟，HitachiCR22GIII离心机，R20A2转子)，并将上清液上样到Ni-亲和柱(1mL HiTrap柱，安装在AKTApurifier，GE Healthcare上)，用20mM磷酸钠缓冲液，pH 7.4，500mM NaCl，20mM咪唑(缓冲液A)平衡。注射后，洗涤柱子(35mL缓冲液A，1mL.min^-1)并使用20mM磷酸钠缓冲液，pH7.4，500mM NaCl，500mM咪唑(缓冲液B)洗脱蛋白，并且在0％至20％逐步梯度的缓冲液B中洗涤20分钟，接着在20％洗涤10分钟，然后在20％至100％线性梯度洗涤20分钟，以及在100％最后洗涤10分钟。在变性条件下(SDS-PAGE)通过10％聚丙烯酰胺凝胶电泳分析收集的级分(1mL，在280nm处检测)，合并含有纯蛋白的级分。将蛋白溶液用50mM HEPES-150mMNaCl pH7.4通过离心过滤器(Amicon Ultra-4离心过滤器单元100k)脱盐和浓缩，然后加入甘油至终浓度10％(w/v)。通过使用蛋白测定试剂盒(Bio-Rad)测定蛋白浓度并储存在-80℃。

克隆sxtA的酰基载体蛋白结构域用于单独表达和与sfp一起表达

使用Velocity聚合酶(Bioline)(引物：正向5'-ATATCCATGGGACCTGGTGATCGCAAAGGA-3'(SEQ ID NO：87)和反向5'-TATCTCGAGAGTGTTGATTTCGTTGGCTG-3'(SEQ ID NO：88))扩增sxtA(sxtA-ACP)编码基因的酰基载体蛋白。遵循制造商方案，退火温度为54℃，延伸时间为1.5分钟。使用与sfp所述相同的方法纯化、消化PCR扩增子并连接到pET-28b中。在电感受态大肠杆菌GB2005细胞中转化后，用通用引物T7启动子和T7终止子筛选阳性克隆，并如前所述测序。为了与sfp共表达，将基因克隆到pET28b::sxtA-ACP质粒中，如前所述。

apo-和holo-sxtA-ACP的表达和纯化

为了表达sxtA-ACP，如上所述，将10mL含有pET28b::sxtA-ACP和pET28b::sxtA-ACP、sfp质粒的过夜大肠杆菌BL21(DE3)转化体在1L Lysogeny肉汤(LB)中培养并在37℃搅拌(200rpm)下温育直至用100μM IPTG诱导，该肉汤补充有50μg.mL^-1卡那霉素和30μg.mL^-1氯霉素。通过离心(4000rpm，在4℃20分钟，Hitachi CR22GIII离心机，R10A5)收集细胞，重悬于15mL裂解缓冲液中，并通过超声破碎(Branson Digital Sonifier M450，3mm探头，振幅30％，4℃ 3min，1秒通电，然后4秒关闭的循环)。将得到的悬浮液离心(20000g，在4℃60分钟，Hitachi CR22GIII离心机，R20A2转子)，并将上清液上样到Ni-亲和柱(1mL HiTrap柱，安装在AKTApurifier，GE Healthcare上)，其预先用20mM磷酸钠缓冲液，pH 7.4，500mMNaCl，20mM咪唑(缓冲液A)平衡。注射后，洗涤柱子(35mL缓冲液A，1mL.min^-1)，用20mM磷酸钠缓冲液，pH7.4，500mM NaCl，500mM咪唑(缓冲液B)洗脱蛋白，在0％至20％线性梯度的B中洗涤20分钟，接着在20％洗涤10分钟，然后在20％至100％线性梯度洗涤20分钟，以及在100％最后洗涤20分钟。在变性条件下(SDS-PAGE)通过15％聚丙烯酰胺凝胶电泳分析收集的级分(1mL，在280nm处检测)，合并含有纯蛋白的级分。将蛋白溶液使用离心过滤(Amicon Ultra-15离心过滤装置3k)和50mM HEPES-150mM NaCl，pH7.4脱盐和浓缩，在液氮中冷冻并储存在-80℃。通过使用蛋白测定试剂盒(Bio-Rad)测定蛋白浓度。

在IMAC和SDS-PAGE上纯化后成功检测到SxtA(图5)。纯化预期大小为143kDa的蛋白，培养物的产量为0.5mg.L^-1，通过胰蛋白酶解确认身份为SxtA。

Apo-和holo-sxtA-ACP的MALDI-TOF-TOF质谱分析

通过MALDI-TOF-TOF质谱法检测蛋白质量。对于基质制备，将10mg的3,5-二甲氧基-4-羟基肉桂酸加入到含有0.1％TFA的1mL 80％乙腈中，并将1mL基质与1μl蛋白样品混合在MALDI靶板的表面上。然后通过Bruker ultrafleXtreme MALDI-TOF/TOF用YAG激光进行分析。以正离子模式进行数据采集，并在每次分析之前立即校准仪器。在获得100个平均光谱的线性延迟提取模式中进行分析。结果如图6所示。

4-氨基-3-氧代-胍基庚烷的提取

将含有pRARE和pET28b::sxtA，sfp的BL21(DE3)转化体重悬于用0.1％酸乙酸酸化的甲醇中。通过超声破碎细胞(Branson Digital Sonifier M450，3mm探针，30％振幅，4℃2分钟，5秒通电和15秒关闭的循环)。将得到的悬浮液离心(20000rpm，在4℃30分钟，HitachiCR22GIII离心机，R20A2转子)。将上清液在旋转蒸发下干燥并储存在-20℃直至进一步分析。4-氨基-3-氧代-胍基庚烷的质谱分析

为了确定SxtA的生物合成产物，将含有pET28b::sxtA、sfp和pRARE的大肠杆菌细胞的细胞内代谢物化学提取并通过LC-MS分析。

将样品重悬于95：5乙腈：水(通常1mL)中，并转移至HPLC小瓶中进行质谱分析。使用连接至Q-Exactive Plus(ThermoFisher Scientific)的Dionex U3000UHPLC通过加热的电喷雾界面，对10μL样品进行LC-MS分析。在默认源条件下(如制造商的Tune软件所建议的)以正模式进行电离。将样品注射到Waters BEH HILIC柱(2.1×100mm，1.9μm)上。色谱条件如Turner等所述，没有修改。

质谱仪以数据依赖性分析模式运行，在每个全扫描质谱后收集六个MS/MS谱。来自文献的毒素和代谢物的包含列表用于优先考虑它们的检测。

诱导细胞和未诱导对照之间质谱的比较显示在m/z 187.06[M+H]+的1.1分钟处存在分子离子，对应于AOGH(C₈H₁₈N₄O)的质子化质量。该分子离子的二次离子碎裂导致与AOGH非常相似的碎裂模式。该实验在8个重复中实现，并且通过Progenesis QI分析质量数据以量化诱导和非诱导提取之间的表达差异。与未诱导的对照相比，观察到推定的AOGH化合物在诱导的细胞中过表达(图)，最大倍数变化等于无穷大(在阴性对照中完全不存在)并且ANOVAp值为1.1×10^-16。

纯化并分析187.06Da质量的化合物，NMR证实了AOGH的结构。

实施例2：sxt1片段

将来自蓝藻拟柱孢藻(C.raciborskii)T3的以下三个开放阅读框(ORF)置于标记为“sxt1”：sxtA、sxtB和sxtC的核苷酸片段中。使用GeneArt软件，通过Life Technology对每个ORF进行密码子优化以在大肠杆菌中表达。

在片段的两端添加EcoRI限制性位点。另外，将lacZ(H1)和lacA(H2)基因的50bp同源区域分别添加到5'-和3'-末端，以通过RED ET介导的重组整合到大肠杆菌基因组中。在H1的下游，添加终止子以防止通读，然后是转录因子基因xylS及其Ps2启动子。(XylS是在与其诱导物甲苯甲酸结合后从Pm启动子转录所需的转录因子。)然后是终止子，然后是Pm启动子以用于转录下游sxt基因。在每个ORF的上游，添加核糖体结合位点(RBS)。最后，加入具有用于通过翻转酶-重组酶(GeneBridges)切除的两个侧翼FRT位点的卡那霉素抗性标记和同源臂H2，包括末端EcoRI位点。

实施例3：sxt2片段

以下sxt基因包括在“sxt2”片段中：sxtD、sxtE、sxtG、sxtH、sxtI、sxtJ、sxtK、sxtL。使用GeneArt软件，通过Life Technology对每个ORF进行密码子优化以在大肠杆菌中表达。

设计sxt2片段以具有末端EcoRI位点，用于与大肠杆菌的malE(H1)和malG(H2)基因重组的同源臂以及sxt基因上游的Pm启动子。该片段还含有具有FRT位点的kanR抗性盒，如片段sxt1。

实施例4：sxt3片段

设计了sxt3片段的三种变体。以下sxt基因包括在“sxt3”片段中，变体1：sxtQ、sxtR、orf24、sxtS、sxtT、sxtU、sxtV、sxtW、sxtX。以下sxt基因包括在“sxt3”片段中，变体2：sxtQ、sxtR、sxtS、sxtT、sxtU、sxtV、sxtW、sxtX。以下sxt基因包括在“sxt3”片段中，变体3：sxtS、sxtT、sxtU、sxtV、sxtW、sxtX。使用GeneArt软件，通过Life Technology对每个ORF进行密码子优化以在大肠杆菌中表达。

设计sxt3片段的每个变体以具有末端EcoRI位点，用于与大肠杆菌的xylF(H1)和xylB(H2)基因重组的同源臂以及sxt基因上游的Pm启动子。该片段的每个变体还含有具有FRT位点的kanR抗性盒，如片段sxt1。

实施例5：sxt4片段

以下sxt基因包括在“sxt4”片段中：sxtF、sxtP、sxtM。使用GeneArt软件，通过LifeTechnology对每个ORF进行密码子优化以在大肠杆菌中表达。

设计sxt4片段以具有末端EcoRI位点，用于与大肠杆菌的melR(H1)和melB(H2)基因重组的同源臂以及sxt基因上游的Pm启动子。该片段还含有具有FRT位点的kanR抗性盒，如片段sxt1。

实施例6：大肠杆菌BL21(DE3)PPT酶的产生

理想的是使用磷酸泛酰巯基乙胺基转移酶(PPT酶)将聚酮化合物合成酶的载脂形式SxtA转化为其holo-形式。

已经对Raphidiopsis brooki D9和Cylindrospermopsis racoborskii CS-505的整个基因组进行测序，并将序列保存在GenBank中。这些菌株中的每一种仅含有单一PPT酶基因。基于D9和CS-505PPT酶基因设计特异性PCR引物以PCR扩增和测序来自蓝藻拟柱孢藻(C.raciborskii)T3的PPT酶基因。

设计合成基因构建体以将蓝藻拟柱孢藻(C.racicorskii)T3PPT酶基因整合到大肠杆菌BL21(DE3)的麦芽糖操纵子中。对PPT酶基因进行密码子优化以在大肠杆菌中表达，并且该构建体装配有T7启动子和β-内酰胺酶基因以用于选择氨苄青霉素抗性。起始密码子也改为ATG。

然后使用Quick&Easy大肠杆菌基因缺失试剂盒按照制造商的说明(GeneBridges，目录号K006)将基因构建体整合到大肠杆菌BL21(DE3)(Life Technology)的麦芽糖操纵子中，如图8所示。通过测序验证了非预期突变的正确整合和缺失。

实施例7：通过大肠杆菌BL21(DE3)PPT酶pSxt1生产4-氨基-3-氧代-胍基庚烷

sxt1片段通过Life Technology在pMA-RQ(ampR)质粒骨架内产生。该质粒在本文中将称为pSxt1。将pSxt1质粒转化到大肠杆菌BL21(DE3)PPT酶中，其携带来自其基因组中的蓝藻拟柱孢藻(Cylindrospermopsis raciborskii)T3的磷酸泛酰巯基乙胺基转移酶。PPT酶基因在T7启动子控制下(IPTG诱导型)，pSxt1上的sxtA、B和C基因在Pm启动子控制下(间甲苯甲酸可诱导型)。

本实验的目的是测量在恒定诱导剂浓度(IPTG(0.5mM)和间甲苯甲酸(1mM))的三个不同温度5℃、19℃和30℃下sxtA基因大肠杆菌中的表达和活性。实验菌株是大肠杆菌BL21(DE3)PPT酶pSxt1，阴性对照是大肠杆菌BL21(DE3)(亲本菌株)。预期仅SxtA的酶产物，因为SxtB和SxtC的底物是其它酶的酶产物，例如SxtG，其不在pSxt1上编码。

BL21(DE3)(亲本菌株)和BL21(DE3)PPT酶pSxt1的种子培养物分别在37℃下在LB和LB50μg/ml氨苄青霉素和卡那霉素中过夜生长。第二天，将含有卡那霉素50μg/ml的200ml体积的LB培养基一式三份接种，每次用大肠杆菌BL21(DE3)PPT酶pSxt1的2ml种子培养物接种，并在30℃温育直至培养物达到OD₆₀₀为～0.6。

对于阴性对照，用来自大肠杆菌BL21(DE3)的2ml种子培养物各一式三份接种200ml体积的不含抗生素的LB，并在30℃温育至OD₆₀₀为～0.6。然后将所有培养物转移至相应的温度，并适应30分钟。随后，向每种培养物中加入IPTG(0.5mM终浓度)和间甲苯甲酸(1mM终浓度)，然后在5℃温育48小时，在19℃温育18小时，并在30℃温育18小时。

在诱导前和实验结束时采集样品用于SDS-PAGE以及用于RT-PCR。诱导18小时后，通过7500rpm离心12分钟收获培养物。将细胞沉淀冷冻直至提取用于LC-MS分析。

提取

将细胞沉淀重悬于1ml水中并在冰上超声处理(输出对照4，占空比50％，总共7分钟，循环2-3分钟)。超声处理后，加入4ml乙腈，涡旋样品，离心除去细胞碎片和其它颗粒。

LC-MS/MS分析

在Hikelaboratory，Haukeland大学医院的Waters Xevo TQ-S上进行LC-MS分析，所述Waters Xevo TQ-S与配有50×2.1mm Acquity BEH酰胺柱的iclass Acquity UPLC偶联。流动相A由10mM甲酸铵pH 3.0组成，流动相B由95％乙腈和10mM甲酸铵pH 3.0组成。流速为每分钟0.4ml，柱温保持在40℃。以梯度85％B至70％B在3分钟内施加。注射体积总是1μl。

通过电喷雾电离将分析物以正模式电离。根据Tsuchiya等(2014)和Tsuchiya等(2015)，测量了以下mrm跃迁。精氨酸175.05->60.00、175->70.02，4-氨基-3-氧代-胍基庚烷：187.1->170.1、187.1->128.1、187.1->110.1、187.1->72.08、187.1->60.05。

在所有培养处理以及纯精氨酸溶液中检测到大的精氨酸峰(数据未显示)，而精氨酸溶液和所有对照中不存在4-氨基-3-氧代-胍基庚烷信号。此外，除了在19℃诱导的培养物外，所有大肠杆菌BL21(DE3)PPT酶pSxt1培养物中都不存在4-氨基-3-氧代-胍基庚烷信号。

该实验证明使用合成的DNA构建体可以在大肠杆菌BL21(DE3)中以催化活性形式表达SxtA。在该实验中，在用0.5mM IPTG和1mM甲苯甲酸诱导后，表达仅在19℃的生长温度下发生。

实施例8：将片段sxt1与sxt3整合到大肠杆菌DE3(BL21)PPT酶的糖分解代谢操纵子中

将sxt1构建体整合到大肠杆菌BL21(DE3)PPT酶的lac操纵子中，如下：

使用2μl模板DNA、0.4μM引物，Phusion DNA聚合酶在50μl反应体积中进行PCR扩增合成的DNA构建体sxt1。

PCR循环如下：98℃1分钟，30个循环：98℃5秒，72℃2分钟，72℃5分钟，然后保持在4℃。

在通过凝胶电泳和凝胶提取纯化后，然后将PCR产物(8019bp)用于RED ET介导的重组。在重组之前，通过电穿孔用质粒pRED(GeneBridges)转化大肠杆菌BL21(DE3)PPT酶，并根据制造商的说明书诱导pRED编码的重组酶的转录。随后，用上述PCR产物(2.5kV，200Ohm，25μF，在5μl中150ng PCR产物)电穿孔转化菌株，然后重组进入lac操纵子。

将电穿孔的细胞接种到含有15μg/ml卡那霉素的LB琼脂上，并在37℃过夜生长。挑取得到的克隆并接种到含有15μg/ml卡那霉素的MacConkey(含乳糖)琼脂上，并在37℃生长至少24小时。将得到的白色菌落分离到纯培养物中，并通过PCR和测序进行测试以确保片段sxt1正确且无突变地整合到lac操纵子中。

确认后，根据制造商的方案(GeneBridges)，使用质粒p707通过翻转酶重组选择克隆以除去卡那霉素抗性盒。筛选得到的克隆的卡那霉素抗性，并通过PCR验证卡那霉素抗性盒的成功去除。此外，PCR用于验证sxt1片段的其余部分是完整的。

然后使用相同的方法将所得菌株用于将片段sxt2整合到麦芽糖操纵子中。通过相同的方法使用所得菌株(其中整合有片段sxt1和sxt2且去除卡那霉素抗性盒后)将sxt3片段的三种变体中的每一种整合到木糖操纵子中。

sxt3变体大肠杆菌BL21(DE3)菌株

菌株	菌株设计	从sxt3中缺失基因
			T3PPT酶sxt1 sxt2 sxt3 v1	NSX3v1	无
T3PPT酶sxt1 sxt2 sxt3 v2	NSX3v2	orf24
			T3PPT酶sxt1 sxt2 sxt3 v3	NSX3v3	sxtQ、sxtR和orf24

然后使用来自枯草芽孢杆菌(Bacillus subtilis)的4'-磷酸泛酰巯基乙胺基转移酶基因sfp(Pfeifer BA，等(2001)Science 291：1790-2)代替上述每种菌株中的T3PPT酶以生产另外的菌株。

然后将所得菌株用于将片段sxt4整合到大肠杆菌BL21(DE3)T3PPT酶和大肠杆菌BL21(DE3)sfp的蜜二糖操纵子中。没有除去卡那霉素盒。sxt1-4片段的图表在图9A和图9B中给出。

实施例9：大肠杆菌BL21(DE3)sfp NSX3v3的变体菌株的产生

使用菌株大肠杆菌BL21(DE3)sfp NSX3v3作为亲本菌株以产生以下菌株，其中通过同源重组方法缺失个体或多组基因。

大肠杆菌BL21(DE3)菌株表和已将它们整合到非必需的糖操纵子中的基因

实施例10：使用LC-MS检测新石房蛤毒素和中间体

LC-MS用于检测新石房蛤毒素和新石房蛤毒素生产中的中间体。LC-MS分析在ThermoFisher Scientific Q Exative Hybrid Quadrupole质谱仪上进行，该质谱仪配备有ESI II离子源，并在线偶联至Dionex 3000Ultimate RSLC Ultrapressure液相色谱仪。

可以由大肠杆菌BL21(DE3)NSX3菌株产生的可能的石房蛤毒素类似物和中间代谢物的质荷比(m/z)

化合物	m/z[M+H]+加合物	化学组成
			中间体1	187.15534	C<sub>8</sub>H<sub>19</sub>ON<sub>4</sub>
中间体2	229.17714	C<sub>9</sub>H<sub>21</sub>ON<sub>6</sub>
			中间体3	211.16657	C<sub>9</sub>H<sub>19</sub>N<sub>6</sub>
中间体4	209.14584	C<sub>9</sub>H<sub>17</sub>N<sub>6</sub>
			中间体5	207.13527	C<sub>9</sub>H<sub>15</sub>N<sub>6</sub>
中间体6	223.13019	C<sub>9</sub>H<sub>15</sub>ON<sub>6</sub>
			中间体7	223.13090	C<sub>9</sub>H<sub>15</sub>ON<sub>6</sub>
中间体8	225.14584	C<sub>9</sub>H<sub>17</sub>ON<sub>6</sub>
			中间体9	268.15165	C<sub>10</sub>H<sub>18</sub>O<sub>2</sub>N<sub>7</sub>
dcSTX	257.13566	C<sub>9</sub>H<sub>17</sub>O<sub>3</sub>N<sub>6</sub>
			dcneoSTX	273.13058	C<sub>9</sub>H<sub>17</sub>O<sub>4</sub>N<sub>6</sub>
STX	300.14148	C<sub>10</sub>H<sub>18</sub>O<sub>4</sub>N<sub>7</sub>
			neoSTX	316.13639	C<sub>10</sub>H<sub>18</sub>O<sub>5</sub>N<sub>7</sub>
STX-15N4	304.12962	C<sub>10</sub>H<sub>18</sub>O<sub>4</sub>N<sub>3</sub>-<sup>15</sup>N<sub>4</sub>

实施例11：大肠杆菌提取物中中间体1和中间体8的检测

大肠杆菌BL21(DE3)T3PPt酶NSX3v1在19℃下在100ml烧瓶中的20ml LB肉汤中振荡(200rpm)生长。当其达到OD₆₀₀为0.9时，用0.2mM IPTG，1mM甲苯甲酸诱导培养物，并生长18小时至OD₆₀₀＝5。

通过离心收获细胞，并在800μl的0.1M乙酸的甲醇溶液中提取。将裂解物离心，并在LC-MS分析之前用乙腈以1：5稀释上清液。

在提取物中检测到中间体1和8。来自中间体8的光谱显示在图10和图11中。

实施例12：新石房蛤毒素的生产

在50ml Hi YE培养基中制备大肠杆菌sfp NSX3v3的种子培养物，并在30℃(225rpm)温育过夜。根据制造商的说明，建立配备有加热器，水冷，pH和溶解氧探针的新Brunswick BioFlo 110发酵罐(2L体积)用于发酵实验。将2L Hi-YE培养基装入发酵罐，并高压灭菌。在高压灭菌后，将酵母提取物、氯化镁、葡萄糖和甘油的储备溶液无菌地添加到发酵罐中。另外，向发酵罐中加入2ml 5％消泡剂204(Sigma Aldrich)的消毒剂溶液。用20ml过夜种子培养物接种培养基，其OD₆₀₀为5.71。起始培养物的OD₆₀₀在0.15下测量。在19℃将培养物温育，初始搅拌速度为50rpm，温育26小时后增加至600rpm。用加压空气以2升/小时的流速吹扫培养物。连续监测pH和溶解氧水平，并在取样后离线测量生长。在整个实验期间pH(pH 7.1)以及溶解氧水平(100％)是稳定的。温育22小时后(OD₆₀₀＝10.6)用0.5mM间甲苯甲酸和0.2mM IPTG诱导培养物，并再温育22小时。将无菌葡萄糖溶液(400g/l)以2.9ml/min的流速在实验的24和26.3小时之间加入培养物中(总共11.4g)，并且1.8ml无菌1M硫酸镁溶液是在实验的26.3小时添加，以试图刺激neoSTX的生长和产生。45小时后终止实验，此时通过离心(5000×5，30分钟，4℃)收获培养物。将细胞沉淀用50ml冰冷的MQ水(5000×g，10分钟，4℃)洗涤两次，称重，并储存在-20℃直至分析。获得的总生物量是23.77g。

通过在0.1％甲酸中煮沸来裂解来自发酵实验的细胞，并且在LC-MS分析之前用含有0.1％甲酸的乙腈以1：5稀释提取物(参见图12和图13)。还通过小鼠神经母细胞瘤测定MS分析沉淀中neoSTX的含量。

实施例13：优化细胞裂解以提取中间体

将天然基因sxtA、sxtB、sxtC克隆到pVB载体(Vectrons Biosolutions)中，并将得到的载体pVB-sxtABC转化到大肠杆菌BAP1中。BAP1pVB-sxtABC在19℃下在10ml TB培养基中以200rpm振荡生长24小时。通过离心收获细胞，并用冰冷的MQ水洗涤两次，将沉淀物称重，并储存在-20℃直至分析。

将沉淀物在各种裂解溶液中重悬(1：3湿重：体积)：

1.含有25mM氢氧化钠的50％甲醇

2.含有0.5％氢氧化铵的50％甲醇

3.含有0.1％甲酸的50％甲醇

4.0.1mM盐酸

5.0.1％甲酸

6.0.5％氢氧化铵

使用配备有微探针的Branson Sonifier 250(输出2，占空比50％)将处理1、2和3超声处理2分钟。将处理3至5在沸水批次中煮沸5分钟。将提取物在18000×g(4℃)下离心10分钟。将250μl上清液与含有0.4％甲酸的750μl乙腈混合，并离心(10分钟，18000×g，4℃)。将上清液转移至自动进样器小瓶中以用于中间体1的LC-MS分析(参见图14)。

在0.1％甲酸中煮沸5分钟被认为是最合适的方法，因为它不会引起对HILIC LC-MS的干扰，并且在提取过程中产生最小量的沉淀。

实施例14：最佳菌株和生产水平

在10ml LB肉汤中制备大肠杆菌菌株的种子培养物，并在30℃下以200rpm振荡生长过夜。比较以下菌株的neoSTX生产水平：

大肠杆菌BL21(DE3)sfp

大肠杆菌BL21(DE3)T3PPT酶sxt1sxt2

大肠杆菌BL21(DE3)T3PPT酶NSX3v1

大肠杆菌BL21(DE3)sfp NSX3v1

大肠杆菌BL21(DE3)sfp NSX3v2

大肠杆菌BL21(DE3)sfp NSX3v3

大肠杆菌BL21(DE3)sfp NSX3v4

大肠杆菌BL21(DE3)sfp NSX3v5

大肠杆菌BL21(DE3)sfp NSX3v6

大肠杆菌BL21(DE3)sfp NSX3v7

将30ml具有0.4％甘油并用89mM磷酸盐缓冲液缓冲至pH 6.8的Terrific Broth(TB)用300μl过夜种子培养物接种至OD₆₀₀为0.05。将培养物在30℃下以225rpm振荡温育直至它们达到OD₆₀₀为0.4。然后将培养物转移至19℃(振荡225rpm)，并生长至OD₆₀₀为0.5。为了诱导sfp和sxt基因，将0.05mM IPTG(0.05mM终浓度)和甲苯甲酸(0.5mM终浓度)加入到培养物中，其在19℃下继续振荡(225rpm)温育48小时。每种菌株在一式三份亚培养物中生长。通过在4℃下以3000×g离心10分钟而收获25ml的每种培养物。将1ml上清液的等分试样储存在-20℃，弃去剩余的上清液。将细胞沉淀物分别用25和5ml冰冷的MQ水(3000×g，4℃，10分钟)洗涤两次。称重细胞沉淀并储存在-20℃。

从细胞沉淀中提取毒素

将细菌细胞沉淀物以1：4(湿重：体积)的比例重悬于0.1％甲酸中并煮沸5分钟。将提取物在冰上短暂冷却，以16000×g离心10分钟，收集上清液。对于LC-MS分析，将上清液用含有25nM石房蛤毒素-¹⁵N₄内标的90％乙腈：10％甲醇：0.1％甲酸以1：5的比例稀释。将样品离心(16000×g，10分钟，4℃)，将上清液转移至自动进样器小瓶中进行LC-MS分析。

从生长培养基中提取毒素

将生长培养基(200μl)用2μl 10％甲酸酸化，煮沸5分钟，在冰上冷却，并在4℃下以16000×g离心10分钟。将上清液转移到新管中，并且加入40μl内标(25nM石房蛤毒素-¹⁵N₄在10％甲醇90％乙腈和0.1％甲酸中)。将管在16000×g 4℃下离心10分钟，并将上清液转移至HPLC自动进样器小瓶用于LC-MS分析。结果如图15所示。

实施例15：用于检测钠通道阻断毒素的小鼠神经母细胞瘤测定(MNBA)

用于MNBA的大肠杆菌培养物

在10ml LB肉汤中制备大肠杆菌菌株BL21(DE3)sfp和BL21(DE3)sfp NSX3v3的种子培养物，并在30℃下以200rpm振荡生长过夜。将50ml具有0.4％甘油并用89mM磷酸盐缓冲液缓冲至pH 6.8的Terrific Broth(TB)用500μl过夜种子培养物接种至OD₆₀₀约为0.05。将培养物在30℃下以225rpm振荡温育直至它们达到OD₆₀₀为0.4。然后将培养物转移至19℃(振荡225rpm)并生长至OD₆₀₀为0.5。为了诱导sfp和sxt基因，将0.05mM IPTG(0.05mM终浓度)和甲苯甲酸(0.5mM终浓度)加入到培养物中，其在19℃下继续振荡(225rpm)温育48小时。每种菌株在一式三份亚培养物中生长。通过在4℃下以2500×g离心10分钟以收获培养物。将细胞沉淀物分别用25℃冰冷MQ水(2500×g，4℃，10分钟)洗涤两次。称重细胞沉淀物并储存在-20℃。

MNBA的细胞提取

根据以下方案，使用Accell Plus CM柱(360mg，1.1ml，WAT010910，Waters)，通过弱阳离子交换固相提取(WCX-SPE)为MNBA提取细菌细胞。

将1.2g细胞沉淀物重悬于3.6ml 0.15％甲酸中并煮沸裂解5分钟。通过以16000×g离心10分钟来澄清细胞提取物。

用3.6ml甲醇调节柱，然后用3.6ml 0.15％甲酸调节。加入3ml样品，用1.8ml MQ水洗涤柱子，然后用1.8ml乙腈洗涤。然后将柱干燥，样品在含有5％甲酸的2×3.6ml甲醇中洗脱。通过真空离心干燥洗脱液，并将样品在200μl 0.01％甲酸中重构。

用于钠通道阻滞毒素的小鼠神经母细胞瘤检测

使用小鼠神经母细胞瘤细胞系(CCL131)，并使用小鼠神经母细胞瘤测定法(如Humpage等(2007).Environ.Toxicol.Chem.26：1512-9所述)。

使用针对neoSTX的经认证的参考材料，用和不用生物基质制备MNBA测定的校准曲线(CRM-NEO-c，批次2009-02-18，在3mM HCl中65.6μM)。结果如图16所示。

实施例16：通过ELISA免疫化学检测新石房蛤毒素

使用石房蛤毒素ELISA试剂盒(Abraxis PN 52255B，Microtiter Plate 96T)检测大肠杆菌中产生的neoSTX。该试剂盒使用多克隆石房蛤毒素抗体，其与neoSTX具有1.3％的交叉反应性。制备大肠杆菌T3PPT酶NSX3v3的培养物并获得细胞裂解物。在SampliQ硅胶柱(Agilent PN 5982-2211,1ml，100mg，Jansson D和Astot C(2015)m J Chromatogr A1417：41-8)上通过固相萃取提取样品。将提取和蒸发的样品溶解在由STX ELISA试剂盒提供的100μl样品缓冲液中。还制备了在样品缓冲液中1：1000稀释的大肠杆菌T3PPT酶NSX3v3提取物。使用试剂盒提供的Std 0(作为空白)，Std 1(0.0668nM STX)和STd 5(1.3365nMSTX)通过2点标准曲线校准测定。参考样品用于估计neoSTX的STX ELISA试剂盒的准确度，而SPE期间的neoSTX的回收率基于提取的参考样品与参考样品的比率来估计。测定结果显示在下表中。估计的准确度为119％，而SPE期间的回收率为92％。该测定在大肠杆菌T3PPT酶NSX3v3的细胞提取物中检测到相当于1.16nM STX。转换为neoSTX，这相当于89.1nM，每升大肠杆菌培养物的产率约为223pmol neoSTX。

STX ELISA。由STX ELISA试剂盒提供Std 0、Std 1和Std 5。通过2点(y＝-0.4627+0.7597)校准ELISA测定。根据制造商，基于STX抗体的1.3％交叉反应性计算neoSTX的浓度。ND：没有检测到。SPE对neoSTX的回收率为92％。

实施例17：合成的与天然的基因和RBS间隔区的作用

使用以下元素制作了许多pVB构建体：

(i)Pm启动子；

(ii)合成的sxtA(对大肠杆菌进行密码子优化)或sxt天然基因；以及

(iii)核糖体结合位点(RBS)和起始密码子之间的8或10bp间隔区。

具有RBS和SxtA起始密码子之间的8bp间隔区的Pm启动子的序列如下所示。RBS和起始密码子用大写字母显示，间隔区用下划线标出：

agtccagccttgcaagaagcggatacaggagtgcaaaaaatggctatctctagaaaggcctaccccttaggctttatgcaacagaaacaataataatGGAGtcatgaacATG(SEQ ID NO:100)

具有RBS和SxtA起始密码子之间的10bp间隔区的Pm启动子的序列如下所示。RBS和起始密码子用大写字母显示，间隔区用下划线标出：

agtccagccttgcaagaagcggatacaggagtgcaaaaaatggctatctctagaaaggcctaccccttaggctttatgcaacagaaacaataataatGGAGtcatgaacatATG(SEQ ID NO:101)

将四种pVB-sxtA质粒独立地转化到大肠杆菌BL21(DE3)sfp中。

制备具有pVB-sxtA变体的四种大肠杆菌BL21(DE3)sfp中的每一种的培养物并收获细胞。提取细胞沉淀物并通过LC-MS分析中间体1的存在。结果如图17所示。可以看出，与含有8bp间隔区的合成sxtA构建体相比，在RBS和起始密码子之间含有10bp间隔区的合成sxtA构建体中产生显著更多的中间体1。

实施例18：在各种PPT酶存在下制备中间体8

在本实验中，比较了以下PPT酶：

1.T3PPT：大肠杆菌BL21(DE3)T3PPT酶NSX3v1

2.T3PPT：大肠杆菌BL21(DE3)T3PPT酶NSX3v1pET28B-NsPPT(具有来自结节菌(Nodularia spumigena)的磷酸泛酰巯基乙胺基转移酶的pET载体)

3.Ala18T3PPT：大肠杆菌BL21(DE3)T3PPT酶NSX3v1pET30b-Ala18T3PPT酶(T3PPT酶，其中除去其前18个氨基酸以增加表达蛋白的溶解度。)

将菌株在20ml LB肉汤中在19℃以200rpm振荡培养18小时。具有pET载体的菌株在50μg/ml卡那霉素存在下生长。培养物在没有诱导物的情况下生长，或者在OD₆₀₀约0.8℃下用0.2mM IPTG和1mM甲苯甲酸诱导。在没有诱导物的情况下，sxt和PPT酶基因有明显的背景表达。

测量中间体8和neoSTX，并用作PPT酶有效性的指标。结果如图18所示。Ala18T3PPT给出最高水平，但诱导后水平降低。这种现象可能是由于当PPT酶水平过高时抑制SxtA且占据酶。

实施例19：石房蛤毒素类似物和变体的产生

石房蛤毒素可以通过SxtN转化为GTX-5(即通过氨基甲酰基侧链的磺化)。类似地，石房蛤毒素可以通过SxtDIOX转化为11-羟基STX。这是在C-11磺化之前将STX转化为GTX-2/3(或将新石房蛤毒素转化为GTX-4/1)的步骤。

将来自Scytonema cf.crispum UCFS15的sxtN克隆到合适的表达载体中，并置于IPTG诱导型T7启动子的控制下，并在其N-和C-末端提供六组氨酸标签。

将来自S.cf.crispum UCFS15的sxtO克隆到合适的表达载体中，并置于IPTG诱导型T7启动子的控制下，并在其N-和C-末端提供六组氨酸标签。

表达载体在大肠杆菌中表达，并且使用No-NTA树脂(Novagen)纯化Sxt蛋白。在SDS凝胶上评估蛋白的纯度。

使用石房蛤毒素或GTX2测试SxtN的磺基转移酶活性。使用HPLC-MS/MS测定结果。使用石房蛤毒素作为底物，鉴定出在对照中不存在的2.13分钟处的峰。其包含m/z 380.10的主峰，其碎片化(LC-MS/MS)至m/z为300.14和282.13，建议为GTX5(如图19所示)。在使用GTX2作为底物时，在样品和对照之间没有观察到毒素存在的差异。

使用石房蛤毒素测试SxtDIOX的双加氧酶活性。使用HPLC-MS/MS测定结果。在测定和对照两者中鉴定底物。此外，在测定中鉴定出在对照中不存在的1.66分钟处的m/z316.14>296.13的峰，表明存在羟基化的石房蛤毒素(图20)。

序列

所附的序列表在此作为说明书的一部分完全并入。

序列表单独文本

SEQ ID NO：91

整合到大肠杆菌乳糖操纵子后的sxt1片段的序列。

SEQ ID NO：92

整合到大肠杆菌木糖操纵子中的sxt3片段版本1的序列。

SEQ ID NO：93

整合到大肠杆菌木糖操纵子中的sxt3片段版本2的序列。

SEQ ID NO：94

整合到大肠杆菌木糖操纵子中的sxt3片段版本3的序列。

SEQ ID NO：95

整合到大肠杆菌乳糖操纵子中的sxt1片段的序列。

SEQ ID NO：96

整合到大肠杆菌蜜二糖操纵子中的sxt4片段的序列。

SEQ ID NO：97

整合到大肠杆菌麦芽糖操纵子中的sxt2片段的序列。

SEQ ID NO：98

缺失sxtL后整合到麦芽糖操纵子中的sxt2片段的序列。

SEQ ID NO：99

整合到麦芽糖操纵子中的sxt2片段的序列。

序列表

<110> 卑尔根技术交易股份公司

新南威尔士大学

<120> 方法

<130> 489.121403/01

<160> 101

<170> PatentIn version 3.5

<210> 1

<211> 252

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 1

Met Ile Asp Thr Ile Ser Val Leu Leu Arg Glu Trp Thr Val Ile Ser

1 5 10 15

Leu Thr Gly Leu Ala Phe Trp Leu Trp Glu Ile Arg Ser Pro Phe His

20 25 30

Gln Ile Glu Tyr Lys Ala Lys Phe Phe Lys Glu Leu Gly Trp Ala Gly

35 40 45

Ile Ser Phe Val Phe Arg Asn Val Tyr Ala Tyr Val Ser Val Ala Ile

50 55 60

Ile Lys Leu Leu Ser Ser Leu Phe Met Gly Glu Ser Ala Asn Phe Ala

65 70 75 80

Gly Val Met Tyr Val Pro Leu Trp Leu Arg Ile Ile Thr Ala Tyr Ile

85 90 95

Leu Gln Asp Leu Thr Asp Tyr Leu Leu His Arg Thr Met His Ser Asn

100 105 110

Gln Phe Leu Trp Leu Thr His Lys Trp His His Ser Thr Lys Gln Ser

115 120 125

Trp Trp Leu Ser Gly Asn Lys Asp Ser Phe Thr Gly Gly Leu Leu Tyr

130 135 140

Thr Val Thr Ala Leu Trp Phe Pro Leu Leu Asp Ile Pro Ser Glu Val

145 150 155 160

Met Ser Val Val Ala Val His Gln Val Ile His Asn Asn Trp Ile His

165 170 175

Leu Asn Val Lys Trp Asn Ser Trp Leu Gly Ile Ile Glu Trp Ile Tyr

180 185 190

Val Thr Pro Arg Ile His Thr Leu His His Leu Asp Thr Gly Gly Arg

195 200 205

Asn Leu Ser Ser Met Phe Thr Phe Ile Asp Arg Leu Phe Gly Thr Tyr

210 215 220

Val Phe Pro Glu Asn Phe Asp Ile Glu Lys Ser Lys Asn Arg Leu Asp

225 230 235 240

Asp Gln Ser Val Thr Val Lys Thr Ile Leu Gly Phe

245 250

<210> 2

<211> 759

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 2

atgatagata caatatcagt actattaaga gagtggactg taatttttct tacaggttta 60

gccttctggc tttgggaaat tcgctctccc ttgcatcaaa ttgaatacaa agctaaattc 120

ttcaaggaat tgggatgggc gggaatatca ttcgtcttta gaattgttta tgcatatgtt 180

tctgtggcaa ttataaaact attgagttct ctatttatgg gagagtcagc aaattttgca 240

ggagtaatgt atgtgcccct ctggctgagg atcatcactg catatatatt acaggactta 300

actgactatc tattacacag gacaatgcat agtaatcagt ttctttggtt gacgcacaaa 360

tggcatcatt caacaaagca atcatggtgg ctgagtggaa acaaagatag ctttaccggc 420

ggacttttat atactgttac agctttgtgg tttccactgc tggacattcc ctcagaggtt 480

atgtctgtag tggcagtaca tcaagtgatt cataacaatt ggatacacct caatgtaaag 540

tggaactcct ggttaggaat aattgaatgg atttatgtta cgccccgtat tcacactttg 600

catcatcttg atacaggggg aagaaatttg agttctatgt ttactttcat cgaccgatta 660

tttggaacct atgtgtttcc agaaaacttt gatatagaaa aatctaaaaa tagattggat 720

gatcaatcag taacggtgaa gacaattttg ggtttttaa 759

<210> 3

<211> 759

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 3

atgattgata ccattagcgt tctgctgcgt gaatggaccg ttatttttct gaccggtctg 60

gcattttggc tgtgggaaat tcgtagtccg ctgcatcaga ttgaatacaa agccaaattt 120

ttcaaagaac tgggttgggc aggtatcagc tttgtttttc gtattgttta tgcctatgtt 180

agcgtggcca ttatcaaact gctgagcagc ctgtttatgg gtgaaagcgc aaattttgcc 240

ggtgttatgt atgttccgct gtggctgcgt attattaccg catatattct gcaggatctg 300

accgattatc tgctgcatcg taccatgcat agcaatcagt ttctgtggct gacccataaa 360

tggcatcata gcaccaaaca gagttggtgg ctgagcggta ataaagatag ctttaccggt 420

ggtctgctgt ataccgttac cgcactgtgg tttccgctgc tggatattcc gagcgaagtt 480

atgagcgttg ttgcagttca tcaggtgatt cataacaact ggattcacct gaatgtgaaa 540

tggaatagct ggctgggtat tatcgaatgg atttatgtta caccgcgtat ccataccctg 600

catcatctgg ataccggtgg tcgtaatctg agcagtatgt ttacctttat tgatcgtctg 660

tttggcacct atgtgtttcc ggaaaacttt gatatcgaaa aaagcaaaaa ccgcctggat 720

gatcagagcg ttaccgttaa aaccattctg ggtttctga 759

<210> 4

<211> 117

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 4

Met Phe Gln Thr Lys Ser Tyr Tyr Ser Val Val Gly Leu Glu Thr Glu

1 5 10 15

Leu Ile Lys Gly Lys Phe Phe Met Ser Asn Glu Leu Thr Asn Glu Gln

20 25 30

Val Phe Lys Leu Val Cys Met Glu Val Ile Glu Lys Met Gly Phe Ala

35 40 45

His Phe Pro Pro Ile Ile Leu Val Tyr Glu Met Thr Asn Ser Gly Phe

50 55 60

Val Asp Trp Cys Glu Gln Met Val Phe Val Asp Asp Lys Gly Lys Leu

65 70 75 80

Asp Glu Gly Glu Lys Phe Leu Leu Asp Trp Met Arg Arg Asn Val Gly

85 90 95

Asn Phe Asp Leu Ile Arg Glu Leu Met Pro Val Ala Glu Arg Leu Glu

100 105 110

Met Lys Met Arg Ser

115

<210> 5

<211> 354

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 5

atgttccaga ccaagagtta ttactctgtg gtaggattag aaacagaatt gattaaagga 60

aaattcttta tgtctaatga attgacaaac gaacaagtat ttaagctggt ttgtatggaa 120

gtcattgaaa aaatgggatt cgcacacttt cctcccatca ttttagtcta tgagatgact 180

aattccggat ttgtagattg gtgcgagcag atggtttttg ttgatgataa aggtaagcta 240

gatgaaggag aaaaattctt attagactgg atgagacgga acgtaggaaa ctttgatctg 300

atacgtgagt taatgcccgt tgctgaacgt ctagaaatga aaatgaggtc ataa 354

<210> 6

<211> 354

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 6

atgtttcaga ccaaaagcta ttatagcgtc gttggcctgg aaaccgaact gattaaaggt 60

aaattcttca tgagcaacga actgaccaat gaacaggtgt ttaaactggt gtgcatggaa 120

gtgattgaaa aaatgggttt tgcacacttt ccgcctatta tcctggttta tgaaatgacc 180

aattccggct ttgttgattg gtgcgagcag atggtttttg tggatgataa aggcaaactg 240

gatgagggcg aaaaatttct gctggattgg atgcgtcgta atgtgggtaa ttttgatctg 300

attcgcgaac tgatgccggt ggcagaacgc ctggaaatga aaatgcgtag ctaa 354

<210> 7

<211> 318

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 7

Met Thr His Val Ala Leu Glu Gln Ala Ile Ala Lys Val Pro Arg Ser

1 5 10 15

Ile Gln Ser Glu Leu Arg Thr Ile Leu Ala Gln His Ala Val Ile Asp

20 25 30

Ser Ser Val Val Ala Ser Trp Ile Asp Arg Leu Gly Thr Asn Ile Ser

35 40 45

Thr Leu Met Ile Gln Leu Leu Pro Val Ala Ala Thr Tyr Ala Arg Val

50 55 60

Pro Ile Ser Gln Phe Tyr Val Gly Ala Ile Ala Leu Gly Lys Pro Gln

65 70 75 80

Ser Lys Asn Gln Leu Gly Ser Gly Thr Leu Tyr Phe Gly Ala Asp Met

85 90 95

Glu Phe Val Gly Gln Ala Leu Ser Phe Ser Val His Ala Glu Gln Ser

100 105 110

Ala Thr Ile Asn Ala Trp Leu His Gly Glu Thr Gly Leu Gln Ala Leu

115 120 125

Ala Ile His Glu Ala Pro Cys Gly Tyr Cys Arg Gln Phe Leu Tyr Glu

130 135 140

Met Ala Thr Val Asn Gln Asn Phe Val Leu Leu Val Lys Ser Asn Glu

145 150 155 160

Ser Gln Pro Glu Gln Thr Tyr Thr Ser Asn Lys Leu Pro His Phe Leu

165 170 175

Pro Glu Pro Phe Gly Pro Ala Asp Leu Gly Leu Thr Gly Gly Leu Met

180 185 190

Gln Thr Val Phe His Asp Leu Glu Thr Tyr Ser Thr Asp Asp Val Val

195 200 205

Leu Ala Ala Leu Ser Ala Ala Asn Gln Ser Tyr Ala Pro Tyr Thr Lys

210 215 220

Asn Phe Ala Gly Val Ala Leu Lys Asp Ser His Gly Asn Ile Phe Thr

225 230 235 240

Gly Arg Tyr Ala Glu Asn Ala Ala Phe Asn Ser Ser Met Ser Pro Met

245 250 255

Glu Ser Ala Leu Thr Phe Met Asn Met Asn Arg Tyr Ser Gln Ser Leu

260 265 270

Phe Asp Ile Cys Asp Ala Val Leu Val Glu Val Glu Thr Gly Ile Ser

275 280 285

Gln Arg Pro Val Thr Glu Ala Phe Leu Ser Ser Ile Ala Pro Lys Val

290 295 300

Lys Leu Arg Tyr Ala Pro Ala Thr Pro Ser Ser Asn Lys Leu

305 310 315

<210> 8

<211> 957

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 8

atgacccatg tagcattaga acaggcgatt gccaaggttc cacgttccat tcaatcagag 60

ttaaggacaa ttcttgccca acatgctgta attgactcaa gtgttgtcgc atcttggatt 120

gatcgacttg gtactaatat tagtacgtta atgattcaat tactacccgt agccgcaact 180

tatgctaggg taccaatatc gcagttttat gtaggggcga tcgctcttgg taaaccacaa 240

tctaagaatc aactgggttc tggaactctt tattttggtg ccgacatgga atttgtagga 300

caggcactta gtttctcagt tcacgcagaa caatccgcca ccataaatgc gtggttgcac 360

ggagaaaccg gtttacaagc attagcaatc cacgaagcac catgtggata ctgccgacaa 420

tttttatacg agatggcaac tgtaaatcaa aattttgttc ttcttgtgaa gtctaatgaa 480

tcacagcctg agcaaactta tacctcaaat aaactcccac attttctacc cgagccattt 540

ggaccagcgg atctaggact cacaggtgga ttaatgcaaa cagtatttca tgatctggag 600

acctattcta ccgatgatgt tgtgcttgct gctctatccg ctgccaatca aagttatgct 660

ccctacacga aaaattttgc aggggtagcg ttaaaagatt cccacgggaa tatatttaca 720

ggtcgatacg ctgaaaacgc tgcctttaat tcatccatgt ctccgatgga atctgctctg 780

actttcatga atatgaatag atattctcaa tcactattcg acatttgtga tgctgtttta 840

gttgaagtgg aaactgggat tagtcaaaga cccgtcactg aagccttcct ttcttctatc 900

gctcccaagg tcaagttaag gtatgcccct gcaactccgt caagtaataa gttatga 957

<210> 9

<211> 957

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 9

atgacccatg ttgccctgga acaggcaatt gcaaaagttc cgcgtagcat tcagagcgaa 60

ctgcgtacca ttctggcaca gcatgcagtt attgatagca gcgttgtggc aagctggatt 120

gatcgtctgg gcaccaatat tagtaccctg atgatccagc tgctgccggt tgcagcaacc 180

tatgcacgtg ttccgattag ccagttttat gttggtgcca ttgcactggg caaaccgcag 240

agtaaaaatc agctgggtag cggcaccctg tattttggtg cagatatgga atttgttggt 300

caggcactga gctttagcgt tcatgcagaa cagagcgcca ccattaatgc ctggctgcat 360

ggcgaaaccg gactgcaggc actggcaatc catgaagcac cgtgtggtta ttgtcgccag 420

tttctgtatg aaatggcaac cgtgaatcag aattttgtgc tgctggtgaa aagcaatgaa 480

agccagccgg aacagaccta taccagcaac aaactgccgc attttctgcc tgaaccgttt 540

ggtccagccg atctgggtct gaccggtggc ctgatgcaga ccgtgtttca cgatctggaa 600

acctatagca ccgatgatgt tgttctggca gcactgagtg cagcaaatca gagttatgca 660

ccgtatacca aaaactttgc cggtgttgca ctgaaagata gtcatggtaa catttttaca 720

ggtcgctatg ccgaaaacgc agcatttaat agcagcatga gcccgatgga aagcgcactg 780

acctttatga atatgaatcg ttattcacag agcctgttcg atatttgtga tgcagttctg 840

gtagaagtgg aaaccggtat tagtcagcgt ccggttaccg aagcctttct gagtagcatt 900

gcaccgaaag tgaaactgcg ctatgcaccg gcaaccccga gcagtaacaa actgtga 957

<210> 10

<211> 1245

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 10

Met Leu Gln Lys Ile Asn Arg Tyr Thr His Gly Phe Val Ala Val Pro

1 5 10 15

Val Ile Leu Ala Cys Arg Glu Lys Gly Val Phe Glu Leu Leu Ala Asp

20 25 30

Glu Ser Pro Leu Ser Leu Asn Gln Met Val Glu His Leu Gly Ala Asn

35 40 45

Ser Gly His Phe Gln Val Ala Leu Arg Met Leu Glu Ser Leu His Trp

50 55 60

Leu Ser Arg Asn Lys Glu Leu Lys Tyr Ser Leu Thr Ala Glu Ala Ala

65 70 75 80

Ile His Asn Lys Ile Ser Glu Asp Ile Leu Gln Leu Tyr Asn Leu Pro

85 90 95

Ile Gln Ser Tyr Leu Glu Gly Lys Gln Gly Asn Leu Leu Gly Arg Trp

100 105 110

Ile Glu Arg Ser Cys Gln Leu Trp Asn Leu Asp Asn Pro Leu Met Ala

115 120 125

Asp Phe Leu Asp Gly Leu Leu Val Ile Pro Leu Leu Leu Ala Leu His

130 135 140

Lys His Asn Leu Leu Ala Asp Ser Glu Asp Lys Pro Leu Leu Ser Ser

145 150 155 160

Leu Ser Ser Thr Val Gln Glu Glu Leu Gly Lys Leu Phe Leu His Leu

165 170 175

Gly Trp Ala Asp Leu Thr Ala Gly Arg Leu Thr Ile Thr Glu Leu Gly

180 185 190

Arg Phe Met Gly Glu Arg Ala Leu Asn Thr Ala Ile Val Ala Ser Tyr

195 200 205

Thr Pro Met Leu Ser Arg Ile His Asp Val Leu Phe Gly Asn Cys Leu

210 215 220

Ser Val Phe Gln Arg Asp Ala Ser Gly His Glu Arg His Ile Asp Arg

225 230 235 240

Thr Leu Asn Val Ile Gly Ser Gly Phe Gln His Gln Lys Tyr Phe Ala

245 250 255

Asp Leu Glu Glu Ser Ile Leu Ser Val Phe Asn Gln Leu Pro Leu Glu

260 265 270

Glu Gln Pro Lys Tyr Ile Thr Asp Met Gly Cys Gly Asp Gly Thr Leu

275 280 285

Leu Lys Arg Val Trp Glu Thr Ile Gln Phe Lys Ser Ala Arg Gly Lys

290 295 300

Ala Leu Glu Gln Tyr Pro Leu Arg Leu Ile Gly Val Asp Tyr Asn Glu

305 310 315 320

Ala Ser Leu Lys Ala Thr Thr Arg Thr Leu Ala Ser Leu Pro His Leu

325 330 335

Val Leu Gln Gly Asp Ile Gly Asn Pro Glu Gln Met Val Arg Ser Leu

340 345 350

Glu Ala His Gly Ile His Asp Pro Glu Asn Ile Leu His Ile Arg Ser

355 360 365

Phe Leu Asp His Asp Arg Leu Phe Ile Pro Pro Gln Lys Arg Asn Glu

370 375 380

Leu Lys Glu Arg Ala His Leu Pro Tyr Gln Ser Val Cys Val Asp Asp

385 390 395 400

Gln Gly Glu Leu Ile Pro Pro His Val Met Val Gln Ser Leu Val Glu

405 410 415

His Leu Glu Arg Trp Ser Gln Val Val Asn Lys His Gly Leu Met Ile

420 425 430

Leu Glu Val His Cys Leu Glu Pro Arg Val Val Tyr Gln Phe Leu Asp

435 440 445

Lys Ser Glu Asn Leu His Phe Asp Ala Phe Gln Gly Phe Ser Gln Gln

450 455 460

Tyr Leu Val Glu Ala Glu Val Phe Leu Met Ser Ala Ala Gln Val Gly

465 470 475 480

Leu Phe Pro Lys Leu Glu Leu Ser Lys Arg Tyr Pro Lys Thr Phe Pro

485 490 495

Phe Thr Arg Ile Thr Leu Asn Tyr Phe Glu Lys Arg Pro Tyr Lys Ile

500 505 510

Ser His Ala Tyr Leu Ser Asp Leu Pro Ala Leu Val Asp Leu Glu Val

515 520 525

Lys Cys Trp Pro Glu Asn Leu Arg Ala Ser Thr His Glu Ile Arg Arg

530 535 540

Arg Leu Glu Leu Asn Pro Gln Gly Asn Leu Val Leu Ile Ile Glu Asp

545 550 555 560

Gln Ile Ile Gly Ala Ile Tyr Ser Gln Thr Ile Thr Ser Thr Glu Ala

565 570 575

Leu Glu Asn Val Lys Tyr Ala Gln Val Pro Thr Leu His Thr Pro Gln

580 585 590

Gly Ser Val Ile Gln Leu Leu Ala Leu Asn Ile Leu Pro Glu Phe Gln

595 600 605

Ala Arg Gly Leu Gly Asn Glu Leu Arg Asp Phe Met Leu Tyr Tyr Cys

610 615 620

Thr Leu Lys Gly Gly Ile Glu Ser Val Val Gly Val Thr Arg Cys Arg

625 630 635 640

Asn Tyr Val Asn Tyr Ser Gln Met Pro Met Met Glu Tyr Leu Lys Leu

645 650 655

His Asn Glu Gln Arg Gln Leu Leu Asp Pro Ile Val Gly Phe His Val

660 665 670

Ser Gly Gly Ala Glu Ile Arg Gly Ile Ile Ala Asn Tyr Arg Pro Glu

675 680 685

Asp Thr Asp Asn Leu Gly Met Gly Ile Leu Ile Glu Tyr Asn Leu Arg

690 695 700

Asp Ser Ala Leu His Ser Pro Gly Asp Arg Lys Gly Pro Tyr Ile Asn

705 710 715 720

Ser Ala Ile Gly Ser Leu Val Pro Lys Ala Thr Ser Ala Thr Lys Glu

725 730 735

Asn Lys Thr Val Ala Asp Leu Val Lys Glu Cys Ile Leu Lys Val Met

740 745 750

Gly Ser Gln Arg Gln Ala Ala Tyr Ala Pro Gln Gln Lys Leu Leu Asp

755 760 765

Met Gly Leu Asp Ser Leu Asp Leu Leu Glu Leu Gln Thr Leu Leu Glu

770 775 780

Glu Arg Leu Gly Ile Asn Leu Ser Gly Thr Phe Phe Leu Gln Lys Asn

785 790 795 800

Thr Pro Thr Ala Ile Ile Thr Tyr Phe Gln Asn Gln Val Val Gln Glu

805 810 815

Lys Gln Ser Asp Leu Ala Pro Pro Val Asp Ser Ala Asn Glu Ile Asn

820 825 830

Thr Leu Glu Asn Val Val Asn Gln Gln Lys Ile Pro Gln Val Thr Arg

835 840 845

Val Val Thr Glu Gln Gln Gly Arg Lys Val Leu Ile Asp Gly His Trp

850 855 860

Val Ile Asp Phe Ala Ser Cys Asn Tyr Leu Gly Leu Asp Leu His Pro

865 870 875 880

Lys Val Lys Glu Ala Ile Pro Pro Ala Leu Asp Lys Trp Gly Thr His

885 890 895

Pro Ser Trp Thr Arg Leu Val Ala Ser Pro Ala Ile Tyr Glu Glu Leu

900 905 910

Glu Glu Glu Leu Ser Lys Leu Leu Gly Val Pro Asp Val Leu Val Phe

915 920 925

Pro Ala Val Thr Leu Leu Gln Ile Gly Ile Leu Pro Leu Leu Thr Gly

930 935 940

Asn Asn Gly Val Ile Phe Gly Asp Ile Ala Ala His Arg Cys Ile Tyr

945 950 955 960

Glu Ala Cys Cys Leu Ala Gln His Lys Gly Ala Gln Phe Ile Gln Tyr

965 970 975

Arg His Asn Asp Leu Asn Asp Leu Ala Glu Lys Leu Ala Lys Tyr Pro

980 985 990

Pro Glu Gln Val Lys Ile Ile Val Ile Asp Gly Val Tyr Ser Met Ser

995 1000 1005

Ala Asp Phe Pro Asp Leu Pro Ala Tyr Val His Leu Ala Lys Glu

1010 1015 1020

Tyr Asn Ala Leu Ile Tyr Met Asp Asp Ala His Gly Phe Gly Ile

1025 1030 1035

Leu Gly Glu Asn Pro Ser Ser Asp Met Pro Tyr Gly Tyr Lys Gly

1040 1045 1050

Asn Gly Met Val Asn Tyr Phe Asp Leu Arg Phe Ala Glu Asp Asn

1055 1060 1065

Ile Ile Tyr Val Ala Gly Leu Ser Lys Ala Tyr Ser Ser Tyr Ala

1070 1075 1080

Ala Phe Leu Thr Cys Gly Asp Arg Arg Ile Lys Thr Asn Phe Arg

1085 1090 1095

Asn Ala Trp Thr Ala Ile Phe Ser Gly Pro Ser Pro Val Ala Ser

1100 1105 1110

Leu Ala Ser Ala Leu Ala Gly Leu Gln Val Asn Arg Gln Glu Gly

1115 1120 1125

Glu Gln Leu Arg Lys Gln Ile Tyr His Leu Thr His Lys Leu Val

1130 1135 1140

Thr Gln Ala Arg Ala Ile Gly Phe Glu Val Asp Asn Tyr Gly Tyr

1145 1150 1155

Val Pro Ile Val Gly Val Leu Val Gly Asp Ala Gln His Met Ile

1160 1165 1170

Asp Val Cys Gln Leu Leu Trp Glu Tyr Gly Ile Leu Ile Thr Pro

1175 1180 1185

Ala Ile Phe Pro Ile Val Pro Leu Asn Lys Ser Ala Leu Arg Phe

1190 1195 1200

Ser Ile Thr Ala Ala Asn Thr Glu Glu Glu Ile Asp Gln Ala Ile

1205 1210 1215

Lys Ser Leu Lys Ala Val Trp Asp Leu Leu Gln Lys Arg Lys Ala

1220 1225 1230

Leu Pro Cys Lys Gln Glu Glu Asn Ile Leu Lys His

1235 1240 1245

<210> 11

<211> 3738

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 11

atgttacaaa agattaatcg ttatactcac ggctttgtgg cggttcccgt tattcttgcg 60

tgtcgagaaa aaggtgtttt tgaattactc gccgatgaaa gtcctctctc tttaaaccaa 120

atggtggaac atctgggagc taacagcgga cattttcaag ttgctttgag gatgctcgag 180

tctttacatt ggctttcccg aaataaggag cttaaatact ctctaaccgc agaagcagcg 240

attcacaaca aaatttcgga agacattctt caattgtaca acctaccaat tcagtcttat 300

ttagaaggga aacaaggaaa tttgctggga agatggattg agcgttcttg ccaattgtgg 360

aacctggaca atcccctaat ggcagatttt ttagatggat tactggtcat cccactcctg 420

ctggcactgc acaaacacaa cttgcttgca gattcggagg acaaaccttt gctctcctca 480

ttaagctcaa cagtgcaaga agagttgggt aagttatttc tccaccttgg ctgggctgac 540

cttacagcag gtcgtttgac cataaccgaa cttggtcgat ttatgggaga gcgagccttg 600

aatacagcca tagtggcgtc ctacactcct atgttgtccc gcattcatga tgtattgttt 660

ggcaattgtc tctccgtatt ccaaagagat gcttccggtc acgaaaggca cattgatcgc 720

acccttaacg tgatcgggag tggatttcaa caccagaaat attttgccga tttagaagaa 780

agtatcctct cagtattcaa tcagttgcca ttagaagaac aacccaaata cattactgac 840

atggggtgtg gcgatggaac tctcctgaaa cgagtctggg aaaccattca atttaagtct 900

gctaggggaa aagcactcga acagtatccc ctgcgtctta taggtgtaga ttataacgaa 960

gcttctttaa aagctaccac acgcaccctt gctagccttc cccacttagt tttacaggga 1020

gatattggga acccagaaca aatggtgcgt tctttagaag ctcatggcat tcatgatccc 1080

gaaaatatcc tgcacatccg ttcgttcctc gaccatgatc gtctctttat tcctcctcag 1140

aaaagaaacg aattgaaaga acgtgctcac ttaccttacc aatcagtctg tgtcgatgat 1200

caaggagagc ttattcctcc tcatgttatg gtgcaaagtt tggtggaaca cttagaaaga 1260

tggtctcaag tggtcaataa acacggttta atgattttgg aggtccattg tttggaacca 1320

agggtagtct atcagttttt agacaaaagc gaaaacttac atttcgatgc gtttcaggga 1380

ttttctcagc agtatcttgt ggaagctgag gtttttctca tgtctgctgc acaagtaggt 1440

ctatttccaa aactagagct ttctaaaaga tacccaaaaa catttccttt tactcgcatt 1500

acgcttaatt acttcgagaa aagaccttac aaaattagtc atgcctattt gtcagattta 1560

cctgccttag ttgacttgga ggtcaagtgt tggccagaaa atttacgggc atctactcat 1620

gaaattcggc gaagacttga gctaaacccg caaggtaatt tagtgctgat tatagaagat 1680

caaattattg gtgcgattta ttcccaaaca attaccagca ctgaggcatt agagaatgta 1740

aaatatgcgc aagtgccgac gttacatact ccccaagggt cagttattca actgctcgca 1800

ctaaatattc tacctgagtt tcaggcgcgg gggttaggaa atgaattgcg ggactttatg 1860

ctttactact gtaccctgaa aggcggcatt gagagcgtgg tgggtgtaac tcgctgtcga 1920

aattatgtca attattccca aatgccgatg atggagtatt taaagctaca caatgagcaa 1980

cgacagcttc tggatccaat tgtgggtttc catgtgtcgg gaggagccga aattagggga 2040

attattgcta attatcgtcc ggaagataca gataatctcg gcatgggtat tttgattgaa 2100

tataacctgc gcgacagtgc tttgcactcg cctggtgatc gcaaaggacc gtatattaac 2160

tcagcaattg gttcattggt accaaaagca acatctgcaa ctaaggaaaa caaaactgta 2220

gcggatctcg ttaaagaatg catcttaaaa gtaatgggtt cccaacgtca ggcagcctac 2280

gctccacaac aaaaactgct ggatatggga ttagattctt tagatttatt agaactgcaa 2340

acgctcctag aggaacgttt agggatcaat ctgtctggaa cgttcttttt acaaaagaac 2400

actccaactg ccatcatcac ttatttccaa aaccaagtgg tacaagagaa acaatctgat 2460

ctagctccac ctgttgactc agccaacgaa atcaacactc tggaaaacgt agttaaccaa 2520

caaaaaattc ctcaagtcac aagagtcgtc acagaacaac aaggtcgcaa ggtgctaatt 2580

gacggacatt gggtgataga ctttgcttct tgcaactatt taggtcttga cttgcatcca 2640

aaagttaagg aagcaattcc accagctttg gataaatggg gcacacatcc aagctggact 2700

cggcttgttg cttccccagc aatttatgag gaattggagg aagaattgtc caaactttta 2760

ggcgtacctg atgttttagt atttccagct gtaacactgc ttcagatagg aattttacca 2820

ctattaactg ggaataatgg tgtcatcttt ggtgacatag ctgcacatcg ttgtatttat 2880

gaagcgtgct gtctggctca gcacaaagga gcccagttca tccaatatcg acataatgat 2940

ttgaacgatt tagccgaaaa actagcaaaa tatccgcctg aacaagtaaa gattattgtc 3000

attgatggcg tgtattccat gtcggcagat tttcccgatc tgccagctta cgtgcatctg 3060

gcaaaagagt acaatgcctt aatttacatg gatgatgctc atggttttgg cattttgggc 3120

gaaaatccca gcagcgatat gccttacggt tacaaaggaa acgggatggt gaattatttt 3180

gacctgcggt ttgcagagga taatatcatc tatgtagctg gtttgtccaa agcctattct 3240

tcttacgcag cattcttaac ttgtggcgat cgccggatca aaaccaactt ccgcaacgct 3300

tggactgcca tattttctgg tccttctcct gttgcgagtt tggcaagtgc cttagccgga 3360

ttacaggtga atcgtcagga gggggagcag ttaagaaaac aaatttatca cctaactcac 3420

aaattggtta cacaagcaag agccattgga ttcgaagtgg ataactatgg ttacgttccc 3480

atcgtaggcg tgttagtggg agatgctcaa cacatgattg atgtgtgtca actcctttgg 3540

gaatatggta ttttaattac tcctgctatt tttccaatcg tacctttaaa taaaagtgct 3600

ttaaggtttt cgattacagc cgccaatacc gaagaggaga tagaccaagc aattaaatct 3660

ctcaaagcag tttgggattt gctacaaaaa aggaaagctt tgccttgtaa gcaggaggaa 3720

aacatactca agcattaa 3738

<210> 12

<211> 3738

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 12

atgctgcaga aaatcaatcg ttatacccat ggttttgttg ccgttccggt tattctggca 60

tgtcgtgaaa aaggtgtttt tgaactgctg gcagatgaaa gtccgctgag cctgaatcag 120

atggttgaac atctgggtgc caatagcggt cattttcagg ttgcactgcg tatgctggaa 180

agtctgcatt ggctgagccg taataaagaa ctgaaatata gcctgaccgc agaagcagca 240

attcataaca aaattagcga agatatcctg cagctgtata atctgccgat tcagagctat 300

ctggaaggta aacagggcaa tctgctgggt cgttggattg aacgtagctg tcagctgtgg 360

aatctggata atccgctgat ggcagatttt ctggatggtc tgctggttat tccgctgctg 420

ctggcactgc ataaacataa cctgctggcc gattctgaag ataaaccgct gctgagcagc 480

ctgagcagta ccgttcaaga agaactgggt aaactgtttc tgcatctggg ttgggcagat 540

ctgacagcag gtcgtctgac cattaccgaa ctgggtcgct ttatgggtga acgtgcactg 600

aataccgcaa ttgttgcaag ctataccccg atgctgagtc gtattcatga tgttctgttt 660

ggtaattgcc tgagcgtttt tcagcgtgat gcaagcggtc atgaacgtca tattgatcgt 720

accctgaatg ttattggtag cggttttcag caccagaaat actttgcaga tctggaagaa 780

agcattctga gcgtgtttaa tcagctgccg ctggaagaac agccgaaata cattaccgat 840

atgggttgtg gtgatggcac cctgctgaaa cgtgtttggg aaaccattca gtttaaaagc 900

gcacgtggta aagcactgga acagtatccg ctgcgtctga ttggtgttga ttataatgaa 960

gcaagcctga aagcaaccac ccgtaccctg gcaagcctgc cgcatctggt tctgcagggt 1020

gatattggta atccggaaca aatggttcgt agcctggaag cacatggcat tcatgatccg 1080

gaaaatattc tgcatattcg cagctttctg gatcacgatc gtctgtttat tccgcctcag 1140

aaacgtaatg aactgaaaga acgtgcccat ctgccgtatc agagtgtttg tgttgatgat 1200

cagggtgaac tgattcctcc gcatgttatg gttcagagcc tggtggaaca cctggaacgt 1260

tggagccagg ttgttaataa acatggtctg atgattctgg aagtgcattg tctggaaccg 1320

cgtgttgttt atcagtttct ggataaaagc gaaaacctgc actttgatgc atttcagggt 1380

tttagccagc agtatctggt tgaagccgaa gtttttctga tgagcgcagc acaggttggt 1440

ctgtttccga aactggaact gagcaaacgt tatccgaaaa cctttccgtt tacccgtatt 1500

accctgaact atttcgaaaa acgtccgtac aaaatcagcc atgcatatct gagcgatctg 1560

cctgcactgg ttgacctgga agttaaatgt tggcctgaga atctgcgtgc aagcacccat 1620

gaaattcgtc gtcgtctgga actgaatccg cagggtaacc tggttctgat tattgaagat 1680

cagattatcg gtgccattta cagccagacc attacaagca ccgaagccct ggaaaatgtt 1740

aaatatgcac aggttccgac cctgcataca ccgcagggtt cagtgattca gctgctggcc 1800

ctgaacattc tgccggaatt tcaggcacgt ggtctgggca atgaactgcg tgattttatg 1860

ctgtattatt gcaccctgaa aggtggtatt gaaagcgttg ttggtgttac ccgttgtcgc 1920

aattatgtga attatagcca gatgccgatg atggaatatc tgaaactgca taatgaacag 1980

cgtcaactgc tggatccgat tgttggtttt catgttagcg gtggtgcaga aattcgtggc 2040

attattgcaa attatcgtcc ggaagataca gataatctgg gtatgggtat tctgatcgaa 2100

tataacctgc gtgatagcgc actgcattca ccgggtgatc gtaaaggtcc gtatatcaat 2160

agcgcaattg gtagcctggt tccgaaagcg accagcgcaa ccaaagaaaa caaaaccgtt 2220

gcggatctgg tgaaagaatg tattctgaaa gtgatgggta gccagcgtca ggcagcatat 2280

gcaccgcagc agaaactgct ggacatgggt ctggatagcc tggatctgct ggaactgcag 2340

accctgctgg aagaacgtct gggtattaat ctgagcggca ccttttttct gcaaaaaaac 2400

accccgaccg ccatcattac ctattttcag aatcaggtcg tgcaagagaa acagagtgat 2460

ctggcaccgc ctgttgatag cgccaatgaa atcaatacac tggaaaacgt tgtgaatcag 2520

cagaaaattc cgcaggttac acgtgttgtt accgaacagc agggacgtaa agttctgatt 2580

gatggtcatt gggttattga ttttgccagc tgtaattatc tgggcctgga cctgcatccg 2640

aaagttaaag aagcaattcc tccggcactg gataaatggg gcacccatcc gagctggacc 2700

cgtctggttg caagtccggc aatttatgag gaactggaag aggaactgtc aaaactgctg 2760

ggtgtgccgg atgttctggt ttttccggca gttacactgc tgcagattgg tattctgcct 2820

ctgctgaccg gtaataatgg tgtgattttt ggcgatattg cagcccatcg ttgtatttat 2880

gaagcatgtt gtctggccca gcataaaggt gcacagttta ttcagtatcg tcataacgac 2940

ctgaatgatc tggccgaaaa actggccaaa tatccgcctg aacaggttaa aatcattgtg 3000

atcgatggtg tgtatagcat gagtgccgat ttcccggacc tgcctgcata tgttcatctg 3060

gcaaaagaat ataacgccct gatctatatg gatgatgcac atggctttgg cattctgggt 3120

gaaaatccga gcagcgatat gccgtatggt tataaaggta atggcatggt gaactacttt 3180

gatctgcgtt ttgccgaaga taacatcatt tatgttgcag gtctgagcaa agcctatagc 3240

agctatgcag catttctgac ctgtggtgat cgtcgtatta aaaccaattt tcgtaatgca 3300

tggaccgcga tttttagcgg tccgagtccg gttgcaagcc tggccagcgc actggcaggt 3360

ctgcaggtta atcgtcaaga aggtgaacag ctgcgcaaac aaatctatca tctgacacat 3420

aaactggtta cccaggctcg tgccattggt tttgaagttg ataattatgg ttatgtgccg 3480

attgtgggtg ttctggtggg tgatgcacag catatgattg atgtgtgcca actgctgtgg 3540

gaatatggta tcctgattac ccctgcaatt tttccgattg tgccgctgaa taaatcagca 3600

ctgcgtttta gcattaccgc agcaaatacc gaagaagaaa ttgatcaggc catcaaaagt 3660

ctgaaagcag tttgggacct gctgcaaaaa cgtaaagccc tgccgtgtaa acaagaagaa 3720

aatatcctga aacattga 3738

<210> 13

<211> 128

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 13

Met Leu Lys Asp Phe Asn Gln Phe Leu Ile Arg Thr Leu Ala Phe Val

1 5 10 15

Phe Ala Phe Gly Ile Phe Leu Thr Thr Gly Val Gly Ile Ala Lys Ala

20 25 30

Asp Tyr Leu Val Lys Gly Gly Lys Ile Thr Asn Val Gln Asn Thr Ser

35 40 45

Ser Asn Gly Asp Asn Tyr Ala Val Ser Ile Ser Gly Gly Phe Gly Pro

50 55 60

Cys Ala Asp Arg Val Ile Ile Leu Pro Thr Ser Gly Val Ile Asn Arg

65 70 75 80

Asp Ile His Met Arg Gly Tyr Glu Ala Ala Leu Thr Ala Leu Ser Asn

85 90 95

Gly Phe Leu Val Asp Ile Tyr Asp Tyr Thr Gly Ser Ser Cys Ser Asn

100 105 110

Gly Gly Gln Leu Thr Ile Thr Asn Gln Leu Gly Lys Leu Ile Ser Asn

115 120 125

<210> 14

<211> 387

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 14

atgttgaaag atttcaacca gtttttaatc agaacactag cattcgtatt cgcatttggt 60

attttcttaa ccactggagt tggcattgct aaagctgact acctagttaa aggtggaaag 120

attaccaatg ttcaaaatac ttcttctaac ggtgataatt atgccgttag tatcagcggt 180

gggtttggtc cttgcgcaga tagagtgatt atcctaccaa cttcaggagt gataaatcga 240

gacattcata tgcgtggcta tgaagccgca ttaactgcac tatccaatgg ctttttagta 300

gatatttacg actatactgg ctcttcttgc agcaatggtg gccaactaac tattaccaac 360

caattaggta agctaatcag caattag 387

<210> 15

<211> 387

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 15

atgctgaaag attttaacca gttcctgatt cgtaccctgg catttgtttt tgcctttggc 60

atttttctga caaccggtgt tggtattgca aaagcagatt atctggtgaa aggtggcaaa 120

attaccaatg ttcagaatac cagcagcaac ggtgataatt atgcagttag cattagcggt 180

ggttttggtc cgtgtgcaga tcgtgttatt attctgccga ccagcggtgt tattaatcgt 240

gatattcaca tgcgtggtta tgaagcagca ctgaccgcac tgagcaatgg ttttctggtt 300

gatatctatg attataccgg tagcagctgt agcaatggtg gccagctgac cattaccaat 360

cagctgggta aactgattag caattga 387

<210> 16

<211> 471

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 16

Met Glu Thr Thr Ser Lys Lys Phe Lys Ser Asp Leu Ile Leu Glu Ala

1 5 10 15

Arg Ala Ser Leu Lys Leu Gly Ile Pro Leu Val Ile Ser Gln Met Cys

20 25 30

Glu Thr Gly Ile Tyr Thr Ala Asn Ala Val Met Met Gly Leu Leu Gly

35 40 45

Thr Gln Val Leu Ala Ala Gly Ala Leu Gly Ala Leu Ala Phe Leu Thr

50 55 60

Leu Leu Phe Ala Cys His Gly Ile Leu Ser Val Gly Gly Ser Leu Ala

65 70 75 80

Ala Glu Ala Phe Gly Ala Asn Lys Ile Asp Glu Val Ser Arg Ile Ala

85 90 95

Ser Gly Gln Ile Trp Leu Ala Val Thr Leu Ser Leu Pro Ala Met Leu

100 105 110

Leu Leu Trp His Gly Asp Thr Ile Leu Leu Leu Phe Gly Gln Glu Glu

115 120 125

Ser Asn Val Leu Leu Thr Lys Thr Tyr Leu His Ser Ile Leu Trp Gly

130 135 140

Phe Pro Ala Ala Leu Ser Ile Leu Thr Leu Arg Gly Ile Ala Ser Ala

145 150 155 160

Leu Asn Val Pro Arg Leu Ile Thr Ile Thr Met Leu Thr Gln Leu Ile

165 170 175

Leu Asn Thr Ala Ala Asp Tyr Val Leu Ile Phe Gly Lys Phe Gly Leu

180 185 190

Pro Gln Leu Gly Leu Ala Gly Ile Gly Trp Ala Thr Ala Leu Gly Phe

195 200 205

Trp Val Ser Phe Thr Leu Gly Leu Ile Leu Leu Ile Phe Ser Leu Lys

210 215 220

Val Arg Asp Tyr Lys Leu Phe Arg Tyr Leu His Gln Phe Asp Lys Gln

225 230 235 240

Ile Phe Val Lys Ile Phe Gln Thr Gly Trp Pro Met Gly Phe Gln Trp

245 250 255

Gly Ala Glu Thr Ala Leu Phe Asn Val Thr Ala Trp Val Ala Gly Tyr

260 265 270

Leu Gly Thr Val Thr Leu Ala Ala His Asp Ile Gly Phe Gln Thr Ala

275 280 285

Glu Leu Ala Met Val Ile Pro Leu Gly Val Gly Asn Val Ala Met Thr

290 295 300

Arg Val Gly Gln Ser Ile Gly Glu Lys Asn Pro Leu Gly Ala Arg Arg

305 310 315 320

Val Ala Ser Ile Gly Ile Thr Ile Val Gly Ile Tyr Ala Ser Ile Val

325 330 335

Ala Leu Val Phe Trp Leu Phe Pro Tyr Gln Ile Ala Gly Ile Tyr Leu

340 345 350

Asn Ile Asn Asn Pro Glu Asn Ile Glu Ala Ile Lys Lys Ala Thr Thr

355 360 365

Phe Ile Pro Leu Ala Gly Leu Phe Gln Met Phe Tyr Ser Ile Gln Ile

370 375 380

Ile Ile Val Gly Ala Leu Val Gly Leu Arg Asp Thr Phe Val Pro Val

385 390 395 400

Ser Met Asn Leu Ile Val Trp Gly Leu Gly Leu Ala Gly Ser Tyr Phe

405 410 415

Met Ala Ile Ile Leu Gly Trp Gly Gly Ile Gly Ile Trp Leu Ala Met

420 425 430

Val Leu Ser Pro Leu Leu Ser Ala Val Ile Leu Thr Val Arg Phe Tyr

435 440 445

Arg Val Ile Asp Asn Leu Leu Ala Asn Ser Asp Asp Met Leu Gln Asn

450 455 460

Ala Ser Val Thr Thr Leu Gly

465 470

<210> 17

<211> 1416

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 17

atggaaacaa cctcaaaaaa atttaagtca gatctgatat tagaagcacg agcaagccta 60

aagttgggaa tccccttagt catttcacaa atgtgcgaaa cgggtattta tacagcgaat 120

gcagtcatga tgggtttact tggtacgcaa gttttggccg ccggtgcttt gggcgcgctc 180

gcttttttga ccttattatt tgcctgccat ggtattctct cagtaggagg atcactagca 240

gccgaagctt ttggggcaaa taaaatagat gaagttagtc gtattgcttc cgggcaaata 300

tggctagcag ttaccttgtc tttacctgca atgcttctgc tttggcatgg cgatactatc 360

ttgctgctat tcggtcaaga ggaaagcaat gtgttattga caaaaacgta tttacactca 420

attttatggg gctttcccgc tgcgcttagt attttgacat taagaggcat tgcctctgct 480

ctcaacgttc cccgattgat aactattact atgctcactc agctgatatt gaataccgcc 540

gccgattatg tgttaatatt cggtaaattt ggtcttcctc aacttggttt ggctggaata 600

ggctgggcaa ctgctctggg tttttgggtt agttttacat tggggcttat cttgctgatt 660

ttctccctga aagttagaga ttataaactt ttccgctact tgcatcagtt tgataaacag 720

atctttgtca aaatttttca aactggatgg cccatggggt ttcaatgggg ggcggaaacg 780

gcactattta acgtcaccgc ttgggtagca gggtatttag gaacggtaac attagcagcc 840

catgatattg gcttccaaac ggcagaactg gcgatggtta taccactcgg agtcggcaat 900

gtcgctatga caagagtagg tcagagtata ggagaaaaaa accctttggg tgcaagaagg 960

gtagcatcga ttggaattac aatagttggc atttatgcca gtattgtagc acttgttttc 1020

tggttgtttc catatcaaat tgccggaatt tatttaaata taaacaatcc cgagaatatc 1080

gaagcaatta agaaagcaac tacttttatc cccttggcgg gactattcca aatgttttac 1140

agtattcaaa taattattgt tggggctttg gtcggtctgc gggatacatt tgttccagta 1200

tcaatgaact taattgtctg gggtcttgga ttggcaggaa gctatttcat ggcaatcatt 1260

ttaggatggg gggggatcgg gatttggttg gctatggttt tgagtccact cctctcggca 1320

gttattttaa ctgttcgttt ttatcgagtg attgacaatc ttcttgccaa cagtgatgat 1380

atgttacaga atgcgtctgt tactactcta ggctga 1416

<210> 18

<211> 1416

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 18

atggaaacca cgagcaaaaa attcaaaagc gatctgattc tggaagcacg tgcaagcctg 60

aaactgggta ttccgctggt tattagccag atgtgtgaaa ccggtattta taccgcaaat 120

gcagttatga tgggtctgct gggcacccag gttctggcag ccggtgctct gggtgcactg 180

gcatttctga ccctgctgtt tgcatgtcat ggtattctga gcgttggtgg tagcctggca 240

gcggaagcat ttggtgcaaa caaaattgat gaagttagcc gtattgcaag cggtcagatt 300

tggctggcag ttaccctgag cctgcctgca atgctgctgc tgtggcatgg tgataccatt 360

ctgctgttat ttggtcaaga agaaagcaac gttctgctga ccaaaaccta tctgcatagc 420

attctgtggg gttttccggc agcactgagt attctgacac tgcgtggtat tgccagcgca 480

ctgaatgttc cgcgtctgat taccattacc atgctgaccc agctgattct gaataccgca 540

gcagattatg ttctgatctt tggtaaattt ggtctgccgc agctgggtct ggcaggtatt 600

ggttgggcaa ccgcactggg tttttgggtt agctttaccc tgggtctgat cctgctgatt 660

tttagcctga aagtgcgtga ttataaactg tttcgttatc tgcaccagtt cgacaagcag 720

atctttgtga aaatctttca gaccggttgg ccgatgggtt ttcagtgggg tgcagaaaca 780

gcactgttta atgttaccgc atgggttgca ggttatctgg gcaccgttac cctggcagca 840

catgatattg gttttcagac agcagaactg gcaatggtta tcccgctggg tgttggtaat 900

gttgcaatga cccgtgttgg tcagagcatt ggtgaaaaaa atccactggg tgcccgtcgt 960

gttgcaagca ttggtattac cattgttggt atttatgcca gcattgttgc cctggttttt 1020

tggctgtttc cgtatcagat tgcaggcatt tatctgaaca ttaataaccc ggaaaacatt 1080

gaagccatca aaaaagccac cacctttatt ccactggcag gtctgtttca gatgttttat 1140

agcattcaga tcattatcgt tggtgcgctg gttggtctgc gtgatacctt tgttccggtt 1200

agcatgaatc tgattgtttg gggtctgggt ttagcaggta gctattttat ggcaattatt 1260

ctgggttggg gtggtattgg tatctggctg gccatggttc tgagtccgct gctgagcgca 1320

gttattctga ccgttcgttt ttatcgcgtg attgataatc tgctggccaa cagtgatgat 1380

atgctgcaga atgcaagcgt taccaccctg ggatga 1416

<210> 19

<211> 377

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 19

Met Thr Asn Gln Asn Asn Gln Glu Leu Glu Asn Asp Leu Pro Ile Ala

1 5 10 15

Lys Gln Pro Cys Pro Val Asn Ser Tyr Asn Glu Trp Asp Thr Leu Glu

20 25 30

Glu Val Ile Val Gly Ser Val Glu Gly Ala Met Leu Pro Ala Leu Glu

35 40 45

Pro Ile Asn Lys Trp Thr Phe Pro Phe Glu Glu Leu Glu Ser Ala Gln

50 55 60

Lys Ile Leu Ser Glu Arg Gly Gly Val Pro Tyr Pro Pro Glu Met Ile

65 70 75 80

Thr Leu Ala His Lys Glu Leu Asn Glu Phe Ile His Ile Leu Glu Ala

85 90 95

Glu Gly Val Lys Val Arg Arg Val Lys Pro Val Asp Phe Ser Val Pro

100 105 110

Phe Ser Thr Pro Ala Trp Gln Val Gly Ser Gly Phe Cys Ala Ala Asn

115 120 125

Pro Arg Asp Val Phe Leu Val Ile Gly Asn Glu Ile Ile Glu Ala Pro

130 135 140

Met Ala Asp Arg Asn Arg Tyr Phe Glu Thr Trp Ala Tyr Arg Glu Met

145 150 155 160

Leu Lys Glu Tyr Phe Gln Ala Gly Ala Lys Trp Thr Ala Ala Pro Lys

165 170 175

Pro Gln Leu Phe Asp Ala Gln Tyr Asp Phe Asn Phe Gln Phe Pro Gln

180 185 190

Leu Gly Glu Pro Pro Arg Phe Val Val Thr Glu Phe Glu Pro Thr Phe

195 200 205

Asp Ala Ala Asp Phe Val Arg Cys Gly Arg Asp Ile Phe Gly Gln Lys

210 215 220

Ser His Val Thr Asn Gly Leu Gly Ile Glu Trp Leu Gln Arg His Leu

225 230 235 240

Glu Asp Glu Tyr Arg Ile His Ile Ile Glu Ser His Cys Pro Glu Ala

245 250 255

Leu His Ile Asp Thr Thr Leu Met Pro Leu Ala Pro Gly Lys Ile Leu

260 265 270

Val Asn Pro Glu Phe Val Asp Val Asn Lys Leu Pro Lys Ile Leu Lys

275 280 285

Ser Trp Asp Ile Leu Val Ala Pro Tyr Pro Asn His Ile Pro Gln Asn

290 295 300

Gln Leu Arg Leu Val Ser Glu Trp Ala Gly Leu Asn Val Leu Met Leu

305 310 315 320

Asp Glu Glu Arg Val Ile Val Glu Lys Asn Gln Glu Gln Met Ile Lys

325 330 335

Ala Leu Lys Asp Trp Gly Phe Lys Pro Ile Val Cys His Phe Glu Ser

340 345 350

Tyr Tyr Pro Phe Leu Gly Ser Phe His Cys Ala Thr Leu Asp Val Arg

355 360 365

Arg Arg Gly Thr Leu Gln Ser Tyr Phe

370 375

<210> 20

<211> 1134

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 20

atgaccaatc aaaataacca agaattagag aacgatttac caatcgccaa gcagccttgt 60

ccggtcaatt cttataatga gtgggacaca cttgaggagg tcattgttgg tagtgttgaa 120

ggtgcaatgt taccggccct agaaccaatc aacaaatgga cattcccttt tgaagaattg 180

gaatctgccc aaaagatact ctctgagagg ggaggagttc cttatccacc agagatgatt 240

acattagcac acaaagaact aaatgaattt attcacattc ttgaagcaga aggggtcaaa 300

gttcgtcgag ttaaacctgt agatttctct gtccccttct ccacaccagc ttggcaagta 360

ggaagtggtt tttgtgccgc caatcctcgc gatgtttttt tggtgattgg gaatgagatt 420

attgaagcac caatggcaga tcgcaaccgc tattttgaaa cttgggcgta tcgagagatg 480

ctcaaggaat attttcaggc aggagctaag tggactgcag cgccgaagcc acaattattc 540

gacgcacagt atgacttcaa tttccagttt cctcaactgg gggagccgcc gcgtttcgtc 600

gttacagagt ttgaaccgac ttttgatgcg gcagattttg tgcgctgtgg acgagatatt 660

tttggtcaaa aaagtcatgt gactaatggt ttgggcatag aatggttaca acgtcacttg 720

gaagacgaat accgtattca tattattgaa tcgcattgtc cggaagcact gcacatcgat 780

accaccttaa tgcctcttgc acctggcaaa atactagtaa atccagaatt tgtagatgtt 840

aataaattgc caaaaatcct gaaaagctgg gacattttgg ttgcacctta ccccaaccat 900

atacctcaaa accagctgag actggtcagt gaatgggcag gtttgaatgt actgatgtta 960

gatgaagagc gagtcattgt agaaaaaaac caggagcaga tgattaaagc actgaaagat 1020

tggggattta agcctattgt ttgccatttt gaaagctact atccattttt aggatcattt 1080

cactgtgcaa cattagacgt tcgccgacgc ggaactcttc agtcctattt ttaa 1134

<210> 21

<211> 1134

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 21

atgaccaatc agaacaacca agagctggaa aatgatctgc cgattgcaaa acagccgtgt 60

ccggttaata gctataatga atgggatacc ctggaagaag ttattgttgg tagcgttgaa 120

ggtgcaatgc tgcctgcact ggaaccgatt aacaaatgga cctttccgtt tgaagaactg 180

gaaagcgcac agaaaattct gagcgaacgt ggtggtgttc cgtatccgcc tgaaatgatt 240

accctggcac ataaagaact gaacgagttt attcatatcc tggaagccga aggtgttaaa 300

gttcgtcgtg ttaaaccggt tgattttagc gttccgttta gcacaccggc atggcaggtt 360

ggtagcggtt tttgtgcagc aaatccgcgt gatgtttttc tggttattgg caacgaaatt 420

atcgaagcac cgatggcaga tcgtaatcgt tattttgaaa cctgggcata tcgcgaaatg 480

ctgaaagaat attttcaggc aggcgcaaaa tggaccgcag caccgaaacc gcagctgttt 540

gatgcacagt atgatttcaa ttttcagttt ccgcagctgg gtgaaccgcc tcgttttgtt 600

gttaccgaat ttgaaccgac ctttgatgca gccgattttg ttcgttgtgg tcgtgatatt 660

tttggccaga aaagccatgt taccaatggt ctgggtattg aatggctgca gcgtcatctg 720

gaagatgaat atcgcattca tatcatcgaa agccattgtc cggaagcact gcatattgat 780

accaccctga tgccgctggc accgggtaaa attctggtta atccggaatt tgtggacgtg 840

aataaactgc cgaaaattct gaaaagctgg gatattctgg ttgcaccgta tccgaatcat 900

attccgcaga atcagctgcg tctggttagc gaatgggcag gtctgaatgt tctgatgctg 960

gatgaagaac gtgtgatcgt ggaaaaaaat caagagcaga tgatcaaagc cctgaaagat 1020

tggggtttta aaccgattgt ttgccacttc gaaagctatt atccgtttct gggtagcttt 1080

cattgtgcaa ccctggatgt tcgtcgtcgt ggcaccctgc agagctattt ttga 1134

<210> 22

<211> 334

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 22

Met Thr Thr Ala Asp Leu Ile Leu Ile Asn Asn Trp Tyr Val Val Ala

1 5 10 15

Lys Val Glu Asp Cys Lys Pro Gly Ser Ile Thr Thr Ala Leu Leu Leu

20 25 30

Gly Val Lys Leu Val Leu Trp Arg Ser Arg Glu Gln Asn Ser Pro Ile

35 40 45

Gln Ile Trp Gln Asp Tyr Cys Pro His Arg Gly Val Ala Leu Ser Met

50 55 60

Gly Glu Ile Val Asn Asn Thr Leu Val Cys Pro Tyr His Gly Trp Arg

65 70 75 80

Tyr Asn Gln Ala Gly Lys Cys Val His Ile Pro Ala His Pro Asp Met

85 90 95

Thr Pro Pro Ala Ser Ala Gln Ala Lys Ile Tyr His Cys Gln Glu Arg

100 105 110

Tyr Gly Leu Val Trp Val Cys Leu Gly Asp Pro Val Asn Asp Ile Pro

115 120 125

Ser Leu Pro Glu Trp Asp Asp Pro Asn Tyr His Asn Thr Cys Thr Lys

130 135 140

Ser Tyr Phe Ile Gln Ala Ser Ala Phe Arg Val Met Asp Asn Phe Ile

145 150 155 160

Asp Val Ser His Phe Pro Phe Val His Asp Gly Gly Leu Gly Asp Arg

165 170 175

Asn His Ala Gln Ile Glu Glu Phe Glu Val Lys Val Asp Lys Asp Gly

180 185 190

Ile Ser Ile Gly Asn Leu Lys Leu Gln Met Pro Arg Phe Asn Ser Ser

195 200 205

Asn Glu Asp Asp Ser Trp Thr Leu Tyr Gln Arg Ile Ser His Pro Leu

210 215 220

Cys Gln Tyr Tyr Ile Thr Glu Ser Ser Glu Ile Arg Thr Ala Asp Leu

225 230 235 240

Met Leu Val Thr Pro Ile Asp Glu Asp Asn Ser Leu Val Arg Met Leu

245 250 255

Val Thr Trp Asn Arg Ser Glu Ile Leu Glu Ser Thr Val Leu Glu Glu

260 265 270

Phe Asp Glu Thr Ile Glu Gln Asp Ile Pro Ile Ile His Ser Gln Gln

275 280 285

Pro Ala Arg Leu Pro Leu Leu Pro Ser Lys Gln Ile Asn Met Gln Trp

290 295 300

Leu Ser Gln Glu Ile His Val Pro Ser Asp Arg Cys Thr Val Ala Tyr

305 310 315 320

Arg Arg Trp Leu Lys Glu Leu Gly Val Thr Tyr Gly Val Cys

325 330

<210> 23

<211> 1005

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 23

atgacaactg ctgacctaat cttaattaac aactggtacg tagtcgcaaa ggtggaagat 60

tgtaaaccag gaagtatcac cacggctctt ttattgggag ttaagttggt actatggcgc 120

agtcgtgaac agaattcccc catacagata tggcaagact actgccctca ccgaggtgtg 180

gctctgtcta tgggagaaat tgttaataat actttggttt gtccgtatca cggatggaga 240

tataatcaag caggtaaatg cgtacatatc ccggctcacc ctgacatgac acccccagca 300

agtgcccaag ccaagatcta tcattgccag gagcgatacg gattagtatg ggtgtgctta 360

ggtgatcctg tcaatgatat accttcatta cccgaatggg acgatccgaa ttatcataat 420

acttgtacta aatcttattt tattcaagct agtgcgtttc gtgtaatgga taatttcata 480

gatgtatctc attttccttt tgtccacgac ggtgggttag gtgatcgcaa ccacgcacaa 540

attgaagaat ttgaggtaaa agtagacaaa gatggcatta gcataggtaa ccttaaactc 600

cagatgccaa ggtttaacag cagtaacgaa gatgactcat ggactcttta ccaaaggatt 660

agtcatccct tgtgtcaata ctatattact gaatcctctg aaattcggac tgcggatttg 720

atgctggtaa caccgattga tgaagacaac agcttagtgc gaatgttagt aacgtggaac 780

cgctccgaaa tattagagtc aacggtacta gaggaatttg acgaaacaat agaacaagat 840

attccgatta tacactctca acagccagcg cgtttaccac tgttaccttc aaagcagata 900

aacatgcaat ggttgtcaca ggaaatacat gtaccgtcag atcgatgcac agttgcctat 960

cgtcgatggc taaaggaact gggcgttacc tatggtgttt gttaa 1005

<210> 24

<211> 1005

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 24

atgacgaccg cagatctgat tctgatcaat aattggtatg ttgtggccaa ggtggaagat 60

tgtaaaccgg gtagcattac caccgcactg ctgctgggtg ttaaactggt tctgtggcgt 120

agccgtgaac agaatagccc gattcagatt tggcaggatt attgtccgca tcgtggtgtt 180

gcactgagca tgggtgaaat tgtgaataat accctggttt gtccgtatca tggttggcgt 240

tataatcagg caggtaaatg tgttcatatt ccggcacatc cggatatgac ccctccggca 300

agcgcacagg caaaaatcta tcattgtcaa gaacgttatg gtctggtttg ggtttgtctg 360

ggtgatccgg ttaatgatat tccgagtctg ccggaatggg atgatccgaa ttatcataat 420

acctgcacca agagctactt tatccaggca agcgcatttc gtgtgatgga taactttatt 480

gatgtgagcc attttccgtt tgtgcatgat ggtggtctgg gcgatcgtaa tcatgcacag 540

attgaagaat ttgaggtgaa agtggataaa gacggtatta gcattggcaa tctgaaactg 600

cagatgcctc gttttaatag cagcaatgaa gatgatagct ggaccctgta tcagcgtatt 660

agccatccgc tgtgtcagta ttatatcacc gaaagcagcg aaattcgtac agcagatctg 720

atgctggtta ccccgattga tgaagataat tcactggttc gtatgctggt gacctggaat 780

cgtagcgaaa ttctggaaag caccgttctg gaagaatttg atgaaaccat tgaacaggat 840

atcccgatta ttcatagcca gcagcctgca cgtctgccgc tgctgccgag caagcagatt 900

aatatgcagt ggctgagcca agaaattcat gttccgagcg atcgttgtac cgttgcatat 960

cgtcgttggc tgaaagaact gggcgttacc tatggtgttt gttga 1005

<210> 25

<211> 612

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 25

Met Gln Ile Leu Gly Ile Ser Ala Tyr Tyr His Asp Ser Ala Ala Ala

1 5 10 15

Met Val Ile Asp Gly Glu Ile Val Ala Ala Ala Gln Glu Glu Arg Phe

20 25 30

Ser Arg Arg Lys His Asp Ala Gly Phe Pro Thr Gly Ala Ile Thr Tyr

35 40 45

Cys Leu Lys Gln Val Gly Thr Lys Leu Gln Tyr Ile Asp Gln Ile Val

50 55 60

Phe Tyr Asp Lys Pro Leu Val Lys Phe Glu Arg Leu Leu Glu Thr Tyr

65 70 75 80

Leu Ala Tyr Ala Pro Lys Gly Phe Gly Ser Phe Ile Thr Ala Met Pro

85 90 95

Val Trp Leu Lys Glu Lys Leu Tyr Leu Lys Thr Leu Leu Lys Lys Glu

100 105 110

Leu Ala Leu Leu Gly Glu Cys Lys Ala Ser Gln Leu Pro Pro Leu Leu

115 120 125

Phe Thr Ser His His Gln Ala His Ala Ala Ala Ala Phe Phe Pro Ser

130 135 140

Pro Phe Gln Arg Ala Ala Val Leu Cys Leu Asp Gly Val Gly Glu Trp

145 150 155 160

Ala Thr Thr Ser Val Trp Leu Gly Glu Gly Asn Lys Leu Thr Pro Gln

165 170 175

Trp Glu Ile Asp Phe Pro His Ser Leu Gly Leu Leu Tyr Ser Ala Phe

180 185 190

Thr Tyr Tyr Thr Gly Phe Lys Val Asn Ser Gly Glu Tyr Lys Leu Met

195 200 205

Gly Leu Ala Pro Tyr Gly Glu Pro Lys Tyr Val Asp Gln Ile Leu Lys

210 215 220

His Leu Leu Asp Leu Lys Glu Asp Gly Thr Phe Arg Leu Asn Met Asp

225 230 235 240

Tyr Phe Asn Tyr Thr Val Gly Leu Thr Met Thr Asn His Lys Phe His

245 250 255

Ser Met Phe Gly Gly Pro Pro Arg Gln Ala Glu Gly Lys Ile Ser Gln

260 265 270

Arg Asp Met Asp Leu Ala Ser Ser Ile Gln Lys Val Thr Glu Glu Val

275 280 285

Ile Leu Arg Leu Ala Arg Thr Ile Lys Lys Glu Leu Gly Val Glu Tyr

290 295 300

Leu Cys Leu Ala Gly Gly Val Gly Leu Asn Cys Val Ala Asn Gly Arg

305 310 315 320

Ile Leu Arg Glu Ser Asp Phe Lys Asp Ile Trp Ile Gln Pro Ala Ala

325 330 335

Gly Asp Ala Gly Ser Ala Val Gly Ala Ala Leu Ala Ile Trp His Glu

340 345 350

Tyr His Lys Lys Pro Arg Thr Ser Thr Ala Gly Asp Arg Met Lys Gly

355 360 365

Ser Tyr Leu Gly Pro Ser Phe Ser Glu Ala Glu Ile Leu Gln Phe Leu

370 375 380

Asn Ser Val Asn Ile Pro Tyr His Arg Cys Val Asp Asn Glu Leu Met

385 390 395 400

Ala Arg Leu Ala Glu Ile Leu Asp Gln Gly Asn Val Val Gly Trp Phe

405 410 415

Ser Gly Arg Met Glu Phe Gly Pro Arg Ala Leu Gly Gly Arg Ser Ile

420 425 430

Ile Gly Asp Ser Arg Ser Pro Lys Met Gln Ser Val Met Asn Leu Lys

435 440 445

Ile Lys Tyr Arg Glu Ser Phe Arg Pro Phe Ala Pro Ser Val Leu Ala

450 455 460

Glu Arg Val Ser Asp Tyr Phe Asp Leu Asp Arg Pro Ser Pro Tyr Met

465 470 475 480

Leu Leu Val Ala Gln Val Lys Glu Asn Leu His Ile Pro Met Thr Gln

485 490 495

Glu Gln His Glu Leu Phe Gly Ile Glu Lys Leu Asn Val Pro Arg Ser

500 505 510

Gln Ile Pro Ala Val Thr His Val Asp Tyr Ser Ala Arg Ile Gln Thr

515 520 525

Val His Lys Glu Thr Asn Pro Arg Tyr Tyr Glu Leu Ile Arg His Phe

530 535 540

Glu Ala Arg Thr Gly Cys Ala Val Leu Val Asn Thr Ser Phe Asn Val

545 550 555 560

Arg Gly Glu Pro Ile Val Cys Thr Pro Glu Asp Ala Tyr Arg Cys Phe

565 570 575

Met Arg Thr Glu Met Asp Tyr Leu Val Met Glu Asn Phe Leu Leu Val

580 585 590

Lys Ser Glu Gln Pro Arg Gly Asn Ser Asp Glu Ser Trp Gln Lys Glu

595 600 605

Phe Glu Leu Asp

610

<210> 26

<211> 1839

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 26

atgcagatct taggaatttc agcttactac cacgatagtg ctgccgcgat ggttatcgat 60

ggcgaaattg ttgctgcagc tcaggaagaa cgtttctcaa gacgaaagca cgatgctggg 120

tttccgactg gagcgattac ttactgtcta aaacaagtag gaaccaagtt acaatatatc 180

gatcaaattg ttttttacga caagccatta gtcaaatttg agcggttgct agaaacatat 240

ttagcatatg ccccaaaggg atttggctcg tttattactg ctatgcccgt ttggctcaaa 300

gaaaagcttt acctaaaaac acttttaaaa aaagaattgg cgcttttggg ggagtgcaaa 360

gcttctcaat tgcctcctct actgtttacc tcacatcacc aagcccatgc ggccgctgct 420

ttttttccca gtccttttca gcgtgctgcc gttctgtgct tagatggtgt aggagagtgg 480

gcaactactt ctgtctggtt gggagaagga aataaactca caccacaatg ggaaattgat 540

tttccccatt ccctcggttt gctttactca gcgtttacct actacactgg gttcaaagtt 600

aactcaggtg agtacaaact catgggttta gcaccctacg gggaacccaa atatgtggac 660

caaattctca agcatttgtt ggatctcaaa gaagatggta cttttaggtt gaatatggac 720

tacttcaact acacggtggg gctaaccatg accaatcata agttccatag tatgtttgga 780

ggaccaccac gccaggcgga aggaaaaatc tcccaaagag acatggatct ggcaagttcg 840

atccaaaagg tgactgaaga agtcatactg cgtctggcta gaactatcaa aaaagaactg 900

ggtgtagagt atctatgttt agcaggtggt gtcggtctca attgcgtggc taacggacga 960

attctccgag aaagtgattt caaagatatt tggattcaac ccgcagcagg agatgccggt 1020

agtgcagtgg gagcagcttt agcgatttgg catgaatacc ataagaaacc tcgcacttca 1080

acagcaggcg atcgcatgaa aggttcttat ctgggaccta gctttagcga ggcggagatt 1140

ctccagtttc ttaattctgt taacataccc taccatcgat gcgttgataa cgaacttatg 1200

gctcgtcttg cagaaatttt agaccaggga aatgttgtag gctggttttc tggacgaatg 1260

gagtttggtc cgcgtgcttt gggtggccgt tcgattattg gcgattcacg cagtccaaaa 1320

atgcaatcgg tcatgaacct gaaaattaaa tatcgtgagt ccttccgtcc atttgctcct 1380

tcagtcttgg ctgaacgagt ctccgactac ttcgatcttg atcgtcctag tccttatatg 1440

cttttggtag cacaagtcaa agagaatctg cacattccta tgacacaaga gcaacacgag 1500

ctatttggga tcgagaagct gaatgttcct cgttcccaaa ttcccgcagt cactcacgtt 1560

gattactcag ctcgtattca gacagttcac aaagaaacga atcctcgtta ctacgagtta 1620

attcgtcatt ttgaggcacg aactggttgt gctgtcttgg tcaatacttc gtttaatgtc 1680

cgcggcgaac caattgtttg tactcccgaa gacgcttatc gatgctttat gagaactgaa 1740

atggactatt tggttatgga gaatttcttg ttggtcaaat ctgaacagcc acggggaaat 1800

agtgatgagt catggcaaaa agaattcgag ttagattaa 1839

<210> 27

<211> 1839

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 27

atgcagattc tgggtatcag cgcctattat catgatagcg cagcagcaat ggttattgat 60

ggtgaaattg ttgcagcagc acaagaagaa cgttttagcc gtcgtaaaca tgatgcaggt 120

tttccgaccg gtgcaattac ctattgtctg aaacaggttg gcaccaaact gcagtatatt 180

gatcagatcg tgttctatga taaaccgctg gtgaaatttg aacgtctgct ggaaacctat 240

ctggcctatg caccgaaagg ttttggtagt tttattaccg caatgccggt gtggctgaaa 300

gagaaactgt atctgaaaac cctgctgaaa aaagaactgg cactgctggg tgaatgtaaa 360

gcaagccagc tgcctccgct gctgtttacc agccatcatc aggcacatgc agcagcagca 420

ttttttccga gcccgtttca gcgtgcagca gttctgtgtc tggatggtgt tggtgaatgg 480

gcaaccacca gtgtttggct gggtgaaggt aataaactga caccgcagtg ggaaattgat 540

tttccgcata gcctgggcct gctgtatagc gcatttacct attataccgg ctttaaagtg 600

aacagcggtg agtataaact gatgggtctg gcaccgtatg gtgaaccgaa atatgttgat 660

cagattctga aacatctgct ggatctgaaa gaagatggca cctttcgtct gaacatggat 720

tatttcaatt ataccgttgg tctgaccatg accaaccata aatttcatag catgtttggt 780

ggtccgcctc gtcaggcaga aggtaaaatt agccagcgtg atatggatct ggcaagcagc 840

attcagaaag ttaccgaaga agtgattctg cgtctggcac gtaccattaa gaaagaatta 900

ggtgttgaat acctgtgtct ggcaggcggt gttggtctga attgtgttgc aaatggtcgt 960

attctgcgtg agagcgattt taaagatatt tggattcagc ctgcagccgg tgatgcaggt 1020

agcgcagttg gtgcagcact ggcaatttgg catgaatatc ataaaaaacc gcgtaccagc 1080

accgcaggcg atcgtatgaa aggtagctat ctgggtccga gctttagcga agcagaaatt 1140

ctgcagtttc tgaacagcgt gaatattccg tatcatcgtt gtgtggataa tgaactgatg 1200

gcacgtctgg cggaaattct ggatcagggt aatgttgttg gttggtttag cggtcgtatg 1260

gaatttggtc cgcgtgcact gggtggtcgt agcattattg gtgatagccg tagcccgaaa 1320

atgcagagcg ttatgaatct gaaaatcaaa tatcgcgaaa gcttccgtcc gtttgcaccg 1380

agcgttctgg cagaacgtgt tagcgattat tttgatctgg atcgtccgag cccgtatatg 1440

ctgctggttg cacaggttaa agaaaatctg catattccga tgacccaaga acagcatgaa 1500

ctgtttggta tcgaaaaact gaatgttccg cgtagccaga ttccggcagt tacccatgtt 1560

gattatagcg cacgtattca gaccgttcat aaagaaacca atccgcgtta ttatgaactg 1620

atccgtcatt ttgaagcacg taccggttgt gcagttctgg ttaataccag ctttaatgtt 1680

cgtggtgaac cgattgtgtg tacaccggaa gatgcatatc gttgttttat gcgtaccgag 1740

atggattacc tggtgatgga aaattttctg ctggtgaaaa gcgaacagcc tcgtggtaat 1800

agtgatgaaa gctggcagaa agaatttgag ctggattga 1839

<210> 28

<211> 147

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 28

Met Ser Glu Phe Phe Pro Gln Lys Ser Gly Lys Leu Lys Met Glu Gln

1 5 10 15

Ile Lys Glu Leu Asp Lys Lys Gly Leu Arg Glu Phe Gly Leu Ile Gly

20 25 30

Gly Ser Ile Val Ala Val Leu Phe Gly Phe Leu Leu Pro Val Ile Arg

35 40 45

His His Ser Leu Ser Val Ile Pro Trp Val Val Ala Gly Phe Leu Trp

50 55 60

Ile Trp Ala Ile Ile Ala Pro Thr Thr Leu Ser Phe Ile Tyr Gln Ile

65 70 75 80

Trp Met Arg Ile Gly Leu Val Leu Gly Trp Ile Gln Thr Arg Ile Ile

85 90 95

Leu Gly Val Leu Phe Tyr Ile Met Ile Thr Pro Ile Gly Phe Ile Arg

100 105 110

Arg Leu Leu Asn Gln Asp Pro Met Thr Arg Ile Phe Glu Pro Glu Leu

115 120 125

Pro Thr Tyr Arg Gln Leu Ser Lys Ser Arg Thr Thr Gln Ser Met Glu

130 135 140

Lys Pro Phe

145

<210> 29

<211> 405

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 29

atggaacaga taaaagaact tgacaaaaaa ggattgcgtg agtttggact gattggcggt 60

tctatagtgg cggttttatt cggcttttta ctgccagtta tacgccatca ttccttatca 120

gttatccctt gggttgttgc tggatttctc tggatttggg caataatcgc acctacgact 180

ttaagtttta tttaccaaat atggatgagg attggacttg ttttaggatg gatacaaaca 240

cgaattattt tgggagtttt attttatata atgatcacac caataggatt cataagacgg 300

ctgttgaatc aagatccaat gacgcgaatc ttcgagccag agttgccaac ttatcgccaa 360

ttgagtaagt caagaactac acaaagtatg gagaaaccat tctaa 405

<210> 30

<211> 405

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 30

atggaacaaa ttaaagaact ggataagaaa ggcctgcgtg aatttggtct gattggtggt 60

agcattgttg ccgttctgtt tggttttctg ctgccggtta ttcgtcatca tagcctgagc 120

gttattccgt gggttgttgc aggttttctg tggatttggg caattattgc accgaccacc 180

ctgagcttta tctatcagat ttggatgcgt attggtctgg tgctgggttg gattcagacc 240

cgtattattc tgggtgttct gttctatatt atgattaccc cgatcggttt tattcgtcgt 300

ctgctgaatc aggatccgat gacccgtatt tttgaaccgg aactgccgac ctatcgtcag 360

ctgagcaaaa gccgtaccac ccagagcatg gaaaaaccgt tctga 405

<210> 31

<211> 54

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 31

Met Leu Lys Asp Thr Trp Asp Phe Ile Lys Asp Ile Ala Gly Phe Ile

1 5 10 15

Lys Glu Gln Lys Asn Tyr Leu Leu Ile Pro Leu Ile Ile Thr Leu Val

20 25 30

Ser Leu Gly Ala Leu Ile Val Phe Ala Gln Ser Ser Ala Ile Ala Pro

35 40 45

Phe Ile Tyr Thr Leu Phe

50

<210> 32

<211> 165

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 32

atgctaaaag acacttggga ttttattaaa gacattgccg gatttattaa agaacaaaaa 60

aactatttgt tgattcccct aattatcacc ctggtatcct tgggggcgct gattgtcttt 120

gctcaatctt ctgcgatcgc acctttcatt tacactcttt tttaa 165

<210> 33

<211> 165

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 33

atgttaaaag acacctggga ttttatcaag gatatcgcag gctttatcaa agaacagaaa 60

aactatctgc tgattccgct gattattacc ctggttagcc tgggtgcact gattgttttt 120

gcacagagca gcgcaattgc accgtttatc tataccctgt tttga 165

<210> 34

<211> 432

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 34

Met Ser Asn Phe Lys Gly Ser Val Lys Ile Ala Leu Met Gly Ile Leu

1 5 10 15

Ile Phe Cys Gly Leu Ile Phe Gly Val Ala Phe Val Glu Ile Gly Leu

20 25 30

Arg Ile Ala Gly Ile Glu His Ile Ala Phe His Ser Ile Asp Glu His

35 40 45

Arg Gly Trp Val Gly Arg Pro His Val Ser Gly Trp Tyr Arg Thr Glu

50 55 60

Gly Glu Ala His Ile Gln Met Asn Ser Asp Gly Phe Arg Asp Arg Glu

65 70 75 80

His Ile Lys Val Lys Pro Glu Asn Thr Phe Arg Ile Ala Leu Leu Gly

85 90 95

Asp Ser Phe Val Glu Ser Met Gln Val Pro Leu Glu Gln Asn Leu Ala

100 105 110

Ala Val Ile Glu Gly Glu Ile Ser Ser Cys Ile Ala Leu Ala Gly Arg

115 120 125

Lys Ala Glu Val Ile Asn Phe Gly Val Thr Gly Tyr Gly Thr Asp Gln

130 135 140

Glu Leu Ile Thr Leu Arg Glu Lys Val Trp Asp Tyr Ser Pro Asp Ile

145 150 155 160

Val Val Leu Asp Phe Tyr Thr Gly Asn Asp Ile Val Asp Asn Ser Arg

165 170 175

Ala Leu Ser Gln Lys Phe Tyr Pro Asn Glu Leu Gly Ser Leu Lys Pro

180 185 190

Phe Phe Ile Leu Arg Asp Gly Asn Leu Val Val Asp Ala Ser Phe Ile

195 200 205

Asn Thr Asp Asn Tyr Arg Ser Lys Leu Thr Trp Trp Gly Lys Thr Tyr

210 215 220

Met Lys Ile Lys Asp His Ser Arg Ile Leu Gln Val Leu Asn Met Val

225 230 235 240

Arg Asp Ala Leu Asn Asn Ser Ser Arg Gly Phe Ser Ser Gln Ala Ile

245 250 255

Glu Glu Pro Leu Phe Ser Asp Gly Lys Gln Asp Thr Lys Leu Ser Gly

260 265 270

Phe Phe Asp Ile Tyr Lys Pro Pro Thr Asp Pro Glu Trp Gln Gln Ala

275 280 285

Trp Gln Val Thr Glu Lys Leu Ile Ser Ser Met Gln His Glu Val Thr

290 295 300

Ala Lys Lys Ala Asp Phe Leu Val Val Thr Phe Gly Gly Pro Phe Gln

305 310 315 320

Arg Glu Pro Leu Val Arg Gln Lys Glu Met Gln Glu Leu Gly Leu Thr

325 330 335

Asp Trp Phe Tyr Pro Glu Lys Arg Ile Thr Arg Leu Gly Glu Asp Glu

340 345 350

Gly Phe Ser Val Leu Asn Leu Ser Pro Asn Leu Gln Val Tyr Ser Glu

355 360 365

Gln Asn Asn Ala Cys Leu Tyr Gly Phe Asp Asp Thr Gln Gly Cys Val

370 375 380

Gly His Trp Asn Ala Leu Gly His Gln Val Ala Gly Lys Met Ile Ala

385 390 395 400

Ser Lys Ile Cys Gln Gln Gln Met Arg Glu Ser Ile Leu Pro His Lys

405 410 415

His Asp Pro Ser Ser Gln Ser Ser Pro Ile Thr Gln Ser Val Ile Gln

420 425 430

<210> 35

<211> 1299

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 35

atgagtaact tcaagggttc ggtaaagata gcattgatgg gaatattgat tttttgtggg 60

ctaatctttg gcgtagcatt tgttgaaatt gggttacgta ttgccgggat cgaacacata 120

gcattccata gcattgatga acacaggggg tgggtagggc gacctcatgt ttccgggtgg 180

tatagaaccg aaggtgaagc tcacatccaa atgaatagtg atggctttcg agatcgagaa 240

cacatcaagg tcaaaccaga aaataccttc aggatagcgc tgttgggaga ttcctttgta 300

gagtccatgc aagtaccgtt ggagcaaaat ttggcagcag ttatagaagg agaaatcagt 360

agttgtatag ctttagctgg acgaaaggcg gaagtgatta attttggagt gactggttat 420

ggaacagacc aagaactaat tactctacgg gagaaagttt gggactattc acctgatata 480

gtagtgctag atttttatac tggcaacgac attgttgata actcccgtgc gctgagtcag 540

aaattctatc ctaatgaact aggttcacta aagccgtttt ttatacttag agatggtaat 600

ctggtggttg atgcttcgtt tatcaatacg gataattatc gctcaaagct gacatggtgg 660

ggcaaaactt atatgaaaat aaaagaccac tcacggattt tacaggtttt aaacatggta 720

cgggatgctc ttaacaactc tagtagaggg ttttcttctc aagctataga ggaaccgtta 780

tttagtgatg gaaaacagga tacaaaattg agcgggtttt ttgatatcta caaaccacct 840

actgaccctg aatggcaaca ggcatggcaa gtcacagaga aactgattag ctcaatgcaa 900

cacgaggtga ctgcgaagaa agcagatttt ttagttgtta cttttggcgg tccctttcaa 960

cgagaacctt tagtgcgtca aaaagaaatg caagaattgg gtctgactga ttggttttac 1020

ccagagaagc gaattacacg tttgggtgag gatgaggggt tcagtgtact caatctcagc 1080

ccaaatttgc aggtttattc tgagcagaac aatgcttgcc tatatgggtt tgatgatact 1140

caaggctgtg tagggcattg gaatgcttta ggacatcagg tagcaggaaa aatgattgca 1200

tcgaagattt gtcaacagca gatgagagaa agtatattgc ctcataagca cgacccttca 1260

agccaaagct cacctattac ccaatcagtg atccaataa 1299

<210> 36

<211> 1299

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 36

atgagcaact tcaaaggcag cgttaaaatt gcactgatgg gcattctgat tttttgcggt 60

ctgatttttg gtgtggcctt tgttgaaatt ggtctgcgta ttgcaggcat tgaacatatt 120

gcctttcata gcattgatga acatcgtggt tgggttggtc gtccgcatgt tagcggttgg 180

tatcgtaccg aaggtgaagc acatattcag atgaatagtg atggttttcg tgatcgcgaa 240

cacattaaag tgaaaccgga aaataccttt cgtattgccc tgctgggtga tagctttgtt 300

gaaagcatgc aggttccgct ggaacagaat ctggcagcag ttattgaagg cgaaattagc 360

agctgtattg cactggcagg tcgtaaagcc gaagttatta actttggtgt taccggttat 420

ggcaccgatc aagaactgat taccctgcgt gaaaaagtgt gggattatag tccggatatt 480

gttgtgctgg atttctatac cggtaacgat attgttgata atagccgtgc actgtcccag 540

aaattctatc cgaatgaact gggtagcctg aaaccgtttt ttatcctgcg tgatggtaat 600

ctggttgttg atgcaagctt tatcaacacc gataactatc gtagcaaact gacctggtgg 660

ggtaaaacct atatgaaaat caaagatcat agccgcattc tgcaggtcct gaatatggtt 720

cgtgatgcac tgaataatag cagccgtggt tttagcagcc aggcaattga agaaccgctg 780

tttagtgatg gtaaacagga taccaaactg agcggcttct tcgatatcta taaaccgcct 840

accgatccgg aatggcagca ggcctggcag gttaccgaaa aactgattag tagcatgcag 900

catgaagtga ccgccaaaaa agccgatttt ctggttgtta cctttggcgg tccgtttcag 960

cgcgaaccgc tggttcgtca gaaagaaatg caagaactgg gtctgaccga ttggttttat 1020

ccggaaaaac gtattacccg tctgggtgaa gatgaaggtt ttagcgtgct gaatctgagc 1080

ccgaatctgc aggtttatag cgaacagaat aatgcctgtc tgtatggttt tgatgatacc 1140

cagggttgtg ttggtcattg gaatgcactg ggtcatcagg ttgcaggtaa aatgattgca 1200

agcaaaattt gtcagcagca gatgcgtgaa agcattctgc cgcataaaca tgatccgagc 1260

agccagagca gcccgattac ccagagcgtt attcagtaa 1299

<210> 37

<211> 482

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 37

Met Thr Asn Thr Glu Arg Gly Leu Ala Glu Ile Thr Ser Thr Gly Tyr

1 5 10 15

Lys Ser Glu Leu Arg Ser Glu Ala Arg Val Ser Leu Gln Leu Ala Ile

20 25 30

Pro Leu Val Leu Val Glu Ile Cys Gly Thr Ser Ile Asn Val Val Asp

35 40 45

Val Val Met Met Gly Leu Leu Gly Thr Gln Val Leu Ala Ala Gly Ala

50 55 60

Leu Gly Ala Ile Ala Phe Leu Ser Val Ser Asn Thr Cys Tyr Asn Met

65 70 75 80

Leu Leu Ser Gly Val Ala Lys Ala Ser Glu Ala Phe Gly Ala Asn Lys

85 90 95

Ile Asp Gln Val Ser Arg Ile Ala Ser Gly Gln Ile Trp Leu Ala Leu

100 105 110

Thr Leu Ser Leu Pro Ala Met Leu Leu Leu Trp Tyr Met Asp Thr Ile

115 120 125

Leu Val Leu Phe Gly Gln Val Glu Ser Asn Thr Leu Ile Ala Lys Thr

130 135 140

Tyr Leu His Ser Ile Val Trp Gly Phe Pro Ala Ala Val Gly Ile Leu

145 150 155 160

Ile Leu Arg Gly Ile Ala Ser Ala Val Asn Val Pro Gln Leu Val Thr

165 170 175

Val Thr Met Leu Val Gly Leu Val Leu Asn Ala Pro Ala Asn Tyr Val

180 185 190

Leu Met Phe Gly Lys Phe Gly Leu Pro Glu Leu Gly Leu Ala Gly Ile

195 200 205

Gly Trp Ala Ser Thr Leu Val Phe Trp Ile Ser Phe Leu Val Gly Val

210 215 220

Val Leu Leu Ile Phe Ser Pro Lys Val Arg Asp Tyr Lys Leu Phe Arg

225 230 235 240

Tyr Leu His Gln Phe Asp Arg Gln Thr Val Val Glu Ile Phe Gln Thr

245 250 255

Gly Trp Pro Met Gly Phe Leu Leu Gly Val Glu Ser Val Val Leu Ser

260 265 270

Leu Thr Ala Trp Leu Thr Gly Tyr Leu Gly Thr Val Thr Leu Ala Ala

275 280 285

His Glu Ile Ala Ile Gln Thr Ala Glu Leu Ala Ile Val Ile Pro Leu

290 295 300

Gly Ile Gly Asn Val Ala Val Thr Arg Val Gly Gln Thr Ile Gly Glu

305 310 315 320

Lys Asn Pro Leu Gly Ala Arg Arg Ala Ala Leu Ile Gly Ile Met Ile

325 330 335

Gly Gly Ile Tyr Ala Ser Leu Val Ala Val Ile Phe Trp Leu Phe Pro

340 345 350

Tyr Gln Ile Ala Gly Leu Tyr Leu Lys Ile Asn Asp Pro Glu Ser Met

355 360 365

Glu Ala Val Lys Thr Ala Thr Asn Phe Leu Phe Leu Ala Gly Leu Phe

370 375 380

Gln Phe Phe His Ser Val Gln Ile Ile Val Val Gly Val Leu Ile Gly

385 390 395 400

Leu Gln Asp Thr Phe Ile Pro Leu Leu Met Asn Leu Val Gly Trp Gly

405 410 415

Leu Gly Leu Ala Val Ser Tyr Tyr Met Gly Ile Ile Leu Cys Trp Gly

420 425 430

Gly Met Gly Ile Trp Leu Gly Leu Val Leu Ser Pro Leu Leu Ser Gly

435 440 445

Leu Ile Leu Met Val Arg Phe Tyr Gln Glu Ile Ala Asn Arg Ile Ala

450 455 460

Asn Ser Asp Asp Gly Gln Glu Ser Ile Ser Ile Asp Asn Val Glu Glu

465 470 475 480

Leu Ser

<210> 38

<211> 1449

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 38

atgacaaata ccgaaagagg attagcagaa ataacatcaa caggatataa gtcagagctt 60

agatcggagg cacgagttag cctccaactg gcaattccct tagtccttgt cgaaatatgc 120

ggaacgagta ttaatgtggt ggatgtagtc atgatgggct tacttggtac tcaagttttg 180

gctgctggtg ccttgggtgc gatcgctttt ttatctgtat cgaatacttg ttataatatg 240

cttttgtcgg gggtagcaaa ggcatctgag gcttttgggg caaacaaaat agatcaggtt 300

agtcgtattg cttctgggca aatatggctg gcactcacct tgtctttgcc tgcaatgctt 360

ttgctttggt atatggatac tatattggtg ctatttggtc aagttgaaag caacacatta 420

attgcaaaaa cgtatttaca ctcaattgtg tggggatttc cggcggcagt tggtattttg 480

atattaagag gcattgcctc tgctgtgaac gtcccccaat tggtaactgt gacgatgcta 540

gtagggctgg tcttgaatgc cccggccaat tatgtattaa tgttcggtaa atttggtctt 600

cctgaacttg gtttagctgg aataggctgg gcaagtactt tggttttttg gattagtttt 660

ctagtggggg ttgtcttgct gattttctcc ccaaaagtta gagattataa acttttccgc 720

tacttgcatc agtttgatcg acagacggtt gtggaaattt ttcaaactgg atggcctatg 780

ggttttctac tgggagtgga atcagtagta ttgagcctca ccgcttggtt aacaggctat 840

ttgggaacag taacattagc agctcatgag atcgcgatcc aaacagcaga actggcgata 900

gtgataccac tcggaatcgg gaatgttgcc gtcacgagag taggtcagac tataggagaa 960

aaaaaccctt tgggtgctag aagggcagca ttgattggga ttatgattgg tggcatttat 1020

gccagtcttg tggcagtcat tttctggttg tttccatatc agattgcggg actttattta 1080

aaaataaacg atccagagag tatggaagca gttaagacag caactaattt tctcttcttg 1140

gcgggattat tccaattttt tcatagcgtt caaataattg ttgttggggt tttaataggg 1200

ttgcaggata cgtttatccc attgttaatg aatttggtag gctggggtct tggcttggca 1260

gtaagctatt acatgggaat cattttatgt tggggaggta tgggtatctg gttaggtctg 1320

gttttgagtc cactcctgtc cggacttatt ttaatggttc gtttttatca agagattgcc 1380

aataggattg ccaatagtga tgatgggcaa gagagtatat ctattgacaa cgttgaagaa 1440

ctctcctga 1449

<210> 39

<211> 1449

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 39

atgaccaata ccgaacgtgg tctggccgaa attaccagca ccggttataa aagcgaactg 60

cgtagcgaag cccgtgttag cctgcagctg gcaattcctc tggttctggt tgaaatttgt 120

ggcaccagca ttaatgttgt tgatgttgtg atgatgggtt tactgggtac acaagtgtta 180

gcagcgggtg ccctgggagc aattgccttc ctgagcgtta gcaatacctg ctataatatg 240

ctgctgagtg gtgttgcaaa agcaagcgaa gcctttggag ccaataaaat cgatcaggtt 300

tcacgtattg cctcaggcca gatttggtta gccctgaccc tgtcattacc agccatgctg 360

ttactgtggt atatggatac catcctggtt ctgtttggtc aggttgaaag caataccctg 420

attgcgaaaa catacctgca ttcaattgtg tggggctttc ctgccgcagt tggtatcctg 480

attctgcgtg gcatagcaag tgcagttaac gttcctcagc tggttaccgt gaccatgctg 540

gttggcctgg tgctgaatgc accggctaat tatgtgctga tgttcggcaa attcggttta 600

ccggaattag gcctggctgg cattggctgg gccagcacac tggtgttttg gattagtttt 660

ctggttggtg ttgtgctgct gatattttca ccgaaagttc gcgactacaa actgttccgc 720

tatttacatc agtttgatcg tcagaccgtg gttgagattt ttcagacggg ctggcctatg 780

ggcttcctgc tgggtgtgga aagcgttgtt ctgagcctga ccgcatggct gaccggctat 840

ctgggtacag tgaccttagc agcccatgaa attgcaatcc agactgccga actggcgatt 900

gtgattccgt taggtattgg caatgttgcc gttacccgtg tgggccagac aatcggcgaa 960

aaaaacccgc tgggagcacg ccgtgcagcc ctgattggca ttatgattgg tggcatttat 1020

gcgagcctgg ttgcagtgat tttttggtta ttcccttatc aaatcgcagg cctgtacctg 1080

aaaattaacg atccggaatc aatggaagca gttaaaaccg caacaaactt tctgttttta 1140

gctggcctgt tccagttttt tcatagcgtg cagattattg ttgtgggtgt tctgattggc 1200

ctgcaggata cctttatccc tctgctgatg aatctggtgg gctggggact gggcctggcg 1260

gtttcctatt atatgggtat tatcctgtgc tggggtggca tgggcatctg gttaggtctg 1320

gtactgtcac cgctgctgtc aggcctgatc ctgatggtgc gcttttatca agaaattgcc 1380

aatcgcattg cgaatagcga cgatggccaa gaaagcatta gcattgataa tgttgaagaa 1440

ctgagctaa 1449

<210> 40

<211> 276

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 40

Met Lys Thr Asn Lys His Ile Ala Met Trp Ala Cys Pro Arg Ser Arg

1 5 10 15

Ser Thr Val Ile Thr Arg Ala Phe Glu Asn Leu Asp Gly Cys Val Val

20 25 30

Tyr Asp Glu Pro Leu Glu Ala Pro Asn Val Leu Met Thr Thr Tyr Thr

35 40 45

Met Ser Asn Ser Arg Thr Leu Ala Glu Glu Asp Leu Lys Gln Leu Ile

50 55 60

Leu Gln Asn Asn Val Glu Thr Asp Leu Lys Lys Val Ile Glu Gln Leu

65 70 75 80

Thr Gly Asp Leu Pro Asp Gly Lys Leu Phe Ser Phe Gln Lys Met Ile

85 90 95

Thr Gly Asp Tyr Arg Ser Glu Phe Gly Ile Asp Trp Ala Lys Lys Leu

100 105 110

Thr Asn Phe Phe Leu Ile Arg His Pro Gln Asp Ile Ile Phe Ser Phe

115 120 125

Asp Ile Ala Glu Arg Lys Thr Gly Ile Thr Glu Pro Phe Thr Gln Gln

130 135 140

Asn Leu Gly Met Lys Thr Leu Tyr Glu Val Phe Gln Gln Ile Glu Val

145 150 155 160

Ile Thr Gly Gln Thr Pro Leu Val Ile His Ser Asp Asp Ile Ile Lys

165 170 175

Asn Pro Pro Ser Ala Leu Lys Trp Leu Cys Lys Asn Leu Gly Leu Ala

180 185 190

Phe Asp Glu Lys Met Leu Thr Trp Lys Ala Asn Leu Glu Asp Ser Asn

195 200 205

Leu Lys Tyr Thr Lys Leu Tyr Ala Asn Ser Ala Ser Gly Ser Ser Glu

210 215 220

Pro Trp Phe Glu Thr Leu Arg Ser Thr Lys Thr Phe Leu Ala Tyr Glu

225 230 235 240

Lys Lys Glu Lys Lys Leu Pro Ala Arg Leu Ile Pro Leu Leu Asp Glu

245 250 255

Ser Ile Pro Tyr Tyr Glu Lys Leu Leu Gln His Cys His Ile Phe Glu

260 265 270

Trp Ser Glu His

275

<210> 41

<211> 831

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 41

atgaaaacaa acaaacatat agctatgtgg gcttgtccta gaagtcgttc tactgtaatt 60

acccgtgctt ttgagaactt agatgggtgt gttgtttatg atgagcctct agaggctccg 120

aatgtcttga tgacaactta cacgatgagt aacagtcgta cgttagcaga agaagactta 180

aagcaattaa tactgcaaaa taatgtagaa acagacctca agaaagttat agaacaattg 240

actggagatt taccggacgg aaaattattc tcatttcaaa aaatgataac aggtgactat 300

agatctgaat ttggaataga ttgggcaaaa aagctaacta acttcttttt aataaggcat 360

ccccaagata ttattttttc tttcgatata gcggagagaa agacaggtat cacagaacca 420

ttcacacaac aaaatcttgg catgaaaaca ctttatgaag ttttccaaca aattgaagtt 480

attacagggc aaacaccttt agttattcac tcagatgata taattaaaaa ccctccttct 540

gctttgaaat ggctgtgtaa aaacttaggg cttgcatttg atgaaaagat gctgacatgg 600

aaagcaaatc tagaagactc caatttaaag tatacaaaat tatatgctaa ttctgcgtct 660

ggcagttcag aaccttggtt tgaaacttta agatcgacca aaacatttct cgcctatgaa 720

aagaaggaga aaaaattacc agctcggtta atacctctac tagatgaatc tattccttac 780

tatgaaaaac tcttacagca ttgtcatatt tttgaatggt cagaacactg a 831

<210> 42

<211> 257

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 42

Met Ser Phe Gln Lys Phe Val Gln Glu Ala Ala Tyr Lys Val Ala Pro

1 5 10 15

Phe Lys Pro Asn Arg Phe Ala Lys Ile Ser Glu Arg Glu Asp Lys Cys

20 25 30

Ala Ile Pro Val Pro Ala Trp Arg Ala Leu Leu Ala Asn Arg Asp Leu

35 40 45

Phe Thr Trp Lys Gly Ile Pro Phe Leu Lys Gly Cys Thr Glu Ile Ala

50 55 60

Leu Tyr Ser Met Leu Leu Tyr Glu Leu Arg Pro Lys Thr Ile Ile Glu

65 70 75 80

Ile Gly Ala Leu Ser Gly Gly Ser Ala Ile Trp Leu Ala Asp His Leu

85 90 95

Glu Leu Phe Gln Ile Glu Gly Cys Val Tyr Cys Ile Asp Ile Asp Leu

100 105 110

Ser Leu Leu Asp Glu Lys Ala Lys Thr Asp Ser Arg Val His Phe Leu

115 120 125

Glu Gly Asp Cys Asn Asn Met Gly Ala Ile Met Ser Ser Glu Leu Leu

130 135 140

Ser Gly Leu Ala His Pro Trp Leu Ile Val Glu Asp Ala His Ala Asn

145 150 155 160

Ala Val Gly Val Val Glu Tyr Phe His Glu Asn Gly Leu Lys Ser Gly

165 170 175

Asp Tyr Leu Ile Val Glu Asp Thr Asn Lys Thr Met Trp Glu Leu Asp

180 185 190

Arg Glu Glu Leu Asp Arg Asp Asp Leu Asp Glu Gln Glu Leu Ile Glu

195 200 205

Lys Gly Glu Gln Lys Leu Ala Glu Leu Lys Ser Trp Leu Met Leu His

210 215 220

Glu Asn Glu Tyr Leu Ile Asp Thr Tyr Tyr Gln Asp Met Tyr Gly Tyr

225 230 235 240

Asn Gly Ser Arg Asn Trp Asn Ser Ile Leu Lys Arg Val Glu Lys Asn

245 250 255

Phe

<210> 43

<211> 774

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 43

atgagcttcc aaaaatttgt tcaagaagcc gcctataaag ttgcaccttt caaacctaat 60

cggtttgcca aaatttctga aagagaagat aaatgtgcta ttccagtgcc agcttggaga 120

gcgctcttgg caaaccgcga tttgttcact tggaaaggga tacccttcct gaaagggtgc 180

accgaaatag ctctttattc aatgctcctg tatgagcttc gcccgaaaac aataatcgaa 240

ataggagcat taagcggtgg cagcgcgatt tggctagccg atcacttaga actgttccaa 300

atagaaggtt gtgtctactg tatcgatatc gatctttccc tactcgacga gaaagcaaaa 360

actgactctc gcgttcattt tttagagggg gattgtaaca atatgggtgc aataatgtcg 420

tcggaactgc tttctgggct tgctcatccc tggttgatcg tagaagatgc ccatgctaat 480

gcggtgggag tagttgaata ttttcacgaa aacggtctaa aaagtggaga ctacttgatt 540

gtcgaagata ccaacaaaac tatgtgggag ttggacaggg aggagttgga cagggatgat 600

ttggatgagc aagaattaat agaaaaagga gagcagaaat tagcggagtt aaaaagctgg 660

ttaatgctcc acgaaaatga gtacctcatc gatacgtact atcaagatat gtacggttac 720

aacggctcta gaaactggaa ttctatcctg aaaagagtag aaaaaaattt ttag 774

<210> 44

<211> 774

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 44

atgtcatttc agaaatttgt gcaagaagca gcctataaag tcgcaccgtt taaaccgaat 60

cgttttgcca aaattagcga gcgtgaagat aaatgtgcaa ttccggttcc ggcatggcgt 120

gcactgctgg ccaatcgtga cctgtttacc tggaaaggta ttccgtttct gaaaggttgt 180

accgaaattg cactgtatag catgctgctg tatgaactgc gtccgaaaac gattattgaa 240

attggtgcgc tgagcggtgg tagcgcaatt tggctggcag atcatctgga actgtttcag 300

attgaaggtt gcgtgtattg cattgatatt gatctgtctc tgctggacga aaaagcaaaa 360

accgatagcc gtgttcattt tctggaaggt gattgcaata atatgggtgc aattatgtca 420

agcgagctgc tgagtggtct ggcacatcct tggctgattg ttgaagatgc acatgcaaat 480

gccgttggtg tggttgaata ttttcacgaa aacggtctga aaagtggcga ttacctgatc 540

gtggaagata ccaataaaac aatgtgggaa ctggatcgcg aagaactgga ccgtgatgac 600

ctggatgaac aagaactgat cgaaaaaggt gagcagaaat tagcagaact gaaaagctgg 660

ctgatgctgc atgagaatga atatctgata gatacctact atcaggatat gtatggctat 720

aatggtagcc gtaattggaa cagcattctg aaacgtgtgg aaaagaactt ttaa 774

<210> 45

<211> 108

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 45

Met Ile Glu Leu Val Ser His Lys Leu Cys Ile Asn Cys Asn Val Cys

1 5 10 15

Val Gln Val Cys Pro Thr Asn Val Phe Asp Ala Val Pro Asn Gln Pro

20 25 30

Pro Ala Ile Ala Arg Gln Glu Asp Cys Gln Thr Cys Phe Ile Cys Glu

35 40 45

Ala Tyr Cys Pro Ala Asp Ala Leu Tyr Val Ala Pro Gln Ser His Thr

50 55 60

Asn Val Ala Val Asn Glu Asp Asp Leu Ile Asp Ser Gly Ile Met Gly

65 70 75 80

Glu Tyr Arg Arg Ile Leu Gly Trp Gly Tyr Gly Arg Lys Asn Asn Ser

85 90 95

Glu Leu Asp Thr Asp His Lys Leu Arg Leu Phe Glu

100 105

<210> 46

<211> 327

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 46

atgatcgagc ttgtcagcca taaactctgt attaattgta atgtttgcgt ccaagtatgc 60

cctaccaatg tctttgatgc agttcccaac caaccgcctg cgatcgcccg acaggaagac 120

tgtcaaactt gtttcatctg tgaagcatat tgtcctgcgg atgcgctcta tgttgcgccg 180

caatctcata ccaatgttgc agtcaacgag gatgatttaa ttgacagtgg cattatgggt 240

gaatatcgtc gcatcttagg ttggggatat ggcagaaaaa acaatagcga attggatacc 300

gatcataaac tacggctatt tgaataa 327

<210> 47

<211> 327

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 47

atgattgaac tggtgagcca taagctgtgc attaattgta atgtttgtgt tcaggtgtgc 60

ccgaccaatg tttttgatgc agtgccgaat cagcctccgg caattgcacg ccaagaagat 120

tgtcagacct gttttatttg tgaagcatat tgtcctgcag atgcgctgta tgttgcaccg 180

cagagccata ccaatgttgc agttaacgaa gatgatttaa tcgacagcgg cattatgggt 240

gaatatcgtc gcattctggg ttggggctat ggtcgtaaaa acaatagcga actggatacc 300

gaccataaac tgcgtctgtt tgaatga 327

<210> 48

<211> 550

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 48

Met Asn Leu Thr Leu Asn Lys Glu Glu Lys Gln Leu Leu Thr Ala Tyr

1 5 10 15

Ser Gly Thr Glu Leu Gln Leu Thr Ala Asp Val Leu Val Ile Gly Gly

20 25 30

Gly Pro Ala Ala Ala Trp Ala Ala Trp Ala Ala Gly Ala Gln Gly Val

35 40 45

Lys Val Ile Ile Val Asp Lys Gly Phe Leu Gly Thr Ser Gly Ala Ala

50 55 60

Ala Ala Ser Gly Asn Ser Val Met Ala Pro Ser Pro Glu Asn Trp Glu

65 70 75 80

Lys Asp Val Ser Glu Cys Tyr Ser Lys Gly Asn Asn Leu Ala Asn Leu

85 90 95

Arg Trp Ile Glu Arg Val Ile Glu Lys Ala Trp Leu Ser Leu Pro Leu

100 105 110

Val Glu Asp Trp Gly Tyr Arg Phe Pro Lys Glu Asn Gly Glu Ser Val

115 120 125

Arg Gln Ser Tyr Tyr Gly Pro Glu Tyr Met Arg Val Leu Arg Lys Asn

130 135 140

Leu Leu Arg Val Gly Val Gln Ile Phe Asp Gln Ser Pro Ala Leu Glu

145 150 155 160

Leu Leu Leu Ala Gln Asp Gly Ser Val Ala Gly Ala Arg Gly Val Gln

165 170 175

Arg Gln Asn His Arg Thr Tyr Thr Val Arg Ala Gly Ala Val Val Leu

180 185 190

Ala Asn Gly Gly Cys Ala Phe Leu Ser Lys Ala Leu Gly Cys Asn Thr

195 200 205

Asn Thr Gly Asp Gly Leu Leu Met Ala Val Glu Ala Gly Gly Glu Leu

210 215 220

Ser Ser Met Glu Ala Ser Ser His Tyr Thr Ile Ser Thr Ala Phe Asn

225 230 235 240

Ala Thr Val Thr Arg Ala Ala Pro Phe Tyr Trp Ala Ser Tyr Thr Asp

245 250 255

Glu Ala Gly Asn Asp Leu Gly Gly Tyr Ile Asn Gly Arg Arg Asp Pro

260 265 270

Ser Phe Leu Pro Asn Ala Leu Leu Lys Gly Pro Val Tyr Ala Arg Leu

275 280 285

Asp Arg Ala Thr Pro Glu Ile Gln Ala Leu Val Glu Lys Ser His Phe

290 295 300

Ile Ala Phe Leu Pro Tyr Lys Lys Ala Gly Ile Asp Pro Tyr Thr Glu

305 310 315 320

Arg Val Pro Val Thr Leu Val Leu Glu Gly Thr Val Arg Gly Thr Gly

325 330 335

Gly Ile Arg Ile Val Asn Asp Ser Cys Gly Thr Lys Val Pro Gly Leu

340 345 350

Tyr Ala Ala Gly Asp Ala Ala Ser Arg Glu Phe Leu Ala Gly Ile Ala

355 360 365

Ser Gly Gly Asp Gly Pro Asn Ala Ala Trp Ala Ile Ser Thr Gly Gln

370 375 380

Trp Ala Gly Glu Gly Ala Ala Ala Phe Ala Lys Ser Leu Gly Ala His

385 390 395 400

Val His Glu Arg Val Val Arg Pro Ala Gly Gln Ala Gly Leu Arg Ser

405 410 415

Gln Tyr Pro Gly Ser Glu Thr Phe Asp Ser Glu Ala Val Val Arg Gly

420 425 430

Val Gln Ala Glu Met Phe Pro Leu Glu Lys Asn Tyr Leu Arg Cys Glu

435 440 445

Gln Gly Leu Leu Asp Ser Leu Ala Lys Leu Glu Met Leu Trp Gln Gln

450 455 460

Val Gln Gly Asn Pro Lys Gln Asp Thr Val Arg Asp Leu Glu Phe Ser

465 470 475 480

Arg Arg Ala Ala Ala Leu Val Ser Val Ala Arg Trp Ala Tyr Phe Ser

485 490 495

Ala Leu His Arg Lys Glu Thr Arg Ser Glu His Ile Arg Ile Asp Tyr

500 505 510

Pro Glu Thr Asp Pro Asn Gln Leu Tyr Tyr Gln Ala Thr Gly Gly Leu

515 520 525

Glu Arg Leu Trp Val Arg Arg Asp Trp Val Lys Asp Ala Ser Ala Thr

530 535 540

Pro Pro Val Leu Thr Thr

545 550

<210> 49

<211> 1653

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 49

atgaacttga ctttaaacaa ggaggaaaag caattgctta cagcctatag cggcactgaa 60

ctacaattaa ctgctgacgt gctggtaatt ggtggtggtc ctgccgccgc atgggcagca 120

tgggcggctg gagcccaagg tgtcaaagtc atcattgttg ataaaggttt tctaggtacg 180

agcggtgcag ctgctgccag tggcaatagc gtcatggcac cttctccaga gaattgggag 240

aaagatgtat ccgaatgtta cagcaaagga aataacctcg ctaacttacg ttggattgaa 300

cgtgtaattg aaaaagcttg gctgagtttg cccttagtgg aagattgggg ctatcgtttc 360

cccaaagaaa atggggaatc cgtgcgccag agttattatg gtccggaata tatgcgggta 420

cttcgcaaga acctgttgcg tgtgggtgtg caaattttcg accaaagtcc ggctctagaa 480

ctgttattag cccaggacgg ctccgtggct ggagctagag gtgtacagag gcaaaatcat 540

cgcacctata ccgttcgcgc tggtgcagta gttctagcga atggcggttg tgcattccta 600

agtaaagctt taggttgcaa taccaataca ggcgatggac tgctgatggc ggtggaagct 660

ggcggcgaac tctccagtat ggaagcttcc agtcactata ccatctcgac cgctttcaat 720

gccacagtga caagggctgc tcccttttac tgggctagtt acaccgatga ggcaggtaac 780

gatcttggtg gctatatcaa tggtcgtcgc gatccatcgt tcctgcccaa tgccctcctg 840

aaaggtcccg tttatgctcg tttggatcga gccacacctg aaatccaagc attggttgaa 900

aagtctcact tcatcgcctt tctaccctat aaaaaagctg gcattgaccc ttatacagaa 960

cgagtacctg taacactggt tttagaaggt acagtccgtg gtacaggtgg aattcggatt 1020

gtgaatgata gttgtggtac aaaagttcct ggactgtatg ccgccggaga tgcagcatcg 1080

cgggagtttt tagctgggat agcttctggg ggtgatggtc ctaatgctgc ttgggcaatc 1140

tctacaggac aatgggcagg ggaaggtgca gccgcctttg ccaagagttt gggcgctcat 1200

gtccatgaac gggttgtgcg tccagcaggt caagccggat tacgttccca gtaccctggt 1260

tccgaaacat tcgatagcga ggcagttgtc cgcggtgtac aagccgagat gttcccatta 1320

gagaagaatt acttgcgctg tgagcaggga cttttggatt ccctcgccaa attagaaatg 1380

ctgtggcagc aagtacaagg gaacccgaaa caagatacag tgcgcgatct ggaattttct 1440

cgtcgagcgg ctgctcttgt gtctgtagca cgatgggcat attttagcgc tttacatcgc 1500

aaggaaacgc gtagcgaaca tattcgcata gactatcctg aaaccgatcc aaatcagctt 1560

tattaccaag ccacgggcgg cttagaaagg ctttgggtga gacgggattg ggtgaaggat 1620

gcgagcgcta caccaccagt attaaccact taa 1653

<210> 50

<211> 1653

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 50

atgaacctga ccctgaacaa agaagaaaaa cagctgctga cggcatatag cggcaccgaa 60

ctgcagctga cagcagatgt tctggttatt ggtggtggtc cggcagccgc atgggcagct 120

tgggcagcag gcgcacaggg tgtgaaagtt attattgtgg ataaaggttt tctgggcacc 180

agcggtgccg cagccgcaag cggtaatagc gttatggcac cgtcaccgga aaattgggaa 240

aaagatgtga gcgaatgtta cagcaaaggt aataatctgg caaatctgcg ttggattgaa 300

cgtgttattg aaaaagcctg gctgtcactg ccgctggttg aagattgggg ttatcgtttt 360

cctaaagaaa atggtgaaag cgtgcgtcag agctattatg gtcctgaata tatgcgtgtt 420

ctgcggaaaa atctgctgcg cgttggtgtt cagatctttg atcagtcacc ggcactggaa 480

ttactgctgg cacaggatgg tagcgttgcc ggtgcacgtg gtgtgcagcg tcagaatcat 540

cgtacatata ccgttcgtgc cggtgccgtt gttctggcca atggtggttg cgcatttctg 600

agtaaagcac tgggttgtaa taccaatacc ggtgatggtc tgttaatggc agttgaagcc 660

ggtggtgaac tgagcagtat ggaagccagc agccattata ccattagcac cgcctttaat 720

gcaaccgtta cccgtgcagc tccgttttat tgggcaagct ataccgatga agctggcaat 780

gatctgggtg gctatattaa cggtcgtcgt gatccgagct ttctgccgaa cgcactgctg 840

aaaggtccgg tttatgcacg tctggatcgt gcaacaccgg aaattcaggc gctggtagaa 900

aaaagccatt ttattgcatt tctgccgtac aagaaagccg gtattgatcc gtataccgaa 960

cgtgttccgg ttaccctggt gctggaaggc accgtgcgtg gcaccggtgg tattcgcatt 1020

gttaatgatt catgtggcac caaagttccg ggactgtatg cagcgggtga tgcagcaagc 1080

cgtgaatttc tggcaggcat tgccagcggt ggtgatggac cgaatgcagc atgggcaatt 1140

tcaaccggtc agtgggcagg cgaaggtgca gcagcctttg caaaaagtct gggtgcacat 1200

gttcatgaac gcgttgttcg tccggcaggc caggcaggtc tgcgtagtca gtatccgggt 1260

agcgaaacct ttgatagtga agcagttgtt cgtggcgttc aggcagaaat gtttccgctg 1320

gaaaaaaact atctgcgctg tgaacaggga ctgctggata gcctggcaaa actggaaatg 1380

ctgtggcagc aggttcaggg taatccgaaa caggatacag ttcgtgatct ggaattttca 1440

cgtcgtgcgg cagcactggt tagcgtggca cgttgggcat attttagcgc actgcatcgt 1500

aaagaaaccc gtagcgaaca tatccgtatt gattacccgg aaacggatcc gaatcaactg 1560

tattatcagg caaccggtgg cctggaacgt ctgtgggtgc gtcgtgattg ggttaaagat 1620

gcaagcgcca cccctccggt gctgaccacc tga 1653

<210> 51

<211> 249

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 51

Met Ala Gly Lys Leu Asp Gly Lys Val Ala Ile Ile Thr Gly Ala Ser

1 5 10 15

Ser Gly Ile Gly Glu Ala Thr Ala Phe Ala Leu Ala Ala Glu Gly Ala

20 25 30

Lys Val Ala Ile Ala Ala Arg Arg Ala Glu Leu Leu His Ala Leu Ala

35 40 45

Lys Arg Ile Glu Ala Ser Gly Gly Gln Ala Leu Pro Ile Val Thr Asp

50 55 60

Ile Thr Asp Glu Ser Gln Val Asn His Leu Val Gln Lys Thr Lys Val

65 70 75 80

Glu Leu Gly His Val Asp Ile Leu Val Asn Asn Ala Gly Ile Gly Val

85 90 95

Phe Gly Ala Ile Asp Thr Gly Asn Pro Ala Asp Trp Arg Arg Ala Phe

100 105 110

Asp Val Asn Val Leu Gly Val Leu Tyr Ala Ile His Ala Val Leu Pro

115 120 125

Leu Leu Lys Ala Gln Lys Ser Gly His Ile Val Asn Ile Ser Ser Val

130 135 140

Asp Gly Arg Ile Ala Gln Ser Gly Ala Val Val Tyr Ser Ala Ala Lys

145 150 155 160

Ser Gly Val Asn Ala Leu Ser Glu Ala Leu Arg Gln Glu Val Ser Leu

165 170 175

Asp Asn Ile Arg Val Thr Ile Ile Glu Pro Gly Leu Val Asp Thr Pro

180 185 190

Phe Asn Asp Leu Ile Ser Asp Pro Ile Thr Lys Gln Leu Ser Lys Glu

195 200 205

Gln Leu Ser Thr Ile Thr Pro Leu Gln Ser Glu Asp Ile Ala Arg Ala

210 215 220

Ile Ile Tyr Ala Val Thr Gln Pro Asp His Val Asn Val Asn Glu Ile

225 230 235 240

Leu Ile Arg Pro Thr Ala Glu Asp Asn

245

<210> 52

<211> 750

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 52

atggcaggta aattggatgg aaaagtggcg attattactg gagcttcctc tgggattgga 60

gaggctacag catttgcttt agctgcggag ggggcaaaag ttgcgatcgc cgcaagacgt 120

gctgagcttt tgcatgcact agcaaaacgg attgaagcca gtggtggtca agcattgcct 180

attgttacag atattacaga cgaatctcaa gtaaatcatc tagtccaaaa gaccaaggtt 240

gagctaggac atgtagatat tttggtgaat aatgcaggaa ttggtgtgtt tggtgcaatt 300

gatactggaa atcccgcaga ctggaggcga gcattcgatg tgaatgttct gggagtttta 360

tatgctatcc acgcagtttt gcctcttctg aaggcccaaa aatccggtca tatagtcaat 420

atatcttctg tcgatggcag gatagcgcag tccggtgcgg tcgtttatag tgctgccaaa 480

tcaggcgtca atgctctttc agaagcatta cgccaggagg tatctttaga caacattcgc 540

gttaccatca ttgagccagg tttagtcgat acgccattta atgacttaat ttctgacccg 600

atcacgaaac agcttagtaa agaacaactt agtacaataa cacctttaca aagtgaggat 660

attgcaagag ctataattta tgcagtgaca caacccgatc atgtaaatgt aaatgaaatt 720

ttgattcgac cgactgcaga agataattaa 750

<210> 53

<211> 750

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 53

atggcaggta aactggatgg taaggttgca attattaccg gtgcaagcag cggtattggt 60

gaagccaccg catttgcact ggcagcagaa ggtgcaaaag ttgcaattgc agcccgtcgt 120

gcagaactgt tacatgcact ggccaaacgt attgaagcaa gcggtggtca ggcactgccg 180

attgttaccg atatcaccga tgaaagccag gttaatcatc tggttcagaa aaccaaagtt 240

gaactgggtc atgttgatat cctggtgaat aatgcaggta ttggcgtttt tggtgcaatc 300

gataccggta atccggcaga ttggcgtcgt gcatttgatg ttaatgtgct gggtgttctg 360

tatgcaattc atgcagttct gcctttactg aaagcacaga aaagcggtca tattgtgaat 420

attagcagcg tggatggtcg tattgcacag agcggtgcag ttgtttatag cgcagcaaaa 480

agcggtgtta atgccctgag cgaagcactg cgtcaagaag tgagcctgga taatattcgt 540

gtgaccatta ttgaaccggg tctggtagat accccgttta atgatctgat tagtgatccg 600

attaccaaac agctgagcaa agaacagctg tcaaccatta ctccgctgca gagcgaagat 660

attgcacgtg ccattatcta tgcagttacc cagccggatc atgttaacgt taatgaaatt 720

ctgattcgtc cgaccgcaga ggataattga 750

<210> 54

<211> 334

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 54

Met Thr Thr Thr Asp Pro Ile Leu Ile Asn Asn Trp His Val Val Ala

1 5 10 15

Asn Val Glu Asp Cys Lys Pro Gly Ser Ile Thr Arg Ser Arg Leu Leu

20 25 30

Gly Val Lys Leu Val Leu Trp Arg Ser Tyr Glu Gln Asn Ser Pro Ile

35 40 45

Gln Val Trp Leu Asp Tyr Cys Pro His Arg Gly Val Pro Leu Ser Met

50 55 60

Gly Glu Ile Thr Asn Asn Thr Leu Val Cys Pro Tyr His Gly Trp Arg

65 70 75 80

Tyr Asn Glu Ala Gly Lys Cys Ile Gln Ile Pro Ala His Pro Gly Met

85 90 95

Val Pro Pro Ala Ser Ala Glu Ala Arg Thr Tyr His Ser Gln Glu Arg

100 105 110

Tyr Gly Leu Val Trp Val Cys Leu Gly Asp Pro Val Asn Asp Ile Pro

115 120 125

Ser Phe Pro Glu Trp Asp Asp Pro Asn Tyr His Lys Thr Tyr Thr Lys

130 135 140

Ser Tyr Leu Ile Lys Ala Ser Ala Phe Arg Val Met Asp Asn Ser Leu

145 150 155 160

Asp Val Ser His Phe Pro Phe Ile His Asp Gly Trp Leu Gly Asp Arg

165 170 175

Asn Tyr Thr Lys Val Glu Glu Phe Glu Val Lys Leu Asp Lys Asp Gly

180 185 190

Leu Thr Met Gly Lys Tyr Gln Phe Gln Thr Ser Arg Ile Val Ser His

195 200 205

Ile Glu Asp Asp Ser Trp Val Asn Trp Phe Arg Leu Ser His Pro Leu

210 215 220

Cys Gln Tyr Cys Val Ser Glu Ser Pro Glu Met Arg Ile Val Asp Leu

225 230 235 240

Met Thr Ile Thr Pro Ile Asp Glu Glu Asn Ser Val Leu Arg Met Leu

245 250 255

Ile Met Trp Asn Gly Tyr Glu Thr Leu Glu Ser Lys Met Leu Thr Glu

260 265 270

Tyr Asp Glu Thr Ile Glu Gln Asp Ile Arg Ile Leu His Ala Gln Gln

275 280 285

Pro Val Arg Leu Pro Leu Leu Thr Pro Lys Gln Ile Asn Thr Gln Leu

290 295 300

Phe Ser His Glu Ile His Val Pro Ser Asp Arg Cys Thr Leu Ala Tyr

305 310 315 320

Arg Arg Trp Leu Lys Gln Leu Gly Val Thr Tyr Gly Val Cys

325 330

<210> 55

<211> 1005

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 55

atgacaacta ccgacccaat cttaatcaat aactggcacg tagtcgccaa tgtagaagac 60

tgtaaacctg gaagtatcac cagatctcgt ttgttgggag tgaagttggt attatggcgc 120

agttatgaac aaaattcacc catacaggta tggcttgact actgccccca ccgaggtgtt 180

cctctgtcta tgggagaaat tacgaataat actttagttt gtccgtatca cggatggaga 240

tacaatgagg ctggtaaatg catacagatc ccagctcacc ctggcatggt accaccggca 300

agtgctgaag ccaggacata tcactcccag gagcgctatg gcttagtgtg ggtgtgcttg 360

ggcgatcctg ttaatgatat accttcattt cctgaatggg atgatccgaa ttatcacaag 420

acttatacca agtcttactt gattaaagct agtgcgtttc gtgtgatgga taattcctta 480

gacgtgtctc attttccttt tatccatgac ggttggttag gtgatcgcaa ttatacaaaa 540

gtggaagaat ttgaggtgaa attagataaa gatggcctta ctatgggtaa gtatcaattc 600

cagacatcaa ggattgtcag ccatatcgaa gatgactctt gggttaattg gttcaggctt 660

agtcatcctt tatgtcaata ctgcgtttca gaatcccctg aaatgaggat tgtggattta 720

atgacgatca caccgattga tgaggaaaat agtgtattgc gtatgttgat aatgtggaac 780

gggtatgaaa cgttagagtc aaagatgcta actgaatatg acgaaacaat agaacaagat 840

attcggatct tacatgcaca acagccggta cgtttaccac tgttaactcc aaagcagata 900

aatacacaat tgttttcaca cgaaatccac gtaccatcag atagatgcac acttgcctat 960

cgtcgatggc taaagcaact aggtgttact tatggggttt gttaa 1005

<210> 56

<211> 1005

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 56

atgacaacca ccgatccgat cctgattaat aactggcatg ttgtggcaaa tgtcgaggat 60

tgtaaaccgg gtagcattac ccgtagccgt ttactgggtg ttaaactggt tctgtggcgt 120

agctatgaac agaatagccc gattcaggtt tggctggatt attgtccgca tcgtggtgtt 180

ccgctgagca tgggtgaaat taccaataat accctggttt gtccgtatca tggctggcgt 240

tataatgaag caggtaaatg tattcagatt ccggcacatc cgggtatggt tccgcctgca 300

agcgcagaag cacgtaccta tcatagccaa gaacgttatg gtctggtttg ggtttgtctg 360

ggtgatccgg ttaatgatat tccgtcattt ccggaatggg atgatccgaa ttatcacaaa 420

acctacacca aaagctatct gattaaagca agcgcctttc gcgttatgga taattcactg 480

gatgttagcc attttccgtt tattcatgat ggctggctgg gcgatcgtaa ctataccaaa 540

gtggaagaat ttgaagtgaa actggataaa gatggtctga cgatgggcaa atatcagttt 600

cagaccagcc gtattgtgag ccatattgaa gatgatagct gggtgaattg gtttcgtctg 660

agccatccgc tgtgtcagta ttgtgttagc gaaagtccgg aaatgcgtat tgttgatctg 720

atgaccatta cgccgattga tgaagaaaat agcgttctgc gcatgctgat catgtggaat 780

ggttatgaaa ccctggaaag caaaatgctg acagagtatg atgaaacgat cgaacaggat 840

attcgtattc tgcatgccca gcagccggtg cgtctgccgc tgctgacacc gaagcagatt 900

aatacccagc tgtttagcca tgaaattcat gttccgagcg atcgttgtac cctggcatat 960

cgtcgttggc tgaaacaact gggtgtgacc tatggtgttt gttga 1005

<210> 57

<211> 241

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 57

Met Leu Thr Ala Glu Gln Lys Gln Ala Tyr Thr Asn Asp Gly Tyr Phe

1 5 10 15

Thr Val Glu Glu Ala Val Pro Lys Ala Leu Ile Glu Glu Ile Arg His

20 25 30

Glu Val Glu Leu Ile Thr Glu Gln Lys Arg Gly Gly Val Leu Ala Gly

35 40 45

Asp Tyr Glu Trp Trp Ser Glu His Thr Ile Pro Asp Pro Val Arg Tyr

50 55 60

Gln Lys Ile Ile Gln Arg Leu Leu Glu Leu Pro Thr Val Met Gly Pro

65 70 75 80

Val Gln Ala Leu Ile Gly Ser Asp Ile Phe Leu Leu Ile Thr Asp Leu

85 90 95

Ala Ile Ile Arg Ala Gly Thr Gly Tyr Ile Ala Trp His Gln Asp His

100 105 110

Gly Tyr Val Val Glu Val Leu Asn Ala Leu Ala Ser Met Ser Lys Asn

115 120 125

Glu Leu Asn Asp Asp Ala Leu Arg Leu Leu Val Pro Val Ala Asn Gln

130 135 140

Ala Met Val Phe Ile Thr Ile Tyr Leu Gln Asp Thr Asp Asn Thr Met

145 150 155 160

Gly Thr Met Arg Val Ile Pro Ser Ser His Gln Trp Glu His Ser Leu

165 170 175

Asp Ser Ser Ser Ala Asn Ser Leu Asn Ala Glu Ile Cys Leu Ser Leu

180 185 190

Pro Gly Gly Ala Ala Met Phe Tyr Thr Pro Thr Val Trp His Thr Ala

195 200 205

Ala Ala Asn Thr Ser Ile Thr Asp Tyr Arg Met Leu Thr Leu Ile Phe

210 215 220

Thr Lys Asn Asn Ile Lys Pro Leu Leu Val Asp Ala Leu Lys Arg Ile

225 230 235 240

Ile

<210> 58

<211> 726

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 58

atgctcacag cggaacaaaa acaagcttac acaaatgatg gttatttcac agttgaagaa 60

gctgtaccaa aagcgttaat tgaagaaata cggcatgaag tagaacttat taccgaacaa 120

aaacgtgggg gagtattggc gggtgactat gagtggtggt ctgagcatac tatcccagat 180

ccagttaggt atcaaaagat aattcagagg cttttagagc ttccaactgt gatgggacca 240

gtacaggctc taattgggtc tgatatcttc ctattgatca ccgatctagc cataattcgt 300

gcaggtacag gatacattgc ttggcatcaa gaccatggat atgtagttga agtattgaac 360

gcacttgcat ccatgtcaaa aaacgagtta aatgacgacg cgcttcggtt gttggttcca 420

gtagccaatc aagccatggt attcataact atatacttac aggatacaga taatactatg 480

ggtacaatgc gagttatacc aagtagccac caatgggaac actcattaga ttcatcttct 540

gccaattcac taaatgcaga aatatgtctt tcacttccag gaggggcagc aatgttttat 600

acaccaactg tatggcatac cgcagctgcc aacacttcaa ttaccgatta caggatgcta 660

actctgattt ttacaaaaaa caacatcaaa ccactgttgg tggatgcctt gaaaaggata 720

atttag 726

<210> 59

<211> 726

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 59

atgctgaccg cagaacagaa acaggcatat accaatgatg gctattttac cgtggaagaa 60

gcagttccga aagcactgat tgaagaaatt cgccatgaag tggaactgat caccgagcag 120

aaacgtggtg gtgtgctggc aggcgattat gaatggtggt cagaacacac cattccggat 180

ccggttcgtt atcagaaaat tatccagcgt ctgctggaac tgccgaccgt tatgggtccg 240

gttcaggccc tgattggtag cgatattttt ctgttaatta ccgacctggc aattattcgt 300

gcaggcaccg gttatattgc atggcatcag gatcatggct atgttgttga agttctgaac 360

gccctggcaa gcatgagcaa aaatgagctg aatgatgatg cactgcgcct gctggtgccg 420

gttgcaaatc aggcaatggt gtttattacc atctatctgc aggataccga taacaccatg 480

ggcaccatgc gtgtgattcc gagcagccat cagtgggaac atagtctgga tagcagcagc 540

gccaattcac tgaatgcaga aatttgtctg agcctgcctg gtggtgcagc aatgttttat 600

accccgaccg tttggcatac cgcagcagca aataccagca ttaccgatta tcgtatgctg 660

acgctgatct tcaccaaaaa caacattaaa ccgctgctgg ttgatgccct gaaacgtatt 720

atttga 726

<210> 60

<211> 191

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 60

Met Ile Asn Ile Glu Gln Phe Arg Gln Glu Ile Glu Asp Trp Ile Ile

1 5 10 15

Asn Val Val Ser Ile Pro Asn Pro Leu Thr Gly Asn Phe Pro Pro Cys

20 25 30

Pro Tyr Ala Lys Ala Ala Trp Leu Asn Asn Arg Val Ser Val Arg Trp

35 40 45

Phe His Gly Pro Glu Leu Pro Glu Leu Leu Met Glu Gln Ile Arg Thr

50 55 60

Trp Asn Asn Asp Phe Glu Met Val Ile Phe Gly Cys Asp Pro Gln Asn

65 70 75 80

Leu Asp Ala Gln Arg Leu Glu Arg Tyr Ile Thr Lys Ala Asn Tyr Val

85 90 95

Leu Pro Glu Tyr Asp Leu Val Ala Leu Gly Ser His Pro Asp Lys Gln

100 105 110

Tyr Val Gly Asp Asp Ala Glu Asn Val Asn Asn Val Ile Ile Thr His

115 120 125

Pro Lys Tyr Val Leu Ala Ser Val Gln Ser Phe Ser Gln Leu Gln Glu

130 135 140

Ala Ser Asp Glu Leu Leu Arg Leu Gly Tyr Phe Gln Tyr Trp Ser Ala

145 150 155 160

Glu Lys Leu Ala Glu Met Lys Ser Glu Arg Ala Ser His Asn Leu Ser

165 170 175

Ser Ile Gln Arg Lys Asn Ser Tyr Arg Ile Ile Pro Thr Asn His

180 185 190

<210> 61

<211> 576

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 61

atgataaata tcgaacaatt tcgccaagaa atagaggatt ggattatcaa tgttgtcagc 60

attcccaatc ctctaacagg aaattttcca ccctgtcctt acgcgaaggc agcttggtta 120

aataaccgtg ttagtgttcg ttggtttcat ggacctgaac tgccagagct tctaatggaa 180

cagataagaa catggaataa tgactttgaa atggtgattt ttggctgcga ccctcaaaac 240

ctagatgcac agaggttgga aaggtacatt accaaggcga attatgtatt accagaatac 300

gatttggtag ctttaggatc gcatccagac aaacaatatg ttggtgatga cgcggagaat 360

gtgaataacg taatcataac tcaccctaag tatgttttag catcagtaca gtcattcagc 420

cagttacaag aggctagtga tgaattatta agattgggat attttcagta ttggtctgca 480

gaaaaattgg ctgaaatgaa gtcggagcga gcttctcaca acctttcttc tatccagaga 540

aagaacagct ataggataat tcctactaac cattga 576

<210> 62

<211> 576

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 62

atgatcaaca tcgaacagtt tcgccaagaa atcgaagatt ggattattaa cgttgtcagc 60

attccgaacc cgctgaccgg taattttcct ccgtgtccgt atgcaaaagc agcatggctg 120

aataatcgtg ttagcgtgcg ttggtttcat ggtccggaac tgcctgaact gctgatggaa 180

caaattcgta catggaacaa cgatttcgag atggtgattt ttggttgcga tcctcagaat 240

ctggatgcac agcgtctgga acgttatatc accaaagcaa attatgtgct gcccgaatat 300

gacctggttg cactgggtag ccatccggat aaacagtatg ttggtgatga tgccgaaaat 360

gtgaacaacg tgattattac ccatccgaaa tatgttctgg caagcgttca gagctttagc 420

cagctgcaag aggcaagtga tgagctgctg cgtctgggtt atttccagta ttggtcagca 480

gaaaaactgg ccgaaatgaa aagcgaacgt gcaagccata atctgagcag cattcagcgt 540

aaaaatagct atcgtattat cccgaccaac cattga 576

<210> 63

<211> 258

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 63

Met Thr Ile Gln Ile Val Gln His Asn Leu Glu Tyr Ser Phe Val Thr

1 5 10 15

Pro Lys Glu Thr Ser Asp Phe Val Glu Arg Thr Met Ser Val Phe Asp

20 25 30

Gln Ala Tyr Pro Lys Phe Leu Ile His Asp Val Trp Ala Asp Pro Ala

35 40 45

Ser Leu Ala Leu Phe Glu Ile Tyr Pro Glu Phe Gln Phe Gly Leu Val

50 55 60

Glu Ala Thr Thr Gln Leu Met Ile Ala Gln Gly Asn Cys Ile Pro Leu

65 70 75 80

Thr Tyr Glu Ser Arg Phe Asp Glu Leu Pro Asp Glu Gly Cys Asp Trp

85 90 95

Ala Leu Ala Lys Trp Leu Glu Asp Arg Glu Gln Asn Arg Leu Pro Asn

100 105 110

Ala Leu Cys Val Val Ser Ile Ser Ile Leu Pro Glu Tyr Gln Gly Lys

115 120 125

Asn Leu Ser Gln Tyr Leu Ile Gly Tyr Met Lys Glu Leu Ala Gln Tyr

130 135 140

His Gly Leu Asn Ser Leu Ile Met Ala Ala Arg Pro Ser Leu Lys Tyr

145 150 155 160

Leu Tyr Pro Leu Ile Pro Ile Glu Arg Tyr Ile Thr Trp Arg Asp Lys

165 170 175

Asn Gly Leu Ile Phe Asp Pro Trp Leu Arg Val Asn Val Lys His Gly

180 185 190

Ala Lys Ile Ala Gly Ile Cys Phe Lys Ser Thr Thr Ile Asn Asp Thr

195 200 205

Ile Asp Gly Trp Glu Asp Arg Val Gly Met Arg Phe Pro Glu Thr Gly

210 215 220

Asp Tyr Ile Ile Pro Lys Gly Leu Val Pro Val Lys Ile Asp Tyr Pro

225 230 235 240

Asn Asn Met Gly Ile Tyr Ile Glu Pro Asn Ile Trp Leu Tyr Tyr Asp

245 250 255

Leu Asp

<210> 64

<211> 777

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 64

atgaccattc aaattgtaca gcataattta gagtatagct ttgtaacccc aaaagaaact 60

tctgattttg tggaaaggac gatgagtgtc tttgatcaag catacccaaa atttttgata 120

catgatgtct gggcagatcc agcttcctta gctctatttg aaatttatcc agaattccag 180

tttgggttag tagaagctac cacacagctt atgatagcgc aaggaaactg tatcccttta 240

acttatgaaa gccgttttga tgagttaccg gacgaaggtt gtgactgggc tttagccaag 300

tggcttgaag accgagaaca gaaccgcctg cctaatgcgt tatgtgtagt atcgatttca 360

atcctaccag agtatcaagg caaaaacttg agtcagtatc tgattggata catgaaagaa 420

cttgctcaat accacggtct taattctttg atcatggctg cacgtccaag cctaaaatat 480

ctttacccac ttatacccat agagcggtat attacctggc gagataaaaa tggtcttata 540

tttgaccctt ggttacgagt taatgtcaaa catggggcta aaattgcagg gatctgtttt 600

aaatccacaa caattaatga tactattgac ggttgggaag atagagttgg gatgcgtttt 660

ccagaaactg gtgactatat tattcccaaa ggcttagtac ctgtcaaaat tgactatccc 720

aacaatatgg gaatatacat cgagcctaat atatggttat actatgacct agattaa 777

<210> 65

<211> 777

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 65

atgaccatcc agattgtgca gcataacctg gaatatagct ttgtgacccc gaaagaaacc 60

agcgattttg ttgaacgtac catgagcgtt tttgatcagg catatccgaa atttctgatc 120

catgatgttt gggcagatcc ggcaagcctg gccctgtttg aaatttatcc ggaatttcag 180

tttggtctgg tggaagcaac cacccagctg atgattgcac agggtaattg tattccgctg 240

acctatgaaa gccgttttga tgaactgccg gatgaaggtt gtgattgggc actggcaaaa 300

tggctggaag atcgcgaaca gaatcgtctg ccgaatgccc tgtgtgttgt gagcattagc 360

atcctgccgg aatatcaggg taaaaatctg agccagtatc tgatcggcta tatgaaagaa 420

ctggcacagt atcatggtct gaatagcctg attatggcag cacgtccgag cctgaaatat 480

ctgtatccgc tgattccgat tgaacgctat attacctggc gtgataaaaa cggcctgatt 540

tttgatccgt ggctgcgtgt taatgttaaa catggcgcaa aaattgccgg tatctgcttt 600

aaaagcacca ccattaatga taccattgat ggttgggagg atcgtgttgg tatgcgtttt 660

ccggaaaccg gtgattatat cattccgaaa ggtctggttc cggtgaaaat tgattatccg 720

aataacatgg gcatctacat cgaaccgaat atctggctgt attatgatct ggactga 777

<210> 66

<211> 258

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 66

Met Val Ile Lys Asn Leu Cys Pro Asp Gly Val Thr Pro Ile Trp Asn

1 5 10 15

Lys Ser Gln Met Glu Ser Ser Leu Leu Glu Glu Cys Leu Pro Ala Trp

20 25 30

Val Arg Thr Ser Tyr Ser Thr Phe Val Glu Thr Ile Ser Asp Ser Ala

35 40 45

Phe Pro Cys Phe Trp Gly Thr Ile Gly Glu Gln Lys Gly Met Ile Arg

50 55 60

Tyr Leu Ile Val Ser Ser Leu Thr Asp Pro Ile Leu Val Glu His Thr

65 70 75 80

Leu Glu Gly Ile Tyr Lys Tyr Ile Asp Glu Val Asn Glu Asn Glu Leu

85 90 95

Leu Gln His Glu Asn Ala Asp Leu Leu Thr Leu Val Ile Phe Phe Pro

100 105 110

Pro Glu Pro Thr Val Leu Thr Val Glu Glu Tyr Ala Gly Gln Ala Phe

115 120 125

Asp Phe Leu Asn Ala Leu His Ser Leu Asp Ala Val Ser Cys Pro Cys

130 135 140

His Trp Ser Ala Asp Pro Gln Ser Ala Asn Trp Ser Tyr Ser Leu Gly

145 150 155 160

Gly Cys Ala Leu Phe Val Ser Val Ser Thr Pro Ala Asn Gln Lys Arg

165 170 175

Arg Ser Arg His Leu Gly Ser Gly Met Thr Phe Val Ile Thr Pro Val

180 185 190

Glu Val Leu Leu Asn Lys His Gly Gly Glu Asn Ser Ser Ile Phe Arg

195 200 205

Arg Val Arg Gln Tyr Asp Gly Ile Pro Pro His Pro Asn Leu Leu Ile

210 215 220

Met Pro Gly Asn Gly Lys Val Gly Asn Glu Leu Thr Val Gln Val Leu

225 230 235 240

Pro Asp Asn Asn Asp Ser Glu Ile Ser Phe Asp Phe Gln Tyr Lys Phe

245 250 255

Lys Asp

<210> 67

<211> 777

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 67

atggtaatca agaatttatg tcctgacgga gttacaccaa tctggaacaa aagccagatg 60

gaatcctctc ttctagagga gtgccttcct gcttgggtac gcactagcta ctcaacattt 120

gttgaaacaa tcagcgattc tgccttccct tgcttctggg gaactatcgg ggaacagaag 180

ggaatgatta gatacctgat agtctcatct ttaactgacc cgatcttggt tgagcatacg 240

cttgagggta tctacaaata cattgatgaa gttaatgaaa acgaattgct tcagcacgaa 300

aatgcggatc ttctgacact tgtcatcttt ttcccacctg aaccaacagt tcttacagta 360

gaggaatatg caggtcaagc atttgatttt ttgaatgcgt tacatagcct tgatgcggtg 420

tcttgtccct gccattggtc tgccgatccg cagtctgcta actggtctta ttctctagga 480

gggtgtgcct tatttgttag tgtttccact ccagcaaatc aaaagcggcg atcgcgccac 540

cttgggtcag gaatgacttt tgtcatcaca ccagttgaag tcctcttgaa taaacatggt 600

ggcgagaatt cgagcatttt tcgccgcgtc cgagagtacg acggcattcc acctcaccct 660

aacttattaa ttatgcctgg gaatgggaaa gtcggtaatg aattgacagt gcaagtactt 720

ccagataata acgatagtga gatctcattt gacttccagt ataaatttaa ggattag 777

<210> 68

<211> 777

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 68

atggtgatta aaaacctgtg tccggatggt gttaccccga tttggaataa aagccagatg 60

gaaagcagcc tgctggaaga atgtctgcct gcatgggttc gtaccagcta tagcaccttt 120

gttgaaacca ttagcgatag cgcatttccg tgtttttggg gcaccattgg tgaacagaaa 180

ggtatgattc gttatctgat tgttagcagc ctgaccgatc cgattctggt tgaacatacc 240

ctggaaggta tctacaaata tatcgatgaa gtgaacgaaa acgaactgct gcagcatgaa 300

aatgcagatc tgctgaccct ggttatcttt tttccgcctg aaccgaccgt tctgaccgtt 360

gaagaatatg caggtcaggc atttgatttt ctgaatgcac tgcatagcct ggatgcagtt 420

agctgtccgt gtcattggag cgcagatccg cagagcgcaa attggagcta tagcctgggt 480

ggttgtgcac tgtttgttag cgttagcaca ccggcaaatc agaaacgtcg tagccgtcat 540

ctgggtagcg gtatgacctt tgttattaca ccggttgaag tgctgctgaa taaacatggt 600

ggtgaaaaca gcagcatttt tcgtcgtgtt cgtgaatatg atggtattcc gcctcatccg 660

aatctgctga ttatgcctgg taatggtaaa gtgggtaatg aactgaccgt gcaggttctg 720

ccggataata atgatagcga aatcagcttc gattttcagt ataaattcaa agattga 777

<210> 69

<211> 408

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 69

Met Lys Arg Leu Thr Leu Leu Ile Ile Ala Gly Ile Leu Ser Val Ser

1 5 10 15

Thr Phe Leu Cys Ile Thr Pro Val Ala Leu Ala Asn Ile Thr Asp Tyr

20 25 30

Tyr Leu Lys Asn Glu Lys Leu Ser Gly Gln Phe Ser Val Pro Val Asn

35 40 45

Leu Ser Val Gly Val Arg Phe Ala His Arg Ser Ser Tyr Ala Thr Ala

50 55 60

Ile Asn Phe Pro Thr Gly Leu Asp Ala Asp Ser Val Ala Val Gly Asp

65 70 75 80

Phe Asn Ser Asp Ser Lys Leu Asp Leu Ala Val Thr Asn Trp Phe Asp

85 90 95

Asn Asn Val Ser Val Leu Leu Gly Asn Gly Asn Gly Ser Phe Gly Ala

100 105 110

Ala Thr Asn Phe Pro Val Gly Thr Asn Pro Val Phe Val Val Thr Gly

115 120 125

Asp Val Asn Gly Asp Ser Lys Leu Asp Leu Ala Val Ala Asn Phe Ser

130 135 140

Ser Asn Asn Val Ser Val Leu Leu Gly Asn Gly Asn Gly Ser Phe Gly

145 150 155 160

Ala Ala Thr Asn Phe Ser Val Gly Thr Asn Pro Tyr Ser Val Ala Ile

165 170 175

Gly Asp Val Asn Asn Asp Ser Glu Leu Asp Leu Ala Phe Thr Asn Trp

180 185 190

Phe Asp Asn Lys Val Leu Val Leu Leu Gly Asn Gly Asn Gly Ser Phe

195 200 205

Gly Ala Ala Ser Ser Phe Pro Val Asp Thr Tyr Ser Ile Ser Val Ala

210 215 220

Ile Ala Asp Phe Asn Ser Asp Ser Lys Leu Asp Leu Ala Ile Thr Asn

225 230 235 240

Trp Val Ser Asn Asn Val Ser Val Leu Leu Gly Asn Gly Asn Gly Ser

245 250 255

Phe Gly Ala Ala Thr Asn Phe Pro Val Gly Thr Asn Pro Ile Phe Val

260 265 270

Ala Thr Gly Asp Val Asn Gly Asp Ser Lys Leu Asp Leu Ala Val Ala

275 280 285

Asn Thr Ser Ser Asn Asn Val Ser Val Leu Leu Gly Asn Gly Asn Gly

290 295 300

Ser Phe Gly Ala Ala Thr Asn Phe Pro Ala Gly Thr Asn Pro Tyr Ser

305 310 315 320

Val Ala Ile Arg Asp Val Asn Gly Asp Ser Lys Leu Asp Leu Ala Val

325 330 335

Thr Asn Tyr Ser Ser Asn Asn Val Ser Val Leu Pro Gly Asn Gly Asn

340 345 350

Gly Ser Phe Gly Ile Ala Thr Asn Phe Pro Val Gly Thr Asn Pro Glu

355 360 365

Ser Ile Ala Ile Ala Asp Phe Asn Gly Asp Ser Lys Leu Asp Leu Ala

370 375 380

Val Thr Asn Ser Gly Asn Asn Asn Val Ser Ile Leu Leu Asn Asn Phe

385 390 395 400

Gln Gly Leu Pro Lys Asn Lys Ile

405

<210> 70

<211> 1227

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 70

gtgaaaaggc tcactttact aattatagcg gggatattat ctgttagtac atttttatgt 60

ataactcctg ttgcattagc aaatataact gactattatc tgaagaatga aaagctttct 120

gggcaattta gtgttccggt taatttgtcc gtaggagtga gatttgccca caggagtagt 180

tatgctactg ctattaactt cccaactggt cttgatgctg actctgtagc agttggggat 240

ttcaatagcg atagtaagct cgacctggct gttacaaatt ggttcgacaa taacgtctcg 300

gtcttactgg gaaatggtaa tgggtctttt ggcgcagcca ctaactttcc agtcggtact 360

aatcccgtct ttgtagtgac tggggatgta aatggcgaca gcaagcttga cctggctgtt 420

gcaaatttta gtagcaataa cgtctcggtc ttactaggaa atggtaatgg gtcttttggc 480

gcagccacta acttttcagt tggtactaac ccttattctg tagccattgg agatgtgaat 540

aacgatagtg agcttgacct tgcttttaca aattggttcg acaataaggt cttggtttta 600

ctgggaaatg gtaatgggtc ttttggcgca gccagcagct tccctgtcga tacttattcg 660

atttccgtag cgattgcgga ttttaatagc gacagtaagc tcgaccttgc tattacaaat 720

tgggtcagca ataacgtctc ggtcttactg ggaaatggta atgggtcttt tggcgcagcc 780

actaactttc cagtcggtac taatcccata tttgtagcaa ctggggatgt aaatggcgac 840

agcaagcttg acctggctgt tgcaaatact agcagcaata acgtctcggt cttactggga 900

aatggtaatg ggtcttttgg cgcagccact aactttccag ccggtactaa tccctactct 960

gtagcgatta gagatgtgaa tggcgacagt aaacttgacc tggctgttac aaattatagt 1020

agcaataacg tctcggtctt accaggaaat ggtaatgggt cttttggcat agctactaac 1080

tttccagtcg gtactaatcc tgaatctata gcaattgcgg atttcaacgg cgacagcaag 1140

cttgacctgg ctgtcacaaa ttctggcaac aacaacgtct cgatcttgtt gaataatttt 1200

cagggacttc caaaaaataa gatatag 1227

<210> 71

<211> 1227

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 71

atgaaacgtc tgacgctgct gatcattgca ggtattctgt cagttagcac ctttctgtgt 60

attacaccgg ttgcactggc caatattacc gattattatc tgaaaaacga gaaactgagc 120

ggtcagttta gcgttccggt gaatctgtct gttggtgttc gttttgcaca tcgtagcagc 180

tatgcaaccg caattaactt tccgaccggt ctggatgcag atagcgttgc agttggtgat 240

tttaacagcg atagcaaact ggatctggcc gttaccaatt ggtttgataa caatgttagc 300

gtgctgctgg gtaatggcaa tggcagcttt ggtgcagcaa ccaattttcc ggttggcacc 360

aatccggttt ttgttgttac cggtgatgtt aatggtgaca gtaaactgga tttagccgtg 420

gcaaatttta gcagcaataa tgtttcagtt ctgctgggaa acggtaatgg ttcttttggc 480

gcagccacaa actttagcgt tggtacaaat ccgtatagcg tggccattgg tgatgtgaat 540

aatgatagtg aactggacct ggcatttacg aactggttcg ataataaagt tctggtgctg 600

ttaggcaatg gtaatggctc gtttggtgcc gcaagctcat ttccggtgga tacctatagc 660

attagcgttg cgattgcaga tttcaactca gattctaaat tagacctggc gatcaccaat 720

tgggtgtcaa ataatgtgag tgtgttactg gggaatggta acggtagttt tggagctgcg 780

acaaattttc ctgtgggtac aaacccgatt tttgtggcaa ccggtgacgt gaatggcgat 840

tctaagctgg acttagcagt tgcaaatacc agctctaata acgttagcgt tctgttaggt 900

aacgggaacg gctcattcgg tgctgccacg aattttccag caggcaccaa cccgtatagt 960

gttgcaattc gcgacgttaa cggtgatagc aaattagatt tagcggtgac caactatagc 1020

agcaacaacg tgagtgttct gccaggcaac ggtaacggat catttggtat tgcgaccaac 1080

tttccagtag gtacgaatcc ggaaagcatt gcaattgccg attttaatgg ggattccaag 1140

ttagatctgg cagtgacaaa tagcggtaac aataatgtaa gcatactgct gaataacttt 1200

cagggtctgc cgaaaaacaa gatttga 1227

<210> 72

<211> 200

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 72

Met Lys Ser Thr Asn Ile His Tyr Thr Lys His Leu Ile Ser Pro Tyr

1 5 10 15

Asp Arg Tyr Leu Lys Asn Gly His Lys Ser Gly Ile Leu Trp Phe Thr

20 25 30

Gly Leu Ser Gly Ala Gly Lys Thr Thr Leu Ala Leu Lys Leu Glu Gln

35 40 45

Thr Leu Phe Glu Lys Gly Trp Ser Thr Phe Val Leu Asp Gly Asp Ser

50 55 60

Val Arg His Gly Leu Cys Ser Asp Leu Gly Phe Ser Ala Ser Asp Arg

65 70 75 80

Ser Glu Asn Ile Arg Arg Leu Gly Glu Val Ala Lys Leu Phe Ala Glu

85 90 95

Ser Gly Cys Leu Val Ile Thr Ala Phe Ile Ser Pro Tyr Arg Asn Asp

100 105 110

Arg Glu Gln Val Arg Arg Leu Ala Gly Asp Leu Phe His Glu Val Tyr

115 120 125

Ile Ala Thr Pro Leu Glu Leu Cys Glu Gln Arg Asp Pro Lys Gly Leu

130 135 140

Tyr Leu Lys Ala Arg Ser Gly Glu Ile Asp Gly Phe Thr Gly Ile Ser

145 150 155 160

Ala Pro Tyr Glu Pro Pro Asn Ser Pro Asp Leu Trp Val Glu Thr Ser

165 170 175

Glu Leu Thr Val Glu Glu Ser Leu Glu Gln Leu Leu Lys Tyr Val Glu

180 185 190

Asn Lys Phe Thr Ile Phe Lys Gln

195 200

<210> 73

<211> 603

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 73

atgaaatcaa ctaatattca ctatacaaaa catcttatat ctccatatga tcgttatcta 60

aagaatggtc ataaaagcgg gattctatgg tttactggac tgtccggggc tggtaaaaca 120

acattggctt taaaattaga gcagactttg ttcgagaaag gatggtctac ctttgtttta 180

gatggtgata gtgttcgtca tggactgtgt tccgatttag gattttctgc tagtgatcgc 240

tcagaaaata tccgtcgttt gggtgaggtt gccaaactct ttgcggagtc aggatgccta 300

gtgatcactg ccttcatctc accctacagg aatgaccgag aacaggtgcg tagactagct 360

ggagatctat ttcatgaagt atacattgca actccactgg aactttgtga gcagcgtgat 420

ccgaaaggtc tttatctaaa agcacgcagt ggggaaatag atggatttac gggaatcagc 480

gccccttatg aaccacccaa tagcccagat ttatgggtgg aaacatccga actcaccgtc 540

gaggaaagcc tagaacaact actcaaatac gtggaaaaca aattcacaat tttcaaacaa 600

tag 603

<210> 74

<211> 221

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 74

Met Lys Ala Val Val Lys Tyr Thr Ile Phe Glu Lys Pro Gln Pro Ile

1 5 10 15

Arg Ala Ile Lys Arg Leu Glu Arg Asp Val Leu Arg Met Gly Ala Leu

20 25 30

Val Glu Gln Ser Phe Arg Leu Ser His Gln Ala Leu Phe Asn Arg Asp

35 40 45

Leu Thr Ala Ala Glu Gln Ile Arg Arg Leu Asp Lys Lys Ile Asp Arg

50 55 60

Phe Tyr Arg Gln Ile Glu Val Asp Cys Ala Thr Ile Met Ser Ser Gln

65 70 75 80

Ala Pro Thr Asp Gln Glu Ser Arg Cys Leu Ser Ser Phe Met Gln Leu

85 90 95

Val Arg Asp Leu Glu Arg Ile Gly Asp Tyr Ala Lys Asp Leu Ala Glu

100 105 110

Ile Ala Met Lys Ile Phe Pro Tyr Pro Pro His Pro Thr Leu Gly Glu

115 120 125

Val Ala Ile Met Ser Asp His Ala Gln Ser Met Leu Ala Thr Ser Leu

130 135 140

Val Ala Leu Ala Asp Leu Asp Glu Ile Ser Gly Arg Arg Ile Lys Leu

145 150 155 160

Leu Asp Asp Thr Val Asp Asp Ala Tyr Lys Lys Leu Tyr Arg Asn Leu

165 170 175

Ala Gln Gln Lys Asp Val Pro Gly Val Val Glu Pro Ile Leu Leu Leu

180 185 190

Thr Leu Ala Ile Gln Cys Leu Glu Arg Met Ala Asp His Ala Thr Asn

195 200 205

Ile Gly Gln Arg Val Ala Tyr Ile Val Thr Gly Gln Arg

210 215 220

<210> 75

<211> 666

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 75

atgaaagctg ttgtgaaata tacaattttt gaaaaacctc aacctatacg tgccattaaa 60

agactggaac gagatgtttt gcgtatgggt gctttagtag agcagtcatt ccgtctgagt 120

caccaagctc tattcaatcg ggatttaaca gcagctgagc aaatacggag attagacaaa 180

aaaattgatc gcttctacag acaaatagaa gtcgattgtg ccacaattat gagcagtcaa 240

gctcccacag accaagaatc tcggtgttta agctcattca tgcaattagt tagagacttg 300

gaacgtattg gggactatgc caaagatttg gcagaaatag caatgaaaat atttccctat 360

cccccccatc ctactttggg ggaggttgcc attatgtccg atcatgccca atctatgttg 420

gctaccagcc tagtagcttt agcggattta gacgagatta gtggtagaag gattaaatta 480

ttagatgata cagtagatga tgcttacaaa aagttatatc gtaatttggc gcagcagaaa 540

gatgttcccg gggtagtgga gcccatttta ctattaacat tagcaattca gtgtttagag 600

agaatggcag atcatgctac taatattggt caaagggtag catacattgt tacagggcaa 660

agatag 666

<210> 76

<211> 450

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 76

Met Phe Leu Leu Gly Phe Leu Leu Gly Leu Ala Val Gly Phe Gly Phe

1 5 10 15

Trp Leu Trp Gln Gln Phe Gln Leu Asn Ser His Leu Glu Gln Leu Thr

20 25 30

Gln Pro Leu Asn Pro His Ala Glu Lys Ile Leu Leu Pro Leu Leu Ala

35 40 45

Gly Leu His Arg Lys Ile Ser Thr Val Arg Asp Glu Gln Gln Asn Leu

50 55 60

Arg Leu Ser Leu Lys Ala Tyr Glu Gln Leu Leu Asp Ala Ala Pro Leu

65 70 75 80

Gly Tyr Leu Gln Val Asp Glu Glu Asn Gln Leu Leu Trp Cys Asn Gln

85 90 95

Cys Ala Arg Glu Met Leu Tyr Leu Gln Arg Trp Gln Pro Gly Gln Val

100 105 110

Arg Leu Leu Leu Glu Leu Val Arg Ser Tyr Glu Leu Asp Gln Leu Ile

115 120 125

Glu Gln Thr Arg Asp Trp Gln Lys Pro Gln Met Gln Glu Trp Ile Phe

130 135 140

His Pro Ser Arg Asp His Gly Gln Gly Ile Leu Gly Leu Lys Pro Leu

145 150 155 160

Ser Leu Ala Ala Asn Ser Phe Pro Leu Pro Gly Gly Gln Val Gly Val

165 170 175

Phe Leu Glu Ser His Gln Gln Phe Val Asp Ile His Gln Gln Arg Asp

180 185 190

Arg Ser Phe Ser Asp Leu Ala His Glu Leu Arg Thr Pro Leu Thr Ser

195 200 205

Ile Arg Leu Val Ala Glu Thr Leu Gln Thr Arg Leu Asp Pro Pro Leu

210 215 220

Asn Arg Trp Val Ile Arg Leu Met Gln Glu Val Asp Arg Leu Ile Asn

225 230 235 240

Leu Val Gln Asn Trp Leu Asp Leu Thr Gln Met Glu Ile Thr Ser Ser

245 250 255

Ile Gln Leu Asn Leu Glu Met Leu Glu Val Arg Ser Leu Ile Phe Ser

260 265 270

Val Trp Glu Asn Leu Glu Pro Leu Ala Ala Asn Gln His Leu Ser Ile

275 280 285

Ser Tyr Ser Gly Pro Glu Lys Val Tyr Ile Cys Ala Asp Lys Ser Arg

290 295 300

Ile Tyr Gln Val Phe Leu Asn Leu Leu Asp Asn Cys Ile Lys Tyr Ser

305 310 315 320

Asn Leu Asn Gly Thr Ile Phe Ile Glu Met Asn Pro Val Cys Gly Glu

325 330 335

Lys Ser Ile Asn Gly Val Asp Pro Glu Ala Asp Thr Ile Leu Asn Gln

340 345 350

Val Ser Asn Gln Ile Leu Glu Ile Asn Ile Ile Asp Ser Gly Val Gly

355 360 365

Phe Ala Pro Met Asp Leu Pro His Val Phe Gln Arg Phe Tyr Arg Gly

370 375 380

Asp Lys Ala Arg His Arg Glu Ser Arg Ser Glu Asn Glu Thr Val Glu

385 390 395 400

Ile Thr Gly Ser Gly Leu Gly Leu Ser Ile Val Arg Gln Ile Ile Ile

405 410 415

Ala His Gly Gly Lys Ile Arg Ala Met Asn His Pro Asp Thr Gly Gly

420 425 430

Ala Trp Ile Gln Ile His Leu Pro Gln Val Val Gln His Asp Gly Gly

435 440 445

Tyr Phe

450

<210> 77

<211> 1353

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 77

atgttcttat tgggatttct tctgggtttg gcagtcggtt ttggtttttg gctttggcaa 60

caatttcaac ttaacagtca tttggagcag ttaacccaac ccttaaaccc tcacgctgaa 120

aagatattat tacccctatt agctggatta catcgtaaaa tatctaccgt tagagatgag 180

caacaaaact tacgcttgtc actcaaagct tatgaacagt tgctggatgc tgcgcctttg 240

ggatatttac aagtagatga agaaaaccaa ctactatggt gtaatcagtg cgcgcgggaa 300

atgctgtatt tacaaagatg gcaaccgggt caagtgcgcc tgctactgga attagtgaga 360

tcctatgagc tggatcagtt aattgagcaa acccgggatt ggcaaaaacc gcaaatgcaa 420

gagtggattt ttcacccttc ccgagatcat ggtcagggta ttttaggatt aaagccattg 480

tctttagcag ctaacagttt tcccctaccg gggggacaag tgggtgtgtt tctagaaagt 540

caccaacaat ttgtagacat tcatcagcaa cgtgaccgct ctttttcaga cctggcccat 600

gaactgagaa cacctctgac ttccattcgt ctggtcgcag aaaccctgca aactcgctta 660

gatccccctc taaaccgttg ggtcatccgc ttgatgcagg aggttgacag actaattaat 720

ttagtccaaa attggttaga cctgacccag atggaaataa cctcctccat acaactgaat 780

ttggaaatgc tagaagtccg ctccctaatt ttttcagtct gggagaattt agagccccta 840

gccgctaatc agcatcttag tatttcttac tccggcccgg aaaaggtcta tatatgtgct 900

gataagtcca gaatttatca agtgtttctt aatctgttag ataactgtat taaatacagc 960

aacctgaacg gtactatttt cattgaaatg aatccagttt gtggggagaa gtctattaat 1020

ggggttgatc cagaagcaga tacaatatta aaccaagtat caaatcagat tttagaaatt 1080

aacattattg attccggggt tggatttgct cccatggatc taccccatgt ctttcaaaga 1140

ttttatcggg gggacaaagc tagacaccgc gagtcccgct ctgagaatga aacagtagaa 1200

attactggta gtggtttagg gttatccatt gtccgccaaa taattatagc tcatggtggc 1260

aaaatcaggg ccatgaacca tcctgatacc ggtggtgctt ggatacaaat tcatcttccc 1320

caggtggttc aacatgatgg cggatatttc tga 1353

<210> 78

<211> 240

<212> PRT

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 78

Val Asn Gln Ser Ile Val Trp Gln Arg Ala Pro Glu Asn Phe Gln Leu

1 5 10 15

Cys Ala Gln Glu Val His Ile Trp Lys Ile Asn Leu Lys Val Ser Pro

20 25 30

Ser Glu Val Glu Leu Cys Arg Arg Ile Leu Ser Gly Asp Glu Ile Ala

35 40 45

Arg Ala Glu Arg Phe Ser Phe Pro Glu His Gln Glu Arg Phe Ile Val

50 55 60

Gly Arg Ala Phe Leu Arg Lys Ile Leu Ser Arg Tyr Leu Asn Val Glu

65 70 75 80

Ala Gln Ala Ile Glu Phe Glu Tyr Glu Glu Arg Gly Lys Pro Leu Leu

85 90 95

Gly Phe Lys Phe Lys Tyr Ser Gly Ile Cys Phe Asn Leu Ser His Ser

100 105 110

Gln Glu Leu Ala Leu Cys Gly Val Thr His Gln Arg Ser Ile Gly Val

115 120 125

Asp Leu Glu Gly Val Arg His Thr Ser Asp Ile Glu Asn Leu Ala Asn

130 135 140

Arg Phe Phe Ser Val Lys Glu Tyr Gly Val Ile Lys Ser Val Pro Pro

145 150 155 160

Glu Gln Gln Gln Gln Val Phe Phe Arg Tyr Trp Thr Cys Lys Glu Ala

165 170 175

Tyr Leu Lys Ala Ile Gly Lys Gly Leu Ser Glu Leu Ser Gln Ile Glu

180 185 190

Ile Glu Leu Thr Pro Asn Lys Ser Ala Arg Leu Arg Val Leu Gly Asp

195 200 205

Trp Gln Leu Lys Glu Leu Val Pro Ala Asp Asn Phe Ala Ala Ala Val

210 215 220

Val Ile Ala Ser His Asn His Leu Asp Arg Phe Glu Phe Trp Glu Pro

225 230 235 240

<210> 79

<211> 723

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 79

gtgaatcagt ctattgtttg gcaacgggca cctgaaaatt tccagttgtg cgctcaggaa 60

gtacatatct ggaagattaa cctgaaagta tcaccatcag aggtggaact ttgtcgcagg 120

attttatctg gtgatgaaat agctcgtgcg gaaagatttt cttttccgga acatcaagag 180

cgttttattg ttggtcgtgc ctttcttaga aaaatactat caagatattt aaacgtagaa 240

gcacaagcaa tagagtttga gtatgaagag agaggaaaac cactgttagg gttcaagttt 300

aagtactctg gaatatgttt taatttatcc cattctcagg aattagcttt atgcggtgtg 360

actcatcaaa gatccattgg agtagatcta gaaggtgttc gtcacacatc agatatagaa 420

aacctagcca accgcttttt ttcagttaaa gaatatgggg taattaaatc agtacccccg 480

gaacaacaac agcaggtatt tttccgttat tggacttgta aagaggccta tttaaaagct 540

attggaaaag gtttgtctga gttatctcaa atagaaatag aattaacgcc aaataaatct 600

gctaggttgc gtgtattggg agattggcag ttaaaagaac tagtaccagc agataatttt 660

gcagcagcag ttgttatagc tagccataat catttagaca ggtttgagtt ttgggaacct 720

taa 723

<210> 80

<211> 723

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 80

atgaatcaat caatcgtgtg gcagcgtgcg ccggaaaact tccaactgtg tgctcaagaa 60

gtgcatatct ggaaaatcaa cctgaaagtg agcccgtctg aagtggaact gtgccgtcgc 120

attctgagtg gcgatgaaat cgcgcgtgcc gaacgctttt ccttcccgga acatcaggaa 180

cgttttattg tgggtcgtgc attcctgcgc aaaatcctga gccgctatct gaacgttgaa 240

gcacaggcta ttgaatttga atacgaagaa cgtggcaaac cgctgctggg tttcaaattc 300

aaatactctg gcatctgctt caatctgagt cattcccagg aactggcgct gtgtggtgtt 360

acccaccaac gttcaattgg cgtcgatctg gaaggtgtgc gccacacgtc ggacatcgaa 420

aacctggcca atcgtttctt tagcgtcaaa gaatacggcg tgattaaaag cgtgccgccg 480

gaacagcaac agcaagtgtt tttccgctat tggacctgta aagaagcgta cctgaaagcc 540

atcggcaaag gtctgtcaga actgtcgcag attgaaatcg aactgacgcc gaacaaatca 600

gcgcgtctgc gcgttctggg tgattggcaa ctgaaagaac tggtcccggc agacaatttt 660

gctgcagcag ttgtcattgc gagtcataat catctggacc gttttgaatt ttgggaaccg 720

tga 723

<210> 81

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 引物

<400> 81

gggctttcat atgttacaaa agattaa 27

<210> 82

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 引物

<400> 82

aaagtatgcg gccgcatgct tgagtat 27

<210> 83

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 引物

<400> 83

ggcatccatg ggcaagattt acggaa 26

<210> 84

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 引物

<400> 84

ggcatctcga gttataaaag cgcttcg 27

<210> 85

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 引物

<400> 85

ggttaagatc tgaaattaat acgactc 27

<210> 86

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 引物

<400> 86

ttttaagatc ttttcagcaa aaaaccc 27

<210> 87

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 引物

<400> 87

atatccatgg gacctggtga tcgcaaagga 30

<210> 88

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 引物

<400> 88

tatctcgaga gtgttgattt cgttggctg 29

<210> 89

<211> 675

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 89

atgaagattt acggaattta tatggaccgc ccgctttcac aggaagaaaa tgaacggttc 60

atgactttca tatcacctga aaaacgggag aaatgccgga gattttatca taaagaagat 120

gctcaccgca ccctgctggg agatgtgctc gttcgctcag tcataagcag gcagtatcag 180

ttggacaaat ccgatatccg ctttagcacg caggaatacg ggaagccgtg catccctgat 240

cttcccgacg ctcatttcaa catttctcac tccggccgct gggtcattgg tgcgtttgat 300

tcacagccga tcggcataga tatcgaaaaa acgaaaccga tcagccttga gatcgccaag 360

cgcttctttt caaaaacaga gtacagcgac cttttagcaa aagacaagga cgagcagaca 420

gactattttt atcatctatg gtcaatgaaa gaaagcttta tcaaacagga aggcaaaggc 480

ttatcgcttc cgcttgattc cttttcagtg cgcctgcatc aggacggaca agtatccatt 540

gagcttccgg acagccattc cccatgctat atcaaaacgt atgaggtcga tcccggctac 600

aaaatggctg tatgcgccgc acaccctgat ttccccgagg atatcacaat ggtctcgtac 660

gaagagcttt tataa 675

<210> 90

<211> 224

<212> PRT

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 90

Met Lys Ile Tyr Gly Ile Tyr Met Asp Arg Pro Leu Ser Gln Glu Glu

1 5 10 15

Asn Glu Arg Phe Met Thr Phe Ile Ser Pro Glu Lys Arg Glu Lys Cys

20 25 30

Arg Arg Phe Tyr His Lys Glu Asp Ala His Arg Thr Leu Leu Gly Asp

35 40 45

Val Leu Val Arg Ser Val Ile Ser Arg Gln Tyr Gln Leu Asp Lys Ser

50 55 60

Asp Ile Arg Phe Ser Thr Gln Glu Tyr Gly Lys Pro Cys Ile Pro Asp

65 70 75 80

Leu Pro Asp Ala His Phe Asn Ile Ser His Ser Gly Arg Trp Val Ile

85 90 95

Gly Ala Phe Asp Ser Gln Pro Ile Gly Ile Asp Ile Glu Lys Thr Lys

100 105 110

Pro Ile Ser Leu Glu Ile Ala Lys Arg Phe Phe Ser Lys Thr Glu Tyr

115 120 125

Ser Asp Leu Leu Ala Lys Asp Lys Asp Glu Gln Thr Asp Tyr Phe Tyr

130 135 140

His Leu Trp Ser Met Lys Glu Ser Phe Ile Lys Gln Glu Gly Lys Gly

145 150 155 160

Leu Ser Leu Pro Leu Asp Ser Phe Ser Val Arg Leu His Gln Asp Gly

165 170 175

Gln Val Ser Ile Glu Leu Pro Asp Ser His Ser Pro Cys Tyr Ile Lys

180 185 190

Thr Tyr Glu Val Asp Pro Gly Tyr Lys Met Ala Val Cys Ala Ala His

195 200 205

Pro Asp Phe Pro Glu Asp Ile Thr Met Val Ser Tyr Glu Glu Leu Leu

210 215 220

<210> 91

<211> 7035

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 整合到大肠杆菌乳糖操纵子后的sxt1片段的序列

<400> 91

gtttcatctg tggtgcaacg ggcgctgggt cggttacggc caggacagtc agtggagatg 60

cccaagggca cttcgggtcg aggaacccga cctgcattgg gacgcggcca cggagagcgc 120

gggcaaacgc cggcactata gccagtggag tttgtaaaac gctatttcag agcttggaga 180

gtgtctaaga aagccgggcg atgccaaccc atcccttctt cggctacgtt cgtaatcaag 240

ccacttcctt tttgcattga cgcagggtgt cggaaggcaa ctcgccgaac gcgctcctat 300

agttttcagc gaagcgtccc aaatgtaaga agccgtagtc tagggctatc tcagttatac 360

tacgcacatt ggcactggga tcgttcaagc aggcgcggat gctttcgagc ttgcggttgc 420

ggatgtagtt cttcggcgtg gtgccggcat gcttctcgaa caaattgtag agcgagcgtg 480

gactcatcat cgccagctcc gctaaccgct caaggctgat attccgtttg agattctcct 540

caatgaattg aacgactcgc tcgaaagacg ggttaccttt gctgaaaatt tcacggctga 600

cattgctgcc cagcatttcg agcagcttgg aagcgatgat ccccgcatag tgctcttgga 660

cccgaggcat cgactttgta tgttccgctt cgtcacaaac taacccgagt agattgataa 720

agccatcgag ttgctggaga ttgtgtcgcg cggcgaaacg gataccctcc ctcggcttgt 780

gccaattgtt gtcactgcat gcccgatcaa ggaccactga gggcaattta acgataaatt 840

tctcgcaatc ttctgaatag gtcaggtcgg cttggtcatc cggattgagc agcaatagtt 900

cgcccggcgc aaaatagtgc tcctggccat ggccacgcca caggcaatgg cctttgagta 960

ttatttgcag atgataacag gtctctaatc caggcgagat taccctcacg ctaccgccgt 1020

agctgattcg acacaggtcg aggcatccga agattctgtg gtgcagcctg cctgccgggg 1080

gcccgccctt gggcaggcga atagagtgcg taccgacata ctggttaaca taatcggaga 1140

ctgcataggg ctcggcgtgg acgaagatct gacttttctc gttcaataag caaaaatcca 1200

tagttcacgg ttctcttatt ttaatgtggg ctgcttggtg tgatgtagaa aggcgccaag 1260

tcgatgaaaa tgcaggaatt aattcgcaga tcctggcgga tgagagaaga ttttcagcct 1320

gatacagatt aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag 1380

tagcgcggtg gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga 1440

tggtagtgtg gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa 1500

aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc 1560

tgagtaggac aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt 1620

ggcgggcagg acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga 1680

cggatggcct ttttgcgtag atcccagcct tgcaagaagc ggatacagga gtgcaaaaaa 1740

tggctatctc tagaaaggcc taccccttag gctttatgca acagaaacaa taataatgga 1800

gtcatgaaca tgctgcagaa aatcaatcgt tatacccatg gttttgttgc cgttccggtt 1860

attctggcat gtcgtgaaaa aggtgttttt gaactgctgg cagatgaaag tccgctgagc 1920

ctgaatcaga tggttgaaca tctgggtgcc aatagcggtc attttcaggt tgcactgcgt 1980

atgctggaaa gtctgcattg gctgagccgt aataaagaac tgaaatatag cctgaccgca 2040

gaagcagcaa ttcataacaa aattagcgaa gatatcctgc agctgtataa tctgccgatt 2100

cagagctatc tggaaggtaa acagggcaat ctgctgggtc gttggattga acgtagctgt 2160

cagctgtgga atctggataa tccgctgatg gcagattttc tggatggtct gctggttatt 2220

ccgctgctgc tggcactgca taaacataac ctgctggccg attctgaaga taaaccgctg 2280

ctgagcagcc tgagcagtac cgttcaagaa gaactgggta aactgtttct gcatctgggt 2340

tgggcagatc tgacagcagg tcgtctgacc attaccgaac tgggtcgctt tatgggtgaa 2400

cgtgcactga ataccgcaat tgttgcaagc tataccccga tgctgagtcg tattcatgat 2460

gttctgtttg gtaattgcct gagcgttttt cagcgtgatg caagcggtca tgaacgtcat 2520

attgatcgta ccctgaatgt tattggtagc ggttttcagc accagaaata ctttgcagat 2580

ctggaagaaa gcattctgag cgtgtttaat cagctgccgc tggaagaaca gccgaaatac 2640

attaccgata tgggttgtgg tgatggcacc ctgctgaaac gtgtttggga aaccattcag 2700

tttaaaagcg cacgtggtaa agcactggaa cagtatccgc tgcgtctgat tggtgttgat 2760

tataatgaag caagcctgaa agcaaccacc cgtaccctgg caagcctgcc gcatctggtt 2820

ctgcagggtg atattggtaa tccggaacaa atggttcgta gcctggaagc acatggcatt 2880

catgatccgg aaaatattct gcatattcgc agctttctgg atcacgatcg tctgtttatt 2940

ccgcctcaga aacgtaatga actgaaagaa cgtgcccatc tgccgtatca gagtgtttgt 3000

gttgatgatc agggtgaact gattcctccg catgttatgg ttcagagcct ggtggaacac 3060

ctggaacgtt ggagccaggt tgttaataaa catggtctga tgattctgga agtgcattgt 3120

ctggaaccgc gtgttgttta tcagtttctg gataaaagcg aaaacctgca ctttgatgca 3180

tttcagggtt ttagccagca gtatctggtt gaagccgaag tttttctgat gagcgcagca 3240

caggttggtc tgtttccgaa actggaactg agcaaacgtt atccgaaaac ctttccgttt 3300

acccgtatta ccctgaacta tttcgaaaaa cgtccgtaca aaatcagcca tgcatatctg 3360

agcgatctgc ctgcactggt tgacctggaa gttaaatgtt ggcctgagaa tctgcgtgca 3420

agcacccatg aaattcgtcg tcgtctggaa ctgaatccgc agggtaacct ggttctgatt 3480

attgaagatc agattatcgg tgccatttac agccagacca ttacaagcac cgaagccctg 3540

gaaaatgtta aatatgcaca ggttccgacc ctgcatacac cgcagggttc agtgattcag 3600

ctgctggccc tgaacattct gccggaattt caggcacgtg gtctgggcaa tgaactgcgt 3660

gattttatgc tgtattattg caccctgaaa ggtggtattg aaagcgttgt tggtgttacc 3720

cgttgtcgca attatgtgaa ttatagccag atgccgatga tggaatatct gaaactgcat 3780

aatgaacagc gtcaactgct ggatccgatt gttggttttc atgttagcgg tggtgcagaa 3840

attcgtggca ttattgcaaa ttatcgtccg gaagatacag ataatctggg tatgggtatt 3900

ctgatcgaat ataacctgcg tgatagcgca ctgcattcac cgggtgatcg taaaggtccg 3960

tatatcaata gcgcaattgg tagcctggtt ccgaaagcga ccagcgcaac caaagaaaac 4020

aaaaccgttg cggatctggt gaaagaatgt attctgaaag tgatgggtag ccagcgtcag 4080

gcagcatatg caccgcagca gaaactgctg gacatgggtc tggatagcct ggatctgctg 4140

gaactgcaga ccctgctgga agaacgtctg ggtattaatc tgagcggcac cttttttctg 4200

caaaaaaaca ccccgaccgc catcattacc tattttcaga atcaggtcgt gcaagagaaa 4260

cagagtgatc tggcaccgcc tgttgatagc gccaatgaaa tcaatacact ggaaaacgtt 4320

gtgaatcagc agaaaattcc gcaggttaca cgtgttgtta ccgaacagca gggacgtaaa 4380

gttctgattg atggtcattg ggttattgat tttgccagct gtaattatct gggcctggac 4440

ctgcatccga aagttaaaga agcaattcct ccggcactgg ataaatgggg cacccatccg 4500

agctggaccc gtctggttgc aagtccggca atttatgagg aactggaaga ggaactgtca 4560

aaactgctgg gtgtgccgga tgttctggtt tttccggcag ttacactgct gcagattggt 4620

attctgcctc tgctgaccgg taataatggt gtgatttttg gcgatattgc agcccatcgt 4680

tgtatttatg aagcatgttg tctggcccag cataaaggtg cacagtttat tcagtatcgt 4740

cataacgacc tgaatgatct ggccgaaaaa ctggccaaat atccgcctga acaggttaaa 4800

atcattgtga tcgatggtgt gtatagcatg agtgccgatt tcccggacct gcctgcatat 4860

gttcatctgg caaaagaata taacgccctg atctatatgg atgatgcaca tggctttggc 4920

attctgggtg aaaatccgag cagcgatatg ccgtatggtt ataaaggtaa tggcatggtg 4980

aactactttg atctgcgttt tgccgaagat aacatcattt atgttgcagg tctgagcaaa 5040

gcctatagca gctatgcagc atttctgacc tgtggtgatc gtcgtattaa aaccaatttt 5100

cgtaatgcat ggaccgcgat ttttagcggt ccgagtccgg ttgcaagcct ggccagcgca 5160

ctggcaggtc tgcaggttaa tcgtcaagaa ggtgaacagc tgcgcaaaca aatctatcat 5220

ctgacacata aactggttac ccaggctcgt gccattggtt ttgaagttga taattatggt 5280

tatgtgccga ttgtgggtgt tctggtgggt gatgcacagc atatgattga tgtgtgccaa 5340

ctgctgtggg aatatggtat cctgattacc cctgcaattt ttccgattgt gccgctgaat 5400

aaatcagcac tgcgttttag cattaccgca gcaaataccg aagaagaaat tgatcaggcc 5460

atcaaaagtc tgaaagcagt ttgggacctg ctgcaaaaac gtaaagccct gccgtgtaaa 5520

caagaagaaa atatcctgaa acattgagaa ggagatatac atatgaccca tgttgccctg 5580

gaacaggcaa ttgcaaaagt tccgcgtagc attcagagcg aactgcgtac cattctggca 5640

cagcatgcag ttattgatag cagcgttgtg gcaagctgga ttgatcgtct gggcaccaat 5700

attagtaccc tgatgatcca gctgctgccg gttgcagcaa cctatgcacg tgttccgatt 5760

agccagtttt atgttggtgc cattgcactg ggcaaaccgc agagtaaaaa tcagctgggt 5820

agcggcaccc tgtattttgg tgcagatatg gaatttgttg gtcaggcact gagctttagc 5880

gttcatgcag aacagagcgc caccattaat gcctggctgc atggcgaaac cggactgcag 5940

gcactggcaa tccatgaagc accgtgtggt tattgtcgcc agtttctgta tgaaatggca 6000

accgtgaatc agaattttgt gctgctggtg aaaagcaatg aaagccagcc ggaacagacc 6060

tataccagca acaaactgcc gcattttctg cctgaaccgt ttggtccagc cgatctgggt 6120

ctgaccggtg gcctgatgca gaccgtgttt cacgatctgg aaacctatag caccgatgat 6180

gttgttctgg cagcactgag tgcagcaaat cagagttatg caccgtatac caaaaacttt 6240

gccggtgttg cactgaaaga tagtcatggt aacattttta caggtcgcta tgccgaaaac 6300

gcagcattta atagcagcat gagcccgatg gaaagcgcac tgacctttat gaatatgaat 6360

cgttattcac agagcctgtt cgatatttgt gatgcagttc tggtagaagt ggaaaccggt 6420

attagtcagc gtccggttac cgaagccttt ctgagtagca ttgcaccgaa agtgaaactg 6480

cgctatgcac cggcaacccc gagcagtaac aaactgtgag aaggagatat acatatgttt 6540

cagaccaaaa gctattatag cgtcgttggc ctggaaaccg aactgattaa aggtaaattc 6600

ttcatgagca acgaactgac caatgaacag gtgtttaaac tggtgtgcat ggaagtgatt 6660

gaaaaaatgg gttttgcaca ctttccgcct attatcctgg tttatgaaat gaccaattcc 6720

ggctttgttg attggtgcga gcagatggtt tttgtggatg ataaaggcaa actggatgag 6780

ggcgaaaaat ttctgctgga ttggatgcgt cgtaatgtgg gtaattttga tctgattcgc 6840

gaactgatgc cggtggcaga acgcctggaa atgaaaatgc gtagctaact cggtaccaaa 6900

ttccagaaaa gaggcctccc gaaagggggg ccttttttcg ttttggtccc gaagttccta 6960

ttctctagaa agtataggaa cttcgaccgc ctgtctattt ctcttacggt tccaacatcc 7020

atataggccg caatt 7035

<210> 92

<211> 12758

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 整合到大肠杆菌木糖操纵子中的sxt3片段版本1的序列

<400> 92

ttgcatttcc ttgagcctta tccgacttgt cagtcggata aggcttttta ctttgtctca 60

ggcagttgag ctacgagcct gaagcgttgt tggtgcgttt tatcatgcct ggcgggtagg 120

tcggataagg cgttcacgcc gcatccgaca accacgcagc gttacctgat gtgacgccga 180

caattctcat catcgctaca acatgacctc gctatttaca tcgcgatact cttttggcgt 240

cgtgtcatat gcttttttaa aaacagagta gaaatattgc agcgatggat aaccgcacat 300

ttgcgatatc tcattgatcg acaaggtggt tgaaatcagc agactgcgcg ctttctccag 360

cttctcggca tgaatcatgg catggatggt ttcacccacc tcttctttaa aacgcttctc 420

aagattggag cgcgagatcc cgaccgcatc cagtacctga tccactttaa tccctttaca 480

ggcgtgatta cgaatgtaat gcatggcctg aataacggcg ggatcggtca gcgagcgata 540

atctgttgag cgccgttcaa tgacgcgaac tggtgggacc aaaattcgct gtagcggcat 600

ttcttcttta tctaataatc gatgcaacag ttttgccgcc tgatagccca tttgccgcgc 660

gccctgagcg accgaagaaa gggcgacacg cgacagatag cgggtcagtt cttcgttatc 720

gatgccaatc acgcataatt tttccggtac gggaatatgt agatgttcac atacttgcag 780

aatatgccgc gctcgggcgt cagtaacggc aataatcccg gtttgcggtg gtagcgtttg 840

tagccagtct gccagccgat tttgcgcgtg ttgccagttc tctggcgcgg tttctaaccc 900

ctgataaacc actccgcgat acttttcttc ggcgacaagc tgacgaaatg catattcgcg 960

ctcagtggcc caacgtttgc cgcttgattc cggaagacca taaaaagcaa agcggttaac 1020

gcctttctct tttaaatgca aaaatgcgct ttcaaccagc gcatagttat cggtggcaat 1080

gtaatgaacg ggtgggtaac tttctgcaag gtgatacgag ccgccaaccc caacaatggg 1140

gacgtcgaca tcagccagcg cttgctcgat ctgtttgtcg tcgaagtcgg caatgacgcc 1200

atctcctaac cagtccttga ttttatcaat gcgggcgcgg aaatcttctt caatgaaaat 1260

atcccattcc gattgtgacg cctgtaaata ttcccctacg ccttctacta cctgccggtc 1320

ataggcttta ttggcattga acagtaatgt gatgcggtga cgtttagtaa acatggttct 1380

tttcctgctg aatcatgcaa aaactcaaaa ccggtaatac gtaaccggct ttgagaaaat 1440

ttttatcaaa atcaagaacg gcgtttggtt gcggagtcca tccatactgc cagcaacaga 1500

atcgcacctt taacgatata ctgccagaag gtcggtacat ccatcatact catgccgtta 1560

tccagtgaag ccatgataaa tgcccccatt actgctccgg caacgcttcc cacaccgcca 1620

gccaggctgg tgccgccaat cacgcatgct gcaattgcgt ccagttcggc gatatttccc 1680

gcagaaggtg aaccagcgcc aagtcgagaa ctaaggatta atccggcgat ggctaccatt 1740

aatccgttaa tcgcgaacac ggcaagtttg gtgcgttcaa cgttaatccc ggagagacgt 1800

gctgcttcca gattgccgcc gatggcataa atgcgtcgtc caaatgccgt ccgcgtttcc 1860

ataaacattc cgccgagtaa cagcaacgtc agcagcagaa caggagtggg aacgccacgg 1920

taatcattca acagccagat tgcgcctaat acgatgatag cggttaaagc ctggcgaccg 1980

actactgcgg tagaggccgg agactgcaaa cccaaagcct gacggcgcat tcttccgcgc 2040

cattgccaac caacaaaagc cattaagcca agcgcgccaa tgatgaagcc agtgctggca 2100

ggtagatagc tttgcccaat ttgtgacatc gcggcgctgg tgggggaaac agtcgtgccg 2160

ttggtgatgc caatgagtat gccgcgaaat gccaacatgc ccgcgagggt gacaataaat 2220

gaagggactt tgcggtacgc gacccaccat ccgttccagg caccgagaag cagtcccaga 2280

accaacgtca caatgatggt aagtggcaaa ggccagccta accagacgtc acaaatcgcc 2340

gcgacgccac ctaatagccc catcattgag ccgacggaaa ggtcgatttc agcagaaatt 2400

atgacgaaca ccattcctac cgcgaggatg ccggtaatcg cggtctggcg taacaggttg 2460

gagacgttac gggcgcttaa gtaggcacca tcggtggtcc aggtaaagaa cagcatgatt 2520

gcgatgatag ctgcaatcat cacgaagacc tgcaaattca gtgatttcag cccggagaag 2580

ctaccggatg tcggtacggc caatttcact tcagacggat tgcttttcga catgatgttc 2640

gctcctcaat gcggcttcca tcacctgctc ctgagtcagg ttatgattta tcaggttggc 2700

ttttagtttc ccttcatgca tcaccagtac acgatcgcta aggccgagca cttcaggtaa 2760

ttcggaagag atgacaataa cggcaatacc ctgctggacg agttggttaa ttaatttgta 2820

gatctcgtat ttcgcgccaa tatcgatacc cctggtgggt tcatcaagaa tgagaatgcg 2880

cgggttaagt aacagacagc gagcgaggat cgctttttgc tgattgccgc cgctcaaacg 2940

tccaatagca aggtcggggg acgacgtttt aactttgagt tgctggattg attccagaat 3000

acatttttgc tctgccgcgt catcaagctg gctaatgcca ccggtaaatt tattgagtcg 3060

gcgagggtaa tatttttacc aaccgccatt accggaacga tgccgtcgcg ctttctgtct 3120

tcgggtacca tcgcaatccc ctgggcgatg gcttgctgac agttacgaat atctacctgt 3180

ttgccatcaa tataaatttt tccttcccat tgtccgggcc acacgccaaa caggcactga 3240

atggtctcgg tacgtccggc accaacgagt ccggcaatac ccagtatttc gccacgtttc 3300

agggaaaacg agacatcatt aactcgttta atatgacgat tgaccggatg ccatgccgtc 3360

agatgttcaa tacgtaatat ttcatctccg gtggtatgtg gttcattagg gtaaagcgcg 3420

gttaactctc gcccgaccat catggtgata atatcgtctt cactcattcc ggcagcatca 3480

cgcgtaccaa tgtgctgtcc gtcgcgaata acgcaaatcg tatcggaaat cgctttgact 3540

tcgttgagtt tgtgcgaaat ataaatacag gcgataccgt gctgttgtag atcgcgaata 3600

atatccagta aaaccgacgt ttcctgctca gttaatgagg ctgtcggttc atcgagaatt 3660

aacaagcgca cctgtttatt aagtgccttg gcaatttcaa ccagttgttg ttgcccaagc 3720

cctaaatcgc caacgcgggt atcaggtgaa atggataaac tgacctgtgc gagcagcttc 3780

tgacagcgta gcgtcatcag gtcataatcc ataatgccat tgtgggttat ttcgttaccc 3840

aggaagatat tttccagcac ggtcaattct ttcaccaggg ccaattcctg atgaatgatg 3900

gcgatacctt tgcgttcggt atcgcggatg tgactcgcct gaatctcttc tcccgcaaaa 3960

ataatttcgc cttcgtagga gccatgggga taaataccac acagcacttt catcagcgtt 4020

gatttaccag acccattttc cccacaaagt gagacgattt cgccagcatt caaccgcaag 4080

cagacgttat caatcgcctt cacactgccg aaggttttgg taatgttctt catttcaagt 4140

agataaggca taacgactcc acctaagcca attcattcac gcggcatgga gagaaatcac 4200

gcccccgctc cgcgccgggc gtaacgctta cagctcgctc tctttgtgga atccgtcttt 4260

aattaccgta tctttgatgt tgtttttatt cacatcgatc ggtgtcagga ggcgggaggg 4320

gacatctttc aggccattat tcagtgaggt ccagccttgc aagaagcgga tacaggagtg 4380

caaaaaatgg ctatctctag aaaggcctac cccttaggct ttatgcaaca gaaacaataa 4440

taatggagtc atgaacatat ggtgattaaa aacctgtgtc cggatggtgt taccccgatt 4500

tggaataaaa gccagatgga aagcagcctg ctggaagaat gtctgcctgc atgggttcgt 4560

accagctata gcacctttgt tgaaaccatt agcgatagcg catttccgtg tttttggggc 4620

accattggtg aacagaaagg tatgattcgt tatctgattg ttagcagcct gaccgatccg 4680

attctggttg aacataccct ggaaggtatc tacaaatata tcgatgaagt gaacgaaaac 4740

gaactgctgc agcatgaaaa tgcagatctg ctgaccctgg ttatcttttt tccgcctgaa 4800

ccgaccgttc tgaccgttga agaatatgca ggtcaggcat ttgattttct gaatgcactg 4860

catagcctgg atgcagttag ctgtccgtgt cattggagcg cagatccgca gagcgcaaat 4920

tggagctata gcctgggtgg ttgtgcactg tttgttagcg ttagcacacc ggcaaatcag 4980

aaacgtcgta gccgtcatct gggtagcggt atgacctttg ttattacacc ggttgaagtg 5040

ctgctgaata aacatggtgg tgaaaacagc agcatttttc gtcgtgttcg tgaatatgat 5100

ggtattccgc ctcatccgaa tctgctgatt atgcctggta atggtaaagt gggtaatgaa 5160

ctgaccgtgc aggttctgcc ggataataat gatagcgaaa tcagcttcga ttttcagtat 5220

aaattcaaag attgagaagg agatatacat atgaccatcc agattgtgca gcataacctg 5280

gaatatagct ttgtgacccc gaaagaaacc agcgattttg ttgaacgtac catgagcgtt 5340

tttgatcagg catatccgaa atttctgatc catgatgttt gggcagatcc ggcaagcctg 5400

gccctgtttg aaatttatcc ggaatttcag tttggtctgg tggaagcaac cacccagctg 5460

atgattgcac agggtaattg tattccgctg acctatgaaa gccgttttga tgaactgccg 5520

gatgaaggtt gtgattgggc actggcaaaa tggctggaag atcgcgaaca gaatcgtctg 5580

ccgaatgccc tgtgtgttgt gagcattagc atcctgccgg aatatcaggg taaaaatctg 5640

agccagtatc tgatcggcta tatgaaagaa ctggcacagt atcatggtct gaatagcctg 5700

attatggcag cacgtccgag cctgaaatat ctgtatccgc tgattccgat tgaacgctat 5760

attacctggc gtgataaaaa cggcctgatt tttgatccgt ggctgcgtgt taatgttaaa 5820

catggcgcaa aaattgccgg tatctgcttt aaaagcacca ccattaatga taccattgat 5880

ggttgggagg atcgtgttgg tatgcgtttt ccggaaaccg gtgattatat cattccgaaa 5940

ggtctggttc cggtgaaaat tgattatccg aataacatgg gcatctacat cgaaccgaat 6000

atctggctgt attatgatct ggactgagaa ggagatatac atatgatcaa catcgaacag 6060

tttcgccaag aaatcgaaga ttggattatt aacgttgtca gcattccgaa cccgctgacc 6120

ggtaattttc ctccgtgtcc gtatgcaaaa gcagcatggc tgaataatcg tgttagcgtg 6180

cgttggtttc atggtccgga actgcctgaa ctgctgatgg aacaaattcg tacatggaac 6240

aacgatttcg agatggtgat ttttggttgc gatcctcaga atctggatgc acagcgtctg 6300

gaacgttata tcaccaaagc aaattatgtg ctgcccgaat atgacctggt tgcactgggt 6360

agccatccgg ataaacagta tgttggtgat gatgccgaaa atgtgaacaa cgtgattatt 6420

acccatccga aatatgttct ggcaagcgtt cagagcttta gccagctgca agaggcaagt 6480

gatgagctgc tgcgtctggg ttatttccag tattggtcag cagaaaaact ggccgaaatg 6540

aaaagcgaac gtgcaagcca taatctgagc agcattcagc gtaaaaatag ctatcgtatt 6600

atcccgacca accattgaga aggagatata catatgctga ccgcagaaca gaaacaggca 6660

tataccaatg atggctattt taccgtggaa gaagcagttc cgaaagcact gattgaagaa 6720

attcgccatg aagtggaact gatcaccgag cagaaacgtg gtggtgtgct ggcaggcgat 6780

tatgaatggt ggtcagaaca caccattccg gatccggttc gttatcagaa aattatccag 6840

cgtctgctgg aactgccgac cgttatgggt ccggttcagg ccctgattgg tagcgatatt 6900

tttctgttaa ttaccgacct ggcaattatt cgtgcaggca ccggttatat tgcatggcat 6960

caggatcatg gctatgttgt tgaagttctg aacgccctgg caagcatgag caaaaatgag 7020

ctgaatgatg atgcactgcg cctgctggtg ccggttgcaa atcaggcaat ggtgtttatt 7080

accatctatc tgcaggatac cgataacacc atgggcacca tgcgtgtgat tccgagcagc 7140

catcagtggg aacatagtct ggatagcagc agcgccaatt cactgaatgc agaaatttgt 7200

ctgagcctgc ctggtggtgc agcaatgttt tataccccga ccgtttggca taccgcagca 7260

gcaaatacca gcattaccga ttatcgtatg ctgacgctga tcttcaccaa aaacaacatt 7320

aaaccgctgc tggttgatgc cctgaaacgt attatttgag aaggagatat acatatgaca 7380

accaccgatc cgatcctgat taataactgg catgttgtgg caaatgtcga ggattgtaaa 7440

ccgggtagca ttacccgtag ccgtttactg ggtgttaaac tggttctgtg gcgtagctat 7500

gaacagaata gcccgattca ggtttggctg gattattgtc cgcatcgtgg tgttccgctg 7560

agcatgggtg aaattaccaa taataccctg gtttgtccgt atcatggctg gcgttataat 7620

gaagcaggta aatgtattca gattccggca catccgggta tggttccgcc tgcaagcgca 7680

gaagcacgta cctatcatag ccaagaacgt tatggtctgg tttgggtttg tctgggtgat 7740

ccggttaatg atattccgtc atttccggaa tgggatgatc cgaattatca caaaacctac 7800

accaaaagct atctgattaa agcaagcgcc tttcgcgtta tggataattc actggatgtt 7860

agccattttc cgtttattca tgatggctgg ctgggcgatc gtaactatac caaagtggaa 7920

gaatttgaag tgaaactgga taaagatggt ctgacgatgg gcaaatatca gtttcagacc 7980

agccgtattg tgagccatat tgaagatgat agctgggtga attggtttcg tctgagccat 8040

ccgctgtgtc agtattgtgt tagcgaaagt ccggaaatgc gtattgttga tctgatgacc 8100

attacgccga ttgatgaaga aaatagcgtt ctgcgcatgc tgatcatgtg gaatggttat 8160

gaaaccctgg aaagcaaaat gctgacagag tatgatgaaa cgatcgaaca ggatattcgt 8220

attctgcatg cccagcagcc ggtgcgtctg ccgctgctga caccgaagca gattaatacc 8280

cagctgttta gccatgaaat tcatgttccg agcgatcgtt gtaccctggc atatcgtcgt 8340

tggctgaaac aactgggtgt gacctatggt gtttgttgag aaggagatat acatatggca 8400

ggtaaactgg atggtaaggt tgcaattatt accggtgcaa gcagcggtat tggtgaagcc 8460

accgcatttg cactggcagc agaaggtgca aaagttgcaa ttgcagcccg tcgtgcagaa 8520

ctgttacatg cactggccaa acgtattgaa gcaagcggtg gtcaggcact gccgattgtt 8580

accgatatca ccgatgaaag ccaggttaat catctggttc agaaaaccaa agttgaactg 8640

ggtcatgttg atatcctggt gaataatgca ggtattggcg tttttggtgc aatcgatacc 8700

ggtaatccgg cagattggcg tcgtgcattt gatgttaatg tgctgggtgt tctgtatgca 8760

attcatgcag ttctgccttt actgaaagca cagaaaagcg gtcatattgt gaatattagc 8820

agcgtggatg gtcgtattgc acagagcggt gcagttgttt atagcgcagc aaaaagcggt 8880

gttaatgccc tgagcgaagc actgcgtcaa gaagtgagcc tggataatat tcgtgtgacc 8940

attattgaac cgggtctggt agataccccg tttaatgatc tgattagtga tccgattacc 9000

aaacagctga gcaaagaaca gctgtcaacc attactccgc tgcagagcga agatattgca 9060

cgtgccatta tctatgcagt tacccagccg gatcatgtta acgttaatga aattctgatt 9120

cgtccgaccg cagaggataa ttgagaagga gatatacata tgaacctgac cctgaacaaa 9180

gaagaaaaac agctgctgac ggcatatagc ggcaccgaac tgcagctgac agcagatgtt 9240

ctggttattg gtggtggtcc ggcagccgca tgggcagctt gggcagcagg cgcacagggt 9300

gtgaaagtta ttattgtgga taaaggtttt ctgggcacca gcggtgccgc agccgcaagc 9360

ggtaatagcg ttatggcacc gtcaccggaa aattgggaaa aagatgtgag cgaatgttac 9420

agcaaaggta ataatctggc aaatctgcgt tggattgaac gtgttattga aaaagcctgg 9480

ctgtcactgc cgctggttga agattggggt tatcgttttc ctaaagaaaa tggtgaaagc 9540

gtgcgtcaga gctattatgg tcctgaatat atgcgtgttc tgcggaaaaa tctgctgcgc 9600

gttggtgttc agatctttga tcagtcaccg gcactggaat tactgctggc acaggatggt 9660

agcgttgccg gtgcacgtgg tgtgcagcgt cagaatcatc gtacatatac cgttcgtgcc 9720

ggtgccgttg ttctggccaa tggtggttgc gcatttctga gtaaagcact gggttgtaat 9780

accaataccg gtgatggtct gttaatggca gttgaagccg gtggtgaact gagcagtatg 9840

gaagccagca gccattatac cattagcacc gcctttaatg caaccgttac ccgtgcagct 9900

ccgttttatt gggcaagcta taccgatgaa gctggcaatg atctgggtgg ctatattaac 9960

ggtcgtcgtg atccgagctt tctgccgaac gcactgctga aaggtccggt ttatgcacgt 10020

ctggatcgtg caacaccgga aattcaggcg ctggtagaaa aaagccattt tattgcattt 10080

ctgccgtaca agaaagccgg tattgatccg tataccgaac gtgttccggt taccctggtg 10140

ctggaaggca ccgtgcgtgg caccggtggt attcgcattg ttaatgattc atgtggcacc 10200

aaagttccgg gactgtatgc agcgggtgat gcagcaagcc gtgaatttct ggcaggcatt 10260

gccagcggtg gtgatggacc gaatgcagca tgggcaattt caaccggtca gtgggcaggc 10320

gaaggtgcag cagcctttgc aaaaagtctg ggtgcacatg ttcatgaacg cgttgttcgt 10380

ccggcaggcc aggcaggtct gcgtagtcag tatccgggta gcgaaacctt tgatagtgaa 10440

gcagttgttc gtggcgttca ggcagaaatg tttccgctgg aaaaaaacta tctgcgctgt 10500

gaacagggac tgctggatag cctggcaaaa ctggaaatgc tgtggcagca ggttcagggt 10560

aatccgaaac aggatacagt tcgtgatctg gaattttcac gtcgtgcggc agcactggtt 10620

agcgtggcac gttgggcata ttttagcgca ctgcatcgta aagaaacccg tagcgaacat 10680

atccgtattg attacccgga aacggatccg aatcaactgt attatcaggc aaccggtggc 10740

ctggaacgtc tgtgggtgcg tcgtgattgg gttaaagatg caagcgccac ccctccggtg 10800

ctgaccacct gagaaggaga tatacatatg attgaactgg tgagccataa gctgtgcatt 10860

aattgtaatg tttgtgttca ggtgtgcccg accaatgttt ttgatgcagt gccgaatcag 10920

cctccggcaa ttgcacgcca agaagattgt cagacctgtt ttatttgtga agcatattgt 10980

cctgcagatg cgctgtatgt tgcaccgcag agccatacca atgttgcagt taacgaagat 11040

gatttaatcg acagcggcat tatgggtgaa tatcgtcgca ttctgggttg gggctatggt 11100

cgtaaaaaca atagcgaact ggataccgac cataaactgc gtctgtttga atgagaagga 11160

gatatacata tgtcatttca gaaatttgtg caagaagcag cctataaagt cgcaccgttt 11220

aaaccgaatc gttttgccaa aattagcgag cgtgaagata aatgtgcaat tccggttccg 11280

gcatggcgtg cactgctggc caatcgtgac ctgtttacct ggaaaggtat tccgtttctg 11340

aaaggttgta ccgaaattgc actgtatagc atgctgctgt atgaactgcg tccgaaaacg 11400

attattgaaa ttggtgcgct gagcggtggt agcgcaattt ggctggcaga tcatctggaa 11460

ctgtttcaga ttgaaggttg cgtgtattgc attgatattg atctgtctct gctggacgaa 11520

aaagcaaaaa ccgatagccg tgttcatttt ctggaaggtg attgcaataa tatgggtgca 11580

attatgtcaa gcgagctgct gagtggtctg gcacatcctt ggctgattgt tgaagatgca 11640

catgcaaatg ccgttggtgt ggttgaatat tttcacgaaa acggtctgaa aagtggcgat 11700

tacctgatcg tggaagatac caataaaaca atgtgggaac tggatcgcga agaactggac 11760

cgtgatgacc tggatgaaca agaactgatc gaaaaaggtg agcagaaatt agcagaactg 11820

aaaagctggc tgatgctgca tgagaatgaa tatctgatag atacctacta tcaggatatg 11880

tatggctata atggtagccg taattggaac agcattctga aacgtgtgga aaagaacttt 11940

taatctaact aaaaacaccc taacgggtgt tttttctttt ctggtctccc cgaagttcct 12000

attctctaga aagtatagga acttcgctgg attgggccgc gaaattaacc ggcctgagca 12060

atgtcccagc tttaatcgct gcagctcaac aggctgatga aagtgccgag ccagtttggt 12120

ttctgcctta tctttccggc gagcgtacgc cacacaataa tccccaggcg aagggggttt 12180

tctttggttt gactcatcaa catggcccca atgaactggc gcgagcagtg ctggaaggcg 12240

tgggttatgc gctggcagat ggcatggatg tcgtgcatgc ctgcggtatt aaaccgcaaa 12300

gtgttacgtt gattgggggc ggggcgcgta gtgagtactg gcgtcagatg ctggcggata 12360

tcagcggtca gcagctcgat taccgtacgg gaggggatgt ggggccagca ctgggcgcag 12420

caaggctggc gcagatcgcg gcgaatccag agaaatcgct cattgaattg ttgccgcaac 12480

taccgttaga acagtcgcat ctaccagatg cgcagcgtta tgccgcttat cagccacgac 12540

gagaaacgtt ccgtcgcctc tatcagcaac ttctgccatt aatggcgtaa acgttatccc 12600

ctgcctgacc gggtggggga taattcacat ctatatatct cagtaattaa ttaatattta 12660

gtatgaattt attctgaaaa tcatttgtta atggcatttt tcagttttgt ctttcgttgg 12720

ttactcgtaa tgtatcgctg gtagatatgg agatcgtt 12758

<210> 93

<211> 7185

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 整合到大肠杆菌木糖操纵子中的sxt3片段版本2的序列

<400> 93

ggtgtcagga ggcgggaggg gacatctttc aggccattat tcagtgaggt ccagccttgc 60

aagaagcgga tacaggagtg caaaaaatgg ctatctctag aaaggcctac cccttaggct 120

ttatgcaaca gaaacaataa taatggagtc atgaacatat ggtgattaaa aacctgtgtc 180

cggatggtgt taccccgatt tggaataaaa gccagatgga aagcagcctg ctggaagaat 240

gtctgcctgc atgggttcgt accagctata gcacctttgt tgaaaccatt agcgatagcg 300

catttccgtg tttttggggc accattggtg aacagaaagg tatgattcgt tatctgattg 360

ttagcagcct gaccgatccg attctggttg aacataccct ggaaggtatc tacaaatata 420

tcgatgaagt gaacgaaaac gaactgctgc agcatgaaaa tgcagatctg ctgaccctgg 480

ttatcttttt tccgcctgaa ccgaccgttc tgaccgttga agaatatgca ggtcaggcat 540

ttgattttct gaatgcactg catagcctgg atgcagttag ctgtccgtgt cattggagcg 600

cagatccgca gagcgcaaat tggagctata gcctgggtgg ttgtgcactg tttgttagcg 660

ttagcacacc ggcaaatcag aaacgtcgta gccgtcatct gggtagcggt atgacctttg 720

ttattacacc ggttgaagtg ctgctgaata aacatggtgg tgaaaacagc agcatttttc 780

gtcgtgttcg tgaatatgat ggtattccgc ctcatccgaa tctgctgatt atgcctggta 840

atggtaaagt gggtaatgaa ctgaccgtgc aggttctgcc ggataataat gatagcgaaa 900

tcagcttcga ttttcagtat aaattcaaag attgagaagg agatatacat atgaccatcc 960

agattgtgca gcataacctg gaatatagct ttgtgacccc gaaagaaacc agcgattttg 1020

ttgaacgtac catgagcgtt tttgatcagg catatccgaa atttctgatc catgatgttt 1080

gggcagatcc ggcaagcctg gccctgtttg aaatttatcc ggaatttcag tttggtctgg 1140

tggaagcaac cacccagctg atgattgcac agggtaattg tattccgctg acctatgaaa 1200

gccgttttga tgaactgccg gatgaaggtt gtgattgggc actggcaaaa tggctggaag 1260

atcgcgaaca gaatcgtctg ccgaatgccc tgtgtgttgt gagcattagc atcctgccgg 1320

aatatcaggg taaaaatctg agccagtatc tgatcggcta tatgaaagaa ctggcacagt 1380

atcatggtct gaatagcctg attatggcag cacgtccgag cctgaaatat ctgtatccgc 1440

tgattccgat tgaacgctat attacctggc gtgataaaaa cggcctgatt tttgatccgt 1500

ggctgcgtgt taatgttaaa catggcgcaa aaattgccgg tatctgcttt aaaagcacca 1560

ccattaatga taccattgat ggttgggagg atcgtgttgg tatgcgtttt ccggaaaccg 1620

gtgattatat cattccgaaa ggtctggttc cggtgaaaat tgattatccg aataacatgg 1680

gcatctacat cgaaccgaat atctggctgt attatgatct ggactgagaa ggagatatac 1740

atatgctgac cgcagaacag aaacaggcat ataccaatga tggctatttt accgtggaag 1800

aagcagttcc gaaagcactg attgaagaaa ttcgccatga agtggaactg atcaccgagc 1860

agaaacgtgg tggtgtgctg gcaggcgatt atgaatggtg gtcagaacac accattccgg 1920

atccggttcg ttatcagaaa attatccagc gtctgctgga actgccgacc gttatgggtc 1980

cggttcaggc cctgattggt agcgatattt ttctgttaat taccgacctg gcaattattc 2040

gtgcaggcac cggttatatt gcatggcatc aggatcatgg ctatgttgtt gaagttctga 2100

acgccctggc aagcatgagc aaaaatgagc tgaatgatga tgcactgcgc ctgctggtgc 2160

cggttgcaaa tcaggcaatg gtgtttatta ccatctatct gcaggatacc gataacacca 2220

tgggcaccat gcgtgtgatt ccgagcagcc atcagtggga acatagtctg gatagcagca 2280

gcgccaattc actgaatgca gaaatttgtc tgagcctgcc tggtggtgca gcaatgtttt 2340

ataccccgac cgtttggcat accgcagcag caaataccag cattaccgat tatcgtatgc 2400

tgacgctgat cttcaccaaa aacaacatta aaccgctgct ggttgatgcc ctgaaacgta 2460

ttatttgaga aggagatata catatgacaa ccaccgatcc gatcctgatt aataactggc 2520

atgttgtggc aaatgtcgag gattgtaaac cgggtagcat tacccgtagc cgtttactgg 2580

gtgttaaact ggttctgtgg cgtagctatg aacagaatag cccgattcag gtttggctgg 2640

attattgtcc gcatcgtggt gttccgctga gcatgggtga aattaccaat aataccctgg 2700

tttgtccgta tcatggctgg cgttataatg aagcaggtaa atgtattcag attccggcac 2760

atccgggtat ggttccgcct gcaagcgcag aagcacgtac ctatcatagc caagaacgtt 2820

atggtctggt ttgggtttgt ctgggtgatc cggttaatga tattccgtca tttccggaat 2880

gggatgatcc gaattatcac aaaacctaca ccaaaagcta tctgattaaa gcaagcgcct 2940

ttcgcgttat ggataattca ctggatgtta gccattttcc gtttattcat gatggctggc 3000

tgggcgatcg taactatacc aaagtggaag aatttgaagt gaaactggat aaagatggtc 3060

tgacgatggg caaatatcag tttcagacca gccgtattgt gagccatatt gaagatgata 3120

gctgggtgaa ttggtttcgt ctgagccatc cgctgtgtca gtattgtgtt agcgaaagtc 3180

cggaaatgcg tattgttgat ctgatgacca ttacgccgat tgatgaagaa aatagcgttc 3240

tgcgcatgct gatcatgtgg aatggttatg aaaccctgga aagcaaaatg ctgacagagt 3300

atgatgaaac gatcgaacag gatattcgta ttctgcatgc ccagcagccg gtgcgtctgc 3360

cgctgctgac accgaagcag attaataccc agctgtttag ccatgaaatt catgttccga 3420

gcgatcgttg taccctggca tatcgtcgtt ggctgaaaca actgggtgtg acctatggtg 3480

tttgttgaga aggagatata catatggcag gtaaactgga tggtaaggtt gcaattatta 3540

ccggtgcaag cagcggtatt ggtgaagcca ccgcatttgc actggcagca gaaggtgcaa 3600

aagttgcaat tgcagcccgt cgtgcagaac tgttacatgc actggccaaa cgtattgaag 3660

caagcggtgg tcaggcactg ccgattgtta ccgatatcac cgatgaaagc caggttaatc 3720

atctggttca gaaaaccaaa gttgaactgg gtcatgttga tatcctggtg aataatgcag 3780

gtattggcgt ttttggtgca atcgataccg gtaatccggc agattggcgt cgtgcatttg 3840

atgttaatgt gctgggtgtt ctgtatgcaa ttcatgcagt tctgccttta ctgaaagcac 3900

agaaaagcgg tcatattgtg aatattagca gcgtggatgg tcgtattgca cagagcggtg 3960

cagttgttta tagcgcagca aaaagcggtg ttaatgccct gagcgaagca ctgcgtcaag 4020

aagtgagcct ggataatatt cgtgtgacca ttattgaacc gggtctggta gataccccgt 4080

ttaatgatct gattagtgat ccgattacca aacagctgag caaagaacag ctgtcaacca 4140

ttactccgct gcagagcgaa gatattgcac gtgccattat ctatgcagtt acccagccgg 4200

atcatgttaa cgttaatgaa attctgattc gtccgaccgc agaggataat tgagaaggag 4260

atatacatat gaacctgacc ctgaacaaag aagaaaaaca gctgctgacg gcatatagcg 4320

gcaccgaact gcagctgaca gcagatgttc tggttattgg tggtggtccg gcagccgcat 4380

gggcagcttg ggcagcaggc gcacagggtg tgaaagttat tattgtggat aaaggttttc 4440

tgggcaccag cggtgccgca gccgcaagcg gtaatagcgt tatggcaccg tcaccggaaa 4500

attgggaaaa agatgtgagc gaatgttaca gcaaaggtaa taatctggca aatctgcgtt 4560

ggattgaacg tgttattgaa aaagcctggc tgtcactgcc gctggttgaa gattggggtt 4620

atcgttttcc taaagaaaat ggtgaaagcg tgcgtcagag ctattatggt cctgaatata 4680

tgcgtgttct gcggaaaaat ctgctgcgcg ttggtgttca gatctttgat cagtcaccgg 4740

cactggaatt actgctggca caggatggta gcgttgccgg tgcacgtggt gtgcagcgtc 4800

agaatcatcg tacatatacc gttcgtgccg gtgccgttgt tctggccaat ggtggttgcg 4860

catttctgag taaagcactg ggttgtaata ccaataccgg tgatggtctg ttaatggcag 4920

ttgaagccgg tggtgaactg agcagtatgg aagccagcag ccattatacc attagcaccg 4980

cctttaatgc aaccgttacc cgtgcagctc cgttttattg ggcaagctat accgatgaag 5040

ctggcaatga tctgggtggc tatattaacg gtcgtcgtga tccgagcttt ctgccgaacg 5100

cactgctgaa aggtccggtt tatgcacgtc tggatcgtgc aacaccggaa attcaggcgc 5160

tggtagaaaa aagccatttt attgcatttc tgccgtacaa gaaagccggt attgatccgt 5220

ataccgaacg tgttccggtt accctggtgc tggaaggcac cgtgcgtggc accggtggta 5280

ttcgcattgt taatgattca tgtggcacca aagttccggg actgtatgca gcgggtgatg 5340

cagcaagccg tgaatttctg gcaggcattg ccagcggtgg tgatggaccg aatgcagcat 5400

gggcaatttc aaccggtcag tgggcaggcg aaggtgcagc agcctttgca aaaagtctgg 5460

gtgcacatgt tcatgaacgc gttgttcgtc cggcaggcca ggcaggtctg cgtagtcagt 5520

atccgggtag cgaaaccttt gatagtgaag cagttgttcg tggcgttcag gcagaaatgt 5580

ttccgctgga aaaaaactat ctgcgctgtg aacagggact gctggatagc ctggcaaaac 5640

tggaaatgct gtggcagcag gttcagggta atccgaaaca ggatacagtt cgtgatctgg 5700

aattttcacg tcgtgcggca gcactggtta gcgtggcacg ttgggcatat tttagcgcac 5760

tgcatcgtaa agaaacccgt agcgaacata tccgtattga ttacccggaa acggatccga 5820

atcaactgta ttatcaggca accggtggcc tggaacgtct gtgggtgcgt cgtgattggg 5880

ttaaagatgc aagcgccacc cctccggtgc tgaccacctg agaaggagat atacatatga 5940

ttgaactggt gagccataag ctgtgcatta attgtaatgt ttgtgttcag gtgtgcccga 6000

ccaatgtttt tgatgcagtg ccgaatcagc ctccggcaat tgcacgccaa gaagattgtc 6060

agacctgttt tatttgtgaa gcatattgtc ctgcagatgc gctgtatgtt gcaccgcaga 6120

gccataccaa tgttgcagtt aacgaagatg atttaatcga cagcggcatt atgggtgaat 6180

atcgtcgcat tctgggttgg ggctatggtc gtaaaaacaa tagcgaactg gataccgacc 6240

ataaactgcg tctgtttgaa tgagaaggag atatacatat gtcatttcag aaatttgtgc 6300

aagaagcagc ctataaagtc gcaccgttta aaccgaatcg ttttgccaaa attagcgagc 6360

gtgaagataa atgtgcaatt ccggttccgg catggcgtgc actgctggcc aatcgtgacc 6420

tgtttacctg gaaaggtatt ccgtttctga aaggttgtac cgaaattgca ctgtatagca 6480

tgctgctgta tgaactgcgt ccgaaaacga ttattgaaat tggtgcgctg agcggtggta 6540

gcgcaatttg gctggcagat catctggaac tgtttcagat tgaaggttgc gtgtattgca 6600

ttgatattga tctgtctctg ctggacgaaa aagcaaaaac cgatagccgt gttcattttc 6660

tggaaggtga ttgcaataat atgggtgcaa ttatgtcaag cgagctgctg agtggtctgg 6720

cacatccttg gctgattgtt gaagatgcac atgcaaatgc cgttggtgtg gttgaatatt 6780

ttcacgaaaa cggtctgaaa agtggcgatt acctgatcgt ggaagatacc aataaaacaa 6840

tgtgggaact ggatcgcgaa gaactggacc gtgatgacct ggatgaacaa gaactgatcg 6900

aaaaaggtga gcagaaatta gcagaactga aaagctggct gatgctgcat gagaatgaat 6960

atctgataga tacctactat caggatatgt atggctataa tggtagccgt aattggaaca 7020

gcattctgaa acgtgtggaa aagaactttt aatctaacta aaaacaccct aacgggtgtt 7080

ttttcttttc tggtctcccc gaagttccta ttctctagaa agtataggaa cttcgctgga 7140

ttgggccgcg aaattaaccg gcctgagcaa tgtcccagct ttaat 7185

<210> 94

<211> 5599

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 整合到大肠杆菌木糖操纵子中的sxt3片段版本3的序列

<400> 94

ggtgtcagga ggcgggaggg gacatctttc aggccattat tcagtgaggt ccagccttgc 60

aagaagcgga tacaggagtg caaaaaatgg ctatctctag aaaggcctac cccttaggct 120

ttatgcaaca gaaacaataa taatggagtc atgaacatgc tgaccgcaga acagaaacag 180

gcatatacca atgatggcta ttttaccgtg gaagaagcag ttccgaaagc actgattgaa 240

gaaattcgcc atgaagtgga actgatcacc gagcagaaac gtggtggtgt gctggcaggc 300

gattatgaat ggtggtcaga acacaccatt ccggatccgg ttcgttatca gaaaattatc 360

cagcgtctgc tggaactgcc gaccgttatg ggtccggttc aggccctgat tggtagcgat 420

atttttctgt taattaccga cctggcaatt attcgtgcag gcaccggtta tattgcatgg 480

catcaggatc atggctatgt tgttgaagtt ctgaacgccc tggcaagcat gagcaaaaat 540

gagctgaatg atgatgcact gcgcctgctg gtgccggttg caaatcaggc aatggtgttt 600

attaccatct atctgcagga taccgataac accatgggca ccatgcgtgt gattccgagc 660

agccatcagt gggaacatag tctggatagc agcagcgcca attcactgaa tgcagaaatt 720

tgtctgagcc tgcctggtgg tgcagcaatg ttttataccc cgaccgtttg gcataccgca 780

gcagcaaata ccagcattac cgattatcgt atgctgacgc tgatcttcac caaaaacaac 840

attaaaccgc tgctggttga tgccctgaaa cgtattattt gagaaggaga tatacatatg 900

acaaccaccg atccgatcct gattaataac tggcatgttg tggcaaatgt cgaggattgt 960

aaaccgggta gcattacccg tagccgttta ctgggtgtta aactggttct gtggcgtagc 1020

tatgaacaga atagcccgat tcaggtttgg ctggattatt gtccgcatcg tggtgttccg 1080

ctgagcatgg gtgaaattac caataatacc ctggtttgtc cgtatcatgg ctggcgttat 1140

aatgaagcag gtaaatgtat tcagattccg gcacatccgg gtatggttcc gcctgcaagc 1200

gcagaagcac gtacctatca tagccaagaa cgttatggtc tggtttgggt ttgtctgggt 1260

gatccggtta atgatattcc gtcatttccg gaatgggatg atccgaatta tcacaaaacc 1320

tacaccaaaa gctatctgat taaagcaagc gcctttcgcg ttatggataa ttcactggat 1380

gttagccatt ttccgtttat tcatgatggc tggctgggcg atcgtaacta taccaaagtg 1440

gaagaatttg aagtgaaact ggataaagat ggtctgacga tgggcaaata tcagtttcag 1500

accagccgta ttgtgagcca tattgaagat gatagctggg tgaattggtt tcgtctgagc 1560

catccgctgt gtcagtattg tgttagcgaa agtccggaaa tgcgtattgt tgatctgatg 1620

accattacgc cgattgatga agaaaatagc gttctgcgca tgctgatcat gtggaatggt 1680

tatgaaaccc tggaaagcaa aatgctgaca gagtatgatg aaacgatcga acaggatatt 1740

cgtattctgc atgcccagca gccggtgcgt ctgccgctgc tgacaccgaa gcagattaat 1800

acccagctgt ttagccatga aattcatgtt ccgagcgatc gttgtaccct ggcatatcgt 1860

cgttggctga aacaactggg tgtgacctat ggtgtttgtt gagaaggaga tatacatatg 1920

gcaggtaaac tggatggtaa ggttgcaatt attaccggtg caagcagcgg tattggtgaa 1980

gccaccgcat ttgcactggc agcagaaggt gcaaaagttg caattgcagc ccgtcgtgca 2040

gaactgttac atgcactggc caaacgtatt gaagcaagcg gtggtcaggc actgccgatt 2100

gttaccgata tcaccgatga aagccaggtt aatcatctgg ttcagaaaac caaagttgaa 2160

ctgggtcatg ttgatatcct ggtgaataat gcaggtattg gcgtttttgg tgcaatcgat 2220

accggtaatc cggcagattg gcgtcgtgca tttgatgtta atgtgctggg tgttctgtat 2280

gcaattcatg cagttctgcc tttactgaaa gcacagaaaa gcggtcatat tgtgaatatt 2340

agcagcgtgg atggtcgtat tgcacagagc ggtgcagttg tttatagcgc agcaaaaagc 2400

ggtgttaatg ccctgagcga agcactgcgt caagaagtga gcctggataa tattcgtgtg 2460

accattattg aaccgggtct ggtagatacc ccgtttaatg atctgattag tgatccgatt 2520

accaaacagc tgagcaaaga acagctgtca accattactc cgctgcagag cgaagatatt 2580

gcacgtgcca ttatctatgc agttacccag ccggatcatg ttaacgttaa tgaaattctg 2640

attcgtccga ccgcagagga taattgagaa ggagatatac atatgaacct gaccctgaac 2700

aaagaagaaa aacagctgct gacggcatat agcggcaccg aactgcagct gacagcagat 2760

gttctggtta ttggtggtgg tccggcagcc gcatgggcag cttgggcagc aggcgcacag 2820

ggtgtgaaag ttattattgt ggataaaggt tttctgggca ccagcggtgc cgcagccgca 2880

agcggtaata gcgttatggc accgtcaccg gaaaattggg aaaaagatgt gagcgaatgt 2940

tacagcaaag gtaataatct ggcaaatctg cgttggattg aacgtgttat tgaaaaagcc 3000

tggctgtcac tgccgctggt tgaagattgg ggttatcgtt ttcctaaaga aaatggtgaa 3060

agcgtgcgtc agagctatta tggtcctgaa tatatgcgtg ttctgcggaa aaatctgctg 3120

cgcgttggtg ttcagatctt tgatcagtca ccggcactgg aattactgct ggcacaggat 3180

ggtagcgttg ccggtgcacg tggtgtgcag cgtcagaatc atcgtacata taccgttcgt 3240

gccggtgccg ttgttctggc caatggtggt tgcgcatttc tgagtaaagc actgggttgt 3300

aataccaata ccggtgatgg tctgttaatg gcagttgaag ccggtggtga actgagcagt 3360

atggaagcca gcagccatta taccattagc accgccttta atgcaaccgt tacccgtgca 3420

gctccgtttt attgggcaag ctataccgat gaagctggca atgatctggg tggctatatt 3480

aacggtcgtc gtgatccgag ctttctgccg aacgcactgc tgaaaggtcc ggtttatgca 3540

cgtctggatc gtgcaacacc ggaaattcag gcgctggtag aaaaaagcca ttttattgca 3600

tttctgccgt acaagaaagc cggtattgat ccgtataccg aacgtgttcc ggttaccctg 3660

gtgctggaag gcaccgtgcg tggcaccggt ggtattcgca ttgttaatga ttcatgtggc 3720

accaaagttc cgggactgta tgcagcgggt gatgcagcaa gccgtgaatt tctggcaggc 3780

attgccagcg gtggtgatgg accgaatgca gcatgggcaa tttcaaccgg tcagtgggca 3840

ggcgaaggtg cagcagcctt tgcaaaaagt ctgggtgcac atgttcatga acgcgttgtt 3900

cgtccggcag gccaggcagg tctgcgtagt cagtatccgg gtagcgaaac ctttgatagt 3960

gaagcagttg ttcgtggcgt tcaggcagaa atgtttccgc tggaaaaaaa ctatctgcgc 4020

tgtgaacagg gactgctgga tagcctggca aaactggaaa tgctgtggca gcaggttcag 4080

ggtaatccga aacaggatac agttcgtgat ctggaatttt cacgtcgtgc ggcagcactg 4140

gttagcgtgg cacgttgggc atattttagc gcactgcatc gtaaagaaac ccgtagcgaa 4200

catatccgta ttgattaccc ggaaacggat ccgaatcaac tgtattatca ggcaaccggt 4260

ggcctggaac gtctgtgggt gcgtcgtgat tgggttaaag atgcaagcgc cacccctccg 4320

gtgctgacca cctgagaagg agatatacat atgattgaac tggtgagcca taagctgtgc 4380

attaattgta atgtttgtgt tcaggtgtgc ccgaccaatg tttttgatgc agtgccgaat 4440

cagcctccgg caattgcacg ccaagaagat tgtcagacct gttttatttg tgaagcatat 4500

tgtcctgcag atgcgctgta tgttgcaccg cagagccata ccaatgttgc agttaacgaa 4560

gatgatttaa tcgacagcgg cattatgggt gaatatcgtc gcattctggg ttggggctat 4620

ggtcgtaaaa acaatagcga actggatacc gaccataaac tgcgtctgtt tgaatgagaa 4680

ggagatatac atatgtcatt tcagaaattt gtgcaagaag cagcctataa agtcgcaccg 4740

tttaaaccga atcgttttgc caaaattagc gagcgtgaag ataaatgtgc aattccggtt 4800

ccggcatggc gtgcactgct ggccaatcgt gacctgttta cctggaaagg tattccgttt 4860

ctgaaaggtt gtaccgaaat tgcactgtat agcatgctgc tgtatgaact gcgtccgaaa 4920

acgattattg aaattggtgc gctgagcggt ggtagcgcaa tttggctggc agatcatctg 4980

gaactgtttc agattgaagg ttgcgtgtat tgcattgata ttgatctgtc tctgctggac 5040

gaaaaagcaa aaaccgatag ccgtgttcat tttctggaag gtgattgcaa taatatgggt 5100

gcaattatgt caagcgagct gctgagtggt ctggcacatc cttggctgat tgttgaagat 5160

gcacatgcaa atgccgttgg tgtggttgaa tattttcacg aaaacggtct gaaaagtggc 5220

gattacctga tcgtggaaga taccaataaa acaatgtggg aactggatcg cgaagaactg 5280

gaccgtgatg acctggatga acaagaactg atcgaaaaag gtgagcagaa attagcagaa 5340

ctgaaaagct ggctgatgct gcatgagaat gaatatctga tagataccta ctatcaggat 5400

atgtatggct ataatggtag ccgtaattgg aacagcattc tgaaacgtgt ggaaaagaac 5460

ttttaatcta actaaaaaca ccctaacggg tgttttttct tttctggtct ccccgaagtt 5520

cctattctct agaaagtata ggaacttcgc tggattgggc cgcgaaatta accggcctga 5580

gcaatgtccc agctttaat 5599

<210> 95

<211> 7064

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 整合到大肠杆菌乳糖操纵子中的sxt1片段的序列

<400> 95

atgaccatga ttacggattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct 60

ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc 120

gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc 180

tttgcctggt ttccggcacc agaagcggtg ccggaaagct ggctggagtg cgatcttcct 240

gaggccgata ctgtcgtcgt cccctcaaac tggcagatgc acggttacga tgcgcccatc 300

tacaccaacg tgacctatcc cattacggtc aatccgccgt ttgttcccac ggagaatccg 360

acgggttgtt actcgctcac atttaatgtt gatgaaagct ggctacagga aggccagacg 420

cgaattattt ttgatggcgt taactcggcg tttcatctgt ggtgcaacgg gcgctgggtc 480

ggttacggcc aggacagtca gtggagatgc ccaagggcac ttcgggtcga ggaacccgac 540

ctgcattggg acgcggccac ggagagcgcg ggcaaacgcc ggcactatag ccagtggagt 600

ttgtaaaacg ctatttcaga gcttggagag tgtctaagaa agccgggcga tgccaaccca 660

tcccttcttc ggctacgttc gtaatcaagc cacttccttt ttgcattgac gcagggtgtc 720

ggaaggcaac tcgccgaacg cgctcctata gttttcagcg aagcgtccca aatgtaagaa 780

gccgtagtct agggctatct cagttatact acgcacattg gcactgggat cgttcaagca 840

ggcgcggatg ctttcgagct tgcggttgcg gatgtagttc ttcggcgtgg tgccggcatg 900

cttctcgaac aaattgtaga gcgagcgtgg actcatcatc gccagctccg ctaaccgctc 960

aaggctgata ttccgtttga gattctcctc aatgaattga acgactcgct cgaaagacgg 1020

gttacctttg ctgaaaattt cacggctgac attgctgccc agcatttcga gcagcttgga 1080

agcgatgatc cccgcatagt gctcttggac ccgaggcatc gactttgtat gttccgcttc 1140

gtcacaaact aacccgagta gattgataaa gccatcgagt tgctggagat tgtgtcgcgc 1200

ggcgaaacgg ataccctccc tcggcttgtg ccaattgttg tcactgcatg cccgatcaag 1260

gaccactgag ggcaatttaa cgataaattt ctcgcaatct tctgaatagg tcaggtcggc 1320

ttggtcatcc ggattgagca gcaatagttc gcccggcgca aaatagtgct cctggccatg 1380

gccacgccac aggcaatggc ctttgagtat tatttgcaga tgataacagg tctctaatcc 1440

aggcgagatt accctcacgc taccgccgta gctgattcga cacaggtcga ggcatccgaa 1500

gattctgtgg tgcagcctgc ctgccggggg cccgcccttg ggcaggcgaa tagagtgcgt 1560

accgacatac tggttaacat aatcggagac tgcatagggc tcggcgtgga cgaagatctg 1620

acttttctcg ttcaataagc aaaaatccat agttcacggt tctcttattt taatgtgggc 1680

tgcttggtgt gatgtagaaa ggcgccaagt cgatgaaaat gcaggaatta attcgcagat 1740

cctggcggat gagagaagat tttcagcctg atacagatta aatcagaacg cagaagcggt 1800

ctgataaaac agaatttgcc tggcggcagt agcgcggtgg tcccacctga ccccatgccg 1860

aactcagaag tgaaacgccg tagcgccgat ggtagtgtgg ggtctcccca tgcgagagta 1920

gggaactgcc aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt 1980

tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgg gagcggattt 2040

gaacgttgcg aagcaacggc ccggagggtg gcgggcagga cgcccgccat aaactgccag 2100

gcatcaaatt aagcagaagg ccatcctgac ggatggcctt tttgcgtaga tcccagcctt 2160

gcaagaagcg gatacaggag tgcaaaaaat ggctatctct agaaaggcct accccttagg 2220

ctttatgcaa cagaaacaat aataatggag tcatgaacat gctgcagaaa atcaatcgtt 2280

atacccatgg ttttgttgcc gttccggtta ttctggcatg tcgtgaaaaa ggtgtttttg 2340

aactgctggc agatgaaagt ccgctgagcc tgaatcagat ggttgaacat ctgggtgcca 2400

atagcggtca ttttcaggtt gcactgcgta tgctggaaag tctgcattgg ctgagccgta 2460

ataaagaact gaaatatagc ctgaccgcag aagcagcaat tcataacaaa attagcgaag 2520

atatcctgca gctgtataat ctgccgattc agagctatct ggaaggtaaa cagggcaatc 2580

tgctgggtcg ttggattgaa cgtagctgtc agctgtggaa tctggataat ccgctgatgg 2640

cagattttct ggatggtctg ctggttattc cgctgctgct ggcactgcat aaacataacc 2700

tgctggccga ttctgaagat aaaccgctgc tgagcagcct gagcagtacc gttcaagaag 2760

aactgggtaa actgtttctg catctgggtt gggcagatct gacagcaggt cgtctgacca 2820

ttaccgaact gggtcgcttt atgggtgaac gtgcactgaa taccgcaatt gttgcaagct 2880

ataccccgat gctgagtcgt attcatgatg ttctgtttgg taattgcctg agcgtttttc 2940

agcgtgatgc aagcggtcat gaacgtcata ttgatcgtac cctgaatgtt attggtagcg 3000

gttttcagca ccagaaatac tttgcagatc tggaagaaag cattctgagc gtgtttaatc 3060

agctgccgct ggaagaacag ccgaaataca ttaccgatat gggttgtggt gatggcaccc 3120

tgctgaaacg tgtttgggaa accattcagt ttaaaagcgc acgtggtaaa gcactggaac 3180

agtatccgct gcgtctgatt ggtgttgatt ataatgaagc aagcctgaaa gcaaccaccc 3240

gtaccctggc aagcctgccg catctggttc tgcagggtga tattggtaat ccggaacaaa 3300

tggttcgtag cctggaagca catggcattc atgatccgga aaatattctg catattcgca 3360

gctttctgga tcacgatcgt ctgtttattc cgcctcagaa acgtaatgaa ctgaaagaac 3420

gtgcccatct gccgtatcag agtgtttgtg ttgatgatca gggtgaactg attcctccgc 3480

atgttatggt tcagagcctg gtggaacacc tggaacgttg gagccaggtt gttaataaac 3540

atggtctgat gattctggaa gtgcattgtc tggaaccgcg tgttgtttat cagtttctgg 3600

ataaaagcga aaacctgcac tttgatgcat ttcagggttt tagccagcag tatctggttg 3660

aagccgaagt ttttctgatg agcgcagcac aggttggtct gtttccgaaa ctggaactga 3720

gcaaacgtta tccgaaaacc tttccgttta cccgtattac cctgaactat ttcgaaaaac 3780

gtccgtacaa aatcagccat gcatatctga gcgatctgcc tgcactggtt gacctggaag 3840

ttaaatgttg gcctgagaat ctgcgtgcaa gcacccatga aattcgtcgt cgtctggaac 3900

tgaatccgca gggtaacctg gttctgatta ttgaagatca gattatcggt gccatttaca 3960

gccagaccat tacaagcacc gaagccctgg aaaatgttaa atatgcacag gttccgaccc 4020

tgcatacacc gcagggttca gtgattcagc tgctggccct gaacattctg ccggaatttc 4080

aggcacgtgg tctgggcaat gaactgcgtg attttatgct gtattattgc accctgaaag 4140

gtggtattga aagcgttgtt ggtgttaccc gttgtcgcaa ttatgtgaat tatagccaga 4200

tgccgatgat ggaatatctg aaactgcata atgaacagcg tcaactgctg gatccgattg 4260

ttggttttca tgttagcggt ggtgcagaaa ttcgtggcat tattgcaaat tatcgtccgg 4320

aagatacaga taatctgggt atgggtattc tgatcgaata taacctgcgt gatagcgcac 4380

tgcattcacc gggtgatcgt aaaggtccgt atatcaatag cgcaattggt agcctggttc 4440

cgaaagcgac cagcgcaacc aaagaaaaca aaaccgttgc ggatctggtg aaagaatgta 4500

ttctgaaagt gatgggtagc cagcgtcagg cagcatatgc accgcagcag aaactgctgg 4560

acatgggtct ggatagcctg gatctgctgg aactgcagac cctgctggaa gaacgtctgg 4620

gtattaatct gagcggcacc ttttttctgc aaaaaaacac cccgaccgcc atcattacct 4680

attttcagaa tcaggtcgtg caagagaaac agagtgatct ggcaccgcct gttgatagcg 4740

ccaatgaaat caatacactg gaaaacgttg tgaatcagca gaaaattccg caggttacac 4800

gtgttgttac cgaacagcag ggacgtaaag ttctgattga tggtcattgg gttattgatt 4860

ttgccagctg taattatctg ggcctggacc tgcatccgaa agttaaagaa gcaattcctc 4920

cggcactgga taaatggggc acccatccga gctggacccg tctggttgca agtccggcaa 4980

tttatgagga actggaagag gaactgtcaa aactgctggg tgtgccggat gttctggttt 5040

ttccggcagt tacactgctg cagattggta ttctgcctct gctgaccggt aataatggtg 5100

tgatttttgg cgatattgca gcccatcgtt gtatttatga agcatgttgt ctggcccagc 5160

ataaaggtgc acagtttatt cagtatcgtc ataacgacct gaatgatctg gccgaaaaac 5220

tggccaaata tccgcctgaa caggttaaaa tcattgtgat cgatggtgtg tatagcatga 5280

gtgccgattt cccggacctg cctgcatatg ttcatctggc aaaagaatat aacgccctga 5340

tctatatgga tgatgcacat ggctttggca ttctgggtga aaatccgagc agcgatatgc 5400

cgtatggtta taaaggtaat ggcatggtga actactttga tctgcgtttt gccgaagata 5460

acatcattta tgttgcaggt ctgagcaaag cctatagcag ctatgcagca tttctgacct 5520

gtggtgatcg tcgtattaaa accaattttc gtaatgcatg gaccgcgatt tttagcggtc 5580

cgagtccggt tgcaagcctg gccagcgcac tggcaggtct gcaggttaat cgtcaagaag 5640

gtgaacagct gcgcaaacaa atctatcatc tgacacataa actggttacc caggctcgtg 5700

ccattggttt tgaagttgat aattatggtt atgtgccgat tgtgggtgtt ctggtgggtg 5760

atgcacagca tatgattgat gtgtgccaac tgctgtggga atatggtatc ctgattaccc 5820

ctgcaatttt tccgattgtg ccgctgaata aatcagcact gcgttttagc attaccgcag 5880

caaataccga agaagaaatt gatcaggcca tcaaaagtct gaaagcagtt tgggacctgc 5940

tgcaaaaacg taaagccctg ccgtgtaaac aagaagaaaa tatcctgaaa cattgagaag 6000

gagatataca tatgacccat gttgccctgg aacaggcaat tgcaaaagtt ccgcgtagca 6060

ttcagagcga actgcgtacc attctggcac agcatgcagt tattgatagc agcgttgtgg 6120

caagctggat tgatcgtctg ggcaccaata ttagtaccct gatgatccag ctgctgccgg 6180

ttgcagcaac ctatgcacgt gttccgatta gccagtttta tgttggtgcc attgcactgg 6240

gcaaaccgca gagtaaaaat cagctgggta gcggcaccct gtattttggt gcagatatgg 6300

aatttgttgg tcaggcactg agctttagcg ttcatgcaga acagagcgcc accattaatg 6360

cctggctgca tggcgaaacc ggactgcagg cactggcaat ccatgaagca ccgtgtggtt 6420

attgtcgcca gtttctgtat gaaatggcaa ccgtgaatca gaattttgtg ctgctggtga 6480

aaagcaatga aagccagccg gaacagacct ataccagcaa caaactgccg cattttctgc 6540

ctgaaccgtt tggtccagcc gatctgggtc tgaccggtgg cctgatgcag accgtgtttc 6600

acgatctgga aacctatagc accgatgatg ttgttctggc agcactgagt gcagcaaatc 6660

agagttatgc accgtatacc aaaaactttg ccggtgttgc actgaaagat agtcatggta 6720

acatttttac aggtcgctat gccgaaaacg cagcatttaa tagcagcatg agcccgatgg 6780

aaagcgcact gacctttatg aatatgaatc gttattcaca gagcctgttc gatatttgtg 6840

atgcagttct ggtagaagtg gaaaccggta ttagtcagcg tccggttacc gaagcctttc 6900

tgagtagcat tgcaccgaaa gtgaaactgc gctatgcacc ggcaaccccg agcagtaaca 6960

aactgtgact cggtaccaaa ttccagaaaa gaggcctccc gaaagggggg ccttttttcg 7020

ttttggtccc gaagttccta ttctctagaa agtataggaa cttc 7064

<210> 96

<211> 4413

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 整合到大肠杆菌蜜二糖操纵子中的sxt4片段的序列

<400> 96

aagcctgccg tcagggcaat atcgagaata cttttatcgg tatcgctcag ccagccttgc 60

aagaagcgga tacaggagtg caaaaaatgg ctatctctag aaaggcctac cccttaggct 120

ttatgcaaca gaaacaataa taatggagtc atgaacatat ggaaaccacg agcaaaaaat 180

tcaaaagcga tctgattctg gaagcacgtg caagcctgaa actgggtatt ccgctggtta 240

ttagccagat gtgtgaaacc ggtatttata ccgcaaatgc agttatgatg ggtctgctgg 300

gcacccaggt tctggcagcc ggtgctctgg gtgcactggc atttctgacc ctgctgtttg 360

catgtcatgg tattctgagc gttggtggta gcctggcagc ggaagcattt ggtgcaaaca 420

aaattgatga agttagccgt attgcaagcg gtcagatttg gctggcagtt accctgagcc 480

tgcctgcaat gctgctgctg tggcatggtg ataccattct gctgttattt ggtcaagaag 540

aaagcaacgt tctgctgacc aaaacctatc tgcatagcat tctgtggggt tttccggcag 600

cactgagtat tctgacactg cgtggtattg ccagcgcact gaatgttccg cgtctgatta 660

ccattaccat gctgacccag ctgattctga ataccgcagc agattatgtt ctgatctttg 720

gtaaatttgg tctgccgcag ctgggtctgg caggtattgg ttgggcaacc gcactgggtt 780

tttgggttag ctttaccctg ggtctgatcc tgctgatttt tagcctgaaa gtgcgtgatt 840

ataaactgtt tcgttatctg caccagttcg acaagcagat ctttgtgaaa atctttcaga 900

ccggttggcc gatgggtttt cagtggggtg cagaaacagc actgtttaat gttaccgcat 960

gggttgcagg ttatctgggc accgttaccc tggcagcaca tgatattggt tttcagacag 1020

cagaactggc aatggttatc ccgctgggtg ttggtaatgt tgcaatgacc cgtgttggtc 1080

agagcattgg tgaaaaaaat ccactgggtg cccgtcgtgt tgcaagcatt ggtattacca 1140

ttgttggtat ttatgccagc attgttgccc tggttttttg gctgtttccg tatcagattg 1200

caggcattta tctgaacatt aataacccgg aaaacattga agccatcaaa aaagccacca 1260

cctttattcc actggcaggt ctgtttcaga tgttttatag cattcagatc attatcgttg 1320

gtgcgctggt tggtctgcgt gatacctttg ttccggttag catgaatctg attgtttggg 1380

gtctgggttt agcaggtagc tattttatgg caattattct gggttggggt ggtattggta 1440

tctggctggc catggttctg agtccgctgc tgagcgcagt tattctgacc gttcgttttt 1500

atcgcgtgat tgataatctg ctggccaaca gtgatgatat gctgcagaat gcaagcgtta 1560

ccaccctggg atgagaagga gatatacata tgaaacgtct gacgctgctg atcattgcag 1620

gtattctgtc agttagcacc tttctgtgta ttacaccggt tgcactggcc aatattaccg 1680

attattatct gaaaaacgag aaactgagcg gtcagtttag cgttccggtg aatctgtctg 1740

ttggtgttcg ttttgcacat cgtagcagct atgcaaccgc aattaacttt ccgaccggtc 1800

tggatgcaga tagcgttgca gttggtgatt ttaacagcga tagcaaactg gatctggccg 1860

ttaccaattg gtttgataac aatgttagcg tgctgctggg taatggcaat ggcagctttg 1920

gtgcagcaac caattttccg gttggcacca atccggtttt tgttgttacc ggtgatgtta 1980

atggtgacag taaactggat ttagccgtgg caaattttag cagcaataat gtttcagttc 2040

tgctgggaaa cggtaatggt tcttttggcg cagccacaaa ctttagcgtt ggtacaaatc 2100

cgtatagcgt ggccattggt gatgtgaata atgatagtga actggacctg gcatttacga 2160

actggttcga taataaagtt ctggtgctgt taggcaatgg taatggctcg tttggtgccg 2220

caagctcatt tccggtggat acctatagca ttagcgttgc gattgcagat ttcaactcag 2280

attctaaatt agacctggcg atcaccaatt gggtgtcaaa taatgtgagt gtgttactgg 2340

ggaatggtaa cggtagtttt ggagctgcga caaattttcc tgtgggtaca aacccgattt 2400

ttgtggcaac cggtgacgtg aatggcgatt ctaagctgga cttagcagtt gcaaatacca 2460

gctctaataa cgttagcgtt ctgttaggta acgggaacgg ctcattcggt gctgccacga 2520

attttccagc aggcaccaac ccgtatagtg ttgcaattcg cgacgttaac ggtgatagca 2580

aattagattt agcggtgacc aactatagca gcaacaacgt gagtgttctg ccaggcaacg 2640

gtaacggatc atttggtatt gcgaccaact ttccagtagg tacgaatccg gaaagcattg 2700

caattgccga ttttaatggg gattccaagt tagatctggc agtgacaaat agcggtaaca 2760

ataatgtaag catactgctg aataactttc agggtctgcc gaaaaacaag atttgagaag 2820

gagatataca tatgaccaat accgaacgtg gtctggccga aattaccagc accggttata 2880

aaagcgaact gcgtagcgaa gcccgtgtta gcctgcagct ggcaattcct ctggttctgg 2940

ttgaaatttg tggcaccagc attaatgttg ttgatgttgt gatgatgggt ttactgggta 3000

cacaagtgtt agcagcgggt gccctgggag caattgcctt cctgagcgtt agcaatacct 3060

gctataatat gctgctgagt ggtgttgcaa aagcaagcga agcctttgga gccaataaaa 3120

tcgatcaggt ttcacgtatt gcctcaggcc agatttggtt agccctgacc ctgtcattac 3180

cagccatgct gttactgtgg tatatggata ccatcctggt tctgtttggt caggttgaaa 3240

gcaataccct gattgcgaaa acatacctgc attcaattgt gtggggcttt cctgccgcag 3300

ttggtatcct gattctgcgt ggcatagcaa gtgcagttaa cgttcctcag ctggttaccg 3360

tgaccatgct ggttggcctg gtgctgaatg caccggctaa ttatgtgctg atgttcggca 3420

aattcggttt accggaatta ggcctggctg gcattggctg ggccagcaca ctggtgtttt 3480

ggattagttt tctggttggt gttgtgctgc tgatattttc accgaaagtt cgcgactaca 3540

aactgttccg ctatttacat cagtttgatc gtcagaccgt ggttgagatt tttcagacgg 3600

gctggcctat gggcttcctg ctgggtgtgg aaagcgttgt tctgagcctg accgcatggc 3660

tgaccggcta tctgggtaca gtgaccttag cagcccatga aattgcaatc cagactgccg 3720

aactggcgat tgtgattccg ttaggtattg gcaatgttgc cgttacccgt gtgggccaga 3780

caatcggcga aaaaaacccg ctgggagcac gccgtgcagc cctgattggc attatgattg 3840

gtggcattta tgcgagcctg gttgcagtga ttttttggtt attcccttat caaatcgcag 3900

gcctgtacct gaaaattaac gatccggaat caatggaagc agttaaaacc gcaacaaact 3960

ttctgttttt agctggcctg ttccagtttt ttcatagcgt gcagattatt gttgtgggtg 4020

ttctgattgg cctgcaggat acctttatcc ctctgctgat gaatctggtg ggctggggac 4080

tgggcctggc ggtttcctat tatatgggta ttatcctgtg ctggggtggc atgggcatct 4140

ggttaggtct ggtactgtca ccgctgctgt caggcctgat cctgatggtg cgcttttatc 4200

aagaaattgc caatcgcatt gcgaatagcg acgatggcca agaaagcatt agcattgata 4260

atgttgaaga actgagctaa tagaccaacc ccttgcggcc tcaatcgggg gggatggggt 4320

tttttgtcga agttcctatt ctctagaaag tataggaact tcgcaaccgt ctgctgaagg 4380

aagccatctg acacttaaag ccatcgttgc gct 4413

<210> 97

<211> 7377

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 整合到大肠杆菌麦芽糖操纵子中的sxt2片段的序列

<400> 97

ctgtgaacta aaccgaggtc atgtaaggaa tttcgtgatg ttgcttgcaa ccagccttgc 60

aagaagcgga tacaggagtg caaaaaatgg ctatctctag aaaggcctac cccttaggct 120

ttatgcaaca gaaacaataa taatggagtc atgaacatga ttgataccat tagcgttctg 180

ctgcgtgaat ggaccgttat ttttctgacc ggtctggcat tttggctgtg ggaaattcgt 240

agtccgctgc atcagattga atacaaagcc aaatttttca aagaactggg ttgggcaggt 300

atcagctttg tttttcgtat tgtttatgcc tatgttagcg tggccattat caaactgctg 360

agcagcctgt ttatgggtga aagcgcaaat tttgccggtg ttatgtatgt tccgctgtgg 420

ctgcgtatta ttaccgcata tattctgcag gatctgaccg attatctgct gcatcgtacc 480

atgcatagca atcagtttct gtggctgacc cataaatggc atcatagcac caaacagagt 540

tggtggctga gcggtaataa agatagcttt accggtggtc tgctgtatac cgttaccgca 600

ctgtggtttc cgctgctgga tattccgagc gaagttatga gcgttgttgc agttcatcag 660

gtgattcata acaactggat tcacctgaat gtgaaatgga atagctggct gggtattatc 720

gaatggattt atgttacacc gcgtatccat accctgcatc atctggatac cggtggtcgt 780

aatctgagca gtatgtttac ctttattgat cgtctgtttg gcacctatgt gtttccggaa 840

aactttgata tcgaaaaaag caaaaaccgc ctggatgatc agagcgttac cgttaaaacc 900

attctgggtt tctgagaagg agatatacat atgctgaaag attttaacca gttcctgatt 960

cgtaccctgg catttgtttt tgcctttggc atttttctga caaccggtgt tggtattgca 1020

aaagcagatt atctggtgaa aggtggcaaa attaccaatg ttcagaatac cagcagcaac 1080

ggtgataatt atgcagttag cattagcggt ggttttggtc cgtgtgcaga tcgtgttatt 1140

attctgccga ccagcggtgt tattaatcgt gatattcaca tgcgtggtta tgaagcagca 1200

ctgaccgcac tgagcaatgg ttttctggtt gatatctatg attataccgg tagcagctgt 1260

agcaatggtg gccagctgac cattaccaat cagctgggta aactgattag caattgagaa 1320

ggagatatac atatgaccaa tcagaacaac caagagctgg aaaatgatct gccgattgca 1380

aaacagccgt gtccggttaa tagctataat gaatgggata ccctggaaga agttattgtt 1440

ggtagcgttg aaggtgcaat gctgcctgca ctggaaccga ttaacaaatg gacctttccg 1500

tttgaagaac tggaaagcgc acagaaaatt ctgagcgaac gtggtggtgt tccgtatccg 1560

cctgaaatga ttaccctggc acataaagaa ctgaacgagt ttattcatat cctggaagcc 1620

gaaggtgtta aagttcgtcg tgttaaaccg gttgatttta gcgttccgtt tagcacaccg 1680

gcatggcagg ttggtagcgg tttttgtgca gcaaatccgc gtgatgtttt tctggttatt 1740

ggcaacgaaa ttatcgaagc accgatggca gatcgtaatc gttattttga aacctgggca 1800

tatcgcgaaa tgctgaaaga atattttcag gcaggcgcaa aatggaccgc agcaccgaaa 1860

ccgcagctgt ttgatgcaca gtatgatttc aattttcagt ttccgcagct gggtgaaccg 1920

cctcgttttg ttgttaccga atttgaaccg acctttgatg cagccgattt tgttcgttgt 1980

ggtcgtgata tttttggcca gaaaagccat gttaccaatg gtctgggtat tgaatggctg 2040

cagcgtcatc tggaagatga atatcgcatt catatcatcg aaagccattg tccggaagca 2100

ctgcatattg ataccaccct gatgccgctg gcaccgggta aaattctggt taatccggaa 2160

tttgtggacg tgaataaact gccgaaaatt ctgaaaagct gggatattct ggttgcaccg 2220

tatccgaatc atattccgca gaatcagctg cgtctggtta gcgaatgggc aggtctgaat 2280

gttctgatgc tggatgaaga acgtgtgatc gtggaaaaaa atcaagagca gatgatcaaa 2340

gccctgaaag attggggttt taaaccgatt gtttgccact tcgaaagcta ttatccgttt 2400

ctgggtagct ttcattgtgc aaccctggat gttcgtcgtc gtggcaccct gcagagctat 2460

ttttgagaag gagatataca tatgacgacc gcagatctga ttctgatcaa taattggtat 2520

gttgtggcca aggtggaaga ttgtaaaccg ggtagcatta ccaccgcact gctgctgggt 2580

gttaaactgg ttctgtggcg tagccgtgaa cagaatagcc cgattcagat ttggcaggat 2640

tattgtccgc atcgtggtgt tgcactgagc atgggtgaaa ttgtgaataa taccctggtt 2700

tgtccgtatc atggttggcg ttataatcag gcaggtaaat gtgttcatat tccggcacat 2760

ccggatatga cccctccggc aagcgcacag gcaaaaatct atcattgtca agaacgttat 2820

ggtctggttt gggtttgtct gggtgatccg gttaatgata ttccgagtct gccggaatgg 2880

gatgatccga attatcataa tacctgcacc aagagctact ttatccaggc aagcgcattt 2940

cgtgtgatgg ataactttat tgatgtgagc cattttccgt ttgtgcatga tggtggtctg 3000

ggcgatcgta atcatgcaca gattgaagaa tttgaggtga aagtggataa agacggtatt 3060

agcattggca atctgaaact gcagatgcct cgttttaata gcagcaatga agatgatagc 3120

tggaccctgt atcagcgtat tagccatccg ctgtgtcagt attatatcac cgaaagcagc 3180

gaaattcgta cagcagatct gatgctggtt accccgattg atgaagataa ttcactggtt 3240

cgtatgctgg tgacctggaa tcgtagcgaa attctggaaa gcaccgttct ggaagaattt 3300

gatgaaacca ttgaacagga tatcccgatt attcatagcc agcagcctgc acgtctgccg 3360

ctgctgccga gcaagcagat taatatgcag tggctgagcc aagaaattca tgttccgagc 3420

gatcgttgta ccgttgcata tcgtcgttgg ctgaaagaac tgggcgttac ctatggtgtt 3480

tgttgagaag gagatataca tatgcagatt ctgggtatca gcgcctatta tcatgatagc 3540

gcagcagcaa tggttattga tggtgaaatt gttgcagcag cacaagaaga acgttttagc 3600

cgtcgtaaac atgatgcagg ttttccgacc ggtgcaatta cctattgtct gaaacaggtt 3660

ggcaccaaac tgcagtatat tgatcagatc gtgttctatg ataaaccgct ggtgaaattt 3720

gaacgtctgc tggaaaccta tctggcctat gcaccgaaag gttttggtag ttttattacc 3780

gcaatgccgg tgtggctgaa agagaaactg tatctgaaaa ccctgctgaa aaaagaactg 3840

gcactgctgg gtgaatgtaa agcaagccag ctgcctccgc tgctgtttac cagccatcat 3900

caggcacatg cagcagcagc attttttccg agcccgtttc agcgtgcagc agttctgtgt 3960

ctggatggtg ttggtgaatg ggcaaccacc agtgtttggc tgggtgaagg taataaactg 4020

acaccgcagt gggaaattga ttttccgcat agcctgggcc tgctgtatag cgcatttacc 4080

tattataccg gctttaaagt gaacagcggt gagtataaac tgatgggtct ggcaccgtat 4140

ggtgaaccga aatatgttga tcagattctg aaacatctgc tggatctgaa agaagatggc 4200

acctttcgtc tgaacatgga ttatttcaat tataccgttg gtctgaccat gaccaaccat 4260

aaatttcata gcatgtttgg tggtccgcct cgtcaggcag aaggtaaaat tagccagcgt 4320

gatatggatc tggcaagcag cattcagaaa gttaccgaag aagtgattct gcgtctggca 4380

cgtaccatta agaaagaatt aggtgttgaa tacctgtgtc tggcaggcgg tgttggtctg 4440

aattgtgttg caaatggtcg tattctgcgt gagagcgatt ttaaagatat ttggattcag 4500

cctgcagccg gtgatgcagg tagcgcagtt ggtgcagcac tggcaatttg gcatgaatat 4560

cataaaaaac cgcgtaccag caccgcaggc gatcgtatga aaggtagcta tctgggtccg 4620

agctttagcg aagcagaaat tctgcagttt ctgaacagcg tgaatattcc gtatcatcgt 4680

tgtgtggata atgaactgat ggcacgtctg gcggaaattc tggatcaggg taatgttgtt 4740

ggttggttta gcggtcgtat ggaatttggt ccgcgtgcac tgggtggtcg tagcattatt 4800

ggtgatagcc gtagcccgaa aatgcagagc gttatgaatc tgaaaatcaa atatcgcgaa 4860

agcttccgtc cgtttgcacc gagcgttctg gcagaacgtg ttagcgatta ttttgatctg 4920

gatcgtccga gcccgtatat gctgctggtt gcacaggtta aagaaaatct gcatattccg 4980

atgacccaag aacagcatga actgtttggt atcgaaaaac tgaatgttcc gcgtagccag 5040

attccggcag ttacccatgt tgattatagc gcacgtattc agaccgttca taaagaaacc 5100

aatccgcgtt attatgaact gatccgtcat tttgaagcac gtaccggttg tgcagttctg 5160

gttaatacca gctttaatgt tcgtggtgaa ccgattgtgt gtacaccgga agatgcatat 5220

cgttgtttta tgcgtaccga gatggattac ctggtgatgg aaaattttct gctggtgaaa 5280

agcgaacagc ctcgtggtaa tagtgatgaa agctggcaga aagaatttga gctggattga 5340

gaaggagata tacatatgga acaaattaaa gaactggata agaaaggcct gcgtgaattt 5400

ggtctgattg gtggtagcat tgttgccgtt ctgtttggtt ttctgctgcc ggttattcgt 5460

catcatagcc tgagcgttat tccgtgggtt gttgcaggtt ttctgtggat ttgggcaatt 5520

attgcaccga ccaccctgag ctttatctat cagatttgga tgcgtattgg tctggtgctg 5580

ggttggattc agacccgtat tattctgggt gttctgttct atattatgat taccccgatc 5640

ggttttattc gtcgtctgct gaatcaggat ccgatgaccc gtatttttga accggaactg 5700

ccgacctatc gtcagctgag caaaagccgt accacccaga gcatggaaaa accgttctga 5760

gaaggagata tacatatgtt aaaagacacc tgggatttta tcaaggatat cgcaggcttt 5820

atcaaagaac agaaaaacta tctgctgatt ccgctgatta ttaccctggt tagcctgggt 5880

gcactgattg tttttgcaca gagcagcgca attgcaccgt ttatctatac cctgttttga 5940

gaaggagata tacatatgag caacttcaaa ggcagcgtta aaattgcact gatgggcatt 6000

ctgatttttt gcggtctgat ttttggtgtg gcctttgttg aaattggtct gcgtattgca 6060

ggcattgaac atattgcctt tcatagcatt gatgaacatc gtggttgggt tggtcgtccg 6120

catgttagcg gttggtatcg taccgaaggt gaagcacata ttcagatgaa tagtgatggt 6180

tttcgtgatc gcgaacacat taaagtgaaa ccggaaaata cctttcgtat tgccctgctg 6240

ggtgatagct ttgttgaaag catgcaggtt ccgctggaac agaatctggc agcagttatt 6300

gaaggcgaaa ttagcagctg tattgcactg gcaggtcgta aagccgaagt tattaacttt 6360

ggtgttaccg gttatggcac cgatcaagaa ctgattaccc tgcgtgaaaa agtgtgggat 6420

tatagtccgg atattgttgt gctggatttc tataccggta acgatattgt tgataatagc 6480

cgtgcactgt cccagaaatt ctatccgaat gaactgggta gcctgaaacc gttttttatc 6540

ctgcgtgatg gtaatctggt tgttgatgca agctttatca acaccgataa ctatcgtagc 6600

aaactgacct ggtggggtaa aacctatatg aaaatcaaag atcatagccg cattctgcag 6660

gtcctgaata tggttcgtga tgcactgaat aatagcagcc gtggttttag cagccaggca 6720

attgaagaac cgctgtttag tgatggtaaa caggatacca aactgagcgg cttcttcgat 6780

atctataaac cgcctaccga tccggaatgg cagcaggcct ggcaggttac cgaaaaactg 6840

attagtagca tgcagcatga agtgaccgcc aaaaaagccg attttctggt tgttaccttt 6900

ggcggtccgt ttcagcgcga accgctggtt cgtcagaaag aaatgcaaga actgggtctg 6960

accgattggt tttatccgga aaaacgtatt acccgtctgg gtgaagatga aggttttagc 7020

gtgctgaatc tgagcccgaa tctgcaggtt tatagcgaac agaataatgc ctgtctgtat 7080

ggttttgatg atacccaggg ttgtgttggt cattggaatg cactgggtca tcaggttgca 7140

ggtaaaatga ttgcaagcaa aatttgtcag cagcagatgc gtgaaagcat tctgccgcat 7200

aaacatgatc cgagcagcca gagcagcccg attacccaga gcgttattca gtaatactct 7260

aaccccatcg gccgtcttag gggttttttg tcgaagttcc tattctctag aaagtatagg 7320

aacttcgacc tgtggggtga ctttgccgcc gctgccgtga tgtctgcatt accgatc 7377

<210> 98

<211> 6062

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 缺失sxtL后整合到麦芽糖操纵子中的sxt2片段的序列

<400> 98

ctgtgaacta aaccgaggtc atgtaaggaa tttcgtgatg ttgcttgcaa ccagccttgc 60

aagaagcgga tacaggagtg caaaaaatgg ctatctctag aaaggcctac cccttaggct 120

ttatgcaaca gaaacaataa taatggagtc atgaacatga ttgataccat tagcgttctg 180

ctgcgtgaat ggaccgttat ttttctgacc ggtctggcat tttggctgtg ggaaattcgt 240

agtccgctgc atcagattga atacaaagcc aaatttttca aagaactggg ttgggcaggt 300

atcagctttg tttttcgtat tgtttatgcc tatgttagcg tggccattat caaactgctg 360

agcagcctgt ttatgggtga aagcgcaaat tttgccggtg ttatgtatgt tccgctgtgg 420

ctgcgtatta ttaccgcata tattctgcag gatctgaccg attatctgct gcatcgtacc 480

atgcatagca atcagtttct gtggctgacc cataaatggc atcatagcac caaacagagt 540

tggtggctga gcggtaataa agatagcttt accggtggtc tgctgtatac cgttaccgca 600

ctgtggtttc cgctgctgga tattccgagc gaagttatga gcgttgttgc agttcatcag 660

gtgattcata acaactggat tcacctgaat gtgaaatgga atagctggct gggtattatc 720

gaatggattt atgttacacc gcgtatccat accctgcatc atctggatac cggtggtcgt 780

aatctgagca gtatgtttac ctttattgat cgtctgtttg gcacctatgt gtttccggaa 840

aactttgata tcgaaaaaag caaaaaccgc ctggatgatc agagcgttac cgttaaaacc 900

attctgggtt tctgagaagg agatatacat atgctgaaag attttaacca gttcctgatt 960

cgtaccctgg catttgtttt tgcctttggc atttttctga caaccggtgt tggtattgca 1020

aaagcagatt atctggtgaa aggtggcaaa attaccaatg ttcagaatac cagcagcaac 1080

ggtgataatt atgcagttag cattagcggt ggttttggtc cgtgtgcaga tcgtgttatt 1140

attctgccga ccagcggtgt tattaatcgt gatattcaca tgcgtggtta tgaagcagca 1200

ctgaccgcac tgagcaatgg ttttctggtt gatatctatg attataccgg tagcagctgt 1260

agcaatggtg gccagctgac cattaccaat cagctgggta aactgattag caattgagaa 1320

ggagatatac atatgaccaa tcagaacaac caagagctgg aaaatgatct gccgattgca 1380

aaacagccgt gtccggttaa tagctataat gaatgggata ccctggaaga agttattgtt 1440

ggtagcgttg aaggtgcaat gctgcctgca ctggaaccga ttaacaaatg gacctttccg 1500

tttgaagaac tggaaagcgc acagaaaatt ctgagcgaac gtggtggtgt tccgtatccg 1560

cctgaaatga ttaccctggc acataaagaa ctgaacgagt ttattcatat cctggaagcc 1620

gaaggtgtta aagttcgtcg tgttaaaccg gttgatttta gcgttccgtt tagcacaccg 1680

gcatggcagg ttggtagcgg tttttgtgca gcaaatccgc gtgatgtttt tctggttatt 1740

ggcaacgaaa ttatcgaagc accgatggca gatcgtaatc gttattttga aacctgggca 1800

tatcgcgaaa tgctgaaaga atattttcag gcaggcgcaa aatggaccgc agcaccgaaa 1860

ccgcagctgt ttgatgcaca gtatgatttc aattttcagt ttccgcagct gggtgaaccg 1920

cctcgttttg ttgttaccga atttgaaccg acctttgatg cagccgattt tgttcgttgt 1980

ggtcgtgata tttttggcca gaaaagccat gttaccaatg gtctgggtat tgaatggctg 2040

cagcgtcatc tggaagatga atatcgcatt catatcatcg aaagccattg tccggaagca 2100

ctgcatattg ataccaccct gatgccgctg gcaccgggta aaattctggt taatccggaa 2160

tttgtggacg tgaataaact gccgaaaatt ctgaaaagct gggatattct ggttgcaccg 2220

tatccgaatc atattccgca gaatcagctg cgtctggtta gcgaatgggc aggtctgaat 2280

gttctgatgc tggatgaaga acgtgtgatc gtggaaaaaa atcaagagca gatgatcaaa 2340

gccctgaaag attggggttt taaaccgatt gtttgccact tcgaaagcta ttatccgttt 2400

ctgggtagct ttcattgtgc aaccctggat gttcgtcgtc gtggcaccct gcagagctat 2460

ttttgagaag gagatataca tatgacgacc gcagatctga ttctgatcaa taattggtat 2520

gttgtggcca aggtggaaga ttgtaaaccg ggtagcatta ccaccgcact gctgctgggt 2580

gttaaactgg ttctgtggcg tagccgtgaa cagaatagcc cgattcagat ttggcaggat 2640

tattgtccgc atcgtggtgt tgcactgagc atgggtgaaa ttgtgaataa taccctggtt 2700

tgtccgtatc atggttggcg ttataatcag gcaggtaaat gtgttcatat tccggcacat 2760

ccggatatga cccctccggc aagcgcacag gcaaaaatct atcattgtca agaacgttat 2820

ggtctggttt gggtttgtct gggtgatccg gttaatgata ttccgagtct gccggaatgg 2880

gatgatccga attatcataa tacctgcacc aagagctact ttatccaggc aagcgcattt 2940

cgtgtgatgg ataactttat tgatgtgagc cattttccgt ttgtgcatga tggtggtctg 3000

ggcgatcgta atcatgcaca gattgaagaa tttgaggtga aagtggataa agacggtatt 3060

agcattggca atctgaaact gcagatgcct cgttttaata gcagcaatga agatgatagc 3120

tggaccctgt atcagcgtat tagccatccg ctgtgtcagt attatatcac cgaaagcagc 3180

gaaattcgta cagcagatct gatgctggtt accccgattg atgaagataa ttcactggtt 3240

cgtatgctgg tgacctggaa tcgtagcgaa attctggaaa gcaccgttct ggaagaattt 3300

gatgaaacca ttgaacagga tatcccgatt attcatagcc agcagcctgc acgtctgccg 3360

ctgctgccga gcaagcagat taatatgcag tggctgagcc aagaaattca tgttccgagc 3420

gatcgttgta ccgttgcata tcgtcgttgg ctgaaagaac tgggcgttac ctatggtgtt 3480

tgttgagaag gagatataca tatgcagatt ctgggtatca gcgcctatta tcatgatagc 3540

gcagcagcaa tggttattga tggtgaaatt gttgcagcag cacaagaaga acgttttagc 3600

cgtcgtaaac atgatgcagg ttttccgacc ggtgcaatta cctattgtct gaaacaggtt 3660

ggcaccaaac tgcagtatat tgatcagatc gtgttctatg ataaaccgct ggtgaaattt 3720

gaacgtctgc tggaaaccta tctggcctat gcaccgaaag gttttggtag ttttattacc 3780

gcaatgccgg tgtggctgaa agagaaactg tatctgaaaa ccctgctgaa aaaagaactg 3840

gcactgctgg gtgaatgtaa agcaagccag ctgcctccgc tgctgtttac cagccatcat 3900

caggcacatg cagcagcagc attttttccg agcccgtttc agcgtgcagc agttctgtgt 3960

ctggatggtg ttggtgaatg ggcaaccacc agtgtttggc tgggtgaagg taataaactg 4020

acaccgcagt gggaaattga ttttccgcat agcctgggcc tgctgtatag cgcatttacc 4080

tattataccg gctttaaagt gaacagcggt gagtataaac tgatgggtct ggcaccgtat 4140

ggtgaaccga aatatgttga tcagattctg aaacatctgc tggatctgaa agaagatggc 4200

acctttcgtc tgaacatgga ttatttcaat tataccgttg gtctgaccat gaccaaccat 4260

aaatttcata gcatgtttgg tggtccgcct cgtcaggcag aaggtaaaat tagccagcgt 4320

gatatggatc tggcaagcag cattcagaaa gttaccgaag aagtgattct gcgtctggca 4380

cgtaccatta agaaagaatt aggtgttgaa tacctgtgtc tggcaggcgg tgttggtctg 4440

aattgtgttg caaatggtcg tattctgcgt gagagcgatt ttaaagatat ttggattcag 4500

cctgcagccg gtgatgcagg tagcgcagtt ggtgcagcac tggcaatttg gcatgaatat 4560

cataaaaaac cgcgtaccag caccgcaggc gatcgtatga aaggtagcta tctgggtccg 4620

agctttagcg aagcagaaat tctgcagttt ctgaacagcg tgaatattcc gtatcatcgt 4680

tgtgtggata atgaactgat ggcacgtctg gcggaaattc tggatcaggg taatgttgtt 4740

ggttggttta gcggtcgtat ggaatttggt ccgcgtgcac tgggtggtcg tagcattatt 4800

ggtgatagcc gtagcccgaa aatgcagagc gttatgaatc tgaaaatcaa atatcgcgaa 4860

agcttccgtc cgtttgcacc gagcgttctg gcagaacgtg ttagcgatta ttttgatctg 4920

gatcgtccga gcccgtatat gctgctggtt gcacaggtta aagaaaatct gcatattccg 4980

atgacccaag aacagcatga actgtttggt atcgaaaaac tgaatgttcc gcgtagccag 5040

attccggcag ttacccatgt tgattatagc gcacgtattc agaccgttca taaagaaacc 5100

aatccgcgtt attatgaact gatccgtcat tttgaagcac gtaccggttg tgcagttctg 5160

gttaatacca gctttaatgt tcgtggtgaa ccgattgtgt gtacaccgga agatgcatat 5220

cgttgtttta tgcgtaccga gatggattac ctggtgatgg aaaattttct gctggtgaaa 5280

agcgaacagc ctcgtggtaa tagtgatgaa agctggcaga aagaatttga gctggattga 5340

gaaggagata tacatatgga acaaattaaa gaactggata agaaaggcct gcgtgaattt 5400

ggtctgattg gtggtagcat tgttgccgtt ctgtttggtt ttctgctgcc ggttattcgt 5460

catcatagcc tgagcgttat tccgtgggtt gttgcaggtt ttctgtggat ttgggcaatt 5520

attgcaccga ccaccctgag ctttatctat cagatttgga tgcgtattgg tctggtgctg 5580

ggttggattc agacccgtat tattctgggt gttctgttct atattatgat taccccgatc 5640

ggttttattc gtcgtctgct gaatcaggat ccgatgaccc gtatttttga accggaactg 5700

ccgacctatc gtcagctgag caaaagccgt accacccaga gcatggaaaa accgttctga 5760

gaaggagata tacatatgtt aaaagacacc tgggatttta tcaaggatat cgcaggcttt 5820

atcaaagaac agaaaaacta tctgctgatt ccgctgatta ttaccctggt tagcctgggt 5880

gcactgattg tttttgcaca gagcagcgca attgcaccgt ttatctatac cctgttttga 5940

tactctaacc ccatcggccg tcttaggggt tttttgtcga agttcctatt ctctagaaag 6000

tataggaact tcacctgtgg ggtgactttg ccgccgctgc cgtgatgtct gcattaccga 6060

tc 6062

<210> 99

<211> 5462

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 整合到麦芽糖操纵子中的sxt2片段的序列

<400> 99

ctgtgaacta aaccgaggtc atgtaaggaa tttcgtgatg ttgcttgcaa ccagccttgc 60

aagaagcgga tacaggagtg caaaaaatgg ctatctctag aaaggcctac cccttaggct 120

ttatgcaaca gaaacaataa taatggagtc atgaacatga ttgataccat tagcgttctg 180

ctgcgtgaat ggaccgttat ttttctgacc ggtctggcat tttggctgtg ggaaattcgt 240

agtccgctgc atcagattga atacaaagcc aaatttttca aagaactggg ttgggcaggt 300

atcagctttg tttttcgtat tgtttatgcc tatgttagcg tggccattat caaactgctg 360

agcagcctgt ttatgggtga aagcgcaaat tttgccggtg ttatgtatgt tccgctgtgg 420

ctgcgtatta ttaccgcata tattctgcag gatctgaccg attatctgct gcatcgtacc 480

atgcatagca atcagtttct gtggctgacc cataaatggc atcatagcac caaacagagt 540

tggtggctga gcggtaataa agatagcttt accggtggtc tgctgtatac cgttaccgca 600

ctgtggtttc cgctgctgga tattccgagc gaagttatga gcgttgttgc agttcatcag 660

gtgattcata acaactggat tcacctgaat gtgaaatgga atagctggct gggtattatc 720

gaatggattt atgttacacc gcgtatccat accctgcatc atctggatac cggtggtcgt 780

aatctgagca gtatgtttac ctttattgat cgtctgtttg gcacctatgt gtttccggaa 840

aactttgata tcgaaaaaag caaaaaccgc ctggatgatc agagcgttac cgttaaaacc 900

attctgggtt tctgagaagg agatatacat atgctgaaag attttaacca gttcctgatt 960

cgtaccctgg catttgtttt tgcctttggc atttttctga caaccggtgt tggtattgca 1020

aaagcagatt atctggtgaa aggtggcaaa attaccaatg ttcagaatac cagcagcaac 1080

ggtgataatt atgcagttag cattagcggt ggttttggtc cgtgtgcaga tcgtgttatt 1140

attctgccga ccagcggtgt tattaatcgt gatattcaca tgcgtggtta tgaagcagca 1200

ctgaccgcac tgagcaatgg ttttctggtt gatatctatg attataccgg tagcagctgt 1260

agcaatggtg gccagctgac cattaccaat cagctgggta aactgattag caattgagaa 1320

ggagatatac atatgaccaa tcagaacaac caagagctgg aaaatgatct gccgattgca 1380

aaacagccgt gtccggttaa tagctataat gaatgggata ccctggaaga agttattgtt 1440

ggtagcgttg aaggtgcaat gctgcctgca ctggaaccga ttaacaaatg gacctttccg 1500

tttgaagaac tggaaagcgc acagaaaatt ctgagcgaac gtggtggtgt tccgtatccg 1560

cctgaaatga ttaccctggc acataaagaa ctgaacgagt ttattcatat cctggaagcc 1620

gaaggtgtta aagttcgtcg tgttaaaccg gttgatttta gcgttccgtt tagcacaccg 1680

gcatggcagg ttggtagcgg tttttgtgca gcaaatccgc gtgatgtttt tctggttatt 1740

ggcaacgaaa ttatcgaagc accgatggca gatcgtaatc gttattttga aacctgggca 1800

tatcgcgaaa tgctgaaaga atattttcag gcaggcgcaa aatggaccgc agcaccgaaa 1860

ccgcagctgt ttgatgcaca gtatgatttc aattttcagt ttccgcagct gggtgaaccg 1920

cctcgttttg ttgttaccga atttgaaccg acctttgatg cagccgattt tgttcgttgt 1980

ggtcgtgata tttttggcca gaaaagccat gttaccaatg gtctgggtat tgaatggctg 2040

cagcgtcatc tggaagatga atatcgcatt catatcatcg aaagccattg tccggaagca 2100

ctgcatattg ataccaccct gatgccgctg gcaccgggta aaattctggt taatccggaa 2160

tttgtggacg tgaataaact gccgaaaatt ctgaaaagct gggatattct ggttgcaccg 2220

tatccgaatc atattccgca gaatcagctg cgtctggtta gcgaatgggc aggtctgaat 2280

gttctgatgc tggatgaaga acgtgtgatc gtggaaaaaa atcaagagca gatgatcaaa 2340

gccctgaaag attggggttt taaaccgatt gtttgccact tcgaaagcta ttatccgttt 2400

ctgggtagct ttcattgtgc aaccctggat gttcgtcgtc gtggcaccct gcagagctat 2460

ttttgagaag gagatataca tatgacgacc gcagatctga ttctgatcaa taattggtat 2520

gttgtggcca aggtggaaga ttgtaaaccg ggtagcatta ccaccgcact gctgctgggt 2580

gttaaactgg ttctgtggcg tagccgtgaa cagaatagcc cgattcagat ttggcaggat 2640

tattgtccgc atcgtggtgt tgcactgagc atgggtgaaa ttgtgaataa taccctggtt 2700

tgtccgtatc atggttggcg ttataatcag gcaggtaaat gtgttcatat tccggcacat 2760

ccggatatga cccctccggc aagcgcacag gcaaaaatct atcattgtca agaacgttat 2820

ggtctggttt gggtttgtct gggtgatccg gttaatgata ttccgagtct gccggaatgg 2880

gatgatccga attatcataa tacctgcacc aagagctact ttatccaggc aagcgcattt 2940

cgtgtgatgg ataactttat tgatgtgagc cattttccgt ttgtgcatga tggtggtctg 3000

ggcgatcgta atcatgcaca gattgaagaa tttgaggtga aagtggataa agacggtatt 3060

agcattggca atctgaaact gcagatgcct cgttttaata gcagcaatga agatgatagc 3120

tggaccctgt atcagcgtat tagccatccg ctgtgtcagt attatatcac cgaaagcagc 3180

gaaattcgta cagcagatct gatgctggtt accccgattg atgaagataa ttcactggtt 3240

cgtatgctgg tgacctggaa tcgtagcgaa attctggaaa gcaccgttct ggaagaattt 3300

gatgaaacca ttgaacagga tatcccgatt attcatagcc agcagcctgc acgtctgccg 3360

ctgctgccga gcaagcagat taatatgcag tggctgagcc aagaaattca tgttccgagc 3420

gatcgttgta ccgttgcata tcgtcgttgg ctgaaagaac tgggcgttac ctatggtgtt 3480

tgttgagaag gagatataca tatgcagatt ctgggtatca gcgcctatta tcatgatagc 3540

gcagcagcaa tggttattga tggtgaaatt gttgcagcag cacaagaaga acgttttagc 3600

cgtcgtaaac atgatgcagg ttttccgacc ggtgcaatta cctattgtct gaaacaggtt 3660

ggcaccaaac tgcagtatat tgatcagatc gtgttctatg ataaaccgct ggtgaaattt 3720

gaacgtctgc tggaaaccta tctggcctat gcaccgaaag gttttggtag ttttattacc 3780

gcaatgccgg tgtggctgaa agagaaactg tatctgaaaa ccctgctgaa aaaagaactg 3840

gcactgctgg gtgaatgtaa agcaagccag ctgcctccgc tgctgtttac cagccatcat 3900

caggcacatg cagcagcagc attttttccg agcccgtttc agcgtgcagc agttctgtgt 3960

ctggatggtg ttggtgaatg ggcaaccacc agtgtttggc tgggtgaagg taataaactg 4020

acaccgcagt gggaaattga ttttccgcat agcctgggcc tgctgtatag cgcatttacc 4080

tattataccg gctttaaagt gaacagcggt gagtataaac tgatgggtct ggcaccgtat 4140

ggtgaaccga aatatgttga tcagattctg aaacatctgc tggatctgaa agaagatggc 4200

acctttcgtc tgaacatgga ttatttcaat tataccgttg gtctgaccat gaccaaccat 4260

aaatttcata gcatgtttgg tggtccgcct cgtcaggcag aaggtaaaat tagccagcgt 4320

gatatggatc tggcaagcag cattcagaaa gttaccgaag aagtgattct gcgtctggca 4380

cgtaccatta agaaagaatt aggtgttgaa tacctgtgtc tggcaggcgg tgttggtctg 4440

aattgtgttg caaatggtcg tattctgcgt gagagcgatt ttaaagatat ttggattcag 4500

cctgcagccg gtgatgcagg tagcgcagtt ggtgcagcac tggcaatttg gcatgaatat 4560

cataaaaaac cgcgtaccag caccgcaggc gatcgtatga aaggtagcta tctgggtccg 4620

agctttagcg aagcagaaat tctgcagttt ctgaacagcg tgaatattcc gtatcatcgt 4680

tgtgtggata atgaactgat ggcacgtctg gcggaaattc tggatcaggg taatgttgtt 4740

ggttggttta gcggtcgtat ggaatttggt ccgcgtgcac tgggtggtcg tagcattatt 4800

ggtgatagcc gtagcccgaa aatgcagagc gttatgaatc tgaaaatcaa atatcgcgaa 4860

agcttccgtc cgtttgcacc gagcgttctg gcagaacgtg ttagcgatta ttttgatctg 4920

gatcgtccga gcccgtatat gctgctggtt gcacaggtta aagaaaatct gcatattccg 4980

atgacccaag aacagcatga actgtttggt atcgaaaaac tgaatgttcc gcgtagccag 5040

attccggcag ttacccatgt tgattatagc gcacgtattc agaccgttca taaagaaacc 5100

aatccgcgtt attatgaact gatccgtcat tttgaagcac gtaccggttg tgcagttctg 5160

gttaatacca gctttaatgt tcgtggtgaa ccgattgtgt gtacaccgga agatgcatat 5220

cgttgtttta tgcgtaccga gatggattac ctggtgatgg aaaattttct gctggtgaaa 5280

agcgaacagc ctcgtggtaa tagtgatgaa agctggcaga aagaatttga gctggattga 5340

tactctaacc ccatcggccg tcttaggggt tttttgtcga agttcctatt ctctagaaag 5400

tataggaact tcacctgtgg ggtgactttg ccgccgctgc cgtgatgtct gcattaccga 5460

tc 5462

<210> 100

<211> 112

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 100

agtccagcct tgcaagaagc ggatacagga gtgcaaaaaa tggctatctc tagaaaggcc 60

taccccttag gctttatgca acagaaacaa taataatgga gtcatgaaca tg 112

<210> 101

<211> 114

<212> DNA

<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)

<400> 101

agtccagcct tgcaagaagc ggatacagga gtgcaaaaaa tggctatctc tagaaaggcc 60

taccccttag gctttatgca acagaaacaa taataatgga gtcatgaaca tatg 114

88

Claims

1.一种在宿主细胞中生产新石房蛤毒素的方法，该方法包括以下步骤：

(A)在适合生产新石房蛤毒素的条件下，在以下底物存在下在培养基中培养宿主细胞，所述宿主细胞包含编码PPT酶和编码Sxt多肽A、B、D、G、H、I、S、T、U、V、W和X的核酸分子：

(i)S-腺苷甲硫氨酸，

(ii)精氨酸

(iii)乙酰辅酶A、丙二酰辅酶A或丙酰辅酶A，和

(iv)氨基甲酰磷酸酯，

并且其中，所述宿主细胞不包含编码Sxt多肽C、F、J、K、L、M、P、Q、R和ORF24的核酸分子；以及任选地

(B)从所述宿主细胞或所述培养基中分离和/或纯化新石房蛤毒素。

2.一种生产新石房蛤毒素或其类似物或变体的方法，该方法包括以下步骤：

(i)S-腺苷甲硫氨酸，

(ii)精氨酸

(iii)乙酰辅酶A、丙二酰辅酶A或丙酰辅酶A，和

(iv)氨基甲酰磷酸酯，

以及任选地

(B)从所述反应介质中分离和/或纯化新石房蛤毒素或其类似物或变体。

3.根据权利要求2所述的方法，其中，所述反应介质另外包含PPT酶。

4.一种在宿主细胞中生产新石房蛤毒素或其类似物或变体的方法，该方法包括以下步骤：

(A)在适合生产新石房蛤毒素或其类似物或变体的条件下，在以下底物存在下在培养基中培养宿主细胞，所述宿主细胞包含编码Sxt多肽A、B、D、G、H、I、S、T、U、V、W和X的核酸分子：

(i)S-腺苷甲硫氨酸，

(ii)精氨酸

(iii)乙酰辅酶A、丙二酰辅酶A或丙酰辅酶A，和

(iv)氨基甲酰磷酸酯；以及任选地

(B)从所述宿主细胞或所述培养基中分离和/或纯化新石房蛤毒素或其类似物或变体。

5.根据权利要求4所述的方法，其中，所述宿主细胞另外包含编码PPT酶的核酸分子。

6.根据权利要求2-5中任一项所述的方法，其中，所述底物不与Sxt多肽C、J和K中的一种或多种或所有接触，和/或所述宿主细胞不包含编码Sxt多肽C、J和K中的一种或多种或所有的核酸分子。

7.根据权利要求2-6中任一项所述的方法，其中，所述底物不与Sxt多肽Q、R和ORF24中的一种或多种或所有接触，和/或所述宿主细胞不包含编码Sxt多肽Q、R和ORF24中的一种或多种或所有的核酸分子。

8.根据权利要求2-7中任一项所述的方法，其中，所述底物不与(a)-(c)中的一个或多个中的任何Sxt多肽接触：

(a)C、Q、R和ORF24；

(b)L、Q、R和ORF24；或

(c)J、K、L、Q、R和ORF24；

和/或所述宿主细胞不包含编码(a)-(c)中的一个或多个中的任何所述Sxt多肽的核酸分子。

9.根据权利要求2-8中任一项所述的方法，其中，所述底物不与Sxt多肽F、M和P中的一种或多种或所有接触，和/或所述宿主细胞不包含编码Sxt多肽F、M和P中的一种或多种或所有的核酸分子。

10.根据前述权利要求中任一项所述的方法，其中，所述底物另外与选自由SxtC、E、J、K、L和R(优选C和/或E)组成的组中的一种或多种Sxt多肽接触，和/或所述宿主细胞另外包含编码Sxt多肽C、E、J、K、L和R(优选C和/或E)中的一种或多种的核酸分子。

11.根据前述权利要求中任一项所述的方法，其中，所述底物不与选自由SxtF、M、N、O、P、Y、Z、ORF3、ORF4、ORF29、ORF34、OMPR或HISA组成的组中的一种或多种或所有Sxt多肽接触，和/或所述宿主细胞不包含编码Sxt多肽F、M、N、O、P、Y、Z、ORF3、ORF4、ORF29、ORF34、OMPR或HISA中的一种或多种或所有的核酸分子。

12.根据前述权利要求中任一项所述的方法，其中，所述底物另外与SxtN和/或SxtDIOX接触，和/或所述宿主细胞另外包含编码SxtN和/或SxtDIOX的核酸分子。

13.根据权利要求1或4-12中任一项所述的方法，其中，所述宿主细胞是原核宿主细胞，优选细菌细胞，最优选大肠杆菌细胞。

14.根据权利要求1或4-13中任一项所述的方法，其中，所述宿主细胞是异养生物。

15.根据权利要求1或4-14中任一项所述的方法，其中，所述宿主细胞是重组宿主细胞。

16.根据前述权利要求中任一项所述的方法，其中，将所述新石房蛤毒素或其类似物或变体或其药学上可接受的盐配制成药物组合物。

17.根据权利要求16所述的方法，其中，所述配制步骤包括将分离的或纯化的新石房蛤毒素或其类似物或变体与一种或多种药学上可接受的载体、佐剂和/或赋形剂混合。

18.通过前述权利要求中任一项所述的方法生产的新石房蛤毒素或其类似物或变体。

19.一种包含编码Sxt多肽A、B、D、G、H、I、S、T、U、V、W和X的核酸分子的宿主细胞，其中，所述宿主细胞不包含编码以下的核酸分子：

(i)Sxt多肽C、J或K中的一种或多种或所有；

(ii)Sxt多肽Q、R和ORF24中的一种或多种或所有；

(iii)Sxt多肽C、Q、R和ORF24中的一种或多种或所有；

(iv)Sxt多肽L、Q、R和ORF24中的一种或多种或所有；

(v)Sxt多肽J、K、L、Q、R和ORF24中的一种或多种或所有；或

(vi)Sxt多肽F、M和P中的一种或多种或所有。

20.根据权利要求19所述的宿主细胞，其中，所述宿主细胞另外包含编码选自由SxtC、E、J、K、L和/或R(优选C和/或E)组成的组中的一种或多种Sxt多肽的核酸分子。

21.根据权利要求19或20所述的宿主细胞，其中，所述宿主细胞另外包含编码SxtN和/或SxtDIOX的核酸分子。

22.根据权利要求19-20中任一项所述的宿主细胞，其中，所述宿主细胞不包含编码选自由F、M、N、O、P、Y、Z、ORF3、ORF4、ORF29、ORF34、OMPR或HISA组成的组中的一种或多种或所有Sxt多肽的核酸分子。

23.根据权利要求19-22中任一项所述的宿主细胞，其中，所述宿主细胞是原核宿主细胞，优选细菌细胞，最优选大肠杆菌细胞。