CN109790558A - 方法 - Google Patents

方法 Download PDF

Info

Publication number
CN109790558A
CN109790558A CN201780023087.6A CN201780023087A CN109790558A CN 109790558 A CN109790558 A CN 109790558A CN 201780023087 A CN201780023087 A CN 201780023087A CN 109790558 A CN109790558 A CN 109790558A
Authority
CN
China
Prior art keywords
leu
ala
val
ile
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780023087.6A
Other languages
English (en)
Inventor
R·科尔曼
B·尼兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Australian New South Innovation Co Ltd
Bergen Teknologioverforing AS
Original Assignee
Australian New South Innovation Co Ltd
Bergen Teknologioverforing AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Australian New South Innovation Co Ltd, Bergen Teknologioverforing AS filed Critical Australian New South Innovation Co Ltd
Publication of CN109790558A publication Critical patent/CN109790558A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/182Heterocyclic compounds containing nitrogen atoms as the only ring heteroatoms in the condensed system
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • C12P17/12Nitrogen as only ring hetero atom containing a six-membered hetero ring
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/495Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with two or more nitrogen atoms as the only ring heteroatoms, e.g. piperazine or tetrazines
    • A61K31/505Pyrimidines; Hydrogenated pyrimidines, e.g. trimethoprim
    • A61K31/519Pyrimidines; Hydrogenated pyrimidines, e.g. trimethoprim ortho- or peri-condensed with heterocyclic rings
    • A61K31/52Purines, e.g. adenine
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/04Centrally acting analgesics, e.g. opioids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • C12N1/205Bacterial isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1288Transferases for other substituted phosphate groups (2.7.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2500/00Specific components of cell culture medium
    • C12N2500/30Organic components
    • C12N2500/32Amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2500/00Specific components of cell culture medium
    • C12N2500/30Organic components
    • C12N2500/42Organic phosphate, e.g. beta glycerophosphate
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • C12R2001/19Escherichia coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/08Transferases for other substituted phosphate groups (2.7.8)
    • C12Y207/08007Holo-[acyl-carrier-protein] synthase (2.7.8.7)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Epidemiology (AREA)
  • Neurosurgery (AREA)
  • Neurology (AREA)
  • Pain & Pain Management (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本发明涉及在重组宿主细胞中制备新石房蛤毒素及其类似物和变体以及在生产新石房蛤毒素中的中间体的方法。新石房蛤毒素及其类似物和变体可用于生产药物组合物。

Description

方法
技术领域
本发明涉及新石房蛤毒素及其类似物的制备方法,以及在重组宿主细胞中产生新石房蛤毒素的中间体。新石房蛤毒素可以用于生产药物组合物。
背景技术
电压门控钠通道(VGSC)是完整的膜蛋白,其形成离子通道,通过细胞质膜传导钠离子(Na+)。它们在动作电位的启动中起着重要作用。
人们早就知道阻断这些通道可能有助于预防疼痛冲动的传递;现在已充分验证VGSC是用于治疗疼痛的靶标。特别地,目前正在镇痛药和麻醉剂的生产中研究许多VGSC拮抗剂。
石房蛤毒素和新石房蛤毒素两者都作为VGSC的特异性阻断剂。因此,这些化合物在治疗疼痛中可能是有用的。石房蛤毒素(SXT)也称为麻痹性贝类毒素(PST),是由许多蓝藻(例如鱼腥藻(Anabaena)、丝囊藻属(Aphanizomenon)、拟柱孢藻属(Cylindrospermopsis)、鞘丝藻属(Lyngbya)、浮丝藻属(Planktothrix)、尖头藻属(Raphidiopsis)、双歧藻属(Scytonema))和甲藻(亚历山大藻(Alexandrium)、裸甲藻(Gymnodinium)和梨甲藻(Pyrodinium))产生的神经毒素。石房蛤毒素是迄今已知的最致命的非蛋白质神经毒素之一,并可逆地结合VGSC以导致瘫痪。它导致许多人类食物中毒事件,因为摄入了受污染的滤食性水生动物(例如甲壳类动物、软体动物、贝类),这些动物会对毒素进行生物累积。
然而,存在许多SXT类似物包括新石房蛤毒素(它是SXT的N1-羟基化类似物),虽然它们具有高特异性毒性,但当以低剂量施用时它们没有全身毒性。因此它们可能用作人类治疗剂。
2015年6月,德国制药商Grunenthal与智利公司Proteus S.A.和美国波士顿儿童医院开展合作以开发使用新石房蛤毒素作为局部麻醉和术后疼痛管理的新型麻醉剂。
还存在其它石房蛤毒素类似物的市场,例如膝钩藻毒素(gonyautoxin),其已经临床测试为肌肉松弛剂。
Proteus S.A.已经提交了与从天然产生新石房蛤毒素和石房蛤毒素的细胞(例如蓝藻细胞)生产和收获新石房蛤毒素和石房蛤毒素相关的专利申请(例如US2015/0099879)。
Shimizu等首次提出了产生石房蛤毒素的生物合成途径(J.Am.Chem.Soc.(1984),106,6433–6434)。然而,直到2008年才首次鉴定石房蛤毒素(sxt)基因簇;这是在蓝藻拟柱孢藻(Cylindrospermopsis raciborskii)T3中(Kellmann等Appl.Environ.Microbiol.2008,74,4044–4053)。sxt基因簇由34个基因或开放阅读框(ORF)组成。基于Sxt蛋白的理论功能,这导致Kellmann等提出修订的(10步)用于产生石房蛤毒素的生物合成途径(参见本文的图1)。
其它四个sxt基因簇已经在不同的属中被鉴定:卷曲鱼腥藻(Anabaenacircinalis)131C和丝囊藻属(Aphanizomenon sp.)NH-5(Mihali等BMC Biochem.10,8(2009));鞘丝藻(Lyngbyawollei)(Mihali等PloS One 6,e14657(2011));和尖头藻(Raphidiopsis brookii)D9(Stucken,K.等PLoS ONE 5,e9235(2010))。然而值得注意的是,这些基因簇存在一些差异,包括缺少某些基因和其它基因重复。此外,sxt簇的结构在一些基因组中重新排列,导致石房蛤毒素类似物的生物合成。这使得用于产生石房蛤毒素和新石房蛤毒素的生物合成途径的阐明特别困难,因此通过重组途径防止石房蛤毒素和新石房蛤毒素的产生。
在Kellmann(2008)提出的途径中,提出第一步涉及sxtA基因产物。sxtA基因编码与聚酮化合物合酶(PKS)相关的多结构域蛋白。Kellmann提出SxtA催化精氨酸和一个甲基化乙酸酯单元的缩合以产生4-氨基-3-氧代-胍基庚烷(AOGH)中间体。提出该方法以逐步进行,并由SxtA的四个结构域催化。据说乙酰转移酶结构域选择性地将乙酰辅酶A连接到全酰基载体蛋白的泛乙酰基臂上。据说由第一个SxA结构域催化的乙酰基部分的SAM依赖性甲基化导致丙酸盐的形成。据说AOGH生物合成的最后一步是丙酸盐与精氨酸的缩合,由II类氨基转移酶结构域催化。AOGH用作由sxt基因簇的其它成员编码的下游酶生物合成石房蛤毒素的底物。然而,由于缺乏化学标准,未确认AOGH的结构。
尽管Tsuchiya及其同事最近已阐明AOGH的合成途径(Tsuchiya,S.等Org.Biomol.Chem.12,3016–3020(2014);Tsuchiya,S.等Chem.Eur.J.21,7835–7840(2015))。该研究并没有研究SxtA或任何其它Sxt蛋白参与AOGH的生产。该步骤是石房蛤毒素和新石房蛤毒素生产中的关键步骤。
因此,总之目前可用于制备石房蛤毒素和新石房蛤毒素的唯一商业上可获得的高产量途径是将其与天然产生它的细胞(例如蓝藻)分离。
目前用于生产新石房蛤毒素的方法不能以制造所需药物组合物所需的量生产新石房蛤毒素。因此,存在对改进的生产新石房蛤毒素的方法的需要。
现在已经足够详细地阐明了用于生产新石房蛤毒素的生物合成途径以便能够通过重组途径生产新石房蛤毒素。特别地,在Kellmann(2008)鉴定的34个sxt基因或ORF中,已经鉴定了用于生产新石房蛤毒素所必需的那些。
现在已经发现,Kellmann(2008)提出的生物合成途径是不正确的,并且Kellmann途径是指一些对于重组生产新石房蛤毒素不必要的基因;Kellmann(2008)途径也未能提及一些生产新石房蛤毒素所必需的sxt基因。
因此,本发明首次提供了用于生产新石房蛤毒素及其类似物的重组途径,以及用于在新石房蛤毒素及其类似物的生产中生产各种中间体的重组途径。
本发明还有助于生产石房蛤毒素及其其它类似物,例如膝钩藻毒素。
发明内容
在一种实施方式中,本发明提供了用于生产新石房蛤毒素或其类似物的方法,该方法包括以下步骤:
(A)在反应介质中将以下底物与SxtA、B、D、G、H、I、S、T、U、V、W和X多肽接触:
(i)S-腺苷甲硫氨酸,
(ii)精氨酸,
(iii)乙酰辅酶A、丙二酰辅酶A或丙酰辅酶A,和
(iv)氨基甲酰磷酸酯
以及任选地
(B)从反应介质中分离和/或纯化新石房蛤毒素或其类似物。
优选地,该方法在宿主细胞中进行,所述宿主细胞包含编码所述Sxt多肽的核酸分子。
本发明还提供了在宿主细胞中生产石房蛤毒素或其类似物的方法,该方法包括以下步骤:
(A)在以下底物的存在下,在培养基中培养包含编码Sxt多肽A、B、D、G、H、I、S、T、U、V、W和X的核酸分子的宿主细胞:
(i)S-腺苷甲硫氨酸,
(ii)精氨酸,
(iii)乙酰辅酶A、丙二酰辅酶A或丙酰辅酶A,和
(iv)氨基甲酰磷酸酯
优选在适合生产新石房蛤毒素或其类似物的条件下。优选地,宿主细胞另外包含编码PPT酶的核酸分子。
优选地,该方法还包括从宿主细胞或培养基中分离和/或纯化新石房蛤毒素或其类似物的步骤。
如本文所用,术语“新石房蛤毒素”是指具有以下结构的化合物或其立体异构体:
宿主细胞可以是能够表达编码所有特定Sxt多肽的核酸分子的任何细胞。宿主细胞优选是重组宿主细胞。
如本文所用,术语“重组”是指宿主细胞不是野生型宿主细胞的事实,例如它们已通过引入一种或多种编码一种或多种特定Sxt多肽的核酸分子而被修饰。
宿主细胞可以是原核细胞或真核细胞。例如,宿主细胞可以是细菌细胞。细菌可以是革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌可以选自由放线菌(Actinobacteria)、厚壁菌门(Firmicutes)和柔膜菌门(Tenericutes)组成的组。革兰氏阴性细菌可以选自由产水菌门(Aquificae)、拟杆菌门/纤维杆菌门-绿菌门(Bacteroidetes/Fibrobacteres-Chlorobi)(FCB组)、异常球菌-栖热菌门(Deinococcus-Thermus)、梭杆菌门(Fusobacteria)、芽单胞菌门(Gemmatimonadetes)、硝化螺旋菌门(Nitrospirae)、浮霉菌门-疣微菌门/衣原体门(Planctomycetes-Verrucomicrobia/Chlamydiae)(PVC组)、变形菌门(Proteobacteria)、螺旋体门(Spirochaetes)和互养菌门(Synergistetes)组成的组。
优选地,宿主细胞是变形细菌门(Phylum Proteobacteria);更优选为γ-变形菌类(Gammaproteobacteria);更优选为肠杆菌(Enterobacteriaceae)科;甚至更优选为埃希氏菌(Escherichia)属。最优选地,宿主细胞为大肠杆菌(E.coli)种。在一些实施方式中,宿主细胞是假单胞菌(Pseudomonas)属。
也可以使用真核细胞,例如酵母细胞和哺乳动物细胞。由于新石房蛤毒素对许多真核细胞有毒,因此真核宿主细胞优选为对新石房蛤毒素毒性不敏感的宿主细胞。这些细胞可以是天然不易感的(例如酵母细胞),或者它们可以工程化成不易感的(例如共表达新石房蛤毒素拮抗剂的哺乳动物细胞)。
或者,宿主细胞可以是不分泌新石房蛤毒素的宿主细胞,即产生的任何新石房蛤毒素保留在细胞内(从而防止其发挥其毒性作用)。宿主细胞也可以是植物细胞。
在一些实施方式中,宿主细胞是异养生物。宿主细胞可以是光合异养生物或化学异养生物。异养生物是一种不能固定碳并使用有机碳生长的生物。异养生物可以基于它们如何获得能量而进一步划分:如果异养生物利用光供能,那么它就是光合异养生物;如果异养生物使用化学能,那么它就是化学异养生物。在一些实施方式中,宿主细胞不是自养生物。自养生物可以是光合自养生物或化学自养生物。
新石房蛤毒素是由几种海洋甲藻和淡水蓝藻自然产生的。本发明不涉及由这种野生型宿主细胞种类天然产生新石房蛤毒素。因此,在本发明的一些实施方式中,宿主细胞不是甲藻或蓝藻。
特别地,宿主细胞优选不选自由蓝藻拟柱孢藻(Cylindrospermopsisraciborskii)、水华束丝藻(Anphanizomenon flos-aquae)、束丝藻(APh)依沙束丝藻(Aphanizomenon)(APh)、(issatschenkoi(usaceb)Proskina-Lavrenco)、柔细束丝藻(Aphanizomenon gracile(Lemm)Lemm)、卷曲鱼腥藻(Anabaena circinalis)、鞘丝藻(Lyngbya wollei)和塔玛亚历山大藻(Alexandrium tamarens)组成的组。
特别地,宿主细胞优选不选自由鱼腥藻(Anabaena)、束丝藻属(Aphanizomenon)、拟柱孢藻属(Cylindrospermopsis)、鞘丝藻属(Lyngbya)、浮丝藻属(Planktothrix)、尖头藻属(Raphidiopsis)、双歧藻属(Scytonema)和甲藻(亚历山大藻(Alexandrium)、裸甲藻(Gymnodinium)和梨甲藻(Pyrodinium))组成的组。
然而,宿主细胞可以是重组甲藻或重组蓝藻,例如与野生型甲藻或蓝藻相比已经被修饰的甲藻或蓝藻(例如通过添加一个或多个基因,优选通过添加一个或多个sxt基因)。宿主细胞包含和/或表达编码特定Sxt蛋白的核酸分子。
优选地,Sxt多肽和sxt基因获自蓝藻或甲藻。更优选地,Sxt多肽和sxt基因获自鱼腥藻(Anabaena),丝囊藻属(Aphanizomenon),拟柱孢藻属(Cylindrospermopsis),鞘丝藻属(Lyngbya),浮丝藻属(Planktothrix),尖头藻属(Raphidiopsis),双歧藻属(Scytonema),亚历山大藻(Alexandrium),裸甲藻(Gymnodinium)或梨甲藻(Pyrodinium)。甚至更优选地,Sxt多肽和sxt基因获自蓝藻拟柱孢藻(Cylindrospermopsisraciborskii),水华束丝藻(Anphanizomenon flos-aquae),束丝藻(APh)依沙束丝藻(Aphanizomenon)(APh)、(issatschenkoi(usaceb)Proskina-Lavrenco)、柔细束丝藻(Aphanizomenon gracile(Lemm)Lemm),卷曲鱼腥藻(Anabaena circinalis),鞘丝藻(Lyngbya wollei)或塔玛亚历山大藻(Alexandrium tamarens)。最优选地,Sxt多肽和sxt基因获自蓝藻拟柱孢藻(C.raciborskii)T3菌株。在一些实施方式中,Sxt多肽和sxt基因可以获自长孢鱼腥藻(Dolichosporum circinale)134C或微小亚历山大藻(A.minutum)。
编码特定Sxt蛋白的核酸分子可以是异源分子,即在野生型宿主细胞中不天然存在的分子。
如本文所用,术语SxtA优选是指具有SEQ ID NO:10中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有含四个催化结构域的聚酮合酶相关蛋白功能的序列:sxtA1:甲基转移酶;sxtA2:GNAT乙酰转移酶;sxtA3:酰基载体蛋白和sxtA4:II类氨基转移酶。
如本文所用,术语sxtA优选是指具有SEQ ID NO:11或12中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码含四个催化结构域的聚酮合酶相关蛋白的序列:sxtA1:甲基转移酶;sxtA2:GNAT乙酰转移酶;sxtA3:酰基载体蛋白和sxtA4:II类氨基转移酶。
如本文所用,术语SxtB优选是指具有SEQ ID NO:7中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有胞苷脱氨酶功能的序列。
如本文所用,术语sxtB优选是指具有SEQ ID NO:8或9中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码胞苷脱氨酶的序列。SxtB多肽也可以能够环化。
如本文所用,术语SxtC优选是指具有SEQ ID NO:4中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并编码调节亚基的序列。如本文所用,术语SxtC优选是指具有SEQ ID NO:5或6中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码调节亚基的序列。SxtC多肽也可以能够去氨基甲酰化。
如本文所用,术语SxtD优选是指具有SEQ ID NO:1中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有去饱和酶功能的序列。如本文所用,术语sxtD优选是指具有SEQ ID NO:2或3中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码去饱和酶的序列。
如本文所用,术语SxtE优选是指具有SEQ ID NO:13中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有伴侣样蛋白功能的序列。如本文所用,术语sxtE优选是指具有SEQ ID NO:14或15中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码伴侣样蛋白的序列。
如本文所用,术语SxtF优选是指具有SEQ ID NO:16中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有钠驱动多药和毒性化合物挤出蛋白功能的序列。如本文所用,术语sxtF优选是指具有SEQ ID NO:17或18中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码钠驱动多药和毒性化合物挤出蛋白的序列。
如本文所用,术语SxtG优选是指具有SEQ ID NO:19中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有脒基转移酶功能的序列。如本文所用,术语sxtG优选是指具有SEQ ID NO:20或21中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码脒基转移酶的序列。
如本文所用,术语SxtH优选是指具有SEQ ID NO:22中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有双加氧酶功能的序列。如本文所用,术语sxtH优选是指具有SEQ ID NO:23或24中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码双加氧酶的序列。SxtH多肽也可以能够C12羟基化。
如本文所用,术语SxtI优选是指具有SEQ ID NO:25中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有O-氨基甲酰基转移酶功能的序列。如本文所用,术语sxtI优选是指具有SEQ ID NO:26或27中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码O-氨基甲酰基转移酶的序列。
如本文所用,术语SxtJ优选是指具有SEQ ID NO:28中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性的序列。如本文所用,术语sxtJ优选是指具有SEQ IDNO:29或30中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性的序列。
如本文所用,术语SxtK优选是指具有SEQ ID NO:31中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性的序列。如本文所用,术语sxtK优选是指具有SEQ IDNO:32或33中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性的序列。sxtJ和sxtK通常与O-氨基甲酰基转移酶相关。它们可以是调节亚基和/或介导SxtI与其它蛋白或膜的结合。
如本文所用,术语SxtL优选是指具有SEQ ID NO:34中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有GDSL-脂肪酶功能的序列。如本文所用,术语sxtL优选是指具有SEQ ID NO:35或36中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码GDSL-脂肪酶的序列。SxtL多肽也可以能够去氨基甲酰化。
如本文所用,术语SxtM优选是指具有SEQ ID NO:37中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并且具有钠驱动多药和毒性化合物挤出蛋白功能的序列。如本文所用,术语sxtM优选是指具有SEQ ID NO:38或39中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码钠驱动多药和毒性化合物挤出蛋白的序列。
如本文所用,术语SxtN优选是指具有SEQ ID NO:40中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有磺基转移酶功能的序列。如本文所用,术语sxtN优选是指具有SEQ ID NO:41中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码磺基转移酶的序列。
如本文所用,术语SxtO优选是指具有SEQ ID NO:72中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有腺苷酰硫酸激酶功能的序列。如本文所用,术语sxtO优选是指具有SEQ ID NO:73中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码腺苷酰硫酸激酶的序列。SxtO多肽也可以能够PAPS生物合成。
如本文所用,术语SxtP优选是指具有SEQ ID NO:69中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有推定的石房蛤毒素结合蛋白功能的序列。如本文所用,术语sxtP优选是指具有SEQ ID NO:70或71中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码推定的石房蛤毒素结合蛋白的序列。
如本文所用,术语SxtQ优选是指具有SEQ ID NO:66中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性的序列。如本文所用,术语sxtQ优选是指具有SEQ IDNO:67或68中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性的序列。
如本文所用,术语SxtR优选是指具有SEQ ID NO:63中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有酰基辅酶A N-酰基转移酶功能的序列。如本文所用,术语sxtR优选是指具有SEQ ID NO:64或65中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码酰基辅酶A N-酰基转移酶的序列。
如本文所用,术语SxtS优选是指具有SEQ ID NO:57中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并且能够环氧化和环形成新石房蛤毒素前体的序列。如本文所用,术语sxtS优选是指具有SEQ ID NO:58或59中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并且能够环氧化和环形成新石房蛤毒素前体的序列。
如本文所用,术语SxtT优选是指具有SEQ ID N:54中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并且能够使新石房蛤毒素前体C-11羟基化的序列。如本文所用,术语sxtT优选是指具有SEQ ID NO:55或56中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并且能够使新石房蛤毒素前体C-11羟基化的序列。
如本文所用,术语SxtU优选是指具有SEQ ID NO:51中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有短链醇脱氢酶功能的序列。如本文所用,术语sxtU优选是指具有SEQ ID NO:52或53中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码短链醇脱氢酶的序列。SxtU多肽也可以能够C1还原。
如本文所用,术语SxtV优选是指具有SEQ ID NO:48中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有FAD依赖性琥珀酸脱氢酶/富马酸还原酶功能的序列。如本文所用,术语sxtV优选是指具有SEQ ID NO:49或50中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码FAD依赖性琥珀酸脱氢酶/富马酸还原酶的序列。SxtV多肽也可以编码双加氧酶还原酶。
如本文所用,术语SxtW优选是指具有SEQ ID NO:45中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有铁氧还蛋白功能的序列。如本文所用,术语sxtW优选是指具有SEQ ID NO:46或47中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码铁氧还蛋白的序列。SxtW多肽也可以编码电子载体。
如本文所用,术语SxtX优选是指具有SEQ ID NO:42中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并且能够使新石房蛤毒素N-1羟基化的序列。如本文所用,术语sxtX优选是指具有SEQ ID NO:43或44中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并且能够使新石房蛤毒素N-1羟基化的序列。
如本文所用,术语SxtY优选是指具有SEQ ID NO:74中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有磷酸依赖性转录调节子功能的序列。如本文所用,术语sxtY优选是指具有SEQ ID NO:75中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码磷酸依赖性转录调节子的序列。SxtY多肽也可以能够信号转导。
如本文所用,术语SxtZ优选是指具有SEQ ID NO:76中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有组氨酸激酶功能的序列。如本文所用,术语sxtZ优选是指具有SEQ ID NO:77中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码组氨酸激酶的序列。
一些sxt基因的功能和能力在图2、图3、图4A、图4B中进一步说明,其中可以看出一些能够将中间体X转化为中间体Y(其中X和Y是确定的中间体的结构)。
如本文所用,术语ORF5优选是指具有SEQ ID NO:60中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有噬藻体S-PM2蛋白CAF34141样蛋白功能的序列。ORF5在本领域中也称为ORF24。如本文所用,术语orf5优选是指具有SEQ ID NO:61或62中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码噬藻噬菌体S-PM2蛋白CAF34141样蛋白的序列。
优选地,宿主细胞另外包含和/或表达编码4'-磷酸泛酰巯基乙胺基转移酶(PPT酶)的核酸分子。如本文所用,术语PPT酶优选是指具有SEQ ID NO:78或90中给出的氨基酸序列的多肽或与其具有至少50%氨基酸序列同一性并具有磷酸泛酰巯基乙胺基转移酶功能的序列。如本文所用,术语PPT酶基因优选是指具有SEQ ID NO:79、80或89中给出的核苷酸序列的核酸分子或与其具有至少50%核苷酸序列同一性并编码磷酸泛酰巯基乙胺基转移酶的序列。优选地,PPT酶由枯草芽孢杆菌sfp基因(SEQ ID NO:89)编码。最优选地,PPT酶来自蓝藻拟柱孢藻(C.raciborskii)T3菌株。在一些实施方式中,可以去除PPT酶的前20个氨基酸的1-20(例如20)以增加PPT酶的溶解度。另外,可以将氨基酸序列中的第一个V改变为M。
优选地,核酸分子的核苷酸序列针对宿主细胞进行密码子优化。
Sxt多肽、ORF和PPT酶优选在本文中定义为与参考氨基酸序列具有至少50%的氨基酸序列同一性。优选地,Sxt、ORF和PPT酶多肽与特定的参考多肽具有至少60%、70%、80%、90%、95%、98%或99%的氨基酸序列同一性。sxt核酸分子、orf和PPT酶核酸分子在本文中优选定义为与参考核苷酸序列具有至少50%的核苷酸序列同一性。优选地,sxt、orf和PPT酶核酸分子与特定的参考核酸分子具有至少60%、70%、80%、90%、95%、98%或99%的核苷酸序列同一性。
核酸分子可以是DNA或RNA。使用BLAST比对方法可以获得百分比氨基酸序列同一性和核苷酸序列同一性(Altschul等(1997),"Gapped BLAST and PSI-BLAST:a newgeneration of protein database search programs",Nucleic Acids Res.25:3389-3402;and http://www.ncbi.nlm.nih.gov/BLAST)。优选地,使用标准或默认比对参数。标准蛋白-蛋白BLAST(blastp)可以用于在蛋白数据库中发现相似的序列。与其它BLAST程序一样,blastp旨在发现相似的局部区域。当序列相似性跨越整个序列时,blastp还将报告全局比对,这是蛋白鉴定目的的优选结果。优选地,使用标准或默认比对参数。在某些情况下,可以取消“低复杂度过滤器”。BLAST蛋白搜索也可以用BLASTX程序进行,得分=50,字长=3。为了获得用于比较目的的空位比对,可以如Altschul等(1997)Nucleic Acids Res.25:3389所述使用Gapped BLAST(BLAST 2.0中)。或者,PSI-BLAST(在BLAST 2.0中)可以用于执行检测分子之间的远距离关系的迭代搜索(参见Altschul等(1997)同上)。当使用BLAST、Gapped BLAST、PSI-BLAST时,可以使用各个程序的默认参数。关于核苷酸序列比较,可以使用MEGABLAST、不连续的megablast和blastn来实现该目标。优选地,使用标准或默认比对参数。MEGABLAST专门设计用于有效地发现非常相似序列之间的长对齐。不连续的MEGABLAST可以用于发现与本发明的核酸相似但不相同的核苷酸序列。BLAST核苷酸算法通过将查询分解为称为词的短子序列来发现相似的序列。该程序首先识别与查询词的准确匹配(词命中)。然后,BLAST程序以多个步骤扩展这些词命中以生成最终的空位比对。在一些实施方式中,BLAST核苷酸搜索可以用BLASTN程序进行,得分=100,字长=12。控制BLAST搜索灵敏度的重要参数之一是词大小。blastn比MEGABLAST更敏感的最重要原因是它使用较短的默认词大小(11)。因此,blastn在发现与其它生物的相关核苷酸序列的比对方面优于MEGABLAST。词大小可以在blastn中调整,并且可以从默认值减少到最小值7以提高搜索灵敏度。通过使用新引入的不连续的megablast页面(www.ncbi.nlm.nih.gov/Web/Newsltr/FallWinter02/blastlab.html)可以实现更灵敏的搜索。该页面使用的算法类似于Ma等报道的算法(Bioinformatics.2002Mar;18(3):440-5)。相比于要求精确的词匹配作为比对扩展的起源,不连续的megablast在较长的模板窗口中使用非连续的词。在编码模式中,通过集中于在第一和第二密码子位置处发现匹配而忽略第三位置中的错配来考虑第三基础摆动。使用相同的词大小在不连续的MEGABLAST中搜索比使用相同词大小的标准blastn更敏感和有效。不连续的megablast唯一的参数是:词大小:11或12;模板:16、18或21;模板类型:编码(0)、非编码(1)或两者(2)。
蓝藻拟柱孢藻(Cylindrospermopsis raciborskii)T3sxt基因的Sxt多肽序列可以从GenBank在登记号DQ787200下获得(http://www.ncbi.nlm.nih.gov/nuccore/DQ787200)。蓝藻拟柱孢藻(Cylindrospermopsis raciborskii)T3Sxt多肽的氨基酸序列在本文的附录“序列”部分中给出。然而,本发明不限于那些多肽的序列;本发明涵盖来自其它物种的多肽,其具有与所述蓝藻拟柱孢藻(Cylindrospermopsis raciborskii)T3多肽相同的功能。
在本发明的方法中,使底物与Sxt多肽A、B、D、G、H、I、S、T、U、V、W和X接触,或宿主细胞包含一种或多种编码此类多肽的核酸分子。在本发明的一些实施方式中,底物不与Sxt多肽A、B、D、G、H、I、S、T、U、V、W和X中的一种或多种接触,或宿主细胞不包含一种或多种编码此类多肽的核酸分子。在本发明方法的一些实施方式中,可以使用或不使用编码此类多肽的其它Sxt多肽或核酸分子。
如果本发明的方法确实使用特定的Sxt多肽,则底物将与该Sxt多肽接触和/或宿主细胞将包含编码这种多肽的核酸分子。如果本发明的方法不使用特定的Sxt多肽,则底物将不与该Sxt多肽接触和/或宿主细胞将不包含编码这种多肽的核酸分子。
在一些实施方式中,本发明的方法可以另外使用或不使用独立地选自由Sxt C、E、J、K、L和R组成的组中的一种或多种Sxt多肽,或编码此类多肽的核酸分子。优选地,本发明的方法另外使用选自由Sxt C、E、J、K、L和R(优选C和/或E)组成的组中的一种或多种Sxt多肽,或编码此类多肽的核酸分子。
在一些实施方式中,本发明的方法另外使用Sxt E或编码此类多肽的核酸分子。在其它实施方式中,本发明的方法另外不使用Sxt E或编码这种多肽的核酸分子。
在一些实施方式中,本发明的方法可以使用或不使用Sxt Q多肽或编码这种多肽的核酸分子。
在一些实施方式中,本发明的方法可以使用或不使用Sxt R多肽或编码这种多肽的核酸分子。
在一些实施方式中,本发明的方法可以使用或不使用ORF24多肽或编码这种多肽的核酸分子。
在其它实施方式中,本发明的方法可以使用或不使用独立地选自由Sxt F、M、N、O、P、Y、Z、ORF3、ORF4、ORF29、ORF34、OMPR或HISA组成的组中的一种或多种Sxt多肽,或编码此类多肽的核酸分子。优选地,本发明的方法不使用选自由Sxt F、M、N、O、P、Y、Z、ORF3、ORF4、ORF29、ORF34、OMPR或HISA组成的组中的一种或多种Sxt多肽,或编码此类多肽的核酸分子。
在本发明的一些实施方式中,本发明的方法可以使用或不使用独立地选自由以下组成的组中的一种或多种Sxt多肽(或编码此类多肽的核酸分子):
可能需要Sxt ACT来制备石房蛤毒素(LWTX-1至-6)的鞘丝藻(Lyngbya wollei)特异性“weird”类似物。它们携带有甲基-乙酰酯侧链而不是氨基甲酰基侧链。
可能需要Sxt DIOX和Sxt SUL来制备C-11硫酸化毒素类似物,例如膝钩藻毒素1至4和C-1至C-4毒素。
可能需要SxtN1和SxtN2来制备各种N-磺基氨基甲酰基类似物(C-毒素)。来自蓝藻拟柱孢藻(C.raciborskii)T3的SxtN可能由于催化位点的突变而失活。
在其它实施方式中,本发明的方法可以使用或不使用独立地选自由ORF24、P和Q组成的组中的一种或多种Sxt多肽,或编码此类多肽的核酸分子。优选地,本发明的方法不使用选自由ORF24、P和Q组成的组的一种或多种Sxt多肽,或编码此类多肽的核酸分子。
本发明的宿主细胞可以使用标准分子生物学技术(例如Green&Sambrook,“Molecular Cloning:A Laboratory Manual”,Fourth Edition,2012)并参考本文公开的实施例来生产。
每种特定多肽的编码序列将与合适的调节元件可操作地结合,所述调节元件有助于在宿主细胞中产生特定的多肽。例如,每个编码序列将与合适的启动子和终止子元件可操作地连接。优选地,这些调节元件被优化用于宿主细胞。例如,如果宿主细胞是大肠杆菌,则优选使用大肠杆菌调节元件(例如启动子、终止子、核糖体结合序列)。
可以将一种或多种核酸分子整合到宿主细胞的基因组中。一种或多种核酸分子可以以质粒或载体的形式存在于宿主细胞中。优选地,所有特定核酸都整合到宿主细胞的基因组中。可以将一种或多种特定核酸插入宿主细胞基因组内的糖操纵子内。
核酸分子可以以操纵子或基因簇片段的形式存在,即编码一种以上的所需多肽。这些可以独立地转化到宿主细胞中。例如,第一核酸分子可以包含编码sxtA、sxtB和sxtC的开放阅读框;第二核酸分子可以包含编码sxtD、sxtE、sxtG、sxtH、sxtI、sxtJ、sxtK和sxtL的开放阅读框;第三核酸分子可以包含编码sxtQ、sxtR、orf24、sxtS、sxtT、sxtU、sxtV、sxtW和sxtX的开放阅读框;和/或第四核酸分子可以包含编码sxtF、sxtP和sxtM的开放阅读框。在一些实施方式中,第三核酸分子可以包含编码sxtQ、sxtR、sxtS、sxtT、sxtU、sxtV、sxtW和sxtX;或sxtS、sxtT、sxtU、sxtV、sxtW和sxtX的开放阅读框。
核酸分子还可以包含合适的选择标记(例如编码抗生素抗性的基因)。核酸分子还可以包含其它控制元件,使得一种或多种多肽的表达是可诱导的。在一些优选的实施方式中,SxtA的表达是可诱导的。
在本发明的一些实施方式中,一种或多种核酸分子或编码功能等同多肽的核酸分子可能已经内源性地存在于宿主细胞中(在宿主细胞基因组中或在内源质粒中)。
本发明还延伸至如本文定义的所有宿主细胞。特别地,本发明提供了宿主细胞,其包含编码独立地选自由A、B、D、G、H、I、S、T、U、V、W和X组成的组中的一种或多种Sxt多肽的核酸分子。宿主细胞可以另外包含或不包含编码独立地选自由Sxt C、E、J、K、L和/或R组成的组中的一种或多种Sxt多肽的核酸分子。宿主细胞可以另外包含或不包含编码Sxt Q的核酸分子。
宿主细胞可以另外包含或不包含编码独立地选自由Sxt F、M、N、O、P、Y、Z、ORF3、ORF4、ORF29、ORF34、OMPR或HISA组成的组中的一种或多种或所有Sxt多肽的一种或多种核酸分子。优选地,宿主细胞不包含编码选自由Sxt F、M、N、O、P、Y、Z、ORF3、ORF4、ORF29、ORF34、OMPR或HISA组成的组中的一种或多种或所有Sxt多肽的核酸分子。
反应介质和培养基为生产新石房蛤毒素或其类似物提供合适的条件。条件将还包括合适的pH和温度,这可以由技术人员容易地确定。在适于生产新石房蛤毒素或其类似物的条件下在培养基中培养宿主细胞。合适的培养基是本领域熟知的。这些将根据正在使用的宿主细胞进行选择。优选地,培养基将是水性介质。
用于生产新石房蛤毒素或其类似物或变体的起始底物是:
(i)S-腺苷甲硫氨酸,
(ii)精氨酸,
(iii)乙酰辅酶A,丙二酰辅酶A或丙酰辅酶A,和
(iv)氨基甲酰磷酸酯。
因此,在该方法开始时,需要在反应介质和培养基中获得合适浓度的上述底物。本领域技术人员可以容易地确定合适浓度的上述底物。可以将精氨酸容易地从周围的培养基中作为底物摄入到宿主细胞中。其它底物(即S-腺苷甲硫氨酸、乙酰辅酶A、丙二酰辅酶A、丙酰辅酶A和氨基甲酰磷酸酯)是不稳定的。优选地,在宿主细胞内以足够的量生产这些底物(它们存在于所有活细胞中)。如果需要,可以容易地修饰宿主细胞以本领域常规的方式增加这些底物的产量。
在本发明的一些实施方式中,该方法在14-24℃的温度进行;优选在16-22℃进行;甚至优选在约17、18、19、20或21℃进行;最优选在约19℃进行。
优选地,从反应或培养基中分离和/或纯化新石房蛤毒素。这种分离/纯化可以通过任何合适的方法进行。
在本发明的实施方式中,其中,所述方法在宿主细胞中进行,新石房蛤毒素将在宿主细胞中生产。因此可以将宿主细胞与培养基分离(例如通过过滤或离心);然后可以裂解宿主细胞;和收获新石房蛤毒素。
可以通过在C-18反相树脂上的固相萃取从反应或培养基中分离新石房蛤毒素以除去疏水性化合物;新石房蛤毒素将以流通式(flow-through)出现。也可以使用在活性炭上使用阳离子交换树脂的固相萃取。对于进一步的纯化技术,可以参考US2015/0099879。
本发明还提供了生产如下定义的新石房蛤毒素的各种中间体的方法。这些方法可以在无细胞培养基中或在包含编码合适的Sxt多肽的核酸分子的宿主细胞中进行。
在其它实施方式中,本发明提供了生产式I化合物[中间体4]的方法:
其中,R是OH,该方法包括以下步骤:
(A)使式II化合物[中间体3]与Sxt S,和任选的α-酮戊二酸,以及任选的分子氧接触,
其中R是OH;以及(B)从反应介质中分离或纯化式I化合物。
本发明还提供了生产式I化合物[中间体4]的方法:
其中R是OH,该方法包括以下步骤:
(A)在使得生产Sxt S并且Sxt S将式II化合物转化为式I化合物的条件下,在式II化合物(中间体3)存在下在培养基中培养包含编码Sxt S的核酸分子的宿主细胞:
其中R是OH。
在其它实施方式中,本发明提供了生产式I化合物[中间体4']的方法:
其中R是OH,该方法包括以下步骤:
(A)使式II化合物[中间体3]与Sxt S,和任选的α-酮戊二酸,以及任选的分子氧接触,
其中R是OH;以及(B)从反应介质中分离或纯化式I化合物。
本发明还提供了生产式I化合物[中间体4']的方法:
其中R是OH,该方法包括以下步骤:
(A)在使得生产Sxt S并且Sxt S将式II化合物转化为式I化合物的条件下,在式II化合物(中间体3)存在下在培养基中培养包含编码Sxt S的核酸分子的宿主细胞:
其中R是OH。
在其它实施方式中,本发明提供了生产式I化合物[中间体5]的方法:
其中R是OH,该方法包括以下步骤:
(A)使式II化合物[中间体4]与Sxt D,和任选的NADH,以及任选的NADPH接触:
其中R是OH;以及
(B)从反应介质中分离或纯化式I化合物。
本发明还提供了生产式I化合物[中间体5]的方法:
其中R是OH,该方法包括以下步骤:
(A)在使得生产Sxt D并且Sxt D将式II化合物转化为式I的化合物的条件下,在式II化合物[中间体4]存在下在培养基中培养包含编码Sxt D的核酸分子的宿主细胞:
其中R是OH。
在其它实施方式中,本发明提供了生产式I化合物[中间体5']的方法:
其中R是OH,该方法包括以下步骤:
(A)使式II化合物[中间体4']与Sxt D,和任选的NADH,以及任选的NADPH接触:
其中R是OH;以及
(B)从反应介质中分离或纯化式I化合物。
本发明还提供了生产式I化合物[中间体5']的方法:
其中R是OH,该方法包括以下步骤:
(A)在使得生产Sxt D并且Sxt D将式II化合物转化为式I化合物的条件下,在式II化合物[中间体4']存在下在培养基中培养包含编码Sxt D的核酸分子的宿主细胞:
其中R是OH。
在其它实施方式中,本发明提供了生产式I化合物[中间体6]的方法,
其中R是OH,该方法包括以下步骤:
(A)使式II化合物[中间体5]与Sxt S,和任选的α-酮戊二酸,以及任选的分子氧接触:
其中R是OH;以及(B)从反应介质中分离或纯化式I化合物。
本发明还提供了生产式I化合物[中间体6]的方法:
其中R是OH,该方法包括以下步骤:
(A)在使得生产Sxt S并且Sxt S将式II化合物转化为式I化合物的条件下,在式II化合物[中间体5]的存在下在培养基中培养包含编码Sxt S的核酸分子的宿主细胞:
其中R是OH。
在其它实施方式中,本发明提供了生产式I化合物[中间体6']的方法:
其中R是OH,该方法包括以下步骤:
(A)使式II化合物[中间体5']与Sxt S,和任选的α-酮戊二酸,以及任选的分子氧接触:
其中R是OH;以及(B)从反应介质中分离或纯化式I化合物。
本发明还提供了生产式I化合物[中间体6']的方法:
其中R是OH,该方法包括以下步骤:
(A)在使得生产Sxt S并且Sxt S将式II化合物转化为式I化合物的条件下,在式II化合物[中间体5']存在下在培养基中培养包含编码Sxt S的核酸分子的宿主细胞:
其中R是OH。
在其它实施方式中,本发明提供了生产式I化合物[中间体7]的方法:
其中R是OH,该方法包括以下步骤:
(A)使式II化合物[中间体6]与Sxt S,和任选的α-酮戊二酸,以及任选的分子氧接触:
其中R是OH;以及(B)从反应介质中分离或纯化式I化合物。
本发明还提供了生产式I化合物[中间体7]的方法:
其中R是OH,该方法包括以下步骤:
(A)在使得生产Sxt S并且Sxt S将式II化合物转化为式I化合物的条件下,在式II化合物[中间体6]存在下在培养基中培养包含编码Sxt S的核酸分子的宿主细胞:
其中R是OH。
在其它实施方式中,本发明提供了生产式I化合物[中间体7']的方法:
其中R是OH,该方法包括以下步骤:
(A)使式II化合物[中间体6']与Sxt S,和任选的α-酮戊二酸,以及任选的分子氧接触:
其中R是OH;以及(B)从反应介质中分离或纯化式I化合物。
本发明还提供了生产式I化合物[中间体7']的方法:
其中R是OH,该方法包括以下步骤:
(A)在使得生产Sxt S并且Sxt S将式II化合物转化为式I化合物的条件下,在式II化合物[中间体6']存在下在培养基中培养包含编码Sxt S的核酸分子的宿主细胞:
其中R是OH。
本发明还涵盖上述方法,其中R是H。
本文所用的术语“新石房蛤毒素类似物”涵盖新石房蛤毒素的类似物和变体,例如下面提到的那些化合物(优选石房蛤毒素)。
如本文所公开的石房蛤毒素和新石房蛤毒素生物合成途径的阐明还使得能够生产各种石房蛤毒素、新石房蛤毒素和膝钩藻毒素变体,例如下文所示的变体(参考石房蛤毒素的结构):
如本文所公开的石房蛤毒素和新石房蛤毒素生物合成途径的阐明还使得能够生产以下新石房蛤毒素类似物和变体(参考石房蛤毒素的结构如下所示):
石房蛤毒素的分子结构。
麻痹性贝类毒素的天然衍生物(Oshima 1995)。使用的缩写是STX:石房蛤毒素;GTX:膝钩藻毒素;C:C-毒素;dc:脱氨基甲酰基;do:脱氧。
不寻常的石房蛤毒素衍生物的取代基。
(使用的缩写是LTX:鞘丝藻(Lyngbya wollei)毒素;GC:裸甲藻(Gymnodiniumcatenatum)毒素)。
来自金蛙(Atelopus zeteki)的zeteki毒素AB的分子结构(Yotsu-Yamashita等,2004)。
因此,在另一方面,本发明提供了生产如上表中定义的石房蛤毒素变体或其生产中的中间体的方法,该方法包含本文公开的用于生产新石房蛤毒素或新石房蛤毒素生产中的中间体的方法,其中,已经改进该方法以生产石房蛤毒素变体或其生产中的中间体。
例如,在石房蛤毒素的生产中,Sxt X多肽或sxt X基因的使用可能是不必要的,因为SxtX多肽负责新石房蛤毒素生产中的N1-羟基化步骤(并且石房蛤毒素是非N1-羟基化的)。
在C-11磺化以生产C-11硫酸化毒素(例如GTX-1至-4)之前,需要将碳C-11羟基化。这是由SxtDIOX所推定进行的。
磺基转移酶SxtN推定催化N-磺化以生产N-磺基氨基甲酰基毒素,例如GTX5/6和C1-4毒素。不确定这些反应在途径中的何处发生。然而,它们很可能在STX形成之前发生,即在中间体上而不是在途径的最终产物上发生。
在另一方面,本发明提供了用于生产新石房蛤毒素或其类似物或变体的方法,其中,所述方法另外包括使新石房蛤毒素或其类似物或变体与SxtN或SxtDIOX多肽接触的步骤。例如,宿主细胞可以是另外包含编码sxtN和/或sxtDIOX的基因的宿主细胞。
以这种方式,可以通过SxtN(通过氨基甲酰基侧链的硫酸化)将石房蛤毒素转化为GTX-5。类似地,可以通过SxtDIOX将石房蛤毒素转化为11-羟基石房蛤毒素。该步骤将在C-11硫酸化之前将石房蛤毒素转化为GTX-2/3(或将新石房蛤毒素转化为GTX-4/1)。
在给定菌株中生产的毒素阵列很可能是具有不同动力学(反应速度)并且通过各种修饰而改变对中间代谢物的松弛底物特异性的每种酶组合的结果。
中间体8通过O-氨基甲酰基转移酶SxtI转化为中间体9。中间体8以及中间体9均可以是双加氧酶SxtH和SxtT的底物,这些酶将中间体8转化为dcSTX并将中间体9转化为STX。类似的途径可能是neoSTX和dcneoSTX的生产。
中间体8向中间体9和脱氨基甲酰基毒素的转化,以及中间体9向石房蛤毒素的转化。
羟基化中间体8向羟基化中间体9和脱氨基甲酰基新石房蛤毒素的转化,以及羟基化中间体9向新石房蛤毒素的转化。
在又一个实施方式中,本发明提供了通过本发明的方法生产的新石房蛤毒素或其类似物。通过本发明的方法生产的新石房蛤毒素或其类似物可以进一步与无机或有机酸或碱转化为盐,特别是其药学上可接受的盐。
可用于此目的的酸包括盐酸、氢溴酸、硫酸、磺酸、甲磺酸、磷酸、富马酸、琥珀酸、乳酸、柠檬酸、酒石酸、马来酸、乙酸、三氟乙酸和抗坏血酸。适用于此目的的碱包括碱金属和碱土金属氢氧化物,例如氢氧化钠、氢氧化钾或氢氧化铯,氨和有机胺如二乙胺、三乙胺、乙醇胺、二乙醇胺、环己胺和二环己胺。形成盐的程序在本领域中是常规的。
通过本发明的方法或其盐生产的新石房蛤毒素或其类似物可以进一步配制用于药物组合物。因此,在另一方面,本发明提供了生产新石房蛤毒素或其类似物或其盐的方法,该方法另外包括在药物组合物中配制分离的或纯化的新石房蛤毒素或其盐的步骤。优选地,该步骤包括将分离的或纯化的新石房蛤毒素或其类似物或其盐与一种或多种药学上可接受的载体、佐剂和/或赋形剂组合。
特别地,根据本领域熟知的技术,可以将新石房蛤毒素或其类似物或其盐与一种或多种常规载体、稀释剂和/或赋形剂一起配制。药学上可接受的载体、佐剂和/或赋形剂可以是防腐剂。
该组合物可以适于口服施用或胃肠外施用,例如通过皮内、皮下、腹膜内、静脉内或肌内注射。因此,合适的药物形式包括普通或包衣片剂、胶囊、悬浮液和溶液,其含有活性组分以及任选地一种或多种常规惰性载体和/或稀释剂,例如玉米淀粉、乳糖、蔗糖、微晶纤维素、硬脂酸镁、聚乙烯吡咯烷酮、柠檬酸、酒石酸、水、水/乙醇、水/甘油、水/山梨糖醇、水/聚乙二醇、丙二醇、硬脂醇、羧甲基纤维素或脂肪物质如硬脂或任何上述物质的合适混合物。
或者,新石房蛤毒素或其盐可以配制用于局部施用,例如以凝胶、乳霜、乳液、糊剂等形式,例如包含新石房蛤毒素或其盐以及常规稀释剂、载体或赋形剂。
在其它实施方式中,新石房蛤毒素或其盐可以配制用于透皮施用。
附图说明
图1:由Kellmann(2008)提出的用于生产石房蛤毒素的先前生物化学途径。
图2-图3:两种修订的用于生产新石房蛤毒素的生物化学途径。在图2中,该途径涉及使用6-5-5元环中间体。
在图3中,该途径涉及使用5-5-5元环中间体,其转化为6-5-5环系统。
图4A-图4B:提出的生物化学途径,其显示在新石房蛤毒素的产生中在途径中的何处引入N-1羟基。-R基团表示可能发生羟基化的位置。
图5:IMAC后SxtA的SDS-PAGE。泳道1:含有SxtA(147kDa)的蛋白溶液;伴侣,DnaK和GroES,(分别为70kDa和60kDa);Sfp,(27kDa)。泳道2:梯形精度+蛋白标准双色(BioRad)。
图6:SxtA-ACP结构域的磷酸泛酰巯基乙胺基化的MALDI-TOF-TOF分析。通过MALDI-TOF-TOF分析纯化的SxtA(a)和与Sfp(b)共表达的SxtA,各自的质量分别为14694Da和15034Da。340Da的差异对应于磷酸泛酰巯基乙胺基臂的附着。
图7:大肠杆菌转化体甲醇提取物的液相色谱-质谱。a)诱导(虚线)和非诱导(实线)提取物两者的总离子流色谱图。b)诱导(虚线)和非诱导(实线)提取物两者的m/z=187.06的提取离子色谱图。c)ProgenesisQI统计分析,比较诱导(方形)和非诱导(圆形)的提取物之间m/z 187.06处分子离子的表达。d)诱导的提取物的质谱。
图8:将PPT酶基因构建体插入大肠杆菌的甘露醇操纵子中的方案。
图9A和图9B:(a)整合到乳糖操纵子中的sxt1,通过翻转酶重组除去卡那霉素盒。(b)整合到麦芽糖操纵子中的sxt2,通过翻转酶重组除去卡那霉素盒。(c)整合到木糖操纵子中的sxt3(所有基因),通过翻转酶重组除去卡那霉素盒。(d)整合到蜜二糖操纵子中的sxt4,未除去卡那霉素盒。
图10:大肠杆菌BL21(DE3)T3PPT酶NSX3v1的细胞提取物中的中间体8的检测。
图11:大肠杆菌BL21(DE3)T3PPT酶NSX3v1的细胞提取物中的中间体8的MS/MS谱。
图12:新石房蛤毒素标准溶液(100nM)的精确质量LC-MS分析。m/z 316.13639(400mmu窗口)的选择离子监测色谱图显示在上图中,峰值的MS谱图和理论谱图分别显示在中间和下图中。保留时间(RT)、手动积分峰面积(MA)、信噪比(SN)在上图中给出。测量的质量、化学组成和质量误差(ppm)在中间和下图中给出。
图13:来自大肠杆菌BL21(DE3)sfp NSX3v3的提取物的精确质量LC-MS分析。m/z316.13639(400mmu窗口)的选择离子监测色谱图显示在上图中,峰值的MS谱图和理论谱图分别显示在中间和下图中。保留时间(RT)、手动积分峰面积(MA)、信噪比(SN)在上图中给出。测量的质量、化学组成和质量误差(ppm)在中间和下图中给出。
图14:通过各种细胞裂解方法从大肠杆菌BL21(DE3)pVB-sxtABC中回收中间体1。LC-MS分析在SIM模式下进行(m/z 187.15534,质量窗口为400mmu)。仪器响应以峰面积(每秒计数)给出。
图15:neoSTX相对于大肠杆菌sfp NSX3v4(sfp sxt123V4)的生产水平百分比。sfpsxt123V4的提取物中neoSTX的估计浓度为2.8nM。
图16:将来自在50ml TB培养基中的摇瓶培养物中生长的大肠杆菌BL21(DE3)sfp(阴性对照菌株)和BL21(DE3)sfp NSX3v3的钠通道阻断毒素neoSTX浓缩。每个条代表生物学重复。误差条表示相同提取物的4个重复MNBA测定的标准偏差。在从1.2g细胞沉淀物分析之前,通过弱阳离子交换固相萃取提取所有样品。浓度以nmol neoSTX/升给出。提取物中neoSTX的平均浓度为38.74nM(±7.8标准偏差)。
图17:由大肠杆菌BL21(DE3)sfp pVB-sxtA生产中间体1。sfp pVB:没有插入的pVB载体。sfp nat 8:具有天然sxtA密码子使用和RBS与起始密码子之间的8bp间隔区的pVB载体。sfp nat 10:具有天然sxtA密码子使用和RBS与起始密码子之间的10bp间隔区的pVB载体。sfp syn 8:具有合成sxtA基因(被密码子使用优化以在大肠杆菌中表达)和RBS与起始密码子之间的8bp间隔区的pVB载体。sfp syn 10:具有合成sxtA基因(被密码子使用优化以在大肠杆菌中表达)和RBS与起始密码子之间的10bp间隔区的pVB载体。
图18:大肠杆菌菌株中中间体8和neoSTX的生产。T3PPT:大肠杆菌T3PPT酶NSX3V1。NsPPT:大肠杆菌T3PPT酶NSX3V1pET28b-NsPPT,编码结节菌(Hodularia spumigena)磷酸泛酰巯基乙胺基转移酶。T3Ala18T3PPT酶:大肠杆菌T3PPT酶NSX3V1pET30b-Ala18T3PPT酶,编码T3PPT酶,其去除了前18个N-末端氨基酸以改善表达过程中的溶解度。用0.2mM IPTG和1mM甲苯甲酸诱导培养物,如图所示。
图19:使用石房蛤毒素作为底物的SxtN的磺基转移酶测定的LC色谱图、MS谱、MS/MS片段化(从上到下)。
图20:使用STX作为底物的双加氧酶测定(SxtDIOX)的LC色谱图、MS谱,MS/MS片段化(从上到下)。用箭头表示在测定(右)中表示羟基-STX产生而在对照(左)中不存在的峰。
具体实施方式
实施例
通过以下实施例进一步说明本发明,除非另有说明,其中份数和百分比均以重量计,度数为摄氏度。应当理解的是,这些实施例虽然表明了本发明的优选实施方式,但仅以说明的方式给出。从以上讨论和这些实施例中,本领域技术人员可以确定本发明的基本特征,并且在不脱离其精神和范围的情况下,可以对本发明进行各种改变和修饰以使其适应各种用途和条件。因此,除了本文所示和所述的那些之外,从前面的描述中本发明的各种修饰对于本领域技术人员而言是显而易见的。这些修饰也旨在落入所附权利要求的范围内。
本文所述的每篇参考文献的公开内容均以引用的方式整体并入本文。
实施例1:SxtA的生产
在pET28b中亚克隆sxtA和sfp
使用Velocity聚合酶(Bioline)从基因组DNA进行来自蓝藻拟柱孢藻(Cylindrospermopsis raciborskii)T3的sxtA和来自枯草芽孢杆菌(Bacillus subtilis)的sfp的PCR扩增。遵循制造商的方案,退火温度为55℃,sxtA和sfp的延伸时间分别为4分钟和1分钟(sxtA引物:正向5'-GGGCTTTCATATGTTACAAAAGATTAA-3'(SEQ ID NO:81)和反向5'-AAAGTATGCGGCCGCATGCTTGAGTAT-3'(SEQ ID NO:82);sfp引物:正向5'-GGCATCCATGGGCAAGATTTACGGAA-3'(SEQ ID NO:83)和反向5'-GGCATCTCGAGTTATAAAAGCGCTTCG-3'(SEQ ID NO:84))。纯化PCR扩增子(DNA clean和浓缩剂5X试剂盒,ZymoResearch)并用NdeI/NotI(sxtA)或NcoI/XhoI(sfp;New England Biolabs)消化。将消化的产物纯化并连接到pET-28b(Novagen)中,用相同的酶切割,并通过琼脂糖凝胶电泳(DNA回收试剂盒,ZymoResearch)纯化。在电感受态大肠杆菌GB2005细胞中转化后,用通用引物T7启动子和T7终止子通过纯化质粒(PureLink Miniprep,Invitrogen)的PCR筛选阳性克隆。对插入物进行测序(Ramaciotti Center,UNSW,Australia)用于验证。
为了与sxtA共表达,使用Velocity聚合酶(Bioline)从pET28b::sfp扩增sfp基因,用于T7启动子和T7终止子的引物为(5'-GGTTAAGATCTGAAATTAATACGACTC-3'(SEQ ID NO:85),5'-TTTTAAGATCTTTTCAGCAAAAAACCC-3'(SEQ ID NO:86))。遵循制造商的方案,退火温度为55℃,延伸时间为1分钟。纯化扩增子(DNA净化和浓缩剂5X试剂盒,ZymoResearch)并用BglII(New England Biolabs)消化。将消化的产物纯化并连接到pET28b::sxtA中,用相同的酶切割,并如前所述进行纯化。在电感受态大肠杆菌GB2005细胞中转化后,通过纯化质粒(PureLink Miniprep,Invitrogen)的PCR筛选阳性克隆。对插入物进行测序(RamaciottiCenter,UNSW,Australia)用于验证。
用sfp表达sxtA并纯化holo-SxtA
为了表达sxtA,将0.5mL含有pET28b::sxtA,sfp和pRARE质粒(Invitrogen)的过夜大肠杆菌BL21(DE3)转化体在50mL Lysogeny Broth(LB)培养基中传代培养并在30℃搅拌(200rpm)下温育直至在600nm处的光密度为0.8-1.0,所述培养基补充有50μg.mL-1卡那霉素和30μg.mL-1氯霉素。然后用200μM异丙基β-D-硫代半乳糖苷(IPTG)诱导培养物,并在18℃搅拌温育过夜,并通过离心(4000rpm,在4℃20分钟,Hitachi CR22GIII离心机,R10A5转子)沉淀。将细胞沉淀冷冻直至进一步纯化。
将沉淀的细胞重悬于10mL裂解缓冲液(20mM磷酸钠缓冲液,pH 7.4,500mM NaCl,20mM咪唑)中,并通过超声裂解(Branson Digital Sonifier M450,3mm探针,30%振幅,4℃3分钟,15秒通电和59秒关闭)。将得到的悬浮液离心(20000rpm,4℃下60分钟,HitachiCR22GIII离心机,R20A2转子),并将上清液上样到Ni-亲和柱(1mL HiTrap柱,安装在AKTApurifier,GE Healthcare上),用20mM磷酸钠缓冲液,pH 7.4,500mM NaCl,20mM咪唑(缓冲液A)平衡。注射后,洗涤柱子(35mL缓冲液A,1mL.min-1)并使用20mM磷酸钠缓冲液,pH7.4,500mM NaCl,500mM咪唑(缓冲液B)洗脱蛋白,并且在0%至20%逐步梯度的缓冲液B中洗涤20分钟,接着在20%洗涤10分钟,然后在20%至100%线性梯度洗涤20分钟,以及在100%最后洗涤10分钟。在变性条件下(SDS-PAGE)通过10%聚丙烯酰胺凝胶电泳分析收集的级分(1mL,在280nm处检测),合并含有纯蛋白的级分。将蛋白溶液用50mM HEPES-150mMNaCl pH7.4通过离心过滤器(Amicon Ultra-4离心过滤器单元100k)脱盐和浓缩,然后加入甘油至终浓度10%(w/v)。通过使用蛋白测定试剂盒(Bio-Rad)测定蛋白浓度并储存在-80℃。
克隆sxtA的酰基载体蛋白结构域用于单独表达和与sfp一起表达
使用Velocity聚合酶(Bioline)(引物:正向5'-ATATCCATGGGACCTGGTGATCGCAAAGGA-3'(SEQ ID NO:87)和反向5'-TATCTCGAGAGTGTTGATTTCGTTGGCTG-3'(SEQ ID NO:88))扩增sxtA(sxtA-ACP)编码基因的酰基载体蛋白。遵循制造商方案,退火温度为54℃,延伸时间为1.5分钟。使用与sfp所述相同的方法纯化、消化PCR扩增子并连接到pET-28b中。在电感受态大肠杆菌GB2005细胞中转化后,用通用引物T7启动子和T7终止子筛选阳性克隆,并如前所述测序。为了与sfp共表达,将基因克隆到pET28b::sxtA-ACP质粒中,如前所述。
apo-和holo-sxtA-ACP的表达和纯化
为了表达sxtA-ACP,如上所述,将10mL含有pET28b::sxtA-ACP和pET28b::sxtA-ACP、sfp质粒的过夜大肠杆菌BL21(DE3)转化体在1L Lysogeny肉汤(LB)中培养并在37℃搅拌(200rpm)下温育直至用100μM IPTG诱导,该肉汤补充有50μg.mL-1卡那霉素和30μg.mL-1氯霉素。通过离心(4000rpm,在4℃20分钟,Hitachi CR22GIII离心机,R10A5)收集细胞,重悬于15mL裂解缓冲液中,并通过超声破碎(Branson Digital Sonifier M450,3mm探头,振幅30%,4℃ 3min,1秒通电,然后4秒关闭的循环)。将得到的悬浮液离心(20000g,在4℃60分钟,Hitachi CR22GIII离心机,R20A2转子),并将上清液上样到Ni-亲和柱(1mL HiTrap柱,安装在AKTApurifier,GE Healthcare上),其预先用20mM磷酸钠缓冲液,pH 7.4,500mMNaCl,20mM咪唑(缓冲液A)平衡。注射后,洗涤柱子(35mL缓冲液A,1mL.min-1),用20mM磷酸钠缓冲液,pH7.4,500mM NaCl,500mM咪唑(缓冲液B)洗脱蛋白,在0%至20%线性梯度的B中洗涤20分钟,接着在20%洗涤10分钟,然后在20%至100%线性梯度洗涤20分钟,以及在100%最后洗涤20分钟。在变性条件下(SDS-PAGE)通过15%聚丙烯酰胺凝胶电泳分析收集的级分(1mL,在280nm处检测),合并含有纯蛋白的级分。将蛋白溶液使用离心过滤(Amicon Ultra-15离心过滤装置3k)和50mM HEPES-150mM NaCl,pH7.4脱盐和浓缩,在液氮中冷冻并储存在-80℃。通过使用蛋白测定试剂盒(Bio-Rad)测定蛋白浓度。
在IMAC和SDS-PAGE上纯化后成功检测到SxtA(图5)。纯化预期大小为143kDa的蛋白,培养物的产量为0.5mg.L-1,通过胰蛋白酶解确认身份为SxtA。
Apo-和holo-sxtA-ACP的MALDI-TOF-TOF质谱分析
通过MALDI-TOF-TOF质谱法检测蛋白质量。对于基质制备,将10mg的3,5-二甲氧基-4-羟基肉桂酸加入到含有0.1%TFA的1mL 80%乙腈中,并将1mL基质与1μl蛋白样品混合在MALDI靶板的表面上。然后通过Bruker ultrafleXtreme MALDI-TOF/TOF用YAG激光进行分析。以正离子模式进行数据采集,并在每次分析之前立即校准仪器。在获得100个平均光谱的线性延迟提取模式中进行分析。结果如图6所示。
4-氨基-3-氧代-胍基庚烷的提取
将含有pRARE和pET28b::sxtA,sfp的BL21(DE3)转化体重悬于用0.1%酸乙酸酸化的甲醇中。通过超声破碎细胞(Branson Digital Sonifier M450,3mm探针,30%振幅,4℃2分钟,5秒通电和15秒关闭的循环)。将得到的悬浮液离心(20000rpm,在4℃30分钟,HitachiCR22GIII离心机,R20A2转子)。将上清液在旋转蒸发下干燥并储存在-20℃直至进一步分析。4-氨基-3-氧代-胍基庚烷的质谱分析
为了确定SxtA的生物合成产物,将含有pET28b::sxtA、sfp和pRARE的大肠杆菌细胞的细胞内代谢物化学提取并通过LC-MS分析。
将样品重悬于95:5乙腈:水(通常1mL)中,并转移至HPLC小瓶中进行质谱分析。使用连接至Q-Exactive Plus(ThermoFisher Scientific)的Dionex U3000UHPLC通过加热的电喷雾界面,对10μL样品进行LC-MS分析。在默认源条件下(如制造商的Tune软件所建议的)以正模式进行电离。将样品注射到Waters BEH HILIC柱(2.1×100mm,1.9μm)上。色谱条件如Turner等所述,没有修改。
质谱仪以数据依赖性分析模式运行,在每个全扫描质谱后收集六个MS/MS谱。来自文献的毒素和代谢物的包含列表用于优先考虑它们的检测。
诱导细胞和未诱导对照之间质谱的比较显示在m/z 187.06[M+H]+的1.1分钟处存在分子离子,对应于AOGH(C8H18N4O)的质子化质量。该分子离子的二次离子碎裂导致与AOGH非常相似的碎裂模式。该实验在8个重复中实现,并且通过Progenesis QI分析质量数据以量化诱导和非诱导提取之间的表达差异。与未诱导的对照相比,观察到推定的AOGH化合物在诱导的细胞中过表达(图),最大倍数变化等于无穷大(在阴性对照中完全不存在)并且ANOVAp值为1.1×10-16
纯化并分析187.06Da质量的化合物,NMR证实了AOGH的结构。
实施例2:sxt1片段
将来自蓝藻拟柱孢藻(C.raciborskii)T3的以下三个开放阅读框(ORF)置于标记为“sxt1”:sxtA、sxtB和sxtC的核苷酸片段中。使用GeneArt软件,通过Life Technology对每个ORF进行密码子优化以在大肠杆菌中表达。
在片段的两端添加EcoRI限制性位点。另外,将lacZ(H1)和lacA(H2)基因的50bp同源区域分别添加到5'-和3'-末端,以通过RED ET介导的重组整合到大肠杆菌基因组中。在H1的下游,添加终止子以防止通读,然后是转录因子基因xylS及其Ps2启动子。(XylS是在与其诱导物甲苯甲酸结合后从Pm启动子转录所需的转录因子。)然后是终止子,然后是Pm启动子以用于转录下游sxt基因。在每个ORF的上游,添加核糖体结合位点(RBS)。最后,加入具有用于通过翻转酶-重组酶(GeneBridges)切除的两个侧翼FRT位点的卡那霉素抗性标记和同源臂H2,包括末端EcoRI位点。
实施例3:sxt2片段
以下sxt基因包括在“sxt2”片段中:sxtD、sxtE、sxtG、sxtH、sxtI、sxtJ、sxtK、sxtL。使用GeneArt软件,通过Life Technology对每个ORF进行密码子优化以在大肠杆菌中表达。
设计sxt2片段以具有末端EcoRI位点,用于与大肠杆菌的malE(H1)和malG(H2)基因重组的同源臂以及sxt基因上游的Pm启动子。该片段还含有具有FRT位点的kanR抗性盒,如片段sxt1。
实施例4:sxt3片段
设计了sxt3片段的三种变体。以下sxt基因包括在“sxt3”片段中,变体1:sxtQ、sxtR、orf24、sxtS、sxtT、sxtU、sxtV、sxtW、sxtX。以下sxt基因包括在“sxt3”片段中,变体2:sxtQ、sxtR、sxtS、sxtT、sxtU、sxtV、sxtW、sxtX。以下sxt基因包括在“sxt3”片段中,变体3:sxtS、sxtT、sxtU、sxtV、sxtW、sxtX。使用GeneArt软件,通过Life Technology对每个ORF进行密码子优化以在大肠杆菌中表达。
设计sxt3片段的每个变体以具有末端EcoRI位点,用于与大肠杆菌的xylF(H1)和xylB(H2)基因重组的同源臂以及sxt基因上游的Pm启动子。该片段的每个变体还含有具有FRT位点的kanR抗性盒,如片段sxt1。
实施例5:sxt4片段
以下sxt基因包括在“sxt4”片段中:sxtF、sxtP、sxtM。使用GeneArt软件,通过LifeTechnology对每个ORF进行密码子优化以在大肠杆菌中表达。
设计sxt4片段以具有末端EcoRI位点,用于与大肠杆菌的melR(H1)和melB(H2)基因重组的同源臂以及sxt基因上游的Pm启动子。该片段还含有具有FRT位点的kanR抗性盒,如片段sxt1。
实施例6:大肠杆菌BL21(DE3)PPT酶的产生
理想的是使用磷酸泛酰巯基乙胺基转移酶(PPT酶)将聚酮化合物合成酶的载脂形式SxtA转化为其holo-形式。
已经对Raphidiopsis brooki D9和Cylindrospermopsis racoborskii CS-505的整个基因组进行测序,并将序列保存在GenBank中。这些菌株中的每一种仅含有单一PPT酶基因。基于D9和CS-505PPT酶基因设计特异性PCR引物以PCR扩增和测序来自蓝藻拟柱孢藻(C.raciborskii)T3的PPT酶基因。
设计合成基因构建体以将蓝藻拟柱孢藻(C.racicorskii)T3PPT酶基因整合到大肠杆菌BL21(DE3)的麦芽糖操纵子中。对PPT酶基因进行密码子优化以在大肠杆菌中表达,并且该构建体装配有T7启动子和β-内酰胺酶基因以用于选择氨苄青霉素抗性。起始密码子也改为ATG。
然后使用Quick&Easy大肠杆菌基因缺失试剂盒按照制造商的说明(GeneBridges,目录号K006)将基因构建体整合到大肠杆菌BL21(DE3)(Life Technology)的麦芽糖操纵子中,如图8所示。通过测序验证了非预期突变的正确整合和缺失。
实施例7:通过大肠杆菌BL21(DE3)PPT酶pSxt1生产4-氨基-3-氧代-胍基庚烷
sxt1片段通过Life Technology在pMA-RQ(ampR)质粒骨架内产生。该质粒在本文中将称为pSxt1。将pSxt1质粒转化到大肠杆菌BL21(DE3)PPT酶中,其携带来自其基因组中的蓝藻拟柱孢藻(Cylindrospermopsis raciborskii)T3的磷酸泛酰巯基乙胺基转移酶。PPT酶基因在T7启动子控制下(IPTG诱导型),pSxt1上的sxtA、B和C基因在Pm启动子控制下(间甲苯甲酸可诱导型)。
本实验的目的是测量在恒定诱导剂浓度(IPTG(0.5mM)和间甲苯甲酸(1mM))的三个不同温度5℃、19℃和30℃下sxtA基因大肠杆菌中的表达和活性。实验菌株是大肠杆菌BL21(DE3)PPT酶pSxt1,阴性对照是大肠杆菌BL21(DE3)(亲本菌株)。预期仅SxtA的酶产物,因为SxtB和SxtC的底物是其它酶的酶产物,例如SxtG,其不在pSxt1上编码。
BL21(DE3)(亲本菌株)和BL21(DE3)PPT酶pSxt1的种子培养物分别在37℃下在LB和LB50μg/ml氨苄青霉素和卡那霉素中过夜生长。第二天,将含有卡那霉素50μg/ml的200ml体积的LB培养基一式三份接种,每次用大肠杆菌BL21(DE3)PPT酶pSxt1的2ml种子培养物接种,并在30℃温育直至培养物达到OD600为~0.6。
对于阴性对照,用来自大肠杆菌BL21(DE3)的2ml种子培养物各一式三份接种200ml体积的不含抗生素的LB,并在30℃温育至OD600为~0.6。然后将所有培养物转移至相应的温度,并适应30分钟。随后,向每种培养物中加入IPTG(0.5mM终浓度)和间甲苯甲酸(1mM终浓度),然后在5℃温育48小时,在19℃温育18小时,并在30℃温育18小时。
在诱导前和实验结束时采集样品用于SDS-PAGE以及用于RT-PCR。诱导18小时后,通过7500rpm离心12分钟收获培养物。将细胞沉淀冷冻直至提取用于LC-MS分析。
提取
将细胞沉淀重悬于1ml水中并在冰上超声处理(输出对照4,占空比50%,总共7分钟,循环2-3分钟)。超声处理后,加入4ml乙腈,涡旋样品,离心除去细胞碎片和其它颗粒。
LC-MS/MS分析
在Hikelaboratory,Haukeland大学医院的Waters Xevo TQ-S上进行LC-MS分析,所述Waters Xevo TQ-S与配有50×2.1mm Acquity BEH酰胺柱的iclass Acquity UPLC偶联。流动相A由10mM甲酸铵pH 3.0组成,流动相B由95%乙腈和10mM甲酸铵pH 3.0组成。流速为每分钟0.4ml,柱温保持在40℃。以梯度85%B至70%B在3分钟内施加。注射体积总是1μl。
通过电喷雾电离将分析物以正模式电离。根据Tsuchiya等(2014)和Tsuchiya等(2015),测量了以下mrm跃迁。精氨酸175.05->60.00、175->70.02,4-氨基-3-氧代-胍基庚烷:187.1->170.1、187.1->128.1、187.1->110.1、187.1->72.08、187.1->60.05。
在所有培养处理以及纯精氨酸溶液中检测到大的精氨酸峰(数据未显示),而精氨酸溶液和所有对照中不存在4-氨基-3-氧代-胍基庚烷信号。此外,除了在19℃诱导的培养物外,所有大肠杆菌BL21(DE3)PPT酶pSxt1培养物中都不存在4-氨基-3-氧代-胍基庚烷信号。
该实验证明使用合成的DNA构建体可以在大肠杆菌BL21(DE3)中以催化活性形式表达SxtA。在该实验中,在用0.5mM IPTG和1mM甲苯甲酸诱导后,表达仅在19℃的生长温度下发生。
实施例8:将片段sxt1与sxt3整合到大肠杆菌DE3(BL21)PPT酶的糖分解代谢操纵子中
将sxt1构建体整合到大肠杆菌BL21(DE3)PPT酶的lac操纵子中,如下:
使用2μl模板DNA、0.4μM引物,Phusion DNA聚合酶在50μl反应体积中进行PCR扩增合成的DNA构建体sxt1。
PCR循环如下:98℃1分钟,30个循环:98℃5秒,72℃2分钟,72℃5分钟,然后保持在4℃。
在通过凝胶电泳和凝胶提取纯化后,然后将PCR产物(8019bp)用于RED ET介导的重组。在重组之前,通过电穿孔用质粒pRED(GeneBridges)转化大肠杆菌BL21(DE3)PPT酶,并根据制造商的说明书诱导pRED编码的重组酶的转录。随后,用上述PCR产物(2.5kV,200Ohm,25μF,在5μl中150ng PCR产物)电穿孔转化菌株,然后重组进入lac操纵子。
将电穿孔的细胞接种到含有15μg/ml卡那霉素的LB琼脂上,并在37℃过夜生长。挑取得到的克隆并接种到含有15μg/ml卡那霉素的MacConkey(含乳糖)琼脂上,并在37℃生长至少24小时。将得到的白色菌落分离到纯培养物中,并通过PCR和测序进行测试以确保片段sxt1正确且无突变地整合到lac操纵子中。
确认后,根据制造商的方案(GeneBridges),使用质粒p707通过翻转酶重组选择克隆以除去卡那霉素抗性盒。筛选得到的克隆的卡那霉素抗性,并通过PCR验证卡那霉素抗性盒的成功去除。此外,PCR用于验证sxt1片段的其余部分是完整的。
然后使用相同的方法将所得菌株用于将片段sxt2整合到麦芽糖操纵子中。通过相同的方法使用所得菌株(其中整合有片段sxt1和sxt2且去除卡那霉素抗性盒后)将sxt3片段的三种变体中的每一种整合到木糖操纵子中。
sxt3变体大肠杆菌BL21(DE3)菌株
菌株 菌株设计 从sxt3中缺失基因
T3PPT酶sxt1 sxt2 sxt3 v1 NSX3v1
T3PPT酶sxt1 sxt2 sxt3 v2 NSX3v2 orf24
T3PPT酶sxt1 sxt2 sxt3 v3 NSX3v3 sxtQ、sxtR和orf24
然后使用来自枯草芽孢杆菌(Bacillus subtilis)的4'-磷酸泛酰巯基乙胺基转移酶基因sfp(Pfeifer BA,等(2001)Science 291:1790-2)代替上述每种菌株中的T3PPT酶以生产另外的菌株。
然后将所得菌株用于将片段sxt4整合到大肠杆菌BL21(DE3)T3PPT酶和大肠杆菌BL21(DE3)sfp的蜜二糖操纵子中。没有除去卡那霉素盒。sxt1-4片段的图表在图9A和图9B中给出。
实施例9:大肠杆菌BL21(DE3)sfp NSX3v3的变体菌株的产生
使用菌株大肠杆菌BL21(DE3)sfp NSX3v3作为亲本菌株以产生以下菌株,其中通过同源重组方法缺失个体或多组基因。
大肠杆菌BL21(DE3)菌株表和已将它们整合到非必需的糖操纵子中的基因
实施例10:使用LC-MS检测新石房蛤毒素和中间体
LC-MS用于检测新石房蛤毒素和新石房蛤毒素生产中的中间体。LC-MS分析在ThermoFisher Scientific Q Exative Hybrid Quadrupole质谱仪上进行,该质谱仪配备有ESI II离子源,并在线偶联至Dionex 3000Ultimate RSLC Ultrapressure液相色谱仪。
可以由大肠杆菌BL21(DE3)NSX3菌株产生的可能的石房蛤毒素类似物和中间代谢 物的质荷比(m/z)
化合物 m/z[M+H]+加合物 化学组成
中间体1 187.15534 C<sub>8</sub>H<sub>19</sub>ON<sub>4</sub>
中间体2 229.17714 C<sub>9</sub>H<sub>21</sub>ON<sub>6</sub>
中间体3 211.16657 C<sub>9</sub>H<sub>19</sub>N<sub>6</sub>
中间体4 209.14584 C<sub>9</sub>H<sub>17</sub>N<sub>6</sub>
中间体5 207.13527 C<sub>9</sub>H<sub>15</sub>N<sub>6</sub>
中间体6 223.13019 C<sub>9</sub>H<sub>15</sub>ON<sub>6</sub>
中间体7 223.13090 C<sub>9</sub>H<sub>15</sub>ON<sub>6</sub>
中间体8 225.14584 C<sub>9</sub>H<sub>17</sub>ON<sub>6</sub>
中间体9 268.15165 C<sub>10</sub>H<sub>18</sub>O<sub>2</sub>N<sub>7</sub>
dcSTX 257.13566 C<sub>9</sub>H<sub>17</sub>O<sub>3</sub>N<sub>6</sub>
dcneoSTX 273.13058 C<sub>9</sub>H<sub>17</sub>O<sub>4</sub>N<sub>6</sub>
STX 300.14148 C<sub>10</sub>H<sub>18</sub>O<sub>4</sub>N<sub>7</sub>
neoSTX 316.13639 C<sub>10</sub>H<sub>18</sub>O<sub>5</sub>N<sub>7</sub>
STX-15N4 304.12962 C<sub>10</sub>H<sub>18</sub>O<sub>4</sub>N<sub>3</sub>-<sup>15</sup>N<sub>4</sub>
实施例11:大肠杆菌提取物中中间体1和中间体8的检测
大肠杆菌BL21(DE3)T3PPt酶NSX3v1在19℃下在100ml烧瓶中的20ml LB肉汤中振荡(200rpm)生长。当其达到OD600为0.9时,用0.2mM IPTG,1mM甲苯甲酸诱导培养物,并生长18小时至OD600=5。
通过离心收获细胞,并在800μl的0.1M乙酸的甲醇溶液中提取。将裂解物离心,并在LC-MS分析之前用乙腈以1:5稀释上清液。
在提取物中检测到中间体1和8。来自中间体8的光谱显示在图10和图11中。
实施例12:新石房蛤毒素的生产
在50ml Hi YE培养基中制备大肠杆菌sfp NSX3v3的种子培养物,并在30℃(225rpm)温育过夜。根据制造商的说明,建立配备有加热器,水冷,pH和溶解氧探针的新Brunswick BioFlo 110发酵罐(2L体积)用于发酵实验。将2L Hi-YE培养基装入发酵罐,并高压灭菌。在高压灭菌后,将酵母提取物、氯化镁、葡萄糖和甘油的储备溶液无菌地添加到发酵罐中。另外,向发酵罐中加入2ml 5%消泡剂204(Sigma Aldrich)的消毒剂溶液。用20ml过夜种子培养物接种培养基,其OD600为5.71。起始培养物的OD600在0.15下测量。在19℃将培养物温育,初始搅拌速度为50rpm,温育26小时后增加至600rpm。用加压空气以2升/小时的流速吹扫培养物。连续监测pH和溶解氧水平,并在取样后离线测量生长。在整个实验期间pH(pH 7.1)以及溶解氧水平(100%)是稳定的。温育22小时后(OD600=10.6)用0.5mM间甲苯甲酸和0.2mM IPTG诱导培养物,并再温育22小时。将无菌葡萄糖溶液(400g/l)以2.9ml/min的流速在实验的24和26.3小时之间加入培养物中(总共11.4g),并且1.8ml无菌1M硫酸镁溶液是在实验的26.3小时添加,以试图刺激neoSTX的生长和产生。45小时后终止实验,此时通过离心(5000×5,30分钟,4℃)收获培养物。将细胞沉淀用50ml冰冷的MQ水(5000×g,10分钟,4℃)洗涤两次,称重,并储存在-20℃直至分析。获得的总生物量是23.77g。
通过在0.1%甲酸中煮沸来裂解来自发酵实验的细胞,并且在LC-MS分析之前用含有0.1%甲酸的乙腈以1:5稀释提取物(参见图12和图13)。还通过小鼠神经母细胞瘤测定MS分析沉淀中neoSTX的含量。
实施例13:优化细胞裂解以提取中间体
将天然基因sxtA、sxtB、sxtC克隆到pVB载体(Vectrons Biosolutions)中,并将得到的载体pVB-sxtABC转化到大肠杆菌BAP1中。BAP1pVB-sxtABC在19℃下在10ml TB培养基中以200rpm振荡生长24小时。通过离心收获细胞,并用冰冷的MQ水洗涤两次,将沉淀物称重,并储存在-20℃直至分析。
将沉淀物在各种裂解溶液中重悬(1:3湿重:体积):
1.含有25mM氢氧化钠的50%甲醇
2.含有0.5%氢氧化铵的50%甲醇
3.含有0.1%甲酸的50%甲醇
4.0.1mM盐酸
5.0.1%甲酸
6.0.5%氢氧化铵
使用配备有微探针的Branson Sonifier 250(输出2,占空比50%)将处理1、2和3超声处理2分钟。将处理3至5在沸水批次中煮沸5分钟。将提取物在18000×g(4℃)下离心10分钟。将250μl上清液与含有0.4%甲酸的750μl乙腈混合,并离心(10分钟,18000×g,4℃)。将上清液转移至自动进样器小瓶中以用于中间体1的LC-MS分析(参见图14)。
在0.1%甲酸中煮沸5分钟被认为是最合适的方法,因为它不会引起对HILIC LC-MS的干扰,并且在提取过程中产生最小量的沉淀。
实施例14:最佳菌株和生产水平
在10ml LB肉汤中制备大肠杆菌菌株的种子培养物,并在30℃下以200rpm振荡生长过夜。比较以下菌株的neoSTX生产水平:
大肠杆菌BL21(DE3)sfp
大肠杆菌BL21(DE3)T3PPT酶sxt1sxt2
大肠杆菌BL21(DE3)T3PPT酶NSX3v1
大肠杆菌BL21(DE3)sfp NSX3v1
大肠杆菌BL21(DE3)sfp NSX3v2
大肠杆菌BL21(DE3)sfp NSX3v3
大肠杆菌BL21(DE3)sfp NSX3v4
大肠杆菌BL21(DE3)sfp NSX3v5
大肠杆菌BL21(DE3)sfp NSX3v6
大肠杆菌BL21(DE3)sfp NSX3v7
将30ml具有0.4%甘油并用89mM磷酸盐缓冲液缓冲至pH 6.8的Terrific Broth(TB)用300μl过夜种子培养物接种至OD600为0.05。将培养物在30℃下以225rpm振荡温育直至它们达到OD600为0.4。然后将培养物转移至19℃(振荡225rpm),并生长至OD600为0.5。为了诱导sfp和sxt基因,将0.05mM IPTG(0.05mM终浓度)和甲苯甲酸(0.5mM终浓度)加入到培养物中,其在19℃下继续振荡(225rpm)温育48小时。每种菌株在一式三份亚培养物中生长。通过在4℃下以3000×g离心10分钟而收获25ml的每种培养物。将1ml上清液的等分试样储存在-20℃,弃去剩余的上清液。将细胞沉淀物分别用25和5ml冰冷的MQ水(3000×g,4℃,10分钟)洗涤两次。称重细胞沉淀并储存在-20℃。
从细胞沉淀中提取毒素
将细菌细胞沉淀物以1:4(湿重:体积)的比例重悬于0.1%甲酸中并煮沸5分钟。将提取物在冰上短暂冷却,以16000×g离心10分钟,收集上清液。对于LC-MS分析,将上清液用含有25nM石房蛤毒素-15N4内标的90%乙腈:10%甲醇:0.1%甲酸以1:5的比例稀释。将样品离心(16000×g,10分钟,4℃),将上清液转移至自动进样器小瓶中进行LC-MS分析。
从生长培养基中提取毒素
将生长培养基(200μl)用2μl 10%甲酸酸化,煮沸5分钟,在冰上冷却,并在4℃下以16000×g离心10分钟。将上清液转移到新管中,并且加入40μl内标(25nM石房蛤毒素-15N4在10%甲醇90%乙腈和0.1%甲酸中)。将管在16000×g 4℃下离心10分钟,并将上清液转移至HPLC自动进样器小瓶用于LC-MS分析。结果如图15所示。
实施例15:用于检测钠通道阻断毒素的小鼠神经母细胞瘤测定(MNBA)
用于MNBA的大肠杆菌培养物
在10ml LB肉汤中制备大肠杆菌菌株BL21(DE3)sfp和BL21(DE3)sfp NSX3v3的种子培养物,并在30℃下以200rpm振荡生长过夜。将50ml具有0.4%甘油并用89mM磷酸盐缓冲液缓冲至pH 6.8的Terrific Broth(TB)用500μl过夜种子培养物接种至OD600约为0.05。将培养物在30℃下以225rpm振荡温育直至它们达到OD600为0.4。然后将培养物转移至19℃(振荡225rpm)并生长至OD600为0.5。为了诱导sfp和sxt基因,将0.05mM IPTG(0.05mM终浓度)和甲苯甲酸(0.5mM终浓度)加入到培养物中,其在19℃下继续振荡(225rpm)温育48小时。每种菌株在一式三份亚培养物中生长。通过在4℃下以2500×g离心10分钟以收获培养物。将细胞沉淀物分别用25℃冰冷MQ水(2500×g,4℃,10分钟)洗涤两次。称重细胞沉淀物并储存在-20℃。
MNBA的细胞提取
根据以下方案,使用Accell Plus CM柱(360mg,1.1ml,WAT010910,Waters),通过弱阳离子交换固相提取(WCX-SPE)为MNBA提取细菌细胞。
将1.2g细胞沉淀物重悬于3.6ml 0.15%甲酸中并煮沸裂解5分钟。通过以16000×g离心10分钟来澄清细胞提取物。
用3.6ml甲醇调节柱,然后用3.6ml 0.15%甲酸调节。加入3ml样品,用1.8ml MQ水洗涤柱子,然后用1.8ml乙腈洗涤。然后将柱干燥,样品在含有5%甲酸的2×3.6ml甲醇中洗脱。通过真空离心干燥洗脱液,并将样品在200μl 0.01%甲酸中重构。
用于钠通道阻滞毒素的小鼠神经母细胞瘤检测
使用小鼠神经母细胞瘤细胞系(CCL131),并使用小鼠神经母细胞瘤测定法(如Humpage等(2007).Environ.Toxicol.Chem.26:1512-9所述)。
使用针对neoSTX的经认证的参考材料,用和不用生物基质制备MNBA测定的校准曲线(CRM-NEO-c,批次2009-02-18,在3mM HCl中65.6μM)。结果如图16所示。
实施例16:通过ELISA免疫化学检测新石房蛤毒素
使用石房蛤毒素ELISA试剂盒(Abraxis PN 52255B,Microtiter Plate 96T)检测大肠杆菌中产生的neoSTX。该试剂盒使用多克隆石房蛤毒素抗体,其与neoSTX具有1.3%的交叉反应性。制备大肠杆菌T3PPT酶NSX3v3的培养物并获得细胞裂解物。在SampliQ硅胶柱(Agilent PN 5982-2211,1ml,100mg,Jansson D和Astot C(2015)m J Chromatogr A1417:41-8)上通过固相萃取提取样品。将提取和蒸发的样品溶解在由STX ELISA试剂盒提供的100μl样品缓冲液中。还制备了在样品缓冲液中1:1000稀释的大肠杆菌T3PPT酶NSX3v3提取物。使用试剂盒提供的Std 0(作为空白),Std 1(0.0668nM STX)和STd 5(1.3365nMSTX)通过2点标准曲线校准测定。参考样品用于估计neoSTX的STX ELISA试剂盒的准确度,而SPE期间的neoSTX的回收率基于提取的参考样品与参考样品的比率来估计。测定结果显示在下表中。估计的准确度为119%,而SPE期间的回收率为92%。该测定在大肠杆菌T3PPT酶NSX3v3的细胞提取物中检测到相当于1.16nM STX。转换为neoSTX,这相当于89.1nM,每升大肠杆菌培养物的产率约为223pmol neoSTX。
STX ELISA。由STX ELISA试剂盒提供Std 0、Std 1和Std 5。通过2点(y=-0.4627+0.7597)校准ELISA测定。根据制造商,基于STX抗体的1.3%交叉反应性计算neoSTX的浓度。ND:没有检测到。SPE对neoSTX的回收率为92%。
实施例17:合成的与天然的基因和RBS间隔区的作用
使用以下元素制作了许多pVB构建体:
(i)Pm启动子;
(ii)合成的sxtA(对大肠杆菌进行密码子优化)或sxt天然基因;以及
(iii)核糖体结合位点(RBS)和起始密码子之间的8或10bp间隔区。
具有RBS和SxtA起始密码子之间的8bp间隔区的Pm启动子的序列如下所示。RBS和起始密码子用大写字母显示,间隔区用下划线标出:
agtccagccttgcaagaagcggatacaggagtgcaaaaaatggctatctctagaaaggcctaccccttaggctttatgcaacagaaacaataataatGGAGtcatgaacATG(SEQ ID NO:100)
具有RBS和SxtA起始密码子之间的10bp间隔区的Pm启动子的序列如下所示。RBS和起始密码子用大写字母显示,间隔区用下划线标出:
agtccagccttgcaagaagcggatacaggagtgcaaaaaatggctatctctagaaaggcctaccccttaggctttatgcaacagaaacaataataatGGAGtcatgaacatATG(SEQ ID NO:101)
将四种pVB-sxtA质粒独立地转化到大肠杆菌BL21(DE3)sfp中。
制备具有pVB-sxtA变体的四种大肠杆菌BL21(DE3)sfp中的每一种的培养物并收获细胞。提取细胞沉淀物并通过LC-MS分析中间体1的存在。结果如图17所示。可以看出,与含有8bp间隔区的合成sxtA构建体相比,在RBS和起始密码子之间含有10bp间隔区的合成sxtA构建体中产生显著更多的中间体1。
实施例18:在各种PPT酶存在下制备中间体8
在本实验中,比较了以下PPT酶:
1.T3PPT:大肠杆菌BL21(DE3)T3PPT酶NSX3v1
2.T3PPT:大肠杆菌BL21(DE3)T3PPT酶NSX3v1pET28B-NsPPT(具有来自结节菌(Nodularia spumigena)的磷酸泛酰巯基乙胺基转移酶的pET载体)
3.Ala18T3PPT:大肠杆菌BL21(DE3)T3PPT酶NSX3v1pET30b-Ala18T3PPT酶(T3PPT酶,其中除去其前18个氨基酸以增加表达蛋白的溶解度。)
将菌株在20ml LB肉汤中在19℃以200rpm振荡培养18小时。具有pET载体的菌株在50μg/ml卡那霉素存在下生长。培养物在没有诱导物的情况下生长,或者在OD600约0.8℃下用0.2mM IPTG和1mM甲苯甲酸诱导。在没有诱导物的情况下,sxt和PPT酶基因有明显的背景表达。
测量中间体8和neoSTX,并用作PPT酶有效性的指标。结果如图18所示。Ala18T3PPT给出最高水平,但诱导后水平降低。这种现象可能是由于当PPT酶水平过高时抑制SxtA且占据酶。
实施例19:石房蛤毒素类似物和变体的产生
石房蛤毒素可以通过SxtN转化为GTX-5(即通过氨基甲酰基侧链的磺化)。类似地,石房蛤毒素可以通过SxtDIOX转化为11-羟基STX。这是在C-11磺化之前将STX转化为GTX-2/3(或将新石房蛤毒素转化为GTX-4/1)的步骤。
将来自Scytonema cf.crispum UCFS15的sxtN克隆到合适的表达载体中,并置于IPTG诱导型T7启动子的控制下,并在其N-和C-末端提供六组氨酸标签。
将来自S.cf.crispum UCFS15的sxtO克隆到合适的表达载体中,并置于IPTG诱导型T7启动子的控制下,并在其N-和C-末端提供六组氨酸标签。
表达载体在大肠杆菌中表达,并且使用No-NTA树脂(Novagen)纯化Sxt蛋白。在SDS凝胶上评估蛋白的纯度。
使用石房蛤毒素或GTX2测试SxtN的磺基转移酶活性。使用HPLC-MS/MS测定结果。使用石房蛤毒素作为底物,鉴定出在对照中不存在的2.13分钟处的峰。其包含m/z 380.10的主峰,其碎片化(LC-MS/MS)至m/z为300.14和282.13,建议为GTX5(如图19所示)。在使用GTX2作为底物时,在样品和对照之间没有观察到毒素存在的差异。
使用石房蛤毒素测试SxtDIOX的双加氧酶活性。使用HPLC-MS/MS测定结果。在测定和对照两者中鉴定底物。此外,在测定中鉴定出在对照中不存在的1.66分钟处的m/z316.14>296.13的峰,表明存在羟基化的石房蛤毒素(图20)。
序列
所附的序列表在此作为说明书的一部分完全并入。
序列表单独文本
SEQ ID NO:91
整合到大肠杆菌乳糖操纵子后的sxt1片段的序列。
SEQ ID NO:92
整合到大肠杆菌木糖操纵子中的sxt3片段版本1的序列。
SEQ ID NO:93
整合到大肠杆菌木糖操纵子中的sxt3片段版本2的序列。
SEQ ID NO:94
整合到大肠杆菌木糖操纵子中的sxt3片段版本3的序列。
SEQ ID NO:95
整合到大肠杆菌乳糖操纵子中的sxt1片段的序列。
SEQ ID NO:96
整合到大肠杆菌蜜二糖操纵子中的sxt4片段的序列。
SEQ ID NO:97
整合到大肠杆菌麦芽糖操纵子中的sxt2片段的序列。
SEQ ID NO:98
缺失sxtL后整合到麦芽糖操纵子中的sxt2片段的序列。
SEQ ID NO:99
整合到麦芽糖操纵子中的sxt2片段的序列。
序列表
<110> 卑尔根技术交易股份公司
新南威尔士大学
<120> 方法
<130> 489.121403/01
<160> 101
<170> PatentIn version 3.5
<210> 1
<211> 252
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 1
Met Ile Asp Thr Ile Ser Val Leu Leu Arg Glu Trp Thr Val Ile Ser
1 5 10 15
Leu Thr Gly Leu Ala Phe Trp Leu Trp Glu Ile Arg Ser Pro Phe His
20 25 30
Gln Ile Glu Tyr Lys Ala Lys Phe Phe Lys Glu Leu Gly Trp Ala Gly
35 40 45
Ile Ser Phe Val Phe Arg Asn Val Tyr Ala Tyr Val Ser Val Ala Ile
50 55 60
Ile Lys Leu Leu Ser Ser Leu Phe Met Gly Glu Ser Ala Asn Phe Ala
65 70 75 80
Gly Val Met Tyr Val Pro Leu Trp Leu Arg Ile Ile Thr Ala Tyr Ile
85 90 95
Leu Gln Asp Leu Thr Asp Tyr Leu Leu His Arg Thr Met His Ser Asn
100 105 110
Gln Phe Leu Trp Leu Thr His Lys Trp His His Ser Thr Lys Gln Ser
115 120 125
Trp Trp Leu Ser Gly Asn Lys Asp Ser Phe Thr Gly Gly Leu Leu Tyr
130 135 140
Thr Val Thr Ala Leu Trp Phe Pro Leu Leu Asp Ile Pro Ser Glu Val
145 150 155 160
Met Ser Val Val Ala Val His Gln Val Ile His Asn Asn Trp Ile His
165 170 175
Leu Asn Val Lys Trp Asn Ser Trp Leu Gly Ile Ile Glu Trp Ile Tyr
180 185 190
Val Thr Pro Arg Ile His Thr Leu His His Leu Asp Thr Gly Gly Arg
195 200 205
Asn Leu Ser Ser Met Phe Thr Phe Ile Asp Arg Leu Phe Gly Thr Tyr
210 215 220
Val Phe Pro Glu Asn Phe Asp Ile Glu Lys Ser Lys Asn Arg Leu Asp
225 230 235 240
Asp Gln Ser Val Thr Val Lys Thr Ile Leu Gly Phe
245 250
<210> 2
<211> 759
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 2
atgatagata caatatcagt actattaaga gagtggactg taatttttct tacaggttta 60
gccttctggc tttgggaaat tcgctctccc ttgcatcaaa ttgaatacaa agctaaattc 120
ttcaaggaat tgggatgggc gggaatatca ttcgtcttta gaattgttta tgcatatgtt 180
tctgtggcaa ttataaaact attgagttct ctatttatgg gagagtcagc aaattttgca 240
ggagtaatgt atgtgcccct ctggctgagg atcatcactg catatatatt acaggactta 300
actgactatc tattacacag gacaatgcat agtaatcagt ttctttggtt gacgcacaaa 360
tggcatcatt caacaaagca atcatggtgg ctgagtggaa acaaagatag ctttaccggc 420
ggacttttat atactgttac agctttgtgg tttccactgc tggacattcc ctcagaggtt 480
atgtctgtag tggcagtaca tcaagtgatt cataacaatt ggatacacct caatgtaaag 540
tggaactcct ggttaggaat aattgaatgg atttatgtta cgccccgtat tcacactttg 600
catcatcttg atacaggggg aagaaatttg agttctatgt ttactttcat cgaccgatta 660
tttggaacct atgtgtttcc agaaaacttt gatatagaaa aatctaaaaa tagattggat 720
gatcaatcag taacggtgaa gacaattttg ggtttttaa 759
<210> 3
<211> 759
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 3
atgattgata ccattagcgt tctgctgcgt gaatggaccg ttatttttct gaccggtctg 60
gcattttggc tgtgggaaat tcgtagtccg ctgcatcaga ttgaatacaa agccaaattt 120
ttcaaagaac tgggttgggc aggtatcagc tttgtttttc gtattgttta tgcctatgtt 180
agcgtggcca ttatcaaact gctgagcagc ctgtttatgg gtgaaagcgc aaattttgcc 240
ggtgttatgt atgttccgct gtggctgcgt attattaccg catatattct gcaggatctg 300
accgattatc tgctgcatcg taccatgcat agcaatcagt ttctgtggct gacccataaa 360
tggcatcata gcaccaaaca gagttggtgg ctgagcggta ataaagatag ctttaccggt 420
ggtctgctgt ataccgttac cgcactgtgg tttccgctgc tggatattcc gagcgaagtt 480
atgagcgttg ttgcagttca tcaggtgatt cataacaact ggattcacct gaatgtgaaa 540
tggaatagct ggctgggtat tatcgaatgg atttatgtta caccgcgtat ccataccctg 600
catcatctgg ataccggtgg tcgtaatctg agcagtatgt ttacctttat tgatcgtctg 660
tttggcacct atgtgtttcc ggaaaacttt gatatcgaaa aaagcaaaaa ccgcctggat 720
gatcagagcg ttaccgttaa aaccattctg ggtttctga 759
<210> 4
<211> 117
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 4
Met Phe Gln Thr Lys Ser Tyr Tyr Ser Val Val Gly Leu Glu Thr Glu
1 5 10 15
Leu Ile Lys Gly Lys Phe Phe Met Ser Asn Glu Leu Thr Asn Glu Gln
20 25 30
Val Phe Lys Leu Val Cys Met Glu Val Ile Glu Lys Met Gly Phe Ala
35 40 45
His Phe Pro Pro Ile Ile Leu Val Tyr Glu Met Thr Asn Ser Gly Phe
50 55 60
Val Asp Trp Cys Glu Gln Met Val Phe Val Asp Asp Lys Gly Lys Leu
65 70 75 80
Asp Glu Gly Glu Lys Phe Leu Leu Asp Trp Met Arg Arg Asn Val Gly
85 90 95
Asn Phe Asp Leu Ile Arg Glu Leu Met Pro Val Ala Glu Arg Leu Glu
100 105 110
Met Lys Met Arg Ser
115
<210> 5
<211> 354
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 5
atgttccaga ccaagagtta ttactctgtg gtaggattag aaacagaatt gattaaagga 60
aaattcttta tgtctaatga attgacaaac gaacaagtat ttaagctggt ttgtatggaa 120
gtcattgaaa aaatgggatt cgcacacttt cctcccatca ttttagtcta tgagatgact 180
aattccggat ttgtagattg gtgcgagcag atggtttttg ttgatgataa aggtaagcta 240
gatgaaggag aaaaattctt attagactgg atgagacgga acgtaggaaa ctttgatctg 300
atacgtgagt taatgcccgt tgctgaacgt ctagaaatga aaatgaggtc ataa 354
<210> 6
<211> 354
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 6
atgtttcaga ccaaaagcta ttatagcgtc gttggcctgg aaaccgaact gattaaaggt 60
aaattcttca tgagcaacga actgaccaat gaacaggtgt ttaaactggt gtgcatggaa 120
gtgattgaaa aaatgggttt tgcacacttt ccgcctatta tcctggttta tgaaatgacc 180
aattccggct ttgttgattg gtgcgagcag atggtttttg tggatgataa aggcaaactg 240
gatgagggcg aaaaatttct gctggattgg atgcgtcgta atgtgggtaa ttttgatctg 300
attcgcgaac tgatgccggt ggcagaacgc ctggaaatga aaatgcgtag ctaa 354
<210> 7
<211> 318
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 7
Met Thr His Val Ala Leu Glu Gln Ala Ile Ala Lys Val Pro Arg Ser
1 5 10 15
Ile Gln Ser Glu Leu Arg Thr Ile Leu Ala Gln His Ala Val Ile Asp
20 25 30
Ser Ser Val Val Ala Ser Trp Ile Asp Arg Leu Gly Thr Asn Ile Ser
35 40 45
Thr Leu Met Ile Gln Leu Leu Pro Val Ala Ala Thr Tyr Ala Arg Val
50 55 60
Pro Ile Ser Gln Phe Tyr Val Gly Ala Ile Ala Leu Gly Lys Pro Gln
65 70 75 80
Ser Lys Asn Gln Leu Gly Ser Gly Thr Leu Tyr Phe Gly Ala Asp Met
85 90 95
Glu Phe Val Gly Gln Ala Leu Ser Phe Ser Val His Ala Glu Gln Ser
100 105 110
Ala Thr Ile Asn Ala Trp Leu His Gly Glu Thr Gly Leu Gln Ala Leu
115 120 125
Ala Ile His Glu Ala Pro Cys Gly Tyr Cys Arg Gln Phe Leu Tyr Glu
130 135 140
Met Ala Thr Val Asn Gln Asn Phe Val Leu Leu Val Lys Ser Asn Glu
145 150 155 160
Ser Gln Pro Glu Gln Thr Tyr Thr Ser Asn Lys Leu Pro His Phe Leu
165 170 175
Pro Glu Pro Phe Gly Pro Ala Asp Leu Gly Leu Thr Gly Gly Leu Met
180 185 190
Gln Thr Val Phe His Asp Leu Glu Thr Tyr Ser Thr Asp Asp Val Val
195 200 205
Leu Ala Ala Leu Ser Ala Ala Asn Gln Ser Tyr Ala Pro Tyr Thr Lys
210 215 220
Asn Phe Ala Gly Val Ala Leu Lys Asp Ser His Gly Asn Ile Phe Thr
225 230 235 240
Gly Arg Tyr Ala Glu Asn Ala Ala Phe Asn Ser Ser Met Ser Pro Met
245 250 255
Glu Ser Ala Leu Thr Phe Met Asn Met Asn Arg Tyr Ser Gln Ser Leu
260 265 270
Phe Asp Ile Cys Asp Ala Val Leu Val Glu Val Glu Thr Gly Ile Ser
275 280 285
Gln Arg Pro Val Thr Glu Ala Phe Leu Ser Ser Ile Ala Pro Lys Val
290 295 300
Lys Leu Arg Tyr Ala Pro Ala Thr Pro Ser Ser Asn Lys Leu
305 310 315
<210> 8
<211> 957
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 8
atgacccatg tagcattaga acaggcgatt gccaaggttc cacgttccat tcaatcagag 60
ttaaggacaa ttcttgccca acatgctgta attgactcaa gtgttgtcgc atcttggatt 120
gatcgacttg gtactaatat tagtacgtta atgattcaat tactacccgt agccgcaact 180
tatgctaggg taccaatatc gcagttttat gtaggggcga tcgctcttgg taaaccacaa 240
tctaagaatc aactgggttc tggaactctt tattttggtg ccgacatgga atttgtagga 300
caggcactta gtttctcagt tcacgcagaa caatccgcca ccataaatgc gtggttgcac 360
ggagaaaccg gtttacaagc attagcaatc cacgaagcac catgtggata ctgccgacaa 420
tttttatacg agatggcaac tgtaaatcaa aattttgttc ttcttgtgaa gtctaatgaa 480
tcacagcctg agcaaactta tacctcaaat aaactcccac attttctacc cgagccattt 540
ggaccagcgg atctaggact cacaggtgga ttaatgcaaa cagtatttca tgatctggag 600
acctattcta ccgatgatgt tgtgcttgct gctctatccg ctgccaatca aagttatgct 660
ccctacacga aaaattttgc aggggtagcg ttaaaagatt cccacgggaa tatatttaca 720
ggtcgatacg ctgaaaacgc tgcctttaat tcatccatgt ctccgatgga atctgctctg 780
actttcatga atatgaatag atattctcaa tcactattcg acatttgtga tgctgtttta 840
gttgaagtgg aaactgggat tagtcaaaga cccgtcactg aagccttcct ttcttctatc 900
gctcccaagg tcaagttaag gtatgcccct gcaactccgt caagtaataa gttatga 957
<210> 9
<211> 957
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 9
atgacccatg ttgccctgga acaggcaatt gcaaaagttc cgcgtagcat tcagagcgaa 60
ctgcgtacca ttctggcaca gcatgcagtt attgatagca gcgttgtggc aagctggatt 120
gatcgtctgg gcaccaatat tagtaccctg atgatccagc tgctgccggt tgcagcaacc 180
tatgcacgtg ttccgattag ccagttttat gttggtgcca ttgcactggg caaaccgcag 240
agtaaaaatc agctgggtag cggcaccctg tattttggtg cagatatgga atttgttggt 300
caggcactga gctttagcgt tcatgcagaa cagagcgcca ccattaatgc ctggctgcat 360
ggcgaaaccg gactgcaggc actggcaatc catgaagcac cgtgtggtta ttgtcgccag 420
tttctgtatg aaatggcaac cgtgaatcag aattttgtgc tgctggtgaa aagcaatgaa 480
agccagccgg aacagaccta taccagcaac aaactgccgc attttctgcc tgaaccgttt 540
ggtccagccg atctgggtct gaccggtggc ctgatgcaga ccgtgtttca cgatctggaa 600
acctatagca ccgatgatgt tgttctggca gcactgagtg cagcaaatca gagttatgca 660
ccgtatacca aaaactttgc cggtgttgca ctgaaagata gtcatggtaa catttttaca 720
ggtcgctatg ccgaaaacgc agcatttaat agcagcatga gcccgatgga aagcgcactg 780
acctttatga atatgaatcg ttattcacag agcctgttcg atatttgtga tgcagttctg 840
gtagaagtgg aaaccggtat tagtcagcgt ccggttaccg aagcctttct gagtagcatt 900
gcaccgaaag tgaaactgcg ctatgcaccg gcaaccccga gcagtaacaa actgtga 957
<210> 10
<211> 1245
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 10
Met Leu Gln Lys Ile Asn Arg Tyr Thr His Gly Phe Val Ala Val Pro
1 5 10 15
Val Ile Leu Ala Cys Arg Glu Lys Gly Val Phe Glu Leu Leu Ala Asp
20 25 30
Glu Ser Pro Leu Ser Leu Asn Gln Met Val Glu His Leu Gly Ala Asn
35 40 45
Ser Gly His Phe Gln Val Ala Leu Arg Met Leu Glu Ser Leu His Trp
50 55 60
Leu Ser Arg Asn Lys Glu Leu Lys Tyr Ser Leu Thr Ala Glu Ala Ala
65 70 75 80
Ile His Asn Lys Ile Ser Glu Asp Ile Leu Gln Leu Tyr Asn Leu Pro
85 90 95
Ile Gln Ser Tyr Leu Glu Gly Lys Gln Gly Asn Leu Leu Gly Arg Trp
100 105 110
Ile Glu Arg Ser Cys Gln Leu Trp Asn Leu Asp Asn Pro Leu Met Ala
115 120 125
Asp Phe Leu Asp Gly Leu Leu Val Ile Pro Leu Leu Leu Ala Leu His
130 135 140
Lys His Asn Leu Leu Ala Asp Ser Glu Asp Lys Pro Leu Leu Ser Ser
145 150 155 160
Leu Ser Ser Thr Val Gln Glu Glu Leu Gly Lys Leu Phe Leu His Leu
165 170 175
Gly Trp Ala Asp Leu Thr Ala Gly Arg Leu Thr Ile Thr Glu Leu Gly
180 185 190
Arg Phe Met Gly Glu Arg Ala Leu Asn Thr Ala Ile Val Ala Ser Tyr
195 200 205
Thr Pro Met Leu Ser Arg Ile His Asp Val Leu Phe Gly Asn Cys Leu
210 215 220
Ser Val Phe Gln Arg Asp Ala Ser Gly His Glu Arg His Ile Asp Arg
225 230 235 240
Thr Leu Asn Val Ile Gly Ser Gly Phe Gln His Gln Lys Tyr Phe Ala
245 250 255
Asp Leu Glu Glu Ser Ile Leu Ser Val Phe Asn Gln Leu Pro Leu Glu
260 265 270
Glu Gln Pro Lys Tyr Ile Thr Asp Met Gly Cys Gly Asp Gly Thr Leu
275 280 285
Leu Lys Arg Val Trp Glu Thr Ile Gln Phe Lys Ser Ala Arg Gly Lys
290 295 300
Ala Leu Glu Gln Tyr Pro Leu Arg Leu Ile Gly Val Asp Tyr Asn Glu
305 310 315 320
Ala Ser Leu Lys Ala Thr Thr Arg Thr Leu Ala Ser Leu Pro His Leu
325 330 335
Val Leu Gln Gly Asp Ile Gly Asn Pro Glu Gln Met Val Arg Ser Leu
340 345 350
Glu Ala His Gly Ile His Asp Pro Glu Asn Ile Leu His Ile Arg Ser
355 360 365
Phe Leu Asp His Asp Arg Leu Phe Ile Pro Pro Gln Lys Arg Asn Glu
370 375 380
Leu Lys Glu Arg Ala His Leu Pro Tyr Gln Ser Val Cys Val Asp Asp
385 390 395 400
Gln Gly Glu Leu Ile Pro Pro His Val Met Val Gln Ser Leu Val Glu
405 410 415
His Leu Glu Arg Trp Ser Gln Val Val Asn Lys His Gly Leu Met Ile
420 425 430
Leu Glu Val His Cys Leu Glu Pro Arg Val Val Tyr Gln Phe Leu Asp
435 440 445
Lys Ser Glu Asn Leu His Phe Asp Ala Phe Gln Gly Phe Ser Gln Gln
450 455 460
Tyr Leu Val Glu Ala Glu Val Phe Leu Met Ser Ala Ala Gln Val Gly
465 470 475 480
Leu Phe Pro Lys Leu Glu Leu Ser Lys Arg Tyr Pro Lys Thr Phe Pro
485 490 495
Phe Thr Arg Ile Thr Leu Asn Tyr Phe Glu Lys Arg Pro Tyr Lys Ile
500 505 510
Ser His Ala Tyr Leu Ser Asp Leu Pro Ala Leu Val Asp Leu Glu Val
515 520 525
Lys Cys Trp Pro Glu Asn Leu Arg Ala Ser Thr His Glu Ile Arg Arg
530 535 540
Arg Leu Glu Leu Asn Pro Gln Gly Asn Leu Val Leu Ile Ile Glu Asp
545 550 555 560
Gln Ile Ile Gly Ala Ile Tyr Ser Gln Thr Ile Thr Ser Thr Glu Ala
565 570 575
Leu Glu Asn Val Lys Tyr Ala Gln Val Pro Thr Leu His Thr Pro Gln
580 585 590
Gly Ser Val Ile Gln Leu Leu Ala Leu Asn Ile Leu Pro Glu Phe Gln
595 600 605
Ala Arg Gly Leu Gly Asn Glu Leu Arg Asp Phe Met Leu Tyr Tyr Cys
610 615 620
Thr Leu Lys Gly Gly Ile Glu Ser Val Val Gly Val Thr Arg Cys Arg
625 630 635 640
Asn Tyr Val Asn Tyr Ser Gln Met Pro Met Met Glu Tyr Leu Lys Leu
645 650 655
His Asn Glu Gln Arg Gln Leu Leu Asp Pro Ile Val Gly Phe His Val
660 665 670
Ser Gly Gly Ala Glu Ile Arg Gly Ile Ile Ala Asn Tyr Arg Pro Glu
675 680 685
Asp Thr Asp Asn Leu Gly Met Gly Ile Leu Ile Glu Tyr Asn Leu Arg
690 695 700
Asp Ser Ala Leu His Ser Pro Gly Asp Arg Lys Gly Pro Tyr Ile Asn
705 710 715 720
Ser Ala Ile Gly Ser Leu Val Pro Lys Ala Thr Ser Ala Thr Lys Glu
725 730 735
Asn Lys Thr Val Ala Asp Leu Val Lys Glu Cys Ile Leu Lys Val Met
740 745 750
Gly Ser Gln Arg Gln Ala Ala Tyr Ala Pro Gln Gln Lys Leu Leu Asp
755 760 765
Met Gly Leu Asp Ser Leu Asp Leu Leu Glu Leu Gln Thr Leu Leu Glu
770 775 780
Glu Arg Leu Gly Ile Asn Leu Ser Gly Thr Phe Phe Leu Gln Lys Asn
785 790 795 800
Thr Pro Thr Ala Ile Ile Thr Tyr Phe Gln Asn Gln Val Val Gln Glu
805 810 815
Lys Gln Ser Asp Leu Ala Pro Pro Val Asp Ser Ala Asn Glu Ile Asn
820 825 830
Thr Leu Glu Asn Val Val Asn Gln Gln Lys Ile Pro Gln Val Thr Arg
835 840 845
Val Val Thr Glu Gln Gln Gly Arg Lys Val Leu Ile Asp Gly His Trp
850 855 860
Val Ile Asp Phe Ala Ser Cys Asn Tyr Leu Gly Leu Asp Leu His Pro
865 870 875 880
Lys Val Lys Glu Ala Ile Pro Pro Ala Leu Asp Lys Trp Gly Thr His
885 890 895
Pro Ser Trp Thr Arg Leu Val Ala Ser Pro Ala Ile Tyr Glu Glu Leu
900 905 910
Glu Glu Glu Leu Ser Lys Leu Leu Gly Val Pro Asp Val Leu Val Phe
915 920 925
Pro Ala Val Thr Leu Leu Gln Ile Gly Ile Leu Pro Leu Leu Thr Gly
930 935 940
Asn Asn Gly Val Ile Phe Gly Asp Ile Ala Ala His Arg Cys Ile Tyr
945 950 955 960
Glu Ala Cys Cys Leu Ala Gln His Lys Gly Ala Gln Phe Ile Gln Tyr
965 970 975
Arg His Asn Asp Leu Asn Asp Leu Ala Glu Lys Leu Ala Lys Tyr Pro
980 985 990
Pro Glu Gln Val Lys Ile Ile Val Ile Asp Gly Val Tyr Ser Met Ser
995 1000 1005
Ala Asp Phe Pro Asp Leu Pro Ala Tyr Val His Leu Ala Lys Glu
1010 1015 1020
Tyr Asn Ala Leu Ile Tyr Met Asp Asp Ala His Gly Phe Gly Ile
1025 1030 1035
Leu Gly Glu Asn Pro Ser Ser Asp Met Pro Tyr Gly Tyr Lys Gly
1040 1045 1050
Asn Gly Met Val Asn Tyr Phe Asp Leu Arg Phe Ala Glu Asp Asn
1055 1060 1065
Ile Ile Tyr Val Ala Gly Leu Ser Lys Ala Tyr Ser Ser Tyr Ala
1070 1075 1080
Ala Phe Leu Thr Cys Gly Asp Arg Arg Ile Lys Thr Asn Phe Arg
1085 1090 1095
Asn Ala Trp Thr Ala Ile Phe Ser Gly Pro Ser Pro Val Ala Ser
1100 1105 1110
Leu Ala Ser Ala Leu Ala Gly Leu Gln Val Asn Arg Gln Glu Gly
1115 1120 1125
Glu Gln Leu Arg Lys Gln Ile Tyr His Leu Thr His Lys Leu Val
1130 1135 1140
Thr Gln Ala Arg Ala Ile Gly Phe Glu Val Asp Asn Tyr Gly Tyr
1145 1150 1155
Val Pro Ile Val Gly Val Leu Val Gly Asp Ala Gln His Met Ile
1160 1165 1170
Asp Val Cys Gln Leu Leu Trp Glu Tyr Gly Ile Leu Ile Thr Pro
1175 1180 1185
Ala Ile Phe Pro Ile Val Pro Leu Asn Lys Ser Ala Leu Arg Phe
1190 1195 1200
Ser Ile Thr Ala Ala Asn Thr Glu Glu Glu Ile Asp Gln Ala Ile
1205 1210 1215
Lys Ser Leu Lys Ala Val Trp Asp Leu Leu Gln Lys Arg Lys Ala
1220 1225 1230
Leu Pro Cys Lys Gln Glu Glu Asn Ile Leu Lys His
1235 1240 1245
<210> 11
<211> 3738
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 11
atgttacaaa agattaatcg ttatactcac ggctttgtgg cggttcccgt tattcttgcg 60
tgtcgagaaa aaggtgtttt tgaattactc gccgatgaaa gtcctctctc tttaaaccaa 120
atggtggaac atctgggagc taacagcgga cattttcaag ttgctttgag gatgctcgag 180
tctttacatt ggctttcccg aaataaggag cttaaatact ctctaaccgc agaagcagcg 240
attcacaaca aaatttcgga agacattctt caattgtaca acctaccaat tcagtcttat 300
ttagaaggga aacaaggaaa tttgctggga agatggattg agcgttcttg ccaattgtgg 360
aacctggaca atcccctaat ggcagatttt ttagatggat tactggtcat cccactcctg 420
ctggcactgc acaaacacaa cttgcttgca gattcggagg acaaaccttt gctctcctca 480
ttaagctcaa cagtgcaaga agagttgggt aagttatttc tccaccttgg ctgggctgac 540
cttacagcag gtcgtttgac cataaccgaa cttggtcgat ttatgggaga gcgagccttg 600
aatacagcca tagtggcgtc ctacactcct atgttgtccc gcattcatga tgtattgttt 660
ggcaattgtc tctccgtatt ccaaagagat gcttccggtc acgaaaggca cattgatcgc 720
acccttaacg tgatcgggag tggatttcaa caccagaaat attttgccga tttagaagaa 780
agtatcctct cagtattcaa tcagttgcca ttagaagaac aacccaaata cattactgac 840
atggggtgtg gcgatggaac tctcctgaaa cgagtctggg aaaccattca atttaagtct 900
gctaggggaa aagcactcga acagtatccc ctgcgtctta taggtgtaga ttataacgaa 960
gcttctttaa aagctaccac acgcaccctt gctagccttc cccacttagt tttacaggga 1020
gatattggga acccagaaca aatggtgcgt tctttagaag ctcatggcat tcatgatccc 1080
gaaaatatcc tgcacatccg ttcgttcctc gaccatgatc gtctctttat tcctcctcag 1140
aaaagaaacg aattgaaaga acgtgctcac ttaccttacc aatcagtctg tgtcgatgat 1200
caaggagagc ttattcctcc tcatgttatg gtgcaaagtt tggtggaaca cttagaaaga 1260
tggtctcaag tggtcaataa acacggttta atgattttgg aggtccattg tttggaacca 1320
agggtagtct atcagttttt agacaaaagc gaaaacttac atttcgatgc gtttcaggga 1380
ttttctcagc agtatcttgt ggaagctgag gtttttctca tgtctgctgc acaagtaggt 1440
ctatttccaa aactagagct ttctaaaaga tacccaaaaa catttccttt tactcgcatt 1500
acgcttaatt acttcgagaa aagaccttac aaaattagtc atgcctattt gtcagattta 1560
cctgccttag ttgacttgga ggtcaagtgt tggccagaaa atttacgggc atctactcat 1620
gaaattcggc gaagacttga gctaaacccg caaggtaatt tagtgctgat tatagaagat 1680
caaattattg gtgcgattta ttcccaaaca attaccagca ctgaggcatt agagaatgta 1740
aaatatgcgc aagtgccgac gttacatact ccccaagggt cagttattca actgctcgca 1800
ctaaatattc tacctgagtt tcaggcgcgg gggttaggaa atgaattgcg ggactttatg 1860
ctttactact gtaccctgaa aggcggcatt gagagcgtgg tgggtgtaac tcgctgtcga 1920
aattatgtca attattccca aatgccgatg atggagtatt taaagctaca caatgagcaa 1980
cgacagcttc tggatccaat tgtgggtttc catgtgtcgg gaggagccga aattagggga 2040
attattgcta attatcgtcc ggaagataca gataatctcg gcatgggtat tttgattgaa 2100
tataacctgc gcgacagtgc tttgcactcg cctggtgatc gcaaaggacc gtatattaac 2160
tcagcaattg gttcattggt accaaaagca acatctgcaa ctaaggaaaa caaaactgta 2220
gcggatctcg ttaaagaatg catcttaaaa gtaatgggtt cccaacgtca ggcagcctac 2280
gctccacaac aaaaactgct ggatatggga ttagattctt tagatttatt agaactgcaa 2340
acgctcctag aggaacgttt agggatcaat ctgtctggaa cgttcttttt acaaaagaac 2400
actccaactg ccatcatcac ttatttccaa aaccaagtgg tacaagagaa acaatctgat 2460
ctagctccac ctgttgactc agccaacgaa atcaacactc tggaaaacgt agttaaccaa 2520
caaaaaattc ctcaagtcac aagagtcgtc acagaacaac aaggtcgcaa ggtgctaatt 2580
gacggacatt gggtgataga ctttgcttct tgcaactatt taggtcttga cttgcatcca 2640
aaagttaagg aagcaattcc accagctttg gataaatggg gcacacatcc aagctggact 2700
cggcttgttg cttccccagc aatttatgag gaattggagg aagaattgtc caaactttta 2760
ggcgtacctg atgttttagt atttccagct gtaacactgc ttcagatagg aattttacca 2820
ctattaactg ggaataatgg tgtcatcttt ggtgacatag ctgcacatcg ttgtatttat 2880
gaagcgtgct gtctggctca gcacaaagga gcccagttca tccaatatcg acataatgat 2940
ttgaacgatt tagccgaaaa actagcaaaa tatccgcctg aacaagtaaa gattattgtc 3000
attgatggcg tgtattccat gtcggcagat tttcccgatc tgccagctta cgtgcatctg 3060
gcaaaagagt acaatgcctt aatttacatg gatgatgctc atggttttgg cattttgggc 3120
gaaaatccca gcagcgatat gccttacggt tacaaaggaa acgggatggt gaattatttt 3180
gacctgcggt ttgcagagga taatatcatc tatgtagctg gtttgtccaa agcctattct 3240
tcttacgcag cattcttaac ttgtggcgat cgccggatca aaaccaactt ccgcaacgct 3300
tggactgcca tattttctgg tccttctcct gttgcgagtt tggcaagtgc cttagccgga 3360
ttacaggtga atcgtcagga gggggagcag ttaagaaaac aaatttatca cctaactcac 3420
aaattggtta cacaagcaag agccattgga ttcgaagtgg ataactatgg ttacgttccc 3480
atcgtaggcg tgttagtggg agatgctcaa cacatgattg atgtgtgtca actcctttgg 3540
gaatatggta ttttaattac tcctgctatt tttccaatcg tacctttaaa taaaagtgct 3600
ttaaggtttt cgattacagc cgccaatacc gaagaggaga tagaccaagc aattaaatct 3660
ctcaaagcag tttgggattt gctacaaaaa aggaaagctt tgccttgtaa gcaggaggaa 3720
aacatactca agcattaa 3738
<210> 12
<211> 3738
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 12
atgctgcaga aaatcaatcg ttatacccat ggttttgttg ccgttccggt tattctggca 60
tgtcgtgaaa aaggtgtttt tgaactgctg gcagatgaaa gtccgctgag cctgaatcag 120
atggttgaac atctgggtgc caatagcggt cattttcagg ttgcactgcg tatgctggaa 180
agtctgcatt ggctgagccg taataaagaa ctgaaatata gcctgaccgc agaagcagca 240
attcataaca aaattagcga agatatcctg cagctgtata atctgccgat tcagagctat 300
ctggaaggta aacagggcaa tctgctgggt cgttggattg aacgtagctg tcagctgtgg 360
aatctggata atccgctgat ggcagatttt ctggatggtc tgctggttat tccgctgctg 420
ctggcactgc ataaacataa cctgctggcc gattctgaag ataaaccgct gctgagcagc 480
ctgagcagta ccgttcaaga agaactgggt aaactgtttc tgcatctggg ttgggcagat 540
ctgacagcag gtcgtctgac cattaccgaa ctgggtcgct ttatgggtga acgtgcactg 600
aataccgcaa ttgttgcaag ctataccccg atgctgagtc gtattcatga tgttctgttt 660
ggtaattgcc tgagcgtttt tcagcgtgat gcaagcggtc atgaacgtca tattgatcgt 720
accctgaatg ttattggtag cggttttcag caccagaaat actttgcaga tctggaagaa 780
agcattctga gcgtgtttaa tcagctgccg ctggaagaac agccgaaata cattaccgat 840
atgggttgtg gtgatggcac cctgctgaaa cgtgtttggg aaaccattca gtttaaaagc 900
gcacgtggta aagcactgga acagtatccg ctgcgtctga ttggtgttga ttataatgaa 960
gcaagcctga aagcaaccac ccgtaccctg gcaagcctgc cgcatctggt tctgcagggt 1020
gatattggta atccggaaca aatggttcgt agcctggaag cacatggcat tcatgatccg 1080
gaaaatattc tgcatattcg cagctttctg gatcacgatc gtctgtttat tccgcctcag 1140
aaacgtaatg aactgaaaga acgtgcccat ctgccgtatc agagtgtttg tgttgatgat 1200
cagggtgaac tgattcctcc gcatgttatg gttcagagcc tggtggaaca cctggaacgt 1260
tggagccagg ttgttaataa acatggtctg atgattctgg aagtgcattg tctggaaccg 1320
cgtgttgttt atcagtttct ggataaaagc gaaaacctgc actttgatgc atttcagggt 1380
tttagccagc agtatctggt tgaagccgaa gtttttctga tgagcgcagc acaggttggt 1440
ctgtttccga aactggaact gagcaaacgt tatccgaaaa cctttccgtt tacccgtatt 1500
accctgaact atttcgaaaa acgtccgtac aaaatcagcc atgcatatct gagcgatctg 1560
cctgcactgg ttgacctgga agttaaatgt tggcctgaga atctgcgtgc aagcacccat 1620
gaaattcgtc gtcgtctgga actgaatccg cagggtaacc tggttctgat tattgaagat 1680
cagattatcg gtgccattta cagccagacc attacaagca ccgaagccct ggaaaatgtt 1740
aaatatgcac aggttccgac cctgcataca ccgcagggtt cagtgattca gctgctggcc 1800
ctgaacattc tgccggaatt tcaggcacgt ggtctgggca atgaactgcg tgattttatg 1860
ctgtattatt gcaccctgaa aggtggtatt gaaagcgttg ttggtgttac ccgttgtcgc 1920
aattatgtga attatagcca gatgccgatg atggaatatc tgaaactgca taatgaacag 1980
cgtcaactgc tggatccgat tgttggtttt catgttagcg gtggtgcaga aattcgtggc 2040
attattgcaa attatcgtcc ggaagataca gataatctgg gtatgggtat tctgatcgaa 2100
tataacctgc gtgatagcgc actgcattca ccgggtgatc gtaaaggtcc gtatatcaat 2160
agcgcaattg gtagcctggt tccgaaagcg accagcgcaa ccaaagaaaa caaaaccgtt 2220
gcggatctgg tgaaagaatg tattctgaaa gtgatgggta gccagcgtca ggcagcatat 2280
gcaccgcagc agaaactgct ggacatgggt ctggatagcc tggatctgct ggaactgcag 2340
accctgctgg aagaacgtct gggtattaat ctgagcggca ccttttttct gcaaaaaaac 2400
accccgaccg ccatcattac ctattttcag aatcaggtcg tgcaagagaa acagagtgat 2460
ctggcaccgc ctgttgatag cgccaatgaa atcaatacac tggaaaacgt tgtgaatcag 2520
cagaaaattc cgcaggttac acgtgttgtt accgaacagc agggacgtaa agttctgatt 2580
gatggtcatt gggttattga ttttgccagc tgtaattatc tgggcctgga cctgcatccg 2640
aaagttaaag aagcaattcc tccggcactg gataaatggg gcacccatcc gagctggacc 2700
cgtctggttg caagtccggc aatttatgag gaactggaag aggaactgtc aaaactgctg 2760
ggtgtgccgg atgttctggt ttttccggca gttacactgc tgcagattgg tattctgcct 2820
ctgctgaccg gtaataatgg tgtgattttt ggcgatattg cagcccatcg ttgtatttat 2880
gaagcatgtt gtctggccca gcataaaggt gcacagttta ttcagtatcg tcataacgac 2940
ctgaatgatc tggccgaaaa actggccaaa tatccgcctg aacaggttaa aatcattgtg 3000
atcgatggtg tgtatagcat gagtgccgat ttcccggacc tgcctgcata tgttcatctg 3060
gcaaaagaat ataacgccct gatctatatg gatgatgcac atggctttgg cattctgggt 3120
gaaaatccga gcagcgatat gccgtatggt tataaaggta atggcatggt gaactacttt 3180
gatctgcgtt ttgccgaaga taacatcatt tatgttgcag gtctgagcaa agcctatagc 3240
agctatgcag catttctgac ctgtggtgat cgtcgtatta aaaccaattt tcgtaatgca 3300
tggaccgcga tttttagcgg tccgagtccg gttgcaagcc tggccagcgc actggcaggt 3360
ctgcaggtta atcgtcaaga aggtgaacag ctgcgcaaac aaatctatca tctgacacat 3420
aaactggtta cccaggctcg tgccattggt tttgaagttg ataattatgg ttatgtgccg 3480
attgtgggtg ttctggtggg tgatgcacag catatgattg atgtgtgcca actgctgtgg 3540
gaatatggta tcctgattac ccctgcaatt tttccgattg tgccgctgaa taaatcagca 3600
ctgcgtttta gcattaccgc agcaaatacc gaagaagaaa ttgatcaggc catcaaaagt 3660
ctgaaagcag tttgggacct gctgcaaaaa cgtaaagccc tgccgtgtaa acaagaagaa 3720
aatatcctga aacattga 3738
<210> 13
<211> 128
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 13
Met Leu Lys Asp Phe Asn Gln Phe Leu Ile Arg Thr Leu Ala Phe Val
1 5 10 15
Phe Ala Phe Gly Ile Phe Leu Thr Thr Gly Val Gly Ile Ala Lys Ala
20 25 30
Asp Tyr Leu Val Lys Gly Gly Lys Ile Thr Asn Val Gln Asn Thr Ser
35 40 45
Ser Asn Gly Asp Asn Tyr Ala Val Ser Ile Ser Gly Gly Phe Gly Pro
50 55 60
Cys Ala Asp Arg Val Ile Ile Leu Pro Thr Ser Gly Val Ile Asn Arg
65 70 75 80
Asp Ile His Met Arg Gly Tyr Glu Ala Ala Leu Thr Ala Leu Ser Asn
85 90 95
Gly Phe Leu Val Asp Ile Tyr Asp Tyr Thr Gly Ser Ser Cys Ser Asn
100 105 110
Gly Gly Gln Leu Thr Ile Thr Asn Gln Leu Gly Lys Leu Ile Ser Asn
115 120 125
<210> 14
<211> 387
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 14
atgttgaaag atttcaacca gtttttaatc agaacactag cattcgtatt cgcatttggt 60
attttcttaa ccactggagt tggcattgct aaagctgact acctagttaa aggtggaaag 120
attaccaatg ttcaaaatac ttcttctaac ggtgataatt atgccgttag tatcagcggt 180
gggtttggtc cttgcgcaga tagagtgatt atcctaccaa cttcaggagt gataaatcga 240
gacattcata tgcgtggcta tgaagccgca ttaactgcac tatccaatgg ctttttagta 300
gatatttacg actatactgg ctcttcttgc agcaatggtg gccaactaac tattaccaac 360
caattaggta agctaatcag caattag 387
<210> 15
<211> 387
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 15
atgctgaaag attttaacca gttcctgatt cgtaccctgg catttgtttt tgcctttggc 60
atttttctga caaccggtgt tggtattgca aaagcagatt atctggtgaa aggtggcaaa 120
attaccaatg ttcagaatac cagcagcaac ggtgataatt atgcagttag cattagcggt 180
ggttttggtc cgtgtgcaga tcgtgttatt attctgccga ccagcggtgt tattaatcgt 240
gatattcaca tgcgtggtta tgaagcagca ctgaccgcac tgagcaatgg ttttctggtt 300
gatatctatg attataccgg tagcagctgt agcaatggtg gccagctgac cattaccaat 360
cagctgggta aactgattag caattga 387
<210> 16
<211> 471
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 16
Met Glu Thr Thr Ser Lys Lys Phe Lys Ser Asp Leu Ile Leu Glu Ala
1 5 10 15
Arg Ala Ser Leu Lys Leu Gly Ile Pro Leu Val Ile Ser Gln Met Cys
20 25 30
Glu Thr Gly Ile Tyr Thr Ala Asn Ala Val Met Met Gly Leu Leu Gly
35 40 45
Thr Gln Val Leu Ala Ala Gly Ala Leu Gly Ala Leu Ala Phe Leu Thr
50 55 60
Leu Leu Phe Ala Cys His Gly Ile Leu Ser Val Gly Gly Ser Leu Ala
65 70 75 80
Ala Glu Ala Phe Gly Ala Asn Lys Ile Asp Glu Val Ser Arg Ile Ala
85 90 95
Ser Gly Gln Ile Trp Leu Ala Val Thr Leu Ser Leu Pro Ala Met Leu
100 105 110
Leu Leu Trp His Gly Asp Thr Ile Leu Leu Leu Phe Gly Gln Glu Glu
115 120 125
Ser Asn Val Leu Leu Thr Lys Thr Tyr Leu His Ser Ile Leu Trp Gly
130 135 140
Phe Pro Ala Ala Leu Ser Ile Leu Thr Leu Arg Gly Ile Ala Ser Ala
145 150 155 160
Leu Asn Val Pro Arg Leu Ile Thr Ile Thr Met Leu Thr Gln Leu Ile
165 170 175
Leu Asn Thr Ala Ala Asp Tyr Val Leu Ile Phe Gly Lys Phe Gly Leu
180 185 190
Pro Gln Leu Gly Leu Ala Gly Ile Gly Trp Ala Thr Ala Leu Gly Phe
195 200 205
Trp Val Ser Phe Thr Leu Gly Leu Ile Leu Leu Ile Phe Ser Leu Lys
210 215 220
Val Arg Asp Tyr Lys Leu Phe Arg Tyr Leu His Gln Phe Asp Lys Gln
225 230 235 240
Ile Phe Val Lys Ile Phe Gln Thr Gly Trp Pro Met Gly Phe Gln Trp
245 250 255
Gly Ala Glu Thr Ala Leu Phe Asn Val Thr Ala Trp Val Ala Gly Tyr
260 265 270
Leu Gly Thr Val Thr Leu Ala Ala His Asp Ile Gly Phe Gln Thr Ala
275 280 285
Glu Leu Ala Met Val Ile Pro Leu Gly Val Gly Asn Val Ala Met Thr
290 295 300
Arg Val Gly Gln Ser Ile Gly Glu Lys Asn Pro Leu Gly Ala Arg Arg
305 310 315 320
Val Ala Ser Ile Gly Ile Thr Ile Val Gly Ile Tyr Ala Ser Ile Val
325 330 335
Ala Leu Val Phe Trp Leu Phe Pro Tyr Gln Ile Ala Gly Ile Tyr Leu
340 345 350
Asn Ile Asn Asn Pro Glu Asn Ile Glu Ala Ile Lys Lys Ala Thr Thr
355 360 365
Phe Ile Pro Leu Ala Gly Leu Phe Gln Met Phe Tyr Ser Ile Gln Ile
370 375 380
Ile Ile Val Gly Ala Leu Val Gly Leu Arg Asp Thr Phe Val Pro Val
385 390 395 400
Ser Met Asn Leu Ile Val Trp Gly Leu Gly Leu Ala Gly Ser Tyr Phe
405 410 415
Met Ala Ile Ile Leu Gly Trp Gly Gly Ile Gly Ile Trp Leu Ala Met
420 425 430
Val Leu Ser Pro Leu Leu Ser Ala Val Ile Leu Thr Val Arg Phe Tyr
435 440 445
Arg Val Ile Asp Asn Leu Leu Ala Asn Ser Asp Asp Met Leu Gln Asn
450 455 460
Ala Ser Val Thr Thr Leu Gly
465 470
<210> 17
<211> 1416
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 17
atggaaacaa cctcaaaaaa atttaagtca gatctgatat tagaagcacg agcaagccta 60
aagttgggaa tccccttagt catttcacaa atgtgcgaaa cgggtattta tacagcgaat 120
gcagtcatga tgggtttact tggtacgcaa gttttggccg ccggtgcttt gggcgcgctc 180
gcttttttga ccttattatt tgcctgccat ggtattctct cagtaggagg atcactagca 240
gccgaagctt ttggggcaaa taaaatagat gaagttagtc gtattgcttc cgggcaaata 300
tggctagcag ttaccttgtc tttacctgca atgcttctgc tttggcatgg cgatactatc 360
ttgctgctat tcggtcaaga ggaaagcaat gtgttattga caaaaacgta tttacactca 420
attttatggg gctttcccgc tgcgcttagt attttgacat taagaggcat tgcctctgct 480
ctcaacgttc cccgattgat aactattact atgctcactc agctgatatt gaataccgcc 540
gccgattatg tgttaatatt cggtaaattt ggtcttcctc aacttggttt ggctggaata 600
ggctgggcaa ctgctctggg tttttgggtt agttttacat tggggcttat cttgctgatt 660
ttctccctga aagttagaga ttataaactt ttccgctact tgcatcagtt tgataaacag 720
atctttgtca aaatttttca aactggatgg cccatggggt ttcaatgggg ggcggaaacg 780
gcactattta acgtcaccgc ttgggtagca gggtatttag gaacggtaac attagcagcc 840
catgatattg gcttccaaac ggcagaactg gcgatggtta taccactcgg agtcggcaat 900
gtcgctatga caagagtagg tcagagtata ggagaaaaaa accctttggg tgcaagaagg 960
gtagcatcga ttggaattac aatagttggc atttatgcca gtattgtagc acttgttttc 1020
tggttgtttc catatcaaat tgccggaatt tatttaaata taaacaatcc cgagaatatc 1080
gaagcaatta agaaagcaac tacttttatc cccttggcgg gactattcca aatgttttac 1140
agtattcaaa taattattgt tggggctttg gtcggtctgc gggatacatt tgttccagta 1200
tcaatgaact taattgtctg gggtcttgga ttggcaggaa gctatttcat ggcaatcatt 1260
ttaggatggg gggggatcgg gatttggttg gctatggttt tgagtccact cctctcggca 1320
gttattttaa ctgttcgttt ttatcgagtg attgacaatc ttcttgccaa cagtgatgat 1380
atgttacaga atgcgtctgt tactactcta ggctga 1416
<210> 18
<211> 1416
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 18
atggaaacca cgagcaaaaa attcaaaagc gatctgattc tggaagcacg tgcaagcctg 60
aaactgggta ttccgctggt tattagccag atgtgtgaaa ccggtattta taccgcaaat 120
gcagttatga tgggtctgct gggcacccag gttctggcag ccggtgctct gggtgcactg 180
gcatttctga ccctgctgtt tgcatgtcat ggtattctga gcgttggtgg tagcctggca 240
gcggaagcat ttggtgcaaa caaaattgat gaagttagcc gtattgcaag cggtcagatt 300
tggctggcag ttaccctgag cctgcctgca atgctgctgc tgtggcatgg tgataccatt 360
ctgctgttat ttggtcaaga agaaagcaac gttctgctga ccaaaaccta tctgcatagc 420
attctgtggg gttttccggc agcactgagt attctgacac tgcgtggtat tgccagcgca 480
ctgaatgttc cgcgtctgat taccattacc atgctgaccc agctgattct gaataccgca 540
gcagattatg ttctgatctt tggtaaattt ggtctgccgc agctgggtct ggcaggtatt 600
ggttgggcaa ccgcactggg tttttgggtt agctttaccc tgggtctgat cctgctgatt 660
tttagcctga aagtgcgtga ttataaactg tttcgttatc tgcaccagtt cgacaagcag 720
atctttgtga aaatctttca gaccggttgg ccgatgggtt ttcagtgggg tgcagaaaca 780
gcactgttta atgttaccgc atgggttgca ggttatctgg gcaccgttac cctggcagca 840
catgatattg gttttcagac agcagaactg gcaatggtta tcccgctggg tgttggtaat 900
gttgcaatga cccgtgttgg tcagagcatt ggtgaaaaaa atccactggg tgcccgtcgt 960
gttgcaagca ttggtattac cattgttggt atttatgcca gcattgttgc cctggttttt 1020
tggctgtttc cgtatcagat tgcaggcatt tatctgaaca ttaataaccc ggaaaacatt 1080
gaagccatca aaaaagccac cacctttatt ccactggcag gtctgtttca gatgttttat 1140
agcattcaga tcattatcgt tggtgcgctg gttggtctgc gtgatacctt tgttccggtt 1200
agcatgaatc tgattgtttg gggtctgggt ttagcaggta gctattttat ggcaattatt 1260
ctgggttggg gtggtattgg tatctggctg gccatggttc tgagtccgct gctgagcgca 1320
gttattctga ccgttcgttt ttatcgcgtg attgataatc tgctggccaa cagtgatgat 1380
atgctgcaga atgcaagcgt taccaccctg ggatga 1416
<210> 19
<211> 377
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 19
Met Thr Asn Gln Asn Asn Gln Glu Leu Glu Asn Asp Leu Pro Ile Ala
1 5 10 15
Lys Gln Pro Cys Pro Val Asn Ser Tyr Asn Glu Trp Asp Thr Leu Glu
20 25 30
Glu Val Ile Val Gly Ser Val Glu Gly Ala Met Leu Pro Ala Leu Glu
35 40 45
Pro Ile Asn Lys Trp Thr Phe Pro Phe Glu Glu Leu Glu Ser Ala Gln
50 55 60
Lys Ile Leu Ser Glu Arg Gly Gly Val Pro Tyr Pro Pro Glu Met Ile
65 70 75 80
Thr Leu Ala His Lys Glu Leu Asn Glu Phe Ile His Ile Leu Glu Ala
85 90 95
Glu Gly Val Lys Val Arg Arg Val Lys Pro Val Asp Phe Ser Val Pro
100 105 110
Phe Ser Thr Pro Ala Trp Gln Val Gly Ser Gly Phe Cys Ala Ala Asn
115 120 125
Pro Arg Asp Val Phe Leu Val Ile Gly Asn Glu Ile Ile Glu Ala Pro
130 135 140
Met Ala Asp Arg Asn Arg Tyr Phe Glu Thr Trp Ala Tyr Arg Glu Met
145 150 155 160
Leu Lys Glu Tyr Phe Gln Ala Gly Ala Lys Trp Thr Ala Ala Pro Lys
165 170 175
Pro Gln Leu Phe Asp Ala Gln Tyr Asp Phe Asn Phe Gln Phe Pro Gln
180 185 190
Leu Gly Glu Pro Pro Arg Phe Val Val Thr Glu Phe Glu Pro Thr Phe
195 200 205
Asp Ala Ala Asp Phe Val Arg Cys Gly Arg Asp Ile Phe Gly Gln Lys
210 215 220
Ser His Val Thr Asn Gly Leu Gly Ile Glu Trp Leu Gln Arg His Leu
225 230 235 240
Glu Asp Glu Tyr Arg Ile His Ile Ile Glu Ser His Cys Pro Glu Ala
245 250 255
Leu His Ile Asp Thr Thr Leu Met Pro Leu Ala Pro Gly Lys Ile Leu
260 265 270
Val Asn Pro Glu Phe Val Asp Val Asn Lys Leu Pro Lys Ile Leu Lys
275 280 285
Ser Trp Asp Ile Leu Val Ala Pro Tyr Pro Asn His Ile Pro Gln Asn
290 295 300
Gln Leu Arg Leu Val Ser Glu Trp Ala Gly Leu Asn Val Leu Met Leu
305 310 315 320
Asp Glu Glu Arg Val Ile Val Glu Lys Asn Gln Glu Gln Met Ile Lys
325 330 335
Ala Leu Lys Asp Trp Gly Phe Lys Pro Ile Val Cys His Phe Glu Ser
340 345 350
Tyr Tyr Pro Phe Leu Gly Ser Phe His Cys Ala Thr Leu Asp Val Arg
355 360 365
Arg Arg Gly Thr Leu Gln Ser Tyr Phe
370 375
<210> 20
<211> 1134
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 20
atgaccaatc aaaataacca agaattagag aacgatttac caatcgccaa gcagccttgt 60
ccggtcaatt cttataatga gtgggacaca cttgaggagg tcattgttgg tagtgttgaa 120
ggtgcaatgt taccggccct agaaccaatc aacaaatgga cattcccttt tgaagaattg 180
gaatctgccc aaaagatact ctctgagagg ggaggagttc cttatccacc agagatgatt 240
acattagcac acaaagaact aaatgaattt attcacattc ttgaagcaga aggggtcaaa 300
gttcgtcgag ttaaacctgt agatttctct gtccccttct ccacaccagc ttggcaagta 360
ggaagtggtt tttgtgccgc caatcctcgc gatgtttttt tggtgattgg gaatgagatt 420
attgaagcac caatggcaga tcgcaaccgc tattttgaaa cttgggcgta tcgagagatg 480
ctcaaggaat attttcaggc aggagctaag tggactgcag cgccgaagcc acaattattc 540
gacgcacagt atgacttcaa tttccagttt cctcaactgg gggagccgcc gcgtttcgtc 600
gttacagagt ttgaaccgac ttttgatgcg gcagattttg tgcgctgtgg acgagatatt 660
tttggtcaaa aaagtcatgt gactaatggt ttgggcatag aatggttaca acgtcacttg 720
gaagacgaat accgtattca tattattgaa tcgcattgtc cggaagcact gcacatcgat 780
accaccttaa tgcctcttgc acctggcaaa atactagtaa atccagaatt tgtagatgtt 840
aataaattgc caaaaatcct gaaaagctgg gacattttgg ttgcacctta ccccaaccat 900
atacctcaaa accagctgag actggtcagt gaatgggcag gtttgaatgt actgatgtta 960
gatgaagagc gagtcattgt agaaaaaaac caggagcaga tgattaaagc actgaaagat 1020
tggggattta agcctattgt ttgccatttt gaaagctact atccattttt aggatcattt 1080
cactgtgcaa cattagacgt tcgccgacgc ggaactcttc agtcctattt ttaa 1134
<210> 21
<211> 1134
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 21
atgaccaatc agaacaacca agagctggaa aatgatctgc cgattgcaaa acagccgtgt 60
ccggttaata gctataatga atgggatacc ctggaagaag ttattgttgg tagcgttgaa 120
ggtgcaatgc tgcctgcact ggaaccgatt aacaaatgga cctttccgtt tgaagaactg 180
gaaagcgcac agaaaattct gagcgaacgt ggtggtgttc cgtatccgcc tgaaatgatt 240
accctggcac ataaagaact gaacgagttt attcatatcc tggaagccga aggtgttaaa 300
gttcgtcgtg ttaaaccggt tgattttagc gttccgttta gcacaccggc atggcaggtt 360
ggtagcggtt tttgtgcagc aaatccgcgt gatgtttttc tggttattgg caacgaaatt 420
atcgaagcac cgatggcaga tcgtaatcgt tattttgaaa cctgggcata tcgcgaaatg 480
ctgaaagaat attttcaggc aggcgcaaaa tggaccgcag caccgaaacc gcagctgttt 540
gatgcacagt atgatttcaa ttttcagttt ccgcagctgg gtgaaccgcc tcgttttgtt 600
gttaccgaat ttgaaccgac ctttgatgca gccgattttg ttcgttgtgg tcgtgatatt 660
tttggccaga aaagccatgt taccaatggt ctgggtattg aatggctgca gcgtcatctg 720
gaagatgaat atcgcattca tatcatcgaa agccattgtc cggaagcact gcatattgat 780
accaccctga tgccgctggc accgggtaaa attctggtta atccggaatt tgtggacgtg 840
aataaactgc cgaaaattct gaaaagctgg gatattctgg ttgcaccgta tccgaatcat 900
attccgcaga atcagctgcg tctggttagc gaatgggcag gtctgaatgt tctgatgctg 960
gatgaagaac gtgtgatcgt ggaaaaaaat caagagcaga tgatcaaagc cctgaaagat 1020
tggggtttta aaccgattgt ttgccacttc gaaagctatt atccgtttct gggtagcttt 1080
cattgtgcaa ccctggatgt tcgtcgtcgt ggcaccctgc agagctattt ttga 1134
<210> 22
<211> 334
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 22
Met Thr Thr Ala Asp Leu Ile Leu Ile Asn Asn Trp Tyr Val Val Ala
1 5 10 15
Lys Val Glu Asp Cys Lys Pro Gly Ser Ile Thr Thr Ala Leu Leu Leu
20 25 30
Gly Val Lys Leu Val Leu Trp Arg Ser Arg Glu Gln Asn Ser Pro Ile
35 40 45
Gln Ile Trp Gln Asp Tyr Cys Pro His Arg Gly Val Ala Leu Ser Met
50 55 60
Gly Glu Ile Val Asn Asn Thr Leu Val Cys Pro Tyr His Gly Trp Arg
65 70 75 80
Tyr Asn Gln Ala Gly Lys Cys Val His Ile Pro Ala His Pro Asp Met
85 90 95
Thr Pro Pro Ala Ser Ala Gln Ala Lys Ile Tyr His Cys Gln Glu Arg
100 105 110
Tyr Gly Leu Val Trp Val Cys Leu Gly Asp Pro Val Asn Asp Ile Pro
115 120 125
Ser Leu Pro Glu Trp Asp Asp Pro Asn Tyr His Asn Thr Cys Thr Lys
130 135 140
Ser Tyr Phe Ile Gln Ala Ser Ala Phe Arg Val Met Asp Asn Phe Ile
145 150 155 160
Asp Val Ser His Phe Pro Phe Val His Asp Gly Gly Leu Gly Asp Arg
165 170 175
Asn His Ala Gln Ile Glu Glu Phe Glu Val Lys Val Asp Lys Asp Gly
180 185 190
Ile Ser Ile Gly Asn Leu Lys Leu Gln Met Pro Arg Phe Asn Ser Ser
195 200 205
Asn Glu Asp Asp Ser Trp Thr Leu Tyr Gln Arg Ile Ser His Pro Leu
210 215 220
Cys Gln Tyr Tyr Ile Thr Glu Ser Ser Glu Ile Arg Thr Ala Asp Leu
225 230 235 240
Met Leu Val Thr Pro Ile Asp Glu Asp Asn Ser Leu Val Arg Met Leu
245 250 255
Val Thr Trp Asn Arg Ser Glu Ile Leu Glu Ser Thr Val Leu Glu Glu
260 265 270
Phe Asp Glu Thr Ile Glu Gln Asp Ile Pro Ile Ile His Ser Gln Gln
275 280 285
Pro Ala Arg Leu Pro Leu Leu Pro Ser Lys Gln Ile Asn Met Gln Trp
290 295 300
Leu Ser Gln Glu Ile His Val Pro Ser Asp Arg Cys Thr Val Ala Tyr
305 310 315 320
Arg Arg Trp Leu Lys Glu Leu Gly Val Thr Tyr Gly Val Cys
325 330
<210> 23
<211> 1005
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 23
atgacaactg ctgacctaat cttaattaac aactggtacg tagtcgcaaa ggtggaagat 60
tgtaaaccag gaagtatcac cacggctctt ttattgggag ttaagttggt actatggcgc 120
agtcgtgaac agaattcccc catacagata tggcaagact actgccctca ccgaggtgtg 180
gctctgtcta tgggagaaat tgttaataat actttggttt gtccgtatca cggatggaga 240
tataatcaag caggtaaatg cgtacatatc ccggctcacc ctgacatgac acccccagca 300
agtgcccaag ccaagatcta tcattgccag gagcgatacg gattagtatg ggtgtgctta 360
ggtgatcctg tcaatgatat accttcatta cccgaatggg acgatccgaa ttatcataat 420
acttgtacta aatcttattt tattcaagct agtgcgtttc gtgtaatgga taatttcata 480
gatgtatctc attttccttt tgtccacgac ggtgggttag gtgatcgcaa ccacgcacaa 540
attgaagaat ttgaggtaaa agtagacaaa gatggcatta gcataggtaa ccttaaactc 600
cagatgccaa ggtttaacag cagtaacgaa gatgactcat ggactcttta ccaaaggatt 660
agtcatccct tgtgtcaata ctatattact gaatcctctg aaattcggac tgcggatttg 720
atgctggtaa caccgattga tgaagacaac agcttagtgc gaatgttagt aacgtggaac 780
cgctccgaaa tattagagtc aacggtacta gaggaatttg acgaaacaat agaacaagat 840
attccgatta tacactctca acagccagcg cgtttaccac tgttaccttc aaagcagata 900
aacatgcaat ggttgtcaca ggaaatacat gtaccgtcag atcgatgcac agttgcctat 960
cgtcgatggc taaaggaact gggcgttacc tatggtgttt gttaa 1005
<210> 24
<211> 1005
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 24
atgacgaccg cagatctgat tctgatcaat aattggtatg ttgtggccaa ggtggaagat 60
tgtaaaccgg gtagcattac caccgcactg ctgctgggtg ttaaactggt tctgtggcgt 120
agccgtgaac agaatagccc gattcagatt tggcaggatt attgtccgca tcgtggtgtt 180
gcactgagca tgggtgaaat tgtgaataat accctggttt gtccgtatca tggttggcgt 240
tataatcagg caggtaaatg tgttcatatt ccggcacatc cggatatgac ccctccggca 300
agcgcacagg caaaaatcta tcattgtcaa gaacgttatg gtctggtttg ggtttgtctg 360
ggtgatccgg ttaatgatat tccgagtctg ccggaatggg atgatccgaa ttatcataat 420
acctgcacca agagctactt tatccaggca agcgcatttc gtgtgatgga taactttatt 480
gatgtgagcc attttccgtt tgtgcatgat ggtggtctgg gcgatcgtaa tcatgcacag 540
attgaagaat ttgaggtgaa agtggataaa gacggtatta gcattggcaa tctgaaactg 600
cagatgcctc gttttaatag cagcaatgaa gatgatagct ggaccctgta tcagcgtatt 660
agccatccgc tgtgtcagta ttatatcacc gaaagcagcg aaattcgtac agcagatctg 720
atgctggtta ccccgattga tgaagataat tcactggttc gtatgctggt gacctggaat 780
cgtagcgaaa ttctggaaag caccgttctg gaagaatttg atgaaaccat tgaacaggat 840
atcccgatta ttcatagcca gcagcctgca cgtctgccgc tgctgccgag caagcagatt 900
aatatgcagt ggctgagcca agaaattcat gttccgagcg atcgttgtac cgttgcatat 960
cgtcgttggc tgaaagaact gggcgttacc tatggtgttt gttga 1005
<210> 25
<211> 612
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 25
Met Gln Ile Leu Gly Ile Ser Ala Tyr Tyr His Asp Ser Ala Ala Ala
1 5 10 15
Met Val Ile Asp Gly Glu Ile Val Ala Ala Ala Gln Glu Glu Arg Phe
20 25 30
Ser Arg Arg Lys His Asp Ala Gly Phe Pro Thr Gly Ala Ile Thr Tyr
35 40 45
Cys Leu Lys Gln Val Gly Thr Lys Leu Gln Tyr Ile Asp Gln Ile Val
50 55 60
Phe Tyr Asp Lys Pro Leu Val Lys Phe Glu Arg Leu Leu Glu Thr Tyr
65 70 75 80
Leu Ala Tyr Ala Pro Lys Gly Phe Gly Ser Phe Ile Thr Ala Met Pro
85 90 95
Val Trp Leu Lys Glu Lys Leu Tyr Leu Lys Thr Leu Leu Lys Lys Glu
100 105 110
Leu Ala Leu Leu Gly Glu Cys Lys Ala Ser Gln Leu Pro Pro Leu Leu
115 120 125
Phe Thr Ser His His Gln Ala His Ala Ala Ala Ala Phe Phe Pro Ser
130 135 140
Pro Phe Gln Arg Ala Ala Val Leu Cys Leu Asp Gly Val Gly Glu Trp
145 150 155 160
Ala Thr Thr Ser Val Trp Leu Gly Glu Gly Asn Lys Leu Thr Pro Gln
165 170 175
Trp Glu Ile Asp Phe Pro His Ser Leu Gly Leu Leu Tyr Ser Ala Phe
180 185 190
Thr Tyr Tyr Thr Gly Phe Lys Val Asn Ser Gly Glu Tyr Lys Leu Met
195 200 205
Gly Leu Ala Pro Tyr Gly Glu Pro Lys Tyr Val Asp Gln Ile Leu Lys
210 215 220
His Leu Leu Asp Leu Lys Glu Asp Gly Thr Phe Arg Leu Asn Met Asp
225 230 235 240
Tyr Phe Asn Tyr Thr Val Gly Leu Thr Met Thr Asn His Lys Phe His
245 250 255
Ser Met Phe Gly Gly Pro Pro Arg Gln Ala Glu Gly Lys Ile Ser Gln
260 265 270
Arg Asp Met Asp Leu Ala Ser Ser Ile Gln Lys Val Thr Glu Glu Val
275 280 285
Ile Leu Arg Leu Ala Arg Thr Ile Lys Lys Glu Leu Gly Val Glu Tyr
290 295 300
Leu Cys Leu Ala Gly Gly Val Gly Leu Asn Cys Val Ala Asn Gly Arg
305 310 315 320
Ile Leu Arg Glu Ser Asp Phe Lys Asp Ile Trp Ile Gln Pro Ala Ala
325 330 335
Gly Asp Ala Gly Ser Ala Val Gly Ala Ala Leu Ala Ile Trp His Glu
340 345 350
Tyr His Lys Lys Pro Arg Thr Ser Thr Ala Gly Asp Arg Met Lys Gly
355 360 365
Ser Tyr Leu Gly Pro Ser Phe Ser Glu Ala Glu Ile Leu Gln Phe Leu
370 375 380
Asn Ser Val Asn Ile Pro Tyr His Arg Cys Val Asp Asn Glu Leu Met
385 390 395 400
Ala Arg Leu Ala Glu Ile Leu Asp Gln Gly Asn Val Val Gly Trp Phe
405 410 415
Ser Gly Arg Met Glu Phe Gly Pro Arg Ala Leu Gly Gly Arg Ser Ile
420 425 430
Ile Gly Asp Ser Arg Ser Pro Lys Met Gln Ser Val Met Asn Leu Lys
435 440 445
Ile Lys Tyr Arg Glu Ser Phe Arg Pro Phe Ala Pro Ser Val Leu Ala
450 455 460
Glu Arg Val Ser Asp Tyr Phe Asp Leu Asp Arg Pro Ser Pro Tyr Met
465 470 475 480
Leu Leu Val Ala Gln Val Lys Glu Asn Leu His Ile Pro Met Thr Gln
485 490 495
Glu Gln His Glu Leu Phe Gly Ile Glu Lys Leu Asn Val Pro Arg Ser
500 505 510
Gln Ile Pro Ala Val Thr His Val Asp Tyr Ser Ala Arg Ile Gln Thr
515 520 525
Val His Lys Glu Thr Asn Pro Arg Tyr Tyr Glu Leu Ile Arg His Phe
530 535 540
Glu Ala Arg Thr Gly Cys Ala Val Leu Val Asn Thr Ser Phe Asn Val
545 550 555 560
Arg Gly Glu Pro Ile Val Cys Thr Pro Glu Asp Ala Tyr Arg Cys Phe
565 570 575
Met Arg Thr Glu Met Asp Tyr Leu Val Met Glu Asn Phe Leu Leu Val
580 585 590
Lys Ser Glu Gln Pro Arg Gly Asn Ser Asp Glu Ser Trp Gln Lys Glu
595 600 605
Phe Glu Leu Asp
610
<210> 26
<211> 1839
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 26
atgcagatct taggaatttc agcttactac cacgatagtg ctgccgcgat ggttatcgat 60
ggcgaaattg ttgctgcagc tcaggaagaa cgtttctcaa gacgaaagca cgatgctggg 120
tttccgactg gagcgattac ttactgtcta aaacaagtag gaaccaagtt acaatatatc 180
gatcaaattg ttttttacga caagccatta gtcaaatttg agcggttgct agaaacatat 240
ttagcatatg ccccaaaggg atttggctcg tttattactg ctatgcccgt ttggctcaaa 300
gaaaagcttt acctaaaaac acttttaaaa aaagaattgg cgcttttggg ggagtgcaaa 360
gcttctcaat tgcctcctct actgtttacc tcacatcacc aagcccatgc ggccgctgct 420
ttttttccca gtccttttca gcgtgctgcc gttctgtgct tagatggtgt aggagagtgg 480
gcaactactt ctgtctggtt gggagaagga aataaactca caccacaatg ggaaattgat 540
tttccccatt ccctcggttt gctttactca gcgtttacct actacactgg gttcaaagtt 600
aactcaggtg agtacaaact catgggttta gcaccctacg gggaacccaa atatgtggac 660
caaattctca agcatttgtt ggatctcaaa gaagatggta cttttaggtt gaatatggac 720
tacttcaact acacggtggg gctaaccatg accaatcata agttccatag tatgtttgga 780
ggaccaccac gccaggcgga aggaaaaatc tcccaaagag acatggatct ggcaagttcg 840
atccaaaagg tgactgaaga agtcatactg cgtctggcta gaactatcaa aaaagaactg 900
ggtgtagagt atctatgttt agcaggtggt gtcggtctca attgcgtggc taacggacga 960
attctccgag aaagtgattt caaagatatt tggattcaac ccgcagcagg agatgccggt 1020
agtgcagtgg gagcagcttt agcgatttgg catgaatacc ataagaaacc tcgcacttca 1080
acagcaggcg atcgcatgaa aggttcttat ctgggaccta gctttagcga ggcggagatt 1140
ctccagtttc ttaattctgt taacataccc taccatcgat gcgttgataa cgaacttatg 1200
gctcgtcttg cagaaatttt agaccaggga aatgttgtag gctggttttc tggacgaatg 1260
gagtttggtc cgcgtgcttt gggtggccgt tcgattattg gcgattcacg cagtccaaaa 1320
atgcaatcgg tcatgaacct gaaaattaaa tatcgtgagt ccttccgtcc atttgctcct 1380
tcagtcttgg ctgaacgagt ctccgactac ttcgatcttg atcgtcctag tccttatatg 1440
cttttggtag cacaagtcaa agagaatctg cacattccta tgacacaaga gcaacacgag 1500
ctatttggga tcgagaagct gaatgttcct cgttcccaaa ttcccgcagt cactcacgtt 1560
gattactcag ctcgtattca gacagttcac aaagaaacga atcctcgtta ctacgagtta 1620
attcgtcatt ttgaggcacg aactggttgt gctgtcttgg tcaatacttc gtttaatgtc 1680
cgcggcgaac caattgtttg tactcccgaa gacgcttatc gatgctttat gagaactgaa 1740
atggactatt tggttatgga gaatttcttg ttggtcaaat ctgaacagcc acggggaaat 1800
agtgatgagt catggcaaaa agaattcgag ttagattaa 1839
<210> 27
<211> 1839
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 27
atgcagattc tgggtatcag cgcctattat catgatagcg cagcagcaat ggttattgat 60
ggtgaaattg ttgcagcagc acaagaagaa cgttttagcc gtcgtaaaca tgatgcaggt 120
tttccgaccg gtgcaattac ctattgtctg aaacaggttg gcaccaaact gcagtatatt 180
gatcagatcg tgttctatga taaaccgctg gtgaaatttg aacgtctgct ggaaacctat 240
ctggcctatg caccgaaagg ttttggtagt tttattaccg caatgccggt gtggctgaaa 300
gagaaactgt atctgaaaac cctgctgaaa aaagaactgg cactgctggg tgaatgtaaa 360
gcaagccagc tgcctccgct gctgtttacc agccatcatc aggcacatgc agcagcagca 420
ttttttccga gcccgtttca gcgtgcagca gttctgtgtc tggatggtgt tggtgaatgg 480
gcaaccacca gtgtttggct gggtgaaggt aataaactga caccgcagtg ggaaattgat 540
tttccgcata gcctgggcct gctgtatagc gcatttacct attataccgg ctttaaagtg 600
aacagcggtg agtataaact gatgggtctg gcaccgtatg gtgaaccgaa atatgttgat 660
cagattctga aacatctgct ggatctgaaa gaagatggca cctttcgtct gaacatggat 720
tatttcaatt ataccgttgg tctgaccatg accaaccata aatttcatag catgtttggt 780
ggtccgcctc gtcaggcaga aggtaaaatt agccagcgtg atatggatct ggcaagcagc 840
attcagaaag ttaccgaaga agtgattctg cgtctggcac gtaccattaa gaaagaatta 900
ggtgttgaat acctgtgtct ggcaggcggt gttggtctga attgtgttgc aaatggtcgt 960
attctgcgtg agagcgattt taaagatatt tggattcagc ctgcagccgg tgatgcaggt 1020
agcgcagttg gtgcagcact ggcaatttgg catgaatatc ataaaaaacc gcgtaccagc 1080
accgcaggcg atcgtatgaa aggtagctat ctgggtccga gctttagcga agcagaaatt 1140
ctgcagtttc tgaacagcgt gaatattccg tatcatcgtt gtgtggataa tgaactgatg 1200
gcacgtctgg cggaaattct ggatcagggt aatgttgttg gttggtttag cggtcgtatg 1260
gaatttggtc cgcgtgcact gggtggtcgt agcattattg gtgatagccg tagcccgaaa 1320
atgcagagcg ttatgaatct gaaaatcaaa tatcgcgaaa gcttccgtcc gtttgcaccg 1380
agcgttctgg cagaacgtgt tagcgattat tttgatctgg atcgtccgag cccgtatatg 1440
ctgctggttg cacaggttaa agaaaatctg catattccga tgacccaaga acagcatgaa 1500
ctgtttggta tcgaaaaact gaatgttccg cgtagccaga ttccggcagt tacccatgtt 1560
gattatagcg cacgtattca gaccgttcat aaagaaacca atccgcgtta ttatgaactg 1620
atccgtcatt ttgaagcacg taccggttgt gcagttctgg ttaataccag ctttaatgtt 1680
cgtggtgaac cgattgtgtg tacaccggaa gatgcatatc gttgttttat gcgtaccgag 1740
atggattacc tggtgatgga aaattttctg ctggtgaaaa gcgaacagcc tcgtggtaat 1800
agtgatgaaa gctggcagaa agaatttgag ctggattga 1839
<210> 28
<211> 147
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 28
Met Ser Glu Phe Phe Pro Gln Lys Ser Gly Lys Leu Lys Met Glu Gln
1 5 10 15
Ile Lys Glu Leu Asp Lys Lys Gly Leu Arg Glu Phe Gly Leu Ile Gly
20 25 30
Gly Ser Ile Val Ala Val Leu Phe Gly Phe Leu Leu Pro Val Ile Arg
35 40 45
His His Ser Leu Ser Val Ile Pro Trp Val Val Ala Gly Phe Leu Trp
50 55 60
Ile Trp Ala Ile Ile Ala Pro Thr Thr Leu Ser Phe Ile Tyr Gln Ile
65 70 75 80
Trp Met Arg Ile Gly Leu Val Leu Gly Trp Ile Gln Thr Arg Ile Ile
85 90 95
Leu Gly Val Leu Phe Tyr Ile Met Ile Thr Pro Ile Gly Phe Ile Arg
100 105 110
Arg Leu Leu Asn Gln Asp Pro Met Thr Arg Ile Phe Glu Pro Glu Leu
115 120 125
Pro Thr Tyr Arg Gln Leu Ser Lys Ser Arg Thr Thr Gln Ser Met Glu
130 135 140
Lys Pro Phe
145
<210> 29
<211> 405
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 29
atggaacaga taaaagaact tgacaaaaaa ggattgcgtg agtttggact gattggcggt 60
tctatagtgg cggttttatt cggcttttta ctgccagtta tacgccatca ttccttatca 120
gttatccctt gggttgttgc tggatttctc tggatttggg caataatcgc acctacgact 180
ttaagtttta tttaccaaat atggatgagg attggacttg ttttaggatg gatacaaaca 240
cgaattattt tgggagtttt attttatata atgatcacac caataggatt cataagacgg 300
ctgttgaatc aagatccaat gacgcgaatc ttcgagccag agttgccaac ttatcgccaa 360
ttgagtaagt caagaactac acaaagtatg gagaaaccat tctaa 405
<210> 30
<211> 405
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 30
atggaacaaa ttaaagaact ggataagaaa ggcctgcgtg aatttggtct gattggtggt 60
agcattgttg ccgttctgtt tggttttctg ctgccggtta ttcgtcatca tagcctgagc 120
gttattccgt gggttgttgc aggttttctg tggatttggg caattattgc accgaccacc 180
ctgagcttta tctatcagat ttggatgcgt attggtctgg tgctgggttg gattcagacc 240
cgtattattc tgggtgttct gttctatatt atgattaccc cgatcggttt tattcgtcgt 300
ctgctgaatc aggatccgat gacccgtatt tttgaaccgg aactgccgac ctatcgtcag 360
ctgagcaaaa gccgtaccac ccagagcatg gaaaaaccgt tctga 405
<210> 31
<211> 54
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 31
Met Leu Lys Asp Thr Trp Asp Phe Ile Lys Asp Ile Ala Gly Phe Ile
1 5 10 15
Lys Glu Gln Lys Asn Tyr Leu Leu Ile Pro Leu Ile Ile Thr Leu Val
20 25 30
Ser Leu Gly Ala Leu Ile Val Phe Ala Gln Ser Ser Ala Ile Ala Pro
35 40 45
Phe Ile Tyr Thr Leu Phe
50
<210> 32
<211> 165
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 32
atgctaaaag acacttggga ttttattaaa gacattgccg gatttattaa agaacaaaaa 60
aactatttgt tgattcccct aattatcacc ctggtatcct tgggggcgct gattgtcttt 120
gctcaatctt ctgcgatcgc acctttcatt tacactcttt tttaa 165
<210> 33
<211> 165
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 33
atgttaaaag acacctggga ttttatcaag gatatcgcag gctttatcaa agaacagaaa 60
aactatctgc tgattccgct gattattacc ctggttagcc tgggtgcact gattgttttt 120
gcacagagca gcgcaattgc accgtttatc tataccctgt tttga 165
<210> 34
<211> 432
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 34
Met Ser Asn Phe Lys Gly Ser Val Lys Ile Ala Leu Met Gly Ile Leu
1 5 10 15
Ile Phe Cys Gly Leu Ile Phe Gly Val Ala Phe Val Glu Ile Gly Leu
20 25 30
Arg Ile Ala Gly Ile Glu His Ile Ala Phe His Ser Ile Asp Glu His
35 40 45
Arg Gly Trp Val Gly Arg Pro His Val Ser Gly Trp Tyr Arg Thr Glu
50 55 60
Gly Glu Ala His Ile Gln Met Asn Ser Asp Gly Phe Arg Asp Arg Glu
65 70 75 80
His Ile Lys Val Lys Pro Glu Asn Thr Phe Arg Ile Ala Leu Leu Gly
85 90 95
Asp Ser Phe Val Glu Ser Met Gln Val Pro Leu Glu Gln Asn Leu Ala
100 105 110
Ala Val Ile Glu Gly Glu Ile Ser Ser Cys Ile Ala Leu Ala Gly Arg
115 120 125
Lys Ala Glu Val Ile Asn Phe Gly Val Thr Gly Tyr Gly Thr Asp Gln
130 135 140
Glu Leu Ile Thr Leu Arg Glu Lys Val Trp Asp Tyr Ser Pro Asp Ile
145 150 155 160
Val Val Leu Asp Phe Tyr Thr Gly Asn Asp Ile Val Asp Asn Ser Arg
165 170 175
Ala Leu Ser Gln Lys Phe Tyr Pro Asn Glu Leu Gly Ser Leu Lys Pro
180 185 190
Phe Phe Ile Leu Arg Asp Gly Asn Leu Val Val Asp Ala Ser Phe Ile
195 200 205
Asn Thr Asp Asn Tyr Arg Ser Lys Leu Thr Trp Trp Gly Lys Thr Tyr
210 215 220
Met Lys Ile Lys Asp His Ser Arg Ile Leu Gln Val Leu Asn Met Val
225 230 235 240
Arg Asp Ala Leu Asn Asn Ser Ser Arg Gly Phe Ser Ser Gln Ala Ile
245 250 255
Glu Glu Pro Leu Phe Ser Asp Gly Lys Gln Asp Thr Lys Leu Ser Gly
260 265 270
Phe Phe Asp Ile Tyr Lys Pro Pro Thr Asp Pro Glu Trp Gln Gln Ala
275 280 285
Trp Gln Val Thr Glu Lys Leu Ile Ser Ser Met Gln His Glu Val Thr
290 295 300
Ala Lys Lys Ala Asp Phe Leu Val Val Thr Phe Gly Gly Pro Phe Gln
305 310 315 320
Arg Glu Pro Leu Val Arg Gln Lys Glu Met Gln Glu Leu Gly Leu Thr
325 330 335
Asp Trp Phe Tyr Pro Glu Lys Arg Ile Thr Arg Leu Gly Glu Asp Glu
340 345 350
Gly Phe Ser Val Leu Asn Leu Ser Pro Asn Leu Gln Val Tyr Ser Glu
355 360 365
Gln Asn Asn Ala Cys Leu Tyr Gly Phe Asp Asp Thr Gln Gly Cys Val
370 375 380
Gly His Trp Asn Ala Leu Gly His Gln Val Ala Gly Lys Met Ile Ala
385 390 395 400
Ser Lys Ile Cys Gln Gln Gln Met Arg Glu Ser Ile Leu Pro His Lys
405 410 415
His Asp Pro Ser Ser Gln Ser Ser Pro Ile Thr Gln Ser Val Ile Gln
420 425 430
<210> 35
<211> 1299
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 35
atgagtaact tcaagggttc ggtaaagata gcattgatgg gaatattgat tttttgtggg 60
ctaatctttg gcgtagcatt tgttgaaatt gggttacgta ttgccgggat cgaacacata 120
gcattccata gcattgatga acacaggggg tgggtagggc gacctcatgt ttccgggtgg 180
tatagaaccg aaggtgaagc tcacatccaa atgaatagtg atggctttcg agatcgagaa 240
cacatcaagg tcaaaccaga aaataccttc aggatagcgc tgttgggaga ttcctttgta 300
gagtccatgc aagtaccgtt ggagcaaaat ttggcagcag ttatagaagg agaaatcagt 360
agttgtatag ctttagctgg acgaaaggcg gaagtgatta attttggagt gactggttat 420
ggaacagacc aagaactaat tactctacgg gagaaagttt gggactattc acctgatata 480
gtagtgctag atttttatac tggcaacgac attgttgata actcccgtgc gctgagtcag 540
aaattctatc ctaatgaact aggttcacta aagccgtttt ttatacttag agatggtaat 600
ctggtggttg atgcttcgtt tatcaatacg gataattatc gctcaaagct gacatggtgg 660
ggcaaaactt atatgaaaat aaaagaccac tcacggattt tacaggtttt aaacatggta 720
cgggatgctc ttaacaactc tagtagaggg ttttcttctc aagctataga ggaaccgtta 780
tttagtgatg gaaaacagga tacaaaattg agcgggtttt ttgatatcta caaaccacct 840
actgaccctg aatggcaaca ggcatggcaa gtcacagaga aactgattag ctcaatgcaa 900
cacgaggtga ctgcgaagaa agcagatttt ttagttgtta cttttggcgg tccctttcaa 960
cgagaacctt tagtgcgtca aaaagaaatg caagaattgg gtctgactga ttggttttac 1020
ccagagaagc gaattacacg tttgggtgag gatgaggggt tcagtgtact caatctcagc 1080
ccaaatttgc aggtttattc tgagcagaac aatgcttgcc tatatgggtt tgatgatact 1140
caaggctgtg tagggcattg gaatgcttta ggacatcagg tagcaggaaa aatgattgca 1200
tcgaagattt gtcaacagca gatgagagaa agtatattgc ctcataagca cgacccttca 1260
agccaaagct cacctattac ccaatcagtg atccaataa 1299
<210> 36
<211> 1299
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 36
atgagcaact tcaaaggcag cgttaaaatt gcactgatgg gcattctgat tttttgcggt 60
ctgatttttg gtgtggcctt tgttgaaatt ggtctgcgta ttgcaggcat tgaacatatt 120
gcctttcata gcattgatga acatcgtggt tgggttggtc gtccgcatgt tagcggttgg 180
tatcgtaccg aaggtgaagc acatattcag atgaatagtg atggttttcg tgatcgcgaa 240
cacattaaag tgaaaccgga aaataccttt cgtattgccc tgctgggtga tagctttgtt 300
gaaagcatgc aggttccgct ggaacagaat ctggcagcag ttattgaagg cgaaattagc 360
agctgtattg cactggcagg tcgtaaagcc gaagttatta actttggtgt taccggttat 420
ggcaccgatc aagaactgat taccctgcgt gaaaaagtgt gggattatag tccggatatt 480
gttgtgctgg atttctatac cggtaacgat attgttgata atagccgtgc actgtcccag 540
aaattctatc cgaatgaact gggtagcctg aaaccgtttt ttatcctgcg tgatggtaat 600
ctggttgttg atgcaagctt tatcaacacc gataactatc gtagcaaact gacctggtgg 660
ggtaaaacct atatgaaaat caaagatcat agccgcattc tgcaggtcct gaatatggtt 720
cgtgatgcac tgaataatag cagccgtggt tttagcagcc aggcaattga agaaccgctg 780
tttagtgatg gtaaacagga taccaaactg agcggcttct tcgatatcta taaaccgcct 840
accgatccgg aatggcagca ggcctggcag gttaccgaaa aactgattag tagcatgcag 900
catgaagtga ccgccaaaaa agccgatttt ctggttgtta cctttggcgg tccgtttcag 960
cgcgaaccgc tggttcgtca gaaagaaatg caagaactgg gtctgaccga ttggttttat 1020
ccggaaaaac gtattacccg tctgggtgaa gatgaaggtt ttagcgtgct gaatctgagc 1080
ccgaatctgc aggtttatag cgaacagaat aatgcctgtc tgtatggttt tgatgatacc 1140
cagggttgtg ttggtcattg gaatgcactg ggtcatcagg ttgcaggtaa aatgattgca 1200
agcaaaattt gtcagcagca gatgcgtgaa agcattctgc cgcataaaca tgatccgagc 1260
agccagagca gcccgattac ccagagcgtt attcagtaa 1299
<210> 37
<211> 482
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 37
Met Thr Asn Thr Glu Arg Gly Leu Ala Glu Ile Thr Ser Thr Gly Tyr
1 5 10 15
Lys Ser Glu Leu Arg Ser Glu Ala Arg Val Ser Leu Gln Leu Ala Ile
20 25 30
Pro Leu Val Leu Val Glu Ile Cys Gly Thr Ser Ile Asn Val Val Asp
35 40 45
Val Val Met Met Gly Leu Leu Gly Thr Gln Val Leu Ala Ala Gly Ala
50 55 60
Leu Gly Ala Ile Ala Phe Leu Ser Val Ser Asn Thr Cys Tyr Asn Met
65 70 75 80
Leu Leu Ser Gly Val Ala Lys Ala Ser Glu Ala Phe Gly Ala Asn Lys
85 90 95
Ile Asp Gln Val Ser Arg Ile Ala Ser Gly Gln Ile Trp Leu Ala Leu
100 105 110
Thr Leu Ser Leu Pro Ala Met Leu Leu Leu Trp Tyr Met Asp Thr Ile
115 120 125
Leu Val Leu Phe Gly Gln Val Glu Ser Asn Thr Leu Ile Ala Lys Thr
130 135 140
Tyr Leu His Ser Ile Val Trp Gly Phe Pro Ala Ala Val Gly Ile Leu
145 150 155 160
Ile Leu Arg Gly Ile Ala Ser Ala Val Asn Val Pro Gln Leu Val Thr
165 170 175
Val Thr Met Leu Val Gly Leu Val Leu Asn Ala Pro Ala Asn Tyr Val
180 185 190
Leu Met Phe Gly Lys Phe Gly Leu Pro Glu Leu Gly Leu Ala Gly Ile
195 200 205
Gly Trp Ala Ser Thr Leu Val Phe Trp Ile Ser Phe Leu Val Gly Val
210 215 220
Val Leu Leu Ile Phe Ser Pro Lys Val Arg Asp Tyr Lys Leu Phe Arg
225 230 235 240
Tyr Leu His Gln Phe Asp Arg Gln Thr Val Val Glu Ile Phe Gln Thr
245 250 255
Gly Trp Pro Met Gly Phe Leu Leu Gly Val Glu Ser Val Val Leu Ser
260 265 270
Leu Thr Ala Trp Leu Thr Gly Tyr Leu Gly Thr Val Thr Leu Ala Ala
275 280 285
His Glu Ile Ala Ile Gln Thr Ala Glu Leu Ala Ile Val Ile Pro Leu
290 295 300
Gly Ile Gly Asn Val Ala Val Thr Arg Val Gly Gln Thr Ile Gly Glu
305 310 315 320
Lys Asn Pro Leu Gly Ala Arg Arg Ala Ala Leu Ile Gly Ile Met Ile
325 330 335
Gly Gly Ile Tyr Ala Ser Leu Val Ala Val Ile Phe Trp Leu Phe Pro
340 345 350
Tyr Gln Ile Ala Gly Leu Tyr Leu Lys Ile Asn Asp Pro Glu Ser Met
355 360 365
Glu Ala Val Lys Thr Ala Thr Asn Phe Leu Phe Leu Ala Gly Leu Phe
370 375 380
Gln Phe Phe His Ser Val Gln Ile Ile Val Val Gly Val Leu Ile Gly
385 390 395 400
Leu Gln Asp Thr Phe Ile Pro Leu Leu Met Asn Leu Val Gly Trp Gly
405 410 415
Leu Gly Leu Ala Val Ser Tyr Tyr Met Gly Ile Ile Leu Cys Trp Gly
420 425 430
Gly Met Gly Ile Trp Leu Gly Leu Val Leu Ser Pro Leu Leu Ser Gly
435 440 445
Leu Ile Leu Met Val Arg Phe Tyr Gln Glu Ile Ala Asn Arg Ile Ala
450 455 460
Asn Ser Asp Asp Gly Gln Glu Ser Ile Ser Ile Asp Asn Val Glu Glu
465 470 475 480
Leu Ser
<210> 38
<211> 1449
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 38
atgacaaata ccgaaagagg attagcagaa ataacatcaa caggatataa gtcagagctt 60
agatcggagg cacgagttag cctccaactg gcaattccct tagtccttgt cgaaatatgc 120
ggaacgagta ttaatgtggt ggatgtagtc atgatgggct tacttggtac tcaagttttg 180
gctgctggtg ccttgggtgc gatcgctttt ttatctgtat cgaatacttg ttataatatg 240
cttttgtcgg gggtagcaaa ggcatctgag gcttttgggg caaacaaaat agatcaggtt 300
agtcgtattg cttctgggca aatatggctg gcactcacct tgtctttgcc tgcaatgctt 360
ttgctttggt atatggatac tatattggtg ctatttggtc aagttgaaag caacacatta 420
attgcaaaaa cgtatttaca ctcaattgtg tggggatttc cggcggcagt tggtattttg 480
atattaagag gcattgcctc tgctgtgaac gtcccccaat tggtaactgt gacgatgcta 540
gtagggctgg tcttgaatgc cccggccaat tatgtattaa tgttcggtaa atttggtctt 600
cctgaacttg gtttagctgg aataggctgg gcaagtactt tggttttttg gattagtttt 660
ctagtggggg ttgtcttgct gattttctcc ccaaaagtta gagattataa acttttccgc 720
tacttgcatc agtttgatcg acagacggtt gtggaaattt ttcaaactgg atggcctatg 780
ggttttctac tgggagtgga atcagtagta ttgagcctca ccgcttggtt aacaggctat 840
ttgggaacag taacattagc agctcatgag atcgcgatcc aaacagcaga actggcgata 900
gtgataccac tcggaatcgg gaatgttgcc gtcacgagag taggtcagac tataggagaa 960
aaaaaccctt tgggtgctag aagggcagca ttgattggga ttatgattgg tggcatttat 1020
gccagtcttg tggcagtcat tttctggttg tttccatatc agattgcggg actttattta 1080
aaaataaacg atccagagag tatggaagca gttaagacag caactaattt tctcttcttg 1140
gcgggattat tccaattttt tcatagcgtt caaataattg ttgttggggt tttaataggg 1200
ttgcaggata cgtttatccc attgttaatg aatttggtag gctggggtct tggcttggca 1260
gtaagctatt acatgggaat cattttatgt tggggaggta tgggtatctg gttaggtctg 1320
gttttgagtc cactcctgtc cggacttatt ttaatggttc gtttttatca agagattgcc 1380
aataggattg ccaatagtga tgatgggcaa gagagtatat ctattgacaa cgttgaagaa 1440
ctctcctga 1449
<210> 39
<211> 1449
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 39
atgaccaata ccgaacgtgg tctggccgaa attaccagca ccggttataa aagcgaactg 60
cgtagcgaag cccgtgttag cctgcagctg gcaattcctc tggttctggt tgaaatttgt 120
ggcaccagca ttaatgttgt tgatgttgtg atgatgggtt tactgggtac acaagtgtta 180
gcagcgggtg ccctgggagc aattgccttc ctgagcgtta gcaatacctg ctataatatg 240
ctgctgagtg gtgttgcaaa agcaagcgaa gcctttggag ccaataaaat cgatcaggtt 300
tcacgtattg cctcaggcca gatttggtta gccctgaccc tgtcattacc agccatgctg 360
ttactgtggt atatggatac catcctggtt ctgtttggtc aggttgaaag caataccctg 420
attgcgaaaa catacctgca ttcaattgtg tggggctttc ctgccgcagt tggtatcctg 480
attctgcgtg gcatagcaag tgcagttaac gttcctcagc tggttaccgt gaccatgctg 540
gttggcctgg tgctgaatgc accggctaat tatgtgctga tgttcggcaa attcggttta 600
ccggaattag gcctggctgg cattggctgg gccagcacac tggtgttttg gattagtttt 660
ctggttggtg ttgtgctgct gatattttca ccgaaagttc gcgactacaa actgttccgc 720
tatttacatc agtttgatcg tcagaccgtg gttgagattt ttcagacggg ctggcctatg 780
ggcttcctgc tgggtgtgga aagcgttgtt ctgagcctga ccgcatggct gaccggctat 840
ctgggtacag tgaccttagc agcccatgaa attgcaatcc agactgccga actggcgatt 900
gtgattccgt taggtattgg caatgttgcc gttacccgtg tgggccagac aatcggcgaa 960
aaaaacccgc tgggagcacg ccgtgcagcc ctgattggca ttatgattgg tggcatttat 1020
gcgagcctgg ttgcagtgat tttttggtta ttcccttatc aaatcgcagg cctgtacctg 1080
aaaattaacg atccggaatc aatggaagca gttaaaaccg caacaaactt tctgttttta 1140
gctggcctgt tccagttttt tcatagcgtg cagattattg ttgtgggtgt tctgattggc 1200
ctgcaggata cctttatccc tctgctgatg aatctggtgg gctggggact gggcctggcg 1260
gtttcctatt atatgggtat tatcctgtgc tggggtggca tgggcatctg gttaggtctg 1320
gtactgtcac cgctgctgtc aggcctgatc ctgatggtgc gcttttatca agaaattgcc 1380
aatcgcattg cgaatagcga cgatggccaa gaaagcatta gcattgataa tgttgaagaa 1440
ctgagctaa 1449
<210> 40
<211> 276
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 40
Met Lys Thr Asn Lys His Ile Ala Met Trp Ala Cys Pro Arg Ser Arg
1 5 10 15
Ser Thr Val Ile Thr Arg Ala Phe Glu Asn Leu Asp Gly Cys Val Val
20 25 30
Tyr Asp Glu Pro Leu Glu Ala Pro Asn Val Leu Met Thr Thr Tyr Thr
35 40 45
Met Ser Asn Ser Arg Thr Leu Ala Glu Glu Asp Leu Lys Gln Leu Ile
50 55 60
Leu Gln Asn Asn Val Glu Thr Asp Leu Lys Lys Val Ile Glu Gln Leu
65 70 75 80
Thr Gly Asp Leu Pro Asp Gly Lys Leu Phe Ser Phe Gln Lys Met Ile
85 90 95
Thr Gly Asp Tyr Arg Ser Glu Phe Gly Ile Asp Trp Ala Lys Lys Leu
100 105 110
Thr Asn Phe Phe Leu Ile Arg His Pro Gln Asp Ile Ile Phe Ser Phe
115 120 125
Asp Ile Ala Glu Arg Lys Thr Gly Ile Thr Glu Pro Phe Thr Gln Gln
130 135 140
Asn Leu Gly Met Lys Thr Leu Tyr Glu Val Phe Gln Gln Ile Glu Val
145 150 155 160
Ile Thr Gly Gln Thr Pro Leu Val Ile His Ser Asp Asp Ile Ile Lys
165 170 175
Asn Pro Pro Ser Ala Leu Lys Trp Leu Cys Lys Asn Leu Gly Leu Ala
180 185 190
Phe Asp Glu Lys Met Leu Thr Trp Lys Ala Asn Leu Glu Asp Ser Asn
195 200 205
Leu Lys Tyr Thr Lys Leu Tyr Ala Asn Ser Ala Ser Gly Ser Ser Glu
210 215 220
Pro Trp Phe Glu Thr Leu Arg Ser Thr Lys Thr Phe Leu Ala Tyr Glu
225 230 235 240
Lys Lys Glu Lys Lys Leu Pro Ala Arg Leu Ile Pro Leu Leu Asp Glu
245 250 255
Ser Ile Pro Tyr Tyr Glu Lys Leu Leu Gln His Cys His Ile Phe Glu
260 265 270
Trp Ser Glu His
275
<210> 41
<211> 831
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 41
atgaaaacaa acaaacatat agctatgtgg gcttgtccta gaagtcgttc tactgtaatt 60
acccgtgctt ttgagaactt agatgggtgt gttgtttatg atgagcctct agaggctccg 120
aatgtcttga tgacaactta cacgatgagt aacagtcgta cgttagcaga agaagactta 180
aagcaattaa tactgcaaaa taatgtagaa acagacctca agaaagttat agaacaattg 240
actggagatt taccggacgg aaaattattc tcatttcaaa aaatgataac aggtgactat 300
agatctgaat ttggaataga ttgggcaaaa aagctaacta acttcttttt aataaggcat 360
ccccaagata ttattttttc tttcgatata gcggagagaa agacaggtat cacagaacca 420
ttcacacaac aaaatcttgg catgaaaaca ctttatgaag ttttccaaca aattgaagtt 480
attacagggc aaacaccttt agttattcac tcagatgata taattaaaaa ccctccttct 540
gctttgaaat ggctgtgtaa aaacttaggg cttgcatttg atgaaaagat gctgacatgg 600
aaagcaaatc tagaagactc caatttaaag tatacaaaat tatatgctaa ttctgcgtct 660
ggcagttcag aaccttggtt tgaaacttta agatcgacca aaacatttct cgcctatgaa 720
aagaaggaga aaaaattacc agctcggtta atacctctac tagatgaatc tattccttac 780
tatgaaaaac tcttacagca ttgtcatatt tttgaatggt cagaacactg a 831
<210> 42
<211> 257
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 42
Met Ser Phe Gln Lys Phe Val Gln Glu Ala Ala Tyr Lys Val Ala Pro
1 5 10 15
Phe Lys Pro Asn Arg Phe Ala Lys Ile Ser Glu Arg Glu Asp Lys Cys
20 25 30
Ala Ile Pro Val Pro Ala Trp Arg Ala Leu Leu Ala Asn Arg Asp Leu
35 40 45
Phe Thr Trp Lys Gly Ile Pro Phe Leu Lys Gly Cys Thr Glu Ile Ala
50 55 60
Leu Tyr Ser Met Leu Leu Tyr Glu Leu Arg Pro Lys Thr Ile Ile Glu
65 70 75 80
Ile Gly Ala Leu Ser Gly Gly Ser Ala Ile Trp Leu Ala Asp His Leu
85 90 95
Glu Leu Phe Gln Ile Glu Gly Cys Val Tyr Cys Ile Asp Ile Asp Leu
100 105 110
Ser Leu Leu Asp Glu Lys Ala Lys Thr Asp Ser Arg Val His Phe Leu
115 120 125
Glu Gly Asp Cys Asn Asn Met Gly Ala Ile Met Ser Ser Glu Leu Leu
130 135 140
Ser Gly Leu Ala His Pro Trp Leu Ile Val Glu Asp Ala His Ala Asn
145 150 155 160
Ala Val Gly Val Val Glu Tyr Phe His Glu Asn Gly Leu Lys Ser Gly
165 170 175
Asp Tyr Leu Ile Val Glu Asp Thr Asn Lys Thr Met Trp Glu Leu Asp
180 185 190
Arg Glu Glu Leu Asp Arg Asp Asp Leu Asp Glu Gln Glu Leu Ile Glu
195 200 205
Lys Gly Glu Gln Lys Leu Ala Glu Leu Lys Ser Trp Leu Met Leu His
210 215 220
Glu Asn Glu Tyr Leu Ile Asp Thr Tyr Tyr Gln Asp Met Tyr Gly Tyr
225 230 235 240
Asn Gly Ser Arg Asn Trp Asn Ser Ile Leu Lys Arg Val Glu Lys Asn
245 250 255
Phe
<210> 43
<211> 774
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 43
atgagcttcc aaaaatttgt tcaagaagcc gcctataaag ttgcaccttt caaacctaat 60
cggtttgcca aaatttctga aagagaagat aaatgtgcta ttccagtgcc agcttggaga 120
gcgctcttgg caaaccgcga tttgttcact tggaaaggga tacccttcct gaaagggtgc 180
accgaaatag ctctttattc aatgctcctg tatgagcttc gcccgaaaac aataatcgaa 240
ataggagcat taagcggtgg cagcgcgatt tggctagccg atcacttaga actgttccaa 300
atagaaggtt gtgtctactg tatcgatatc gatctttccc tactcgacga gaaagcaaaa 360
actgactctc gcgttcattt tttagagggg gattgtaaca atatgggtgc aataatgtcg 420
tcggaactgc tttctgggct tgctcatccc tggttgatcg tagaagatgc ccatgctaat 480
gcggtgggag tagttgaata ttttcacgaa aacggtctaa aaagtggaga ctacttgatt 540
gtcgaagata ccaacaaaac tatgtgggag ttggacaggg aggagttgga cagggatgat 600
ttggatgagc aagaattaat agaaaaagga gagcagaaat tagcggagtt aaaaagctgg 660
ttaatgctcc acgaaaatga gtacctcatc gatacgtact atcaagatat gtacggttac 720
aacggctcta gaaactggaa ttctatcctg aaaagagtag aaaaaaattt ttag 774
<210> 44
<211> 774
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 44
atgtcatttc agaaatttgt gcaagaagca gcctataaag tcgcaccgtt taaaccgaat 60
cgttttgcca aaattagcga gcgtgaagat aaatgtgcaa ttccggttcc ggcatggcgt 120
gcactgctgg ccaatcgtga cctgtttacc tggaaaggta ttccgtttct gaaaggttgt 180
accgaaattg cactgtatag catgctgctg tatgaactgc gtccgaaaac gattattgaa 240
attggtgcgc tgagcggtgg tagcgcaatt tggctggcag atcatctgga actgtttcag 300
attgaaggtt gcgtgtattg cattgatatt gatctgtctc tgctggacga aaaagcaaaa 360
accgatagcc gtgttcattt tctggaaggt gattgcaata atatgggtgc aattatgtca 420
agcgagctgc tgagtggtct ggcacatcct tggctgattg ttgaagatgc acatgcaaat 480
gccgttggtg tggttgaata ttttcacgaa aacggtctga aaagtggcga ttacctgatc 540
gtggaagata ccaataaaac aatgtgggaa ctggatcgcg aagaactgga ccgtgatgac 600
ctggatgaac aagaactgat cgaaaaaggt gagcagaaat tagcagaact gaaaagctgg 660
ctgatgctgc atgagaatga atatctgata gatacctact atcaggatat gtatggctat 720
aatggtagcc gtaattggaa cagcattctg aaacgtgtgg aaaagaactt ttaa 774
<210> 45
<211> 108
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 45
Met Ile Glu Leu Val Ser His Lys Leu Cys Ile Asn Cys Asn Val Cys
1 5 10 15
Val Gln Val Cys Pro Thr Asn Val Phe Asp Ala Val Pro Asn Gln Pro
20 25 30
Pro Ala Ile Ala Arg Gln Glu Asp Cys Gln Thr Cys Phe Ile Cys Glu
35 40 45
Ala Tyr Cys Pro Ala Asp Ala Leu Tyr Val Ala Pro Gln Ser His Thr
50 55 60
Asn Val Ala Val Asn Glu Asp Asp Leu Ile Asp Ser Gly Ile Met Gly
65 70 75 80
Glu Tyr Arg Arg Ile Leu Gly Trp Gly Tyr Gly Arg Lys Asn Asn Ser
85 90 95
Glu Leu Asp Thr Asp His Lys Leu Arg Leu Phe Glu
100 105
<210> 46
<211> 327
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 46
atgatcgagc ttgtcagcca taaactctgt attaattgta atgtttgcgt ccaagtatgc 60
cctaccaatg tctttgatgc agttcccaac caaccgcctg cgatcgcccg acaggaagac 120
tgtcaaactt gtttcatctg tgaagcatat tgtcctgcgg atgcgctcta tgttgcgccg 180
caatctcata ccaatgttgc agtcaacgag gatgatttaa ttgacagtgg cattatgggt 240
gaatatcgtc gcatcttagg ttggggatat ggcagaaaaa acaatagcga attggatacc 300
gatcataaac tacggctatt tgaataa 327
<210> 47
<211> 327
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 47
atgattgaac tggtgagcca taagctgtgc attaattgta atgtttgtgt tcaggtgtgc 60
ccgaccaatg tttttgatgc agtgccgaat cagcctccgg caattgcacg ccaagaagat 120
tgtcagacct gttttatttg tgaagcatat tgtcctgcag atgcgctgta tgttgcaccg 180
cagagccata ccaatgttgc agttaacgaa gatgatttaa tcgacagcgg cattatgggt 240
gaatatcgtc gcattctggg ttggggctat ggtcgtaaaa acaatagcga actggatacc 300
gaccataaac tgcgtctgtt tgaatga 327
<210> 48
<211> 550
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 48
Met Asn Leu Thr Leu Asn Lys Glu Glu Lys Gln Leu Leu Thr Ala Tyr
1 5 10 15
Ser Gly Thr Glu Leu Gln Leu Thr Ala Asp Val Leu Val Ile Gly Gly
20 25 30
Gly Pro Ala Ala Ala Trp Ala Ala Trp Ala Ala Gly Ala Gln Gly Val
35 40 45
Lys Val Ile Ile Val Asp Lys Gly Phe Leu Gly Thr Ser Gly Ala Ala
50 55 60
Ala Ala Ser Gly Asn Ser Val Met Ala Pro Ser Pro Glu Asn Trp Glu
65 70 75 80
Lys Asp Val Ser Glu Cys Tyr Ser Lys Gly Asn Asn Leu Ala Asn Leu
85 90 95
Arg Trp Ile Glu Arg Val Ile Glu Lys Ala Trp Leu Ser Leu Pro Leu
100 105 110
Val Glu Asp Trp Gly Tyr Arg Phe Pro Lys Glu Asn Gly Glu Ser Val
115 120 125
Arg Gln Ser Tyr Tyr Gly Pro Glu Tyr Met Arg Val Leu Arg Lys Asn
130 135 140
Leu Leu Arg Val Gly Val Gln Ile Phe Asp Gln Ser Pro Ala Leu Glu
145 150 155 160
Leu Leu Leu Ala Gln Asp Gly Ser Val Ala Gly Ala Arg Gly Val Gln
165 170 175
Arg Gln Asn His Arg Thr Tyr Thr Val Arg Ala Gly Ala Val Val Leu
180 185 190
Ala Asn Gly Gly Cys Ala Phe Leu Ser Lys Ala Leu Gly Cys Asn Thr
195 200 205
Asn Thr Gly Asp Gly Leu Leu Met Ala Val Glu Ala Gly Gly Glu Leu
210 215 220
Ser Ser Met Glu Ala Ser Ser His Tyr Thr Ile Ser Thr Ala Phe Asn
225 230 235 240
Ala Thr Val Thr Arg Ala Ala Pro Phe Tyr Trp Ala Ser Tyr Thr Asp
245 250 255
Glu Ala Gly Asn Asp Leu Gly Gly Tyr Ile Asn Gly Arg Arg Asp Pro
260 265 270
Ser Phe Leu Pro Asn Ala Leu Leu Lys Gly Pro Val Tyr Ala Arg Leu
275 280 285
Asp Arg Ala Thr Pro Glu Ile Gln Ala Leu Val Glu Lys Ser His Phe
290 295 300
Ile Ala Phe Leu Pro Tyr Lys Lys Ala Gly Ile Asp Pro Tyr Thr Glu
305 310 315 320
Arg Val Pro Val Thr Leu Val Leu Glu Gly Thr Val Arg Gly Thr Gly
325 330 335
Gly Ile Arg Ile Val Asn Asp Ser Cys Gly Thr Lys Val Pro Gly Leu
340 345 350
Tyr Ala Ala Gly Asp Ala Ala Ser Arg Glu Phe Leu Ala Gly Ile Ala
355 360 365
Ser Gly Gly Asp Gly Pro Asn Ala Ala Trp Ala Ile Ser Thr Gly Gln
370 375 380
Trp Ala Gly Glu Gly Ala Ala Ala Phe Ala Lys Ser Leu Gly Ala His
385 390 395 400
Val His Glu Arg Val Val Arg Pro Ala Gly Gln Ala Gly Leu Arg Ser
405 410 415
Gln Tyr Pro Gly Ser Glu Thr Phe Asp Ser Glu Ala Val Val Arg Gly
420 425 430
Val Gln Ala Glu Met Phe Pro Leu Glu Lys Asn Tyr Leu Arg Cys Glu
435 440 445
Gln Gly Leu Leu Asp Ser Leu Ala Lys Leu Glu Met Leu Trp Gln Gln
450 455 460
Val Gln Gly Asn Pro Lys Gln Asp Thr Val Arg Asp Leu Glu Phe Ser
465 470 475 480
Arg Arg Ala Ala Ala Leu Val Ser Val Ala Arg Trp Ala Tyr Phe Ser
485 490 495
Ala Leu His Arg Lys Glu Thr Arg Ser Glu His Ile Arg Ile Asp Tyr
500 505 510
Pro Glu Thr Asp Pro Asn Gln Leu Tyr Tyr Gln Ala Thr Gly Gly Leu
515 520 525
Glu Arg Leu Trp Val Arg Arg Asp Trp Val Lys Asp Ala Ser Ala Thr
530 535 540
Pro Pro Val Leu Thr Thr
545 550
<210> 49
<211> 1653
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 49
atgaacttga ctttaaacaa ggaggaaaag caattgctta cagcctatag cggcactgaa 60
ctacaattaa ctgctgacgt gctggtaatt ggtggtggtc ctgccgccgc atgggcagca 120
tgggcggctg gagcccaagg tgtcaaagtc atcattgttg ataaaggttt tctaggtacg 180
agcggtgcag ctgctgccag tggcaatagc gtcatggcac cttctccaga gaattgggag 240
aaagatgtat ccgaatgtta cagcaaagga aataacctcg ctaacttacg ttggattgaa 300
cgtgtaattg aaaaagcttg gctgagtttg cccttagtgg aagattgggg ctatcgtttc 360
cccaaagaaa atggggaatc cgtgcgccag agttattatg gtccggaata tatgcgggta 420
cttcgcaaga acctgttgcg tgtgggtgtg caaattttcg accaaagtcc ggctctagaa 480
ctgttattag cccaggacgg ctccgtggct ggagctagag gtgtacagag gcaaaatcat 540
cgcacctata ccgttcgcgc tggtgcagta gttctagcga atggcggttg tgcattccta 600
agtaaagctt taggttgcaa taccaataca ggcgatggac tgctgatggc ggtggaagct 660
ggcggcgaac tctccagtat ggaagcttcc agtcactata ccatctcgac cgctttcaat 720
gccacagtga caagggctgc tcccttttac tgggctagtt acaccgatga ggcaggtaac 780
gatcttggtg gctatatcaa tggtcgtcgc gatccatcgt tcctgcccaa tgccctcctg 840
aaaggtcccg tttatgctcg tttggatcga gccacacctg aaatccaagc attggttgaa 900
aagtctcact tcatcgcctt tctaccctat aaaaaagctg gcattgaccc ttatacagaa 960
cgagtacctg taacactggt tttagaaggt acagtccgtg gtacaggtgg aattcggatt 1020
gtgaatgata gttgtggtac aaaagttcct ggactgtatg ccgccggaga tgcagcatcg 1080
cgggagtttt tagctgggat agcttctggg ggtgatggtc ctaatgctgc ttgggcaatc 1140
tctacaggac aatgggcagg ggaaggtgca gccgcctttg ccaagagttt gggcgctcat 1200
gtccatgaac gggttgtgcg tccagcaggt caagccggat tacgttccca gtaccctggt 1260
tccgaaacat tcgatagcga ggcagttgtc cgcggtgtac aagccgagat gttcccatta 1320
gagaagaatt acttgcgctg tgagcaggga cttttggatt ccctcgccaa attagaaatg 1380
ctgtggcagc aagtacaagg gaacccgaaa caagatacag tgcgcgatct ggaattttct 1440
cgtcgagcgg ctgctcttgt gtctgtagca cgatgggcat attttagcgc tttacatcgc 1500
aaggaaacgc gtagcgaaca tattcgcata gactatcctg aaaccgatcc aaatcagctt 1560
tattaccaag ccacgggcgg cttagaaagg ctttgggtga gacgggattg ggtgaaggat 1620
gcgagcgcta caccaccagt attaaccact taa 1653
<210> 50
<211> 1653
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 50
atgaacctga ccctgaacaa agaagaaaaa cagctgctga cggcatatag cggcaccgaa 60
ctgcagctga cagcagatgt tctggttatt ggtggtggtc cggcagccgc atgggcagct 120
tgggcagcag gcgcacaggg tgtgaaagtt attattgtgg ataaaggttt tctgggcacc 180
agcggtgccg cagccgcaag cggtaatagc gttatggcac cgtcaccgga aaattgggaa 240
aaagatgtga gcgaatgtta cagcaaaggt aataatctgg caaatctgcg ttggattgaa 300
cgtgttattg aaaaagcctg gctgtcactg ccgctggttg aagattgggg ttatcgtttt 360
cctaaagaaa atggtgaaag cgtgcgtcag agctattatg gtcctgaata tatgcgtgtt 420
ctgcggaaaa atctgctgcg cgttggtgtt cagatctttg atcagtcacc ggcactggaa 480
ttactgctgg cacaggatgg tagcgttgcc ggtgcacgtg gtgtgcagcg tcagaatcat 540
cgtacatata ccgttcgtgc cggtgccgtt gttctggcca atggtggttg cgcatttctg 600
agtaaagcac tgggttgtaa taccaatacc ggtgatggtc tgttaatggc agttgaagcc 660
ggtggtgaac tgagcagtat ggaagccagc agccattata ccattagcac cgcctttaat 720
gcaaccgtta cccgtgcagc tccgttttat tgggcaagct ataccgatga agctggcaat 780
gatctgggtg gctatattaa cggtcgtcgt gatccgagct ttctgccgaa cgcactgctg 840
aaaggtccgg tttatgcacg tctggatcgt gcaacaccgg aaattcaggc gctggtagaa 900
aaaagccatt ttattgcatt tctgccgtac aagaaagccg gtattgatcc gtataccgaa 960
cgtgttccgg ttaccctggt gctggaaggc accgtgcgtg gcaccggtgg tattcgcatt 1020
gttaatgatt catgtggcac caaagttccg ggactgtatg cagcgggtga tgcagcaagc 1080
cgtgaatttc tggcaggcat tgccagcggt ggtgatggac cgaatgcagc atgggcaatt 1140
tcaaccggtc agtgggcagg cgaaggtgca gcagcctttg caaaaagtct gggtgcacat 1200
gttcatgaac gcgttgttcg tccggcaggc caggcaggtc tgcgtagtca gtatccgggt 1260
agcgaaacct ttgatagtga agcagttgtt cgtggcgttc aggcagaaat gtttccgctg 1320
gaaaaaaact atctgcgctg tgaacaggga ctgctggata gcctggcaaa actggaaatg 1380
ctgtggcagc aggttcaggg taatccgaaa caggatacag ttcgtgatct ggaattttca 1440
cgtcgtgcgg cagcactggt tagcgtggca cgttgggcat attttagcgc actgcatcgt 1500
aaagaaaccc gtagcgaaca tatccgtatt gattacccgg aaacggatcc gaatcaactg 1560
tattatcagg caaccggtgg cctggaacgt ctgtgggtgc gtcgtgattg ggttaaagat 1620
gcaagcgcca cccctccggt gctgaccacc tga 1653
<210> 51
<211> 249
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 51
Met Ala Gly Lys Leu Asp Gly Lys Val Ala Ile Ile Thr Gly Ala Ser
1 5 10 15
Ser Gly Ile Gly Glu Ala Thr Ala Phe Ala Leu Ala Ala Glu Gly Ala
20 25 30
Lys Val Ala Ile Ala Ala Arg Arg Ala Glu Leu Leu His Ala Leu Ala
35 40 45
Lys Arg Ile Glu Ala Ser Gly Gly Gln Ala Leu Pro Ile Val Thr Asp
50 55 60
Ile Thr Asp Glu Ser Gln Val Asn His Leu Val Gln Lys Thr Lys Val
65 70 75 80
Glu Leu Gly His Val Asp Ile Leu Val Asn Asn Ala Gly Ile Gly Val
85 90 95
Phe Gly Ala Ile Asp Thr Gly Asn Pro Ala Asp Trp Arg Arg Ala Phe
100 105 110
Asp Val Asn Val Leu Gly Val Leu Tyr Ala Ile His Ala Val Leu Pro
115 120 125
Leu Leu Lys Ala Gln Lys Ser Gly His Ile Val Asn Ile Ser Ser Val
130 135 140
Asp Gly Arg Ile Ala Gln Ser Gly Ala Val Val Tyr Ser Ala Ala Lys
145 150 155 160
Ser Gly Val Asn Ala Leu Ser Glu Ala Leu Arg Gln Glu Val Ser Leu
165 170 175
Asp Asn Ile Arg Val Thr Ile Ile Glu Pro Gly Leu Val Asp Thr Pro
180 185 190
Phe Asn Asp Leu Ile Ser Asp Pro Ile Thr Lys Gln Leu Ser Lys Glu
195 200 205
Gln Leu Ser Thr Ile Thr Pro Leu Gln Ser Glu Asp Ile Ala Arg Ala
210 215 220
Ile Ile Tyr Ala Val Thr Gln Pro Asp His Val Asn Val Asn Glu Ile
225 230 235 240
Leu Ile Arg Pro Thr Ala Glu Asp Asn
245
<210> 52
<211> 750
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 52
atggcaggta aattggatgg aaaagtggcg attattactg gagcttcctc tgggattgga 60
gaggctacag catttgcttt agctgcggag ggggcaaaag ttgcgatcgc cgcaagacgt 120
gctgagcttt tgcatgcact agcaaaacgg attgaagcca gtggtggtca agcattgcct 180
attgttacag atattacaga cgaatctcaa gtaaatcatc tagtccaaaa gaccaaggtt 240
gagctaggac atgtagatat tttggtgaat aatgcaggaa ttggtgtgtt tggtgcaatt 300
gatactggaa atcccgcaga ctggaggcga gcattcgatg tgaatgttct gggagtttta 360
tatgctatcc acgcagtttt gcctcttctg aaggcccaaa aatccggtca tatagtcaat 420
atatcttctg tcgatggcag gatagcgcag tccggtgcgg tcgtttatag tgctgccaaa 480
tcaggcgtca atgctctttc agaagcatta cgccaggagg tatctttaga caacattcgc 540
gttaccatca ttgagccagg tttagtcgat acgccattta atgacttaat ttctgacccg 600
atcacgaaac agcttagtaa agaacaactt agtacaataa cacctttaca aagtgaggat 660
attgcaagag ctataattta tgcagtgaca caacccgatc atgtaaatgt aaatgaaatt 720
ttgattcgac cgactgcaga agataattaa 750
<210> 53
<211> 750
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 53
atggcaggta aactggatgg taaggttgca attattaccg gtgcaagcag cggtattggt 60
gaagccaccg catttgcact ggcagcagaa ggtgcaaaag ttgcaattgc agcccgtcgt 120
gcagaactgt tacatgcact ggccaaacgt attgaagcaa gcggtggtca ggcactgccg 180
attgttaccg atatcaccga tgaaagccag gttaatcatc tggttcagaa aaccaaagtt 240
gaactgggtc atgttgatat cctggtgaat aatgcaggta ttggcgtttt tggtgcaatc 300
gataccggta atccggcaga ttggcgtcgt gcatttgatg ttaatgtgct gggtgttctg 360
tatgcaattc atgcagttct gcctttactg aaagcacaga aaagcggtca tattgtgaat 420
attagcagcg tggatggtcg tattgcacag agcggtgcag ttgtttatag cgcagcaaaa 480
agcggtgtta atgccctgag cgaagcactg cgtcaagaag tgagcctgga taatattcgt 540
gtgaccatta ttgaaccggg tctggtagat accccgttta atgatctgat tagtgatccg 600
attaccaaac agctgagcaa agaacagctg tcaaccatta ctccgctgca gagcgaagat 660
attgcacgtg ccattatcta tgcagttacc cagccggatc atgttaacgt taatgaaatt 720
ctgattcgtc cgaccgcaga ggataattga 750
<210> 54
<211> 334
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 54
Met Thr Thr Thr Asp Pro Ile Leu Ile Asn Asn Trp His Val Val Ala
1 5 10 15
Asn Val Glu Asp Cys Lys Pro Gly Ser Ile Thr Arg Ser Arg Leu Leu
20 25 30
Gly Val Lys Leu Val Leu Trp Arg Ser Tyr Glu Gln Asn Ser Pro Ile
35 40 45
Gln Val Trp Leu Asp Tyr Cys Pro His Arg Gly Val Pro Leu Ser Met
50 55 60
Gly Glu Ile Thr Asn Asn Thr Leu Val Cys Pro Tyr His Gly Trp Arg
65 70 75 80
Tyr Asn Glu Ala Gly Lys Cys Ile Gln Ile Pro Ala His Pro Gly Met
85 90 95
Val Pro Pro Ala Ser Ala Glu Ala Arg Thr Tyr His Ser Gln Glu Arg
100 105 110
Tyr Gly Leu Val Trp Val Cys Leu Gly Asp Pro Val Asn Asp Ile Pro
115 120 125
Ser Phe Pro Glu Trp Asp Asp Pro Asn Tyr His Lys Thr Tyr Thr Lys
130 135 140
Ser Tyr Leu Ile Lys Ala Ser Ala Phe Arg Val Met Asp Asn Ser Leu
145 150 155 160
Asp Val Ser His Phe Pro Phe Ile His Asp Gly Trp Leu Gly Asp Arg
165 170 175
Asn Tyr Thr Lys Val Glu Glu Phe Glu Val Lys Leu Asp Lys Asp Gly
180 185 190
Leu Thr Met Gly Lys Tyr Gln Phe Gln Thr Ser Arg Ile Val Ser His
195 200 205
Ile Glu Asp Asp Ser Trp Val Asn Trp Phe Arg Leu Ser His Pro Leu
210 215 220
Cys Gln Tyr Cys Val Ser Glu Ser Pro Glu Met Arg Ile Val Asp Leu
225 230 235 240
Met Thr Ile Thr Pro Ile Asp Glu Glu Asn Ser Val Leu Arg Met Leu
245 250 255
Ile Met Trp Asn Gly Tyr Glu Thr Leu Glu Ser Lys Met Leu Thr Glu
260 265 270
Tyr Asp Glu Thr Ile Glu Gln Asp Ile Arg Ile Leu His Ala Gln Gln
275 280 285
Pro Val Arg Leu Pro Leu Leu Thr Pro Lys Gln Ile Asn Thr Gln Leu
290 295 300
Phe Ser His Glu Ile His Val Pro Ser Asp Arg Cys Thr Leu Ala Tyr
305 310 315 320
Arg Arg Trp Leu Lys Gln Leu Gly Val Thr Tyr Gly Val Cys
325 330
<210> 55
<211> 1005
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 55
atgacaacta ccgacccaat cttaatcaat aactggcacg tagtcgccaa tgtagaagac 60
tgtaaacctg gaagtatcac cagatctcgt ttgttgggag tgaagttggt attatggcgc 120
agttatgaac aaaattcacc catacaggta tggcttgact actgccccca ccgaggtgtt 180
cctctgtcta tgggagaaat tacgaataat actttagttt gtccgtatca cggatggaga 240
tacaatgagg ctggtaaatg catacagatc ccagctcacc ctggcatggt accaccggca 300
agtgctgaag ccaggacata tcactcccag gagcgctatg gcttagtgtg ggtgtgcttg 360
ggcgatcctg ttaatgatat accttcattt cctgaatggg atgatccgaa ttatcacaag 420
acttatacca agtcttactt gattaaagct agtgcgtttc gtgtgatgga taattcctta 480
gacgtgtctc attttccttt tatccatgac ggttggttag gtgatcgcaa ttatacaaaa 540
gtggaagaat ttgaggtgaa attagataaa gatggcctta ctatgggtaa gtatcaattc 600
cagacatcaa ggattgtcag ccatatcgaa gatgactctt gggttaattg gttcaggctt 660
agtcatcctt tatgtcaata ctgcgtttca gaatcccctg aaatgaggat tgtggattta 720
atgacgatca caccgattga tgaggaaaat agtgtattgc gtatgttgat aatgtggaac 780
gggtatgaaa cgttagagtc aaagatgcta actgaatatg acgaaacaat agaacaagat 840
attcggatct tacatgcaca acagccggta cgtttaccac tgttaactcc aaagcagata 900
aatacacaat tgttttcaca cgaaatccac gtaccatcag atagatgcac acttgcctat 960
cgtcgatggc taaagcaact aggtgttact tatggggttt gttaa 1005
<210> 56
<211> 1005
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 56
atgacaacca ccgatccgat cctgattaat aactggcatg ttgtggcaaa tgtcgaggat 60
tgtaaaccgg gtagcattac ccgtagccgt ttactgggtg ttaaactggt tctgtggcgt 120
agctatgaac agaatagccc gattcaggtt tggctggatt attgtccgca tcgtggtgtt 180
ccgctgagca tgggtgaaat taccaataat accctggttt gtccgtatca tggctggcgt 240
tataatgaag caggtaaatg tattcagatt ccggcacatc cgggtatggt tccgcctgca 300
agcgcagaag cacgtaccta tcatagccaa gaacgttatg gtctggtttg ggtttgtctg 360
ggtgatccgg ttaatgatat tccgtcattt ccggaatggg atgatccgaa ttatcacaaa 420
acctacacca aaagctatct gattaaagca agcgcctttc gcgttatgga taattcactg 480
gatgttagcc attttccgtt tattcatgat ggctggctgg gcgatcgtaa ctataccaaa 540
gtggaagaat ttgaagtgaa actggataaa gatggtctga cgatgggcaa atatcagttt 600
cagaccagcc gtattgtgag ccatattgaa gatgatagct gggtgaattg gtttcgtctg 660
agccatccgc tgtgtcagta ttgtgttagc gaaagtccgg aaatgcgtat tgttgatctg 720
atgaccatta cgccgattga tgaagaaaat agcgttctgc gcatgctgat catgtggaat 780
ggttatgaaa ccctggaaag caaaatgctg acagagtatg atgaaacgat cgaacaggat 840
attcgtattc tgcatgccca gcagccggtg cgtctgccgc tgctgacacc gaagcagatt 900
aatacccagc tgtttagcca tgaaattcat gttccgagcg atcgttgtac cctggcatat 960
cgtcgttggc tgaaacaact gggtgtgacc tatggtgttt gttga 1005
<210> 57
<211> 241
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 57
Met Leu Thr Ala Glu Gln Lys Gln Ala Tyr Thr Asn Asp Gly Tyr Phe
1 5 10 15
Thr Val Glu Glu Ala Val Pro Lys Ala Leu Ile Glu Glu Ile Arg His
20 25 30
Glu Val Glu Leu Ile Thr Glu Gln Lys Arg Gly Gly Val Leu Ala Gly
35 40 45
Asp Tyr Glu Trp Trp Ser Glu His Thr Ile Pro Asp Pro Val Arg Tyr
50 55 60
Gln Lys Ile Ile Gln Arg Leu Leu Glu Leu Pro Thr Val Met Gly Pro
65 70 75 80
Val Gln Ala Leu Ile Gly Ser Asp Ile Phe Leu Leu Ile Thr Asp Leu
85 90 95
Ala Ile Ile Arg Ala Gly Thr Gly Tyr Ile Ala Trp His Gln Asp His
100 105 110
Gly Tyr Val Val Glu Val Leu Asn Ala Leu Ala Ser Met Ser Lys Asn
115 120 125
Glu Leu Asn Asp Asp Ala Leu Arg Leu Leu Val Pro Val Ala Asn Gln
130 135 140
Ala Met Val Phe Ile Thr Ile Tyr Leu Gln Asp Thr Asp Asn Thr Met
145 150 155 160
Gly Thr Met Arg Val Ile Pro Ser Ser His Gln Trp Glu His Ser Leu
165 170 175
Asp Ser Ser Ser Ala Asn Ser Leu Asn Ala Glu Ile Cys Leu Ser Leu
180 185 190
Pro Gly Gly Ala Ala Met Phe Tyr Thr Pro Thr Val Trp His Thr Ala
195 200 205
Ala Ala Asn Thr Ser Ile Thr Asp Tyr Arg Met Leu Thr Leu Ile Phe
210 215 220
Thr Lys Asn Asn Ile Lys Pro Leu Leu Val Asp Ala Leu Lys Arg Ile
225 230 235 240
Ile
<210> 58
<211> 726
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 58
atgctcacag cggaacaaaa acaagcttac acaaatgatg gttatttcac agttgaagaa 60
gctgtaccaa aagcgttaat tgaagaaata cggcatgaag tagaacttat taccgaacaa 120
aaacgtgggg gagtattggc gggtgactat gagtggtggt ctgagcatac tatcccagat 180
ccagttaggt atcaaaagat aattcagagg cttttagagc ttccaactgt gatgggacca 240
gtacaggctc taattgggtc tgatatcttc ctattgatca ccgatctagc cataattcgt 300
gcaggtacag gatacattgc ttggcatcaa gaccatggat atgtagttga agtattgaac 360
gcacttgcat ccatgtcaaa aaacgagtta aatgacgacg cgcttcggtt gttggttcca 420
gtagccaatc aagccatggt attcataact atatacttac aggatacaga taatactatg 480
ggtacaatgc gagttatacc aagtagccac caatgggaac actcattaga ttcatcttct 540
gccaattcac taaatgcaga aatatgtctt tcacttccag gaggggcagc aatgttttat 600
acaccaactg tatggcatac cgcagctgcc aacacttcaa ttaccgatta caggatgcta 660
actctgattt ttacaaaaaa caacatcaaa ccactgttgg tggatgcctt gaaaaggata 720
atttag 726
<210> 59
<211> 726
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 59
atgctgaccg cagaacagaa acaggcatat accaatgatg gctattttac cgtggaagaa 60
gcagttccga aagcactgat tgaagaaatt cgccatgaag tggaactgat caccgagcag 120
aaacgtggtg gtgtgctggc aggcgattat gaatggtggt cagaacacac cattccggat 180
ccggttcgtt atcagaaaat tatccagcgt ctgctggaac tgccgaccgt tatgggtccg 240
gttcaggccc tgattggtag cgatattttt ctgttaatta ccgacctggc aattattcgt 300
gcaggcaccg gttatattgc atggcatcag gatcatggct atgttgttga agttctgaac 360
gccctggcaa gcatgagcaa aaatgagctg aatgatgatg cactgcgcct gctggtgccg 420
gttgcaaatc aggcaatggt gtttattacc atctatctgc aggataccga taacaccatg 480
ggcaccatgc gtgtgattcc gagcagccat cagtgggaac atagtctgga tagcagcagc 540
gccaattcac tgaatgcaga aatttgtctg agcctgcctg gtggtgcagc aatgttttat 600
accccgaccg tttggcatac cgcagcagca aataccagca ttaccgatta tcgtatgctg 660
acgctgatct tcaccaaaaa caacattaaa ccgctgctgg ttgatgccct gaaacgtatt 720
atttga 726
<210> 60
<211> 191
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 60
Met Ile Asn Ile Glu Gln Phe Arg Gln Glu Ile Glu Asp Trp Ile Ile
1 5 10 15
Asn Val Val Ser Ile Pro Asn Pro Leu Thr Gly Asn Phe Pro Pro Cys
20 25 30
Pro Tyr Ala Lys Ala Ala Trp Leu Asn Asn Arg Val Ser Val Arg Trp
35 40 45
Phe His Gly Pro Glu Leu Pro Glu Leu Leu Met Glu Gln Ile Arg Thr
50 55 60
Trp Asn Asn Asp Phe Glu Met Val Ile Phe Gly Cys Asp Pro Gln Asn
65 70 75 80
Leu Asp Ala Gln Arg Leu Glu Arg Tyr Ile Thr Lys Ala Asn Tyr Val
85 90 95
Leu Pro Glu Tyr Asp Leu Val Ala Leu Gly Ser His Pro Asp Lys Gln
100 105 110
Tyr Val Gly Asp Asp Ala Glu Asn Val Asn Asn Val Ile Ile Thr His
115 120 125
Pro Lys Tyr Val Leu Ala Ser Val Gln Ser Phe Ser Gln Leu Gln Glu
130 135 140
Ala Ser Asp Glu Leu Leu Arg Leu Gly Tyr Phe Gln Tyr Trp Ser Ala
145 150 155 160
Glu Lys Leu Ala Glu Met Lys Ser Glu Arg Ala Ser His Asn Leu Ser
165 170 175
Ser Ile Gln Arg Lys Asn Ser Tyr Arg Ile Ile Pro Thr Asn His
180 185 190
<210> 61
<211> 576
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 61
atgataaata tcgaacaatt tcgccaagaa atagaggatt ggattatcaa tgttgtcagc 60
attcccaatc ctctaacagg aaattttcca ccctgtcctt acgcgaaggc agcttggtta 120
aataaccgtg ttagtgttcg ttggtttcat ggacctgaac tgccagagct tctaatggaa 180
cagataagaa catggaataa tgactttgaa atggtgattt ttggctgcga ccctcaaaac 240
ctagatgcac agaggttgga aaggtacatt accaaggcga attatgtatt accagaatac 300
gatttggtag ctttaggatc gcatccagac aaacaatatg ttggtgatga cgcggagaat 360
gtgaataacg taatcataac tcaccctaag tatgttttag catcagtaca gtcattcagc 420
cagttacaag aggctagtga tgaattatta agattgggat attttcagta ttggtctgca 480
gaaaaattgg ctgaaatgaa gtcggagcga gcttctcaca acctttcttc tatccagaga 540
aagaacagct ataggataat tcctactaac cattga 576
<210> 62
<211> 576
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 62
atgatcaaca tcgaacagtt tcgccaagaa atcgaagatt ggattattaa cgttgtcagc 60
attccgaacc cgctgaccgg taattttcct ccgtgtccgt atgcaaaagc agcatggctg 120
aataatcgtg ttagcgtgcg ttggtttcat ggtccggaac tgcctgaact gctgatggaa 180
caaattcgta catggaacaa cgatttcgag atggtgattt ttggttgcga tcctcagaat 240
ctggatgcac agcgtctgga acgttatatc accaaagcaa attatgtgct gcccgaatat 300
gacctggttg cactgggtag ccatccggat aaacagtatg ttggtgatga tgccgaaaat 360
gtgaacaacg tgattattac ccatccgaaa tatgttctgg caagcgttca gagctttagc 420
cagctgcaag aggcaagtga tgagctgctg cgtctgggtt atttccagta ttggtcagca 480
gaaaaactgg ccgaaatgaa aagcgaacgt gcaagccata atctgagcag cattcagcgt 540
aaaaatagct atcgtattat cccgaccaac cattga 576
<210> 63
<211> 258
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 63
Met Thr Ile Gln Ile Val Gln His Asn Leu Glu Tyr Ser Phe Val Thr
1 5 10 15
Pro Lys Glu Thr Ser Asp Phe Val Glu Arg Thr Met Ser Val Phe Asp
20 25 30
Gln Ala Tyr Pro Lys Phe Leu Ile His Asp Val Trp Ala Asp Pro Ala
35 40 45
Ser Leu Ala Leu Phe Glu Ile Tyr Pro Glu Phe Gln Phe Gly Leu Val
50 55 60
Glu Ala Thr Thr Gln Leu Met Ile Ala Gln Gly Asn Cys Ile Pro Leu
65 70 75 80
Thr Tyr Glu Ser Arg Phe Asp Glu Leu Pro Asp Glu Gly Cys Asp Trp
85 90 95
Ala Leu Ala Lys Trp Leu Glu Asp Arg Glu Gln Asn Arg Leu Pro Asn
100 105 110
Ala Leu Cys Val Val Ser Ile Ser Ile Leu Pro Glu Tyr Gln Gly Lys
115 120 125
Asn Leu Ser Gln Tyr Leu Ile Gly Tyr Met Lys Glu Leu Ala Gln Tyr
130 135 140
His Gly Leu Asn Ser Leu Ile Met Ala Ala Arg Pro Ser Leu Lys Tyr
145 150 155 160
Leu Tyr Pro Leu Ile Pro Ile Glu Arg Tyr Ile Thr Trp Arg Asp Lys
165 170 175
Asn Gly Leu Ile Phe Asp Pro Trp Leu Arg Val Asn Val Lys His Gly
180 185 190
Ala Lys Ile Ala Gly Ile Cys Phe Lys Ser Thr Thr Ile Asn Asp Thr
195 200 205
Ile Asp Gly Trp Glu Asp Arg Val Gly Met Arg Phe Pro Glu Thr Gly
210 215 220
Asp Tyr Ile Ile Pro Lys Gly Leu Val Pro Val Lys Ile Asp Tyr Pro
225 230 235 240
Asn Asn Met Gly Ile Tyr Ile Glu Pro Asn Ile Trp Leu Tyr Tyr Asp
245 250 255
Leu Asp
<210> 64
<211> 777
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 64
atgaccattc aaattgtaca gcataattta gagtatagct ttgtaacccc aaaagaaact 60
tctgattttg tggaaaggac gatgagtgtc tttgatcaag catacccaaa atttttgata 120
catgatgtct gggcagatcc agcttcctta gctctatttg aaatttatcc agaattccag 180
tttgggttag tagaagctac cacacagctt atgatagcgc aaggaaactg tatcccttta 240
acttatgaaa gccgttttga tgagttaccg gacgaaggtt gtgactgggc tttagccaag 300
tggcttgaag accgagaaca gaaccgcctg cctaatgcgt tatgtgtagt atcgatttca 360
atcctaccag agtatcaagg caaaaacttg agtcagtatc tgattggata catgaaagaa 420
cttgctcaat accacggtct taattctttg atcatggctg cacgtccaag cctaaaatat 480
ctttacccac ttatacccat agagcggtat attacctggc gagataaaaa tggtcttata 540
tttgaccctt ggttacgagt taatgtcaaa catggggcta aaattgcagg gatctgtttt 600
aaatccacaa caattaatga tactattgac ggttgggaag atagagttgg gatgcgtttt 660
ccagaaactg gtgactatat tattcccaaa ggcttagtac ctgtcaaaat tgactatccc 720
aacaatatgg gaatatacat cgagcctaat atatggttat actatgacct agattaa 777
<210> 65
<211> 777
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 65
atgaccatcc agattgtgca gcataacctg gaatatagct ttgtgacccc gaaagaaacc 60
agcgattttg ttgaacgtac catgagcgtt tttgatcagg catatccgaa atttctgatc 120
catgatgttt gggcagatcc ggcaagcctg gccctgtttg aaatttatcc ggaatttcag 180
tttggtctgg tggaagcaac cacccagctg atgattgcac agggtaattg tattccgctg 240
acctatgaaa gccgttttga tgaactgccg gatgaaggtt gtgattgggc actggcaaaa 300
tggctggaag atcgcgaaca gaatcgtctg ccgaatgccc tgtgtgttgt gagcattagc 360
atcctgccgg aatatcaggg taaaaatctg agccagtatc tgatcggcta tatgaaagaa 420
ctggcacagt atcatggtct gaatagcctg attatggcag cacgtccgag cctgaaatat 480
ctgtatccgc tgattccgat tgaacgctat attacctggc gtgataaaaa cggcctgatt 540
tttgatccgt ggctgcgtgt taatgttaaa catggcgcaa aaattgccgg tatctgcttt 600
aaaagcacca ccattaatga taccattgat ggttgggagg atcgtgttgg tatgcgtttt 660
ccggaaaccg gtgattatat cattccgaaa ggtctggttc cggtgaaaat tgattatccg 720
aataacatgg gcatctacat cgaaccgaat atctggctgt attatgatct ggactga 777
<210> 66
<211> 258
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 66
Met Val Ile Lys Asn Leu Cys Pro Asp Gly Val Thr Pro Ile Trp Asn
1 5 10 15
Lys Ser Gln Met Glu Ser Ser Leu Leu Glu Glu Cys Leu Pro Ala Trp
20 25 30
Val Arg Thr Ser Tyr Ser Thr Phe Val Glu Thr Ile Ser Asp Ser Ala
35 40 45
Phe Pro Cys Phe Trp Gly Thr Ile Gly Glu Gln Lys Gly Met Ile Arg
50 55 60
Tyr Leu Ile Val Ser Ser Leu Thr Asp Pro Ile Leu Val Glu His Thr
65 70 75 80
Leu Glu Gly Ile Tyr Lys Tyr Ile Asp Glu Val Asn Glu Asn Glu Leu
85 90 95
Leu Gln His Glu Asn Ala Asp Leu Leu Thr Leu Val Ile Phe Phe Pro
100 105 110
Pro Glu Pro Thr Val Leu Thr Val Glu Glu Tyr Ala Gly Gln Ala Phe
115 120 125
Asp Phe Leu Asn Ala Leu His Ser Leu Asp Ala Val Ser Cys Pro Cys
130 135 140
His Trp Ser Ala Asp Pro Gln Ser Ala Asn Trp Ser Tyr Ser Leu Gly
145 150 155 160
Gly Cys Ala Leu Phe Val Ser Val Ser Thr Pro Ala Asn Gln Lys Arg
165 170 175
Arg Ser Arg His Leu Gly Ser Gly Met Thr Phe Val Ile Thr Pro Val
180 185 190
Glu Val Leu Leu Asn Lys His Gly Gly Glu Asn Ser Ser Ile Phe Arg
195 200 205
Arg Val Arg Gln Tyr Asp Gly Ile Pro Pro His Pro Asn Leu Leu Ile
210 215 220
Met Pro Gly Asn Gly Lys Val Gly Asn Glu Leu Thr Val Gln Val Leu
225 230 235 240
Pro Asp Asn Asn Asp Ser Glu Ile Ser Phe Asp Phe Gln Tyr Lys Phe
245 250 255
Lys Asp
<210> 67
<211> 777
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 67
atggtaatca agaatttatg tcctgacgga gttacaccaa tctggaacaa aagccagatg 60
gaatcctctc ttctagagga gtgccttcct gcttgggtac gcactagcta ctcaacattt 120
gttgaaacaa tcagcgattc tgccttccct tgcttctggg gaactatcgg ggaacagaag 180
ggaatgatta gatacctgat agtctcatct ttaactgacc cgatcttggt tgagcatacg 240
cttgagggta tctacaaata cattgatgaa gttaatgaaa acgaattgct tcagcacgaa 300
aatgcggatc ttctgacact tgtcatcttt ttcccacctg aaccaacagt tcttacagta 360
gaggaatatg caggtcaagc atttgatttt ttgaatgcgt tacatagcct tgatgcggtg 420
tcttgtccct gccattggtc tgccgatccg cagtctgcta actggtctta ttctctagga 480
gggtgtgcct tatttgttag tgtttccact ccagcaaatc aaaagcggcg atcgcgccac 540
cttgggtcag gaatgacttt tgtcatcaca ccagttgaag tcctcttgaa taaacatggt 600
ggcgagaatt cgagcatttt tcgccgcgtc cgagagtacg acggcattcc acctcaccct 660
aacttattaa ttatgcctgg gaatgggaaa gtcggtaatg aattgacagt gcaagtactt 720
ccagataata acgatagtga gatctcattt gacttccagt ataaatttaa ggattag 777
<210> 68
<211> 777
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 68
atggtgatta aaaacctgtg tccggatggt gttaccccga tttggaataa aagccagatg 60
gaaagcagcc tgctggaaga atgtctgcct gcatgggttc gtaccagcta tagcaccttt 120
gttgaaacca ttagcgatag cgcatttccg tgtttttggg gcaccattgg tgaacagaaa 180
ggtatgattc gttatctgat tgttagcagc ctgaccgatc cgattctggt tgaacatacc 240
ctggaaggta tctacaaata tatcgatgaa gtgaacgaaa acgaactgct gcagcatgaa 300
aatgcagatc tgctgaccct ggttatcttt tttccgcctg aaccgaccgt tctgaccgtt 360
gaagaatatg caggtcaggc atttgatttt ctgaatgcac tgcatagcct ggatgcagtt 420
agctgtccgt gtcattggag cgcagatccg cagagcgcaa attggagcta tagcctgggt 480
ggttgtgcac tgtttgttag cgttagcaca ccggcaaatc agaaacgtcg tagccgtcat 540
ctgggtagcg gtatgacctt tgttattaca ccggttgaag tgctgctgaa taaacatggt 600
ggtgaaaaca gcagcatttt tcgtcgtgtt cgtgaatatg atggtattcc gcctcatccg 660
aatctgctga ttatgcctgg taatggtaaa gtgggtaatg aactgaccgt gcaggttctg 720
ccggataata atgatagcga aatcagcttc gattttcagt ataaattcaa agattga 777
<210> 69
<211> 408
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 69
Met Lys Arg Leu Thr Leu Leu Ile Ile Ala Gly Ile Leu Ser Val Ser
1 5 10 15
Thr Phe Leu Cys Ile Thr Pro Val Ala Leu Ala Asn Ile Thr Asp Tyr
20 25 30
Tyr Leu Lys Asn Glu Lys Leu Ser Gly Gln Phe Ser Val Pro Val Asn
35 40 45
Leu Ser Val Gly Val Arg Phe Ala His Arg Ser Ser Tyr Ala Thr Ala
50 55 60
Ile Asn Phe Pro Thr Gly Leu Asp Ala Asp Ser Val Ala Val Gly Asp
65 70 75 80
Phe Asn Ser Asp Ser Lys Leu Asp Leu Ala Val Thr Asn Trp Phe Asp
85 90 95
Asn Asn Val Ser Val Leu Leu Gly Asn Gly Asn Gly Ser Phe Gly Ala
100 105 110
Ala Thr Asn Phe Pro Val Gly Thr Asn Pro Val Phe Val Val Thr Gly
115 120 125
Asp Val Asn Gly Asp Ser Lys Leu Asp Leu Ala Val Ala Asn Phe Ser
130 135 140
Ser Asn Asn Val Ser Val Leu Leu Gly Asn Gly Asn Gly Ser Phe Gly
145 150 155 160
Ala Ala Thr Asn Phe Ser Val Gly Thr Asn Pro Tyr Ser Val Ala Ile
165 170 175
Gly Asp Val Asn Asn Asp Ser Glu Leu Asp Leu Ala Phe Thr Asn Trp
180 185 190
Phe Asp Asn Lys Val Leu Val Leu Leu Gly Asn Gly Asn Gly Ser Phe
195 200 205
Gly Ala Ala Ser Ser Phe Pro Val Asp Thr Tyr Ser Ile Ser Val Ala
210 215 220
Ile Ala Asp Phe Asn Ser Asp Ser Lys Leu Asp Leu Ala Ile Thr Asn
225 230 235 240
Trp Val Ser Asn Asn Val Ser Val Leu Leu Gly Asn Gly Asn Gly Ser
245 250 255
Phe Gly Ala Ala Thr Asn Phe Pro Val Gly Thr Asn Pro Ile Phe Val
260 265 270
Ala Thr Gly Asp Val Asn Gly Asp Ser Lys Leu Asp Leu Ala Val Ala
275 280 285
Asn Thr Ser Ser Asn Asn Val Ser Val Leu Leu Gly Asn Gly Asn Gly
290 295 300
Ser Phe Gly Ala Ala Thr Asn Phe Pro Ala Gly Thr Asn Pro Tyr Ser
305 310 315 320
Val Ala Ile Arg Asp Val Asn Gly Asp Ser Lys Leu Asp Leu Ala Val
325 330 335
Thr Asn Tyr Ser Ser Asn Asn Val Ser Val Leu Pro Gly Asn Gly Asn
340 345 350
Gly Ser Phe Gly Ile Ala Thr Asn Phe Pro Val Gly Thr Asn Pro Glu
355 360 365
Ser Ile Ala Ile Ala Asp Phe Asn Gly Asp Ser Lys Leu Asp Leu Ala
370 375 380
Val Thr Asn Ser Gly Asn Asn Asn Val Ser Ile Leu Leu Asn Asn Phe
385 390 395 400
Gln Gly Leu Pro Lys Asn Lys Ile
405
<210> 70
<211> 1227
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 70
gtgaaaaggc tcactttact aattatagcg gggatattat ctgttagtac atttttatgt 60
ataactcctg ttgcattagc aaatataact gactattatc tgaagaatga aaagctttct 120
gggcaattta gtgttccggt taatttgtcc gtaggagtga gatttgccca caggagtagt 180
tatgctactg ctattaactt cccaactggt cttgatgctg actctgtagc agttggggat 240
ttcaatagcg atagtaagct cgacctggct gttacaaatt ggttcgacaa taacgtctcg 300
gtcttactgg gaaatggtaa tgggtctttt ggcgcagcca ctaactttcc agtcggtact 360
aatcccgtct ttgtagtgac tggggatgta aatggcgaca gcaagcttga cctggctgtt 420
gcaaatttta gtagcaataa cgtctcggtc ttactaggaa atggtaatgg gtcttttggc 480
gcagccacta acttttcagt tggtactaac ccttattctg tagccattgg agatgtgaat 540
aacgatagtg agcttgacct tgcttttaca aattggttcg acaataaggt cttggtttta 600
ctgggaaatg gtaatgggtc ttttggcgca gccagcagct tccctgtcga tacttattcg 660
atttccgtag cgattgcgga ttttaatagc gacagtaagc tcgaccttgc tattacaaat 720
tgggtcagca ataacgtctc ggtcttactg ggaaatggta atgggtcttt tggcgcagcc 780
actaactttc cagtcggtac taatcccata tttgtagcaa ctggggatgt aaatggcgac 840
agcaagcttg acctggctgt tgcaaatact agcagcaata acgtctcggt cttactggga 900
aatggtaatg ggtcttttgg cgcagccact aactttccag ccggtactaa tccctactct 960
gtagcgatta gagatgtgaa tggcgacagt aaacttgacc tggctgttac aaattatagt 1020
agcaataacg tctcggtctt accaggaaat ggtaatgggt cttttggcat agctactaac 1080
tttccagtcg gtactaatcc tgaatctata gcaattgcgg atttcaacgg cgacagcaag 1140
cttgacctgg ctgtcacaaa ttctggcaac aacaacgtct cgatcttgtt gaataatttt 1200
cagggacttc caaaaaataa gatatag 1227
<210> 71
<211> 1227
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 71
atgaaacgtc tgacgctgct gatcattgca ggtattctgt cagttagcac ctttctgtgt 60
attacaccgg ttgcactggc caatattacc gattattatc tgaaaaacga gaaactgagc 120
ggtcagttta gcgttccggt gaatctgtct gttggtgttc gttttgcaca tcgtagcagc 180
tatgcaaccg caattaactt tccgaccggt ctggatgcag atagcgttgc agttggtgat 240
tttaacagcg atagcaaact ggatctggcc gttaccaatt ggtttgataa caatgttagc 300
gtgctgctgg gtaatggcaa tggcagcttt ggtgcagcaa ccaattttcc ggttggcacc 360
aatccggttt ttgttgttac cggtgatgtt aatggtgaca gtaaactgga tttagccgtg 420
gcaaatttta gcagcaataa tgtttcagtt ctgctgggaa acggtaatgg ttcttttggc 480
gcagccacaa actttagcgt tggtacaaat ccgtatagcg tggccattgg tgatgtgaat 540
aatgatagtg aactggacct ggcatttacg aactggttcg ataataaagt tctggtgctg 600
ttaggcaatg gtaatggctc gtttggtgcc gcaagctcat ttccggtgga tacctatagc 660
attagcgttg cgattgcaga tttcaactca gattctaaat tagacctggc gatcaccaat 720
tgggtgtcaa ataatgtgag tgtgttactg gggaatggta acggtagttt tggagctgcg 780
acaaattttc ctgtgggtac aaacccgatt tttgtggcaa ccggtgacgt gaatggcgat 840
tctaagctgg acttagcagt tgcaaatacc agctctaata acgttagcgt tctgttaggt 900
aacgggaacg gctcattcgg tgctgccacg aattttccag caggcaccaa cccgtatagt 960
gttgcaattc gcgacgttaa cggtgatagc aaattagatt tagcggtgac caactatagc 1020
agcaacaacg tgagtgttct gccaggcaac ggtaacggat catttggtat tgcgaccaac 1080
tttccagtag gtacgaatcc ggaaagcatt gcaattgccg attttaatgg ggattccaag 1140
ttagatctgg cagtgacaaa tagcggtaac aataatgtaa gcatactgct gaataacttt 1200
cagggtctgc cgaaaaacaa gatttga 1227
<210> 72
<211> 200
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 72
Met Lys Ser Thr Asn Ile His Tyr Thr Lys His Leu Ile Ser Pro Tyr
1 5 10 15
Asp Arg Tyr Leu Lys Asn Gly His Lys Ser Gly Ile Leu Trp Phe Thr
20 25 30
Gly Leu Ser Gly Ala Gly Lys Thr Thr Leu Ala Leu Lys Leu Glu Gln
35 40 45
Thr Leu Phe Glu Lys Gly Trp Ser Thr Phe Val Leu Asp Gly Asp Ser
50 55 60
Val Arg His Gly Leu Cys Ser Asp Leu Gly Phe Ser Ala Ser Asp Arg
65 70 75 80
Ser Glu Asn Ile Arg Arg Leu Gly Glu Val Ala Lys Leu Phe Ala Glu
85 90 95
Ser Gly Cys Leu Val Ile Thr Ala Phe Ile Ser Pro Tyr Arg Asn Asp
100 105 110
Arg Glu Gln Val Arg Arg Leu Ala Gly Asp Leu Phe His Glu Val Tyr
115 120 125
Ile Ala Thr Pro Leu Glu Leu Cys Glu Gln Arg Asp Pro Lys Gly Leu
130 135 140
Tyr Leu Lys Ala Arg Ser Gly Glu Ile Asp Gly Phe Thr Gly Ile Ser
145 150 155 160
Ala Pro Tyr Glu Pro Pro Asn Ser Pro Asp Leu Trp Val Glu Thr Ser
165 170 175
Glu Leu Thr Val Glu Glu Ser Leu Glu Gln Leu Leu Lys Tyr Val Glu
180 185 190
Asn Lys Phe Thr Ile Phe Lys Gln
195 200
<210> 73
<211> 603
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 73
atgaaatcaa ctaatattca ctatacaaaa catcttatat ctccatatga tcgttatcta 60
aagaatggtc ataaaagcgg gattctatgg tttactggac tgtccggggc tggtaaaaca 120
acattggctt taaaattaga gcagactttg ttcgagaaag gatggtctac ctttgtttta 180
gatggtgata gtgttcgtca tggactgtgt tccgatttag gattttctgc tagtgatcgc 240
tcagaaaata tccgtcgttt gggtgaggtt gccaaactct ttgcggagtc aggatgccta 300
gtgatcactg ccttcatctc accctacagg aatgaccgag aacaggtgcg tagactagct 360
ggagatctat ttcatgaagt atacattgca actccactgg aactttgtga gcagcgtgat 420
ccgaaaggtc tttatctaaa agcacgcagt ggggaaatag atggatttac gggaatcagc 480
gccccttatg aaccacccaa tagcccagat ttatgggtgg aaacatccga actcaccgtc 540
gaggaaagcc tagaacaact actcaaatac gtggaaaaca aattcacaat tttcaaacaa 600
tag 603
<210> 74
<211> 221
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 74
Met Lys Ala Val Val Lys Tyr Thr Ile Phe Glu Lys Pro Gln Pro Ile
1 5 10 15
Arg Ala Ile Lys Arg Leu Glu Arg Asp Val Leu Arg Met Gly Ala Leu
20 25 30
Val Glu Gln Ser Phe Arg Leu Ser His Gln Ala Leu Phe Asn Arg Asp
35 40 45
Leu Thr Ala Ala Glu Gln Ile Arg Arg Leu Asp Lys Lys Ile Asp Arg
50 55 60
Phe Tyr Arg Gln Ile Glu Val Asp Cys Ala Thr Ile Met Ser Ser Gln
65 70 75 80
Ala Pro Thr Asp Gln Glu Ser Arg Cys Leu Ser Ser Phe Met Gln Leu
85 90 95
Val Arg Asp Leu Glu Arg Ile Gly Asp Tyr Ala Lys Asp Leu Ala Glu
100 105 110
Ile Ala Met Lys Ile Phe Pro Tyr Pro Pro His Pro Thr Leu Gly Glu
115 120 125
Val Ala Ile Met Ser Asp His Ala Gln Ser Met Leu Ala Thr Ser Leu
130 135 140
Val Ala Leu Ala Asp Leu Asp Glu Ile Ser Gly Arg Arg Ile Lys Leu
145 150 155 160
Leu Asp Asp Thr Val Asp Asp Ala Tyr Lys Lys Leu Tyr Arg Asn Leu
165 170 175
Ala Gln Gln Lys Asp Val Pro Gly Val Val Glu Pro Ile Leu Leu Leu
180 185 190
Thr Leu Ala Ile Gln Cys Leu Glu Arg Met Ala Asp His Ala Thr Asn
195 200 205
Ile Gly Gln Arg Val Ala Tyr Ile Val Thr Gly Gln Arg
210 215 220
<210> 75
<211> 666
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 75
atgaaagctg ttgtgaaata tacaattttt gaaaaacctc aacctatacg tgccattaaa 60
agactggaac gagatgtttt gcgtatgggt gctttagtag agcagtcatt ccgtctgagt 120
caccaagctc tattcaatcg ggatttaaca gcagctgagc aaatacggag attagacaaa 180
aaaattgatc gcttctacag acaaatagaa gtcgattgtg ccacaattat gagcagtcaa 240
gctcccacag accaagaatc tcggtgttta agctcattca tgcaattagt tagagacttg 300
gaacgtattg gggactatgc caaagatttg gcagaaatag caatgaaaat atttccctat 360
cccccccatc ctactttggg ggaggttgcc attatgtccg atcatgccca atctatgttg 420
gctaccagcc tagtagcttt agcggattta gacgagatta gtggtagaag gattaaatta 480
ttagatgata cagtagatga tgcttacaaa aagttatatc gtaatttggc gcagcagaaa 540
gatgttcccg gggtagtgga gcccatttta ctattaacat tagcaattca gtgtttagag 600
agaatggcag atcatgctac taatattggt caaagggtag catacattgt tacagggcaa 660
agatag 666
<210> 76
<211> 450
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 76
Met Phe Leu Leu Gly Phe Leu Leu Gly Leu Ala Val Gly Phe Gly Phe
1 5 10 15
Trp Leu Trp Gln Gln Phe Gln Leu Asn Ser His Leu Glu Gln Leu Thr
20 25 30
Gln Pro Leu Asn Pro His Ala Glu Lys Ile Leu Leu Pro Leu Leu Ala
35 40 45
Gly Leu His Arg Lys Ile Ser Thr Val Arg Asp Glu Gln Gln Asn Leu
50 55 60
Arg Leu Ser Leu Lys Ala Tyr Glu Gln Leu Leu Asp Ala Ala Pro Leu
65 70 75 80
Gly Tyr Leu Gln Val Asp Glu Glu Asn Gln Leu Leu Trp Cys Asn Gln
85 90 95
Cys Ala Arg Glu Met Leu Tyr Leu Gln Arg Trp Gln Pro Gly Gln Val
100 105 110
Arg Leu Leu Leu Glu Leu Val Arg Ser Tyr Glu Leu Asp Gln Leu Ile
115 120 125
Glu Gln Thr Arg Asp Trp Gln Lys Pro Gln Met Gln Glu Trp Ile Phe
130 135 140
His Pro Ser Arg Asp His Gly Gln Gly Ile Leu Gly Leu Lys Pro Leu
145 150 155 160
Ser Leu Ala Ala Asn Ser Phe Pro Leu Pro Gly Gly Gln Val Gly Val
165 170 175
Phe Leu Glu Ser His Gln Gln Phe Val Asp Ile His Gln Gln Arg Asp
180 185 190
Arg Ser Phe Ser Asp Leu Ala His Glu Leu Arg Thr Pro Leu Thr Ser
195 200 205
Ile Arg Leu Val Ala Glu Thr Leu Gln Thr Arg Leu Asp Pro Pro Leu
210 215 220
Asn Arg Trp Val Ile Arg Leu Met Gln Glu Val Asp Arg Leu Ile Asn
225 230 235 240
Leu Val Gln Asn Trp Leu Asp Leu Thr Gln Met Glu Ile Thr Ser Ser
245 250 255
Ile Gln Leu Asn Leu Glu Met Leu Glu Val Arg Ser Leu Ile Phe Ser
260 265 270
Val Trp Glu Asn Leu Glu Pro Leu Ala Ala Asn Gln His Leu Ser Ile
275 280 285
Ser Tyr Ser Gly Pro Glu Lys Val Tyr Ile Cys Ala Asp Lys Ser Arg
290 295 300
Ile Tyr Gln Val Phe Leu Asn Leu Leu Asp Asn Cys Ile Lys Tyr Ser
305 310 315 320
Asn Leu Asn Gly Thr Ile Phe Ile Glu Met Asn Pro Val Cys Gly Glu
325 330 335
Lys Ser Ile Asn Gly Val Asp Pro Glu Ala Asp Thr Ile Leu Asn Gln
340 345 350
Val Ser Asn Gln Ile Leu Glu Ile Asn Ile Ile Asp Ser Gly Val Gly
355 360 365
Phe Ala Pro Met Asp Leu Pro His Val Phe Gln Arg Phe Tyr Arg Gly
370 375 380
Asp Lys Ala Arg His Arg Glu Ser Arg Ser Glu Asn Glu Thr Val Glu
385 390 395 400
Ile Thr Gly Ser Gly Leu Gly Leu Ser Ile Val Arg Gln Ile Ile Ile
405 410 415
Ala His Gly Gly Lys Ile Arg Ala Met Asn His Pro Asp Thr Gly Gly
420 425 430
Ala Trp Ile Gln Ile His Leu Pro Gln Val Val Gln His Asp Gly Gly
435 440 445
Tyr Phe
450
<210> 77
<211> 1353
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 77
atgttcttat tgggatttct tctgggtttg gcagtcggtt ttggtttttg gctttggcaa 60
caatttcaac ttaacagtca tttggagcag ttaacccaac ccttaaaccc tcacgctgaa 120
aagatattat tacccctatt agctggatta catcgtaaaa tatctaccgt tagagatgag 180
caacaaaact tacgcttgtc actcaaagct tatgaacagt tgctggatgc tgcgcctttg 240
ggatatttac aagtagatga agaaaaccaa ctactatggt gtaatcagtg cgcgcgggaa 300
atgctgtatt tacaaagatg gcaaccgggt caagtgcgcc tgctactgga attagtgaga 360
tcctatgagc tggatcagtt aattgagcaa acccgggatt ggcaaaaacc gcaaatgcaa 420
gagtggattt ttcacccttc ccgagatcat ggtcagggta ttttaggatt aaagccattg 480
tctttagcag ctaacagttt tcccctaccg gggggacaag tgggtgtgtt tctagaaagt 540
caccaacaat ttgtagacat tcatcagcaa cgtgaccgct ctttttcaga cctggcccat 600
gaactgagaa cacctctgac ttccattcgt ctggtcgcag aaaccctgca aactcgctta 660
gatccccctc taaaccgttg ggtcatccgc ttgatgcagg aggttgacag actaattaat 720
ttagtccaaa attggttaga cctgacccag atggaaataa cctcctccat acaactgaat 780
ttggaaatgc tagaagtccg ctccctaatt ttttcagtct gggagaattt agagccccta 840
gccgctaatc agcatcttag tatttcttac tccggcccgg aaaaggtcta tatatgtgct 900
gataagtcca gaatttatca agtgtttctt aatctgttag ataactgtat taaatacagc 960
aacctgaacg gtactatttt cattgaaatg aatccagttt gtggggagaa gtctattaat 1020
ggggttgatc cagaagcaga tacaatatta aaccaagtat caaatcagat tttagaaatt 1080
aacattattg attccggggt tggatttgct cccatggatc taccccatgt ctttcaaaga 1140
ttttatcggg gggacaaagc tagacaccgc gagtcccgct ctgagaatga aacagtagaa 1200
attactggta gtggtttagg gttatccatt gtccgccaaa taattatagc tcatggtggc 1260
aaaatcaggg ccatgaacca tcctgatacc ggtggtgctt ggatacaaat tcatcttccc 1320
caggtggttc aacatgatgg cggatatttc tga 1353
<210> 78
<211> 240
<212> PRT
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 78
Val Asn Gln Ser Ile Val Trp Gln Arg Ala Pro Glu Asn Phe Gln Leu
1 5 10 15
Cys Ala Gln Glu Val His Ile Trp Lys Ile Asn Leu Lys Val Ser Pro
20 25 30
Ser Glu Val Glu Leu Cys Arg Arg Ile Leu Ser Gly Asp Glu Ile Ala
35 40 45
Arg Ala Glu Arg Phe Ser Phe Pro Glu His Gln Glu Arg Phe Ile Val
50 55 60
Gly Arg Ala Phe Leu Arg Lys Ile Leu Ser Arg Tyr Leu Asn Val Glu
65 70 75 80
Ala Gln Ala Ile Glu Phe Glu Tyr Glu Glu Arg Gly Lys Pro Leu Leu
85 90 95
Gly Phe Lys Phe Lys Tyr Ser Gly Ile Cys Phe Asn Leu Ser His Ser
100 105 110
Gln Glu Leu Ala Leu Cys Gly Val Thr His Gln Arg Ser Ile Gly Val
115 120 125
Asp Leu Glu Gly Val Arg His Thr Ser Asp Ile Glu Asn Leu Ala Asn
130 135 140
Arg Phe Phe Ser Val Lys Glu Tyr Gly Val Ile Lys Ser Val Pro Pro
145 150 155 160
Glu Gln Gln Gln Gln Val Phe Phe Arg Tyr Trp Thr Cys Lys Glu Ala
165 170 175
Tyr Leu Lys Ala Ile Gly Lys Gly Leu Ser Glu Leu Ser Gln Ile Glu
180 185 190
Ile Glu Leu Thr Pro Asn Lys Ser Ala Arg Leu Arg Val Leu Gly Asp
195 200 205
Trp Gln Leu Lys Glu Leu Val Pro Ala Asp Asn Phe Ala Ala Ala Val
210 215 220
Val Ile Ala Ser His Asn His Leu Asp Arg Phe Glu Phe Trp Glu Pro
225 230 235 240
<210> 79
<211> 723
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 79
gtgaatcagt ctattgtttg gcaacgggca cctgaaaatt tccagttgtg cgctcaggaa 60
gtacatatct ggaagattaa cctgaaagta tcaccatcag aggtggaact ttgtcgcagg 120
attttatctg gtgatgaaat agctcgtgcg gaaagatttt cttttccgga acatcaagag 180
cgttttattg ttggtcgtgc ctttcttaga aaaatactat caagatattt aaacgtagaa 240
gcacaagcaa tagagtttga gtatgaagag agaggaaaac cactgttagg gttcaagttt 300
aagtactctg gaatatgttt taatttatcc cattctcagg aattagcttt atgcggtgtg 360
actcatcaaa gatccattgg agtagatcta gaaggtgttc gtcacacatc agatatagaa 420
aacctagcca accgcttttt ttcagttaaa gaatatgggg taattaaatc agtacccccg 480
gaacaacaac agcaggtatt tttccgttat tggacttgta aagaggccta tttaaaagct 540
attggaaaag gtttgtctga gttatctcaa atagaaatag aattaacgcc aaataaatct 600
gctaggttgc gtgtattggg agattggcag ttaaaagaac tagtaccagc agataatttt 660
gcagcagcag ttgttatagc tagccataat catttagaca ggtttgagtt ttgggaacct 720
taa 723
<210> 80
<211> 723
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 80
atgaatcaat caatcgtgtg gcagcgtgcg ccggaaaact tccaactgtg tgctcaagaa 60
gtgcatatct ggaaaatcaa cctgaaagtg agcccgtctg aagtggaact gtgccgtcgc 120
attctgagtg gcgatgaaat cgcgcgtgcc gaacgctttt ccttcccgga acatcaggaa 180
cgttttattg tgggtcgtgc attcctgcgc aaaatcctga gccgctatct gaacgttgaa 240
gcacaggcta ttgaatttga atacgaagaa cgtggcaaac cgctgctggg tttcaaattc 300
aaatactctg gcatctgctt caatctgagt cattcccagg aactggcgct gtgtggtgtt 360
acccaccaac gttcaattgg cgtcgatctg gaaggtgtgc gccacacgtc ggacatcgaa 420
aacctggcca atcgtttctt tagcgtcaaa gaatacggcg tgattaaaag cgtgccgccg 480
gaacagcaac agcaagtgtt tttccgctat tggacctgta aagaagcgta cctgaaagcc 540
atcggcaaag gtctgtcaga actgtcgcag attgaaatcg aactgacgcc gaacaaatca 600
gcgcgtctgc gcgttctggg tgattggcaa ctgaaagaac tggtcccggc agacaatttt 660
gctgcagcag ttgtcattgc gagtcataat catctggacc gttttgaatt ttgggaaccg 720
tga 723
<210> 81
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 81
gggctttcat atgttacaaa agattaa 27
<210> 82
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 82
aaagtatgcg gccgcatgct tgagtat 27
<210> 83
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 83
ggcatccatg ggcaagattt acggaa 26
<210> 84
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 84
ggcatctcga gttataaaag cgcttcg 27
<210> 85
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 85
ggttaagatc tgaaattaat acgactc 27
<210> 86
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 86
ttttaagatc ttttcagcaa aaaaccc 27
<210> 87
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 87
atatccatgg gacctggtga tcgcaaagga 30
<210> 88
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 88
tatctcgaga gtgttgattt cgttggctg 29
<210> 89
<211> 675
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 89
atgaagattt acggaattta tatggaccgc ccgctttcac aggaagaaaa tgaacggttc 60
atgactttca tatcacctga aaaacgggag aaatgccgga gattttatca taaagaagat 120
gctcaccgca ccctgctggg agatgtgctc gttcgctcag tcataagcag gcagtatcag 180
ttggacaaat ccgatatccg ctttagcacg caggaatacg ggaagccgtg catccctgat 240
cttcccgacg ctcatttcaa catttctcac tccggccgct gggtcattgg tgcgtttgat 300
tcacagccga tcggcataga tatcgaaaaa acgaaaccga tcagccttga gatcgccaag 360
cgcttctttt caaaaacaga gtacagcgac cttttagcaa aagacaagga cgagcagaca 420
gactattttt atcatctatg gtcaatgaaa gaaagcttta tcaaacagga aggcaaaggc 480
ttatcgcttc cgcttgattc cttttcagtg cgcctgcatc aggacggaca agtatccatt 540
gagcttccgg acagccattc cccatgctat atcaaaacgt atgaggtcga tcccggctac 600
aaaatggctg tatgcgccgc acaccctgat ttccccgagg atatcacaat ggtctcgtac 660
gaagagcttt tataa 675
<210> 90
<211> 224
<212> PRT
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 90
Met Lys Ile Tyr Gly Ile Tyr Met Asp Arg Pro Leu Ser Gln Glu Glu
1 5 10 15
Asn Glu Arg Phe Met Thr Phe Ile Ser Pro Glu Lys Arg Glu Lys Cys
20 25 30
Arg Arg Phe Tyr His Lys Glu Asp Ala His Arg Thr Leu Leu Gly Asp
35 40 45
Val Leu Val Arg Ser Val Ile Ser Arg Gln Tyr Gln Leu Asp Lys Ser
50 55 60
Asp Ile Arg Phe Ser Thr Gln Glu Tyr Gly Lys Pro Cys Ile Pro Asp
65 70 75 80
Leu Pro Asp Ala His Phe Asn Ile Ser His Ser Gly Arg Trp Val Ile
85 90 95
Gly Ala Phe Asp Ser Gln Pro Ile Gly Ile Asp Ile Glu Lys Thr Lys
100 105 110
Pro Ile Ser Leu Glu Ile Ala Lys Arg Phe Phe Ser Lys Thr Glu Tyr
115 120 125
Ser Asp Leu Leu Ala Lys Asp Lys Asp Glu Gln Thr Asp Tyr Phe Tyr
130 135 140
His Leu Trp Ser Met Lys Glu Ser Phe Ile Lys Gln Glu Gly Lys Gly
145 150 155 160
Leu Ser Leu Pro Leu Asp Ser Phe Ser Val Arg Leu His Gln Asp Gly
165 170 175
Gln Val Ser Ile Glu Leu Pro Asp Ser His Ser Pro Cys Tyr Ile Lys
180 185 190
Thr Tyr Glu Val Asp Pro Gly Tyr Lys Met Ala Val Cys Ala Ala His
195 200 205
Pro Asp Phe Pro Glu Asp Ile Thr Met Val Ser Tyr Glu Glu Leu Leu
210 215 220
<210> 91
<211> 7035
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 整合到大肠杆菌乳糖操纵子后的sxt1片段的序列
<400> 91
gtttcatctg tggtgcaacg ggcgctgggt cggttacggc caggacagtc agtggagatg 60
cccaagggca cttcgggtcg aggaacccga cctgcattgg gacgcggcca cggagagcgc 120
gggcaaacgc cggcactata gccagtggag tttgtaaaac gctatttcag agcttggaga 180
gtgtctaaga aagccgggcg atgccaaccc atcccttctt cggctacgtt cgtaatcaag 240
ccacttcctt tttgcattga cgcagggtgt cggaaggcaa ctcgccgaac gcgctcctat 300
agttttcagc gaagcgtccc aaatgtaaga agccgtagtc tagggctatc tcagttatac 360
tacgcacatt ggcactggga tcgttcaagc aggcgcggat gctttcgagc ttgcggttgc 420
ggatgtagtt cttcggcgtg gtgccggcat gcttctcgaa caaattgtag agcgagcgtg 480
gactcatcat cgccagctcc gctaaccgct caaggctgat attccgtttg agattctcct 540
caatgaattg aacgactcgc tcgaaagacg ggttaccttt gctgaaaatt tcacggctga 600
cattgctgcc cagcatttcg agcagcttgg aagcgatgat ccccgcatag tgctcttgga 660
cccgaggcat cgactttgta tgttccgctt cgtcacaaac taacccgagt agattgataa 720
agccatcgag ttgctggaga ttgtgtcgcg cggcgaaacg gataccctcc ctcggcttgt 780
gccaattgtt gtcactgcat gcccgatcaa ggaccactga gggcaattta acgataaatt 840
tctcgcaatc ttctgaatag gtcaggtcgg cttggtcatc cggattgagc agcaatagtt 900
cgcccggcgc aaaatagtgc tcctggccat ggccacgcca caggcaatgg cctttgagta 960
ttatttgcag atgataacag gtctctaatc caggcgagat taccctcacg ctaccgccgt 1020
agctgattcg acacaggtcg aggcatccga agattctgtg gtgcagcctg cctgccgggg 1080
gcccgccctt gggcaggcga atagagtgcg taccgacata ctggttaaca taatcggaga 1140
ctgcataggg ctcggcgtgg acgaagatct gacttttctc gttcaataag caaaaatcca 1200
tagttcacgg ttctcttatt ttaatgtggg ctgcttggtg tgatgtagaa aggcgccaag 1260
tcgatgaaaa tgcaggaatt aattcgcaga tcctggcgga tgagagaaga ttttcagcct 1320
gatacagatt aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag 1380
tagcgcggtg gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga 1440
tggtagtgtg gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa 1500
aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc 1560
tgagtaggac aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt 1620
ggcgggcagg acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga 1680
cggatggcct ttttgcgtag atcccagcct tgcaagaagc ggatacagga gtgcaaaaaa 1740
tggctatctc tagaaaggcc taccccttag gctttatgca acagaaacaa taataatgga 1800
gtcatgaaca tgctgcagaa aatcaatcgt tatacccatg gttttgttgc cgttccggtt 1860
attctggcat gtcgtgaaaa aggtgttttt gaactgctgg cagatgaaag tccgctgagc 1920
ctgaatcaga tggttgaaca tctgggtgcc aatagcggtc attttcaggt tgcactgcgt 1980
atgctggaaa gtctgcattg gctgagccgt aataaagaac tgaaatatag cctgaccgca 2040
gaagcagcaa ttcataacaa aattagcgaa gatatcctgc agctgtataa tctgccgatt 2100
cagagctatc tggaaggtaa acagggcaat ctgctgggtc gttggattga acgtagctgt 2160
cagctgtgga atctggataa tccgctgatg gcagattttc tggatggtct gctggttatt 2220
ccgctgctgc tggcactgca taaacataac ctgctggccg attctgaaga taaaccgctg 2280
ctgagcagcc tgagcagtac cgttcaagaa gaactgggta aactgtttct gcatctgggt 2340
tgggcagatc tgacagcagg tcgtctgacc attaccgaac tgggtcgctt tatgggtgaa 2400
cgtgcactga ataccgcaat tgttgcaagc tataccccga tgctgagtcg tattcatgat 2460
gttctgtttg gtaattgcct gagcgttttt cagcgtgatg caagcggtca tgaacgtcat 2520
attgatcgta ccctgaatgt tattggtagc ggttttcagc accagaaata ctttgcagat 2580
ctggaagaaa gcattctgag cgtgtttaat cagctgccgc tggaagaaca gccgaaatac 2640
attaccgata tgggttgtgg tgatggcacc ctgctgaaac gtgtttggga aaccattcag 2700
tttaaaagcg cacgtggtaa agcactggaa cagtatccgc tgcgtctgat tggtgttgat 2760
tataatgaag caagcctgaa agcaaccacc cgtaccctgg caagcctgcc gcatctggtt 2820
ctgcagggtg atattggtaa tccggaacaa atggttcgta gcctggaagc acatggcatt 2880
catgatccgg aaaatattct gcatattcgc agctttctgg atcacgatcg tctgtttatt 2940
ccgcctcaga aacgtaatga actgaaagaa cgtgcccatc tgccgtatca gagtgtttgt 3000
gttgatgatc agggtgaact gattcctccg catgttatgg ttcagagcct ggtggaacac 3060
ctggaacgtt ggagccaggt tgttaataaa catggtctga tgattctgga agtgcattgt 3120
ctggaaccgc gtgttgttta tcagtttctg gataaaagcg aaaacctgca ctttgatgca 3180
tttcagggtt ttagccagca gtatctggtt gaagccgaag tttttctgat gagcgcagca 3240
caggttggtc tgtttccgaa actggaactg agcaaacgtt atccgaaaac ctttccgttt 3300
acccgtatta ccctgaacta tttcgaaaaa cgtccgtaca aaatcagcca tgcatatctg 3360
agcgatctgc ctgcactggt tgacctggaa gttaaatgtt ggcctgagaa tctgcgtgca 3420
agcacccatg aaattcgtcg tcgtctggaa ctgaatccgc agggtaacct ggttctgatt 3480
attgaagatc agattatcgg tgccatttac agccagacca ttacaagcac cgaagccctg 3540
gaaaatgtta aatatgcaca ggttccgacc ctgcatacac cgcagggttc agtgattcag 3600
ctgctggccc tgaacattct gccggaattt caggcacgtg gtctgggcaa tgaactgcgt 3660
gattttatgc tgtattattg caccctgaaa ggtggtattg aaagcgttgt tggtgttacc 3720
cgttgtcgca attatgtgaa ttatagccag atgccgatga tggaatatct gaaactgcat 3780
aatgaacagc gtcaactgct ggatccgatt gttggttttc atgttagcgg tggtgcagaa 3840
attcgtggca ttattgcaaa ttatcgtccg gaagatacag ataatctggg tatgggtatt 3900
ctgatcgaat ataacctgcg tgatagcgca ctgcattcac cgggtgatcg taaaggtccg 3960
tatatcaata gcgcaattgg tagcctggtt ccgaaagcga ccagcgcaac caaagaaaac 4020
aaaaccgttg cggatctggt gaaagaatgt attctgaaag tgatgggtag ccagcgtcag 4080
gcagcatatg caccgcagca gaaactgctg gacatgggtc tggatagcct ggatctgctg 4140
gaactgcaga ccctgctgga agaacgtctg ggtattaatc tgagcggcac cttttttctg 4200
caaaaaaaca ccccgaccgc catcattacc tattttcaga atcaggtcgt gcaagagaaa 4260
cagagtgatc tggcaccgcc tgttgatagc gccaatgaaa tcaatacact ggaaaacgtt 4320
gtgaatcagc agaaaattcc gcaggttaca cgtgttgtta ccgaacagca gggacgtaaa 4380
gttctgattg atggtcattg ggttattgat tttgccagct gtaattatct gggcctggac 4440
ctgcatccga aagttaaaga agcaattcct ccggcactgg ataaatgggg cacccatccg 4500
agctggaccc gtctggttgc aagtccggca atttatgagg aactggaaga ggaactgtca 4560
aaactgctgg gtgtgccgga tgttctggtt tttccggcag ttacactgct gcagattggt 4620
attctgcctc tgctgaccgg taataatggt gtgatttttg gcgatattgc agcccatcgt 4680
tgtatttatg aagcatgttg tctggcccag cataaaggtg cacagtttat tcagtatcgt 4740
cataacgacc tgaatgatct ggccgaaaaa ctggccaaat atccgcctga acaggttaaa 4800
atcattgtga tcgatggtgt gtatagcatg agtgccgatt tcccggacct gcctgcatat 4860
gttcatctgg caaaagaata taacgccctg atctatatgg atgatgcaca tggctttggc 4920
attctgggtg aaaatccgag cagcgatatg ccgtatggtt ataaaggtaa tggcatggtg 4980
aactactttg atctgcgttt tgccgaagat aacatcattt atgttgcagg tctgagcaaa 5040
gcctatagca gctatgcagc atttctgacc tgtggtgatc gtcgtattaa aaccaatttt 5100
cgtaatgcat ggaccgcgat ttttagcggt ccgagtccgg ttgcaagcct ggccagcgca 5160
ctggcaggtc tgcaggttaa tcgtcaagaa ggtgaacagc tgcgcaaaca aatctatcat 5220
ctgacacata aactggttac ccaggctcgt gccattggtt ttgaagttga taattatggt 5280
tatgtgccga ttgtgggtgt tctggtgggt gatgcacagc atatgattga tgtgtgccaa 5340
ctgctgtggg aatatggtat cctgattacc cctgcaattt ttccgattgt gccgctgaat 5400
aaatcagcac tgcgttttag cattaccgca gcaaataccg aagaagaaat tgatcaggcc 5460
atcaaaagtc tgaaagcagt ttgggacctg ctgcaaaaac gtaaagccct gccgtgtaaa 5520
caagaagaaa atatcctgaa acattgagaa ggagatatac atatgaccca tgttgccctg 5580
gaacaggcaa ttgcaaaagt tccgcgtagc attcagagcg aactgcgtac cattctggca 5640
cagcatgcag ttattgatag cagcgttgtg gcaagctgga ttgatcgtct gggcaccaat 5700
attagtaccc tgatgatcca gctgctgccg gttgcagcaa cctatgcacg tgttccgatt 5760
agccagtttt atgttggtgc cattgcactg ggcaaaccgc agagtaaaaa tcagctgggt 5820
agcggcaccc tgtattttgg tgcagatatg gaatttgttg gtcaggcact gagctttagc 5880
gttcatgcag aacagagcgc caccattaat gcctggctgc atggcgaaac cggactgcag 5940
gcactggcaa tccatgaagc accgtgtggt tattgtcgcc agtttctgta tgaaatggca 6000
accgtgaatc agaattttgt gctgctggtg aaaagcaatg aaagccagcc ggaacagacc 6060
tataccagca acaaactgcc gcattttctg cctgaaccgt ttggtccagc cgatctgggt 6120
ctgaccggtg gcctgatgca gaccgtgttt cacgatctgg aaacctatag caccgatgat 6180
gttgttctgg cagcactgag tgcagcaaat cagagttatg caccgtatac caaaaacttt 6240
gccggtgttg cactgaaaga tagtcatggt aacattttta caggtcgcta tgccgaaaac 6300
gcagcattta atagcagcat gagcccgatg gaaagcgcac tgacctttat gaatatgaat 6360
cgttattcac agagcctgtt cgatatttgt gatgcagttc tggtagaagt ggaaaccggt 6420
attagtcagc gtccggttac cgaagccttt ctgagtagca ttgcaccgaa agtgaaactg 6480
cgctatgcac cggcaacccc gagcagtaac aaactgtgag aaggagatat acatatgttt 6540
cagaccaaaa gctattatag cgtcgttggc ctggaaaccg aactgattaa aggtaaattc 6600
ttcatgagca acgaactgac caatgaacag gtgtttaaac tggtgtgcat ggaagtgatt 6660
gaaaaaatgg gttttgcaca ctttccgcct attatcctgg tttatgaaat gaccaattcc 6720
ggctttgttg attggtgcga gcagatggtt tttgtggatg ataaaggcaa actggatgag 6780
ggcgaaaaat ttctgctgga ttggatgcgt cgtaatgtgg gtaattttga tctgattcgc 6840
gaactgatgc cggtggcaga acgcctggaa atgaaaatgc gtagctaact cggtaccaaa 6900
ttccagaaaa gaggcctccc gaaagggggg ccttttttcg ttttggtccc gaagttccta 6960
ttctctagaa agtataggaa cttcgaccgc ctgtctattt ctcttacggt tccaacatcc 7020
atataggccg caatt 7035
<210> 92
<211> 12758
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 整合到大肠杆菌木糖操纵子中的sxt3片段版本1的序列
<400> 92
ttgcatttcc ttgagcctta tccgacttgt cagtcggata aggcttttta ctttgtctca 60
ggcagttgag ctacgagcct gaagcgttgt tggtgcgttt tatcatgcct ggcgggtagg 120
tcggataagg cgttcacgcc gcatccgaca accacgcagc gttacctgat gtgacgccga 180
caattctcat catcgctaca acatgacctc gctatttaca tcgcgatact cttttggcgt 240
cgtgtcatat gcttttttaa aaacagagta gaaatattgc agcgatggat aaccgcacat 300
ttgcgatatc tcattgatcg acaaggtggt tgaaatcagc agactgcgcg ctttctccag 360
cttctcggca tgaatcatgg catggatggt ttcacccacc tcttctttaa aacgcttctc 420
aagattggag cgcgagatcc cgaccgcatc cagtacctga tccactttaa tccctttaca 480
ggcgtgatta cgaatgtaat gcatggcctg aataacggcg ggatcggtca gcgagcgata 540
atctgttgag cgccgttcaa tgacgcgaac tggtgggacc aaaattcgct gtagcggcat 600
ttcttcttta tctaataatc gatgcaacag ttttgccgcc tgatagccca tttgccgcgc 660
gccctgagcg accgaagaaa gggcgacacg cgacagatag cgggtcagtt cttcgttatc 720
gatgccaatc acgcataatt tttccggtac gggaatatgt agatgttcac atacttgcag 780
aatatgccgc gctcgggcgt cagtaacggc aataatcccg gtttgcggtg gtagcgtttg 840
tagccagtct gccagccgat tttgcgcgtg ttgccagttc tctggcgcgg tttctaaccc 900
ctgataaacc actccgcgat acttttcttc ggcgacaagc tgacgaaatg catattcgcg 960
ctcagtggcc caacgtttgc cgcttgattc cggaagacca taaaaagcaa agcggttaac 1020
gcctttctct tttaaatgca aaaatgcgct ttcaaccagc gcatagttat cggtggcaat 1080
gtaatgaacg ggtgggtaac tttctgcaag gtgatacgag ccgccaaccc caacaatggg 1140
gacgtcgaca tcagccagcg cttgctcgat ctgtttgtcg tcgaagtcgg caatgacgcc 1200
atctcctaac cagtccttga ttttatcaat gcgggcgcgg aaatcttctt caatgaaaat 1260
atcccattcc gattgtgacg cctgtaaata ttcccctacg ccttctacta cctgccggtc 1320
ataggcttta ttggcattga acagtaatgt gatgcggtga cgtttagtaa acatggttct 1380
tttcctgctg aatcatgcaa aaactcaaaa ccggtaatac gtaaccggct ttgagaaaat 1440
ttttatcaaa atcaagaacg gcgtttggtt gcggagtcca tccatactgc cagcaacaga 1500
atcgcacctt taacgatata ctgccagaag gtcggtacat ccatcatact catgccgtta 1560
tccagtgaag ccatgataaa tgcccccatt actgctccgg caacgcttcc cacaccgcca 1620
gccaggctgg tgccgccaat cacgcatgct gcaattgcgt ccagttcggc gatatttccc 1680
gcagaaggtg aaccagcgcc aagtcgagaa ctaaggatta atccggcgat ggctaccatt 1740
aatccgttaa tcgcgaacac ggcaagtttg gtgcgttcaa cgttaatccc ggagagacgt 1800
gctgcttcca gattgccgcc gatggcataa atgcgtcgtc caaatgccgt ccgcgtttcc 1860
ataaacattc cgccgagtaa cagcaacgtc agcagcagaa caggagtggg aacgccacgg 1920
taatcattca acagccagat tgcgcctaat acgatgatag cggttaaagc ctggcgaccg 1980
actactgcgg tagaggccgg agactgcaaa cccaaagcct gacggcgcat tcttccgcgc 2040
cattgccaac caacaaaagc cattaagcca agcgcgccaa tgatgaagcc agtgctggca 2100
ggtagatagc tttgcccaat ttgtgacatc gcggcgctgg tgggggaaac agtcgtgccg 2160
ttggtgatgc caatgagtat gccgcgaaat gccaacatgc ccgcgagggt gacaataaat 2220
gaagggactt tgcggtacgc gacccaccat ccgttccagg caccgagaag cagtcccaga 2280
accaacgtca caatgatggt aagtggcaaa ggccagccta accagacgtc acaaatcgcc 2340
gcgacgccac ctaatagccc catcattgag ccgacggaaa ggtcgatttc agcagaaatt 2400
atgacgaaca ccattcctac cgcgaggatg ccggtaatcg cggtctggcg taacaggttg 2460
gagacgttac gggcgcttaa gtaggcacca tcggtggtcc aggtaaagaa cagcatgatt 2520
gcgatgatag ctgcaatcat cacgaagacc tgcaaattca gtgatttcag cccggagaag 2580
ctaccggatg tcggtacggc caatttcact tcagacggat tgcttttcga catgatgttc 2640
gctcctcaat gcggcttcca tcacctgctc ctgagtcagg ttatgattta tcaggttggc 2700
ttttagtttc ccttcatgca tcaccagtac acgatcgcta aggccgagca cttcaggtaa 2760
ttcggaagag atgacaataa cggcaatacc ctgctggacg agttggttaa ttaatttgta 2820
gatctcgtat ttcgcgccaa tatcgatacc cctggtgggt tcatcaagaa tgagaatgcg 2880
cgggttaagt aacagacagc gagcgaggat cgctttttgc tgattgccgc cgctcaaacg 2940
tccaatagca aggtcggggg acgacgtttt aactttgagt tgctggattg attccagaat 3000
acatttttgc tctgccgcgt catcaagctg gctaatgcca ccggtaaatt tattgagtcg 3060
gcgagggtaa tatttttacc aaccgccatt accggaacga tgccgtcgcg ctttctgtct 3120
tcgggtacca tcgcaatccc ctgggcgatg gcttgctgac agttacgaat atctacctgt 3180
ttgccatcaa tataaatttt tccttcccat tgtccgggcc acacgccaaa caggcactga 3240
atggtctcgg tacgtccggc accaacgagt ccggcaatac ccagtatttc gccacgtttc 3300
agggaaaacg agacatcatt aactcgttta atatgacgat tgaccggatg ccatgccgtc 3360
agatgttcaa tacgtaatat ttcatctccg gtggtatgtg gttcattagg gtaaagcgcg 3420
gttaactctc gcccgaccat catggtgata atatcgtctt cactcattcc ggcagcatca 3480
cgcgtaccaa tgtgctgtcc gtcgcgaata acgcaaatcg tatcggaaat cgctttgact 3540
tcgttgagtt tgtgcgaaat ataaatacag gcgataccgt gctgttgtag atcgcgaata 3600
atatccagta aaaccgacgt ttcctgctca gttaatgagg ctgtcggttc atcgagaatt 3660
aacaagcgca cctgtttatt aagtgccttg gcaatttcaa ccagttgttg ttgcccaagc 3720
cctaaatcgc caacgcgggt atcaggtgaa atggataaac tgacctgtgc gagcagcttc 3780
tgacagcgta gcgtcatcag gtcataatcc ataatgccat tgtgggttat ttcgttaccc 3840
aggaagatat tttccagcac ggtcaattct ttcaccaggg ccaattcctg atgaatgatg 3900
gcgatacctt tgcgttcggt atcgcggatg tgactcgcct gaatctcttc tcccgcaaaa 3960
ataatttcgc cttcgtagga gccatgggga taaataccac acagcacttt catcagcgtt 4020
gatttaccag acccattttc cccacaaagt gagacgattt cgccagcatt caaccgcaag 4080
cagacgttat caatcgcctt cacactgccg aaggttttgg taatgttctt catttcaagt 4140
agataaggca taacgactcc acctaagcca attcattcac gcggcatgga gagaaatcac 4200
gcccccgctc cgcgccgggc gtaacgctta cagctcgctc tctttgtgga atccgtcttt 4260
aattaccgta tctttgatgt tgtttttatt cacatcgatc ggtgtcagga ggcgggaggg 4320
gacatctttc aggccattat tcagtgaggt ccagccttgc aagaagcgga tacaggagtg 4380
caaaaaatgg ctatctctag aaaggcctac cccttaggct ttatgcaaca gaaacaataa 4440
taatggagtc atgaacatat ggtgattaaa aacctgtgtc cggatggtgt taccccgatt 4500
tggaataaaa gccagatgga aagcagcctg ctggaagaat gtctgcctgc atgggttcgt 4560
accagctata gcacctttgt tgaaaccatt agcgatagcg catttccgtg tttttggggc 4620
accattggtg aacagaaagg tatgattcgt tatctgattg ttagcagcct gaccgatccg 4680
attctggttg aacataccct ggaaggtatc tacaaatata tcgatgaagt gaacgaaaac 4740
gaactgctgc agcatgaaaa tgcagatctg ctgaccctgg ttatcttttt tccgcctgaa 4800
ccgaccgttc tgaccgttga agaatatgca ggtcaggcat ttgattttct gaatgcactg 4860
catagcctgg atgcagttag ctgtccgtgt cattggagcg cagatccgca gagcgcaaat 4920
tggagctata gcctgggtgg ttgtgcactg tttgttagcg ttagcacacc ggcaaatcag 4980
aaacgtcgta gccgtcatct gggtagcggt atgacctttg ttattacacc ggttgaagtg 5040
ctgctgaata aacatggtgg tgaaaacagc agcatttttc gtcgtgttcg tgaatatgat 5100
ggtattccgc ctcatccgaa tctgctgatt atgcctggta atggtaaagt gggtaatgaa 5160
ctgaccgtgc aggttctgcc ggataataat gatagcgaaa tcagcttcga ttttcagtat 5220
aaattcaaag attgagaagg agatatacat atgaccatcc agattgtgca gcataacctg 5280
gaatatagct ttgtgacccc gaaagaaacc agcgattttg ttgaacgtac catgagcgtt 5340
tttgatcagg catatccgaa atttctgatc catgatgttt gggcagatcc ggcaagcctg 5400
gccctgtttg aaatttatcc ggaatttcag tttggtctgg tggaagcaac cacccagctg 5460
atgattgcac agggtaattg tattccgctg acctatgaaa gccgttttga tgaactgccg 5520
gatgaaggtt gtgattgggc actggcaaaa tggctggaag atcgcgaaca gaatcgtctg 5580
ccgaatgccc tgtgtgttgt gagcattagc atcctgccgg aatatcaggg taaaaatctg 5640
agccagtatc tgatcggcta tatgaaagaa ctggcacagt atcatggtct gaatagcctg 5700
attatggcag cacgtccgag cctgaaatat ctgtatccgc tgattccgat tgaacgctat 5760
attacctggc gtgataaaaa cggcctgatt tttgatccgt ggctgcgtgt taatgttaaa 5820
catggcgcaa aaattgccgg tatctgcttt aaaagcacca ccattaatga taccattgat 5880
ggttgggagg atcgtgttgg tatgcgtttt ccggaaaccg gtgattatat cattccgaaa 5940
ggtctggttc cggtgaaaat tgattatccg aataacatgg gcatctacat cgaaccgaat 6000
atctggctgt attatgatct ggactgagaa ggagatatac atatgatcaa catcgaacag 6060
tttcgccaag aaatcgaaga ttggattatt aacgttgtca gcattccgaa cccgctgacc 6120
ggtaattttc ctccgtgtcc gtatgcaaaa gcagcatggc tgaataatcg tgttagcgtg 6180
cgttggtttc atggtccgga actgcctgaa ctgctgatgg aacaaattcg tacatggaac 6240
aacgatttcg agatggtgat ttttggttgc gatcctcaga atctggatgc acagcgtctg 6300
gaacgttata tcaccaaagc aaattatgtg ctgcccgaat atgacctggt tgcactgggt 6360
agccatccgg ataaacagta tgttggtgat gatgccgaaa atgtgaacaa cgtgattatt 6420
acccatccga aatatgttct ggcaagcgtt cagagcttta gccagctgca agaggcaagt 6480
gatgagctgc tgcgtctggg ttatttccag tattggtcag cagaaaaact ggccgaaatg 6540
aaaagcgaac gtgcaagcca taatctgagc agcattcagc gtaaaaatag ctatcgtatt 6600
atcccgacca accattgaga aggagatata catatgctga ccgcagaaca gaaacaggca 6660
tataccaatg atggctattt taccgtggaa gaagcagttc cgaaagcact gattgaagaa 6720
attcgccatg aagtggaact gatcaccgag cagaaacgtg gtggtgtgct ggcaggcgat 6780
tatgaatggt ggtcagaaca caccattccg gatccggttc gttatcagaa aattatccag 6840
cgtctgctgg aactgccgac cgttatgggt ccggttcagg ccctgattgg tagcgatatt 6900
tttctgttaa ttaccgacct ggcaattatt cgtgcaggca ccggttatat tgcatggcat 6960
caggatcatg gctatgttgt tgaagttctg aacgccctgg caagcatgag caaaaatgag 7020
ctgaatgatg atgcactgcg cctgctggtg ccggttgcaa atcaggcaat ggtgtttatt 7080
accatctatc tgcaggatac cgataacacc atgggcacca tgcgtgtgat tccgagcagc 7140
catcagtggg aacatagtct ggatagcagc agcgccaatt cactgaatgc agaaatttgt 7200
ctgagcctgc ctggtggtgc agcaatgttt tataccccga ccgtttggca taccgcagca 7260
gcaaatacca gcattaccga ttatcgtatg ctgacgctga tcttcaccaa aaacaacatt 7320
aaaccgctgc tggttgatgc cctgaaacgt attatttgag aaggagatat acatatgaca 7380
accaccgatc cgatcctgat taataactgg catgttgtgg caaatgtcga ggattgtaaa 7440
ccgggtagca ttacccgtag ccgtttactg ggtgttaaac tggttctgtg gcgtagctat 7500
gaacagaata gcccgattca ggtttggctg gattattgtc cgcatcgtgg tgttccgctg 7560
agcatgggtg aaattaccaa taataccctg gtttgtccgt atcatggctg gcgttataat 7620
gaagcaggta aatgtattca gattccggca catccgggta tggttccgcc tgcaagcgca 7680
gaagcacgta cctatcatag ccaagaacgt tatggtctgg tttgggtttg tctgggtgat 7740
ccggttaatg atattccgtc atttccggaa tgggatgatc cgaattatca caaaacctac 7800
accaaaagct atctgattaa agcaagcgcc tttcgcgtta tggataattc actggatgtt 7860
agccattttc cgtttattca tgatggctgg ctgggcgatc gtaactatac caaagtggaa 7920
gaatttgaag tgaaactgga taaagatggt ctgacgatgg gcaaatatca gtttcagacc 7980
agccgtattg tgagccatat tgaagatgat agctgggtga attggtttcg tctgagccat 8040
ccgctgtgtc agtattgtgt tagcgaaagt ccggaaatgc gtattgttga tctgatgacc 8100
attacgccga ttgatgaaga aaatagcgtt ctgcgcatgc tgatcatgtg gaatggttat 8160
gaaaccctgg aaagcaaaat gctgacagag tatgatgaaa cgatcgaaca ggatattcgt 8220
attctgcatg cccagcagcc ggtgcgtctg ccgctgctga caccgaagca gattaatacc 8280
cagctgttta gccatgaaat tcatgttccg agcgatcgtt gtaccctggc atatcgtcgt 8340
tggctgaaac aactgggtgt gacctatggt gtttgttgag aaggagatat acatatggca 8400
ggtaaactgg atggtaaggt tgcaattatt accggtgcaa gcagcggtat tggtgaagcc 8460
accgcatttg cactggcagc agaaggtgca aaagttgcaa ttgcagcccg tcgtgcagaa 8520
ctgttacatg cactggccaa acgtattgaa gcaagcggtg gtcaggcact gccgattgtt 8580
accgatatca ccgatgaaag ccaggttaat catctggttc agaaaaccaa agttgaactg 8640
ggtcatgttg atatcctggt gaataatgca ggtattggcg tttttggtgc aatcgatacc 8700
ggtaatccgg cagattggcg tcgtgcattt gatgttaatg tgctgggtgt tctgtatgca 8760
attcatgcag ttctgccttt actgaaagca cagaaaagcg gtcatattgt gaatattagc 8820
agcgtggatg gtcgtattgc acagagcggt gcagttgttt atagcgcagc aaaaagcggt 8880
gttaatgccc tgagcgaagc actgcgtcaa gaagtgagcc tggataatat tcgtgtgacc 8940
attattgaac cgggtctggt agataccccg tttaatgatc tgattagtga tccgattacc 9000
aaacagctga gcaaagaaca gctgtcaacc attactccgc tgcagagcga agatattgca 9060
cgtgccatta tctatgcagt tacccagccg gatcatgtta acgttaatga aattctgatt 9120
cgtccgaccg cagaggataa ttgagaagga gatatacata tgaacctgac cctgaacaaa 9180
gaagaaaaac agctgctgac ggcatatagc ggcaccgaac tgcagctgac agcagatgtt 9240
ctggttattg gtggtggtcc ggcagccgca tgggcagctt gggcagcagg cgcacagggt 9300
gtgaaagtta ttattgtgga taaaggtttt ctgggcacca gcggtgccgc agccgcaagc 9360
ggtaatagcg ttatggcacc gtcaccggaa aattgggaaa aagatgtgag cgaatgttac 9420
agcaaaggta ataatctggc aaatctgcgt tggattgaac gtgttattga aaaagcctgg 9480
ctgtcactgc cgctggttga agattggggt tatcgttttc ctaaagaaaa tggtgaaagc 9540
gtgcgtcaga gctattatgg tcctgaatat atgcgtgttc tgcggaaaaa tctgctgcgc 9600
gttggtgttc agatctttga tcagtcaccg gcactggaat tactgctggc acaggatggt 9660
agcgttgccg gtgcacgtgg tgtgcagcgt cagaatcatc gtacatatac cgttcgtgcc 9720
ggtgccgttg ttctggccaa tggtggttgc gcatttctga gtaaagcact gggttgtaat 9780
accaataccg gtgatggtct gttaatggca gttgaagccg gtggtgaact gagcagtatg 9840
gaagccagca gccattatac cattagcacc gcctttaatg caaccgttac ccgtgcagct 9900
ccgttttatt gggcaagcta taccgatgaa gctggcaatg atctgggtgg ctatattaac 9960
ggtcgtcgtg atccgagctt tctgccgaac gcactgctga aaggtccggt ttatgcacgt 10020
ctggatcgtg caacaccgga aattcaggcg ctggtagaaa aaagccattt tattgcattt 10080
ctgccgtaca agaaagccgg tattgatccg tataccgaac gtgttccggt taccctggtg 10140
ctggaaggca ccgtgcgtgg caccggtggt attcgcattg ttaatgattc atgtggcacc 10200
aaagttccgg gactgtatgc agcgggtgat gcagcaagcc gtgaatttct ggcaggcatt 10260
gccagcggtg gtgatggacc gaatgcagca tgggcaattt caaccggtca gtgggcaggc 10320
gaaggtgcag cagcctttgc aaaaagtctg ggtgcacatg ttcatgaacg cgttgttcgt 10380
ccggcaggcc aggcaggtct gcgtagtcag tatccgggta gcgaaacctt tgatagtgaa 10440
gcagttgttc gtggcgttca ggcagaaatg tttccgctgg aaaaaaacta tctgcgctgt 10500
gaacagggac tgctggatag cctggcaaaa ctggaaatgc tgtggcagca ggttcagggt 10560
aatccgaaac aggatacagt tcgtgatctg gaattttcac gtcgtgcggc agcactggtt 10620
agcgtggcac gttgggcata ttttagcgca ctgcatcgta aagaaacccg tagcgaacat 10680
atccgtattg attacccgga aacggatccg aatcaactgt attatcaggc aaccggtggc 10740
ctggaacgtc tgtgggtgcg tcgtgattgg gttaaagatg caagcgccac ccctccggtg 10800
ctgaccacct gagaaggaga tatacatatg attgaactgg tgagccataa gctgtgcatt 10860
aattgtaatg tttgtgttca ggtgtgcccg accaatgttt ttgatgcagt gccgaatcag 10920
cctccggcaa ttgcacgcca agaagattgt cagacctgtt ttatttgtga agcatattgt 10980
cctgcagatg cgctgtatgt tgcaccgcag agccatacca atgttgcagt taacgaagat 11040
gatttaatcg acagcggcat tatgggtgaa tatcgtcgca ttctgggttg gggctatggt 11100
cgtaaaaaca atagcgaact ggataccgac cataaactgc gtctgtttga atgagaagga 11160
gatatacata tgtcatttca gaaatttgtg caagaagcag cctataaagt cgcaccgttt 11220
aaaccgaatc gttttgccaa aattagcgag cgtgaagata aatgtgcaat tccggttccg 11280
gcatggcgtg cactgctggc caatcgtgac ctgtttacct ggaaaggtat tccgtttctg 11340
aaaggttgta ccgaaattgc actgtatagc atgctgctgt atgaactgcg tccgaaaacg 11400
attattgaaa ttggtgcgct gagcggtggt agcgcaattt ggctggcaga tcatctggaa 11460
ctgtttcaga ttgaaggttg cgtgtattgc attgatattg atctgtctct gctggacgaa 11520
aaagcaaaaa ccgatagccg tgttcatttt ctggaaggtg attgcaataa tatgggtgca 11580
attatgtcaa gcgagctgct gagtggtctg gcacatcctt ggctgattgt tgaagatgca 11640
catgcaaatg ccgttggtgt ggttgaatat tttcacgaaa acggtctgaa aagtggcgat 11700
tacctgatcg tggaagatac caataaaaca atgtgggaac tggatcgcga agaactggac 11760
cgtgatgacc tggatgaaca agaactgatc gaaaaaggtg agcagaaatt agcagaactg 11820
aaaagctggc tgatgctgca tgagaatgaa tatctgatag atacctacta tcaggatatg 11880
tatggctata atggtagccg taattggaac agcattctga aacgtgtgga aaagaacttt 11940
taatctaact aaaaacaccc taacgggtgt tttttctttt ctggtctccc cgaagttcct 12000
attctctaga aagtatagga acttcgctgg attgggccgc gaaattaacc ggcctgagca 12060
atgtcccagc tttaatcgct gcagctcaac aggctgatga aagtgccgag ccagtttggt 12120
ttctgcctta tctttccggc gagcgtacgc cacacaataa tccccaggcg aagggggttt 12180
tctttggttt gactcatcaa catggcccca atgaactggc gcgagcagtg ctggaaggcg 12240
tgggttatgc gctggcagat ggcatggatg tcgtgcatgc ctgcggtatt aaaccgcaaa 12300
gtgttacgtt gattgggggc ggggcgcgta gtgagtactg gcgtcagatg ctggcggata 12360
tcagcggtca gcagctcgat taccgtacgg gaggggatgt ggggccagca ctgggcgcag 12420
caaggctggc gcagatcgcg gcgaatccag agaaatcgct cattgaattg ttgccgcaac 12480
taccgttaga acagtcgcat ctaccagatg cgcagcgtta tgccgcttat cagccacgac 12540
gagaaacgtt ccgtcgcctc tatcagcaac ttctgccatt aatggcgtaa acgttatccc 12600
ctgcctgacc gggtggggga taattcacat ctatatatct cagtaattaa ttaatattta 12660
gtatgaattt attctgaaaa tcatttgtta atggcatttt tcagttttgt ctttcgttgg 12720
ttactcgtaa tgtatcgctg gtagatatgg agatcgtt 12758
<210> 93
<211> 7185
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 整合到大肠杆菌木糖操纵子中的sxt3片段版本2的序列
<400> 93
ggtgtcagga ggcgggaggg gacatctttc aggccattat tcagtgaggt ccagccttgc 60
aagaagcgga tacaggagtg caaaaaatgg ctatctctag aaaggcctac cccttaggct 120
ttatgcaaca gaaacaataa taatggagtc atgaacatat ggtgattaaa aacctgtgtc 180
cggatggtgt taccccgatt tggaataaaa gccagatgga aagcagcctg ctggaagaat 240
gtctgcctgc atgggttcgt accagctata gcacctttgt tgaaaccatt agcgatagcg 300
catttccgtg tttttggggc accattggtg aacagaaagg tatgattcgt tatctgattg 360
ttagcagcct gaccgatccg attctggttg aacataccct ggaaggtatc tacaaatata 420
tcgatgaagt gaacgaaaac gaactgctgc agcatgaaaa tgcagatctg ctgaccctgg 480
ttatcttttt tccgcctgaa ccgaccgttc tgaccgttga agaatatgca ggtcaggcat 540
ttgattttct gaatgcactg catagcctgg atgcagttag ctgtccgtgt cattggagcg 600
cagatccgca gagcgcaaat tggagctata gcctgggtgg ttgtgcactg tttgttagcg 660
ttagcacacc ggcaaatcag aaacgtcgta gccgtcatct gggtagcggt atgacctttg 720
ttattacacc ggttgaagtg ctgctgaata aacatggtgg tgaaaacagc agcatttttc 780
gtcgtgttcg tgaatatgat ggtattccgc ctcatccgaa tctgctgatt atgcctggta 840
atggtaaagt gggtaatgaa ctgaccgtgc aggttctgcc ggataataat gatagcgaaa 900
tcagcttcga ttttcagtat aaattcaaag attgagaagg agatatacat atgaccatcc 960
agattgtgca gcataacctg gaatatagct ttgtgacccc gaaagaaacc agcgattttg 1020
ttgaacgtac catgagcgtt tttgatcagg catatccgaa atttctgatc catgatgttt 1080
gggcagatcc ggcaagcctg gccctgtttg aaatttatcc ggaatttcag tttggtctgg 1140
tggaagcaac cacccagctg atgattgcac agggtaattg tattccgctg acctatgaaa 1200
gccgttttga tgaactgccg gatgaaggtt gtgattgggc actggcaaaa tggctggaag 1260
atcgcgaaca gaatcgtctg ccgaatgccc tgtgtgttgt gagcattagc atcctgccgg 1320
aatatcaggg taaaaatctg agccagtatc tgatcggcta tatgaaagaa ctggcacagt 1380
atcatggtct gaatagcctg attatggcag cacgtccgag cctgaaatat ctgtatccgc 1440
tgattccgat tgaacgctat attacctggc gtgataaaaa cggcctgatt tttgatccgt 1500
ggctgcgtgt taatgttaaa catggcgcaa aaattgccgg tatctgcttt aaaagcacca 1560
ccattaatga taccattgat ggttgggagg atcgtgttgg tatgcgtttt ccggaaaccg 1620
gtgattatat cattccgaaa ggtctggttc cggtgaaaat tgattatccg aataacatgg 1680
gcatctacat cgaaccgaat atctggctgt attatgatct ggactgagaa ggagatatac 1740
atatgctgac cgcagaacag aaacaggcat ataccaatga tggctatttt accgtggaag 1800
aagcagttcc gaaagcactg attgaagaaa ttcgccatga agtggaactg atcaccgagc 1860
agaaacgtgg tggtgtgctg gcaggcgatt atgaatggtg gtcagaacac accattccgg 1920
atccggttcg ttatcagaaa attatccagc gtctgctgga actgccgacc gttatgggtc 1980
cggttcaggc cctgattggt agcgatattt ttctgttaat taccgacctg gcaattattc 2040
gtgcaggcac cggttatatt gcatggcatc aggatcatgg ctatgttgtt gaagttctga 2100
acgccctggc aagcatgagc aaaaatgagc tgaatgatga tgcactgcgc ctgctggtgc 2160
cggttgcaaa tcaggcaatg gtgtttatta ccatctatct gcaggatacc gataacacca 2220
tgggcaccat gcgtgtgatt ccgagcagcc atcagtggga acatagtctg gatagcagca 2280
gcgccaattc actgaatgca gaaatttgtc tgagcctgcc tggtggtgca gcaatgtttt 2340
ataccccgac cgtttggcat accgcagcag caaataccag cattaccgat tatcgtatgc 2400
tgacgctgat cttcaccaaa aacaacatta aaccgctgct ggttgatgcc ctgaaacgta 2460
ttatttgaga aggagatata catatgacaa ccaccgatcc gatcctgatt aataactggc 2520
atgttgtggc aaatgtcgag gattgtaaac cgggtagcat tacccgtagc cgtttactgg 2580
gtgttaaact ggttctgtgg cgtagctatg aacagaatag cccgattcag gtttggctgg 2640
attattgtcc gcatcgtggt gttccgctga gcatgggtga aattaccaat aataccctgg 2700
tttgtccgta tcatggctgg cgttataatg aagcaggtaa atgtattcag attccggcac 2760
atccgggtat ggttccgcct gcaagcgcag aagcacgtac ctatcatagc caagaacgtt 2820
atggtctggt ttgggtttgt ctgggtgatc cggttaatga tattccgtca tttccggaat 2880
gggatgatcc gaattatcac aaaacctaca ccaaaagcta tctgattaaa gcaagcgcct 2940
ttcgcgttat ggataattca ctggatgtta gccattttcc gtttattcat gatggctggc 3000
tgggcgatcg taactatacc aaagtggaag aatttgaagt gaaactggat aaagatggtc 3060
tgacgatggg caaatatcag tttcagacca gccgtattgt gagccatatt gaagatgata 3120
gctgggtgaa ttggtttcgt ctgagccatc cgctgtgtca gtattgtgtt agcgaaagtc 3180
cggaaatgcg tattgttgat ctgatgacca ttacgccgat tgatgaagaa aatagcgttc 3240
tgcgcatgct gatcatgtgg aatggttatg aaaccctgga aagcaaaatg ctgacagagt 3300
atgatgaaac gatcgaacag gatattcgta ttctgcatgc ccagcagccg gtgcgtctgc 3360
cgctgctgac accgaagcag attaataccc agctgtttag ccatgaaatt catgttccga 3420
gcgatcgttg taccctggca tatcgtcgtt ggctgaaaca actgggtgtg acctatggtg 3480
tttgttgaga aggagatata catatggcag gtaaactgga tggtaaggtt gcaattatta 3540
ccggtgcaag cagcggtatt ggtgaagcca ccgcatttgc actggcagca gaaggtgcaa 3600
aagttgcaat tgcagcccgt cgtgcagaac tgttacatgc actggccaaa cgtattgaag 3660
caagcggtgg tcaggcactg ccgattgtta ccgatatcac cgatgaaagc caggttaatc 3720
atctggttca gaaaaccaaa gttgaactgg gtcatgttga tatcctggtg aataatgcag 3780
gtattggcgt ttttggtgca atcgataccg gtaatccggc agattggcgt cgtgcatttg 3840
atgttaatgt gctgggtgtt ctgtatgcaa ttcatgcagt tctgccttta ctgaaagcac 3900
agaaaagcgg tcatattgtg aatattagca gcgtggatgg tcgtattgca cagagcggtg 3960
cagttgttta tagcgcagca aaaagcggtg ttaatgccct gagcgaagca ctgcgtcaag 4020
aagtgagcct ggataatatt cgtgtgacca ttattgaacc gggtctggta gataccccgt 4080
ttaatgatct gattagtgat ccgattacca aacagctgag caaagaacag ctgtcaacca 4140
ttactccgct gcagagcgaa gatattgcac gtgccattat ctatgcagtt acccagccgg 4200
atcatgttaa cgttaatgaa attctgattc gtccgaccgc agaggataat tgagaaggag 4260
atatacatat gaacctgacc ctgaacaaag aagaaaaaca gctgctgacg gcatatagcg 4320
gcaccgaact gcagctgaca gcagatgttc tggttattgg tggtggtccg gcagccgcat 4380
gggcagcttg ggcagcaggc gcacagggtg tgaaagttat tattgtggat aaaggttttc 4440
tgggcaccag cggtgccgca gccgcaagcg gtaatagcgt tatggcaccg tcaccggaaa 4500
attgggaaaa agatgtgagc gaatgttaca gcaaaggtaa taatctggca aatctgcgtt 4560
ggattgaacg tgttattgaa aaagcctggc tgtcactgcc gctggttgaa gattggggtt 4620
atcgttttcc taaagaaaat ggtgaaagcg tgcgtcagag ctattatggt cctgaatata 4680
tgcgtgttct gcggaaaaat ctgctgcgcg ttggtgttca gatctttgat cagtcaccgg 4740
cactggaatt actgctggca caggatggta gcgttgccgg tgcacgtggt gtgcagcgtc 4800
agaatcatcg tacatatacc gttcgtgccg gtgccgttgt tctggccaat ggtggttgcg 4860
catttctgag taaagcactg ggttgtaata ccaataccgg tgatggtctg ttaatggcag 4920
ttgaagccgg tggtgaactg agcagtatgg aagccagcag ccattatacc attagcaccg 4980
cctttaatgc aaccgttacc cgtgcagctc cgttttattg ggcaagctat accgatgaag 5040
ctggcaatga tctgggtggc tatattaacg gtcgtcgtga tccgagcttt ctgccgaacg 5100
cactgctgaa aggtccggtt tatgcacgtc tggatcgtgc aacaccggaa attcaggcgc 5160
tggtagaaaa aagccatttt attgcatttc tgccgtacaa gaaagccggt attgatccgt 5220
ataccgaacg tgttccggtt accctggtgc tggaaggcac cgtgcgtggc accggtggta 5280
ttcgcattgt taatgattca tgtggcacca aagttccggg actgtatgca gcgggtgatg 5340
cagcaagccg tgaatttctg gcaggcattg ccagcggtgg tgatggaccg aatgcagcat 5400
gggcaatttc aaccggtcag tgggcaggcg aaggtgcagc agcctttgca aaaagtctgg 5460
gtgcacatgt tcatgaacgc gttgttcgtc cggcaggcca ggcaggtctg cgtagtcagt 5520
atccgggtag cgaaaccttt gatagtgaag cagttgttcg tggcgttcag gcagaaatgt 5580
ttccgctgga aaaaaactat ctgcgctgtg aacagggact gctggatagc ctggcaaaac 5640
tggaaatgct gtggcagcag gttcagggta atccgaaaca ggatacagtt cgtgatctgg 5700
aattttcacg tcgtgcggca gcactggtta gcgtggcacg ttgggcatat tttagcgcac 5760
tgcatcgtaa agaaacccgt agcgaacata tccgtattga ttacccggaa acggatccga 5820
atcaactgta ttatcaggca accggtggcc tggaacgtct gtgggtgcgt cgtgattggg 5880
ttaaagatgc aagcgccacc cctccggtgc tgaccacctg agaaggagat atacatatga 5940
ttgaactggt gagccataag ctgtgcatta attgtaatgt ttgtgttcag gtgtgcccga 6000
ccaatgtttt tgatgcagtg ccgaatcagc ctccggcaat tgcacgccaa gaagattgtc 6060
agacctgttt tatttgtgaa gcatattgtc ctgcagatgc gctgtatgtt gcaccgcaga 6120
gccataccaa tgttgcagtt aacgaagatg atttaatcga cagcggcatt atgggtgaat 6180
atcgtcgcat tctgggttgg ggctatggtc gtaaaaacaa tagcgaactg gataccgacc 6240
ataaactgcg tctgtttgaa tgagaaggag atatacatat gtcatttcag aaatttgtgc 6300
aagaagcagc ctataaagtc gcaccgttta aaccgaatcg ttttgccaaa attagcgagc 6360
gtgaagataa atgtgcaatt ccggttccgg catggcgtgc actgctggcc aatcgtgacc 6420
tgtttacctg gaaaggtatt ccgtttctga aaggttgtac cgaaattgca ctgtatagca 6480
tgctgctgta tgaactgcgt ccgaaaacga ttattgaaat tggtgcgctg agcggtggta 6540
gcgcaatttg gctggcagat catctggaac tgtttcagat tgaaggttgc gtgtattgca 6600
ttgatattga tctgtctctg ctggacgaaa aagcaaaaac cgatagccgt gttcattttc 6660
tggaaggtga ttgcaataat atgggtgcaa ttatgtcaag cgagctgctg agtggtctgg 6720
cacatccttg gctgattgtt gaagatgcac atgcaaatgc cgttggtgtg gttgaatatt 6780
ttcacgaaaa cggtctgaaa agtggcgatt acctgatcgt ggaagatacc aataaaacaa 6840
tgtgggaact ggatcgcgaa gaactggacc gtgatgacct ggatgaacaa gaactgatcg 6900
aaaaaggtga gcagaaatta gcagaactga aaagctggct gatgctgcat gagaatgaat 6960
atctgataga tacctactat caggatatgt atggctataa tggtagccgt aattggaaca 7020
gcattctgaa acgtgtggaa aagaactttt aatctaacta aaaacaccct aacgggtgtt 7080
ttttcttttc tggtctcccc gaagttccta ttctctagaa agtataggaa cttcgctgga 7140
ttgggccgcg aaattaaccg gcctgagcaa tgtcccagct ttaat 7185
<210> 94
<211> 5599
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 整合到大肠杆菌木糖操纵子中的sxt3片段版本3的序列
<400> 94
ggtgtcagga ggcgggaggg gacatctttc aggccattat tcagtgaggt ccagccttgc 60
aagaagcgga tacaggagtg caaaaaatgg ctatctctag aaaggcctac cccttaggct 120
ttatgcaaca gaaacaataa taatggagtc atgaacatgc tgaccgcaga acagaaacag 180
gcatatacca atgatggcta ttttaccgtg gaagaagcag ttccgaaagc actgattgaa 240
gaaattcgcc atgaagtgga actgatcacc gagcagaaac gtggtggtgt gctggcaggc 300
gattatgaat ggtggtcaga acacaccatt ccggatccgg ttcgttatca gaaaattatc 360
cagcgtctgc tggaactgcc gaccgttatg ggtccggttc aggccctgat tggtagcgat 420
atttttctgt taattaccga cctggcaatt attcgtgcag gcaccggtta tattgcatgg 480
catcaggatc atggctatgt tgttgaagtt ctgaacgccc tggcaagcat gagcaaaaat 540
gagctgaatg atgatgcact gcgcctgctg gtgccggttg caaatcaggc aatggtgttt 600
attaccatct atctgcagga taccgataac accatgggca ccatgcgtgt gattccgagc 660
agccatcagt gggaacatag tctggatagc agcagcgcca attcactgaa tgcagaaatt 720
tgtctgagcc tgcctggtgg tgcagcaatg ttttataccc cgaccgtttg gcataccgca 780
gcagcaaata ccagcattac cgattatcgt atgctgacgc tgatcttcac caaaaacaac 840
attaaaccgc tgctggttga tgccctgaaa cgtattattt gagaaggaga tatacatatg 900
acaaccaccg atccgatcct gattaataac tggcatgttg tggcaaatgt cgaggattgt 960
aaaccgggta gcattacccg tagccgttta ctgggtgtta aactggttct gtggcgtagc 1020
tatgaacaga atagcccgat tcaggtttgg ctggattatt gtccgcatcg tggtgttccg 1080
ctgagcatgg gtgaaattac caataatacc ctggtttgtc cgtatcatgg ctggcgttat 1140
aatgaagcag gtaaatgtat tcagattccg gcacatccgg gtatggttcc gcctgcaagc 1200
gcagaagcac gtacctatca tagccaagaa cgttatggtc tggtttgggt ttgtctgggt 1260
gatccggtta atgatattcc gtcatttccg gaatgggatg atccgaatta tcacaaaacc 1320
tacaccaaaa gctatctgat taaagcaagc gcctttcgcg ttatggataa ttcactggat 1380
gttagccatt ttccgtttat tcatgatggc tggctgggcg atcgtaacta taccaaagtg 1440
gaagaatttg aagtgaaact ggataaagat ggtctgacga tgggcaaata tcagtttcag 1500
accagccgta ttgtgagcca tattgaagat gatagctggg tgaattggtt tcgtctgagc 1560
catccgctgt gtcagtattg tgttagcgaa agtccggaaa tgcgtattgt tgatctgatg 1620
accattacgc cgattgatga agaaaatagc gttctgcgca tgctgatcat gtggaatggt 1680
tatgaaaccc tggaaagcaa aatgctgaca gagtatgatg aaacgatcga acaggatatt 1740
cgtattctgc atgcccagca gccggtgcgt ctgccgctgc tgacaccgaa gcagattaat 1800
acccagctgt ttagccatga aattcatgtt ccgagcgatc gttgtaccct ggcatatcgt 1860
cgttggctga aacaactggg tgtgacctat ggtgtttgtt gagaaggaga tatacatatg 1920
gcaggtaaac tggatggtaa ggttgcaatt attaccggtg caagcagcgg tattggtgaa 1980
gccaccgcat ttgcactggc agcagaaggt gcaaaagttg caattgcagc ccgtcgtgca 2040
gaactgttac atgcactggc caaacgtatt gaagcaagcg gtggtcaggc actgccgatt 2100
gttaccgata tcaccgatga aagccaggtt aatcatctgg ttcagaaaac caaagttgaa 2160
ctgggtcatg ttgatatcct ggtgaataat gcaggtattg gcgtttttgg tgcaatcgat 2220
accggtaatc cggcagattg gcgtcgtgca tttgatgtta atgtgctggg tgttctgtat 2280
gcaattcatg cagttctgcc tttactgaaa gcacagaaaa gcggtcatat tgtgaatatt 2340
agcagcgtgg atggtcgtat tgcacagagc ggtgcagttg tttatagcgc agcaaaaagc 2400
ggtgttaatg ccctgagcga agcactgcgt caagaagtga gcctggataa tattcgtgtg 2460
accattattg aaccgggtct ggtagatacc ccgtttaatg atctgattag tgatccgatt 2520
accaaacagc tgagcaaaga acagctgtca accattactc cgctgcagag cgaagatatt 2580
gcacgtgcca ttatctatgc agttacccag ccggatcatg ttaacgttaa tgaaattctg 2640
attcgtccga ccgcagagga taattgagaa ggagatatac atatgaacct gaccctgaac 2700
aaagaagaaa aacagctgct gacggcatat agcggcaccg aactgcagct gacagcagat 2760
gttctggtta ttggtggtgg tccggcagcc gcatgggcag cttgggcagc aggcgcacag 2820
ggtgtgaaag ttattattgt ggataaaggt tttctgggca ccagcggtgc cgcagccgca 2880
agcggtaata gcgttatggc accgtcaccg gaaaattggg aaaaagatgt gagcgaatgt 2940
tacagcaaag gtaataatct ggcaaatctg cgttggattg aacgtgttat tgaaaaagcc 3000
tggctgtcac tgccgctggt tgaagattgg ggttatcgtt ttcctaaaga aaatggtgaa 3060
agcgtgcgtc agagctatta tggtcctgaa tatatgcgtg ttctgcggaa aaatctgctg 3120
cgcgttggtg ttcagatctt tgatcagtca ccggcactgg aattactgct ggcacaggat 3180
ggtagcgttg ccggtgcacg tggtgtgcag cgtcagaatc atcgtacata taccgttcgt 3240
gccggtgccg ttgttctggc caatggtggt tgcgcatttc tgagtaaagc actgggttgt 3300
aataccaata ccggtgatgg tctgttaatg gcagttgaag ccggtggtga actgagcagt 3360
atggaagcca gcagccatta taccattagc accgccttta atgcaaccgt tacccgtgca 3420
gctccgtttt attgggcaag ctataccgat gaagctggca atgatctggg tggctatatt 3480
aacggtcgtc gtgatccgag ctttctgccg aacgcactgc tgaaaggtcc ggtttatgca 3540
cgtctggatc gtgcaacacc ggaaattcag gcgctggtag aaaaaagcca ttttattgca 3600
tttctgccgt acaagaaagc cggtattgat ccgtataccg aacgtgttcc ggttaccctg 3660
gtgctggaag gcaccgtgcg tggcaccggt ggtattcgca ttgttaatga ttcatgtggc 3720
accaaagttc cgggactgta tgcagcgggt gatgcagcaa gccgtgaatt tctggcaggc 3780
attgccagcg gtggtgatgg accgaatgca gcatgggcaa tttcaaccgg tcagtgggca 3840
ggcgaaggtg cagcagcctt tgcaaaaagt ctgggtgcac atgttcatga acgcgttgtt 3900
cgtccggcag gccaggcagg tctgcgtagt cagtatccgg gtagcgaaac ctttgatagt 3960
gaagcagttg ttcgtggcgt tcaggcagaa atgtttccgc tggaaaaaaa ctatctgcgc 4020
tgtgaacagg gactgctgga tagcctggca aaactggaaa tgctgtggca gcaggttcag 4080
ggtaatccga aacaggatac agttcgtgat ctggaatttt cacgtcgtgc ggcagcactg 4140
gttagcgtgg cacgttgggc atattttagc gcactgcatc gtaaagaaac ccgtagcgaa 4200
catatccgta ttgattaccc ggaaacggat ccgaatcaac tgtattatca ggcaaccggt 4260
ggcctggaac gtctgtgggt gcgtcgtgat tgggttaaag atgcaagcgc cacccctccg 4320
gtgctgacca cctgagaagg agatatacat atgattgaac tggtgagcca taagctgtgc 4380
attaattgta atgtttgtgt tcaggtgtgc ccgaccaatg tttttgatgc agtgccgaat 4440
cagcctccgg caattgcacg ccaagaagat tgtcagacct gttttatttg tgaagcatat 4500
tgtcctgcag atgcgctgta tgttgcaccg cagagccata ccaatgttgc agttaacgaa 4560
gatgatttaa tcgacagcgg cattatgggt gaatatcgtc gcattctggg ttggggctat 4620
ggtcgtaaaa acaatagcga actggatacc gaccataaac tgcgtctgtt tgaatgagaa 4680
ggagatatac atatgtcatt tcagaaattt gtgcaagaag cagcctataa agtcgcaccg 4740
tttaaaccga atcgttttgc caaaattagc gagcgtgaag ataaatgtgc aattccggtt 4800
ccggcatggc gtgcactgct ggccaatcgt gacctgttta cctggaaagg tattccgttt 4860
ctgaaaggtt gtaccgaaat tgcactgtat agcatgctgc tgtatgaact gcgtccgaaa 4920
acgattattg aaattggtgc gctgagcggt ggtagcgcaa tttggctggc agatcatctg 4980
gaactgtttc agattgaagg ttgcgtgtat tgcattgata ttgatctgtc tctgctggac 5040
gaaaaagcaa aaaccgatag ccgtgttcat tttctggaag gtgattgcaa taatatgggt 5100
gcaattatgt caagcgagct gctgagtggt ctggcacatc cttggctgat tgttgaagat 5160
gcacatgcaa atgccgttgg tgtggttgaa tattttcacg aaaacggtct gaaaagtggc 5220
gattacctga tcgtggaaga taccaataaa acaatgtggg aactggatcg cgaagaactg 5280
gaccgtgatg acctggatga acaagaactg atcgaaaaag gtgagcagaa attagcagaa 5340
ctgaaaagct ggctgatgct gcatgagaat gaatatctga tagataccta ctatcaggat 5400
atgtatggct ataatggtag ccgtaattgg aacagcattc tgaaacgtgt ggaaaagaac 5460
ttttaatcta actaaaaaca ccctaacggg tgttttttct tttctggtct ccccgaagtt 5520
cctattctct agaaagtata ggaacttcgc tggattgggc cgcgaaatta accggcctga 5580
gcaatgtccc agctttaat 5599
<210> 95
<211> 7064
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 整合到大肠杆菌乳糖操纵子中的sxt1片段的序列
<400> 95
atgaccatga ttacggattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct 60
ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc 120
gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc 180
tttgcctggt ttccggcacc agaagcggtg ccggaaagct ggctggagtg cgatcttcct 240
gaggccgata ctgtcgtcgt cccctcaaac tggcagatgc acggttacga tgcgcccatc 300
tacaccaacg tgacctatcc cattacggtc aatccgccgt ttgttcccac ggagaatccg 360
acgggttgtt actcgctcac atttaatgtt gatgaaagct ggctacagga aggccagacg 420
cgaattattt ttgatggcgt taactcggcg tttcatctgt ggtgcaacgg gcgctgggtc 480
ggttacggcc aggacagtca gtggagatgc ccaagggcac ttcgggtcga ggaacccgac 540
ctgcattggg acgcggccac ggagagcgcg ggcaaacgcc ggcactatag ccagtggagt 600
ttgtaaaacg ctatttcaga gcttggagag tgtctaagaa agccgggcga tgccaaccca 660
tcccttcttc ggctacgttc gtaatcaagc cacttccttt ttgcattgac gcagggtgtc 720
ggaaggcaac tcgccgaacg cgctcctata gttttcagcg aagcgtccca aatgtaagaa 780
gccgtagtct agggctatct cagttatact acgcacattg gcactgggat cgttcaagca 840
ggcgcggatg ctttcgagct tgcggttgcg gatgtagttc ttcggcgtgg tgccggcatg 900
cttctcgaac aaattgtaga gcgagcgtgg actcatcatc gccagctccg ctaaccgctc 960
aaggctgata ttccgtttga gattctcctc aatgaattga acgactcgct cgaaagacgg 1020
gttacctttg ctgaaaattt cacggctgac attgctgccc agcatttcga gcagcttgga 1080
agcgatgatc cccgcatagt gctcttggac ccgaggcatc gactttgtat gttccgcttc 1140
gtcacaaact aacccgagta gattgataaa gccatcgagt tgctggagat tgtgtcgcgc 1200
ggcgaaacgg ataccctccc tcggcttgtg ccaattgttg tcactgcatg cccgatcaag 1260
gaccactgag ggcaatttaa cgataaattt ctcgcaatct tctgaatagg tcaggtcggc 1320
ttggtcatcc ggattgagca gcaatagttc gcccggcgca aaatagtgct cctggccatg 1380
gccacgccac aggcaatggc ctttgagtat tatttgcaga tgataacagg tctctaatcc 1440
aggcgagatt accctcacgc taccgccgta gctgattcga cacaggtcga ggcatccgaa 1500
gattctgtgg tgcagcctgc ctgccggggg cccgcccttg ggcaggcgaa tagagtgcgt 1560
accgacatac tggttaacat aatcggagac tgcatagggc tcggcgtgga cgaagatctg 1620
acttttctcg ttcaataagc aaaaatccat agttcacggt tctcttattt taatgtgggc 1680
tgcttggtgt gatgtagaaa ggcgccaagt cgatgaaaat gcaggaatta attcgcagat 1740
cctggcggat gagagaagat tttcagcctg atacagatta aatcagaacg cagaagcggt 1800
ctgataaaac agaatttgcc tggcggcagt agcgcggtgg tcccacctga ccccatgccg 1860
aactcagaag tgaaacgccg tagcgccgat ggtagtgtgg ggtctcccca tgcgagagta 1920
gggaactgcc aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt 1980
tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgg gagcggattt 2040
gaacgttgcg aagcaacggc ccggagggtg gcgggcagga cgcccgccat aaactgccag 2100
gcatcaaatt aagcagaagg ccatcctgac ggatggcctt tttgcgtaga tcccagcctt 2160
gcaagaagcg gatacaggag tgcaaaaaat ggctatctct agaaaggcct accccttagg 2220
ctttatgcaa cagaaacaat aataatggag tcatgaacat gctgcagaaa atcaatcgtt 2280
atacccatgg ttttgttgcc gttccggtta ttctggcatg tcgtgaaaaa ggtgtttttg 2340
aactgctggc agatgaaagt ccgctgagcc tgaatcagat ggttgaacat ctgggtgcca 2400
atagcggtca ttttcaggtt gcactgcgta tgctggaaag tctgcattgg ctgagccgta 2460
ataaagaact gaaatatagc ctgaccgcag aagcagcaat tcataacaaa attagcgaag 2520
atatcctgca gctgtataat ctgccgattc agagctatct ggaaggtaaa cagggcaatc 2580
tgctgggtcg ttggattgaa cgtagctgtc agctgtggaa tctggataat ccgctgatgg 2640
cagattttct ggatggtctg ctggttattc cgctgctgct ggcactgcat aaacataacc 2700
tgctggccga ttctgaagat aaaccgctgc tgagcagcct gagcagtacc gttcaagaag 2760
aactgggtaa actgtttctg catctgggtt gggcagatct gacagcaggt cgtctgacca 2820
ttaccgaact gggtcgcttt atgggtgaac gtgcactgaa taccgcaatt gttgcaagct 2880
ataccccgat gctgagtcgt attcatgatg ttctgtttgg taattgcctg agcgtttttc 2940
agcgtgatgc aagcggtcat gaacgtcata ttgatcgtac cctgaatgtt attggtagcg 3000
gttttcagca ccagaaatac tttgcagatc tggaagaaag cattctgagc gtgtttaatc 3060
agctgccgct ggaagaacag ccgaaataca ttaccgatat gggttgtggt gatggcaccc 3120
tgctgaaacg tgtttgggaa accattcagt ttaaaagcgc acgtggtaaa gcactggaac 3180
agtatccgct gcgtctgatt ggtgttgatt ataatgaagc aagcctgaaa gcaaccaccc 3240
gtaccctggc aagcctgccg catctggttc tgcagggtga tattggtaat ccggaacaaa 3300
tggttcgtag cctggaagca catggcattc atgatccgga aaatattctg catattcgca 3360
gctttctgga tcacgatcgt ctgtttattc cgcctcagaa acgtaatgaa ctgaaagaac 3420
gtgcccatct gccgtatcag agtgtttgtg ttgatgatca gggtgaactg attcctccgc 3480
atgttatggt tcagagcctg gtggaacacc tggaacgttg gagccaggtt gttaataaac 3540
atggtctgat gattctggaa gtgcattgtc tggaaccgcg tgttgtttat cagtttctgg 3600
ataaaagcga aaacctgcac tttgatgcat ttcagggttt tagccagcag tatctggttg 3660
aagccgaagt ttttctgatg agcgcagcac aggttggtct gtttccgaaa ctggaactga 3720
gcaaacgtta tccgaaaacc tttccgttta cccgtattac cctgaactat ttcgaaaaac 3780
gtccgtacaa aatcagccat gcatatctga gcgatctgcc tgcactggtt gacctggaag 3840
ttaaatgttg gcctgagaat ctgcgtgcaa gcacccatga aattcgtcgt cgtctggaac 3900
tgaatccgca gggtaacctg gttctgatta ttgaagatca gattatcggt gccatttaca 3960
gccagaccat tacaagcacc gaagccctgg aaaatgttaa atatgcacag gttccgaccc 4020
tgcatacacc gcagggttca gtgattcagc tgctggccct gaacattctg ccggaatttc 4080
aggcacgtgg tctgggcaat gaactgcgtg attttatgct gtattattgc accctgaaag 4140
gtggtattga aagcgttgtt ggtgttaccc gttgtcgcaa ttatgtgaat tatagccaga 4200
tgccgatgat ggaatatctg aaactgcata atgaacagcg tcaactgctg gatccgattg 4260
ttggttttca tgttagcggt ggtgcagaaa ttcgtggcat tattgcaaat tatcgtccgg 4320
aagatacaga taatctgggt atgggtattc tgatcgaata taacctgcgt gatagcgcac 4380
tgcattcacc gggtgatcgt aaaggtccgt atatcaatag cgcaattggt agcctggttc 4440
cgaaagcgac cagcgcaacc aaagaaaaca aaaccgttgc ggatctggtg aaagaatgta 4500
ttctgaaagt gatgggtagc cagcgtcagg cagcatatgc accgcagcag aaactgctgg 4560
acatgggtct ggatagcctg gatctgctgg aactgcagac cctgctggaa gaacgtctgg 4620
gtattaatct gagcggcacc ttttttctgc aaaaaaacac cccgaccgcc atcattacct 4680
attttcagaa tcaggtcgtg caagagaaac agagtgatct ggcaccgcct gttgatagcg 4740
ccaatgaaat caatacactg gaaaacgttg tgaatcagca gaaaattccg caggttacac 4800
gtgttgttac cgaacagcag ggacgtaaag ttctgattga tggtcattgg gttattgatt 4860
ttgccagctg taattatctg ggcctggacc tgcatccgaa agttaaagaa gcaattcctc 4920
cggcactgga taaatggggc acccatccga gctggacccg tctggttgca agtccggcaa 4980
tttatgagga actggaagag gaactgtcaa aactgctggg tgtgccggat gttctggttt 5040
ttccggcagt tacactgctg cagattggta ttctgcctct gctgaccggt aataatggtg 5100
tgatttttgg cgatattgca gcccatcgtt gtatttatga agcatgttgt ctggcccagc 5160
ataaaggtgc acagtttatt cagtatcgtc ataacgacct gaatgatctg gccgaaaaac 5220
tggccaaata tccgcctgaa caggttaaaa tcattgtgat cgatggtgtg tatagcatga 5280
gtgccgattt cccggacctg cctgcatatg ttcatctggc aaaagaatat aacgccctga 5340
tctatatgga tgatgcacat ggctttggca ttctgggtga aaatccgagc agcgatatgc 5400
cgtatggtta taaaggtaat ggcatggtga actactttga tctgcgtttt gccgaagata 5460
acatcattta tgttgcaggt ctgagcaaag cctatagcag ctatgcagca tttctgacct 5520
gtggtgatcg tcgtattaaa accaattttc gtaatgcatg gaccgcgatt tttagcggtc 5580
cgagtccggt tgcaagcctg gccagcgcac tggcaggtct gcaggttaat cgtcaagaag 5640
gtgaacagct gcgcaaacaa atctatcatc tgacacataa actggttacc caggctcgtg 5700
ccattggttt tgaagttgat aattatggtt atgtgccgat tgtgggtgtt ctggtgggtg 5760
atgcacagca tatgattgat gtgtgccaac tgctgtggga atatggtatc ctgattaccc 5820
ctgcaatttt tccgattgtg ccgctgaata aatcagcact gcgttttagc attaccgcag 5880
caaataccga agaagaaatt gatcaggcca tcaaaagtct gaaagcagtt tgggacctgc 5940
tgcaaaaacg taaagccctg ccgtgtaaac aagaagaaaa tatcctgaaa cattgagaag 6000
gagatataca tatgacccat gttgccctgg aacaggcaat tgcaaaagtt ccgcgtagca 6060
ttcagagcga actgcgtacc attctggcac agcatgcagt tattgatagc agcgttgtgg 6120
caagctggat tgatcgtctg ggcaccaata ttagtaccct gatgatccag ctgctgccgg 6180
ttgcagcaac ctatgcacgt gttccgatta gccagtttta tgttggtgcc attgcactgg 6240
gcaaaccgca gagtaaaaat cagctgggta gcggcaccct gtattttggt gcagatatgg 6300
aatttgttgg tcaggcactg agctttagcg ttcatgcaga acagagcgcc accattaatg 6360
cctggctgca tggcgaaacc ggactgcagg cactggcaat ccatgaagca ccgtgtggtt 6420
attgtcgcca gtttctgtat gaaatggcaa ccgtgaatca gaattttgtg ctgctggtga 6480
aaagcaatga aagccagccg gaacagacct ataccagcaa caaactgccg cattttctgc 6540
ctgaaccgtt tggtccagcc gatctgggtc tgaccggtgg cctgatgcag accgtgtttc 6600
acgatctgga aacctatagc accgatgatg ttgttctggc agcactgagt gcagcaaatc 6660
agagttatgc accgtatacc aaaaactttg ccggtgttgc actgaaagat agtcatggta 6720
acatttttac aggtcgctat gccgaaaacg cagcatttaa tagcagcatg agcccgatgg 6780
aaagcgcact gacctttatg aatatgaatc gttattcaca gagcctgttc gatatttgtg 6840
atgcagttct ggtagaagtg gaaaccggta ttagtcagcg tccggttacc gaagcctttc 6900
tgagtagcat tgcaccgaaa gtgaaactgc gctatgcacc ggcaaccccg agcagtaaca 6960
aactgtgact cggtaccaaa ttccagaaaa gaggcctccc gaaagggggg ccttttttcg 7020
ttttggtccc gaagttccta ttctctagaa agtataggaa cttc 7064
<210> 96
<211> 4413
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 整合到大肠杆菌蜜二糖操纵子中的sxt4片段的序列
<400> 96
aagcctgccg tcagggcaat atcgagaata cttttatcgg tatcgctcag ccagccttgc 60
aagaagcgga tacaggagtg caaaaaatgg ctatctctag aaaggcctac cccttaggct 120
ttatgcaaca gaaacaataa taatggagtc atgaacatat ggaaaccacg agcaaaaaat 180
tcaaaagcga tctgattctg gaagcacgtg caagcctgaa actgggtatt ccgctggtta 240
ttagccagat gtgtgaaacc ggtatttata ccgcaaatgc agttatgatg ggtctgctgg 300
gcacccaggt tctggcagcc ggtgctctgg gtgcactggc atttctgacc ctgctgtttg 360
catgtcatgg tattctgagc gttggtggta gcctggcagc ggaagcattt ggtgcaaaca 420
aaattgatga agttagccgt attgcaagcg gtcagatttg gctggcagtt accctgagcc 480
tgcctgcaat gctgctgctg tggcatggtg ataccattct gctgttattt ggtcaagaag 540
aaagcaacgt tctgctgacc aaaacctatc tgcatagcat tctgtggggt tttccggcag 600
cactgagtat tctgacactg cgtggtattg ccagcgcact gaatgttccg cgtctgatta 660
ccattaccat gctgacccag ctgattctga ataccgcagc agattatgtt ctgatctttg 720
gtaaatttgg tctgccgcag ctgggtctgg caggtattgg ttgggcaacc gcactgggtt 780
tttgggttag ctttaccctg ggtctgatcc tgctgatttt tagcctgaaa gtgcgtgatt 840
ataaactgtt tcgttatctg caccagttcg acaagcagat ctttgtgaaa atctttcaga 900
ccggttggcc gatgggtttt cagtggggtg cagaaacagc actgtttaat gttaccgcat 960
gggttgcagg ttatctgggc accgttaccc tggcagcaca tgatattggt tttcagacag 1020
cagaactggc aatggttatc ccgctgggtg ttggtaatgt tgcaatgacc cgtgttggtc 1080
agagcattgg tgaaaaaaat ccactgggtg cccgtcgtgt tgcaagcatt ggtattacca 1140
ttgttggtat ttatgccagc attgttgccc tggttttttg gctgtttccg tatcagattg 1200
caggcattta tctgaacatt aataacccgg aaaacattga agccatcaaa aaagccacca 1260
cctttattcc actggcaggt ctgtttcaga tgttttatag cattcagatc attatcgttg 1320
gtgcgctggt tggtctgcgt gatacctttg ttccggttag catgaatctg attgtttggg 1380
gtctgggttt agcaggtagc tattttatgg caattattct gggttggggt ggtattggta 1440
tctggctggc catggttctg agtccgctgc tgagcgcagt tattctgacc gttcgttttt 1500
atcgcgtgat tgataatctg ctggccaaca gtgatgatat gctgcagaat gcaagcgtta 1560
ccaccctggg atgagaagga gatatacata tgaaacgtct gacgctgctg atcattgcag 1620
gtattctgtc agttagcacc tttctgtgta ttacaccggt tgcactggcc aatattaccg 1680
attattatct gaaaaacgag aaactgagcg gtcagtttag cgttccggtg aatctgtctg 1740
ttggtgttcg ttttgcacat cgtagcagct atgcaaccgc aattaacttt ccgaccggtc 1800
tggatgcaga tagcgttgca gttggtgatt ttaacagcga tagcaaactg gatctggccg 1860
ttaccaattg gtttgataac aatgttagcg tgctgctggg taatggcaat ggcagctttg 1920
gtgcagcaac caattttccg gttggcacca atccggtttt tgttgttacc ggtgatgtta 1980
atggtgacag taaactggat ttagccgtgg caaattttag cagcaataat gtttcagttc 2040
tgctgggaaa cggtaatggt tcttttggcg cagccacaaa ctttagcgtt ggtacaaatc 2100
cgtatagcgt ggccattggt gatgtgaata atgatagtga actggacctg gcatttacga 2160
actggttcga taataaagtt ctggtgctgt taggcaatgg taatggctcg tttggtgccg 2220
caagctcatt tccggtggat acctatagca ttagcgttgc gattgcagat ttcaactcag 2280
attctaaatt agacctggcg atcaccaatt gggtgtcaaa taatgtgagt gtgttactgg 2340
ggaatggtaa cggtagtttt ggagctgcga caaattttcc tgtgggtaca aacccgattt 2400
ttgtggcaac cggtgacgtg aatggcgatt ctaagctgga cttagcagtt gcaaatacca 2460
gctctaataa cgttagcgtt ctgttaggta acgggaacgg ctcattcggt gctgccacga 2520
attttccagc aggcaccaac ccgtatagtg ttgcaattcg cgacgttaac ggtgatagca 2580
aattagattt agcggtgacc aactatagca gcaacaacgt gagtgttctg ccaggcaacg 2640
gtaacggatc atttggtatt gcgaccaact ttccagtagg tacgaatccg gaaagcattg 2700
caattgccga ttttaatggg gattccaagt tagatctggc agtgacaaat agcggtaaca 2760
ataatgtaag catactgctg aataactttc agggtctgcc gaaaaacaag atttgagaag 2820
gagatataca tatgaccaat accgaacgtg gtctggccga aattaccagc accggttata 2880
aaagcgaact gcgtagcgaa gcccgtgtta gcctgcagct ggcaattcct ctggttctgg 2940
ttgaaatttg tggcaccagc attaatgttg ttgatgttgt gatgatgggt ttactgggta 3000
cacaagtgtt agcagcgggt gccctgggag caattgcctt cctgagcgtt agcaatacct 3060
gctataatat gctgctgagt ggtgttgcaa aagcaagcga agcctttgga gccaataaaa 3120
tcgatcaggt ttcacgtatt gcctcaggcc agatttggtt agccctgacc ctgtcattac 3180
cagccatgct gttactgtgg tatatggata ccatcctggt tctgtttggt caggttgaaa 3240
gcaataccct gattgcgaaa acatacctgc attcaattgt gtggggcttt cctgccgcag 3300
ttggtatcct gattctgcgt ggcatagcaa gtgcagttaa cgttcctcag ctggttaccg 3360
tgaccatgct ggttggcctg gtgctgaatg caccggctaa ttatgtgctg atgttcggca 3420
aattcggttt accggaatta ggcctggctg gcattggctg ggccagcaca ctggtgtttt 3480
ggattagttt tctggttggt gttgtgctgc tgatattttc accgaaagtt cgcgactaca 3540
aactgttccg ctatttacat cagtttgatc gtcagaccgt ggttgagatt tttcagacgg 3600
gctggcctat gggcttcctg ctgggtgtgg aaagcgttgt tctgagcctg accgcatggc 3660
tgaccggcta tctgggtaca gtgaccttag cagcccatga aattgcaatc cagactgccg 3720
aactggcgat tgtgattccg ttaggtattg gcaatgttgc cgttacccgt gtgggccaga 3780
caatcggcga aaaaaacccg ctgggagcac gccgtgcagc cctgattggc attatgattg 3840
gtggcattta tgcgagcctg gttgcagtga ttttttggtt attcccttat caaatcgcag 3900
gcctgtacct gaaaattaac gatccggaat caatggaagc agttaaaacc gcaacaaact 3960
ttctgttttt agctggcctg ttccagtttt ttcatagcgt gcagattatt gttgtgggtg 4020
ttctgattgg cctgcaggat acctttatcc ctctgctgat gaatctggtg ggctggggac 4080
tgggcctggc ggtttcctat tatatgggta ttatcctgtg ctggggtggc atgggcatct 4140
ggttaggtct ggtactgtca ccgctgctgt caggcctgat cctgatggtg cgcttttatc 4200
aagaaattgc caatcgcatt gcgaatagcg acgatggcca agaaagcatt agcattgata 4260
atgttgaaga actgagctaa tagaccaacc ccttgcggcc tcaatcgggg gggatggggt 4320
tttttgtcga agttcctatt ctctagaaag tataggaact tcgcaaccgt ctgctgaagg 4380
aagccatctg acacttaaag ccatcgttgc gct 4413
<210> 97
<211> 7377
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 整合到大肠杆菌麦芽糖操纵子中的sxt2片段的序列
<400> 97
ctgtgaacta aaccgaggtc atgtaaggaa tttcgtgatg ttgcttgcaa ccagccttgc 60
aagaagcgga tacaggagtg caaaaaatgg ctatctctag aaaggcctac cccttaggct 120
ttatgcaaca gaaacaataa taatggagtc atgaacatga ttgataccat tagcgttctg 180
ctgcgtgaat ggaccgttat ttttctgacc ggtctggcat tttggctgtg ggaaattcgt 240
agtccgctgc atcagattga atacaaagcc aaatttttca aagaactggg ttgggcaggt 300
atcagctttg tttttcgtat tgtttatgcc tatgttagcg tggccattat caaactgctg 360
agcagcctgt ttatgggtga aagcgcaaat tttgccggtg ttatgtatgt tccgctgtgg 420
ctgcgtatta ttaccgcata tattctgcag gatctgaccg attatctgct gcatcgtacc 480
atgcatagca atcagtttct gtggctgacc cataaatggc atcatagcac caaacagagt 540
tggtggctga gcggtaataa agatagcttt accggtggtc tgctgtatac cgttaccgca 600
ctgtggtttc cgctgctgga tattccgagc gaagttatga gcgttgttgc agttcatcag 660
gtgattcata acaactggat tcacctgaat gtgaaatgga atagctggct gggtattatc 720
gaatggattt atgttacacc gcgtatccat accctgcatc atctggatac cggtggtcgt 780
aatctgagca gtatgtttac ctttattgat cgtctgtttg gcacctatgt gtttccggaa 840
aactttgata tcgaaaaaag caaaaaccgc ctggatgatc agagcgttac cgttaaaacc 900
attctgggtt tctgagaagg agatatacat atgctgaaag attttaacca gttcctgatt 960
cgtaccctgg catttgtttt tgcctttggc atttttctga caaccggtgt tggtattgca 1020
aaagcagatt atctggtgaa aggtggcaaa attaccaatg ttcagaatac cagcagcaac 1080
ggtgataatt atgcagttag cattagcggt ggttttggtc cgtgtgcaga tcgtgttatt 1140
attctgccga ccagcggtgt tattaatcgt gatattcaca tgcgtggtta tgaagcagca 1200
ctgaccgcac tgagcaatgg ttttctggtt gatatctatg attataccgg tagcagctgt 1260
agcaatggtg gccagctgac cattaccaat cagctgggta aactgattag caattgagaa 1320
ggagatatac atatgaccaa tcagaacaac caagagctgg aaaatgatct gccgattgca 1380
aaacagccgt gtccggttaa tagctataat gaatgggata ccctggaaga agttattgtt 1440
ggtagcgttg aaggtgcaat gctgcctgca ctggaaccga ttaacaaatg gacctttccg 1500
tttgaagaac tggaaagcgc acagaaaatt ctgagcgaac gtggtggtgt tccgtatccg 1560
cctgaaatga ttaccctggc acataaagaa ctgaacgagt ttattcatat cctggaagcc 1620
gaaggtgtta aagttcgtcg tgttaaaccg gttgatttta gcgttccgtt tagcacaccg 1680
gcatggcagg ttggtagcgg tttttgtgca gcaaatccgc gtgatgtttt tctggttatt 1740
ggcaacgaaa ttatcgaagc accgatggca gatcgtaatc gttattttga aacctgggca 1800
tatcgcgaaa tgctgaaaga atattttcag gcaggcgcaa aatggaccgc agcaccgaaa 1860
ccgcagctgt ttgatgcaca gtatgatttc aattttcagt ttccgcagct gggtgaaccg 1920
cctcgttttg ttgttaccga atttgaaccg acctttgatg cagccgattt tgttcgttgt 1980
ggtcgtgata tttttggcca gaaaagccat gttaccaatg gtctgggtat tgaatggctg 2040
cagcgtcatc tggaagatga atatcgcatt catatcatcg aaagccattg tccggaagca 2100
ctgcatattg ataccaccct gatgccgctg gcaccgggta aaattctggt taatccggaa 2160
tttgtggacg tgaataaact gccgaaaatt ctgaaaagct gggatattct ggttgcaccg 2220
tatccgaatc atattccgca gaatcagctg cgtctggtta gcgaatgggc aggtctgaat 2280
gttctgatgc tggatgaaga acgtgtgatc gtggaaaaaa atcaagagca gatgatcaaa 2340
gccctgaaag attggggttt taaaccgatt gtttgccact tcgaaagcta ttatccgttt 2400
ctgggtagct ttcattgtgc aaccctggat gttcgtcgtc gtggcaccct gcagagctat 2460
ttttgagaag gagatataca tatgacgacc gcagatctga ttctgatcaa taattggtat 2520
gttgtggcca aggtggaaga ttgtaaaccg ggtagcatta ccaccgcact gctgctgggt 2580
gttaaactgg ttctgtggcg tagccgtgaa cagaatagcc cgattcagat ttggcaggat 2640
tattgtccgc atcgtggtgt tgcactgagc atgggtgaaa ttgtgaataa taccctggtt 2700
tgtccgtatc atggttggcg ttataatcag gcaggtaaat gtgttcatat tccggcacat 2760
ccggatatga cccctccggc aagcgcacag gcaaaaatct atcattgtca agaacgttat 2820
ggtctggttt gggtttgtct gggtgatccg gttaatgata ttccgagtct gccggaatgg 2880
gatgatccga attatcataa tacctgcacc aagagctact ttatccaggc aagcgcattt 2940
cgtgtgatgg ataactttat tgatgtgagc cattttccgt ttgtgcatga tggtggtctg 3000
ggcgatcgta atcatgcaca gattgaagaa tttgaggtga aagtggataa agacggtatt 3060
agcattggca atctgaaact gcagatgcct cgttttaata gcagcaatga agatgatagc 3120
tggaccctgt atcagcgtat tagccatccg ctgtgtcagt attatatcac cgaaagcagc 3180
gaaattcgta cagcagatct gatgctggtt accccgattg atgaagataa ttcactggtt 3240
cgtatgctgg tgacctggaa tcgtagcgaa attctggaaa gcaccgttct ggaagaattt 3300
gatgaaacca ttgaacagga tatcccgatt attcatagcc agcagcctgc acgtctgccg 3360
ctgctgccga gcaagcagat taatatgcag tggctgagcc aagaaattca tgttccgagc 3420
gatcgttgta ccgttgcata tcgtcgttgg ctgaaagaac tgggcgttac ctatggtgtt 3480
tgttgagaag gagatataca tatgcagatt ctgggtatca gcgcctatta tcatgatagc 3540
gcagcagcaa tggttattga tggtgaaatt gttgcagcag cacaagaaga acgttttagc 3600
cgtcgtaaac atgatgcagg ttttccgacc ggtgcaatta cctattgtct gaaacaggtt 3660
ggcaccaaac tgcagtatat tgatcagatc gtgttctatg ataaaccgct ggtgaaattt 3720
gaacgtctgc tggaaaccta tctggcctat gcaccgaaag gttttggtag ttttattacc 3780
gcaatgccgg tgtggctgaa agagaaactg tatctgaaaa ccctgctgaa aaaagaactg 3840
gcactgctgg gtgaatgtaa agcaagccag ctgcctccgc tgctgtttac cagccatcat 3900
caggcacatg cagcagcagc attttttccg agcccgtttc agcgtgcagc agttctgtgt 3960
ctggatggtg ttggtgaatg ggcaaccacc agtgtttggc tgggtgaagg taataaactg 4020
acaccgcagt gggaaattga ttttccgcat agcctgggcc tgctgtatag cgcatttacc 4080
tattataccg gctttaaagt gaacagcggt gagtataaac tgatgggtct ggcaccgtat 4140
ggtgaaccga aatatgttga tcagattctg aaacatctgc tggatctgaa agaagatggc 4200
acctttcgtc tgaacatgga ttatttcaat tataccgttg gtctgaccat gaccaaccat 4260
aaatttcata gcatgtttgg tggtccgcct cgtcaggcag aaggtaaaat tagccagcgt 4320
gatatggatc tggcaagcag cattcagaaa gttaccgaag aagtgattct gcgtctggca 4380
cgtaccatta agaaagaatt aggtgttgaa tacctgtgtc tggcaggcgg tgttggtctg 4440
aattgtgttg caaatggtcg tattctgcgt gagagcgatt ttaaagatat ttggattcag 4500
cctgcagccg gtgatgcagg tagcgcagtt ggtgcagcac tggcaatttg gcatgaatat 4560
cataaaaaac cgcgtaccag caccgcaggc gatcgtatga aaggtagcta tctgggtccg 4620
agctttagcg aagcagaaat tctgcagttt ctgaacagcg tgaatattcc gtatcatcgt 4680
tgtgtggata atgaactgat ggcacgtctg gcggaaattc tggatcaggg taatgttgtt 4740
ggttggttta gcggtcgtat ggaatttggt ccgcgtgcac tgggtggtcg tagcattatt 4800
ggtgatagcc gtagcccgaa aatgcagagc gttatgaatc tgaaaatcaa atatcgcgaa 4860
agcttccgtc cgtttgcacc gagcgttctg gcagaacgtg ttagcgatta ttttgatctg 4920
gatcgtccga gcccgtatat gctgctggtt gcacaggtta aagaaaatct gcatattccg 4980
atgacccaag aacagcatga actgtttggt atcgaaaaac tgaatgttcc gcgtagccag 5040
attccggcag ttacccatgt tgattatagc gcacgtattc agaccgttca taaagaaacc 5100
aatccgcgtt attatgaact gatccgtcat tttgaagcac gtaccggttg tgcagttctg 5160
gttaatacca gctttaatgt tcgtggtgaa ccgattgtgt gtacaccgga agatgcatat 5220
cgttgtttta tgcgtaccga gatggattac ctggtgatgg aaaattttct gctggtgaaa 5280
agcgaacagc ctcgtggtaa tagtgatgaa agctggcaga aagaatttga gctggattga 5340
gaaggagata tacatatgga acaaattaaa gaactggata agaaaggcct gcgtgaattt 5400
ggtctgattg gtggtagcat tgttgccgtt ctgtttggtt ttctgctgcc ggttattcgt 5460
catcatagcc tgagcgttat tccgtgggtt gttgcaggtt ttctgtggat ttgggcaatt 5520
attgcaccga ccaccctgag ctttatctat cagatttgga tgcgtattgg tctggtgctg 5580
ggttggattc agacccgtat tattctgggt gttctgttct atattatgat taccccgatc 5640
ggttttattc gtcgtctgct gaatcaggat ccgatgaccc gtatttttga accggaactg 5700
ccgacctatc gtcagctgag caaaagccgt accacccaga gcatggaaaa accgttctga 5760
gaaggagata tacatatgtt aaaagacacc tgggatttta tcaaggatat cgcaggcttt 5820
atcaaagaac agaaaaacta tctgctgatt ccgctgatta ttaccctggt tagcctgggt 5880
gcactgattg tttttgcaca gagcagcgca attgcaccgt ttatctatac cctgttttga 5940
gaaggagata tacatatgag caacttcaaa ggcagcgtta aaattgcact gatgggcatt 6000
ctgatttttt gcggtctgat ttttggtgtg gcctttgttg aaattggtct gcgtattgca 6060
ggcattgaac atattgcctt tcatagcatt gatgaacatc gtggttgggt tggtcgtccg 6120
catgttagcg gttggtatcg taccgaaggt gaagcacata ttcagatgaa tagtgatggt 6180
tttcgtgatc gcgaacacat taaagtgaaa ccggaaaata cctttcgtat tgccctgctg 6240
ggtgatagct ttgttgaaag catgcaggtt ccgctggaac agaatctggc agcagttatt 6300
gaaggcgaaa ttagcagctg tattgcactg gcaggtcgta aagccgaagt tattaacttt 6360
ggtgttaccg gttatggcac cgatcaagaa ctgattaccc tgcgtgaaaa agtgtgggat 6420
tatagtccgg atattgttgt gctggatttc tataccggta acgatattgt tgataatagc 6480
cgtgcactgt cccagaaatt ctatccgaat gaactgggta gcctgaaacc gttttttatc 6540
ctgcgtgatg gtaatctggt tgttgatgca agctttatca acaccgataa ctatcgtagc 6600
aaactgacct ggtggggtaa aacctatatg aaaatcaaag atcatagccg cattctgcag 6660
gtcctgaata tggttcgtga tgcactgaat aatagcagcc gtggttttag cagccaggca 6720
attgaagaac cgctgtttag tgatggtaaa caggatacca aactgagcgg cttcttcgat 6780
atctataaac cgcctaccga tccggaatgg cagcaggcct ggcaggttac cgaaaaactg 6840
attagtagca tgcagcatga agtgaccgcc aaaaaagccg attttctggt tgttaccttt 6900
ggcggtccgt ttcagcgcga accgctggtt cgtcagaaag aaatgcaaga actgggtctg 6960
accgattggt tttatccgga aaaacgtatt acccgtctgg gtgaagatga aggttttagc 7020
gtgctgaatc tgagcccgaa tctgcaggtt tatagcgaac agaataatgc ctgtctgtat 7080
ggttttgatg atacccaggg ttgtgttggt cattggaatg cactgggtca tcaggttgca 7140
ggtaaaatga ttgcaagcaa aatttgtcag cagcagatgc gtgaaagcat tctgccgcat 7200
aaacatgatc cgagcagcca gagcagcccg attacccaga gcgttattca gtaatactct 7260
aaccccatcg gccgtcttag gggttttttg tcgaagttcc tattctctag aaagtatagg 7320
aacttcgacc tgtggggtga ctttgccgcc gctgccgtga tgtctgcatt accgatc 7377
<210> 98
<211> 6062
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 缺失sxtL后整合到麦芽糖操纵子中的sxt2片段的序列
<400> 98
ctgtgaacta aaccgaggtc atgtaaggaa tttcgtgatg ttgcttgcaa ccagccttgc 60
aagaagcgga tacaggagtg caaaaaatgg ctatctctag aaaggcctac cccttaggct 120
ttatgcaaca gaaacaataa taatggagtc atgaacatga ttgataccat tagcgttctg 180
ctgcgtgaat ggaccgttat ttttctgacc ggtctggcat tttggctgtg ggaaattcgt 240
agtccgctgc atcagattga atacaaagcc aaatttttca aagaactggg ttgggcaggt 300
atcagctttg tttttcgtat tgtttatgcc tatgttagcg tggccattat caaactgctg 360
agcagcctgt ttatgggtga aagcgcaaat tttgccggtg ttatgtatgt tccgctgtgg 420
ctgcgtatta ttaccgcata tattctgcag gatctgaccg attatctgct gcatcgtacc 480
atgcatagca atcagtttct gtggctgacc cataaatggc atcatagcac caaacagagt 540
tggtggctga gcggtaataa agatagcttt accggtggtc tgctgtatac cgttaccgca 600
ctgtggtttc cgctgctgga tattccgagc gaagttatga gcgttgttgc agttcatcag 660
gtgattcata acaactggat tcacctgaat gtgaaatgga atagctggct gggtattatc 720
gaatggattt atgttacacc gcgtatccat accctgcatc atctggatac cggtggtcgt 780
aatctgagca gtatgtttac ctttattgat cgtctgtttg gcacctatgt gtttccggaa 840
aactttgata tcgaaaaaag caaaaaccgc ctggatgatc agagcgttac cgttaaaacc 900
attctgggtt tctgagaagg agatatacat atgctgaaag attttaacca gttcctgatt 960
cgtaccctgg catttgtttt tgcctttggc atttttctga caaccggtgt tggtattgca 1020
aaagcagatt atctggtgaa aggtggcaaa attaccaatg ttcagaatac cagcagcaac 1080
ggtgataatt atgcagttag cattagcggt ggttttggtc cgtgtgcaga tcgtgttatt 1140
attctgccga ccagcggtgt tattaatcgt gatattcaca tgcgtggtta tgaagcagca 1200
ctgaccgcac tgagcaatgg ttttctggtt gatatctatg attataccgg tagcagctgt 1260
agcaatggtg gccagctgac cattaccaat cagctgggta aactgattag caattgagaa 1320
ggagatatac atatgaccaa tcagaacaac caagagctgg aaaatgatct gccgattgca 1380
aaacagccgt gtccggttaa tagctataat gaatgggata ccctggaaga agttattgtt 1440
ggtagcgttg aaggtgcaat gctgcctgca ctggaaccga ttaacaaatg gacctttccg 1500
tttgaagaac tggaaagcgc acagaaaatt ctgagcgaac gtggtggtgt tccgtatccg 1560
cctgaaatga ttaccctggc acataaagaa ctgaacgagt ttattcatat cctggaagcc 1620
gaaggtgtta aagttcgtcg tgttaaaccg gttgatttta gcgttccgtt tagcacaccg 1680
gcatggcagg ttggtagcgg tttttgtgca gcaaatccgc gtgatgtttt tctggttatt 1740
ggcaacgaaa ttatcgaagc accgatggca gatcgtaatc gttattttga aacctgggca 1800
tatcgcgaaa tgctgaaaga atattttcag gcaggcgcaa aatggaccgc agcaccgaaa 1860
ccgcagctgt ttgatgcaca gtatgatttc aattttcagt ttccgcagct gggtgaaccg 1920
cctcgttttg ttgttaccga atttgaaccg acctttgatg cagccgattt tgttcgttgt 1980
ggtcgtgata tttttggcca gaaaagccat gttaccaatg gtctgggtat tgaatggctg 2040
cagcgtcatc tggaagatga atatcgcatt catatcatcg aaagccattg tccggaagca 2100
ctgcatattg ataccaccct gatgccgctg gcaccgggta aaattctggt taatccggaa 2160
tttgtggacg tgaataaact gccgaaaatt ctgaaaagct gggatattct ggttgcaccg 2220
tatccgaatc atattccgca gaatcagctg cgtctggtta gcgaatgggc aggtctgaat 2280
gttctgatgc tggatgaaga acgtgtgatc gtggaaaaaa atcaagagca gatgatcaaa 2340
gccctgaaag attggggttt taaaccgatt gtttgccact tcgaaagcta ttatccgttt 2400
ctgggtagct ttcattgtgc aaccctggat gttcgtcgtc gtggcaccct gcagagctat 2460
ttttgagaag gagatataca tatgacgacc gcagatctga ttctgatcaa taattggtat 2520
gttgtggcca aggtggaaga ttgtaaaccg ggtagcatta ccaccgcact gctgctgggt 2580
gttaaactgg ttctgtggcg tagccgtgaa cagaatagcc cgattcagat ttggcaggat 2640
tattgtccgc atcgtggtgt tgcactgagc atgggtgaaa ttgtgaataa taccctggtt 2700
tgtccgtatc atggttggcg ttataatcag gcaggtaaat gtgttcatat tccggcacat 2760
ccggatatga cccctccggc aagcgcacag gcaaaaatct atcattgtca agaacgttat 2820
ggtctggttt gggtttgtct gggtgatccg gttaatgata ttccgagtct gccggaatgg 2880
gatgatccga attatcataa tacctgcacc aagagctact ttatccaggc aagcgcattt 2940
cgtgtgatgg ataactttat tgatgtgagc cattttccgt ttgtgcatga tggtggtctg 3000
ggcgatcgta atcatgcaca gattgaagaa tttgaggtga aagtggataa agacggtatt 3060
agcattggca atctgaaact gcagatgcct cgttttaata gcagcaatga agatgatagc 3120
tggaccctgt atcagcgtat tagccatccg ctgtgtcagt attatatcac cgaaagcagc 3180
gaaattcgta cagcagatct gatgctggtt accccgattg atgaagataa ttcactggtt 3240
cgtatgctgg tgacctggaa tcgtagcgaa attctggaaa gcaccgttct ggaagaattt 3300
gatgaaacca ttgaacagga tatcccgatt attcatagcc agcagcctgc acgtctgccg 3360
ctgctgccga gcaagcagat taatatgcag tggctgagcc aagaaattca tgttccgagc 3420
gatcgttgta ccgttgcata tcgtcgttgg ctgaaagaac tgggcgttac ctatggtgtt 3480
tgttgagaag gagatataca tatgcagatt ctgggtatca gcgcctatta tcatgatagc 3540
gcagcagcaa tggttattga tggtgaaatt gttgcagcag cacaagaaga acgttttagc 3600
cgtcgtaaac atgatgcagg ttttccgacc ggtgcaatta cctattgtct gaaacaggtt 3660
ggcaccaaac tgcagtatat tgatcagatc gtgttctatg ataaaccgct ggtgaaattt 3720
gaacgtctgc tggaaaccta tctggcctat gcaccgaaag gttttggtag ttttattacc 3780
gcaatgccgg tgtggctgaa agagaaactg tatctgaaaa ccctgctgaa aaaagaactg 3840
gcactgctgg gtgaatgtaa agcaagccag ctgcctccgc tgctgtttac cagccatcat 3900
caggcacatg cagcagcagc attttttccg agcccgtttc agcgtgcagc agttctgtgt 3960
ctggatggtg ttggtgaatg ggcaaccacc agtgtttggc tgggtgaagg taataaactg 4020
acaccgcagt gggaaattga ttttccgcat agcctgggcc tgctgtatag cgcatttacc 4080
tattataccg gctttaaagt gaacagcggt gagtataaac tgatgggtct ggcaccgtat 4140
ggtgaaccga aatatgttga tcagattctg aaacatctgc tggatctgaa agaagatggc 4200
acctttcgtc tgaacatgga ttatttcaat tataccgttg gtctgaccat gaccaaccat 4260
aaatttcata gcatgtttgg tggtccgcct cgtcaggcag aaggtaaaat tagccagcgt 4320
gatatggatc tggcaagcag cattcagaaa gttaccgaag aagtgattct gcgtctggca 4380
cgtaccatta agaaagaatt aggtgttgaa tacctgtgtc tggcaggcgg tgttggtctg 4440
aattgtgttg caaatggtcg tattctgcgt gagagcgatt ttaaagatat ttggattcag 4500
cctgcagccg gtgatgcagg tagcgcagtt ggtgcagcac tggcaatttg gcatgaatat 4560
cataaaaaac cgcgtaccag caccgcaggc gatcgtatga aaggtagcta tctgggtccg 4620
agctttagcg aagcagaaat tctgcagttt ctgaacagcg tgaatattcc gtatcatcgt 4680
tgtgtggata atgaactgat ggcacgtctg gcggaaattc tggatcaggg taatgttgtt 4740
ggttggttta gcggtcgtat ggaatttggt ccgcgtgcac tgggtggtcg tagcattatt 4800
ggtgatagcc gtagcccgaa aatgcagagc gttatgaatc tgaaaatcaa atatcgcgaa 4860
agcttccgtc cgtttgcacc gagcgttctg gcagaacgtg ttagcgatta ttttgatctg 4920
gatcgtccga gcccgtatat gctgctggtt gcacaggtta aagaaaatct gcatattccg 4980
atgacccaag aacagcatga actgtttggt atcgaaaaac tgaatgttcc gcgtagccag 5040
attccggcag ttacccatgt tgattatagc gcacgtattc agaccgttca taaagaaacc 5100
aatccgcgtt attatgaact gatccgtcat tttgaagcac gtaccggttg tgcagttctg 5160
gttaatacca gctttaatgt tcgtggtgaa ccgattgtgt gtacaccgga agatgcatat 5220
cgttgtttta tgcgtaccga gatggattac ctggtgatgg aaaattttct gctggtgaaa 5280
agcgaacagc ctcgtggtaa tagtgatgaa agctggcaga aagaatttga gctggattga 5340
gaaggagata tacatatgga acaaattaaa gaactggata agaaaggcct gcgtgaattt 5400
ggtctgattg gtggtagcat tgttgccgtt ctgtttggtt ttctgctgcc ggttattcgt 5460
catcatagcc tgagcgttat tccgtgggtt gttgcaggtt ttctgtggat ttgggcaatt 5520
attgcaccga ccaccctgag ctttatctat cagatttgga tgcgtattgg tctggtgctg 5580
ggttggattc agacccgtat tattctgggt gttctgttct atattatgat taccccgatc 5640
ggttttattc gtcgtctgct gaatcaggat ccgatgaccc gtatttttga accggaactg 5700
ccgacctatc gtcagctgag caaaagccgt accacccaga gcatggaaaa accgttctga 5760
gaaggagata tacatatgtt aaaagacacc tgggatttta tcaaggatat cgcaggcttt 5820
atcaaagaac agaaaaacta tctgctgatt ccgctgatta ttaccctggt tagcctgggt 5880
gcactgattg tttttgcaca gagcagcgca attgcaccgt ttatctatac cctgttttga 5940
tactctaacc ccatcggccg tcttaggggt tttttgtcga agttcctatt ctctagaaag 6000
tataggaact tcacctgtgg ggtgactttg ccgccgctgc cgtgatgtct gcattaccga 6060
tc 6062
<210> 99
<211> 5462
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 整合到麦芽糖操纵子中的sxt2片段的序列
<400> 99
ctgtgaacta aaccgaggtc atgtaaggaa tttcgtgatg ttgcttgcaa ccagccttgc 60
aagaagcgga tacaggagtg caaaaaatgg ctatctctag aaaggcctac cccttaggct 120
ttatgcaaca gaaacaataa taatggagtc atgaacatga ttgataccat tagcgttctg 180
ctgcgtgaat ggaccgttat ttttctgacc ggtctggcat tttggctgtg ggaaattcgt 240
agtccgctgc atcagattga atacaaagcc aaatttttca aagaactggg ttgggcaggt 300
atcagctttg tttttcgtat tgtttatgcc tatgttagcg tggccattat caaactgctg 360
agcagcctgt ttatgggtga aagcgcaaat tttgccggtg ttatgtatgt tccgctgtgg 420
ctgcgtatta ttaccgcata tattctgcag gatctgaccg attatctgct gcatcgtacc 480
atgcatagca atcagtttct gtggctgacc cataaatggc atcatagcac caaacagagt 540
tggtggctga gcggtaataa agatagcttt accggtggtc tgctgtatac cgttaccgca 600
ctgtggtttc cgctgctgga tattccgagc gaagttatga gcgttgttgc agttcatcag 660
gtgattcata acaactggat tcacctgaat gtgaaatgga atagctggct gggtattatc 720
gaatggattt atgttacacc gcgtatccat accctgcatc atctggatac cggtggtcgt 780
aatctgagca gtatgtttac ctttattgat cgtctgtttg gcacctatgt gtttccggaa 840
aactttgata tcgaaaaaag caaaaaccgc ctggatgatc agagcgttac cgttaaaacc 900
attctgggtt tctgagaagg agatatacat atgctgaaag attttaacca gttcctgatt 960
cgtaccctgg catttgtttt tgcctttggc atttttctga caaccggtgt tggtattgca 1020
aaagcagatt atctggtgaa aggtggcaaa attaccaatg ttcagaatac cagcagcaac 1080
ggtgataatt atgcagttag cattagcggt ggttttggtc cgtgtgcaga tcgtgttatt 1140
attctgccga ccagcggtgt tattaatcgt gatattcaca tgcgtggtta tgaagcagca 1200
ctgaccgcac tgagcaatgg ttttctggtt gatatctatg attataccgg tagcagctgt 1260
agcaatggtg gccagctgac cattaccaat cagctgggta aactgattag caattgagaa 1320
ggagatatac atatgaccaa tcagaacaac caagagctgg aaaatgatct gccgattgca 1380
aaacagccgt gtccggttaa tagctataat gaatgggata ccctggaaga agttattgtt 1440
ggtagcgttg aaggtgcaat gctgcctgca ctggaaccga ttaacaaatg gacctttccg 1500
tttgaagaac tggaaagcgc acagaaaatt ctgagcgaac gtggtggtgt tccgtatccg 1560
cctgaaatga ttaccctggc acataaagaa ctgaacgagt ttattcatat cctggaagcc 1620
gaaggtgtta aagttcgtcg tgttaaaccg gttgatttta gcgttccgtt tagcacaccg 1680
gcatggcagg ttggtagcgg tttttgtgca gcaaatccgc gtgatgtttt tctggttatt 1740
ggcaacgaaa ttatcgaagc accgatggca gatcgtaatc gttattttga aacctgggca 1800
tatcgcgaaa tgctgaaaga atattttcag gcaggcgcaa aatggaccgc agcaccgaaa 1860
ccgcagctgt ttgatgcaca gtatgatttc aattttcagt ttccgcagct gggtgaaccg 1920
cctcgttttg ttgttaccga atttgaaccg acctttgatg cagccgattt tgttcgttgt 1980
ggtcgtgata tttttggcca gaaaagccat gttaccaatg gtctgggtat tgaatggctg 2040
cagcgtcatc tggaagatga atatcgcatt catatcatcg aaagccattg tccggaagca 2100
ctgcatattg ataccaccct gatgccgctg gcaccgggta aaattctggt taatccggaa 2160
tttgtggacg tgaataaact gccgaaaatt ctgaaaagct gggatattct ggttgcaccg 2220
tatccgaatc atattccgca gaatcagctg cgtctggtta gcgaatgggc aggtctgaat 2280
gttctgatgc tggatgaaga acgtgtgatc gtggaaaaaa atcaagagca gatgatcaaa 2340
gccctgaaag attggggttt taaaccgatt gtttgccact tcgaaagcta ttatccgttt 2400
ctgggtagct ttcattgtgc aaccctggat gttcgtcgtc gtggcaccct gcagagctat 2460
ttttgagaag gagatataca tatgacgacc gcagatctga ttctgatcaa taattggtat 2520
gttgtggcca aggtggaaga ttgtaaaccg ggtagcatta ccaccgcact gctgctgggt 2580
gttaaactgg ttctgtggcg tagccgtgaa cagaatagcc cgattcagat ttggcaggat 2640
tattgtccgc atcgtggtgt tgcactgagc atgggtgaaa ttgtgaataa taccctggtt 2700
tgtccgtatc atggttggcg ttataatcag gcaggtaaat gtgttcatat tccggcacat 2760
ccggatatga cccctccggc aagcgcacag gcaaaaatct atcattgtca agaacgttat 2820
ggtctggttt gggtttgtct gggtgatccg gttaatgata ttccgagtct gccggaatgg 2880
gatgatccga attatcataa tacctgcacc aagagctact ttatccaggc aagcgcattt 2940
cgtgtgatgg ataactttat tgatgtgagc cattttccgt ttgtgcatga tggtggtctg 3000
ggcgatcgta atcatgcaca gattgaagaa tttgaggtga aagtggataa agacggtatt 3060
agcattggca atctgaaact gcagatgcct cgttttaata gcagcaatga agatgatagc 3120
tggaccctgt atcagcgtat tagccatccg ctgtgtcagt attatatcac cgaaagcagc 3180
gaaattcgta cagcagatct gatgctggtt accccgattg atgaagataa ttcactggtt 3240
cgtatgctgg tgacctggaa tcgtagcgaa attctggaaa gcaccgttct ggaagaattt 3300
gatgaaacca ttgaacagga tatcccgatt attcatagcc agcagcctgc acgtctgccg 3360
ctgctgccga gcaagcagat taatatgcag tggctgagcc aagaaattca tgttccgagc 3420
gatcgttgta ccgttgcata tcgtcgttgg ctgaaagaac tgggcgttac ctatggtgtt 3480
tgttgagaag gagatataca tatgcagatt ctgggtatca gcgcctatta tcatgatagc 3540
gcagcagcaa tggttattga tggtgaaatt gttgcagcag cacaagaaga acgttttagc 3600
cgtcgtaaac atgatgcagg ttttccgacc ggtgcaatta cctattgtct gaaacaggtt 3660
ggcaccaaac tgcagtatat tgatcagatc gtgttctatg ataaaccgct ggtgaaattt 3720
gaacgtctgc tggaaaccta tctggcctat gcaccgaaag gttttggtag ttttattacc 3780
gcaatgccgg tgtggctgaa agagaaactg tatctgaaaa ccctgctgaa aaaagaactg 3840
gcactgctgg gtgaatgtaa agcaagccag ctgcctccgc tgctgtttac cagccatcat 3900
caggcacatg cagcagcagc attttttccg agcccgtttc agcgtgcagc agttctgtgt 3960
ctggatggtg ttggtgaatg ggcaaccacc agtgtttggc tgggtgaagg taataaactg 4020
acaccgcagt gggaaattga ttttccgcat agcctgggcc tgctgtatag cgcatttacc 4080
tattataccg gctttaaagt gaacagcggt gagtataaac tgatgggtct ggcaccgtat 4140
ggtgaaccga aatatgttga tcagattctg aaacatctgc tggatctgaa agaagatggc 4200
acctttcgtc tgaacatgga ttatttcaat tataccgttg gtctgaccat gaccaaccat 4260
aaatttcata gcatgtttgg tggtccgcct cgtcaggcag aaggtaaaat tagccagcgt 4320
gatatggatc tggcaagcag cattcagaaa gttaccgaag aagtgattct gcgtctggca 4380
cgtaccatta agaaagaatt aggtgttgaa tacctgtgtc tggcaggcgg tgttggtctg 4440
aattgtgttg caaatggtcg tattctgcgt gagagcgatt ttaaagatat ttggattcag 4500
cctgcagccg gtgatgcagg tagcgcagtt ggtgcagcac tggcaatttg gcatgaatat 4560
cataaaaaac cgcgtaccag caccgcaggc gatcgtatga aaggtagcta tctgggtccg 4620
agctttagcg aagcagaaat tctgcagttt ctgaacagcg tgaatattcc gtatcatcgt 4680
tgtgtggata atgaactgat ggcacgtctg gcggaaattc tggatcaggg taatgttgtt 4740
ggttggttta gcggtcgtat ggaatttggt ccgcgtgcac tgggtggtcg tagcattatt 4800
ggtgatagcc gtagcccgaa aatgcagagc gttatgaatc tgaaaatcaa atatcgcgaa 4860
agcttccgtc cgtttgcacc gagcgttctg gcagaacgtg ttagcgatta ttttgatctg 4920
gatcgtccga gcccgtatat gctgctggtt gcacaggtta aagaaaatct gcatattccg 4980
atgacccaag aacagcatga actgtttggt atcgaaaaac tgaatgttcc gcgtagccag 5040
attccggcag ttacccatgt tgattatagc gcacgtattc agaccgttca taaagaaacc 5100
aatccgcgtt attatgaact gatccgtcat tttgaagcac gtaccggttg tgcagttctg 5160
gttaatacca gctttaatgt tcgtggtgaa ccgattgtgt gtacaccgga agatgcatat 5220
cgttgtttta tgcgtaccga gatggattac ctggtgatgg aaaattttct gctggtgaaa 5280
agcgaacagc ctcgtggtaa tagtgatgaa agctggcaga aagaatttga gctggattga 5340
tactctaacc ccatcggccg tcttaggggt tttttgtcga agttcctatt ctctagaaag 5400
tataggaact tcacctgtgg ggtgactttg ccgccgctgc cgtgatgtct gcattaccga 5460
tc 5462
<210> 100
<211> 112
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 100
agtccagcct tgcaagaagc ggatacagga gtgcaaaaaa tggctatctc tagaaaggcc 60
taccccttag gctttatgca acagaaacaa taataatgga gtcatgaaca tg 112
<210> 101
<211> 114
<212> DNA
<213> 蓝藻拟柱孢藻T3 (Cylindrospermopsis raciborskii T3)
<400> 101
agtccagcct tgcaagaagc ggatacagga gtgcaaaaaa tggctatctc tagaaaggcc 60
taccccttag gctttatgca acagaaacaa taataatgga gtcatgaaca tatg 114
88

Claims (23)

1.一种在宿主细胞中生产新石房蛤毒素的方法,该方法包括以下步骤:
(A)在适合生产新石房蛤毒素的条件下,在以下底物存在下在培养基中培养宿主细胞,所述宿主细胞包含编码PPT酶和编码Sxt多肽A、B、D、G、H、I、S、T、U、V、W和X的核酸分子:
(i)S-腺苷甲硫氨酸,
(ii)精氨酸
(iii)乙酰辅酶A、丙二酰辅酶A或丙酰辅酶A,和
(iv)氨基甲酰磷酸酯,
并且其中,所述宿主细胞不包含编码Sxt多肽C、F、J、K、L、M、P、Q、R和ORF24的核酸分子;以及任选地
(B)从所述宿主细胞或所述培养基中分离和/或纯化新石房蛤毒素。
2.一种生产新石房蛤毒素或其类似物或变体的方法,该方法包括以下步骤:
(A)在反应介质中将以下底物与SxtA、B、D、G、H、I、S、T、U、V、W和X多肽接触:
(i)S-腺苷甲硫氨酸,
(ii)精氨酸
(iii)乙酰辅酶A、丙二酰辅酶A或丙酰辅酶A,和
(iv)氨基甲酰磷酸酯,
以及任选地
(B)从所述反应介质中分离和/或纯化新石房蛤毒素或其类似物或变体。
3.根据权利要求2所述的方法,其中,所述反应介质另外包含PPT酶。
4.一种在宿主细胞中生产新石房蛤毒素或其类似物或变体的方法,该方法包括以下步骤:
(A)在适合生产新石房蛤毒素或其类似物或变体的条件下,在以下底物存在下在培养基中培养宿主细胞,所述宿主细胞包含编码Sxt多肽A、B、D、G、H、I、S、T、U、V、W和X的核酸分子:
(i)S-腺苷甲硫氨酸,
(ii)精氨酸
(iii)乙酰辅酶A、丙二酰辅酶A或丙酰辅酶A,和
(iv)氨基甲酰磷酸酯;以及任选地
(B)从所述宿主细胞或所述培养基中分离和/或纯化新石房蛤毒素或其类似物或变体。
5.根据权利要求4所述的方法,其中,所述宿主细胞另外包含编码PPT酶的核酸分子。
6.根据权利要求2-5中任一项所述的方法,其中,所述底物不与Sxt多肽C、J和K中的一种或多种或所有接触,和/或所述宿主细胞不包含编码Sxt多肽C、J和K中的一种或多种或所有的核酸分子。
7.根据权利要求2-6中任一项所述的方法,其中,所述底物不与Sxt多肽Q、R和ORF24中的一种或多种或所有接触,和/或所述宿主细胞不包含编码Sxt多肽Q、R和ORF24中的一种或多种或所有的核酸分子。
8.根据权利要求2-7中任一项所述的方法,其中,所述底物不与(a)-(c)中的一个或多个中的任何Sxt多肽接触:
(a)C、Q、R和ORF24;
(b)L、Q、R和ORF24;或
(c)J、K、L、Q、R和ORF24;
和/或所述宿主细胞不包含编码(a)-(c)中的一个或多个中的任何所述Sxt多肽的核酸分子。
9.根据权利要求2-8中任一项所述的方法,其中,所述底物不与Sxt多肽F、M和P中的一种或多种或所有接触,和/或所述宿主细胞不包含编码Sxt多肽F、M和P中的一种或多种或所有的核酸分子。
10.根据前述权利要求中任一项所述的方法,其中,所述底物另外与选自由SxtC、E、J、K、L和R(优选C和/或E)组成的组中的一种或多种Sxt多肽接触,和/或所述宿主细胞另外包含编码Sxt多肽C、E、J、K、L和R(优选C和/或E)中的一种或多种的核酸分子。
11.根据前述权利要求中任一项所述的方法,其中,所述底物不与选自由SxtF、M、N、O、P、Y、Z、ORF3、ORF4、ORF29、ORF34、OMPR或HISA组成的组中的一种或多种或所有Sxt多肽接触,和/或所述宿主细胞不包含编码Sxt多肽F、M、N、O、P、Y、Z、ORF3、ORF4、ORF29、ORF34、OMPR或HISA中的一种或多种或所有的核酸分子。
12.根据前述权利要求中任一项所述的方法,其中,所述底物另外与SxtN和/或SxtDIOX接触,和/或所述宿主细胞另外包含编码SxtN和/或SxtDIOX的核酸分子。
13.根据权利要求1或4-12中任一项所述的方法,其中,所述宿主细胞是原核宿主细胞,优选细菌细胞,最优选大肠杆菌细胞。
14.根据权利要求1或4-13中任一项所述的方法,其中,所述宿主细胞是异养生物。
15.根据权利要求1或4-14中任一项所述的方法,其中,所述宿主细胞是重组宿主细胞。
16.根据前述权利要求中任一项所述的方法,其中,将所述新石房蛤毒素或其类似物或变体或其药学上可接受的盐配制成药物组合物。
17.根据权利要求16所述的方法,其中,所述配制步骤包括将分离的或纯化的新石房蛤毒素或其类似物或变体与一种或多种药学上可接受的载体、佐剂和/或赋形剂混合。
18.通过前述权利要求中任一项所述的方法生产的新石房蛤毒素或其类似物或变体。
19.一种包含编码Sxt多肽A、B、D、G、H、I、S、T、U、V、W和X的核酸分子的宿主细胞,其中,所述宿主细胞不包含编码以下的核酸分子:
(i)Sxt多肽C、J或K中的一种或多种或所有;
(ii)Sxt多肽Q、R和ORF24中的一种或多种或所有;
(iii)Sxt多肽C、Q、R和ORF24中的一种或多种或所有;
(iv)Sxt多肽L、Q、R和ORF24中的一种或多种或所有;
(v)Sxt多肽J、K、L、Q、R和ORF24中的一种或多种或所有;或
(vi)Sxt多肽F、M和P中的一种或多种或所有。
20.根据权利要求19所述的宿主细胞,其中,所述宿主细胞另外包含编码选自由SxtC、E、J、K、L和/或R(优选C和/或E)组成的组中的一种或多种Sxt多肽的核酸分子。
21.根据权利要求19或20所述的宿主细胞,其中,所述宿主细胞另外包含编码SxtN和/或SxtDIOX的核酸分子。
22.根据权利要求19-20中任一项所述的宿主细胞,其中,所述宿主细胞不包含编码选自由F、M、N、O、P、Y、Z、ORF3、ORF4、ORF29、ORF34、OMPR或HISA组成的组中的一种或多种或所有Sxt多肽的核酸分子。
23.根据权利要求19-22中任一项所述的宿主细胞,其中,所述宿主细胞是原核宿主细胞,优选细菌细胞,最优选大肠杆菌细胞。
CN201780023087.6A 2016-02-12 2017-02-10 方法 Pending CN109790558A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1602576.9A GB201602576D0 (en) 2016-02-12 2016-02-12 Process
GB1602576.9 2016-02-12
PCT/EP2017/053077 WO2017137606A1 (en) 2016-02-12 2017-02-10 Process

Publications (1)

Publication Number Publication Date
CN109790558A true CN109790558A (zh) 2019-05-21

Family

ID=55697646

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780023087.6A Pending CN109790558A (zh) 2016-02-12 2017-02-10 方法

Country Status (14)

Country Link
US (2) US10920256B2 (zh)
EP (2) EP3414334B1 (zh)
JP (1) JP2019504650A (zh)
KR (1) KR20190006478A (zh)
CN (1) CN109790558A (zh)
AU (2) AU2017218598B2 (zh)
BR (1) BR112018016346A2 (zh)
CA (1) CA3014109A1 (zh)
CL (1) CL2018002149A1 (zh)
EA (1) EA201891805A1 (zh)
GB (3) GB201602576D0 (zh)
IL (1) IL261106A (zh)
MX (1) MX2018009676A (zh)
WO (1) WO2017137606A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109097415A (zh) * 2018-08-08 2018-12-28 浙江海洋大学 一种利用产毒海洋亚硫酸杆菌发酵制备石房蛤毒素的方法
CN115466219A (zh) * 2022-07-28 2022-12-13 中国科学院天津工业生物技术研究所 一种1-[3-(2-氨基-4-乙基-1h-咪唑-5-基)丙基]胍的制备方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2609817A (en) * 2020-03-26 2023-02-15 The Cawthron Inst Trust Board Preparation of neosaxitoxin

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101903530A (zh) * 2007-10-12 2010-12-01 加利福尼亚大学董事会 被改造以产生异丙醇的微生物
US8957207B2 (en) * 2009-03-24 2015-02-17 Proteus S.A. Methods for producing phycotoxins

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE255582T1 (de) 1993-04-08 2003-12-15 Univ Columbia Verfahren zur synthese von 4-und/oder 5-(di) substituierten 2-aminoimidazolen aus 2- aminoimidazolen und aldehyden
WO1998051290A2 (en) 1997-05-16 1998-11-19 Children's Medical Center Corporation Local anesthetic formulations comprising a site 1 sodium channel blocker combined with a second active agent
JP4289694B2 (ja) 1998-04-03 2009-07-01 正昭 児玉 新規のサキシトキシン誘導体およびその製造方法
US20040029210A1 (en) 2000-12-12 2004-02-12 Robillot Cedric Emile Francois Assay for paralytic shellfish toxin
JP2003012699A (ja) 2001-07-04 2003-01-15 Japan Science & Technology Corp 抗麻酔性貝毒抗体の製法、新規抗体、該抗体を用いるelisa測定キット、該製法による系標識毒標品
EA006739B1 (ru) 2001-11-15 2006-04-28 Майкроу Элджи Корпорейшн Фармацевтические композиции, содержащие 3,4-пропинопергидропурины, и их применение для блокирования нейронной передачи
US20030148359A1 (en) 2002-01-11 2003-08-07 Yale University Saxitoxin detection and assay method
AU2003901897A0 (en) 2003-02-12 2003-05-08 Australian Institute Of Marine Science Conjugate
JP2008513407A (ja) 2004-09-21 2008-05-01 ウェックス ファーマシューティカルズ インコーポレイテッド 中枢神経由来の神経障害性疼痛の治療用テトロドトキシンおよびその誘導体
JP2008513528A (ja) 2004-09-22 2008-05-01 ウェックス ファーマシューティカルズ インコーポレイテッド 末梢神経由来の神経障害性疼痛の治療用テトロドトキシンおよびその誘導体
RU2277097C1 (ru) 2004-12-27 2006-05-27 Институт Молекулярной Генетики Российской Академии Наук (Имг Ран) Высокомеченный тритием дигидрохлорид [3h]сакситоксина
AR053811A1 (es) * 2005-02-11 2007-05-23 Esteve Labor Dr Utilizacion de un bloqueador del canal de sodio y sus analogos para el tratamiento de la dependencia de la nicotina
CA2619856A1 (en) 2005-08-25 2007-03-01 Wex Pharmaceuticals Inc. Use of sodium channel blockers for the treatment of visceral pain or pain caused by cancer treatment
EP1931349A4 (en) 2005-08-25 2009-08-05 Wex Pharmaceuticals Inc USE OF SODIUM CHANNEL BLOCKERS TO TREAT MUSCULO-SKELETAL PAIN
EP1844781A1 (en) 2006-02-22 2007-10-17 Wex Pharmaceuticals Inc. Use of sodium channel blockers for the treatment of preterm labor
EP1844782A1 (en) 2006-03-27 2007-10-17 Wex Pharmaceuticals, Inc Use of 4,9-anhydro-tetrodotoxin for the treatment of diseases related to the voltage-gated sodium channel subunit Nav1.6
EP2394646B1 (en) 2006-03-27 2018-07-25 Wex Medical Limited Use of sodium channel blockers for the treatment of neuropathic pain developing as a consequence of chemotherapy
DK2279265T3 (da) 2008-04-24 2014-12-08 Newsouth Innovations Pty Ltd Cyanobakterie-saxitoxin-gencluster og detektering af cyanotoksiske organismer
CL2009000723A1 (es) 2009-03-24 2009-06-19 Proteus Sa Metodo de purificacion industrial de ficotoxinas biologicamente activas que comprende proporcionar una cantidad adecuada de una fuente de ficotoxinas como por ejemplo el cultivo de un clon de cianobacterias.
EP2459565B1 (en) 2009-05-07 2018-05-02 The Board of Trustees of The Leland Stanford Junior University Saxitoxin derivatives, methods and compositions for studying, imaging, and treating pain
CN105640501A (zh) 2010-01-26 2016-06-08 迈克尔·A·埃文斯 用于去神经支配的方法、装置以及药剂
JP6112867B2 (ja) 2010-02-10 2017-04-12 ファイトトックス リミテッドPhytotox Limited サキシトキシン誘導体での触覚の喪失の処置
KR101939421B1 (ko) 2011-05-16 2019-01-16 뉴사우스 이노베이션즈 피티와이 리미티드 삭시톡신 생성 와편모조류의 검출
EP2638908A1 (en) 2012-03-16 2013-09-18 Phytotox SpA Paralytic Shellfish Poison
CN104427987A (zh) 2012-04-23 2015-03-18 儿童医学中心公司 延缓慢性神经病理性疼痛发作的调配物和方法
US10233219B2 (en) 2013-04-12 2019-03-19 Tufts Medical Center Methods and systems for designing and/or characterizing soluble lipidated ligand agents
AU2015243437B2 (en) 2014-04-09 2019-08-29 Siteone Therapeutics, Inc. 10',11'-modified saxitoxins useful for the treatment of pain

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101903530A (zh) * 2007-10-12 2010-12-01 加利福尼亚大学董事会 被改造以产生异丙醇的微生物
US8957207B2 (en) * 2009-03-24 2015-02-17 Proteus S.A. Methods for producing phycotoxins

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ELISABETH CAN˜ETE 等: "Improvements in the use of neuroblastoma x glioma hybrid cells", 《TOXICON》 *
宋伦 等: "黄渤海贝毒机理及产毒藻类的研究现状", 《水产科学》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109097415A (zh) * 2018-08-08 2018-12-28 浙江海洋大学 一种利用产毒海洋亚硫酸杆菌发酵制备石房蛤毒素的方法
CN115466219A (zh) * 2022-07-28 2022-12-13 中国科学院天津工业生物技术研究所 一种1-[3-(2-氨基-4-乙基-1h-咪唑-5-基)丙基]胍的制备方法
CN115466219B (zh) * 2022-07-28 2023-09-08 中国科学院天津工业生物技术研究所 一种1-[3-(2-氨基-4-乙基-1h-咪唑-5-基)丙基]胍的制备方法

Also Published As

Publication number Publication date
JP2019504650A (ja) 2019-02-21
GB201702275D0 (en) 2017-03-29
KR20190006478A (ko) 2019-01-18
AU2021201969B2 (en) 2023-02-02
US20190048375A1 (en) 2019-02-14
US10920256B2 (en) 2021-02-16
IL261106A (en) 2018-10-31
EP3414334A1 (en) 2018-12-19
US20210108239A1 (en) 2021-04-15
AU2017218598B2 (en) 2021-05-06
EA201891805A1 (ru) 2019-02-28
GB2552859A (en) 2018-02-14
CA3014109A1 (en) 2017-08-17
GB201903649D0 (en) 2019-05-01
CL2018002149A1 (es) 2019-02-15
AU2021201969A1 (en) 2021-04-29
BR112018016346A2 (pt) 2019-01-22
EP4279577A3 (en) 2024-01-24
AU2017218598A1 (en) 2018-10-04
US11566271B2 (en) 2023-01-31
WO2017137606A1 (en) 2017-08-17
EP3414334C0 (en) 2023-10-11
EP4279577A2 (en) 2023-11-22
GB2569907A (en) 2019-07-03
GB2569907B (en) 2020-04-08
EP3414334B1 (en) 2023-10-11
GB2552859B (en) 2019-09-18
MX2018009676A (es) 2019-06-06
GB201602576D0 (en) 2016-03-30

Similar Documents

Publication Publication Date Title
US20210198711A1 (en) Production of steviol glycosides in recombinant hosts
KR102491060B1 (ko) (r)-레티큘린 및 그 전구체를 제조하기 위한 조성물 및 방법
AU2021201969B2 (en) Process
AU2021201338A1 (en) Complete genome sequence of the methanogen methanobrevibacter ruminantium
CN110218244B (zh) 化合物ilamycin F及其应用
KR20200111172A (ko) 네페탈락톨 산화 환원 효소, 네페탈락톨 합성 효소, 및 네페탈락톤을 생산할 수 있는 미생물
CN107771214A (zh) 用于具有增加的2,4‑二羟基丁酸外排物的优化的2,4‑二羟基丁酸产生的修饰的微生物
CN113227364A (zh) 用于产生熊去氧胆酸及其前体的细胞和方法
AU2022256122A1 (en) Novel Proteins From Anaerobic Fungi And Uses Thereof
CN114286858B (zh) 叶酸生产菌株及其制备和应用
CN110777155B (zh) 最小霉素生物合成基因簇、重组菌及其应用
KR20210097723A (ko) 발효에 의한 1,5-디아미노펜탄의 생산을 위한 조작된 생합성 경로
CN114958627A (zh) 一株高产生育酚的重组裂殖壶菌工程菌的构建方法及应用
KR20200134333A (ko) 발효에 의한 히스타민 생산을 위해 조작된 생합성 경로
CN111117942B (zh) 一种产林可霉素的基因工程菌及其构建方法和应用
CN115335514A (zh) 罗汉果甙的生物合成
CN107208149A (zh) 结直肠癌相关疾病的生物标志物
KR20020029767A (ko) 환상 뎁시펩티드 합성효소 및 그의 유전자 및 환상뎁시펩티드의 대량생산계
CN112375725B (zh) 一种生产维生素b6的代谢工程菌株及其构建方法与应用
CN110551739A (zh) 吡唑霉素生物合成基因簇、重组菌及其应用
CN114250172B (zh) 一种海运海杆菌及其应用
CN115247179B (zh) 一种聚酮化合物骨架及其后修饰物的生物合成基因簇及其应用
CN115058401B (zh) 一种酮泛解酸羟甲基转移酶突变体、编码基因及应用
KR100889800B1 (ko) 발리다마이신 생합성 유전자 클러스터와 이의 프라이머
KR20230079107A (ko) 개선된 특성을 갖는 유전자 변형된 메틸로바실러스 세균

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190521

WD01 Invention patent application deemed withdrawn after publication