CN113166718A - 使用无抗生素选择在未灭菌条件下生长的基因工程蓝细菌 - Google Patents

使用无抗生素选择在未灭菌条件下生长的基因工程蓝细菌 Download PDF

Info

Publication number
CN113166718A
CN113166718A CN201980080144.3A CN201980080144A CN113166718A CN 113166718 A CN113166718 A CN 113166718A CN 201980080144 A CN201980080144 A CN 201980080144A CN 113166718 A CN113166718 A CN 113166718A
Authority
CN
China
Prior art keywords
seq
gene
ala
val
arg
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980080144.3A
Other languages
English (en)
Inventor
蒂亚戈·德索萨·若热·托斯卡诺·塞里奥
英厄·比吉塔·诺林
彼得·朱利安·尼克松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanyang Technological University
Original Assignee
Nanyang Technological University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanyang Technological University filed Critical Nanyang Technological University
Publication of CN113166718A publication Critical patent/CN113166718A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/38Chemical stimulation of growth or activity by addition of chemical compounds which are not essential growth factors; Stimulation of growth by removal of a chemical compound
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • C12N9/80Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5) acting on amide bonds in linear amides (3.5.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • C12N9/86Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5) acting on amide bonds in cyclic amides, e.g. penicillinase (3.5.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y120/00Oxidoreductases acting on phosphorus or arsenic in donors (1.20)
    • C12Y120/01Oxidoreductases acting on phosphorus or arsenic in donors (1.20) with NAD+ or NADP+ as acceptor (1.20.1)
    • C12Y120/01001Phosphonate dehydrogenase (1.20.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/01Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in linear amides (3.5.1)
    • C12Y305/01084Biuret amidohydrolase (3.5.1.84)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/02Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amides (3.5.2)
    • C12Y305/02015Cyanuric acid amidohydrolase (3.5.2.15)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04003Guanine deaminase (3.5.4.3)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及代谢工程细胞增加其与污染微生物竞争而无需抗生素的能力的方法。更特别地,本发明提供了工程蓝细菌以利用三聚氰胺作为氮源,亚磷酸盐作为磷源,任选地还利用NADP+而不是NAD+的方法,并且还提供了使用这种方法制造的基因工程蓝细菌。在特定的实施方式中,基因工程细胞是由至少一种多核苷酸分子转化的蓝细菌,该多核苷酸分子包括与至少一个启动子可操作地连接的异源三聚氰胺利用途径基因atzD、trzE、DUR1,2、trzC、guaD和triA以及/或者包括进一步的亚磷酸盐脱氢酶(ptxD)基因。

Description

使用无抗生素选择在未灭菌条件下生长的基因工程蓝细菌
发明领域
本发明涉及代谢工程细胞增加其与污染微生物竞争而无需抗生素的能力的方法。更特别地,本发明提供了工程蓝细菌以利用三聚氰胺作为氮源,亚磷酸盐作为磷源,任选地还利用NADP+而不是NAD+的方法,并且还提供了使用这种方法制造的基因工程细胞。
背景技术
作为推进碳中和经济的努力的一部分,蓝细菌正在越来越多地被用于代谢工程。它们是光合自养生物,能够以相当简单的要求生长——具有无机氮和磷源的最少培养基,使用光用于能源生成并且将CO2作为唯一的碳输入。近年来,已证明蓝细菌能够产生大量不同的分子,从商品化学品诸如乳酸盐或乙醇[Angermayr等人,Applied and environmentalmicrobiology. 78:7098-106.10.1128/AEM.01587-12(2012);Dexter等人,J ApplMicrobiol. 119:11-24.10.1111/jam.12821(2015);Gordon等人,Metab Eng.38: 170-179.10.1016/j.ymben.2016.07.007(2016),至生物燃料(例如,游离脂肪酸 [Kato等人,Biotechnol Biofuels.10:141.10.1186/s13068-017-0831-z(2017); Ruffing,Frontiersin bioengineering and biotechnology.2:17(2014)]或丁醇 [Fathima等人,BiotechnolBiofuels.11:188.10.1186/s13068-018-1187-8 (2018);Shabestary等人,ACS SynthBiol.7:1669-1675(2018)]至特别的化学品诸如金合欢烯[Halfmann等人,Appl MicrobiolBiotechnol.98:9869 (2014)],角鲨烯[Choi等人,ACS Synth Biol.6:1289-1295(2017);Englund等人,PLoS One.9:e90270.10.1371/journal.pone.0090270(2014)]或柠烯[Wang等人,Proceedings of the National Academy of Sciences of the United States ofAmerica.113:14225-14230(2016)]。快速生长的海洋菌株,诸如聚球藻 (Synechococcussp.)PCC 7002(以下为“Syn7002”)引起特别关注,是因为它能够在海水中生长(因此不竞争淡水资源),耐受高光强度和最高达40℃的温度(在大型露天设施中很有用)。此外,它是自然可转化的,具有大约4小时的最佳分裂时间和可用的基因组序列[Begemann等人,PLoSOne.8: e76594.10.1371/journal.pone.0076594(2013);Clark等人,Metab Eng.47: 230-242(2018);Frigaard等人,Methods Mol Biol.274:325-40(2004);Gordon 等人,MetabEng.38:170-179.10.1016/j.ymben.2016.07.007(2016);Ludwig and Bryant,Frontiersin microbiology.2:41(2011);Ludwig and Bryant, Frontiers in microbiology.3:354(2012);Markley等人,ACS Synth Biol.4:595 (2015);Perez等人,Journal ofbacteriology.10:1128(2016);Xu等人,Methods Mol Biol.684:273-93(2011)]。
大型蓝细菌培养可以在半封闭系统诸如吊袋中,或者在开放系统,是跑道池或气提式贮水池中进行[Schoepp等人,Bioresour Technol.166:273-81 (2014)]。封闭系统具有更高可控性、培养物污染的机会更少以及通常更高的生长产率的优点。然而,与迄今为止发现的最经济可行的替代的具有气提式贮水池或跑道池的开放系统相比,封闭系统运行基本上更加昂贵 [Schoepp等人,Bioresour Technol.166:273-81(2014)]。另一方面,开放系统具有暴露于环境中的明显缺点,并且因此更易于受到污染。通过使用抗生素和抗生素抗性蓝细菌菌株通常将污染的威胁降至最低。运行具有携带抗生素抗性基因的蓝细菌菌株的大型开放系统,一旦培养物逃逸,会带来严重的生物危害,并且通过水平基因转移,可能有助于抗生素抗性向环境致病物种的传播。
最近,已经探索了使用生态上稀有或异生源的常量营养素来作为手段,以对转基因生物在不使用抗生素下生长来生成选择压力[Kanda等人,J Biotechnol.182:68-73(2014);Loera-Quezada等人,Plant Biotechnol J.14: 2066(2016);Pandeya等人,PlantMol Biol.95:567-577(2017);Polyviou等人,Environmental microbiology reports.7:824-30(2015);Shaw等人,Science. 353:583-6(2016)]以及允许转基因植物竞争过杂草,同时消耗显著更少的磷 [Lopez-Arredondo and Herrera-Estrella,Nat Biotechnol.30:889(2012)]。亚磷酸盐脱氢酶(PtxD)是一种将亚磷酸盐(一种生态学上罕见的磷形式)转化为磷酸盐的酶,已被引入多种生物中[Kanda等人,J Biotechnol.182:68-73(2014);Lopez-Arredondo and Herrera-Estrella,Nat Biotechnol.30:889(2012);Nahampun等人,Plant Cell Rep.35:1121-1132(2016);Pandeya等人,Plant Mol Biol.95:567-577(2017)]。还已经设计出利用异生的富氮化合物三聚氰胺的合成途径,并将其引入不同的生物中[Shaw等人,Science.353:583-6 (2016)]。在大肠杆菌(Escherichia coli)中引入完整的途径(由6种酶组成)允许携带菌株克服蓄意的污染[Shaw等人,Science.353:583-6(2016)]。
在许多情况下,借助于抗生素盒将这些途径或基因引入靶生物 [Loera-Quezada等人,Plant Biotechnol J.14:2066(2016);Motomura等人, ACS Synth Biol.10:1021(2018);Shaw等人,Science.353:583-6(2016)]。即使这证明了这些途径为携带它们的生物带来了优势,但一种或多种抗生素抗性盒的水平基因转移风险仍然存在。
鉴于上述缺陷,期望提供用于生产工程微生物的方法,该工程微生物可以更有效地与污染物竞争而没有将抗生素抗性基因转移至环境中的风险。
发明内容
本发明提供了工程蓝细菌菌株的方法,其能够在作为唯一N和Pi源的三聚氰胺和/或亚磷酸盐上生长,通过使用代谢选择来驱动它们的基因组整合而无需抗生素选择。通过实验室的演变,获得了七种不同的聚球藻PCC 7002突变菌株,其可以在作为唯一N源的三聚氰胺上生长。另外,使用ptxD 基因或其突变体和亚磷酸盐也被示为是此蓝细菌物种中有效的代谢选择标志物。用三聚氰胺和亚磷酸盐代谢途径转化的细胞能够分别使用作为N和 Pi源的三聚氰胺和亚磷酸盐生长,并且可以耐受并且轻易竞争过污染,即使在大量过量污染中。
三聚氰胺突变菌株均具有影响triA基因的突变,并且以Mel 1表示,具有Trp471stop突变;Mel4,具有Leu88Phe突变;Mel5,在核糖体结合位点(RBS)中具有AGGAGA至AGAAGA的突变;Mel6,具有Glu317Lys突变;Mel7,具有His254Tyr突变;Mel8,具有Ala355Val突变;以及Mel5evo,除了在RBS中具有与Mel5相同的AGGAGA至AGAAGA突变外,在triA 中具有Thr218Asn突变和Val278Met突变。
根据第一方面,本发明提供了一种分离的基因工程蓝细菌,其中,所述蓝细菌已被至少一种多核苷酸分子转化,所述至少一种多核苷酸分子包括与至少一个启动子可操作地连接的异源三聚氰胺利用途径基因atzD、 trzE、DUR1,2、trzC、guaD和triA,其中;
i)所述triA基因包括编码氨基酸取代的一个或多个突变,其中,所述氨基酸取代位于选自包括以下的组的位置:Leu88Phe、His254Tyr、Glu317Lys、 Ala355Val、Trp471Stop以及Thr218Asn和Val278Met的组合;
和/或
ii)所述triA基因具有包括AGGAGA至AGAAGA突变的核糖体结合位点(RBS),
其中,所述基因工程蓝细菌不具有异源抗生素抗性基因。
根据另一方面,本发明提供了分离的基因工程蓝细菌,其中,所述蓝细菌已被至少一种多核苷酸分子转化,所述至少一种多核苷酸分子包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因,其中,所述ptxD 基因包括SEQ ID NO:89(天然)、SEQ ID NO:90(MelPhi)或SEQ ID NO: 91(NADP)所示的多核苷酸序列,
其中,所述基因工程蓝细菌不具有异源抗生素抗性基因。
根据另一方面,本发明提供重组载体,所述重组载体包括与至少一个启动子可操作地连接的三聚氰胺途径基因triA、DUR1,2、atzD、trzC、trzE 和guaD,其中
i)所述triA基因包括编码氨基酸取代的一个或多个突变,其中,所述氨基酸取代位于选自包括以下的组的位置:Leu88Phe、His254Tyr、Glu317Lys、 Ala355Val、Trp471Stop以及254His和Val278Met的组合;
和/或
ii)所述triA基因具有包括AGGAGA至AGAAGA突变的核糖体结合位点(RBS),
其中,所述载体缺失抗生素抗性基因。
在一些实施方式中,重组载体进一步包括多核苷酸,该多核苷酸包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因。
根据另一方面,本发明提供在基因工程蓝细菌细胞中表达产物的方法,包括步骤:
a)根据本发明的任何方面,在无抗生素并且三聚氰胺为氮源的培养基中,培养多个基因工程蓝细菌细胞,所述基因工程蓝细菌细胞包括异源三聚氰胺利用途径基因和包括编码RNA和/或蛋白质产物的可表达多核苷酸的至少一种外源多核苷酸,其中,培养有利于代谢三聚氰胺的蓝细菌细胞的生长,
b)在用于表达所述产物的条件下培养所述基因工程蓝细菌细胞。
根据另一方面,本发明提供在基因工程蓝细菌细胞中表达产物的方法,包括步骤:
a)在无抗生素、三聚氰胺为氮源并且亚磷酸盐为磷源的培养基中,培养多个基因工程蓝细菌细胞,所述基因工程蓝细菌细胞包括异源三聚氰胺利用途径基因和亚磷酸盐代谢基因和包括编码RNA和/或蛋白质产物的可表达多核苷酸的至少一种外源多核苷酸,其中,培养有利于代谢三聚氰胺和亚磷酸盐的蓝细菌细胞的生长;,
b)在用于表达所述产物的条件下培养所述基因工程蓝细菌细胞。
附图说明
图1示出了三聚氰胺选择工具的概述。(A)三聚氰胺利用途径反应。一 mol的三聚氰胺产生6mol的氨和3mol的二氧化碳。(B)三聚氰胺利用操纵子的示意图。所示引物用于证实该途径的全基因组整合。不同部分均不按比例(C)PCR反应的0.6%琼脂糖凝胶使用A中所示的引物进行。(参见表1 的序列)
图2示出了在包含三聚氰胺的培养基中利用三聚氰胺的菌株的生长。(A) 野生型(WT)Syn7002和利用三聚氰胺的菌株的生长曲线。(B)接种后48小时的培养物样品。对所有菌株计算了将OD730转化为克干细胞重量(gDCW)·L-1的因子,并且这些因子可以在表2中找到。
图3A-3B示出了如通过Illumina测序发现的在不同的利用三聚氰胺的菌株中,triA基因座的突变的示意图。Mel1在原始终止密码子之前具有4 个氨基酸的突变(图3A)。在不同的利用三聚氰胺的菌株中,triA基因座的多序列比对(图3B)。
图4示出了在指示的时间点在用过的培养基中三聚氰胺途径中间体 LC-MS/MS定量。(A)三聚氰胺;(B)三聚氰酸二酰胺;(C)三聚氰酸一酰胺; (D)氰尿酸。还包括接种在AD7-Mel培养基中的WT培养物的定量,作为对照。注意三聚氰胺(以mM)和其余中间体(以μM)的比例差异。由于比例,误差线可能不明显。
图5示出了在包含2mM或4mM三聚氰胺的AD7-Mel培养基中生长的Mel5菌株的生长曲线。
图6示出了利用亚磷酸盐的菌株在包含磷酸盐(Pho)和亚磷酸盐(Phi)的 AD7培养基中的生长。(A)WT Syn7002(左)和利用亚磷酸盐的菌株(右)在包含Pho或不同浓度Phi的AD7培养基中的生长曲线,如所示。(B)接种后 48小时的培养物样品的细节。可以在表2中找到将OD730转化为克干细胞重量(gDCW)·L-1的因子。
图7示出了亚磷酸盐选择工具的概述。(A)顶部——pSJ135的细节,包括用于染色体整合PCR的引物。底部——构建体pSJ141的细节,其使用亚磷酸盐以驱动异源基因(YFP)的染色体整合。(B)PCR的0.8%琼脂糖凝胶,在WT和Mel5背景两者下均示出ptxD基因的基因组整合和YFP基因的 ptxD驱动整合。(C)用pSJ135和pSJ141转化的菌株相对于各自的背景菌株的YFP荧光。
图8A-8C示出了敲除Syn7002中推定的膦酸盐转运蛋白同源物 A0336(顶部)和G0143(底部)。(图8A)敲除构建体质粒pSJ156(顶部)和 pSJ157(底部)的示意图。各个元件未按比例。(图8B)用于A0935-ptxD推定的膦酸盐转运蛋白同源物敲除菌株的分离凝胶。(图8C)在AD7-Pho 1x(左) 或AD7-Phi 20x(右)中,A0935-ptxD亲本菌株和衍生的敲除菌株的稀释涂布。注意:ΔA–ΔA0336::SpR;ΔG–ΔG0143::GmR
图9示出利用三聚氰胺和亚磷酸盐的菌株的表征。(A)在常规AD7培养基或AD7-MelPhi 20x中的WT和Mel5-A0935ptxD(“MelPhi”)菌株的生长曲线。(B)接种后48小时的培养物样品的细节。对于在AD7-Mel Pho 1x 或AD7-Mel Phi 20x中的MelPhi菌株,计算了将OD730转化为克干细胞重量(gDCW)·L-1的因子,并且这些因子可以在表2中找到。(C)通过流式细胞术测量的以下生长曲线:在Syn7002 WT背景中表达YFP的菌株(“纯 YFP”,在常规AD7中生长);MelPhi菌株(“纯MelPhi”,缺失YFP,在AD7-Mel Phi 20x中生长);或者在AD7-Mel Phi20x中,在YFP(在WT背景中)与 MelPhi(缺失YFP)以6:1的细胞比率组合的两种菌株的混合培养物。“混合物YFP”是混合物中YFP菌株的细胞计数,以及“混合物MelPhi”是混合物中MelPhi菌株的细胞计数。
图10示出了WT、Mel5和Re-Mel5菌株在正常AD7-NO3或AD7-Mel 中的生长曲线。
图11示出了通过流式细胞术测量的以下生长曲线:在Syn7002 WT背景中表达YFP的菌株(“纯YFP”,在常规AD7中生长);MelPhi菌株(“纯 MelPhi”,缺失YFP,在AD7-Mel Phi20x中生长);或者在AD7-Mel Phi 20x 中,在YFP(在WT背景中)与MelPhi(缺失YFP)以10:1的细胞比率组合的两种菌株(“混合物YFP”和“混合物MelPhi”)的混合培养物。
图12示出了用于污染实验中细胞计数的门控策略。示出的数据是针对在T=100小时下,10:1混合培养实验之一。YFP和MelPhi纯培养物和混合培养物在点绘图上绘制的左门(顶部至底部);相同样品的中间直方图绘图;使用YFP与前向散射对相同样品进行的右点绘图,用于定量。SSC–侧向散射;FSC-前向散射
图13示出了Syn7002 WT和利用三聚氰胺和亚磷酸盐的菌株在具有硝酸盐(NO3)或三聚氰胺(Mel)和磷酸盐(Pho)或亚磷酸盐(Phi)的AD7中的生长曲线。所有板均在30℃、80μE·m-2·s-1和1%CO2下生长5天。
图14示出了MelPhi菌株在AD7-Mel Phi 20x(2L的培养物总体积)中,在两个带挡板的1L锥形烧瓶中在11天的时间段内的生长曲线。
图15示出了MelPhi菌株(MelPhi WT)和MelPhi菌株的衍生物 (MelPhiAQ)的生长曲线,在其中,PtxD酶被突变为使用NADP+代替 NAD+(因为蓝细菌具有的NADP+比NAD+更多)。使用分批补料策略生长菌株,每天添加三聚氰胺(将600μL的20mM三聚氰胺储备液加入12mL 培养物中)以继续生长至更高密度。达到的最高密度为约70的OD730
图16示出了在12mM三聚氰胺中Mel5菌株和进化的Mel5菌株(以“Mel5evo”表示)的生长曲线。Mel5菌株无法在12mM三聚氰胺中生长,但是Mel5evo菌株可以并且生长至约50的OD730
定义
为了方便起见,这里收集了说明书、实施例和所附权利要求书中应用的某些术语。
如本文所用,术语“氨基酸”或“氨基酸序列”是指寡肽、肽、多肽或蛋白质序列,或任何这些的片段,并且是指天然存在的或合成的分子。本文所述的“氨基酸序列”是指天然存在的蛋白质分子的氨基酸序列,“氨基酸序列”和类似术语并不意指将氨基酸序列限制为与所述蛋白质分子相关的完整的天然氨基酸序列。
如本文所用,术语“包括(comprising)”或“包括(including)”应解释为指定所指的所述特征、整数、步骤或组分的存在,但不排除一个或多个特征、整数、步骤或组分或其组的存在或增加。然而,在本公开的上下文中,术语“包括(comprising)”或“包括(including)”也包括“由……组成”。单词“包括(comprising)”,诸如“包括(comprise)”和“包括(comprises)”,以及“包括(including)”,诸如“包括(include)”和“包括(includes)”具有相应变化含义的变体。
如本文所用,将术语“基因突变”定义为其具有至少一个核苷酸序列从野生型序列经由以下变化的基因突变:可以增强基因活性或者可以导致编码蛋白质的氨基酸序列与野生型蛋白质相比相对更具活性的至少一个核苷酸的取代、缺失或添加。例如,可以突变至少一个天然或野生型三聚氰胺脱氨酶(triA)基因和/或其核糖体结合位点(RBS)AGGAGA以增加三聚氰胺代谢。
将术语“分离的”在本文定义为基本上从自然存在组分的生物体的细胞中的其他生物组分(即其他染色体和额外染色体DNA和RNA)和蛋白质分离、分开生产或纯化出的生物组分(诸如核酸、肽或蛋白质)。因此,已分离的核酸、肽和蛋白质包括通过标准纯化方法纯化的核酸和蛋白质。该术语还涵盖通过在宿主细胞中重组表达制备的核酸、肽和蛋白质,以及化学合成的核酸。
如本文所用,短语“核酸”或“核酸序列”是指寡核苷酸、核苷酸、多核苷酸或其任何片段,是指可以为单链或双链的并且可以表示正义链和反义链的基因组或合成来源DNA或RNA,是指肽核酸(PNA),或是指任何类似DNA或类似RNA的材料。
如本文所用,术语“可操作地连接”意指对其中应用术语的组分处于允许它们在适当条件下执行其固有功能的关系中。例如,将与蛋白质编码序列“可操作地连接”的控制序列连接到其上,使得在与控制序列的转录活性相容的条件下实现蛋白质编码序列的表达。借助于实例,当第一核酸序列与第二核酸序列处于功能关系时,第一核酸序列与第二核酸序列可操作地连接。例如,如果启动子影响编码序列的转录或表达,则启动子与编码序列可操作地连接。通常,可操作地连接的DNA序列是连续的,并且在需要结合两个蛋白质编码区的情况下,它们在同一阅读框中。
如本文所用,术语“突变体”意指以下的多核苷酸:可以编码保留活性的示例性催化酶的突变体,或可以具有突变,例如在其RBS中,其增强了催化酶生产。如本文所用,催化酶的“突变体”是指被一个或多个氨基酸改变的氨基酸序列。突变体可以具有“保守”变化,其中,取代的氨基酸具有相似的结构或化学特性(例如,用异亮氨酸替代亮氨酸)。更少见的是,突变体可以具有“非保守”变化(例如,用色氨酸替代甘氨酸)。类似的微小变化也可包括氨基酸缺失或插入,或两者。使用本领域众所周知的计算机程序,例如DNASTAR软件,可以找到确定哪些氨基酸残基可以被取代、插入或缺失而不丧失催化活性的指导。在一些实施方式中,突变酶在氨基酸水平上为至少80%、85%、90%、95%、96%、97%、98%、99%或更高,优选至少90%同源或同一性,以示例性本文描述的氨基酸序列(例如,三聚氰胺脱氨酶)或其功能片段——例如,在约:50、55、60、65、70、75、 80、85、90、95或100%的长度上,优选成熟参考序列长度的至少90%,但仍保持催化活性。优选地,所述变体酶在氨基酸水平上具有至少90%的同一性并保持催化活性。示例性的三聚氰胺脱氨酶突变体在具有增加活性的His254Tyr取代的Mel7(SEQ ID NO:87)中表示为SEQ ID NO:64。254Tyr 可能被其他氨基酸替代(保守取代)并保留了活性。
载体可以以适于在宿主细胞中表达的一个或多个核酸的形式包括一个或多个催化酶核酸。优选地,重组表达载体包括与预表达的一个或多个核酸序列可操作地连接的一个或多个调控序列。术语“调控序列”包括启动子、增强子、核糖体结合位点和/或IRES元件和其他表达控制元件(例如,聚腺苷酸化信号)。调控序列包括指导核苷酸序列组成型表达的那些,诸如本文实例中公开的Pc223启动子。表达载体的设计可以取决于如选择预转化的宿主细胞、期望蛋白质的表达水平等这样的因素。可以将本发明的表达载体引入宿主细胞,从而产生由如本文描述的核酸编码的包括融合蛋白或多肽的蛋白质或多肽(例如,催化酶蛋白质)。
可以设计本发明的重组表达载体用于在原核或真核细胞中,更特别在原核细胞中,表达催化酶蛋白质。例如,本发明的多肽可以在细菌(例如,蓝细菌)或酵母细胞中表达。合适的宿主细胞在Goeddel,(1990)Gene Expression Technology:Methods inEnzymology 185,Academic Press,San Diego,Calif.中进一步讨论。
上文描述的方法利用酶催化反应的序列。尽管这些反应可以单独地,或者更特别地将它们中的两个或更多个组合进行,但是特别优选地将所有反应组合在级联反应序列中,该级联反应序列在一锅中提供来自初始原料的产物,从而消除了分离中间体的需要,并且潜在地提高了反应序列的总产率。
在本发明中,新型工程细菌不包含抗生素抗性基因,并且而是利用三聚氰胺和亚磷酸盐与污染物竞争。此外,本发明的工程细胞在triA基因中和/或在其RBS中包括突变,其改进了生物的生长,其中一些可以在12mM 的三聚氰胺中健壮生长。另外,亚磷酸盐代谢基因ptxD可以被突变以利用 NADP+代替NAD+。
具体实施方式
本说明书中提及的参考文献是为了方便起见以文献列表的形式列出的,并添加在实施例的末尾。这些参考文献的全部内容上下文通过援引并入本文,但其在说明书中的提及并不意味着它们构成一般通用常识的一部分。
根据第一方面,本发明提供了一种分离的基因工程蓝细菌,其中,所述蓝细菌已被至少一种多核苷酸分子转化,所述至少一种多核苷酸分子包括与至少一个启动子可操作地连接的异源三聚氰胺利用途径基因atzD、 trzE、DUR1,2、trzC、guaD和triA,其中;
i)所述triA基因包括编码氨基酸取代的一个或多个突变,其中,所述氨基酸取代位于选自包括以下的组的位置:Leu88Phe、His254Tyr、Glu317Lys、 Ala355Val、Trp471Stop以及Thr218Asn和Val278Met的组合;
和/或
ii)所述triA基因具有包括AGGAGA至AGAAGA突变的核糖体结合位点(RBS),
其中,所述基因工程蓝细菌不具有异源抗生素抗性基因。
在一些实施方式中,蓝细菌是聚球藻Syn7002。
在一些实施方式中,triA基因编码选自包括以下的组的氨基酸序列: SEQ ID NO:56(天然,Mel5)、SEQ ID NO:58(Mel1)、SEQ ID NO:60(Mel4)、 SEQ ID NO:62(Mel6)、SEQID NO:64(Mel7)、SEQ ID NO:66(Mel8)和SEQ ID NO:68(Mel5evo)。在一些实施方式中,triA基因多核苷酸序列具有与选自包括以下的组的triA基因的多核苷酸序列至少80%、至少85%、至少90%、至少95%序列同一性或100%序列同一性:SEQ ID NO:57、SEQ ID NO:59(Mel1)、SEQ ID NO:61(Mel4)、SEQ ID NO:63(Mel6)、SEQ ID NO: 65(Mel7)、SEQ ID NO:67(Mel8)、SEQ ID NO:69(Mel5evo)和SEQ ID NO: 70(Mel5)。
应当理解,由于遗传密码中的冗余,核酸序列可以具有小于100%的同一性并且仍然编码相同的氨基酸序列。
在一些实施方式中,triA基因包括选自包括以下的组的多核苷酸序列: SEQ IDNO:57(天然)、SEQ ID NO:59(Mel1)、SEQ ID NO:61(Mel4)、SEQ ID NO:63(Mel6)、SEQ IDNO:65(Mel7)、SEQ ID NO:67(Mel8)、SEQ ID NO: 69(Mel5evo)和SEQ ID NO:70(Mel5密码子opt)。
优选地,triA基因包括SEQ ID NO:69或SEQ ID NO:70中所示的多核苷酸序列。
在一些实施方式中,异源trzE基因包括与SEQ ID NO:71或72中所示的多核苷酸序列至少80%、至少85%、至少90%、至少95%序列同一性或 100%序列同一性的多核苷酸序列;trzC基因包括与SEQ ID NO:73或74中所示的多核苷酸序列至少80%、至少85%、至少90%、至少95%序列同一性或100%序列同一性的多核苷酸序列;DUR1,2基因包括与SEQ IDNO:75 或76中所示的多核苷酸序列至少80%、至少85%、至少90%、至少95%序列同一性或100%序列同一性的多核苷酸序列;atzD基因包括与SEQ ID NO:77或78中所示的多核苷酸序列至少80%、至少85%、至少90%、至少 95%序列同一性或100%序列同一性的多核苷酸序列;和/或guaD基因包括与SEQ ID NO:79、80或81(Arg352Ser)中所示的多核苷酸序列至少80%、至少85%、至少90%、至少95%序列同一性或100%序列同一性的多核苷酸序列。
在一些实施方式中,异源trzE基因包括SEQ ID NO:71或72(密码子优化的)中所示的多核苷酸序列;trzC基因包括SEQ ID NO:73或74(密码子优化的)中所示的多核苷酸序列;DUR1,2基因包括SEQ ID NO:75或76(密码子优化的)中所示的多核苷酸序列;atzD基因包括SEQ ID NO:77或78(密码子优化的)中所示的多核苷酸序列;和/或guaD基因包括SEQID NO:79、 80(密码子优化的)或81(Arg352Ser)中所示的多核苷酸序列。
在一些实施方式中,atzD基因来自假单胞菌(Pseudomonas sp.)菌株 ADP、trzE基因来自红球菌(Rhodococcus sp.)Mel、DUR1,2基因来自酿酒酵母(S.cerevisiae)、trzC基因来自瓜类细菌性果斑病菌(A.citrulli)NRRL B-12227、guaD基因来自大肠杆菌K-12以及triA基因来自瓜类细菌性果斑病菌NRRL B-12227。
在一些实施方式中,所述三聚氰胺利用途径基因的每一个具有核糖体结合位点(RBS)。适合的RBS的实例具有多核苷酸序列AGGAGA。有利地,可以使用包括多核苷酸序列AGAAGA的突变体RBS。更特别地,该突变体RBS与triA基因连接。应当理解,IRES可能适合代替与atzD、trzE、 DUR1,2、trzC和guaD基因连接的一个或多个RBS。
在一些实施方式中,所述至少一个启动子是组成型启动子。应当理解,存在适合于驱动三聚氰胺途径基因表达的已知启动子,诸如Ptrc、PpsbA、PcpcB和Pc223。优选地,启动子是强启动子,诸如Pc223[Markley等人,ACS Synth Biol.4:595(2015)]。
在一些实施方式中,所述组成型启动子是Pc223(SEQ ID NO:82)。
在一些实施方式中,所述异源三聚氰胺利用途径基因从单个启动子表达,作为基因操纵子的一部分。
在一些实施方式中,基因操纵子多核苷酸序列选自包括以下的组:SEQ ID NO:83(Mel1菌株)、SEQ ID NO:84(Mel4菌株)、SEQ ID NO:85(Mel5 菌株)、SEQ ID NO:86(Mel6菌株)、SEQ ID NO:87(Mel7菌株)和SEQ ID NO: 88(Mel8菌株)。
在一些实施方式中,至少一个多核苷酸分子进一步包括多核苷酸,该多核苷酸包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因。结果示出,ptxD可以单独用于重组菌株的选择,无需抗生素选择。还可以将 ptxD基因与三聚氰胺途径基因(MelPhi菌株)组合使用,以更严格的选择方法来生产与缺失这些异源基因的污染细菌激烈竞争的菌株。而且,生成了允许工程菌株利用NADP+而不是NAD+的ptxD的突变体形式。
在一些实施方式中,ptxD基因包括SEQ ID NO:89(天然)、SEQ ID NO: 90(MelPhi)或SEQ ID NO:91(NADP)中所示的多核苷酸序列。
在一些实施方式中,与ptxD基因连接的启动子可以选自包括以下的组: Ptrc、PpsbA、PcpcB和Pc223。在一些实施方式中,与ptxD基因连接的启动子是包括SEQ ID NO:92中所示的多核苷酸序列的psbA。
在一些实施方式中,所述异源亚磷酸盐脱氢酶(ptxD)基因从单个启动子表达,作为基因操纵子的一部分,其中,所述操纵子多核苷酸序列在SEQ ID NO:93中示出。
在一些实施方式中,本发明的分离的基因工程蓝细菌进一步包括外源多核苷酸,该外源多核苷酸包括编码RNA和/或蛋白质产物的可表达多核苷酸。
根据另一方面,本发明提供了分离的基因工程蓝细菌,其中,该蓝细菌已被至少一个多核苷酸分子转化,至少一个多核苷酸分子包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因,其中,所述ptxD基因包括SEQ ID NO:89(天然)、SEQ ID NO:90(MelPhi)或SEQ ID NO:91(NADP) 中所示的多核苷酸序列,并且其中,所述基因工程蓝细菌不具有异源抗生素抗性基因。
优选地,ptxD基因包括SEQ ID NO:90或SEQ ID NO:91中所示的多核苷酸序列。
根据另一方面,本发明提供重组载体,所述重组载体包括与至少一个启动子可操作地连接的三聚氰胺途径基因triA、DUR1,2、atzD、trzC、trzE 和guaD,其中
i)triA基因包括编码氨基酸取代的一个或多个突变,其中,该氨基酸取代位于选自包括以下的组的位置:Leu88Phe、His254Tyr、Glu317Lys、 Ala355Val、Trp471Stop以及Thr218Asn和Val278Met的组合;
和/或
ii)所述triA基因具有包括AGGAGA至AGAAGA突变的核糖体结合位点(RBS),
其中,所述载体缺失抗生素抗性基因。
在一些实施方式中,triA基因编码选自包括以下的组的氨基酸序列: SEQ ID NO:56(天然,Mel5)、SEQ ID NO:58(Mel1)、SEQ ID NO:60(Mel4)、 SEQ ID NO:62(Mel6)、SEQID NO:64(Mel7)、SEQ ID NO:66(Mel8)和SEQ ID NO:68(Mel5evo)。
在一些实施方式中,triA基因包括选自包括以下的组的多核苷酸序列: SEQ IDNO:57(天然)、SEQ ID NO:59(Mel1)、SEQ ID NO:61(Mel4)、SEQ ID NO:63(Mel6)、SEQ IDNO:65(Mel7)、SEQ ID NO:67(Mel8)、SEQ ID NO: 69(Mel5evo)和SEQ ID NO:70(Mel5)。
在一些实施方式中,异源基因trzE包括SEQ ID NO:71或72(密码子优化的)中所示的多核苷酸序列;trzC包括SEQ ID NO:73或74(密码子优化的) 中所示的多核苷酸序列;DUR1,2包括SEQ ID NO:75或76(密码子优化的) 中所示的多核苷酸序列;atzD包括SEQ IDNO:77或78(密码子优化的)中所示的多核苷酸序列;guaD包括SEQ ID NO:79、80(密码子优化的)或 81(Arg352Ser)中所示的多核苷酸序列。
在一些实施方式中,atzD基因来自假单胞菌菌株ADP、trzE基因来自红球菌Mel、DUR1,2基因来自酿酒酵母、trzC基因来自瓜类细菌性果斑病菌B-12227、guaD基因来自大肠杆菌以及triA基因来自瓜类细菌性果斑病菌B-12227。
在一些实施方式中,所述三聚氰胺利用途径基因的每一个具有核糖体结合位点(RBS)。适合的RBS的实例具有多核苷酸序列AGGAGA。有利地,可以使用包括多核苷酸序列AGAAGA的突变体RBS。更特别地,该突变体RBS与triA基因连接。应当理解,IRES可能适合代替与atzD、trzE、 DUR1,2、trzC和guaD基因连接的一个或多个RBS。
在一些实施方式中,所述至少一个启动子是组成型启动子。应当理解,存在适合于驱动三聚氰胺途径基因表达的已知启动子,诸如Ptrc、PpsbA、PcpcB和Pc223。优选地,启动子是强启动子,诸如Pc223[Markley等人,ACS Synth Biol. 4:595(2015)]。
在一些实施方式中,所述组成型启动子是Pc223(SEQ ID NO:82)。
在一些实施方式中,所述异源三聚氰胺利用途径基因从单个启动子表达,作为基因操纵子的一部分。
在一些实施方式中,基因操纵子多核苷酸序列选自包括以下的组:SEQ ID NO:83(Mel1)、SEQ ID NO:84(Mel4)、SEQ ID NO:85(Mel5)、SEQ ID NO: 86(Mel6)、SEQ ID NO:87(Mel7)和SEQ ID NO:88(Mel8)。
在一些实施方式中,至少一个多核苷酸分子进一步包括多核苷酸,该多核苷酸包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因。
在一些实施方式中,ptxD基因包括选自包括以下的组的多核苷酸序列: SEQ IDNO:89(天然)、SEQ ID NO:90(MelPhi)和SEQ ID NO:91(NADP)。
在一些实施方式中,与ptxD基因连接的启动子选自包括以下的组:Ptrc、 PpsbA、PcpcB和Pc223。在一些实施方式中,与ptxD基因连接的启动子是包括 SEQ ID NO:92中所示的多核苷酸序列的psbA。
在一些实施方式中,重组载体进一步包括外源多核苷酸,该外源多核苷酸包括编码RNA和/或蛋白质产物的可表达多核苷酸。
根据另一方面,本发明提供在基因工程蓝细菌细胞中表达产物的方法,包括步骤:
a)根据本发明的任何方面,在无抗生素并且三聚氰胺为氮源的培养基中,培养多个基因工程蓝细菌细胞,该基因工程蓝细菌细胞包括异源三聚氰胺利用途径基因和包括编码RNA和/或蛋白质产物的可表达多核苷酸的至少一种外源多核苷酸,其中,培养有利于代谢三聚氰胺的细胞的生长;
b)在用于表达所述产物的条件下培养所述基因工程蓝细菌细胞。
根据另一方面,本发明提供在基因工程蓝细菌细胞中表达产物的方法,包括步骤:
a)根据本发明的任何方面,在无抗生素、三聚氰胺为氮源并且亚磷酸盐为磷源的培养基中,培养多个基因工程蓝细菌细胞,该基因工程蓝细菌细胞包括异源三聚氰胺利用途径基因和亚磷酸盐代谢基因和包括编码RNA和 /或蛋白质产物的可表达多核苷酸的至少一种外源多核苷酸,其中,培养有利于代谢三聚氰胺和亚磷酸盐的蓝细菌细胞的生长,
b)在用于表达所述产物的条件下培养所述基因工程蓝细菌细胞。
在一些实施方式中,所述表达产物能够将底物转化为其他产物。所述产物可以是,例如是可以催化培养物中的底物转化为其他产物的酶。例如,所述表达的产物可以是酶,诸如金合欢烯合酶,其可以将CO2和H2O转化为金合欢烯(C15H24)。
在一些实施方式中,培养基包括在以下浓度的三聚氰胺:至少1mM、至少2mM、至少4mM、至少6mM、至少8mM、至少10mM、至少12mM、至少14Mm或至少16mM。在一些实施方式中,培养基中三聚氰胺的浓度选自约2mM至约12mM范围内的浓度。
在一些实施方式中,该方法进一步包括分离在基因工程蓝细菌细胞中表达的所述产物。
现在已经大体上描述了本发明,通过参考以下借助于说明而提供以下实施例,将更容易理解本发明,并且不旨在限制本发明。
实施例
实施例1:方法
如Green and Sambrook and Russel,Molecular Cloning:A LaboratoryManual,Cold Springs Harbor Laboratory,New York(2012)中描述的,通常按照本领域已知且未具体描述的标准分子生物学技术。
细胞生长条件
聚球藻PCC 7002(来自美国宾夕法尼亚州立大学(Penn State University) 的Donald Bryant教授的一种馈赠)在使用D7微量营养元素[Arnon等人, Biochim BiophysActa.357:231-45(1974)],按指示补充有12mM硝酸钠(AD7-NO3)、4mM氰尿酸盐(AD7-Cya)或2mM三聚氰胺(AD7-Mel)以及维生素B12(0.01mg/L)的培养基A[Stevens等人,J Phycol.9:427-430(1973)]中光合自养生长。对于亚磷酸盐利用菌株,由亚磷酸二氢钾(Phi,RudongHuayun Chemical Co.,Ltd.,江苏,中国)取代磷酸二氢钾(Pho),为0.370 mM(Pho 1x或Phi1x)。通过用1.2%(w/v)Bacto琼脂(BD Diagnostics)和1g/L 硫代硫酸钠补充上文的培养基来制备固体培养基。
对于生长实验,在50μmol光子m-2·s-1的弱光强度下于38℃、1% CO2、160rpm下培养Syn7002 WT(生长于AD7-NO3)或三聚氰胺生长菌株(生长于AD7-Mel)的液体预培养物,直到OD730在4至6之间(在弱光条件下为对数生长后期)。沉淀细胞并用不含磷酸盐(AD7-MelP-)的AD7-Mel培养基洗涤两次,然后接种至带挡板的烧瓶中。液体培养物(25mL的总体积,每个菌株三个生物学重复制)在以下生长:在100mL带挡板的锥形烧瓶中,在740-FHC LED培养箱(HiPoint Corporation,中国台湾)中,于38℃,在补充有 1%(v/v)CO2的空气中,在300μmol光子m-2·s-1的恒定照明下,使用LED Z4面板,设置215μmol光子m-2·s-1的红光(660nm)、50μmol光子m-2·s-1的绿光(520nm)和35μmol光子m-2·s-1的蓝光(450nm)并且在200rpm下振荡。通过用Cary 300Bio(Varian)分光光度计在1-cm光路中以730nm(OD730) 的光密度测量来监测细胞的生长。对于测定干细胞的重量,将在OD730(8至 10之间)下测定的1至2mL培养体积过滤至预干燥且预称重的玻璃微纤维过滤器(直径47mm,孔径1μm,GEHealthcare,Cat.No.1822-047),用去离子水洗涤两次,并于65℃下干燥过夜(直到读数之间的质量偏差不高于 0.0001g)。所有测量均使用每种菌株的生物学三份法进行。
使用超感受态大肠杆菌细胞(Stellar,TaKaRa)构建所有相关质粒,并且于37℃,在补充有50μg·mL-1卡那霉素、50μg·mL-1壮观霉素、50μg·mL-1庆大霉素或100μg·mL-1羧苄西林的LB培养基中培养,视情况而定。除非另有说明,否则所有使用的化学药品均购自Sigma-Aldrich。
菌株构建
三聚氰胺生长菌株
除非另有说明,否则使用Q5 DNA聚合酶(New England Biolabs,NEB) 进行所有的PCR反应,以及PCR产物通常用DpnI消化过夜,并且在组装 DNA之前使用EZ-10旋转柱PCR产物纯化试剂盒(BioBasic)进行纯化。使用引物D08807和D08808(参见表1)从Syn7002基因组DNA(gDNA)中PCR 扩增了包括glpK中性基因组整合位点的DNA片段[Begemann等人,PLoSOne.8:e76594.10.1371/journal.pone.0076594(2013)],侧翼为500-bp的上游和下游区。
表1:使用的引物列表
Figure BDA0003099073190000191
Figure BDA0003099073190000201
按照制造商的说明,将纯化的PCR产物连接至pCR-Blunt II TOPO (Invitrogen)中,并转化为至化学感受态Stellar大肠杆菌细胞中,从而产生质粒pCRBlunt-glpK(通过使用通用M13引物的Sanger测序证实正确的组装)。使用引物D98496993和D77036,反向PCR扩增pCRBlunt-glpK主链,并且使用引物D98847023和D98847024(上半部分)以及D98847025和D98847026(下半部分),从合成构建体(GenScript,香港,Ltd.)中将三聚氰胺操纵子扩增为两等份。按照制造商的说明,使用NEBuilder HiFi DNA Assembly Master Mix(NEB)将两个片段组装至pCRBlunt-glpK。将1μL的组装混合物转化至Stellar大肠杆菌超感受态细胞中,得到质粒pSJ051。使用表1中所示的引物Mel_seq_1至Mel_seq_14、D99280067和D99280068,通过Sanger测序证实了三聚氰胺操纵子的正确组装。如先前所描述的 [Frigaard等人,Methods Mol Biol.274:325-40(2004)]通过双重同源重组转化 Syn7002 WT,具有修饰。简而言之,如上文描述,在0.5的OD730下将2μg 的pSJ051用于转化2mL的Syn7002培养物,并在12mL圆底卡口盖管中孵育过夜。第二天,将培养物离心,将沉淀物重悬于50μL上清液中,然后铺展在AD7-Cya板上,以利于将整个三聚氰胺操纵子整合到glpK位点。将该板在上文描述的条件下孵育直至出现菌落(2周后)。挑选八个菌落,并在AD7-Cya板上重新划线4次,并且随后在AD7-Mel板上划线直到证实染色体分离,使用引物D99280067和D99280068(参见图1)测试。最初的八个菌落中只有六个幸存,已经进化为菌株Mel1、Mel4、Mel5、Mel6、Mel7 和Mel8。
利用亚磷酸盐和利用三聚氰胺/亚磷酸盐组合的菌株
将在ORF A0935和A0936之间的中性基因组整合位点的上游500bp至下游500bp的区[Davies等人,Frontiers in bioengineering and biotechnology. 2:21.10.3389/fbioe.2014.00021(2014)]使用引物D100023580和D100023581 从Syn7002 gDNA进行PCR扩增。用XbaI(NEB)消化pUC19(Invitrogen),并使用EZ-10旋转柱DNA凝胶提取试剂盒(BioBasic)从琼脂糖凝胶带中纯化。根据制造商的说明,使用pEASY-Uni无缝克隆和组装试剂盒(TransGen Biotech Co.,Ltd,中国)将A0935-A0936位点组装至消化的pUC19主链中,并转化至Stellar大肠杆菌细胞中,从而获得质粒pSZT001。将引物对 A0935_UCO_F和A0936_UCO_R用于反向PCR扩增pSZT001主链,并且对D98496996和D100141467用于扩增施氏假单胞菌(Pseudomonas stutzeri)WM88亚磷酸盐脱氢酶(ptxD)基因[Loera-Quezada等人,Plant Biotechnol J.14:2066(2016)]的合成的、密码子优化型(SEQ ID NO:90)(由GenScript,香港,Ltd),由绿穗苋(Amaranthus hybridus)组成型psbA启动子 (SEQ ID NO:92)驱动[Elhai and Wolk,Gene.68:119-138(1988)]。如上文描述,使用pEASY-Uni试剂盒组装两个片段,得到质粒pSJ135。如上文描述,将2μg的该质粒用于转化Syn7002 WT以及Mel5菌株,不同的是,在转化之前将培养物离心并用缺少磷酸盐的AD7培养基(AD7-NO3 P-用于WT以及AD7-Mel P-用于Mel5)洗涤两次,并且随后分别涂布于AD7-NO3 Phi 1x(0.370mM亚磷酸盐)或AD7-Mel Phi 1x上。将两个板在上文描述的条件下孵育直到出现菌落(10天)。从每个板中挑选出八个菌落,并在AD7-NO3 Phi 1x或AD7-Mel Phi 1x上连续重新划线,直至通过使用引物D100043610和 D100043611由菌落PCR证实全染色体分离(参见图7),分别得到菌株 A0935-ptxD和Mel5-ptxD。
为了进一步测试亚磷酸盐作为选择标志物的用途,在强组成型Pcpt启动子[Markley等人,ACS Synth Biol.4:595(2015)]的控制下,使用引物 D100263687和D100263688从pAcsA-cpt-YFP(来自美国威斯康星大学 (University of Wisconsin-Madison)的Brian Pfleger教授的一种馈赠)中扩增出包含YFP基因的DNA片段。使用引物D100141467和D100098818反向PCR 扩增pSJ135主链,并使用pEASY-Uni试剂盒组装两个片段,得到pSJ141。如上文描述,使用亚磷酸盐培养基转化Syn7002 WT或Mel5,用于选择转化体,并通过菌落PCR进行完全分离菌株的选择。
敲除推定的膦酸盐转运蛋白
通过使用 CyanoBase(http://genomedotmicrobedbdotjp/blast/blast_search/cyanobase/gene s)内的BlastP工具鉴定了推定的膦酸盐转运蛋白基因,将搜索限制在Syn7002上,并将来自原绿球藻(Prochlorococcus marinus sp.)MIT9301[Bisson等人,NatCommun.8:1746.10.1038/s41467-017-01226-8 (2017);Feingersch等人,ISME J.6:827-34(2012)]的PhnD的氨基酸序列作为搜索模板使用。在Syn7002:A0336(E值=1e-96)和G0143(E值=2e-08)中鉴定了两种同源物(标注为推定的结合磷酸盐(phosphate)/膦酸盐(phosphonate)的 ABC转运蛋白)。使用引物D15106和D15107(A0336上游区)、D15108和D15109(A0336下游区)、D15110和D15111(G0143上游区)以及D15112和 D15113(G0143下游区)从Syn7002细胞扩增这些基因的500上游和下游的 DNA序列。用从pBAD42扩增(使用引物D98646038和D98646039)的壮观霉素抗性盒(对于A0336)或从pVZ322扩增(使用引物D99047654和 D99047655)的庆大霉素抗性盒(对于G0143),使用NEBuilder HiFi DNAAssembly Master Mix,根据制造商的说明,将纯化的DNA片段组装至XbaI 消化的pUC19片段,得到pSJ156(pUC19-ΔA0336::SpR)和pSJ157 (pUC19-ΔG0143::GmR)。将两种质粒均用于转化Syn7002 WT和A0935-ptxD 菌株,并且在完全分离后,将pSJ157用于转化WT(WTΔA0336菌株)和 A0935-ptxD(ptxDΔA0336菌株)背景中的ΔA0336::SpR缺失菌株,得到双敲除菌株WTΔA0336ΔG0143和ptxDΔA0336ΔG0143。WT Syn7002、 A0935-ptxD、ptxDΔA0336、ptxDΔD0143(A0935-ptxD背景中的ΔG0143::GmR)和ptxDΔA0336ΔG0143在适当的抗生素浓度(50μg·mL-1壮观霉素和/或50μg·mL-1庆大霉素)存在下,在上文描述的条件下在常规AD7 (Pho 1x)培养基中生长。将所有菌株的培养物用AD7-NO3 P-洗涤两次,在相同培养基中重悬至OD730=4,并使用相同的AD7-NO3 P-培养基按1:10 系列稀释(从4x100至4x10-5)。将10μL的每种稀释点样在AD7-NO3 Pho 1x 或AD7-NO3 Phi 20x上,在上文描述的条件下培养5天。
黄色荧光蛋白(YFP)荧光测量
对于以下测定全细胞YFP荧光:一式三份的培养物(每份15mL)在常规 AD7培养基中生长至OD730在0.5和1之间,在Hidex Sense(激发:485/10 nm;发射:535/20nm)中使用96孔黑色透明底板测量了150μL等分样品。对每种培养物一式三份测量荧光,并将其归一化至OD730(如上文描述,由 Hidex Sense读板器同时测量),使用AD7培养基作为空白对照。
基因组测序
通过使用Quick-DNA真菌/细菌试剂盒(Zymo Research),从WT菌株以及不同的利用三聚氰胺的菌株两者中制备基因组DNA。文库制备是根据 Illumina的TruSeq纳米DNA样品制备方案进行的。按照制造商的建议,将样品在Covaris E220上剪切至~550bp,并用Illumina的TruSeq LT DNA条形码之一进行唯一标记,以使样品合并以用于测序。使用Promega的 QuantiFluor dsDNA测定法对完成的文库进行定量,并在Agilent Tapestation4200上确定平均文库大小。然后使用用于Illumina平台的Kapa文库定量试剂盒(KapaBiosystems),将文库浓度归一化至4nM,并且通过在QuantStudio-3实时PCR系统(AppliedBiosystems)上qPCR进行验证。然后将文库以等摩尔浓度合并,并在Illumina MiSeq平台上以300bp配对末端的阅读长度进行测序。使用Geneious 11.1.4软件(Biomatters Ltd.)组装并比较基因组。
核糖体结合位点(RBS)点突变测试
为了评估Mel5中RBS变化的影响,通过反向PCR[Liu and Naismith, BMCBiotechnol.8:91.10.1186/1472-6750-8-91(2008)],使用Q5 DNA聚合酶 (NEB),使用引物D101108989和D101108990,将原始的pSJ051质粒在triA 上游的RBS处突变(从AGGAGA变化至AGAAGA),得到质粒pSJ155。如上文描述,使用AD7-Cya和AD7-Mel板,将该质粒用于转化Syn7002 WT。如上文描述,将所得菌株Re-Mel5在AD7-Mel板上重新划线两次,并测试其在AD7-Mel中的生长。
共培养竞争实验和流式细胞术
通过在AD7-NO3 1xPho或AD7-Mel 20xPhi中培养用pAcsA-cpt-YFP 质粒(组成型表达YFP,称为“cptYFP”)和Mel5-ptxD转化的Syn7002菌株来进行生长竞争实验。将菌株稀释至0.05的起始OD730,并使其生长(在生物一式三份培养物中),随后使用3-激光BD LSRFortessa X20,使用FITC 的通道进行流式细胞术(ext:488nm;em:525/50nm),以检测YFP阳性细胞和APC(ext:633nm;em:670/30nm)的叶绿素a(Chl a)阳性细胞。对于进行细胞计数,如需要将培养物首先稀释至大约0.05的OD730,并在Fortessa X20 流式细胞仪上以3000个事件/s的恒定速率进行采集。将前向散射(在x轴上) 与侧向散射(在y轴上)的对数刻度图用作选择活细胞的初始门控,然后分析 Chl a阳性细胞。然后将其用于绘制仅Chl a(Mel5-ptxD)或双阳性Chl a/YFP (cptYFP)细胞的门控。通过耗尽50μL的设定样品体积来获得细胞计数。使用BD FACS Diva软件(v.8.0)导出一式三份样品中的细胞计数,并基于所用的稀释度进行反算。
使用LC-MS/MS鉴定三聚氰胺途径中间体
生长48小时后收集Syn7002和利用三聚氰胺的菌株培养物,并离心(14000g,5min,室温)。将上清液通过0.2μm注射器过滤器(带有Supor膜的Acrodisc过滤器,PALL)过滤,并在-80℃冷冻直至进一步使用。在NTU Phenomics Centre使用先前描述的方法[Braekevelt等人,Food Addit Contam Part A Chem Anal Control Expo Risk Assess.28:698-704(2011)],,通过 LC-MS/MS对三聚氰胺、三聚氰酸二酰胺(ammeline)、三聚氰酸一酰胺(ammelide)和氰尿酸进行定量。
实施例2
三聚氰胺降解途径的引入要求进化适应性以有效利用
在此研究中利用的三聚氰胺降解途径是基于Shaw及其同事报道的最优途径(基因triA、guaD、trzC、atzD、trzE和DUR1,2,包括在guaD基因产物中描述的R352S突变)[Shaw等人,Science.353:583-6(2016)](图1)。在我们的情况下,我们使用了密码子优化的基因(triA,SEQ ID NO:70;guaD, SEQ ID NO:80;trzC,SEQ ID NO:74;atzD,SEQ ID NO:78;trzE SEQ ID NO:72;和DUR1,2,SEQ ID NO:76),合成的强蓝细菌启动子Pc223(SEQ ID NO:82)[Markley等人,ACS Synth Biol.4:595(2015)]和在Syn7002中测试的最强RBS序列(AGGAGA)[Markley等人,ACS Synth Biol.4:595(2015)]所有 6个基因的上游。通过随机DNA序列生成器 (http://worldwidewebdotfacultydotucrdotedu/~mmaduro/randomdothtm)生成了基因间区(总计21bp),包括RBS序列之前(7bp)和之后(8bp)的间隔,并且构建载体是为了将整个途径靶向WT Syn7002的glpK中性位点[Begemann 等人,PLoSOne.8:e76594.10.1371/journal.pone.0076594(2013)](参见实施例 1的细节)。为了避免引入抗生素盒,在包含2mM三聚氰胺的板(AD7-Mel 板)上选择转化体。然而,尽管进行了几次尝试,但当直接涂布于AD7-Mel 板上时仍无法获得菌落(数据未示出)。我们假设通过将细胞涂布至包含4 mM氰尿酸而不是三聚氰胺的AD7板上来选择阳性转化体,因为氰尿酸是该途径第3步形成的三聚氰胺降解中的中间体(图1A)。这种策略导致了少数氰尿酸生长菌落的分离。然而,这些菌落最初无法在AD7-Mel板上生长,并且在AD7-Cya板上重新划线4次,之后才可以最终在AD7-Mel板上实现生长。进一步分析了在AD7-Mel板上生长的六个分离的菌落(以Mel1、Mel4、Mel5、Mel6、Mel7和Mel8表示),并示出包含完整的Mel操纵子(图1B),并且通过PCR分析判断为完全分离(图1C)。Mel1、Mel4、Mel5、Mel6、 Mel7和Mel8操纵子的多核苷酸序列分别在SEQ ID NO:83、84、85、86、 87和88中示出。
比较了不同的Mel菌株和WT Syn 7002在AD7-Mel培养基(包含2mM 三聚氰胺)或常规AD7培养基(包含硝酸盐)中的生长。如在图2A和B中看出,与亲本Syn7002 Wt菌株不同,不同的单独菌株能够在作为唯一的氮源的三聚氰胺上生长,尽管速率不同。特别是两个菌株,Mel5和Mel7,可以在AD7-Mel中的生长几乎与Syn7002 WT在AD7-NO3中生长的一样好,而其余菌株具有较慢的生长和不同的着色(图2B),这是应力的常见指示 [Collier andGrossman,Journal of Bacteriology.174:4718-26(1992)]。
为了进一步了解这些不同表型背后的原因,我们对所有三聚氰胺生长菌株(Mel1、Mel4、Mel5、Mel6、Mel7和Mel8)的以及本实验中使用的Syn7002 WT(获得自美国宾夕法尼亚州立大学Donald Bryant教授的实验室)的基因组进行了测序。比较序列确定了三聚氰胺操纵子中的几个突变,它们全部位于triA(编码三聚氰胺脱氨酶)基因之前的RBS中或triA基因本身的内部(图 3A)。triA氨基酸序列中的突变位于以下的位置:Leu88Phe(Mel4)、His254Tyr (Mel7)、Glu317Lys(Mel6)、Ala355Val(Mel8)和Trp471stop(Mel1)。Mel5具有在RBS中的突变(从AGGAGA至AGAAGA)(图3B)。由于这是三聚氰胺降解途径的第一步,影响triA或其RBS的突变将调控通过该途径其余部分的代谢通量。
为了进一步阐明不同菌株中三聚氰胺途径代谢通量中发生的变化,使用LC-MS/MS定量从三聚氰胺到氰尿酸排入生长培养基的途径中间体(图 4)。在生长的最初24小时内,Mel5和Mel7两者中,三聚氰胺被非常快速地消耗,同时发现,在同一时间范围内,三聚氰酸二酰胺(三聚氰胺之后的第一个中间体)在Mel5和Mel7中的积累(Mel5为86.2±1.6μM以及Mel7 为57.2±1.5μM)比其余菌株中的(≤25μM)显著更多。仅以非常低的水平定量三聚氰酸一酰胺(第三中间体)(24小时后在Mel5生长培养基中检测到<4 μM),而氰尿酸在Mel5中以207.5±16.3μM的浓度以及在Mel 7中以134.5 ±8.8μM的浓度快速积累(图4A-D)。在最初的文章中也报道了氰尿酸大量排入培养基中,该文章涉及在添加的三聚氰胺为13%的初始(摩尔)量的水平下,将三聚氰胺降解途径引入至大肠杆菌中[Shaw等人,Science.353:583-6 (2016)],惊人地类似于24小时后在Mel5菌株中观察到的9.7%的值。存在于其余菌株中的突变很可能没有赋予与Mel5和Mel7发现那些突变一样的强大的优势,导致在正常光照条件下观察到的低细胞内氮水平和较慢的生长速率(图2)。应当注意的是,在弱光下生长的预培养物受到的影响要小得多,这可能是由于在这些条件下总体代谢速率下降(数据未示出)。
Mel5在2mM和4mM三聚氰胺中生长,并且比较了生长速率。图5 示出,约72小时后,4mM三聚氰胺可使Mel5维持比2mM三聚氰胺更高的OD。
最后,将RBS序列在原始pSJ051中的triA基因上游突变,以匹配在 Mel5中发现的突变。当直接涂布于AD7-Mel板上(以及通过涂布于AD7-Cya 板上)时,使用这种修饰的构建体获得菌落。将新获得的菌株(名为“Re-Mel5”) 的生长与Mel5进行了比较,并且当在以三聚氰胺作为唯一氮源中生长时,在48小时后,发现Re-Mel5达到了类似的OD730(图10),表明发现的突变确实能够提高三聚氰胺的利用效率。
实施例3
可以将亚磷酸盐和PtxD用作聚球藻PCC7002中有效的选择系统
尽管亚磷酸盐(Phi)先前示出能够维持集胞藻(Synechocystis sp.)PCC 6803[Polyviou等人,Environmental microbiology reports.7:824-30(2015)]和聚球藻PCC7942[Motomura等人,ACS Synth Biol.10:1021(2018)]两者的修饰菌株的生长,在这两者的情况下,基因操作(包含ptxD以及特定的Phi转运蛋白的操纵子的整合)均由抗生素选择压力驱动。同时,两种菌株(野生型集胞藻PCC 6803或野生型聚球藻PCC 7942)似乎都无法在不包括特定转运蛋白下摄取Phi,因此使构建体过大而无法具有作为选择标志物的实际用途。由于文献中不存在关于Syn7002在作为唯一P源的Phi上生长的能力的数据,因此使用不同浓度的Phi测试了WT菌株的生长(图6A,左图片)。尽管在最初的24-36小时内有一些生长,但是在此时间段之后没有发生可观察到的生长,这可能是由于内部磷酸盐储备的全部消耗——蓝细菌将磷作为多磷酸盐颗粒存储在细胞质中,并且具有动态流通机制,允许它们在需要时采用这些储备[Gomez-Garcia等人,Journal of bacteriology.195,3309(2013)]。
在中性位点A0935中,并且没有其他可选择标志物,用包含施氏假单胞菌WM88亚磷酸盐脱氢酶基因(密码子优化的;SEQ ID NO:90)的构建体 (pSJ135)转化的Syn7002 WT(图7A,上)涂布于具有Phi(0.37mM,1x)作为唯一磷源的AD7板上。这种转化产生了数百个菌落,并且尽管转化体 (A0935-ptxD)具有淡微黄色,是磷酸盐缺乏细胞的特征,但这种浓度的Phi 足以诱导转化菌株的全染色体分离(图7B),因此验证了ptxD基因和亚磷酸盐作为Syn7002中有效的选择策略。
考虑到单独的ptxD基因足以使菌株A0935-ptxD在Phi上生长,其似乎与相关(淡水)菌株集胞藻PCC6803和聚球藻PCC7942不同,Syn7002能够通过迄今未定义的转运蛋白从生长培养基中输入Phi。
为了测试更高的浓度梯度是否足以增强向细胞内的转运并允许其在 Phi上更快地生长,在具有Phi浓度增加(0.37mM至7.4mM)的AD7中测试了A0935-ptxD的生长。如图6A(右侧)可以看出,测试的最高Phi浓度(Phi 20x, 7.4mM)使该菌株达到接近Pho生长细胞的生长速率。同时,克干细胞重量 (gDCW)与OD730之间的关系也随着Phi浓度的增加而增加,从在AD7-Phi 1x 中生长的细胞的0.1633±0.014gDCW·L-1·OD730 -1至在AD7-Phi 20x中生长的细胞的0.2038±0.003gDCW·L-1·OD730 -1(表2),该值类似于在标准条件中生长的WT细胞的值(0.2145±0.007gDCW·L-1·OD730 -1)。这种增加可能是由于在较高的Phi浓度下更有效的Phi吸收和转化。
表2:每种测试菌株的OD730与克干细胞重量(gDCW)/L之间的计算比率。
Figure BDA0003099073190000281
Figure BDA0003099073190000291
备注:图是使用生物一式三份样品测定干重量的平均和标准偏差。
已知表达相同的ptxD基因的转基因拟南芥(Arabidopsis thaliana)植物 (使用草丁膦(phosphinothricin)选择)能够使用Phi作为唯一的磷源来生长[Lopez-Arredondoand Herrera-Estrella,Nat Biotechnol.30:889(2012)]。虽然尚不清楚由植物根部摄取Phi的具体转运蛋白,但似乎不需要额外的Phi 转运蛋白基因,Syn7002就是这种情况。然而,与拟南芥不同,Syn7002中 Phi的吸收效率要低得多。如先前的研究示出,几种海洋蓝细菌能够摄取并利用Phi作为磷源[Feingersch等人,ISME J.6:827-34(2012);Martinez等人, Environ Microbiol.14:1363(2012);Polyviou等人,Environmental microbiologyreports.7:824-30(2015)]我们在Syn7002基因组中搜索了推定的转运蛋白基因,诸如ptxB和phnD同源物[Bisson等人,Nat Commun.8: 1746.10.1038/s41467-017-01226-8(2017)]。虽然未找到ptxB同源物,但环状染色体(A0336)或pAQ7质粒(G0143)中存在两个推定的phnD基因A0336和 G0143(数据未示出)。我们假设这两个基因中的任何一个都可能涉及亚磷酸盐向细胞的输入,因为phnD同源物也示出与亚磷酸盐结合[Bisson等人,Nat Commun.8:1746.10.1038/s41467-017-01226-8(2017)]。然而,单独或组合敲除这些推定的膦酸盐转运蛋白并不能阻止ptxD亲本菌株在亚磷酸盐上生长 (图8A-8C)。
为了研究这种选择方法是否足以允许其他基因的共整合,设计了第二种构建体,其中将yfp基因整合至同一基因座的染色体中,使用ptxD作为选择标志物,并且Phi作为阳性选择。在图7B和7C中可以看出,使用该方法成功地共整合了yfp基因,并且可以在阳性转化体中测量YFP荧光。因此,该方法可用于选择在Syn7002中整合和表达异源基因。
实施例4
构建能够在三聚氰胺和亚磷酸盐两者上生长的菌株
上文的实施例证明了Syn7002中两种独立的无抗生素选择方法。通过双重选择产生的菌株可能对污染生物更为强健。因此,Mel5,最佳三聚氰胺生长菌株之一,是用pSJ135(单独的ptxD基因;SEQ ID NO:93)或 pSJ141(ptxD和yfp)转化,并在AD7-Mel 1xPhi板上选择阳性转化体。与 Syn7002 WT背景的情况一样,通过这种选择方法(图7B)可以轻松获得阳性转化体,并在完全分离的表达YFP的转化体中测量YFP荧光(图7C)。与在常规AD7中生长的MelPhi或Syn7002 WT亲本菌株相比,菌株 Mel5-A0935ptxD(“MelPhi”)能够在AD7-Mel Phi20x液体培养基中生长,尽管速率稍较慢(图9A)。如预测的,Syn7002 WT不能在AD7-Mel Phi20x 培养基中生长(图9A)。这示出了在同一基底中使用三聚氰胺和Phi两者进行双重选择是可能的。图13示出了Syn7002、Mel5、A0935ptxD和MelPhi 菌株在包括各种培养基的板上的生长。
实施例5
菌株Mel5-A0935ptxD能够抵抗蓄意的污染
本发明涉及适合于在开放系统中室外培养的蓝细菌菌株。在这些条件下,该菌株应能够竞争过其他菌株,以成为在潜在受污染系统中的优势种群。为了确定获得菌株的强健性,设计了实验,其中蓄意将用于 Mel5-A0935ptxD(在AD7-Mel Phi 20x中)的起始培养物大量过量污染,组成型表达YFP(来自Pcpt启动子)的Syn7002菌株为6倍(图9C)或者10倍高的细胞计数(图11)。如图9C中可见,Mel5-A0935ptxD(“MelPhi”)能够克服这种大量过量的污染物并成为优势种群,因此示出该菌株确实适合在未灭菌条件下室外培养。尽管如上文讨论的,在三聚氰胺中培养期间,亲本菌株Mel5细胞存在三聚氰胺途径中间体的泄漏(图4),但是由细胞释放的低量的这些异生化合物(最大0.2mM)是不太可能支持细菌生长,从而消除了污染物细胞的任何形式的清除。如上文提及,观察到的YFP污染物略有生长(参见实施例3),最有可能是由于内部营养储备的流通和消耗,尽管这不能维持长期生长。先前,表达ptxD的转基因拟南芥还示出能够抵抗和克服常见杂草的蓄意污染[Lopez-Arredondoand Herrera-Estrella,Nat Biotechnol. 30:889(2012)],强调了这种方式的优势,使在未灭菌条件中生长的菌株在竞争中更具优势。
实施例6
菌株Mel5-A0935ptxD的生长可扩展性
通过在生长室中于AD7-Mel Phi 20x培养基中的2x 1L带挡板的锥形烧瓶(2L的总体积)中生长11天,测试了Mel5-A0935ptxD在较大规模培养物中生长的能力。细菌在开始的24小时内生长非常快,并且逐渐减少到约 10的OD(图14)。生长速率减慢的解释是,稀释的培养物在开始的24小时内允许更多的光照,并且随着培养物变得更加浑浊而在该阶段之后变得基本上受光照限制,因此生长更慢。
实施例7
构建能够利用NADP+代替NAD+的MelPhi菌株
由于蓝细菌具有比NAD+更多的NADP+,生成了MelPhi菌株的新衍生物,其中PtxD酶(密码子优化的;SEQ ID NO:90)突变,使用NADP+ 代替NAD+,具有的突变基因的多核苷酸序列在SEQ ID NO:91中示出。使用引物RF_ptxD_F(SEQ ID NO:95)和RF_ptxD_R(SEQ ID NO:96),使用 pSJ135作为模板,Phusion聚合酶(NEB)和如van den Ent,等人,J BiochemBiophys Methods,67:67-74(2006)中描述的RF克隆方法,对ptxD基因的序列突变,得到质粒pSJ165。ptxD基因中的突变(Glu175Ala和Ala176Arg)模拟了Woodyer,R.等人,FEBS J.,272:3816-27(2005)中描述的那些突变,先前示出增加PtxD对NADP+的特异性。如上文描述,用pSJ165转化Mel5。将ptxD突变体菌株以MelPhiAQ表示,并且将其生长与使用分批补料策略的MelPhi进行比较,每天添加三聚氰胺以继续生长至更高的密度。图15 示出了两种菌株的生长相似,并且达到的最高密度为约70的OD730
实施例8
可以在高浓度三聚氰胺中生长的Mel5菌株的进化
Mel5菌株在包括2mM三聚氰胺的培养基中进化,并且可以在4mM 三聚氰胺中生长(图5)。可以在更高浓度的三聚氰胺中生长的菌株可能甚至更抵抗污染,因此Mel5菌株在12mM的三聚氰胺上进一步进化。将Mel5 培养物涂布于包含12mM三聚氰胺代替常规2mM的AD7-Mel板上,并如上文描述进行培养。大约2周后,将出现的菌落在相同条件下,在具有12mM 三聚氰胺的AD7-Mel板中重新划线进一步的4次。在划线的最初12个菌落中,将3个看似更强健的生长菌株(在板上)培养在具有12mM三聚氰胺作为氮源的AD7液体培养基中。将最强健的菌株即由此生成的新进化的Mel5 菌株(“Mel5evo”)的生长与Mel5进行比较。如图16中示出,原始菌株不能在12mM三聚氰胺中生长,但进化后的菌株生长至相当高的OD750(约50 的OD)。在高三聚氰胺浓度中改进的生长似乎是由于triA基因中的进一步突变。triA基因的多核苷酸序列在SEQ ID NO:69中示出,以及氨基酸序列在SEQ ID NO:68中示出。与Mel5中的triA序列相比,在Thr218Asn和 Val278Met处还存在两个进一步的氨基酸取代。
总结
本发明工程菌株的重要考虑是,在当前价格和本研究中使用的浓度下,三聚氰胺将是比硝酸盐更经济的氮源,使用三聚氰胺时成本降低24%(参见表3)。
表3:硝酸盐、三聚氰胺、磷酸盐和亚磷酸盐的成本估算
Figure BDA0003099073190000331
备注:基于来自Alibaba.com网站上的数据(2019年3月25日访问),数值为最低价格。
而且,由于三聚氰胺不用作农业肥料,将其用作氮源将消除农业中使用的富氮肥料的竞争。此外,随着三聚氰胺水平在生长24小时内降至使用 LC-MS/MS检测水平以下,最终培养物上清液中残留的三聚氰胺不会成为采用该技术的阻碍因素。
亚磷酸盐的额外选择使菌株具有“双刃剑”,尤其是在培养物的早期阶段,污染物种更难以克服,从而使携带这两种修饰的菌株成为优势种群,而无需灭菌或添加抗生素。此外,该策略消除了水平基因转移抗生素抗性盒的风险[Ventola,P T.40:277-83(2015a);Ventola,P T.40:344-52(2015b); von Wintersdorff等人,Frontiers inmicrobiology.7:10.3389/fmicb.2016.00173 (2016)]。
本文的结果表明,TriA突变调控通过三聚氰胺途径的通量,使得其更有效地被使用。Mel5evo菌株无需在线进料设备等(比分批培养更加昂贵)即可使分批培养达到高密度。MelPhiAQ菌株生长良好,并且可以提高需要更高NADPH浓度的生物分子的产量(因为使用突变的PtxD酶将亚磷酸盐转化为磷酸盐会将NADP+转化为NADPH,从而增加其内部浓度)。
本发明的菌株为高密度培养提供了两种不同的策略。第一种策略是使用Mel5和相关的工程蓝细菌菌株进行分批补料。第二种策略是使用 Mel5evo蓝细菌菌株以高浓度的三聚氰胺(最高至少12mM)进行分批培养。
总之,这项工作首次描述了能够在高达12mM的三聚氰胺作为唯一氮源上生长的海洋蓝细菌菌株,将亚磷酸盐选择作为可以利用NADP+代替NAD+的蓝细菌和亚磷酸盐代谢菌株中有效选择策略的用途。最后,我们开发了独特的菌株,其能够使用三聚氰胺和亚磷酸盐两者分别作为唯一的N 和P源。即使当污染大量过量存在时,该菌株也能够抵抗由其他蓝细菌的蓄意污染,并且对于“绿色”生物技术应用而言,该菌株应证明是有用的基底菌株。
文献
Angermayr,S.A.,Paszota,M.,Hellingwerf,K.J.,2012.Engineering acyanobacterial cell factory for production of lactic acid.Applied andenvironmental microbiology.78,7098-106.10.1128/AEM.01587-12.
Arnon,D.I.,McSwain,B.D.,Tsujimoto,H.Y.,Wada,K.,1974. Photochemicalactivity and components of membrane preparations from blue-greenalgae.I.Coexistence of two photosystems in relation to chlorophyll a andremoval of phycocyanin.Biochim Biophys Acta.357,231-45.
Begemann,M.B.,Zess,E.K.,Walters,E.M.,Schmitt,E.F.,Markley,A. L.,Pfleger,B.F.,2013.An organic acid based counter selection system forcyanobacteria.PLoS One.8,e76594.10.1371/journal.pone.0076594.
Bisson,C.,Adams,N.B.P.,Stevenson,B.,Brindley,A.A.,Polyviou,D., Bibby,T.S.,Baker,P.J.,Hunter,C.N.,Hitchcock,A.,2017.The molecular basis ofphosphite and hypophosphite recognition by ABC-transporters.Nat Commun.8,1746.10.1038/s41467-017-01226-8.
Braekevelt,E.,Lau,B.P.,Feng,S.,Menard,C.,Tittlemier,S.A.,2011.Determination of melamine,ammeline,ammelide and cyanuric acid in infantformula purchased in Canada by liquid chromatography-tandem massspectrometry.Food Addit Contam Part A Chem Anal Control Expo Risk Assess. 28,698-704.10.1080/19440049.2010.545442.
Choi,S.Y.,Wang,J.Y.,Kwak,H.S.,Lee,S.M.,Um,Y.,Kim,Y.,Sim,S. J.,Choi,J.I.,Woo,H.M.,2017.Improvement of squalene production from CO2 inSynechococcus elongatus PCC 7942by metabolic engineering and scalableproduction in a photobioreactor.ACS Synth Biol.6, 1289-1295.10.1021/acssynbio.7b00083.
Clark,R.L.,McGinley,L.L.,Purdy,H.M.,Korosh,T.C.,Reed,J.L., Root,T.W.,Pfleger,B.F.,2018.Light-optimized growth of cyanobacterial cultures:Growthphases and productivity of biomass and secreted molecules in light-limitedbatch growth.Metab Eng.47, 230-242.10.1016/j.ymben.2018.03.017.
Collier,J.L.,Grossman,A.R.,1992.Chlorosis induced by nutrientdeprivation in Synechococcus sp.strain PCC 7942:not all bleaching is thesame. Journal of bacteriology.174,4718-26.
Davies,F.K.,Work,V.H.,Beliaev,A.S.,Posewitz,M.C.,2014. Engineeringlimonene and bisabolene production in wild type and a glycogen-deficientmutant of Synechococcus sp.PCC 7002.Frontiers in bioengineering andbiotechnology.2,21.10.3389/fbioe.2014.00021.
Dexter,J.,Armshaw,P.,Sheahan,C.,Pembroke,J.T.,2015.The state ofautotrophic ethanol production in Cyanobacteria.J Appl Microbiol.119, 11-24.10.1111/jam.12821.
Elhai,J.,Wolk,C.P.,1988.A versatile class of positive-selectionvectors based on the nonviability of palindrome-containing plasmids thatallows cloning into long polylinkers.Gene.68,119-138.Doi 10.1016/0378-1119(88)90605-1.
Englund,E.,Pattanaik,B.,Ubhayasekera,S.J.,Stensjo,K.,Bergquist,J.,Lindberg,P.,2014.Production of squalene in Synechocystis sp.PCC 6803. PLoSOne.9,e90270.10.1371/journal.pone.0090270.
Fathima,A.M.,Chuang,D.,Lavina,W.A.,Liao,J.,Putri,S.P.,Fukusaki, E.,2018.Iterative cycle of widely targeted metabolic profiling for theimprovement of 1-butanol titer and productivity in Synechococcus elongatus.Biotechnol Biofuels.11,188.10.1186/s13068-018-1187-8.
Feingersch,R.,Philosof,A.,Mejuch,T.,Glaser,F.,Alalouf,O.,Shoham,Y.,Beja,O.,2012.Potential for phosphite and phosphonate utilization byProchlorococcus.ISME J.6,827-34.10.1038/ismej.2011.149.
Frigaard,N.U.,Sakuragi,Y.,Bryant,D.A.,2004.Gene inactivation in thecyanobacterium Synechococcus sp.PCC 7002 and the green sulfur bacteriumChlorobium tepidum using in vitro-made DNA constructs and naturaltransformation.Methods Mol Biol.274,325-40.10.1385/1-59259-799-8:325.
Gomez-Garcia,M.R.,Fazeli,F.,Grote,A.,Grossman,A.R.,Bhaya,D.,2013.Role of polyphosphate in thermophilic Synechococcus sp.from microbialmats.Journal of bacteriology.195,3309-19.10.1128/JB.00207-13.
Gordon,G.C.,Korosh,T.C.,Cameron,J.C.,Markley,A.L.,Begemann, M.B.,Pfleger,B.F.,2016.CRISPR interference as a titratable,trans-acting regulatorytool for metabolic engineering in the cyanobacterium Synechococcus sp.strainPCC 7002.Metab Eng.38,170-179.10.1016/j.ymben.2016.07.007.
Halfmann,C.,Gu,L.,Gibbons,W.,Zhou,R.,2014.Genetically engineeringcyanobacteria to convert CO2,water,and light into the long-chain hydrocarbonfarnesene.Appl Microbiol Biotechnol.98, 9869-77.10.1007/s00253-014-6118-4.
Hirota,R.,Abe,K.,Katsuura,Z.I.,Noguchi,R.,Moribe,S.,Motomura,K.,Ishida,T.,Alexandrov,M.,Funabashi,H.,Ikeda,T.,Kuroda,A.,2017.A novelbiocontainment strategy makes bacterial growth and survival dependent onphosphite.Sci Rep.7,44748.10.1038/srep44748.
Kanda,K.,Ishida,T.,Hirota,R.,Ono,S.,Motomura,K.,Ikeda,T., Kitamura,K.,Kuroda,A.,2014.Application of a phosphite dehydrogenase gene as a noveldominant selection marker for yeasts.J Biotechnol.182, 68-73.10.1016/j.jbiotec.2014.04.012.
Kato,A.,Takatani,N.,Ikeda,K.,Maeda,S.I.,Omata,T.,2017.Removal of theproduct from the culture medium strongly enhances free fatty acid productionby genetically engineered Synechococcus elongatus.Biotechnol Biofuels.10,141.10.1186/s13068-017-0831-z.
Liu,H.,Naismith,J.H.,2008.An efficient one-step site-directeddeletion, insertion,single and multiple-site plasmid mutagenesis protocol.BMCBiotechnol.8,91.10.1186/1472-6750-8-91.
Loera-Quezada,M.M.,Leyva-Gonzalez,M.A.,Velazquez-Juarez,G., Sanchez-Calderon,L.,Do Nascimento,M.,Lopez-Arredondo,D., Herrera-Estrella,L.,2016.Anovel genetic engineering platform for the effective management of biologicalcontaminants for the production of microalgae.Plant Biotechnol J.14,2066-76.10.1111/pbi.12564.
Lopez-Arredondo,D.L.,Herrera-Estrella,L.,2012.Engineering phosphorusmetabolism in plants to produce a dual fertilization and weed controlsystem.Nat Biotechnol.30,889-93.10.1038/nbt.2346.
Ludwig,M.,Bryant,D.A.,2011.Transcription profiling of the modelcyanobacterium Synechococcus sp.strain PCC 7002 by next-gen(SOLiD) sequencingof cDNA.Frontiers in microbiology.2,41.
Ludwig,M.,Bryant,D.A.,2012.Synechococcus sp.strain PCC 7002transcriptome:acclimation to temperature,salinity,oxidative stress,andmixotrophic growth conditions.Frontiers in microbiology.3,354.
Markley,A.L.,Begemann,M.B.,Clarke,R.E.,Gordon,G.C.,Pfleger,B. F.,2015.Synthetic biology toolbox for controlling gene expression in thecyanobacterium Synechococcus sp.strain PCC 7002.ACS Synth Biol.4, 595-603.10.1021/sb500260k.
Martinez,A.,Osburne,M.S.,Sharma,A.K.,DeLong,E.F.,Chisholm,S. W.,2012.Phosphite utilization by the marine picocyanobacterium ProchlorococcusMIT9301.Environ Microbiol.14, 1363-77.10.1111/j.1462-2920.2011.02612.x.
Motomura,K.,Sano,K.,Watanabe,S.,Kanbara,A.,Gamal Nasser,A.H., Ikeda,T.,Ishida,T.,Funabashi,H.,Kuroda,A.,Hirota,R.,2018.Synthetic phosphorusmetabolic pathway for biosafety and contamination management ofcyanobacterial cultivation.ACS Synth Biol.10.1021/acssynbio.8b00199.
Nahampun,H.N.,Lopez-Arredondo,D.,Xu,X.,Herrera-Estrella,L., Wang,K.,2016.Assessment of ptxD gene as an alternative selectable marker forAgrobacterium-mediated maize transformation.Plant Cell Rep.35, 1121-1132.10.1007/s00299-016-1942-x.
Pandeya,D.,Campbell,L.M.,Nunes,E.,Lopez-Arredondo,D.L.,Janga, M.R.,Herrera-Estrella,L.,Rathore,K.S.,2017.ptxD gene in combination with phosphiteserves as a highly effective selection system to generate transgenic cotton(Gossypium hirsutum L.).Plant Mol Biol.95, 567-577.10.1007/s11103-017-0670-0.
Perez,A.A.,Liu,Z.,Rodionov,D.A.,Li,Z.,Bryant,D.A.,2016.Complementation of cobalamin auxotrophy in Synechococcus sp.strain PCC 7002and validation of a putative cobalamin riboswitch in vivo.Journal ofbacteriology.10.1128/JB.00475-16.
Polyviou,D.,Hitchcock,A.,Baylay,A.J.,Moore,C.M.,Bibby,T.S.,2015.Phosphite utilization by the globally important marine diazotrophTrichodesmium.Environmental microbiology reports.7, 824-30.10.1111/1758-2229.12308.
Ruffing,A.M.,2014.Improved free fatty acid production incyanobacteria with Synechococcus sp.PCC 7002 as host.Frontiers inbioengineering and biotechnology.2,17.10.3389/fbioe.2014.00017.
Schoepp,N.G.,Stewart,R.L.,Sun,V.,Quigley,A.J.,Mendola,D., Mayfield,S.P.,Burkart,M.D.,2014.System and method for research-scale outdoorproduction of microalgae and cyanobacteria.Bioresour Technol.166, 273-81.10.1016/j.biortech.2014.05.046.
Shabestary,K.,Anfelt,J.,Ljungqvist,E.,Jahn,M.,Yao,L.,Hudson,E.P.,2018.Targeted repression of essential genes to arrest growth and increasecarbon partitioning and biofuel titers in cyanobacteria.ACS Synth Biol.7,1669-1675.10.1021/acssynbio.8b00056.
Shaw,A.J.,Lam,F.H.,Hamilton,M.,Consiglio,A.,MacEwen,K., Brevnova,E.E.,Greenhagen,E.,LaTouf,W.G.,South,C.R.,van Dijken,H., Stephanopoulos,G.,2016.Metabolic engineering of microbial competitive advantage for industrialfermentation processes.Science.353, 583-6.10.1126/science.aaf6159.
Stevens,S.E.,Patterson,C.O.,Myers,J.,1973.Production of hydrogenperoxide by blue-green algae-a survey.J Phycol.9,427-430
van den Ent,F.,and
Figure BDA0003099073190000381
J.,2006.RF cloning:A restriction-free methodfor inserting target genes into plasmids.J Biochem Biophys Methods.Apr 30; 67(1):67-74.
Ventola,C.L.,2015a.The antibiotic resistance crisis:part 1:causes andthreats.P T.40,277-83.
Ventola,C.L.,2015b.The antibiotic resistance crisis:part 2:managementstrategies and new agents.P T.40,344-52.
von Wintersdorff,C.J.H.,Penders,J.,van Niekerk,J.M.,Mills,N.D.,Majumder,S.,van Alphen,L.B.,Savelkoul,P.H.M.,Wolffs,P.F.G.,2016.Dissemination of antimicrobial resistance in microbial ecosystems throughhorizontal gene transfer.Frontiers in microbiology. 7.10.3389/fmicb.2016.00173.
Wang,X.,Liu,W.,Xin,C.,Zheng,Y.,Cheng,Y.,Sun,S.,Li,R.,Zhu,X.G., Dai,S.Y.,Rentzepis,P.M.,Yuan,J.S.,2016.Enhanced limonene production incyanobacteria reveals photosynthesis limitations.Proceedings of the NationalAcademy of Sciences of the United States of America.113, 14225-14230.10.1073/pnas.1613340113.
Woodyer R.,Zhao H.,van der Donk WA.,2005.Mechanistic investigation ofa highly active phosphite dehydrogenase mutant and its application for NADPHregeneration.FEBS J.Aug;272(15):3816-27.
Xu,Y.,Alvey,R.M.,Byrne,P.O.,Graham,J.E.,Shen,G.,Bryant,D.A.,2011.Expression of genes in cyanobacteria:adaptation of endogenous plasmidsas platforms for high-level gene expression in Synechococcus sp.PCC 7002.Methods Mol Biol.684,273-93。
序列表
<110> 南洋理工大学(Nanyang Technological University)
<120> 使用无抗生素选择的遗传工程蓝细菌在未灭菌条件下生长
<130> PPI21171099SG
<150> 10201810863R
<151> 2018-12-04
<160> 96
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> D08807
<400> 1
gcactgtggc aaggaaatcg 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> D08808
<400> 2
tcgcctttat ggaggatggc 20
<210> 3
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> D98496993
<400> 3
taaaaaagac tttatgactg ctttactg 28
<210> 4
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> D77036
<400> 4
ggctcaaaag acatcattta gg 22
<210> 5
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> D98847023
<400> 5
gaaggttttc tgttatctga aattcctccc taaatgatgt cttttgagcc aaaggtgctt 60
gtgtctcaac 70
<210> 6
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> D98847024
<400> 6
tcatggtgta tatctcctaa tcaatttaga gcatttcaaa gtaggc 46
<210> 7
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> D98847025
<400> 7
tcgggcctac tttgaaatgc tctaaattga ttaggagata tacaccatg 49
<210> 8
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> D98847026
<400> 8
gggaataatg ttggtcatgg agcagtaaag cagtcataaa gtctttttta tcgctcgtca 60
tttgctttc 69
<210> 9
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> D99280067
<400> 9
tgaagatcaa caccatctat gacttagcc 29
<210> 10
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> D99280068
<400> 10
taaccccatg caaacgccat c 21
<210> 11
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> Mel_seq_1
<400> 11
tgccattggt atgagtgaac aagc 24
<210> 12
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> Mel_seq_2
<400> 12
tctctccgat tgtaccggtg c 21
<210> 13
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> Mel_seq_3
<400> 13
aatggatcaa atcttttatt tgtgaagaaa gtgg 34
<210> 14
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> Mel_seq_4
<400> 14
atgatgtggc ccgctcc 17
<210> 15
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> Mel_seq_5
<400> 15
tcgtggataa actctttgtg atgatgacc 29
<210> 16
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> Mel_seq_6
<400> 16
catgcccaaa ttaccgaaac c 21
<210> 17
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> Mel_seq_7
<400> 17
tgctctctga tagtgatatt aattccacc 29
<210> 18
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> Mel_seq_8
<400> 18
gaaggtgaac ccattattga taaacc 26
<210> 19
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> Mel_seq_9
<400> 19
tccatcaatt tcaaattctc aagtctcg 28
<210> 20
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> Mel_seq_10
<400> 20
agcaatcccc tcaaaaaatt tagttcc 27
<210> 21
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> Mel_seq_11
<400> 21
tcattggcaa aaaatttacc gattatgc 28
<210> 22
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> Mel_seq_12
<400> 22
tgcccaatgt gaccgtgg 18
<210> 23
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> Mel_seq_13
<400> 23
tcaaagaaga ataccccgat acctg 25
<210> 24
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> Mel_seq_14
<400> 24
tcgatgaacg cctccaagtg g 21
<210> 25
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> D100023580
<400> 25
acccggggat cctctagagc cagatccttt tgcatc 36
<210> 26
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> D100023581
<400> 26
ctgcaggtcg actcttgaag ggagccagaa cataaaaag 39
<210> 27
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> A0935_UCO_F
<400> 27
tgacttggtt cacgtagaaa aaccagaagg gac 33
<210> 28
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> A0936_UCO_R
<400> 28
tgtccactcc ttaatcacta ttcaaaatat tatatttact cagtttttaa g 51
<210> 29
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> D98496996
<400> 29
attaaggagt ggacagccta c 21
<210> 30
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> D100141467
<400> 30
acgtgaacca agtcagacaa tc 22
<210> 31
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> D100043610
<400> 31
tagatgatga tgtagaattg tctgctaatt ac 32
<210> 32
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> D100043611
<400> 32
taatgatttc agtacaaatt gctctgc 27
<210> 33
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> D100263687
<400> 33
tttgattgtc tgacttggtt cacgtttgag gccgttgatc tagacaaaaa ac 52
<210> 34
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> D100263688
<400> 34
aggagattaa ttccatgggc catc 24
<210> 35
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> D100098818
<400> 35
agaaaaacca gaagggacg 19
<210> 36
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> D101108991
<400> 36
taaagtcaag tagaagatta attccatggg ccatcatcat catcatcatc atc 53
<210> 37
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> D101108992
<400> 37
ggaattaatc ttctacttga ctttatgagt tgggagctcc ttttgcaatc 50
<210> 38
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> D74727
<400> 38
ttcacagagg aaggggaaat tgtc 24
<210> 39
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> D74729
<400> 39
tcatatccgg ggcatacatt cg 22
<210> 40
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> D101108989
<400> 40
ttaagctagt tagaagattc agaccatgca aaccctcagc attcaacatg 50
<210> 41
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> D101108990
<400> 41
ggtctgaatc ttctaactag cttaattccg ttcgtacacg aggcgac 47
<210> 42
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> D15106
<400> 42
gttgtaaaac gacggccagt gaattttaag cctggggtga gttgac 46
<210> 43
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> D15107
<400> 43
cgtttccagt tgtccactcc ttaattaatt tctcaaggga aagaaaaaga tttattcc 58
<210> 44
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> D15108
<400> 44
ttaaaaagca tgacttggtt cacgtacgaa ggttgttttt aaagctaaga ag 52
<210> 45
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> D15109
<400> 45
caggaaacag ctatgaccat gattatatga aaatgcttca caccatgatt cg 52
<210> 46
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> D15110
<400> 46
gttgtaaaac gacggccagt gaattacaat tgacacaaaa aagagagcaa ag 52
<210> 47
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> D15111
<400> 47
gctccggctt tgacttggtt cacgtgtgac cctcttgcag caacc 45
<210> 48
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> D15112
<400> 48
ttccacggtg tgtccactcc ttaatttgcc tgattatgct tccatcaaaa tttg 54
<210> 49
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> D15113
<400> 49
caggaaacag ctatgaccat gattatatcc gtcacggtgg ctc 43
<210> 50
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> D39394
<400> 50
taggtagtat tggggcatca gg 22
<210> 51
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> D39395
<400> 51
taatctcgat gtgatgattg ctgaagg 27
<210> 52
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> D99047654
<400> 52
attaaggagt ggacacaccg tggaaacgga tgaag 35
<210> 53
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> D99047655
<400> 53
acgtgaacca agtcaaagcc ggagcgcttt tg 32
<210> 54
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> D98646038
<400> 54
attaaggagt ggacaactgg aaacggatga agg 33
<210> 55
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> D98646039
<400> 55
acgtgaacca agtcatgctt tttaagggaa ttgtgc 36
<210> 56
<211> 474
<212> PRT
<213> 人工序列
<220>
<223> 原始TriA
<400> 56
Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln
1 5 10 15
Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg
20 25 30
Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp
35 40 45
Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn
50 55 60
Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His
65 70 75 80
Gly Arg Gln Leu Tyr Asp Trp Leu Phe Asn Val Leu Tyr Pro Gly Gln
85 90 95
Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys
100 105 110
Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp
115 120 125
Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly
130 135 140
Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met
145 150 155 160
Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro
165 170 175
Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp
180 185 190
Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg
195 200 205
Ile Ser Val Trp Pro Ala Pro Ala Ile Thr Pro Ala Val Thr Val Glu
210 215 220
Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp
225 230 235 240
Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu His Trp Met
245 250 255
Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu
260 265 270
Gln Val Ala His Cys Val Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu
275 280 285
His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr
290 295 300
Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Glu Arg Gly Met
305 310 315 320
Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn
325 330 335
Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His
340 345 350
Arg Asp Ala Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr
355 360 365
Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile
370 375 380
Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro
385 390 395 400
Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala
405 410 415
Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met
420 425 430
Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe
435 440 445
Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn
450 455 460
Met Val Ala Asn Pro Ala Trp Arg Ser Leu
465 470
<210> 57
<211> 1425
<212> DNA
<213> 人工序列
<220>
<223> 瓜类细菌性果斑病菌(Acidovorax avenae subsp. citrulli) NRRL B-12227
<400> 57
atgcaaacgc tcagcatcca gcacggtacc ctcgtcacga tggatcagta ccgcagagtc 60
cttggggata gctgggttca cgtgcaggat ggacggatcg tcgcgctcgg agtgcacgcc 120
gagtcggtgc ctccgccagc ggatcgggtg atcgatgcac gcggcaaggt cgtgttaccc 180
ggtttcatca atgcccacac ccatgtgaac cagatcctcc tgcgcggagg gccctcgcac 240
gggcgtcaac tctatgactg gctgttcaac gttttgtatc cgggacaaaa ggcgatgaga 300
ccggaggacg tagcggtggc ggtgaggttg tattgtgcgg aagctgtgcg cagcgggatt 360
acgacgatca acgacaacgc cgattcggcc atctacccag gcaacatcga ggccgcgatg 420
gcggtctatg gtgaggtggg tgtgagggtc gtctacgccc gcatgttctt tgatcggatg 480
gacgggcgca ttcaagggta tgtggacgcc ttgaaggctc gctctcccca agtcgaactg 540
tgctcgatca tggaggaaac ggctgtggcc aaagatcgga tcacagccct gtcagatcag 600
tatcatggca cggcaggagg tcgtatatca gtttggcccg ctcctgccat taccccggcg 660
gtgacagttg aaggaatgcg atgggcacaa gccttcgccc gtgatcgggc ggtaatgtgg 720
acgcttcaca tggcggagag cgatcatgat gagcggcttc attggatgag tcccgccgag 780
tacatggagt gttacggact cttggatgag cgtctgcagg tcgcgcattg cgtgtacttt 840
gaccggaagg atgttcggct gctgcaccgc cacaatgtga aggtcgcgtc gcaggttgtg 900
agcaatgcct acctcggctc aggggtggcc cccgtgccag agatggtgga gcgcggcatg 960
gccgtgggca ttggaacaga tgacgggaat tgtaatgact ccgtaaacat gatcggagac 1020
atgaagttta tggcccatat tcaccgcgcg gtgcatcggg atgcggacgt gctgacccca 1080
gagaagattc ttgaaatggc gacgatcgat ggggcgcgtt cgttgggaat ggaccacgag 1140
attggttcca tcgaaaccgg caagcgcgcg gaccttatcc tgcttgacct gcgtcaccct 1200
cagacgactc ctcaccatca tttggcggcc acgatcgtgt ttcaggctta cggcaatgag 1260
gtggacactg tcctgattga cggaaacgtt gtgatggaga accgccgctt gagctttctt 1320
ccccctgaac gtgagttggc gttccttgag gaagcgcaga gccgcgccac agctattttg 1380
cagcgggcga acatggtggc taacccagct tggcgcagcc tctag 1425
<210> 58
<211> 470
<212> PRT
<213> 人工序列
<220>
<223> Mel1 TriA
<400> 58
Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln
1 5 10 15
Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg
20 25 30
Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp
35 40 45
Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn
50 55 60
Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His
65 70 75 80
Gly Arg Gln Leu Tyr Asp Trp Leu Phe Asn Val Leu Tyr Pro Gly Gln
85 90 95
Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys
100 105 110
Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp
115 120 125
Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly
130 135 140
Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met
145 150 155 160
Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro
165 170 175
Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp
180 185 190
Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg
195 200 205
Ile Ser Val Trp Pro Ala Pro Ala Ile Thr Pro Ala Val Thr Val Glu
210 215 220
Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp
225 230 235 240
Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu His Trp Met
245 250 255
Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu
260 265 270
Gln Val Ala His Cys Val Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu
275 280 285
His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr
290 295 300
Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Glu Arg Gly Met
305 310 315 320
Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn
325 330 335
Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His
340 345 350
Arg Asp Ala Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr
355 360 365
Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile
370 375 380
Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro
385 390 395 400
Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala
405 410 415
Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met
420 425 430
Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe
435 440 445
Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn
450 455 460
Met Val Ala Asn Pro Ala
465 470
<210> 59
<211> 1443
<212> DNA
<213> 人工序列
<220>
<223> Mel1基因序列
<220>
<221> RBS
<222> (5)..(10)
<220>
<221> 基因
<222> (19)..(1443)
<400> 59
agttaggaga ttcagaccat gcaaaccctc agcattcaac atggcaccct cgtgacgatg 60
gatcaatatc gccgggtgct cggcgatagc tgggtgcatg tgcaagatgg ccgcattgtg 120
gccctcggtg tgcatgccga atctgtgccc ccccccgccg atcgtgtgat tgatgcccgc 180
ggtaaagtgg tgctccccgg ttttattaat gcccataccc acgtgaatca aattctcctc 240
cgtggtggtc cctctcacgg tcgccaactc tatgattggc tctttaatgt gctctacccc 300
ggccaaaaag ccatgcgccc cgaagatgtg gccgtggccg tgcggctcta ttgtgccgaa 360
gccgtgcgca gtggtattac caccattaat gataatgccg attccgccat ttaccccggc 420
aatattgaag ccgcgatggc cgtgtatggc gaagtgggtg tgcgggtggt gtacgcccgc 480
atgtttttcg atcgcatgga tggccggatt caaggttatg tggatgccct caaagcccgg 540
agcccccaag tggaactctg ttctattatg gaagaaaccg ccgtggccaa agatcggatt 600
accgccctca gcgatcaata tcacggcacc gccggtggcc gcattagtgt gtggcccgcc 660
cccgccatta cccccgccgt gaccgtggag ggtatgcgtt gggcccaagc ctttgcccgc 720
gatcgggccg tgatgtggac cctccacatg gccgaaagcg atcatgatga acggctccac 780
tggatgtctc ccgccgaata tatggaatgt tacggcctcc tcgatgaacg cctccaagtg 840
gcccactgtg tgtattttga tcgcaaagat gtgcggctcc tccatcgcca caatgtgaaa 900
gtggccagtc aagtggtgtc caatgcctac ctcggcagtg gtgtggcccc cgtgcccgaa 960
atggtggaac gtggcatggc cgtgggcatt ggcaccgatg atggtaattg taatgattcc 1020
gtgaatatga ttggcgatat gaaatttatg gcccatattc accgggccgt gcatcgcgat 1080
gccgatgtgc tcacccccga aaaaattctc gaaatggcca ccattgatgg cgcccgcagt 1140
ctcggtatgg atcatgaaat tggctccatt gaaaccggta aacgggccga tctcattctc 1200
ctcgatctcc gccaccccca aaccaccccc caccatcacc tcgccgccac cattgtgttt 1260
caagcctacg gtaatgaagt ggataccgtg ctcattgatg gcaatgtggt gatggaaaat 1320
cgccggctca gttttctccc ccccgaacgg gaactcgcct ttctcgaaga agcccaaagt 1380
cgcgccaccg ccattctcca acgcgccaat atggtggcca atcccgcctg acgcagcctc 1440
taa 1443
<210> 60
<211> 474
<212> PRT
<213> 人工序列
<220>
<223> Mel4 TriA.
<400> 60
Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln
1 5 10 15
Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg
20 25 30
Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp
35 40 45
Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn
50 55 60
Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His
65 70 75 80
Gly Arg Gln Leu Tyr Asp Trp Phe Phe Asn Val Leu Tyr Pro Gly Gln
85 90 95
Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys
100 105 110
Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp
115 120 125
Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly
130 135 140
Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met
145 150 155 160
Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro
165 170 175
Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp
180 185 190
Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg
195 200 205
Ile Ser Val Trp Pro Ala Pro Ala Ile Thr Pro Ala Val Thr Val Glu
210 215 220
Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp
225 230 235 240
Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu His Trp Met
245 250 255
Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu
260 265 270
Gln Val Ala His Cys Val Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu
275 280 285
His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr
290 295 300
Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Glu Arg Gly Met
305 310 315 320
Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn
325 330 335
Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His
340 345 350
Arg Asp Ala Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr
355 360 365
Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile
370 375 380
Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro
385 390 395 400
Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala
405 410 415
Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met
420 425 430
Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe
435 440 445
Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn
450 455 460
Met Val Ala Asn Pro Ala Trp Arg Ser Leu
465 470
<210> 61
<211> 1443
<212> DNA
<213> 人工序列
<220>
<223> Mel4基因序列
<220>
<221> RBS
<222> (5)..(10)
<220>
<221> 基因
<222> (19)..(1443)
<223> triA基因序列
<400> 61
agttaggaga ttcagaccat gcaaaccctc agcattcaac atggcaccct cgtgacgatg 60
gatcaatatc gccgggtgct cggcgatagc tgggtgcatg tgcaagatgg ccgcattgtg 120
gccctcggtg tgcatgccga atctgtgccc ccccccgccg atcgtgtgat tgatgcccgc 180
ggtaaagtgg tgctccccgg ttttattaat gcccataccc acgtgaatca aattctcctc 240
cgtggtggtc cctctcacgg tcgccaactc tatgattggt tctttaatgt gctctacccc 300
ggccaaaaag ccatgcgccc cgaagatgtg gccgtggccg tgcggctcta ttgtgccgaa 360
gccgtgcgca gtggtattac caccattaat gataatgccg attccgccat ttaccccggc 420
aatattgaag ccgcgatggc cgtgtatggc gaagtgggtg tgcgggtggt gtacgcccgc 480
atgtttttcg atcgcatgga tggccggatt caaggttatg tggatgccct caaagcccgg 540
agcccccaag tggaactctg ttctattatg gaagaaaccg ccgtggccaa agatcggatt 600
accgccctca gcgatcaata tcacggcacc gccggtggcc gcattagtgt gtggcccgcc 660
cccgccatta cccccgccgt gaccgtggag ggtatgcgtt gggcccaagc ctttgcccgc 720
gatcgggccg tgatgtggac cctccacatg gccgaaagcg atcatgatga acggctccac 780
tggatgtctc ccgccgaata tatggaatgt tacggcctcc tcgatgaacg cctccaagtg 840
gcccactgtg tgtattttga tcgcaaagat gtgcggctcc tccatcgcca caatgtgaaa 900
gtggccagtc aagtggtgtc caatgcctac ctcggcagtg gtgtggcccc cgtgcccgaa 960
atggtggaac gtggcatggc cgtgggcatt ggcaccgatg atggtaattg taatgattcc 1020
gtgaatatga ttggcgatat gaaatttatg gcccatattc accgggccgt gcatcgcgat 1080
gccgatgtgc tcacccccga aaaaattctc gaaatggcca ccattgatgg cgcccgcagt 1140
ctcggtatgg atcatgaaat tggctccatt gaaaccggta aacgggccga tctcattctc 1200
ctcgatctcc gccaccccca aaccaccccc caccatcacc tcgccgccac cattgtgttt 1260
caagcctacg gtaatgaagt ggataccgtg ctcattgatg gcaatgtggt gatggaaaat 1320
cgccggctca gttttctccc ccccgaacgg gaactcgcct ttctcgaaga agcccaaagt 1380
cgcgccaccg ccattctcca acgcgccaat atggtggcca atcccgcctg gcgcagcctc 1440
taa 1443
<210> 62
<211> 474
<212> PRT
<213> 人工序列
<220>
<223> Mel6 TriA
<400> 62
Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln
1 5 10 15
Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg
20 25 30
Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp
35 40 45
Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn
50 55 60
Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His
65 70 75 80
Gly Arg Gln Leu Tyr Asp Trp Leu Phe Asn Val Leu Tyr Pro Gly Gln
85 90 95
Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys
100 105 110
Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp
115 120 125
Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly
130 135 140
Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met
145 150 155 160
Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro
165 170 175
Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp
180 185 190
Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg
195 200 205
Ile Ser Val Trp Pro Ala Pro Ala Ile Thr Pro Ala Val Thr Val Glu
210 215 220
Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp
225 230 235 240
Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu His Trp Met
245 250 255
Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu
260 265 270
Gln Val Ala His Cys Val Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu
275 280 285
His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr
290 295 300
Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Lys Arg Gly Met
305 310 315 320
Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn
325 330 335
Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His
340 345 350
Arg Asp Ala Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr
355 360 365
Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile
370 375 380
Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro
385 390 395 400
Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala
405 410 415
Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met
420 425 430
Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe
435 440 445
Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn
450 455 460
Met Val Ala Asn Pro Ala Trp Arg Ser Leu
465 470
<210> 63
<211> 1443
<212> DNA
<213> 人工序列
<220>
<223> Mel6基因序列
<220>
<221> RBS
<222> (5)..(10)
<220>
<221> 基因
<222> (19)..(1443)
<223> triA基因序列
<400> 63
agttaggaga ttcagaccat gcaaaccctc agcattcaac atggcaccct cgtgacgatg 60
gatcaatatc gccgggtgct cggcgatagc tgggtgcatg tgcaagatgg ccgcattgtg 120
gccctcggtg tgcatgccga atctgtgccc ccccccgccg atcgtgtgat tgatgcccgc 180
ggtaaagtgg tgctccccgg ttttattaat gcccataccc acgtgaatca aattctcctc 240
cgtggtggtc cctctcacgg tcgccaactc tatgattggc tctttaatgt gctctacccc 300
ggccaaaaag ccatgcgccc cgaagatgtg gccgtggccg tgcggctcta ttgtgccgaa 360
gccgtgcgca gtggtattac caccattaat gataatgccg attccgccat ttaccccggc 420
aatattgaag ccgcgatggc cgtgtatggc gaagtgggtg tgcgggtggt gtacgcccgc 480
atgtttttcg atcgcatgga tggccggatt caaggttatg tggatgccct caaagcccgg 540
agcccccaag tggaactctg ttctattatg gaagaaaccg ccgtggccaa agatcggatt 600
accgccctca gcgatcaata tcacggcacc gccggtggcc gcattagtgt gtggcccgcc 660
cccgccatta cccccgccgt gaccgtggag ggtatgcgtt gggcccaagc ctttgcccgc 720
gatcgggccg tgatgtggac cctccacatg gccgaaagcg atcatgatga acggctccac 780
tggatgtctc ccgccgaata tatggaatgt tacggcctcc tcgatgaacg cctccaagtg 840
gcccactgtg tgtattttga tcgcaaagat gtgcggctcc tccatcgcca caatgtgaaa 900
gtggccagtc aagtggtgtc caatgcctac ctcggcagtg gtgtggcccc cgtgcccgaa 960
atggtgaaac gtggcatggc cgtgggcatt ggcaccgatg atggtaattg taatgattcc 1020
gtgaatatga ttggcgatat gaaatttatg gcccatattc accgggccgt gcatcgcgat 1080
gccgatgtgc tcacccccga aaaaattctc gaaatggcca ccattgatgg cgcccgcagt 1140
ctcggtatgg atcatgaaat tggctccatt gaaaccggta aacgggccga tctcattctc 1200
ctcgatctcc gccaccccca aaccaccccc caccatcacc tcgccgccac cattgtgttt 1260
caagcctacg gtaatgaagt ggataccgtg ctcattgatg gcaatgtggt gatggaaaat 1320
cgccggctca gttttctccc ccccgaacgg gaactcgcct ttctcgaaga agcccaaagt 1380
cgcgccaccg ccattctcca acgcgccaat atggtggcca atcccgcctg gcgcagcctc 1440
taa 1443
<210> 64
<211> 474
<212> PRT
<213> 人工序列
<220>
<223> Mel7 TriA
<400> 64
Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln
1 5 10 15
Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg
20 25 30
Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp
35 40 45
Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn
50 55 60
Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His
65 70 75 80
Gly Arg Gln Leu Tyr Asp Trp Leu Phe Asn Val Leu Tyr Pro Gly Gln
85 90 95
Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys
100 105 110
Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp
115 120 125
Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly
130 135 140
Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met
145 150 155 160
Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro
165 170 175
Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp
180 185 190
Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg
195 200 205
Ile Ser Val Trp Pro Ala Pro Ala Ile Thr Pro Ala Val Thr Val Glu
210 215 220
Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp
225 230 235 240
Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu Tyr Trp Met
245 250 255
Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu
260 265 270
Gln Val Ala His Cys Val Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu
275 280 285
His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr
290 295 300
Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Glu Arg Gly Met
305 310 315 320
Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn
325 330 335
Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His
340 345 350
Arg Asp Ala Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr
355 360 365
Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile
370 375 380
Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro
385 390 395 400
Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala
405 410 415
Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met
420 425 430
Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe
435 440 445
Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn
450 455 460
Met Val Ala Asn Pro Ala Trp Arg Ser Leu
465 470
<210> 65
<211> 1443
<212> DNA
<213> 人工序列
<220>
<223> Mel7基因序列
<220>
<221> RBS
<222> (5)..(10)
<220>
<221> 基因
<222> (19)..(1443)
<223> triA基因序列
<400> 65
agttaggaga ttcagaccat gcaaaccctc agcattcaac atggcaccct cgtgacgatg 60
gatcaatatc gccgggtgct cggcgatagc tgggtgcatg tgcaagatgg ccgcattgtg 120
gccctcggtg tgcatgccga atctgtgccc ccccccgccg atcgtgtgat tgatgcccgc 180
ggtaaagtgg tgctccccgg ttttattaat gcccataccc acgtgaatca aattctcctc 240
cgtggtggtc cctctcacgg tcgccaactc tatgattggc tctttaatgt gctctacccc 300
ggccaaaaag ccatgcgccc cgaagatgtg gccgtggccg tgcggctcta ttgtgccgaa 360
gccgtgcgca gtggtattac caccattaat gataatgccg attccgccat ttaccccggc 420
aatattgaag ccgcgatggc cgtgtatggc gaagtgggtg tgcgggtggt gtacgcccgc 480
atgtttttcg atcgcatgga tggccggatt caaggttatg tggatgccct caaagcccgg 540
agcccccaag tggaactctg ttctattatg gaagaaaccg ccgtggccaa agatcggatt 600
accgccctca gcgatcaata tcacggcacc gccggtggcc gcattagtgt gtggcccgcc 660
cccgccatta cccccgccgt gaccgtggag ggtatgcgtt gggcccaagc ctttgcccgc 720
gatcgggccg tgatgtggac cctccacatg gccgaaagcg atcatgatga acggctctac 780
tggatgtctc ccgccgaata tatggaatgt tacggcctcc tcgatgaacg cctccaagtg 840
gcccactgtg tgtattttga tcgcaaagat gtgcggctcc tccatcgcca caatgtgaaa 900
gtggccagtc aagtggtgtc caatgcctac ctcggcagtg gtgtggcccc cgtgcccgaa 960
atggtggaac gtggcatggc cgtgggcatt ggcaccgatg atggtaattg taatgattcc 1020
gtgaatatga ttggcgatat gaaatttatg gcccatattc accgggccgt gcatcgcgat 1080
gccgatgtgc tcacccccga aaaaattctc gaaatggcca ccattgatgg cgcccgcagt 1140
ctcggtatgg atcatgaaat tggctccatt gaaaccggta aacgggccga tctcattctc 1200
ctcgatctcc gccaccccca aaccaccccc caccatcacc tcgccgccac cattgtgttt 1260
caagcctacg gtaatgaagt ggataccgtg ctcattgatg gcaatgtggt gatggaaaat 1320
cgccggctca gttttctccc ccccgaacgg gaactcgcct ttctcgaaga agcccaaagt 1380
cgcgccaccg ccattctcca acgcgccaat atggtggcca atcccgcctg gcgcagcctc 1440
taa 1443
<210> 66
<211> 474
<212> PRT
<213> 人工序列
<220>
<223> Mel8 TriA
<400> 66
Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln
1 5 10 15
Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg
20 25 30
Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp
35 40 45
Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn
50 55 60
Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His
65 70 75 80
Gly Arg Gln Leu Tyr Asp Trp Leu Phe Asn Val Leu Tyr Pro Gly Gln
85 90 95
Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys
100 105 110
Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp
115 120 125
Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly
130 135 140
Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met
145 150 155 160
Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro
165 170 175
Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp
180 185 190
Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg
195 200 205
Ile Ser Val Trp Pro Ala Pro Ala Ile Thr Pro Ala Val Thr Val Glu
210 215 220
Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp
225 230 235 240
Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu His Trp Met
245 250 255
Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu
260 265 270
Gln Val Ala His Cys Val Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu
275 280 285
His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr
290 295 300
Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Glu Arg Gly Met
305 310 315 320
Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn
325 330 335
Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His
340 345 350
Arg Asp Val Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr
355 360 365
Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile
370 375 380
Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro
385 390 395 400
Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala
405 410 415
Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met
420 425 430
Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe
435 440 445
Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn
450 455 460
Met Val Ala Asn Pro Ala Trp Arg Ser Leu
465 470
<210> 67
<211> 1443
<212> DNA
<213> 人工序列
<220>
<223> Mel8基因序列
<220>
<221> RBS
<222> (5)..(10)
<220>
<221> 基因
<222> (19)..(1443)
<223> triA基因序列
<400> 67
agttaggaga ttcagaccat gcaaaccctc agcattcaac atggcaccct cgtgacgatg 60
gatcaatatc gccgggtgct cggcgatagc tgggtgcatg tgcaagatgg ccgcattgtg 120
gccctcggtg tgcatgccga atctgtgccc ccccccgccg atcgtgtgat tgatgcccgc 180
ggtaaagtgg tgctccccgg ttttattaat gcccataccc acgtgaatca aattctcctc 240
cgtggtggtc cctctcacgg tcgccaactc tatgattggc tctttaatgt gctctacccc 300
ggccaaaaag ccatgcgccc cgaagatgtg gccgtggccg tgcggctcta ttgtgccgaa 360
gccgtgcgca gtggtattac caccattaat gataatgccg attccgccat ttaccccggc 420
aatattgaag ccgcgatggc cgtgtatggc gaagtgggtg tgcgggtggt gtacgcccgc 480
atgtttttcg atcgcatgga tggccggatt caaggttatg tggatgccct caaagcccgg 540
agcccccaag tggaactctg ttctattatg gaagaaaccg ccgtggccaa agatcggatt 600
accgccctca gcgatcaata tcacggcacc gccggtggcc gcattagtgt gtggcccgcc 660
cccgccatta cccccgccgt gaccgtggag ggtatgcgtt gggcccaagc ctttgcccgc 720
gatcgggccg tgatgtggac cctccacatg gccgaaagcg atcatgatga acggctccac 780
tggatgtctc ccgccgaata tatggaatgt tacggcctcc tcgatgaacg cctccaagtg 840
gcccactgtg tgtattttga tcgcaaagat gtgcggctcc tccatcgcca caatgtgaaa 900
gtggccagtc aagtggtgtc caatgcctac ctcggcagtg gtgtggcccc cgtgcccgaa 960
atggtggaac gtggcatggc cgtgggcatt ggcaccgatg atggtaattg taatgattcc 1020
gtgaatatga ttggcgatat gaaatttatg gcccatattc accgggccgt gcatcgcgat 1080
gtcgatgtgc tcacccccga aaaaattctc gaaatggcca ccattgatgg cgcccgcagt 1140
ctcggtatgg atcatgaaat tggctccatt gaaaccggta aacgggccga tctcattctc 1200
ctcgatctcc gccaccccca aaccaccccc caccatcacc tcgccgccac cattgtgttt 1260
caagcctacg gtaatgaagt ggataccgtg ctcattgatg gcaatgtggt gatggaaaat 1320
cgccggctca gttttctccc ccccgaacgg gaactcgcct ttctcgaaga agcccaaagt 1380
cgcgccaccg ccattctcca acgcgccaat atggtggcca atcccgcctg gcgcagcctc 1440
taa 1443
<210> 68
<211> 474
<212> PRT
<213> 人工序列
<220>
<223> Mel5Evo TriA
<400> 68
Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln
1 5 10 15
Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg
20 25 30
Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp
35 40 45
Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn
50 55 60
Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His
65 70 75 80
Gly Arg Gln Leu Tyr Asp Trp Leu Phe Asn Val Leu Tyr Pro Gly Gln
85 90 95
Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys
100 105 110
Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp
115 120 125
Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly
130 135 140
Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met
145 150 155 160
Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro
165 170 175
Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp
180 185 190
Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg
195 200 205
Ile Ser Val Trp Pro Ala Pro Ala Ile Asn Pro Ala Val Thr Val Glu
210 215 220
Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp
225 230 235 240
Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu His Trp Met
245 250 255
Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu
260 265 270
Gln Val Ala His Cys Met Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu
275 280 285
His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr
290 295 300
Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Glu Arg Gly Met
305 310 315 320
Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn
325 330 335
Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His
340 345 350
Arg Asp Ala Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr
355 360 365
Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile
370 375 380
Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro
385 390 395 400
Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala
405 410 415
Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met
420 425 430
Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe
435 440 445
Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn
450 455 460
Met Val Ala Asn Pro Ala Trp Arg Ser Leu
465 470
<210> 69
<211> 1446
<212> DNA
<213> 人工序列
<220>
<223> Mel5Evo
<220>
<221> RBS
<222> (1)..(21)
<220>
<221> 基因
<222> (22)..(1446)
<223> triA基因序列
<400> 69
gctagttaga agattcagac catgcaaacc ctcagcattc aacatggcac cctcgtgacg 60
atggatcaat atcgccgggt gctcggcgat agctgggtgc atgtgcaaga tggccgcatt 120
gtggccctcg gtgtgcatgc cgaatctgtg cccccccccg ccgatcgtgt gattgatgcc 180
cgcggtaaag tggtgctccc cggttttatt aatgcccata cccacgtgaa tcaaattctc 240
ctccgtggtg gtccctctca cggtcgccaa ctctatgatt ggctctttaa tgtgctctac 300
cccggccaaa aagccatgcg ccccgaagat gtggccgtgg ccgtgcggct ctattgtgcc 360
gaagccgtgc gcagtggtat taccaccatt aatgataatg ccgattccgc catttacccc 420
ggcaatattg aagccgcgat ggccgtgtat ggcgaagtgg gtgtgcgggt ggtgtacgcc 480
cgcatgtttt tcgatcgcat ggatggccgg attcaaggtt atgtggatgc cctcaaagcc 540
cggagccccc aagtggaact ctgttctatt atggaagaaa ccgccgtggc caaagatcgg 600
attaccgccc tcagcgatca atatcacggc accgccggtg gccgcattag tgtgtggccc 660
gcccccgcca ttaaccccgc cgtgaccgtg gagggtatgc gttgggccca agcctttgcc 720
cgcgatcggg ccgtgatgtg gaccctccac atggccgaaa gcgatcatga tgaacggctc 780
cactggatgt ctcccgccga atatatggaa tgttacggcc tcctcgatga acgcctccaa 840
gtggcccact gtatgtattt tgatcgcaaa gatgtgcggc tcctccatcg ccacaatgtg 900
aaagtggcca gtcaagtggt gtccaatgcc tacctcggca gtggtgtggc ccccgtgccc 960
gaaatggtgg aacgtggcat ggccgtgggc attggcaccg atgatggtaa ttgtaatgat 1020
tccgtgaata tgattggcga tatgaaattt atggcccata ttcaccgggc cgtgcatcgc 1080
gatgccgatg tgctcacccc cgaaaaaatt ctcgaaatgg ccaccattga tggcgcccgc 1140
agtctcggta tggatcatga aattggctcc attgaaaccg gtaaacgggc cgatctcatt 1200
ctcctcgatc tccgccaccc ccaaaccacc ccccaccatc acctcgccgc caccattgtg 1260
tttcaagcct acggtaatga agtggatacc gtgctcattg atggcaatgt ggtgatggaa 1320
aatcgccggc tcagttttct cccccccgaa cgggaactcg cctttctcga agaagcccaa 1380
agtcgcgcca ccgccattct ccaacgcgcc aatatggtgg ccaatcccgc ctggcgcagc 1440
ctctaa 1446
<210> 70
<211> 1443
<212> DNA
<213> 人工序列
<220>
<223> Mel5 triA包括RBS
<220>
<221> RBS
<222> (5)..(10)
<220>
<221> 基因
<222> (19)..(1443)
<223> triA基因序列
<400> 70
agttagaaga ttcagaccat gcaaaccctc agcattcaac atggcaccct cgtgacgatg 60
gatcaatatc gccgggtgct cggcgatagc tgggtgcatg tgcaagatgg ccgcattgtg 120
gccctcggtg tgcatgccga atctgtgccc ccccccgccg atcgtgtgat tgatgcccgc 180
ggtaaagtgg tgctccccgg ttttattaat gcccataccc acgtgaatca aattctcctc 240
cgtggtggtc cctctcacgg tcgccaactc tatgattggc tctttaatgt gctctacccc 300
ggccaaaaag ccatgcgccc cgaagatgtg gccgtggccg tgcggctcta ttgtgccgaa 360
gccgtgcgca gtggtattac caccattaat gataatgccg attccgccat ttaccccggc 420
aatattgaag ccgcgatggc cgtgtatggc gaagtgggtg tgcgggtggt gtacgcccgc 480
atgtttttcg atcgcatgga tggccggatt caaggttatg tggatgccct caaagcccgg 540
agcccccaag tggaactctg ttctattatg gaagaaaccg ccgtggccaa agatcggatt 600
accgccctca gcgatcaata tcacggcacc gccggtggcc gcattagtgt gtggcccgcc 660
cccgccatta cccccgccgt gaccgtggag ggtatgcgtt gggcccaagc ctttgcccgc 720
gatcgggccg tgatgtggac cctccacatg gccgaaagcg atcatgatga acggctccac 780
tggatgtctc ccgccgaata tatggaatgt tacggcctcc tcgatgaacg cctccaagtg 840
gcccactgtg tgtattttga tcgcaaagat gtgcggctcc tccatcgcca caatgtgaaa 900
gtggccagtc aagtggtgtc caatgcctac ctcggcagtg gtgtggcccc cgtgcccgaa 960
atggtggaac gtggcatggc cgtgggcatt ggcaccgatg atggtaattg taatgattcc 1020
gtgaatatga ttggcgatat gaaatttatg gcccatattc accgggccgt gcatcgcgat 1080
gccgatgtgc tcacccccga aaaaattctc gaaatggcca ccattgatgg cgcccgcagt 1140
ctcggtatgg atcatgaaat tggctccatt gaaaccggta aacgggccga tctcattctc 1200
ctcgatctcc gccaccccca aaccaccccc caccatcacc tcgccgccac cattgtgttt 1260
caagcctacg gtaatgaagt ggataccgtg ctcattgatg gcaatgtggt gatggaaaat 1320
cgccggctca gttttctccc ccccgaacgg gaactcgcct ttctcgaaga agcccaaagt 1380
cgcgccaccg ccattctcca acgcgccaat atggtggcca atcccgcctg gcgcagcctc 1440
taa 1443
<210> 71
<211> 726
<212> DNA
<213> 人工序列
<220>
<223> trzE 红球菌(Rhodococcus sp.) Mel
<400> 71
atgatatact caacagtcaa cgctaatcct tacgcttggc cttacgatgg ttcaatagac 60
cctgctcaca ccgctttaat cttaatcgat tggcaaatag acttttgtgg tccaggtggt 120
tatgtcgatt ccatgggtta cgacttatcc ttgactagaa gtggtttaga acctacagca 180
agagtattgg ctgcagccag agatactggt atgacagtta tccatactag agaaggtcac 240
agaccagatt tggctgactt gccacctaat aagagatgga gatctgcatc agccggtgct 300
gaaatcggtt cagttggtcc atgtggtaga attttagtca gaggtgaacc tggttgggaa 360
atagtaccag aagttgcacc tagagaaggt gaaccaatta tagataaacc tggtaaaggt 420
gctttctacg caacagattt ggacttgttg ttgagaacaa gaggtatcac ccatttgatt 480
ttgaccggta taactacaga tgtttgcgtc cacaccacta tgagagaagc caacgataga 540
ggttacgaat gtttaatttt gtctgattgc accggtgcta ctgacagaaa gcatcacgaa 600
gctgcattat ctatggtcac catgcaaggt ggtgtattcg gtgcaactgc ccattcagat 660
gacttattgg ccgctttggg tacaaccgtt ccagcagccg ctggtcctag agctagaaca 720
gaataa 726
<210> 72
<211> 726
<212> DNA
<213> 人工序列
<220>
<223> trzE 红球菌(Rhodococcus sp.) Mel
<400> 72
atgatttata gtaccgtgaa tgccaatccc tatgcctggc cctacgatgg ctccattgat 60
cccgcccaca ccgccctcat cctcatcgat tggcaaatcg atttttgtgg tcccggcggt 120
tatgtggata gtatgggcta cgatctcagc ctcacccgct ctggcctcga acccaccgcc 180
cgcgtgctcg ccgccgcccg cgataccggc atgaccgtga ttcacacccg cgaaggtcat 240
cgtcccgatc tcgccgatct cccccccaat aaacgttggc ggagtgcctc cgccggcgcc 300
gaaattggca gtgtgggtcc ctgtggccgc attctcgtgc gtggtgaacc cggttgggaa 360
attgtgcccg aagtggcccc ccgcgaaggt gaacccatta ttgataaacc cggtaaaggt 420
gccttttatg ccaccgatct cgatctcctc ctccgcaccc gcggcattac ccacctcatt 480
ctcaccggca ttaccaccga tgtgtgtgtg cataccacca tgcgcgaagc caatgatcgg 540
ggctacgaat gtctcattct ctccgattgt accggtgcca ccgatcggaa acaccatgaa 600
gccgccctca gcatggtgac catgcaaggc ggtgtgtttg gtgccaccgc ccattctgat 660
gatctcctcg ccgccctcgg caccaccgtg cccgccgccg ccggcccccg tgcccgcacc 720
gaataa 726
<210> 73
<211> 1239
<212> DNA
<213> 人工序列
<220>
<223> trzC 瓜类细菌性果斑病菌(Acidovorax avenae subsp. citrulli) NRRL B-12227
<400> 73
atgtcaatgg aaacccatag ttatgtagac gtcgcaattc gtaacgcgcg tcttgccgat 60
acggagggaa ttgtcgatat tcttattcac gatgggcgca ttgcgtccat cgtgaagtcg 120
acaaaaacaa aaggatcggt ggagatcgat gctcatgagg gtctggtcac ttccggcctg 180
gtagagcctc acatccatct cgataaggcc ctgacggcag atcgggttcc cgcaggaagc 240
attggcgacc ttcgaacgcg acgaggcctt gagatggcaa ttcgggccac ccgtgatatc 300
aagcgtacgt tcacggttga agatgttcga gaacgggcca tacgtgcggc cctgatggca 360
tcccgtgcgg gaaccaccgc attgcggaca cacgtcgatg tcgacccgat tgtcggcctc 420
gcaggtatcc gtggtgtcct tgaggcgcgt gaagtctgcg cgggattgat cgatatccag 480
atcgtcgcct tccctcagga gggactcttc tgctctgcgg gggccgtgga cctcatgcgg 540
gaggcgatca aactgggcgc ggatgccgtc ggcggcgcac ccgcgctgga tgatcgcccg 600
caggaccatg tccgagccgt ttttgacctt gctgctgagt tcggcctgcc cgtagacatg 660
cacgtcgatg agtccgaccg gcgggaagac tttacgcttc cctttgtgat tgaagctgcc 720
cgtgaacggc gtgtgcccaa tgtgaccgtc gcgcacatca gctcgctgtc cgtacagacg 780
gatgacgtag cacggtcgac cattgccgcc cttgcggacg ccgatgttaa tgtcgtggtt 840
aatccgatca ttgtcaaaat tacgcggctg agtgaattac tcgatgccgg agtctccgta 900
atgtttggct cggacaacct gcgggatccg ttctatccgc tcggagcggc gaatcccctt 960
ggatcagcca tttttgcctg tcaaattgcc gcgctgggaa caccgcaaga tctcagacgg 1020
gtattcgatg cggtcaccat caacgctgcc cgcatgctgg gattcccctc acttttaggc 1080
gtcgtggaag gggcagtcgc ggatctcgca gtattcccat cggcgacgcc cgaggaggtt 1140
gttctggatc aacagtctcc gctcttcgta ctcaagggcg gacgtgtcgt tgccatgcga 1200
ttggccgctg gatcaacgtc gttccgcgac tactcatga 1239
<210> 74
<211> 1239
<212> DNA
<213> 人工序列
<220>
<223> trzC 瓜类细菌性果斑病菌(Acidovorax avenae subsp. citrulli) NRRL B-12227
<400> 74
atgagcatgg aaacccactc ctatgttgat gttgcgatcc gtaacgcccg tctcgccgat 60
accgaaggca ttgttgatat tctgattcat gatggtcgga ttgccagcat tgtgaaatcc 120
accaaaacca aaggttccgt ggaaattgat gcccatgaag gtctcgtgac cagtggcctc 180
gtggaacccc acattcatct cgataaagcc ctcaccgccg atcgcgtgcc cgccggtagt 240
attggcgatc tccggacccg ccggggtctc gaaatggcca ttcgcgccac ccgcgatatt 300
aaacgcacct ttaccgtgga agatgtgcgg gaacgcgcca ttcgggccgc cctcatggcc 360
agtcgcgccg gcaccaccgc cctccgcacc catgtggatg tggaccccat tgtgggtctc 420
gccggtattc ggggcgtgct cgaagcccgc gaagtgtgtg ccggtctcat tgatattcaa 480
attgtggcct ttccccaaga aggcctcttt tgtagtgccg gtgccgtgga tctcatgcgg 540
gaagccatta aactcggtgc cgatgccgtg ggcggtgccc ccgccctcga tgatcgcccc 600
caagatcatg tgcgcgccgt gtttgatctc gccgccgaat ttggtctccc cgtggatatg 660
cacgtggatg aaagtgatcg ccgggaagat tttaccctcc cctttgtgat tgaagccgcc 720
cgcgaacggc gcgtgcccaa tgtgaccgtg gcccacattt cctctctcag tgtgcaaacc 780
gatgatgtgg cccgctccac cattgccgcc ctcgccgatg ccgatgtgaa tgtggtggtg 840
aatcccatta ttgtgaaaat tacccgcctc tctgaactcc tcgatgccgg tgtgtctgtg 900
atgtttggct ccgataatct ccgcgatccc ttttatcccc tcggtgccgc caatcccctc 960
ggtagtgcca tttttgcctg tcaaattgcc gccctcggca ccccccaaga cctccgccgg 1020
gtgtttgatg ccgtgaccat taatgccgcc cgcatgctcg gttttcccag tctcctcggt 1080
gtggtggaag gtgccgtggc cgatctcgcc gtgtttccca gtgccacccc cgaagaagtg 1140
gtgctcgatc aacaaagtcc cctctttgtg ctcaaaggtg gtcgggtcgt tgcgatgcgg 1200
ttagcggcgg gtagcacctc ctttcgtgat tattcgtaa 1239
<210> 75
<211> 1866
<212> DNA
<213> 人工序列
<220>
<223> DUR 1,2 酿酒酵母(1,2 Saccharomyces cerevisiae),截短氨基酸1-622
<400> 75
atgacagtta gttccgatac aactgctgaa atatcgttag gttggtcaat ccaagactgg 60
attgatttcc acaagtcatc aagctcccag gcttcactaa ggcttcttga atcactacta 120
gactctcaaa atgttgcgcc agtcgataat gcgtggatat cgctaatttc aaaggaaaat 180
ttactgcacc aattccaaat tttaaagagc agagaaaata aagaaactct acctctctac 240
ggtgtcccta ttgctgttaa ggacaacatc gacgttagag gtctacccac caccgctgca 300
tgtccatcct ttgcatatga gccttccaaa gactctaaag tagtagaact actaagaaat 360
gcaggtgcga taatcgtggg taagacaaac ttggaccaat ttgccacagg attagtcggc 420
acacggtctc catatgggaa aacaccttgc gcttttagca aagagcatgt atctggtggt 480
tcctccgctg ggtcagcatc ggtggtcgcc agaggtatcg taccaattgc attgggtact 540
gatacagcag gttctggtag agtcccagcc gccttgaaca acctgattgg cctaaagcca 600
acaaagggcg tcttttcctg tcaaggtgta gttcccgctt gtaaatcttt agactgcgtc 660
tccatctttg cattaaacct aagtgatgct gaacgctgct tccgcatcat gtgccagcca 720
gatcctgata atgatgaata ttctagaccc tatgtttcca accctttgaa aaaattttca 780
agcaatgtaa cgattgctat tcctaaaaat atcccatggt atggtgaaac caagaatcct 840
gtactgtttt ccaatgctgt cgaaaatcta tcaagaacgg gcgctaacgt catagaaatt 900
gattttgagc ctcttttaga gttagctcgc tgtttatacg aaggtacttg ggtggccgag 960
cgttatcaag ctattcaatc gtttttggac agtaaaccac caaaggaatc tttggaccct 1020
actgttattt caattataga aggggccaag aaatacagtg cagtagactg cttcagtttt 1080
gaatacaaaa gacaaggcat cttgcaaaaa gtgagacgac ttctcgaatc agtcgatgta 1140
ttgtgtgtgc ccacatgtcc tttaaatcct actatgcaac aagttgcgga tgaaccagtc 1200
ctagtcaatt caagacaagg cacatggact aattttgtca acttggcaga tttggcagcc 1260
cttgctgttc ccgcagggtt ccgagacgat ggtttgccaa atggtattac tttaatcggt 1320
aaaaaattca cagattacgc actattagag ttggctaacc gctatttcca aaatatattc 1380
cccaacggtt ccagaacata cggtactttt acctcttctt cagtaaagcc agcaaacgat 1440
caattagtgg gaccagacta tgacccatct acgtccataa aattggctgt tgtcggtgca 1500
catcttaagg gtctgcctct acattggcaa ttggaaaagg tcaatgcaac atatttatgt 1560
acaacaaaaa catcaaaagc ttaccagctt tttgctttgc ccaaaaatgg accagtttta 1620
aaacctggtt tgagaagagt tcaagatagc aatggctctc aaatcgaatt agaagtgtac 1680
agtgttccaa aagaactgtt cggtgctttt atttccatgg ttcctgaacc attaggaata 1740
ggttcagtgg agttagaatc tggtgaatgg atcaaatcct ttatttgtga agaatctggt 1800
tacaaagcca aaggtacagt tgatatcaca aagtatggtg gatttagagc atattttgaa 1860
atgttg 1866
<210> 76
<211> 1869
<212> DNA
<213> 人工序列
<220>
<223> DUR 1,2 酿酒酵母(1,2 Saccharomyces cerevisiae),截短氨基酸1-622
<400> 76
atgaccgtga gttccgatac caccgccgaa atttctctcg gctggagtat ccaagattgg 60
atcgattttc acaaaagctc tagttcccaa gcctccctcc gcctcctcga atccctcctc 120
gatagccaaa atgtggcccc cgtggataat gcctggattt ccctcattag caaggaaaac 180
ctcctccatc aatttcaaat tctcaagtct cgcgaaaaca aggaaaccct ccccctctat 240
ggtgtgccca ttgccgtgaa agataatatt gatgtgcgtg gcctccccac caccgccgcc 300
tgtcccagtt ttgcctacga accctctaaa gatagtaaag tggtggaact cctccgcaat 360
gccggcgcca ttattgtggg taaaaccaat ctcgatcaat ttgccaccgg cctcgtgggc 420
acccgcagtc cctatggcaa aaccccctgt gccttttcca aagaacacgt gagcggcggt 480
agctctgccg gctccgccag cgtggtggcc cgcggtattg tgcccattgc cctcggcacc 540
gataccgccg gctctggtcg ggtgcccgcc gccctcaata atctcattgg cctcaaaccc 600
accaagggtg tgtttagttg tcaaggcgtg gtgcccgcct gtaaatctct cgattgtgtg 660
agtatttttg ccctcaatct cagcgatgcc gaacgctgtt ttcggattat gtgtcaaccc 720
gatcccgata atgatgaata ttcccgcccc tacgtgagca atcccctcaa aaaatttagt 780
tccaatgtga ccattgccat tcccaaaaat attccctggt atggtgaaac caaaaatccc 840
gtgctctttt ccaatgccgt ggaaaatctc agccggaccg gcgccaatgt gattgaaatt 900
gattttgaac ccctcctcga actcgcccgc tgtctctatg aaggcacctg ggtggccgaa 960
cgctatcaag ccattcaatc ttttctcgat agtaaacccc ccaaagaatc tctcgatccc 1020
accgtgatta gtatcatcga aggtgccaaa aaatactccg ccgtggattg ttttagcttt 1080
gaatacaaac gccaaggcat tctccaaaaa gtgcgccggc tcctcgaatc cgtggatgtg 1140
ctctgtgtgc ccacctgtcc cctcaatccc accatgcaac aagtggccga tgaacccgtg 1200
ctcgtgaata gccgccaagg cacctggacc aattttgtga atctcgccga tctcgccgcc 1260
ctcgccgtgc ccgccggttt tcgggatgat ggcctcccca atggtattac cctcattggc 1320
aaaaaattta ccgattatgc cctcctcgaa ctcgccaacc gctactttca aaacatcttt 1380
cccaacggct cccggaccta tggcaccttt accagctcta gtgtgaaacc cgccaatgat 1440
caactcgtgg gccccgatta cgatccctct accagtatta aactcgccgt ggtgggcgcc 1500
cacctcaaag gcctccccct ccattggcaa ctcgaaaaag tgaatgccac ctatctctgt 1560
accaccaaaa ccagcaaagc ctaccaactc tttgccctcc ccaaaaatgg tcccgtgctc 1620
aaacccggcc tccgtcgtgt gcaagattcc aatggtagcc aaattgaact cgaagtgtat 1680
tccgtgccca aagaactctt tggcgccttt attagcatgg tgcccgaacc cctcggcatt 1740
ggttctgtgg aactcgaaag tggcgaatgg atcaaatctt ttatttgtga agaaagtggc 1800
tacaaagcca aaggcaccgt ggatattacc aaatatggcg gttttcgggc ctactttgaa 1860
atgctctaa 1869
<210> 77
<211> 1092
<212> DNA
<213> 人工序列
<220>
<223> atzD 假单胞菌(Pseudomonas sp.) ADP
<400> 77
atgtatcaca tcgacgtttt ccgaatccct tgccacagcc ctggtgatac atcgggtctc 60
gaggatttga ttgaaacagg ccgcgttgcc cccgccgaca tcgtcgcggt aatgggcaag 120
accgagggca atggctgcgt caacgattac acgcgtgaat acgccaccgc catgcttgct 180
gcgtgccttg ggcgtcattt gcaactccca ccccatgagg tggaaaagcg ggtcgcgttt 240
gtgatgtcag gtgggacgga aggcgtgctg tccccccacc acacggtatt cgcaagacgt 300
ccggcaatcg acgcgcatcg tcccgctggc aaacgtctca cgcttggaat cgccttcacg 360
cgtgattttc tgccggagga aattggccgc cacgctcaga taacggagac agccggcgcc 420
gtcaaacgcg caatgcgaga tgccgggatc gcttcgattg acgatctgca ttttgtgcag 480
gtgaagtgtc cgctgctgac accagcaaag atcgcctcgg cgcgatcacg cggatgcgct 540
ccagtcacga cggatacgta tgaatcgatg ggctattcgc gcggcgcttc ggccctgggc 600
atcgctctcg ctacagaaga ggtgccctcc tcgatgctcg tagacgaatc agtgctgaat 660
gactggagtc tctcatcgtc actggcgtcg gcgtctgcag gcatcgaact ggagcacaac 720
gtggtgatcg ctattggcat gagcgagcag gccaccagtg aactggtcat tgcccacggc 780
gtgatgagcg acgcgatcga cgcggcctcg gtgcggcgaa cgattgaatc gctgggcata 840
cgtagcgatg acgagatgga tcgcatcgtc aacgtattcg ccaaagcgga ggcgagcccg 900
gacggggttg tacgaggtat gcggcacacg atgctaagtg actccgacat taattcgacc 960
cgccatgcgc gggcggtcac cggcgcggcc attgcctcgg tagttgggca tggcatggtg 1020
tatgtgtccg gtggcgccga gcatcaggga cctgccggcg gcggcccttt tgcagtcatt 1080
gcccgcgctt aa 1092
<210> 78
<211> 1092
<212> DNA
<213> 人工序列
<220>
<223> atzD 假单胞菌(Pseudomonas sp.) ADP
<400> 78
atgtatcaca ttgatgtgtt tcgcattccc tgtcatagcc ccggtgatac ctctggcctc 60
gaagatttga ttgaaaccgg tcgtgtggcc cccgccgata ttgtggccgt gatgggtaaa 120
accgagggta atggctgtgt gaatgattat acccgcgaat acgccaccgc catgctcgcc 180
gcctgtctcg gccgccacct ccaactcccc ccccatgaag tggaaaaacg ggtggccttt 240
gtgatgagtg gtggcaccga aggtgtgctc tccccccacc ataccgtgtt tgcccgtcgc 300
cccgccattg atgcccaccg tcccgccggt aaacgtctca ccctcggcat tgcctttacc 360
cgcgattttc tccccgaaga aattggtcgg catgcccaaa ttaccgaaac cgccggcgcc 420
gtgaaacgtg ccatgcgtga tgccggtatt gccagtattg atgatctcca ctttgtgcaa 480
gtgaaatgtc ccctcctcac ccccgccaaa attgcctccg cccgcagccg gggctgtgcc 540
cccgtgacca ccgataccta tgaatctatg ggttacagtc ggggcgcctc cgccctcggt 600
attgccctcg ccaccgaaga agtgcccagt tccatgctcg tggatgaaag tgtgctcaat 660
gattggtccc tcagctctag tctcgcctcc gccagcgccg gcattgaact cgaacacaat 720
gtggtgattg ccattggtat gagtgaacaa gccacctccg aactcgtgat tgcccacggc 780
gtgatgagcg atgccattga tgccgcctct gtgcgccgga ccattgaaag cctcggtatt 840
cgctctgatg atgaaatgga tcggattgtg aatgtgtttg ccaaagccga agccagtccc 900
gatggtgtgg tgcgtggtat gcgtcacacc atgctctctg atagtgatat taattccacc 960
cgtcatgccc gtgccgtgac cggtgccgcc attgccagcg tggtgggtca cggcatggtg 1020
tacgtgtctg gcggtgccga acatcaaggt cccgccggtg gtggtccctt tgccgtgatt 1080
gcccgtgcct aa 1092
<210> 79
<211> 1320
<212> DNA
<213> 人工序列
<220>
<223> guaD 大肠杆菌(Escherichia coli) K-12
<400> 79
atgatgtcag gagaacacac gttaaaagcg gtacgaggca gttttattga tgtcacccgt 60
acgatcgata acccggaaga gattgcctct gcgctgcggt ttattgagga tggtttatta 120
ctcattaaac agggaaaagt ggaatggttt ggcgaatggg aaaacggaaa gcatcaaatt 180
cctgacacca ttcgcgtgcg cgactatcgc ggcaaactga tagtaccggg ctttgtcgat 240
acacatatcc attatccgca aagtgaaatg gtgggggcct atggtgagca attgctggag 300
tggttgaata aacacacctt ccctactgaa cgtcgttatg aggatttaga gtacgcccgc 360
gaaatgtcgg cgttcttcat caagcagctt ttacgtaacg gaaccaccac ggcgctggtg 420
tttggcactg ttcatccgca atctgttgat gcgctgtttg aagccgccag tcatatcaat 480
atgcgtatga ttgccggtaa ggtgatgatg gaccgcaacg caccggatta tctgctcgac 540
actgccgaaa gcagctatca ccaaagcaaa gaactgatcg aacgctggca caaaaatggt 600
cgtctgctat atgcgattac gccacgcttc gccccgacct catctcctga acagatggcg 660
atggcgcaac gcctgaaaga agaatatccg gatacgtggg tacataccca tctctgtgaa 720
aacaaagatg aaattgcctg ggtgaaatcg ctttatcctg accatgatgg ttatctggat 780
gtttaccatc agtacggcct gaccggtaaa aactgtgtct ttgctcactg cgtccatctc 840
gaagaaaaag agtgggatcg tctcagcgaa accaaatcca gcattgcttt ctgtccgacc 900
tccaaccttt acctcggcag cggcttattc aacttgaaaa aagcatggca gaagaaagtt 960
aaagtgggca tgggaacgga tatcggtgcc ggaaccactt tcaacatgct gcaaacgctg 1020
aacgaagcct acaaagtatt gcaattacaa ggctatcgcc tctcggcata tgaagcgttt 1080
tacctggcca cgctcggcgg agcgaaatct ctgggccttg acgatttgat tggcaacttt 1140
ttacctggca aagaggctga tttcgtggtg atggaaccca ccgccactcc gctacagcag 1200
ctgcgctatg acaactctgt ttctttagtc gacaaattgt tcgtgatgat gacgttgggc 1260
gatgaccgtt cgatctaccg cacctacgtt gatggtcgtc tggtgtacga acgcaactaa 1320
<210> 80
<211> 1343
<212> DNA
<213> 人工序列
<220>
<223> guaD 大肠杆菌(Escherichia coli) K-12
<400> 80
atgatgagcg gcgaacacac cctcaaagcc gtgcgcggtt cttttattga tgtgacccgg 60
accattgata atcccgaaga aattgccagc gccctccgct ttattgaaga tggcctcctc 120
ctcattaaac agggtaaagt ggaatggttt ggcgaatggg aaaatggtaa acaccaaatt 180
cccgatacca ttcgcgtgcg ggattatcgg ggcaaactca ttgtgcccgg ttttgtggat 240
acccacattc attatcccca aagtgaaatg gtgggcgcct acggtgaaca actcctcgaa 300
tggctcaata aacatacctt tcccaccgaa cgccggtatg aagatttgga atacgcccgc 360
gaaatgtccg cctttttcat taaacaactc ctccggaatg gcaccaccac cgccctcgtg 420
tttggcaccg tgcatcccca aagtgtggat gccctctttg aagccgcctc ccatattaat 480
atgcgcatga ttgccggcaa agtgatgatg gatcggaatg cccccgatta tctcctcgat 540
accgccgaaa gttcctacca ccaatctaaa gaactcattg aacgctggca taaaaatggt 600
cggctcctct atgccattac cccccgtttt gcccccacca gctctcccga acaaatggcg 660
atggcccaac ggctcaaaga agaatacccc gatacctggg tgcataccca tctctgtgaa 720
aataaagatg aaattgcctg ggtgaaaagc ctctatcccg atcacgatgg ctacctcgat 780
gtgtatcatc aatacggcct caccggtaaa aattgtgtgt ttgcccactg tgtgcatctc 840
gaagaaaaag aatgggatcg cctctctgaa accaaaagtt ccattgcctt ttgtcccacc 900
agcaatctct atctcggctc tggcctcttt aatctcaaaa aagcctggca gaaaaaagtg 960
aaagtgggca tgggcaccga tattggcgcc ggcaccacct ttaatatgct ccaaaccctc 1020
aatgaagcct ataaagtgct ccaactccaa ggctacagcc tctctgccta tgaagccttt 1080
tacctcgcca ccctcggcgg tgccaaaagt ctcggcctcg atgatctcat tggcaatttt 1140
ctccccggta aagaagccga ttttgtggtg atggaaccca ccgccacccc cctccaacaa 1200
ctccgttatg ataatagtgt gtccctcgtg gagggtttgc atggtctgaa tctgataaac 1260
tctttgtgat gatgaccctc ggcgatgatc gctccattta tcggacctac gtggatggtc 1320
gcctcgtgta cgaacggaat taa 1343
<210> 81
<211> 1320
<212> DNA
<213> 人工序列
<220>
<223> guaD R352S 大肠杆菌(Escherichia coli) K-12
<400> 81
atgatgtcag gagaacacac gttaaaagcg gtacgaggca gttttattga tgtcacccgt 60
acgatcgata acccggaaga gattgcctct gcgctgcggt ttattgagga tggtttatta 120
ctcattaaac agggaaaagt ggaatggttt ggcgaatggg aaaacggaaa gcatcaaatt 180
cctgacacca ttcgcgtgcg cgactatcgc ggcaaactga tagtaccggg ctttgtcgat 240
acacatatcc attatccgca aagtgaaatg gtgggggcct atggtgagca attgctggag 300
tggttgaata aacacacctt ccctactgaa cgtcgttatg aggatttaga gtacgcccgc 360
gaaatgtcgg cgttcttcat caagcagctt ttacgtaacg gaaccaccac ggcgctggtg 420
tttggcactg ttcatccgca atctgttgat gcgctgtttg aagccgccag tcatatcaat 480
atgcgtatga ttgccggtaa ggtgatgatg gaccgcaacg caccggatta tctgctcgac 540
actgccgaaa gcagctatca ccaaagcaaa gaactgatcg aacgctggca caaaaatggt 600
cgtctgctat atgcgattac gccacgcttc gccccgacct catctcctga acagatggcg 660
atggcgcaac gcctgaaaga agaatatccg gatacgtggg tacataccca tctctgtgaa 720
aacaaagatg aaattgcctg ggtgaaatcg ctttatcctg accatgatgg ttatctggat 780
gtttaccatc agtacggcct gaccggtaaa aactgtgtct ttgctcactg cgtccatctc 840
gaagaaaaag agtgggatcg tctcagcgaa accaaatcca gcattgcttt ctgtccgacc 900
tccaaccttt acctcggcag cggcttattc aacttgaaaa aagcatggca gaagaaagtt 960
aaagtgggca tgggaacgga tatcggtgcc ggaaccactt tcaacatgct gcaaacgctg 1020
aacgaagcct acaaagtatt gcaattacaa ggctatagcc tctcggcata tgaagcgttt 1080
tacctggcca cgctcggcgg agcgaaatct ctgggccttg acgatttgat tggcaacttt 1140
ttacctggca aagaggctga tttcgtggtg atggaaccca ccgccactcc gctacagcag 1200
ctgcgctatg acaactctgt ttctttagtc gacaaattgt tcgtgatgat gacgttgggc 1260
gatgaccgtt cgatctaccg cacctacgtt gatggtcgtc tggtgtacga acgcaactaa 1320
<210> 82
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> Pc223启动子
<400> 82
ttaacaaaaa agcaggaata aaattaacat gatgtaacag acataagtcc catcaccgtt 60
gtataatgtt aactgtggga ttgcaaaag 89
<210> 83
<211> 7983
<212> DNA
<213> 人工序列
<220>
<223> Mel1
<220>
<221> 启动子
<222> (1)..(89)
<223> Pc223启动子
<220>
<221> 基因
<222> (104)..(1195)
<223> atzd
<220>
<221> 基因
<222> (1217)..(1942)
<223> trzE
<220>
<221> 基因
<222> (1963)..(3831)
<223> DUR1,2
<220>
<221> 基因
<222> (3853)..(5091)
<223> trzC
<220>
<221> 基因
<222> (5113)..(6432)
<223> guaD
<220>
<221> 基因
<222> (6454)..(7878)
<223> triA
<220>
<221> 终止子
<222> (7929)..(7957)
<223> RRNB终止子
<400> 83
ttaacaaaaa agcaggaata aaattaacat gatgtaacag acataagtcc catcaccgtt 60
gtataatgtt aactgtggga ttgcaaaaga ggagattaat tcaatgtatc acattgatgt 120
gtttcgcatt ccctgtcata gccccggtga tacctctggc ctcgaagatt tgattgaaac 180
cggtcgtgtg gcccccgccg atattgtggc cgtgatgggt aaaaccgagg gtaatggctg 240
tgtgaatgat tatacccgcg aatacgccac cgccatgctc gccgcctgtc tcggccgcca 300
cctccaactc cccccccatg aagtggaaaa acgggtggcc tttgtgatga gtggtggcac 360
cgaaggtgtg ctctcccccc accataccgt gtttgcccgt cgccccgcca ttgatgccca 420
ccgtcccgcc ggtaaacgtc tcaccctcgg cattgccttt acccgcgatt ttctccccga 480
agaaattggt cggcatgccc aaattaccga aaccgccggc gccgtgaaac gtgccatgcg 540
tgatgccggt attgccagta ttgatgatct ccactttgtg caagtgaaat gtcccctcct 600
cacccccgcc aaaattgcct ccgcccgcag ccggggctgt gcccccgtga ccaccgatac 660
ctatgaatct atgggttaca gtcggggcgc ctccgccctc ggtattgccc tcgccaccga 720
agaagtgccc agttccatgc tcgtggatga aagtgtgctc aatgattggt ccctcagctc 780
tagtctcgcc tccgccagcg ccggcattga actcgaacac aatgtggtga ttgccattgg 840
tatgagtgaa caagccacct ccgaactcgt gattgcccac ggcgtgatga gcgatgccat 900
tgatgccgcc tctgtgcgcc ggaccattga aagcctcggt attcgctctg atgatgaaat 960
ggatcggatt gtgaatgtgt ttgccaaagc cgaagccagt cccgatggtg tggtgcgtgg 1020
tatgcgtcac accatgctct ctgatagtga tattaattcc acccgtcatg cccgtgccgt 1080
gaccggtgcc gccattgcca gcgtggtggg tcacggcatg gtgtacgtgt ctggcggtgc 1140
cgaacatcaa ggtcccgccg gtggtggtcc ctttgccgtg attgcccgtg cctaagtcaa 1200
gtaggagatt aattccatga tttatagtac cgtgaatgcc aatccctatg cctggcccta 1260
cgatggctcc attgatcccg cccacaccgc cctcatcctc atcgattggc aaatcgattt 1320
ttgtggtccc ggcggttatg tggatagtat gggctacgat ctcagcctca cccgctctgg 1380
cctcgaaccc accgcccgcg tgctcgccgc cgcccgcgat accggcatga ccgtgattca 1440
cacccgcgaa ggtcatcgtc ccgatctcgc cgatctcccc cccaataaac gttggcggag 1500
tgcctccgcc ggcgccgaaa ttggcagtgt gggtccctgt ggccgcattc tcgtgcgtgg 1560
tgaacccggt tgggaaattg tgcccgaagt ggccccccgc gaaggtgaac ccattattga 1620
taaacccggt aaaggtgcct tttatgccac cgatctcgat ctcctcctcc gcacccgcgg 1680
cattacccac ctcattctca ccggcattac caccgatgtg tgtgtgcata ccaccatgcg 1740
cgaagccaat gatcggggct acgaatgtct cattctctcc gattgtaccg gtgccaccga 1800
tcggaaacac catgaagccg ccctcagcat ggtgaccatg caaggcggtg tgtttggtgc 1860
caccgcccat tctgatgatc tcctcgccgc cctcggcacc accgtgcccg ccgccgccgg 1920
cccccgtgcc cgcaccgaat aatctaatag gagacaaata ctatgaccgt gagttccgat 1980
accaccgccg aaatttctct cggctggagt atccaagatt ggatcgattt tcacaaaagc 2040
tctagttccc aagcctccct ccgcctcctc gaatccctcc tcgatagcca aaatgtggcc 2100
cccgtggata atgcctggat ttccctcatt agcaaggaaa acctcctcca tcaatttcaa 2160
attctcaagt ctcgcgaaaa caaggaaacc ctccccctct atggtgtgcc cattgccgtg 2220
aaagataata ttgatgtgcg tggcctcccc accaccgccg cctgtcccag ttttgcctac 2280
gaaccctcta aagatagtaa agtggtggaa ctcctccgca atgccggcgc cattattgtg 2340
ggtaaaacca atctcgatca atttgccacc ggcctcgtgg gcacccgcag tccctatggc 2400
aaaaccccct gtgccttttc caaagaacac gtgagcggcg gtagctctgc cggctccgcc 2460
agcgtggtgg cccgcggtat tgtgcccatt gccctcggca ccgataccgc cggctctggt 2520
cgggtgcccg ccgccctcaa taatctcatt ggcctcaaac ccaccaaggg tgtgtttagt 2580
tgtcaaggcg tggtgcccgc ctgtaaatct ctcgattgtg tgagtatttt tgccctcaat 2640
ctcagcgatg ccgaacgctg ttttcggatt atgtgtcaac ccgatcccga taatgatgaa 2700
tattcccgcc cctacgtgag caatcccctc aaaaaattta gttccaatgt gaccattgcc 2760
attcccaaaa atattccctg gtatggtgaa accaaaaatc ccgtgctctt ttccaatgcc 2820
gtggaaaatc tcagccggac cggcgccaat gtgattgaaa ttgattttga acccctcctc 2880
gaactcgccc gctgtctcta tgaaggcacc tgggtggccg aacgctatca agccattcaa 2940
tcttttctcg atagtaaacc ccccaaagaa tctctcgatc ccaccgtgat tagtatcatc 3000
gaaggtgcca aaaaatactc cgccgtggat tgttttagct ttgaatacaa acgccaaggc 3060
attctccaaa aagtgcgccg gctcctcgaa tccgtggatg tgctctgtgt gcccacctgt 3120
cccctcaatc ccaccatgca acaagtggcc gatgaacccg tgctcgtgaa tagccgccaa 3180
ggcacctgga ccaattttgt gaatctcgcc gatctcgccg ccctcgccgt gcccgccggt 3240
tttcgggatg atggcctccc caatggtatt accctcattg gcaaaaaatt taccgattat 3300
gccctcctcg aactcgccaa ccgctacttt caaaacatct ttcccaacgg ctcccggacc 3360
tatggcacct ttaccagctc tagtgtgaaa cccgccaatg atcaactcgt gggccccgat 3420
tacgatccct ctaccagtat taaactcgcc gtggtgggcg cccacctcaa aggcctcccc 3480
ctccattggc aactcgaaaa agtgaatgcc acctatctct gtaccaccaa aaccagcaaa 3540
gcctaccaac tctttgccct ccccaaaaat ggtcccgtgc tcaaacccgg cctccgtcgt 3600
gtgcaagatt ccaatggtag ccaaattgaa ctcgaagtgt attccgtgcc caaagaactc 3660
tttggcgcct ttattagcat ggtgcccgaa cccctcggca ttggttctgt ggaactcgaa 3720
agtggcgaat ggatcaaatc ttttatttgt gaagaaagtg gctacaaagc caaaggcacc 3780
gtggatatta ccaaatatgg cggttttcgg gcctactttg aaatgctcta aattgattag 3840
gagatataca ccatgagcat ggaaacccac tcctatgttg atgttgcgat ccgtaacgcc 3900
cgtctcgccg ataccgaagg cattgttgat attctgattc atgatggtcg gattgccagc 3960
attgtgaaat ccaccaaaac caaaggttcc gtggaaattg atgcccatga aggtctcgtg 4020
accagtggcc tcgtggaacc ccacattcat ctcgataaag ccctcaccgc cgatcgcgtg 4080
cccgccggta gtattggcga tctccggacc cgccggggtc tcgaaatggc cattcgcgcc 4140
acccgcgata ttaaacgcac ctttaccgtg gaagatgtgc gggaacgcgc cattcgggcc 4200
gccctcatgg ccagtcgcgc cggcaccacc gccctccgca cccatgtgga tgtggacccc 4260
attgtgggtc tcgccggtat tcggggcgtg ctcgaagccc gcgaagtgtg tgccggtctc 4320
attgatattc aaattgtggc ctttccccaa gaaggcctct tttgtagtgc cggtgccgtg 4380
gatctcatgc gggaagccat taaactcggt gccgatgccg tgggcggtgc ccccgccctc 4440
gatgatcgcc cccaagatca tgtgcgcgcc gtgtttgatc tcgccgccga atttggtctc 4500
cccgtggata tgcacgtgga tgaaagtgat cgccgggaag attttaccct cccctttgtg 4560
attgaagccg cccgcgaacg gcgcgtgccc aatgtgaccg tggcccacat ttcctctctc 4620
agtgtgcaaa ccgatgatgt ggcccgctcc accattgccg ccctcgccga tgccgatgtg 4680
aatgtggtgg tgaatcccat tattgtgaaa attacccgcc tctctgaact cctcgatgcc 4740
ggtgtgtctg tgatgtttgg ctccgataat ctccgcgatc ccttttatcc cctcggtgcc 4800
gccaatcccc tcggtagtgc catttttgcc tgtcaaattg ccgccctcgg caccccccaa 4860
gacctccgcc gggtgtttga tgccgtgacc attaatgccg cccgcatgct cggttttccc 4920
agtctcctcg gtgtggtgga aggtgccgtg gccgatctcg ccgtgtttcc cagtgccacc 4980
cccgaagaag tggtgctcga tcaacaaagt cccctctttg tgctcaaagg tggtcgggtc 5040
gttgcgatgc ggttagcggc gggtagcacc tcctttcgtg attattcgta atatacttag 5100
gagattcata cgatgatgag cggcgaacac accctcaaag ccgtgcgcgg ttcttttatt 5160
gatgtgaccc ggaccattga taatcccgaa gaaattgcca gcgccctccg ctttattgaa 5220
gatggcctcc tcctcattaa acagggtaaa gtggaatggt ttggcgaatg ggaaaatggt 5280
aaacaccaaa ttcccgatac cattcgcgtg cgggattatc ggggcaaact cattgtgccc 5340
ggttttgtgg atacccacat tcattatccc caaagtgaaa tggtgggcgc ctacggtgaa 5400
caactcctcg aatggctcaa taaacatacc tttcccaccg aacgccggta tgaagatttg 5460
gaatacgccc gcgaaatgtc cgcctttttc attaaacaac tcctccggaa tggcaccacc 5520
accgccctcg tgtttggcac cgtgcatccc caaagtgtgg atgccctctt tgaagccgcc 5580
tcccatatta atatgcgcat gattgccggc aaagtgatga tggatcggaa tgcccccgat 5640
tatctcctcg ataccgccga aagttcctac caccaatcta aagaactcat tgaacgctgg 5700
cataaaaatg gtcggctcct ctatgccatt accccccgtt ttgcccccac cagctctccc 5760
gaacaaatgg cgatggccca acggctcaaa gaagaatacc ccgatacctg ggtgcatacc 5820
catctctgtg aaaataaaga tgaaattgcc tgggtgaaaa gcctctatcc cgatcacgat 5880
ggctacctcg atgtgtatca tcaatacggc ctcaccggta aaaattgtgt gtttgcccac 5940
tgtgtgcatc tcgaagaaaa agaatgggat cgcctctctg aaaccaaaag ttccattgcc 6000
ttttgtccca ccagcaatct ctatctcggc tctggcctct ttaatctcaa aaaagcctgg 6060
cagaaaaaag tgaaagtggg catgggcacc gatattggcg ccggcaccac ctttaatatg 6120
ctccaaaccc tcaatgaagc ctataaagtg ctccaactcc aaggctacag cctctctgcc 6180
tatgaagcct tttacctcgc caccctcggc ggtgccaaaa gtctcggcct cgatgatctc 6240
attggcaatt ttctccccgg taaagaagcc gattttgtgg tgatggaacc caccgccacc 6300
cccctccaac aactccgtta tgataatagt gtgtccctcg tggataaact ctttgtgatg 6360
atgaccctcg gcgatgatcg ctccatttat cggacctacg tggatggtcg cctcgtgtac 6420
gaacggaatt aagctagtta ggagattcag accatgcaaa ccctcagcat tcaacatggc 6480
accctcgtga cgatggatca atatcgccgg gtgctcggcg atagctgggt gcatgtgcaa 6540
gatggccgca ttgtggccct cggtgtgcat gccgaatctg tgcccccccc cgccgatcgt 6600
gtgattgatg cccgcggtaa agtggtgctc cccggtttta ttaatgccca tacccacgtg 6660
aatcaaattc tcctccgtgg tggtccctct cacggtcgcc aactctatga ttggctcttt 6720
aatgtgctct accccggcca aaaagccatg cgccccgaag atgtggccgt ggccgtgcgg 6780
ctctattgtg ccgaagccgt gcgcagtggt attaccacca ttaatgataa tgccgattcc 6840
gccatttacc ccggcaatat tgaagccgcg atggccgtgt atggcgaagt gggtgtgcgg 6900
gtggtgtacg cccgcatgtt tttcgatcgc atggatggcc ggattcaagg ttatgtggat 6960
gccctcaaag cccggagccc ccaagtggaa ctctgttcta ttatggaaga aaccgccgtg 7020
gccaaagatc ggattaccgc cctcagcgat caatatcacg gcaccgccgg tggccgcatt 7080
agtgtgtggc ccgcccccgc cattaccccc gccgtgaccg tggagggtat gcgttgggcc 7140
caagcctttg cccgcgatcg ggccgtgatg tggaccctcc acatggccga aagcgatcat 7200
gatgaacggc tccactggat gtctcccgcc gaatatatgg aatgttacgg cctcctcgat 7260
gaacgcctcc aagtggccca ctgtgtgtat tttgatcgca aagatgtgcg gctcctccat 7320
cgccacaatg tgaaagtggc cagtcaagtg gtgtccaatg cctacctcgg cagtggtgtg 7380
gcccccgtgc ccgaaatggt ggaacgtggc atggccgtgg gcattggcac cgatgatggt 7440
aattgtaatg attccgtgaa tatgattggc gatatgaaat ttatggccca tattcaccgg 7500
gccgtgcatc gcgatgccga tgtgctcacc cccgaaaaaa ttctcgaaat ggccaccatt 7560
gatggcgccc gcagtctcgg tatggatcat gaaattggct ccattgaaac cggtaaacgg 7620
gccgatctca ttctcctcga tctccgccac ccccaaacca ccccccacca tcacctcgcc 7680
gccaccattg tgtttcaagc ctacggtaat gaagtggata ccgtgctcat tgatggcaat 7740
gtggtgatgg aaaatcgccg gctcagtttt ctcccccccg aacgggaact cgcctttctc 7800
gaagaagccc aaagtcgcgc caccgccatt ctccaacgcg ccaatatggt ggccaatccc 7860
gcctgacgca gcctctaaaa gggtgggcgc gccgacccag ctttcttgta caaactcggc 7920
cctgcaggag aaggccatcc tgacggatgg cctttttgaa gcttgaaagc aaatgacgag 7980
cga 7983
<210> 84
<211> 7968
<212> DNA
<213> 人工序列
<220>
<223> Mel4
<220>
<221> 启动子
<222> (1)..(89)
<223> Pc223启动子
<220>
<221> 基因
<222> (104)..(1195)
<223> atzD
<220>
<221> 基因
<222> (1217)..(1942)
<223> trzE
<220>
<221> 基因
<222> (1963)..(3831)
<223> DUR1,2
<220>
<221> 基因
<222> (3853)..(5091)
<223> trzC
<220>
<221> 基因
<222> (5113)..(6432)
<223> guaD
<220>
<221> 基因
<222> (6454)..(7878)
<223> triA
<220>
<221> 终止子
<222> (7929)..(7957)
<223> RRNB终止子
<400> 84
ttaacaaaaa agcaggaata aaattaacat gatgtaacag acataagtcc catcaccgtt 60
gtataatgtt aactgtggga ttgcaaaaga ggagattaat tcaatgtatc acattgatgt 120
gtttcgcatt ccctgtcata gccccggtga tacctctggc ctcgaagatt tgattgaaac 180
cggtcgtgtg gcccccgccg atattgtggc cgtgatgggt aaaaccgagg gtaatggctg 240
tgtgaatgat tatacccgcg aatacgccac cgccatgctc gccgcctgtc tcggccgcca 300
cctccaactc cccccccatg aagtggaaaa acgggtggcc tttgtgatga gtggtggcac 360
cgaaggtgtg ctctcccccc accataccgt gtttgcccgt cgccccgcca ttgatgccca 420
ccgtcccgcc ggtaaacgtc tcaccctcgg cattgccttt acccgcgatt ttctccccga 480
agaaattggt cggcatgccc aaattaccga aaccgccggc gccgtgaaac gtgccatgcg 540
tgatgccggt attgccagta ttgatgatct ccactttgtg caagtgaaat gtcccctcct 600
cacccccgcc aaaattgcct ccgcccgcag ccggggctgt gcccccgtga ccaccgatac 660
ctatgaatct atgggttaca gtcggggcgc ctccgccctc ggtattgccc tcgccaccga 720
agaagtgccc agttccatgc tcgtggatga aagtgtgctc aatgattggt ccctcagctc 780
tagtctcgcc tccgccagcg ccggcattga actcgaacac aatgtggtga ttgccattgg 840
tatgagtgaa caagccacct ccgaactcgt gattgcccac ggcgtgatga gcgatgccat 900
tgatgccgcc tctgtgcgcc ggaccattga aagcctcggt attcgctctg atgatgaaat 960
ggatcggatt gtgaatgtgt ttgccaaagc cgaagccagt cccgatggtg tggtgcgtgg 1020
tatgcgtcac accatgctct ctgatagtga tattaattcc acccgtcatg cccgtgccgt 1080
gaccggtgcc gccattgcca gcgtggtggg tcacggcatg gtgtacgtgt ctggcggtgc 1140
cgaacatcaa ggtcccgccg gtggtggtcc ctttgccgtg attgcccgtg cctaagtcaa 1200
gtaggagatt aattccatga tttatagtac cgtgaatgcc aatccctatg cctggcccta 1260
cgatggctcc attgatcccg cccacaccgc cctcatcctc atcgattggc aaatcgattt 1320
ttgtggtccc ggcggttatg tggatagtat gggctacgat ctcagcctca cccgctctgg 1380
cctcgaaccc accgcccgcg tgctcgccgc cgcccgcgat accggcatga ccgtgattca 1440
cacccgcgaa ggtcatcgtc ccgatctcgc cgatctcccc cccaataaac gttggcggag 1500
tgcctccgcc ggcgccgaaa ttggcagtgt gggtccctgt ggccgcattc tcgtgcgtgg 1560
tgaacccggt tgggaaattg tgcccgaagt ggccccccgc gaaggtgaac ccattattga 1620
taaacccggt aaaggtgcct tttatgccac cgatctcgat ctcctcctcc gcacccgcgg 1680
cattacccac ctcattctca ccggcattac caccgatgtg tgtgtgcata ccaccatgcg 1740
cgaagccaat gatcggggct acgaatgtct cattctctcc gattgtaccg gtgccaccga 1800
tcggaaacac catgaagccg ccctcagcat ggtgaccatg caaggcggtg tgtttggtgc 1860
caccgcccat tctgatgatc tcctcgccgc cctcggcacc accgtgcccg ccgccgccgg 1920
cccccgtgcc cgcaccgaat aatctaatag gagacaaata ctatgaccgt gagttccgat 1980
accaccgccg aaatttctct cggctggagt atccaagatt ggatcgattt tcacaaaagc 2040
tctagttccc aagcctccct ccgcctcctc gaatccctcc tcgatagcca aaatgtggcc 2100
cccgtggata atgcctggat ttccctcatt agcaaggaaa acctcctcca tcaatttcaa 2160
attctcaagt ctcgcgaaaa caaggaaacc ctccccctct atggtgtgcc cattgccgtg 2220
aaagataata ttgatgtgcg tggcctcccc accaccgccg cctgtcccag ttttgcctac 2280
gaaccctcta aagatagtaa agtggtggaa ctcctccgca atgccggcgc cattattgtg 2340
ggtaaaacca atctcgatca atttgccacc ggcctcgtgg gcacccgcag tccctatggc 2400
aaaaccccct gtgccttttc caaagaacac gtgagcggcg gtagctctgc cggctccgcc 2460
agcgtggtgg cccgcggtat tgtgcccatt gccctcggca ccgataccgc cggctctggt 2520
cgggtgcccg ccgccctcaa taatctcatt ggcctcaaac ccaccaaggg tgtgtttagt 2580
tgtcaaggcg tggtgcccgc ctgtaaatct ctcgattgtg tgagtatttt tgccctcaat 2640
ctcagcgatg ccgaacgctg ttttcggatt atgtgtcaac ccgatcccga taatgatgaa 2700
tattcccgcc cctacgtgag caatcccctc aaaaaattta gttccaatgt gaccattgcc 2760
attcccaaaa atattccctg gtatggtgaa accaaaaatc ccgtgctctt ttccaatgcc 2820
gtggaaaatc tcagccggac cggcgccaat gtgattgaaa ttgattttga acccctcctc 2880
gaactcgccc gctgtctcta tgaaggcacc tgggtggccg aacgctatca agccattcaa 2940
tcttttctcg atagtaaacc ccccaaagaa tctctcgatc ccaccgtgat tagtatcatc 3000
gaaggtgcca aaaaatactc cgccgtggat tgttttagct ttgaatacaa acgccaaggc 3060
attctccaaa aagtgcgccg gctcctcgaa tccgtggatg tgctctgtgt gcccacctgt 3120
cccctcaatc ccaccatgca acaagtggcc gatgaacccg tgctcgtgaa tagccgccaa 3180
ggcacctgga ccaattttgt gaatctcgcc gatctcgccg ccctcgccgt gcccgccggt 3240
tttcgggatg atggcctccc caatggtatt accctcattg gcaaaaaatt taccgattat 3300
gccctcctcg aactcgccaa ccgctacttt caaaacatct ttcccaacgg ctcccggacc 3360
tatggcacct ttaccagctc tagtgtgaaa cccgccaatg atcaactcgt gggccccgat 3420
tacgatccct ctaccagtat taaactcgcc gtggtgggcg cccacctcaa aggcctcccc 3480
ctccattggc aactcgaaaa agtgaatgcc acctatctct gtaccaccaa aaccagcaaa 3540
gcctaccaac tctttgccct ccccaaaaat ggtcccgtgc tcaaacccgg cctccgtcgt 3600
gtgcaagatt ccaatggtag ccaaattgaa ctcgaagtgt attccgtgcc caaagaactc 3660
tttggcgcct ttattagcat ggtgcccgaa cccctcggca ttggttctgt ggaactcgaa 3720
agtggcgaat ggatcaaatc ttttatttgt gaagaaagtg gctacaaagc caaaggcacc 3780
gtggatatta ccaaatatgg cggttttcgg gcctactttg aaatgctcta aattgattag 3840
gagatataca ccatgagcat ggaaacccac tcctatgttg atgttgcgat ccgtaacgcc 3900
cgtctcgccg ataccgaagg cattgttgat attctgattc atgatggtcg gattgccagc 3960
attgtgaaat ccaccaaaac caaaggttcc gtggaaattg atgcccatga aggtctcgtg 4020
accagtggcc tcgtggaacc ccacattcat ctcgataaag ccctcaccgc cgatcgcgtg 4080
cccgccggta gtattggcga tctccggacc cgccggggtc tcgaaatggc cattcgcgcc 4140
acccgcgata ttaaacgcac ctttaccgtg gaagatgtgc gggaacgcgc cattcgggcc 4200
gccctcatgg ccagtcgcgc cggcaccacc gccctccgca cccatgtgga tgtggacccc 4260
attgtgggtc tcgccggtat tcggggcgtg ctcgaagccc gcgaagtgtg tgccggtctc 4320
attgatattc aaattgtggc ctttccccaa gaaggcctct tttgtagtgc cggtgccgtg 4380
gatctcatgc gggaagccat taaactcggt gccgatgccg tgggcggtgc ccccgccctc 4440
gatgatcgcc cccaagatca tgtgcgcgcc gtgtttgatc tcgccgccga atttggtctc 4500
cccgtggata tgcacgtgga tgaaagtgat cgccgggaag attttaccct cccctttgtg 4560
attgaagccg cccgcgaacg gcgcgtgccc aatgtgaccg tggcccacat ttcctctctc 4620
agtgtgcaaa ccgatgatgt ggcccgctcc accattgccg ccctcgccga tgccgatgtg 4680
aatgtggtgg tgaatcccat tattgtgaaa attacccgcc tctctgaact cctcgatgcc 4740
ggtgtgtctg tgatgtttgg ctccgataat ctccgcgatc ccttttatcc cctcggtgcc 4800
gccaatcccc tcggtagtgc catttttgcc tgtcaaattg ccgccctcgg caccccccaa 4860
gacctccgcc gggtgtttga tgccgtgacc attaatgccg cccgcatgct cggttttccc 4920
agtctcctcg gtgtggtgga aggtgccgtg gccgatctcg ccgtgtttcc cagtgccacc 4980
cccgaagaag tggtgctcga tcaacaaagt cccctctttg tgctcaaagg tggtcgggtc 5040
gttgcgatgc ggttagcggc gggtagcacc tcctttcgtg attattcgta atatacttag 5100
gagattcata cgatgatgag cggcgaacac accctcaaag ccgtgcgcgg ttcttttatt 5160
gatgtgaccc ggaccattga taatcccgaa gaaattgcca gcgccctccg ctttattgaa 5220
gatggcctcc tcctcattaa acagggtaaa gtggaatggt ttggcgaatg ggaaaatggt 5280
aaacaccaaa ttcccgatac cattcgcgtg cgggattatc ggggcaaact cattgtgccc 5340
ggttttgtgg atacccacat tcattatccc caaagtgaaa tggtgggcgc ctacggtgaa 5400
caactcctcg aatggctcaa taaacatacc tttcccaccg aacgccggta tgaagatttg 5460
gaatacgccc gcgaaatgtc cgcctttttc attaaacaac tcctccggaa tggcaccacc 5520
accgccctcg tgtttggcac cgtgcatccc caaagtgtgg atgccctctt tgaagccgcc 5580
tcccatatta atatgcgcat gattgccggc aaagtgatga tggatcggaa tgcccccgat 5640
tatctcctcg ataccgccga aagttcctac caccaatcta aagaactcat tgaacgctgg 5700
cataaaaatg gtcggctcct ctatgccatt accccccgtt ttgcccccac cagctctccc 5760
gaacaaatgg cgatggccca acggctcaaa gaagaatacc ccgatacctg ggtgcatacc 5820
catctctgtg aaaataaaga tgaaattgcc tgggtgaaaa gcctctatcc cgatcacgat 5880
ggctacctcg atgtgtatca tcaatacggc ctcaccggta aaaattgtgt gtttgcccac 5940
tgtgtgcatc tcgaagaaaa agaatgggat cgcctctctg aaaccaaaag ttccattgcc 6000
ttttgtccca ccagcaatct ctatctcggc tctggcctct ttaatctcaa aaaagcctgg 6060
cagaaaaaag tgaaagtggg catgggcacc gatattggcg ccggcaccac ctttaatatg 6120
ctccaaaccc tcaatgaagc ctataaagtg ctccaactcc aaggctacag cctctctgcc 6180
tatgaagcct tttacctcgc caccctcggc ggtgccaaaa gtctcggcct cgatgatctc 6240
attggcaatt ttctccccgg taaagaagcc gattttgtgg tgatggaacc caccgccacc 6300
cccctccaac aactccgtta tgataatagt gtgtccctcg tggataaact ctttgtgatg 6360
atgaccctcg gcgatgatcg ctccatttat cggacctacg tggatggtcg cctcgtgtac 6420
gaacggaatt aagctagtta ggagattcag accatgcaaa ccctcagcat tcaacatggc 6480
accctcgtga cgatggatca atatcgccgg gtgctcggcg atagctgggt gcatgtgcaa 6540
gatggccgca ttgtggccct cggtgtgcat gccgaatctg tgcccccccc cgccgatcgt 6600
gtgattgatg cccgcggtaa agtggtgctc cccggtttta ttaatgccca tacccacgtg 6660
aatcaaattc tcctccgtgg tggtccctct cacggtcgcc aactctatga ttggttcttt 6720
aatgtgctct accccggcca aaaagccatg cgccccgaag atgtggccgt ggccgtgcgg 6780
ctctattgtg ccgaagccgt gcgcagtggt attaccacca ttaatgataa tgccgattcc 6840
gccatttacc ccggcaatat tgaagccgcg atggccgtgt atggcgaagt gggtgtgcgg 6900
gtggtgtacg cccgcatgtt tttcgatcgc atggatggcc ggattcaagg ttatgtggat 6960
gccctcaaag cccggagccc ccaagtggaa ctctgttcta ttatggaaga aaccgccgtg 7020
gccaaagatc ggattaccgc cctcagcgat caatatcacg gcaccgccgg tggccgcatt 7080
agtgtgtggc ccgcccccgc cattaccccc gccgtgaccg tggagggtat gcgttgggcc 7140
caagcctttg cccgcgatcg ggccgtgatg tggaccctcc acatggccga aagcgatcat 7200
gatgaacggc tccactggat gtctcccgcc gaatatatgg aatgttacgg cctcctcgat 7260
gaacgcctcc aagtggccca ctgtgtgtat tttgatcgca aagatgtgcg gctcctccat 7320
cgccacaatg tgaaagtggc cagtcaagtg gtgtccaatg cctacctcgg cagtggtgtg 7380
gcccccgtgc ccgaaatggt ggaacgtggc atggccgtgg gcattggcac cgatgatggt 7440
aattgtaatg attccgtgaa tatgattggc gatatgaaat ttatggccca tattcaccgg 7500
gccgtgcatc gcgatgccga tgtgctcacc cccgaaaaaa ttctcgaaat ggccaccatt 7560
gatggcgccc gcagtctcgg tatggatcat gaaattggct ccattgaaac cggtaaacgg 7620
gccgatctca ttctcctcga tctccgccac ccccaaacca ccccccacca tcacctcgcc 7680
gccaccattg tgtttcaagc ctacggtaat gaagtggata ccgtgctcat tgatggcaat 7740
gtggtgatgg aaaatcgccg gctcagtttt ctcccccccg aacgggaact cgcctttctc 7800
gaagaagccc aaagtcgcgc caccgccatt ctccaacgcg ccaatatggt ggccaatccc 7860
gcctggcgca gcctctaaaa gggtgggcgc gccgacccag ctttcttgta caaactcggc 7920
cctgcaggag aaggccatcc tgacggatgg cctttttgaa gcttgaaa 7968
<210> 85
<211> 7968
<212> DNA
<213> 人工序列
<220>
<223> Mel5
<220>
<221> 启动子
<222> (1)..(89)
<223> Pc223启动子
<220>
<221> 基因
<222> (104)..(1195)
<223> atzD
<220>
<221> 基因
<222> (1217)..(1942)
<223> trzE
<220>
<221> 基因
<222> (1963)..(3831)
<223> DUR1,2
<220>
<221> 基因
<222> (3853)..(5091)
<223> trzC
<220>
<221> 基因
<222> (5113)..(6432)
<223> guaD
<220>
<221> 基因
<222> (6454)..(7878)
<223> triA
<220>
<221> 终止子
<222> (7929)..(7957)
<223> RRNB终止子
<400> 85
ttaacaaaaa agcaggaata aaattaacat gatgtaacag acataagtcc catcaccgtt 60
gtataatgtt aactgtggga ttgcaaaaga ggagattaat tcaatgtatc acattgatgt 120
gtttcgcatt ccctgtcata gccccggtga tacctctggc ctcgaagatt tgattgaaac 180
cggtcgtgtg gcccccgccg atattgtggc cgtgatgggt aaaaccgagg gtaatggctg 240
tgtgaatgat tatacccgcg aatacgccac cgccatgctc gccgcctgtc tcggccgcca 300
cctccaactc cccccccatg aagtggaaaa acgggtggcc tttgtgatga gtggtggcac 360
cgaaggtgtg ctctcccccc accataccgt gtttgcccgt cgccccgcca ttgatgccca 420
ccgtcccgcc ggtaaacgtc tcaccctcgg cattgccttt acccgcgatt ttctccccga 480
agaaattggt cggcatgccc aaattaccga aaccgccggc gccgtgaaac gtgccatgcg 540
tgatgccggt attgccagta ttgatgatct ccactttgtg caagtgaaat gtcccctcct 600
cacccccgcc aaaattgcct ccgcccgcag ccggggctgt gcccccgtga ccaccgatac 660
ctatgaatct atgggttaca gtcggggcgc ctccgccctc ggtattgccc tcgccaccga 720
agaagtgccc agttccatgc tcgtggatga aagtgtgctc aatgattggt ccctcagctc 780
tagtctcgcc tccgccagcg ccggcattga actcgaacac aatgtggtga ttgccattgg 840
tatgagtgaa caagccacct ccgaactcgt gattgcccac ggcgtgatga gcgatgccat 900
tgatgccgcc tctgtgcgcc ggaccattga aagcctcggt attcgctctg atgatgaaat 960
ggatcggatt gtgaatgtgt ttgccaaagc cgaagccagt cccgatggtg tggtgcgtgg 1020
tatgcgtcac accatgctct ctgatagtga tattaattcc acccgtcatg cccgtgccgt 1080
gaccggtgcc gccattgcca gcgtggtggg tcacggcatg gtgtacgtgt ctggcggtgc 1140
cgaacatcaa ggtcccgccg gtggtggtcc ctttgccgtg attgcccgtg cctaagtcaa 1200
gtaggagatt aattccatga tttatagtac cgtgaatgcc aatccctatg cctggcccta 1260
cgatggctcc attgatcccg cccacaccgc cctcatcctc atcgattggc aaatcgattt 1320
ttgtggtccc ggcggttatg tggatagtat gggctacgat ctcagcctca cccgctctgg 1380
cctcgaaccc accgcccgcg tgctcgccgc cgcccgcgat accggcatga ccgtgattca 1440
cacccgcgaa ggtcatcgtc ccgatctcgc cgatctcccc cccaataaac gttggcggag 1500
tgcctccgcc ggcgccgaaa ttggcagtgt gggtccctgt ggccgcattc tcgtgcgtgg 1560
tgaacccggt tgggaaattg tgcccgaagt ggccccccgc gaaggtgaac ccattattga 1620
taaacccggt aaaggtgcct tttatgccac cgatctcgat ctcctcctcc gcacccgcgg 1680
cattacccac ctcattctca ccggcattac caccgatgtg tgtgtgcata ccaccatgcg 1740
cgaagccaat gatcggggct acgaatgtct cattctctcc gattgtaccg gtgccaccga 1800
tcggaaacac catgaagccg ccctcagcat ggtgaccatg caaggcggtg tgtttggtgc 1860
caccgcccat tctgatgatc tcctcgccgc cctcggcacc accgtgcccg ccgccgccgg 1920
cccccgtgcc cgcaccgaat aatctaatag gagacaaata ctatgaccgt gagttccgat 1980
accaccgccg aaatttctct cggctggagt atccaagatt ggatcgattt tcacaaaagc 2040
tctagttccc aagcctccct ccgcctcctc gaatccctcc tcgatagcca aaatgtggcc 2100
cccgtggata atgcctggat ttccctcatt agcaaggaaa acctcctcca tcaatttcaa 2160
attctcaagt ctcgcgaaaa caaggaaacc ctccccctct atggtgtgcc cattgccgtg 2220
aaagataata ttgatgtgcg tggcctcccc accaccgccg cctgtcccag ttttgcctac 2280
gaaccctcta aagatagtaa agtggtggaa ctcctccgca atgccggcgc cattattgtg 2340
ggtaaaacca atctcgatca atttgccacc ggcctcgtgg gcacccgcag tccctatggc 2400
aaaaccccct gtgccttttc caaagaacac gtgagcggcg gtagctctgc cggctccgcc 2460
agcgtggtgg cccgcggtat tgtgcccatt gccctcggca ccgataccgc cggctctggt 2520
cgggtgcccg ccgccctcaa taatctcatt ggcctcaaac ccaccaaggg tgtgtttagt 2580
tgtcaaggcg tggtgcccgc ctgtaaatct ctcgattgtg tgagtatttt tgccctcaat 2640
ctcagcgatg ccgaacgctg ttttcggatt atgtgtcaac ccgatcccga taatgatgaa 2700
tattcccgcc cctacgtgag caatcccctc aaaaaattta gttccaatgt gaccattgcc 2760
attcccaaaa atattccctg gtatggtgaa accaaaaatc ccgtgctctt ttccaatgcc 2820
gtggaaaatc tcagccggac cggcgccaat gtgattgaaa ttgattttga acccctcctc 2880
gaactcgccc gctgtctcta tgaaggcacc tgggtggccg aacgctatca agccattcaa 2940
tcttttctcg atagtaaacc ccccaaagaa tctctcgatc ccaccgtgat tagtatcatc 3000
gaaggtgcca aaaaatactc cgccgtggat tgttttagct ttgaatacaa acgccaaggc 3060
attctccaaa aagtgcgccg gctcctcgaa tccgtggatg tgctctgtgt gcccacctgt 3120
cccctcaatc ccaccatgca acaagtggcc gatgaacccg tgctcgtgaa tagccgccaa 3180
ggcacctgga ccaattttgt gaatctcgcc gatctcgccg ccctcgccgt gcccgccggt 3240
tttcgggatg atggcctccc caatggtatt accctcattg gcaaaaaatt taccgattat 3300
gccctcctcg aactcgccaa ccgctacttt caaaacatct ttcccaacgg ctcccggacc 3360
tatggcacct ttaccagctc tagtgtgaaa cccgccaatg atcaactcgt gggccccgat 3420
tacgatccct ctaccagtat taaactcgcc gtggtgggcg cccacctcaa aggcctcccc 3480
ctccattggc aactcgaaaa agtgaatgcc acctatctct gtaccaccaa aaccagcaaa 3540
gcctaccaac tctttgccct ccccaaaaat ggtcccgtgc tcaaacccgg cctccgtcgt 3600
gtgcaagatt ccaatggtag ccaaattgaa ctcgaagtgt attccgtgcc caaagaactc 3660
tttggcgcct ttattagcat ggtgcccgaa cccctcggca ttggttctgt ggaactcgaa 3720
agtggcgaat ggatcaaatc ttttatttgt gaagaaagtg gctacaaagc caaaggcacc 3780
gtggatatta ccaaatatgg cggttttcgg gcctactttg aaatgctcta aattgattag 3840
gagatataca ccatgagcat ggaaacccac tcctatgttg atgttgcgat ccgtaacgcc 3900
cgtctcgccg ataccgaagg cattgttgat attctgattc atgatggtcg gattgccagc 3960
attgtgaaat ccaccaaaac caaaggttcc gtggaaattg atgcccatga aggtctcgtg 4020
accagtggcc tcgtggaacc ccacattcat ctcgataaag ccctcaccgc cgatcgcgtg 4080
cccgccggta gtattggcga tctccggacc cgccggggtc tcgaaatggc cattcgcgcc 4140
acccgcgata ttaaacgcac ctttaccgtg gaagatgtgc gggaacgcgc cattcgggcc 4200
gccctcatgg ccagtcgcgc cggcaccacc gccctccgca cccatgtgga tgtggacccc 4260
attgtgggtc tcgccggtat tcggggcgtg ctcgaagccc gcgaagtgtg tgccggtctc 4320
attgatattc aaattgtggc ctttccccaa gaaggcctct tttgtagtgc cggtgccgtg 4380
gatctcatgc gggaagccat taaactcggt gccgatgccg tgggcggtgc ccccgccctc 4440
gatgatcgcc cccaagatca tgtgcgcgcc gtgtttgatc tcgccgccga atttggtctc 4500
cccgtggata tgcacgtgga tgaaagtgat cgccgggaag attttaccct cccctttgtg 4560
attgaagccg cccgcgaacg gcgcgtgccc aatgtgaccg tggcccacat ttcctctctc 4620
agtgtgcaaa ccgatgatgt ggcccgctcc accattgccg ccctcgccga tgccgatgtg 4680
aatgtggtgg tgaatcccat tattgtgaaa attacccgcc tctctgaact cctcgatgcc 4740
ggtgtgtctg tgatgtttgg ctccgataat ctccgcgatc ccttttatcc cctcggtgcc 4800
gccaatcccc tcggtagtgc catttttgcc tgtcaaattg ccgccctcgg caccccccaa 4860
gacctccgcc gggtgtttga tgccgtgacc attaatgccg cccgcatgct cggttttccc 4920
agtctcctcg gtgtggtgga aggtgccgtg gccgatctcg ccgtgtttcc cagtgccacc 4980
cccgaagaag tggtgctcga tcaacaaagt cccctctttg tgctcaaagg tggtcgggtc 5040
gttgcgatgc ggttagcggc gggtagcacc tcctttcgtg attattcgta atatacttag 5100
gagattcata cgatgatgag cggcgaacac accctcaaag ccgtgcgcgg ttcttttatt 5160
gatgtgaccc ggaccattga taatcccgaa gaaattgcca gcgccctccg ctttattgaa 5220
gatggcctcc tcctcattaa acagggtaaa gtggaatggt ttggcgaatg ggaaaatggt 5280
aaacaccaaa ttcccgatac cattcgcgtg cgggattatc ggggcaaact cattgtgccc 5340
ggttttgtgg atacccacat tcattatccc caaagtgaaa tggtgggcgc ctacggtgaa 5400
caactcctcg aatggctcaa taaacatacc tttcccaccg aacgccggta tgaagatttg 5460
gaatacgccc gcgaaatgtc cgcctttttc attaaacaac tcctccggaa tggcaccacc 5520
accgccctcg tgtttggcac cgtgcatccc caaagtgtgg atgccctctt tgaagccgcc 5580
tcccatatta atatgcgcat gattgccggc aaagtgatga tggatcggaa tgcccccgat 5640
tatctcctcg ataccgccga aagttcctac caccaatcta aagaactcat tgaacgctgg 5700
cataaaaatg gtcggctcct ctatgccatt accccccgtt ttgcccccac cagctctccc 5760
gaacaaatgg cgatggccca acggctcaaa gaagaatacc ccgatacctg ggtgcatacc 5820
catctctgtg aaaataaaga tgaaattgcc tgggtgaaaa gcctctatcc cgatcacgat 5880
ggctacctcg atgtgtatca tcaatacggc ctcaccggta aaaattgtgt gtttgcccac 5940
tgtgtgcatc tcgaagaaaa agaatgggat cgcctctctg aaaccaaaag ttccattgcc 6000
ttttgtccca ccagcaatct ctatctcggc tctggcctct ttaatctcaa aaaagcctgg 6060
cagaaaaaag tgaaagtggg catgggcacc gatattggcg ccggcaccac ctttaatatg 6120
ctccaaaccc tcaatgaagc ctataaagtg ctccaactcc aaggctacag cctctctgcc 6180
tatgaagcct tttacctcgc caccctcggc ggtgccaaaa gtctcggcct cgatgatctc 6240
attggcaatt ttctccccgg taaagaagcc gattttgtgg tgatggaacc caccgccacc 6300
cccctccaac aactccgtta tgataatagt gtgtccctcg tggataaact ctttgtgatg 6360
atgaccctcg gcgatgatcg ctccatttat cggacctacg tggatggtcg cctcgtgtac 6420
gaacggaatt aagctagtta gaagattcag accatgcaaa ccctcagcat tcaacatggc 6480
accctcgtga cgatggatca atatcgccgg gtgctcggcg atagctgggt gcatgtgcaa 6540
gatggccgca ttgtggccct cggtgtgcat gccgaatctg tgcccccccc cgccgatcgt 6600
gtgattgatg cccgcggtaa agtggtgctc cccggtttta ttaatgccca tacccacgtg 6660
aatcaaattc tcctccgtgg tggtccctct cacggtcgcc aactctatga ttggctcttt 6720
aatgtgctct accccggcca aaaagccatg cgccccgaag atgtggccgt ggccgtgcgg 6780
ctctattgtg ccgaagccgt gcgcagtggt attaccacca ttaatgataa tgccgattcc 6840
gccatttacc ccggcaatat tgaagccgcg atggccgtgt atggcgaagt gggtgtgcgg 6900
gtggtgtacg cccgcatgtt tttcgatcgc atggatggcc ggattcaagg ttatgtggat 6960
gccctcaaag cccggagccc ccaagtggaa ctctgttcta ttatggaaga aaccgccgtg 7020
gccaaagatc ggattaccgc cctcagcgat caatatcacg gcaccgccgg tggccgcatt 7080
agtgtgtggc ccgcccccgc cattaccccc gccgtgaccg tggagggtat gcgttgggcc 7140
caagcctttg cccgcgatcg ggccgtgatg tggaccctcc acatggccga aagcgatcat 7200
gatgaacggc tccactggat gtctcccgcc gaatatatgg aatgttacgg cctcctcgat 7260
gaacgcctcc aagtggccca ctgtgtgtat tttgatcgca aagatgtgcg gctcctccat 7320
cgccacaatg tgaaagtggc cagtcaagtg gtgtccaatg cctacctcgg cagtggtgtg 7380
gcccccgtgc ccgaaatggt ggaacgtggc atggccgtgg gcattggcac cgatgatggt 7440
aattgtaatg attccgtgaa tatgattggc gatatgaaat ttatggccca tattcaccgg 7500
gccgtgcatc gcgatgccga tgtgctcacc cccgaaaaaa ttctcgaaat ggccaccatt 7560
gatggcgccc gcagtctcgg tatggatcat gaaattggct ccattgaaac cggtaaacgg 7620
gccgatctca ttctcctcga tctccgccac ccccaaacca ccccccacca tcacctcgcc 7680
gccaccattg tgtttcaagc ctacggtaat gaagtggata ccgtgctcat tgatggcaat 7740
gtggtgatgg aaaatcgccg gctcagtttt ctcccccccg aacgggaact cgcctttctc 7800
gaagaagccc aaagtcgcgc caccgccatt ctccaacgcg ccaatatggt ggccaatccc 7860
gcctggcgca gcctctaaaa gggtgggcgc gccgacccag ctttcttgta caaactcggc 7920
cctgcaggag aaggccatcc tgacggatgg cctttttgaa gcttgaaa 7968
<210> 86
<211> 7968
<212> DNA
<213> 人工序列
<220>
<223> Mel6
<220>
<221> 启动子
<222> (1)..(89)
<223> Pc223启动子
<220>
<221> 基因
<222> (104)..(1195)
<223> atzD
<220>
<221> 基因
<222> (1217)..(1942)
<223> trzE
<220>
<221> 基因
<222> (1963)..(3831)
<223> DUR1,2
<220>
<221> 基因
<222> (3853)..(5091)
<223> trzC
<220>
<221> 基因
<222> (5113)..(6432)
<223> guaD
<220>
<221> 基因
<222> (6454)..(7878)
<223> triA
<220>
<221> 终止子
<222> (7929)..(7957)
<223> RRNB终止子
<400> 86
ttaacaaaaa agcaggaata aaattaacat gatgtaacag acataagtcc catcaccgtt 60
gtataatgtt aactgtggga ttgcaaaaga ggagattaat tcaatgtatc acattgatgt 120
gtttcgcatt ccctgtcata gccccggtga tacctctggc ctcgaagatt tgattgaaac 180
cggtcgtgtg gcccccgccg atattgtggc cgtgatgggt aaaaccgagg gtaatggctg 240
tgtgaatgat tatacccgcg aatacgccac cgccatgctc gccgcctgtc tcggccgcca 300
cctccaactc cccccccatg aagtggaaaa acgggtggcc tttgtgatga gtggtggcac 360
cgaaggtgtg ctctcccccc accataccgt gtttgcccgt cgccccgcca ttgatgccca 420
ccgtcccgcc ggtaaacgtc tcaccctcgg cattgccttt acccgcgatt ttctccccga 480
agaaattggt cggcatgccc aaattaccga aaccgccggc gccgtgaaac gtgccatgcg 540
tgatgccggt attgccagta ttgatgatct ccactttgtg caagtgaaat gtcccctcct 600
cacccccgcc aaaattgcct ccgcccgcag ccggggctgt gcccccgtga ccaccgatac 660
ctatgaatct atgggttaca gtcggggcgc ctccgccctc ggtattgccc tcgccaccga 720
agaagtgccc agttccatgc tcgtggatga aagtgtgctc aatgattggt ccctcagctc 780
tagtctcgcc tccgccagcg ccggcattga actcgaacac aatgtggtga ttgccattgg 840
tatgagtgaa caagccacct ccgaactcgt gattgcccac ggcgtgatga gcgatgccat 900
tgatgccgcc tctgtgcgcc ggaccattga aagcctcggt attcgctctg atgatgaaat 960
ggatcggatt gtgaatgtgt ttgccaaagc cgaagccagt cccgatggtg tggtgcgtgg 1020
tatgcgtcac accatgctct ctgatagtga tattaattcc acccgtcatg cccgtgccgt 1080
gaccggtgcc gccattgcca gcgtggtggg tcacggcatg gtgtacgtgt ctggcggtgc 1140
cgaacatcaa ggtcccgccg gtggtggtcc ctttgccgtg attgcccgtg cctaagtcaa 1200
gtaggagatt aattccatga tttatagtac cgtgaatgcc aatccctatg cctggcccta 1260
cgatggctcc attgatcccg cccacaccgc cctcatcctc atcgattggc aaatcgattt 1320
ttgtggtccc ggcggttatg tggatagtat gggctacgat ctcagcctca cccgctctgg 1380
cctcgaaccc accgcccgcg tgctcgccgc cgcccgcgat accggcatga ccgtgattca 1440
cacccgcgaa ggtcatcgtc ccgatctcgc cgatctcccc cccaataaac gttggcggag 1500
tgcctccgcc ggcgccgaaa ttggcagtgt gggtccctgt ggccgcattc tcgtgcgtgg 1560
tgaacccggt tgggaaattg tgcccgaagt ggccccccgc gaaggtgaac ccattattga 1620
taaacccggt aaaggtgcct tttatgccac cgatctcgat ctcctcctcc gcacccgcgg 1680
cattacccac ctcattctca ccggcattac caccgatgtg tgtgtgcata ccaccatgcg 1740
cgaagccaat gatcggggct acgaatgtct cattctctcc gattgtaccg gtgccaccga 1800
tcggaaacac catgaagccg ccctcagcat ggtgaccatg caaggcggtg tgtttggtgc 1860
caccgcccat tctgatgatc tcctcgccgc cctcggcacc accgtgcccg ccgccgccgg 1920
cccccgtgcc cgcaccgaat aatctaatag gagacaaata ctatgaccgt gagttccgat 1980
accaccgccg aaatttctct cggctggagt atccaagatt ggatcgattt tcacaaaagc 2040
tctagttccc aagcctccct ccgcctcctc gaatccctcc tcgatagcca aaatgtggcc 2100
cccgtggata atgcctggat ttccctcatt agcaaggaaa acctcctcca tcaatttcaa 2160
attctcaagt ctcgcgaaaa caaggaaacc ctccccctct atggtgtgcc cattgccgtg 2220
aaagataata ttgatgtgcg tggcctcccc accaccgccg cctgtcccag ttttgcctac 2280
gaaccctcta aagatagtaa agtggtggaa ctcctccgca atgccggcgc cattattgtg 2340
ggtaaaacca atctcgatca atttgccacc ggcctcgtgg gcacccgcag tccctatggc 2400
aaaaccccct gtgccttttc caaagaacac gtgagcggcg gtagctctgc cggctccgcc 2460
agcgtggtgg cccgcggtat tgtgcccatt gccctcggca ccgataccgc cggctctggt 2520
cgggtgcccg ccgccctcaa taatctcatt ggcctcaaac ccaccaaggg tgtgtttagt 2580
tgtcaaggcg tggtgcccgc ctgtaaatct ctcgattgtg tgagtatttt tgccctcaat 2640
ctcagcgatg ccgaacgctg ttttcggatt atgtgtcaac ccgatcccga taatgatgaa 2700
tattcccgcc cctacgtgag caatcccctc aaaaaattta gttccaatgt gaccattgcc 2760
attcccaaaa atattccctg gtatggtgaa accaaaaatc ccgtgctctt ttccaatgcc 2820
gtggaaaatc tcagccggac cggcgccaat gtgattgaaa ttgattttga acccctcctc 2880
gaactcgccc gctgtctcta tgaaggcacc tgggtggccg aacgctatca agccattcaa 2940
tcttttctcg atagtaaacc ccccaaagaa tctctcgatc ccaccgtgat tagtatcatc 3000
gaaggtgcca aaaaatactc cgccgtggat tgttttagct ttgaatacaa acgccaaggc 3060
attctccaaa aagtgcgccg gctcctcgaa tccgtggatg tgctctgtgt gcccacctgt 3120
cccctcaatc ccaccatgca acaagtggcc gatgaacccg tgctcgtgaa tagccgccaa 3180
ggcacctgga ccaattttgt gaatctcgcc gatctcgccg ccctcgccgt gcccgccggt 3240
tttcgggatg atggcctccc caatggtatt accctcattg gcaaaaaatt taccgattat 3300
gccctcctcg aactcgccaa ccgctacttt caaaacatct ttcccaacgg ctcccggacc 3360
tatggcacct ttaccagctc tagtgtgaaa cccgccaatg atcaactcgt gggccccgat 3420
tacgatccct ctaccagtat taaactcgcc gtggtgggcg cccacctcaa aggcctcccc 3480
ctccattggc aactcgaaaa agtgaatgcc acctatctct gtaccaccaa aaccagcaaa 3540
gcctaccaac tctttgccct ccccaaaaat ggtcccgtgc tcaaacccgg cctccgtcgt 3600
gtgcaagatt ccaatggtag ccaaattgaa ctcgaagtgt attccgtgcc caaagaactc 3660
tttggcgcct ttattagcat ggtgcccgaa cccctcggca ttggttctgt ggaactcgaa 3720
agtggcgaat ggatcaaatc ttttatttgt gaagaaagtg gctacaaagc caaaggcacc 3780
gtggatatta ccaaatatgg cggttttcgg gcctactttg aaatgctcta aattgattag 3840
gagatataca ccatgagcat ggaaacccac tcctatgttg atgttgcgat ccgtaacgcc 3900
cgtctcgccg ataccgaagg cattgttgat attctgattc atgatggtcg gattgccagc 3960
attgtgaaat ccaccaaaac caaaggttcc gtggaaattg atgcccatga aggtctcgtg 4020
accagtggcc tcgtggaacc ccacattcat ctcgataaag ccctcaccgc cgatcgcgtg 4080
cccgccggta gtattggcga tctccggacc cgccggggtc tcgaaatggc cattcgcgcc 4140
acccgcgata ttaaacgcac ctttaccgtg gaagatgtgc gggaacgcgc cattcgggcc 4200
gccctcatgg ccagtcgcgc cggcaccacc gccctccgca cccatgtgga tgtggacccc 4260
attgtgggtc tcgccggtat tcggggcgtg ctcgaagccc gcgaagtgtg tgccggtctc 4320
attgatattc aaattgtggc ctttccccaa gaaggcctct tttgtagtgc cggtgccgtg 4380
gatctcatgc gggaagccat taaactcggt gccgatgccg tgggcggtgc ccccgccctc 4440
gatgatcgcc cccaagatca tgtgcgcgcc gtgtttgatc tcgccgccga atttggtctc 4500
cccgtggata tgcacgtgga tgaaagtgat cgccgggaag attttaccct cccctttgtg 4560
attgaagccg cccgcgaacg gcgcgtgccc aatgtgaccg tggcccacat ttcctctctc 4620
agtgtgcaaa ccgatgatgt ggcccgctcc accattgccg ccctcgccga tgccgatgtg 4680
aatgtggtgg tgaatcccat tattgtgaaa attacccgcc tctctgaact cctcgatgcc 4740
ggtgtgtctg tgatgtttgg ctccgataat ctccgcgatc ccttttatcc cctcggtgcc 4800
gccaatcccc tcggtagtgc catttttgcc tgtcaaattg ccgccctcgg caccccccaa 4860
gacctccgcc gggtgtttga tgccgtgacc attaatgccg cccgcatgct cggttttccc 4920
agtctcctcg gtgtggtgga aggtgccgtg gccgatctcg ccgtgtttcc cagtgccacc 4980
cccgaagaag tggtgctcga tcaacaaagt cccctctttg tgctcaaagg tggtcgggtc 5040
gttgcgatgc ggttagcggc gggtagcacc tcctttcgtg attattcgta atatacttag 5100
gagattcata cgatgatgag cggcgaacac accctcaaag ccgtgcgcgg ttcttttatt 5160
gatgtgaccc ggaccattga taatcccgaa gaaattgcca gcgccctccg ctttattgaa 5220
gatggcctcc tcctcattaa acagggtaaa gtggaatggt ttggcgaatg ggaaaatggt 5280
aaacaccaaa ttcccgatac cattcgcgtg cgggattatc ggggcaaact cattgtgccc 5340
ggttttgtgg atacccacat tcattatccc caaagtgaaa tggtgggcgc ctacggtgaa 5400
caactcctcg aatggctcaa taaacatacc tttcccaccg aacgccggta tgaagatttg 5460
gaatacgccc gcgaaatgtc cgcctttttc attaaacaac tcctccggaa tggcaccacc 5520
accgccctcg tgtttggcac cgtgcatccc caaagtgtgg atgccctctt tgaagccgcc 5580
tcccatatta atatgcgcat gattgccggc aaagtgatga tggatcggaa tgcccccgat 5640
tatctcctcg ataccgccga aagttcctac caccaatcta aagaactcat tgaacgctgg 5700
cataaaaatg gtcggctcct ctatgccatt accccccgtt ttgcccccac cagctctccc 5760
gaacaaatgg cgatggccca acggctcaaa gaagaatacc ccgatacctg ggtgcatacc 5820
catctctgtg aaaataaaga tgaaattgcc tgggtgaaaa gcctctatcc cgatcacgat 5880
ggctacctcg atgtgtatca tcaatacggc ctcaccggta aaaattgtgt gtttgcccac 5940
tgtgtgcatc tcgaagaaaa agaatgggat cgcctctctg aaaccaaaag ttccattgcc 6000
ttttgtccca ccagcaatct ctatctcggc tctggcctct ttaatctcaa aaaagcctgg 6060
cagaaaaaag tgaaagtggg catgggcacc gatattggcg ccggcaccac ctttaatatg 6120
ctccaaaccc tcaatgaagc ctataaagtg ctccaactcc aaggctacag cctctctgcc 6180
tatgaagcct tttacctcgc caccctcggc ggtgccaaaa gtctcggcct cgatgatctc 6240
attggcaatt ttctccccgg taaagaagcc gattttgtgg tgatggaacc caccgccacc 6300
cccctccaac aactccgtta tgataatagt gtgtccctcg tggataaact ctttgtgatg 6360
atgaccctcg gcgatgatcg ctccatttat cggacctacg tggatggtcg cctcgtgtac 6420
gaacggaatt aagctagtta ggagattcag accatgcaaa ccctcagcat tcaacatggc 6480
accctcgtga cgatggatca atatcgccgg gtgctcggcg atagctgggt gcatgtgcaa 6540
gatggccgca ttgtggccct cggtgtgcat gccgaatctg tgcccccccc cgccgatcgt 6600
gtgattgatg cccgcggtaa agtggtgctc cccggtttta ttaatgccca tacccacgtg 6660
aatcaaattc tcctccgtgg tggtccctct cacggtcgcc aactctatga ttggctcttt 6720
aatgtgctct accccggcca aaaagccatg cgccccgaag atgtggccgt ggccgtgcgg 6780
ctctattgtg ccgaagccgt gcgcagtggt attaccacca ttaatgataa tgccgattcc 6840
gccatttacc ccggcaatat tgaagccgcg atggccgtgt atggcgaagt gggtgtgcgg 6900
gtggtgtacg cccgcatgtt tttcgatcgc atggatggcc ggattcaagg ttatgtggat 6960
gccctcaaag cccggagccc ccaagtggaa ctctgttcta ttatggaaga aaccgccgtg 7020
gccaaagatc ggattaccgc cctcagcgat caatatcacg gcaccgccgg tggccgcatt 7080
agtgtgtggc ccgcccccgc cattaccccc gccgtgaccg tggagggtat gcgttgggcc 7140
caagcctttg cccgcgatcg ggccgtgatg tggaccctcc acatggccga aagcgatcat 7200
gatgaacggc tccactggat gtctcccgcc gaatatatgg aatgttacgg cctcctcgat 7260
gaacgcctcc aagtggccca ctgtgtgtat tttgatcgca aagatgtgcg gctcctccat 7320
cgccacaatg tgaaagtggc cagtcaagtg gtgtccaatg cctacctcgg cagtggtgtg 7380
gcccccgtgc ccgaaatggt gaaacgtggc atggccgtgg gcattggcac cgatgatggt 7440
aattgtaatg attccgtgaa tatgattggc gatatgaaat ttatggccca tattcaccgg 7500
gccgtgcatc gcgatgccga tgtgctcacc cccgaaaaaa ttctcgaaat ggccaccatt 7560
gatggcgccc gcagtctcgg tatggatcat gaaattggct ccattgaaac cggtaaacgg 7620
gccgatctca ttctcctcga tctccgccac ccccaaacca ccccccacca tcacctcgcc 7680
gccaccattg tgtttcaagc ctacggtaat gaagtggata ccgtgctcat tgatggcaat 7740
gtggtgatgg aaaatcgccg gctcagtttt ctcccccccg aacgggaact cgcctttctc 7800
gaagaagccc aaagtcgcgc caccgccatt ctccaacgcg ccaatatggt ggccaatccc 7860
gcctggcgca gcctctaaaa gggtgggcgc gccgacccag ctttcttgta caaactcggc 7920
cctgcaggag aaggccatcc tgacggatgg cctttttgaa gcttgaaa 7968
<210> 87
<211> 7968
<212> DNA
<213> 人工序列
<220>
<223> Mel7
<220>
<221> 启动子
<222> (1)..(89)
<223> Pc223启动子
<220>
<221> 基因
<222> (104)..(1195)
<223> atzD
<220>
<221> 基因
<222> (1217)..(1942)
<223> trzE
<220>
<221> 基因
<222> (1963)..(3831)
<223> DUR1,2
<220>
<221> 基因
<222> (3853)..(5091)
<223> trzC
<220>
<221> 基因
<222> (5113)..(6432)
<223> guaD
<220>
<221> 基因
<222> (6454)..(7878)
<223> triA
<220>
<221> 终止子
<222> (7929)..(7957)
<223> RRNB终止子
<400> 87
ttaacaaaaa agcaggaata aaattaacat gatgtaacag acataagtcc catcaccgtt 60
gtataatgtt aactgtggga ttgcaaaaga ggagattaat tcaatgtatc acattgatgt 120
gtttcgcatt ccctgtcata gccccggtga tacctctggc ctcgaagatt tgattgaaac 180
cggtcgtgtg gcccccgccg atattgtggc cgtgatgggt aaaaccgagg gtaatggctg 240
tgtgaatgat tatacccgcg aatacgccac cgccatgctc gccgcctgtc tcggccgcca 300
cctccaactc cccccccatg aagtggaaaa acgggtggcc tttgtgatga gtggtggcac 360
cgaaggtgtg ctctcccccc accataccgt gtttgcccgt cgccccgcca ttgatgccca 420
ccgtcccgcc ggtaaacgtc tcaccctcgg cattgccttt acccgcgatt ttctccccga 480
agaaattggt cggcatgccc aaattaccga aaccgccggc gccgtgaaac gtgccatgcg 540
tgatgccggt attgccagta ttgatgatct ccactttgtg caagtgaaat gtcccctcct 600
cacccccgcc aaaattgcct ccgcccgcag ccggggctgt gcccccgtga ccaccgatac 660
ctatgaatct atgggttaca gtcggggcgc ctccgccctc ggtattgccc tcgccaccga 720
agaagtgccc agttccatgc tcgtggatga aagtgtgctc aatgattggt ccctcagctc 780
tagtctcgcc tccgccagcg ccggcattga actcgaacac aatgtggtga ttgccattgg 840
tatgagtgaa caagccacct ccgaactcgt gattgcccac ggcgtgatga gcgatgccat 900
tgatgccgcc tctgtgcgcc ggaccattga aagcctcggt attcgctctg atgatgaaat 960
ggatcggatt gtgaatgtgt ttgccaaagc cgaagccagt cccgatggtg tggtgcgtgg 1020
tatgcgtcac accatgctct ctgatagtga tattaattcc acccgtcatg cccgtgccgt 1080
gaccggtgcc gccattgcca gcgtggtggg tcacggcatg gtgtacgtgt ctggcggtgc 1140
cgaacatcaa ggtcccgccg gtggtggtcc ctttgccgtg attgcccgtg cctaagtcaa 1200
gtaggagatt aattccatga tttatagtac cgtgaatgcc aatccctatg cctggcccta 1260
cgatggctcc attgatcccg cccacaccgc cctcatcctc atcgattggc aaatcgattt 1320
ttgtggtccc ggcggttatg tggatagtat gggctacgat ctcagcctca cccgctctgg 1380
cctcgaaccc accgcccgcg tgctcgccgc cgcccgcgat accggcatga ccgtgattca 1440
cacccgcgaa ggtcatcgtc ccgatctcgc cgatctcccc cccaataaac gttggcggag 1500
tgcctccgcc ggcgccgaaa ttggcagtgt gggtccctgt ggccgcattc tcgtgcgtgg 1560
tgaacccggt tgggaaattg tgcccgaagt ggccccccgc gaaggtgaac ccattattga 1620
taaacccggt aaaggtgcct tttatgccac cgatctcgat ctcctcctcc gcacccgcgg 1680
cattacccac ctcattctca ccggcattac caccgatgtg tgtgtgcata ccaccatgcg 1740
cgaagccaat gatcggggct acgaatgtct cattctctcc gattgtaccg gtgccaccga 1800
tcggaaacac catgaagccg ccctcagcat ggtgaccatg caaggcggtg tgtttggtgc 1860
caccgcccat tctgatgatc tcctcgccgc cctcggcacc accgtgcccg ccgccgccgg 1920
cccccgtgcc cgcaccgaat aatctaatag gagacaaata ctatgaccgt gagttccgat 1980
accaccgccg aaatttctct cggctggagt atccaagatt ggatcgattt tcacaaaagc 2040
tctagttccc aagcctccct ccgcctcctc gaatccctcc tcgatagcca aaatgtggcc 2100
cccgtggata atgcctggat ttccctcatt agcaaggaaa acctcctcca tcaatttcaa 2160
attctcaagt ctcgcgaaaa caaggaaacc ctccccctct atggtgtgcc cattgccgtg 2220
aaagataata ttgatgtgcg tggcctcccc accaccgccg cctgtcccag ttttgcctac 2280
gaaccctcta aagatagtaa agtggtggaa ctcctccgca atgccggcgc cattattgtg 2340
ggtaaaacca atctcgatca atttgccacc ggcctcgtgg gcacccgcag tccctatggc 2400
aaaaccccct gtgccttttc caaagaacac gtgagcggcg gtagctctgc cggctccgcc 2460
agcgtggtgg cccgcggtat tgtgcccatt gccctcggca ccgataccgc cggctctggt 2520
cgggtgcccg ccgccctcaa taatctcatt ggcctcaaac ccaccaaggg tgtgtttagt 2580
tgtcaaggcg tggtgcccgc ctgtaaatct ctcgattgtg tgagtatttt tgccctcaat 2640
ctcagcgatg ccgaacgctg ttttcggatt atgtgtcaac ccgatcccga taatgatgaa 2700
tattcccgcc cctacgtgag caatcccctc aaaaaattta gttccaatgt gaccattgcc 2760
attcccaaaa atattccctg gtatggtgaa accaaaaatc ccgtgctctt ttccaatgcc 2820
gtggaaaatc tcagccggac cggcgccaat gtgattgaaa ttgattttga acccctcctc 2880
gaactcgccc gctgtctcta tgaaggcacc tgggtggccg aacgctatca agccattcaa 2940
tcttttctcg atagtaaacc ccccaaagaa tctctcgatc ccaccgtgat tagtatcatc 3000
gaaggtgcca aaaaatactc cgccgtggat tgttttagct ttgaatacaa acgccaaggc 3060
attctccaaa aagtgcgccg gctcctcgaa tccgtggatg tgctctgtgt gcccacctgt 3120
cccctcaatc ccaccatgca acaagtggcc gatgaacccg tgctcgtgaa tagccgccaa 3180
ggcacctgga ccaattttgt gaatctcgcc gatctcgccg ccctcgccgt gcccgccggt 3240
tttcgggatg atggcctccc caatggtatt accctcattg gcaaaaaatt taccgattat 3300
gccctcctcg aactcgccaa ccgctacttt caaaacatct ttcccaacgg ctcccggacc 3360
tatggcacct ttaccagctc tagtgtgaaa cccgccaatg atcaactcgt gggccccgat 3420
tacgatccct ctaccagtat taaactcgcc gtggtgggcg cccacctcaa aggcctcccc 3480
ctccattggc aactcgaaaa agtgaatgcc acctatctct gtaccaccaa aaccagcaaa 3540
gcctaccaac tctttgccct ccccaaaaat ggtcccgtgc tcaaacccgg cctccgtcgt 3600
gtgcaagatt ccaatggtag ccaaattgaa ctcgaagtgt attccgtgcc caaagaactc 3660
tttggcgcct ttattagcat ggtgcccgaa cccctcggca ttggttctgt ggaactcgaa 3720
agtggcgaat ggatcaaatc ttttatttgt gaagaaagtg gctacaaagc caaaggcacc 3780
gtggatatta ccaaatatgg cggttttcgg gcctactttg aaatgctcta aattgattag 3840
gagatataca ccatgagcat ggaaacccac tcctatgttg atgttgcgat ccgtaacgcc 3900
cgtctcgccg ataccgaagg cattgttgat attctgattc atgatggtcg gattgccagc 3960
attgtgaaat ccaccaaaac caaaggttcc gtggaaattg atgcccatga aggtctcgtg 4020
accagtggcc tcgtggaacc ccacattcat ctcgataaag ccctcaccgc cgatcgcgtg 4080
cccgccggta gtattggcga tctccggacc cgccggggtc tcgaaatggc cattcgcgcc 4140
acccgcgata ttaaacgcac ctttaccgtg gaagatgtgc gggaacgcgc cattcgggcc 4200
gccctcatgg ccagtcgcgc cggcaccacc gccctccgca cccatgtgga tgtggacccc 4260
attgtgggtc tcgccggtat tcggggcgtg ctcgaagccc gcgaagtgtg tgccggtctc 4320
attgatattc aaattgtggc ctttccccaa gaaggcctct tttgtagtgc cggtgccgtg 4380
gatctcatgc gggaagccat taaactcggt gccgatgccg tgggcggtgc ccccgccctc 4440
gatgatcgcc cccaagatca tgtgcgcgcc gtgtttgatc tcgccgccga atttggtctc 4500
cccgtggata tgcacgtgga tgaaagtgat cgccgggaag attttaccct cccctttgtg 4560
attgaagccg cccgcgaacg gcgcgtgccc aatgtgaccg tggcccacat ttcctctctc 4620
agtgtgcaaa ccgatgatgt ggcccgctcc accattgccg ccctcgccga tgccgatgtg 4680
aatgtggtgg tgaatcccat tattgtgaaa attacccgcc tctctgaact cctcgatgcc 4740
ggtgtgtctg tgatgtttgg ctccgataat ctccgcgatc ccttttatcc cctcggtgcc 4800
gccaatcccc tcggtagtgc catttttgcc tgtcaaattg ccgccctcgg caccccccaa 4860
gacctccgcc gggtgtttga tgccgtgacc attaatgccg cccgcatgct cggttttccc 4920
agtctcctcg gtgtggtgga aggtgccgtg gccgatctcg ccgtgtttcc cagtgccacc 4980
cccgaagaag tggtgctcga tcaacaaagt cccctctttg tgctcaaagg tggtcgggtc 5040
gttgcgatgc ggttagcggc gggtagcacc tcctttcgtg attattcgta atatacttag 5100
gagattcata cgatgatgag cggcgaacac accctcaaag ccgtgcgcgg ttcttttatt 5160
gatgtgaccc ggaccattga taatcccgaa gaaattgcca gcgccctccg ctttattgaa 5220
gatggcctcc tcctcattaa acagggtaaa gtggaatggt ttggcgaatg ggaaaatggt 5280
aaacaccaaa ttcccgatac cattcgcgtg cgggattatc ggggcaaact cattgtgccc 5340
ggttttgtgg atacccacat tcattatccc caaagtgaaa tggtgggcgc ctacggtgaa 5400
caactcctcg aatggctcaa taaacatacc tttcccaccg aacgccggta tgaagatttg 5460
gaatacgccc gcgaaatgtc cgcctttttc attaaacaac tcctccggaa tggcaccacc 5520
accgccctcg tgtttggcac cgtgcatccc caaagtgtgg atgccctctt tgaagccgcc 5580
tcccatatta atatgcgcat gattgccggc aaagtgatga tggatcggaa tgcccccgat 5640
tatctcctcg ataccgccga aagttcctac caccaatcta aagaactcat tgaacgctgg 5700
cataaaaatg gtcggctcct ctatgccatt accccccgtt ttgcccccac cagctctccc 5760
gaacaaatgg cgatggccca acggctcaaa gaagaatacc ccgatacctg ggtgcatacc 5820
catctctgtg aaaataaaga tgaaattgcc tgggtgaaaa gcctctatcc cgatcacgat 5880
ggctacctcg atgtgtatca tcaatacggc ctcaccggta aaaattgtgt gtttgcccac 5940
tgtgtgcatc tcgaagaaaa agaatgggat cgcctctctg aaaccaaaag ttccattgcc 6000
ttttgtccca ccagcaatct ctatctcggc tctggcctct ttaatctcaa aaaagcctgg 6060
cagaaaaaag tgaaagtggg catgggcacc gatattggcg ccggcaccac ctttaatatg 6120
ctccaaaccc tcaatgaagc ctataaagtg ctccaactcc aaggctacag cctctctgcc 6180
tatgaagcct tttacctcgc caccctcggc ggtgccaaaa gtctcggcct cgatgatctc 6240
attggcaatt ttctccccgg taaagaagcc gattttgtgg tgatggaacc caccgccacc 6300
cccctccaac aactccgtta tgataatagt gtgtccctcg tggataaact ctttgtgatg 6360
atgaccctcg gcgatgatcg ctccatttat cggacctacg tggatggtcg cctcgtgtac 6420
gaacggaatt aagctagtta ggagattcag accatgcaaa ccctcagcat tcaacatggc 6480
accctcgtga cgatggatca atatcgccgg gtgctcggcg atagctgggt gcatgtgcaa 6540
gatggccgca ttgtggccct cggtgtgcat gccgaatctg tgcccccccc cgccgatcgt 6600
gtgattgatg cccgcggtaa agtggtgctc cccggtttta ttaatgccca tacccacgtg 6660
aatcaaattc tcctccgtgg tggtccctct cacggtcgcc aactctatga ttggctcttt 6720
aatgtgctct accccggcca aaaagccatg cgccccgaag atgtggccgt ggccgtgcgg 6780
ctctattgtg ccgaagccgt gcgcagtggt attaccacca ttaatgataa tgccgattcc 6840
gccatttacc ccggcaatat tgaagccgcg atggccgtgt atggcgaagt gggtgtgcgg 6900
gtggtgtacg cccgcatgtt tttcgatcgc atggatggcc ggattcaagg ttatgtggat 6960
gccctcaaag cccggagccc ccaagtggaa ctctgttcta ttatggaaga aaccgccgtg 7020
gccaaagatc ggattaccgc cctcagcgat caatatcacg gcaccgccgg tggccgcatt 7080
agtgtgtggc ccgcccccgc cattaccccc gccgtgaccg tggagggtat gcgttgggcc 7140
caagcctttg cccgcgatcg ggccgtgatg tggaccctcc acatggccga aagcgatcat 7200
gatgaacggc tctactggat gtctcccgcc gaatatatgg aatgttacgg cctcctcgat 7260
gaacgcctcc aagtggccca ctgtgtgtat tttgatcgca aagatgtgcg gctcctccat 7320
cgccacaatg tgaaagtggc cagtcaagtg gtgtccaatg cctacctcgg cagtggtgtg 7380
gcccccgtgc ccgaaatggt ggaacgtggc atggccgtgg gcattggcac cgatgatggt 7440
aattgtaatg attccgtgaa tatgattggc gatatgaaat ttatggccca tattcaccgg 7500
gccgtgcatc gcgatgccga tgtgctcacc cccgaaaaaa ttctcgaaat ggccaccatt 7560
gatggcgccc gcagtctcgg tatggatcat gaaattggct ccattgaaac cggtaaacgg 7620
gccgatctca ttctcctcga tctccgccac ccccaaacca ccccccacca tcacctcgcc 7680
gccaccattg tgtttcaagc ctacggtaat gaagtggata ccgtgctcat tgatggcaat 7740
gtggtgatgg aaaatcgccg gctcagtttt ctcccccccg aacgggaact cgcctttctc 7800
gaagaagccc aaagtcgcgc caccgccatt ctccaacgcg ccaatatggt ggccaatccc 7860
gcctggcgca gcctctaaaa gggtgggcgc gccgacccag ctttcttgta caaactcggc 7920
cctgcaggag aaggccatcc tgacggatgg cctttttgaa gcttgaaa 7968
<210> 88
<211> 7968
<212> DNA
<213> 人工序列
<220>
<223> Mel8
<220>
<221> 启动子
<222> (1)..(89)
<223> Pc223启动子
<220>
<221> 基因
<222> (104)..(1195)
<223> atzD
<220>
<221> 基因
<222> (1217)..(1942)
<223> trzE
<220>
<221> 基因
<222> (1963)..(3831)
<223> DUR1,2
<220>
<221> 基因
<222> (3853)..(5091)
<223> trzC
<220>
<221> 基因
<222> (5113)..(6432)
<223> guaD
<220>
<221> 基因
<222> (6454)..(7878)
<223> triA
<220>
<221> 终止子
<222> (7929)..(7957)
<223> RRNB终止子
<400> 88
ttaacaaaaa agcaggaata aaattaacat gatgtaacag acataagtcc catcaccgtt 60
gtataatgtt aactgtggga ttgcaaaaga ggagattaat tcaatgtatc acattgatgt 120
gtttcgcatt ccctgtcata gccccggtga tacctctggc ctcgaagatt tgattgaaac 180
cggtcgtgtg gcccccgccg atattgtggc cgtgatgggt aaaaccgagg gtaatggctg 240
tgtgaatgat tatacccgcg aatacgccac cgccatgctc gccgcctgtc tcggccgcca 300
cctccaactc cccccccatg aagtggaaaa acgggtggcc tttgtgatga gtggtggcac 360
cgaaggtgtg ctctcccccc accataccgt gtttgcccgt cgccccgcca ttgatgccca 420
ccgtcccgcc ggtaaacgtc tcaccctcgg cattgccttt acccgcgatt ttctccccga 480
agaaattggt cggcatgccc aaattaccga aaccgccggc gccgtgaaac gtgccatgcg 540
tgatgccggt attgccagta ttgatgatct ccactttgtg caagtgaaat gtcccctcct 600
cacccccgcc aaaattgcct ccgcccgcag ccggggctgt gcccccgtga ccaccgatac 660
ctatgaatct atgggttaca gtcggggcgc ctccgccctc ggtattgccc tcgccaccga 720
agaagtgccc agttccatgc tcgtggatga aagtgtgctc aatgattggt ccctcagctc 780
tagtctcgcc tccgccagcg ccggcattga actcgaacac aatgtggtga ttgccattgg 840
tatgagtgaa caagccacct ccgaactcgt gattgcccac ggcgtgatga gcgatgccat 900
tgatgccgcc tctgtgcgcc ggaccattga aagcctcggt attcgctctg atgatgaaat 960
ggatcggatt gtgaatgtgt ttgccaaagc cgaagccagt cccgatggtg tggtgcgtgg 1020
tatgcgtcac accatgctct ctgatagtga tattaattcc acccgtcatg cccgtgccgt 1080
gaccggtgcc gccattgcca gcgtggtggg tcacggcatg gtgtacgtgt ctggcggtgc 1140
cgaacatcaa ggtcccgccg gtggtggtcc ctttgccgtg attgcccgtg cctaagtcaa 1200
gtaggagatt aattccatga tttatagtac cgtgaatgcc aatccctatg cctggcccta 1260
cgatggctcc attgatcccg cccacaccgc cctcatcctc atcgattggc aaatcgattt 1320
ttgtggtccc ggcggttatg tggatagtat gggctacgat ctcagcctca cccgctctgg 1380
cctcgaaccc accgcccgcg tgctcgccgc cgcccgcgat accggcatga ccgtgattca 1440
cacccgcgaa ggtcatcgtc ccgatctcgc cgatctcccc cccaataaac gttggcggag 1500
tgcctccgcc ggcgccgaaa ttggcagtgt gggtccctgt ggccgcattc tcgtgcgtgg 1560
tgaacccggt tgggaaattg tgcccgaagt ggccccccgc gaaggtgaac ccattattga 1620
taaacccggt aaaggtgcct tttatgccac cgatctcgat ctcctcctcc gcacccgcgg 1680
cattacccac ctcattctca ccggcattac caccgatgtg tgtgtgcata ccaccatgcg 1740
cgaagccaat gatcggggct acgaatgtct cattctctcc gattgtaccg gtgccaccga 1800
tcggaaacac catgaagccg ccctcagcat ggtgaccatg caaggcggtg tgtttggtgc 1860
caccgcccat tctgatgatc tcctcgccgc cctcggcacc accgtgcccg ccgccgccgg 1920
cccccgtgcc cgcaccgaat aatctaatag gagacaaata ctatgaccgt gagttccgat 1980
accaccgccg aaatttctct cggctggagt atccaagatt ggatcgattt tcacaaaagc 2040
tctagttccc aagcctccct ccgcctcctc gaatccctcc tcgatagcca aaatgtggcc 2100
cccgtggata atgcctggat ttccctcatt agcaaggaaa acctcctcca tcaatttcaa 2160
attctcaagt ctcgcgaaaa caaggaaacc ctccccctct atggtgtgcc cattgccgtg 2220
aaagataata ttgatgtgcg tggcctcccc accaccgccg cctgtcccag ttttgcctac 2280
gaaccctcta aagatagtaa agtggtggaa ctcctccgca atgccggcgc cattattgtg 2340
ggtaaaacca atctcgatca atttgccacc ggcctcgtgg gcacccgcag tccctatggc 2400
aaaaccccct gtgccttttc caaagaacac gtgagcggcg gtagctctgc cggctccgcc 2460
agcgtggtgg cccgcggtat tgtgcccatt gccctcggca ccgataccgc cggctctggt 2520
cgggtgcccg ccgccctcaa taatctcatt ggcctcaaac ccaccaaggg tgtgtttagt 2580
tgtcaaggcg tggtgcccgc ctgtaaatct ctcgattgtg tgagtatttt tgccctcaat 2640
ctcagcgatg ccgaacgctg ttttcggatt atgtgtcaac ccgatcccga taatgatgaa 2700
tattcccgcc cctacgtgag caatcccctc aaaaaattta gttccaatgt gaccattgcc 2760
attcccaaaa atattccctg gtatggtgaa accaaaaatc ccgtgctctt ttccaatgcc 2820
gtggaaaatc tcagccggac cggcgccaat gtgattgaaa ttgattttga acccctcctc 2880
gaactcgccc gctgtctcta tgaaggcacc tgggtggccg aacgctatca agccattcaa 2940
tcttttctcg atagtaaacc ccccaaagaa tctctcgatc ccaccgtgat tagtatcatc 3000
gaaggtgcca aaaaatactc cgccgtggat tgttttagct ttgaatacaa acgccaaggc 3060
attctccaaa aagtgcgccg gctcctcgaa tccgtggatg tgctctgtgt gcccacctgt 3120
cccctcaatc ccaccatgca acaagtggcc gatgaacccg tgctcgtgaa tagccgccaa 3180
ggcacctgga ccaattttgt gaatctcgcc gatctcgccg ccctcgccgt gcccgccggt 3240
tttcgggatg atggcctccc caatggtatt accctcattg gcaaaaaatt taccgattat 3300
gccctcctcg aactcgccaa ccgctacttt caaaacatct ttcccaacgg ctcccggacc 3360
tatggcacct ttaccagctc tagtgtgaaa cccgccaatg atcaactcgt gggccccgat 3420
tacgatccct ctaccagtat taaactcgcc gtggtgggcg cccacctcaa aggcctcccc 3480
ctccattggc aactcgaaaa agtgaatgcc acctatctct gtaccaccaa aaccagcaaa 3540
gcctaccaac tctttgccct ccccaaaaat ggtcccgtgc tcaaacccgg cctccgtcgt 3600
gtgcaagatt ccaatggtag ccaaattgaa ctcgaagtgt attccgtgcc caaagaactc 3660
tttggcgcct ttattagcat ggtgcccgaa cccctcggca ttggttctgt ggaactcgaa 3720
agtggcgaat ggatcaaatc ttttatttgt gaagaaagtg gctacaaagc caaaggcacc 3780
gtggatatta ccaaatatgg cggttttcgg gcctactttg aaatgctcta aattgattag 3840
gagatataca ccatgagcat ggaaacccac tcctatgttg atgttgcgat ccgtaacgcc 3900
cgtctcgccg ataccgaagg cattgttgat attctgattc atgatggtcg gattgccagc 3960
attgtgaaat ccaccaaaac caaaggttcc gtggaaattg atgcccatga aggtctcgtg 4020
accagtggcc tcgtggaacc ccacattcat ctcgataaag ccctcaccgc cgatcgcgtg 4080
cccgccggta gtattggcga tctccggacc cgccggggtc tcgaaatggc cattcgcgcc 4140
acccgcgata ttaaacgcac ctttaccgtg gaagatgtgc gggaacgcgc cattcgggcc 4200
gccctcatgg ccagtcgcgc cggcaccacc gccctccgca cccatgtgga tgtggacccc 4260
attgtgggtc tcgccggtat tcggggcgtg ctcgaagccc gcgaagtgtg tgccggtctc 4320
attgatattc aaattgtggc ctttccccaa gaaggcctct tttgtagtgc cggtgccgtg 4380
gatctcatgc gggaagccat taaactcggt gccgatgccg tgggcggtgc ccccgccctc 4440
gatgatcgcc cccaagatca tgtgcgcgcc gtgtttgatc tcgccgccga atttggtctc 4500
cccgtggata tgcacgtgga tgaaagtgat cgccgggaag attttaccct cccctttgtg 4560
attgaagccg cccgcgaacg gcgcgtgccc aatgtgaccg tggcccacat ttcctctctc 4620
agtgtgcaaa ccgatgatgt ggcccgctcc accattgccg ccctcgccga tgccgatgtg 4680
aatgtggtgg tgaatcccat tattgtgaaa attacccgcc tctctgaact cctcgatgcc 4740
ggtgtgtctg tgatgtttgg ctccgataat ctccgcgatc ccttttatcc cctcggtgcc 4800
gccaatcccc tcggtagtgc catttttgcc tgtcaaattg ccgccctcgg caccccccaa 4860
gacctccgcc gggtgtttga tgccgtgacc attaatgccg cccgcatgct cggttttccc 4920
agtctcctcg gtgtggtgga aggtgccgtg gccgatctcg ccgtgtttcc cagtgccacc 4980
cccgaagaag tggtgctcga tcaacaaagt cccctctttg tgctcaaagg tggtcgggtc 5040
gttgcgatgc ggttagcggc gggtagcacc tcctttcgtg attattcgta atatacttag 5100
gagattcata cgatgatgag cggcgaacac accctcaaag ccgtgcgcgg ttcttttatt 5160
gatgtgaccc ggaccattga taatcccgaa gaaattgcca gcgccctccg ctttattgaa 5220
gatggcctcc tcctcattaa acagggtaaa gtggaatggt ttggcgaatg ggaaaatggt 5280
aaacaccaaa ttcccgatac cattcgcgtg cgggattatc ggggcaaact cattgtgccc 5340
ggttttgtgg atacccacat tcattatccc caaagtgaaa tggtgggcgc ctacggtgaa 5400
caactcctcg aatggctcaa taaacatacc tttcccaccg aacgccggta tgaagatttg 5460
gaatacgccc gcgaaatgtc cgcctttttc attaaacaac tcctccggaa tggcaccacc 5520
accgccctcg tgtttggcac cgtgcatccc caaagtgtgg atgccctctt tgaagccgcc 5580
tcccatatta atatgcgcat gattgccggc aaagtgatga tggatcggaa tgcccccgat 5640
tatctcctcg ataccgccga aagttcctac caccaatcta aagaactcat tgaacgctgg 5700
cataaaaatg gtcggctcct ctatgccatt accccccgtt ttgcccccac cagctctccc 5760
gaacaaatgg cgatggccca acggctcaaa gaagaatacc ccgatacctg ggtgcatacc 5820
catctctgtg aaaataaaga tgaaattgcc tgggtgaaaa gcctctatcc cgatcacgat 5880
ggctacctcg atgtgtatca tcaatacggc ctcaccggta aaaattgtgt gtttgcccac 5940
tgtgtgcatc tcgaagaaaa agaatgggat cgcctctctg aaaccaaaag ttccattgcc 6000
ttttgtccca ccagcaatct ctatctcggc tctggcctct ttaatctcaa aaaagcctgg 6060
cagaaaaaag tgaaagtggg catgggcacc gatattggcg ccggcaccac ctttaatatg 6120
ctccaaaccc tcaatgaagc ctataaagtg ctccaactcc aaggctacag cctctctgcc 6180
tatgaagcct tttacctcgc caccctcggc ggtgccaaaa gtctcggcct cgatgatctc 6240
attggcaatt ttctccccgg taaagaagcc gattttgtgg tgatggaacc caccgccacc 6300
cccctccaac aactccgtta tgataatagt gtgtccctcg tggataaact ctttgtgatg 6360
atgaccctcg gcgatgatcg ctccatttat cggacctacg tggatggtcg cctcgtgtac 6420
gaacggaatt aagctagtta ggagattcag accatgcaaa ccctcagcat tcaacatggc 6480
accctcgtga cgatggatca atatcgccgg gtgctcggcg atagctgggt gcatgtgcaa 6540
gatggccgca ttgtggccct cggtgtgcat gccgaatctg tgcccccccc cgccgatcgt 6600
gtgattgatg cccgcggtaa agtggtgctc cccggtttta ttaatgccca tacccacgtg 6660
aatcaaattc tcctccgtgg tggtccctct cacggtcgcc aactctatga ttggctcttt 6720
aatgtgctct accccggcca aaaagccatg cgccccgaag atgtggccgt ggccgtgcgg 6780
ctctattgtg ccgaagccgt gcgcagtggt attaccacca ttaatgataa tgccgattcc 6840
gccatttacc ccggcaatat tgaagccgcg atggccgtgt atggcgaagt gggtgtgcgg 6900
gtggtgtacg cccgcatgtt tttcgatcgc atggatggcc ggattcaagg ttatgtggat 6960
gccctcaaag cccggagccc ccaagtggaa ctctgttcta ttatggaaga aaccgccgtg 7020
gccaaagatc ggattaccgc cctcagcgat caatatcacg gcaccgccgg tggccgcatt 7080
agtgtgtggc ccgcccccgc cattaccccc gccgtgaccg tggagggtat gcgttgggcc 7140
caagcctttg cccgcgatcg ggccgtgatg tggaccctcc acatggccga aagcgatcat 7200
gatgaacggc tccactggat gtctcccgcc gaatatatgg aatgttacgg cctcctcgat 7260
gaacgcctcc aagtggccca ctgtgtgtat tttgatcgca aagatgtgcg gctcctccat 7320
cgccacaatg tgaaagtggc cagtcaagtg gtgtccaatg cctacctcgg cagtggtgtg 7380
gcccccgtgc ccgaaatggt ggaacgtggc atggccgtgg gcattggcac cgatgatggt 7440
aattgtaatg attccgtgaa tatgattggc gatatgaaat ttatggccca tattcaccgg 7500
gccgtgcatc gcgatgtcga tgtgctcacc cccgaaaaaa ttctcgaaat ggccaccatt 7560
gatggcgccc gcagtctcgg tatggatcat gaaattggct ccattgaaac cggtaaacgg 7620
gccgatctca ttctcctcga tctccgccac ccccaaacca ccccccacca tcacctcgcc 7680
gccaccattg tgtttcaagc ctacggtaat gaagtggata ccgtgctcat tgatggcaat 7740
gtggtgatgg aaaatcgccg gctcagtttt ctcccccccg aacgggaact cgcctttctc 7800
gaagaagccc aaagtcgcgc caccgccatt ctccaacgcg ccaatatggt ggccaatccc 7860
gcctggcgca gcctctaaaa gggtgggcgc gccgacccag ctttcttgta caaactcggc 7920
cctgcaggag aaggccatcc tgacggatgg cctttttgaa gcttgaaa 7968
<210> 89
<211> 1011
<212> DNA
<213> 人工序列
<220>
<223> ptxD原始序列
<400> 89
atgctgccga aactcgttat aactcaccga gtacacgatg agatcctgca actgctggcg 60
ccacattgcg agctgatgac caaccagacc gacagcacgc tgacgcgcga ggaaattctg 120
cgccgctgtc gcgatgctca ggcgatgatg gcgttcatgc ccgatcgggt cgatgcagac 180
tttcttcaag cctgccctga gctgcgtgta gtcggctgcg cgctcaaggg cttcgacaat 240
ttcgatgtgg acgcctgtac tgcccgcggg gtctggctga ccttcgtgcc tgatctgttg 300
acggtcccga ctgccgagct ggcgatcgga ctggcggtgg ggctggggcg gcatctgcgg 360
gcagcagatg cgttcgtccg ctctggcgag ttccagggct ggcaaccaca gttctacggc 420
acggggctgg ataacgctac ggtcggcatc cttggcatgg gcgccatcgg actggccatg 480
gctgatcgct tgcagggatg gggcgcgacc ctgcagtacc acgaggcgaa ggctctggat 540
acacaaaccg agcaacggct cggcctgcgc caggtggcgt gcagcgaact cttcgccagc 600
tcggacttca tcctgctggc gcttcccttg aatgccgata cccagcatct ggtcaacgcc 660
gagctgcttg ccctcgtacg gccgggcgct ctgcttgtaa acccctgtcg tggttcggta 720
gtggatgaag ccgccgtgct cgcggcgctt gagcgaggcc agctcggcgg gtatgcggcg 780
gatgtattcg aaatggaaga ctgggctcgc gcggaccggc cgcggctgat cgatcctgcg 840
ctgctcgcgc atccgaatac gctgttcact ccgcacatag ggtcggcagt gcgcgcggtg 900
cgcctggaga ttgaacgttg tgcagcgcag aacatcatcc aggtattggc aggtgcgcgc 960
ccaatcaacg ctgcgaaccg tctgcccaag gccgagcctg ccgcatgttg a 1011
<210> 90
<211> 1011
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的ptxD
<400> 90
atgctgccca aactggtcat cacccaccgc gtccatgatg aaattctgca gctgctggcc 60
ccgcactgtg agctgatgac caaccaaacc gatagcaccc tgacgcgcga agagatcctg 120
cgccgctgcc gcgatgctca ggccatgatg gcttttatgc ccgatcgcgt ggatgcggat 180
ttcctgcaag cttgtcccga actgcgcgtg gtgggttgtg ccctgaaggg ttttgataat 240
tttgatgtgg atgcctgcac ggcccgcggc gtgtggctga cctttgtccc cgatctgctg 300
accgtgccga ccgctgaact ggccattggc ctggcggtgg gtctgggtcg ccatctgcgc 360
gcggccgatg cgtttgtgcg cagcggcgag ttccagggtt ggcagcccca attctatggc 420
accggcctgg ataatgccac ggtgggcatc ctgggtatgg gtgctattgg cctggccatg 480
gctgatcgcc tgcagggttg gggcgccacc ctgcaatatc acgaagccaa agcgctggat 540
acgcaaacgg aacagcgcct gggtctgcgc caggtggctt gcagcgaact gtttgccagc 600
agcgatttca tcctgctggc cctgccgctg aacgcggata cccaacatct ggtcaatgct 660
gaactgctgg ctctggtgcg ccccggtgct ctgctggtca atccgtgtcg cggcagcgtg 720
gtggatgaag cggctgtgct ggccgctctg gagcgcggtc aactgggcgg ctacgccgcg 780
gatgtctttg aaatggagga ttgggctcgc gcggatcgcc cacgcctgat cgatcccgcc 840
ctgctggctc acccaaacac cctgttcacc ccgcatattg gcagcgccgt gcgcgcggtc 900
cgcctggaaa ttgagcgctg cgctgcccag aatatcattc aagtgctggc cggtgctcgc 960
cccattaacg ccgctaatcg cctgcccaag gccgaaccgg ccgcgtgcta g 1011
<210> 91
<211> 1011
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的ptxD NADP+
<400> 91
atgctgccca aactggtcat cacccaccgc gtccatgatg aaattctgca gctgctggcc 60
ccgcactgtg agctgatgac caaccaaacc gatagcaccc tgacgcgcga agagatcctg 120
cgccgctgcc gcgatgctca ggccatgatg gcttttatgc ccgatcgcgt ggatgcggat 180
ttcctgcaag cttgtcccga actgcgcgtg gtgggttgtg ccctgaaggg ttttgataat 240
tttgatgtgg atgcctgcac ggcccgcggc gtgtggctga cctttgtccc cgatctgctg 300
accgtgccga ccgctgaact ggccattggc ctggcggtgg gtctgggtcg ccatctgcgc 360
gcggccgatg cgtttgtgcg cagcggcgag ttccagggtt ggcagcccca attctatggc 420
accggcctgg ataatgccac ggtgggcatc ctgggtatgg gtgctattgg cctggccatg 480
gctgatcgcc tgcagggttg gggcgccacc ctgcaatatc acgctcgtaa agcgctggat 540
acgcaaacgg aacagcgcct gggtctgcgc caggtggctt gcagcgaact gtttgccagc 600
agcgatttca tcctgctggc cctgccgctg aacgcggata cccaacatct ggtcaatgct 660
gaactgctgg ctctggtgcg ccccggtgct ctgctggtca atccgtgtcg cggcagcgtg 720
gtggatgaag cggctgtgct ggccgctctg gagcgcggtc aactgggcgg ctacgccgcg 780
gatgtctttg aaatggagga ttgggctcgc gcggatcgcc cacgcctgat cgatcccgcc 840
ctgctggctc acccaaacac cctgttcacc ccgcatattg gcagcgccgt gcgcgcggtc 900
cgcctggaaa ttgagcgctg cgctgcccag aatatcattc aagtgctggc cggtgctcgc 960
cccattaacg ccgctaatcg cctgcccaag gccgaaccgg ccgcgtgcta g 1011
<210> 92
<211> 61
<212> DNA
<213> 人工序列
<220>
<223> psbA启动子
<400> 92
gatctcaatg aatattggtt gacacgggcg tataagacat gttatactgt tgaataacaa 60
g 61
<210> 93
<211> 1236
<212> DNA
<213> 人工序列
<220>
<223> ptxD操纵子
<220>
<221> 启动子
<222> (1)..(61)
<223> psbA启动子
<220>
<221> 基因
<222> (84)..(1091)
<223> ptxD
<220>
<221> 终止子
<222> (1107)..(1194)
<400> 93
gatctcaatg aatattggtt gacacgggcg tataagacat gttatactgt tgaataacaa 60
gactagatag tggaggtact agaatgctgc ccaaactggt catcacccac cgcgtccatg 120
atgaaattct gcagctgctg gccccgcact gtgagctgat gaccaaccaa accgatagca 180
ccctgacgcg cgaagagatc ctgcgccgct gccgcgatgc tcaggccatg atggctttta 240
tgcccgatcg cgtggatgcg gatttcctgc aagcttgtcc cgaactgcgc gtggtgggtt 300
gtgccctgaa gggttttgat aattttgatg tggatgcctg cacggcccgc ggcgtgtggc 360
tgacctttgt ccccgatctg ctgaccgtgc cgaccgctga actggccatt ggcctggcgg 420
tgggtctggg tcgccatctg cgcgcggccg atgcgtttgt gcgcagcggc gagttccagg 480
gttggcagcc ccaattctat ggcaccggcc tggataatgc cacggtgggc atcctgggta 540
tgggtgctat tggcctggcc atggctgatc gcctgcaggg ttggggcgcc accctgcaat 600
atcacgaagc caaagcgctg gatacgcaaa cggaacagcg cctgggtctg cgccaggtgg 660
cttgcagcga actgtttgcc agcagcgatt tcatcctgct ggccctgccg ctgaacgcgg 720
atacccaaca tctggtcaat gctgaactgc tggctctggt gcgccccggt gctctgctgg 780
tcaatccgtg tcgcggcagc gtggtggatg aagcggctgt gctggccgct ctggagcgcg 840
gtcaactggg cggctacgcc gcggatgtct ttgaaatgga ggattgggct cgcgcggatc 900
gcccacgcct gatcgatccc gccctgctgg ctcacccaaa caccctgttc accccgcata 960
ttggcagcgc cgtgcgcgcg gtccgcctgg aaattgagcg ctgcgctgcc cagaatatca 1020
ttcaagtgct ggccggtgct cgccccatta acgccgctaa tcgcctgccc aaggccgaac 1080
cggccgcgtg ctagttaaac ctcagcggtt tagtgaccga ctaacacttt tctcataaaa 1140
tcccagggag gtttcggcct cccttttttt cacttgctaa gctctctttc gtttgattgt 1200
ctgacttggt tcacgtagaa aaaccagaag ggacgc 1236
<210> 94
<211> 1443
<212> DNA
<213> 人工序列
<220>
<223> pSJ051
<220>
<221> RBS
<222> (5)..(10)
<220>
<221> 基因
<222> (19)..(1443)
<223> triA基因序列
<400> 94
agttaggaga ttcagaccat gcaaacgctc agcatccagc acggtaccct cgtcacgatg 60
gatcagtacc gcagagtcct tggggatagc tgggttcacg tgcaggatgg acggatcgtc 120
gcgctcggag tgcacgccga gtcggtgcct ccgccagcgg atcgggtgat cgatgcacgc 180
ggcaaggtcg tgttacccgg tttcatcaat gcccacaccc atgtgaacca gatcctcctg 240
cgcggagggc cctcgcacgg gcgtcaactc tatgactggc tgttcaacgt tttgtatccg 300
ggacaaaagg cgatgagacc ggaggacgta gcggtggcgg tgaggttgta ttgtgcggaa 360
gctgtgcgca gcgggattac gacgatcaac gacaacgccg attcggccat ctacccaggc 420
aacatcgagg ccgcgatggc ggtctatggt gaggtgggtg tgagggtcgt ctacgcccgc 480
atgttctttg atcggatgga cgggcgcatt caagggtatg tggacgcctt gaaggctcgc 540
tctccccaag tcgaactgtg ctcgatcatg gaggaaacgg ctgtggccaa agatcggatc 600
acagccctgt cagatcagta tcatggcacg gcaggaggtc gtatatcagt ttggcccgct 660
cctgccatta ccccggcggt gacagttgaa ggaatgcgat gggcacaagc cttcgcccgt 720
gatcgggcgg taatgtggac gcttcacatg gcggagagcg atcatgatga gcggcttcat 780
tggatgagtc ccgccgagta catggagtgt tacggactct tggatgagcg tctgcaggtc 840
gcgcattgcg tgtactttga ccggaaggat gttcggctgc tgcaccgcca caatgtgaag 900
gtcgcgtcgc aggttgtgag caatgcctac ctcggctcag gggtggcccc cgtgccagag 960
atggtggagc gcggcatggc cgtgggcatt ggaacagatg acgggaattg taatgactcc 1020
gtaaacatga tcggagacat gaagtttatg gcccatattc accgcgcggt gcatcgggat 1080
gcggacgtgc tgaccccaga gaagattctt gaaatggcga cgatcgatgg ggcgcgttcg 1140
ttgggaatgg accacgagat tggttccatc gaaaccggca agcgcgcgga ccttatcctg 1200
cttgacctgc gtcaccctca gacgactcct caccatcatt tggcggccac gatcgtgttt 1260
caggcttacg gcaatgaggt ggacactgtc ctgattgacg gaaacgttgt gatggagaac 1320
cgccgcttga gctttcttcc ccctgaacgt gagttggcgt tccttgagga agcgcagagc 1380
cgcgccacag ctattttgca gcgggcgaac atggtggcta acccagcttg gcgcagcctc 1440
tag 1443
<210> 95
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> RF_ptxD_F
<400> 95
ggcgccaccc tgcaatatca cgctcgtaaa gcgct 35
<210> 96
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> RF_ptxD_R
<400> 96
ccgtttgcgt atccagcgct ttacgagcgt gata 34

Claims (29)

1.一种分离的基因工程蓝细菌,其中,所述蓝细菌已被至少一个多核苷酸分子转化;所述至少一个多核苷酸分子包括与至少一个启动子可操作地连接的异源三聚氰胺利用途径基因atzD、trzE、DUR1,2、trzC、guaD和triA,其中;
i)所述triA基因包括编码氨基酸取代的一个或多个突变,其中,所述氨基酸取代位于选自包括以下的组的位置:Leu88Phe、His254Tyr、Glu317Lys、Ala355Val、Trp471Stop以及254His和Val278Met的组合;
和/或
ii)所述triA基因具有包括AGGAGA至AGAAGA突变的核糖体结合位点(RBS),
其中,所述基因工程蓝细菌不具有异源抗生素抗性基因。
2.根据权利要求1所述的分离的基因工程蓝细菌,其中,所述triA基因编码选自包括以下的组的氨基酸序列:SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ IDNO:64、SEQ ID NO:66和SEQ ID NO:68。
3.根据权利要求2所述的分离的基因工程蓝细菌,其中,所述triA基因包括选自包括以下的组的多核苷酸序列:SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQID NO:65、SEQ ID NO:67、SEQ ID NO:69和SEQ ID NO:70。
4.根据权利要求1至3中任一项所述的分离的基因工程蓝细菌,其中,所述异源基因trzE包括SEQ ID NO:71或SEQ ID NO:72中所示的多核苷酸序列;
trzC包括SEQ ID NO:73或SEQ ID NO:74中所示的多核苷酸序列;
DUR1,2包括SEQ ID NO:75或SEQ ID NO:76中所示的多核苷酸序列;
atzD包括SEQ ID NO:77或SEQ ID NO:78中所示的多核苷酸序列;
guaD包括SEQ ID NO:79、SEQ ID NO:80或SEQ ID NO:81(Arg352Ser)中所示的多核苷酸序列。
5.根据权利要求1至4中任一项所述的分离的基因工程蓝细菌,其中,所述三聚氰胺利用途径基因的每一种具有对于所述三聚氰胺利用途径基因的每一种的核糖体结合位点(RBS)。
6.根据权利要求1至5中任一项所述的分离的基因工程蓝细菌,其中,所述至少一个启动子是组成型启动子。
7.根据权利要求1至6中任一项所述的分离的基因工程蓝细菌,其中,所述异源三聚氰胺利用途径基因从单个启动子表达,作为基因操纵子的一部分。
8.根据权利要求7所述的分离的基因工程蓝细菌,其中,所述基因操纵子多核苷酸序列选自包括以下的组:SEQ ID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ IDNO:87和SEQ ID NO:88。
9.根据权利要求1至8中任一项所述的分离的基因工程蓝细菌,其中,所述至少一个多核苷酸分子进一步包括:包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因的多核苷酸。
10.根据权利要求9所述的分离的基因工程蓝细菌,其中,所述ptxD基因包括SEQ IDNO:89、SEQ ID NO:90或SEQ ID NO:91中所示的多核苷酸序列。
11.根据权利要求9或10所述的分离的基因工程蓝细菌,其中,所述异源亚磷酸盐脱氢酶(ptxD)基因从单个启动子表达,作为基因操纵子的一部分,其中,所述操纵子多核苷酸序列在SEQ ID NO:93中示出。
12.一种分离的基因工程蓝细菌,其中,所述蓝细菌已被至少一个多核苷酸分子转化,所述至少一个多核苷酸分子包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因,其中,所述ptxD基因包括SEQ ID NO:90或SEQ ID NO:91中所示的多核苷酸序列,
其中,所述基因工程蓝细菌不具有异源抗生素抗性基因。
13.根据权利要求1至12中任一项所述的分离的基因工程蓝细菌,进一步包括:包括编码RNA和/或蛋白质产物的可表达多核苷酸的外源多核苷酸。
14.根据权利要求1至13中任一项所述的分离的基因工程蓝细菌,其中,所述蓝细菌是聚球藻。
15.一种重组载体,包括与至少一个启动子可操作地连接的三聚氰胺途径基因triA、DUR1,2、atzD、trzC、trzE和guaD,其中
i)triA基因包括编码氨基酸取代的一个或多个突变,其中,该氨基酸取代位于选自包括以下的组的位置:Leu88Phe、His254Tyr、Glu317Lys、Ala355Val、Trp471Stop以及Thr218Asn和Val278Met的组合;
和/或
ii)所述triA基因具有包括AGGAGA至AGAAGA突变的核糖体结合位点(RBS),
其中,所述载体缺失抗生素抗性基因。
16.根据权利要求15所述的重组载体,其中,所述triA基因编码选自包括以下的组的氨基酸序列:SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQID NO:66和SEQ ID NO:68。
17.根据权利要求15或16所述的重组载体,其中,所述triA基因包括选自包括以下的组的多核苷酸序列:SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69和SEQ ID NO:70。
18.根据权利要求15至17中任一项所述的重组载体,其中,所述异源基因trzE包括SEQID NO:71或SEQ ID NO:72中所示的多核苷酸序列;
trzC包括SEQ ID NO:73或SEQ ID NO:74中所示的多核苷酸序列;
DUR1,2包括SEQ ID NO:75或SEQ ID NO:76中所示的多核苷酸序列;
atzD包括SEQ ID NO:77或SEQ ID NO:78中所示的多核苷酸序列;
guaD包括SEQ ID NO:79、SEQ ID NO:80或SEQ ID NO:81中所示的多核苷酸序列。
19.根据权利要求15至18中任一项所述的重组载体,其中,所述三聚氰胺利用途径基因的每一种具有核糖体结合位点(RBS)。
20.根据权利要求15至19中任一项所述的重组载体,其中,所述至少一个启动子是组成型启动子。
21.根据权利要求15至21中任一项所述的重组载体,其中,所述异源三聚氰胺利用途径基因从单个启动子表达,作为基因操纵子的一部分。
22.根据权利要求21所述的重组载体,其中,所述基因操纵子多核苷酸序列选自包括以下的组:SEQ ID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87和SEQID NO:88。
23.根据权利要求15至22中任一项所述的重组载体,其中,所述至少一个多核苷酸分子进一步包括:包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因的多核苷酸。
24.根据权利要求23所述的重组载体,其中,所述ptxD基因包括SEQ ID NO:89、SEQ IDNO:90或SEQ ID NO:91中所示的多核苷酸序列。
25.根据权利要求15至24中任一项所述的重组载体,进一步包括:包括编码RNA和/或蛋白质产物的可表达多核苷酸的外源多核苷酸。
26.一种在基因工程蓝细菌细胞中表达产物的方法,包括步骤:
a)在无抗生素并且三聚氰胺为氮源的培养基中,培养多个权利要求1至8中任一项所述的基因工程蓝细菌细胞,其中,培养有利于代谢三聚氰胺的蓝细菌细胞的生长;以及其中,所述工程蓝细菌细胞进一步包括:包括编码RNA和/或蛋白质产物的可表达多核苷酸的至少一种外源多核苷酸,
b)在用于表达所述产物的条件下培养所述基因工程蓝细菌细胞。
27.一种在基因工程蓝细菌细胞中表达产物的方法,包括步骤:
a)在无抗生素、三聚氰胺为氮源以及亚磷酸盐为磷源的培养基中,培养多个权利要求9至11中任一项所述的基因工程蓝细菌细胞,其中,培养有利于代谢三聚氰胺和亚磷酸盐的蓝细菌细胞的生长;以及其中,所述工程蓝细菌细胞进一步包括:包括编码RNA和/或蛋白质产物的可表达多核苷酸的至少一种外源多核苷酸,
b)在用于表达所述产物的条件下培养所述基因工程蓝细菌细胞。
28.根据权利要求26或27所述的方法,其中,所述培养基包括至少2mM浓度的三聚氰胺。
29.根据权利要求26至28中任一项所述的方法,进一步包括分离在所述基因工程蓝细菌细胞中表达的所述产物。
CN201980080144.3A 2018-12-04 2019-12-02 使用无抗生素选择在未灭菌条件下生长的基因工程蓝细菌 Pending CN113166718A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SG10201810863R 2018-12-04
SG10201810863R 2018-12-04
PCT/SG2019/050593 WO2020117128A1 (en) 2018-12-04 2019-12-02 Genetically engineered cyanobacteria for growth in unsterilized conditions using antibiotic-free selection

Publications (1)

Publication Number Publication Date
CN113166718A true CN113166718A (zh) 2021-07-23

Family

ID=70975616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980080144.3A Pending CN113166718A (zh) 2018-12-04 2019-12-02 使用无抗生素选择在未灭菌条件下生长的基因工程蓝细菌

Country Status (4)

Country Link
US (1) US20220033828A1 (zh)
EP (1) EP3891268A4 (zh)
CN (1) CN113166718A (zh)
WO (1) WO2020117128A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114107140A (zh) * 2022-01-27 2022-03-01 中国科学院烟台海岸带研究所 一种原位无菌富集培养聚球藻的方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220389474A1 (en) * 2019-10-28 2022-12-08 Danisco Us Inc. Microbial host cells for the production of heterologous cyanuric acid hydrolases and biuret hydrolases

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150125934A1 (en) * 2012-08-09 2015-05-07 Hiroshima University Method for selectively culturing microorganism using phosphite dehydrogenase gene as marker
CN105264061A (zh) * 2013-01-04 2016-01-20 诺沃吉公司 经工程改造以利用非常规氮源的微生物
US20170096691A1 (en) * 2014-04-08 2017-04-06 Novogy, Inc. Selective advantage in fermentation
CN107058115A (zh) * 2008-11-19 2017-08-18 国家政治研究所高级研究中心(高级研究中心) 能够代谢亚磷酸盐作为磷源的转基因植物和真菌
EP3760706A1 (en) * 2018-03-02 2021-01-06 Hiroshima University Transformant, and method using said transformant to detect presence or absence of reduced phosphorous compound

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10138489B2 (en) * 2016-10-20 2018-11-27 Algenol Biotech LLC Cyanobacterial strains capable of utilizing phosphite

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107058115A (zh) * 2008-11-19 2017-08-18 国家政治研究所高级研究中心(高级研究中心) 能够代谢亚磷酸盐作为磷源的转基因植物和真菌
US20150125934A1 (en) * 2012-08-09 2015-05-07 Hiroshima University Method for selectively culturing microorganism using phosphite dehydrogenase gene as marker
CN105264061A (zh) * 2013-01-04 2016-01-20 诺沃吉公司 经工程改造以利用非常规氮源的微生物
US20170096691A1 (en) * 2014-04-08 2017-04-06 Novogy, Inc. Selective advantage in fermentation
CN107075498A (zh) * 2014-04-08 2017-08-18 诺沃吉公司 发酵中的选择优势
EP3760706A1 (en) * 2018-03-02 2021-01-06 Hiroshima University Transformant, and method using said transformant to detect presence or absence of reduced phosphorous compound

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ANDREW L.等: "Synthetic Biology Toolbox for Controlling Gene Expression in the Cyanobacterium Synechococcus sp. strain PCC 7002", ACS SYNTH. BIOL., 15 May 2015 (2015-05-15), pages 595 - 603, XP055518857, DOI: 10.1021/sb500260k *
刘涛编著: "《藻类系统学》", 31 August 2017, 海洋出版社, pages: 229 - 233 *
邓杰;陈雪初;黄莹莹;张军毅;: "蓝藻群体颗粒驱动元素地球化学循环研究进展", 微生物学报, no. 09, 10 July 2020 (2020-07-10), pages 90 - 95 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114107140A (zh) * 2022-01-27 2022-03-01 中国科学院烟台海岸带研究所 一种原位无菌富集培养聚球藻的方法

Also Published As

Publication number Publication date
WO2020117128A1 (en) 2020-06-11
EP3891268A4 (en) 2022-08-03
EP3891268A1 (en) 2021-10-13
US20220033828A1 (en) 2022-02-03

Similar Documents

Publication Publication Date Title
KR102229968B1 (ko) 메틸영양성 효모를 유전적으로 조작하는 발현 구축물 및 방법
Selão et al. Growth and selection of the cyanobacterium Synechococcus sp. PCC 7002 using alternative nitrogen and phosphorus sources
US9321697B2 (en) Recombinant nitrogen fixing microorganism and uses thereof
Cohen et al. The cyanobacteria—ecology, physiology and molecular genetics
CN102282262B (zh) 用于转化植物的营养缺陷型农杆菌和其方法
CN104903438A (zh) 用于化合物生产的蓝藻
KR100312456B1 (ko) 슈도모나스 플루오레슨스 유래의 외래단백질 분비촉진유전자
US11673923B2 (en) Minimized cyanobacterial microcompartment for carbon dioxide fixation
CN113166718A (zh) 使用无抗生素选择在未灭菌条件下生长的基因工程蓝细菌
US20080148431A1 (en) Novel targets for herbicides and transgenic plants resistant to said herbicides
Cannio et al. Thermoadaptation of a mesophilic hygromycin B phosphotransferase by directed evolution in hyperthermophilic Archaea: selection of a stable genetic marker for DNA transfer into Sulfolobus solfataricus
KR20200134333A (ko) 발효에 의한 히스타민 생산을 위해 조작된 생합성 경로
KR20210015881A (ko) 메타크릴레이트 제조 방법
EP3508575B1 (en) Transformant, method for producing transformant, and method for detecting presence or absence of reduced phosphorus compound using transformant
US20170088850A1 (en) Constructs and systems and methods for engineering a co2 fixing photorespiratory by-pass pathway
US9902963B2 (en) Modified microorganism having enhanced biomass synthesis capacity and a method thereof
US10280428B2 (en) Molecular biology tools for algal engineering
WO2014202838A1 (en) Methods for producing styrene and genetically modified micro-organisms related thereto
Zhang et al. Extended toolboxes enable efficient biosynthesis of valuable chemicals directly from CO2 in fast-growing Synechococcus sp. PCC 11901
dos Santos Improvement of Synechocystis sp. PCC 6803 salt tolerance envisaging large-scale seawater cultivation
CN107922463A (zh) 具有提高的光合能力的微生物
KR20230129762A (ko) 바이오라세인 생산능이 증대된 형질전환 메탄올자화균 및 이를 이용한 바이오라세인 생산방법
Huang et al. Cloning and identification of methionine synthase gene from Pichia pastoris
WO2011034031A1 (ja) イソプロピルアルコール生産細菌及びイソプロピルアルコール生産方法
Liu et al. The enoyl-ACP reductase gene, fabI1, of Sinorhizobium meliloti is involved in salt tolerance, swarming mobility and nodulation efficiency

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination