CN108138162A - 重组细胞,重组细胞的制造方法以及有机化合物的生产方法 - Google Patents

重组细胞,重组细胞的制造方法以及有机化合物的生产方法 Download PDF

Info

Publication number
CN108138162A
CN108138162A CN201580084036.5A CN201580084036A CN108138162A CN 108138162 A CN108138162 A CN 108138162A CN 201580084036 A CN201580084036 A CN 201580084036A CN 108138162 A CN108138162 A CN 108138162A
Authority
CN
China
Prior art keywords
recombinant cell
leu
glu
ser
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580084036.5A
Other languages
English (en)
Inventor
古谷昌弘
西山典秀
川端史
川端一史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sekisui Chemical Co Ltd
Original Assignee
Sekisui Chemical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sekisui Chemical Co Ltd filed Critical Sekisui Chemical Co Ltd
Publication of CN108138162A publication Critical patent/CN108138162A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0008Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/002Preparation of hydrocarbons or halogenated hydrocarbons cyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/007Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/02Preparation of hydrocarbons or halogenated hydrocarbons acyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01001Alcohol dehydrogenase (1.1.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01034Hydroxymethylglutaryl-CoA reductase (NADPH) (1.1.1.34)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01088Hydroxymethylglutaryl-CoA reductase (1.1.1.88)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y102/00Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
    • C12Y102/01Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
    • C12Y102/0101Acetaldehyde dehydrogenase (acetylating) (1.2.1.10)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
    • C12Y402/03027Isoprene synthase (4.2.3.27)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
    • C12Y402/03051Beta-phellandrene synthase (neryl-diphosphate-cyclizing) (4.2.3.51)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/30Fuel from waste, e.g. synthetic alcohol or diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

一种重组细胞,其具有由甲基四氢叶酸、一氧化碳及CoA合成乙酰CoA的功能,所述重组细胞具有表达外源性NAD(P)H消耗途径的基因,且该基因在所述重组细胞内表达,所述重组细胞具有的内源性NAD(P)H消耗途径中的至少一者的表达被下调,且所述内源性NAD(P)H消耗途径与所述外源性NAD(P)H消耗途径不同,所述重组细胞能够通过所述外源性NAD(P)H消耗途径,由选自一氧化碳及二氧化碳中的至少一者生产碳原子数为4以上的有机化合物。

Description

重组细胞,重组细胞的制造方法以及有机化合物的生产方法
技术领域
本发明涉及可以由一氧化碳等特定的C1化合物生产碳原子数为4以上的有机化合物的重组细胞及其制造方法,以及使用该重组细胞生产碳原子数为4以上的有机化合物的方法。
背景技术
合成气(Synthesis gas,Syngas)可以在高温高压下,通过金属催化剂的作用从废物、天然气及煤中有效获得,它是一种以一氧化碳、二氧化碳及氢为主要成分的混合气体。以合成气为起点并利用金属催化剂的C1化学领域中,开发了廉价且大量生产甲醇、甲酸、甲醛等液态化学品的工序。
而且,一氧化碳及二氧化碳包含在来自废物的合成气及工厂废气或来自天然气的合成气中,几乎可以永久使用。但是,目前,以它们为碳源,利用微生物生产化学品的例子却非常少。目前,正在开发的仅有乙醇、2,3-丁二醇等的生产。特别是有关通过重组体进行的利用合成气同化性物质的报告比较少。专利文献1中公开了利用大肠杆菌的重组体生产异丙醇的技术。在该技术中,向大肠杆菌导入多个CO代谢酶基因而赋予合成气同化能力,从而由合成气生产异丙醇。
作为梭菌(Clostridium)属细菌及穆尔氏菌(Moorella)属细菌,已知是可以对合成气中包含的一氧化碳及二氧化碳进行同化的合成气同化细菌。已知该合成气同化细菌具有一氧化碳脱氢酶(例如,EC 1.2.99.2/1.2.7.4)(一氧化碳脱氢酶和CO dehydrogenase,CODH),其中,一氧化碳脱氢酶具有由一氧化碳和水生成二氧化碳和质子的作用,并且具有通过作为其逆反应的由二氧化碳和质子生成一氧化碳和水的作用。一氧化碳脱氢酶为在乙酰CoA途径(图1)中起作用的酶中的一种。
由乙酰CoA途径合成的乙酰CoA代谢为乙酸、乙醛、乙醇等代谢。尤其是,增殖稳定期的过剩乙酰CoA大部分转换为乙醇,此时,还原型烟酰胺腺嘌呤二核苷酸(NADH)被消耗。在由乙酰CoA生成乙醛、由乙醛生成乙醇的过程中,均消耗NADH,生成氧化型烟酰胺腺嘌呤二核苷酸(NAD)。另外,已知在烟酰胺腺嘌呤二核苷酸的腺苷的核苷酸的2’位附属有磷酸基的烟酰胺腺嘌呤二核苷酸磷酸也同样具有还原型(NADPH)和氧化型(NADP),并作为脱氢酶的辅酶起作用。细胞内的NAD(P)H/NAD(P)平衡影响生殖。在非专利文献1中,丙酮丁醇梭菌(Clostridium acetbutylicum)显示出:在甘油代谢中,NADPH过剩,而不能生殖;另外,通过导入消耗NADPH的1,3-丙二醇NADP依赖性脱氢酶(1,3-propanediol NADP-dependentdehydrogenase)(YqhD)合成酶的基因,可以进行生殖,并且,合成1,3-丙二醇。
有些报告中尝试基于重组体由一氧化碳等特定C1化合物生产C4以上的有机化合物。专利文献2,3中示出了通过导入有异戊二烯合成基因,并导入有作为NAD(P)H消耗途径的甲羟戊酸途径(也称作MVA途径)的基因的梭菌(Clostridium)属细菌来尝试合成异戊二烯的例子。但是,异戊二烯的生产量均非常少。
专利文献4中公开了可以由一氧化碳等特定C1化合物生产异戊二烯的重组细胞。并且,公开了使用梭菌(Clostridium)属细菌的重组体由合成气生产异戊二烯的例子。
甲羟戊酸途径是合成异戊烯基二磷酸(IPP)及二甲基烯丙基二磷酸(DMAPP)的途径,是形成萜烯、类固醇等工业用途的化合物的合成起点。
萜烯为以异戊二烯为结构单元的一组烃。萜烯包含异戊二烯(碳原子数5)、单萜烯(碳原子数10)、倍半萜烯(碳原子数15)、二萜烯(碳原子数20)、三萜烯(碳原子数30)。异戊二烯是合成聚异戊二烯的单体原料,特别是在轮胎行业中它是非常重要的素材。作为环单萜烯,β-蒎烯(β-Pinene)、α-蒎烯(α-Pinene)、柠檬烯、α-水芹烯(α-Phellandrene)等作为粘接剂及透明树脂等的单体原料进行了研究(非专利文献3)。法呢烯是倍半萜烯的一种,作为轮胎原材料备受瞩目(专利文献5)。作为三萜烯,已知有作为甘草的萃取物而熟知的甘草酸等。
现有技术文献
专利文献
专利文献1:国际公开第2009/094485号
专利文献2:国际公开第2013/181647号
专利文献3:国际公开第2013/180584号
专利文献4:国际公开第2014/065271号
专利文献5:国际公开第2013/047348号
非专利文献
非专利文献1:Tang X,Tan Y,Zhu H,Zhao K,Shen W.,Appl EnvironMicrobiol.2009Mar;75(6):1628-34.doi:10.1128/AEM.02376-08.Epub 2009Jan 9.
非专利文献2:Kiriukhin M,Tyurin M.,Bioprocess Biosyst Eng.2014 Feb;37(2):245-60.doi:10.1007/s00449-013-0991-6.Epub 2013Jun 18
非专利文献3:Schilmiller,A.L.,et al.,Proc Natl Acad Sci U S A.,2009,
发明内容
发明要解决的技术问题
如上所述,使用重组体由合成气生产异戊二烯等有机化合物的技术的开发不断发展,需要进一步提高生产性的技术。因此,本发明的目的在于提供一种使用重组体由合成气等C1碳源有效地获得C4以上的有机化合物的一系列技术。
用于解决技术问题的技术方案
用于解决上述技术问题的本发明的一个方式为一种重组细胞,其特征在于,其具有由甲基四氢叶酸、一氧化碳及CoA合成乙酰CoA的功能,其具有表达外源性NAD(P)H消耗途径的基因,且该基因在所述重组细胞内表达,所述重组细胞具有的内源性NAD(P)H消耗途径中的至少一者的表达被下调,且所述内源性NAD(P)H消耗途径与所述外源性NAD(P)H消耗途径不同,所述重组细胞能够通过所述外源性NAD(P)H消耗途径,由选自一氧化碳及二氧化碳中的至少一种来生产碳原子数为4以上的有机化合物。
本方式涉及可以生产碳原子数为4以上的有机化合物的重组细胞。本方式的重组细胞具有“由甲基四氢叶酸、一氧化碳及CoA合成乙酰CoA的功能”。而且,本方式的重组细胞具有“表达外源性NAD(P)H消耗途径的基因”,且该基因在重组细胞内表达。即,在本方式的重组细胞中,NAD(P)H消耗途径被重新赋予或增强。
而且,在本方式的重组细胞中,内源性NAD(P)H消耗途径中的至少一者的表达被下调,且该内源性NAD(P)H消耗途径与所述外源性NAD(P)H消耗途径不同。
并且,本方式的重组细胞可以通过所述外源性NAD(P)H消耗途径,由选自一氧化碳及二氧化碳中的至少一者生产碳原子数为4以上的有机化合物。
作为本方式的重组细胞,在NAD(P)H消耗途径中,与所述有机化合物的生产无关的内源性NAD(P)H消耗途径的表达被下调,因此,NAD(P)H优先供应供给于与所述有机化合物的生产相关的所述外源性NAD(P)H途径。因此,有效生产所述有机化合物。例如,可以通过培养本方式的重组细胞来大量生产碳原子数为4以上的有机化合物。
在本方式中,作为具有“由甲基四氢叶酸、一氧化碳及CoA合成乙酰CoA的功能”的细胞,示例有具有图1所示的乙酰CoA途径(Wood-Ljungdahl pathway)及甲醇途径(Methanol pathway)的厌氧微生物。
NAD(P)H是指NADH或NADPH。同样,NAD(P)是指NAD或NADP。
NAD(P)H消耗途径是指随着由NAD(P)H向NAD(P)的转换而消耗NAD(P)H的途径。外源性NAD(P)H消耗途径是指从外部向宿主细胞导入的NAD(P)H消耗途径。内源性NAD(P)H消耗途径是指宿主细胞原本具有的NAD(P)H消耗途径。
基因表达被下调是指,减少基因表达量的调控及基因功能缺失的调控。作为基因表达被下调的例子,可以举出:基因敲除(knock out)或基因敲低(knock down)。而且,基因敲除中包含基因本身缺失
优选地,所述重组细胞为梭菌(Clostridium)属细菌或穆尔氏菌(Moorella)属细菌。
优选地,所述重组细胞为李氏梭菌(Clostridium ljungdahlii)、自产乙醇梭菌(Clostridium autoethanogenum)、食一氧化碳梭菌(Clostridium carboxidivorans)、拉氏梭菌(Clostridium ragsdalei)、科氏梭菌(Clostridium kluyveri)或热醋穆尔氏菌(Moorella thermoacetica)。
优选地,所述外源性NAD(P)H消耗途径为甲羟戊酸途径。
通过该构成,异戊烯基二磷酸(IPP)及二甲基烯丙基二磷酸(DMAPP)的合成能力提高。
优选地,所述甲羟戊酸途径为酵母、原核生物或放线菌的甲羟戊酸途径。
优选地,所述甲羟戊酸途径为放线菌的甲羟戊酸途径。
优选地,作为所述甲羟戊酸途径的HMG-CoA还原酶,包含NADH依赖性的HMG-CoA还原酶。
优选地,所述HMG-CoA还原酶为来自Pseudomonas mevalonii的mvaA(P13702)、来自Methanocella conradii的hmgA-1Mtc_0274(H8I942)、来自乳酸乳球菌乳酸亚种(Lactococcus lactis subsp.lactis)(KF147株)的mvaA LLKF_1694(D2BKK7)或来自血链球菌(Streptococcus sanguinis)(SK36株)的mvaA SSA_0337(A3CKT9)。
优选地,在所述内源性NAD(P)H消耗途径中,选自乙醇脱氢酶、乙醛脱氢酶、乳酸脱氢酶、及2,3-丁二醇脱氢酶中的至少一者的表达被下调。
作为梭菌(Clostridium)属细菌等中的内源性NAD(P)H消耗途径,可以举出以下各途径:由乙醛向乙醇的转换、由乙酰CoA向乙醛的转换、由丙酮酸向乳酸的转换及由丙酮酸向2,3-丁二醇的转换。并且,在本方式中,在这些内源性NAD(P)H消耗途径中起作用的酶的表达被下调。
优选地,在所述内源性NAD(P)H消耗途径中,至少乙醇脱氢酶的表达被下调。
优选地,在所述内源性NAD(P)H消耗途径中,乙醛脱氢酶的表达也被下调。
优选地,在所述内源性NAD(P)H消耗途径中,乳酸脱氢酶或2,3-丁二醇脱氢酶的表达也被下调。
优选地,所述进行下调的至少一种为表达缺失。
优选地,乙醇脱氢酶和/或乙醛脱氢酶的表达发生了缺失。
优选地通过同源重组,表达所述甲羟戊酸途径的基因被整合至基因组中来代替编码乙醇脱氢酶和/或乙醛脱氢酶的基因。
优选地,磷酸转乙酰化酶和/或乙酸激酶的表达也被下调。
磷酸转乙酰化酶和乙酸激酶是在由乙酰CoA向乙酸转换的途径中起作用的酶。通过本方式,抑制乙酰CoA的无意义的消耗。
优选地,至少磷酸转乙酰化酶的表达被下调。
优选地,所述下调的至少一种是通过基因缺失或基因表达调控区的修饰而进行的。
优选地,表达所述外源性NAD(P)H消耗途径的基因为基因簇,该基因簇包含表达甲羟戊酸途径的基因和编码由异戊烯基二磷酸生成异戊二烯的酶的基因,所述有机化合物为异戊二烯。
通过该技术方案,提供可以大量生产异戊二烯的重组细胞。
优选地,由所述异戊烯基二磷酸生成异戊二烯的酶是异戊二烯合成酶。
优选地,表达所述外源性NAD(P)H消耗途径的基因为基因簇,该基因簇包含表达甲羟戊酸途径的基因和编码由异戊烯基二磷酸生成环萜烯的酶的基因,所述有机化合物为环萜烯。
通过该技术方案,提供可以大量生产环萜烯的重组细胞。
优选地,由所述异戊烯基二磷酸生成环萜烯的酶为牻牛儿基二磷酸合成酶和/或橙花基二磷酸合成酶、及环单萜烯合成酶,所述有机化合物为环单萜烯。
优选地,所述环单萜烯合成酶为β-水芹烯合成酶,所述环单萜烯为β-水芹烯、4-蒈烯或柠檬烯。
根据本方式,通过在细胞内表达的β-水芹烯合成酶的作用,由牻牛儿基二磷酸(GPP)和/或橙花基二磷酸(NPP)生成β-水芹烯、4-蒈烯或柠檬烯。从而,通过培养本方式的重组细胞,可以大量生产β-水芹烯、4-蒈烯或柠檬烯。
优选地,所述基因簇被整合至重组细胞的基因组中。
优选地,作为所述重组细胞的基本的宿主细胞的adhE1基因及adhE2基因的一部分或全部发生了缺失,通过同源重组,所述基因簇被整合至基因组中来代替所述adhE1基因及adhE2基因。
一般认为,adhE1基因和adhE2基因为梭菌(Clostridium)属细菌等所具有的基因,均包含乙醛脱氢酶基因和乙醇脱氢酶基因这两者。
本发明的其它方式为重组细胞的制造方法,其特征在于,包括:第一工序:提供宿主细胞,该宿主细胞具有由甲基四氢叶酸、一氧化碳及CoA合成乙酰CoA的功能;及第二工序:向所述宿主细胞中导入表达外源性NAD(P)H消耗途径的基因,第二工序中导入的所述基因在所述宿主细胞内表达,所述宿主细胞具有的内源性NAD(P)H消耗途径中的至少一者的表达被下调,且所述内源性NAD(P)H消耗途径与所述外源性NAD(P)H消耗途径不同,所述重组细胞可以通过所述外源性NAD(P)H消耗途径,由选自一氧化碳及二氧化碳中的至少一者来生产碳原子数为4以上的所述有机化合物。
本方式涉及可以生产碳原子数为4以上的有机化合物的重组细胞的制造方法。本方式的方法包含如下工序:第一工序:提供宿主细胞,该宿主细胞具有由甲基四氢叶酸、一氧化碳及CoA合成乙酰CoA的功能;第二工序:向所述宿主细胞中导入表达外源性NAD(P)H消耗途径的基因。并且,第二工序中导入的基因在宿主细胞内表达。即,在通过本方式的方法制造的重组细胞中,对于宿主细胞而言,赋予新的NAD(P)H消耗途径或NAD(P)H消耗途径增强。
而且,在通过本方式的方法制造的重组细胞中,宿主细胞具有的内源性NAD(P)H消耗途径中的至少一者的表达被下调,且所述内源性NAD(P)H消耗途径与所述外源性NAD(P)H消耗途径不同。
并且,通过本方式的方法制造的重组细胞可以通过所述外源性NAD(P)H消耗途径,由选自一氧化碳及二氧化碳中的至少一者生产碳原子数为4以上的有机化合物。
作为通过本方式的方法制造的重组细胞,在NAD(P)H消耗途径中,与所述有机化合物的生产无关的内源性NAD(P)H消耗途径的表达被下调,因此,优先向与所述有机化合物的生产有关的所述外源性NAD(P)H途径提供NAD(P)H。因此,有效生产所述有机化合物。例如,可以通过培养该重组细胞来大量生产碳原子数为4以上的有机化合物。
优选地,所述宿主细胞为梭菌(Clostridium)属细菌或穆尔氏菌(Moorella)属细菌。
优选地,所述宿主细胞为李氏梭菌(Clostridium ljungdahlii)、自产乙醇梭菌(Clostridium autoethanogenum)、食一氧化碳梭菌(Clostridium carboxidivorans)、拉氏梭菌(Clostridium ragsdalei)、科氏梭菌(Clostridium kluyveri)或热醋穆尔氏菌(Moorella thermoacetica)。
优选地,所述外源性NAD(P)H消耗途径为甲羟戊酸途径。
优选地,所述甲羟戊酸途径为酵母、原核生物或放线菌的甲羟戊酸途径。
优选地,所述甲羟戊酸途径为放线菌的甲羟戊酸途径。
优选地,作为所述甲羟戊酸途径的HMG-CoA还原酶,包含NADH依赖性的HMG-CoA还原酶。
优选地,所述HMG-CoA还原酶为来自Pseudomonas mevalonii的mvaA(P13702)、来自Methanocella conradii的hmgA-1Mtc_0274(H8I942)、来自乳酸乳球菌乳酸亚种(Lactococcus lactis subsp.lactis)(KF147株)的mvaA LLKF_1694(D2BKK7)或来自血链球菌(Streptococcus sanguinis)(SK36株)的mvaA SSA_0337(A3CKT9)。
优选地,在所述内源性NAD(P)H消耗途径中,选自乙醇脱氢酶、乙醛脱氢酶、乳酸脱氢酶及2,3-丁二醇脱氢酶中的至少一种的表达被下调。
优选地,在所述内源性NAD(P)H消耗途径中,至少乙醇脱氢酶的表达被下调。
优选地,在所述内源性NAD(P)H消耗途径中,乙醛脱氢酶的表达也被下调。
优选地,在所述内源性NAD(P)H消耗途径中,乳酸脱氢酶或2,3-丁二醇脱氢酶的表达也被下调。
优选地,所述下调的至少一种为表达缺失。
优选地,乙醇脱氢酶和/或乙醛脱氢酶的表达发生了缺失。
优选地,通过同源重组,表达所述甲羟戊酸途径的基因被整合至所述重组细胞的基因组中来代替编码乙醇脱氢酶和/或乙醛脱氢酶的基因。
优选地,磷酸转乙酰化酶和/或乙酸激酶的表达也被下调。
优选地,至少磷酸转乙酰化酶的表达被下调。
优选地,所述下调的至少一种通过基因的缺失或基因表达调控区的修饰而进行。
优选地,所述第二工序中导入的基因为基因簇,该基因簇包含表达甲羟戊酸途径的基因和编码由异戊烯基二磷酸生成异戊二烯的酶的基因,所述有机化合物为异戊二烯。
优选地,所述由异戊烯基二磷酸生成异戊二烯的酶为异戊二烯合成酶。
优选地,所述第二工序中导入的基因为基因簇,该基因簇表达甲羟戊酸途径的基因和编码由异戊烯基二磷酸生成环萜烯的酶的基因,所述有机化合物为环萜烯。
优选地,所述由异戊烯基二磷酸生成环萜烯的酶为牻牛儿基二磷酸合成酶和/或橙花基二磷酸合成酶、及环单萜烯合成酶,所述有机化合物为环单萜烯。
优选地,所述环单萜烯合成酶为β-水芹烯合成酶,所述环单萜烯为β-水芹烯、4-蒈烯或柠檬烯。
优选地,所述基因簇被整合至宿主细胞的基因组中。
优选地,宿主细胞的adhE1基因及adhE2基因的一部分或全部发生了缺失,通过同源重组,所述基因簇被整合至基因组中来代替所述adhE1基因及adhE2基因。
本发明的其它方式为有机化合物的生产方法,其特征在于,使上述重组细胞或通过上述方法所制造的重组细胞与选自一氧化碳及二氧化碳中的至少一个C1化合物接触,使该重组细胞由所述C1化合物生产碳原子数为4以上的有机化合物。
本方式涉及碳原子数为4以上的有机化合物的生产方法。在本方式中,使上述重组细胞或通过上述方法制造的重组细胞与选自一氧化碳及二氧化碳中的至少一个C1化合物接触,由该C1化合物生产所述有机化合物。根据本方式的方法,例如,可以由包含一氧化碳及二氧化碳的合成气生产所述有机化合物。
优选地,将选自一氧化碳及二氧化碳中的至少一个C1化合物作为碳源,培养所述重组细胞,使该重组细胞生产碳原子数为4以上的有机化合物。
优选地,向所述重组细胞提供以一氧化碳为主要成分的气体、以一氧化碳和氢为主要成分的气体、以二氧化碳和氢为主要成分的气体或者以一氧化碳、二氧化碳及氢为主要成分的气体。
“向重组细胞提供气体”是指使重组细胞与气体接触。例如,包含培养重组细胞时,向重组细胞提供气体作为碳源等。
优选地,进一步向所述重组细胞提供甲酸或甲醇。
“向重组细胞提供气体和甲醇”是指,使重组细胞与气体和甲醇接触。例如,包含在培养重组细胞时,向重组细胞提供气体和甲醇作为碳源等。
优选地,所述重组细胞为梭菌(Clostridium)属细菌或穆尔氏菌(Moorella)属细菌。
优选地,对释放至所述重组细胞的细胞外的所述有机化合物进行回收。
优选地,从所述重组细胞的培养系统的气相回收所述有机化合物。
发明的效果
根据本发明,可以利用重组体,通过外源性NAD(P)H消耗途径,有效地生产碳原子数为4以上的有机化合物。特别是根据导入甲羟戊酸途径作为外源性NAD(P)H消耗途径的技术特征,可以利用重组体高效地生产异戊二烯及环单萜烯。
附图说明
图1为表示乙酰CoA途径和甲醇途径的说明图。
图2为表示导入有甲羟戊酸途径的梭菌(Clostridium)属细菌或穆尔氏菌(Moorella)属细菌中的主要代谢途径的一部分的说明图。
具体实施方式
下面,对本发明的实施方式进行说明。需要说明的是,在本发明中,术语“基因”可以全部替换为“核酸”或者“DNA”。
作为本发明的重组细胞,其特征在于,具有由甲基四氢叶酸、一氧化碳及CoA合成乙酰CoA的功能,表达外源性NAD(P)H消耗途径的基因,且该基因在所述重组细胞内表达,所述重组细胞具有的内源性NAD(P)H消耗途径中的至少一者的表达被下调,且所述内源性NAD(P)H消耗途径与所述外源性NAD(P)H消耗途径不同,所述重组细胞能够通过所述外源性NAD(P)H消耗途径,由选自一氧化碳及二氧化碳中的至少一者生产碳原子数为4以上的有机化合物。
例如,本发明的重组细胞是向宿主细胞中导入表达外源性NAD(P)H消耗途径的基因而得到的,该宿主细胞具有由甲基四氢叶酸、一氧化碳及CoA合成乙酰CoA的功能,且该基因在所述宿主细胞内表达,所述重组细胞具有的内源性NAD(P)H消耗途径中的至少一者的表达被下调,且所述内源性NAD(P)H消耗途径与所述外源性NAD(P)H消耗途径不同,所述重组细胞能够通过所述外源性NAD(P)H消耗途径,由选自一氧化碳及二氧化碳中的至少一者生产碳原子数为4以上的有机化合物。
作为本发明的重组细胞的制造方法,其特征在于,包含:第一工序:提供宿主细胞,该宿主细胞具有由甲基四氢叶酸、一氧化碳及CoA合成乙酰CoA的功能;及第二工序:向所述宿主细胞中导入表达外源性NAD(P)H消耗途径的基因,第二工序中导入的所述基因在所述宿主细胞内表达,所述宿主细胞具有的内源性NAD(P)H消耗途径中的至少一者的表达被下调,且所述内源性NAD(P)H消耗途径与所述外源性NAD(P)H消耗途径不同,所述重组细胞可以通过所述外源性NAD(P)H消耗途径,由选自一氧化碳及二氧化碳中的至少一者来生产碳原子数为4以上的所述有机化合物。
本发明的重组细胞具有由甲基四氢叶酸、一氧化碳及CoA合成乙酰CoA的功能。例如,作为本发明的重组细胞的基本的宿主细胞具有由甲基四氢叶酸、一氧化碳及CoA合成乙酰CoA的功能。由甲基四氢叶酸([CH3]-THF)、一氧化碳(CO)及CoA合成乙酰CoA的途径包含在例如,图1所示的乙酰CoA途径(Wood-Ljungdahl pathway)和甲醇途径(Methanolpathway)中。
如图1所示,在乙酰CoA途径中,二氧化碳(CO2)通过两个途径分别还原为一氧化碳(CO)和甲基阳离子源。并且,以上述两个碳源为基质对CoA(图1中记作HSCoA)的巯基进行乙酰化,合成一个分子的乙酰CoA。在乙酰CoA途径中,乙酰CoA合成酶(Acetyl-CoA synthase,ACS)、甲基转移酶(Methyltransferase)、一氧化碳脱氢酶(CODH)、甲酸脱氢酶(Formatedehydrogenase,FDH)等酶起作用。需要说明的是,从甲酰四氢叶酸([CHO]-THF)至[CH3]-THF的途径被称为甲基分支(Methyl branch)。
另一方面,甲醇途径包含将甲醇转化为甲醛(HCHO),再转化为甲酸(HCOOH)的途径和由甲醇衍生[CH3]-THF的途径。
即,由甲基四氢叶酸([CH3]-THF)、一氧化碳(CO),及CoA合成乙酰CoA的途径在乙酰CoA途径和甲醇途径中相同。
作为所述宿主细胞的例子,可以举出:梭菌(Clostridium)属细菌及穆尔氏菌(Moorella)属细菌等厌氧微生物。作为具体例,例如,可以举出:李氏梭菌(Clostridiumljungdahlii)、自产乙醇梭菌(Clostridium autoethanogenum)、食一氧化碳梭菌(Clostridium carboxidivorans)、拉氏梭菌(Clostridium ragsdalei)(Kopke M.et al.,Appl.Environ.Microbiol.2011,77(15),5467-5475)、科氏梭菌(Clostridium kluyveri)、热醋穆尔氏菌(Moorella thermoacetica)(与热乙酸梭菌(Clostridium thermoaceticum)相同)(Pierce EG.Et al.,Environ.Microbiol.2008,10,2550-2573)等梭菌(Clostridium)属细菌及穆尔氏菌(Moorella)属细菌。作为本发明中的宿主细胞,特别优选梭菌(Clostridium)属细菌,其已经建立宿主-载体系统系和培养方法。
除此之外,作为所述宿主细胞的例子,还可以举出:伍氏醋酸杆菌(Acetobacterium woodii)(Dilling S.et al.,Appl.Environ.Microbiol.2007,73(11),3630-3636)等醋酸杆菌属(Acetobacterium)属细菌。而且,作为所述宿主细胞的例子,也可以举出:生孢一氧化碳胞菌(Carboxydocella sporoducens sp.Nov.)(Slepova TV.etal.,Inter.J.Sys.Evol.Microbiol.2006,56,797-800)、胶状红长命菌(Rhodopseudomonasgelatinosa)(Uffen RL,J.Bacteriol.1983,155(3),956-965)、粘液真杆菌(Eubacteriumlimosum)(Roh H.et al.,J.Bacteriol.2011,193(1),307-308)、食甲基丁酸杆菌(Butyribacterium methylotrophicum)(Lynd,LH.Et al.,J.Bacteriol.1983,153(3),1415-1423)等细菌。
需要说明的是,本发明的重组细胞可以具有一氧化碳脱氢酶(CODH)。具体而言,主要优选在一氧化碳代谢即一氧化碳脱氢酶的作用下,通过由一氧化碳和水产生二氧化碳和质子的功能进行生育的细胞。所述具有乙酰CoA途径和甲醇途径的厌氧微生物具有一氧化碳脱氢酶(CODH)。
需要说明的是,上述细菌的增殖及CODH活性均为氧敏感性,还已知有非氧敏感性CODH。例如,以嗜羧寡养菌(Oligotropha carboxidovorans)(Schubel,U.et al.,J.Bacteriol.,1995,2197-2203)、日本慢生根瘤菌(Bradyrhizobium japonicum)(LoriteMJ.Et al.,Appl.Environ.Microbiol.,2000,66(5),1871-1876)为主的其它细菌种类中存在非氧敏感性CODH(King GM et al.,Appl.Environ.Microbiol.2003,69(12),7257-7265)。作为需氧氢氧化细菌的罗尔斯通氏菌(Ralstonia)属菌中也存在非氧敏感性的CODH(NCBI Gene ID:4249199,8019399)。
如上所述,具有CODH的细菌广泛存在,可以从其中适当选择用于本发明的宿主细胞。例如,可以使用以CO、CO/H2(以CO和H2为主要成分的气体)或者以CO/CO2/H2(以CO、CO2和H2为主要成分的气体)为唯一的碳源和能源的选择性培养基,在厌氧、微需氧或者需氧条件下,对可以用作宿主细胞的具有CODH的细菌进行分离。
如上所述,NAD(P)H消耗途径是指随着由NAD(P)H向NAD(P)转化而消耗NAD(P)H的途径。作为NAD(P)H消耗途径的例子,可以举出:NAD(P)H作为脱氢酶的辅酶起作用的途径。
本发明的重组细胞具有表达外源性NAD(P)H消耗途径的基因,且该基因进行表达。例如,宿主细胞中导入有表达外源性NAD(P)H消耗途径的基因,且该基因进行表达。就优选的方式而言,宿主细胞为梭菌(Clostridium)属细菌或穆尔氏菌(Moorella)属细菌,外源性NAD(P)H消耗途径为甲羟戊酸途径。
一般而言,异戊烯基二磷酸(IPP)的合成途径大致分为甲羟戊酸途径(MVA途径)和非甲羟戊酸途径(MEP途径)这两条途径。其中,甲羟戊酸途径为真核生物所具备,以乙酰CoA起始物质。作为在甲羟戊酸途径中起作用的酶,从上游开始依次可以举出:乙酰CoA乙酰基转移酶、HMG-CoA合成酶、HMG-CoA还原酶、甲羟戊酸激酶、5-磷酸甲羟戊酸激酶、二磷酸甲羟戊酸脱羧酶、异戊烯基二磷酸异构酶。
当通过甲羟戊酸途径由乙酰CoA合成IPP时,消耗NAD(P)H。
表达甲羟戊酸途径的基因是指,编码这些酶,且通过其表达由乙酰CoA合成IPP的基因。
需要说明的是,甲羟戊酸途径是全部真核生物所具备的,在原核生物中也有发现。就具有甲羟戊酸途径的原核生物而言,作为放线菌,可以举出:链霉菌属(Streptomycessp.)株CL190(Takagi M.et al.,J.Bacteriol.2000,182(15),4153-7)、灰色孢链霉菌(Streptomyces griseolosporeus)MF730-N6(Hamano Y.et al.,Biosci.Biotechnol.Biochem.2001,65(7),1627-35)。
作为细菌,可以举出:瑞士乳杆菌(Lactobacillus helvecticus)(Smeds A etal.,DNA seq.2001,12(3),187-190)、无枝菌酸棒杆菌(Corynebacterium amycolatum)、海分枝杆菌(Mycobacterium marinum)、凝结芽孢杆菌(Bacillus coagulans)、粪肠球菌(Enterococcus faecalis)、无乳链球菌(Streptococus agalactiae)、橙黄色黏球菌(Myxococcus xanthus)等(Lombard J.et al.,Mol.Biol.Evol.2010,28(1),87-99)。
作为古菌,可以举出:气火菌属(Aeropyrum)、硫化叶菌属(Sulfolobus)、脱硫古菌属(Desulfurococcus)、热变形菌属(Thermoproteus)、盐古杆菌属(Halobacterium)、甲烷球菌属(Methanococcus)、热球菌属(Thermococcus)、热火球菌属(Pyrococcus)、甲烷火菌属(Methanopyrus)、热原体属(Thermoplasma)等(Lombard J.et al.,Mol.Biol.Evol.2010,28(1),87-99)。
在本发明中,作为外源性NAD(P)H消耗途径即甲羟戊酸途径的来源,没有特别限定,优选酵母、原核生物或放线菌的甲羟戊酸途径,特别优选放线菌的甲羟戊酸途径。
需要说明的是,HMG-CoA还原酶中存在NADPH依赖性(EC1.1.1.34)和NADH依赖性(EC1.1.1.88)这两种。放线菌的HMG-CoA还原酶为NADPH依赖性,但在本发明中,可以根据目的使用NADH依赖性的还原酶。作为NADH依赖性的HMG-CoA还原酶,具有:来自Pseudomonasmevalonii的mvaA(P13702)、来自Methanocella conradii的hmgA-1Mtc_0274(H8I942),来自乳酸乳球菌乳酸亚种(Lactococcus lactis subsp.lactis)(KF147株)的mvaA LLKF_1694(D2BKK7)、来自血链球菌(Streptococcus sanguinis)(SK36株)的mvaA SSA_0337(A3CKT9)等。
在本发明的重组细胞中,与所述外源性NAD(P)H消耗途径不同的内源性NAD(P)H消耗途径中的至少一种的表达被下调。下面,将对重组细胞为梭菌(Clostridium)属细菌或穆尔氏菌(Moorella)属细菌,且外源性NAD(P)H消耗途径为甲羟戊酸途径的方式进行具体说明。
图2表示导入有甲羟戊酸途径的梭菌(Clostridium)属细菌或穆尔氏菌(Moorella)属细菌中的中心代谢途径的一部分。在图2所示的例子中,通过甲羟戊酸途径(外源性NAD(P)H消耗途径)由乙酰CoA合成IPP。需要说明的是,乙酰CoA由乙酰CoA途径(Wood-Ljungdahl pathway)(图1)供应。
另一方面,在图2所示的例子中,作为内源性NAD(P)H消耗途径,存在各种途径,这些途径进行由乙醛向乙醇的转换、由乙酰CoA向乙醛的转换、由丙酮酸向乳酸的转换及由丙酮酸向2,3-丁二醇的转换。在此,由乙醛向乙醇的转换通过乙醇脱氢酶进行,由乙酰CoA向乙醛的转换通过乙醛脱氢酶进行,与丙酮酸向乳酸的转换通过乳酸脱氢酶进行,及由丙酮酸向2,3-丁二醇的转换通过2,3-丁二醇脱氢酶进行。
并且,在本方式中,参与内源性NAD(P)H消耗途径的这些酶中的至少一中的表达被下调。因此,内源性NAD(P)H消耗途径中的NAD(P)H消耗量被抑制为较低,NAD(P)H优先供给至作为外源性NAD(P)H消耗途径的甲羟戊酸途径。结果,有效地通过甲羟戊酸途径合成IPP。
进行下调的上述酶可以为一种,也可以为多种。
如上所述,基因表达被下调是指,减少基因表达量的调控及使基因功能缺失的调控。作为基因表达被下调的例子,可以举出:基因敲除(knock out)及基因敲低(knockdown)。而且,基因敲除中包含基因本身缺失。另外,通过修饰启动子等基因表达调控区来减少基因表达量的方式也包含在基因表达被下调中。在进行下调的基因为多种的情况下,各基因下调的方式可以相同,也可以不同。
作为梭菌(Clostridium)属细菌及穆尔氏菌(Moorella)属细菌的基因敲除方法,已知有:使用同源重组的手法(Leang C.et al.,Appl Environ Microbiol.201379(4),1102-9)、使用II组内含子的手法(John T.Heap et al.,Journal of MicrobiologicalMethods 70(2007)452-464)、使用Cre-Lox66/lox71的手法(Vel Berzin et al.,ApplBioichem Biotechnol.,2012 168:1384-1393)等。
需要说明的是,在图2所示的例子中,除NAD(P)H消耗途径以外,还存在由乙酰CoA向乙酸转换的途径。该途径通过磷酸转乙酰化酶进行。因此,除上述内源性NAD(P)H消耗途径之外,可以通过对磷酸转乙酰化酶的表达进行调控而使其下调来抑制不必要的乙酰CoA消耗。结果,有效地进行通过甲羟戊酸途径的IPP合成。
另外,可以通过对乙酸激酶的表达进行调控而使其下调,在由乙酰CoA向乙酸转换的途径中,会抑制生成多余的烃,故更优选。
作为本发明的重组细胞生产的C4以上的有机化合物,没有特别限定,例如,可以举出萜烯。作为一种方式,可以采用基因簇作为表达外源性NAD(P)H消耗途径的基因,该基因簇包括表达甲羟戊酸的基因和编码由IPP生成异戊二烯的酶的基因。由此,可以提供能够生产异戊二烯的重组细胞。
作为由IPP生成异戊二烯的酶,可以举出异戊二烯合成酶。作为异戊二烯合成酶,只要为可以在重组细胞内发挥其酶活性的合成酶即可,没有特别限定。编码异戊二烯合成酶的基因也一样,只要为在重组细胞内基序正常转录、翻译的基因即可,没有特别限定。另外,编码异戊二烯合成酶的基因可以是进行了修饰而成为在重组细胞内容易进行转录的密码子的基因。例如,若宿主细胞为梭菌(Clostridium)属细菌,则可以基于梭菌(Clostridium)属细菌的密码子使用频率的信息,对导入的核酸的密码子进行修饰。
异戊二烯合成酶在很多植物中被发现。作为异戊二烯合成酶的具体例,可以举出:来自黑杨(Populus nigra)的合成酶(GenBank Accession No.:AM410988.1)。除此之外,还可以举出来自枯草芽孢杆菌(Bacillus subtilis)的合成酶(Sivy TL.et al.,Biochem.Biophys.Res.Commu.2002,294(1),71-5)。
序列号1中示出了编码来自黑杨的异戊二烯合成酶的基因(DNA)的碱基序列和对应的氨基酸序列,序列号2中仅示出了氨基酸序列。具有序列号1中所示的碱基序列的DNA是编码异戊二烯合成酶的核酸的一个例子。
并且,编码异戊二烯合成酶的基因中至少包含编码下述(a)、(b)或(c)的蛋白质的核酸。
(a)蛋白质,包含序列号2所示的氨基酸序列;
(b)蛋白质,包含序列号2所示的氨基酸序列中缺失置换或添加1~20个氨基酸而得到的氨基酸序列,且具有异戊二烯合成酶的活性;
(c)蛋白质,具有与序列号2所示的氨基酸序列显示60%以上同源性的氨基酸序列,且具有异戊二烯合成酶的活性。
需要说明的是,关于(c)中的氨基酸序列的同源性,更优选为80%以上,进一步优选为90%以上,特别优选为95%以上。
另外,在其它方式中,作为表达外源性NAD(P)H消耗途径的基因,采用基因簇,该基因簇包含表达甲羟戊酸途径的基因和编码由异戊烯基二磷酸生成环萜烯的酶的基因。由此,可以提供能够生产环萜烯的重组细胞。
作为由异戊烯基二磷酸生成环萜烯的酶,可以举出:牻牛儿基二磷酸合成酶(GPP合成酶)和/或橙花基二磷酸合成酶(NPP合成酶)以及环单萜烯合成酶。
关于GPP合成酶和NPP合成酶,可以仅采用任意一者,也可以采用两者。
作为GPP合成酶,只要为能够在重组细胞内发挥其酶活性的合成酶即可,没有特别限定。编码GPP合成酶的基因也相同,只要为在重组细胞内进行正常转录、翻译的合成酶即可,没有特别限定。
NPP合成酶、环单萜烯合成酶及编码它们的基因也相同。
作为GPP合成酶的具体例,可以举出:来自拟南芥(Arabidopsis thaliana)的酶(GenBank Accession No.:Y17376/At2g34630;Bouvier,F.,et al.,Plant J,.2000,24,241-52.)、来自结核分枝杆菌(Mycobacterium tuberculosis)的酶(GenBank AccessionNo.:NP_215504;Mann,F.M.,et al.,FEBS Lett.,2011,585,549-54.)等。
序列号3中示出了编码来自上述拟南芥的GPP合成酶的基因(DNA)的碱基序列和对应的氨基酸序列,序列号4中仅示出了氨基酸序列。具有序列号3所示的碱基序列的DNA成为编码GPP合成酶的基因的一个例子。
而且,编码GPP合成酶的基因中至少包含编码下述(a)、(b)或(c)的蛋白质的核酸。
(a)蛋白质,包括序列号4所示的氨基酸序列;
(b)蛋白质,包含序列号4所示的氨基酸序列中缺失、置换或添加1~20个氨基酸而成的氨基酸序列,且具有牻牛儿基二磷酸合成酶的活性;
(c)蛋白质,具有与序列号4所示的氨基酸序列显示60%以上的同源性的氨基酸序列,且具有牻牛儿基二磷酸合成酶的活性。
需要说明的是,关于(c)中的氨基酸序列的同源性,更优选为80%以上,进一步优选为90%以上,特别优选为95%以上。
作为NPP合成酶的具体例,可以举出:来自番茄(Solanum lycopersicum)的酶(GenBank Accession No.:FJ797956)等。
序列号5中示出了编码来自上述番茄的NPP合成酶的基因(DNA)的碱基序列和对应的氨基酸序列,序列号6中仅示出了氨基酸序列。具有序列号5所示的碱基序列的DNA是编码NPP合成酶的基因的一个例子。
而且,编码NPP合成酶的基因中至少包含编码下述(d)、(e)或(f)的蛋白质的核酸。
(d)蛋白质,包含序列号6所示的氨基酸序列;
(e)蛋白质,包含序列号6所示的氨基酸序列中缺失、置换或添加1~20个氨基酸而成的氨基酸序列,且具有橙花基二磷酸合成酶的活性;
(f)蛋白质,具有与序列号6所示的氨基酸序列显示60%以上的同源性的氨基酸序列,且具有橙花基二磷酸合成酶的活性。
需要说明的是,关于(f)中的氨基酸序列的同源性,更优选为80%以上,进一步优选为90%以上,特别优选为95%以上。
作为环单萜烯合成酶的例子,可以举出β-水芹烯合成酶。通过β-水芹烯合成酶的作用由GPP和/或NPP合成β-水芹烯。另外,作为副产物,可以合成4-蒈烯或柠檬烯。
作为β-水芹烯合成酶及编码其的基因的具体例,可以举出:来自番茄(Solanumlycopersicum)的基因(GenBank Accession No.:FJ797957;Schilmiller,A.L.,et al.,Proc Natl Acad Sci U S A.,2009,106,10865-70.)、来自薰衣草(Lavandulaangustifolia)的基因(GenBank Accession No.:HQ404305;Demissie,Z.A.,et al.,Planta,2011,.233,685-96)等。
序列号7中示出了编码来自上述番茄的β-水芹烯合成酶的基因(DNA)的碱基序列和对应的氨基酸序列,序列号8中仅示出了氨基酸序列。
序列号9中示出了编码来自上述薰衣草的β-水芹烯合成酶的基因(DNA)的碱基序列和对应的氨基酸序列,序列号10中仅示出了氨基酸序列。
具有序列号7或序列号9所示的碱基序列的DNA是编码β-水芹烯合成酶的基因的一个例子。
而且,编码β-水芹烯合成酶的基因中至少包含编码下述(g)、(h)或(i)的蛋白质的核酸。
(g)蛋白质,包含序列号8或10所示的氨基酸序列;
(h)蛋白质,包含序列号8或10所示的氨基酸序列中缺失、置换或添加1~20个氨基酸而成的氨基酸序列,且具有β-水芹烯合成酶的活性;
(i)蛋白质,具有与序列号8或10所示的氨基酸序列显示60%以上的同源性的氨基酸序列,且具有β-水芹烯合成酶的活性。
需要说明的是,关于(i)中的氨基酸序列的同源性,更优选为80%以上,进一步优选为90%以上,特别优选为95%以上。
作为导入表达外源性NAD(P)H消耗途径的基因并且对内源性NAD(P)H消耗途径的表达进行调控而使其下调的具体方式,可以举出:通过同源重组,利用上述基因簇取代位于梭菌(Clostridium)属细菌或穆尔氏菌(Moorella)属细菌的基因组上的adhE1基因和adhE2基因的一部分或全部。adhE1基因和adhE2基因均包含乙醛脱氢酶基因和乙醇脱氢酶基因这两者,另外,在基因组上,两者可以位于相邻位置。
本发明的重组细胞具有表达外源性NAD(P)H消耗途径的基因。例如,表达外源性NAD(P)H消耗途径的基因被导入宿主细胞中。所导入的基因可以整合至宿主细胞的基因组中,也可以以整合至质粒中状态存在于基因组外。
作为向宿主细胞导入基因的方法,没有特别限定,根据宿主细胞的种类适当选择即可。例如,可以使用能够导入宿主细胞中且能够表达所整合基因的载体。
例如,在宿主细胞为细菌等原核生物的情况下,作为该载体,可以使用在宿主细胞中能够自主复制或能够整合至染色体中,且在能够对所插入的上述基因(DNA)进行转录的位置包含启动子的载体。例如,优选使用该载体,启动子,在宿主细胞内构建由核糖体结合序列、上述基因(DNA)及转录终止序列构成的一系列结构。
在宿主细胞为梭菌(Clostridium)属细菌(包含穆尔氏菌(Moorella)属细菌等近缘种类)的情况下,可以使用梭菌(Clostridium)属细菌和大肠杆菌的穿梭载体pIMP1(Mermelstein LD et al.,Bio/technology 1992,10,190-195)。本穿梭载体为pUC9(ATCC37252)和分离自枯草芽孢杆菌(Bacillus subtilis)的pIM13(Projan SJ et al.,J.Bacteriol.1987,169(11),5131-5139)的融合载体,在梭菌(Clostridium)属细菌内也稳定地保有。作为梭菌(Clostridium)属细菌和大肠杆菌的穿梭载体的其它例子,可以举出pSOS95(GenBank:AY187686.1)。
需要说明的是,通常,使用电穿孔法向梭菌(Clostridium)属细菌导入基因,但在基因刚导入后被导入的外源质粒容易被限制酶Cac824I等分解而极其不稳定。因此,优选在具有pAN1(Mermelstein LD et al.,Apply.Environ.Microbiol.1993,59(4),1077-1081)的大肠杆菌,例如,ER2275株等中,对来自pIMP1的载体进行扩增,并进行甲基化处理,然后从大肠杆菌中回收,用于利用电穿孔进行的转化中,其中,pAN1具有来自枯草芽孢杆菌(Bacillus subtilis)噬菌体Φ3T1的甲基转移酶基因。需要说明的是,最近,开发了Cac824I基因缺失的丙酮丁醇梭菌(Clostridium acetobuthylicum),从而未进行甲基化处理的载体也可以稳定地存在(Dong H.et al.,PLoS ONE 2010,5(2),e9038)。另外,已知有如下手法:使用作为大肠杆菌BL21株的的改良株NEB express来扩增载体,并载体(LeangC.et al.,Appl Environ Microbiol.2013 79(4),1102-9)有效导入。另外,还示出了下述的手法:通过向pBluescipt II KS(-)及pUC19载体中整合宿主同源序列,向梭菌(Clostridium)属细菌的基因组中导入基因(Leang C.et al.,Appl EnvironMicrobiol.2013 79(4),1102-9,Berzin V.et al.,Appl Biochem Biotechnol(2012)167:338-347)
作为梭菌(Clostridium)属细菌中表达异源基因的启动子,例如,具有:thl(硫解酶,thiolase)启动子(Perret S et al.,J.Bacteriol.2004,186(1),253-257)、Dha(甘油脱水酶,glycerol dehydratase)启动子(Raynaud C.et al.,PNAS 2003,100(9),5010-5015),ptb(丁酰磷酸转移酶,phosphotransbutyrylase)启动子(Desai RP et al.,Appl.Environ.Microbiol.1999,65(3),936-945),adc(乙酰乙酸脱羧酶,acetoacetatedecarboxylase)启动子(Lee J et al.,Appl.Environ.Microbiol.2012,78(5),1416-1423)等。但是,在本发明中,不限定于这些,可以使用宿主细胞等中发现的各种代谢系统的操纵子中所使用的启动子区域的序列。
除此之外,还可以使用:pta(磷酸转乙酰酶,phosphate acetyltransferase)、adhE(乙醛乙醇脱氢酶,aldehyde/alcohol dehydrogenase)、CODH(一氧化碳脱氢酶,carbon monoxide dehydrogenase)、acsA(乙酰-coA合成酶α亚基acetyl-coA synthaseαsubunit)、铁氧还原蛋白、Rnf复合体、氢化酶、GroE、ATP合成酶等启动子。另外,在进行合成气发酵的情况下,也适用于通过一氧化碳、二氧化碳或氢进行了活性化的启动子。
另外,在使用载体将多种基因导入至宿主细胞的情况下,各基因可以整合至一个载体中,也可以整合至不同载体中。而且,在一个载体中整合多个基因的情况下,可以在同一启动子下表达各基因,也可以在不同启动子下表达各基因。作为导入多种基因的例子,可以举出如上所述的方式,即,除表达甲羟戊酸途径的基因之外,导入异戊二烯合成基因、GPP合成酶、NPP合成酶基因、环单萜烯合成酶基因等。
如上所述,示出了可以用于本发明的已知载体,但也可以根据目的对启动子、终止子等与转录调控、复制区域等相关的区域进行修饰。作为修饰方法,可以变更为各宿主细胞或其近缘种类中的其它天然基因序列,也可以变更为人工基因序列。
在本发明的有机化合物的生产方法的一种方式中,使上述重组细胞与选自一氧化碳及二氧化碳中的至少一种C1化合物接触,使该重组细胞由所述C1化合物生产碳原子数为4以上的有机化合物。
作为优选的实施方式,将选自一氧化碳及二氧化碳中的至少一个C1化合物作为碳源,培养所述重组细胞,使该重组细胞生产碳原子数为4以上的有机化合物。作为这些用作碳源的C1化合物,可以单独使用一种,也可以组合使用两种以上。另外,这些C1化合物优选用作主要碳源,更优选为唯一的碳源。
另外,优选同时提供氢(H2)以作为能量源。
作为培养本发明的重组细胞的方法,没有特别限定,可以根据重组细胞的种类等适当进行。在重组细胞为梭菌(Clostridium)属细菌(专性厌氧、绝对厌氧)的情况下,例如,在由生育所需的无机盐类及合成气构成的营养条件进行培养。优选在0.2~0.3MPa(绝对压力)左右的加压状态下培养。而且,为了使初期增殖及到达细胞密度良好,可以少量添加维生素、酵母提取物、玉米浆、细菌用胰蛋白胨等有机物。
需要说明的是,在重组细胞为需氧及兼性厌氧的情况下,例如,可以使用液体培养基在通气及搅拌下进行培养。
可以采用培养以外的方法。即,无论是否伴有细胞分裂(细胞增殖),均可以使重组细胞与所述C1化合物接触,并产生所述有机化合物。例如,可以向进行了固定化的重组细胞连续提供所述C1化合物,从而使其连续生产所述有机化合物。在该情况下,这些C1化合物可以单独使用一种,或组合使用两种以上。另外,优选同时接触氢(H2)以作为能量源。
作为优选的实施方式,向所述重组细胞提供以一氧化碳为主要成分的气体、以一氧化碳和氢为主要成分的气体、以二氧化碳和氢为主要成分的气体或以一氧化碳、二氧化碳及氢为主要成分的气体。即,将这些气体作为碳源培养重组细胞或者使这些气体与重组细胞接触,从而由气体中的一氧化碳或二氧化碳生产所述有机化合物。在该情况下,氢也被用作能量源。
除这些C1化合物之外,还可以向所述重组细胞提供甲酸或甲醇。即,将甲酸或甲醇和这些气体作为碳源对重组细胞进行培养或者使甲酸或甲醇和这些气体与重组细胞接触。通过添加甲酸或甲醇,谋求培养效率及所述有机化合物生产的高效化。作为提供方式,例如,可以举出:向重组细胞同时提供甲酸或甲醇和这些气体。
作为表达外源性NADP消耗途径的基因,根据导入基因簇的方式,可以生产异戊二烯作为所述有机化合物,其中,该基因簇包含表达甲羟戊酸途径的基因和对由异戊烯基二磷酸生成异戊二烯的酶进行编码的基因。
另外,作为表达外源性NADP消耗途径的基因,根据导入基因簇的方式,作为所述有机化合物,可以生产环萜烯,其中,基因簇包含表达甲羟戊酸途径的基因和对由异戊烯基二磷酸生成环萜烯的酶进行编码的基因。根据由异戊烯基二磷酸生成环萜烯的酶为牻牛儿基二磷酸合成酶和/或橙花基二磷酸合成酶以及环单萜烯合成酶的方式,可以生产环单萜烯。而且,根据环单萜烯合成酶为β-水芹烯合成酶的方式,作为环单萜烯,可以生产β-水芹烯、4-蒈烯或柠檬烯。
生产的所述有机化合物积累在细胞内或放出细胞外。例如,在生产环萜烯的方式中,可以使用以上述梭菌(Clostridium)属细菌或穆尔氏菌(Moorella)属细菌为宿主细胞的重组细胞,回收放出细胞外的环单萜烯,通过蒸馏等进行单离并提纯,从而得到纯化后的环萜烯。
从重组细胞的培养物中单离并对所述有机化合物进行提纯的方法没有特别限定。在生产环萜烯的情况下,例如,可以利用戊烷等合适的溶剂萃取培养液(培养上清),并通过反相色谱法、气体色谱法等色谱法进行了提纯的为高纯度。放出细胞外的环萜烯大部分会被气相蒸发,因此,也使用冷阱等使其液化并回收。
需要说明的是,有时除二氧化碳以外也使用碳酸氢盐。即,已知梭菌(Clostridium)属细菌及其近缘种类具有碳酸脱氢酶(Carbonic anhydrase,CA)(EC4.2.1.1:)(Braus-Stromeyer SA et al.,J.Bacteriol.1997,179(22),7197-7200),作为CO2源,可以使用作为HCO3-源的NaHCO3等碳酸氢盐。
在此,在宿主细胞具有乙酰CoA途径和甲醇途径(图1)的情况下,对能够供给重组细胞的一氧化碳、二氧化碳、甲酸及甲醇的组合进行说明。
就通过乙酰CoA途径合成乙酰CoA而言,基于甲基转移酶(Methyltransferase)、钴铁硫蛋白(Corrinoid iron-sulfur protein,CoFeS-P)、乙酰CoA合成酶(Acetyl-CoAsynthase,ACS)及CODH的作用,由CoA、甲基四氢叶酸(methyltetrahydrofolate,[CH3]-THF)及CO合成乙酰CoA的构成是必须的(Ragsdale SW et al.,B.B.R.C.2008,1784(12),1873-1898)。
另一方面,已知在培养食甲基丁酸杆菌(Butyribacterium methylotrophicum)时,除CO及CO2以外,添加甲酸及甲醇作为碳源,以增加CO代谢,即,增加乙酰CoA途径的甲基分支(Methyl branch)中的四氢叶酸(tetrahydrofolate,THF)含量及CO代谢所必须的CODH、甲酸脱氢酶(formate dehydrogenase,FDH)及氢化酶(hydrogenase)的活性(KerbyR.et al.,J.Bacteriol.1987,169(12),5605-5609)。在淤泥真杆菌(Eubacteriumlimosum)等中,即使在厌氧条件下且将CO2及甲醇作为碳源的情况下,也显示高增殖(Genthner BRS.et al.,Appl.Environ.Microbiol.,1987,53(3),471-476)。
由对这些甲醇的合成气同化性微生物的影响及热醋穆尔氏菌(Moorellathermoacetica)(热乙酸梭菌(Clostridium thermoaceticum))及李氏梭菌(Clostridiumljungdahlii)等的基因组分析(Pierce E.et al.,Environ.Microbiol.2008,10(10),2550-2573;Durre P.et al.,PNAS 2010,107(29),13087-13092)的结果可以说明,在这些微生物物种中,图1所示的甲醇途径(methanol pathway)作为甲基供体参与乙酰CoA途径(Wood-Ljungdahl pathway)。
另外,实际上,在多种梭菌(Clostridium)属菌中确认到了甲酸脱氢酶(FDH)(EC1.2.1.2/1.2.1.43:)的正向活性(由Formate形成CO2)(Liu CL et al.,J.Bacteriol.1984,159(1),375-380;Keamy JJ et al.,J.Bacteriol.1972,109(1),152-161)。因此,在这些菌株中,在CO2及CO不足的情况下,由甲醇(CH3OH)及甲酸(HCOOH)生成CO2这一方向的反应可以部分进行(图1)。前述通过添加CH3OH增大甲酸氢化酶(formatede hydrogenase)活性及CODH活性的现象(Kerby R et al.,J.Bateriol.1987,169(12),5605-5609)也可以说明这一点。即,可以将甲酸(HCOOH)或甲醇(CH3OH)作为唯一的碳源增殖。
即使宿主细胞原本是不具备甲酸脱氢酶正向活性的菌株,只要通过导入变异、导入外源基因或基因组改组等进行基因修饰从而赋予其正向活性即可。
由上可知,在宿主细胞具有乙酰CoA途径和甲醇途径的情况下,可以使用以下气体或液体生产所述有机化合物。
·CO
·CO2
·CO/H2
·CO2/H2
·CO/CO2/H2
·CO/HCOOH
·CO2/HCOOH
·CO/CH3OH
·CO2/CH3OH
·CO/H2/HCOOH
·CO2/H2/HCOOH
·CO/H2/CH3OH
·CO2/H2/CH3OH
·CO/CO2/H2/HCOOH
·CO/CO2/H2/CH3OH
·CH3OH/H2
·HCOOH/H2
·CH3OH
·HCOOH
需要说明的是,作为本发明的重组细胞,在专门为了增加细胞而不以生产有机化合物为目的进行培养的情况下,无需将一氧化碳及二氧化碳作为碳源。例如,使用糖类或甘油等其它碳源培养重组细胞即可。
下面,通过实施例对本发明进行更具体说明,但本发明不仅限定于实施例。
实施例1
在本实施例中,通过合成气同化细菌的一种即李氏梭菌(Clostridiumljungdahlii)的重组细胞高效生产β-水芹烯。
(1)各种载体的构建
参考Appl Biochem Biotechnol(2012)168:1384_1393、Bioprocess Biosyst Eng(2014)37:245_260,制作包含李氏梭菌(C.ljungdahlii)的adhE1(CLJU_c16510)上游序列、lox66序列、氯霉素抗性基因(FM201786)、lox71序列及李氏梭菌(C.ljungdahlii)的adhE2(CLJU_c16520)下游序列的pUC-ΔadhE-Cat(序列号11)。
另外,对作为梭菌/大肠杆菌(Clostridium/E.coli)的双元载体pJIR750ai(Sigma-Aldrich)进行修饰,构建包含对β-水芹烯合成酶基因(GenBank Accession No.:FJ797957;Schilmiller,A.L.,et al.,Proc Natl Acad Sci U S A.,2009,106,10865-70.)、橙花基二磷酸(NPP)合成酶基因(GenBank Accession No.:FJ797956)、氯霉素抗性基因(FM201786)的密码子进行修饰后的碱基序列的pSK1-PHS-NPPS(序列号12)。
另外,构建除序列号12的序列之外进一步包含来自放线菌的甲羟戊酸途径基因簇(包含来自Pseudomonas mevalonii的mvaA)的pSK1-PHS-NPPS-MVA(序列号13)。关于各序列,进行密码子修饰,并将梭菌(Clostridium)属细菌的密码子使用频率考虑在内。
(2)adhE基因敲除的梭菌(Clostridium)株的制作
使用Leang C.et al.,Appl Environ Microbiol.2013 79(4),1102-9中推荐的手法将pUC-ΔadhE-Cat导入至李氏梭菌(C.ljungdahlii)(DSM13528/ATCC55383),利用包含10μg/mL氯霉素的ATCC1754琼脂培养基(1.5%Agar)进行选择,制成adhE1、adhE2敲除株(ΔadhE株)。通过Leang C.et al.,Appl Environ Microbiol.2013 79(4),1102-9中推荐的手法制作ΔadhE株感受态细胞。通过Bioprocess Biosyst Eng(2014)37:245_260中记载的手法对pUCΔadhE株感受态细胞进行Cre-recombinase处理,由此除去氯霉素抗性基因,得到氯霉素敏感株(ΔadhEΔCm株)。
(3)向DSM13528/ATCC55383株及ΔadhEΔCm株导入基因
使用Leang C.et al.,Appl Environ Microbiol.2013 79(4),1102-9中记载的手法,通过电穿孔,向DSM13528/ATCC55383株导入pSK1-PHS-NPPS、pSK1-PHS-NPPS-MVA,向ΔadhEΔCm株导入pSK1-PHS-NPPS-MVA,利用包含10μg/mL氯霉素的ATCC1754琼脂培养基(包含果糖,1.5%Agar)进行选择。
(4)β-水芹烯定量
上述(3)中选择出的导入pSK1-PHS-NPPS的DSM13528/ATCC55383株、导入pSK1-PHS-NPPS-MVA的DSM13528/ATCC55383株、导入pSK1-PHS-NPPS-MVA的ΔadhEΔCm株分别在37℃、厌氧条件下培养。转接至包含10μg/mL氯霉素的ATCC1754培养基(其中,pH=5.0,不含果糖)5mL,将CO/CO2/H2=33/33/34%(体积比)的混合气体投入容积为27mL的可封闭顶空小瓶容器中,在0.25MPa(绝对压力)的气体压力下填充,用铝盖密封之后,振荡培养。对于确认到增殖的菌株,在OD600达到1.0时停止培养,利用气相色谱质谱仪(岛津GCMS-QP2010Ultra)对气相进行分析。
结果,在导入pSK1-PHS-NPPS的DSM13528/ATCC55383株中,检测到平均生产量为0.15mg的β-水芹烯/干燥菌体(g)的β-水芹烯。在pSK1-PHS-NPPS-MVA导入DSM13528/ATCC55383株中,检测到平均生产量为10mg的β-水芹烯/干燥菌体(g)的β-水芹烯。在导入pSK1-PHS-NPPS-MVA的ΔadhEΔCm株中,检测到平均为55mgβ-水芹烯/干燥菌体(g)的β-水芹烯。
由以上可知,通过向宿主细胞中导入产生β-水芹烯前体的外源甲羟戊酸途径,作为环单萜烯的一种的β-水芹烯的产生量提高。另外,通过敲除作为NAD(P)H消耗途径的adhE1、adhE2基因,可以更有效地生产β-水芹烯。
实施例2
在本实施例中,在pUC57(GenBank Accession No.Y14837)中导入李氏梭菌(C.ljungdahlii)的基因组序列以及包含外源性甲羟戊酸途径及异戊二烯合成酶的基因簇,由此构建序列,并通过同源重组将其导入李氏梭菌(C.ljungdahlii),由此,制作宿主adhE1、adhE2被敲除且基因组中导入有该基因簇的重组细胞。并且,在该重组细胞中高效生产异戊二烯。
(1)各种载体的构建
向pUC57(GenBank Accession No.Y14837)中导入包含李氏梭菌(C.ljungdahlii)(DSM13528/ATCC55383)的adhE1(CLJU_c16510)上游序列、adhE2(CLJU_c16520)下游序列、来自放线菌的甲羟戊酸途径基因(包含来自Pseudomonas mevalonii的mvaA)、来自白杨的异戊二烯合成酶基因(GenBank Accession No.:AM410988.1)及氯霉素抗性基因(FM201786)(Appl Biochem Biotechnol.2012May;167(2):338-47.)的基因簇,从而构建pUC-ΔadhE-IspS-MVA(序列号14)。另外,向pJIR750ai(Sigma-Aldrich)修饰序列导入来自白杨的异戊二烯合成酶基因(GenBank Accession No.:AM410988.1)及氯霉素抗性基因(FM201786)、来自放线菌的甲羟戊酸途径基因(包含来自Pseudomonas mevalonii的mvaAを),从而构建pSK1-IspS-MVA(序列号15)。针对各序列考虑梭菌(Clostridium)属细菌的密码子使用频率进行密码子修饰。
(2)基因导入
使用Leang C.et al.,Appl Environ Microbiol.2013 79(4),1102-9中记载的手法,通过电穿孔,向李氏梭菌(C.ljungdahlii)(DSM13528/ATCC55383)导入pUC-ΔadhE-IspS-MVA,通过该包含10μg/mL氯霉素的ATCC1754琼脂培养基(包含果糖,1.5%寒天)进行选择。将可以确认到由pUC-ΔadhE-IspS-MVA的基因导入产生的adhE1、adhE2缺失及异戊二烯基因的基因组导入的菌株作为ΔadhE-IspS-MVA株。另外,使用Leang C.et al.,ApplEnviron Microbiol.201379(4),1102-9中记载的手法,通过电穿孔,分别向李氏梭菌(C.ljungdahlii)(DSM13528/ATCC55383)、实施例1中制得的ΔadhEΔCm株导入pSK1-IspS-MVA,通过包含10μg/mL氯霉素的ATCC1754琼脂培养基(包含果糖,1.5%Agar)进行选择。
(3)异戊二烯定量
上述(2)中获得的ΔadhE-IspS-MVA株、导入pSK1-IspS-MVA的DSM13528/ATCC55383、导入pSK1-IspS-MVA的ΔadhEΔCm株分别在37℃、厌氧条件下培养。将包含10μg/mL氯霉素的ATCC培养基(medium)1754PETC培养基(其中,pH=5.0不含果糖)5mL装入容量为27mL的可密封顶空小瓶容器中,在0.25MPa(绝对压力)的气体压力下填充CO/CO2/H2=33/33/34%(体积比)的混合气体,利用铝盖密封之后,振荡培养。在OD600达到1.0时停止培养,利用气相色谱质谱仪(岛津GCMS-QP2010Ultra)对气相进行分析,在ΔadhE-IspS-MVA株中,检测到平均为185mg异戊二烯/干燥菌体(g),在导入pSK1-IspS-MVA的ΔadhEΔCm株中,检测到平均为74mg异戊二烯/干燥菌体(g),在导入pSK1-IspS-MVA的DSM13528/ATCC55383中,检测到平均为15mg异戊二烯/干燥菌体(g)。
由以上可知,通过向宿主细胞中导入产生异戊二烯的前体的外源甲羟戊酸途径,并且,敲除作为宿主NAD(P)H消耗途径的adhE1、adhE2基因,可以有效地生产异戊二烯。另外,通过利用同源重组向基因组中整合该碱基序列,可以更有效地生产异戊二烯。
序列表
<110> 积水化学工业株式会社
<120> 重组细胞,重组细胞的制造方法以及有机化合物的生产方法
<130> 15P01503
<160> 15
<170> PatentIn version 3.1
<210> 1
<211> 1788
<212> DNA
<213> 黑杨
<220>
<221> CDS
<222> (1)..(1788)
<223>
<400> 1
atg gca act gaa tta ttg tgc ttg cac cgt cca atc tca ctg aca cac 48
Met Ala Thr Glu Leu Leu Cys Leu His Arg Pro Ile Ser Leu Thr His
1 5 10 15
aaa ttg ttc aga aat ccc ttg cct aaa gtc atc cag gcc act ccc tta 96
Lys Leu Phe Arg Asn Pro Leu Pro Lys Val Ile Gln Ala Thr Pro Leu
20 25 30
act ttg aaa ctc aga tgt tct gta agc aca gaa aac gtc agc ttc aca 144
Thr Leu Lys Leu Arg Cys Ser Val Ser Thr Glu Asn Val Ser Phe Thr
35 40 45
gaa aca gaa aca gaa acc aga agg tct gcc aat tat gaa cca aat agc 192
Glu Thr Glu Thr Glu Thr Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser
50 55 60
tgg gat tat gat tat ttg ctg tct tcg gac act gac gaa tcg att gaa 240
Trp Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu
65 70 75 80
gta tac aaa gac aag gcc aaa aag ctg gag gct gag gtg aga aga gag 288
Val Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu
85 90 95
att aac aat gaa aag gca gag ttt ttg act ctg cct gaa ctg ata gat 336
Ile Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Pro Glu Leu Ile Asp
100 105 110
aat gtc caa agg tta gga tta ggt tac cgg ttc gag agt gac ata agg 384
Asn Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg
115 120 125
aga gcc ctt gat aga ttt gtt tct tca gga gga ttt gat gct gtt aca 432
Arg Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr
130 135 140
aaa act agc ctt cat gct act gct ctt agc ttc agg ctt ctc aga cag 480
Lys Thr Ser Leu His Ala Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln
145 150 155 160
cat ggc ttt gag gtc tct caa gaa gcg ttc agc gga ttc aag gat caa 528
His Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln
165 170 175
aat ggc aat ttc ttg aaa aac ctt aag gag gac atc aag gca ata cta 576
Asn Gly Asn Phe Leu Lys Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu
180 185 190
agc cta tat gaa gct tca ttt ctt gcc tta gaa gga gaa aat atc ttg 624
Ser Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu
195 200 205
gat gag gcc aag gtg ttt gca ata tca cat cta aaa gag ctc agc gaa 672
Asp Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu
210 215 220
gaa aag att gga aaa gac ctg gcc gaa cag gtg aat cat gca ttg gag 720
Glu Lys Ile Gly Lys Asp Leu Ala Glu Gln Val Asn His Ala Leu Glu
225 230 235 240
ctt cca ttg cat cga agg acg caa aga cta gaa gct gtt tgg agc att 768
Leu Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile
245 250 255
gaa gca tac cgt aaa aag gaa gat gca gat caa gta ctg cta gaa ctt 816
Glu Ala Tyr Arg Lys Lys Glu Asp Ala Asp Gln Val Leu Leu Glu Leu
260 265 270
gct ata ttg gac tac aac atg att caa tca gta tac caa aga gat ctt 864
Ala Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu
275 280 285
cgc gag aca tca agg tgg tgg agg cgt gtg ggt ctt gca aca aag ttg 912
Arg Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu
290 295 300
cat ttt gct aga gac agg tta att gaa agc ttt tac tgg gca gtt gga 960
His Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly
305 310 315 320
gtt gcg ttt gaa cct caa tac agt gat tgc cgt aat tcc gta gca aaa 1008
Val Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys
325 330 335
atg ttt tcg ttt gta aca atc att gat gat atc tat gat gtt tat ggt 1056
Met Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly
340 345 350
act ctg gat gag ttg gag cta ttt aca gat gct gtt gag aga tgg gat 1104
Thr Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp
355 360 365
gtt aat gcc atc gat gat ctt ccg gat tat atg aag ctc tgc ttc cta 1152
Val Asn Ala Ile Asp Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu
370 375 380
gct ctc tat aac act atc aat gag ata gct tat gat aat ctg aag gac 1200
Ala Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp
385 390 395 400
aag ggg gaa aac att ctt cca tac cta aca aaa gcg tgg gca gat tta 1248
Lys Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu
405 410 415
tgc aat gca ttc cta caa gaa gca aaa tgg ttg tac aat aag tcc aca 1296
Cys Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr
420 425 430
cca aca ttt gat gaa tat ttc gga aat gca tgg aaa tca tcc tca ggg 1344
Pro Thr Phe Asp Glu Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly
435 440 445
cct ctt caa cta gtt ttt gcc tac ttt gcc gtt gtt caa aac atc aag 1392
Pro Leu Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys
450 455 460
aaa gag gaa att gat aac tta caa aag tat cat gat atc atc agt agg 1440
Lys Glu Glu Ile Asp Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg
465 470 475 480
cct tcc cac atc ttt cgt ctt tgc aac gac ttg gct tca gca tcg gct 1488
Pro Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala
485 490 495
gag ata gcg aga ggt gaa acc gcg aat tct gta tca tgc tac atg cgt 1536
Glu Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg
500 505 510
aca aaa ggc att tct gag gaa ctt gct act gaa tcc gta atg aat ttg 1584
Thr Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu
515 520 525
atc gac gaa acc tgg aaa aag atg aac aaa gaa aag ctt ggt ggc tct 1632
Ile Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser
530 535 540
ctg ttt gca aaa cct ttt gtc gaa aca gct att aac ctt gca cga caa 1680
Leu Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln
545 550 555 560
tcc cat tgc act tat cac aac gga gat gcg cat act tca cca gat gag 1728
Ser His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu
565 570 575
ctc act agg aaa cgt gtc ctg tca gta atc aca gag cct att cta ccc 1776
Leu Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro
580 585 590
ttt gag aga taa 1788
Phe Glu Arg
595
<210> 2
<211> 595
<212> PRT
<213> 黑杨
<400> 2
Met Ala Thr Glu Leu Leu Cys Leu His Arg Pro Ile Ser Leu Thr His
1 5 10 15
Lys Leu Phe Arg Asn Pro Leu Pro Lys Val Ile Gln Ala Thr Pro Leu
20 25 30
Thr Leu Lys Leu Arg Cys Ser Val Ser Thr Glu Asn Val Ser Phe Thr
35 40 45
Glu Thr Glu Thr Glu Thr Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser
50 55 60
Trp Asp Tyr Asp Tyr Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu
65 70 75 80
Val Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu
85 90 95
Ile Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Pro Glu Leu Ile Asp
100 105 110
Asn Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg
115 120 125
Arg Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Ala Val Thr
130 135 140
Lys Thr Ser Leu His Ala Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln
145 150 155 160
His Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln
165 170 175
Asn Gly Asn Phe Leu Lys Asn Leu Lys Glu Asp Ile Lys Ala Ile Leu
180 185 190
Ser Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu
195 200 205
Asp Glu Ala Lys Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu
210 215 220
Glu Lys Ile Gly Lys Asp Leu Ala Glu Gln Val Asn His Ala Leu Glu
225 230 235 240
Leu Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile
245 250 255
Glu Ala Tyr Arg Lys Lys Glu Asp Ala Asp Gln Val Leu Leu Glu Leu
260 265 270
Ala Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu
275 280 285
Arg Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu
290 295 300
His Phe Ala Arg Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly
305 310 315 320
Val Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys
325 330 335
Met Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly
340 345 350
Thr Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp
355 360 365
Val Asn Ala Ile Asp Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu
370 375 380
Ala Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp
385 390 395 400
Lys Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu
405 410 415
Cys Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr
420 425 430
Pro Thr Phe Asp Glu Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly
435 440 445
Pro Leu Gln Leu Val Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys
450 455 460
Lys Glu Glu Ile Asp Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg
465 470 475 480
Pro Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala
485 490 495
Glu Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg
500 505 510
Thr Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu
515 520 525
Ile Asp Glu Thr Trp Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser
530 535 540
Leu Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln
545 550 555 560
Ser His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu
565 570 575
Leu Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro
580 585 590
Phe Glu Arg
595
<210> 3
<211> 1269
<212> DNA
<213> 拟南芥
<220>
<221> CDS
<222> (1)..(1269)
<223>
<400> 3
atg tta ttc acg agg agt gtt gct cgg att tct tct aag ttt ctg aga 48
Met Leu Phe Thr Arg Ser Val Ala Arg Ile Ser Ser Lys Phe Leu Arg
1 5 10 15
aac cgt agc ttc tat ggc tcc tct caa tct ctc gcc tct cat cgg ttc 96
Asn Arg Ser Phe Tyr Gly Ser Ser Gln Ser Leu Ala Ser His Arg Phe
20 25 30
gca atc att ccc gat cag ggt cac tct tgt tct gac tct cca cac aag 144
Ala Ile Ile Pro Asp Gln Gly His Ser Cys Ser Asp Ser Pro His Lys
35 40 45
ggt tac gtt tgc aga aca act tat tca ttg aaa tct ccg gtt ttt ggt 192
Gly Tyr Val Cys Arg Thr Thr Tyr Ser Leu Lys Ser Pro Val Phe Gly
50 55 60
gga ttt agt cat caa ctc tat cac cag agt agc tcc ttg gtt gag gag 240
Gly Phe Ser His Gln Leu Tyr His Gln Ser Ser Ser Leu Val Glu Glu
65 70 75 80
gag ctt gac cca ttt tcg ctt gtt gcc gat gag ctg tca ctt ctt agt 288
Glu Leu Asp Pro Phe Ser Leu Val Ala Asp Glu Leu Ser Leu Leu Ser
85 90 95
aat aag ttg aga gag atg gta ctt gcc gag gtt cca aag ctt gcc tct 336
Asn Lys Leu Arg Glu Met Val Leu Ala Glu Val Pro Lys Leu Ala Ser
100 105 110
gct gct gag tac ttc ttc aaa agg ggt gtg caa gga aaa cag ttt cgt 384
Ala Ala Glu Tyr Phe Phe Lys Arg Gly Val Gln Gly Lys Gln Phe Arg
115 120 125
tca act att ttg ctg ctg atg gcg aca gct ctg gat gta cga gtt cca 432
Ser Thr Ile Leu Leu Leu Met Ala Thr Ala Leu Asp Val Arg Val Pro
130 135 140
gaa gca ttg att ggg gaa tca aca gat ata gtc aca tca gaa tta cgc 480
Glu Ala Leu Ile Gly Glu Ser Thr Asp Ile Val Thr Ser Glu Leu Arg
145 150 155 160
gta agg caa cgg ggt att gct gaa atc act gaa atg ata cac gtc gca 528
Val Arg Gln Arg Gly Ile Ala Glu Ile Thr Glu Met Ile His Val Ala
165 170 175
agt cta ctg cac gat gat gtc ttg gat gat gcc gat aca agg cgt ggt 576
Ser Leu Leu His Asp Asp Val Leu Asp Asp Ala Asp Thr Arg Arg Gly
180 185 190
gtt ggt tcc tta aat gtt gta atg ggt aac aag atg tcg gta tta gca 624
Val Gly Ser Leu Asn Val Val Met Gly Asn Lys Met Ser Val Leu Ala
195 200 205
gga gac ttc ttg ctc tcc cgg gct tgt ggg gct ctc gct gct tta aag 672
Gly Asp Phe Leu Leu Ser Arg Ala Cys Gly Ala Leu Ala Ala Leu Lys
210 215 220
aac aca gag gtt gta gca tta ctt gca act gct gta gaa cat ctt gtt 720
Asn Thr Glu Val Val Ala Leu Leu Ala Thr Ala Val Glu His Leu Val
225 230 235 240
acc ggt gaa acc atg gag ata act agt tca acc gag cag cgt tat agt 768
Thr Gly Glu Thr Met Glu Ile Thr Ser Ser Thr Glu Gln Arg Tyr Ser
245 250 255
atg gac tac tac atg cag aag aca tat tat aag aca gca tcg cta atc 816
Met Asp Tyr Tyr Met Gln Lys Thr Tyr Tyr Lys Thr Ala Ser Leu Ile
260 265 270
tct aac agc tgc aaa gct gtt gcc gtt ctc act gga caa aca gca gaa 864
Ser Asn Ser Cys Lys Ala Val Ala Val Leu Thr Gly Gln Thr Ala Glu
275 280 285
gtt gcc gtg tta gct ttt gag tat ggg agg aat ctg ggt tta gca ttc 912
Val Ala Val Leu Ala Phe Glu Tyr Gly Arg Asn Leu Gly Leu Ala Phe
290 295 300
caa tta ata gac gac att ctt gat ttc acg ggc aca tct gcc tct ctc 960
Gln Leu Ile Asp Asp Ile Leu Asp Phe Thr Gly Thr Ser Ala Ser Leu
305 310 315 320
gga aag gga tcg ttg tca gat att cgc cat gga gtc ata aca gcc cca 1008
Gly Lys Gly Ser Leu Ser Asp Ile Arg His Gly Val Ile Thr Ala Pro
325 330 335
atc ctc ttt gcc atg gaa gag ttt cct caa cta cgc gaa gtt gtt gat 1056
Ile Leu Phe Ala Met Glu Glu Phe Pro Gln Leu Arg Glu Val Val Asp
340 345 350
caa gtt gaa aaa gat cct agg aat gtt gac att gct tta gag tat ctt 1104
Gln Val Glu Lys Asp Pro Arg Asn Val Asp Ile Ala Leu Glu Tyr Leu
355 360 365
ggg aag agc aag gga ata cag agg gca aga gaa tta gcc atg gaa cat 1152
Gly Lys Ser Lys Gly Ile Gln Arg Ala Arg Glu Leu Ala Met Glu His
370 375 380
gcg aat cta gca gca gct gca atc ggg tct cta cct gaa aca gac aat 1200
Ala Asn Leu Ala Ala Ala Ala Ile Gly Ser Leu Pro Glu Thr Asp Asn
385 390 395 400
gaa gat gtc aaa aga tcg agg cgg gca ctt att gac ttg acc cat aga 1248
Glu Asp Val Lys Arg Ser Arg Arg Ala Leu Ile Asp Leu Thr His Arg
405 410 415
gtc atc acc aga aac aag tga 1269
Val Ile Thr Arg Asn Lys
420
<210> 4
<211> 422
<212> PRT
<213> 拟南芥
<400> 4
Met Leu Phe Thr Arg Ser Val Ala Arg Ile Ser Ser Lys Phe Leu Arg
1 5 10 15
Asn Arg Ser Phe Tyr Gly Ser Ser Gln Ser Leu Ala Ser His Arg Phe
20 25 30
Ala Ile Ile Pro Asp Gln Gly His Ser Cys Ser Asp Ser Pro His Lys
35 40 45
Gly Tyr Val Cys Arg Thr Thr Tyr Ser Leu Lys Ser Pro Val Phe Gly
50 55 60
Gly Phe Ser His Gln Leu Tyr His Gln Ser Ser Ser Leu Val Glu Glu
65 70 75 80
Glu Leu Asp Pro Phe Ser Leu Val Ala Asp Glu Leu Ser Leu Leu Ser
85 90 95
Asn Lys Leu Arg Glu Met Val Leu Ala Glu Val Pro Lys Leu Ala Ser
100 105 110
Ala Ala Glu Tyr Phe Phe Lys Arg Gly Val Gln Gly Lys Gln Phe Arg
115 120 125
Ser Thr Ile Leu Leu Leu Met Ala Thr Ala Leu Asp Val Arg Val Pro
130 135 140
Glu Ala Leu Ile Gly Glu Ser Thr Asp Ile Val Thr Ser Glu Leu Arg
145 150 155 160
Val Arg Gln Arg Gly Ile Ala Glu Ile Thr Glu Met Ile His Val Ala
165 170 175
Ser Leu Leu His Asp Asp Val Leu Asp Asp Ala Asp Thr Arg Arg Gly
180 185 190
Val Gly Ser Leu Asn Val Val Met Gly Asn Lys Met Ser Val Leu Ala
195 200 205
Gly Asp Phe Leu Leu Ser Arg Ala Cys Gly Ala Leu Ala Ala Leu Lys
210 215 220
Asn Thr Glu Val Val Ala Leu Leu Ala Thr Ala Val Glu His Leu Val
225 230 235 240
Thr Gly Glu Thr Met Glu Ile Thr Ser Ser Thr Glu Gln Arg Tyr Ser
245 250 255
Met Asp Tyr Tyr Met Gln Lys Thr Tyr Tyr Lys Thr Ala Ser Leu Ile
260 265 270
Ser Asn Ser Cys Lys Ala Val Ala Val Leu Thr Gly Gln Thr Ala Glu
275 280 285
Val Ala Val Leu Ala Phe Glu Tyr Gly Arg Asn Leu Gly Leu Ala Phe
290 295 300
Gln Leu Ile Asp Asp Ile Leu Asp Phe Thr Gly Thr Ser Ala Ser Leu
305 310 315 320
Gly Lys Gly Ser Leu Ser Asp Ile Arg His Gly Val Ile Thr Ala Pro
325 330 335
Ile Leu Phe Ala Met Glu Glu Phe Pro Gln Leu Arg Glu Val Val Asp
340 345 350
Gln Val Glu Lys Asp Pro Arg Asn Val Asp Ile Ala Leu Glu Tyr Leu
355 360 365
Gly Lys Ser Lys Gly Ile Gln Arg Ala Arg Glu Leu Ala Met Glu His
370 375 380
Ala Asn Leu Ala Ala Ala Ala Ile Gly Ser Leu Pro Glu Thr Asp Asn
385 390 395 400
Glu Asp Val Lys Arg Ser Arg Arg Ala Leu Ile Asp Leu Thr His Arg
405 410 415
Val Ile Thr Arg Asn Lys
420
<210> 5
<211> 912
<212> DNA
<213> 番茄
<220>
<221> CDS
<222> (1)..(912)
<223>
<400> 5
atg agt tct ttg gtt ctt caa tgt tgg aaa tta tca tct cca tct ctg 48
Met Ser Ser Leu Val Leu Gln Cys Trp Lys Leu Ser Ser Pro Ser Leu
1 5 10 15
att tta caa caa aat aca tca ata tcc atg ggt gca ttc aaa ggt att 96
Ile Leu Gln Gln Asn Thr Ser Ile Ser Met Gly Ala Phe Lys Gly Ile
20 25 30
cat aaa ctt caa atc cca aat tcg cct ctg aca gtg tct gct cgt gga 144
His Lys Leu Gln Ile Pro Asn Ser Pro Leu Thr Val Ser Ala Arg Gly
35 40 45
ctc aac aag att tca tgc tca ctc aac tta caa acc gaa aag ctt tgt 192
Leu Asn Lys Ile Ser Cys Ser Leu Asn Leu Gln Thr Glu Lys Leu Cys
50 55 60
tat gag gat aat gat aat gat ctt gat gaa gaa ctt atg cct aaa cac 240
Tyr Glu Asp Asn Asp Asn Asp Leu Asp Glu Glu Leu Met Pro Lys His
65 70 75 80
att gct ttg ata atg gat ggt aat agg aga tgg gca aag gat aag ggt 288
Ile Ala Leu Ile Met Asp Gly Asn Arg Arg Trp Ala Lys Asp Lys Gly
85 90 95
tta gaa gta tat gaa ggt cac aaa cat att att cca aaa tta aaa gag 336
Leu Glu Val Tyr Glu Gly His Lys His Ile Ile Pro Lys Leu Lys Glu
100 105 110
att tgt gac att tct tct aaa ttg gga ata caa att atc act gct ttt 384
Ile Cys Asp Ile Ser Ser Lys Leu Gly Ile Gln Ile Ile Thr Ala Phe
115 120 125
gca ttc tct act gaa aat tgg aaa cga tcc aag gag gag gtt gat ttc 432
Ala Phe Ser Thr Glu Asn Trp Lys Arg Ser Lys Glu Glu Val Asp Phe
130 135 140
ttg ttg caa atg ttc gaa gaa atc tat gat gag ttt tcg agg tct gga 480
Leu Leu Gln Met Phe Glu Glu Ile Tyr Asp Glu Phe Ser Arg Ser Gly
145 150 155 160
gta aga gtg tct att ata ggt tgt aaa tcc gac ctc cca atg aca tta 528
Val Arg Val Ser Ile Ile Gly Cys Lys Ser Asp Leu Pro Met Thr Leu
165 170 175
caa aaa tgc ata gca tta aca gaa gag act aca aag ggc aac aaa gga 576
Gln Lys Cys Ile Ala Leu Thr Glu Glu Thr Thr Lys Gly Asn Lys Gly
180 185 190
ctt cac ctt gtg att gca cta aac tat ggt gga tat tat gac ata ttg 624
Leu His Leu Val Ile Ala Leu Asn Tyr Gly Gly Tyr Tyr Asp Ile Leu
195 200 205
caa gca aca aaa agc att gtt aat aaa gca atg aat ggt tta tta gat 672
Gln Ala Thr Lys Ser Ile Val Asn Lys Ala Met Asn Gly Leu Leu Asp
210 215 220
gta gaa gat atc aac aag aat tta ttt gat caa gaa ctt gaa agc aag 720
Val Glu Asp Ile Asn Lys Asn Leu Phe Asp Gln Glu Leu Glu Ser Lys
225 230 235 240
tgt cca aat cct gat tta ctt ata agg aca gga ggt gaa caa aga gtt 768
Cys Pro Asn Pro Asp Leu Leu Ile Arg Thr Gly Gly Glu Gln Arg Val
245 250 255
agt aac ttt ttg ttg tgg caa ttg gct tac act gaa ttt tac ttc acc 816
Ser Asn Phe Leu Leu Trp Gln Leu Ala Tyr Thr Glu Phe Tyr Phe Thr
260 265 270
aac aca ttg ttt cct gat ttt gga gag gaa gat ctt aaa gag gca ata 864
Asn Thr Leu Phe Pro Asp Phe Gly Glu Glu Asp Leu Lys Glu Ala Ile
275 280 285
atg aac ttt caa caa agg cat aga cgt ttt ggt gga cac aca tat tga 912
Met Asn Phe Gln Gln Arg His Arg Arg Phe Gly Gly His Thr Tyr
290 295 300
<210> 6
<211> 303
<212> PRT
<213> 番茄
<400> 6
Met Ser Ser Leu Val Leu Gln Cys Trp Lys Leu Ser Ser Pro Ser Leu
1 5 10 15
Ile Leu Gln Gln Asn Thr Ser Ile Ser Met Gly Ala Phe Lys Gly Ile
20 25 30
His Lys Leu Gln Ile Pro Asn Ser Pro Leu Thr Val Ser Ala Arg Gly
35 40 45
Leu Asn Lys Ile Ser Cys Ser Leu Asn Leu Gln Thr Glu Lys Leu Cys
50 55 60
Tyr Glu Asp Asn Asp Asn Asp Leu Asp Glu Glu Leu Met Pro Lys His
65 70 75 80
Ile Ala Leu Ile Met Asp Gly Asn Arg Arg Trp Ala Lys Asp Lys Gly
85 90 95
Leu Glu Val Tyr Glu Gly His Lys His Ile Ile Pro Lys Leu Lys Glu
100 105 110
Ile Cys Asp Ile Ser Ser Lys Leu Gly Ile Gln Ile Ile Thr Ala Phe
115 120 125
Ala Phe Ser Thr Glu Asn Trp Lys Arg Ser Lys Glu Glu Val Asp Phe
130 135 140
Leu Leu Gln Met Phe Glu Glu Ile Tyr Asp Glu Phe Ser Arg Ser Gly
145 150 155 160
Val Arg Val Ser Ile Ile Gly Cys Lys Ser Asp Leu Pro Met Thr Leu
165 170 175
Gln Lys Cys Ile Ala Leu Thr Glu Glu Thr Thr Lys Gly Asn Lys Gly
180 185 190
Leu His Leu Val Ile Ala Leu Asn Tyr Gly Gly Tyr Tyr Asp Ile Leu
195 200 205
Gln Ala Thr Lys Ser Ile Val Asn Lys Ala Met Asn Gly Leu Leu Asp
210 215 220
Val Glu Asp Ile Asn Lys Asn Leu Phe Asp Gln Glu Leu Glu Ser Lys
225 230 235 240
Cys Pro Asn Pro Asp Leu Leu Ile Arg Thr Gly Gly Glu Gln Arg Val
245 250 255
Ser Asn Phe Leu Leu Trp Gln Leu Ala Tyr Thr Glu Phe Tyr Phe Thr
260 265 270
Asn Thr Leu Phe Pro Asp Phe Gly Glu Glu Asp Leu Lys Glu Ala Ile
275 280 285
Met Asn Phe Gln Gln Arg His Arg Arg Phe Gly Gly His Thr Tyr
290 295 300
<210> 7
<211> 2337
<212> DNA
<213> 番茄
<220>
<221> CDS
<222> (1)..(2337)
<223>
<400> 7
atg ata gtt ggc tat aga agc aca atc ata acc ctt tct cat cct aag 48
Met Ile Val Gly Tyr Arg Ser Thr Ile Ile Thr Leu Ser His Pro Lys
1 5 10 15
cta ggc aat ggg aaa aca att tca tcc aat gca att ttc cag aga tca 96
Leu Gly Asn Gly Lys Thr Ile Ser Ser Asn Ala Ile Phe Gln Arg Ser
20 25 30
tgt aga gta aga tgc agc cac agt acc act tca tca atg aat ggt ttc 144
Cys Arg Val Arg Cys Ser His Ser Thr Thr Ser Ser Met Asn Gly Phe
35 40 45
gaa gat gca agg gat aga ata agg gaa agt ttt ggg aaa tta gag tta 192
Glu Asp Ala Arg Asp Arg Ile Arg Glu Ser Phe Gly Lys Leu Glu Leu
50 55 60
tct cct tct tcc tat gac aca gca tgg gta gct atg gtc cct tca aga 240
Ser Pro Ser Ser Tyr Asp Thr Ala Trp Val Ala Met Val Pro Ser Arg
65 70 75 80
cat tca cta aat gag cca tgt ttt cca caa tgt ttg gat tgg att att 288
His Ser Leu Asn Glu Pro Cys Phe Pro Gln Cys Leu Asp Trp Ile Ile
85 90 95
gaa aat caa aga gaa gat gga tct tgg gga cta aac cct acc cat cca 336
Glu Asn Gln Arg Glu Asp Gly Ser Trp Gly Leu Asn Pro Thr His Pro
100 105 110
ttg ctt cta aag gac tca ctt tct tcc act ctt gca tgt ttg ctt gca 384
Leu Leu Leu Lys Asp Ser Leu Ser Ser Thr Leu Ala Cys Leu Leu Ala
115 120 125
cta acc aaa tgg aga gtt gga gat gag caa atc aaa aga ggt ctt ggc 432
Leu Thr Lys Trp Arg Val Gly Asp Glu Gln Ile Lys Arg Gly Leu Gly
130 135 140
ttc att gaa acg tat ggt tgg gca gta gat aac aag gat caa att tca 480
Phe Ile Glu Thr Tyr Gly Trp Ala Val Asp Asn Lys Asp Gln Ile Ser
145 150 155 160
cct tta gga ttt gaa gtt ata ttt tct agt atg atc aaa tct gca gag 528
Pro Leu Gly Phe Glu Val Ile Phe Ser Ser Met Ile Lys Ser Ala Glu
165 170 175
aaa tta gat tta aat ttg cct ttg aat ctt cat ctt gta aat ttg gtg 576
Lys Leu Asp Leu Asn Leu Pro Leu Asn Leu His Leu Val Asn Leu Val
180 185 190
aaa tgc aaa aga gat tca aca att aaa agg aat gtt gaa tat atg ggt 624
Lys Cys Lys Arg Asp Ser Thr Ile Lys Arg Asn Val Glu Tyr Met Gly
195 200 205
gaa gga gtt ggt gaa tta tgt gat tgg aag gaa atg ata aag tta cat 672
Glu Gly Val Gly Glu Leu Cys Asp Trp Lys Glu Met Ile Lys Leu His
210 215 220
caa aga caa aat ggt tca tta ttt gat tca cca gcc act act gca gct 720
Gln Arg Gln Asn Gly Ser Leu Phe Asp Ser Pro Ala Thr Thr Ala Ala
225 230 235 240
gcc ttg att tat cat caa cat gat caa aaa tgc tat caa tat ctt aat 768
Ala Leu Ile Tyr His Gln His Asp Gln Lys Cys Tyr Gln Tyr Leu Asn
245 250 255
tca atc ttc caa caa cac aaa aat tgg gtt ccc act atg tat cca aca 816
Ser Ile Phe Gln Gln His Lys Asn Trp Val Pro Thr Met Tyr Pro Thr
260 265 270
aag gta cat tca ttg ctt tgc ttg gtt gat aca ctt caa aat ctt gga 864
Lys Val His Ser Leu Leu Cys Leu Val Asp Thr Leu Gln Asn Leu Gly
275 280 285
gta cat cgg cat ttt aaa tca gaa ata aag aaa gct cta gat gaa ata 912
Val His Arg His Phe Lys Ser Glu Ile Lys Lys Ala Leu Asp Glu Ile
290 295 300
tac agg cta tgg caa caa aag aat gaa caa att ttc tca aat gtc acc 960
Tyr Arg Leu Trp Gln Gln Lys Asn Glu Gln Ile Phe Ser Asn Val Thr
305 310 315 320
cat tgt gct atg gct ttt cga ctt cta agg atg agc tac tat gat gtc 1008
His Cys Ala Met Ala Phe Arg Leu Leu Arg Met Ser Tyr Tyr Asp Val
325 330 335
tcc tca gat gaa cta gca gaa ttt gtg gat gaa gaa cat ttc ttt gca 1056
Ser Ser Asp Glu Leu Ala Glu Phe Val Asp Glu Glu His Phe Phe Ala
340 345 350
aca aat ggg aaa tat aaa agt cat gtt gaa att ctt gaa ctc cac aaa 1104
Thr Asn Gly Lys Tyr Lys Ser His Val Glu Ile Leu Glu Leu His Lys
355 360 365
gca tca caa ttg gct att gat cat gag aaa gat gac att ttg gat aaa 1152
Ala Ser Gln Leu Ala Ile Asp His Glu Lys Asp Asp Ile Leu Asp Lys
370 375 380
ata aac aat tgg aca aga gct ttt atg gag caa aaa ctc tta aac aat 1200
Ile Asn Asn Trp Thr Arg Ala Phe Met Glu Gln Lys Leu Leu Asn Asn
385 390 395 400
ggc ttc ata gat agg atg tca aag aaa gag gtg gaa ctt gct ttg agg 1248
Gly Phe Ile Asp Arg Met Ser Lys Lys Glu Val Glu Leu Ala Leu Arg
405 410 415
aag ttt tat acc aca tct cat cta gca gaa aat aga aga tat ata aag 1296
Lys Phe Tyr Thr Thr Ser His Leu Ala Glu Asn Arg Arg Tyr Ile Lys
420 425 430
tca tac gaa gag aac aat ttt aaa atc tta aaa gca gct tat agg tca 1344
Ser Tyr Glu Glu Asn Asn Phe Lys Ile Leu Lys Ala Ala Tyr Arg Ser
435 440 445
ccc aac att aac aat aag gac ttg tta gca ttt tca ata cac gac ttt 1392
Pro Asn Ile Asn Asn Lys Asp Leu Leu Ala Phe Ser Ile His Asp Phe
450 455 460
gaa tta tgc caa gct caa cac cga gaa gaa ctt caa caa ctc aag agg 1440
Glu Leu Cys Gln Ala Gln His Arg Glu Glu Leu Gln Gln Leu Lys Arg
465 470 475 480
tgg ttt gaa gat tat aga ttg gac caa ctc gga ctt gca gaa cga tat 1488
Trp Phe Glu Asp Tyr Arg Leu Asp Gln Leu Gly Leu Ala Glu Arg Tyr
485 490 495
ata cat gct agt tac tta ttt ggt gtt act gtt atc ccc gag cct gaa 1536
Ile His Ala Ser Tyr Leu Phe Gly Val Thr Val Ile Pro Glu Pro Glu
500 505 510
tta tcc gat gct cgc ctc atg tac gcg aaa tac gtc atg ctc ctg act 1584
Leu Ser Asp Ala Arg Leu Met Tyr Ala Lys Tyr Val Met Leu Leu Thr
515 520 525
att gtc gat gat cat ttc gag agt ttt gca tct aaa gat gaa tgt ttc 1632
Ile Val Asp Asp His Phe Glu Ser Phe Ala Ser Lys Asp Glu Cys Phe
530 535 540
aac atc att gaa tta gta gaa agg tgg gat gac tat gca agt gta ggt 1680
Asn Ile Ile Glu Leu Val Glu Arg Trp Asp Asp Tyr Ala Ser Val Gly
545 550 555 560
tat aaa tct gag aag gtt aaa gtt ttt ttt tct gtt ttc tat aaa tca 1728
Tyr Lys Ser Glu Lys Val Lys Val Phe Phe Ser Val Phe Tyr Lys Ser
565 570 575
ata gag gag ctt gca aca att gct gaa att aaa caa gga cga tcc gtc 1776
Ile Glu Glu Leu Ala Thr Ile Ala Glu Ile Lys Gln Gly Arg Ser Val
580 585 590
aaa aat cac ctt att aat ttg tgg ctt gaa ttg atg aag ttg atg ttg 1824
Lys Asn His Leu Ile Asn Leu Trp Leu Glu Leu Met Lys Leu Met Leu
595 600 605
atg gag cga gta gag tgg tgt tct ggc aag aca ata cca agc ata gaa 1872
Met Glu Arg Val Glu Trp Cys Ser Gly Lys Thr Ile Pro Ser Ile Glu
610 615 620
gag tac ttg tat gtt aca tct ata aca ttt tgt gca aaa ttg att cct 1920
Glu Tyr Leu Tyr Val Thr Ser Ile Thr Phe Cys Ala Lys Leu Ile Pro
625 630 635 640
ctc tca aca caa tat ttt ctt gga ata aaa ata tcc aaa gat cta cta 1968
Leu Ser Thr Gln Tyr Phe Leu Gly Ile Lys Ile Ser Lys Asp Leu Leu
645 650 655
gaa agt gat gaa ata tgt ggc cta tgg aat tgt agc ggt aga gtg atg 2016
Glu Ser Asp Glu Ile Cys Gly Leu Trp Asn Cys Ser Gly Arg Val Met
660 665 670
cga atc ctt aat gat tta caa gat tcc aag aga gaa caa aag gag gtc 2064
Arg Ile Leu Asn Asp Leu Gln Asp Ser Lys Arg Glu Gln Lys Glu Val
675 680 685
tca ata aat tta gtc aca tta cta atg aaa agt atg tct gag gaa gaa 2112
Ser Ile Asn Leu Val Thr Leu Leu Met Lys Ser Met Ser Glu Glu Glu
690 695 700
gct ata atg aag ata aag gaa atc ttg gaa atg aat aga aga gag tta 2160
Ala Ile Met Lys Ile Lys Glu Ile Leu Glu Met Asn Arg Arg Glu Leu
705 710 715 720
ttg aaa atg gtt tta gtt caa aaa aag gga agc caa ttg cct caa tta 2208
Leu Lys Met Val Leu Val Gln Lys Lys Gly Ser Gln Leu Pro Gln Leu
725 730 735
tgc aaa gat ata ttt tgg agg aca agc aaa tgg gct cat ttc act tat 2256
Cys Lys Asp Ile Phe Trp Arg Thr Ser Lys Trp Ala His Phe Thr Tyr
740 745 750
tca caa act gat gga tat aga att gca gag gaa atg aag aat cac att 2304
Ser Gln Thr Asp Gly Tyr Arg Ile Ala Glu Glu Met Lys Asn His Ile
755 760 765
gat gaa gtc ttt tac aaa cca ctc aat cat taa 2337
Asp Glu Val Phe Tyr Lys Pro Leu Asn His
770 775
<210> 8
<211> 778
<212> PRT
<213> 番茄
<400> 8
Met Ile Val Gly Tyr Arg Ser Thr Ile Ile Thr Leu Ser His Pro Lys
1 5 10 15
Leu Gly Asn Gly Lys Thr Ile Ser Ser Asn Ala Ile Phe Gln Arg Ser
20 25 30
Cys Arg Val Arg Cys Ser His Ser Thr Thr Ser Ser Met Asn Gly Phe
35 40 45
Glu Asp Ala Arg Asp Arg Ile Arg Glu Ser Phe Gly Lys Leu Glu Leu
50 55 60
Ser Pro Ser Ser Tyr Asp Thr Ala Trp Val Ala Met Val Pro Ser Arg
65 70 75 80
His Ser Leu Asn Glu Pro Cys Phe Pro Gln Cys Leu Asp Trp Ile Ile
85 90 95
Glu Asn Gln Arg Glu Asp Gly Ser Trp Gly Leu Asn Pro Thr His Pro
100 105 110
Leu Leu Leu Lys Asp Ser Leu Ser Ser Thr Leu Ala Cys Leu Leu Ala
115 120 125
Leu Thr Lys Trp Arg Val Gly Asp Glu Gln Ile Lys Arg Gly Leu Gly
130 135 140
Phe Ile Glu Thr Tyr Gly Trp Ala Val Asp Asn Lys Asp Gln Ile Ser
145 150 155 160
Pro Leu Gly Phe Glu Val Ile Phe Ser Ser Met Ile Lys Ser Ala Glu
165 170 175
Lys Leu Asp Leu Asn Leu Pro Leu Asn Leu His Leu Val Asn Leu Val
180 185 190
Lys Cys Lys Arg Asp Ser Thr Ile Lys Arg Asn Val Glu Tyr Met Gly
195 200 205
Glu Gly Val Gly Glu Leu Cys Asp Trp Lys Glu Met Ile Lys Leu His
210 215 220
Gln Arg Gln Asn Gly Ser Leu Phe Asp Ser Pro Ala Thr Thr Ala Ala
225 230 235 240
Ala Leu Ile Tyr His Gln His Asp Gln Lys Cys Tyr Gln Tyr Leu Asn
245 250 255
Ser Ile Phe Gln Gln His Lys Asn Trp Val Pro Thr Met Tyr Pro Thr
260 265 270
Lys Val His Ser Leu Leu Cys Leu Val Asp Thr Leu Gln Asn Leu Gly
275 280 285
Val His Arg His Phe Lys Ser Glu Ile Lys Lys Ala Leu Asp Glu Ile
290 295 300
Tyr Arg Leu Trp Gln Gln Lys Asn Glu Gln Ile Phe Ser Asn Val Thr
305 310 315 320
His Cys Ala Met Ala Phe Arg Leu Leu Arg Met Ser Tyr Tyr Asp Val
325 330 335
Ser Ser Asp Glu Leu Ala Glu Phe Val Asp Glu Glu His Phe Phe Ala
340 345 350
Thr Asn Gly Lys Tyr Lys Ser His Val Glu Ile Leu Glu Leu His Lys
355 360 365
Ala Ser Gln Leu Ala Ile Asp His Glu Lys Asp Asp Ile Leu Asp Lys
370 375 380
Ile Asn Asn Trp Thr Arg Ala Phe Met Glu Gln Lys Leu Leu Asn Asn
385 390 395 400
Gly Phe Ile Asp Arg Met Ser Lys Lys Glu Val Glu Leu Ala Leu Arg
405 410 415
Lys Phe Tyr Thr Thr Ser His Leu Ala Glu Asn Arg Arg Tyr Ile Lys
420 425 430
Ser Tyr Glu Glu Asn Asn Phe Lys Ile Leu Lys Ala Ala Tyr Arg Ser
435 440 445
Pro Asn Ile Asn Asn Lys Asp Leu Leu Ala Phe Ser Ile His Asp Phe
450 455 460
Glu Leu Cys Gln Ala Gln His Arg Glu Glu Leu Gln Gln Leu Lys Arg
465 470 475 480
Trp Phe Glu Asp Tyr Arg Leu Asp Gln Leu Gly Leu Ala Glu Arg Tyr
485 490 495
Ile His Ala Ser Tyr Leu Phe Gly Val Thr Val Ile Pro Glu Pro Glu
500 505 510
Leu Ser Asp Ala Arg Leu Met Tyr Ala Lys Tyr Val Met Leu Leu Thr
515 520 525
Ile Val Asp Asp His Phe Glu Ser Phe Ala Ser Lys Asp Glu Cys Phe
530 535 540
Asn Ile Ile Glu Leu Val Glu Arg Trp Asp Asp Tyr Ala Ser Val Gly
545 550 555 560
Tyr Lys Ser Glu Lys Val Lys Val Phe Phe Ser Val Phe Tyr Lys Ser
565 570 575
Ile Glu Glu Leu Ala Thr Ile Ala Glu Ile Lys Gln Gly Arg Ser Val
580 585 590
Lys Asn His Leu Ile Asn Leu Trp Leu Glu Leu Met Lys Leu Met Leu
595 600 605
Met Glu Arg Val Glu Trp Cys Ser Gly Lys Thr Ile Pro Ser Ile Glu
610 615 620
Glu Tyr Leu Tyr Val Thr Ser Ile Thr Phe Cys Ala Lys Leu Ile Pro
625 630 635 640
Leu Ser Thr Gln Tyr Phe Leu Gly Ile Lys Ile Ser Lys Asp Leu Leu
645 650 655
Glu Ser Asp Glu Ile Cys Gly Leu Trp Asn Cys Ser Gly Arg Val Met
660 665 670
Arg Ile Leu Asn Asp Leu Gln Asp Ser Lys Arg Glu Gln Lys Glu Val
675 680 685
Ser Ile Asn Leu Val Thr Leu Leu Met Lys Ser Met Ser Glu Glu Glu
690 695 700
Ala Ile Met Lys Ile Lys Glu Ile Leu Glu Met Asn Arg Arg Glu Leu
705 710 715 720
Leu Lys Met Val Leu Val Gln Lys Lys Gly Ser Gln Leu Pro Gln Leu
725 730 735
Cys Lys Asp Ile Phe Trp Arg Thr Ser Lys Trp Ala His Phe Thr Tyr
740 745 750
Ser Gln Thr Asp Gly Tyr Arg Ile Ala Glu Glu Met Lys Asn His Ile
755 760 765
Asp Glu Val Phe Tyr Lys Pro Leu Asn His
770 775
<210> 9
<211> 1746
<212> DNA
<213> 薰衣草
<220>
<221> CDS
<222> (1)..(1746)
<223>
<400> 9
atg tct acc att att gcg ata caa gtg ttg ctt cct att cca act act 48
Met Ser Thr Ile Ile Ala Ile Gln Val Leu Leu Pro Ile Pro Thr Thr
1 5 10 15
aaa aca tac cct agt cat gac ttg gag aag tcc tct tcg cgg tgt cgc 96
Lys Thr Tyr Pro Ser His Asp Leu Glu Lys Ser Ser Ser Arg Cys Arg
20 25 30
tcc tcc tcc act cct cgc cct aga ctg tgt tgc tcg ttg cag gtg agt 144
Ser Ser Ser Thr Pro Arg Pro Arg Leu Cys Cys Ser Leu Gln Val Ser
35 40 45
gat ccg atc cca acg ggc cgg cga tcc gga ggc tac ccg ccc gcc cta 192
Asp Pro Ile Pro Thr Gly Arg Arg Ser Gly Gly Tyr Pro Pro Ala Leu
50 55 60
tgg gat ttc gac act att caa tcg ctc aac acc gag tat aag gga gag 240
Trp Asp Phe Asp Thr Ile Gln Ser Leu Asn Thr Glu Tyr Lys Gly Glu
65 70 75 80
agg cac atg aga agg gaa gaa gac cta att ggg caa gtt aga gag atg 288
Arg His Met Arg Arg Glu Glu Asp Leu Ile Gly Gln Val Arg Glu Met
85 90 95
ctg gtg cat gaa gta gag gat ccc act cca cag ctg gag ttc att gat 336
Leu Val His Glu Val Glu Asp Pro Thr Pro Gln Leu Glu Phe Ile Asp
100 105 110
gat ttg cat aag ctt ggc ata tct tgc cat ttt gag aat gaa atc ctc 384
Asp Leu His Lys Leu Gly Ile Ser Cys His Phe Glu Asn Glu Ile Leu
115 120 125
caa atc ttg aaa tcc ata tat ctt aat caa aac tac aaa agg gat ttg 432
Gln Ile Leu Lys Ser Ile Tyr Leu Asn Gln Asn Tyr Lys Arg Asp Leu
130 135 140
tac tca aca tct cta gca ttc aga ctc ctc aga caa tat ggc ttc atc 480
Tyr Ser Thr Ser Leu Ala Phe Arg Leu Leu Arg Gln Tyr Gly Phe Ile
145 150 155 160
ctt cca caa gaa gta ttt gat tgt ttc aag aat gag gag ggt acg gat 528
Leu Pro Gln Glu Val Phe Asp Cys Phe Lys Asn Glu Glu Gly Thr Asp
165 170 175
ttc aag cca agc ttc ggc cgt gat atc aaa ggc ttg tta caa ttg tat 576
Phe Lys Pro Ser Phe Gly Arg Asp Ile Lys Gly Leu Leu Gln Leu Tyr
180 185 190
gaa gct tct ttc cta tca aga aaa gga gaa gaa act tta caa cta gca 624
Glu Ala Ser Phe Leu Ser Arg Lys Gly Glu Glu Thr Leu Gln Leu Ala
195 200 205
aga gag ttt gca aca aag att ctg caa aaa gaa gtt gat gag aga gag 672
Arg Glu Phe Ala Thr Lys Ile Leu Gln Lys Glu Val Asp Glu Arg Glu
210 215 220
ttt gca acc aag atg gag ttc cct tct cat tgg acg gtt caa atg ccg 720
Phe Ala Thr Lys Met Glu Phe Pro Ser His Trp Thr Val Gln Met Pro
225 230 235 240
aat gca aga cct ttc atc gat gct tac cgt agg agg ccg gat atg aat 768
Asn Ala Arg Pro Phe Ile Asp Ala Tyr Arg Arg Arg Pro Asp Met Asn
245 250 255
cca gtt gtg ctc gag cta gcc ata ctt gat aca aat ata gtt caa gca 816
Pro Val Val Leu Glu Leu Ala Ile Leu Asp Thr Asn Ile Val Gln Ala
260 265 270
caa ttt caa gaa gaa ctc aaa gag acc tca agg tgg tgg gag agt aca 864
Gln Phe Gln Glu Glu Leu Lys Glu Thr Ser Arg Trp Trp Glu Ser Thr
275 280 285
ggc att gtc caa gag ctt cca ttt gtg agg gat agg att gtg gaa ggc 912
Gly Ile Val Gln Glu Leu Pro Phe Val Arg Asp Arg Ile Val Glu Gly
290 295 300
tac ttt tgg acg att gga gtg act cag aga cgc gag cat gga tac gaa 960
Tyr Phe Trp Thr Ile Gly Val Thr Gln Arg Arg Glu His Gly Tyr Glu
305 310 315 320
aga atc atg acc gca aag gtt att gcc tta gta aca tgt tta gac gac 1008
Arg Ile Met Thr Ala Lys Val Ile Ala Leu Val Thr Cys Leu Asp Asp
325 330 335
ata tac gat gtt tat ggc acg ata gaa gag ctt caa ctt ttc aca agc 1056
Ile Tyr Asp Val Tyr Gly Thr Ile Glu Glu Leu Gln Leu Phe Thr Ser
340 345 350
aca atc caa aga tgg gat ttg gaa tca atg aag caa ctc cct acc tac 1104
Thr Ile Gln Arg Trp Asp Leu Glu Ser Met Lys Gln Leu Pro Thr Tyr
355 360 365
atg caa gta agc ttt ctt gca cta cac aac ttt gta acc gag gtg gct 1152
Met Gln Val Ser Phe Leu Ala Leu His Asn Phe Val Thr Glu Val Ala
370 375 380
tac gat act ctc aag aaa aag ggc tac aac tcc aca cca tat tta aga 1200
Tyr Asp Thr Leu Lys Lys Lys Gly Tyr Asn Ser Thr Pro Tyr Leu Arg
385 390 395 400
aaa acg tgg gtg gat ctt gtt gaa tca tat atc aaa gag gca act tgg 1248
Lys Thr Trp Val Asp Leu Val Glu Ser Tyr Ile Lys Glu Ala Thr Trp
405 410 415
tac tac aac ggt tat aaa cct agt atg caa gaa tac ctt aac aat gca 1296
Tyr Tyr Asn Gly Tyr Lys Pro Ser Met Gln Glu Tyr Leu Asn Asn Ala
420 425 430
tgg ata tca gtc gga agt atg gct ata ctc aac cac ctc ttc ttc cgg 1344
Trp Ile Ser Val Gly Ser Met Ala Ile Leu Asn His Leu Phe Phe Arg
435 440 445
ttc aca aac gag aga atg cat aaa tac cgc gat atg aac cgt gtc tcg 1392
Phe Thr Asn Glu Arg Met His Lys Tyr Arg Asp Met Asn Arg Val Ser
450 455 460
tcc aac att gtg agg ctt gct gat gat atg gga aca tca ttg gct gag 1440
Ser Asn Ile Val Arg Leu Ala Asp Asp Met Gly Thr Ser Leu Ala Glu
465 470 475 480
gtg gag aga ggg gac gtg ccg aaa gca att caa tgc tac atg aat gag 1488
Val Glu Arg Gly Asp Val Pro Lys Ala Ile Gln Cys Tyr Met Asn Glu
485 490 495
acg aat gct tct gaa gaa gaa gca aga gaa tat gta aga aga gtc ata 1536
Thr Asn Ala Ser Glu Glu Glu Ala Arg Glu Tyr Val Arg Arg Val Ile
500 505 510
cag gaa gaa tgg gaa aag ttg aac aca gaa ttg atg cgg gat gat gat 1584
Gln Glu Glu Trp Glu Lys Leu Asn Thr Glu Leu Met Arg Asp Asp Asp
515 520 525
gat gat gat gat ttt aca cta tcc aaa tat tac tgt gag gtg gtt gct 1632
Asp Asp Asp Asp Phe Thr Leu Ser Lys Tyr Tyr Cys Glu Val Val Ala
530 535 540
aat ctt aca aga atg gca cag ttt ata tac caa gat gga tcg gat ggc 1680
Asn Leu Thr Arg Met Ala Gln Phe Ile Tyr Gln Asp Gly Ser Asp Gly
545 550 555 560
ttc ggc atg aaa gat tcc aag gtt aat aga ctg cta aaa gag acg ttg 1728
Phe Gly Met Lys Asp Ser Lys Val Asn Arg Leu Leu Lys Glu Thr Leu
565 570 575
atc gag cgc tac gaa taa 1746
Ile Glu Arg Tyr Glu
580
<210> 10
<211> 581
<212> PRT
<213> 薰衣草
<400> 10
Met Ser Thr Ile Ile Ala Ile Gln Val Leu Leu Pro Ile Pro Thr Thr
1 5 10 15
Lys Thr Tyr Pro Ser His Asp Leu Glu Lys Ser Ser Ser Arg Cys Arg
20 25 30
Ser Ser Ser Thr Pro Arg Pro Arg Leu Cys Cys Ser Leu Gln Val Ser
35 40 45
Asp Pro Ile Pro Thr Gly Arg Arg Ser Gly Gly Tyr Pro Pro Ala Leu
50 55 60
Trp Asp Phe Asp Thr Ile Gln Ser Leu Asn Thr Glu Tyr Lys Gly Glu
65 70 75 80
Arg His Met Arg Arg Glu Glu Asp Leu Ile Gly Gln Val Arg Glu Met
85 90 95
Leu Val His Glu Val Glu Asp Pro Thr Pro Gln Leu Glu Phe Ile Asp
100 105 110
Asp Leu His Lys Leu Gly Ile Ser Cys His Phe Glu Asn Glu Ile Leu
115 120 125
Gln Ile Leu Lys Ser Ile Tyr Leu Asn Gln Asn Tyr Lys Arg Asp Leu
130 135 140
Tyr Ser Thr Ser Leu Ala Phe Arg Leu Leu Arg Gln Tyr Gly Phe Ile
145 150 155 160
Leu Pro Gln Glu Val Phe Asp Cys Phe Lys Asn Glu Glu Gly Thr Asp
165 170 175
Phe Lys Pro Ser Phe Gly Arg Asp Ile Lys Gly Leu Leu Gln Leu Tyr
180 185 190
Glu Ala Ser Phe Leu Ser Arg Lys Gly Glu Glu Thr Leu Gln Leu Ala
195 200 205
Arg Glu Phe Ala Thr Lys Ile Leu Gln Lys Glu Val Asp Glu Arg Glu
210 215 220
Phe Ala Thr Lys Met Glu Phe Pro Ser His Trp Thr Val Gln Met Pro
225 230 235 240
Asn Ala Arg Pro Phe Ile Asp Ala Tyr Arg Arg Arg Pro Asp Met Asn
245 250 255
Pro Val Val Leu Glu Leu Ala Ile Leu Asp Thr Asn Ile Val Gln Ala
260 265 270
Gln Phe Gln Glu Glu Leu Lys Glu Thr Ser Arg Trp Trp Glu Ser Thr
275 280 285
Gly Ile Val Gln Glu Leu Pro Phe Val Arg Asp Arg Ile Val Glu Gly
290 295 300
Tyr Phe Trp Thr Ile Gly Val Thr Gln Arg Arg Glu His Gly Tyr Glu
305 310 315 320
Arg Ile Met Thr Ala Lys Val Ile Ala Leu Val Thr Cys Leu Asp Asp
325 330 335
Ile Tyr Asp Val Tyr Gly Thr Ile Glu Glu Leu Gln Leu Phe Thr Ser
340 345 350
Thr Ile Gln Arg Trp Asp Leu Glu Ser Met Lys Gln Leu Pro Thr Tyr
355 360 365
Met Gln Val Ser Phe Leu Ala Leu His Asn Phe Val Thr Glu Val Ala
370 375 380
Tyr Asp Thr Leu Lys Lys Lys Gly Tyr Asn Ser Thr Pro Tyr Leu Arg
385 390 395 400
Lys Thr Trp Val Asp Leu Val Glu Ser Tyr Ile Lys Glu Ala Thr Trp
405 410 415
Tyr Tyr Asn Gly Tyr Lys Pro Ser Met Gln Glu Tyr Leu Asn Asn Ala
420 425 430
Trp Ile Ser Val Gly Ser Met Ala Ile Leu Asn His Leu Phe Phe Arg
435 440 445
Phe Thr Asn Glu Arg Met His Lys Tyr Arg Asp Met Asn Arg Val Ser
450 455 460
Ser Asn Ile Val Arg Leu Ala Asp Asp Met Gly Thr Ser Leu Ala Glu
465 470 475 480
Val Glu Arg Gly Asp Val Pro Lys Ala Ile Gln Cys Tyr Met Asn Glu
485 490 495
Thr Asn Ala Ser Glu Glu Glu Ala Arg Glu Tyr Val Arg Arg Val Ile
500 505 510
Gln Glu Glu Trp Glu Lys Leu Asn Thr Glu Leu Met Arg Asp Asp Asp
515 520 525
Asp Asp Asp Asp Phe Thr Leu Ser Lys Tyr Tyr Cys Glu Val Val Ala
530 535 540
Asn Leu Thr Arg Met Ala Gln Phe Ile Tyr Gln Asp Gly Ser Asp Gly
545 550 555 560
Phe Gly Met Lys Asp Ser Lys Val Asn Arg Leu Leu Lys Glu Thr Leu
565 570 575
Ile Glu Arg Tyr Glu
580
<210> 11
<211> 5803
<212> DNA
<213> 人工制造
<220>
<223> 基因簇
<400> 11
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt ggagatcggt acttcgcgaa 420
tgcgtcgaga tggcgcgcct tggtaaagga tatatggtag tatttgcagg ggatacatag 480
ggagatatag aagttctacc aataggttca gaatttagcc atagttctga tctaaaagct 540
gtactagacg tatttgatac tgtaaaggta tttatatata acttaactcc tgaatcctct 600
gggtttatca agcctcccca agcatttaaa ttacgttcta gaattagaaa gggggtatga 660
cccataaaat attttccttt aaaagattca tatacacgat agggtaggtt tactacttta 720
gttggtttat catgatgact tacggtatcg gaatttaaaa tgttttgatt ttccataaat 780
atgacctcct agtatttagt attattttat gtaaatatat atgtagaagt gtaccatttg 840
tgcaagattt caataaaggg tatattttac ctattttttt agtataaaaa atgcaaaaaa 900
tatgaacaaa agtagagttc ctatgtatta aattgtaaaa tatccactaa aaaaataaaa 960
ttataataaa aaatacaaaa aaataattga caatatataa ataattatgc ataattatat 1020
catgataaca attagttaag cataattaca tatatatgaa cataatatga catcttagaa 1080
gcatatcttt cgttagtaat aatataattt cctttagaag aaaatgattt atttaaaata 1140
aatagtgtaa tgttttttat aatttcaaaa agttccccaa tttagcatac taggcatgat 1200
aaaaatagct tgaataagtg cccgggatta tttattgata catagagaat ttcactcttt 1260
gcattttatc taacatcaag gggtttattt gtcacaaatt atgtaaaaat aaaacaaaga 1320
tgtaagaaag tcctatgata taaattttgt aaacataata aattagcttt cataagattg 1380
gaagaatgat aattactact tagaactgct aaaaattagg aaagaggtgt cgttaattat 1440
accgttcgta taatgtatgc tatacgaagt tatttcagat taaatttttg cttatttgat 1500
ttacattata taatattgag taaagtattg actagcaaaa ttttttgata ctttaatttg 1560
tgaaatttct tatcaaaagt tatatttttg aatgattttt attgaaaaat acaactaaaa 1620
aggattatag tataagtgtg tgtaattttg tgttaaattt aaagggagga aatgaacatg 1680
aactttaata aaattgattt agacaattgg aagagaaaag agatatttaa tcattatttg 1740
aaccaacaaa cgacttttag tataaccaca gaaattgata ttagtgtttt atacagaaac 1800
ataaaacaag aaggatataa attttaccct gcatttattt tcttagtgac aagggtgata 1860
aactcaaata cagcttttag aactggttac aatagcgacg gagagttagg ttattgggat 1920
aagttagagc cactttatac aatttttgat ggtgtatcta aaacattctc tggtatttgg 1980
actcctgtaa agaatgactt caaagagttt tatgatttat acctttctga tgtagagaaa 2040
tataatggtt cggggaaatt gtttcccaaa acacctatac ctgaaaatgc tttttctctt 2100
tctattattc catggacttc atttactggg tttaacttaa atatcaataa taatagtaat 2160
taccttctac ccattattac agcaggaaaa ttcattaata aaggtaattc aatatattta 2220
ccgctatctt tacaggtaca tcattctgtt tgtgatggtt atcatgcagg attgtttatg 2280
aactctattc aggaattgtc agataggcct aatgactggc ttttataatt taaaagcaaa 2340
tataaatgaa aaattgaacc ctagcattat gtaaatgcag ggtttaattt ttatattaag 2400
cagcataata gaaagttttt taaatgcatg tatatatggg gtatttaaag ggaaatctat 2460
aatataattt aggactatat aacttcgtat aatgtatgct atacgaacgg tacctaggat 2520
atataataaa ttgaatatag taaacaaaaa gggacatatt tataatatgt tctttttagt 2580
ttaatactca atttttgcac ataagaaatt aacttaatat aaaaaaattt gcgaagcttt 2640
gcttcgcagt ttaatattgt ttaggtggtt aaattatgaa tctggaagtg ttaaaaacag 2700
agtttaagta tttaagagat aaaataattg aaaagcaata tgaacatctt gatcctatgc 2760
aaagaaaagc agttttaaat ggtgaaaata actgtattgt tattgcttgt cctggagcag 2820
gaaagaccca gactattatt aatagagtgg actacttatg tagattcggt cctatataca 2880
atacagatta tgtacctaat tgtctaaaga ccgatgattt acagataatg aagaaatatt 2940
taaatgataa ttcttttaaa gatgtgactg cagtaaataa aattgagcat ttgttaaata 3000
gcaataaaat aaatccacag aacatagttg ttataacttt tactagagca gctgctctca 3060
atatgaaaaa cagatacata tctataggaa ataaagaaaa gtcacctttt tttggaacat 3120
tccactccct attttataat atattgaaaa agcataataa agaaataaat attatagatc 3180
cttataaggc acatgagata gttaaaaata cacttatgta ttatctggac tttataggag 3240
aagagagagt aaaggaagtt ctaaatgaca tatctctttt aaaaaatagt gaaactaaca 3300
tagatttatt taaaagtaaa attgacaaaa gtgtattttt aaaatgtttt aatgaatatg 3360
aaaattataa agctagaaat aagcttatgg attttgatga tttacaatta aaagttaaag 3420
atatgtttct aaatcagaaa tctattctag atagttatca gaatttgttc aagtatattt 3480
tagttgatga gtttcaggat tcagataacc tccaaatatt cgaaatcgga tgccgggacc 3540
gacgagtgca gaggcgtgca agcgagcttg gcgtaatcat ggtcatagct gtttcctgtg 3600
tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 3660
gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 3720
ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 3780
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 3840
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 3900
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 3960
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 4020
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 4080
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 4140
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 4200
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 4260
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 4320
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 4380
acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc 4440
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 4500
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 4560
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 4620
aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 4680
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 4740
agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc 4800
atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc 4860
cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata 4920
aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc 4980
cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc 5040
aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca 5100
ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa 5160
gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca 5220
ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt 5280
tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt 5340
tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg 5400
ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga 5460
tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc 5520
agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 5580
acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 5640
ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg 5700
gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat tattatcatg 5760
acattaacct ataaaaatag gcgtatcacg aggccctttc gtc 5803
<210> 12
<211> 10704
<212> DNA
<213> 人工制造
<220>
<223> 基因簇
<400> 12
gaattcgagc tcggtacccg gggatcctct agagtcgacc tgcaggcatg cccgcggtcg 60
actttttaac aaaatatatt gataaaaata ataatagtgg gtataattaa gttgttagag 120
aaaacgtata aattagggat aaactatgga acttatgaaa tagattgaaa tggtttatct 180
gttaccccgt aggatccaga atttaaaagg agggattaaa catatgaatg gtttcgaaga 240
tgcaagggat agaataaggg aaagttttgg gaaattagag ttatctcctt cttcctatga 300
cacagcatgg gtagctatgg tcccttcaag acattcacta aatgagccat gttttccaca 360
atgtttggat tggattattg aaaatcaaag agaagatgga tcttggggac taaaccctac 420
ccatccattg cttctaaagg actcactttc ttccactctt gcatgtttgc ttgcactaac 480
caaatggaga gttggagatg agcaaatcaa aagaggtctt ggcttcattg aaacgtatgg 540
ttgggcagta gataacaagg atcaaatttc acctttagga tttgaagtta tattttctag 600
tatgatcaaa tctgcagaga aattagattt aaatttgcct ttgaatcttc atcttgtaaa 660
tttggtgaaa tgcaaaagag attcaacaat taaaaggaat gttgaatata tgggtgaagg 720
agttggtgaa ttatgtgatt ggaaggaaat gataaagtta catcaaagac aaaatggttc 780
attatttgat tcaccagcca ctactgcagc tgccttgatt tatcatcaac atgatcaaaa 840
atgctatcaa tatcttaatt caatcttcca acaacacaaa aattgggttc ccactatgta 900
tccaacaaag gtacattcat tgctttgctt ggttgataca cttcaaaatc ttggagtaca 960
taggcatttt aaatcagaaa taaagaaagc tctagatgaa atatacaggc tatggcaaca 1020
aaagaatgaa caaattttct caaatgtcac ccattgtgct atggctttta gacttctaag 1080
gatgagctac tatgatgtct cctcagatga actagcagaa tttgtggatg aagaacattt 1140
ctttgcaaca aatgggaaat ataaaagtca tgttgaaatt cttgaactcc acaaagcatc 1200
acaattggct attgatcatg agaaagatga cattttggat aaaataaaca attggacaag 1260
agcttttatg gagcaaaaac tcttaaacaa tggcttcata gataggatgt caaagaaaga 1320
ggtggaactt gctttgagga agttttatac cacatctcat ctagcagaaa atagaagata 1380
tataaagtca tacgaagaga acaattttaa aatcttaaaa gcagcttata ggtcacccaa 1440
cattaacaat aaggacttgt tagcattttc aatacacgac tttgaattat gccaagctca 1500
acacagagaa gaacttcaac aactcaagag gtggtttgaa gattatagat tggaccaact 1560
cggacttgca gaaagatata tacatgctag ttacttattt ggtgttactg ttatccccga 1620
gcctgaatta tccgatgcta gactcatgta cgcgaaatac gtcatgctcc tgactattgt 1680
cgatgatcat ttcgagagtt ttgcatctaa agatgaatgt ttcaacatca ttgaattagt 1740
agaaaggtgg gatgactatg caagtgtagg ttataaatct gagaaggtta aagttttttt 1800
ttctgttttc tataaatcaa tagaggagct tgcaacaatt gctgaaatta aacaaggaag 1860
atccgtcaaa aatcacctta ttaatttgtg gcttgaattg atgaagttga tgttgatgga 1920
gagagtagag tggtgttctg gcaagacaat accaagcata gaagagtact tgtatgttac 1980
atctataaca ttttgtgcaa aattgattcc tctctcaaca caatattttc ttggaataaa 2040
aatatccaaa gatctactag aaagtgatga aatatgtggc ctatggaatt gtagcggtag 2100
agtgatgaga atccttaatg atttacaaga ttccaagaga gaacaaaagg aggtctcaat 2160
aaatttagtc acattactaa tgaaaagtat gtctgaggaa gaagctataa tgaagataaa 2220
ggaaatcttg gaaatgaata gaagagagtt attgaaaatg gttttagttc aaaaaaaggg 2280
aagccaattg cctcaattat gcaaagatat attttggagg acaagcaaat gggctcattt 2340
cacttattca caaactgatg gatatagaat tgcagaggaa atgaagaatc acattgatga 2400
agtcttttac aaaccactca atcattaata atagcataac cccttggggc ctctaaacgg 2460
gtcttgaggg gttttttggg gccctcgact ttttaacaaa atatattgat aaaaataata 2520
atagtgggta taattaagtt gttagagaaa acgtataaat tagggataaa ctatggaact 2580
tatgaaatag attgaaatgg tttatctgtt accccgtagg atccagaatt taaaaggagg 2640
gattaaaatg tctgctcgtg gactcaacaa gatttcatgc tcactcaact tacaaaccga 2700
aaagctttgt tatgaggata atgataatga tcttgatgaa gaacttatgc ctaaacacat 2760
tgctttgata atggatggta ataggagatg ggcaaaggat aagggtttag aagtatatga 2820
aggtcacaaa catattattc caaaattaaa agagatttgt gacatttctt ctaaattggg 2880
aatacaaatt atcactgctt ttgcattctc tactgaaaat tggaaaagat ccaaggagga 2940
ggttgatttc ttgttgcaaa tgttcgaaga aatctatgat gagttttcga ggtctggagt 3000
aagagtgtct attataggtt gtaaatccga cctcccaatg acattacaaa aatgcatagc 3060
attaacagaa gagactacaa agggcaacaa aggacttcac cttgtgattg cactaaacta 3120
tggtggatat tatgacatat tgcaagcaac aaaaagcatt gttaataaag caatgaatgg 3180
tttattagat gtagaagata tcaacaagaa tttatttgat caagaacttg aaagcaagtg 3240
tccaaatcct gatttactta taaggacagg aggtgaacaa agagttagta actttttgtt 3300
gtggcaattg gcttacactg aattttactt caccaacaca ttgtttcctg attttggaga 3360
ggaagatctt aaagaggcaa taatgaactt tcaacaaagg catagacgtt ttggtggaca 3420
cacatattaa taataataat taattcgaac agaaaaaata agtatttata taacggttaa 3480
ttgtaaggag ggttttttat gcaaactgaa catgttattt tattgaatgc acagggagtt 3540
cctactggta ctctggaaaa gtatgccgca catacagcag acacccgctt acatctcgct 3600
ttctccagtt ggctgtttaa tgccaaagga caattattag ttaccagaag agcactgagc 3660
aaaaaagcat ggcctggcgt gtggactaac tctgtttgtg ggcatccaca actgggagaa 3720
agcaacgaag acgcagtgat cagaagatgt cgttatgagc ttggcgtgga aattactcct 3780
cctgaatcta tctatcctga ctttagatac agagccaccg atcctagtgg cattgtggaa 3840
aatgaagtgt gtcctgtatt tgccgcaaga accactagtg cattacagat caatgatgat 3900
gaagtgatgg attatcaatg gtgtgattta gcagatgtat tacatggtat tgatgccact 3960
ccttgggctt tcagtccttg gatggtgatg caggcaacaa atagagaagc cagaaaaaga 4020
ttatctgcat ttacccagct taaataaaaa taagagttac cttaaatggt aactcttatt 4080
tttttaatgt cctcgagcga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 4140
cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg catatggtgc 4200
actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca 4260
cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 4320
accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga 4380
cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 4440
tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 4500
taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 4560
tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 4620
gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 4680
gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 4740
cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa attaaaaatg 4800
aagttttaaa acttcatttt taatttaaat taaaaatgaa gttttatcaa aaaaatttcc 4860
aataatccca ctctaagcca caaacacgcc ctataaaatc ccgctttaat cccactttga 4920
gacacatgta atattacttt acgccctagt atagtgataa ttttttacat tcaatgccac 4980
gcaaaaaaat aaaggggcac tataataaaa gttccttcgg aactaactaa agtaaaaaat 5040
tatctttaca acctccccaa aaaaaagaac aggtacaaag taccctataa tacaagcgta 5100
aaaaaatgag ggtaaaaata aaaaaataaa aaaataaaaa aataaaaaaa taaaaaaaat 5160
aaaaaaataa aaaaataaaa aaataaaaaa ataaaaaaat aaaaaaataa aaaaataaaa 5220
aaatataaaa ataaaaaaat ataaaaataa aaaaatataa aaataaaaaa atataaaaat 5280
aaaaaaataa aaaaatataa aaataaaaaa ataaaaaaat ataaaaatat tttttattta 5340
aagtttgaaa aaaatttttt tatattatat aatctttgaa gaaaagaata taaaaaatga 5400
gcctttataa aagcccattt tttttcatat acgtaatatg acgttctaat gtttttattg 5460
gtacttctaa cattagagta atttctttat ttttaaagcc tttttcttta agggctttta 5520
ttttttttct taatacattt aattcctctt tttttgttgc ttttccttta gcttttaatt 5580
gctcttgata atttttttta cctctaatat tttctcttct cttatattcc tttttagaaa 5640
ttattattgt catatatttt tgttcttctt ctgtaatttc taataactct ataagagttt 5700
cattcttata cttatattgc ttatttttat ctaaataaca tctttcagca cttctagttg 5760
ctcttataac ttctctttca cttaaatgtt gtctaaacat actattaagt tctaaaacat 5820
catttaatgc cttctcaatg tcttctgtaa agctacaaag ataatatcta tataaaaata 5880
atataagctc tctgtgtcct tttaaatcat attctcttag ttcacaaagt tttattatgt 5940
cttgtattct tccataatat aaacttcttt ctctataaat ataatttatt ttgcttggtc 6000
tacccttttt cctttcatat ggttttaatt caggtaaaaa tccattttgt atttctctta 6060
agtcataaat atattcgtac tcatctaata tattgactac tgtttttgat ttagagttta 6120
tacttcctgg aactcttaat attctggttg catctaaggc ttgtctatct gctccaaagt 6180
attttaattg attatataaa tattcttgaa ccgctttcca taatggtaat gctttactag 6240
gtactgcatt tattatccat attaaataca ttcctcttcc actatctatt acatagtttg 6300
gtataggaat actttgatta aaataattct tttctaagtc cattaatacc tggtctttag 6360
ttttgccagt tttataataa tccaagtcta taaacagtgt atttaactct tttatatttt 6420
ctaatcgcct acacggctta taaaaggtat ttagagttat atagatattt tcatcactca 6480
tatctaaatc ttttaattca gcgtatttat agtgccattg gctatatcct tttttatcta 6540
taacgctcct ggttatccac cctttacttc tactatgaat attatctata tagttctttt 6600
tattcagctt taatgcgttt ctcacttatt cacctcccct tctgtaaaac taagaaaatt 6660
atatcatatt ttcaataatt attaactatt cttaaactct taataaaaaa tagagtaagt 6720
ccccaattga aacttaatct attttttatg ttttaattta ttatttttat taaaatattt 6780
taaactaaat taaatgattc tttttaattt tttactattt cattccataa tatattacta 6840
taattattta caaataatat ttcttcattt gtaatattta gatgatttac taattttagt 6900
ttttatatat taaataatta atgtataatt tatataaaaa atcaaaggag cttataaatt 6960
atgattattt ccaaagatac taaagattta attttttcaa ttttaacaat actttttgta 7020
atattatgtt taaatttaat tgtatttttt tcatataata aagccgttga agtaaaccaa 7080
tccattttcc ttatgatgtt attattaaat ttaagtttta taataatatc tttattatat 7140
ttattgtttt taaaaaaact agtgaaattt ccggctttat taaacttatt tttaggaatt 7200
ttattttcat tttcatcttt acaggatttg attatatctt taaatatgtt ttatcaaata 7260
ttatcttttt ctaaatttat atatattttt attatattta ttattatata tattttattt 7320
ttaagtttct ttctaacagc tattaaaaag aaacttaaaa ataaaaacac gtactctaaa 7380
ccaataaata aaactatttt tattattgct gccttgattg gaatagtttt tagtaaaatt 7440
aatttcaata ttccacaata ttatattata agctagcttt gcattgtact tttcaatcgc 7500
ttcacgaatg cggttatctc cgaaagataa agtcttttca tcttccttga tgaagataag 7560
attttctccg tctccgccgg cagaattgaa gcggggtact acggtatcgt ctgcgtcatc 7620
ttccgttgtc tgatagatga tagtcatagg ctcattttct tccgtttcgg taaaggggat 7680
aggttcgccc tttgagagca gggcggcgat ggaaagcatt aacttgcttt tcccatcgcc 7740
cggatctccc tgcaatagcg taactttgcc aaacggaata tacggatacc acagccactt 7800
tacttctttc ggctcgattt cacttgcctt gatgatttca agaggtacgc tgaaattcat 7860
ttcgttttca tttagtttca ttttttcttg ttctcctttt ctctgaaaat ataaaaacca 7920
cagattgata ctaaaacctt ggttgtgttg cttttcgggg cttaaatcaa ggaaaaatcc 7980
ttgttttaag cctttcaaaa agaaacacaa ggtctttgta ctaacctgtg gttatgtata 8040
aaattgtaga ttttagggta acaaaaaaca ccgtatttct acgatgtttt tgcttaaata 8100
cttgttttta gttacagaca aacctgaagt tatcatagtc ctaaattata ttatagattt 8160
ccctttaaat accccatata tacatgcatt taaaaaactt tctattatgc tgcttaatat 8220
aaaaattaaa ccctgcattt acataatgct agggttcaat ttttcattta tatttgcttt 8280
taaattataa aagccagtca ttaggcctat ctgacaattc ctgaatagag ttcataaaca 8340
atcctgcatg ataaccatca caaacagaat gatgtacctg taaagatagc ggtaaatata 8400
ttgaattacc tttattaatg aattttcctg ctgtaataat gggtagaagg taattactat 8460
tattattgat atttaagtta aacccagtaa atgaagtcca tggaataata gaaagagaaa 8520
aagcattttc aggtataggt gttttgggaa acaatttccc cgaaccatta tatttctcta 8580
catcagaaag gtataaatca taaaactctt tgaagtcatt ctttacagga gtccaaatac 8640
cagagaatgt tttagataca ccatcaaaaa ttgtataaag tggctctaac ttatcccaat 8700
aacctaactc tccgtcgcta ttgtaaccag ttctaaaagc tgtatttgag tttatcaccc 8760
ttgtcactaa gaaaataaat gcagggtaaa atttatatcc ttcttgtttt atgtttctgt 8820
ataaaacact aatatcaatt tctgtggtta tactaaaagt cgtttgttgg ttcaaataat 8880
gattaaatat ctcttttctc ttccaattgt ctaaatcaat tttattaaag ttcatgttca 8940
tttcctccct ttaaatttaa cacaaaatta cacacactta tactataatc ctttttagtt 9000
gtatttttca ataaaaatca ttcaaaaata taacttttga taagaaattt cacaaattaa 9060
agtatcaaaa aattttgcta gtcaatactt tactcaatat tatataatgt aaatcaaata 9120
agcaaaaatt taatctgaag atgcttagtg ggaatttgta ccccttatcg atacaaattc 9180
cccgtaggcg ctagggacac tttttcactc gttaaaaagt tttgagaata ttttatattt 9240
ttgttcatgt aatcactcct tcttaattac aaatttttag catctaattt aacttcaatt 9300
cctattatac aaaattttaa gatactgcac tatcaacaca ctcttaagtt tgcttctaag 9360
tcttatttcc ataacttctt ttacgtttcc gggtacaatt cgtaatcatg tcatagctgt 9420
ttcctgtgtg aaattcttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 9480
agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 9540
tgcccgcttt ccagtcggga aacctgtcgt gccagaaaac ttcattttta atttaaaagg 9600
atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 9660
ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 9720
ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 9780
ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 9840
ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 9900
ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 9960
tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 10020
tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 10080
tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 10140
tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 10200
gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 10260
tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 10320
ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 10380
gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 10440
gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc 10500
cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg 10560
ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc ccaggcttta 10620
cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca atttcacaca 10680
ggaaacagct atgaccatga ttac 10704
<210> 13
<211> 18188
<212> DNA
<213> 人工制造
<220>
<223> 基因簇
<400> 13
gaattcgagc tcggtacccg gggatcctct agagtcgacc tgcaggcatg ccctaggtcg 60
actttttaac aaaatatatt gataaaaata ataatagtgg gtataattaa gttgttagag 120
aaaacgtata aattagggat aaactatgga acttatgaaa tagattgaaa tggtttatct 180
gttaccccgt aggatccaga atttaaaagg agggattaaa catatgaatg gtttcgaaga 240
tgcaagggat agaataaggg aaagttttgg gaaattagag ttatctcctt cttcctatga 300
cacagcatgg gtagctatgg tcccttcaag acattcacta aatgagccat gttttccaca 360
atgtttggat tggattattg aaaatcaaag agaagatgga tcttggggac taaaccctac 420
ccatccattg cttctaaagg actcactttc ttccactctt gcatgtttgc ttgcactaac 480
caaatggaga gttggagatg agcaaatcaa aagaggtctt ggcttcattg aaacgtatgg 540
ttgggcagta gataacaagg atcaaatttc acctttagga tttgaagtta tattttctag 600
tatgatcaaa tctgcagaga aattagattt aaatttgcct ttgaatcttc atcttgtaaa 660
tttggtgaaa tgcaaaagag attcaacaat taaaaggaat gttgaatata tgggtgaagg 720
agttggtgaa ttatgtgatt ggaaggaaat gataaagtta catcaaagac aaaatggttc 780
attatttgat tcaccagcca ctactgcagc tgccttgatt tatcatcaac atgatcaaaa 840
atgctatcaa tatcttaatt caatcttcca acaacacaaa aattgggttc ccactatgta 900
tccaacaaag gtacattcat tgctttgctt ggttgataca cttcaaaatc ttggagtaca 960
taggcatttt aaatcagaaa taaagaaagc tctagatgaa atatacaggc tatggcaaca 1020
aaagaatgaa caaattttct caaatgtcac ccattgtgct atggctttta gacttctaag 1080
gatgagctac tatgatgtct cctcagatga actagcagaa tttgtggatg aagaacattt 1140
ctttgcaaca aatgggaaat ataaaagtca tgttgaaatt cttgaactcc acaaagcatc 1200
acaattggct attgatcatg agaaagatga cattttggat aaaataaaca attggacaag 1260
agcttttatg gagcaaaaac tcttaaacaa tggcttcata gataggatgt caaagaaaga 1320
ggtggaactt gctttgagga agttttatac cacatctcat ctagcagaaa atagaagata 1380
tataaagtca tacgaagaga acaattttaa aatcttaaaa gcagcttata ggtcacccaa 1440
cattaacaat aaggacttgt tagcattttc aatacacgac tttgaattat gccaagctca 1500
acacagagaa gaacttcaac aactcaagag gtggtttgaa gattatagat tggaccaact 1560
cggacttgca gaaagatata tacatgctag ttacttattt ggtgttactg ttatccccga 1620
gcctgaatta tccgatgcta gactcatgta cgcgaaatac gtcatgctcc tgactattgt 1680
cgatgatcat ttcgagagtt ttgcatctaa agatgaatgt ttcaacatca ttgaattagt 1740
agaaaggtgg gatgactatg caagtgtagg ttataaatct gagaaggtta aagttttttt 1800
ttctgttttc tataaatcaa tagaggagct tgcaacaatt gctgaaatta aacaaggaag 1860
atccgtcaaa aatcacctta ttaatttgtg gcttgaattg atgaagttga tgttgatgga 1920
gagagtagag tggtgttctg gcaagacaat accaagcata gaagagtact tgtatgttac 1980
atctataaca ttttgtgcaa aattgattcc tctctcaaca caatattttc ttggaataaa 2040
aatatccaaa gatctactag aaagtgatga aatatgtggc ctatggaatt gtagcggtag 2100
agtgatgaga atccttaatg atttacaaga ttccaagaga gaacaaaagg aggtctcaat 2160
aaatttagtc acattactaa tgaaaagtat gtctgaggaa gaagctataa tgaagataaa 2220
ggaaatcttg gaaatgaata gaagagagtt attgaaaatg gttttagttc aaaaaaaggg 2280
aagccaattg cctcaattat gcaaagatat attttggagg acaagcaaat gggctcattt 2340
cacttattca caaactgatg gatatagaat tgcagaggaa atgaagaatc acattgatga 2400
agtcttttac aaaccactca atcattaata atagcataac cccttggggc ctctaaacgg 2460
gtcttgaggg gttttttgtc gactttttaa caaaatatat tgataaaaat aataatagtg 2520
ggtataatta agttgttaga gaaaacgtat aaattaggga taaactatgg aacttatgaa 2580
atagattgaa atggtttatc tgttaccccg taggatccag aatttaaaag gagggattaa 2640
aatgtctgct cgtggactca acaagatttc atgctcactc aacttacaaa ccgaaaagct 2700
ttgttatgag gataatgata atgatcttga tgaagaactt atgcctaaac acattgcttt 2760
gataatggat ggtaatagga gatgggcaaa ggataagggt ttagaagtat atgaaggtca 2820
caaacatatt attccaaaat taaaagagat ttgtgacatt tcttctaaat tgggaataca 2880
aattatcact gcttttgcat tctctactga aaattggaaa agatccaagg aggaggttga 2940
tttcttgttg caaatgttcg aagaaatcta tgatgagttt tcgaggtctg gagtaagagt 3000
gtctattata ggttgtaaat ccgacctccc aatgacatta caaaaatgca tagcattaac 3060
agaagagact acaaagggca acaaaggact tcaccttgtg attgcactaa actatggtgg 3120
atattatgac atattgcaag caacaaaaag cattgttaat aaagcaatga atggtttatt 3180
agatgtagaa gatatcaaca agaatttatt tgatcaagaa cttgaaagca agtgtccaaa 3240
tcctgattta cttataagga caggaggtga acaaagagtt agtaactttt tgttgtggca 3300
attggcttac actgaatttt acttcaccaa cacattgttt cctgattttg gagaggaaga 3360
tcttaaagag gcaataatga actttcaaca aaggcataga cgttttggtg gacacacata 3420
ttaataataa taattaattc gaacagaaaa aataagtatt tatataacgg ttaattgtaa 3480
ggagggtttt ttatgcaaac tgaacatgtt attttattga atgcacaggg agttcctact 3540
ggtactctgg aaaagtatgc cgcacataca gcagacaccc gcttacatct cgctttctcc 3600
agttggctgt ttaatgccaa aggacaatta ttagttacca gaagagcact gagcaaaaaa 3660
gcatggcctg gcgtgtggac taactctgtt tgtgggcatc cacaactggg agaaagcaac 3720
gaagacgcag tgatcagaag atgtcgttat gagcttggcg tggaaattac tcctcctgaa 3780
tctatctatc ctgactttag atacagagcc accgatccta gtggcattgt ggaaaatgaa 3840
gtgtgtcctg tatttgccgc aagaaccact agtgcattac agatcaatga tgatgaagtg 3900
atggattatc aatggtgtga tttagcagat gtattacatg gtattgatgc cactccttgg 3960
gctttcagtc cttggatggt gatgcaggca acaaatagag aagccagaaa aagattatct 4020
gcatttaccc agcttaaata attttaaaat ataagtgatt tagatattca taatatattt 4080
gggaggtaaa ttaatatgaa agaagttgta atagctagtg cagtaagaac agcgattgga 4140
tcttatggaa agtctcttaa ggatgtacca gcagtagatt taggagctac agctataaag 4200
gaagcagtta aaaaagcagg aataaaacca gaggatgtta atgaagtcat tttaggaaat 4260
gttcttcaag caggtttagg acagaatcca gcaagacagg catcttttaa agcaggatta 4320
ccagttgaaa ttccagctat gactattaat aaggtttgtg gttcaggact tagaacagtt 4380
agcttagcag cacaaattat aaaagcagga gatgctgacg taataatagc aggtggtatg 4440
gaaaatatgt ctagagctcc ttacttagcg aataacgcta gatggggata tagaatggga 4500
aacgctaaat ttgttgatga aatgatcact gacggattgt gggatgcatt taatgattac 4560
cacatgggaa taacagcaga aaacatagct gagagatgga acatttcaag agaagaacaa 4620
gatgagtttg ctcttgcatc acaaaaaaaa gctgaagaag ctataaaatc aggtcaattt 4680
aaagatgaaa tagttcctgt agtaattaaa ggcagaaagg gagaaactgt agttgataca 4740
gatgagcacc ctagatttgg atcaactata gaaggacttg caaaattaaa acctgccttc 4800
aaaaaagatg gaacagttac agctggtaat gcatcaggat taaatgactg tgcagcagta 4860
cttgtaatca tgagtgcaga aaaagctaaa gagcttggag taaaaccact tgctaagata 4920
gtttcttatg gttcagcagg agttgaccca gcaataatgg gatatggacc tttctatgca 4980
acaaaagcag ctattgaaaa agcaggttgg acagttgatg aattagattt aatagaatca 5040
aatgaagctt ttgcagctca aagtttagca gtagcaaaag atttaaaatt tgatatgaat 5100
aaagtaaatg taaatggagg agctattgcc cttggtcatc caattggagc atcaggtgca 5160
agaatactcg ttactcttgt acacgcaatg caaaaaagag atgcaaaaaa aggcttagca 5220
actttatgta taggtggcgg acaaggaaca gcaatattgc tagaaaagtg ctagtagaaa 5280
taagagttac cttaaatggt aactcttatt tttttaatgt cacatagaga atttcactct 5340
ttgcatttta tctaacatca aggggtttat ttgtcacaaa ttatgtaaaa ataaaacaaa 5400
gatgtaagaa agtcctatga tataaatttt gtaaacataa taaattagct ttcataagat 5460
tggaagaatg ataattacta cttagaactg ctaaaaatta ggaaagaggt gtcgttaatt 5520
aatgcagaaa agacaaaggg agctgagtgc gttgacacta cctacctctg ctgagggggt 5580
atcagaaagc catagggccc gttctgtcgg catcggtcgt gcccatgcca aggccatcct 5640
gctgggagag catgcggtag tatacggagc gccggcactc gctctgccta ttcctcagct 5700
cacggtcacg gccagcgttg gctggtcttc cgaggcctcc gacagtgcgg gtggcctgtc 5760
ctacacgatg accggtacgc cttctagggc actggtgacg caggcctccg acggcctgca 5820
taggctcacc gcggaattca tggcgaggat gggcgtgacg aacgcgcctc atctcgacgt 5880
gatcctggac ggcgcgatcc ctcacggcag gggtctcggc tccagcgcgg ccggctcacg 5940
tgcgatcgcc ttggccctcg ccgacctctt cggccacgaa ctggccgagc atacggcgta 6000
cgaactggtg cagacggccg agaacatggc gcatggcagg gccagcggcg tggacgcgat 6060
gacggtcggc gcgtccaggc ctctgctgtt ccagcagggc cgtaccgaga gactggccat 6120
cggctgcgac agcctgttca tcgtagccga cagcggcgta cctggcagca ccaaggaagc 6180
ggtagagatg ctgagggagg gattcacccg tagcgccgga acacaggagc ggttcgttgg 6240
cagggcgacg gaactgaccg aggccgccag gcaggccctc gccgacggca ggcccgagga 6300
gctgggctct cagctgacgt actaccatga gctgctccat gaggcccgtc tgagcaccga 6360
cggcatcgat gcgctggtag aggccgcgct gaaggcaggc agcctcggag ccaagatcac 6420
cggcggtggt ctgggcggct gcatgatcgc acaggccagg cccgaacagg ccagggaggt 6480
aaccaggcag ctccatgagg ccggtgccgt acagacctgg gtagtaccac tgaaagggct 6540
cgacaaccat gcgcagtaat aattttaaaa tataagtgat ttagatattc ataatatatt 6600
tgggaggtaa attaatatgc gtagtgaaca tcctaccacg accgtgctcc agtctaggga 6660
gcagggcagc gcggccggcg ccaccgcggt agcgcatcca aacatcgcgc tgatcaagta 6720
ctggggcaag cgtgacgaga ggctgatcct gccctgcacc accagcctgt ctatgacgct 6780
ggacgtattc cccacgacca ccgaggtcag gctcgacccc gccgccgagc atgacacggc 6840
cgccctcaac ggcgaggtgg ccacgggcga gacgctgcgt cgtatcagcg ccttcctctc 6900
cctggtgagg gaggtggcgg gcagcgacca gagggccgtg gtggacaccc gtaacaccgt 6960
gcccaccggg gcgggcctgg cgtcctccgc cagcgggttc gccgccctcg ccgtcgcggc 7020
cgcggccgcc tacgggctcg aactcgacga ccgtgggctg tccaggctgg ccagacgtgg 7080
atccggctcc gcctctcggt ctatcttcgg cggcttcgcc gtatggcatg ccggccccga 7140
cggcacggcc acggaagcgg acctcggctc ctacgccgag ccagtgcccg cggccgacct 7200
cgaccctgcg ctggttatcg ccgtggtaaa cgccggcccc aagcccgtat ccagccgtga 7260
ggccatgcgt cgcaccgtag acacctcacc actgtacagg ccatgggccg actccagtaa 7320
ggacgacctg gacgagatgc gttctgcgct gctgcgtggc gacctcgagg ccgtgggcga 7380
gatcgcggag cgtaacgcgc tcggcatgca tgccaccatg ctggccgccc gtcccgcggt 7440
gaggtacctg tcaccagcca cggtaaccgt gctcgacagc gtgctccagc tccgtaagga 7500
cggtgttctg gcctacgcga ccatggacgc cggtcccaac gtgaaggtgc tgtgcaggag 7560
ggcggacgcc gagagggtgg ccgacgttgt acgcgccgcc gcgtccggcg gtcaggtact 7620
cgtagccggg cctggagacg gtgcccgtct gctgagcgag ggcgcataat aattttaaaa 7680
tataagtgat ttagatattc ataatatatt tgggaggtaa attaatatga cgacaggtca 7740
gcgtacgatc gtcaggcatg cgcctggcaa gctgttcgta gcgggcgagt acgcggtagt 7800
ggatcctggc aaccctgcga tcctggtagc ggtagacagg catatcagcg taaccgtgtc 7860
cgacgccgac gcggacaccg gggccgccga cgtagtgatc tcctccgacc tcggtcctca 7920
ggcggtaggc tggcgttggc atgacggcag gctcgtagta cgtgaccctg acgacgggca 7980
gcaggcgcgt agcgccctgg cccatgtggt gtcggcgatc gagaccgtgg gcaggctgct 8040
gggcgaacgt ggacagaagg tacccgctct caccctctcc gttagcagcc gtctgcatga 8100
ggacggcagg aagttcggcc tgggctccag cggcgcggtg accgtggcga ccgtagccgc 8160
cgtagccgcg ttctgcggac tcgaactgtc caccgacgaa aggttcaggc tggccatgct 8220
cgccaccgcg gaactcgacc ccaagggctc cggcggggac ctcgccgcca gcacctgggg 8280
cggctggatc gcctaccagg cgcccgacag ggcctttgtg ctcgacctgg ccaggcgtgt 8340
gggagtagac aggacactga aggcgccctg gccggggcat tctgtgcgta gactgcctgc 8400
gcccaagggc ctcaccctgg aggtcggctg gaccggagag cccgcctcca ccgcgtccct 8460
ggtgtccgat ctgcatcgtc gtacctggag gggcagcgcc tcccatcaga ggttcgtaga 8520
gaccacgacc gactgtgtac gttccgcggt taccgccctg gagtccggcg acgacacgag 8580
cctgctgcat gagatccgca gggcccgtca ggagctggcc cgtctggacg acgaggtagg 8640
cctcggcatc ttcacaccca agctgacggc gctgtgcgac gccgccgaag ccgttggcgg 8700
cgcggccaag ccctccgggg caggcggcgg cgactgcggc atcgccctgc tggacgccga 8760
ggcgtctagg gacatcacac atgtaaggca acggtgggag acagccgggg tgctgcccct 8820
gcccctgact cctgccctgg aagggatcta ataattttaa aatataagtg atttagatat 8880
tcataatata tttgggaggt aaattaatat gagcctcgat tccagactgc ccgctttccg 8940
taacctgtcc cctgccgcga gactggacca catcggccag ttgctcggcc tgagccacga 9000
cgatgtcagc ctgctggcca acgccggtgc cctgccgatg gacatcgcca acggcatgat 9060
cgaaaacgtc atcggcacct tcgagctgcc ctatgccgtg gccagcaact tccagatcaa 9120
tggccgtgat gtgctggtgc cgctggtggt ggaagagccc tcgatcgtcg ccgctgcttc 9180
ttacatggcc aagctggccc gtgccaacgg cggcttcacc acctccagca gcgccccgct 9240
gatgcatgcc caggtacaga tcgtcggcat acaggacccg ctcaatgcac gtctgagcct 9300
gctgagaaga aaagacgaaa tcattgaact ggccaaccgt aaggaccagt tgctcaacag 9360
cctcggcggc ggctgcagag acatcgaagt gcacaccttc gccgataccc cgcgtggccc 9420
gatgctggtg gcgcacctga tcgtcgatgt aagagatgcc atgggcgcca acaccgtcaa 9480
taccatggcc gaggccgttg cgccgctgat ggaagccatc accgggggcc aggtacgtct 9540
gagaattctg tccaacctgg ccgacctgcg cctggccagg gcccaggtga ggattactcc 9600
gcagcaactg gaaacggccg aattcagtgg cgaggcagtg atcgaaggca tcctcgacgc 9660
ctacgccttc gctgcggtcg acccttacag agcggccacc cacaacaagg gcatcatgaa 9720
tggcatcgac ccactgatcg tcgccactgg caacgactgg cgtgcagtgg aagccggcgc 9780
ccatgcgtat gcctgcagaa gtggtcacta cggctcgctg accacctggg aaaaggacaa 9840
caacggccat ttggtcggca ccctggaaat gccgatgccc gtaggcctgg tcggcggcgc 9900
caccaaaacc catccgctgg cgcaactgtc actgagaatc ctcggcgtga aaacagccca 9960
ggcgctcgct gagattgccg tggccgtagg cctggcgcaa aacctcgggg ccatgagagc 10020
cctggccacc gaaggcatcc agcgtggcca catggccctg catgcgagaa atattgccgt 10080
ggtggcgggc gcccgaggcg atgaggtgga ctgggttgcc cggcagttgg tggaatacca 10140
cgacgtgaga gccgacagag ccgtagcact gctgaaacaa aagagaggcc aatgatagtt 10200
ttaaaatata agtgatttag atattcataa tatatttggg aggtaaatta atatgtccat 10260
ctccataggc attcacgacc tgtctttcgc cacaaccgag ttcgtactgc ctcatacggc 10320
gctcgccgag tacaacggca ccgagatcgg caagtaccat gtaggcatcg gccagcagtc 10380
tatgagcgtg cctgccgccg acgaggacat cgtgaccatg gccgcgaccg cggcgaggcc 10440
catcatcgag cgtaacggca agagcaggat ccgtacggta gtgttcgcca cggagtcttc 10500
tatcgaccag gcgaaggcgg gcggcgtata cgtgcactcc ctgctggggc tggagtctgc 10560
ctgcagggta gtagagctga agcaggcctg ctacggggcc accgccgccc ttcagttcgc 10620
catcggcctg gtgaggcgtg accccgccca gcaggtactg gtaatcgcca gtgacgtatc 10680
caagtacgag ctggacagcc ccggcgaggc gacccagggc gcggccgcgg tggccatgct 10740
ggtaggcgcc gaccctgccc tgctgcgtat cgaggagcct tcgggcctgt tcaccgccga 10800
cgtaatggac ttctggcggc ccaactacct caccaccgct ctggtagacg gccaggagtc 10860
catcaacgcc tacctgcagg ccgtagaggg cgcctggaag gactacgcgg agcaggacgg 10920
caggtcactg gaggagttcg cggcgttcgt ataccaccag ccgttcacga agatggccta 10980
caaggcgcat cgccatctgc tgaacttcaa cggctacgac accgacaagg acgccatcga 11040
gggcgccctc ggccagacga cggcgtacaa caacgtaatc ggcaacagct acaccgcgtc 11100
tgtgtacctg ggcctggccg ccctgctcga ccaggcggac gacctgacgg gccgttccat 11160
cggcttcctg agctacggct ctggcagcgt agccgagttc ttctctggca ccgtagtagc 11220
cgggtaccgt gagcgtctgc gtaccgaggc gaaccaggag gcgatcgcca ggcgtaagag 11280
cgtagactac gccacctacc gtgagctgca cgagtacacg ctcccgtccg acggcggcga 11340
ccatgccacc cctgtgcaga ccaccggccc cttcaggctg gccgggatca acgaccataa 11400
gcgtatctac gaggcgcgtt aataatttaa aagcaaatat aaatgaaaaa ttgaacccta 11460
gcattatgta aatgcagggt ttaattttta tattaagcag cataatagaa agttttttaa 11520
atgcatgtat atatggggta tttaaaggga aatctataat ataatttagg actatacgcg 11580
tcgatcgccc ttcccaacag ttgcgcagcc tgaatggcga atggcgcctg atgcggtatt 11640
ttctccttac gcatctgtgc ggtatttcac accgcatatg gtgcactctc agtacaatct 11700
gctctgatgc cgcatagtta agccagcccc gacacccgcc aacacccgct gacgcgccct 11760
gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct 11820
gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gagacgaaag ggcctcgtga 11880
tacgcctatt tttataggtt aatgtcatga taataatggt ttcttagacg tcaggtggca 11940
cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt tttctaaata cattcaaata 12000
tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga aaaaggaaga 12060
gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca ttttgccttc 12120
ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat cagttgggtg 12180
cacgagtggg ttacatcgaa ctggatctca acagcggtaa gatccttgag agttttcgcc 12240
ccgaagaacg ttttccaatg atgagcactt ttaaattaaa aatgaagttt taaaacttca 12300
tttttaattt aaattaaaaa tgaagtttta tcaaaaaaat ttccaataat cccactctaa 12360
gccacaaaca cgccctataa aatcccgctt taatcccact ttgagacaca tgtaatatta 12420
ctttacgccc tagtatagtg ataatttttt acattcaatg ccacgcaaaa aaataaaggg 12480
gcactataat aaaagttcct tcggaactaa ctaaagtaaa aaattatctt tacaacctcc 12540
ccaaaaaaaa gaacaggtac aaagtaccct ataatacaag cgtaaaaaaa tgagggtaaa 12600
aataaaaaaa taaaaaaata aaaaaataaa aaaataaaaa aaataaaaaa ataaaaaaat 12660
aaaaaaataa aaaaataaaa aaataaaaaa ataaaaaaat aaaaaaatat aaaaataaaa 12720
aaatataaaa ataaaaaaat ataaaaataa aaaaatataa aaataaaaaa ataaaaaaat 12780
ataaaaataa aaaaataaaa aaatataaaa atatttttta tttaaagttt gaaaaaaatt 12840
tttttatatt atataatctt tgaagaaaag aatataaaaa atgagccttt ataaaagccc 12900
attttttttc atatacgtaa tatgacgttc taatgttttt attggtactt ctaacattag 12960
agtaatttct ttatttttaa agcctttttc tttaagggct tttatttttt ttcttaatac 13020
atttaattcc tctttttttg ttgcttttcc tttagctttt aattgctctt gataattttt 13080
tttacctcta atattttctc ttctcttata ttccttttta gaaattatta ttgtcatata 13140
tttttgttct tcttctgtaa tttctaataa ctctataaga gtttcattct tatacttata 13200
ttgcttattt ttatctaaat aacatctttc agcacttcta gttgctctta taacttctct 13260
ttcacttaaa tgttgtctaa acatactatt aagttctaaa acatcattta atgccttctc 13320
aatgtcttct gtaaagctac aaagataata tctatataaa aataatataa gctctctgtg 13380
tccttttaaa tcatattctc ttagttcaca aagttttatt atgtcttgta ttcttccata 13440
atataaactt ctttctctat aaatataatt tattttgctt ggtctaccct ttttcctttc 13500
atatggtttt aattcaggta aaaatccatt ttgtatttct cttaagtcat aaatatattc 13560
gtactcatct aatatattga ctactgtttt tgatttagag tttatacttc ctggaactct 13620
taatattctg gttgcatcta aggcttgtct atctgctcca aagtatttta attgattata 13680
taaatattct tgaaccgctt tccataatgg taatgcttta ctaggtactg catttattat 13740
ccatattaaa tacattcctc ttccactatc tattacatag tttggtatag gaatactttg 13800
attaaaataa ttcttttcta agtccattaa tacctggtct ttagttttgc cagttttata 13860
ataatccaag tctataaaca gtgtatttaa ctcttttata ttttctaatc gcctacacgg 13920
cttataaaag gtatttagag ttatatagat attttcatca ctcatatcta aatcttttaa 13980
ttcagcgtat ttatagtgcc attggctata tcctttttta tctataacgc tcctggttat 14040
ccacccttta cttctactat gaatattatc tatatagttc tttttattca gctttaatgc 14100
gtttctcact tattcacctc cccttctgta aaactaagaa aattatatca tattttcaat 14160
aattattaac tattcttaaa ctcttaataa aaaatagagt aagtccccaa ttgaaactta 14220
atctattttt tatgttttaa tttattattt ttattaaaat attttaaact aaattaaatg 14280
attcttttta attttttact atttcattcc ataatatatt actataatta tttacaaata 14340
atatttcttc atttgtaata tttagatgat ttactaattt tagtttttat atattaaata 14400
attaatgtat aatttatata aaaaatcaaa ggagcttata aattatgatt atttccaaag 14460
atactaaaga tttaattttt tcaattttaa caatactttt tgtaatatta tgtttaaatt 14520
taattgtatt tttttcatat aataaagccg ttgaagtaaa ccaatccatt ttccttatga 14580
tgttattatt aaatttaagt tttataataa tatctttatt atatttattg tttttaaaaa 14640
aactagtgaa atttccggct ttattaaact tatttttagg aattttattt tcattttcat 14700
ctttacagga tttgattata tctttaaata tgttttatca aatattatct ttttctaaat 14760
ttatatatat ttttattata tttattatta tatatatttt atttttaagt ttctttctaa 14820
cagctattaa aaagaaactt aaaaataaaa acacgtactc taaaccaata aataaaacta 14880
tttttattat tgctgccttg attggaatag tttttagtaa aattaatttc aatattccac 14940
aatattatat tataagctag ctttgcattg tacttttcaa tcgcttcacg aatgcggtta 15000
tctccgaaag ataaagtctt ttcatcttcc ttgatgaaga taagattttc tccgtctccg 15060
ccggcagaat tgaagcgggg tactacggta tcgtctgcgt catcttccgt tgtctgatag 15120
atgatagtca taggctcatt ttcttccgtt tcggtaaagg ggataggttc gccctttgag 15180
agcagggcgg cgatggaaag cattaacttg cttttcccat cgcccggatc tccctgcaat 15240
agcgtaactt tgccaaacgg aatatacgga taccacagcc actttacttc tttcggctcg 15300
atttcacttg ccttgatgat ttcaagaggt acgctgaaat tcatttcgtt ttcatttagt 15360
ttcatttttt cttgttctcc ttttctctga aaatataaaa accacagatt gatactaaaa 15420
ccttggttgt gttgcttttc ggggcttaaa tcaaggaaaa atccttgttt taagcctttc 15480
aaaaagaaac acaaggtctt tgtactaacc tgtggttatg tataaaattg tagattttag 15540
ggtaacaaaa aacaccgtat ttctacgatg tttttgctta aatacttgtt tttagttaca 15600
gacaaacctg aagttatcat agtcctaaat tatattatag atttcccttt aaatacccca 15660
tatatacatg catttaaaaa actttctatt atgctgctta atataaaaat taaaccctgc 15720
atttacataa tgctagggtt caatttttca tttatatttg cttttaaatt ataaaagcca 15780
gtcattaggc ctatctgaca attcctgaat agagttcata aacaatcctg catgataacc 15840
atcacaaaca gaatgatgta cctgtaaaga tagcggtaaa tatattgaat tacctttatt 15900
aatgaatttt cctgctgtaa taatgggtag aaggtaatta ctattattat tgatatttaa 15960
gttaaaccca gtaaatgaag tccatggaat aatagaaaga gaaaaagcat tttcaggtat 16020
aggtgttttg ggaaacaatt tccccgaacc attatatttc tctacatcag aaaggtataa 16080
atcataaaac tctttgaagt cattctttac aggagtccaa ataccagaga atgttttaga 16140
tacaccatca aaaattgtat aaagtggctc taacttatcc caataaccta actctccgtc 16200
gctattgtaa ccagttctaa aagctgtatt tgagtttatc acccttgtca ctaagaaaat 16260
aaatgcaggg taaaatttat atccttcttg ttttatgttt ctgtataaaa cactaatatc 16320
aatttctgtg gttatactaa aagtcgtttg ttggttcaaa taatgattaa atatctcttt 16380
tctcttccaa ttgtctaaat caattttatt aaagttcatg ttcatttcct ccctttaaat 16440
ttaacacaaa attacacaca cttatactat aatccttttt agttgtattt ttcaataaaa 16500
atcattcaaa aatataactt ttgataagaa atttcacaaa ttaaagtatc aaaaaatttt 16560
gctagtcaat actttactca atattatata atgtaaatca aataagcaaa aatttaatct 16620
gaagatgctt agtgggaatt tgtacccctt atcgatacaa attccccgta ggcgctaggg 16680
acactttttc actcgttaaa aagttttgag aatattttat atttttgttc atgtaatcac 16740
tccttcttaa ttacaaattt ttagcatcta atttaacttc aattcctatt atacaaaatt 16800
ttaagatact gcactatcaa cacactctta agtttgcttc taagtcttat ttccataact 16860
tcttttacgt ttccgggtac aattcgtaat catgtcatag ctgtttcctg tgtgaaattc 16920
ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg 16980
tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc 17040
gggaaacctg tcgtgccaga aaacttcatt tttaatttaa aaggatctag gtgaagatcc 17100
tttttgataa tctcatgacc aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag 17160
accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 17220
gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 17280
caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgtccttc 17340
tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 17400
ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 17460
tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 17520
gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 17580
tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 17640
gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 17700
gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 17760
ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct 17820
ggccttttgc tcacatgttc tttcctgcgt tatcccctga ttctgtggat aaccgtatta 17880
ccgcctttga gtgagctgat accgctcgcc gcagccgaac gaccgagcgc agcgagtcag 17940
tgagcgagga agcggaagag cgcccaatac gcaaaccgcc tctccccgcg cgttggccga 18000
ttcattaatg cagctggcac gacaggtttc ccgactggaa agcgggcagt gagcgcaacg 18060
caattaatgt gagttagctc actcattagg caccccaggc tttacacttt atgcttccgg 18120
ctcgtatgtt gtgtggaatt gtgagcggat aacaatttca cacaggaaac agctatgacc 18180
atgattac 18188
<210> 14
<211> 16239
<212> DNA
<213> 人工制造
<220>
<223> 基因簇
<400> 14
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt ggagatcggt acttcgcgaa 420
tgcgtcgaga tggcgcgcct tggtaaagga tatatggtag tatttgcagg ggatacatag 480
ggagatatag aagttctacc aataggttca gaatttagcc atagttctga tctaaaagct 540
gtactagacg tatttgatac tgtaaaggta tttatatata acttaactcc tgaatcctct 600
gggtttatca agcctcccca agcatttaaa ttacgttcta gaattagaaa gggggtatga 660
cccataaaat attttccttt aaaagattca tatacacgat agggtaggtt tactacttta 720
gttggtttat catgatgact tacggtatcg gaatttaaaa tgttttgatt ttccataaat 780
atgacctcct agtatttagt attattttat gtaaatatat atgtagaagt gtaccatttg 840
tgcaagattt caataaaggg tatattttac ctattttttt agtataaaaa atgcaaaaaa 900
tatgaacaaa agtagagttc ctatgtatta aattgtaaaa tatccactaa aaaaataaaa 960
ttataataaa aaatacaaaa aaataattga caatatataa ataattatgc ataattatat 1020
catgataaca attagttaag cataattaca tatatatgaa cataatatga catcttagaa 1080
gcatatcttt cgttagtaat aatataattt cctttagaag aaaatgattt atttaaaata 1140
aatagtgtaa tgttttttat aatttcaaaa agttccccaa tttagcatac taggcatgat 1200
aaaaatagct tgaataagtg cccgggatta tttattgata catagagaat ttcactcttt 1260
gcattttatc taacatcaag gggtttattt gtcacaaatt atgtaaaaat aaaacaaaga 1320
tgtaagaaag tcctatgata taaattttgt aaacataata aattagcttt cataagattg 1380
gaagaatgat aattactact tagaactgct aaaaattagg aaagaggtgt cgttaattaa 1440
tggaaaccag aaggtctgcc aattatgaac caaatagctg ggattatgat tatttgctgt 1500
cttctgacac tgacgaatct attgaagtat acaaagacaa ggccaaaaag ctggaggctg 1560
aggtgagaag agagattaac aatgaaaagg cagagttttt gactctgcct gaactgatag 1620
ataatgttca aaggttagga ttaggttaca gattcgagag tgacataagg agagcccttg 1680
atagatttgt ttcttcagga ggatttgatg ctgttacaaa aactagcctt catgctactg 1740
ctcttagctt caggcttctc agacagcatg gctttgaggt atctcaagaa gctttcagcg 1800
gattcaagga tcaaaatggc aatttcttga aaaaccttaa ggaggacatc aaggcaatac 1860
taagcctata tgaagcttca tttcttgcct tagaaggaga aaatatcttg gatgaggcca 1920
aggtgtttgc aatatcacat ctaaaagagc ttagcgaaga aaagattgga aaagacctgg 1980
ccgaacaggt gaatcatgca ttggagcttc cattgcatag aaggacacaa agactagaag 2040
ctgtttggag cattgaagca tacagaaaaa aggaagatgc agatcaagta ctgctagaac 2100
ttgctatatt ggactacaac atgattcaat cagtatacca aagagatctt agagagacat 2160
caaggtggtg gaggagagtg ggtcttgcaa caaagttgca ttttgctaga gacaggttaa 2220
ttgaaagctt ttactgggca gttggagttg catttgaacc tcaatacagt gattgtagaa 2280
attccgtagc aaaaatgttt tcttttgtaa caatcattga tgatatctat gatgtttatg 2340
gtactctgga tgagttggag ctatttacag atgctgttga gagatgggat gttaatgcca 2400
tcgatgatct tcctgattat atgaagcttt gtttcctagc tctttataac actatcaatg 2460
agatagctta tgataatctg aaggacaagg gggaaaacat tcttccatac ctaacaaaag 2520
catgggcaga tttatgtaat gcattcctac aagaagcaaa atggttgtac aataagtcca 2580
caccaacatt tgatgaatat ttcggaaatg catggaaatc atcctcaggg cctcttcaac 2640
tagtttttgc ctactttgcc gttgttcaaa acatcaagaa agaggaaatt gataacttac 2700
aaaagtatca tgatatcatc agtaggcctt cccatatctt tagactttgt aacgacttgg 2760
cttcagcatc tgctgagata gcaagaggtg aaaccgcaaa ttctgtatca tgttacatga 2820
gaacaaaagg catttctgag gaacttgcta ctgaatccgt aatgaatttg atcgacgaaa 2880
cctggaaaaa gatgaacaaa gaaaagcttg gtggctctct gtttgcaaaa ccttttgttg 2940
aaacagctat taaccttgca agacaatccc attgtactta tcataacgga gatgcacata 3000
cttcaccaga tgagcttact aggaaaagag tactgtcagt aatcacagag cctattctac 3060
cttttgagag ataataattt taaaatataa gtgatttaga tattcataat atatttggga 3120
ggtaaattaa tatgaccagc gcccaacgta aggacgacca tgtaaggctc gccatcgagc 3180
agcataacgc ccatagcgga cgtaaccagt tcgacgacgt gtctttcgta catcatgccc 3240
tggccggcat cgacaggcca gacgtgtccc tggccacgtc cttcgccggg atctcctggc 3300
aggtgcctat ctacatcaac gcgatgaccg gcggcagcga gaagaccggc ctcatcaaca 3360
gggacctggc caccgccgcc cgtgagaccg gcgtacccat cgcgtccggg tccatgaacg 3420
cgtacatcaa ggacccctcc tgcgccgaca cgttccgtgt gctgcgtgac gagaacccca 3480
acgggttcgt aatcgcgaac atcaacgcca ccacgacggt tgacaacgcg cagcgtgcga 3540
tcgacctgat cgaggcgaac gccctgcaga tccatatcaa cacggcgcag gagacgccta 3600
tgcctgaggg cgacaggtct ttcgcgtcct gggtccctca gatcgagaag atcgcggcgg 3660
ccgtagacat ccccgtgatc gtaaaggagg taggcaacgg cctgagcagg cagaccatcc 3720
tgctgctcgc cgacctcggc gtgcaggcgg cggacgtaag cggccgtggc ggcacggact 3780
tcgcccgtat cgagaacggc cgtagggagc tcggcgacta cgcgttcctg catggctggg 3840
ggcagtccac cgccgcctgc ctgctggacg cccaggacat ctccctgccc gtactcgcct 3900
ccggcggtgt gcgtcatcct ctcgacgtgg tacgtgccct cgcgctcggc gcccgtgccg 3960
taggctcctc cgccggcttc ctgcgtaccc tgatggacga cggcgtagac gcgctgatca 4020
cgaagctcac gacctggctg gaccagctgg cggcgctgca gaccatgctc ggcgcgcgta 4080
cccctgccga cctcacccgt tgcgacgtgc tgctccatgg cgagctgcgt gacttctgcg 4140
ccgacagggg catcgacacg cgtcgtctcg cccagcgttc cagctccatc gaggccctcc 4200
agacgacggg aagcacaaga taataatttt aaaatataag tgatttagat attcataata 4260
tatttgggag gtaaattaat atgaaagaag ttgtaatagc tagtgcagta agaacagcga 4320
ttggatctta tggaaagtct cttaaggatg taccagcagt agatttagga gctacagcta 4380
taaaggaagc agttaaaaaa gcaggaataa aaccagagga tgttaatgaa gtcattttag 4440
gaaatgttct tcaagcaggt ttaggacaga atccagcaag acaggcatct tttaaagcag 4500
gattaccagt tgaaattcca gctatgacta ttaataaggt ttgtggttca ggacttagaa 4560
cagttagctt agcagcacaa attataaaag caggagatgc tgacgtaata atagcaggtg 4620
gtatggaaaa tatgtctaga gctccttact tagcgaataa cgctagatgg ggatatagaa 4680
tgggaaacgc taaatttgtt gatgaaatga tcactgacgg attgtgggat gcatttaatg 4740
attaccacat gggaataaca gcagaaaaca tagctgagag atggaacatt tcaagagaag 4800
aacaagatga gtttgctctt gcatcacaaa aaaaagctga agaagctata aaatcaggtc 4860
aatttaaaga tgaaatagtt cctgtagtaa ttaaaggcag aaagggagaa actgtagttg 4920
atacagatga gcaccctaga tttggatcaa ctatagaagg acttgcaaaa ttaaaacctg 4980
ccttcaaaaa agatggaaca gttacagctg gtaatgcatc aggattaaat gactgtgcag 5040
cagtacttgt aatcatgagt gcagaaaaag ctaaagagct tggagtaaaa ccacttgcta 5100
agatagtttc ttatggttca gcaggagttg acccagcaat aatgggatat ggacctttct 5160
atgcaacaaa agcagctatt gaaaaagcag gttggacagt tgatgaatta gatttaatag 5220
aatcaaatga agcttttgca gctcaaagtt tagcagtagc aaaagattta aaatttgata 5280
tgaataaagt aaatgtaaat ggaggagcta ttgcccttgg tcatccaatt ggagcatcag 5340
gtgcaagaat actcgttact cttgtacacg caatgcaaaa aagagatgca aaaaaaggct 5400
tagcaacttt atgtataggt ggcggacaag gaacagcaat attgctagaa aagtgctagt 5460
agtttaaaag caaatataaa tgaaaaattg aaccctagca ttatgtaaat gcagggttta 5520
atttttatat taagcagcat aatagaaagt tttttaaatg catgtatata tggggtattt 5580
aaagggaaat ctataatata atttaggact atacatagag aatttcactc tttgcatttt 5640
atctaacatc aaggggttta tttgtcacaa attatgtaaa aataaaacaa agatgtaaga 5700
aagtcctatg atataaattt tgtaaacata ataaattagc tttcataaga ttggaagaat 5760
gataattact acttagaact gctaaaaatt aggaaagagg tgtcgttaat taatgcagaa 5820
aagacaaagg gagctgagtg cgttgacact acctacctct gctgaggggg tatcagaaag 5880
ccatagggcc cgttctgtcg gcatcggtcg tgcccatgcc aaggccatcc tgctgggaga 5940
gcatgcggta gtatacggag cgccggcact cgctctgcct attcctcagc tcacggtcac 6000
ggccagcgtt ggctggtctt ccgaggcctc cgacagtgcg ggtggcctgt cctacacgat 6060
gaccggtacg ccttctaggg cactggtgac gcaggcctcc gacggcctgc ataggctcac 6120
cgcggaattc atggcgagga tgggcgtgac gaacgcgcct catctcgacg tgatcctgga 6180
cggcgcgatc cctcacggca ggggtctcgg ctccagcgcg gccggctcac gtgcgatcgc 6240
cttggccctc gccgacctct tcggccacga actggccgag catacggcgt acgaactggt 6300
gcagacggcc gagaacatgg cgcatggcag ggccagcggc gtggacgcga tgacggtcgg 6360
cgcgtccagg cctctgctgt tccagcaggg ccgtaccgag agactggcca tcggctgcga 6420
cagcctgttc atcgtagccg acagcggcgt acctggcagc accaaggaag cggtagagat 6480
gctgagggag ggattcaccc gtagcgccgg aacacaggag cggttcgttg gcagggcgac 6540
ggaactgacc gaggccgcca ggcaggccct cgccgacggc aggcccgagg agctgggctc 6600
tcagctgacg tactaccatg agctgctcca tgaggcccgt ctgagcaccg acggcatcga 6660
tgcgctggta gaggccgcgc tgaaggcagg cagcctcgga gccaagatca ccggcggtgg 6720
tctgggcggc tgcatgatcg cacaggccag gcccgaacag gccagggagg taaccaggca 6780
gctccatgag gccggtgccg tacagacctg ggtagtacca ctgaaagggc tcgacaacca 6840
tgcgcagtaa taattttaaa atataagtga tttagatatt cataatatat ttgggaggta 6900
aattaatatg cgtagtgaac atcctaccac gaccgtgctc cagtctaggg agcagggcag 6960
cgcggccggc gccaccgcgg tagcgcatcc aaacatcgcg ctgatcaagt actggggcaa 7020
gcgtgacgag aggctgatcc tgccctgcac caccagcctg tctatgacgc tggacgtatt 7080
ccccacgacc accgaggtca ggctcgaccc cgccgccgag catgacacgg ccgccctcaa 7140
cggcgaggtg gccacgggcg agacgctgcg tcgtatcagc gccttcctct ccctggtgag 7200
ggaggtggcg ggcagcgacc agagggccgt ggtggacacc cgtaacaccg tgcccaccgg 7260
ggcgggcctg gcgtcctccg ccagcgggtt cgccgccctc gccgtcgcgg ccgcggccgc 7320
ctacgggctc gaactcgacg accgtgggct gtccaggctg gccagacgtg gatccggctc 7380
cgcctctcgg tctatcttcg gcggcttcgc cgtatggcat gccggccccg acggcacggc 7440
cacggaagcg gacctcggct cctacgccga gccagtgccc gcggccgacc tcgaccctgc 7500
gctggttatc gccgtggtaa acgccggccc caagcccgta tccagccgtg aggccatgcg 7560
tcgcaccgta gacacctcac cactgtacag gccatgggcc gactccagta aggacgacct 7620
ggacgagatg cgttctgcgc tgctgcgtgg cgacctcgag gccgtgggcg agatcgcgga 7680
gcgtaacgcg ctcggcatgc atgccaccat gctggccgcc cgtcccgcgg tgaggtacct 7740
gtcaccagcc acggtaaccg tgctcgacag cgtgctccag ctccgtaagg acggtgttct 7800
ggcctacgcg accatggacg ccggtcccaa cgtgaaggtg ctgtgcagga gggcggacgc 7860
cgagagggtg gccgacgttg tacgcgccgc cgcgtccggc ggtcaggtac tcgtagccgg 7920
gcctggagac ggtgcccgtc tgctgagcga gggcgcataa taattttaaa atataagtga 7980
tttagatatt cataatatat ttgggaggta aattaatatg acgacaggtc agcgtacgat 8040
cgtcaggcat gcgcctggca agctgttcgt agcgggcgag tacgcggtag tggatcctgg 8100
caaccctgcg atcctggtag cggtagacag gcatatcagc gtaaccgtgt ccgacgccga 8160
cgcggacacc ggggccgccg acgtagtgat ctcctccgac ctcggtcctc aggcggtagg 8220
ctggcgttgg catgacggca ggctcgtagt acgtgaccct gacgacgggc agcaggcgcg 8280
tagcgccctg gcccatgtgg tgtcggcgat cgagaccgtg ggcaggctgc tgggcgaacg 8340
tggacagaag gtacccgctc tcaccctctc cgttagcagc cgtctgcatg aggacggcag 8400
gaagttcggc ctgggctcca gcggcgcggt gaccgtggcg accgtagccg ccgtagccgc 8460
gttctgcgga ctcgaactgt ccaccgacga aaggttcagg ctggccatgc tcgccaccgc 8520
ggaactcgac cccaagggct ccggcgggga cctcgccgcc agcacctggg gcggctggat 8580
cgcctaccag gcgcccgaca gggcctttgt gctcgacctg gccaggcgtg tgggagtaga 8640
caggacactg aaggcgccct ggccggggca ttctgtgcgt agactgcctg cgcccaaggg 8700
cctcaccctg gaggtcggct ggaccggaga gcccgcctcc accgcgtccc tggtgtccga 8760
tctgcatcgt cgtacctgga ggggcagcgc ctcccatcag aggttcgtag agaccacgac 8820
cgactgtgta cgttccgcgg ttaccgccct ggagtccggc gacgacacga gcctgctgca 8880
tgagatccgc agggcccgtc aggagctggc ccgtctggac gacgaggtag gcctcggcat 8940
cttcacaccc aagctgacgg cgctgtgcga cgccgccgaa gccgttggcg gcgcggccaa 9000
gccctccggg gcaggcggcg gcgactgcgg catcgccctg ctggacgccg aggcgtctag 9060
ggacatcaca catgtaaggc aacggtggga gacagccggg gtgctgcccc tgcccctgac 9120
tcctgccctg gaagggatct aataatttta aaatataagt gatttagata ttcataatat 9180
atttgggagg taaattaata tgagcctcga ttccagactg cccgctttcc gtaacctgtc 9240
ccctgccgcg agactggacc acatcggcca gttgctcggc ctgagccacg acgatgtcag 9300
cctgctggcc aacgccggtg ccctgccgat ggacatcgcc aacggcatga tcgaaaacgt 9360
catcggcacc ttcgagctgc cctatgccgt ggccagcaac ttccagatca atggccgtga 9420
tgtgctggtg ccgctggtgg tggaagagcc ctcgatcgtc gccgctgctt cttacatggc 9480
caagctggcc cgtgccaacg gcggcttcac cacctccagc agcgccccgc tgatgcatgc 9540
ccaggtacag atcgtcggca tacaggaccc gctcaatgca cgtctgagcc tgctgagaag 9600
aaaagacgaa atcattgaac tggccaaccg taaggaccag ttgctcaaca gcctcggcgg 9660
cggctgcaga gacatcgaag tgcacacctt cgccgatacc ccgcgtggcc cgatgctggt 9720
ggcgcacctg atcgtcgatg taagagatgc catgggcgcc aacaccgtca ataccatggc 9780
cgaggccgtt gcgccgctga tggaagccat caccgggggc caggtacgtc tgagaattct 9840
gtccaacctg gccgacctgc gcctggccag ggcccaggtg aggattactc cgcagcaact 9900
ggaaacggcc gaattcagtg gcgaggcagt gatcgaaggc atcctcgacg cctacgcctt 9960
cgctgcggtc gacccttaca gagcggccac ccacaacaag ggcatcatga atggcatcga 10020
cccactgatc gtcgccactg gcaacgactg gcgtgcagtg gaagccggcg cccatgcgta 10080
tgcctgcaga agtggtcact acggctcgct gaccacctgg gaaaaggaca acaacggcca 10140
tttggtcggc accctggaaa tgccgatgcc cgtaggcctg gtcggcggcg ccaccaaaac 10200
ccatccgctg gcgcaactgt cactgagaat cctcggcgtg aaaacagccc aggcgctcgc 10260
tgagattgcc gtggccgtag gcctggcgca aaacctcggg gccatgagag ccctggccac 10320
cgaaggcatc cagcgtggcc acatggccct gcatgcgaga aatattgccg tggtggcggg 10380
cgcccgaggc gatgaggtgg actgggttgc ccggcagttg gtggaatacc acgacgtgag 10440
agccgacaga gccgtagcac tgctgaaaca aaagagaggc caatgatagt tttaaaatat 10500
aagtgattta gatattcata atatatttgg gaggtaaatt aatatgtcca tctccatagg 10560
cattcacgac ctgtctttcg ccacaaccga gttcgtactg cctcatacgg cgctcgccga 10620
gtacaacggc accgagatcg gcaagtacca tgtaggcatc ggccagcagt ctatgagcgt 10680
gcctgccgcc gacgaggaca tcgtgaccat ggccgcgacc gcggcgaggc ccatcatcga 10740
gcgtaacggc aagagcagga tccgtacggt agtgttcgcc acggagtctt ctatcgacca 10800
ggcgaaggcg ggcggcgtat acgtgcactc cctgctgggg ctggagtctg cctgcagggt 10860
agtagagctg aagcaggcct gctacggggc caccgccgcc cttcagttcg ccatcggcct 10920
ggtgaggcgt gaccccgccc agcaggtact ggtaatcgcc agtgacgtat ccaagtacga 10980
gctggacagc cccggcgagg cgacccaggg cgcggccgcg gtggccatgc tggtaggcgc 11040
cgaccctgcc ctgctgcgta tcgaggagcc ttcgggcctg ttcaccgccg acgtaatgga 11100
cttctggcgg cccaactacc tcaccaccgc tctggtagac ggccaggagt ccatcaacgc 11160
ctacctgcag gccgtagagg gcgcctggaa ggactacgcg gagcaggacg gcaggtcact 11220
ggaggagttc gcggcgttcg tataccacca gccgttcacg aagatggcct acaaggcgca 11280
tcgccatctg ctgaacttca acggctacga caccgacaag gacgccatcg agggcgccct 11340
cggccagacg acggcgtaca acaacgtaat cggcaacagc tacaccgcgt ctgtgtacct 11400
gggcctggcc gccctgctcg accaggcgga cgacctgacg ggccgttcca tcggcttcct 11460
gagctacggc tctggcagcg tagccgagtt cttctctggc accgtagtag ccgggtaccg 11520
tgagcgtctg cgtaccgagg cgaaccagga ggcgatcgcc aggcgtaaga gcgtagacta 11580
cgccacctac cgtgagctgc acgagtacac gctcccgtcc gacggcggcg accatgccac 11640
ccctgtgcag accaccggcc ccttcaggct ggccgggatc aacgaccata agcgtatcta 11700
cgaggcgcgt taataattta aaagcaaata taaatgaaaa attgaaccct agcattatgt 11760
aaatgcaggg tttaattttt atattaagca gcataataga aagtttttta aatgcatgta 11820
tatatggggt atttaaaggg aaatctataa tataatttag gactattccg gataccgttc 11880
gtataatgta tgctatacga agttatttca gattaaattt ttgcttattt gatttacatt 11940
atataatatt gagtaaagta ttgactagca aaattttttg atactttaat ttgtgaaatt 12000
tcttatcaaa agttatattt ttgaatgatt tttattgaaa aatacaacta aaaaggatta 12060
tagtataagt gtgtgtaatt ttgtgttaaa tttaaaggga ggaaatgaac atgaacttta 12120
ataaaattga tttagacaat tggaagagaa aagagatatt taatcattat ttgaaccaac 12180
aaacgacttt tagtataacc acagaaattg atattagtgt tttatacaga aacataaaac 12240
aagaaggata taaattttac cctgcattta ttttcttagt gacaagggtg ataaactcaa 12300
atacagcttt tagaactggt tacaatagcg acggagagtt aggttattgg gataagttag 12360
agccacttta tacaattttt gatggtgtat ctaaaacatt ctctggtatt tggactcctg 12420
taaagaatga cttcaaagag ttttatgatt tatacctttc tgatgtagag aaatataatg 12480
gttcggggaa attgtttccc aaaacaccta tacctgaaaa tgctttttct ctttctatta 12540
ttccatggac ttcatttact gggtttaact taaatatcaa taataatagt aattaccttc 12600
tacccattat tacagcagga aaattcatta ataaaggtaa ttcaatatat ttaccgctat 12660
ctttacaggt acatcattct gtttgtgatg gttatcatgc aggattgttt atgaactcta 12720
ttcaggaatt gtcagatagg cctaatgact ggcttttata ataatttaaa agcaaatata 12780
aatgaaaaat tgaaccctag cattatgtaa atgcagggtt taatttttat attaagcagc 12840
ataatagaaa gttttttaaa tgcatgtata tatggggtat ttaaagggaa atctataata 12900
taatttagga ctatataact tcgtataatg tatgctatac gaacggtacc taggatatat 12960
aataaattga atatagtaaa caaaaaggga catatttata atatgttctt tttagtttaa 13020
tactcaattt ttgcacataa gaaattaact taatataaaa aaatttgcga agctttgctt 13080
cgcagtttaa tattgtttag gtggttaaat tatgaatctg gaagtgttaa aaacagagtt 13140
taagtattta agagataaaa taattgaaaa gcaatatgaa catcttgatc ctatgcaaag 13200
aaaagcagtt ttaaatggtg aaaataactg tattgttatt gcttgtcctg gagcaggaaa 13260
gacccagact attattaata gagtggacta cttatgtaga ttcggtccta tatacaatac 13320
agattatgta cctaattgtc taaagaccga tgatttacag ataatgaaga aatatttaaa 13380
tgataattct tttaaagatg tgactgcagt aaataaaatt gagcatttgt taaatagcaa 13440
taaaataaat ccacagaaca tagttgttat aacttttact agagcagctg ctctcaatat 13500
gaaaaacaga tacatatcta taggaaataa agaaaagtca cctttttttg gaacattcca 13560
ctccctattt tataatatat tgaaaaagca taataaagaa ataaatatta tagatcctta 13620
taaggcacat gagatagtta aaaatacact tatgtattat ctggacttta taggagaaga 13680
gagagtaaag gaagttctaa atgacatatc tcttttaaaa aatagtgaaa ctaacataga 13740
tttatttaaa agtaaaattg acaaaagtgt atttttaaaa tgttttaatg aatatgaaaa 13800
ttataaagct agaaataagc ttatggattt tgatgattta caattaaaag ttaaagatat 13860
gtttctaaat cagaaatcta ttctagatag ttatcagaat ttgttcaagt atattttagt 13920
tgatgagttt caggattcag ataacctcca aatattcgaa atcggatgcc gggaccgacg 13980
agtgcagagg cgtgcaagcg agcttggcgt aatcatggtc atagctgttt cctgtgtgaa 14040
attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct 14100
ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc 14160
agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg 14220
gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 14280
ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 14340
gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 14400
aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 14460
gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 14520
ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 14580
cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 14640
cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 14700
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 14760
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 14820
agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg 14880
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 14940
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 15000
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 15060
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 15120
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 15180
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 15240
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 15300
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 15360
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 15420
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 15480
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 15540
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 15600
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 15660
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 15720
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 15780
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 15840
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 15900
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 15960
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 16020
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 16080
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 16140
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 16200
taacctataa aaataggcgt atcacgaggc cctttcgtc 16239
<210> 15
<211> 17400
<212> DNA
<213> 人工制造
<220>
<223> 基因簇
<400> 15
gaattcgagc tcggtacccg ggattattta ttgatacata gagaatttca ctctttgcat 60
tttatctaac atcaaggggt ttatttgtca caaattatgt aaaaataaaa caaagatgta 120
agaaagtcct atgatataaa ttttgtaaac ataataaatt agctttcata agattggaag 180
aatgataatt actacttaga actgctaaaa attaggaaag aggtgtcgtt aattaatgga 240
aaccagaagg tctgccaatt atgaaccaaa tagctgggat tatgattatt tgctgtcttc 300
tgacactgac gaatctattg aagtatacaa agacaaggcc aaaaagctgg aggctgaggt 360
gagaagagag attaacaatg aaaaggcaga gtttttgact ctgcctgaac tgatagataa 420
tgttcaaagg ttaggattag gttacagatt cgagagtgac ataaggagag cccttgatag 480
atttgtttct tcaggaggat ttgatgctgt tacaaaaact agccttcatg ctactgctct 540
tagcttcagg cttctcagac agcatggctt tgaggtatct caagaagctt tcagcggatt 600
caaggatcaa aatggcaatt tcttgaaaaa ccttaaggag gacatcaagg caatactaag 660
cctatatgaa gcttcatttc ttgccttaga aggagaaaat atcttggatg aggccaaggt 720
gtttgcaata tcacatctaa aagagcttag cgaagaaaag attggaaaag acctggccga 780
acaggtgaat catgcattgg agcttccatt gcatagaagg acacaaagac tagaagctgt 840
ttggagcatt gaagcataca gaaaaaagga agatgcagat caagtactgc tagaacttgc 900
tatattggac tacaacatga ttcaatcagt ataccaaaga gatcttagag agacatcaag 960
gtggtggagg agagtgggtc ttgcaacaaa gttgcatttt gctagagaca ggttaattga 1020
aagcttttac tgggcagttg gagttgcatt tgaacctcaa tacagtgatt gtagaaattc 1080
cgtagcaaaa atgttttctt ttgtaacaat cattgatgat atctatgatg tttatggtac 1140
tctggatgag ttggagctat ttacagatgc tgttgagaga tgggatgtta atgccatcga 1200
tgatcttcct gattatatga agctttgttt cctagctctt tataacacta tcaatgagat 1260
agcttatgat aatctgaagg acaaggggga aaacattctt ccatacctaa caaaagcatg 1320
ggcagattta tgtaatgcat tcctacaaga agcaaaatgg ttgtacaata agtccacacc 1380
aacatttgat gaatatttcg gaaatgcatg gaaatcatcc tcagggcctc ttcaactagt 1440
ttttgcctac tttgccgttg ttcaaaacat caagaaagag gaaattgata acttacaaaa 1500
gtatcatgat atcatcagta ggccttccca tatctttaga ctttgtaacg acttggcttc 1560
agcatctgct gagatagcaa gaggtgaaac cgcaaattct gtatcatgtt acatgagaac 1620
aaaaggcatt tctgaggaac ttgctactga atccgtaatg aatttgatcg acgaaacctg 1680
gaaaaagatg aacaaagaaa agcttggtgg ctctctgttt gcaaaacctt ttgttgaaac 1740
agctattaac cttgcaagac aatcccattg tacttatcat aacggagatg cacatacttc 1800
accagatgag cttactagga aaagagtact gtcagtaatc acagagccta ttctaccttt 1860
tgagagataa taattttaaa atataagtga tttagatatt cataatatat ttgggaggta 1920
aattaatatg accagcgccc aacgtaagga cgaccatgta aggctcgcca tcgagcagca 1980
taacgcccat agcggacgta accagttcga cgacgtgtct ttcgtacatc atgccctggc 2040
cggcatcgac aggccagacg tgtccctggc cacgtccttc gccgggatct cctggcaggt 2100
gcctatctac atcaacgcga tgaccggcgg cagcgagaag accggcctca tcaacaggga 2160
cctggccacc gccgcccgtg agaccggcgt acccatcgcg tccgggtcca tgaacgcgta 2220
catcaaggac ccctcctgcg ccgacacgtt ccgtgtgctg cgtgacgaga accccaacgg 2280
gttcgtaatc gcgaacatca acgccaccac gacggttgac aacgcgcagc gtgcgatcga 2340
cctgatcgag gcgaacgccc tgcagatcca tatcaacacg gcgcaggaga cgcctatgcc 2400
tgagggcgac aggtctttcg cgtcctgggt ccctcagatc gagaagatcg cggcggccgt 2460
agacatcccc gtgatcgtaa aggaggtagg caacggcctg agcaggcaga ccatcctgct 2520
gctcgccgac ctcggcgtgc aggcggcgga cgtaagcggc cgtggcggca cggacttcgc 2580
ccgtatcgag aacggccgta gggagctcgg cgactacgcg ttcctgcatg gctgggggca 2640
gtccaccgcc gcctgcctgc tggacgccca ggacatctcc ctgcccgtac tcgcctccgg 2700
cggtgtgcgt catcctctcg acgtggtacg tgccctcgcg ctcggcgccc gtgccgtagg 2760
ctcctccgcc ggcttcctgc gtaccctgat ggacgacggc gtagacgcgc tgatcacgaa 2820
gctcacgacc tggctggacc agctggcggc gctgcagacc atgctcggcg cgcgtacccc 2880
tgccgacctc acccgttgcg acgtgctgct ccatggcgag ctgcgtgact tctgcgccga 2940
caggggcatc gacacgcgtc gtctcgccca gcgttccagc tccatcgagg ccctccagac 3000
gacgggaagc acaagataat aattttaaaa tataagtgat ttagatattc ataatatatt 3060
tgggaggtaa attaatatga aagaagttgt aatagctagt gcagtaagaa cagcgattgg 3120
atcttatgga aagtctctta aggatgtacc agcagtagat ttaggagcta cagctataaa 3180
ggaagcagtt aaaaaagcag gaataaaacc agaggatgtt aatgaagtca ttttaggaaa 3240
tgttcttcaa gcaggtttag gacagaatcc agcaagacag gcatctttta aagcaggatt 3300
accagttgaa attccagcta tgactattaa taaggtttgt ggttcaggac ttagaacagt 3360
tagcttagca gcacaaatta taaaagcagg agatgctgac gtaataatag caggtggtat 3420
ggaaaatatg tctagagctc cttacttagc gaataacgct agatggggat atagaatggg 3480
aaacgctaaa tttgttgatg aaatgatcac tgacggattg tgggatgcat ttaatgatta 3540
ccacatggga ataacagcag aaaacatagc tgagagatgg aacatttcaa gagaagaaca 3600
agatgagttt gctcttgcat cacaaaaaaa agctgaagaa gctataaaat caggtcaatt 3660
taaagatgaa atagttcctg tagtaattaa aggcagaaag ggagaaactg tagttgatac 3720
agatgagcac cctagatttg gatcaactat agaaggactt gcaaaattaa aacctgcctt 3780
caaaaaagat ggaacagtta cagctggtaa tgcatcagga ttaaatgact gtgcagcagt 3840
acttgtaatc atgagtgcag aaaaagctaa agagcttgga gtaaaaccac ttgctaagat 3900
agtttcttat ggttcagcag gagttgaccc agcaataatg ggatatggac ctttctatgc 3960
aacaaaagca gctattgaaa aagcaggttg gacagttgat gaattagatt taatagaatc 4020
aaatgaagct tttgcagctc aaagtttagc agtagcaaaa gatttaaaat ttgatatgaa 4080
taaagtaaat gtaaatggag gagctattgc ccttggtcat ccaattggag catcaggtgc 4140
aagaatactc gttactcttg tacacgcaat gcaaaaaaga gatgcaaaaa aaggcttagc 4200
aactttatgt ataggtggcg gacaaggaac agcaatattg ctagaaaagt gctagtagtt 4260
taaaagcaaa tataaatgaa aaattgaacc ctagcattat gtaaatgcag ggtttaattt 4320
ttatattaag cagcataata gaaagttttt taaatgcatg tatatatggg gtatttaaag 4380
ggaaatctat aatataattt aggactatac atagagaatt tcactctttg cattttatct 4440
aacatcaagg ggtttatttg tcacaaatta tgtaaaaata aaacaaagat gtaagaaagt 4500
cctatgatat aaattttgta aacataataa attagctttc ataagattgg aagaatgata 4560
attactactt agaactgcta aaaattagga aagaggtgtc gttaattaat gcagaaaaga 4620
caaagggagc tgagtgcgtt gacactacct acctctgctg agggggtatc agaaagccat 4680
agggcccgtt ctgtcggcat cggtcgtgcc catgccaagg ccatcctgct gggagagcat 4740
gcggtagtat acggagcgcc ggcactcgct ctgcctattc ctcagctcac ggtcacggcc 4800
agcgttggct ggtcttccga ggcctccgac agtgcgggtg gcctgtccta cacgatgacc 4860
ggtacgcctt ctagggcact ggtgacgcag gcctccgacg gcctgcatag gctcaccgcg 4920
gaattcatgg cgaggatggg cgtgacgaac gcgcctcatc tcgacgtgat cctggacggc 4980
gcgatccctc acggcagggg tctcggctcc agcgcggccg gctcacgtgc gatcgccttg 5040
gccctcgccg acctcttcgg ccacgaactg gccgagcata cggcgtacga actggtgcag 5100
acggccgaga acatggcgca tggcagggcc agcggcgtgg acgcgatgac ggtcggcgcg 5160
tccaggcctc tgctgttcca gcagggccgt accgagagac tggccatcgg ctgcgacagc 5220
ctgttcatcg tagccgacag cggcgtacct ggcagcacca aggaagcggt agagatgctg 5280
agggagggat tcacccgtag cgccggaaca caggagcggt tcgttggcag ggcgacggaa 5340
ctgaccgagg ccgccaggca ggccctcgcc gacggcaggc ccgaggagct gggctctcag 5400
ctgacgtact accatgagct gctccatgag gcccgtctga gcaccgacgg catcgatgcg 5460
ctggtagagg ccgcgctgaa ggcaggcagc ctcggagcca agatcaccgg cggtggtctg 5520
ggcggctgca tgatcgcaca ggccaggccc gaacaggcca gggaggtaac caggcagctc 5580
catgaggccg gtgccgtaca gacctgggta gtaccactga aagggctcga caaccatgcg 5640
cagtaataat tttaaaatat aagtgattta gatattcata atatatttgg gaggtaaatt 5700
aatatgcgta gtgaacatcc taccacgacc gtgctccagt ctagggagca gggcagcgcg 5760
gccggcgcca ccgcggtagc gcatccaaac atcgcgctga tcaagtactg gggcaagcgt 5820
gacgagaggc tgatcctgcc ctgcaccacc agcctgtcta tgacgctgga cgtattcccc 5880
acgaccaccg aggtcaggct cgaccccgcc gccgagcatg acacggccgc cctcaacggc 5940
gaggtggcca cgggcgagac gctgcgtcgt atcagcgcct tcctctccct ggtgagggag 6000
gtggcgggca gcgaccagag ggccgtggtg gacacccgta acaccgtgcc caccggggcg 6060
ggcctggcgt cctccgccag cgggttcgcc gccctcgccg tcgcggccgc ggccgcctac 6120
gggctcgaac tcgacgaccg tgggctgtcc aggctggcca gacgtggatc cggctccgcc 6180
tctcggtcta tcttcggcgg cttcgccgta tggcatgccg gccccgacgg cacggccacg 6240
gaagcggacc tcggctccta cgccgagcca gtgcccgcgg ccgacctcga ccctgcgctg 6300
gttatcgccg tggtaaacgc cggccccaag cccgtatcca gccgtgaggc catgcgtcgc 6360
accgtagaca cctcaccact gtacaggcca tgggccgact ccagtaagga cgacctggac 6420
gagatgcgtt ctgcgctgct gcgtggcgac ctcgaggccg tgggcgagat cgcggagcgt 6480
aacgcgctcg gcatgcatgc caccatgctg gccgcccgtc ccgcggtgag gtacctgtca 6540
ccagccacgg taaccgtgct cgacagcgtg ctccagctcc gtaaggacgg tgttctggcc 6600
tacgcgacca tggacgccgg tcccaacgtg aaggtgctgt gcaggagggc ggacgccgag 6660
agggtggccg acgttgtacg cgccgccgcg tccggcggtc aggtactcgt agccgggcct 6720
ggagacggtg cccgtctgct gagcgagggc gcataataat tttaaaatat aagtgattta 6780
gatattcata atatatttgg gaggtaaatt aatatgacga caggtcagcg tacgatcgtc 6840
aggcatgcgc ctggcaagct gttcgtagcg ggcgagtacg cggtagtgga tcctggcaac 6900
cctgcgatcc tggtagcggt agacaggcat atcagcgtaa ccgtgtccga cgccgacgcg 6960
gacaccgggg ccgccgacgt agtgatctcc tccgacctcg gtcctcaggc ggtaggctgg 7020
cgttggcatg acggcaggct cgtagtacgt gaccctgacg acgggcagca ggcgcgtagc 7080
gccctggccc atgtggtgtc ggcgatcgag accgtgggca ggctgctggg cgaacgtgga 7140
cagaaggtac ccgctctcac cctctccgtt agcagccgtc tgcatgagga cggcaggaag 7200
ttcggcctgg gctccagcgg cgcggtgacc gtggcgaccg tagccgccgt agccgcgttc 7260
tgcggactcg aactgtccac cgacgaaagg ttcaggctgg ccatgctcgc caccgcggaa 7320
ctcgacccca agggctccgg cggggacctc gccgccagca cctggggcgg ctggatcgcc 7380
taccaggcgc ccgacagggc ctttgtgctc gacctggcca ggcgtgtggg agtagacagg 7440
acactgaagg cgccctggcc ggggcattct gtgcgtagac tgcctgcgcc caagggcctc 7500
accctggagg tcggctggac cggagagccc gcctccaccg cgtccctggt gtccgatctg 7560
catcgtcgta cctggagggg cagcgcctcc catcagaggt tcgtagagac cacgaccgac 7620
tgtgtacgtt ccgcggttac cgccctggag tccggcgacg acacgagcct gctgcatgag 7680
atccgcaggg cccgtcagga gctggcccgt ctggacgacg aggtaggcct cggcatcttc 7740
acacccaagc tgacggcgct gtgcgacgcc gccgaagccg ttggcggcgc ggccaagccc 7800
tccggggcag gcggcggcga ctgcggcatc gccctgctgg acgccgaggc gtctagggac 7860
atcacacatg taaggcaacg gtgggagaca gccggggtgc tgcccctgcc cctgactcct 7920
gccctggaag ggatctaata attttaaaat ataagtgatt tagatattca taatatattt 7980
gggaggtaaa ttaatatgag cctcgattcc agactgcccg ctttccgtaa cctgtcccct 8040
gccgcgagac tggaccacat cggccagttg ctcggcctga gccacgacga tgtcagcctg 8100
ctggccaacg ccggtgccct gccgatggac atcgccaacg gcatgatcga aaacgtcatc 8160
ggcaccttcg agctgcccta tgccgtggcc agcaacttcc agatcaatgg ccgtgatgtg 8220
ctggtgccgc tggtggtgga agagccctcg atcgtcgccg ctgcttctta catggccaag 8280
ctggcccgtg ccaacggcgg cttcaccacc tccagcagcg ccccgctgat gcatgcccag 8340
gtacagatcg tcggcataca ggacccgctc aatgcacgtc tgagcctgct gagaagaaaa 8400
gacgaaatca ttgaactggc caaccgtaag gaccagttgc tcaacagcct cggcggcggc 8460
tgcagagaca tcgaagtgca caccttcgcc gataccccgc gtggcccgat gctggtggcg 8520
cacctgatcg tcgatgtaag agatgccatg ggcgccaaca ccgtcaatac catggccgag 8580
gccgttgcgc cgctgatgga agccatcacc gggggccagg tacgtctgag aattctgtcc 8640
aacctggccg acctgcgcct ggccagggcc caggtgagga ttactccgca gcaactggaa 8700
acggccgaat tcagtggcga ggcagtgatc gaaggcatcc tcgacgccta cgccttcgct 8760
gcggtcgacc cttacagagc ggccacccac aacaagggca tcatgaatgg catcgaccca 8820
ctgatcgtcg ccactggcaa cgactggcgt gcagtggaag ccggcgccca tgcgtatgcc 8880
tgcagaagtg gtcactacgg ctcgctgacc acctgggaaa aggacaacaa cggccatttg 8940
gtcggcaccc tggaaatgcc gatgcccgta ggcctggtcg gcggcgccac caaaacccat 9000
ccgctggcgc aactgtcact gagaatcctc ggcgtgaaaa cagcccaggc gctcgctgag 9060
attgccgtgg ccgtaggcct ggcgcaaaac ctcggggcca tgagagccct ggccaccgaa 9120
ggcatccagc gtggccacat ggccctgcat gcgagaaata ttgccgtggt ggcgggcgcc 9180
cgaggcgatg aggtggactg ggttgcccgg cagttggtgg aataccacga cgtgagagcc 9240
gacagagccg tagcactgct gaaacaaaag agaggccaat gatagtttta aaatataagt 9300
gatttagata ttcataatat atttgggagg taaattaata tgtccatctc cataggcatt 9360
cacgacctgt ctttcgccac aaccgagttc gtactgcctc atacggcgct cgccgagtac 9420
aacggcaccg agatcggcaa gtaccatgta ggcatcggcc agcagtctat gagcgtgcct 9480
gccgccgacg aggacatcgt gaccatggcc gcgaccgcgg cgaggcccat catcgagcgt 9540
aacggcaaga gcaggatccg tacggtagtg ttcgccacgg agtcttctat cgaccaggcg 9600
aaggcgggcg gcgtatacgt gcactccctg ctggggctgg agtctgcctg cagggtagta 9660
gagctgaagc aggcctgcta cggggccacc gccgcccttc agttcgccat cggcctggtg 9720
aggcgtgacc ccgcccagca ggtactggta atcgccagtg acgtatccaa gtacgagctg 9780
gacagccccg gcgaggcgac ccagggcgcg gccgcggtgg ccatgctggt aggcgccgac 9840
cctgccctgc tgcgtatcga ggagccttcg ggcctgttca ccgccgacgt aatggacttc 9900
tggcggccca actacctcac caccgctctg gtagacggcc aggagtccat caacgcctac 9960
ctgcaggccg tagagggcgc ctggaaggac tacgcggagc aggacggcag gtcactggag 10020
gagttcgcgg cgttcgtata ccaccagccg ttcacgaaga tggcctacaa ggcgcatcgc 10080
catctgctga acttcaacgg ctacgacacc gacaaggacg ccatcgaggg cgccctcggc 10140
cagacgacgg cgtacaacaa cgtaatcggc aacagctaca ccgcgtctgt gtacctgggc 10200
ctggccgccc tgctcgacca ggcggacgac ctgacgggcc gttccatcgg cttcctgagc 10260
tacggctctg gcagcgtagc cgagttcttc tctggcaccg tagtagccgg gtaccgtgag 10320
cgtctgcgta ccgaggcgaa ccaggaggcg atcgccaggc gtaagagcgt agactacgcc 10380
acctaccgtg agctgcacga gtacacgctc ccgtccgacg gcggcgacca tgccacccct 10440
gtgcagacca ccggcccctt caggctggcc gggatcaacg accataagcg tatctacgag 10500
gcgcgttaat aatttaaaag caaatataaa tgaaaaattg aaccctagca ttatgtaaat 10560
gcagggttta atttttatat taagcagcat aatagaaagt tttttaaatg catgtatata 10620
tggggtattt aaagggaaat ctataatata atttaggact attccggagc atgcttggca 10680
ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca acttaatcgc 10740
cttgcagcac atcccccttt cgccagctgg cgtaatagcg aagaggcccg caccgatcgc 10800
ccttcccaac agttgcgcag cctgaatggc gaatggcgcc tgatgcggta ttttctcctt 10860
acgcatctgt gcggtatttc acaccgcata tggtgcactc tcagtacaat ctgctctgat 10920
gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 10980
tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 11040
cagaggtttt caccgtcatc accgaaacgc gcgagacgaa agggcctcgt gatacgccta 11100
tttttatagg ttaatgtcat gataataatg gtttcttaga cgtcaggtgg cacttttcgg 11160
ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 11220
ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 11280
attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 11340
gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 11400
ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 11460
cgttttccaa tgatgagcac ttttaaatta aaaatgaagt tttaaaactt catttttaat 11520
ttaaattaaa aatgaagttt tatcaaaaaa atttccaata atcccactct aagccacaaa 11580
cacgccctat aaaatcccgc tttaatccca ctttgagaca catgtaatat tactttacgc 11640
cctagtatag tgataatttt ttacattcaa tgccacgcaa aaaaataaag gggcactata 11700
ataaaagttc cttcggaact aactaaagta aaaaattatc tttacaacct ccccaaaaaa 11760
aagaacaggt acaaagtacc ctataataca agcgtaaaaa aatgagggta aaaataaaaa 11820
aataaaaaaa taaaaaaata aaaaaataaa aaaaataaaa aaataaaaaa ataaaaaaat 11880
aaaaaaataa aaaaataaaa aaataaaaaa ataaaaaaat ataaaaataa aaaaatataa 11940
aaataaaaaa atataaaaat aaaaaaatat aaaaataaaa aaataaaaaa atataaaaat 12000
aaaaaaataa aaaaatataa aaatattttt tatttaaagt ttgaaaaaaa tttttttata 12060
ttatataatc tttgaagaaa agaatataaa aaatgagcct ttataaaagc ccattttttt 12120
tcatatacgt aatatgacgt tctaatgttt ttattggtac ttctaacatt agagtaattt 12180
ctttattttt aaagcctttt tctttaaggg cttttatttt ttttcttaat acatttaatt 12240
cctctttttt tgttgctttt cctttagctt ttaattgctc ttgataattt tttttacctc 12300
taatattttc tcttctctta tattcctttt tagaaattat tattgtcata tatttttgtt 12360
cttcttctgt aatttctaat aactctataa gagtttcatt cttatactta tattgcttat 12420
ttttatctaa ataacatctt tcagcacttc tagttgctct tataacttct ctttcactta 12480
aatgttgtct aaacatacta ttaagttcta aaacatcatt taatgccttc tcaatgtctt 12540
ctgtaaagct acaaagataa tatctatata aaaataatat aagctctctg tgtcctttta 12600
aatcatattc tcttagttca caaagtttta ttatgtcttg tattcttcca taatataaac 12660
ttctttctct ataaatataa tttattttgc ttggtctacc ctttttcctt tcatatggtt 12720
ttaattcagg taaaaatcca ttttgtattt ctcttaagtc ataaatatat tcgtactcat 12780
ctaatatatt gactactgtt tttgatttag agtttatact tcctggaact cttaatattc 12840
tggttgcatc taaggcttgt ctatctgctc caaagtattt taattgatta tataaatatt 12900
cttgaaccgc tttccataat ggtaatgctt tactaggtac tgcatttatt atccatatta 12960
aatacattcc tcttccacta tctattacat agtttggtat aggaatactt tgattaaaat 13020
aattcttttc taagtccatt aatacctggt ctttagtttt gccagtttta taataatcca 13080
agtctataaa cagtgtattt aactctttta tattttctaa tcgcctacac ggcttataaa 13140
aggtatttag agttatatag atattttcat cactcatatc taaatctttt aattcagcgt 13200
atttatagtg ccattggcta tatccttttt tatctataac gctcctggtt atccaccctt 13260
tacttctact atgaatatta tctatatagt tctttttatt cagctttaat gcgtttctca 13320
cttattcacc tccccttctg taaaactaag aaaattatat catattttca ataattatta 13380
actattctta aactcttaat aaaaaataga gtaagtcccc aattgaaact taatctattt 13440
tttatgtttt aatttattat ttttattaaa atattttaaa ctaaattaaa tgattctttt 13500
taatttttta ctatttcatt ccataatata ttactataat tatttacaaa taatatttct 13560
tcatttgtaa tatttagatg atttactaat tttagttttt atatattaaa taattaatgt 13620
ataatttata taaaaaatca aaggagctta taaattatga ttatttccaa agatactaaa 13680
gatttaattt tttcaatttt aacaatactt tttgtaatat tatgtttaaa tttaattgta 13740
tttttttcat ataataaagc cgttgaagta aaccaatcca ttttccttat gatgttatta 13800
ttaaatttaa gttttataat aatatcttta ttatatttat tgtttttaaa aaaactagtg 13860
aaatttccgg ctttattaaa cttattttta ggaattttat tttcattttc atctttacag 13920
gatttgatta tatctttaaa tatgttttat caaatattat ctttttctaa atttatatat 13980
atttttatta tatttattat tatatatatt ttatttttaa gtttctttct aacagctatt 14040
aaaaagaaac ttaaaaataa aaacacgtac tctaaaccaa taaataaaac tatttttatt 14100
attgctgcct tgattggaat agtttttagt aaaattaatt tcaatattcc acaatattat 14160
attataagct agctttgcat tgtacttttc aatcgcttca cgaatgcggt tatctccgaa 14220
agataaagtc ttttcatctt ccttgatgaa gataagattt tctccgtctc cgccggcaga 14280
attgaagcgg ggtactacgg tatcgtctgc gtcatcttcc gttgtctgat agatgatagt 14340
cataggctca ttttcttccg tttcggtaaa ggggataggt tcgccctttg agagcagggc 14400
ggcgatggaa agcattaact tgcttttccc atcgcccgga tctccctgca atagcgtaac 14460
tttgccaaac ggaatatacg gataccacag ccactttact tctttcggct cgatttcact 14520
tgccttgatg atttcaagag gtacgctgaa attcatttcg ttttcattta gtttcatttt 14580
ttcttgttct ccttttctct gaaaatataa aaaccacaga ttgatactaa aaccttggtt 14640
gtgttgcttt tcggggctta aatcaaggaa aaatccttgt tttaagcctt tcaaaaagaa 14700
acacaaggtc tttgtactaa cctgtggtta tgtataaaat tgtagatttt agggtaacaa 14760
aaaacaccgt atttctacga tgtttttgct taaatacttg tttttagtta cagacaaacc 14820
tgaagttatc atagtcctaa attatattat agatttccct ttaaataccc catatataca 14880
tgcatttaaa aaactttcta ttatgctgct taatataaaa attaaaccct gcatttacat 14940
aatgctaggg ttcaattttt catttatatt tgcttttaaa ttataaaagc cagtcattag 15000
gcctatctga caattcctga atagagttca taaacaatcc tgcatgataa ccatcacaaa 15060
cagaatgatg tacctgtaaa gatagcggta aatatattga attaccttta ttaatgaatt 15120
ttcctgctgt aataatgggt agaaggtaat tactattatt attgatattt aagttaaacc 15180
cagtaaatga agtccatgga ataatagaaa gagaaaaagc attttcaggt ataggtgttt 15240
tgggaaacaa tttccccgaa ccattatatt tctctacatc agaaaggtat aaatcataaa 15300
actctttgaa gtcattcttt acaggagtcc aaataccaga gaatgtttta gatacaccat 15360
caaaaattgt ataaagtggc tctaacttat cccaataacc taactctccg tcgctattgt 15420
aaccagttct aaaagctgta tttgagttta tcacccttgt cactaagaaa ataaatgcag 15480
ggtaaaattt atatccttct tgttttatgt ttctgtataa aacactaata tcaatttctg 15540
tggttatact aaaagtcgtt tgttggttca aataatgatt aaatatctct tttctcttcc 15600
aattgtctaa atcaatttta ttaaagttca tgttcatttc ctccctttaa atttaacaca 15660
aaattacaca cacttatact ataatccttt ttagttgtat ttttcaataa aaatcattca 15720
aaaatataac ttttgataag aaatttcaca aattaaagta tcaaaaaatt ttgctagtca 15780
atactttact caatattata taatgtaaat caaataagca aaaatttaat ctgaagatgc 15840
ttagtgggaa tttgtacccc ttatcgatac aaattccccg taggcgctag ggacactttt 15900
tcactcgtta aaaagttttg agaatatttt atatttttgt tcatgtaatc actccttctt 15960
aattacaaat ttttagcatc taatttaact tcaattccta ttatacaaaa ttttaagata 16020
ctgcactatc aacacactct taagtttgct tctaagtctt atttccataa cttcttttac 16080
gtttccgggt acaattcgta atcatgtcat agctgtttcc tgtgtgaaat tcttatccgc 16140
tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 16200
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 16260
tgtcgtgcca gaaaacttca tttttaattt aaaaggatct aggtgaagat cctttttgat 16320
aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta 16380
gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa 16440
acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt 16500
tttccgaagg taactggctt cagcagagcg cagataccaa atactgtcct tctagtgtag 16560
ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta 16620
atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca 16680
agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag 16740
cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa 16800
agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga 16860
acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc 16920
gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc 16980
ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt 17040
gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt 17100
gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag 17160
gaagcggaag agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa 17220
tgcagctggc acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat 17280
gtgagttagc tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg 17340
ttgtgtggaa ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac 17400

Claims (59)

1.一种重组细胞,其具有由甲基四氢叶酸、一氧化碳及CoA合成乙酰CoA的功能,
所述重组细胞具有表达外源性NAD(P)H消耗途径的基因,且该基因在所述重组细胞内表达,
所述重组细胞具有的内源性NAD(P)H消耗途径中的至少一者的表达被下调,且所述内源性NAD(P)H消耗途径与所述外源性NAD(P)H消耗途径不同,
所述重组细胞能够通过所述外源性NAD(P)H消耗途径,由选自一氧化碳及二氧化碳中的至少一者生产碳原子数为4以上的有机化合物。
2.如权利要求1所述的重组细胞,其为梭菌(Clostridium)属细菌或穆尔氏菌(Moorella)属细菌。
3.如权利要求2所述的重组细胞,其为李氏梭菌(Clostridium ljungdahlii)、自产乙醇梭菌(Clostridium autoethanogenum)、食一氧化碳梭菌(Clostridiumcarboxidivorans)、拉氏梭菌(Clostridium ragsdalei)、科氏梭菌(Clostridiumkluyveri)或热醋穆尔氏菌(Moorella thermoacetica)。
4.如权利要求2或3所述的重组细胞,其中,所述外源性NAD(P)H消耗途径为甲羟戊酸途径。
5.如权利要求4所述的重组细胞,其中,所述甲羟戊酸途径为酵母、原核生物或放线菌的甲羟戊酸途径。
6.如权利要求4所述的重组细胞,其中,所述甲羟戊酸途径为放线菌的甲羟戊酸途径。
7.如权利要求4所述的重组细胞,其中,作为所述甲羟戊酸途径的HMG-CoA还原酶,包含NADH依赖性的HMG-CoA还原酶。
8.如权利要求7所述的重组细胞,其中,所述HMG-CoA还原酶为来自Pseudomonasmevalonii的mvaA(P13702)、来自Methanocella conradii的hmgA-1Mtc_0274(H8I942)、来自乳酸乳球菌乳酸亚种(Lactococcus lactis subsp.lactis)(KF147株)的mvaALLKF_1694(D2BKK7)或来自血链球菌(Streptococcus sanguinis)(SK36株)的mvaA SSA_0337(A3CKT9)。
9.如权利要求4~8中任一项所述的重组细胞,其中,在所述内源性NAD(P)H消耗途径中,选自乙醇脱氢酶、乙醛脱氢酶、乳酸脱氢酶、及2,3-丁二醇脱氢酶中的至少一者的表达被下调。
10.如权利要求9所述的重组细胞,其中,在所述内源性NAD(P)H消耗途径中,至少乙醇脱氢酶的表达被下调。
11.如权利要求10所述的重组细胞,其中,在所述内源性NAD(P)H消耗途径中,乙醛脱氢酶的表达也被下调。
12.如权利要求10或11所述的重组细胞,其中,在所述内源性NAD(P)H消耗途径中,乳酸脱氢酶或2,3-丁二醇脱氢酶的表达也被下调。
13.如权利要求9~12中任一项所述的重组细胞,其中,所述下调的至少一种为表达缺失。
14.如权利要求13所述的重组细胞,其中,乙醇脱氢酶和/或乙醛脱氢酶的表达发生了缺失。
15.如权利要求14所述的重组细胞,其中,通过同源重组,表达所述甲羟戊酸途径的基因被整合至基因组中来代替编码乙醇脱氢酶和/或乙醛脱氢酶的基因。
16.如权利要求9~15中任一项所述的重组细胞,其中,磷酸转乙酰化酶和/或乙酸激酶的表达也被下调。
17.如权利要求16所述的重组细胞,其中,至少磷酸转乙酰化酶的表达被下调。
18.如权利要求1~17中任一项所述的重组细胞,其中,所述下调的至少一种是通过基因缺失或基因表达调控区的修饰而进行的。
19.如权利要求9~18中任一项所述的重组细胞,其中,表达所述外源性NAD(P)H消耗途径的基因为基因簇,该基因簇包含表达甲羟戊酸途径的基因和编码由异戊烯基二磷酸生成异戊二烯的酶的基因,
所述有机化合物为异戊二烯。
20.如权利要求19所述的重组细胞,其中,所述由异戊烯基二磷酸生成异戊二烯的酶是异戊二烯合成酶。
21.如权利要求9~18中任一项所述的重组细胞,其中,表达所述外源性NAD(P)H消耗途径的基因为基因簇,该基因簇包含表达甲羟戊酸途径的基因和编码由异戊烯基二磷酸生成环萜烯的酶的基因,
所述有机化合物为环萜烯。
22.如权利要求21所述的重组细胞,其中,所述由异戊烯基二磷酸生成环萜烯的酶为牻牛儿基二磷酸合成酶和/或橙花基二磷酸合成酶、及环单萜烯合成酶,
所述有机化合物为环单萜烯。
23.如权利要求22所述的重组细胞,其中,所述环单萜烯合成酶为β-水芹烯合成酶,所述环单萜烯为β-水芹烯、4-蒈烯或柠檬烯。
24.如权利要求18~23中任一项所述的重组细胞,其中,所述基因簇被整合至重组细胞的基因组中。
25.如权利要求19或20所述的重组细胞,其中,
作为所述重组细胞的基本的宿主细胞的adhE1基因及adhE2基因的一部分或全部发生了缺失,
通过同源重组,所述基因簇被整合至基因组中来代替所述adhE1基因及adhE2基因。
26.如权利要求21~23中任一项所述的重组细胞,其中,作为所述重组细胞的基本的宿主细胞的adhE1基因及adhE2基因的一部分或全部发生了缺失,
通过同源重组,所述基因簇被整合至基因组中来代替所述adhE1基因及adhE2基因。
27.一种重组细胞的制造方法,其包括:
第一工序:提供宿主细胞,该宿主细胞具有由甲基四氢叶酸、一氧化碳及CoA合成乙酰CoA的功能;及
第二工序:向所述宿主细胞中导入表达外源性NAD(P)H消耗途径的基因,
第二工序中导入的所述基因在所述宿主细胞内表达,
所述宿主细胞具有的内源性NAD(P)H消耗途径中的至少一者的表达被下调,且所述内源性NAD(P)H消耗途径与所述外源性NAD(P)H消耗途径不同,
所述重组细胞能够通过所述外源性NAD(P)H消耗途径,由选自一氧化碳及二氧化碳中的至少一者来生产碳原子数为4以上的所述有机化合物。
28.如权利要求27所述的重组细胞的制造方法,其中,所述宿主细胞为梭菌(Clostridium)属细菌或穆尔氏菌(Moorella)属细菌。
29.如权利要求28所述的重组细胞的制造方法,其中,所述宿主细胞为李氏梭菌(Clostridium ljungdahlii)、自产乙醇梭菌(Clostridium autoethanogenum)、食一氧化碳梭菌(Clostridium carboxidivorans)、拉氏梭菌(Clostridium ragsdalei)、科氏梭菌(Clostridium kluyveri)或热醋穆尔氏菌(Moorella thermoacetica)。
30.如权利要求28或29所述的重组细胞的制造方法,其中,所述外源性NAD(P)H消耗途径为甲羟戊酸途径。
31.如权利要求30所述的重组细胞的制造方法,其中,所述甲羟戊酸途径为酵母、原核生物或放线菌的甲羟戊酸途径。
32.如权利要求30所述的重组细胞的制造方法,其中,所述甲羟戊酸途径为放线菌的甲羟戊酸途径。
33.如权利要求30所述的重组细胞的制造方法,其中,作为所述甲羟戊酸途径的HMG-CoA还原酶,包含NADH依赖性的HMG-CoA还原酶。
34.如权利要求33所述的重组细胞的制造方法,其中,所述HMG-CoA还原酶为来自Pseudomonas mevalonii的mvaA(P13702)、来自Methanocella conradii的hmgA-1Mtc_0274(H8I942)、来自乳酸乳球菌乳酸亚种(Lactococcus lactis subsp.lactis)(KF147株)的mvaA LLKF_1694(D2BKK7)或来自血链球菌(Streptococcus sanguinis)(SK36株)的mvaASSA_0337(A3CKT9)。
35.如权利要求30~34中任一项所述的重组细胞的制造方法,其中,在所述内源性NAD(P)H消耗途径中,选自乙醇脱氢酶、乙醛脱氢酶、乳酸脱氢酶及2,3-丁二醇脱氢酶中的至少一种的表达被下调。
36.如权利要求35所述的重组细胞的制造方法,其中,在所述内源性NAD(P)H消耗途径中,至少乙醇脱氢酶的表达被下调。
37.如权利要求36所述的重组细胞的制造方法,其中,在所述内源性NAD(P)H消耗途径中,乙醛脱氢酶的表达也被下调。
38.如权利要求36或37所述的重组细胞的制造方法,其中,在所述内源性NAD(P)H消耗途径中,乳酸脱氢酶或2,3-丁二醇脱氢酶的表达也下调。
39.如权利要求35~37中任一项所述的重组细胞的制造方法,其中,所述下调的至少一种为表达缺失。
40.如权利要求39所述的重组细胞的制造方法,其中,乙醇脱氢酶和/或乙醛脱氢酶的表达发生了缺失。
41.如权利要求40所述的重组细胞的制造方法,其中,通过同源重组,表达所述甲羟戊酸途径的基因被整合至所述重组细胞的基因组中来代替编码乙醇脱氢酶和/或乙醛脱氢酶的基因。
42.如权利要求35~41中任一项所述的重组细胞的制造方法,其中,磷酸转乙酰化酶和/或乙酸激酶的表达也被下调。
43.如权利要求42所述的重组细胞的制造方法,其中,至少磷酸转乙酰化酶的表达被下调。
44.如权利要求27~43中任一项所述的重组细胞的制造方法,其中,所述下调的至少一种通过基因的缺失或基因表达调控区的修饰而进行。
45.如权利要求35~44中任一项所述的重组细胞的制造方法,其中,所述第二工序中导入的基因为基因簇,该基因簇包含表达甲羟戊酸途径的基因和编码由异戊烯基二磷酸生成异戊二烯的酶的基因,
所述有机化合物为异戊二烯。
46.如权利要求45所述的重组细胞的制造方法,其中,所述由异戊烯基二磷酸生成异戊二烯的酶为异戊二烯合成酶。
47.如权利要求35~44中任一项所述的重组细胞的制造方法,其中,所述第二工序中导入的基因为基因簇,该基因簇包含表达甲羟戊酸途径的基因和编码由异戊烯基二磷酸生成环萜烯的酶的基因,
所述有机化合物为环萜烯。
48.如权利要求47所述的重组细胞的制造方法,其中,所述由异戊烯基二磷酸生成环萜烯的酶为牻牛儿基二磷酸合成酶和/或橙花基二磷酸合成酶、及环单萜烯合成酶,
所述有机化合物为环单萜烯。
49.如权利要求48所述的重组细胞的制造方法,其中,所述环单萜烯合成酶为β-水芹烯合成酶,所述环单萜烯为β-水芹烯、4-蒈烯或柠檬烯。
50.如权利要求44~49中任一项所述的重组细胞的制造方法,其中,所述基因簇被整合至宿主细胞的基因组中。
51.如权利要求45或46所述的重组细胞的制造方法,其中,
宿主细胞的adhE1基因及adhE2基因的一部分或全部发生了缺失,
通过同源重组,所述基因簇被整合至基因组中来代替所述adhE1基因及adhE2基因。
52.如权利要求47~49中任一项所述的重组细胞的制造方法,其中,
宿主细胞的adhE1基因及adhE2基因的一部分或全部发生了缺失,
通过同源重组,所述基因簇被整合至基因组中来代替所述adhE1基因及adhE2基因。
53.一种有机化合物的生产方法,其包括:
使权利要求1~26中任一项所述的重组细胞或通过权利要求27~52中任一项所述的方法制造的重组细胞与选自一氧化碳及二氧化碳中的至少一种C1化合物接触,使该重组细胞由所述C1化合物生产碳原子数为4以上的有机化合物。
54.如权利要求53所述的有机化合物的生产方法,其中,将选自一氧化碳及二氧化碳中的至少一种C1化合物为用作碳源,培养所述重组细胞,使该重组细胞生产碳原子数为4以上的有机化合物。
55.如权利要求53或54所述的有机化合物的生产方法,其中,
向所述重组细胞提供以一氧化碳为主要成分的气体、以一氧化碳和氢为主要成分的气体、以二氧化碳和氢为主要成分的气体、或者以一氧化碳、二氧化碳及氢为主要成分的气体。
56.如权利要求55所述的有机化合物的生产方法,其中,进一步向所述重组细胞提供甲酸或甲醇。
57.如权利要求53~56中任一项所述的有机化合物的生产方法,其中,所述重组细胞为梭菌(Clostridium)属细菌或穆尔氏菌(Moorella)属细菌。
58.如权利要求53~57中任一项所述的有机化合物的生产方法,其中,对释放至所述重组细胞的细胞外的所述有机化合物进行回收。
59.如权利要求53~58中任一项所述的有机化合物的生产方法,其中,从所述重组细胞的培养系统的气相中回收所述有机化合物。
CN201580084036.5A 2015-11-30 2015-11-30 重组细胞,重组细胞的制造方法以及有机化合物的生产方法 Pending CN108138162A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/083545 WO2017094053A1 (ja) 2015-11-30 2015-11-30 組換え細胞、組換え細胞の製造方法、並びに、有機化合物の生産方法

Publications (1)

Publication Number Publication Date
CN108138162A true CN108138162A (zh) 2018-06-08

Family

ID=58796502

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580084036.5A Pending CN108138162A (zh) 2015-11-30 2015-11-30 重组细胞,重组细胞的制造方法以及有机化合物的生产方法

Country Status (5)

Country Link
US (1) US20180334657A1 (zh)
EP (1) EP3385378A4 (zh)
JP (1) JPWO2017094053A1 (zh)
CN (1) CN108138162A (zh)
WO (1) WO2017094053A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114181879A (zh) * 2021-12-09 2022-03-15 中国科学院深圳先进技术研究院 具有自养能力的底盘细胞及其构建方法和应用

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112011471B (zh) * 2019-05-31 2022-07-22 深圳华大生命科学研究院 酿制柠檬风味啤酒的酵母菌株、其制备方法及啤酒酿制方法
US20240209401A1 (en) * 2022-05-12 2024-06-27 Gwangju Institute Of Science And Technology Culture medium composition for increasing growth and metabolic rate of acetogenic strain and method for culturing acetogenic strain using the same

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104039974A (zh) * 2011-11-09 2014-09-10 阿迈瑞斯公司 乙酰辅酶a衍生的类异戊二烯的生产
CN104797704A (zh) * 2012-09-21 2015-07-22 积水化学工业株式会社 重组细胞以及β-水芹烯的生产方法
CN104822823A (zh) * 2012-06-01 2015-08-05 郎泽科技新西兰有限公司 重组代谢微生物及其用途
CN104919040A (zh) * 2013-01-21 2015-09-16 积水化学工业株式会社 重组细胞以及1,4-丁二醇的生产方法
CN104919038A (zh) * 2012-10-23 2015-09-16 积水化学工业株式会社 重组细胞以及异戊二烯的生产方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014161252A (ja) * 2013-02-22 2014-09-08 Sekisui Chem Co Ltd 組換え細胞
JP6404575B2 (ja) * 2013-03-26 2018-10-10 株式会社日本触媒 遺伝子改変クロストリジウム・サッカロパーブチルアセトニカム
JP6325862B2 (ja) * 2014-03-25 2018-05-16 積水化学工業株式会社 組換え細胞、並びに、環式モノテルペンの生産方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104039974A (zh) * 2011-11-09 2014-09-10 阿迈瑞斯公司 乙酰辅酶a衍生的类异戊二烯的生产
CN104822823A (zh) * 2012-06-01 2015-08-05 郎泽科技新西兰有限公司 重组代谢微生物及其用途
CN104797704A (zh) * 2012-09-21 2015-07-22 积水化学工业株式会社 重组细胞以及β-水芹烯的生产方法
CN104919038A (zh) * 2012-10-23 2015-09-16 积水化学工业株式会社 重组细胞以及异戊二烯的生产方法
CN104919040A (zh) * 2013-01-21 2015-09-16 积水化学工业株式会社 重组细胞以及1,4-丁二醇的生产方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LEANG CHING等: "A Genetic System for Clostridium ljungdahlii: a Chassis for Autotrophic Production of Biocommodities and a Model Homoacetogen", 《APPLIED AND ENVIRONMENTAL MICROBIOLOGY》 *
MICHAEL KIRIUKHIN等: "Mevalonate production by engineered acetogen biocatalyst during continuous fermentation of syngas or CO2/H2 blend", 《BIOPROCESS AND BIOSYSTEMS ENGINEERING》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114181879A (zh) * 2021-12-09 2022-03-15 中国科学院深圳先进技术研究院 具有自养能力的底盘细胞及其构建方法和应用
CN114181879B (zh) * 2021-12-09 2022-11-22 中国科学院深圳先进技术研究院 具有自养能力的底盘细胞及其构建方法和应用

Also Published As

Publication number Publication date
EP3385378A4 (en) 2019-04-24
JPWO2017094053A1 (ja) 2018-09-13
EP3385378A1 (en) 2018-10-10
US20180334657A1 (en) 2018-11-22
WO2017094053A1 (ja) 2017-06-08

Similar Documents

Publication Publication Date Title
CA2794817C (en) Cell suitable for fermentation of a mixed sugar composition
DK2776571T3 (en) PREPARATION OF ACETYL-COENZYM A-DERIVED ISOPRENOIDS
DK2670846T3 (en) METHODS FOR THE DEVELOPMENT OF TERPEN SYNTHASE VARIETIES
IL236992A (en) Genetically modified cyanobacteria that produce ethanol
KR102147005B1 (ko) Fad2 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
KR20140146616A (ko) 부타놀로겐용 배지의 아세테이트 보충물
KR20140113997A (ko) 부탄올 생성을 위한 유전자 스위치
KR20130027063A (ko) Fe-s 클러스터 요구성 단백질의 활성 향상
DK3108014T3 (en) Methods and systems for rapid detection of microorganisms using recombinant bacteriophage
KR20200067176A (ko) N-아세틸뉴라민산의 발효적 생산
CN113874501A (zh) 使用碱基编辑器进行靶向诱变
KR20100037031A (ko) 유전자 녹아웃 중온성 및 호열성 생물체, 및 이의 사용 방법
BRPI0806354A2 (pt) plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados
CN101297042A (zh) 四碳醇的发酵生产
JP2015180227A (ja) トランスジェニック光合成微生物およびフォトバイオリアクター
US20040003420A1 (en) Modified recombinase
KR20130117753A (ko) 포스포케톨라아제를 포함하는 재조합 숙주 세포
KR20210023842A (ko) 시알릴화 사카라이드의 발효 생산
KR20220012327A (ko) 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포
CN107429269A (zh) 通过在微生物中转化戊糖用于生产至少一种感兴趣的代谢物的方法
KR20180084135A (ko) 감소된 clr2 활성을 갖는 사상 진균에서 단백질을 생산하는 방법
KR20150042856A (ko) 클라빈-유형 알칼로이드의 생산을 위한 유전자 및 방법
CN108138162A (zh) 重组细胞,重组细胞的制造方法以及有机化合物的生产方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180608