CN116096881A - 生产5-甲基叶酸盐的微生物 - Google Patents

生产5-甲基叶酸盐的微生物 Download PDF

Info

Publication number
CN116096881A
CN116096881A CN202180049529.0A CN202180049529A CN116096881A CN 116096881 A CN116096881 A CN 116096881A CN 202180049529 A CN202180049529 A CN 202180049529A CN 116096881 A CN116096881 A CN 116096881A
Authority
CN
China
Prior art keywords
microorganism
polypeptide
activity
folate
genetically engineered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180049529.0A
Other languages
English (en)
Inventor
施明安
熊欣
孙佳
左静
夏云重
朱再玲
蔡志刚
张国银
马尔科·布拉齐克
蒂纳·科盖伊
格雷戈尔·科塞茨
米里扬·什沃盖伊
亚卡·霍瓦特
斯蒂芬·富伊斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chifeng Pharmaceutical Co ltd
Original Assignee
Chifeng Pharmaceutical Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP20186028.5A external-priority patent/EP3940071A1/en
Application filed by Chifeng Pharmaceutical Co ltd filed Critical Chifeng Pharmaceutical Co ltd
Publication of CN116096881A publication Critical patent/CN116096881A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y201/00Transferases transferring one-carbon groups (2.1)
    • C12Y201/01Methyltransferases (2.1.1)
    • C12Y201/010145-Methyltetrahydropteroyltriglutamate--homocysteine S-methyltransferase (2.1.1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0026Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on CH-NH groups of donors (1.5)
    • C12N9/0028Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on CH-NH groups of donors (1.5) with NAD or NADP as acceptor (1.5.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/182Heterocyclic compounds containing nitrogen atoms as the only ring heteroatoms in the condensed system
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y105/00Oxidoreductases acting on the CH-NH group of donors (1.5)
    • C12Y105/01Oxidoreductases acting on the CH-NH group of donors (1.5) with NAD+ or NADP+ as acceptor (1.5.1)
    • C12Y105/01003Dihydrofolate reductase (1.5.1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y105/00Oxidoreductases acting on the CH-NH group of donors (1.5)
    • C12Y105/01Oxidoreductases acting on the CH-NH group of donors (1.5) with NAD+ or NADP+ as acceptor (1.5.1)
    • C12Y105/0102Methylenetetrahydrofolate reductase [NAD(P)H] (1.5.1.20)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y201/00Transferases transferring one-carbon groups (2.1)
    • C12Y201/02Hydroxymethyl-, formyl- and related transferases (2.1.2)
    • C12Y201/02001Glycine hydroxymethyltransferase (2.1.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/01015Dihydropteroate synthase (2.5.1.15)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/06Diphosphotransferases (2.7.6)
    • C12Y207/060032-Amino-4-hydroxy-6-hydroxymethyldihydropteridine diphosphokinase (2.7.6.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/01Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in linear amides (3.5.1)
    • C12Y305/0101Formyltetrahydrofolate deformylase (3.5.1.10)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04016GTP cyclohydrolase I (3.5.4.16)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/02Aldehyde-lyases (4.1.2)
    • C12Y401/02025Dihydroneopterin aldolase (4.1.2.25)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y603/00Ligases forming carbon-nitrogen bonds (6.3)
    • C12Y603/02Acid—amino-acid ligases (peptide synthases)(6.3.2)
    • C12Y603/02012Dihydrofolate synthase (6.3.2.12)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y603/00Ligases forming carbon-nitrogen bonds (6.3)
    • C12Y603/02Acid—amino-acid ligases (peptide synthases)(6.3.2)
    • C12Y603/02017Tetrahydrofolate synthase (6.3.2.17)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供一种生产5‑甲基叶酸盐的微生物,该微生物a)修饰为与其他相同微生物(参考微生物)相比,使得具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的多肽的表达和/或活性降低;b)(进一步)修饰以表达仅具有二氢叶酸合成酶活性的异源多肽;c)(进一步)修饰为与其他相同微生物(参考微生物)相比,使得参与5‑甲基叶酸盐的生物合成的至少一种酶(例如至少两种、至少三种、至少四种、至少五种、至少六种、至少七种或至少八种)酶的表达水平增加;和/或d)(进一步)修饰为与其他相同微生物(参考微生物)相比,使得具有5‑甲基四氢蝶酰三谷氨酸同型半胱氨酸S‑甲基转移酶活性的多肽的表达和/或活性降低。

Description

生产5-甲基叶酸盐的微生物
技术领域
本发明涉及生物技术工程领域,具体地涉及生产5-甲基叶酸盐(例如5-甲基四氢叶酸盐)(5-甲基-THF)的微生物,及其制备和用途。更具体地,本发明提供了一种产生5-甲基叶酸盐的微生物(如产生5-甲基叶酸盐的细菌),该微生物a)已被修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,参与5-甲基叶酸盐生物合成的至少一种酶(例如至少两种、至少三种、至少四种、至少五种、至少六种、至少七种或至少八种酶)的表达水平增加;b)已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的内源多肽的表达和/或活性降低;c)已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的内源多肽的表达和/或活性降低;和/或d)已被(进一步)修饰以表达仅具有二氢叶酸合成酶活性的异源多肽。
背景技术
叶酸盐是叶酸及其一些衍生物的统称;它们在氧化状态、蝶啶环的一个碳取代以及γ连接的谷氨酸残基数量上有所不同(如图1所示)。叶酸盐的蝶呤部分可以以三种氧化状态存在,即完全氧化的(叶酸)、或还原的7,8-二氢叶酸盐(DHF)、或5,6,7,8-四氢叶酸盐(THF)。THF是维生素的辅酶活性形式,它接受、转移和捐赠C1基团,C1基团要么连接在N5或N10位置要么通过桥接这些位置。C1基团的氧化状态也有所不同,其中叶酸盐作为甲酸盐(5-甲酰基-THF(5-FTHF或亚叶酸)、10-甲酰基-THF、5,10-甲烯基-THF和5-亚氨甲基-THF)、甲醇(5-甲基-THF;5-MTHF)或甲醛(5,10-亚甲基-THF)的衍生物存在。此外,大多数天然存在的叶酸盐都以γ-连接的聚谷氨酸缀合物的形式存在。
叶酸(蝶酰基-L-谷氨酸)是一种合成化合物,在自然界中不存在。叶酸作为辅酶不具有活性,必须在细胞内经历多个个代谢步骤才能转化为具有代谢活性的THF形式。然而,叶酸是商业上最重要的叶酸盐化合物,通过化学合成在工业上生产。哺乳动物不能合成叶酸,只能依靠膳食补充剂来维持正常叶酸盐水平。低叶酸盐状态可能是由低膳食摄入、摄入叶酸盐吸收不良以及由于遗传缺陷或药物相互作用导致的叶酸盐代谢改变引起的。大多数国家已经通过叶酸补充剂或强化食品制定了叶酸盐的推荐摄入量。膳食补充剂中使用的叶酸盐包括叶酸、亚叶酸(5-FTHF、Leucovorin)或5-MTHF(Scaglione和Panzavolta 2014)。目前生产两种5-MTHF盐形式作为补充剂。默克密理博(Merck Millipore)生产
Figure BDA0004048528550000021
一种5-MTHF的钙盐,它是天然存在的主要叶酸盐形式的稳定晶形。Gnosis S.p.A.开发了一种(6S)-5-MTHF的氨基葡萄糖盐并获得专利,商标名称
Figure BDA0004048528550000022
目前,叶酸主要通过化学合成在工业上生产,而与其他维生素不同,由于当前细菌菌株生产的叶酸产量低,因此微生物生产叶酸的工业规模尚未开发(Rossi等人,2016)。尽管化学生产的叶酸不是天然存在的分子,但人类能够通过二氢叶酸还原酶(DHFR)的作用将其代谢为叶酸盐的生物活性形式。有多个理由支持用微生物发酵代替化学合成方法来商业化生产叶酸盐:首先,通过微生物可以生产还原形式的叶酸,还原形式的叶酸可被人类更有效地使用。最重要的是,原则上,一步发酵工艺比多阶段化学工艺更高效且更环保。
先前的研究已阐明微生物中叶酸盐/叶酸的产生。大多数微生物在叶酸盐生产中的应用限于发酵乳制品的强化和产生叶酸盐的益生菌。还对培养条件进行了优化,以提高叶酸盐的合成,叶酸产量达到约150μg/g(Hjortmo等人,2008;Sybesma等人,2003b)。一些研究描述了乳酸菌(Sybesma等人,2003a)、酵母(Walkey等人,2015)或丝状真菌(SerranoAmatriain等人,2016)的基因修饰菌株,这些菌株能够产生滴度最高达6,6mg/L的叶酸。微生物产生叶酸盐的另一种成功方法是在对氨基苯甲酸(pABA)存在下培养酵母或细菌菌株。在这些培养物的上清液中测量到最高达22mg/L的总叶酸盐含量。
(6S)-5-甲基四氢叶酸盐(L-5-甲基四氢叶酸盐或L-5-甲基-THF)是叶酸(维生素B9)的活性形式。叶酸(蝶酰基-L-谷氨酸)是一种合成化合物,通过化学合成在工业上生产,在新鲜的天然食品中不存在。叶酸作为辅酶不具有活性,必须在细胞内经历多个代谢步骤才能转化为具有代谢活性的叶酸盐形式。另一方面,5-甲基四氢叶酸盐是膳食叶酸盐的主要形式,也是人体叶酸盐的主要活性形式,约占人体血浆叶酸盐的98%。摄入L-5-甲基-THF可能比摄入叶酸具有多个优点,例如降低了掩盖维生素B12缺乏的血液学症状的可能性,减少药物的干扰,该药物靶向二氢叶酸盐还原酶,并且L-5-甲基-THF不会作为未代谢维生素在人体血浆中积累。
化学合成叶酸的工业技术受到巨大的环境负担的阻碍。到目前为止,用于生产叶酸或任何叶酸盐的天然形式如5-甲基叶酸盐的微生物发酵工艺,由于叶酸盐的生产滴度/产量非常低,因此没有竞争力。
因此,迫切需要开发新的基因工程化微生物来提高5-甲基叶酸盐(例如5-甲基四氢叶酸盐或其前体或中间体)的生产能力。
发明内容
本发明的目的是提供基因工程化微生物以增强5-甲基叶酸盐(例如,5-甲基-四氢叶酸)或其前体或中间体的生产能力。本发明人解决了这个问题。
可以通过以下项目来概括本发明。
1.一种基因工程化微生物,如细菌。
2.根据项目1所述的基因工程化微生物,其已被修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的内源多肽的表达和/或活性降低。
3.根据项目2所述的基因工程化微生物,其已被修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述多肽的内源基因的表达水平降低。
4.根据项目3所述的基因工程化微生物,其中与其他相同微生物相比,所述内源基因的表达水平降低了至少50%,例如降低了至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少100%。
5.根据项目3或项目4所述的基因工程化微生物,其中编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述多肽的内源基因已被失活。
6.根据项目5所述的基因工程化微生物,其中编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述多肽的内源基因已通过删除部分或全部基因序列被失活。
7.根据项目4或5所述的基因工程化微生物,其中编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述多肽的内源基因已经通过在微生物中引入或表达能够通过DNA切割而选择性地失活编码所述肽的内源基因的罕见切割核酸内切酶而被失活。
8.根据项目7所述的基因工程化微生物,其中所述罕见切割核酸内切酶是类转录激活因子效应物(TALE)核酸酶、大范围核酸酶(meganuclease)、锌指核酸酶(ZFN)或RNA引导的核酸内切酶。
9.根据项目8所述的基因工程化微生物,其中所述RNA引导的核酸内切酶是催化失活的Cas9蛋白。
10.根据项目13所述的基因工程化微生物,其包含(例如,表达)在细胞条件下与编码所述多肽的基因组DNA特异性杂交(例如结合)的单一引导RNA(sgRNA)。
11.根据项目2所述的基因工程化微生物,其中通过编码所述多肽的内源基因的转录和/或翻译抑制,降低(例如,抑制)具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述内源多肽的表达。
12.根据项目2所述的基因工程化微生物,其中通过在微生物中引入或表达在细胞条件下与编码所述多肽的细胞mRNA和/或基因组DNA特异性杂交(例如结合)的抑制性核酸分子,降低(例如抑制)具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述内源多肽的表达。
13.根据项目12所述的基因工程化微生物,其中所述抑制性核酸分子是反义寡核苷酸、核酶或干扰RNA(RNAi)分子。
14.根据项目13所述的基因工程化微生物,其中所述干扰RNA分子是微小RNA(miRNA)、小干扰RNA(siRNA)或短发夹RNA(shRNA)。
15.根据项目2或3所述的基因工程化微生物,其已被修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的内源多肽的活性降低。
16.根据项目15所述的基因工程化微生物,其中通过至少一种导致活性降低或丧失的活性位点突变降低所述多肽的活性。
17.根据项目16所述的基因工程化微生物,其中所述至少一个活性位点突变位于对应于与SEQ ID No:11中所示的氨基酸序列中的位置51-54、75、114-117、145、152-154、172、263、302和315中的任一项的位置。
18.根据项目16或17所述的基因工程化微生物,其中所述至少一个活性位点突变是非保守氨基酸替换。
19.根据项目2至18中任一项所述的基因工程化微生物,其中编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述多肽的内源基因是基因folC。
20.根据项目2至18中任一项所述的基因工程化微生物,其中编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述多肽的内源基因是内源基因folC。
21.根据项目2至20中任一项所述的基因工程化微生物,其中编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述多肽的内源基因包括与SEQ ID NO:5所示的核酸序列具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的核酸序列。
22.根据项目2至21中任一项所述的基因工程化微生物,其中通过内源基因编码的具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述多肽包括与SEQ ID NO:11所示的氨基酸序列具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸。
23.根据项目1至22中任一项所述的基因工程化微生物,其已被(进一步)修饰为表达仅具有二氢叶酸合成酶活性的异源多肽。
24.根据项目23所述的基因工程化微生物,其中所述仅具有二氢叶酸合成酶活性的异源多肽衍生自细菌或真菌,优选选自罗伊氏乳杆菌(Lactobacillus reuteri)和棉阿舒囊霉(Ashbya gossypii)。
24.根据项目23或24所述的基因工程化微生物,其中所述仅具有二氢叶酸合成酶活性的异源多肽包括与SEQ ID NO:22或23具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。
25.根据项目1至24中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有显著提高的5-甲基叶酸盐(例如5-甲基四氢叶酸盐)或其前体或中间体的生产能力。
26.根据项目25所述的基因工程化微生物,其中与不携带所述修饰的其他相同微生物(参考微生物)相比,5-甲基叶酸盐(例如5-甲基四氢叶酸盐)或其前体或中间体的生产能力增加了至少50%,例如至少100%、至少200%、至少500%、至少1000%、至少2000%、至少5000%、至少10000%、至少20000%或至少50000%。
27.根据项目1至26中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的酶的至少一种基因(例如至少两种、至少三种、至少四种、至少五种、至少六种、至少七种或至少八种基因)的表达水平增加。
28.根据项目1至27中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的酶的至少两种基因(例如至少三种、至少四种、至少五种、至少六种、至少七种或至少八种基因)的表达水平增加。
29.根据项目1至28中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码参与5-甲基叶酸盐的生物合成的酶的至少三种基因(例如至少四种、至少五种、至少六种、至少七种或至少八种基因)的表达水平增加。
30.根据项目1至29中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的酶的至少四种基因(例如至少五种、至少六种、至少七种或至少八种基因)的表达水平增加。
31.根据项目1至30中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的酶的至少五种基因(例如至少六种、至少七种或至少八种基因)的表达水平增加。
32.根据项目1至31中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的酶的至少六种基因(例如至少七种或至少八种基因)的表达水平增加。
33.根据项目1至32中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的酶的至少七种基因(例如至少八种基因)的表达水平增加。
34.根据项目27至33中任一项所述的基因工程化微生物,其中所述至少一种编码参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的酶的基因选自由以下组成的组:folE/mtrA、folB、folK、folP/sul、folA/dfrA、glyA、purU、yitJ和metF。
35.根据项目27至34中任一项所述的基因工程化微生物,其中参与5-甲基叶酸盐(例如5-甲基-四氢叶酸盐)的生物合成的酶选自由以下组成的组:具有GTP环化水解酶活性的多肽、具有7,8-二氢新蝶呤醛缩酶活性的多肽、具有2-氨基-4-羟基-6-羟甲基二氢蝶啶焦磷酸激酶活性的多肽、具有二氢蝶酸合成酶活性的多肽、具有二氢叶酸还原酶活性的多肽、具有丝氨酸羟甲基转移酶活性的多肽、具有甲酰四氢叶酸脱甲酰酶活性的多肽和具有5,10-亚甲基四氢叶酸还原酶活性的多肽。
36.根据项目1至34中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有GTP环化水解酶活性的多肽的基因的表达水平增加。
37.根据项目1至36中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有7,8-二氢新蝶呤醛缩酶活性的多肽的基因的表达水平增加。
38.根据项目1至37中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有2-氨基-4-羟基-6-羟甲基二氢蝶啶焦磷酸激酶活性的多肽的基因的表达水平增加。
39.根据项目1至38中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有二氢蝶酸合成酶活性的多肽的多肽的基因的表达水平增加。
40.根据项目1至39中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有二氢叶酸还原酶活性的多肽的基因的表达水平增加。
41.根据项目1至40中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有丝氨酸羟甲基转移酶活性的多肽的基因的表达水平增加。
42.根据项目1至41中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有甲酰四氢叶酸脱甲酰酶活性的多肽的基因的表达水平增加。
43.根据项目1至42中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有5,10-亚甲基四氢叶酸还原酶活性的多肽的基因的表达水平增加。
44.根据项目27至43中任一项所述的基因工程化微生物,其中所述编码参与5-甲基叶酸盐(例如,5-甲基四氢叶酸盐)的生物合成的酶的至少一种基因与所述基因工程化微生物异源。
45.根据项目27至44中任一项所述的基因工程化微生物,其中所述编码参与5-甲基叶酸盐的生物合成的酶的至少一种基因衍生自细菌或真菌,优选选自芽孢杆菌属(Bacillus)、大肠杆菌属(Escherichia)、乳球菌属(Lactococcus)、希瓦氏菌属(Shewanella)、弧菌属(Vibrio)和阿舒氏菌属(Ashbya)。
46.根据项目27至45中任一项所述的基因工程化微生物,其中所述编码参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的酶的至少一种基因衍生自选自枯草芽孢杆菌(Bacillus subtiltis)、乳酸乳杆菌(Lactobacillus lactis)、大肠杆菌(Escherichia coli)、堇色希瓦氏菌(Shewanella violacea)、需钠弧菌(Vibrionatriegens)或棉阿舒囊霉(Ashbya gossypii)的细菌或真菌。
47.根据项目27至46中任一项所述的基因工程化微生物,其中与其他相同微生物(参考微生物)相比,编码参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的酶的至少一种基因(例如至少两种、至少三种、至少四种、至少五种、至少六种、至少七种或至少八种基因)的表达水平增加了至少50%,至少100、至少200%、至少500%、至少1000%、至少2000%、至少5000%、至少10000%、至少20000%或至少50000%。
48.根据项目1至47中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的至少一种酶(例如至少两种、至少三种、至少四种、至少五种、至少六种、至少七种或至少八种)的表达水平增加。
49.根据项目1至47中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的至少两种酶(例如至少三种、至少四种、至少五种、至少六种、至少七种或至少八种)的表达水平增加。
50.根据项目1至47中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的至少三种酶(例如至少四种、至少五种、至少六种、至少七种或至少八种)的表达水平增加。
51.根据项目1至47中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的至少四种酶(例如至少五种、至少六种、至少七种或至少八种)的表达水平增加。
52.根据项目1至47中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的至少五种酶(例如至少六种、至少七种或至少八种)的表达水平增加。
53.根据项目1至47中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的至少六种酶(例如至少七种或至少八种)的表达水平增加。
54.根据项目1至47中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的至少七种酶(例如至少八种)的表达水平增加。
55.根据项目48至54中任一项所述的基因工程化微生物,其中参与5-甲基叶酸盐(例如5-甲基-四氢叶酸盐)的生物合成的所述至少一种酶选自由以下组成的组:具有GTP环化水解酶活性的多肽、具有7,8-二氢新蝶呤醛缩酶活性的多肽、具有2-氨基-4-羟基-6-羟甲基二氢蝶啶焦磷酸激酶活性的多肽、具有二氢蝶酸合成酶活性的多肽、具有二氢叶酸还原酶活性的多肽、具有丝氨酸羟甲基转移酶活性的多肽、具有甲酰四氢叶酸脱甲酰酶活性的多肽和具有5,10-亚甲基四氢叶酸还原酶活性的多肽。
56.根据项目1至55中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有GTP环化水解酶活性的多肽的表达水平增加。
57.根据项目1至56中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有7,8-二氢新蝶呤醛缩酶活性的多肽的表达水平增加。
58.根据项目1至57中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有2-氨基-4-羟基-6-羟甲基二氢蝶啶焦磷酸激酶活性的多肽的表达水平增加。
59.根据项目1至58中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有二氢蝶酸合成酶活性的多肽的表达水平增加。
60.根据项目1至59中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有二氢叶酸还原酶活性的多肽的表达水平增加。
61.根据项目1至60中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有丝氨酸羟甲基转移酶活性的多肽的表达水平增加。
62.根据项目1至61中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有甲酰四氢叶酸脱甲酰酶活性的多肽的表达水平增加。
63.根据项目1至62中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有5,10-亚甲基四氢叶酸还原酶活性的多肽的表达水平增加。
64.根据项目48至63中任一项所述的基因工程化微生物,其中所述参与5-甲基叶酸盐(例如,5-甲基四氢叶酸盐)的生物合成的至少一种酶(分别为所述多肽)与所述基因工程化微生物异源。
65.根据项目48至64中任一项所述的基因工程化微生物,其中所述参与5-甲基叶酸盐的生物合成的至少一种酶(分别为所述多肽)衍生自细菌或真菌,优选选自芽孢杆菌属(Bacillus)、大肠杆菌属(Escherichia)、乳球菌属(Lactococcus)、希瓦氏菌属(Shewanella)、弧菌属(Vibrio)和阿舒氏菌属(Ashbya)。
66.根据项目48至65中任一项所述的基因工程化微生物,其中所述参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的至少一种酶(分别为所述多肽)衍生自选自枯草芽孢杆菌(Bacillus subtiltis)、乳酸乳杆菌(Lactobacillus lactis)、大肠杆菌(Escherichia coli)、堇色希瓦氏菌(Shewanella violacea)、需钠弧菌(Vibrionatriegens)或棉阿舒囊霉(Ashbya gossypii)的细菌或真菌。
67.根据项目35、36、55和56中任一项所述的基因工程化微生物,其中具有GTP环化水解酶活性的多肽包括与SEQ ID NO:7具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。
68.根据项目35、37、55和57中任一项所述的基因工程化微生物,其中具有7,8-二氢新蝶呤醛缩酶活性的多肽包括与SEQ ID NO:8具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。
69.根据项目35、38、55和58中任一项所述的基因工程化微生物,其中具有2-氨基-4-羟基-6-羟甲基二氢蝶啶焦磷酸激酶活性的多肽包括与SEQ ID NO:9具有至少70%,例如至少80%、至少85%、至少90%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。
70.根据项目35、39、55和59中任一项所述的基因工程化微生物,其中具有二氢蝶酸合成酶活性的多肽包括与SEQ ID NO:10具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。
71.根据项目35、40、55和60中任一项所述的基因工程化微生物,其中具有二氢叶酸还原酶活性的多肽包括与SEQ ID NO:12具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。
72.根据项目35、41、55和61中任一项所述的基因工程化微生物,其中具有丝氨酸羟甲基转移酶活性的多肽包括与SEQ ID NO:79具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。
73.根据项目35、42、55和62中任一项所述的基因工程化微生物,其中具有甲酰四氢叶酸脱甲酰酶活性的多肽包括与SEQ ID NO:81具有至少70%,例如至少80%、至少85%、至少90%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。
74.根据项目35、43、55和63中任一项所述的基因工程化微生物,其中具有5,10-亚甲基四氢叶酸还原酶活性的多肽包括与SEQ ID NO:83具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。
75.根据项目35、43、55和64中任一项所述的基因工程化微生物,其中具有5,10-亚甲基四氢叶酸还原酶活性的多肽包括与SEQ ID NO:84具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。
76.根据项目1至75中任一项所述的基因工程化微生物,其已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的内源多肽的表达和/或活性降低。
77.根据项目76所述的基因工程化微生物,其已被修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述多肽的内源基因的表达水平降低。
78.根据项目77所述的基因工程化微生物,其中与其他相同微生物相比,所述内源基因的表达水平降低了至少50%,例如降低了至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少100%。
79.根据项目76或77所述的基因工程化微生物,其在编码所述多肽的内源基因的调控区中包括至少一个突变,所述多肽具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性,导致表达水平降低。
80.根据项目76或77所述的基因工程化微生物,其中编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述多肽的内源基因已被失活。
81.根据项目76或77所述的基因工程化微生物,其中编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述多肽的内源基因已通过删除部分或全部基因序列被失活。
82.根据项目76所述的基因工程化微生物,其中编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述多肽的内源基因已经通过在微生物中引入或表达能够通过DNA切割而选择性地失活编码所述肽的内源基因的罕见切割核酸内切酶而被失活。
83.根据项目82所述的基因工程化微生物,其中所述罕见切割核酸内切酶是类转录激活因子效应物(TALE)核酸酶、大范围核酸酶、锌指核酸酶(ZFN)或RNA引导的核酸内切酶。
84.根据项目83所述的基因工程化微生物,其中所述RNA引导的核酸内切酶是催化失活的Cas9蛋白。
85.根据项目84所述的基因工程化微生物,其包含(例如,表达)在细胞条件下与编码所述多肽的基因组DNA特异性杂交(例如结合)的单一引导RNA(sgRNA)。
86.根据项目76所述的基因工程化微生物,其中通过编码所述多肽的内源基因的转录和/或翻译抑制,降低(例如,抑制)具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述内源多肽的表达。
87.根据项目76所述的基因工程化微生物,其中通过在微生物中引入或表达在细胞条件下与编码所述多肽的细胞mRNA和/或基因组DNA特异性杂交(例如结合)的抑制性核酸分子,降低(例如抑制)具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述内源多肽的表达。
88.根据项目87所述的基因工程化微生物,其中所述抑制性核酸分子是反义寡核苷酸、核酶或干扰RNA(RNAi)分子。
89.根据项目88所述的基因工程化微生物,其中所述干扰RNA分子是微小RNA(miRNA)、小干扰RNA(siRNA)或短发夹RNA(shRNA)。
90.根据项目76或77所述的基因工程化微生物,其已被修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述内源多肽的活性降低。
91.根据项目90所述的基因工程化微生物,其中通过至少一种导致活性降低或丧失的活性位点突变降低所述多肽的活性。
92.根据项目91所述的基因工程化微生物,其中所述至少一个活性位点突变位于对应于与SEQ ID NO:100中所示的氨基酸序列中的位置18、21、112、117、119、435-437、488、494、519-521、565、601、603、605、645、647、669、730和731中任一项的位置。
92.根据项目16或17所述的基因工程化微生物,其中所述至少一个活性位点突变是非保守氨基酸取代。
93.根据项目76至92中任一项所述的基因工程化微生物,其中编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述多肽的内源基因是基因metE。
94.根据项目76至93中任一项所述的基因工程化微生物,其中编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述多肽的内源基因包括与SEQ IDNO:101所示的核酸序列具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的核酸序列。
95.根据项目76至94中任一项所述的基因工程化微生物,其中通过内源基因编码的具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述多肽包括与SEQID NO:100所示的氨基酸序列具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。
96.根据项目1至95中任一项所述的基因工程化微生物,其为细菌。
97.根据项目1至96中任一项所述的基因工程化微生物,其为芽孢杆菌科(Bacillaceae)的一种细菌。
98.根据项目1至97中任一项所述的基因工程化微生物,其为芽孢杆菌属(Bacillus)的一种细菌。
99.根据项目1至98中任一项所述的基因工程化微生物,其为枯草芽胞杆菌种(Bacillus subtiltis)的一种细菌。
100.一种用于制备叶酸盐、其前体或中间体的方法,包括i)在合适的培养条件下在培养基中培养根据项目1至99中任一项所述的基因工程化微生物,以获得含有所述叶酸盐、其前体或中间体的发酵产物;以及ii)任选地,分离和/或纯化所述叶酸盐、其前体或中间体。
101.根据项目100所述的方法,其中步骤i)在32至42℃范围内的培养温度下进行,优选在34至39℃范围内,更优选在36至39℃范围内,例如在约37℃下进行。
102.根据项目100或101所述的方法,其中步骤i)进行10至70小时范围内,优选24至60小时范围内,更优选36至50小时范围内的时间段。
103.根据项目100至102中任一项所述的方法,其中步骤i)在pH为6至8范围内、优选6.5至7.5范围内、更优选6.8至7.2范围内进行。
104.根据项目100至102中任一项所述的方法,其中所述叶酸盐是式I化合物:
Figure BDA0004048528550000151
任选地为一种立体异构体的形式,优选对映异构体或非对映异构体,外消旋体的形式,或任意混合比的至少两种立体异构体(优选对映异构体和/或非对映异构体)的混合物的形式。
105.根据项目100至104中任一项所述的方法,其中所述叶酸盐是式II化合物:
Figure BDA0004048528550000152
任选地为一种立体异构体的形式,优选对映异构体或非对映异构体,外消旋体的形式,或任意混合比的至少两种立体异构体(优选对映异构体和/或非对映异构体)的混合物的形式。
106.根据项目100至105中任一项所述的方法,其中所述叶酸盐是式IIa化合物:
Figure BDA0004048528550000161
107.根据项目100至104中任一项所述的方法,其中所述叶酸盐是式III化合物:
Figure BDA0004048528550000162
任选地为一种立体异构体的形式,优选对映异构体或非对映异构体,外消旋体的形式,或任意混合比的至少两种立体异构体(优选对映异构体和/或非对映异构体)的混合物的形式。
108.根据项目100至107中任一项所述的方法,还包括在培养步骤(i)期间添加对氨基苯甲酸(PABA)的步骤。
109.根据项目108所述的方法,其中所述对氨基苯甲酸(PABA)选自由以下组成的组:对氨基苯甲酸钾、对氨基苯甲酸钠、对氨基苯甲酸甲酯、对氨基苯甲酸乙酯、对氨基苯甲酸丁酯或其组合。
110.根据项目100至109中任一项所述的方法,还包括使所述步骤(i)或(ii)中获得的产物经受酸性或碱性条件以进一步获得衍生物化合物。
111.一种制备基因工程化微生物的方法,包括以下步骤(a)至(d)中的任一步骤:
(a)与其他相同微生物(参考微生物)相比,增加参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的至少一种(例如至少两种、至少三种、至少四种、至少五种、至少六种、至少七种或至少八种)酶的表达水平;
(b)与不携带所述修饰的其他相同微生物(参考微生物)相比,降低具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的内源多肽的表达和/或活性;
(c)与不携带所述修饰的其他相同微生物(参考微生物)相比,降低具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的内源多肽的表达和/或活性;和/或
(d)表达仅具有二氢叶酸合成酶活性的异源多肽。
112.根据项目111所述的方法,包括以下步骤(a)至(b)中的任一步骤:
(a)与其他相同微生物(参考微生物)相比,增加参与5-甲基叶酸盐的生物合成的至少一种酶的表达水平;以及
(b)与不携带所述修饰的其他相同微生物(参考微生物)相比,降低具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的内源多肽的表达和/或活性。
113.根据权利要求112所述的方法,还包括以下步骤(c)和(d):
(c)与不携带所述修饰的其他相同微生物(参考微生物)相比,降低具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的内源多肽的表达和/或活性;以及
(d)表达仅具有二氢叶酸合成酶活性的异源多肽。
114.根据项目111至113中任一项所述的方法,包括以下步骤:aa)将至少一种外源核酸分子引入所述微生物,所述外源核酸分子包含编码参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的酶的核酸序列;bb)例如通过删除部分或全部基因序列,使编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述多肽的内源基因失活,或在所述内源基因的调控区中引入至少一个突变,这导致表达水平降低;cc)例如通过删除部分或全部基因序列,使编码所述多肽的内源基因失活,所述多肽在所述微生物中具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性;和/或dd)将包含编码仅具有二氢叶酸合成酶活性的异源多肽的核酸序列的外源核酸分子引入所述微生物。
应当理解,在本发明的范围内,上述和以下描述的本发明的每个技术特征可以彼此组合以形成优选的技术方案,由于篇幅限制,这里没有明确列出。
附图说明
图1示出了叶酸盐的核心结构。在天然叶酸盐中,蝶呤环以四氢形式(如图所示)或7,8-二氢形式存在。该环在化学生成的叶酸中被完全氧化。叶酸盐通常具有γ-连接的聚谷氨酰尾部,最多有八个残基附接在第一谷氨酸上。一个碳单元(甲酰基、甲基等)可以连接到N5和/或N10位,从而合成5-甲酰基叶酸盐、10-甲酰基叶酸盐或5-甲基叶酸盐。
图2示出了由乳酸乳球菌(L.lactis)基因组成的叶酸操纵子的一个示例的示意图。
图3示出了由棉蚜(A.gossypii)基因组成的叶酸操纵子的一个示例的示意图。
图4示出了由枯草芽孢杆菌(B.subtilis)基因组成的叶酸操纵子的一个示例的示意图。
图5示出了在Pveg启动子下方具有四环素抗性基因(TetR)、异源folC2-LR或folC2-AG基因以及侧翼有用于天然folC靶基因破坏的同源末端的FolC破坏盒的示意图。用于DNA破坏盒的PCR扩增的引物的位置用线表示。
图6示出了发酵肉汤样品的色谱图。黑色:UV信号,红色:MS扫描信号。
图7示出了在氧气存在下10-甲酰基二氢叶酸氧化为10-甲酰叶酸的示意图,在过氧化氢存在下10-甲酰基二氢叶酸氧化为10-甲酰基叶酸的示意图,以及在高碘酸钠存在下10-甲酰基二氢叶酸氧化成10-甲酰基叶酸的示意图。
图8示出了在酸性介质中10-甲酰基叶酸脱甲酰化为叶酸的示意图。
图9示出了在碱性介质中10-甲酰基叶酸脱甲酰化为叶酸的示意图。
图10示出了叶酸盐生产生物过程曲线。叶酸盐(mg/L):实心星号;葡萄糖浓度(g/L):空心正方形;乙偶姻浓度(g/L):实心正方形;PABA浓度(mg/L):空心圆圈;PABA进料(mg/L):竖条;光学密度:实心圆圈。
图11示出了在摇床上进行5ml规模实验的枯草芽孢杆菌(B.subtilis)菌株w.t.168、菌株VBB38、菌株FL21和FL23的总叶酸盐生产滴度。
图12示出了在摇床上进行5ml规模实验的枯草芽孢杆菌(B.subtilis)菌株w.t.168、菌株VBB38、菌株FL21、FL825和FL2771的5-甲基叶酸盐生产滴度。
图13示出了通过将人工甲基叶酸盐操纵子MTHF-OP-B转化到亲本菌株FL2771中而开发的生产5-甲基四氢叶酸盐的菌株的示意图。
图14示出了人工MTHF-OP叶酸盐操纵子的示意图。构建的操纵子具有大观霉素选择性标记物和在ywhL基因座用于基因组整合的同源性。在MTHF-OP-A中,操纵子基因(glyA、purU和yitJ)选自天然生物枯草芽孢杆菌(B.subtilis)和优化的附加密码子以获得最佳基因表达。此外,来自大肠杆菌(E.coli)的同源基因(metF)用于构建操纵子MTHF-OP-B中yitJ基因的替代物。
图15示出了亲本菌株FL825和后代菌株FL2771中metE基因的转录水平。
图16示出了由枯草芽孢杆菌(B.subtilis)基因组成的叶酸操纵子FOL-OP-BS1的示意图。
具体实施方式
除非本文特别定义,否则使用的所有技术和科学术语具有与生物化学、遗传学和分子生物学领域的熟练技术人员通常理解的相同含义。
与本文描述的方法和材料类似或等效的所有方法和材料都可用于本发明的实践或测试,本文描述了合适的方法和材料。本文提及的所有出版物、专利申请、专利和其他参考文献的全部内容都通过引用并入。如有冲突,以本说明书(包括定义)为准。此外,除非另有规定,否则材料、方法和示例仅是说明性的,不旨在是限制性的。
除非另有说明,否则本发明的实践将采用本领域技术范围内的细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的常规技术。这些技术在文献中有充分的解释。参见例如,Current Protocols in Molecular Biology(FrederickM.AUSUBEL,2000,Wiley and son Inc,Library of Congress,USA);Molecular Cloning:ALaboratory Manual,Third Edition,(Sambrook等人,2001,Cold Spring Harbor,NewYork:Cold Spring Harbor Laboratory Press);Oligonucleotide Synthesis(M.J.Gait编辑,1984);Mullis等人,美国专利号4,683,195;Nucleic Acid Hybridization(B.D.Harries&S.J.Higgins编辑1984);Transcription And Translation(B.D.Hames&S.J.Higgins编辑1984);Culture Of Animal Cells(R.I.Freshney,Alan R.Liss,Inc.,1987);Immobilized Cells And Enzymes(IRL Press,1986);B.Perbal,A PracticalGuide To Molecular Cloning(1984);the series,Methods In ENZYMOLOGY(J.Abelsonand M.Simon主编,Academic Press,Inc.,New York),特别是,第154和155卷(Wu等人编辑)和第185卷,"Gene Expression Technology"(D.Goeddel编辑);Gene Transfer VectorsFor Mammalian Cells(J.H.Miller和M.P.Calos编辑,1987,Cold Spring HarborLaboratory);和Immunochemical Methods In Cell And Molecular Biology(Mayer andWalker编辑,Academic Press,London,1987);Handbook Of Experimental Immunology,第I-IV卷(D.M.Weir and C.C.Blackwell编辑,1986.
本发明的基因工程化微生物
在一个方面,本发明因此提供了基因工程化微生物,例如基因工程化细菌。适宜地,基因工程化微生物具有生产5-甲基叶酸盐(根据下面所示的式(I)),更具体地,5-甲基四氢叶酸盐(5-甲基-THF)(根据下面所示的式(II))的能力,包括其任何立体异构体,例如对映异构体或非对映异构体,例如(6S)-5-甲基四氢叶酸盐(根据下面所示的式(IIa))。
在一些细菌如枯草芽孢杆菌(Bacillus subtilis)中,将L-谷氨酸添加到二氢蝶酸(二氢叶酸合成酶(DHFS)活性,EC 6.3.2.12)以及随后通过γ羧基将L-谷氨酸添加到四氢叶酸盐(叶酰聚谷氨酸合成酶(FPGS)活性,EC 6.3.2.17)是由相同的酶FolC催化的。相反,在真核细胞和一些其他细菌中,DHFS和FPGS酶活性编码在不同的基因中。枯草芽孢杆菌(Bacillus subtilis)和许多其他细菌一样,向叶酸盐添加γ-连接的聚谷氨酸尾以增加溶解度并防止这种重要的辅因子流失到环境中。因此,枯草芽孢杆菌(Bacillus subtilis)FolC具有叶酰聚谷氨酸合成酶(FPGS)活性,除了在从头合成叶酸盐生物合成途径中作为二氢叶酸合成酶的作用外,它还通过其γ羧基催化叶酸盐的聚谷氨酰化。叶酸盐聚阴离子不能从细胞中排出,导致细胞内滞留增强(Sybesma等人,2003c)。此外,FPGS酶的产物叶酰聚谷氨酸是叶酸盐生物合成酶的强烈抑制剂(McGuire和Bertino,1981)。因此,为了增加叶酸的产量,本发明人通过敲除天然(内源)folC基因并用仅编码必需二氢叶酸合成酶(DHFS)活性的异源folC基因代替它,从而消除了叶酸盐的聚谷氨酰化,导致仅添加一个必需谷氨酸部分。在许多细菌物种(如罗伊氏乳杆菌(Lactobacillus reuteri))和许多真核生物(如棉阿舒囊霉(Ashbya gossypii))中可以发现仅具有二氢叶酸合成酶(DHFS)而不具有叶酰基聚谷氨酸(FGPS)合成酶活性的FolC同源物。
在广泛和深入的研究之后,本发明人惊奇地发现,如果编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的多肽的内源基因(例如基因folC)的表达水平在微生物中降低,并且代替引入编码仅具有二氢叶酸合成酶活性的多肽的外源基因,在生物合成的叶酸盐上仅添加一种谷氨酸,叶酸盐(例如5-甲基-四氢叶酸盐)、其盐、前体或中间体的生产能力由此显著增加。
因此,本发明的基因工程化微生物可能被修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的内源多肽的表达和/或活性降低。
根据一些实施方案,本发明的基因工程化微生物可能已被修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述多肽的内源基因的表达水平降低。与其他相同微生物相比,内源基因的表达水平可以例如降低至少50%,例如降低至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少100%。
根据一些实施方案,编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述多肽的内源基因已通过删除部分或全部基因序列被失活。
根据一些实施方案,编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述多肽的内源基因已经通过在微生物中引入或表达能够通过DNA切割,优选通过双链断裂而选择性地失活编码所述肽的内源基因的罕见切割核酸内切酶而被失活。根据本发明用于失活内源基因的罕见切割核酸内切酶可以是例如类转录激活因子效应物(TALE)核酸酶、大范围核酸酶、锌指核酸酶(ZFN)或RNA引导的核酸内切酶。
一种失活编码所述多肽的内源基因的方法是使用CRISPRi系统,所述多肽具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性。CRISPRi系统是作为用于靶向抑制基因表达或阻断基因组上靶向位置的工具而开发的。CRISPRi系统由催化失活的“死亡”Cas9蛋白(dCas9)和限定dCas9与DNA结合位点的引导RNA组成。
因此,根据一些实施方案,通过在微生物中引入或表达RNA引导的核酸内切酶,例如催化失活的Cas9蛋白,以及在细胞条件下与编码所述多肽的基因组DNA特异性杂交(例如结合)的单引导RNA(sgRNA),将编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述多肽的内源基因失活。
例如,如果编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述多肽的内源基因在枯草芽孢杆菌(Bacillus subtiltis)中被抑制,则单引导RNA(sgRNA)可包含SEQ ID NO:5的至少20个连续核苷酸或其互补物。
根据一些实施方案,通过抑制降低了具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的内源多肽的表达。
可以通过本领域已知的任何合适的方法来实现对具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述内源多肽的表达的抑制。例如,表达可通过基因沉默技术来抑制,该技术涉及使用抑制性核酸分子,例如反义寡核苷酸、核酶或干扰RNA(RNAi)分子,例如微小RNA(miRNA)、小干扰RNA(siRNA)或短发夹RNA(shRNA)。
根据一些实施方案,通过编码所述多肽的内源基因的转录和/或翻译抑制,降低(例如,抑制)具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述内源多肽的表达。
根据一些实施方案,通过在微生物中引入或表达抑制性核酸分子来抑制具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述内源多肽的表达。例如,可以通过外源核酸分子引入抑制性核酸分子,所述外源核酸分子包含编码可操作地连接到启动子(例如可诱导启动子)的所述抑制性核酸分子的核苷酸序列,所述启动子在微生物中起作用以引起所述抑制性核酸分子的产生。合适地,抑制性核酸分子是在细胞条件下与编码内源多肽的细胞mRNA和/或基因组DNA特异性杂交(例如结合)的抑制性核酸分子。根据靶标,编码基因组DNA的转录和/或编码mRNA的翻译受到抑制。
根据一些实施方案,所述抑制性核酸分子是反义寡核苷酸、核酶或干扰RNA(RNAi)分子。优选地,这样的核酸分子包含编码多肽或感兴趣的酶的细胞mRNA和/或基因组DNA(例如,编码多肽的细胞mRNA或基因组DNA)的互补物的至少10个连续核苷酸。
例如,如果在枯草芽孢杆菌(Bacillus subtilis)中抑制具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的内源多肽的表达,则这种抑制性核酸分子可包含SEQ IDNO:5的互补物的至少10个连续核苷酸。
根据一些实施方案,抑制性核酸是反义寡核苷酸。这种反义寡核苷酸是在细胞条件下与编码多肽的细胞mRNA和/或基因组DNA特异性杂交(例如结合)的核酸分子(DNA或RNA)。
根据一些实施方案,抑制性核酸分子是核酶,例如锤头状核酶。核酶分子被设计为催化切割mRNA转录物以阻止多肽的翻译。
根据一些实施方案,抑制性核酸分子是干扰RNA(RNAi)分子。RNA干扰是其中RNA分子抑制表达的生物学过程,通常导致特定mRNA的破坏。RNAi分子的示例性类型包括微小RNA(miRNA)、小干扰RNA(siRNA)和短发夹RNA(shRNA)。根据一些实施方案,RNAi分子是miRNA。根据一些实施方案,RNAi分子是siRNA。根据一些实施方案,RNAi分子是shRNA。
例如,如果在枯草芽孢杆菌(Bacillus subtilis)中抑制具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的内源多肽的表达,则RNAi分子可以是与SEQ ID NO:5互补的干扰RNA。RNAi分子可以是包含SEQ ID NO:5的互补物的至少10个连续核苷酸的核糖核酸分子。RNAi分子可以是包含与20至25,例如21至23个SEQ ID NO:5的连续核苷酸相同的第一链和与所述第一链互补的第二链的双链核糖核酸分子。
根据一些实施方案,本发明的基因工程化微生物已被修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的内源多肽的活性降低。
具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的内源多肽的活性的降低可以通过本领域已知的任何合适的方法实现。例如,可通过在多肽的活性位点中引入一个或多个突变,导致活性降低或丧失从而降低活性。因此,根据一些实施方案,具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的内源多肽的活性因至少一个活性位点突变而降低,导致活性降低或丧失。例如,所述至少一个活性位点突变可以是至少一个非保守氨基酸取代。
例如,如果在枯草芽孢杆菌(Bacillus subtilis)中降低具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的内源多肽的活性,则至少一个活性位点突变可发生在SEQID NO:11所示的氨基酸序列中的位置51-54、75、114-117、145、152-154、172、263、302和315中任一个,其形成活性位点的一部分。在同源多肽的情况下,至少一个活性位点突变可以位于对应于与SEQ ID NO:11所示的氨基酸序列中的位置51-54、75、114-117、145、152-154、172、263、302和315中任一项的位置。根据一些实施方案,编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述多肽的内源基因是基因folC。
根据一些实施方案,编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的所述多肽的内源基因包括与SEQ ID NO:5所示的核酸序列具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的核酸序列。根据一些实施方案,编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的多肽的内源基因包括与SEQ ID NO:5所示的核酸序列具有至少85%,例如至少90%序列同一性的核酸序列。根据一些实施方案,编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的多肽的内源基因包括与SEQ ID NO:5所示的核酸序列具有至少95%,例如至少98%序列同一性的核酸序列。
根据一些实施方案,通过内源基因编码的具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的多肽包括与SEQ ID NO:11所示的氨基酸序列具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸。根据一些实施方案,通过内源基因编码的具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的多肽包括与SEQ ID NO:11所示的氨基酸序列具有至少85%,例如至少90%序列同一性的氨基酸。根据一些实施方案,通过内源基因编码的具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的多肽包括与SEQ ID NO:11所示的氨基酸序列具有至少95%,例如至少98%序列同一性的氨基酸。
本发明的基因工程化微生物可被(进一步)修饰以表达仅具有二氢叶酸合成酶活性的异源多肽。例如,仅具有二氢叶酸合成酶活性的异源多肽可以衍生自细菌或真菌,优选选自罗伊氏乳杆菌(Lactobacillus reuteri)和棉阿舒囊霉(Ashbya gossypii)。
根据一些实施方案,仅具有二氢叶酸合成酶活性的异源多肽包括与SEQ ID NO:22或23具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。根据一些实施方案,仅具有二氢叶酸合成酶活性的异源多肽包括与SEQ ID NO:22或23具有至少85%,例如至少90%序列同一性的氨基酸序列。根据一些实施方案,仅具有二氢叶酸合成酶活性的异源多肽包括与SEQ ID NO:22或23具有至少95%,例如至少98%序列同一性的氨基酸序列。
叶酸盐分子含有一个蝶呤部分,来源于鸟苷三磷酸(GTP),与对氨基苯甲酸(pABA)和至少一个谷氨酸分子结合。因此,叶酸盐的从头生物合成需要三种前体:GTP、pABA和谷氨酸。
叶酸盐的生物合成通过四个连续步骤将GTP转化为6-羟甲基-7,8-二氢蝶呤焦磷酸(DHPPP)进行。第一步由GTP环化水解酶I(EC 3.5.4.16)(基因folE/mtrA)催化,并涉及GTP的广泛转化,以形成蝶呤环结构。在脱磷酸化后,蝶呤分子经历醛缩酶(EC 4.1.2.25)(基因folB)和焦磷酸激酶反应(EC 2.7.6.3)(基因folK),这产生活化的焦磷酸化DHPPP。在由二氢蝶酸合成酶(EC 2.5.1.15)(基因folP/sul)催化的对氨基苯甲酸(pABA)与DHPPP的第一次缩合之后,产生二氢蝶酸。第二个缩合是通过二氢叶酸合成酶(DHFS)(EC 6.3.2.12)(基因folC)的谷氨酸与二氢蝶酸反应形成二氢叶酸盐。然后,DHF被DHF还原酶-DHFR(EC1.5.1.3)(基因folA/dfrA)还原为生物活性的辅因子四氢叶酸盐(THF)。
蛋白质GlyA、PurU、YitJ和MetF进一步参与四氢叶酸盐相互转化途径。四氢叶酸盐(THF)可被丝氨酸羟甲基转移酶(基因glyA)(EC:2.1.2.1)激活:通过将丝氨酸转化为甘氨酸,随后将甲基转移至四氢叶酸盐,从而形成5,10-亚甲基四氢叶酸盐(5,10-mTHF)。5,10-mTHF是细胞中C1单位的主要来源。此外,在四氢叶酸盐相互转化中,枯草芽孢杆菌(B.subtilis)yitJ基因和大肠杆菌(Escherichia coli)metF基因编码5,10-亚甲基四氢叶酸还原酶(EC 1.5.1.20),该酶导致5-甲基四氢叶酸盐的最终形成。
此外,酶PurU对四氢叶酸盐相互转化途径也很重要,因为它作为甲酰四氢叶酸脱甲酰化酶(EC 3.5.1.10)参与将10-甲酰四氢叶酸盐转化回THF,进而可用于5-甲基四氢叶酸盐生物合成。
表1.叶酸盐生物合成基因
Figure BDA0004048528550000261
Figure BDA0004048528550000271
本发明人已经发现,在微生物中引入或上调一种或多种参与5-甲基-THF生物合成的基因(例如folE/mtrA、folB、folK、folP/sul、folA/dfrA、glyA、purU、yitJ和metF)也可以显著提高5-甲基-THF、其盐、前体或中间体的生产能力。
因此,本发明的基因工程化微生物可被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有显著提高的5-甲基叶酸盐(例如5-甲基四氢叶酸盐)或其前体或中间体的生产能力。例如,与其他相同微生物(参考微生物)相比,5-甲基叶酸盐(例如5-甲基四氢叶酸盐)或其前体或中间体的生产能力可增加了至少50%,例如至少100%、至少200%、至少500%、至少1000%、至少2000%、至少5000%、至少10000%、至少20000%或至少50000%。
根据一些实施方案,本发明的基因工程化微生物可被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的酶的至少一种基因(例如至少两种、至少三种、至少四种、至少五种、至少六种、至少七种或至少八种基因)的表达水平增加。因此,根据一些实施方案,本发明的基因工程化微生物已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的至少一种酶(例如至少两种、至少三种、至少四种、至少五种、至少六种、至少七种或至少八种基因)的表达水平增加。
例如,与其他相同微生物(参考微生物)相比,编码参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的酶的至少一种基因(例如至少两种、至少三种、至少四种、至少五种、至少六种、至少七种或至少八种基因)的表达水平可能增加了至少50%,至少100、至少200%、至少500%、至少1000%、至少2000%、至少5000%、至少10000%、至少20000%或至少50000%。
根据一些实施方案,参与5-甲基叶酸盐(例如5-甲基-四氢叶酸盐)的生物合成的酶选自由以下组成的组:具有GTP环化水解酶活性的多肽、具有7,8-二氢新蝶呤醛缩酶活性的多肽、具有2-氨基-4-羟基-6-羟甲基二氢蝶啶焦磷酸激酶活性的多肽、具有二氢蝶酸合成酶活性的多肽、具有二氢叶酸还原酶活性的多肽、具有丝氨酸羟甲基转移酶活性的多肽、具有甲酰四氢叶酸脱甲酰酶活性的多肽和具有5,10-亚甲基四氢叶酸还原酶活性的多肽。
根据一些实施方案,本发明的基因工程化微生物已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有GTP环化水解酶活性的多肽的基因的表达水平增加。因此,本发明的基因工程化微生物可能与不携带所述修饰的其他相同微生物(参考微生物)相比,具有GTP环化水解酶活性的多肽的表达水平增加。
根据一些实施方案,具有GTP环化水解酶活性的多肽包括与SEQ ID NO:7具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。根据一些实施方案,具有GTP环化水解酶活性的多肽包括与SEQ IDNO:7具有至少85%,例如至少90%序列同一性的氨基酸序列。根据一些实施方案,具有GTP环化水解酶活性的多肽包括与SEQ ID NO:7具有至少95%,例如至少98%序列同一性的氨基酸序列。
根据一些实施方案,本发明的基因工程化微生物已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有7,8-二氢新蝶呤醛缩酶活性的多肽的基因的表达水平增加。因此,本发明的基因工程化微生物可能与不携带所述修饰的其他相同微生物(参考微生物)相比,具有7,8-二氢新蝶呤醛缩酶活性的多肽的表达水平增加。
根据一些实施方案,具有7,8-二氢新蝶呤醛缩酶活性的多肽包括与SEQ ID NO:8具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。根据一些实施方案,具有7,8-二氢新蝶呤醛缩酶活性的多肽包括与SEQ ID NO:8具有至少85%,例如至少90%序列同一性的氨基酸序列。根据一些实施方案,具有7,8-二氢新蝶呤醛缩酶活性的多肽包括与SEQ ID NO:8具有至少95%,例如至少98%序列同一性的氨基酸序列。
根据一些实施方案,本发明的基因工程化微生物已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有2-氨基-4-羟基-6-羟甲基二氢蝶啶焦磷酸激酶活性的多肽的基因的表达水平增加。因此,本发明的基因工程化微生物可能与不携带所述修饰的其他相同微生物(参考微生物)相比,具有2-氨基-4-羟基-6-羟甲基二氢蝶啶焦磷酸激酶活性的多肽的表达水平增加。
根据一些实施方案,具有2-氨基-4-羟基-6-羟甲基二氢蝶啶焦磷酸激酶活性的多肽包括与SEQ ID NO:9具有至少70%,例如至少80%、至少85%、至少90%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。根据一些实施方案,具有2-氨基-4-羟基-6-羟甲基二氢蝶啶焦磷酸激酶活性的多肽包括与SEQ ID NO:9具有至少85%,例如至少90%序列同一性的氨基酸序列。根据一些实施方案,具有2-氨基-4-羟基-6-羟甲基二氢蝶啶焦磷酸激酶活性的多肽包括与SEQ ID NO:9具有至少95%,例如至少98%序列同一性的氨基酸序列。
根据一些实施方案,本发明的基因工程化微生物已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有二氢蝶酸合成酶活性的多肽的基因的表达水平增加。因此,本发明的基因工程化微生物可能与不携带所述修饰的其他相同微生物(参考微生物)相比,具有二氢蝶酸合成酶活性的多肽的表达水平增加。
根据一些实施方案,具有二氢蝶酸合成酶活性的多肽包括与SEQ ID NO:10具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。根据一些实施方案,具有二氢蝶酸合成酶活性的多肽包括与SEQID NO:10具有至少85%,例如至少90%序列同一性的氨基酸序列。根据一些实施方案,具有二氢蝶酸合成酶活性的多肽包括与SEQ ID NO:10具有至少95%,例如至少98%序列同一性的氨基酸序列。
根据一些实施方案,本发明的基因工程化微生物已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有二氢叶酸还原酶活性的多肽的基因的表达水平增加。因此,本发明的基因工程化微生物可能与不携带所述修饰的其他相同微生物(参考微生物)相比,具有二氢叶酸还原酶活性的多肽的表达水平增加。
根据一些实施方案,具有二氢叶酸还原酶活性的多肽包括与SEQ ID NO:12具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。根据一些实施方案,具有二氢叶酸还原酶活性的多肽包括与SEQID NO:12具有至少85%,例如至少90%序列同一性的氨基酸序列。根据一些实施方案,具有二氢叶酸还原酶活性的多肽包括与SEQ ID NO:12具有至少95%,例如至少98%序列同一性的氨基酸序列。
根据一些实施方案,本发明的基因工程化微生物已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有丝氨酸羟甲基转移酶活性的多肽的基因的表达水平增加。因此,与不携带所述修饰的其他相同微生物(参考微生物)相比,本发明的基因工程化微生物使具有丝氨酸羟甲基转移酶活性的多肽的表达水平可能增加。
根据一些实施方案,具有丝氨酸羟甲基转移酶活性的多肽包括与SEQ ID NO:79具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。根据一些实施方案,具有丝氨酸羟甲基转移酶活性的多肽包括与SEQ ID NO:79具有至少85%,例如至少90%序列同一性的氨基酸序列。根据一些实施方案,具有丝氨酸羟甲基转移酶活性的多肽包括与SEQ ID NO:79具有至少95%,例如至少98%序列同一性的氨基酸序列。
根据一些实施方案,本发明的基因工程化微生物已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有甲酰四氢叶酸脱甲酰酶活性的多肽的基因的表达水平增加。因此,与不携带所述修饰的其他相同微生物(参考微生物)相比,本发明的基因工程化微生物可以使具有甲酰四氢叶酸脱甲酰酶活性的多肽的表达水平增加。
根据一些实施方案,具有甲酰四氢叶酸脱甲酰酶活性的多肽包括与SEQ ID NO:81具有至少70%,例如至少80%、至少85%、至少90%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。根据一些实施方案,具有甲酰四氢叶酸脱甲酰酶活性的多肽包括与SEQID NO:81具有至少85%,例如至少90%序列同一性的氨基酸序列。根据一些实施方案,具有甲酰四氢叶酸脱甲酰酶活性的多肽包括与SEQ ID NO:81具有至少95%,例如至少98%序列同一性的氨基酸序列。
根据一些实施方案,本发明的基因工程化微生物已被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有5,10-亚甲基四氢叶酸还原酶活性的多肽的基因的表达水平增加。因此,与不携带所述修饰的其他相同微生物(参考微生物)相比,本发明的基因工程化微生物可以使具有5,10-亚甲基四氢叶酸还原酶活性的多肽的表达水平增加。
根据一些实施方案,具有5,10-亚甲基四氢叶酸还原酶活性的多肽包括与SEQ IDNO:83具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。根据一些实施方案,具有5,10-亚甲基四氢叶酸还原酶活性的多肽包括与SEQ ID NO:83具有至少85%,例如至少90%序列同一性的氨基酸序列。根据一些实施方案,具有5,10-亚甲基四氢叶酸还原酶活性的多肽包括与SEQ ID NO:83具有至少95%,例如至少98%序列同一性的氨基酸序列。
根据一些实施方案,具有5,10-亚甲基四氢叶酸还原酶活性的多肽包括与SEQ IDNO:84具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸序列。根据一些实施方案,具有5,10-亚甲基四氢叶酸还原酶活性的多肽包括与SEQ ID NO:84具有至少85%,例如至少90%序列同一性的氨基酸序列。根据一些实施方案,具有5,10-亚甲基四氢叶酸还原酶活性的多肽包括与SEQ ID NO:84具有至少95%,例如至少98%序列同一性的氨基酸序列。
根据一些实施方案,编码参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的酶的至少一种基因选自由以下组成的组:folE/mtrA、folB、folK、folP/sul、folA/dfrA、glyA、purU、yitJ和metF。
根据一些实施方案,编码参与5-甲基叶酸盐(例如,5-甲基四氢叶酸盐)的生物合成的酶的至少一种基因与所述基因工程化微生物异源。
根据一些实施方案,编码参与5-甲基叶酸盐的生物合成的酶的至少一种基因衍生自细菌或真菌,优选选自芽孢杆菌属(Bacillus)、大肠杆菌属(Escherichia)、乳球菌属(Lactococcus)、希瓦氏菌属(Shewanella)、弧菌属(Vibrio)和阿舒氏菌属(Ashbya)。
根据一些实施方案,编码参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的酶的至少一种基因衍生自选自枯草芽孢杆菌(Bacillus subtiltis)、乳酸乳杆菌(Lactobacillus lactis)、大肠杆菌(Escherichia coli)、堇色希瓦氏菌(Shewanellaviolacea)、需钠弧菌(Vibrio natriegens)或棉阿舒囊霉(Ashbya gossypii)的细菌或真菌。
本发明人还发现,在微生物中编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的多肽的内源基因(例如基因metE)(其是代谢/消耗5-甲基四氢叶酸盐的主要酶)的下调或缺失可以显著进一步增加5-甲基四氢叶酸盐、其盐、前体或中间体的积累和生产能力。
因此,本发明的基因工程化微生物可能被(进一步)修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的多肽的内源基因的表达水平降低。与其他相同微生物相比,内源基因的表达水平可以例如降低至少50%,例如降低至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少100%。
根据一些实施方案,基因工程化微生物在编码多肽的内源基因的调控区中包括至少一个突变,所述多肽具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性,导致表达水平降低。例如,调控区中的至少一个突变可以是在紧邻Pribnow盒(TATAAT)序列的位置(例如,1或2个核苷酸上游或下游)处的至少一种核苷酸取代,导致编码的多肽的表达水平降低。作为具体情况,例如,如果微生物是枯草芽孢杆菌(Bacillus subtilis),则核苷酸取代可以位于内源基因起始密码子上游12个核苷酸的位置。例如,所述至少一种核苷酸取代可以是一种嘌呤被另一种嘌呤(例如鸟嘌呤到腺嘌呤)的取代。
根据一些实施方案,通过用与内源启动子相比对RNA聚合酶的亲和力较弱的外源启动子取代与编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的多肽的内源基因可操作地连接的内源启动子,对基因工程化微生物进行修饰。如本领域技术人员将认识到的,对RNA聚合酶的较弱亲和力将导致转录水平的降低,并因此导致产生微生物的相应多肽的水平降低。
根据一些实施方案,编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的多肽的内源基因已被失活,例如通过删除部分或全部基因序列。
根据一些实施方案,编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述多肽的内源基因已经通过在微生物中引入或表达能够通过DNA切割,优选通过双链断裂而选择性地失活编码所述肽的内源基因的罕见切割核酸内切酶而被失活。根据本发明用于失活内源基因的罕见切割核酸内切酶可以是例如类转录激活因子效应物(TALE)核酸酶、大范围核酸酶、锌指核酸酶(ZFN)或RNA引导的核酸内切酶。
一种失活编码所述多肽5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的内源基因的方法是使用如上所述的CRISPRi系统。因此,根据一些实施方案,通过在微生物中引入或表达RNA引导的核酸内切酶,例如催化失活的Cas9蛋白,以及在细胞条件下与编码所述多肽的基因组DNA特异性杂交(例如结合)的单引导RNA(sgRNA),将编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述多肽的内源基因失活。
例如,如果编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述多肽的内源基因在枯草芽孢杆菌(Bacillus subtiltis)中被抑制,则单引导RNA(sgRNA)可包含SEQ ID NO:101的至少20个连续核苷酸或其互补物。
根据一些实施方案,通过抑制降低了具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的内源多肽的表达。
可以通过本领域已知的任何合适的方法来实现对具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述内源多肽的表达的抑制。例如,表达可通过基因沉默技术来抑制,该技术涉及使用抑制性核酸分子,例如反义寡核苷酸、核酶或干扰RNA(RNAi)分子,例如微小RNA(miRNA)、小干扰RNA(siRNA)或短发夹RNA(shRNA)。
根据一些实施方案,通过编码所述多肽的内源基因的转录和/或翻译抑制,降低(例如,抑制)具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述内源多肽的表达。
根据一些实施方案,通过在微生物中引入或表达抑制性核酸分子来抑制具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述内源多肽的表达。例如,可以通过外源核酸分子引入抑制性核酸分子,所述外源核酸分子包含编码可操作地连接到启动子(例如可诱导启动子)的所述抑制性核酸分子的核苷酸序列,所述启动子在微生物中起作用以引起所述抑制性核酸分子的产生。合适地,抑制性核酸分子是在细胞条件下与编码内源多肽的细胞mRNA和/或基因组DNA特异性杂交(例如结合)的抑制性核酸分子。
根据一些实施方案,所述抑制性核酸分子是反义寡核苷酸、核酶或干扰RNA(RNAi)分子。优选地,这种核酸分子包含编码多肽的细胞mRNA和/或基因组DNA的互补物的至少10个连续核苷酸。
例如,如果在枯草芽孢杆菌(Bacillus subtilis)中抑制具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的内源多肽的表达,则这种抑制性核酸分子可包含SEQ ID NO:101的互补物的至少10个连续核苷酸。
根据一些实施方案,抑制性核酸是反义寡核苷酸。这种反义寡核苷酸是在细胞条件下与编码多肽的细胞mRNA和/或基因组DNA特异性杂交(例如结合)的核酸分子(DNA或RNA)。
根据一些实施方案,抑制性核酸分子是核酶,例如锤头状核酶。核酶分子被设计为催化切割mRNA转录物以阻止多肽的翻译。
根据一些实施方案,抑制性核酸分子是干扰RNA(RNAi)分子。根据一些实施方案,RNAi分子是miRNA。根据一些实施方案,RNAi分子是siRNA。根据一些实施方案,RNAi分子是shRNA。
例如,如果在枯草芽孢杆菌(Bacillus subtilis)中抑制具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的内源多肽的表达,则RNAi分子可以是与SEQ IDNO:101互补的干扰RNA。RNAi分子可以是包含SEQ ID NO:5的互补物的至少10个连续核苷酸的核糖核酸分子。RNAi分子可以是包含与SEQ ID NO:101的20至25,例如21至23个连续核苷酸相同的第一链和与所述第一链互补的第二链的双链核糖核酸分子。
根据一些实施方案,本发明的基因工程化微生物已被修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的内源多肽的活性降低。
可以通过本领域已知的任何合适的方法来实现对具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的内源多肽的活性的降低。例如,活性可通过在多肽的活性位点中引入一个或多个突变而降低,导致活性降低或丧失。因此,根据一些实施方案,具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的内源多肽的活性因至少一个活性位点突变而降低,导致活性降低或丧失。例如,所述至少一个活性位点突变可以是至少一个非保守氨基酸取代。
例如,如果在枯草芽孢杆菌(Bacillus subtilis)中降低具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的内源多肽的活性,则至少一个活性位点突变可发生在SEQ ID NO:100所示的氨基酸序列中的位置18、21、112、117、119、435-437、488、494、519-521、565、601、603、605、645、647、669、730和731的任一处,其形成活性位点的一部分。在同源多肽的情况下,至少一个活性位点突变可以位于对应于与SEQ ID NO:100所示的氨基酸序列中的位置18、21、112、117、119、435-437、488、494、519-521、565、601、603、605、645、647、669、730和731中任一个的位置。根据一些实施方案,编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的多肽的内源基因是基因metE。
根据一些实施方案,编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的所述多肽的内源基因包括与SEQ ID NO:101所示的核酸序列具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的核酸序列。根据一些实施方案,编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的多肽的内源基因包括与SEQ ID NO:101所示的核酸序列具有至少85%,例如至少90%序列同一性的核酸序列。根据一些实施方案,编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的多肽的内源基因包括与SEQ ID NO:101所示的核酸序列具有至少95%,例如至少98%序列同一性的核酸序列。
根据一些实施方案,通过内源基因编码的具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的多肽的多肽包括与SEQ ID NO:100所示的氨基酸序列具有至少70%,例如至少80%、至少85%、至少90%、至少93%、至少95%、至少98%或至少99%序列同一性的氨基酸。根据一些实施方案,通过内源基因编码的具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的多肽的多肽包括与SEQ ID NO:100所示的氨基酸序列具有至少85%,例如至少90%序列同一性的氨基酸。
根据一些实施方案,通过内源基因编码的具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的多肽的多肽包括与SEQ ID NO:100所示的氨基酸序列具有至少95%,例如至少98%序列同一性的氨基酸。
通常,本文所指的微生物可以是任何合适的微生物,包括单细胞或多细胞微生物,例如细菌或酵母。
细菌微生物可以是革兰氏阳性或革兰氏阴性细菌。革兰氏阴性细菌的非限制性实例包括来自大肠杆菌属(Escherichia)、欧文氏菌属(Erwinia)、克雷伯杆菌属(Klebsiella)和柠檬酸杆菌属(Citrobacter)的物种。革兰氏阳性细菌的非限制性实例包括来自芽孢杆菌属(Bacillus)、乳球菌属(Lactococcus)、乳酸杆菌属(Lactobacillus)、土芽孢杆菌属(Geobacillus)、片球菌属(Pediococcus)、穆尔氏菌属(Moorella)、梭状芽胞杆菌属(Clostridium)、棒状杆菌属(Corynebacterium)、链霉菌属(Streptomyces)、链球菌属(Streptococcus)和纤维素单胞菌属(Cellulomonas)的物种。
根据一些实施方案,微生物是细菌,细菌可以是芽孢杆菌属(Bacillus)、乳球菌属(Lactococcus)、乳酸杆菌属(Lactobacillus)、梭状芽胞杆菌属(Clostridium)、棒状杆菌属(Corynebacterium)、土芽孢杆菌属(Geobacillus)、链球菌属(Streptococcus)、片球菌属(Pediococcus)、穆尔氏菌属(Moorella)、假单胞菌属(Pseudomonas)、链霉菌属(Streptomyces)、大肠杆菌属(Escherichia)、志贺氏菌属(Shigella)、不动杆菌属(Acinetobacter)、柠檬酸杆菌属(Citrobacter)、沙门氏菌属(Salmonella)、克雷伯氏菌属(Klebsiella)、肠杆菌属(Enterobacter)、欧文氏菌属(Erwinia)、克吕沃尔菌属(Kluyvera)、沙雷氏菌属属(Serratia)、西地西菌属(Cedecea)、摩根氏菌属(Morganella)、哈夫尼菌属(Hafnia)、爱德华氏菌属(Edwardsiella)、普罗威登斯菌属(Providencia)、变形杆菌属(Proteus)或耶尔森氏菌属(Yersinia)的细菌。
根据一些实施方案,微生物是大肠杆菌属(Escherichia)的细菌。大肠杆菌属(Escherichia)细菌的非限制性实例是大肠杆菌(Escherichia coli)。根据一些实施方案,微生物是大肠杆菌(Escherichia coli)。
根据一些实施方案,微生物是芽孢杆菌属(Bacillus)的细菌。芽孢杆菌属(Bacillus)细菌的非限制性实例是枯草芽孢杆菌(Bacillus subtitlis)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、地衣芽孢杆菌(Bacillus licheniformis)和摩加夫芽孢杆菌(Bacillus mojavensis)。根据一些实施方案,微生物是枯草芽孢杆菌(Bacillussubtitlis)。
酵母细胞可衍生自例如,酵母属(Saccharomyces)、毕赤酵母属(Pichia)、裂殖酵母属(Schizosacharomyces)、接合酵母属(Zygosaccharomyces)、汉逊酵母属(Hansenula)、Pachyosolen、克鲁维酵母属(Kluyveromyces)、德巴利酵母属(Debaryomyces)、解脂耶氏酵母属(Yarrowia)、念珠菌属(Candida)、隐球菌属(Cryptococcus)、Komagataella、斯氏油脂酵母(Lipomyces)、红螺菌属(Rhodospiridium)、红酵母属(Rhodotorula)或毛孢子菌属(Trichosporon)。
根据一些实施方案,微生物是酵母属(Saccharomyces)的酵母。酵母属(Saccharomyces)酵母的非限制性实例是酿酒酵母(Saccharomyces cerevisiae)。根据某些实施方案,微生物是酿酒酵母(Saccharomyces cerevisiae)。
如上所述,本发明的基因工程化微生物可以被修饰以表达如本文详细描述的一种或多种多肽,这意味着一种或多种外源核酸分子(如DNA分子)包含编码所述多肽的一个或多个核苷酸序列,或多肽已被引入微生物中。用于将外源核酸分子(如DNA分子)引入各种宿主细胞的技术是本领域技术人员所熟知的,并且包括转化(例如热休克或自然转化)、转染、接合、电穿孔、显微注射和微粒轰击。
因此,本发明的基因工程化微生物可包含外源核酸分子,所述外源核酸分子包含编码本文详细描述的多肽的核苷酸序列。为了促进多肽在微生物中的表达,外源核酸分子可包含合适的调控元件如启动子,启动子在宿主细胞中起作用以导致mRNA分子的产生并且可操作地连接到编码所述多肽的核苷酸序列。根据本发明有用的启动子是任何已知的启动子,它们在给定宿主细胞中起作用以导致mRNA分子的产生。许多此类启动子是技术人员已知的。此类启动子包括通常与其他基因关联的启动子和/或从任何细菌、酵母、真菌、藻类或植物细胞分离的启动子。用于蛋白质表达的启动子的使用通常为分子生物学领域的技术人员所知,例如,参见Sambrook等人,Molecular cloning:A Laboratory Manual,ColdSpring Harbor Laboratory,Cold Spring Harbor,N.Y.,1989。除了启动子之外,外源核酸分子还可包含至少一种选自5’非翻译区(5’UTR)和3’非翻译区域(3’UTR)的调控元件。衍生自原核生物和真核生物的许多这样的5’UTR和3’UTR是本领域技术人员熟知的。
外源核酸分子可以是载体或载体的一部分,例如表达载体。通常,这样的载体在微生物内保持在染色体外,这意味着它存在于微生物的细胞核或拟核区域外部。本发明还预期外源核酸分子稳定地整合到宿主细胞的基因组中。本领域技术人员熟知用于稳定整合到微生物基因组中的手段,例如通过同源重组。
应当理解,本文中给出的关于基因工程化微生物的细节适用于本发明的其他方面,特别地适用于根据本发明的方法,这些细节将在下文中更详细地描述。
本发明方法
在第二方面,本发明提供了一种用于制备叶酸盐、其前体或中间体的方法。特别地,用于制备叶酸盐、其前体或中间体的方法包括:
i)在合适的培养条件下在培养基中培养根据本发明的基因工程化微生物,以获得含有所述叶酸盐、其前体或中间体的发酵产物;以及ii)任选地,分离和/或纯化所述叶酸盐、其前体或中间体。
使用的培养基可以是适合于培养所述宿主细胞的任何常规培养基,并且可以根据现有技术的原理组成。培养基通常含有相应宿主细胞生长和存活所需的所有营养素,例如碳源和氮源以及其他无机盐。合适的培养基(例如最小培养基或复合培养基)可从商业供应商处获得,或者可根据公开的配方(例如美国典型培养物保藏中心(ATCC)菌株目录)制备。技术人员熟知的非限制性标准培养基包括Luria Bertani(LB)肉汤、沙氏葡萄糖(SD)肉汤、MS肉汤、酵母蛋白胨葡萄糖、BMMY、GMMY或酵母麦芽提取物(YM)肉汤,它们都是市售的。用于培养细菌细胞(例如枯草芽孢杆菌(B.subtilis)或大肠杆菌(E.coli)细胞)的合适培养基的非限制性实例,包括最小培养基和丰富培养基,例如Luria肉汤(LB)、M9培养基、M17培养基、SA培养基、MOPS培养基、Terrific肉汤、YT等。用于培养真核细胞(例如酵母细胞)的合适培养基是RPMI 1640、MEM、DMEM,所有这些都可以根据所培养的特定宿主细胞的需要补充血清和/或生长因子。用于培养真核细胞的培养基也可以是任何种类的最小培养基,例如酵母最小培养基。
培养相应微生物的合适条件是技术人员熟知的。通常,基因工程化微生物在32至约42℃的温度下培养,优选在34至39℃的范围内,更优选在36至39℃的范围内,例如在约37℃下的温度下培养。培养基的pH可以在6至8的范围内,优选在6.5至7.5的范围内,更优选在6.8至7.2的范围内。步骤i)中的培养可以进行10至70小时范围内,优选24至60小时范围内,更优选36至50小时范围内的时间段。
该方法还可包括ii)分离和/或纯化所述叶酸盐、其前体或中间体。叶酸盐、其前体或中间体可通过从培养基中分离和纯化化合物的任何常规方法分离和/或纯化。熟知的纯化程序包括离心或过滤、沉淀和色谱法,诸如例如离子交换色谱法、凝胶过滤色谱法等。
通过本发明的方法制备的叶酸盐优选为式I化合物:
Figure BDA0004048528550000391
任选地为一种立体异构体的形式,优选对映异构体或非对映异构体,外消旋体的形式,或任意混合比的至少两种立体异构体(优选对映异构体和/或非对映异构体)的混合物的形式。
在上面的通式(I)中,这意味着当a是单键时,a’不存在,或者当a’是单键时,a不存在。
根据某些实施方案,通过本发明方法制备的叶酸盐是式II化合物(5-甲基四氢叶酸盐):
Figure BDA0004048528550000401
任选地为一种立体异构体的形式,优选对映异构体或非对映异构体,外消旋体的形式,或任意混合比的至少两种立体异构体(优选对映异构体和/或非对映异构体)的混合物的形式。
根据特定实施方案,通过本发明方法制备的叶酸盐是式IIa化合物(L-5-甲基四氢叶酸盐;(6S)-5-甲基四氢叶酸盐):
Figure BDA0004048528550000402
根据某些实施方案,通过本发明方法制备的叶酸盐是式III化合物(5-甲基二氢叶酸盐):
Figure BDA0004048528550000403
任选地为一种立体异构体的形式,优选对映异构体或非对映异构体,外消旋体的形式,或任意混合比的至少两种立体异构体(优选对映异构体和/或非对映异构体)的混合物的形式。
本发明人还惊奇地发现,在如上文描述获得的菌株培养期间添加对氨基苯甲酸(PABA)可显著进一步提高叶酸盐、其盐、前体或中间体的生产能力。因此,根据一些实施方案,所述方法还包括在培养步骤(i)期间添加对氨基苯甲酸(PABA)的步骤。
例如,对氨基苯甲酸(PABA)可以是PABA,PABA选自由以下各项组成的组:对氨基苯甲酸钾、对氨基苯甲酸钠、对氨基苯甲酸甲酯、对氨基苯甲酸乙酯、对氨基苯甲酸丁酯或其组合。
根据一些实施方案,所述方法还包括使步骤(i)或(ii)中获得的产物经受酸性或碱性条件以进一步获得衍生物化合物。
在另一方面,本发明提供了制备本发明的基因工程化微生物的方法。特别地,本发明的制备基因工程化微生物的方法包括以下步骤(a)至(d)中的任一个(例如全部):
(a)与其他相同微生物(参考微生物)相比,增加参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的至少一种(例如至少两种、至少三种、至少四种、至少五种、至少六种、至少七种或至少八种)酶的表达水平;
(b)与不携带所述修饰的其他相同微生物(参考微生物)相比,降低具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的内源多肽的表达和/或活性;
(c)与不携带所述修饰的其他相同微生物(参考微生物)相比,降低具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的内源多肽的表达和/或活性;和/或
(d)表达仅具有二氢叶酸合成酶活性的异源多肽。
根据一些实施方案,所述方法包括以下步骤(a)至(b)中的任一个:
(a)与其他相同微生物(参考微生物)相比,增加参与5-甲基叶酸盐的生物合成的至少一种酶的表达水平;以及
(b)与其他相同微生物(参考微生物)相比,降低编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的多肽的内源基因的表达水平;
任选地还包括以下步骤(c)和(d):
(c)与其他相同微生物(参考微生物)相比,降低编码具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的多肽的内源基因的表达水平;以及
(d)表达仅具有二氢叶酸合成酶活性的异源多肽。
根据一些实施方案,制备本发明的基因工程化微生物的方法包括以下步骤:aa)将至少一种外源核酸分子引入所述微生物,所述外源核酸分子包含编码参与5-甲基叶酸盐(例如5-甲基四氢叶酸盐)的生物合成的酶的核酸序列;bb)例如通过删除部分或全部基因序列,使编码具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的多肽的内源基因失活,或在所述内源基因的调控区中引入至少一个突变,这导致表达水平降低;cc)例如通过删除部分或全部基因序列,使编码多肽的内源基因失活,所述多肽在所述微生物中具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性;和/或dd)将包含编码仅具有二氢叶酸合成酶活性的异源多肽的核酸序列的外源核酸分子引入所述微生物。
某些定义
如本文所用,5-甲基叶酸盐是指5-甲基四氢叶酸盐和5-甲基二氢叶酸盐中的任一种,包括其任何立体异构体形式和质子化(酸)或去质子化的(盐)形式。
短语“产生5-甲基叶酸盐的能力”是指在培养基中培养微生物时微生物(例如细菌)能够在培养基中或在微生物中产生、排泄或分泌5-甲基叶酸盐和/或导致5-甲基叶酸盐的积累。如果微生物表达参与产生5-甲基叶酸盐的生物合成途径的所有酶,则可认为其具有生产5-甲基叶酸盐的能力。
短语“产生5-甲基-四氢叶酸盐(5-甲基-THF)的能力”是指在培养基中培养微生物时微生物(例如细菌)能够在培养基中或在微生物中产生、排泄或分泌5-甲基-THF和/或导致5-甲基-THF的积累。如果微生物表达参与产生5-甲基-THF的生物合成途径的所有酶,则可认为其具有生产5-甲基-THF的能力。
如本文所用,“具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的多肽”是指催化反应:ATP+7,8-二氢蝶酸盐+L-谷氨酸盐<=>ADP+磷酸盐+7,8-二氢蝶酰谷氨酸盐(EC6.3.2.12)和反应:ATP+四氢蝶酰基-(γ-Glu)(n)+L-谷氨酸盐<=>ADP+磷酸盐+四氢蝶酰基-(γ-Glu))(n+1)(EC 6.3.2.17)的多肽。例如,具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的多肽由存在于例如枯草芽孢杆菌(Bacillus subtilis)中的基因folC编码。关于例如枯草芽孢杆菌(Bacillus subtilis)的folC的其他信息可访问KEGG(https://www.kegg.jp/kegg/genes.html)登录号为BSU28080。还参见NCBI参考序列:(枯草芽孢杆菌(B.subtilis))氨基酸序列NP_390686.1。
如本文所用,“仅具有二氢叶酸合成酶活性的多肽”是指仅催化以下反应的多肽:ATP+7,8-二氢蝶酸盐+L-谷氨酸盐<=>ADP+磷酸盐+7,8-二氢蝶酰谷氨酸盐(EC6.3.2.12)。例如,仅具有二氢叶酸合成酶活性的多肽由例如存在于棉阿舒囊霉(Ashbyagossypii)和罗伊氏乳杆菌(Lactobacillus reuteri)中的基因folC2编码。关于例如棉阿舒囊霉(Ashbya gossypii)和罗伊氏乳杆菌(Lactobacillus reuteri)的folC2的其他信息可访问KEGG(https://www.kegg.jp/kegg/genes.html)登录号分别为AGOS_AEL310C和Lreu_1277。还参见NCBI参考序列:(棉阿舒囊霉(Ashbya gossypii))氨基酸序列NP_984550.1且(罗伊氏乳杆菌(Lactobacillus reuteri))氨基酸序列WP_003668526.1。
如本文所用,“具有GTP环化水解酶活性的多肽”是指催化以下反应的多肽:GTP+H(2)O<=>甲酸盐+2-氨基-4-羟基-6-(赤式-1,2,3-三羟基丙基)-二氢蝶啶三磷酸盐(EC3.5.4.16)。例如,具有GTP环化水解酶活性的多肽由存在于例如枯草芽孢杆菌(Bacillussubtilis)中的基因folE编码。关于例如枯草芽孢杆菌(Bacillus subtilis)的folE的其他信息可访问KEGG(https://www.kegg.jp/kegg/genes.html)登录号为BSU22780。还参见NCBI参考序列:(枯草芽孢杆菌(B.subtilis))氨基酸序列NP_390159.1。
如本文所用,“具有7,8-二氢新蝶呤醛缩酶活性的多肽”是指催化以下反应的多肽:7,8-二氢新蝶呤<=>6-羟甲基-7,8-二氢蝶呤+乙醇醛(EC 4.1.2.25)。例如,具有7,8-二氢新蝶呤醛缩酶活性的多肽由存在于例如枯草芽孢杆菌(Bacillus subtilis)中的基因folB编码。关于例如枯草芽孢杆菌(Bacillus subtilis)的folB的其他信息可访问KEGG(https://www.kegg.jp/kegg/genes.html)登录号为BSU00780。还参见NCBI参考序列:(枯草芽孢杆菌(B.subtilis))氨基酸序列NP_387959.1。
如本文所用,“具有2-氨基-4-羟基-6-羟甲基二氢蝶啶焦磷酸激酶活性的多肽”是指催化以下反应的多肽:ATP+6-羟甲基-7,8-二氢蝶呤<=>AMP+6-羟甲基-7,8-二氢蝶呤二磷酸盐(EC 2.7.6.3)。例如,具有2-氨基-4-羟基-6-羟甲基二氢蝶啶焦磷酸激酶活性的多肽由存在于例如枯草芽孢杆菌(Bacillus subtilis)中的基因folK编码。关于例如枯草芽孢杆菌(Bacillus subtilis)的folK的其他信息可访问KEGG(https://www.kegg.jp/kegg/genes.html)登录号为BSU00790。还参见NCBI参考序列:(枯草芽孢杆菌(B.subtilis))氨基酸序列NP_387960.1。
如本文所用,“具有二氢蝶酸盐合成酶活性的多肽”是指催化以下反应的多肽:6-羟甲基-7,8-二氢蝶呤二磷酸盐+4-氨基苯甲酸盐<=>二磷酸盐+二氢蝶酸盐(EC2.5.1.15)。例如,具有二氢蝶酸盐合成酶活性的多肽由存在于例如枯草芽孢杆菌(Bacillus subtilis)中的基因folP编码。关于例如枯草芽孢杆菌(Bacillus subtilis)的folP的其他信息进可访问KEGG(https://www.kegg.jp/kegg/genes.html)登录号为BSU00770。还参见NCBI参考序列:(枯草芽孢杆菌(B.subtilis))的氨基酸序列NP_387958.1。
如本文所用,“具有二氢叶酸盐还原酶活性的多肽”是指催化以下反应的多肽:5,6,7,8-四氢叶酸盐+NADP(+)<=>7,8-二氢叶酸盐+NADPH(EC 1.5.1.3)。例如,具有二氢叶酸盐还原酶活性的多肽由存在于例如枯草芽孢杆菌(Bacillus subtilis)中的基因folA编码。关于例如枯草芽孢杆菌(Bacillus subtilis)的folA的其他信息可访问KEGG(https://www.kegg.jp/kegg/genes.html)登录号为BSU21810。还参见NCBI参考序列:(枯草芽孢杆菌(B.subtilis))氨基酸序列NP_390064.1。
如本文所用,“具有丝氨酸羟甲基转移酶活性的多肽”是指催化以下反应的多肽:5,10-亚甲基四氢叶酸盐+甘氨酸+H(2)O<=>四氢叶酸盐+L-丝氨酸(EC 2.1.2.1)。例如,具有丝氨酸羟甲基转移酶活性的多肽由存在于例如枯草芽孢杆菌(Bacillus subtilis)中的基因glyA编码。关于例如枯草芽孢杆菌(Bacillus subtilis)的glyA的其他信息可访问KEGG(https://www.kegg.jp/kegg/genes.html)登录号为BSU36900。还参见NCBI参考序列:(枯草芽孢杆菌(B.subtilis))氨基酸序列NP_391571.1。
如本文所用,“具有甲酰四氢叶酸盐脱甲酰酶活性的多肽”是指催化以下反应的多肽:10-甲酰四氢叶酸盐+H(2)O<=>甲酸盐+四氢叶酸盐(EC 5.5.1.10)。例如,具有甲酰四氢叶酸盐脱甲酰酶活性的多肽由存在于例如枯草芽孢杆菌(Bacillus subtilis)中的基因purU编码。关于例如枯草芽孢杆菌(Bacillus subtilis)的purU的其他信息可访问KEGG(https://www.kegg.jp/kegg/genes.html)登录号为BSU13110。还参见NCBI参考序列:(枯草芽孢杆菌(B.subtilis))氨基酸序列NP_389194.2。
如本文所用,“具有5,10-亚甲基四氢叶酸盐还原酶活性的多肽”是指催化以下反应的多肽:5-甲基四氢叶酸盐+NAD(P)(+)<=>5,10-亚甲基四氢叶酸盐+NAD(P)H(EC1.5.1.20)。例如,具有5,10-亚甲基四氢叶酸盐还原酶活性的多肽由存在于例如枯草芽孢杆菌(Bacillus subtilis)中的基因yitJ编码。关于例如枯草芽孢杆菌(Bacillussubtilis)的yitJ的其他信息可访问KEGG(https://www.kegg.jp/kegg/genes.html)登录号为BSU11010。还参见NCBI参考序列:(枯草芽孢杆菌(B.subtilis))氨基酸序列NP_388982.1。例如,具有5,10-亚甲基四氢叶酸盐还原酶活性的多肽由存在于例如大肠杆菌(Escherichia coli)中的基因metF编码。关于例如大肠杆菌(Escherichia coli)的metF的其他信息可访问KEGG(https://www.kegg.jp/kegg/genes.html)登录号为b3941。还参见NCBI参考序列:(枯草芽孢杆菌(B.subtilis))氨基酸序列NP_418376.1。
如本文所用,“具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的多肽”是指催化以下反应的多肽:5-甲基四氢蝶酰三-L-谷氨酸+L-同型半胱氨酸<=>四氢蝶酰基三-L-谷氨酸+L-蛋氨酸(EC 2.1.1.14)。例如,具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的多肽由存在于例如枯草芽孢杆菌(Bacillus subtilis)中的基因metE编码。关于例如枯草芽孢杆菌(Bacillus subtilis)的metE的其他信息可访问KEGG(https://www.kegg.jp/kegg/genes.html)登录号为BSU13180。还参见NCBI参考序列:(枯草芽孢杆菌(B.subtilis))氨基酸序列NP_389201.2。
如本文在基因或核酸分子的上下文中使用的“异源”或“外源”是指并非作为其存在的微生物基因组的一部分自然存在的,或在基因组中与其自然存在的位置不同的一个或多个位置发现的基因或核酸分子(即,DNA或RNA分子)。因此,“异源”或“外源”基因或核酸分子不是微生物内源的,而是外源引入微生物中的。“异源”基因或核酸分子DNA分子可能来自不同生物体、不同物种、不同属或不同界,作为宿主DNA。
如本文在多肽(如酶)上下文中使用的“异源”是指多肽通常不存在于宿主微生物中或由宿主微生物制造(即表达),而是衍生自不同生物体、不同物种、不同属或不同界。
如本文所用,术语“直系同源”或“直系同源物”是指衍生自共同祖先基因但存在于不同物种中的基因、由此编码的核酸分子(即mRNA)或由此编码的蛋白质。
基因的“表达水平降低”是指与不携带所述修饰的其他相同微生物相比,转录产物的量,相应地由基因工程化微生物产生的所述基因编码的多肽的量降低。更具体地,基因的“表达水平降低”是指与不携带所述修饰的其他相同微生物相比,转录产物的量,相应地由基因工程化微生物产生的所述基因编码的多肽的量降低至少10%,例如至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%,至少90%或至少100%。基因的表达水平可以通过熟知的方法来确定,包括PCR、Southern印迹等。此外,可以通过使用各种熟知的方法(包括Northern印迹、定量RT-PCR等)测量从基因转录的mRNA的量来估计基因表达的水平。基因编码的多肽的量可以通过熟知的方法测量,包括ELISA、免疫组织化学或免疫印迹等。
可以通过将突变引入微生物基因组中的基因中来降低基因表达,从而与不携带所述突变的其他相同微生物相比,所述基因编码的多肽的细胞内活性降低。导致基因表达降低的突变包括替换一个或多个核苷酸以引起基因编码的多肽中的氨基酸取代(错义突变)、引入终止密码子(无义突变)、删除或插入核苷酸以引起移码(移框,frame shift)、插入抗药性基因、或部分基因或整个基因的缺失(Qiu和Goodman,1997;Kwon等人,2000)。还可以通过修饰表达调控序列(如启动子、Shine-Dalgarno(SD)序列等)来降低表达。基因的表达也可以通过基因替换(Datsenko和Wanner,2000)来降低,例如“λ-红介导的基因替换”。λ-红介导的基因替换是一种特别适合于使如本文描述的一种或多种基因失活的方法。
“失活了(Inactivating)”、“失活(inactivation)”和“失活的(inactivated)”,当在基因的上下文中使用时,是指所述基因不再表达功能蛋白。修饰的DNA区域可能由于部分或全部基因序列的缺失、基因阅读框的移位、错义/无义突变(多个)的引入或基因相邻区域的修饰(包括控制基因表达的序列,例如启动子、增强子、弱化子、核糖体结合位点等)无法自然表达该基因。优选地,通过删除部分或全部基因序列(例如通过基因替换)使感兴趣的基因失活。失活也可以通过引入或表达能够通过DNA切割(优选通过双链断裂)选择性失活感兴趣基因的罕见切割核酸内切酶来完成。本发明上下文中的“罕见切割核酸内切酶”包括类转录激活因子效应物(TALE)核酸酶、大范围核酸酶、锌指核酸酶(ZFN)或RNA引导的核酸内切酶。。
微生物(例如细菌)基因组中基因的存在或缺失可以通过熟知的方法检测,包括PCR、Southern印迹等。此外,可以通过使用各种熟知的方法(包括Northern印迹、定量RT-PCR等)测量从基因转录的mRNA的量来估计基因表达的水平。基因编码的蛋白质的量可以通过熟知的方法来测量,包括SDS-PAGE,然后是免疫印迹分析(蛋白质印迹分析)等。
基因的“表达水平增加”是指与不携带所述修饰的其他相同微生物相比,转录产物的量,相应地由基因工程化微生物产生的所述基因编码的多肽的量增加。更具体地,基因的“表达水平增加”是指与不携带所述修饰的其他相同微生物相比,转录产物的量,相应地由基因工程微生物产生的所述基因编码的多肽的量增加了至少10%,例如至少20%、至少30%、至少40%、至少50%至少60%、至少70%、至少80%、至少90%、至少100%、至少150%、至少200%、至少300%、至少400%、至少500%、至少600%、至少700%至少800%、至少约900%、至少约1000%、至少约2000%、至少约3000%、至少约4000%、至少约5000%、至少约6000%、至少约7000%、至少约8000%至少约9000%或至少约10000%。基因的表达水平可以通过熟知的方法来确定,包括PCR、Southern印迹等。此外,可以通过使用各种熟知的方法(包括Northern印迹、定量RT-PCR等)测量从基因转录的mRNA的量来估计基因表达的水平。基因编码的多肽的量可以通过熟知的方法测量,包括ELISA、免疫组织化学或蛋白免疫印迹等。
多肽的“表达水平增加”是指与不携带所述修饰的其他相同微生物相比,由基因工程化微生物产生的所述多肽的量增加。更具体地,多肽的“表达水平增加”是指与不携带所述修饰的其他相同微生物相比,由基因工程微生物产生的所述多肽的量增加了至少10%,例如至少20%、至少30%、至少40%、至少50%至少60%、至少70%、至少80%、至少90%、至少100%、至少150%、至少200%、至少300%、至少400%、至少500%、至少600%、至少700%至少800%、至少约900%、至少约1000%、至少约2000%、至少约3000%、至少约4000%、至少约5000%、至少约6000%、至少约7000%、至少约8000%至少约9000%或至少约10000%。给定细胞中产生的多肽的量可以通过本领域已知的任何合适的定量技术来确定,例如ELISA、免疫组织化学或Western印迹。
多肽表达的增加可以通过本领域技术人员熟知的任何合适的手段实现。例如,多肽表达的增加可以通过增加微生物中编码多肽的一种或多种基因的拷贝数来实现,例如通过将外源核酸(例如载体)引入微生物中,所述外源核酸包含编码多肽的一种或多种基因,所述多肽可操作地连接至在微生物中起作用的启动子以引起mRNA分子的产生。多肽表达的增加也可以通过将编码多肽的一种或多种基因的至少第二拷贝整合到微生物基因组中来实现。多肽表达的增加也可以通过增加与编码多肽的一种或多种基因可操作地连接的启动子(多个)的强度来实现。多肽表达的增加也可以通过修饰编码多肽的mRNA分子上的核糖体结合位点来实现。通过修改核糖体结合位点的序列,可以提高翻译起始速率,从而提高翻译效率。
如本文所用,多肽(例如具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的多肽或具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的多肽)的表达的“降低的(decreased)”、“降低了(decreasing)”或“降低(decrease of)”是指与不携带所述修饰的其他相同微生物(对照)中所述多肽的表达相比,所述多肽在修饰的微生物中的表达减少。与不携带所述修饰的其他相同微生物(对照)中所述多肽的表达相比,多肽在修饰的微生物中的表达可降低至少约10%,优选降低至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%或100%、或10%至100%之间全部整数表示的任何百分比(例如,6%、7%、8%等)。更具体地,与不携带所述修饰的其他相同微生物(对照)中所述多肽的量相比,多肽表达的“降低的(decreased)”、“降低了(decreasing)”或“降低(decrease of)是指微生物中多肽的量减少了至少约10%,且优选减少了至少约20%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%或100%、或10%至100%之间全部整数表示的任何百分比(例如,6%、7%、8%等)。多肽在微生物中的表达或量可以通过本领域已知的任何合适的方法来确定,包括诸如ELISA、免疫组织化学、蛋白免疫印迹或流式细胞术的技术。
如本文所用,多肽(例如具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的多肽或具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的多肽)活性的“降低的(decreased)”、“降低了(decreasing)”或“降低(decrease of)是指与在不携带所述修饰(对照)的其他相同微生物中的所述多肽催化活性相比,修饰的微生物中所述多肽的催化活性降低。与不携带所述修饰的其他相同微生物(对照)中所述多肽的表达相比,修饰的微生物中多肽的活性可降低至少约10%,且优选降低了至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%或100%、或10%至100%之间全部整数表示的任何百分比(例如,6%、7%、8%等)。微生物中多肽的活性可以通过任何合适的蛋白质和酶活性测定法来确定。
如本文所用,基因的“调控区”是指影响编码序列表达的核酸序列。调控区是本领域已知的,包括但不限于启动子、增强子、转录终止子、聚腺苷酸化位点、基质连接区和/或调节编码序列表达的其他元件。
如本文所用,“表达”包括多肽(例如编码酶)产生中涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
“取代(Substitution)”或“取代的(substituted)”是指通过用另一个氨基酸残基替换一个氨基酸残基来修饰多肽,例如,在多肽序列中用甘氨酸或丙氨酸残基替换丝氨酸残基是氨基酸取代。当与多核苷酸一起使用时,“取代(Substitution)”或“取代的(substituted)”是指通过用另一个核苷酸替换一个核苷酸来修饰多核苷酸。例如,在多核苷酸序列中用胸腺嘧啶替换胞嘧啶是核苷酸取代。
“非保守取代”,当与多肽一起使用时,是指用具有显著不同侧链性质的氨基酸取代多肽中的氨基酸。非保守取代可使用在所定义的基团之间而不是在所定义基团内的氨基酸,并影响(a)取代区域中肽骨架的结构(例如,丝氨酸取代甘氨酸),(b)电荷或疏水性,或(c)侧链的体积。作为示例而非限制,示例性非保守取代可以是用碱性或脂肪族氨基酸取代的酸性氨基酸;被小氨基酸取代的芳香族氨基酸;和被疏水性氨基酸取代的亲水性氨基酸。
“序列同一性百分比”、“%序列同一性”和“%同一性”在本文中用于指氨基酸序列和参考氨基酸序列之间的比较。如本文所用,“%序列同一性”是根据以下两个氨基酸序列计算得出的:使用Genetic Computing Group's GAP(全球比对程序)第9版,使用默认BLOSUM62矩阵对序列进行比对,其中间隙开放罚分为-12(针对间隙的第一个空值),间隙扩展罚分为-4(针对间隙中的每个额外空值)。在比对后,通过将匹配数表示为参考氨基酸序列中氨基酸数的百分比来计算百分比同一性。
如果此处规定了数值限制或范围,则包括端点。此外,数字限制或范围内的所有值和子范围都被明确地包括在内,就像明确地写出来一样。
已经概括地描述了本发明,可以通过参考某些特定实施例来获得进一步的理解,本文提供的特定实施例仅用于说明的目的,并且除非另有规定,否则不旨在是限制性的。
实施例
实施例1:枯草芽孢杆菌(Bacillus subtilis)基因组中叶酸盐生物合成基因的鉴定
叶酸盐生物合成途径中涉及的基因和酶在文献中已知,并在KEGG数据库(www.genome.jp/kegg/pathway.html)中详细描述。通过使用BLAST算法研究枯草芽孢杆菌(B.subtilis)的基因组和蛋白质数据库,获得了枯草芽孢杆菌(B.subtilis)关键叶酸盐生物合成基因的核苷酸和蛋白质序列。叶酸盐生物合成基因和酶的序列作为“查询”导入,相应的枯草芽孢杆菌(B.subtilis)序列被鉴定为“命中”。叶酸盐生物合成基因的序列示出于下表2。
表2.枯草芽孢杆菌(B.subtilis)中叶酸盐生物合成相关的基因和酶。
Figure BDA0004048528550000501
Figure BDA0004048528550000511
实施例2:针对枯草芽孢杆菌(Bacillus subtilis)优化的叶酸生物合成的合成基因的合成
氨基酸序列(SEQ ID NO:7、8、9、10、12、79、81和83)用于基因密码子优化(来自IDT集成DNA技术(IDT Integrated DNA Technologies)的密码子优化工具),以改善枯草芽孢杆菌(B.subtilis)中的蛋白质表达。设计合成的DNA片段(分别地SEQ ID NO:13、14、15、16、17、91、92和93),其中添加了RBS序列、用于基因过表达的调控启动子序列(例如p15 SEQ IDNO:38)和用于进一步组装叶酸操纵子表达盒所需的在两端的短衔接子(adapter)序列。
实施例3:叶酸操纵子的组装
·由枯草芽孢杆菌(Bacillus subtilis)基因组装的叶酸操纵子
来自枯草芽孢杆菌基因的关键叶酸盐生物合成基因(合成为DNA片段(SEQ ID NO:13、14、15、16和17))用于叶酸操纵子(FOL-OP-BS2)的组装。为了将叶酸操纵子整合到枯草芽孢杆菌基因组中,设计和合成另外两个具有lacA同源物和红霉素选择性标记物的DNA片段(SEQ ID NO:18和19)用于稳定的基因组整合。
在叶酸操纵子组装的第一步中,使用特定的引物组进行分离DNA片段的PCR扩增(片段SEQ ID NO:13的引物对为SEQ ID NO:26和SEQ ID NO:27;片段SEQ ID NO:17的引物对为SEQ ID NO:32和SEQ ID NO:28;片段SEQ ID NO:15的引物对为SEQ ID NO:33和SEQ IDNO:29;片段SEQ ID NO:16的引物对为SEQ ID NO:34和SEQ ID NO:30;片段SEQ ID NO:14的引物对为SEQ ID NO:35和SEQ ID NO:31)。
使用Eppendorf循环仪和Phusion聚合酶(Thermo Fisher)扩增片段,使用制造商提供的缓冲液,添加200μM的dNTP、5%DMSO、0.5μM的每种引物和约20ng的模板,最终体积为50μl,持续32个循环。
使用的程序:98℃2分钟
32个循环为(98℃30秒,65℃15秒,72℃30秒)
72℃5分钟
10℃保持
每个片段的PCR在0.8%琼脂糖凝胶上进行,并根据Wizard PCR清洗试剂盒(Promega)提供的方案从凝胶中清洗。通过重复的限制性酶切和连接步骤将这些片段组装成人工叶酸盐操纵子。使用NdeI和AseI限制性酶切位点的组合,以确保成功连接的限制性酶切末端兼容。每一步连接完成后,结合后的片段作为下一次PCR扩增的新模板来使用。限制性酶切在50μl的添加了5μl的FD绿色缓冲液,3μl的所选酶和约1500ng的PCR片段的体积中进行。限制性酶切后用Wizard SV凝胶和PCR净化系统清洗片段,前两个用于连接。我们使用2,5U T4 DNA连接酶(Thermo Fisher)和制造商提供的缓冲液,并添加5%的PEG 4000和摩尔比为1:1的两个片段,达到最终体积为15μl。在接下来的步骤中,用1μl失活连接物作为模板,在新鲜50μl PCR中使用引物SEQ ID NO:26和SEQ ID NO:28和相同的程序(更长延伸时间),混合(如上所使用的)。PCR在0.8%琼脂糖凝胶上进行,从凝胶中切除片段并清洗。清洗后的新片段(SEQ ID NO:13和SEQ ID NO:17的组件)用Asel限制性酶切割,并在额外清洗后与已经用Ndel切割并且然后清洗的第三片段(SEQ ID NO:15)连接使用。在作为模板的连接物上进行新的PCR后,我们还按照相同的方案添加了片段4和5,以制备最多达5个叶酸盐生物合成基因的片段。
在进行总叶酸盐的培养测量(参见实施例12)后,使用由枯草芽孢杆菌基因组装的构建叶酸操纵子(如图4所示)进行转化(参见实施例5),以产生菌株FL722。
●来自乳酸乳球菌乳酸亚种基因的叶酸操纵子
来自乳酸乳球菌乳酸亚种操纵子FOL-OP-LL(SEQ ID NO:49)的异源基因(folA、clpX、ysxL、folB、folE、folP、ylgG和folC),通过PCR扩增并将分离的基因组DNA用作模板。用于PCR扩增的引物被设计用于两个单独的PCR反应,其中在第一个PCR反应中,引物(SEQID NO:45和SEQ ID NO:46)用于特异性扩增基因组DNA中的基因,在第二个PCR反应中,引物(SEQ ID NO:47和SEQ ID NO:48)用于在操纵子的两端另外引入限制性位点(NheI和NotI)。将PCR产物亚克隆到低拷贝载体pFOL1中并在FOL-OP-LL操纵子开始处加入强组成型启动子P15(SEQ ID NO:38)。为了构建FOL-OP-LL操纵子的整合盒,引入了氯霉素抗性盒和amyE基因座的下游同源性。在最后一步中,通过使用SbfI限制性酶从克隆载体中实现整合盒,并用于自连接以实现多拷贝基因组整合。由乳酸乳球菌乳酸亚种基因组装而成的构建型叶酸操纵子(如图2所示)在进行总叶酸盐的培养测量后用于转化以产生菌株FL84(参见实施例12)。
·由枯草芽孢杆菌基因组装的叶酸操纵子FOL-OP-BS1
从合成技术的两个单独的DNA片段(BS-FOLOP1-COMB和BS-FOLOP2-COMB,SEQ IDNO:77和78)进行FOL-OP-BS1(人工叶酸盐操纵子)的组装。将合成的DNA片段BS-FOLOP2-COMB克隆到带有卡那霉素抗性盒和amyE基因座下游同源性的低拷贝数质粒中。在构建FOL-OP-BS1整合盒的最后一步中,使用Gibson组装方案用特别设计的用于扩增BS-FOLOP1-COMB(部分A)的引物对(SEQ ID NO:87和88)和用于扩增BS-FOLOP2-COMB+KnR+amyE-HOM(部分B)的引物对(SEQ ID NO 89和90)在体外进行组装。叶酸盐生物合成的操纵子FOL-OP-BS1在强组成型启动子Pveg和卡那霉素抗性盒(作为选择性标记物)的表达下(图16)。将组装的整合盒FOL-OP-BS1进行PCR扩增,并进一步用于自连接,以使多拷贝基因组在amyE位点整合到枯草芽孢杆菌基因组中。
·来自棉阿舒囊霉(Ashbya gossypii)(Eremothecium gossypii)基因的叶酸操纵子
使用两个合成叶酸盐生物合成基因fol1-AG(SEQ ID NO:50)和fol2-AG(SEQ IDNO:51)构建了来自棉阿舒囊霉(Ashbya gossypii)(Eremothecium gosspii)的表达盒(FOL-OP-AG),它是一种已知的产生B2维生素的丝状真菌。对基因进行密码子优化以获得枯草芽孢杆菌(B.subtilis)最佳表达,并合成为两个单独的DNA片段FOL1-AG(SEQ ID NO:52)和FOL2-AG(SEQ ID NO:53),其中引入了额外的调控启动子序列(启动子P15)。首先使用氯霉素抗性盒下游的SpeI/BamHI限制性位点和强组成型启动子P15将FOL1-AG片段亚克隆到低拷贝载体pFOL1中。在第二步中,使用EcoRV限制性位点将FOL2-AG片段亚克隆到amyE基因座同源性上游的低拷贝载体pFOL2中。在下一步中,使用引物(SEQ ID NO:54和SEQ ID NO:55)PCR扩增含有P15-fol2-AG和amyE同源性的DNA片段,并使用BamHI限制性位点克隆到氯霉素抗性盒下游的质粒pFOL1和P15-fol1-AG中。在最后一步中,使用引物(SEQ ID NO:56和SEQID NO:57)对组装的整合盒FOL-OP-AG进行PCR扩增,并将PCR产物用于细胞的转化。在进行总叶酸盐的培养测量后,使用由棉阿舒囊霉(Ashbya gossypii)基因组装的构建型叶酸操纵子(如图3所示)进行转化,以产生菌株FL260(参见实施例12)。
实施例4:用于folC替换的基因构建体的组装
为了使用变体替换能够将多个谷氨酸残基附接到叶酸盐上的天然叶酰聚谷氨酸盐合成酶(folC),该变体仅能够附接叶酸盐生物合成中的第一个谷氨酸残基(本申请所述)来生成相应的基因构建体。通过使用通过PCR从gDNA枯草芽孢杆菌(B.subtilis)VBB38中扩增的folC同源端,通过使用相应的引物对SEQ ID NO:43和SEQ ID NO:44组装folC破坏盒。使用Phusion聚合酶(Thermo Fisher)和制造商提供的缓冲液制作PCR混合物,该缓冲液中添加5%的DMSO、200μM的dNTP和0.5μM的每种引物至50μL的最终体积,持续32个循环(退火温度65℃,延伸时间2分钟)。从0.8%琼脂糖凝胶中切除扩增的PCR片段,用Wizard凝胶和PCR清理系统试剂盒清洗,并用制造商提供的缓冲液A中的T4聚核苷酸激酶(ThermoFisher)磷酸化,并添加1mM ATP。
将制备的片段连接在低拷贝质粒pET-29c(Novagen)中,该质粒先前用FspAl和Xhol切割,用DNA聚合酶l、大(Klenow)片段(Thermo Fisher)钝化末端,并用FastAP热敏碱性磷酸酶(Thermo Fisher)去磷酸化。
使用四环素抗性盒(SEQ ID NO:21)来破坏folC基因序列。通过用Bsp119l限制性酶切割质粒,用DNA聚合酶l、大(Klenow)片段(Thermo Fisher)钝化末端,使用FastAP去磷酸化,并使用T4 DNA连接酶(Thermo Fisher))连接,将四环素抗性盒插入folC序列。
此外,来自罗伊氏乳杆菌(Lactobacillus reuteri)(folC2LR)(SEQ ID NO:22)和来自棉阿舒囊霉(Ashbya gossypii)(folC2AG)(SEQ ID NO:23)的异源folC2蛋白序列用于设计用于folC2-LR(罗伊氏乳菌)(SEQ ID NO:24)的密码子优化的DNA序列和用于folC2-AG(棉阿舒囊霉)(SEQ ID NO:25)异源基因表达。合成了DNA片段(IDT整合DNA技术),并用于构建两个整合盒(如图5所示)。首先,我们使用DNA聚合酶l,大(Klenow)片段(Thermo Fisher)产生含有Pveg启动子(SEQ ID NO:37)的钝化末端片段,并将其与folC同源性连接在质粒中,之前用Xbal切割并用DNA聚合酶l、大(Klenow)片段(Thermo Fisher)钝化末端。
接下来,用Bcul和FspAl限制性酶切割新构建的质粒,并使用FastAP去磷酸化。之后,将质粒与folC2-LR中的顺序优化序列folC2-AG连接,之前用Bcul和FspAl限制性酶切割。在该质粒中,之前用EcoRl限制酶切割并钝化末端的四环素抗性,在用FspAl限制性酶切质粒后连接并去磷酸化。将构建的质粒用作PCR引物SEQ ID NO:43和SEQ ID NO:14的模板,以产生folC破坏/替换盒用于转化。
实施例5:叶酸操纵子构建体的组装用于转化
在叶酸操纵子组装后(参见实施例3),用Xbal限制酶进一步切割具有叶酸盐生物合成基因的DNA片段,并用引物SEQ ID NO:40和SEQ ID NO:41(62℃,40秒)与红霉素抗性盒(SEQ ID NO:19)的合成DNA片段连接,并用XbaI切割,以确保用于连接的相容的DNA末端。连接后,用引物(SEQ ID NO:36和SEQ ID NO:39)进行整个片段的PCR扩增。
在组装片段(SEQ ID NO:18)的最后步骤中,添加了lacA同源性和调控启动子区。用Spel限制酶切割片段并用于连接。连接混合物用作具有引物(SEQ ID NO:42和SEQ IDNO:39)的PCR模板,用其完成人工叶酸盐操纵子的组装(如图4所示)作为表达盒(SEQ IDNO:20)用于将基因组转化到枯草芽孢杆菌(B.subtilis)菌株中。
实施例6:叶酸盐生产工程化的可能的枯草芽孢杆菌(Bacillus subtilis)宿主菌株的选择
不同的芽孢杆菌(Bacillus)菌株可用作叶酸盐生产工程化的起始菌株(表3)。芽孢杆菌(Bacillus)菌株可以从自然界中分离或从培养物保藏单位中获得。其中,用于叶酸盐生产的起始菌株可以从枯草芽孢杆菌(Bacillus subtilis)菌株中选择,这些菌株已经过经典的诱变和选择,以过量生产与嘌呤生物合成途径相关的代谢产物。例如,可以选择过量生产核黄素、肌苷和鸟苷的菌株。优选进行随机诱变和对嘌呤和核黄素途径的毒性代谢抑制剂的菌株,并包括在表3中。
表3.可能用于开发叶酸盐生产的枯草芽孢杆菌(B.subtilis)的潜在非GMO起始菌株。
Figure BDA0004048528550000561
Figure BDA0004048528550000571
Figure BDA0004048528550000581
VKPM B2116菌株是枯草芽孢杆菌(B.subtilis)168菌株(最常见的枯草芽孢杆菌宿主菌株,基因组为约4Mbp)与来自枯草芽孢杆菌W23的DNA的6.4kbp的岛的杂交菌株。这种结构在大多数枯草芽孢杆菌工业菌株中是常见的,并且通过用W23(原养型TrpC+)DNA转化168菌株(色氨酸营养缺陷型trpC-)获得。它在基因组中具有6.4kbp的W23岛,这与常用菌株枯草芽孢杆(B.subtilis)SMY相同,该菌株是具有公开基因组的枯草芽孢菌传统菌株之一(Ziegler等人,The origins of 168,W23 and other Bacillus subtilis legacystrains,Journal of Bacteriology,2008,21,6983–6995)。VKPM B2116菌株是通过经典诱变和选择获得的SMY菌株的直接后代。该菌株的另一个名称是枯草芽孢杆菌VNII Genetika304。1980年提交的苏联专利SU908092中描述了该菌株的构造说明。通过随后的诱变和对代谢抑制剂的选择获得突变。由于编码核黄素激酶的ribC基因突变,菌株VKPM B2116对维生素B2的毒性类似物玫瑰黄色素具有抗性。该菌株对嘌呤碱的毒性类似物8-氮杂鸟嘌呤也有抗性。
实施例7:用于叶酸生产的folC的替换和最佳宿主菌株的产生
在构建异源folC2(folC2 AG或folC2 LR)基因表达盒(参见实施例4和图5)后,我们对枯草芽孢杆菌(B.subtilis)VBB38和枯草芽孢杆菌(B.subtilis)VBB38Δrib进行了转化。利用引物SEQ ID NO:43和SEQ ID NO:44PCR扩增针对天然folC基因破坏具有同源性的表达盒。在转化后,选择耐四环素的菌落,并用cPCR和获得的PCR产物的测序对由异源folC2基因(棉蚜(A.gossypii)或罗伊氏杆菌(L.reuteri))替代的天然folC基因进行遗传确认。使用新菌株测试总叶酸盐的产量(见图11),并比较上清液和细胞生物质之间总叶酸盐的分布。
实施例8:枯草芽孢杆菌(Bacillus subtilis)的转化
i)枯草芽孢杆菌自然感受态转化
从枯草芽孢杆菌的新鲜平板接种10mL的SpC培养基并培养过夜。将1,3mL的过夜培养物稀释成10mL的新鲜SpC培养基(9倍稀释)。测量OD450,预计为约0.5。培养物在37℃下220RPM下生长3小时10分钟。再次测量OD450,预计为约1.2-1.6。培养物用SpII(饥饿培养基)1:1稀释。将3,5ml的培养基与3.5ml的饥饿培养基混合,加入浓度为50ug/ml的色氨酸。培养物在37℃下220RPM下再生长2小时。孵育后,培养物最大的感受态为1小时。将500uL的感受态细胞与DNA(5-20uL,取决于浓度)混合在2mL的Eppendorf管中,在37℃下摇晃孵育30分钟。加入300uL新鲜LB以恢复感受态细胞,并在37℃下再孵育30分钟。Eppendorf管在3000RPM下离心5分钟。颗粒重悬,并在LB板上铺板,使用适当的抗生素。
培养基:
10x T-碱
150mM硫酸铵
800mM K2HPO4
440mM KH2PO4
35mM柠檬酸钠
SpC(最小培养基)
100mL 1x T-碱
1mL 50%葡萄糖
1.5mL1,2% MgSO4
2ml 10%酵母提取物
2.5ml 1%酪蛋白氨基酸
SpII(饥饿培养基)
100ml 1x T-碱
1ml 50%葡萄糖
7ml 1,2% MgSO4
1ml 10%酵母提取物
1ml 1%酪蛋白氨基酸
0.5ml 100mM CaCl2
实施例9:使用qPCR测定叶酸盐操纵子拷贝数
我们使用实时定量PCR(qPCR)技术测定整合的枯草芽孢杆菌人工叶酸盐操纵子基因的拷贝数。在生产叶酸盐的枯草芽孢杆菌转化体中,通过SYBR Green I检测(qPCR)估算了人工叶酸盐操纵子中基因folP、folK、folE、dfrA和KnR(卡那霉素抗性基因)的拷贝数。通过qPCR定量了卡那霉素抗性基因(KnR)的拷贝数和叶酸盐生物合成基因folP、folK、folE、dfrA在人工枯草芽孢杆菌叶酸盐操纵子上的拷贝数。用SW Wizard基因组DNA纯化试剂盒(Promega)分离枯草芽孢杆菌菌株的基因组DNA。在OD260和OD280处用分光光度法评估gDNA的浓度和纯度。所有实验中使用的gDNA的量等于参考菌株的gDNA量。使用具有含有基因folP、folK、folE、dfrA和KnR的单拷贝人工叶酸盐操纵子的枯草芽孢杆菌作为基因拷贝数相对定量的参考菌株。管家基因DxS是枯草芽孢杆菌基因组中的一个单拷贝基因,用作内源性对照基因。叶酸盐生物合成基因的基因拷贝数的定量是使用一组特定的引物(对于folP基因的引物对SEQ ID NO:59和SEQ ID NO:60,对于folK基因的引物对SEQ ID NO:61和SEQID NO:62,对于folE基因的引物对SEQ ID NO:63和SEQ ID NO:64,对于dfrA基因的引物对SEQ ID NO:65和SEQ ID NO:66)进行,用于定量附接于叶酸盐操纵子的卡那霉素抗性标记物(引物对SEQ ID NO:67和SEQ ID NO:68)并且对于参考DxS基因使用引物对SEQ ID NO:71和SEQ ID NO:72。qPCR分析在StepOneTM实时PCR系统上运行,并使用2-ΔΔCT方法进行定量。
相对于具有一个基因拷贝的菌株,对人工BS-FOL-OP菌株中基因的基因拷贝数进行量化。具有一个拷贝数的枯草芽孢杆菌菌株的KnR基因用作参考菌株,用于相对定量枯草芽孢杆菌转化菌株中人工叶酸盐操纵子中基因的基因拷贝数。与具有单拷贝基因的枯草芽孢杆菌菌株相比,基因folP、folK、folE、dfrA和KnR基因的qPCR相对定量显示RQ值增加了6倍。叶酸盐过量产生菌株FL179和FL722被证实具有叶酸合成操纵子的多拷贝整合。
实施例10:枯草芽孢杆菌(Bacillus subtilis)菌株的培养
从冷冻的冷冻瓶制备系列稀释液,使用适当的抗生素铺板在MB板上,并在37℃下孵育约48小时。为了进一步测试,每个菌株使用至少10-20个来自MB平板的单菌落。首先将10-20个单菌落重新贴在新鲜MB平板上(使用相同浓度的抗生素)进行测试。
对于营养阶段(vegetative stage),使用MC培养基,并用每个falcon管1个塞子(或每个带挡板Erlenmeyer烧瓶5个塞子或用于微量滴定板的一小部分贴片)接种。在培养基中加入适当的抗生素。对于微量滴定板,在96深孔中使用500ul培养基,对于falcon管,使用5ml的培养基(在50ml的falcon管中),并且对于Erlenmeyer烧瓶,使用25ml(在250ml的烧瓶中)。培养物在37℃、220RPM下孵育18-20小时。
在营养培养基(vegetative medium)中18-20小时后接种到生产培养基(MD)中。使用10%的接种物(对于MW为50ul,对于falcon管为0.5ml,Erlenmeyer烧瓶为2.5ml)。每个菌株在两个等分试样中进行测试。对于微量滴定板,在48深孔中使用500ul培养基,对于falcon管,使用5ml培养基,而对于带挡板的Erlenmeyer烧瓶,使用25ml培养基。为了更好地通风,falcon管中使用了金属丝,Erlenmeyer烧瓶上使用的是纱布(gauze)而不是终止器(stopper)。培养物在37℃、220RPM下孵育48小时。在24和48小时后,根据开发的程序,使用微生物测定法测定总叶酸盐的滴度。
最佳候选菌株以相同的方式重新测试,并在多次确认后准备用于在生物反应器中测试。将100ul的用于生物反应器测试的选定菌株的冷冻培养物用适当的抗生素散布在MB板上,并在37℃下孵育约48小时。每个平板用2ml的无菌20%甘油收集完整的生物质。收集的生物质分为100ul等分试样,并在-80℃下冷冻。这被用作用于生物反应器测试的工作细胞库。
培养基组成:
1)MB(平板)
胰蛋白胨10g/l
酵母提取物5g/l
NaCl 5g/l
麦芽糖20g/l
琼脂20g/l
pH 7.2-7.4
高压灭菌30分钟,121℃
在高压灭菌和冷却后,加入适当的抗生素。
2)MC(营养培养基)
糖蜜20g/l
CSL 20g/l
酵母提取物5g/l
MgSO4*7H2O 0.5g/l
(NH4)2SO4 5g/l
将成分混合在一起,并将pH值设置为7.2-7.4。然后加入KH2PO4-K2HPO4溶液,KH2PO4的最终浓度为1.5g/l,K2HPO4的最终浓度为3.5g/l。将培养基分配到falcon管(5ml/50ml-falcon管)或Erlenmeyer烧瓶(25ml/250ml带挡板Erlenmeyer烧瓶)中,并在121℃下高压灭菌30分钟。高压灭菌后加入最终浓度为7,5g/l的无菌葡萄糖。在接种前添加抗生素。
3)MD(生产培养基)
酵母20g/l
玉米浆(corn steep liquor)(CSL)5g/l
MgSO4*7H2O 0.5g/l
对氨基苯甲酸(pABA)0.5g/L
将成分混合在一起,并将pH值设置为7.2-7.4。然后添加KH2PO4-K2HPO4溶液,其中KH2PO4的最终浓度为1.5g/l且K2HPO4的最终浓度为3.5g/l。将培养基在121℃下高压灭菌30分钟。在高压灭菌后加入无菌尿素溶液(20ml储备溶液,最终浓度为6g/L)、无菌葡萄糖溶液(250ml储备溶液、最终浓度为100g/l葡萄糖),无菌pABA溶液(100ml储备溶液,最终浓度为0.5g/L)和150ml无菌水,以获得1L的MD+pABA500培养基。接种前添加适当的抗生素。然后将培养基分配到无菌Erlenmeyer烧瓶(25ml/250ml带挡板Erlenmeyer烧瓶)中。
实施例11:用于定量发酵肉汤中总叶酸盐的微生物学测定法
使用海氏肠球菌(Enterococcus hirae)NRRL B-1295的微生物测定法用于检测枯草芽孢杆菌(Bacillus subtilis)菌株中产生的总叶酸盐。微生物测定用于评估枯草芽孢杆菌(B.subtilis)产生的细胞内(保留在生物质中)和细胞外(释放到培养基中)的总叶酸盐。对于微生物测定法,使用指示生物海氏肠球菌(Enterococcus hirae)NRRL B-1295,其对于叶酸盐和叶酸(folates或folic acid)是营养缺陷型的。海氏肠球菌(E.hirae)在含叶酸盐(乳酸杆菌(Lactobacilli)AOAC肉汤)的富生长培养基中在37℃下预培养18-24小时。然后将其在不含叶酸盐的生长培养基(叶酸测定培养基)中洗涤,以去除残留的叶酸盐。将洗涤的海氏肠球菌(E.hirae)培养物接种到不含叶酸的测定培养基中。在96孔微量滴定板中建立微生物测定。将待分析测定的适当稀释培养基样品和叶酸标准溶液添加到含有指示菌株的生长培养基中,并将板在37℃下孵育20小时。指示生物的生长反应与培养基样品/对照中存在的叶酸(folic acid)/叶酸盐(folates)的量成比例。通过向生长培养基和指示菌株中添加一组叶酸标准溶液,为每个测定构建标准曲线。通过测量600nm波长下的光密度(OD)来测量生长。将海氏肠球菌(E.hirae)对测试样品的生长反应与已知标准溶液的生长反应进行定量比较。如上所述制备并分析含有各种浓度叶酸的稀释系列。通过绘制已知叶酸浓度下测量的OD600,获得标准曲线。标准曲线用于计算测试样品中叶酸盐总量。指示生物海氏肠球菌(E.hirae)NRRL B-1295用于检测测量样品中总叶酸盐的浓度,范围为0.05至0.7ng/mL。枯草芽孢杆菌(B.subtilis)菌株产生的细胞外和细胞内叶酸盐总量可通过向叶酸测定培养基中的指示生物海氏肠球菌(E.hirae)添加适当稀释的测试样品来估算。
实施例12:不同起始菌株和初始folC替代和叶酸操纵子扩增菌株的总叶酸盐产量分析
在摇床规模(5ml生产培养基MD)上,对其中folC基因被来自棉蚜(A.gossypii)(枯草芽孢杆菌(B.subtilis)菌株FL21)或罗伊氏乳杆菌(L.reuteri)(枯草芽孢菌(B.subtilis)菌株FL23)的异源folC2基因替换的转化体和具有扩增的叶酸操纵子的转化体进行叶酸盐总量测试。在发酵后,仔细收集发酵肉汤(200μl)的样品以获得均匀的样品,并在冰冷提取缓冲液(0.1M磷酸盐缓冲液,含1%(w/v)抗坏血酸)中稀释10倍。将样品在14,000rpm和4℃下离心10分钟,并过滤灭菌(0.22μm孔径)。对于微生物测定,样品在提取缓冲液中连续稀释,并保持在4℃,直到建立微生物测定。表4中给出了通过微生物测定法测定的选定菌株的结果。
表4.在摇床规模(5ml)的实验中不同枯草芽孢杆菌菌株的叶酸盐总产量。
Figure BDA0004048528550000631
Figure BDA0004048528550000641
实施例13:使用LC-MS测定叶酸盐形式和相关化合物的浓度,并鉴定作为两种主要产物的10-甲酰基二氢叶酸和10-甲酰基叶酸
除微生物测定外,我们的目标是开发灵敏、通用的分析方法,并且分析运行时间相当短。该方法必须是与挥发性流动相兼容的LCMS,并且必须能够进行紫外检测,并对尽可能多的叶酸盐相关分析物进行良好的色谱分离。
仪器和材料:
该方法是在Thermo Accela 1250HPLC仪器上开发的,该仪器配有PDA检测器,并与MS/MS容量质谱仪Thermo TSQ Quantum Access MAX偶联,配备hESI源。方法已在ThermoAcclaim RSLC PA2,150x2.1 mm HPLC柱(粒径2.2μm)上建立。PDA检测器设置在282nm,带宽为9nm,扫描速率为80Hz,DAD扫描范围为200-800nm。柱式烘箱设置为60℃,托盘冷却温度设置为12℃。注射溶剂为10%甲醇的水溶液,清洗和冲洗体积:2000μl。注射体积设置在10μl,当预计分析物浓度较高时,也可设置在1μl。流动相A为650mM乙酸的水溶液,流动相B为甲醇。流动相流量为0.5ml/min,总运行时间为20分钟。方法使用表5中的梯度程序和表6中描述的MS光谱仪参数。
表5.色谱分析的梯度程序
时间/分钟 %A %B
0.00 100 0
2.00 100 0
16.00 82 18
16.01 100 0
20.00 100 0
表6.MS光谱仪调谐参数和其他MS/MS相关参数。
Figure BDA0004048528550000651
Figure BDA0004048528550000661
LCMS检测器耦合在DAD检测器之后,并且在400-600m/z模式下、在其M.W.+1的SIM模式下和MS/MS模式下,在扫描中观察分析物(表6)。通过称量并溶解在0.1M NaOH溶液中制备标准品(表7和表8),并立即放入HPLC仪器。
表7.可用标准品.
分析物: 纯度: 来源: 缩写:
叶酸 91.3% 药典 FA
二氢叶酸 80.0% Sigma DHF
四氢叶酸盐 65.5% Sigma THF
5-甲基四氢叶酸盐 81.0% Carbosynth 5M-THF、5-甲基THF
10-甲酰基叶酸 91.4% EDQM 10F-FA、10-甲酰基FA
5-甲酰基四氢叶酸盐 90.0% EDQM 5F-THF、5-甲酰基THF
表8.观察到的标准品及其相关的MS/MS方法设置。
Figure BDA0004048528550000662
Figure BDA0004048528550000671
该方法对最高达1000mg/L分析物的MS/MS检测具有线性响应,所有标准品的相关性均高于90%。
实施例14:通过基因修饰的枯草芽孢杆菌(Bacillus subtilis)生产不同比例的叶酸及其衍生物
在摇床规模(5ml生产培养基MD)上,对其中folC基因被来自棉蚜(A.gossypii)(枯草芽孢杆菌(B.subtilis)菌株FL21)或罗伊氏乳杆菌(L.reuteri)(枯草芽孢菌(B.subtilis)菌株FL23)的异源folC2基因替换的转化体和具有扩增的叶酸操纵子的转化体进行叶酸盐总量测试。
将菌株用适当的抗生素贴在MB平板上,并在37℃下孵育2天。对于摇瓶实验,将生长的菌株转移到Falcon 50ml锥形离心管(1个塞子/5ml)中的5ml MC(种子)培养基中,并在220RPM和37℃的旋转摇床上培养16–18小时。使用10%的种子培养物的接种物接种5mL生产培养基(MD+pABA500)。菌株在旋转摇床上以220RPM和37℃在黑暗中培养48小时。在发酵后,仔细收集发酵肉汤(200μl)的样品以获得均匀的样品,并在冰冷提取缓冲液(0.1M磷酸盐缓冲液,含1%(w/v)抗坏血酸)中稀释10倍。将样品在14,000rpm和4℃下离心10分钟,并过滤灭菌(0.22μm孔径)。对于不同叶酸盐物质的定量,如实施例13所述使用HPLC方法。不同枯草芽孢杆菌(B.subtilis)菌株的结果如表9所示,发酵肉汤样品的代表性HPLC色谱图如图6所示。
表9.在摇床规模(5ml)的实验中不同枯草芽孢杆菌菌株的叶酸盐总产量。
Figure BDA0004048528550000672
Figure BDA0004048528550000681
与野生型菌株枯草芽孢杆菌(Bacillus subtilis)168相比,具有异源folC AG和来自枯草芽孢杆菌的过表达叶酸盐生物合成基因的菌株FL179显示10-甲酰基叶酸产量增加了43297%。
实施例15:10-甲酰基二氢叶酸氧化转化为10-甲酰基叶酸
在发酵结束时,肉汤的HPLC分析检测到相对较高量的10-甲酰基二氢叶酸(10F-DHF)(85面积%)。此外,我们观察到10-甲酰基二氢叶酸可以氧化转化为10-甲酰基叶酸(参见图7)。因此,我们开始研发一个方案,该方案将提供定量转化为10-甲酰基叶酸。我们预计随后的脱甲酰化步骤将以最高可能的产率提供叶酸。文献检索揭示了一份报告,描述了通过在特定pH值下在水溶液中的空气对四氢叶酸氧化(Reed1980)。根据该报告,在pH值为4、7和10时,主要的氧化产物是对氨基苯甲酰基谷氨酸(PABG)和6-甲酰基蝶呤。此外,仅在pH=10时检测到7,8-二氢叶酸中间体。我们对发酵肉汤上清液进行了一系列氧化实验,以促进10-甲酰基二氢叶酸快速转化为10-甲酰基叶酸。我们检查了多种氧化试剂,如O2、H2O2和NaIO4(参见图7)。
表10.pH对用氧气将发酵肉汤上清液中10-甲酰基二氢叶酸氧化为10-甲酰基叶酸的影响。
Figure BDA0004048528550000691
使用10mL发酵肉汤上清液在50mL圆底烧瓶中进行实验。用1.0M和0.1M NaOH溶液设定pH值。通过HPLC测定反应进展和结果。HPLC样品在提取缓冲液(0.1M磷酸盐缓冲液和1%(w/v)抗坏血酸)中制备。所有反应在环境温度(25℃)下避光搅拌48小时。
用1M和0.1M的HCl或NaOH调节所需的pH值。较低pH值下的反应较慢,并保持相对较高的叶酸盐总量(表10,条目2-4)。相反,在较高pH值下的反应(表10,条目5-7)提高了10-甲酰基二氢叶酸的消耗,尽管显著降低了叶酸盐的总量。我们预计我们可以使用替代的氧化试剂,如过氧化氢或高碘酸钠。
代表性实验程序:
以4500rpm离心发酵肉汤,倾析上清液。将10mL的发酵肉汤上清液移液到配备有搅拌棒、pH计和用于避光保护的铝箔的50mL圆底烧瓶中。滴加氢氧化钠或盐酸(1.0M和0.1M用于微调)以设定pH值,并在环境温度(25℃)下剧烈搅拌反应24小时。用来自气球的空气吹扫反应混合物。搅拌48小时后,用9mL的提取缓冲液(0.1M磷酸盐缓冲液和1%(w/v)抗坏血酸)将1mL每种发酵肉汤稀释成两份。涡流搅拌悬浮液,以4500rpm离心,通过0.22μm过滤器过滤,并在HPLC上分析。
表11.过氧化氢浓度对发酵肉汤上清液中10-甲酰基二氢叶酸氧化为10-甲酰基叶酸的影响。
Figure BDA0004048528550000701
Figure BDA0004048528550000711
使用10mL的发酵肉汤上清液在50mL圆底烧瓶中进行实验。将过氧化氢作为30%的水溶液滴加。通过HPLC测定反应进展和结果。HPLC样品在提取缓冲液(0.1M磷酸盐缓冲液和1%(w/v)抗坏血酸)中制备。所有反应在环境温度(25℃)下避光搅拌48小时。
加入浓度范围为50-500mg/L的过氧化氢,即用于将10-甲酰基二氢叶酸氧化转化为10-甲酰基叶酸的替代氧化剂,从而提供更完善的结果(表11)。在反应的前24小时,10-甲酰基二氢叶酸的浓度降至其初始值的50%。反应时间延长至48小时提供了良好的转化率,从而保持相对较高的叶酸盐总加和量。
代表性实验程序:
以4500rpm离心发酵肉汤,倾析上清液。将10mL的发酵肉汤上清液移液到配备有搅拌棒、pH计和用于避光保护的铝箔的50mL圆底烧瓶中。以30%的水溶液形式滴加过氧化氢,并在环境温度(25℃)下剧烈搅拌反应混合物24-48小时。搅拌48小时后,用9mL的提取缓冲液(0.1M磷酸盐缓冲液和1%(w/v)抗坏血酸)将1mL每种发酵肉汤稀释成两份。涡流搅拌悬浮液,以4500rpm离心,通过0.22μm过滤器过滤,并在HPLC上分析。
表12.高碘酸钠浓度对发酵肉汤上清液中10-甲酰二氢叶酸氧化为10-甲酰基叶酸的影响。
Figure BDA0004048528550000712
Figure BDA0004048528550000721
使用10mL的发酵肉汤上清液在50mL圆底烧瓶中进行实验。一次性加入高碘酸钠。通过HPLC测定反应进展和结果。HPLC样品在提取缓冲液(0.1M磷酸盐缓冲液和1%(w/v)抗坏血酸)中制备。所有反应在环境温度(25℃)下避光搅拌48小时。
高碘酸钠经常被用作各种基质的选择试剂。我们对该试剂的初步实验表明,氧化转化的有效浓度在1-10g/L之间。高碘酸钠以5g/L和10g/L两种不同浓度加入。在反应的前24小时,10-甲酰基二氢叶酸的浓度从其初始值显著下降(表12)。反应时间延长至48小时提供了优异的转化率,从而保持了相对较高的叶酸盐总加和量。
代表性实验程序:
以4500rpm离心发酵肉汤,倾析上清液。将10mL的发酵肉汤上清液移液到配备有搅拌棒、pH计和用于避光保护的铝箔的50mL圆底烧瓶中。一次性加入高碘酸钠,在环境温度(25℃)下剧烈搅拌反应混合物24小时。搅拌48小时后,用9mL的提取缓冲液(0.1M磷酸盐缓冲液和1%(w/v)抗坏血酸)将1mL每种发酵肉汤稀释成两份。涡流搅拌悬浮液,以4500rpm离心,通过0.22μm过滤器过滤,并在HPLC上分析。
实施例16:5L生物反应器体积中的叶酸盐生产
在生物反应器中,如果使用合适的条件来培养和生产叶酸盐,叶酸盐生产可以大大提高。该过程包括预培养物的制备和主要批量进料生物过程。
i)预培养物的制备
将烧瓶中的预培养基(FOL-MC,表13)接种菌株FL179的工作细胞库,并在37℃和220RPM(2”分批补料(throw))的旋转摇床上培养11-14小时。
ii)分批进料生物过程
使用FOL-ME培养基在5L生物反应器中进行叶酸盐生产(表14)。生物反应器启动参数为搅拌=600RPM,曝气=1vvm,使用氢氧化铵溶液将pH控制在7。用10%的预培养物接种生物反应器。DO由搅拌和气流控制,以保持空气饱和度高于30%。当发酵肉汤中的葡萄糖耗尽时,开始加入葡萄糖和CSL混合物(表15)。需要仔细控制进料添加速率,并将进料速率控制在不会导致乙偶姻(不大于10g/L)累积的水平。如果在发酵肉汤中未检测到乙偶姻,则进料速率太低。发酵肉汤中对氨基苯甲酸(PABA)的浓度需要定期测量,并通过分批进料浓缩PABA储备溶液(50g/L)保持在高于500mg/L。生物过程通常在50小时内完成。叶酸盐生产生物过程概况如图10所示。
表13.FOL-MC预培养物培养基
组分
糖蜜 20g/L
玉米浆(CSL) 20g/L
酵母 5g/L
(NH4)2SO4 5g/L
MgSO4x7H2O 0.5g/L
KH2PO4 1.5g/L
K2HPO4 3.5g/L
葡萄糖 7.5g/L
卡那霉素 10mg/L
四环素 10mg/L
表14.FOL-ME生产培养基
Figure BDA0004048528550000731
Figure BDA0004048528550000741
表15.进料溶液(葡萄糖+CSL)
组分
葡萄糖一水合物 400g/L
玉米浆(CSL) 310g/L
实施例17:用qPCR测定叶酸盐生物合成基因的表达水平
培养物生长条件:枯草芽孢杆菌(B.subtilis)培养物在LB培养基中生长至指数期。将培养物与2体积的RNA保护细菌试剂(QIAGEN)混合,以4500rpm离心10分钟,并在-80℃冷冻或立即处理。将细胞颗粒重新悬浮在含有1mg/mL溶菌酶的200μL的TE缓冲液中15分钟,以去除细胞壁。根据制造商方案,使用QIAGEN Rneasy迷你试剂盒分离RNA。用分光光度法检查获得的RNA的浓度和质量。用DNase(Ambion试剂盒)处理分离的RNA,并使用RevertAid HMinus第一链cDNA合成试剂盒(Thermo Scientific)将其逆转录为cDNA。将获得的cDNA稀释,cDNA的最终产量为约2.5ng/μL。
用SYBR Green I(Thermo Scientific)检测通过qPCR分析(StepOne Real-TimePCR System,Applied Biosystems)分析获得的cDNA。通过实时定量PCR(qPCR)技术对整合的枯草芽孢杆菌(B.subtilis)人工叶酸盐操纵子基因folP、folK、folE、dfrA中叶酸盐操纵子基因的表达进行定量。
使用用作定量qPCR表达数据标准化参考的内部对照基因,使用来自枯草芽孢杆菌的16S rRNA基因。叶酸盐生物合成基因的表达是使用特定的一组引物(对于folP基因的引物对SEQ ID NO:59和SEQ ID NO:60,对于folK基因的引物对SEQ ID NO:61和SEQ ID NO:62,对于folE基因的引物对SEQ ID NO:63和SEQ ID NO:64,对于dfrA基因的引物对SEQ IDNO:65和SEQ ID NO:66)进行测定和对于选作内部对照的16S基因,使用引物对SEQ ID NO:69和SEQ ID NO:70。qPCR分析在StepOneTM实时PCR系统上运行,并使用2-ΔΔCT方法进行定量。
在两个不同的基因组位置(amyE和lacA)携带多拷贝合成叶酸盐操纵子的最佳叶酸盐生产菌株FL722被证实具有最强的叶酸盐生物合成基因的表达水平。
实施例18:10-甲酰基叶酸向叶酸的化学转化
酸介导的脱甲酰化
10-甲酰基叶酸的脱甲酰化在0.01mmol规模(5mg)上进行。在配有搅拌棒的2mL的Eppendorf管中称量10-甲酰基叶酸,并悬浮在蒸馏水中(1mL)。用酸(50当量,0.5mmol)处理悬浮液,并在环境温度下搅拌16小时。随后,用DMSO(800μL)稀释悬浮液(200μL),在涡流搅拌器上均化并在HPLC上分析。表16给出了脱甲酰化的结果。
表16.不同酸对10-甲酰基叶酸的N-脱甲酰化的影响
Figure BDA0004048528550000751
Figure BDA0004048528550000761
所有实验均在2mL的Eppendorf管中使用10-甲酰基叶酸(5mg,0.01mmol)进行。a通过HPLC测量转化率。b n.d.–未检测的。由于分析物可能吸附在Dowex 50WX2树脂上,本实验中未检测到10-甲酰基叶酸也未检测到叶酸。c TFA-三氟乙酸。d TCA–三氯乙酸。e PTSA–对甲苯磺酸。
用强无机酸将10-甲酰基叶酸脱甲酰化几乎定量地转变为叶酸(表16,条目1和8)。可替代地,用更强的有机酸进行脱甲酰化,以几乎相同的效率产生叶酸(表16,条目3、4和6)。正如预期的那样,用甲酸和乙酸进行脱甲酰化不产生转化(表16,条目5和7)。使用Dowex50WX2树脂进行的脱甲酰化HPLC分析没有检测到起始材料或产物,因为分析物可能仍吸附在树脂上,并且需要洗脱。
发酵肉汤中10-甲酰基叶酸的酸介导N-脱甲酰化
在之前的实验中,我们已经说明了使用强酸对10-甲酰基叶酸标准物进行脱甲酰化,提供了如图8所示的清晰转化为叶酸。在这里,我们将相同的原理应用于更复杂的系统,即发酵肉汤。为了继续在生物样品上进行实验,我们选择盐酸(HCl)作为脱甲酰化试剂,因为它比我们研究的其他酸高效且成本更低。来自实施例16的发酵肉汤的HPLC分析显示,在生物合成过程中形成的其他叶酸盐中有大量的10-甲酰基叶酸(10-甲酰基叶酸46%面积;5-亚胺甲基四氢叶酸47%面积和5-甲基四氢叶酸7%面积)。将发酵肉汤样品用1M HCl处理最高至不同的pH水平(pH=4、3、2、1和0),并在避光下在环境温度(25℃)下搅拌24小时。根据我们的HPLC测定,只有在较低的pH水平(pH=1和0)下,脱甲酰化才能提供适量的叶酸。基于这些结果,我们确信酸介导的脱甲酰化策略在叶酸的下游加工过程中可能适用。为了在复杂系统(如发酵肉汤)中开发甲酰基叶酸盐物质的成本效益高的脱甲酰化方案,进一步优化酸量和反应温度是必要的。
将来自实施例16的充分搅拌的发酵肉汤移液到六个配有搅拌棒和pH电极的100mL圆底烧瓶中。在搅拌下滴加盐酸以达到表17中所述的多个pH值(pH=4、3、2、1、0)。
表17.发酵肉汤3101的酸介导的脱甲酰化
实验 <![CDATA[V<sub>FB</sub>]]> <![CDATA[V<sub>HCl</sub>]]> <![CDATA[V<sub>总计</sub>]]> pH
1 50mL 0.0mL 50mL 7.0
2 50mL 10.2mL 60.2mL 4.0
3 50mL 15.6mL 65.6mL 3.0
4 50mL 21.4mL 71.4mL 2.0
5 50mL 35.3mL 85.3mL 1.0
6 50mL 59.0mL 109.3mL 0.0
将发酵混合物在环境温度(25℃)下搅拌24小时,通过将烧瓶包裹在铝箔中来屏蔽紫外线。在精确的条件下制备对照样品,尽管没有酸(实验1)。搅拌24小时后,用9mL的提取缓冲液(0.1M磷酸盐缓冲液和1%(w/v)抗坏血酸)将1mL每种发酵肉汤稀释成两份。涡流搅拌悬浮液,以4500rpm离心,通过0.22μm过滤器过滤,并在HPLC上分析。HPLC结果在表18中总结。根据我们的HPLC测定,只有在较低的pH水平(pH=1和0)下,脱甲酰化才能提供适量的叶酸。总之,我们开发了一种酸介导的10-甲酰基叶酸的脱甲酰化(发酵的主要产物)。
表18.来自实施例16的发酵肉汤上酸介导的脱甲酰化的基于HPLC的结果
Figure BDA0004048528550000771
碱介导的脱甲酰化
浏览化学文献,我们发现了一些描述叶酸在较高pH值下表现出更高稳定性的报告。在这样的pH值下,叶酸表现出更高的溶解度,这简化了合成操作、纯化和下游处理。因此,在使用0.1M NaOH的一系列N-脱甲酰基化实验中,我们的目标是从10-甲酰基叶酸清洁高效地转化为叶酸(参见图9),这将简化从发酵肉汤中分离目标产物。使用0.01mmol刻度(5mg)对10-甲酰基叶酸的分析标准品进行初始脱甲酰化实验。
代表性实验程序:
在配有搅拌棒和橡胶隔膜的10mL圆底烧瓶中称量10-甲酰基叶酸。用0.1M氢氧化钠(50当量,0.5mmol,5mL)处理悬浮液,并在避光下在环境温度下搅拌24-48小时。随后,用叶酸提取缓冲液(900μL)稀释溶液(100μL),在涡流搅拌器上均化并在HPLC上分析。在HPLC上对三个时间依赖的等分试样进行取样分析。表19给出了脱甲酰化的结果。在24小时后的第一次取样过程中,用0.1M NaOH将10-甲酰基叶酸脱甲酰化几乎定量地产生叶酸(表19,条目1)。在搅拌48小时后,根据HPLC分析,反应进行至完成。在相同条件下的长时间搅拌揭示了新形成的叶酸即使在144小时(6天)后也不会发生分解。
表19.在0.1M NaOH存在下10-甲酰基叶酸N-脱甲酰化为叶酸的时间尺度
Figure BDA0004048528550000781
实验在10mL圆底烧瓶中使用10-甲酰基叶酸(5mg,0.01mmol)进行。加入过量的NaOH(0.1M,50.0当量,5mL)。实验开始时,10-FFA的质量浓度为约1000mg/L。通过HPLC测定反应过程。HPLC样品在提取缓冲液(0.1M磷酸盐缓冲液和1%(w/v)抗坏血酸)中制备。
发酵肉汤中碱介导的10-甲酰叶酸的N-脱甲酰化
在之前的实验中,我们已经说明了使用0.1M NaOH对10-甲酰基叶酸标准品进行脱甲酰化,提供了如图9所示的清洁转化为叶酸。在这里,我们将相同的原理应用于更复杂的系统,即发酵肉汤。来自实施例16的发酵肉汤在脱甲酰化之前的HPLC分析显示大量的10-甲酰基二氢叶酸(10F-DHF;60%面积);和10-甲酰基叶酸(10F-FA;40%面积)。将来自实施例16的发酵肉汤样品(10mL)用不同v/v比例的0.1M NaOH(1:1、1:2、1:3和1:4)处理,并在避光下在环境温度(25℃)下搅拌24小时。根据我们的HPLC测定,用发酵肉汤/NaOH v/v 1:1和1:2的实验没有导致脱甲酰化,而是导致10-甲酰基二氢叶酸氧化转化为10-甲酰基叶酸,如表20所示(条目2和3)。随后,当NaOH的量相对于发酵肉汤(1:3和1:4)增加时,通过HPLC检测到大量叶酸,如表20所示(条目4和5)。有趣的是,较高量的NaOH在一定程度上阻碍了10F-DHF向10F-FA的氧化转化,因为HPLC检测到大量的10F-DHF。
代表性实验程序:
将来自实施例16的充分搅拌的发酵肉汤(10mL)移液到配备有搅拌棒和用于避光保护的铝箔的50-100mL圆底烧瓶中。滴加氢氧化钠(0.1M),并在环境温度(25℃)下剧烈搅拌反应24小时。搅拌24小时后,用9mL的提取缓冲液(0.1M磷酸盐缓冲液和1%(w/v)抗坏血酸)将1mL每种发酵肉汤稀释成两份。涡流搅拌悬浮液,以4500rpm离心,通过0.22μm过滤器过滤,并在HPLC上分析。
表20.添加不同量的NaOH对发酵肉汤中10-甲酰基叶酸的N-脱甲酰化的影响。
Figure BDA0004048528550000791
Figure BDA0004048528550000801
使用来自实施例16的发酵肉汤(FB3148,10mL)在50-100mL圆底烧瓶中进行实验。基于相对于FB3148的体积/体积比(1:1、1:2、1:3和1:4),加入0.1M的NaOH。通过HPLC测定反应进展和结果。HPLC样品在提取缓冲液(0.1M磷酸盐缓冲液和1%(w/v)抗坏血酸)中制备。所有反应在环境温度(25℃)下避光搅拌24小时。
实施例19:10-甲酰基叶酸的分离
在收获后,使用5M NaOH水溶液将含有50g的叶酸的发酵肉汤调节至pH=12。将溶液在4℃下以10000rpm离心15分钟。向上清液中加入50g氢氧化钙,并在室温下搅拌悬浮液2小时。使所得悬浮液沉淀,倾析,并在100硅藻土(Celite)的帮助下过滤上清液。滤饼用500mL水洗涤并过滤。合并滤液并稀释至最终体积为10升。用1N HCl将澄清叶酸的稀释碱性溶液调节至pH 7.0,加热至70℃,然后冷却至室温。接下来,过滤溶液以去除在中性pH下沉淀的杂质。用1N HCl将澄清滤液调节至pH=3,并在冰上冷却4小时。过滤出悬浮液并将其重新溶解在8L的pH=12的热碱性溶液中(用1M NaOH调节)。向该溶液中加入50克的活性炭(1当量/重量的叶酸),将溶液加热至50℃并搅拌30分钟。过滤悬浮液,用3L的碱化水溶液(用NaOH调节pH=12)洗涤滤饼。合并滤液并使用1N HCl将pH调节至3.0,HCl在连续搅拌期间加入。将所得浆料在冰上冷却24小时或过夜。过滤出悬浮液并重新悬浮在1L的pH=3的酸化水溶液中(pH用1N HCl调节)。再次过滤悬浮液,然后将所得滤饼冷冻并干燥,得到43克的叶酸,其中含有10%的水分,且基于干重测定为90.1%叶酸。
实施例20:叶酸的分离
收获后,使用1M NaOH水溶液将含有30g的叶酸的发酵肉汤调节至pH=10。将溶液在4℃下以10000rpm离心15分钟。用1N HCl将所得上清液调节至pH 4.0,加热至70℃,然后冷却至室温。接着,在100g的硅藻土的帮助下过滤溶液。将滤饼重新悬浮在5L的pH=10的碱性溶液中(pH用1M NaOH调节)。向该溶液中加入50克的活性炭(1当量/重量的叶酸),将溶液加热至50℃并搅拌30分钟。过滤悬浮液,用2L的碱化水溶液(用NaOH调节pH=12)洗涤滤饼。合并滤液并使用1N HCl将pH调节至3.0,HCl在连续搅拌期间加入。将所得沉淀在冰上冷却16-24h,或将所得沉淀过滤掉并重新悬浮在1L的pH=3的酸化水溶液中(pH用1N HCl调节)。再次过滤悬浮液,干燥所得沉淀滤饼,得到21g的10-甲酰基叶酸,其测定为92%。
实施例21.5-甲基叶酸盐操纵子(MTHF-OP)的组装
叶酸盐生物合成基因(glyA、purU yitJ和metF)的合成作为单独的合成DNA片段(SEQ ID NO:91、92、93和94)而进行,其中基因核苷酸序列进行密码子优化用于枯草芽孢杆菌(B.subtilis)的最佳表达。通过重复的限制性酶切和连接步骤将片段组装成人工操纵子(实施例3)。使用NdeI和AseI限制性酶切位点的组合,以确保用于成功连接的相容限制性酶切末端。每一连接步骤之后,组合的片段用作下一次PCR扩增的新模板。操纵子被逐步组装,以便将不同的生物合成基因与ywhL基因座的同源物(SEQ ID NO:95)和大观霉素选择性标记物(SEQ ID NO:96)结合。整合基因座ywhL(非特征化蛋白)被选择作为新的染色体整合位点。叶酸盐生物合成基因甲基叶酸盐操纵子(MTHF-OP)被设计为参与5-甲基四氢叶酸盐生物合成最后步骤的基因的组合,并受强组成型P15启动子的控制(图14)。在MTHF-OP-A操纵子(SEQ ID NO:97)中,基因(glyA、purU和yitJ)选自天然宿主生物体枯草芽孢杆菌(B.subtilis)和针对枯草芽孢杆菌最佳基因表达而优化的附加密码子。此外,来自大肠杆菌(E.coli)的同源基因(metF)用于在操纵子MTHF-OP-B(SEQ ID NO:98)中构建yitJ基因的替代物。
实施例22:枯草芽孢杆菌(B.subtilis)的诱变
对枯草芽孢杆菌(B.subtilis)菌株FL825进行了甲磺酸乙酯(EMS)诱变。培养物在含有适当抗生素的液体LB培养基中生长至指数期。然后,将培养物以3000RPM离心3-5分钟,并除去上清液。将细胞颗粒在无菌的0.9-%NaCl中洗涤两次,离心除去上清液。将颗粒重新悬浮在0.9-%NaCl中。将100μL的细胞悬浮液稀释在900μL的3%甲磺酸乙酯(EMS)中。在持续搅拌/混合的情况下,将细胞暴露于EMS相应的时间。孵育后,每1体积细胞悬浮液加入1体积的10-15%硫代硫酸钠以停止诱变反应。通过离心除去液体。将细胞颗粒在无菌的0.9-%NaCl中洗涤两次,离心除去上清液。将诱变细胞的系列稀释液用适当的抗生素铺板于MB平板上,并在37℃下孵育约48小时。进一步测试单个菌落的5-甲基四氢叶酸盐生产(实施例25)。
实施例23:使用qPCR检测metE基因的表达水平
枯草芽孢杆菌(B.subtilis)菌株FL2771在液体LB培养基中生长至指数阶段。将培养物与2体积的RNA保护细菌试剂(QIAGEN)混合,以4500rpm离心10分钟,并在-80℃下冷冻或立即处理。将细胞颗粒再悬浮在含有1mg/mL溶菌酶的200μL的TE缓冲液中15分钟,以去除细胞壁。根据制造商的方案,使用RNeasy迷你试剂盒(QIAGEN)分离RNA。用分光光度法检查获得的RNA的浓度和质量。用DNase(Ambion试剂盒)处理分离的RNA,并使用RevertAid HMinus第一链cDNA合成试剂盒(Thermo Scientific)将其逆转录为cDNA。将获得的cDNA稀释,cDNA的最终产量为约2.5ng/μL。
利用SYBR Green I(Thermo Scientific)检测,通过实时定量PCR(qPCR)技术(StepOne real-time PCR System,Applied Biosystems)分析获得的cDNA。通过qPCR定量5-Me-THF生产菌株中metE基因的表达。
作为内部对照基因,来自枯草芽孢杆菌的16S rRNA基因用作定量qPCR表达数据标准化的参考。枯草芽孢杆菌(B.subtilis)VBB38用作对照菌株。metE基因的表达使用特异性引物对Q_metE_F(SEQ ID NO:73)和Q_metE_R(SEQ ID NO:74)测定,对于选择作为内部对照基因的16S基因,使用引物对SEQ ID NO:69和SEQ ID NO:70。qPCR分析在StepOneTM实时PCR系统上进行,并使用2-ΔΔCT方法进行定量。
与起始亲本菌株FL825相比,菌株FL2771的metE基因表达下调大于70%(图15)。
实施例24:产生5-甲基四氢叶酸盐的菌株的生成
生产5-甲基四氢叶酸盐的菌株是从起始菌株VBB38发展而来的(参见图13)。为了提高工程化菌株的总叶酸盐生产能力,进行了两项重要的基因修饰。最初,枯草芽孢杆菌(B.subtilis)中的天然folC基因被破坏,以消除叶酸盐上的γ-谷氨酸尾的合成,并被仅编码二氢叶酸合成酶(DHFS)活性的folC同源物替换,导致只添加了一个必需的谷氨酸部分而没有γ-谷氨酸尾。因此,菌株FL21形成了能够增强叶酸盐从细胞向发酵培养基的排泄的表型,以确保通过叶酸盐生物合成途径的高代谢流量。在接下来的菌株开发步骤中,引入叶酸盐生物合成基因(如folE/mtrA、folB、folK、folP/sul、folA/dfrA)的过表达,以上调“从头”生物合成途径(从GTP前体到THF)。构建了含有所选叶酸盐生物合成基因的人工叶酸盐操纵子(BS-FOL-OP1和BS-FOL-OP2–参见实施例3),并在多个基因组位置(amyE和lacA基因座)整合到枯草芽孢杆菌(B.subtilis)中,以提供高水平的基因表达。与起始菌株相比,新工程化菌株FL184(BS-FOL-OP1)和菌株FL825(BS-FOL-OP1+BS-FOL-OP2)中叶酸盐生物合成基因的上调显著提高了总叶酸盐生产能力。
通过天然metE基因的下调/删除和参与叶酸盐形式(从THF到5-甲基四氢叶酸盐)(如glyA、purU、yitJ和metF)相互转化的基因的过度表达,产生了用于过量生产5-甲基四轻叶酸盐的枯草芽孢杆菌的其他工程化菌株。通过对亲本菌株FL825的随机诱变和基于它们的改进5-甲基四氢叶酸盐生产的突变菌株选择,实现了天然metE基因的下调。产生了新菌株FL2771,与野生型菌株(0,35mg/L)相比,达到明显更高的5-甲基四氢叶酸盐滴度(大于220mg/L)。进一步选择菌株FL2771进行全基因组测序。FL2771基因组的生物信息学分析和与祖先起始菌株枯草芽孢杆菌(B.subtilis)VKPM B2116的全基因组序列数据的比较能够合理地将菌株发育过程中随机诱变引入的多个观察到的SNP变异/突变与叶酸盐代谢循环联系起来。一个突变直接位于metE基因(SEQ ID NO:75和SEQ ID NO:76)的上游,该突变位于编码参与5-甲基四氢叶酸盐消耗的蛋氨酸合成酶的基因的调控区。
在开发5-甲基四氢叶酸盐生产菌株的最后一步中,我们进行了对叶酸盐形式相互转化至关重要的基因(glyA、purU、yitJ和metF)的过度表达。所选基因的过度表达被设计为一种新的甲基叶酸盐生物合成操纵子(MTHF-OP),该操纵子由参与5-甲基四氢叶酸盐生物合成的最后步骤的基因(glyA和yitJ/metF)和参与10F-THF转化为THF的基因purU(甲酰基四氢叶酸盐脱甲酰化酶)构建,以提高10F-叶酸盐和5-甲基四氢叶酸盐之间的比率。新的基因工程化菌株FL5416已证明产生最高的5-甲基四氢叶酸盐产量为大于300mg/L,而5-甲基四氢叶酸盐形式占所测叶酸盐总量的75%。
实施例25:枯草芽孢杆菌(B.subtilis)的基因工程化菌株中不同形式叶酸盐比例的测定
将菌株用适当的抗生素贴在MB平板上,并在37℃下孵育2天。对于摇瓶实验,将生长的菌株转移到Falcon 50ml锥形离心管(1个塞子/5ml)中的5ml MC(种子)培养基中,并在220RPM和37℃的旋转摇床上培养16–18小时。使用10%的种子培养物的接种物接种5mL生产培养基(MD+pABA500)。菌株在旋转摇床上以220RPM和37℃在黑暗中培养24小时。在发酵后,仔细收集发酵肉汤(200μl)的样品以获得均匀的样品,并在冰冷提取缓冲液(0.1M磷酸盐缓冲液和1%(w/v)抗坏血酸)中稀释10倍。将样品在14,000rpm和4℃下离心10分钟,并过滤灭菌(0.22μm孔径)。对于不同叶酸盐物质的定量,如实施例13所述使用HPLC方法。不同枯草芽孢杆菌(B.subtilis)菌株的结果如表21所示,发酵肉汤样品的代表性HPLC色谱图如图6所示。
表21.24小时后,在摇床规模(5ml)的实验中不同枯草芽孢杆菌菌株的叶酸盐产生。
Figure BDA0004048528550000841
与野生型菌株枯草芽孢杆菌(Bacillus subtilis)168相比,具有异源folC-AG和过表达叶酸盐生物合成基因(叶酸盐操纵子FOL-OP-BS1、FOL-OP-BS2和MTHF-OP-B)的菌株FL5416显示5-甲基叶酸盐产量增加了191462%。
比较实施例1
测定了枯草芽孢杆菌野生型菌株“168”、我们的起始非GMO菌株VBB38(菌株VKPMB2116=枯草芽孢杆菌(B.subtilis)VNII Genetika 304)及其转化体(其中天然folC基因在一个步骤中被来自棉蚜(A.gossypii)(枯草芽孢杆菌菌株FL21)或罗伊氏乳杆菌(L.reuteri)(枯草杆菌菌株FL23)的异源folC2(FOL3)基因替换)的总叶酸盐产量。在摇床规模(5ml生产培养基MD)上测试菌株,并使用用于叶酸检测的标准微生物测定法测定叶酸盐总量。
结果表明,仅删除枯草芽孢杆菌(B.subtilis)天然folC基因而不同时表达异源folC2基因的敲除突变体不能在标准培养条件下生长(T=37C,在富含营养物的LB培养基中,需氧)。
说明书中引用的参考文献列表
Hjortmo S,Patring J,Andlid T.2008 Growth rate and medium compositionstrongly affect folate content in Saccharomyces cerevisiae.Int J FoodMicrobiol.123(1-2):93-100.
McGuire JJ and Bertino JR.1981.Enzymatic synthesis and function offolylpolyglutamates.Mol Cell Biochem 38 Spec No(Pt 1):19-48.
Reed,LS,Archer MC.1980.Oxidation of tetrahydrofolic acid by air.JAgric Food Chem.28(4):801-805.
Rossi,M.,Raimondi,S.,Costantino,L.,Amaretti,A.,2016.Folate:Relevanceof Chemical and Microbial Production.Industrial Biotechnology of Vitamins,Biopigments,and Antioxidants.Wiley-VCH Verlag GmbH&Co.KGaA,Weinheim,Germany,pp.103-128.
Scaglione and Panzavolta.2014.Folate,folic acid and 5-methyltetrahydrofolate are not the same thing.Xenobiotica.44(5):480-488.
Serrano-Amatriain C,Ledesma-Amaro R,López-Nicolás R,Ros G,Jiménez A,Revuelta JL.2016.Folic acid production by engineered Ashbya gossypii.MetabEng.38:473-482.
Sybesma W,Starrenburg M,Kleerebezem M,Mierau I,de Vos WM,HugenholtzJ.2003a.Increased production of folate by metabolic engineering ofLactococcus lactis.Appl Environ Microbiol.69(6):3069-3076.
Sybesma,W.,Starrenburg,M.,Tijsseling,L.,Hoefnagel,M.H.N.,Hugenholtz,J.,2003b.Effects of cultivation conditions on folate production by lacticacid bacteria.Applied and Environmental Microbiology.69(8):4542-4548.
Sybesma W,Van Den Born E,Starrenburg M,Mierau I,Kleerebezem M,De VosWM,Hugenholtz J.2003c.Controlled modulation of folate polyglutamyl taillength by metabolic engineering of Lactococcus lactis.Appl EnvironMicrobiol.69(12):7101-7107.
Walkey C J,Kitts DD,Liu Y,van Vuuren HJJ.2015.Bioengineering yeast toenhance folate levels in wine.Process Biochem 50(2):205-210.
Qui Z and Goodman MF:The Escherichia coli polB locus is identical todinA,the structural gene for DNA polymerase II.Characterization of Pol IIpurified from a polB mutant.J Biol Chem.1997,272(13):8611-8617.
Kwon DH,
Figure BDA0004048528550000871
JA,Osato MS,Fox JG,Graham DY,Versalovic J:Frameshiftmutations in rdxA and metronidazole resistance in North American Helicobacterpylori isolates.J Antimicrob Chemother 2000,46(5):793-796
Datsenko KA,Wanner BL:One-step inactivation of chromosomal genes inEscherichia coli K-12 using PCR products.Proc Natl Acad Sci U S A 2000,97:6640-6645.
序列表
<110> 赤峰制药股份有限公司(Chifeng Pharmaceutical Co., Ltd.)
<120> 生产5-甲基叶酸盐的微生物(5-Methylfolate producing microorganism)
<130> P47683PC00
<150> EP20186028
<151> 2020-07-15
<150> EP20189690
<151> 2020-08-05
<160> 101
<170> PatentIn version 3.5
<210> 1
<211> 573
<212> DNA
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 1
atgaaagaag ttaataaaga gcaaatcgaa caagctgttc gtcaaatttt agaagcgatc 60
ggagaagacc cgaatagaga agggcttctt gatactccga aaagagtcgc aaagatgtat 120
gccgaagtat tctccggctt gaatgaagat ccaaaagaac atttccagac tatcttcggt 180
gaaaaccatg aggagcttgt tcttgtaaaa gatatagcgt ttcattctat gtgtgagcat 240
caccttgttc ccttttatgg aaaagcacat gttgcatata tcccgcgagg cggaaaggtc 300
acaggactca gcaaactggc acgtgccgtt gaagccgttg caaagcgccc gcagcttcag 360
gaacgcatca cttctacaat tgcagaaagc atcgtagaaa cgcttgatcc gcatggcgta 420
atggtagtgg ttgaagcgga acacatgtgc atgacgatgc gcggtgtaag aaaaccgggt 480
gcgaaaactg tgacttcagc agtcagaggc gtttttaaag atgatgccgc tgcccgtgca 540
gaagtattgg aacatattaa acgccaggac taa 573
<210> 2
<211> 363
<212> DNA
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 2
atggataaag tttatgtaga aggtatggag ttttacggat atcacggtgt gttcacagaa 60
gaaaacaaac ttggccagcg gtttaaagtc gatttaaccg ctgagctgga tttaagcaaa 120
gctggacaga cagacgacct tgagcaaacg atcaactatg ctgagctcta tcacgtatgt 180
aaagatatcg tggaagggga gcctgtgaaa ttggtggaaa cgctggcgga acgtattgct 240
ggcactgttc tcggaaaatt tcagcctgtt cagcaatgta cggtgaaagt gattaagcca 300
gacccgccaa ttcccggaca ctataaatca gtagcaattg aaattacgag aaaaaagtca 360
tga 363
<210> 3
<211> 504
<212> DNA
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 3
atgaacaaca tagcttatat tgcacttgga tctaatattg gagatagaga aacgtattta 60
aggcaagcag tggctttact gcatcagcat gctgcggtga cagtcactaa agtgtcgtct 120
atttacgaaa ctgacccggt cggatacgaa gatcaagctc aatttttgaa tatggctgtt 180
gaaatcaaga catcattgaa cccttttgaa ctccttgaac tgacgcagca gatagaaaat 240
gaattaggca gaacaaggga agtaagatgg gggccgcgga cggcagacct tgacattttg 300
ttatttaatc gtgaaaatat tgaaacagag caactaattg ttccgcatcc gagaatgtat 360
gagcgtttgt ttgtccttgc gccgcttgcg gaaatttgcc agcaggttga aaaagaggct 420
acaagcgccg aaacagacca agaaggtgta agagtatgga agcagaaatc tggggtagac 480
gaattcgtgc attcagaaag ctga 504
<210> 4
<211> 858
<212> DNA
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 4
atggcgcagc acacaataga tcaaacacaa gtaatccaca ctaagcccag cgctttatca 60
tataaagaga agacgctggt gatgggaatt ttaaacgtaa cgcctgactc tttctcggac 120
ggcggaaaat atgacagctt ggacaaggcg ctgctgcacg cgaaagagat gatcgatgat 180
ggtgcccata tcattgatat tggaggggaa tcgacaaggc ctggcgctga gtgcgtatct 240
gaggatgagg agatgtccag agtcattccg gtgattgagc ggattacgaa agagcttggt 300
gttcctattt ctgtagacac gtacaaggct tctgtcgcag atgaagcagt gaaagccggt 360
gcatccatta tcaatgatat ttggggagcc aaacatgatc cgaagatggc ttccgttgca 420
gctgaacata atgttccaat tgtactcatg cataaccgcc ctgaaagaaa ctacaatgac 480
ttattgccgg atatgctgtc ggacttaatg gagagtgtaa aaattgctgt tgaggccgga 540
gtagacgaga agaacattat tcttgatcct ggtatcggtt tcgcgaaaac ctatcacgat 600
aacttggcag tgatgaacaa actagagatt ttcagcggat tgggatatcc ggttcttctg 660
gcaacctccc gaaaaagatt catcggacgt gttctggatc ttccgcctga ggagcgggct 720
gagggcacag gcgcgactgt gtgtctcggc attcaaaaag gctgtgacat tgtcagggtc 780
catgatgtaa agcaaattgc cagaatggcg aaaatgatgg acgcgatgct gaataaggga 840
ggggtgcacc atggataa 858
<210> 5
<211> 1293
<212> DNA
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 5
ttgtttactg catatcaaga tgcgcgcagc tggattcacg ggaggctgaa attcggggtg 60
aagcccggac ttggtcgaat gaaacagctg atggcgcggt taggacatcc tgaaaaaaaa 120
atccgagcgt tccacgtcgc aggaacaaac ggtaaaggat caactgtcgc ttttatccgt 180
tctatgctgc aggaagccgg atatacggtt ggaacattta catcgcctta tattattacg 240
tttaatgaac ggatcagcgt aaacgggata ccgatttcag atgaggaatg gacagcactc 300
gtcaatcaaa tgaaaccgca cgttgaagcc cttgatcaaa cggaatacgg acagccgaca 360
gaatttgaaa ttatgacagc ttgtgcattt ttatattttg cagagtttca taaggtcgat 420
tttgttattt ttgaaacagg tctgggcggt agattcgatt ctactaatgt ggttgaaccg 480
ctcttaactg tgattacaag catcggacac gatcatatga acattttggg aaacaccatt 540
gaagaaattg caggagaaaa ggccggcatt attaaagaag gtattccaat cgttacagca 600
gttacccagc cggaagcttt acaggtcatc cgccatgaag ccgaacggca tgctgcgccg 660
ttccagtcat tgcatgatgc atgtgttatt ttcaatgaag aggctctgcc tgcaggagaa 720
cagttttcat tcaaaacgga agagaaatgc tatgaagata ttcggacatc tctgattggc 780
acccatcaaa gacaaaatgc tgctttgtcc attttggctg cggagtggct caataaggag 840
aatatcgccc atatcagtga cgaagcgtta aggagcgggc ttgtgaaggc tgcttggccg 900
ggacggttag agcttgttca ggaacatcct ccggtatatt tagacggtgc gcataacgaa 960
gaaggtgttg aaaagctggc ggaaacgatg aagcagcgtt tcgccaattc acgcatttct 1020
gtggtgttta gcgcgttaaa ggacaaaccg tatcagaaca tgattaaaag actggaaacc 1080
attgctcatg cgattcattt tgcttctttt gatttcccgc gtgcttccct tgcaaaagat 1140
ctctatgatg caagtgaaat cagcaataaa agctggagtg aagatccaga cgatgtaatc 1200
aaattcatag aaagtaaaaa gggctcaaat gaaattgtgc tgattaccgg atctctttac 1260
tttatttctg acattcgaaa aaggttgaaa taa 1293
<210> 6
<211> 507
<212> DNA
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 6
atgatttcat tcatttttgc gatggatgcc aacaggctta tcggcaaaga caatgatttg 60
ccgtggcatt tgcccaatga tcttgcatac tttaagaaaa taacatcggg ccattcaatc 120
attatgggcc ggaaaacatt tgaatcgatc ggacgtccgc ttccaaatcg gaaaaatatt 180
gtcgttacct cagcgccgga ttcagaattt cagggatgca cggttgtcag ttcattaaag 240
gatgtactgg acatttgttc aggccctgaa gaatgctttg tgatcggagg ggctcagctc 300
tatacggacc tgttccctta tgcggacaga ctgtatatga cgaaaattca tcacgagttt 360
gagggtgacc gtcactttcc tgaatttgat gaatccaatt ggaagctggt ttcttctgag 420
caggggacca aagacgaaaa aaacccgtat gattacgaat ttctaatgta tgaaaaaaag 480
aattcttcta aagcgggagg attttaa 507
<210> 7
<211> 190
<212> PRT
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 7
Met Lys Glu Val Asn Lys Glu Gln Ile Glu Gln Ala Val Arg Gln Ile
1               5                   10                  15
Leu Glu Ala Ile Gly Glu Asp Pro Asn Arg Glu Gly Leu Leu Asp Thr
            20                  25                  30
Pro Lys Arg Val Ala Lys Met Tyr Ala Glu Val Phe Ser Gly Leu Asn
        35                  40                  45
Glu Asp Pro Lys Glu His Phe Gln Thr Ile Phe Gly Glu Asn His Glu
    50                  55                  60
Glu Leu Val Leu Val Lys Asp Ile Ala Phe His Ser Met Cys Glu His
65                  70                  75                  80
His Leu Val Pro Phe Tyr Gly Lys Ala His Val Ala Tyr Ile Pro Arg
                85                  90                  95
Gly Gly Lys Val Thr Gly Leu Ser Lys Leu Ala Arg Ala Val Glu Ala
            100                 105                 110
Val Ala Lys Arg Pro Gln Leu Gln Glu Arg Ile Thr Ser Thr Ile Ala
        115                 120                 125
Glu Ser Ile Val Glu Thr Leu Asp Pro His Gly Val Met Val Val Val
    130                 135                 140
Glu Ala Glu His Met Cys Met Thr Met Arg Gly Val Arg Lys Pro Gly
145                 150                 155                 160
Ala Lys Thr Val Thr Ser Ala Val Arg Gly Val Phe Lys Asp Asp Ala
                165                 170                 175
Ala Ala Arg Ala Glu Val Leu Glu His Ile Lys Arg Gln Asp
            180                 185                 190
<210> 8
<211> 120
<212> PRT
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 8
Met Asp Lys Val Tyr Val Glu Gly Met Glu Phe Tyr Gly Tyr His Gly
1               5                   10                  15
Val Phe Thr Glu Glu Asn Lys Leu Gly Gln Arg Phe Lys Val Asp Leu
            20                  25                  30
Thr Ala Glu Leu Asp Leu Ser Lys Ala Gly Gln Thr Asp Asp Leu Glu
        35                  40                  45
Gln Thr Ile Asn Tyr Ala Glu Leu Tyr His Val Cys Lys Asp Ile Val
    50                  55                  60
Glu Gly Glu Pro Val Lys Leu Val Glu Thr Leu Ala Glu Arg Ile Ala
65                  70                  75                  80
Gly Thr Val Leu Gly Lys Phe Gln Pro Val Gln Gln Cys Thr Val Lys
                85                  90                  95
Val Ile Lys Pro Asp Pro Pro Ile Pro Gly His Tyr Lys Ser Val Ala
            100                 105                 110
Ile Glu Ile Thr Arg Lys Lys Ser
        115                 120
<210> 9
<211> 167
<212> PRT
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 9
Met Asn Asn Ile Ala Tyr Ile Ala Leu Gly Ser Asn Ile Gly Asp Arg
1               5                   10                  15
Glu Thr Tyr Leu Arg Gln Ala Val Ala Leu Leu His Gln His Ala Ala
            20                  25                  30
Val Thr Val Thr Lys Val Ser Ser Ile Tyr Glu Thr Asp Pro Val Gly
        35                  40                  45
Tyr Glu Asp Gln Ala Gln Phe Leu Asn Met Ala Val Glu Ile Lys Thr
    50                  55                  60
Ser Leu Asn Pro Phe Glu Leu Leu Glu Leu Thr Gln Gln Ile Glu Asn
65                  70                  75                  80
Glu Leu Gly Arg Thr Arg Glu Val Arg Trp Gly Pro Arg Thr Ala Asp
                85                  90                  95
Leu Asp Ile Leu Leu Phe Asn Arg Glu Asn Ile Glu Thr Glu Gln Leu
            100                 105                 110
Ile Val Pro His Pro Arg Met Tyr Glu Arg Leu Phe Val Leu Ala Pro
        115                 120                 125
Leu Ala Glu Ile Cys Gln Gln Val Glu Lys Glu Ala Thr Ser Ala Glu
    130                 135                 140
Thr Asp Gln Glu Gly Val Arg Val Trp Lys Gln Lys Ser Gly Val Asp
145                 150                 155                 160
Glu Phe Val His Ser Glu Ser
                165
<210> 10
<211> 285
<212> PRT
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 10
Met Ala Gln His Thr Ile Asp Gln Thr Gln Val Ile His Thr Lys Pro
1               5                   10                  15
Ser Ala Leu Ser Tyr Lys Glu Lys Thr Leu Val Met Gly Ile Leu Asn
            20                  25                  30
Val Thr Pro Asp Ser Phe Ser Asp Gly Gly Lys Tyr Asp Ser Leu Asp
        35                  40                  45
Lys Ala Leu Leu His Ala Lys Glu Met Ile Asp Asp Gly Ala His Ile
    50                  55                  60
Ile Asp Ile Gly Gly Glu Ser Thr Arg Pro Gly Ala Glu Cys Val Ser
65                  70                  75                  80
Glu Asp Glu Glu Met Ser Arg Val Ile Pro Val Ile Glu Arg Ile Thr
                85                  90                  95
Lys Glu Leu Gly Val Pro Ile Ser Val Asp Thr Tyr Lys Ala Ser Val
            100                 105                 110
Ala Asp Glu Ala Val Lys Ala Gly Ala Ser Ile Ile Asn Asp Ile Trp
        115                 120                 125
Gly Ala Lys His Asp Pro Lys Met Ala Ser Val Ala Ala Glu His Asn
    130                 135                 140
Val Pro Ile Val Leu Met His Asn Arg Pro Glu Arg Asn Tyr Asn Asp
145                 150                 155                 160
Leu Leu Pro Asp Met Leu Ser Asp Leu Met Glu Ser Val Lys Ile Ala
                165                 170                 175
Val Glu Ala Gly Val Asp Glu Lys Asn Ile Ile Leu Asp Pro Gly Ile
            180                 185                 190
Gly Phe Ala Lys Thr Tyr His Asp Asn Leu Ala Val Met Asn Lys Leu
        195                 200                 205
Glu Ile Phe Ser Gly Leu Gly Tyr Pro Val Leu Leu Ala Thr Ser Arg
    210                 215                 220
Lys Arg Phe Ile Gly Arg Val Leu Asp Leu Pro Pro Glu Glu Arg Ala
225                 230                 235                 240
Glu Gly Thr Gly Ala Thr Val Cys Leu Gly Ile Gln Lys Gly Cys Asp
                245                 250                 255
Ile Val Arg Val His Asp Val Lys Gln Ile Ala Arg Met Ala Lys Met
            260                 265                 270
Met Asp Ala Met Leu Asn Lys Gly Gly Val His His Gly
        275                 280                 285
<210> 11
<211> 430
<212> PRT
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 11
Met Phe Thr Ala Tyr Gln Asp Ala Arg Ser Trp Ile His Gly Arg Leu
1               5                   10                  15
Lys Phe Gly Val Lys Pro Gly Leu Gly Arg Met Lys Gln Leu Met Ala
            20                  25                  30
Arg Leu Gly His Pro Glu Lys Lys Ile Arg Ala Phe His Val Ala Gly
        35                  40                  45
Thr Asn Gly Lys Gly Ser Thr Val Ala Phe Ile Arg Ser Met Leu Gln
    50                  55                  60
Glu Ala Gly Tyr Thr Val Gly Thr Phe Thr Ser Pro Tyr Ile Ile Thr
65                  70                  75                  80
Phe Asn Glu Arg Ile Ser Val Asn Gly Ile Pro Ile Ser Asp Glu Glu
                85                  90                  95
Trp Thr Ala Leu Val Asn Gln Met Lys Pro His Val Glu Ala Leu Asp
            100                 105                 110
Gln Thr Glu Tyr Gly Gln Pro Thr Glu Phe Glu Ile Met Thr Ala Cys
        115                 120                 125
Ala Phe Leu Tyr Phe Ala Glu Phe His Lys Val Asp Phe Val Ile Phe
    130                 135                 140
Glu Thr Gly Leu Gly Gly Arg Phe Asp Ser Thr Asn Val Val Glu Pro
145                 150                 155                 160
Leu Leu Thr Val Ile Thr Ser Ile Gly His Asp His Met Asn Ile Leu
                165                 170                 175
Gly Asn Thr Ile Glu Glu Ile Ala Gly Glu Lys Ala Gly Ile Ile Lys
            180                 185                 190
Glu Gly Ile Pro Ile Val Thr Ala Val Thr Gln Pro Glu Ala Leu Gln
        195                 200                 205
Val Ile Arg His Glu Ala Glu Arg His Ala Ala Pro Phe Gln Ser Leu
    210                 215                 220
His Asp Ala Cys Val Ile Phe Asn Glu Glu Ala Leu Pro Ala Gly Glu
225                 230                 235                 240
Gln Phe Ser Phe Lys Thr Glu Glu Lys Cys Tyr Glu Asp Ile Arg Thr
                245                 250                 255
Ser Leu Ile Gly Thr His Gln Arg Gln Asn Ala Ala Leu Ser Ile Leu
            260                 265                 270
Ala Ala Glu Trp Leu Asn Lys Glu Asn Ile Ala His Ile Ser Asp Glu
        275                 280                 285
Ala Leu Arg Ser Gly Leu Val Lys Ala Ala Trp Pro Gly Arg Leu Glu
    290                 295                 300
Leu Val Gln Glu His Pro Pro Val Tyr Leu Asp Gly Ala His Asn Glu
305                 310                 315                 320
Glu Gly Val Glu Lys Leu Ala Glu Thr Met Lys Gln Arg Phe Ala Asn
                325                 330                 335
Ser Arg Ile Ser Val Val Phe Ser Ala Leu Lys Asp Lys Pro Tyr Gln
            340                 345                 350
Asn Met Ile Lys Arg Leu Glu Thr Ile Ala His Ala Ile His Phe Ala
        355                 360                 365
Ser Phe Asp Phe Pro Arg Ala Ser Leu Ala Lys Asp Leu Tyr Asp Ala
    370                 375                 380
Ser Glu Ile Ser Asn Lys Ser Trp Ser Glu Asp Pro Asp Asp Val Ile
385                 390                 395                 400
Lys Phe Ile Glu Ser Lys Lys Gly Ser Asn Glu Ile Val Leu Ile Thr
                405                 410                 415
Gly Ser Leu Tyr Phe Ile Ser Asp Ile Arg Lys Arg Leu Lys
            420                 425                 430
<210> 12
<211> 168
<212> PRT
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 12
Met Ile Ser Phe Ile Phe Ala Met Asp Ala Asn Arg Leu Ile Gly Lys
1               5                   10                  15
Asp Asn Asp Leu Pro Trp His Leu Pro Asn Asp Leu Ala Tyr Phe Lys
            20                  25                  30
Lys Ile Thr Ser Gly His Ser Ile Ile Met Gly Arg Lys Thr Phe Glu
        35                  40                  45
Ser Ile Gly Arg Pro Leu Pro Asn Arg Lys Asn Ile Val Val Thr Ser
    50                  55                  60
Ala Pro Asp Ser Glu Phe Gln Gly Cys Thr Val Val Ser Ser Leu Lys
65                  70                  75                  80
Asp Val Leu Asp Ile Cys Ser Gly Pro Glu Glu Cys Phe Val Ile Gly
                85                  90                  95
Gly Ala Gln Leu Tyr Thr Asp Leu Phe Pro Tyr Ala Asp Arg Leu Tyr
            100                 105                 110
Met Thr Lys Ile His His Glu Phe Glu Gly Asp Arg His Phe Pro Glu
        115                 120                 125
Phe Asp Glu Ser Asn Trp Lys Leu Val Ser Ser Glu Gln Gly Thr Lys
    130                 135                 140
Asp Glu Lys Asn Pro Tyr Asp Tyr Glu Phe Leu Met Tyr Glu Lys Lys
145                 150                 155                 160
Asn Ser Ser Lys Ala Gly Gly Phe
                165
<210> 13
<211> 683
<212> DNA
<213> 人工序列
<220>
<223> 针对枯草芽胞杆菌(Bacillus subtilis)使用密码子优选的folE序列
<400> 13
cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatga 60
aagaagtcaa taaagaacaa attgaacagg cagtgagaca gattcttgaa gcaattggag 120
aagatccgaa cagagagggc ttacttgata caccgaaaag agttgctaaa atgtatgcgg 180
aagtcttttc aggcttaaat gaagatccga aagagcattt tcagacaatt ttcggagaaa 240
accatgaaga gctggtcctt gtgaaagata ttgcgtttca ctcaatgtgc gaacatcacc 300
tggtgccgtt ttacggcaag gcacacgttg cgtatattcc tagaggcgga aaagttacag 360
gcttgtcaaa attagcacgc gcagttgaag ctgttgcaaa aagaccgcaa ttacaggaac 420
gcattacatc tacaattgcg gaatcaattg tcgagacatt agaccctcat ggcgttatgg 480
ttgtcgttga agctgaacac atgtgcatga caatgcgcgg cgtcagaaaa cctggcgcaa 540
aaacagtcac atcagcagtc agaggcgtgt ttaaagatga tgcggcagct cgtgcggaag 600
tcctggaaca tattaaacgc caggactgaa aaagagggga gggaaacatt aatgacgacc 660
tggctaacga gtctcgccga tct 683
<210> 14
<211> 454
<212> DNA
<213> 人工序列
<220>
<223> 针对枯草芽胞杆菌(Bacillus subtilis)使用密码子优化的folB序列
<400> 14
ttctttttgc gccaggtagc catagctggt catatgatgg ataaagttta tgtggaagga 60
atggaatttt atggctatca tggcgtcttc acagaagaga acaaattggg acaacgcttc 120
aaagtagatc tgacagcaga actggattta tcaaaagcag gacaaacaga cgaccttgaa 180
cagacaatta actatgcaga gctttaccat gtctgtaaag acattgtcga aggcgagccg 240
gtcaaattgg tagagaccct tgctgagcgg atagctggca cagttttagg taaatttcag 300
ccggttcaac aatgtacggt gaaagttatt aaaccagatc cgccgattcc tggccactat 360
aaatcagtag caattgaaat tacgagaaaa aagtcataaa ttaattctag agtcgatccc 420
cgggttcgcc agcaatgact accggcagcc cgcc 454
<210> 15
<211> 595
<212> DNA
<213> 人工序列
<220>
<223> 针对枯草芽胞杆菌(Bacillus subtilis)使用密码子优化的folK序列
<400> 15
ggcggggctt cttttatcga atccagcgtg acatatgatg aacaacattg cgtacattgc 60
gcttggctct aatattggag atagagaaac gtatctgcgc caggccgttg cgttactgca 120
tcaacatgct gcggtcacag ttacaaaagt cagctcaatt tatgaaacag atccggtcgg 180
ctatgaagac caagcccagt ttttaaatat ggcggttgaa attaaaacaa gcctgaatcc 240
gtttgaactt ctggaactga cacagcaaat cgaaaacgaa ctgggccgca cacgcgaagt 300
tagatggggc ccgagaacag cggatttaga cattctgctg tttaacagag aaaacattga 360
aacagagcag ttaattgtcc cgcatcctcg catgtatgaa cgcctgtttg ttcttgcgcc 420
gcttgcggaa atttgccagc aggtcgagaa agaagcgaca agcgcggaaa cggatcaaga 480
aggagttaga gtttggaaac aaaaatcagg cgttgacgaa tttgtacata gcgaaagctg 540
aaaaagaggg gagggaaaca ttaatgaccg accctcatgg aaacccttcc tggcg 595
<210> 16
<211> 948
<212> DNA
<213> 人工序列
<220>
<223> 针对枯草芽胞杆菌(Bacillus subtilis)使用密码子优化的sul序列
<400> 16
gaccgaccct catggaaacc cttcctggcg catatgatgg cgcagcacac aatagatcaa 60
acacaagtca ttcatacgaa accgagcgcg ctttcatata aagaaaaaac actggtcatg 120
ggcattctta acgttacacc tgattctttt agcgatggtg gaaaatatga cagcttggac 180
aaggcgcttc tgcatgccaa agaaatgatc gacgacggcg cgcacattat tgacatagga 240
ggcgagagca caagaccggg agctgaatgc gtcagcgaag acgaagaaat gtctcgggtc 300
attccggtca ttgaacgcat cacaaaggaa ctcggcgtcc cgatttcagt ggatacatat 360
aaagcatctg tggcagacga agcagtcaaa gcgggcgcat ctattatcaa tgacatttgg 420
ggagcgaaac atgatccgaa gatggcaagc gtcgcagcgg aacataacgt tccaattgtc 480
ctgatgcaca atcggccaga acggaattat aacgaccttc ttccggatat gctgagcgac 540
cttatggaat cagtcaaaat tgcggttgag gcgggcgtgg atgagaaaaa tattatttta 600
gatccgggca tcggcttcgc gaagacatac catgataatc ttgcagtgat gaataagtta 660
gagatcttca gcggacttgg ctatcctgtc ctgctggcta catctcgtaa aagatttatc 720
ggaagagttc ttgatttacc gcctgaagag agagcagagg gcacaggagc gacagtctgc 780
ttgggcattc agaaaggatg cgacatagtg cgtgttcatg atgtcaagca aattgccaga 840
atggcgaaaa tgatggacgc gatgctgaat aagggagggg tgcaccatgg atgaaaaaga 900
ggggagggaa acattaattt ctttttgcgc caggtagcca tagctggt 948
<210> 17
<211> 598
<212> DNA
<213> 人工序列
<220>
<223> 针对枯草芽胞杆菌(Bacillus subtilis)使用密码子优化的dfrA序列
<400> 17
gacgacctgg ctaacgagtc tcgccgatct catatgatga tttcatttat tttcgcaatg 60
gacgcgaata gactgatagg caaagacaat gatctgccgt ggcatttacc gaatgacctg 120
gcttatttta aaaaaattac aagcggccat agcatcatta tgggacgtaa aacatttgag 180
tcaattggca gacctcttcc gaacagaaaa aacattgttg tcacatctgc gccggattca 240
gaatttcagg gctgcacagt cgtctcaagc cttaaagacg ttcttgatat ttgcagcgga 300
ccggaagagt gttttgtcat tggcggagcg caattataca cagatctttt tccgtacgcg 360
gatagactgt atatgacaaa aatccaccat gaatttgaag gcgacagaca ctttcctgaa 420
tttgacgaga gcaactggaa actcgtgtct agcgaacagg gcacgaagga tgagaaaaat 480
ccgtatgact atgaatttct tatgtatgaa aagaaaaaca gcagcaaagc gggaggcttt 540
tgaaaaagag gggagggaaa cattaatggc ggggcttctt ttatcgaatc cagcgtga 598
<210> 18
<211> 1460
<212> DNA
<213> 人工序列
<220>
<223> 组装片段
<400> 18
gccttttaat cccggcaaca gcttaatcag tacatccatc attccgaagc atccgacatt 60
cgatcattac aaggaattat ttgcgggcaa ggaaagcctt caatatgtgc agtggtatgt 120
caactctatg aagatcagcc tgtttacaat ggcagggtct ttgctctgtg tgacgtttac 180
ggcctatgcg ttttcgcgct ttcggtttaa agggaggaaa tacgctttaa cgctcttttt 240
attgctgcag atgattcctc agttttcagc tttaattgcc ttgtttgtgc tggcgcaaat 300
cttgggaatg atcaatagcc actggctgct aatcttgctt tatatcggcg gcctgatccc 360
gatgaatacg tatttgatga aagggtacat ggattccatt ccgatggatt tagacgaaag 420
cgccaagatt gacggagcca gcagcaccag aatcttcttc cagatcattc tgccattatc 480
aaaaccgatg gcggcagtcg tggccatgaa cggctttacc ggtccgctcg gagattttgt 540
gctgtcctca accatattga gaacgcctga atcatataca ttgcccgtcg gtctattcaa 600
tttagtgaat gatgtcatgg gggccagcta tacgacattt gcggccggag ccctgcttat 660
cagcataccg gttgccgtca tctttattat gctgcaaaag aattttgtgt ccggattaac 720
cgcaggcgga acgaagggct aagagaacaa ggaggagaat gtgatgtcaa agcttgaaaa 780
aacgcacgta acaaaagcaa aatttatgct ccatggggga gactacaacc ccgatcagtg 840
gctggatcgg cccgatattt tagctgacga tatcaaactg atgaagcttt ctcatacgaa 900
tacgttttct gtcggcattt ttgcatggag cgcacttgag ccggaggagg gcgtatatca 960
atttgaatgg ctggatgata tttttgagcg gattcacagt ataggcggcc gggtcatatt 1020
agcaacgccg agcggagccc gtccggcctg gctgtcgcaa acctatccgg aagttttgcg 1080
cgtcaatgcc tcccgcgtca aacagctgca cggcggaagg cacaaccact gcctcacatc 1140
taaagtctac cgagaaaaaa cacggcacat caaccgctac gggtgcgcat gatcgtatgg 1200
ttcactgtcc accaaccaaa actgtgctca gtaccgccaa tatttctccc ttggggggta 1260
caaagaggtg tccctagaag agatccacgc tgtgtaaaaa ttttacaaaa aggtattgac 1320
tttccctaca gggtgtgtaa taatttaatt acaggcgggg gcaaccccgc tcagtaccta 1380
gagcgtaaaa gaggggaggg aaacactagt tggcttcgtt gggattctcc ggtgatgctg 1440
atttcgctgc gtatgctgcg 1460
<210> 19
<211> 1038
<212> DNA
<213> 人工序列
<220>
<223> 针对红霉素抗性盒合成的DNA片段
<400> 19
tctagaaatt aagaaggagg gattcgtcat gttggtattc caaatgcgtt atgtagataa 60
aacatctact gttttgaaac agactaaaaa cagtgattac gcagataaat aaatacgtta 120
gattaattcc taccagtgac taatcttatg actttttaaa cagataacta aaattacaaa 180
caaatcgttt aacttctgta tttgtttata gatgtaatca cttcaggagt gattacatga 240
acaaaaatat aaaatattct caaaactttt taacgagtga aaaagtactc aaccaaataa 300
taaaacaatt gaatttaaaa gaaaccgata ccgtttacga aattggaaca ggtaaagggc 360
atttaacgac gaaactggct aaaataagta aacaggtaac gtctattgaa ttagacagtc 420
atctattcaa cttatcgtca gaaaaattaa aactgaacat tcgtgtcact ttaattcacc 480
aagatattct acagtttcaa ttccctaaca aacagaggta taaaattgtt gggaatattc 540
cttaccattt aagcacacaa attattaaaa aagtggtttt tgaaagccat gcgtctgaca 600
tctatctgat tgttgaagaa ggattctaca agcgtacctt ggatattcac cgaacactag 660
ggttgctctt gcacactcaa gtctcgattc agcaattgct taagctgcca gcggaatgct 720
ttcatcctaa accaaaagta aacagtgtct taataaaact tacccgccat accacagatg 780
ttccagataa atattggaag ctatatacgt actttgtttc aaaatgggtc aatcgagaat 840
atcgtcaact gtttactaaa aatcagtttc atcaagcaat gaaacacgcc aaagtaaaca 900
atttaagtac cgttacttat gagcaagtat tgtctatttt taatagttat ctattattta 960
acgggaggaa ataattctat gagtcgcttt tgtaaatttg gaaagttaca cgttactaaa 1020
gggaatgtag atggatcc 1038
<210> 20
<211> 5390
<212> DNA
<213> 人工序列
<220>
<223> 组装人工叶酸盐操纵子作为表达盒
<400> 20
tcccggcaac agcttaatca gtacatccat cattccgaag catccgacat tcgatcatta 60
caaggaatta tttgcgggca aggaaagcct tcaatatgtg cagtggtatg tcaactctat 120
gaagatcagc ctgtttacaa tggcagggtc tttgctctgt gtgacgttta cggcctatgc 180
gttttcgcgc tttcggttta aagggaggaa atacgcttta acgctctttt tattgctgca 240
gatgattcct cagttttcag ctttaattgc cttgtttgtg ctggcgcaaa tcttgggaat 300
gatcaatagc cactggctgc taatcttgct ttatatcggc ggcctgatcc cgatgaatac 360
gtatttgatg aaagggtaca tggattccat tccgatggat ttagacgaaa gcgccaagat 420
tgacggagcc agcagcacca gaatcttctt ccagatcatt ctgccattat caaaaccgat 480
ggcggcagtc gtggccatga acggctttac cggtccgctc ggagattttg tgctgtcctc 540
aaccatattg agaacgcctg aatcatatac attgcccgtc ggtctattca atttagtgaa 600
tgatgtcatg ggggccagct atacgacatt tgcggccgga gccctgctta tcagcatacc 660
ggttgccgtc atctttatta tgctgcaaaa gaattttgtg tccggattaa ccgcaggcgg 720
aacgaagggc taagagaaca aggaggagaa tgtgatgtca aagcttgaaa aaacgcacgt 780
aacaaaagca aaatttatgc tccatggggg agactacaac cccgatcagt ggctggatcg 840
gcccgatatt ttagctgacg atatcaaact gatgaagctt tctcatacga atacgttttc 900
tgtcggcatt tttgcatgga gcgcacttga gccggaggag ggcgtatatc aatttgaatg 960
gctggatgat atttttgagc ggattcacag tataggcggc cgggtcatat tagcaacgcc 1020
gagcggagcc cgtccggcct ggctgtcgca aacctatccg gaagttttgc gcgtcaatgc 1080
ctcccgcgtc aaacagctgc acggcggaag gcacaaccac tgcctcacat ctaaagtcta 1140
ccgagaaaaa acacggcaca tcaaccgcta cgggtgcgca tgatcgtatg gttcactgtc 1200
caccaaccaa aactgtgctc agtaccgcca atatttctcc cttggggggt acaaagaggt 1260
gtccctagaa gagatccacg ctgtgtaaaa attttacaaa aaggtattga ctttccctac 1320
agggtgtgta ataatttaat tacaggcggg ggcaaccccg ctcagtacct agagcgtaaa 1380
agaggggagg gaaacactag ttggcttcgt tgggattctc cggtgatgct gatttcgctg 1440
cgtatgctgc gatgaaagaa gtcaataaag aacaaattga acaggcagtg agacagattc 1500
ttgaagcaat tggagaagat ccgaacagag agggcttact tgatacaccg aaaagagttg 1560
ctaaaatgta tgcggaagtc ttttcaggct taaatgaaga tccgaaagag cattttcaga 1620
caattttcgg agaaaaccat gaagagctgg tccttgtgaa agatattgcg tttcactcaa 1680
tgtgcgaaca tcacctggtg ccgttttacg gcaaggcaca cgttgcgtat attcctagag 1740
gcggaaaagt tacaggcttg tcaaaattag cacgcgcagt tgaagctgtt gcaaaaagac 1800
cgcaattaca ggaacgcatt acatctacaa ttgcggaatc aattgtcgag acattagacc 1860
ctcatggcgt tatggttgtc gttgaagctg aacacatgtg catgacaatg cgcggcgtca 1920
gaaaacctgg cgcaaaaaca gtcacatcag cagtcagagg cgtgtttaaa gatgatgcgg 1980
cagctcgtgc ggaagtcctg gaacatatta aacgccagga ctgaaaaaga ggggagggaa 2040
acattatgat gatttcattt attttcgcaa tggacgcgaa tagactgata ggcaaagaca 2100
atgatctgcc gtggcattta ccgaatgacc tggcttattt taaaaaaatt acaagcggcc 2160
atagcatcat tatgggacgt aaaacatttg agtcaattgg cagacctctt ccgaacagaa 2220
aaaacattgt tgtcacatct gcgccggatt cagaatttca gggctgcaca gtcgtctcaa 2280
gccttaaaga cgttcttgat atttgcagcg gaccggaaga gtgttttgtc attggcggag 2340
cgcaattata cacagatctt tttccgtacg cggatagact gtatatgaca aaaatccacc 2400
atgaatttga aggcgacaga cactttcctg aatttgacga gagcaactgg aaactcgtgt 2460
ctagcgaaca gggcacgaag gatgagaaaa atccgtatga ctatgaattt cttatgtatg 2520
aaaagaaaaa cagcagcaaa gcgggaggct tttgaaaaag aggggaggga aacattatga 2580
tgaacaacat tgcgtacatt gcgcttggct ctaatattgg agatagagaa acgtatctgc 2640
gccaggccgt tgcgttactg catcaacatg ctgcggtcac agttacaaaa gtcagctcaa 2700
tttatgaaac agatccggtc ggctatgaag accaagccca gtttttaaat atggcggttg 2760
aaattaaaac aagcctgaat ccgtttgaac ttctggaact gacacagcaa atcgaaaacg 2820
aactgggccg cacacgcgaa gttagatggg gcccgagaac agcggattta gacattctgc 2880
tgtttaacag agaaaacatt gaaacagagc agttaattgt cccgcatcct cgcatgtatg 2940
aacgcctgtt tgttcttgcg ccgcttgcgg aaatttgcca gcaggtcgag aaagaagcga 3000
caagcgcgga aacggatcaa gaaggagtta gagtttggaa acaaaaatca ggcgttgacg 3060
aatttgtaca tagcgaaagc tgaaaaagag gggagggaaa cattatgatg gcgcagcaca 3120
caatagatca aacacaagtc attcatacga aaccgagcgc gctttcatat aaagaaaaaa 3180
cactggtcat gggcattctt aacgttacac ctgattcttt tagcgatggt ggaaaatatg 3240
acagcttgga caaggcgctt ctgcatgcca aagaaatgat cgacgacggc gcgcacatta 3300
ttgacatagg aggcgagagc acaagaccgg gagctgaatg cgtcagcgaa gacgaagaaa 3360
tgtctcgggt cattccggtc attgaacgca tcacaaagga actcggcgtc ccgatttcag 3420
tggatacata taaagcatct gtggcagacg aagcagtcaa agcgggcgca tctattatca 3480
atgacatttg gggagcgaaa catgatccga agatggcaag cgtcgcagcg gaacataacg 3540
ttccaattgt cctgatgcac aatcggccag aacggaatta taacgacctt cttccggata 3600
tgctgagcga ccttatggaa tcagtcaaaa ttgcggttga ggcgggcgtg gatgagaaaa 3660
atattatttt agatccgggc atcggcttcg cgaagacata ccatgataat cttgcagtga 3720
tgaataagtt agagatcttc agcggacttg gctatcctgt cctgctggct acatctcgta 3780
aaagatttat cggaagagtt cttgatttac cgcctgaaga gagagcagag ggcacaggag 3840
cgacagtctg cttgggcatt cagaaaggat gcgacatagt gcgtgttcat gatgtcaagc 3900
aaattgccag aatggcgaaa atgatggacg cgatgctgaa taagggaggg gtgcaccatg 3960
gatgaaaaag aggggaggga aacattatga tggataaagt ttatgtggaa ggaatggaat 4020
tttatggcta tcatggcgtc ttcacagaag agaacaaatt gggacaacgc ttcaaagtag 4080
atctgacagc agaactggat ttatcaaaag caggacaaac agacgacctt gaacagacaa 4140
ttaactatgc agagctttac catgtctgta aagacattgt cgaaggcgag ccggtcaaat 4200
tggtagagac ccttgctgag cggatagctg gcacagtttt aggtaaattt cagccggttc 4260
aacaatgtac ggtgaaagtt attaaaccag atccgccgat tcctggccac tataaatcag 4320
tagcaattga aattacgaga aaaaagtcat aaattaattc tagaaattaa gaaggaggga 4380
ttcgtcatgt tggtattcca aatgcgttat gtagataaaa catctactgt tttgaaacag 4440
actaaaaaca gtgattacgc agataaataa atacgttaga ttaattccta ccagtgacta 4500
atcttatgac tttttaaaca gataactaaa attacaaaca aatcgtttaa cttctgtatt 4560
tgtttataga tgtaatcact tcaggagtga ttacatgaac aaaaatataa aatattctca 4620
aaacttttta acgagtgaaa aagtactcaa ccaaataata aaacaattga atttaaaaga 4680
aaccgatacc gtttacgaaa ttggaacagg taaagggcat ttaacgacga aactggctaa 4740
aataagtaaa caggtaacgt ctattgaatt agacagtcat ctattcaact tatcgtcaga 4800
aaaattaaaa ctgaacattc gtgtcacttt aattcaccaa gatattctac agtttcaatt 4860
ccctaacaaa cagaggtata aaattgttgg gaatattcct taccatttaa gcacacaaat 4920
tattaaaaaa gtggtttttg aaagccatgc gtctgacatc tatctgattg ttgaagaagg 4980
attctacaag cgtaccttgg atattcaccg aacactaggg ttgctcttgc acactcaagt 5040
ctcgattcag caattgctta agctgccagc ggaatgcttt catcctaaac caaaagtaaa 5100
cagtgtctta ataaaactta cccgccatac cacagatgtt ccagataaat attggaagct 5160
atatacgtac tttgtttcaa aatgggtcaa tcgagaatat cgtcaactgt ttactaaaaa 5220
tcagtttcat caagcaatga aacacgccaa agtaaacaat ttaagtaccg ttacttatga 5280
gcaagtattg tctattttta atagttatct attatttaac gggaggaaat aattctatga 5340
gtcgcttttg taaatttgga aagttacacg ttactaaagg gaatgtagat 5390
<210> 21
<211> 2124
<212> DNA
<213> 人工序列
<220>
<223> 四环素抗性盒
<400> 21
aattcttact gcagatagtg tacgtaaaaa gattaaatta ttgcttggtg aaaaaagtct 60
tgcaatggtg caggttgttc tcaatgtcga aaatatgtat ttgtatttaa cgcacgagag 120
caaggacgct attgctaaga agaaacatgt ttatgataag gctgatataa agctaatcaa 180
taattttgat attgaccgtt atgtgacgtt agatgtcgag gaaaagaccg aacttttcaa 240
tgtggttgta tcgcttattc gtgcgtacac tctccaaaat atttttgatt tgtatgattt 300
cattgacgaa aatggagaaa cttatgggtt gactataaat ttggttaacg aagttattgc 360
agggaaaact ggttttatga aattgttgtt tgacggagct tatcaacgta gtaagcgtgg 420
aacaaagaac gaagagagat aaaaagttga tctttgtgaa aactacagaa agtaaagaat 480
gaaaagagta atgctaacat agcattacgg attttatgac cgatgatgaa gaaaagaatt 540
tgaaacttag tttatatgtg gtaaaatgtt ttaatcaagt ttaggaggaa ttaattatga 600
agtgtaatta atgtaacagg gttcaattaa aagagggaag cgtatcatta accctataaa 660
ctacgtctgc cctcattatt ggagggtgaa atgtgaatac atcctattca caatcgaatt 720
tacgacacaa ccaaatttta atttggcttt gcattttatc tttttttagc gtattaaatg 780
aaatggtttt gaacgtctca ttacctgata ttgcaaatga ttttaataaa ccacctgcga 840
gtacaaactg ggtgaacaca gcctttatgt taaccttttc cattggaaca gctgtatatg 900
gaaagctatc tgatcaatta ggcatcaaaa ggttactcct atttggaatt ataataaatt 960
gtttcgggtc ggtaattggg tttgttggcc attctttctt ttccttactt attatggctc 1020
gttttattca aggggctggt gcagctgcat ttccagcact cgtaatggtt gtagttgcgc 1080
gctatattcc aaaggaaaat aggggtaaag catttggtct tattggatcg atagtagcca 1140
tgggagaagg agtcggtcca gcgattggtg gaatgatagc ccattatatt cattggtcct 1200
atcttctact cattcctatg ataacaatta tcactgttcc gtttcttatg aaattattaa 1260
agaaagaagt aaggataaaa ggtcattttg atatcaaagg aattatacta atgtctgtag 1320
gcattgtatt ttttatgttg tttacaacat catatagcat ttcttttctt atcgttagcg 1380
tgctgtcatt cctgatattt gtaaaacata tcaggaaagt aacagatcct tttgttgatc 1440
ccggattagg gaaaaatata ccttttatga ttggagttct ttgtggggga attatatttg 1500
gaacagtagc agggtttgtc tctatggttc cttatatgat gaaagatgtt caccagctaa 1560
gtactgccga aatcggaagt gtaattattt tccctggaac aatgagtgtc attattttcg 1620
gctacattgg tgggatactt gttgatagaa gaggtccttt atacgtgtta aacatcggag 1680
ttacatttct ttctgttagc tttttaactg cttcctttct tttagaaaca acatcatggt 1740
tcatgacaat tataatcgta tttgttttag gtgggctttc gttcaccaaa acagttatat 1800
caacaattgt ttcaagtagc ttgaaacagc aggaagctgg tgctggaatg agtttgctta 1860
actttaccag ctttttatca gagggaacag gtattgcaat tgtaggtggt ttattatcca 1920
tacccttact tgatcaaagg ttgttaccta tggaagttga tcagtcaact tatctgtata 1980
gtaatttgtt attacttttt tcaggaatca ttgtcattag ttggctggtt accttgaatg 2040
tatataaaca ttctcaaagg gatttctaaa tcgttaaggg atcaactttg ggagagagtt 2100
caaaattgat cctttctgca gaag 2124
<210> 22
<211> 419
<212> PRT
<213> 罗伊氏乳杆菌(Lactobacillus reuteri)
<400> 22
Met Arg Thr Tyr Glu Gln Ile Asn Ala Gly Phe Asn Arg Gln Met Leu
1               5                   10                  15
Gly Gly Gln Arg Asp Arg Val Lys Phe Leu Arg Arg Ile Leu Thr Arg
            20                  25                  30
Leu Gly Asn Pro Asp Gln Arg Phe Lys Ile Ile His Ile Ala Gly Thr
        35                  40                  45
Asn Gly Lys Gly Ser Thr Gly Thr Met Leu Glu Gln Gly Leu Gln Asn
    50                  55                  60
Ala Gly Tyr Arg Val Gly Tyr Phe Ser Ser Pro Ala Leu Val Asp Asp
65                  70                  75                  80
Arg Glu Gln Ile Lys Val Asn Asp His Leu Ile Ser Lys Lys Asp Phe
                85                  90                  95
Ala Met Thr Tyr Gln Lys Ile Thr Glu His Leu Pro Ala Asp Leu Leu
            100                 105                 110
Pro Asp Asp Ile Thr Ile Phe Glu Trp Trp Thr Leu Ile Met Leu Gln
        115                 120                 125
Tyr Phe Ala Asp Gln Lys Val Asp Trp Ala Val Ile Glu Cys Gly Leu
    130                 135                 140
Gly Gly Gln Asp Asp Ala Thr Asn Ile Ile Ser Ala Pro Phe Ile Ser
145                 150                 155                 160
Val Ile Thr His Ile Ala Leu Asp His Thr Arg Ile Leu Gly Pro Thr
                165                 170                 175
Ile Ala Lys Ile Ala Gln Ala Lys Ala Gly Ile Ile Lys Thr Gly Thr
            180                 185                 190
Lys Gln Val Phe Leu Ala Pro His Gln Glu Lys Asp Ala Leu Thr Ile
        195                 200                 205
Ile Arg Glu Lys Ala Gln Gln Gln Lys Val Gly Leu Thr Gln Ala Asp
    210                 215                 220
Ala Gln Ser Ile Val Asp Gly Lys Ala Ile Leu Lys Val Asn His Lys
225                 230                 235                 240
Ile Tyr Lys Val Pro Phe Asn Leu Leu Gly Thr Phe Gln Ser Glu Asn
                245                 250                 255
Leu Gly Thr Val Val Ser Val Phe Asn Phe Leu Tyr Gln Arg Arg Leu
            260                 265                 270
Val Thr Ser Trp Gln Pro Leu Leu Ser Thr Leu Ala Thr Val Lys Ile
        275                 280                 285
Ala Gly Arg Met Gln Lys Ile Ala Asp His Pro Pro Ile Ile Leu Asp
    290                 295                 300
Gly Ala His Asn Pro Asp Ala Ala Lys Gln Leu Thr Lys Thr Ile Ser
305                 310                 315                 320
Lys Leu Pro His Asn Lys Val Ile Met Val Leu Gly Phe Leu Ala Asp
                325                 330                 335
Lys Asn Ile Ser Gln Met Val Lys Ile Tyr Gln Gln Met Ala Asp Glu
            340                 345                 350
Ile Ile Ile Thr Thr Pro Asp His Pro Thr Arg Ala Leu Asp Ala Ser
        355                 360                 365
Ala Leu Lys Ser Val Leu Pro Gln Ala Ile Ile Ala Asn Asn Pro Arg
    370                 375                 380
Gln Gly Leu Val Val Ala Lys Lys Ile Ala Glu Pro Asn Asp Leu Ile
385                 390                 395                 400
Ile Val Thr Gly Ser Phe Tyr Thr Ile Lys Asp Ile Glu Ala Asn Leu
                405                 410                 415
Asp Glu Lys
<210> 23
<211> 406
<212> PRT
<213> 棉阿舒囊霉(Ashbya gossypii)
<400> 23
Met Glu Leu Gly Leu Gly Arg Ile Thr Gln Val Leu Arg Gln Leu His
1               5                   10                  15
Ser Pro His Glu Arg Met Arg Val Leu His Val Ala Gly Thr Asn Gly
            20                  25                  30
Lys Gly Ser Val Cys Ala Tyr Leu Ala Ala Val Leu Arg Ala Gly Gly
        35                  40                  45
Glu Arg Val Gly Arg Phe Thr Ser Pro His Leu Val His Pro Arg Asp
    50                  55                  60
Ala Ile Thr Val Asp Gly Glu Val Ile Gly Ala Ala Thr Tyr Ala Ala
65                  70                  75                  80
Leu Lys Ala Glu Val Val Ala Ala Gly Thr Cys Thr Glu Phe Glu Ala
                85                  90                  95
Gln Thr Ala Val Ala Leu Thr His Phe Ala Arg Leu Glu Cys Thr Trp
            100                 105                 110
Cys Val Val Glu Val Gly Val Gly Gly Arg Leu Asp Ala Thr Asn Val
        115                 120                 125
Val Pro Gly Gly Arg Lys Leu Cys Ala Ile Thr Lys Val Gly Leu Asp
    130                 135                 140
His Gln Ala Leu Leu Gly Gly Thr Leu Ala Val Val Ala Arg Glu Lys
145                 150                 155                 160
Ala Gly Ile Val Val Pro Gly Val Arg Phe Val Ala Val Asp Gly Thr
                165                 170                 175
Asn Ala Pro Ser Val Leu Ala Glu Val Arg Ala Ala Ala Ala Lys Val
            180                 185                 190
Gly Ala Glu Val His Glu Thr Gly Gly Ala Pro Val Cys Thr Val Ser
        195                 200                 205
Trp Gly Ala Val Ala Ala Ser Ala Leu Pro Leu Ala Gly Ala Tyr Gln
    210                 215                 220
Val Gln Asn Ala Gly Val Ala Leu Ala Leu Leu Asp His Leu Gln Gln
225                 230                 235                 240
Leu Gly Glu Ile Ser Val Ser His Ala Ala Leu Glu Arg Gly Leu Lys
                245                 250                 255
Ala Val Glu Trp Pro Gly Arg Leu Gln Gln Val Glu Tyr Asp Leu Gly
            260                 265                 270
Gly Val His Val Pro Leu Leu Phe Asp Gly Ala His Asn Pro Cys Ala
        275                 280                 285
Ala Glu Glu Leu Ala Arg Phe Leu Asn Glu Arg Tyr Arg Gly Pro Gly
    290                 295                 300
Gly Ser Pro Leu Ile Tyr Val Leu Ala Val Thr Cys Gly Lys Glu Ile
305                 310                 315                 320
Asp Ala Leu Leu Ala Pro Leu Leu Lys Pro His Asp Arg Val Phe Ala
                325                 330                 335
Thr Ser Phe Gly Ala Val Glu Ser Met Pro Trp Val Ala Ala Met Ala
            340                 345                 350
Ser Glu Asp Val Ala Ala Ala Ala Arg Arg Tyr Thr Ala His Val Ser
        355                 360                 365
Ala Val Ala Asp Pro Leu Asp Ala Leu Arg Ala Ala Ala Ala Ala Arg
    370                 375                 380
Gly Asp Ala Asn Leu Val Val Cys Gly Ser Leu Tyr Leu Val Gly Glu
385                 390                 395                 400
Leu Leu Arg Arg Glu His
                405
<210> 24
<211> 1399
<212> DNA
<213> 罗伊氏乳杆菌(Lactobacillus reuteri)
<400> 24
ttttactagt atgagaacat acgaacaaat taatgcagga tttaatcgcc agatgctggg 60
cggccagaga gacagagtca agttccttag acgcatcctt acgagacttg gaaaccctga 120
tcagcgcttt aaaattattc atatcgcggg aacgaacggc aaaggatcaa caggcactat 180
gttagaacag ggccttcaga atgcgggata ccgcgtcggc tactttagct ctcctgcgct 240
ggttgatgat cgcgaacaaa ttaaagtcaa tgatcacctt atcagcaaga aagattttgc 300
gatgacctat cagaaaatta cggagcatct gcctgctgac cttctgcctg atgatattac 360
aatctttgag tggtggacgt taatcatgct tcaatacttt gcggatcaaa aggttgactg 420
ggcggtgatt gaatgtggtc ttggcggcca agacgatgcg acaaacatca tctcagcgcc 480
gttcatttca gtcattaccc atatcgctct tgaccacacc cgtatcctgg gccctacaat 540
tgcgaagatt gcgcaagcta aggcaggcat tataaagaca gggactaaac aggttttcct 600
ggcaccacat caagagaagg atgcgttaac aatcattcgc gaaaaagcgc aacagcaaaa 660
ggtcggactg acgcaggcag atgcacagag cattgtggac ggaaaagcta ttttaaaagt 720
gaatcacaag atttacaagg tcccttttaa tctgctgggc acatttcagt cagaaaacct 780
gggaacggtt gttagcgtct ttaactttct gtatcagcgc cgtcttgtca cgtcatggca 840
accgttactt agcacactgg caacagttaa aattgcagga agaatgcaaa aaatcgcgga 900
tcatcctccg atcattcttg atggcgcaca taatccggat gctgcaaagc agcttacaaa 960
gacaattagc aaactcccac ataataaagt cataatggtg ttaggcttcc ttgctgacaa 1020
aaacatttca cagatggtca agatttacca acagatggcg gatgaaatta tcattacaac 1080
gcctgaccat cctacaagag cgctggacgc ctcagccctt aaatcagtct taccgcaagc 1140
aattattgcg aataatcctc gtcagggact ggttgttgct aagaaaattg cagagccgaa 1200
cgatcttatc atcgtcacgg gcagcttcta cacaatcaag gatattgagg caaatttaga 1260
tgagaaataa gcagaggctg tgatcagtct ctgctttttt ttctgcgttc tatttctttt 1320
tcacgttcac ggatgacgtc agtccgatcc cgcaaacggt gtttgtcgat aagaaatatg 1380
aattcgcgtg cgcattgga 1399
<210> 25
<211> 1360
<212> DNA
<213> 棉阿舒囊霉(Ashbya gossypii)
<400> 25
ttttactagt atggagttag gcttaggccg catcacacaa gtgctgagac aattacatag 60
ccctcatgaa agaatgcgtg tcttacatgt tgcaggaaca aatggcaaag gaagcgtctg 120
tgcgtattta gcggctgttt taagagcggg cggagaaaga gttggcagat ttacaagccc 180
tcacttagtt catccgcgcg atgctatcac agtcgacggc gaagttattg gagcggcgac 240
atatgctgca cttaaagctg aagtcgttgc ggcaggcaca tgcacggagt ttgaagcaca 300
aacggcggtt gcgcttacgc attttgcaag acttgaatgc acatggtgtg tcgtcgaagt 360
gggcgtcggc ggcagattag acgctacaaa tgtcgtccct ggcggacgca aactgtgtgc 420
aattacaaag gttggattag atcatcaggc gttacttggc ggaacactgg ctgttgttgc 480
aagagagaag gccggcattg tggttccggg agtgcgcttt gtcgctgtcg acggcacgaa 540
cgcaccttca gttctggcgg aggttcgggc ggctgcagcg aaagttggcg cagaggtcca 600
tgagacagga ggcgcgccgg tttgcacagt cagctggggt gcggttgctg caagcgcact 660
tccgttagcg ggagcttacc aggtacaaaa cgcgggcgtt gcacttgcac tgcttgatca 720
tcttcaacaa ctgggagaga tctcagtcag ccatgcagca ctggaaagag gactgaaagc 780
agtcgaatgg cctggcagac ttcaacaagt tgagtatgac cttggaggcg tccatgtccc 840
gctgttattt gacggagcac acaatccgtg tgcagcggaa gagcttgcaa gattcttaaa 900
cgagagatac cgcggaccgg gaggatctcc gctgatctat gtgctggctg tcacgtgtgg 960
caaagagatc gacgcacttc ttgcacctct tctgaaaccg cacgatagag tcttcgcaac 1020
cagctttggc gcggttgagt ctatgccgtg ggtcgcagcg atggcaagcg aggatgtcgc 1080
agcggcggcg agacgctaca cagcccacgt ttcagcggtt gcggacccgc tggacgcgtt 1140
acgcgccgca gcggcagcac gcggcgatgc taatctggtc gtctgcggat cattatatct 1200
tgtcggcgaa cttctgcgcc gcgaacatta agcagaggct gtgatcagtc tctgcttttt 1260
tttctgcgtt ctatttcttt ttcacgttca cggatgacgt cagtccgatc ccgcaaacgg 1320
tgtttgtcga taagaaatat gaattcgcgt gcgcattgga 1360
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 26
gcagcgaaat cagcatcacc 20
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 27
gactcgttag ccaggtcgtc 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 28
tcgataaaag aagccccgcc 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 29
ggtttccatg agggtcggtc 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 30
gctacctggc gcaaaaagaa 20
<210> 31
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 31
cggtagtcat tgctggcgaa 20
<210> 32
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 32
acgacctggc taacgagtc 19
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 33
ggcggggctt cttttatcga 20
<210> 34
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 34
gaccgaccct catggaaacc 20
<210> 35
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 35
ttctttttgc gccaggtagc 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 36
ggagaatccc aacgaagcca 20
<210> 37
<211> 152
<212> DNA
<213> 人工序列
<220>
<223> 包含Pveg启动子的片段
<400> 37
gcatcactat ctgcagtaaa atcggaattc aattttgtca aaataatttt attgacaacg 60
tcttattaac gttgatataa tttaaatttt atttgacaaa aatgggctcg tgttgtacaa 120
taaatgttac tagagtaaag gaggaaacta gt 152
<210> 38
<211> 228
<212> DNA
<213> 人工序列
<220>
<223> p15
<400> 38
gtgcgcatga tcgtatggtt cactgtccac caaccaaaac tgtgctcagt accgccaata 60
tttctccctt ggggggtaca aagaggtgtc cctagaagag atccacgctg tgtaaaaatt 120
ttacaaaaag gtattgactt tccctacagg gtgtgtaata atttaattac aggcgggggc 180
aaccccgctc agtacctaga gcgtaaaaga ggggagggaa acactagt 228
<210> 39
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 39
atctacattc cctttagtaa cgtgt 25
<210> 40
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 40
aaatctagaa attaagaagg agggattcgt ca 32
<210> 41
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 41
aaaggatcca tctacattcc ctttagtaac gtgt 34
<210> 42
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 42
tcccggcaac agcttaatca 20
<210> 43
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 43
ggagccgatt ctctgcgtta 20
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 44
aaaatgctcc ctgcggctat 20
<210> 45
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 45
caatgagagg ggttgctatg a 21
<210> 46
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 46
tcgaacggtc aagcacgtta 20
<210> 47
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 47
tttgctagca tgataattgg aatatgggca gaag 34
<210> 48
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 48
tttgcggccg ccctcctcgt catttcttca aaag 34
<210> 49
<211> 6975
<212> DNA
<213> 乳酸乳球菌(Lactococcus lactis)
<400> 49
atgataattg gaatatgggc agaagatgaa gcaggtctta tcggtgaagc tgataaaatg 60
ccttggtctt tacctgctga acaacaacat tttaaagaaa caaccatgaa tcaagtgatt 120
ttgatgggac gaaaaacgtt tgaaggcatg aataaacgtg tattgccagg gagaataagt 180
attattttaa ctcgcgatga aacttatcaa tcagataatg aaaaagtgct catcatgcac 240
agccctaagg aagttctaga ttggtaccat aagcaaaata aagacttatt tatcacagga 300
ggagctgaaa ttttagccct ttttgaatct gaacttgaat tgctctatcg aacagttgtt 360
catgaaaaat ttaaaggaga tacttatttt ccaagtacat ttgactttgg aagatttaag 420
ctagtctctg aaaaatttca cgataaagat gagcggaatt cttatacttt tacaattaaa 480
aaatatgaaa aagtgaaaca accatgacaa aatcaatttt tgggcttttc acagctctcc 540
tttgttggat tagcattgtc atcgctattc aatgctttag aaaaaaacgt tggggtctgg 600
gagtattgtt tttactcaat gcttttacga acctcgtaaa tacaattcac gctttttctg 660
gaactttatt ttaaaaaata aaaaaagtgc cttttaagta agccaataac acttactttt 720
tatgttagtg aaatcaggaa taaaataact atgtcaaata cacaaaatcc aaatatacat 780
tgttctttct gtggaaagag tcaagatgat gtaaaaaaat tgattgccgg ttcagacgtt 840
tatatttgta atgaatgtat tgaactttca actcgaatct tagaagaaga attaagagaa 900
gaacaagatt cagaaatgct tgaagttaaa acacctaaag aaatgtttga ccatttaaat 960
gaatatgtga taggtcaaga aaaagcaaaa cgtgcacttg cagttgccgt ttataatcat 1020
tacaaacgaa ttaattttgc agcaagtaaa attgctgaag atattgaact acaaaaatca 1080
aatattctat taatcggacc taccggttct ggtaagactt ttctcgctca aactttagcg 1140
aaatcactca acgttccatt tgcgattgca gatgcgacaa gtttaactga agctggttat 1200
gttggagaag acgttgaaaa tattctctta aaacttttac aagcgagtga tttcaatatt 1260
gaacgtgctg aacgtggaat tatctatatc gatgaaattg ataaaattgc taaaaaatct 1320
gaaaatgtat caattactcg tgacgtttcc ggggaaggtg ttcaacaagc ccttttgaaa 1380
attattgaag gaacggtagc tagtgttcca ccacaaggtg gacgtaaaca tcctaatcaa 1440
gaaatgattc aaattgatac caaaaatatc ttatttattg ttggtggagc ttttgacggg 1500
attgaagaaa ttgtcaaaca acgtttaggt gaaaaaatta ttggttttgg tgccaataat 1560
aaaaaattaa atgacgatga ttcttatatg caagaaatta ttgccgagga cattcaaaaa 1620
ttcggattaa ttcctgaatt tattggtcgt ctgccaattg ttgctgcttt ggaacgtttg 1680
accgaagagg atttgattca aattttgaca gaacctaaaa atgctttgat taaacaatat 1740
aaacaactcc ttttatttga taatgttgaa cttgaatttg aagatgaagc cctcatggca 1800
attgctagaa aagcaattga gcgcaaaaca ggagcgcgtg gacttcgttc aattattgaa 1860
gaagtaatga tggatatcat gtttgaagtt ccaagtcatg aagaaattac aaaagttatt 1920
attaatgaag cagttgttga cggaaaagct gagccacaaa tgattcgaga ggccaagaaa 1980
aaatgaccat aaatacaaat aatctgacaa taacaatttc agcagcatca aaaaaacaat 2040
atccagaaaa tgattggcca gaaattgcct tagctgggcg ttcaaatgtc ggtaaatcaa 2100
gttttattaa tactttactt aatcgtaaaa actttgccag aacttctggt caacctggta 2160
aaacacagtt gctcaatttt tataatattg atgatcaact tcatttcgtt gacgtacctg 2220
gttacggcta cgctcgtgtt tctaaaaagg aacgcgaaaa atggggtaaa atgattgagg 2280
aatatttgac aacaagagaa aatttaaaag cagttgtcag cttagttgat attcgtcatg 2340
aaccctcaga agatgatttg atgatgtatg agtttttgaa atactaccat attccagtga 2400
ttttagttgc gaccaaagcc gataaagttc cacgtggtaa gtggaataaa catgaatcta 2460
ttatcaaaaa agcaatgaaa tttgatagta cagatgattt tattatcttt tcttctactg 2520
ataagacagg atttgaagaa gcttgggaag cgattttaag atatctctga aaatagtgct 2580
atgaagagat tcatagcctt ttctacactt aaaaagagga aatatgtaca aaataaaact 2640
taataatata aaatttaggg cacatattgg tgttctgcca gaagaaaaag ttctcggaca 2700
aaatctcgaa attgatttaa tcgtggaaac aaattttgat ttttcaggaa aagacgaatt 2760
agatgaaact ttgtcttatg ttgatttcta tgaggcaaca aaagcagttg tagaatcttc 2820
aaaagctgat ttaattgaac atgttgcctt tgaaattatt caagcagtaa aggctacttc 2880
agagcgtata tcaacggttg aagtccatct tagaaaatta gccgtaccga ttgaaggaat 2940
ttttgattca gctgaaattg agatgagagg ctaaagctgg tttttaagat aaatatttta 3000
aagagataga agagaaacaa aatcataaaa gattatgtct aaatggagga cttatgcaaa 3060
caacttactt aagcatggga agtaatattg gtgaccgtca gtattattta catgaagcca 3120
ttcgtttatt gggaaaacac cctaaaatta tgattgaaaa agtatcaaat ttttatgaaa 3180
gtactccagt cggcggcgtc aaacaagatg attttactaa tttggcatta aaggtggcaa 3240
cgctacttga acctttggaa ttattatctt ttattcatga agttgagtta tctttgaacc 3300
gtgagcgaaa aattcattgg gggccaagaa caattgatat tgatattatt ttctatgacg 3360
acttagaaat gcaagtagaa aacttggtta ttccacataa agaagctttt aatcgtcttt 3420
ttgtcttgaa acctattttt gaacttattg ataaagactt taaatattat gcgtcaatag 3480
aaaaagcaat agccgaactt tcagtaagtg aacaagagct ccatgtaata aaagaagaaa 3540
aaacaccgag aaatcgtatt gaagatgccg ttaaagagat tctctttgca gtaggtgaaa 3600
atccaaatcg agaaggatta cttgaaactc cagcaagagt agctaaaatg tatgaagaaa 3660
ttctttcgtc acaacgctta agcaagttta atgagtataa actttttgaa attgattctt 3720
ctaaaacgga ttcaatcgtg ttgattaaag atattccttt ttattcaatg tgtgagcatc 3780
atatgttacc attttttggg aaagctcatg ttgcatatat tccagctgat ggaaaaatta 3840
ttggcttgtc aaaaattccc cgtttagttg attatgtttc gcgcaaactc tcggttcaag 3900
aaaatatcac tcatgatatt ggagatattt tgactgatat tttgaatcct aaaggagtgg 3960
cagttcttgt tgaaggacgt catatgtgcg ttgaaatgcg tggagtaaaa aaagtaaatt 4020
ctattactaa aacttcttat tttttaggtg aatttaaaga aaataatgaa aaaagaatgg 4080
aatttttaga aagtctttta tgaaaatctt agaacttaat caagaatctt tttctcttaa 4140
aaatattatc ctaaaatttg atgagttaaa tcacaatgaa atgatttctc ttcaaaaaaa 4200
actttatcga aatggtagtt tgacaagact ggctccagac tccttgttag tagttttaac 4260
aattgatgac ttagcaaaat tgattaatct ttttgaaaat gatgaagata aaaaaatgct 4320
tgaagtgatt tataagcgtc atcaaatcat ttggtcaggt aaaaatttca attttgattt 4380
aactagaaag tcaattgtct attcaatcgt caatgttaca ccagactctt tttatgatgg 4440
aaatccagat aatttaaacc tctctcatat tttaaaaaga gtagaagctg atttagaaaa 4500
tggagcttct gttcttgagc tgggagggaa atcatcgaaa ccaggatatg acgatattag 4560
cccagaagag gaatggaaca gactgaaaga acctattctt gagttgaaaa aaaactttcc 4620
taaagcgatt tttgctgtcg atacggatga agcttatgtc atggaacgag ttttagacgc 4680
tggggttgat attattaacg atattgatgg ttttgataca aatgataaat taaaagtggt 4740
agaaaagtat caaccggctt tagttgctat gaataatggg cgagctggtt ttagttatgc 4800
tgataatgtt tatgaagaac ttccattatt ttttgaaaat aaaaaagaag agttacttca 4860
acttggttta aaagctgagc aaatcgttat tgatcctgga gttggttttt ttaatggaga 4920
ttcaggttca gatagtcttg agcgggttaa agcaactgaa attttaagca gaataggttt 4980
acctcttatg attgcaatct ctcgtaagtc atttatggga aaactcttca atgcccaagg 5040
agatgagcgg cttttttcaa gccttgtcct agaagcgcaa atggttgctg atgggggacg 5100
gattttgcgt gttcatgatg ttaaggagac taaacgttta ctcgatgcaa ttgaaattta 5160
taaggaattt taaaaatgaa tgaagaccta attgctgaaa ttcaagcttt atctgctatt 5220
ggaagtgaag aaaaattttc cgagattatt cgattattga aaaattcgac tttagagctt 5280
cgggggaaaa agaatccaga tttacaattg tcagcaagtg cattagtttt taaaaaacat 5340
aaactatttt ttattgaaca cccttatcaa aaggagcttt tgcttccagc aggtcatgtt 5400
gaactaggag aaaagccatt ggaaactgcg attcgtgagt tccatgaaga aacaggtttt 5460
tcagcgtcag aatcaggcaa gttggtagat gttaacttga ttaatattcc ttacaacaaa 5520
attaagaatg agaaagaaca tcaacacatt gattttcgtt ttctattgga actaaaagaa 5580
aaagaagcag gccttgctga attgcctttt ttccttcttg atagaactga agctcctgat 5640
gaatttaaaa aatattatca atacaaaaga taaagtagaa aaggtcacaa aatgtctata 5700
gaagaagcat tggaatggat acattcacgt ttaaaattta atattcgccc aggcctaagt 5760
cgtgtttcgg cccttttaga attgcttggt catccagaag agtctttgtc aatgattcac 5820
gttgctggaa caaatggaaa aggctccaca gtcgctttca cacgctcaat ctttatgcag 5880
gcaggtctga aggttgcttc tttcacaagt cctttcatca ccacttttgg tgagcggatg 5940
tcgattaatg cactcccgat tgctgatgat aaattaattt attatgtaga aatgatccaa 6000
ccacttgttg ctgaacttga taaagatgct gaactgactg gaattaccga atttgaaatt 6060
atcacggcaa tggcttttaa atatttctct gatgagcagg ttgatttagc ggttattgaa 6120
gttggtttag gtggacttct tgattcaaca aatgtgatta aacctgttgt ttctggaatt 6180
acaacaattg gtttagatca tattgatatt cttggttcga ccattgaaga aatcgcagct 6240
caaaaggctg gaattattaa accaggaatt ccagtagttg ttggaaatat tgaattaaaa 6300
gcacttcggg ttatatggga agtggctaga aaaaatacag cgcgtgttta tcaatttcca 6360
tatgattatc gtacggaagt ggaagaacac gaacatttta atttcttttc tggtcaagaa 6420
gcaatattgg atattgaaaa atctttagtt ggcttacatc aaatagaaaa tgctggtatg 6480
gctattgaac tttctctggt ttatgcaagt aaggttggga ttgaattgac tgaggatgtg 6540
attcgctctg gaattcgtga ggctttttgg ccagctcgta tggaaaaatt gggtgaaaaa 6600
ccactcattt tactggatgg tgctcataat gttcatgcga tgaatcgttt gcttgaaaat 6660
cttagctctg agtttccaga taaaaaaatt acaatcattt tttcagccat taccacaaaa 6720
gatattagtc aaatgataaa aatgcttcaa actgtgaaaa attcgcatct gattttgaca 6780
acttttgatt atccaaaagc tttgaatttg ggagattttc aaagattgga agaagaaggg 6840
gttgaattgg ctccaagttg ggaattagct ttagttcgtg cgcaaaaaaa tttagctgaa 6900
gatgatttgt tattagttac aggctctctc tatttctcat ctcaagttcg tgagtttttg 6960
aaaaaagaga agtaa 6975
<210> 50
<211> 2463
<212> DNA
<213> 人工序列
<220>
<223> 合成叶酸盐生物合成基因fol1-AG
<400> 50
atgcagtccc ttggattcaa gtgtttgctg tctcgcagga gcctgagcag gatatcaatc 60
tgtacaagag gaatgagtag tgctaacggt ggacgaagta atgatactgt gcatatacag 120
agacaggcac tgaaagttgt tgctgggctt gacggatggg gtcaattgca ggcgcaggat 180
gtgaaattga ccatgaatat gaacacagat tttcgtgctt cctcgcagac ggatgatctg 240
aagtactcct tgaattatgc ggtgatttca cgtggggtgc ataggttcgt tgagggctgt 300
ggacggtacc gctctcttgg tcacttggcc agggaggtaa agaagttttc catgaatgag 360
tatccgggta tccaaactat agaggtgggt gcggaggcgg acgcggccca tttgcgatgc 420
ggaagtctgg gcgtcgtggt gaacagcgat gggcatcgtc ctgatgagat tttgctttct 480
ggaatgaagc ttctgacact aataggggtg ttcacttttg aacggcgtcg gaagcagtac 540
gttgacttga agctgtcatt tccgtggccg aaggaggctg gtgaatttcc ggattgccag 600
gaattattgg acgatgttgt gagctatgta gagagagcga attttaaaac ggcagagtct 660
cttgctgaga gtgtagctca cgttgttacc ttgagagagt attttcagct gcatcgtggg 720
ttaccggtaa aagtcaaggt aattaagctt aatgccatta ctgagactga gggagttggt 780
gtgagctgtg taagaagtgc ggatgaattt acggggaaac cgcccttctg ggaagatatt 840
ccaaacgatc gagcagacgt gtttaacctt cctgtattcc agcagccaca tgcatctgtc 900
agtgagtgga atcgtgtgtt tctggcgttt ggatctaata taggggatag gtttgctcac 960
attgagcgaa gcttacgtct acttgcggaa gatcctaaag ttaaactact tcgctcgtcg 1020
tctctgttcg agagtgaacc aatgtacttt aaggagcagt ccccgtttat gaatggcgtt 1080
gtagaagtgc agacacggta tagcccgcac gagttactag agctatgcaa aaggatagaa 1140
tatgaacatt taaaacgtgt caaagagttt gataacggcc ctcgcagcat tgatttagat 1200
attttattgt accaaaatgc aaactttgag catgtggtac tgaactccga ggatttagtt 1260
attcctcatc caaggatgtt ggagagatcg tttgttttag agcctctctg tgaattgttg 1320
gctttccatg aagtgcaccc catttcggct gaatctgtcc aaagtcacct aaaagaattg 1380
taccgtaagg ggaataagga agacattctt gttaaacttg tacctttgcc gggtattccg 1440
tcaaatatac ctacaacgcg atttctgaag tttagacggg agtatgagga ggatcaatcg 1500
acaagcgaat tggttcttag gaccaagtca aatacatatg tcatgggcat cgtgaatgtg 1560
acacctgatt ctttttctga tggatctcct atgtggaatg atgttaatca tttcctctta 1620
aaagtacaaa ggatgatcct tgacgttttg aagttacatg aaaacgttat cattgatatt 1680
ggaggctgtt cgactaggcc tggtagtcag caaccatcag tggaagaaga acttagtcgt 1740
actattcccc taataacagc gatcaggggt tgcagagatt tttcgcaaga gaatgtgatc 1800
atatctatag acacttacag aagtgctgtt gctgaaaagg ccataacagc aggggctgat 1860
attgtgaacg atatttcagg aggtagtttt gatacaaata tgtttaaggt tatcagcgcg 1920
tatccgaatg ttggttatgt gctatcacac ataaggggag atatgactac catgacgagc 1980
ctgaataagt atgatgatac agttggtttg gatggcgttg aagaattcat ttacggtaag 2040
aaacagcact cagaacggac taaggtgatc cggaacattt gtagggaact tgcggagcga 2100
taccagcttg cccttgctag cggaattaag cgctggcaga ttattttgga tccgggtatt 2160
ggttttgcga agaatgctaa acagaactta gatatcatca agcatacccc gtcaattaag 2220
ggttatagtt gtgtgacaca tggacaattt gtaaattttg ccaaccttcc tgtgttgctt 2280
gggccttcca ggaagaactt tattgggact ataattcaag aggcacaggt cgagcgaagg 2340
gactttgcaa cggggactat tgtaggctcc tgtgttggtt atgatgcgga tatcatcagg 2400
gtacatgatg taactaactg tagcaaaagt gctaggttag cggatgagct ttataggaaa 2460
tag 2463
<210> 51
<211> 732
<212> DNA
<213> 人工序列
<220>
<223> 合成叶酸盐生物合成基因fol2-AG
<400> 51
atgtgtcagg ggggcagtaa aggactagtt aggcaggaca cgcccctaaa gacgaggcct 60
gtctcgccat atacgctcca ggccccagtt gaggcggacg gactgtcctg gccgagtgca 120
ggggcacgtg tgcgggtcga ggagggcacg gaggaagagg cggcacgcgc agcccggata 180
gctgatgcag tcaagacgat tttgacggag ctgggcgaag acgtgacgcg ggagggcctg 240
ctggacaccc cgcaacggta cgccaaagcg atgctgtact tcaccaaggg ctaccaagac 300
aatattttga acgatgtgat caataatgct gtgtttgacg aagatcatga cgagatggta 360
attgtgcggg atattgagat ccattcgctg tgcgagcacc acctggtacc cttcttcggg 420
aaggtgcata ttggctacat acctcggagg agagtcctcg ggttgtcgaa gctcgcccgg 480
ctagcggaaa tgtacgcgcg caggctgcag gtgcaggagc ggctgacgaa gcagattgcg 540
atggcattgc aggatatact gcgccctaga ggagtagccg ttgtggtgga ggccacgcat 600
atgtgcatgg tgtcacgggg ggtccagaag tccgggtcct caactgtcac ctcgtgtatg 660
ctgggctgct tcagagacat gcacaagacc cgggaagaat tcttgaacct cttgagaaat 720
agaagtgtat ag 732
<210> 52
<211> 2484
<212> DNA
<213> 人工序列
<220>
<223> DNA片段FOL1-AG
<400> 52
ttttactagt atgcaatcac tgggctttaa atgtcttctg agcagaagaa gcctgagccg 60
cattagcatc tgcacgagag gaatgagctc agcgaatgga ggaagaagca atgatacagt 120
tcatattcag cgccaggcac ttaaggtcgt tgcgggcctt gatggctggg gacagctgca 180
ggcgcaagac gttaagctga caatgaacat gaacacagac tttcgtgcgt caagccaaac 240
agatgacctt aaatacagcc ttaattacgc tgtgattagc cgtggagtcc accgttttgt 300
cgagggatgc ggaagatacc gtagcctggg acatctggcg agagaggtca aaaagttttc 360
aatgaatgag taccctggca ttcagaccat tgaggtgggt gccgaggcgg acgcggcaca 420
cctgagatgc ggatctttag gcgttgttgt gaatagcgat ggacacagac ctgatgagat 480
cttattgtca ggcatgaaac ttctgacgct gattggagtc tttacattcg agcgtcgcag 540
aaagcaatac gtcgatctga aactgagctt cccgtggcct aaagaagcag gagagttccc 600
ggattgtcag gaacttctgg atgacgttgt gagctacgtc gagagagcga acttcaaaac 660
ggcagagtct ctggcggagt ctgtggcaca cgtggtcaca cttcgcgaat attttcaact 720
tcatcgtggc ttgcctgtca aagtgaaagt cattaagctg aacgcgatca cagaaacgga 780
gggcgtcgga gttagctgtg tcagatctgc cgatgaattt acaggcaagc ctccattttg 840
ggaagacatc ccgaacgata gagcggacgt ctttaattta cctgtgttcc agcaacctca 900
tgcaagcgtt tcagagtgga atagagtgtt tctggcgttt ggctccaaca ttggagatag 960
attcgcgcat atcgagagat ctttacgtct gcttgctgaa gatcctaaag tcaaactgct 1020
tagaagcagc agccttttcg aatctgagcc tatgtatttc aaggagcagt ccccgtttat 1080
gaacggagtc gttgaggtcc aaacgagata ttcaccgcat gaacttttag agttgtgcaa 1140
acgtatcgaa tatgaacacc tgaaacgtgt taaagagttt gataatggcc cgcgttcaat 1200
tgacctggat atcttactgt accagaacgc gaactttgag catgtggtcc ttaattccga 1260
agacctggta attccgcatc ctagaatgct ggaacgcagc ttcgtgctgg agcctttatg 1320
cgagctgctt gcgtttcacg aggttcaccc tatatcagcc gagtcagtgc agagccatct 1380
gaaagaatta tacagaaaag gcaataaaga ggacatttta gtcaagttag tccctctgcc 1440
tggaatccct tctaatattc cgacgacgag atttcttaaa tttagacgcg aatatgaaga 1500
ggaccagtct acatcagaat tagtcctgcg tacgaaaagc aacacatacg ttatgggaat 1560
tgtcaatgtt acgcctgact catttagcga cggctcacct atgtggaacg acgtcaatca 1620
tttccttctg aaggtgcaac gcatgatcct ggatgtcctg aaactgcatg agaatgtcat 1680
tattgatatc ggaggctgct ctacaagacc tggctctcag caaccgagcg ttgaagaaga 1740
gttatcacgc acgattcctc ttattacagc tattcgcggc tgcagagatt tttcacaaga 1800
gaatgttatt atctcaattg acacataccg gtcagcggtc gctgagaaag caattacggc 1860
aggagcggat attgttaatg atatttctgg cggatctttc gatacaaata tgtttaaagt 1920
tatttcagcg tatcctaatg tcggctacgt tctgtcccat atccgtggcg atatgacaac 1980
gatgacgtca ctgaacaaat atgatgacac agtcggctta gatggcgttg aggaatttat 2040
ctatggcaaa aaacaacatt cagaacgtac aaaagtcatc cgtaacatct gtcgcgaact 2100
tgcagaacgc taccagcttg cacttgcttc aggcattaaa cgctggcaaa ttatccttga 2160
tcctggcatt ggcttcgcta aaaatgctaa acaaaacctg gatattatta aacacacgcc 2220
gagcattaaa ggatactcat gtgtgacgca tggacaattt gtgaatttcg cgaatttacc 2280
ggtactgctg ggcccgtctc gcaagaattt catcggcaca attattcagg aggcgcaagt 2340
agaacgcaga gatttcgcaa caggcacgat tgtgggctca tgtgtcggct atgacgctga 2400
tattatccgc gttcacgatg tcacgaattg tagcaagagt gcacgcctgg cggatgaact 2460
gtatcgcaaa taaggatcca tttt 2484
<210> 53
<211> 1090
<212> DNA
<213> 人工序列
<220>
<223> DNA片段FOL2-AG
<400> 53
tattggatcc tatggttcac tgtccaccaa ccaaaactgt gctcagtacc gccaatattt 60
ctcccttggg gggtacaaag aggtgtccct agaagagatc cacgctgtgt aaaaatttta 120
caaaaaggta ttgactttcc ctacagggtg tgtaataatt taattacagg cgggggcaac 180
cccgctcagt acctagagcg taaaagaggg gagggaaaca ctagtatgtg tcaaggcgga 240
agcaaaggac tggttagaca agacacaccg ctgaaaacaa gacctgtctc accttataca 300
ctgcaagcac ctgtcgaagc agacggatta agctggccga gcgcgggcgc gagagttaga 360
gtggaagagg gaacggagga agaagcagcg cgcgcggcta gaattgcgga tgcagtcaaa 420
acaatattaa cagagctggg cgaagacgtg acaagagaag gtcttctgga cacaccgcag 480
cggtatgcga aagctatgct gtactttacg aagggatacc aagacaacat cctgaacgat 540
gtcattaaca atgcggtttt tgacgaggat catgatgaga tggttatcgt tcgcgacata 600
gagatacaca gcctgtgtga gcatcacctg gtcccatttt tcggcaaggt ccacataggc 660
tacattccga gaagacgtgt cctgggactt tctaaactgg cgcgcttagc tgaaatgtac 720
gcacgcagac tccaggtcca agaacgttta accaaacaga tcgcaatggc actgcaagat 780
atccttcgcc ctagaggcgt ggcagtcgtt gttgaggcta cgcacatgtg catggtctct 840
cgcggagtgc aaaagagcgg atcatcaacg gtaacatcat gtatgctggg atgtttcaga 900
gacatgcaca agacgagaga ggaatttctt aatttactta gaaacagaag cgtttaagca 960
gaggctgtga tcagtctctg cttttttttc tgcgttctat ttctttttca cgttcacgga 1020
tgacgtcagt ccgatcccgc aaacggtgtt tgtcgataag aaatattacg taatatggcc 1080
tcgagtttta 1090
<210> 54
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 54
tattggatcc tatggttcac tgtcc 25
<210> 55
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 55
gcggtagtgg tgcttacgat 20
<210> 56
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 56
tgcagggtct ttattcttca act 23
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 57
gcggtagtgg tgcttacgat 20
<210> 58
<211> 1221
<212> DNA
<213> 棉阿舒囊霉(Ashbya gossypii)
<400> 58
atggagctgg gactcgggcg gataacacaa gtgctgcggc agcttcacag cccgcatgaa 60
aggatgcgcg tgctgcacgt ggccggtacg aacggtaagg gctcggtctg tgcgtacctc 120
gcggcagtgc tgcgcgcggg cggagagcga gtgggaaggt tcacgagccc gcacctggtg 180
cacccgcggg atgcgatcac ggtggatggg gaggtgatcg gggcggcgac gtacgcggcc 240
ctgaaggcgg aggtggtcgc ggcggggaca tgcacggagt ttgaggcgca aacggcggtg 300
gcgttgacgc actttgcgcg gttagagtgc acgtggtgtg tggtggaggt gggcgtgggc 360
gggcggctgg acgcaacgaa cgttgtgccg ggaggccgca agctgtgcgc catcaccaag 420
gtaggactag accaccaggc gctgctcggc gggacgctgg cggtggttgc gcgcgagaag 480
gcggggattg tggtgccagg cgtgcggttt gtggcggtgg acggaacgaa cgcgccgagt 540
gtgcttgcgg aggtgcgtgc tgcggcagcg aaggtggggg cggaggtgca cgagacggga 600
ggggcgcctg tgtgtacggt ttcatggggc gcagtggcgg cgagcgcgct gccgctggcg 660
ggtgcgtacc aagtacagaa cgcaggcgtg gcgctagcgc tgctagacca tctgcagcaa 720
ctgggggaga tctcggtgag tcacgcggca ctggagcgcg ggctcaaagc agtggagtgg 780
ccgggacggc tgcagcaggt ggagtacgac ctgggcggcg tccacgtccc actgctcttt 840
gacggggcgc acaacccctg tgctgcagag gagctggctc gctttctcaa tgagaggtac 900
cgcgggcccg gaggctctcc gctcatttac gtactggcgg tgacatgtgg caaagagatc 960
gatgcgcttc tggcgccgct gttaaagccg cacgaccgag tgttcgccac atcgttcgga 1020
gccgtggaga gcatgccgtg ggtagcggct atggcctccg aggacgttgc ggcagcggct 1080
cgtcgctaca cggcgcacgt gtctgcggta gcggacccgc tggacgccct gcgggcggca 1140
gctgccgccc ggggcgacgc aaaccttgtc gtttgcggct cgctttatct tgtgggcgag 1200
ctgctgcgcc gcgagcacta g 1221
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 59
taggaggcga gagcacaaga 20
<210> 60
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 60
gccgagttcc tttgtgatgc 20
<210> 61
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 61
gcccgagaac agcggattta 20
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 62
cgcaagaaca aacaggcgtt 20
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 63
tggcgttatg gttgtcgttg 20
<210> 64
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 64
taaacacgcc tctgactgct 20
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 65
ggcggagcgc aattatacac 20
<210> 66
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 66
caggaaagtg tctgtcgcct 20
<210> 67
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 67
gattggccgc ttacacatgg 20
<210> 68
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 68
aacgtttggg cttctaccga 20
<210> 69
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 69
cagctcgtgt cgtgagatgt 20
<210> 70
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 70
agagtgccca actgaatgct 20
<210> 71
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 71
gccctgcata aggaatttaa c 21
<210> 72
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 72
agcttatgga catacgactg atg 23
<210> 73
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 73
tgaacggaca gacatggtcg 20
<210> 74
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 74
acagcgtgag ccgtatgatt 20
<210> 75
<211> 53
<212> DNA
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 75
ctgtatccgc gggtgaaaga gagtgtttta catataaagg aggagaaaca atg 53
<210> 76
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 包含突变的调节区
<400> 76
ctgtatccgc gggtgaaaga gagtgtttta catataaaag aggagaaaca atg 53
<210> 77
<211> 2742
<212> DNA
<213> 人工序列
<220>
<223> BS-FOLOP1-COMB
<400> 77
gcgcgctacg tagggcgcgc tagcggccaa ttttgtcaaa ataattttat tgacaacgtc 60
ttattaacgt tgatataatt taaattttat ttgacaaaaa tgggctcgtg ttgtacaata 120
aatgtatatt aagaggagga gatatatata atgatttatg tcaacggaag atacatggaa 180
gaaaaagacg cagtcctgag cccgtttgat catggctttc tttatggaat tggagttttt 240
gaaacgttcc gcctttatga aggatgtccg tttctgcttg attggcatat cgaacgcctt 300
gaaagagctc tgaaagacct tcaaatcgaa tatacagtta gcaaacatga aattcttgaa 360
atgcttgata aacttcttaa acttaatgat attaaagatg gcaacgcgcg cgtcagactt 420
aatatctcag caggaattag cgataaaggc tttgtcgcgc agacgtatga taaacctacg 480
gttctttgct tcgttaatca acttaaaccg gaaagccttc cgcttcaaaa agaaggcaaa 540
gtccttagca tcagacgcaa tacgcctgaa ggatcattta gactgaaatc tcatcactac 600
cttaataata tgtatgcgaa acgcgaaatt ggcaatgatc cgcgcgtcga aggaatcttt 660
ctgacggagg atggcgcagt tgcagaagga atcatttcta acgttttttg gcgcaaaggc 720
cgctgcattt atacaccgtc acttgataca ggcatcctgg atggagtcac acgcagattt 780
atcattgaaa atgcaaaaga tattggcctt gaacttaaaa caggacgcta tgaacttgaa 840
gcgctgctta cggcggatga agcgtggatg acgaactcag tccttgaaat tattccgttt 900
acaaaaatcg aagaagtcaa ctatggctca cagagcggag aagcaacgtc agcgcttcaa 960
cttctttaca aaaaagaaat aaagaacatg attcatgaaa agggaggaag agcatggcgc 1020
agcacacaat agatcaaaca caagtcattc atacgaaacc gagcgcgctt tcatataaag 1080
aaaaaacact ggtcatgggc attcttaacg ttacacctga ttcttttagc gatggtggaa 1140
aatatgacag cttggacaag gcgcttctgc atgccaaaga aatgatcgac gacggcgcgc 1200
acattattga cataggaggc gagagcacaa gaccgggagc tgaatgcgtc agcgaagacg 1260
aagaaatgtc tcgggtcatt ccggtcattg aacgcatcac aaaggaactc ggcgtcccga 1320
tttcagtgga tacatataaa gcatctgtgg cagacgaagc agtcaaagcg ggcgcatcta 1380
ttatcaatga catttgggga gcgaaacatg atccgaagat ggcaagcgtc gcagcggaac 1440
ataacgttcc aattgtcctg atgcacaatc ggccagaacg gaattataac gaccttcttc 1500
cggatatgct gagcgacctt atggaatcag tcaaaattgc ggttgaggcg ggcgtggatg 1560
agaaaaatat tattttagat ccgggcatcg gcttcgcgaa gacataccat gataatcttg 1620
cagtgatgaa taagttagag atcttcagcg gacttggcta tcctgtcctg ctggctacat 1680
ctcgtaaaag atttatcgga agagttcttg atttaccgcc tgaagagaga gcagagggca 1740
caggagcgac agtctgcttg ggcattcaga aaggatgcga catagtgcgt gttcatgatg 1800
tcaagcaaat tgccagaatg gcgaaaatga tggacgcgat gctgaataag ggaggggtgc 1860
accatggata aagtttatgt ggaaggaatg gaattttatg gctatcatgg cgtcttcaca 1920
gaagagaaca aattgggaca acgcttcaaa gtagatctga cagcagaact ggatttatca 1980
aaagcaggac aaacagacga ccttgaacag acaattaatt atgcagagct ttaccatgtc 2040
tgtaaagaca ttgtcgaagg cgagccggtc aaattggtag agacccttgc tgagcggata 2100
gctggcacag ttttaggtaa atttcagccg gttcaacaat gtacggtgaa agttattaaa 2160
ccagatccgc cgattcctgg ccactataaa tcagtagcaa ttgaaattac gagaaaaaag 2220
tcatgaacaa cattgcgtac attgcgcttg gctctaatat tggagataga gaaacgtatc 2280
tgcgccaggc cgttgcgtta ctgcatcaac atgctgcggt cacagttaca aaagtcagct 2340
caatttatga aacagatccg gtcggctatg aagaccaagc ccagttttta aatatggcgg 2400
ttgaaattaa aacaagcctg aatccgtttg aacttctgga actgacacag caaatcgaaa 2460
acgaactggg ccgcacacgc gaagttagat ggggcccgag aacagcggat ttagacattc 2520
tgctgtttaa cagagaaaac attgaaacag agcagttaat tgtcccgcat cctcgcatgt 2580
atgaacgcct gtttgttctt gcgccgcttg cggaaatttg ccagcaggtc gagaaagaag 2640
cgacaagcgc ggaaacggat caagaaggag ttagagtttg gaaacaaaaa tcaggcgttg 2700
atgaatttgt acatagcgaa agctaagaat tcaattgttg cg 2742
<210> 78
<211> 1239
<212> DNA
<213> 人工序列
<220>
<223> BS-FOLOP2-COMB
<400> 78
gaattcaatt ttgtcaaaat aattttattg acaacgtctt attaacgttg atataattta 60
aattttattt gacaaaaatg ggctcgtgtt gtacaataaa tgttactaga gtaaaggagg 120
aaactagtat gaaagaagtc aataaagaac aaattgaaca ggcagtgaga cagattcttg 180
aagcaattgg agaagatccg aacagagagg gcttacttga tacaccgaaa agagttgcta 240
aaatgtatgc ggaagtcttt tcaggcttaa atgaagatcc gaaagagcat tttcagacaa 300
ttttcggaga aaaccatgaa gagctggtcc ttgtgaaaga tattgcgttt cactcaatgt 360
gcgaacatca cctggtgccg ttttacggca aggcacacgt tgcgtatatt cctagaggcg 420
gaaaagttac aggcttgtca aaattagcac gcgcagttga agctgttgca aaaagaccgc 480
aattacagga acgcattaca tctacaattg cggaatcaat tgtcgagaca ttagaccctc 540
atggcgttat ggttgtcgtt gaagctgaac acatgtgcat gacaatgcgc ggcgtcagaa 600
aacctggcgc aaaaacagtc acatcagcag tcagaggcgt gtttaaagat gatgcggcag 660
ctcgtgcgga agtcctggaa catattaaac gccaggacta ataaagatag agggtgctat 720
aaatgatttc atttattttc gcaatggacg cgaatagact gataggcaaa gacaatgatc 780
tgccgtggca tttaccgaat gacctggctt attttaaaaa aattacaagc ggccatagca 840
tcattatggg acgtaaaaca tttgagtcaa ttggcagacc tcttccgaac agaaaaaaca 900
ttgttgtcac atctgcgccg gattcagaat ttcagggctg cacagtcgtc tcaagcctta 960
aagacgttct tgatatttgc agcggaccgg aagagtgttt tgtcattggc ggagcgcaat 1020
tatacacaga tctttttccg tacgcggata gactgtatat gacaaaaatc caccatgaat 1080
ttgaaggcga cagacacttt cctgaatttg acgagagcaa ctggaaactc gtgtctagcg 1140
aacagggcac gaaggatgag aaaaatccgt atgactatga atttcttatg tatgaaaaga 1200
aaaacagcag caaagcggga ggcttttaac tcgagtttt 1239
<210> 79
<211> 415
<212> PRT
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 79
Met Lys His Leu Pro Ala Gln Asp Glu Gln Val Phe Asn Ala Ile Lys
1               5                   10                  15
Asn Glu Arg Glu Arg Gln Gln Thr Lys Ile Glu Leu Ile Ala Ser Glu
            20                  25                  30
Asn Phe Val Ser Glu Ala Val Met Glu Ala Gln Gly Ser Val Leu Thr
        35                  40                  45
Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr Tyr Gly Gly Cys
    50                  55                  60
Glu His Val Asp Val Val Glu Asp Ile Ala Arg Asp Arg Ala Lys Glu
65                  70                  75                  80
Ile Phe Gly Ala Glu His Val Asn Val Gln Pro His Ser Gly Ala Gln
                85                  90                  95
Ala Asn Met Ala Val Tyr Phe Thr Ile Leu Glu Gln Gly Asp Thr Val
            100                 105                 110
Leu Gly Met Asn Leu Ser His Gly Gly His Leu Thr His Gly Ser Pro
        115                 120                 125
Val Asn Phe Ser Gly Val Gln Tyr Asn Phe Val Glu Tyr Gly Val Asp
    130                 135                 140
Lys Glu Thr Gln Tyr Ile Asp Tyr Asp Asp Val Arg Glu Lys Ala Leu
145                 150                 155                 160
Ala His Lys Pro Lys Leu Ile Val Ala Gly Ala Ser Ala Tyr Pro Arg
                165                 170                 175
Thr Ile Asp Phe Lys Lys Phe Arg Glu Ile Ala Asp Glu Val Gly Ala
            180                 185                 190
Tyr Phe Met Val Asp Met Ala His Ile Ala Gly Leu Val Ala Ala Gly
        195                 200                 205
Leu His Pro Asn Pro Val Pro Tyr Ala Asp Phe Val Thr Thr Thr Thr
    210                 215                 220
His Lys Thr Leu Arg Gly Pro Arg Gly Gly Met Ile Leu Cys Arg Glu
225                 230                 235                 240
Glu Phe Gly Lys Lys Ile Asp Lys Ser Ile Phe Pro Gly Ile Gln Gly
                245                 250                 255
Gly Pro Leu Met His Val Ile Ala Ala Lys Ala Val Ser Phe Gly Glu
            260                 265                 270
Val Leu Gln Asp Asp Phe Lys Thr Tyr Ala Gln Asn Val Ile Ser Asn
        275                 280                 285
Ala Lys Arg Leu Ala Glu Ala Leu Thr Lys Glu Gly Ile Gln Leu Val
    290                 295                 300
Ser Gly Gly Thr Asp Asn His Leu Ile Leu Val Asp Leu Arg Ser Leu
305                 310                 315                 320
Gly Leu Thr Gly Lys Val Ala Glu His Val Leu Asp Glu Ile Gly Ile
                325                 330                 335
Thr Ser Asn Lys Asn Ala Ile Pro Tyr Asp Pro Glu Lys Pro Phe Val
            340                 345                 350
Thr Ser Gly Ile Arg Leu Gly Thr Ala Ala Val Thr Ser Arg Gly Phe
        355                 360                 365
Asp Gly Asp Ala Leu Glu Glu Val Gly Ala Ile Ile Ala Leu Ala Leu
    370                 375                 380
Lys Asn His Glu Asp Glu Gly Lys Leu Glu Glu Ala Arg Gln Arg Val
385                 390                 395                 400
Ala Ala Leu Thr Asp Lys Phe Pro Leu Tyr Lys Glu Leu Asp Tyr
                405                 410                 415
<210> 80
<211> 1248
<212> DNA
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 80
atgaaacatt tacctgcgca agacgaacaa gtgtttaacg ccattaaaaa tgagcgtgaa 60
cgccaacaga ctaagatcga attgattgct tctgagaact ttgtaagtga agcggttatg 120
gaagcacaag gatctgtttt gacaaataag tacgcagaag gatatccggg caaacgctac 180
tacggcggat gcgagcacgt cgatgtcgtt gaagatatcg cccgtgaccg cgcgaaggaa 240
atctttggag cggagcatgt aaacgttcag cctcattcag gcgcacaagc aaacatggca 300
gtgtacttca cgattttgga gcaaggcgat actgtacttg ggatgaacct ctcccacggc 360
ggccatttaa cacacggaag cccagtcaac ttcagcggtg ttcaatataa ctttgttgag 420
tacggcgtag ataaagaaac tcaatatatt gattacgatg acgtgcgtga aaaagccctc 480
gctcataaac cgaagcttat cgtagcagga gcaagtgcgt atcctcgtac aatcgacttt 540
aagaaattcc gtgaaattgc tgatgaagtc ggcgcttact tcatggtgga tatggcacat 600
atcgcaggac ttgttgcggc aggccttcat ccaaacccgg ttccttacgc tgatttcgtt 660
acaacaacaa cacataaaac acttcgcggt cctcgcggcg gtatgatcct ttgccgtgaa 720
gagtttggca agaaaattga taaatcgatc ttccctggaa ttcaaggcgg ccctctgatg 780
cacgttattg ccgcaaaagc tgtttcattc ggtgaagtat tgcaggacga tttcaaaaca 840
tatgcacaaa acgtcatttc aaacgcgaaa cgtctggctg aagccttaac gaaagagggc 900
atccagctcg tttcaggcgg aacagacaac caccttatcc ttgttgacct tcgttcgctc 960
ggactgactg gtaaggttgc ggagcatgta cttgatgaaa ttggtattac gtctaacaaa 1020
aacgcgattc catatgatcc tgaaaaacct ttcgtaacaa gcggcatccg tcttggtaca 1080
gctgctgtaa ccagccgcgg ttttgacgga gacgcattag aagaagtcgg tgctatcatt 1140
gcgcttgcat tgaaaaacca cgaagatgaa ggaaaacttg aagaagcaag acagcgtgta 1200
gctgctctga ctgataaatt tcctttatat aaagaattag attattaa 1248
<210> 81
<211> 300
<212> PRT
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 81
Met Lys Ser Tyr Met Thr Gln Arg Leu Asp Glu Tyr Arg Asp Gly Asn
1               5                   10                  15
Glu Asp Lys Gly Arg Leu Leu Val Ser Cys Pro Asp Gln Pro Gly Ile
            20                  25                  30
Val Ser Ala Val Ser Ala Phe Leu Phe Glu His Gly Ala Asn Ile Ile
        35                  40                  45
Glu Ser Asn Gln Tyr Thr Thr Asp Pro Glu Gly Gly Arg Phe Phe Leu
    50                  55                  60
Arg Ile Glu Phe Asp Cys Ala Gly Ile Arg Glu Lys Lys Ser Ser Leu
65                  70                  75                  80
Gln Ala Ala Phe Ala Ser Val Ala Glu Lys Phe Asp Met Thr Trp Ser
                85                  90                  95
Leu Thr Leu Ala Ser Glu Leu Lys Arg Val Ala Ile Phe Val Ser Lys
            100                 105                 110
Glu Leu His Cys Leu His Glu Leu Ile Trp Glu Trp Gln Thr Gly Asn
        115                 120                 125
Leu Met Ala Glu Ile Ala Val Val Ile Ser Asn His Glu Glu Ala Arg
    130                 135                 140
Glu Leu Val Glu Arg Leu Asn Ile Pro Phe His Tyr Met Lys Ala Asn
145                 150                 155                 160
Lys Asp Ile Arg Ala Glu Val Glu Lys Lys Gln Leu Glu Leu Leu Glu
                165                 170                 175
Gln Tyr Asp Val Asp Val Ile Val Leu Ala Arg Tyr Met Gln Ile Leu
            180                 185                 190
Thr Pro Asp Phe Val Ser Ala His Pro Asn Arg Ile Ile Asn Ile His
        195                 200                 205
His Ser Phe Leu Pro Ala Phe Ile Gly Ala Asn Pro Tyr Lys Arg Ala
    210                 215                 220
Tyr Glu Arg Gly Val Lys Leu Ile Gly Ala Thr Ser His Tyr Val Thr
225                 230                 235                 240
Asn Asp Leu Asp Glu Gly Pro Ile Ile Glu Gln Asp Ile Glu Arg Val
                245                 250                 255
Asp His Arg Asp Asn Ala Glu Ala Leu Lys Asn Ile Gly Arg Thr Ile
            260                 265                 270
Glu Arg Ser Val Leu Ala Arg Ala Val Lys Trp His Leu Glu Asp Arg
        275                 280                 285
Val Ile Val His Glu Asn Lys Thr Ile Val Phe Asn
    290                 295                 300
<210> 82
<211> 903
<212> DNA
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 82
atgaaatcat atatgactca gcggttggac gaataccgtg acggaaatga ggataaaggt 60
cggctcttgg tcagctgccc cgatcagccg ggtatcgtct ctgcagtttc cgcgttttta 120
tttgaacacg gtgccaatat tatagaatca aatcaatata cgacagaccc tgaaggcggc 180
cggttcttcc tgagaatcga attcgactgc gcaggcattc gtgaaaaaaa atcatcactt 240
caggcagcgt ttgcctctgt tgcggaaaaa ttcgacatga catggagctt aactttggcg 300
agcgaactga agcgtgtcgc cattttcgtt tcaaaggagc tccactgcct gcatgagctg 360
atttgggaat ggcaaaccgg caacctgatg gcggagatcg ctgttgtcat cagtaaccat 420
gaggaagcga gagagctggt tgagcgcctg aacattccat tccactatat gaaagcgaac 480
aaagacatca gagcggaagt cgaaaagaag cagcttgaac tgctggagca gtacgatgtt 540
gatgtgatcg tgctcgcacg ctatatgcag attctaactc ctgattttgt ttcggctcat 600
ccgaatcgca tcatcaatat ccaccattca ttcctgccag cttttatcgg tgcgaatccg 660
tacaaacggg cctacgagcg cggcgtgaaa ctgatcggtg cgacatctca ttatgtgaca 720
aacgatcttg atgaagggcc gatcattgaa caggatattg agcgtgtgga ccaccgcgat 780
aatgcggaag cgctgaaaaa catcggaaga acaattgagc gcagcgtgct tgcccgtgct 840
gtgaaatggc atttggaaga ccgtgtcatc gttcatgaaa ataaaacaat cgtctttaac 900
tag 903
<210> 83
<211> 612
<212> PRT
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 83
Met Gly Leu Leu Glu Asp Leu Gln Arg Gln Val Leu Ile Gly Asp Gly
1               5                   10                  15
Ala Met Gly Thr Leu Leu Tyr Ser Tyr Gly Ile Asp Arg Cys Phe Glu
            20                  25                  30
Glu Leu Asn Ile Ser Lys Pro Glu Glu Ile Gln Arg Ile His Lys Ala
        35                  40                  45
Tyr Val Glu Ala Gly Ala Asn Ile Ile Gln Thr Asn Thr Tyr Gly Ala
    50                  55                  60
Asn Tyr Ile Lys Leu Ser Arg His Gly Leu Glu Asp Asp Ile Lys Lys
65                  70                  75                  80
Met Asn Gln Glu Ala Val Lys Ile Ala Arg Ala Ser Ala Gly Asp Ala
                85                  90                  95
Tyr Val Leu Gly Thr Met Gly Gly Ile Arg Thr Phe Asn Lys Asn Ala
            100                 105                 110
Tyr Ser Leu Asp Glu Ile Lys Arg Ser Phe Arg Glu Gln Leu Tyr Leu
        115                 120                 125
Leu Leu His Glu Glu Pro Asp Gly Leu Leu Leu Glu Thr Tyr Tyr Asp
    130                 135                 140
Leu Glu Glu Ala Arg Glu Val Leu Lys Ile Ala Arg Lys Glu Thr Asp
145                 150                 155                 160
Leu Pro Ile Met Leu Asn Val Ser Met His Glu Gln Gly Val Leu Gln
                165                 170                 175
Asp Gly Thr Pro Leu Ser Asp Ala Leu Arg Ser Ile Ala Asp Leu Gly
            180                 185                 190
Ala Asp Ile Val Gly Ile Asn Cys Arg Leu Gly Pro Tyr His Met Ile
        195                 200                 205
Glu Ala Leu Ser Glu Val Pro Ile Phe Asp Asp Val Phe Leu Ser Val
    210                 215                 220
Tyr Pro Asn Ser Ser Leu Pro Ser Leu Glu Glu Gly Arg Leu Val Tyr
225                 230                 235                 240
Glu Thr Asp Asp Thr Tyr Phe Gln Asn Ser Ala Ser Glu Phe Arg Lys
                245                 250                 255
Gln Gly Ala Arg Ile Ile Gly Gly Cys Cys Gly Thr Thr Pro Asn His
            260                 265                 270
Ile Arg Ala Met Ala Glu Ala Val Gly Gly Leu Ala Pro Ile Thr Glu
        275                 280                 285
Lys Glu Val Lys Thr Arg Ala Lys Glu Phe Ile Ser Val His His Glu
    290                 295                 300
Arg Thr Glu Pro Gly Leu Asp Glu Ile Ala Ala Lys Lys Arg Ser Ile
305                 310                 315                 320
Ile Val Glu Leu Asp Pro Pro Lys Lys Leu Ser Phe Asp Lys Phe Leu
                325                 330                 335
Ser Ala Ala Ala Glu Leu Lys Glu Ala Gly Ile Asp Ala Leu Thr Leu
            340                 345                 350
Ala Asp Asn Ser Leu Ala Thr Pro Arg Ile Ser Asn Val Ala Cys Gly
        355                 360                 365
Ala Leu Val Lys Gln Gln Leu Asp Met Arg Ser Leu Val His Ile Thr
    370                 375                 380
Cys Arg Asp Arg Asn Ile Ile Gly Leu Gln Ser His Leu Met Gly Leu
385                 390                 395                 400
Asp Thr Leu Gly Leu Asn Asp Val Leu Ala Ile Thr Gly Asp Pro Ser
                405                 410                 415
Lys Ile Gly Asp Phe Pro Gly Ala Thr Ser Val Tyr Asp Leu Thr Ser
            420                 425                 430
Phe Asp Leu Ile Arg Leu Ile Lys Gln Phe Asn Glu Gly Leu Ser Leu
        435                 440                 445
Ser Gly Lys Pro Leu Gly Lys Lys Thr Asn Phe Ser Val Ala Ala Ala
    450                 455                 460
Phe Asn Pro Asn Val Arg His Leu Asp Lys Ala Val Lys Arg Leu Glu
465                 470                 475                 480
Lys Lys Ile Asp Cys Gly Ala Asp Tyr Phe Val Ser Gln Pro Val Tyr
                485                 490                 495
Ser Glu Gln Gln Leu Val Asp Ile His Asn Glu Thr Lys His Leu Lys
            500                 505                 510
Thr Pro Ile Tyr Ile Gly Ile Met Pro Leu Thr Ser Ser Arg Asn Ala
        515                 520                 525
Glu Phe Ile His Asn Glu Ile Pro Gly Ile Lys Leu Ser Asp Thr Ile
    530                 535                 540
Arg Glu Lys Met Ala His Ala Gly Glu Asp Lys Glu Lys Gln Lys Ala
545                 550                 555                 560
Glu Gly Leu Ala Ile Ala Arg Ser Leu Leu Asp Thr Ala Cys Glu Leu
                565                 570                 575
Phe Asn Gly Ile Tyr Leu Ile Thr Pro Phe Leu Arg Ser Asp Leu Thr
            580                 585                 590
Ala Glu Leu Thr Ser Tyr Ile Gln Gln Lys Asp Glu Gln Arg Gln Asn
        595                 600                 605
Ile Phe Leu His
    610
<210> 84
<211> 296
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 84
Met Ser Phe Phe His Ala Ser Gln Arg Asp Ala Leu Asn Gln Ser Leu
1               5                   10                  15
Ala Glu Val Gln Gly Gln Ile Asn Val Ser Phe Glu Phe Phe Pro Pro
            20                  25                  30
Arg Thr Ser Glu Met Glu Gln Thr Leu Trp Asn Ser Ile Asp Arg Leu
        35                  40                  45
Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser
    50                  55                  60
Gly Glu Arg Asp Arg Thr His Ser Ile Ile Lys Gly Ile Lys Asp Arg
65                  70                  75                  80
Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys Ile Asp Ala Thr Pro
                85                  90                  95
Asp Glu Leu Arg Thr Ile Ala Arg Asp Tyr Trp Asn Asn Gly Ile Arg
            100                 105                 110
His Ile Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro
        115                 120                 125
Glu Met Tyr Ala Ser Asp Leu Val Thr Leu Leu Lys Glu Val Ala Asp
    130                 135                 140
Phe Asp Ile Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys
145                 150                 155                 160
Ser Ala Gln Ala Asp Leu Leu Asn Leu Lys Arg Lys Val Asp Ala Gly
                165                 170                 175
Ala Asn Arg Ala Ile Thr Gln Phe Phe Phe Asp Val Glu Ser Tyr Leu
            180                 185                 190
Arg Phe Arg Asp Arg Cys Val Ser Ala Gly Ile Asp Val Glu Ile Ile
        195                 200                 205
Pro Gly Ile Leu Pro Val Ser Asn Phe Lys Gln Ala Lys Lys Phe Ala
    210                 215                 220
Asp Met Thr Asn Val Arg Ile Pro Ala Trp Met Ala Gln Met Phe Asp
225                 230                 235                 240
Gly Leu Asp Asp Asp Ala Glu Thr Arg Lys Leu Val Gly Ala Asn Ile
                245                 250                 255
Ala Met Asp Met Val Lys Ile Leu Ser Arg Glu Gly Val Lys Asp Phe
            260                 265                 270
His Phe Tyr Thr Leu Asn Arg Ala Glu Met Ser Tyr Ala Ile Cys His
        275                 280                 285
Thr Leu Gly Val Arg Pro Gly Leu
    290                 295
<210> 85
<211> 1839
<212> DNA
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 85
atgggacttt tagaagattt gcaaagacag gtgttaatcg gtgacggcgc catggggacg 60
ctcctctact cctatggcat tgacaggtgt tttgaggagc tcaatatttc aaagccggag 120
gaaattcagc gcatacataa agcgtacgtt gaagcgggag ccaacattat tcaaacgaat 180
acgtacggag ccaactatat taaattatcc agacacgggc ttgaggatga catcaaaaaa 240
atgaatcagg aggccgtaaa gatcgcgcgg gcttcagcag gcgatgcata cgtgcttgga 300
acgatgggcg gcatacgcac atttaataaa aacgcataca gtcttgacga aattaagcgc 360
agcttccgcg agcagctgta tctgctgctg catgaagagc cggatggctt gctgttagaa 420
acatattatg atttggaaga agcccgtgaa gtgctgaaaa tcgcgcgcaa agagactgat 480
cttccgatta tgctcaatgt ctccatgcac gagcaaggcg tattgcagga cggaacgccg 540
ctttctgacg cattgcgctc gattgcggat ctcggagctg atattgtcgg cattaactgc 600
cgcctcggcc cttatcacat gattgaagcg ctaagcgaag tgccgatttt tgatgacgta 660
ttcttatccg tttatccgaa cagcagtctt ccttcgcttg aagagggacg gctcgtctat 720
gaaacagacg acacgtattt tcaaaacagc gcgtcagaat tccgtaagca aggtgcgcgg 780
attatcggcg gctgctgcgg cacaacgccg aatcacatca gggcgatggc ggaagcggtt 840
ggcgggctgg ctccgattac ggaaaaagaa gtcaaaaccc gggcgaaaga attcatttct 900
gttcatcacg agcgaaccga gcccggcctg gatgagatcg cagcgaaaaa acgctctatt 960
atcgtagagc tggacccgcc gaaaaaacta agctttgaca aatttctgtc cgctgctgct 1020
gaattaaaag aagcgggaat cgatgccctg acactcgccg acaattcttt ggcgaccccg 1080
cggatcagca atgttgcctg cggcgccctt gtcaagcagc agctcgatat gcgttccctt 1140
gtccatatta cgtgccgtga ccgtaacatt atcggcttac agtcacattt aatgggcctt 1200
gatacgttag ggctgaatga cgtgcttgct attacaggtg acccttctaa aatcggggat 1260
tttcctgggg cgacgtctgt atatgattta acatcttttg atttaatcag gctgatcaaa 1320
caattcaatg aaggtctgtc tctgtctgga aaaccgctcg gcaagaaaac gaatttctca 1380
gttgccgccg catttaatcc taacgtccgc catctggata aagcggtaaa acggcttgag 1440
aaaaaaatag attgcggcgc agattatttt gtttctcagc ctgtctattc cgagcagcag 1500
cttgtcgata tccataacga aacaaaacat ctgaagacgc cgatctatat cggcatcatg 1560
ccgctgacaa gcagccggaa tgccgaattc atccataatg aaattcccgg cattaagctg 1620
tctgatacga ttcgcgaaaa aatggcccat gccggtgaag ataaagaaaa gcaaaaggcg 1680
gaaggccttg caattgcacg ctccctgctg gatacggcat gcgagctgtt taacggcatc 1740
tacttgataa cgcctttcct cagatctgac ttaaccgctg agctcacatc atatattcag 1800
caaaaagatg agcagcgcca aaatatcttt ttgcattaa 1839
<210> 86
<211> 891
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 86
atgagctttt ttcacgccag ccagcgggat gccctgaatc agagcctggc agaagtccag 60
gggcagatta acgtttcgtt cgagtttttc ccgccgcgta ccagtgaaat ggagcagacc 120
ctgtggaact ccatcgatcg ccttagcagc ctgaaaccga agtttgtatc ggtgacctat 180
ggcgcgaact ccggcgagcg cgaccgtacg cacagcatta ttaaaggcat taaagatcgc 240
actggtctgg aagcggcacc gcatcttact tgcattgatg cgacgcccga cgagctgcgc 300
accattgcac gcgactactg gaataacggt attcgtcata tcgtggcgct gcgtggcgat 360
ctgccgccgg gaagtggtaa gccagaaatg tatgcttctg acctggtgac gctgttaaaa 420
gaagtggcag atttcgatat ctccgtggcg gcgtatccgg aagttcaccc ggaagcaaaa 480
agcgctcagg cggatttgct taatctgaaa cgcaaagtgg atgccggagc caaccgcgcg 540
attactcagt tcttcttcga tgtcgaaagc tacctgcgtt ttcgtgaccg ctgtgtatcg 600
gcgggcattg atgtggaaat tattccggga attttgccgg tatctaactt taaacaggcg 660
aagaaatttg ccgatatgac caacgtgcgt attccggcgt ggatggcgca aatgttcgac 720
ggtctggatg atgatgccga aacccgcaaa ctggttggcg cgaatattgc catggatatg 780
gtgaagattt taagccgtga aggagtgaaa gatttccact tctatacgct taaccgtgct 840
gaaatgagtt acgcgatttg ccatacgctg ggggttcgac ctggtttata a 891
<210> 87
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 87
gggcgcgcta gcggccaat 19
<210> 88
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 88
acgttgtcaa taaaattatt ttgacaaaat tgaattctta gctttcgcta tgtacaaatt 60
catcaacgcc tgatt 75
<210> 89
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 89
aatcaggcgt tgatgaattt gtacatagcg aaagctaaga attcaatttt gtcaaaataa 60
ttttattgac aacgt 75
<210> 90
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 90
gcggtagtgg tgcttacgat 20
<210> 91
<211> 1248
<212> DNA
<213> 人工序列
<220>
<223> 针对枯草芽胞杆菌(Bacillus subtilis)使用密码子优化的glyA序列
<400> 91
atgaagcacc ttcctgcaca agatgaacaa gtattcaacg ctattaagaa cgaacgcgaa 60
cgtcaacaaa ccaagattga attgatcgct agcgaaaatt tcgtttcaga agcagttatg 120
gaggctcaag gctctgttct tacgaacaaa tatgctgaag gctacccagg caaaagatac 180
tacggaggct gcgaacacgt tgacgtagtc gaagacattg cacgtgaccg cgcaaaagaa 240
atcttcggcg cagaacatgt taacgttcaa cctcacagcg gagcacaagc gaacatggca 300
gtttatttta caatccttga acaaggggac acagtcctgg gcatgaacct ttctcacgga 360
ggccatctta ctcatggtag cccggtgaac ttttctggcg tccaatataa cttcgttgag 420
tacggtgtag ataaagaaac acagtatatt gactatgatg atgtgcgtga aaaagctctt 480
gcgcacaaac ctaaacttat tgttgcggga gcgtcagcgt acccgcgtac cattgatttt 540
aaaaagttcc gggaaattgc tgacgaggtt ggcgcgtact ttatggtgga tatggctcat 600
attgcgggct tggtcgcagc aggactgcac cctaacccgg tgccttacgc cgatttcgtt 660
acaaccacga cacataaaac acttagaggc ccacgtggcg gaatgattct ttgcagagaa 720
gaatttggaa agaaaattga caaatccatt ttccctggca tccagggagg tcctcttatg 780
catgtcattg cagcaaaagc ggtgagcttc ggcgaagtgt tacaagatga tttcaaaacg 840
tatgctcaga acgttatctc taatgcgaaa cgtttagcgg aagcgttgac aaaagaaggt 900
atccaacttg tctcaggagg cacagataat catcttattc tggttgatct tcgctcactt 960
ggattaacag gcaaagttgc ggaacatgtt cttgacgaaa ttggtattac atcaaacaaa 1020
aacgctattc cttacgatcc ggaaaaacct ttcgtaacat ctggtattcg cttaggcaca 1080
gctgcggtta caagccgcgg attcgatggc gatgcgcttg aagaggtagg cgctattatt 1140
gcactggcgt taaaaaatca tgaggatgaa ggaaaacttg aagaggcccg ccagcgtgtc 1200
gcagctctta ctgataaatt cccgctttac aaagaacttg attattga 1248
<210> 92
<211> 903
<212> DNA
<213> 人工序列
<220>
<223> 针对枯草芽胞杆菌(Bacillus subtilis)使用密码子优化的 purU序列
<400> 92
atgaagtctt acatgactca acgtttagat gaatatcgtg acggcaacga ggataaagga 60
cgcctcttgg tgtcttgtcc ggaccagcct ggaattgttt ctgcagtttc cgcatttctt 120
tttgagcacg gcgcaaatat catcgaaagc aatcaataca caactgaccc agaaggcggc 180
cgtttcttcc ttcgcattga atttgactgc gcaggaatcc gtgaaaaaaa aagcagctta 240
caggctgctt tcgcatctgt cgctgaaaaa ttcgacatga cttggtcttt aactttggcg 300
tctgagctaa aacgtgttgc tatctttgtg tcaaaagagc tccactgctt acatgaactt 360
atttgggaat ggcaaacagg taacctaatg gcagagattg ccgtagtcat ctcaaaccac 420
gaagaagctc gcgaactggt ggaacgtctt aatatccctt ttcactacat gaaagctaac 480
aaagacatcc gggctgaagt tgaaaaaaaa cagcttgagc tgttagaaca gtatgacgtt 540
gacgtaatcg tgttagcacg ctatatgcag attttaacac cggacttcgt ctctgctcat 600
cctaaccgta ttatcaatat tcaccattct ttcttaccgg cctttatcgg agcaaatcct 660
tataaacgtg cgtatgaacg tggagttaaa ttgatcggcg ccacgtccca ctatgttacg 720
aacgacttag atgaaggtcc tattatcgaa caagatatcg agcgtgttga tcatcgtgat 780
aatgctgaag cactcaaaaa tattggccgt acaatcgagc gctctgttct agctcgtgca 840
gtaaaatggc atcttgagga ccgcgtcatc gttcatgaga ataaaacaat cgtttttaac 900
tga 903
<210> 93
<211> 1839
<212> DNA
<213> 人工序列
<220>
<223> 针对枯草芽胞杆菌(Bacillus subtilis)使用密码子优化的yitJ序列
<400> 93
atgggattac ttgaagatct tcaacgccaa gttctgatcg gagacggagc gatgggaacg 60
cttctgtatt cttacggaat cgacagatgt tttgaagagt taaatatttc taaacctgaa 120
gaaatccaaa gaatccataa agcgtacgtc gaagcaggag caaacatcat tcaaacaaat 180
acatacggag ctaactacat taaacttagc cgccacggcc tggaagacga cattaaaaaa 240
atgaaccaag aagcggtcaa aattgcacgc gcaagcgctg gcgacgcgta tgttcttggc 300
acgatgggag gcatccgcac attcaacaag aatgcttaca gcctggacga gattaaacgc 360
tcattccgtg aacaattata cctgcttctt cacgaagaac cggatggcct tcttttagaa 420
acatattacg atctggaaga ggcacgtgag gttcttaaaa ttgctcgcaa agagacggat 480
cttccgatca tgcttaacgt ctctatgcac gaacaaggcg tgcttcagga tggcacacct 540
cttagcgacg ctttaagaag catcgcggac ctgggcgcag atatcgttgg cattaactgc 600
cgcctgggac cgtaccacat gattgaagca ttgtcagaag tcccgatctt cgatgacgtc 660
ttccttagcg tttacccgaa ctcttcatta ccgagcttag aagaaggacg cttagtgtat 720
gaaacggacg atacatactt ccaaaattct gcaagcgagt tccgtaaaca aggagcgcgt 780
attatcggcg ggtgctgcgg aacaactccg aatcacatta gagcgatggc agaagcagta 840
ggaggtcttg cacctatcac agaaaaagaa gtgaaaacgc gtgctaaaga atttatttct 900
gttcatcacg aacgtacaga accgggctta gacgaaattg ctgctaaaaa gcgcagcatt 960
attgtcgaac ttgatccgcc taaaaaactt tcatttgata aatttctttc agcggcagcg 1020
gagttaaaag aagcaggcat cgatgctctt acattagcgg ataactcatt agcgactcct 1080
cgtatctcta acgtcgcatg cggtgcactt gtgaaacaac aactggatat gcgctcactt 1140
gttcatatca cgtgccgtga ccgcaatatc attggccttc aatctcattt aatgggtctt 1200
gatacattag gtttaaacga tgtacttgcg attacaggtg atccgtcaaa aattggtgac 1260
tttcctggcg caacatcagt gtacgacctg acctcttttg atcttattcg tcttattaaa 1320
caattcaatg aaggattatc tttgtctggt aaacctcttg gcaagaaaac gaacttctca 1380
gtagcggcgg cattcaatcc taatgtgcgt caccttgaca aagcggtcaa aagacttgaa 1440
aaaaaaatcg actgtggagc ggattatttc gtctctcaac cagtatatag tgagcaacaa 1500
ttagtggata tccacaacga aacgaagcac ttaaaaacac caatctacat tggaatcatg 1560
cctcttacgt cctctcgcaa cgctgaattt atccataacg aaattccagg aattaaactt 1620
tctgatacga tccgtgaaaa aatggcccat gctggcgaag acaaggagaa acaaaaggct 1680
gaaggacttg caattgcgcg ttctttactg gacactgctt gcgaattgtt caacggcatc 1740
tatcttatta caccatttct tcgtagcgac ttgacagccg agttgacatc atatattcaa 1800
caaaaggacg aacaacgcca gaatattttt ctgcattaa 1839
<210> 94
<211> 891
<212> DNA
<213> 人工序列
<220>
<223> DNA片段
<400> 94
atgtcattct tccatgcttc acaacgtgat gcgcttaacc agagcctggc agaagttcag 60
ggccaaatca atgtgtcttt cgaatttttt cctcctcgca caagcgagat ggaacaaaca 120
ctttggaact ccatcgaccg tctttcatca cttaagccga aatttgtctc agtgacgtac 180
ggcgctaaca gcggagaacg cgatagaaca cattcaatca ttaagggaat caaagatcgt 240
acgggattag aagctgctcc tcacttaaca tgtattgatg cgacgccgga tgaacttcgt 300
acaatcgcgc gtgattactg gaacaatggt attcgtcata tcgtcgctct gagaggagat 360
ttgcctcctg gatctggtaa accggagatg tacgcttcag accttgtaac acttcttaaa 420
gaagtggcgg actttgatat ctctgtcgcg gcttaccctg aagttcatcc ggaggcaaaa 480
agcgcgcagg cagacttatt aaaccttaag cgtaaagtag acgcgggtgc taaccgtgcg 540
atcacacagt tcttttttga tgtggaaagt tatttacgtt ttcgcgatcg ttgcgtttcg 600
gcaggcatcg atgttgaaat catccctgga attttaccag ttagcaactt caaacaggcg 660
aaaaaatttg cggatatgac gaacgttcgt attccggcat ggatggcgca aatgtttgac 720
ggacttgacg atgacgcaga aacacgcaaa ttagtcggtg ctaacattgc gatggacatg 780
gttaaaattc tgtcacgcga aggtgtcaag gactttcatt tctacacact taatcgcgct 840
gaaatgagct atgcgatctg ccacacactt ggagtccgtc ctggccttta a 891
<210> 95
<211> 1686
<212> DNA
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 95
cttgttgttg ttccgccgtt ttacggcagt cctttatcgg tgacggggac aattgtgctt 60
gtaccggagc cggaacccgt ctacgcgttt acagcgaatc caaatgatca atcagtttct 120
gtgattgata caaacaccga tactgttgtg acaacgattg ctcttccgta caatccggca 180
ggtattgaaa ttacgccaga taaaagcgct gtgtttgtct tacatcccaa caataatgtg 240
atttctgtca tcgattatga cacattaaca gtgacagcaa ctatattgct ggatcagccg 300
cctcgattga ttagatttat ccctaatcat gagtttgctt atgttttcac cggtactgcg 360
gtttatgtga ttggaattga tacgttaact gtggataggt cgattcctgt ggaaggatat 420
gatgttgcaa tcgatcccaa tgggttattc gcctatgttc tgaattttgg aatagtgcaa 480
aaagtggacc taactaccgg tgaagtcaca ggaacaattg aacgagagct tatcgtatca 540
accatagaaa caaattggcc ggagcggtat gcctatgtat tagaacaaga attctttttt 600
aattatttga cggttattga tttaaatacg tttaccatca gcagcaccca agagctggag 660
tatgaagggg aatatcgaat gtttacgagt ggagcagagg tgtatttata tgacggcttc 720
actggcaatt tatattctgt cagtccaaat ggagcaggcg ttataggaaa tgttccgcaa 780
tcagcaacag actatgcgtt taccccgaat ggcgattttc tgtatgcaac tcgttttata 840
gagcagagca tcattgttta caacacagat gattattctg aggaaactgt gatatctctt 900
ggggtttcac cgggtgccat tacgatttaa ccgctgcatg ttgtgcattt ctaaaaggac 960
gtgaaatcat gaaaaagaat gatctttctg ctttacagga aaattgtttc tgtttttgtg 1020
atgaggaaat tagccgggaa gcgccgtttc aagtgccgat agatttccct gagggcttca 1080
aggttgatac ggccgaagcg tcagcggctg ttacatggag tacagacaat ttgtcctgta 1140
tcagtgagcc ttgcttaatc cagactgggc cggaaccaga agatatcggt gttcgatatg 1200
ctgtgagagt acaagggacc attacgcttc ttgtcagtgt gtcgcctgta cgaaatcaat 1260
atggacaagg agacggggct gtttctgtga ttcatactga agagattgat caagttgttt 1320
attatgcagc acagtctggc cgctgtcctg atttcagtca aataacagtg gaagatctgc 1380
tcattgtacc gcctttctac ggcagtccgc ttacacgggt gcgcatgatc gtatggttca 1440
ctgtccacca accaaaactg tgctcagtac cgccaatatt tctcccttgg ggggtacaaa 1500
gaggtgtccc tagaagagat ccacgctgtg taaaaatttt acaaaaaggt attgactttc 1560
cctacagggt gtgtaataat ttaattacag gcgggggcaa ccccgctcag tacctagagc 1620
gtaaaagagg ggagggaaac actagttggc ttcgttggga ttctccggtg atgctgattt 1680
cgctgc 1686
<210> 96
<211> 2126
<212> DNA
<213> 人工序列
<220>
<223> 大观霉素选择性标记物(spectinomycin selectable marker)
<400> 96
cggtagtcat tgctggcgaa cgcgtctaga gctccggcat aaaattaact aaaataatta 60
ttatgtagat aaaaaattta gaagccaatg aaatctataa ataaactaaa ttaagtttat 120
ttaattaaca actatggata taaaataggt actaatcaaa atagtgaggc gaatatattt 180
gaatacatac gaacaaatca ataaagtgaa aaaaatactt cggaaacatt taaaaaataa 240
ccttattggt acttacatgt ttggatcagg agttgagagt ggactcaaac caaatagtga 300
tcttgacttt ttagtcgtcg tatctgaacc attgacagat caaagtaaag aaatacttat 360
acaaaaaatt agacctattt caaaaaaaat aggagataaa agcaacttac gatatattga 420
attaacaatt attattcagc aagaaatggt accgtggaat catcctccca aacaagaatt 480
tatttatgga gaatggttac aagagcttta tgaacaagga tacattcctc agaaggaatt 540
aaattcagat ttaaccataa tgctttacca agcaaaacga aaaaataaaa gaatatacgg 600
aaattatgac ttagaggaat tactacctga tattccattt tctgatgtga gaagagccat 660
tatggattcg tcagaggaac ttatagataa ttatcaggat gatgaaacca actctatatt 720
aactttatgc cgcatgattt taactatgga cacgggtaaa atcataccaa aagatattgc 780
gggaaatgca gtggctgaat cttctccatt agaacatagg gagagaattt tgttagcagt 840
tcgtagttat cttggagaga atattgaatg gactaatgaa aatgtaaatc ttacgataaa 900
ctatcttaat aaccgcctta agaaacttta acccgggcgc gttgctttcg atgaagtttt 960
accgccatca ccagaccctc aatcgtatgt gtttactgcc aatactggag acagcacggt 1020
ttcggttatt gatgcagatt taaacactgt tgtaaaaaca atcccttttt ctgacgtgcc 1080
aactaatcta ggcgttactt tcgataaagc attcacgtat gtcctccatg gaaataccaa 1140
ccttgtctca gtgattgata ataaaacatt aaccatcata aataccatta ctgttggagg 1200
agggccgaga aaaatcgaat ttgatccaac agatgagttc gcatacgtga tggccgccgg 1260
atctatatat gtgattaaca cggcctctca atcggtcatt gatgtcattc cgatacccgg 1320
cgctttagac tttgctcttg atccgaatgg acagtatgtc tataccgcta atggaagcag 1380
ttggtcggtt gataaatatg atgtaaatac tgggcagttg gtagaaagta tcatagatac 1440
atttgaattt cccagtttaa ttacaactcc ttacgctgga aattttgcgt acgtattgaa 1500
tggtgagctg tggccgaaag gtgtaacgga gattagtttg tcaccattaa gcaggggagg 1560
ggacttcagc cgtttatttg aaacgctgag gacgattgta ttttctctcg atagtactag 1620
agcttatttt caagagccat atagtgaacc gtttctcatc aataacttat acgtagttaa 1680
tacggccaga cagaggatca ttgcaaacgt gtctctcccc ggcgcctttg acctcgccgt 1740
aacgccggac aaacagtata tttatgcggc acagcccaac gacaatgctg tgaccgtgta 1800
ccgcacaagt gattatacag ccgtgacggt gattccggtt ggcgcgggtc cgtctgcgat 1860
tgcgatgtag ctattttata gatcaagaga agcggtgctg tgataagaga atcgtttata 1920
aataaatgat ccgatttgct gaatggcagc caggataatc agaaacagca gttcacttat 1980
agagaaactg agcatccacc aaatcccggc tgctgccagt gctcccgcaa acacttttct 2040
gaacaggctg ccgtgccgga aaagctgccg caaatacgtt cgcatgcaaa acaataaata 2100
caggatcagt agcatcgcaa gtccca 2126
<210> 97
<211> 7709
<212> DNA
<213> 人工序列
<220>
<223> MTHF-OP-A操纵子
<400> 97
cgcgtttaca gcgaatccaa atgatcaatc agtttctgtg attgatacaa acaccgatac 60
tgttgtgaca acgattgctc ttccgtacaa tccggcaggt attgaaatta cgccagataa 120
aagcgctgtg tttgtcttac atcccaacaa taatgtgatt tctgtcatcg attatgacac 180
attaacagtg acagcaacta tattgctgga tcagccgcct cgattgatta gatttatccc 240
taatcatgag tttgcttatg ttttcaccgg tactgcggtt tatgtgattg gaattgatac 300
gttaactgtg gataggtcga ttcctgtgga aggatatgat gttgcaatcg atcccaatgg 360
gttattcgcc tatgttctga attttggaat agtgcaaaaa gtggacctaa ctaccggtga 420
agtcacagga acaattgaac gagagcttat cgtatcaacc atagaaacaa attggccgga 480
gcggtatgcc tatgtattag aacaagaatt cttttttaat tatttgacgg ttattgattt 540
aaatacgttt accatcagca gcacccaaga gctggagtat gaaggggaat atcgaatgtt 600
tacgagtgga gcagaggtgt atttatatga cggcttcact ggcaatttat attctgtcag 660
tccaaatgga gcaggcgtta taggaaatgt tccgcaatca gcaacagact atgcgtttac 720
cccgaatggc gattttctgt atgcaactcg ttttatagag cagagcatca ttgtttacaa 780
cacagatgat tattctgagg aaactgtgat atctcttggg gtttcaccgg gtgccattac 840
gatttaaccg ctgcatgttg tgcatttcta aaaggacgtg aaatcatgaa aaagaatgat 900
ctttctgctt tacaggaaaa ttgtttctgt ttttgtgatg aggaaattag ccgggaagcg 960
ccgtttcaag tgccgataga tttccctgag ggcttcaagg ttgatacggc cgaagcgtca 1020
gcggctgtta catggagtac agacaatttg tcctgtatca gtgagccttg cttaatccag 1080
actgggccgg aaccagaaga tatcggtgtt cgatatgctg tgagagtaca agggaccatt 1140
acgcttcttg tcagtgtgtc gcctgtacga aatcaatatg gacaaggaga cggggctgtt 1200
tctgtgattc atactgaaga gattgatcaa gttgtttatt atgcagcaca gtctggccgc 1260
tgtcctgatt tcagtcaaat aacagtggaa gatctgctca ttgtaccgcc tttctacggc 1320
agtccgctta cacgggtgcg catgatcgta tggttcactg tccaccaacc aaaactgtgc 1380
tcagtaccgc caatatttct cccttggggg gtacaaagag gtgtccctag aagagatcca 1440
cgctgtgtaa aaattttaca aaaaggtatt gactttccct acagggtgtg taataattta 1500
attacaggcg ggggcaaccc cgctcagtac ctagagcgta aaagagggga gggaaacact 1560
agtatgaagc accttcctgc acaagatgaa caagtattca acgctattaa gaacgaacgc 1620
gaacgtcaac aaaccaagat tgaattgatc gctagcgaaa atttcgtttc agaagcagtt 1680
atggaggctc aaggctctgt tcttacgaac aaatatgctg aaggctaccc aggcaaaaga 1740
tactacggag gctgcgaaca cgttgacgta gtcgaagaca ttgcacgtga ccgcgcaaaa 1800
gaaatcttcg gcgcagaaca tgttaacgtt caacctcaca gcggagcaca agcgaacatg 1860
gcagtttatt ttacaatcct tgaacaaggg gacacagtcc tgggcatgaa cctttctcac 1920
ggaggccatc ttactcatgg tagcccggtg aacttttctg gcgtccaata taacttcgtt 1980
gagtacggtg tagataaaga aacacagtat attgactatg atgatgtgcg tgaaaaagct 2040
cttgcgcaca aacctaaact tattgttgcg ggagcgtcag cgtacccgcg taccattgat 2100
tttaaaaagt tccgggaaat tgctgacgag gttggcgcgt actttatggt ggatatggct 2160
catattgcgg gcttggtcgc agcaggactg caccctaacc cggtgcctta cgccgatttc 2220
gttacaacca cgacacataa aacacttaga ggcccacgtg gcggaatgat tctttgcaga 2280
gaagaatttg gaaagaaaat tgacaaatcc attttccctg gcatccaggg aggtcctctt 2340
atgcatgtca ttgcagcaaa agcggtgagc ttcggcgaag tgttacaaga tgatttcaaa 2400
acgtatgctc agaacgttat ctctaatgcg aaacgtttag cggaagcgtt gacaaaagaa 2460
ggtatccaac ttgtctcagg aggcacagat aatcatctta ttctggttga tcttcgctca 2520
cttggattaa caggcaaagt tgcggaacat gttcttgacg aaattggtat tacatcaaac 2580
aaaaacgcta ttccttacga tccggaaaaa cctttcgtaa catctggtat tcgcttaggc 2640
acagctgcgg ttacaagccg cggattcgat ggcgatgcgc ttgaagaggt aggcgctatt 2700
attgcactgg cgttaaaaaa tcatgaggat gaaggaaaac ttgaagaggc ccgccagcgt 2760
gtcgcagctc ttactgataa attcccgctt tacaaagaac ttgattattg aaaaagaggg 2820
gagggaaaca ttatgatgaa gtcttacatg actcaacgtt tagatgaata tcgtgacggc 2880
aacgaggata aaggacgcct cttggtgtct tgtccggacc agcctggaat tgtttctgca 2940
gtttccgcat ttctttttga gcacggcgca aatatcatcg aaagcaatca atacacaact 3000
gacccagaag gcggccgttt cttccttcgc attgaatttg actgcgcagg aatccgtgaa 3060
aaaaaaagca gcttacaggc tgctttcgca tctgtcgctg aaaaattcga catgacttgg 3120
tctttaactt tggcgtctga gctaaaacgt gttgctatct ttgtgtcaaa agagctccac 3180
tgcttacatg aacttatttg ggaatggcaa acaggtaacc taatggcaga gattgccgta 3240
gtcatctcaa accacgaaga agctcgcgaa ctggtggaac gtcttaatat cccttttcac 3300
tacatgaaag ctaacaaaga catccgggct gaagttgaaa aaaaacagct tgagctgtta 3360
gaacagtatg acgttgacgt aatcgtgtta gcacgctata tgcagatttt aacaccggac 3420
ttcgtctctg ctcatcctaa ccgtattatc aatattcacc attctttctt accggccttt 3480
atcggagcaa atccttataa acgtgcgtat gaacgtggag ttaaattgat cggcgccacg 3540
tcccactatg ttacgaacga cttagatgaa ggtcctatta tcgaacaaga tatcgagcgt 3600
gttgatcatc gtgataatgc tgaagcactc aaaaatattg gccgtacaat cgagcgctct 3660
gttctagctc gtgcagtaaa atggcatctt gaggaccgcg tcatcgttca tgagaataaa 3720
acaatcgttt ttaactgaaa aagaggggag ggaaacatta tgatgggatt acttgaagat 3780
cttcaacgcc aagttctgat cggagacgga gcgatgggaa cgcttctgta ttcttacgga 3840
atcgacagat gttttgaaga gttaaatatt tctaaacctg aagaaatcca aagaatccat 3900
aaagcgtacg tcgaagcagg agcaaacatc attcaaacaa atacatacgg agctaactac 3960
attaaactta gccgccacgg cctggaagac gacattaaaa aaatgaacca agaagcggtc 4020
aaaattgcac gcgcaagcgc tggcgacgcg tatgttcttg gcacgatggg aggcatccgc 4080
acattcaaca agaatgctta cagcctggac gagattaaac gctcattccg tgaacaatta 4140
tacctgcttc ttcacgaaga accggatggc cttcttttag aaacatatta cgatctggaa 4200
gaggcacgtg aggttcttaa aattgctcgc aaagagacgg atcttccgat catgcttaac 4260
gtctctatgc acgaacaagg cgtgcttcag gatggcacac ctcttagcga cgctttaaga 4320
agcatcgcgg acctgggcgc agatatcgtt ggcattaact gccgcctggg accgtaccac 4380
atgattgaag cattgtcaga agtcccgatc ttcgatgacg tcttccttag cgtttacccg 4440
aactcttcat taccgagctt agaagaagga cgcttagtgt atgaaacgga cgatacatac 4500
ttccaaaatt ctgcaagcga gttccgtaaa caaggagcgc gtattatcgg cgggtgctgc 4560
ggaacaactc cgaatcacat tagagcgatg gcagaagcag taggaggtct tgcacctatc 4620
acagaaaaag aagtgaaaac gcgtgctaaa gaatttattt ctgttcatca cgaacgtaca 4680
gaaccgggct tagacgaaat tgctgctaaa aagcgcagca ttattgtcga acttgatccg 4740
cctaaaaaac tttcatttga taaatttctt tcagcggcag cggagttaaa agaagcaggc 4800
atcgatgctc ttacattagc ggataactca ttagcgactc ctcgtatctc taacgtcgca 4860
tgcggtgcac ttgtgaaaca acaactggat atgcgctcac ttgttcatat cacgtgccgt 4920
gaccgcaata tcattggcct tcaatctcat ttaatgggtc ttgatacatt aggtttaaac 4980
gatgtacttg cgattacagg tgatccgtca aaaattggtg actttcctgg cgcaacatca 5040
gtgtacgacc tgacctcttt tgatcttatt cgtcttatta aacaattcaa tgaaggatta 5100
tctttgtctg gtaaacctct tggcaagaaa acgaacttct cagtagcggc ggcattcaat 5160
cctaatgtgc gtcaccttga caaagcggtc aaaagacttg aaaaaaaaat cgactgtgga 5220
gcggattatt tcgtctctca accagtatat agtgagcaac aattagtgga tatccacaac 5280
gaaacgaagc acttaaaaac accaatctac attggaatca tgcctcttac gtcctctcgc 5340
aacgctgaat ttatccataa cgaaattcca ggaattaaac tttctgatac gatccgtgaa 5400
aaaatggccc atgctggcga agacaaggag aaacaaaagg ctgaaggact tgcaattgcg 5460
cgttctttac tggacactgc ttgcgaattg ttcaacggca tctatcttat tacaccattt 5520
cttcgtagcg acttgacagc cgagttgaca tcatatattc aacaaaagga cgaacaacgc 5580
cagaatattt ttctgcatta aattaattct agagctccgg cataaaatta actaaaataa 5640
ttattatgta gataaaaaat ttagaagcca atgaaatcta taaataaact aaattaagtt 5700
tatttaatta acaactatgg atataaaata ggtactaatc aaaatagtga ggcgaatata 5760
tttgaataca tacgaacaaa tcaataaagt gaaaaaaata cttcggaaac atttaaaaaa 5820
taaccttatt ggtacttaca tgtttggatc aggagttgag agtggactca aaccaaatag 5880
tgatcttgac tttttagtcg tcgtatctga accattgaca gatcaaagta aagaaatact 5940
tatacaaaaa attagaccta tttcaaaaaa aataggagat aaaagcaact tacgatatat 6000
tgaattaaca attattattc agcaagaaat ggtaccgtgg aatcatcctc ccaaacaaga 6060
atttatttat ggagaatggt tacaagagct ttatgaacaa ggatacattc ctcagaagga 6120
attaaattca gatttaacca taatgcttta ccaagcaaaa cgaaaaaata aaagaatata 6180
cggaaattat gacttagagg aattactacc tgatattcca ttttctgatg tgagaagagc 6240
cattatggat tcgtcagagg aacttataga taattatcag gatgatgaaa ccaactctat 6300
attaacttta tgccgcatga ttttaactat ggacacgggt aaaatcatac caaaagatat 6360
tgcgggaaat gcagtggctg aatcttctcc attagaacat agggagagaa ttttgttagc 6420
agttcgtagt tatcttggag agaatattga atggactaat gaaaatgtaa atcttacgat 6480
aaactatctt aataaccgcc ttaagaaact ttaacccggg cgcgttgctt tcgatgaagt 6540
tttaccgcca tcaccagacc ctcaatcgta tgtgtttact gccaatactg gagacagcac 6600
ggtttcggtt attgatgcag atttaaacac tgttgtaaaa acaatccctt tttctgacgt 6660
gccaactaat ctaggcgtta ctttcgataa agcattcacg tatgtcctcc atggaaatac 6720
caaccttgtc tcagtgattg ataataaaac attaaccatc ataaatacca ttactgttgg 6780
aggagggccg agaaaaatcg aatttgatcc aacagatgag ttcgcatacg tgatggccgc 6840
cggatctata tatgtgatta acacggcctc tcaatcggtc attgatgtca ttccgatacc 6900
cggcgcttta gactttgctc ttgatccgaa tggacagtat gtctataccg ctaatggaag 6960
cagttggtcg gttgataaat atgatgtaaa tactgggcag ttggtagaaa gtatcataga 7020
tacatttgaa tttcccagtt taattacaac tccttacgct ggaaattttg cgtacgtatt 7080
gaatggtgag ctgtggccga aaggtgtaac ggagattagt ttgtcaccat taagcagggg 7140
aggggacttc agccgtttat ttgaaacgct gaggacgatt gtattttctc tcgatagtac 7200
tagagcttat tttcaagagc catatagtga accgtttctc atcaataact tatacgtagt 7260
taatacggcc agacagagga tcattgcaaa cgtgtctctc cccggcgcct ttgacctcgc 7320
cgtaacgccg gacaaacagt atatttatgc ggcacagccc aacgacaatg ctgtgaccgt 7380
gtaccgcaca agtgattata cagccgtgac ggtgattccg gttggcgcgg gtccgtctgc 7440
gattgcgatg tagctatttt atagatcaag agaagcggtg ctgtgataag agaatcgttt 7500
ataaataaat gatccgattt gctgaatggc agccaggata atcagaaaca gcagttcact 7560
tatagagaaa ctgagcatcc accaaatccc ggctgctgcc agtgctcccg caaacacttt 7620
tctgaacagg ctgccgtgcc ggaaaagctg ccgcaaatac gttcgcatgc aaaacaataa 7680
atacaggatc agtagcatcg caagtccca 7709
<210> 98
<211> 7709
<212> DNA
<213> 人工序列
<220>
<223> MTHF-OP-B操纵子
<400> 98
cgcgtttaca gcgaatccaa atgatcaatc agtttctgtg attgatacaa acaccgatac 60
tgttgtgaca acgattgctc ttccgtacaa tccggcaggt attgaaatta cgccagataa 120
aagcgctgtg tttgtcttac atcccaacaa taatgtgatt tctgtcatcg attatgacac 180
attaacagtg acagcaacta tattgctgga tcagccgcct cgattgatta gatttatccc 240
taatcatgag tttgcttatg ttttcaccgg tactgcggtt tatgtgattg gaattgatac 300
gttaactgtg gataggtcga ttcctgtgga aggatatgat gttgcaatcg atcccaatgg 360
gttattcgcc tatgttctga attttggaat agtgcaaaaa gtggacctaa ctaccggtga 420
agtcacagga acaattgaac gagagcttat cgtatcaacc atagaaacaa attggccgga 480
gcggtatgcc tatgtattag aacaagaatt cttttttaat tatttgacgg ttattgattt 540
aaatacgttt accatcagca gcacccaaga gctggagtat gaaggggaat atcgaatgtt 600
tacgagtgga gcagaggtgt atttatatga cggcttcact ggcaatttat attctgtcag 660
tccaaatgga gcaggcgtta taggaaatgt tccgcaatca gcaacagact atgcgtttac 720
cccgaatggc gattttctgt atgcaactcg ttttatagag cagagcatca ttgtttacaa 780
cacagatgat tattctgagg aaactgtgat atctcttggg gtttcaccgg gtgccattac 840
gatttaaccg ctgcatgttg tgcatttcta aaaggacgtg aaatcatgaa aaagaatgat 900
ctttctgctt tacaggaaaa ttgtttctgt ttttgtgatg aggaaattag ccgggaagcg 960
ccgtttcaag tgccgataga tttccctgag ggcttcaagg ttgatacggc cgaagcgtca 1020
gcggctgtta catggagtac agacaatttg tcctgtatca gtgagccttg cttaatccag 1080
actgggccgg aaccagaaga tatcggtgtt cgatatgctg tgagagtaca agggaccatt 1140
acgcttcttg tcagtgtgtc gcctgtacga aatcaatatg gacaaggaga cggggctgtt 1200
tctgtgattc atactgaaga gattgatcaa gttgtttatt atgcagcaca gtctggccgc 1260
tgtcctgatt tcagtcaaat aacagtggaa gatctgctca ttgtaccgcc tttctacggc 1320
agtccgctta cacgggtgcg catgatcgta tggttcactg tccaccaacc aaaactgtgc 1380
tcagtaccgc caatatttct cccttggggg gtacaaagag gtgtccctag aagagatcca 1440
cgctgtgtaa aaattttaca aaaaggtatt gactttccct acagggtgtg taataattta 1500
attacaggcg ggggcaaccc cgctcagtac ctagagcgta aaagagggga gggaaacact 1560
agtatgaagc accttcctgc acaagatgaa caagtattca acgctattaa gaacgaacgc 1620
gaacgtcaac aaaccaagat tgaattgatc gctagcgaaa atttcgtttc agaagcagtt 1680
atggaggctc aaggctctgt tcttacgaac aaatatgctg aaggctaccc aggcaaaaga 1740
tactacggag gctgcgaaca cgttgacgta gtcgaagaca ttgcacgtga ccgcgcaaaa 1800
gaaatcttcg gcgcagaaca tgttaacgtt caacctcaca gcggagcaca agcgaacatg 1860
gcagtttatt ttacaatcct tgaacaaggg gacacagtcc tgggcatgaa cctttctcac 1920
ggaggccatc ttactcatgg tagcccggtg aacttttctg gcgtccaata taacttcgtt 1980
gagtacggtg tagataaaga aacacagtat attgactatg atgatgtgcg tgaaaaagct 2040
cttgcgcaca aacctaaact tattgttgcg ggagcgtcag cgtacccgcg taccattgat 2100
tttaaaaagt tccgggaaat tgctgacgag gttggcgcgt actttatggt ggatatggct 2160
catattgcgg gcttggtcgc agcaggactg caccctaacc cggtgcctta cgccgatttc 2220
gttacaacca cgacacataa aacacttaga ggcccacgtg gcggaatgat tctttgcaga 2280
gaagaatttg gaaagaaaat tgacaaatcc attttccctg gcatccaggg aggtcctctt 2340
atgcatgtca ttgcagcaaa agcggtgagc ttcggcgaag tgttacaaga tgatttcaaa 2400
acgtatgctc agaacgttat ctctaatgcg aaacgtttag cggaagcgtt gacaaaagaa 2460
ggtatccaac ttgtctcagg aggcacagat aatcatctta ttctggttga tcttcgctca 2520
cttggattaa caggcaaagt tgcggaacat gttcttgacg aaattggtat tacatcaaac 2580
aaaaacgcta ttccttacga tccggaaaaa cctttcgtaa catctggtat tcgcttaggc 2640
acagctgcgg ttacaagccg cggattcgat ggcgatgcgc ttgaagaggt aggcgctatt 2700
attgcactgg cgttaaaaaa tcatgaggat gaaggaaaac ttgaagaggc ccgccagcgt 2760
gtcgcagctc ttactgataa attcccgctt tacaaagaac ttgattattg aaaaagaggg 2820
gagggaaaca ttatgatgaa gtcttacatg actcaacgtt tagatgaata tcgtgacggc 2880
aacgaggata aaggacgcct cttggtgtct tgtccggacc agcctggaat tgtttctgca 2940
gtttccgcat ttctttttga gcacggcgca aatatcatcg aaagcaatca atacacaact 3000
gacccagaag gcggccgttt cttccttcgc attgaatttg actgcgcagg aatccgtgaa 3060
aaaaaaagca gcttacaggc tgctttcgca tctgtcgctg aaaaattcga catgacttgg 3120
tctttaactt tggcgtctga gctaaaacgt gttgctatct ttgtgtcaaa agagctccac 3180
tgcttacatg aacttatttg ggaatggcaa acaggtaacc taatggcaga gattgccgta 3240
gtcatctcaa accacgaaga agctcgcgaa ctggtggaac gtcttaatat cccttttcac 3300
tacatgaaag ctaacaaaga catccgggct gaagttgaaa aaaaacagct tgagctgtta 3360
gaacagtatg acgttgacgt aatcgtgtta gcacgctata tgcagatttt aacaccggac 3420
ttcgtctctg ctcatcctaa ccgtattatc aatattcacc attctttctt accggccttt 3480
atcggagcaa atccttataa acgtgcgtat gaacgtggag ttaaattgat cggcgccacg 3540
tcccactatg ttacgaacga cttagatgaa ggtcctatta tcgaacaaga tatcgagcgt 3600
gttgatcatc gtgataatgc tgaagcactc aaaaatattg gccgtacaat cgagcgctct 3660
gttctagctc gtgcagtaaa atggcatctt gaggaccgcg tcatcgttca tgagaataaa 3720
acaatcgttt ttaactgaaa aagaggggag ggaaacatta tgatgggatt acttgaagat 3780
cttcaacgcc aagttctgat cggagacgga gcgatgggaa cgcttctgta ttcttacgga 3840
atcgacagat gttttgaaga gttaaatatt tctaaacctg aagaaatcca aagaatccat 3900
aaagcgtacg tcgaagcagg agcaaacatc attcaaacaa atacatacgg agctaactac 3960
attaaactta gccgccacgg cctggaagac gacattaaaa aaatgaacca agaagcggtc 4020
aaaattgcac gcgcaagcgc tggcgacgcg tatgttcttg gcacgatggg aggcatccgc 4080
acattcaaca agaatgctta cagcctggac gagattaaac gctcattccg tgaacaatta 4140
tacctgcttc ttcacgaaga accggatggc cttcttttag aaacatatta cgatctggaa 4200
gaggcacgtg aggttcttaa aattgctcgc aaagagacgg atcttccgat catgcttaac 4260
gtctctatgc acgaacaagg cgtgcttcag gatggcacac ctcttagcga cgctttaaga 4320
agcatcgcgg acctgggcgc agatatcgtt ggcattaact gccgcctggg accgtaccac 4380
atgattgaag cattgtcaga agtcccgatc ttcgatgacg tcttccttag cgtttacccg 4440
aactcttcat taccgagctt agaagaagga cgcttagtgt atgaaacgga cgatacatac 4500
ttccaaaatt ctgcaagcga gttccgtaaa caaggagcgc gtattatcgg cgggtgctgc 4560
ggaacaactc cgaatcacat tagagcgatg gcagaagcag taggaggtct tgcacctatc 4620
acagaaaaag aagtgaaaac gcgtgctaaa gaatttattt ctgttcatca cgaacgtaca 4680
gaaccgggct tagacgaaat tgctgctaaa aagcgcagca ttattgtcga acttgatccg 4740
cctaaaaaac tttcatttga taaatttctt tcagcggcag cggagttaaa agaagcaggc 4800
atcgatgctc ttacattagc ggataactca ttagcgactc ctcgtatctc taacgtcgca 4860
tgcggtgcac ttgtgaaaca acaactggat atgcgctcac ttgttcatat cacgtgccgt 4920
gaccgcaata tcattggcct tcaatctcat ttaatgggtc ttgatacatt aggtttaaac 4980
gatgtacttg cgattacagg tgatccgtca aaaattggtg actttcctgg cgcaacatca 5040
gtgtacgacc tgacctcttt tgatcttatt cgtcttatta aacaattcaa tgaaggatta 5100
tctttgtctg gtaaacctct tggcaagaaa acgaacttct cagtagcggc ggcattcaat 5160
cctaatgtgc gtcaccttga caaagcggtc aaaagacttg aaaaaaaaat cgactgtgga 5220
gcggattatt tcgtctctca accagtatat agtgagcaac aattagtgga tatccacaac 5280
gaaacgaagc acttaaaaac accaatctac attggaatca tgcctcttac gtcctctcgc 5340
aacgctgaat ttatccataa cgaaattcca ggaattaaac tttctgatac gatccgtgaa 5400
aaaatggccc atgctggcga agacaaggag aaacaaaagg ctgaaggact tgcaattgcg 5460
cgttctttac tggacactgc ttgcgaattg ttcaacggca tctatcttat tacaccattt 5520
cttcgtagcg acttgacagc cgagttgaca tcatatattc aacaaaagga cgaacaacgc 5580
cagaatattt ttctgcatta aattaattct agagctccgg cataaaatta actaaaataa 5640
ttattatgta gataaaaaat ttagaagcca atgaaatcta taaataaact aaattaagtt 5700
tatttaatta acaactatgg atataaaata ggtactaatc aaaatagtga ggcgaatata 5760
tttgaataca tacgaacaaa tcaataaagt gaaaaaaata cttcggaaac atttaaaaaa 5820
taaccttatt ggtacttaca tgtttggatc aggagttgag agtggactca aaccaaatag 5880
tgatcttgac tttttagtcg tcgtatctga accattgaca gatcaaagta aagaaatact 5940
tatacaaaaa attagaccta tttcaaaaaa aataggagat aaaagcaact tacgatatat 6000
tgaattaaca attattattc agcaagaaat ggtaccgtgg aatcatcctc ccaaacaaga 6060
atttatttat ggagaatggt tacaagagct ttatgaacaa ggatacattc ctcagaagga 6120
attaaattca gatttaacca taatgcttta ccaagcaaaa cgaaaaaata aaagaatata 6180
cggaaattat gacttagagg aattactacc tgatattcca ttttctgatg tgagaagagc 6240
cattatggat tcgtcagagg aacttataga taattatcag gatgatgaaa ccaactctat 6300
attaacttta tgccgcatga ttttaactat ggacacgggt aaaatcatac caaaagatat 6360
tgcgggaaat gcagtggctg aatcttctcc attagaacat agggagagaa ttttgttagc 6420
agttcgtagt tatcttggag agaatattga atggactaat gaaaatgtaa atcttacgat 6480
aaactatctt aataaccgcc ttaagaaact ttaacccggg cgcgttgctt tcgatgaagt 6540
tttaccgcca tcaccagacc ctcaatcgta tgtgtttact gccaatactg gagacagcac 6600
ggtttcggtt attgatgcag atttaaacac tgttgtaaaa acaatccctt tttctgacgt 6660
gccaactaat ctaggcgtta ctttcgataa agcattcacg tatgtcctcc atggaaatac 6720
caaccttgtc tcagtgattg ataataaaac attaaccatc ataaatacca ttactgttgg 6780
aggagggccg agaaaaatcg aatttgatcc aacagatgag ttcgcatacg tgatggccgc 6840
cggatctata tatgtgatta acacggcctc tcaatcggtc attgatgtca ttccgatacc 6900
cggcgcttta gactttgctc ttgatccgaa tggacagtat gtctataccg ctaatggaag 6960
cagttggtcg gttgataaat atgatgtaaa tactgggcag ttggtagaaa gtatcataga 7020
tacatttgaa tttcccagtt taattacaac tccttacgct ggaaattttg cgtacgtatt 7080
gaatggtgag ctgtggccga aaggtgtaac ggagattagt ttgtcaccat taagcagggg 7140
aggggacttc agccgtttat ttgaaacgct gaggacgatt gtattttctc tcgatagtac 7200
tagagcttat tttcaagagc catatagtga accgtttctc atcaataact tatacgtagt 7260
taatacggcc agacagagga tcattgcaaa cgtgtctctc cccggcgcct ttgacctcgc 7320
cgtaacgccg gacaaacagt atatttatgc ggcacagccc aacgacaatg ctgtgaccgt 7380
gtaccgcaca agtgattata cagccgtgac ggtgattccg gttggcgcgg gtccgtctgc 7440
gattgcgatg tagctatttt atagatcaag agaagcggtg ctgtgataag agaatcgttt 7500
ataaataaat gatccgattt gctgaatggc agccaggata atcagaaaca gcagttcact 7560
tatagagaaa ctgagcatcc accaaatccc ggctgctgcc agtgctcccg caaacacttt 7620
tctgaacagg ctgccgtgcc ggaaaagctg ccgcaaatac gttcgcatgc aaaacaataa 7680
atacaggatc agtagcatcg caagtccca 7709
<210> 99
<211> 1260
<212> DNA
<213> 罗伊氏乳杆菌(Lactobacillus reuteri)
<400> 99
gtgcggacct atgaacaaat taacgcgggc tttaatcgcc aaatgctggg aggacaacgg 60
gatcgggtaa aatttttgcg acgaattctt actcgtttag gaaaccctga ccagcgattt 120
aaaattatcc atattgcagg gacaaacgga aaaggctcga ctgggacaat gttagaacag 180
gggttacaaa atgctggcta ccgggtcggc tattttagca gtcctgcttt ggtagatgat 240
cgggagcaaa ttaaggttaa tgaccatttg attagtaaaa aagattttgc gatgacttac 300
caaaagatca ccgaacattt acccgctgat cttttacctg atgatattac catttttgag 360
tggtggaccc tgataatgct gcaatatttt gcagaccaaa aagtggattg ggcagtcatt 420
gaatgcggtt taggcggtca agatgatgca accaatatta tcagcgcgcc ttttattagt 480
gtgataacgc atattgccct tgaccataca cggattttgg gtccaacgat tgccaaaatt 540
gcccaggcta aagcaggaat tatcaagacc ggtactaaac aagtgttttt agcgccgcac 600
caagaaaaag acgctctcac aattattaga gaaaaggctc aacagcaaaa agtaggatta 660
acgcaagcag atgcccagtc aattgttgat ggaaaggcga tcctgaaagt taatcataaa 720
atttataaag ttccttttaa tttattaggg acatttcaaa gtgaaaattt gggcaccgtt 780
gtcagtgtat ttaattttct ttatcaacga agacttgtta cttcttggca gcctttatta 840
tcgacgcttg cgacagtgaa gattgctggt cgaatgcaga aaatcgctga tcatccccct 900
attattttgg acggggccca taacccagat gcagccaagc aacttaccaa aactatttct 960
aagcttcctc ataataaagt aattatggtt cttggctttc tcgctgataa aaatattagt 1020
caaatggtta aaatttatca gcaaatggca gatgagataa taattactac tcctgaccat 1080
ccaactcgcg cccttgatgc aagtgcgtta aaatcagttc tgcctcaagc gattattgcc 1140
aacaatcccc gacaagggtt agtggtggca aaaaagattg cggagccgaa tgatttaatt 1200
attgtaacgg gttcttttta tacgattaaa gatatcgagg ccaatttaga tgaaaaataa 1260
<210> 100
<211> 762
<212> PRT
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 100
Met Thr Thr Ile Lys Thr Ser Asn Leu Gly Phe Pro Arg Ile Gly Leu
1               5                   10                  15
Asn Arg Glu Trp Lys Lys Ala Leu Glu Ala Tyr Trp Lys Gly Ser Thr
            20                  25                  30
Asp Lys Asp Thr Phe Leu Lys Gln Ile Asp Glu Leu Phe Leu Ser Ala
        35                  40                  45
Val Lys Thr Gln Ile Asp Gln Gln Ile Asp Val Val Pro Val Ser Asp
    50                  55                  60
Phe Thr Gln Tyr Asp His Val Leu Asp Thr Ala Val Ser Phe Asn Trp
65                  70                  75                  80
Ile Pro Lys Arg Phe Arg His Leu Thr Asp Ala Thr Asp Thr Tyr Phe
                85                  90                  95
Ala Ile Ala Arg Gly Ile Lys Asp Ala Val Ser Ser Glu Met Thr Lys
            100                 105                 110
Trp Phe Asn Thr Asn Tyr His Tyr Ile Val Pro Glu Tyr Asp Glu Ser
        115                 120                 125
Ile Glu Phe Arg Leu Thr Arg Asn Lys Gln Leu Glu Asp Tyr Arg Arg
    130                 135                 140
Ile Lys Gln Glu Tyr Gly Val Glu Thr Lys Pro Val Ile Val Gly Pro
145                 150                 155                 160
Tyr Thr Phe Val Thr Leu Ala Lys Gly Tyr Glu Pro Ser Glu Ala Lys
                165                 170                 175
Ala Ile Gln Lys Arg Leu Val Pro Leu Tyr Val Gln Leu Leu Lys Glu
            180                 185                 190
Leu Glu Glu Glu Gly Val Lys Trp Val Gln Ile Asp Glu Pro Ala Leu
        195                 200                 205
Val Thr Ala Ser Ser Glu Asp Val Arg Gly Ala Lys Glu Leu Phe Glu
    210                 215                 220
Ser Ile Thr Ser Glu Leu Ser Ser Leu Asn Val Leu Leu Gln Thr Tyr
225                 230                 235                 240
Phe Asp Ser Val Asp Ala Tyr Glu Glu Leu Ile Ser Tyr Pro Val Gln
                245                 250                 255
Gly Ile Gly Leu Asp Phe Val His Asp Lys Gly Arg Asn Leu Glu Gln
            260                 265                 270
Leu Lys Thr His Gly Phe Pro Thr Asp Lys Val Leu Ala Ala Gly Val
        275                 280                 285
Ile Asp Gly Arg Asn Ile Trp Lys Ala Asp Leu Glu Glu Arg Leu Asp
    290                 295                 300
Ala Val Leu Asp Ile Leu Ser Ile Ala Lys Val Asp Glu Leu Trp Ile
305                 310                 315                 320
Gln Pro Ser Ser Ser Leu Leu His Val Pro Val Ala Lys His Pro Asp
                325                 330                 335
Glu His Leu Glu Lys Asp Leu Leu Asn Gly Leu Ser Tyr Ala Lys Glu
            340                 345                 350
Lys Leu Ala Glu Leu Thr Ala Leu Lys Glu Gly Leu Val Ser Gly Lys
        355                 360                 365
Ala Ala Ile Ser Glu Glu Ile Gln Gln Ala Lys Ala Asp Ile Gln Ala
    370                 375                 380
Leu Lys Gln Phe Ala Thr Gly Ala Asn Ser Glu Gln Lys Lys Glu Leu
385                 390                 395                 400
Glu Gln Leu Thr Asp Lys Asp Phe Lys Arg Pro Ile Pro Phe Glu Glu
                405                 410                 415
Arg Leu Ala Leu Gln Asn Glu Ser Leu Gly Leu Pro Leu Leu Pro Thr
            420                 425                 430
Thr Thr Ile Gly Ser Phe Pro Gln Ser Ala Glu Val Arg Ser Ala Arg
        435                 440                 445
Gln Lys Trp Arg Lys Ala Glu Trp Ser Asp Glu Gln Tyr Gln Asn Phe
    450                 455                 460
Ile Asn Ala Glu Thr Lys Arg Trp Ile Asp Ile Gln Glu Glu Leu Glu
465                 470                 475                 480
Leu Asp Val Leu Val His Gly Glu Phe Glu Arg Thr Asp Met Val Glu
                485                 490                 495
Tyr Phe Gly Glu Lys Leu Ala Gly Phe Ala Phe Thr Lys Tyr Ala Trp
            500                 505                 510
Val Gln Ser Tyr Gly Ser Arg Cys Val Arg Pro Pro Val Ile Tyr Gly
        515                 520                 525
Asp Val Glu Phe Ile Glu Pro Met Thr Val Lys Asp Thr Val Tyr Ala
    530                 535                 540
Gln Ser Leu Thr Ser Lys His Val Lys Gly Met Leu Thr Gly Pro Val
545                 550                 555                 560
Thr Ile Leu Asn Trp Ser Phe Pro Arg Asn Asp Ile Ser Arg Lys Glu
                565                 570                 575
Ile Ala Phe Gln Ile Gly Leu Ala Leu Arg Lys Glu Val Lys Ala Leu
            580                 585                 590
Glu Asp Ala Gly Ile Gln Ile Ile Gln Val Asp Glu Pro Ala Leu Arg
        595                 600                 605
Glu Gly Leu Pro Leu Lys Thr Arg Asp Trp Asp Glu Tyr Leu Thr Trp
    610                 615                 620
Ala Ala Glu Ala Phe Arg Leu Thr Thr Ser Ser Val Lys Asn Glu Thr
625                 630                 635                 640
Gln Ile His Thr His Met Cys Tyr Ser Asn Phe Glu Asp Ile Val Asp
                645                 650                 655
Thr Ile Asn Asp Leu Asp Ala Asp Val Ile Thr Ile Glu His Ser Arg
            660                 665                 670
Ser His Gly Gly Phe Leu Asp Tyr Leu Lys Asn His Pro Tyr Leu Lys
        675                 680                 685
Gly Leu Gly Leu Gly Val Tyr Asp Ile His Ser Pro Arg Val Pro Ser
    690                 695                 700
Thr Glu Glu Met Tyr Asn Ile Ile Val Asp Ala Leu Ala Val Cys Pro
705                 710                 715                 720
Thr Asp Arg Phe Trp Val Asn Pro Asp Cys Gly Leu Lys Thr Arg Gln
                725                 730                 735
Gln Glu Glu Thr Val Ala Ala Leu Lys Asn Met Val Glu Ala Ala Lys
            740                 745                 750
Gln Ala Arg Ala Gln Gln Thr Gln Leu Val
        755                 760
<210> 101
<211> 2289
<212> DNA
<213> 枯草芽胞杆菌(Bacillus subtilis)
<400> 101
atgacaacca tcaaaacatc gaatttagga tttccgagaa tcggactgaa ccgggaatgg 60
aaaaaagcac ttgaagcgta ttggaaaggc agtactgata aagatacgtt tttgaagcaa 120
atcgacgaac tatttttatc cgcagtaaaa acacaaattg accagcagat tgatgttgtg 180
cctgtttctg atttcacaca gtatgaccat gtactcgaca cagcagtcag cttcaactgg 240
atcccgaaac ggttcagaca tttgactgac gctaccgata catacttcgc tatcgcccgc 300
ggaatcaaag acgctgtatc tagtgaaatg acaaaatggt ttaatacaaa ttaccattac 360
atcgttccgg aatatgacga gagcattgag ttccgtctga caagaaacaa acaactcgaa 420
gattatcgcc ggatcaaaca ggaatacggt gtggaaacaa agcctgtgat tgtcggccct 480
tatacgttcg ttacgcttgc taaaggctat gaaccgtctg aagcaaaagc gatccaaaaa 540
cgccttgtgc cattatatgt acagcttttg aaagagcttg aagaagaagg cgtaaaatgg 600
gttcaaatcg atgagccggc gctcgttacc gcctctagtg aagatgtacg cggcgcaaaa 660
gaattatttg aaagcattac aagtgagctt tcatccttga atgtgctttt gcagacgtat 720
tttgattctg ttgatgctta tgaagagctg atctcttacc cggttcaggg aattggcctt 780
gatttcgttc acgacaaagg cagaaacctg gaacagctta aaacacatgg cttcccgaca 840
gataaagtgc tggcagccgg cgttatcgac ggacgcaaca tttggaaagc ggaccttgaa 900
gagcgtctcg atgccgttct tgatattctc agcattgcaa aagttgatga actgtggatt 960
cagccttcca gcagcctgct gcatgttcca gtagcgaaac accctgatga gcatttggaa 1020
aaagacctat tgaacggatt atcctacgca aaagaaaagc tggccgagct gacagctttg 1080
aaagaaggct tagtatcagg aaaagcggcg atcagcgaag agattcagca ggctaaggct 1140
gatatccagg cgcttaaaca gtttgcaaca ggcgccaatt ctgaacaaaa gaaagagctt 1200
gagcaattaa ctgataaaga cttcaagcgc ccgattccgt ttgaagaacg tttagcccta 1260
caaaatgaat ctctcggcct tccgcttttg ccgacgacaa cgatcggcag cttcccgcag 1320
tctgctgaag tgcggagcgc acgccaaaaa tggcggaaag ctgagtggtc cgatgaacag 1380
tatcaaaact ttatcaatgc ggaaacaaaa agatggattg atattcagga agaattggag 1440
cttgatgtcc ttgttcacgg cgaatttgaa cggacagaca tggtcgaata cttcggtgaa 1500
aagctggccg gtttcgcctt cactaaatat gcctgggttc aatcatacgg ctcacgctgt 1560
gtccgcccgc cagtcattta cggagatgtt gaatttattg aaccgatgac agtgaaagac 1620
acagtctacg cacagtcatt gacttccaag catgtgaaag gaatgctgac gggcccggtt 1680
acaatcttaa actggtcttt ccctcgaaac gacatctcga ggaaagaaat cgccttccaa 1740
atcgggcttg cccttcgcaa agaagttaaa gcgcttgaag acgcaggcat tcaaatcatt 1800
caagtcgatg aaccagcgct gcgtgaaggc cttccattga aaacccgcga ttgggatgag 1860
tatttgactt gggcggcaga agctttcaga ttaaccactt cttccgtgaa aaacgagaca 1920
caaattcata cacatatgtg ctacagcaac ttcgaagata tcgttgatac aatcaatgat 1980
cttgatgccg atgtgattac aatcgaacat agcagaagcc acggaggatt tttagattac 2040
ttaaaaaacc acccgtattt gaaagggctt ggccttggtg tatatgacat tcacagccct 2100
cgtgtgccgt caactgaaga aatgtacaat attatcgttg atgcgcttgc cgtctgtccg 2160
actgaccgct tctgggtaaa tccagactgc ggattgaaaa caagacagca ggaagaaacg 2220
gttgcagcat tgaaaaatat ggttgaagcc gcaaaacagg caagagcaca gcagacacag 2280
ctagtataa 2289

Claims (15)

1.一种基因工程化微生物,所述基因工程化微生物修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,使得参与5-甲基叶酸盐的生物合成的至少一种酶的表达水平增加,和/或所述基因工程化微生物修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,使得具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的内源多肽的表达和/或活性降低。
2.根据权利要求1所述的基因工程化微生物,所述基因工程化微生物修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,使得参与5-甲基叶酸盐的生物合成的至少一种酶的表达水平增加。
3.根据权利要求1或2所述的基因工程化微生物,其中参与5-甲基叶酸盐的生物合成的所述酶选自由以下组成的组:具有GTP环化水解酶活性的多肽、具有7,8-二氢新蝶呤醛缩酶活性的多肽、具有2-氨基-4-羟基-6-羟甲基二氢蝶啶焦磷酸激酶活性的多肽、具有二氢蝶酸合成酶活性的多肽、具有二氢叶酸还原酶活性的多肽、具有丝氨酸羟甲基转移酶活性的多肽、具有甲酰四氢叶酸脱甲酰酶活性的多肽和具有5,10-亚甲基四氢叶酸还原酶活性的多肽。
4.根据权利要求1至3中任一项所述的基因工程化微生物,所述基因工程化微生物修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,使得具有5,10-亚甲基四氢叶酸还原酶活性的多肽的表达水平增加。
5.根据权利要求1至4中任一项所述的基因工程化微生物,其中参与5-甲基叶酸盐的生物合成的至少一种所述酶,分别地所述多肽与所述基因工程化微生物异源。
6.根据权利要求1至5中任一项所述的基因工程化微生物,所述基因工程化微生物修饰为与不携带所述修饰的其他相同微生物(参考微生物)相比,使得具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的内源多肽的表达和/或活性降低。
7.根据权利要求1至6中任一项所述的基因工程化微生物,所述基因工程化微生物修饰为a)与不携带所述修饰的其他相同微生物(参考微生物)相比,使得具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的内源多肽的表达和/或活性降低,和b)表达仅具有二氢叶酸合成酶活性的异源多肽。
8.根据权利要求1至7中任一项所述的基因工程化微生物,所述基因工程化微生物是细菌。
9.根据权利要求1至8中任一项所述的基因工程化微生物,所述基因工程化微生物是枯草芽胞杆菌种(Bacillus subtiltis)的细菌。
10.一种用于制备叶酸盐、其前体或中间体的方法,包括i)在合适的培养条件下在培养基中培养根据权利要求1至9中任一项所述的基因工程化微生物,以获得含有所述叶酸盐、其前体或中间体的发酵产物;以及ii)任选地,分离和/或纯化所述叶酸盐、其前体或中间体。
11.根据权利要求10所述的方法,其中所述叶酸盐是式I化合物:
Figure FDA0004048528540000021
 
Figure FDA0004048528540000031
任选地为一种立体异构体的形式,优选对映异构体或非对映异构体,外消旋体的形式,或任意混合比的至少两种立体异构体,优选对映异构体和/或非对映异构体的混合物的形式。
12.根据权利要求10或11所述的方法,其中所述叶酸盐是式II化合物:
Figure FDA0004048528540000032
任选地为一种立体异构体的形式,优选对映异构体或非对映异构体,外消旋体的形式,或任意混合比的至少两种立体异构体,优选对映异构体和/或非对映异构体的混合物的形式。
13.根据权利要求10至12中任一项所述的方法,其中所述叶酸盐是式IIa化合物:
Figure FDA0004048528540000033
14.一种制备基因工程化微生物的方法,包括以下步骤(a)至(b)中的任一个:
(a)与其他相同微生物(参考微生物)相比,增加参与5-甲基叶酸盐的生物合成的至少一种酶的表达水平;以及
(b)与不携带所述修饰的其他相同微生物(参考微生物)相比,降低具有5-甲基四氢蝶酰三谷氨酸同型半胱氨酸S-甲基转移酶活性的内源多肽的表达和/或活性。
15.根据权利要求14所述的方法,还包括以下步骤(c)和(d):
(c)与不携带所述修饰的其他相同微生物(参考微生物)相比,降低具有二氢叶酸合成酶活性和叶酰聚谷氨酸合成酶活性的内源多肽的表达和/或活性;以及
(d)表达仅具有二氢叶酸合成酶活性的异源多肽。
CN202180049529.0A 2020-07-15 2021-06-30 生产5-甲基叶酸盐的微生物 Pending CN116096881A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP20186028.5A EP3940071A1 (en) 2020-07-15 2020-07-15 5-methylfolate producing microorganism
EP20186028.5 2020-07-15
EP20189690.9 2020-08-05
EP20189690 2020-08-05
PCT/IB2021/055845 WO2022013663A1 (en) 2020-07-15 2021-06-30 5-methylfolate producing microorganism

Publications (1)

Publication Number Publication Date
CN116096881A true CN116096881A (zh) 2023-05-09

Family

ID=76730960

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180049529.0A Pending CN116096881A (zh) 2020-07-15 2021-06-30 生产5-甲基叶酸盐的微生物

Country Status (4)

Country Link
US (1) US20230272442A1 (zh)
JP (1) JP2023533812A (zh)
CN (1) CN116096881A (zh)
WO (1) WO2022013663A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SU908092A1 (ru) 1980-09-04 1984-12-30 Всесоюзный научно-исследовательский институт генетики и селекции промышленных микроорганизмов Способ получени рибофлавина
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
CN109652351B (zh) * 2018-12-18 2020-08-04 江南大学 一种高产5-甲基四氢叶酸重组枯草芽孢杆菌及其应用
WO2021035421A1 (en) * 2019-08-23 2021-03-04 Chifeng Pharmaceutical Co., Ltd. Folate producing strain and the preparation and application thereof

Also Published As

Publication number Publication date
WO2022013663A1 (en) 2022-01-20
JP2023533812A (ja) 2023-08-04
US20230272442A1 (en) 2023-08-31

Similar Documents

Publication Publication Date Title
Jin et al. Identification of two distinct Bacillus subtilis citrate synthase genes
JP5787089B2 (ja) リボフラビンの改善された生産
KR20180083350A (ko) 니코틴아미드 리보시드의 미생물학적 제조
CN114286858B (zh) 叶酸生产菌株及其制备和应用
EP2852673B1 (en) Selection method and recombinant microorganisms and uses therefor
CN107922464B (zh) 经改进的维生素生产
KR20170121147A (ko) 발효 경로를 통해 플럭스 증가를 나타내는 재조합 미생물
KR20130101030A (ko) 변형된 미생물을 사용한 개선된 글리콜산 발효 생산
CN116368233A (zh) 通过发酵生产4-氨基苯乙胺的工程化生物合成途径
Kusian et al. The Calvin cycle enzyme pentose-5-phosphate 3-epimerase is encoded within the cfx operons of the chemoautotroph Alcaligenes eutrophus
KR20230112679A (ko) 아이소프레노이드 측쇄가 있는 사이토키닌을 생산할 수 있는 유전자 조작된 세균
WEYGAND‐DURAŠEVIĆ et al. Yeast seryl‐tRNA synthetase expressed in Escherichia coli recognizes bacterial serine‐specific tRNAs in vivo
KR20110104955A (ko) 리보플라빈의 제조 방법
KR20200134333A (ko) 발효에 의한 히스타민 생산을 위해 조작된 생합성 경로
JP2023515250A (ja) 硫酸化多糖の製造方法及びpapsの製造方法
CN110607335B (zh) 一种烟酰胺腺嘌呤二核苷酸类化合物生物合成方法
CN109790558A (zh) 方法
CN116096881A (zh) 生产5-甲基叶酸盐的微生物
KR20020029767A (ko) 환상 뎁시펩티드 합성효소 및 그의 유전자 및 환상뎁시펩티드의 대량생산계
JP2006512913A (ja) ビタミンb12の改良生産法
KR20230005137A (ko) 헤파로산의 제조 방법 및 헤파로산 생산능을 갖는 에스케리키아 속의 세균
EP3044591B1 (en) Recombinant microorganisms and methods of use thereof
EP3940071A1 (en) 5-methylfolate producing microorganism
KR102336516B1 (ko) 변이형 2-데옥시-실로-이노소스 합성효소
EP1170371A1 (en) Phosphohexuloisomerase and gene therefor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination