CN113557305A - 减少非经典支链氨基酸错掺的方法 - Google Patents

减少非经典支链氨基酸错掺的方法 Download PDF

Info

Publication number
CN113557305A
CN113557305A CN201980084812.XA CN201980084812A CN113557305A CN 113557305 A CN113557305 A CN 113557305A CN 201980084812 A CN201980084812 A CN 201980084812A CN 113557305 A CN113557305 A CN 113557305A
Authority
CN
China
Prior art keywords
ala
leu
val
gly
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980084812.XA
Other languages
English (en)
Inventor
P·豪普特曼
A·科尔科莱斯·加西亚
C·T·拉特曼
A·马特森
P·诺伊鲍尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Technische Universitaet Berlin
Sanofi Aventis Deutschland GmbH
Original Assignee
Technische Universitaet Berlin
Sanofi Aventis Deutschland GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Technische Universitaet Berlin, Sanofi Aventis Deutschland GmbH filed Critical Technische Universitaet Berlin
Publication of CN113557305A publication Critical patent/CN113557305A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/62Insulins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1022Transferases (2.) transferring aldehyde or ketonic groups (2.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1217Phosphotransferases with a carboxyl group as acceptor (2.7.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/06Alanine; Leucine; Isoleucine; Serine; Homoserine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/08Lysine; Diaminopimelic acid; Threonine; Valine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01003Homoserine dehydrogenase (1.1.1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01086Ketol-acid reductoisomerase (1.1.1.86)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y202/00Transferases transferring aldehyde or ketonic groups (2.2)
    • C12Y202/01Transketolases and transaldolases (2.2.1)
    • C12Y202/01006Acetolactate synthase (2.2.1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/02Phosphotransferases with a carboxy group as acceptor (2.7.2)
    • C12Y207/02004Aspartate kinase (2.7.2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y403/00Carbon-nitrogen lyases (4.3)
    • C12Y403/01Ammonia-lyases (4.3.1)
    • C12Y403/01009Glucosaminate ammonia-lyase (4.3.1.9)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y403/00Carbon-nitrogen lyases (4.3)
    • C12Y403/01Ammonia-lyases (4.3.1)
    • C12Y403/01019Threonine ammonia-lyase (4.3.1.19)

Abstract

本发明涉及一种用于在微生物宿主细胞中产生目标重组多肽的方法,其包括(a)向微生物宿主细胞中引入编码所述目标多肽的多核苷酸,所述微生物宿主细胞已经被修饰,使得所述微生物宿主细胞中的选自酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L‑苏氨酸脱水酶活性(EC 4.3.1.19)的酶活性与未经修饰的微生物宿主细胞中的所述酶活性相比被调节;以及(b)在所述微生物宿主细胞中表达所述目标多肽。此外,本发明涉及一种用于减少至少一种非经典支链氨基酸向微生物宿主细胞中表达的目标重组多肽中的错掺的方法。

Description

减少非经典支链氨基酸错掺的方法
技术领域
本发明涉及一种用于在微生物宿主细胞中产生目标重组多肽的方法,其包括(a)向微生物宿主细胞中引入编码所述目标多肽的多核苷酸,所述微生物宿主细胞已经被修饰,使得所述微生物宿主细胞中的选自酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶活性(EC 4.3.1.19)的酶活性与未经修饰的微生物宿主细胞中的所述酶活性相比被调节(如被增加);以及(b)在所述微生物宿主细胞中表达所述目标多肽。此外,本发明涉及一种用于减少至少一种非经典支链氨基酸向微生物宿主细胞中表达的目标重组多肽中的错掺的方法。本发明进一步设想的是一种微生物宿主细胞,其包含(a)编码目标多肽的重组多核苷酸,和(b)编码具有酶活性的多肽的重组多核苷酸。
背景技术
在微生物宿主(如大肠杆菌(Escherichia coli/E.coli))中表达重组蛋白已经成为制造重组治疗性蛋白(如胰岛素)的标准技术。如今,由诸如大肠杆菌等微生物细胞产生的多种生物制药产品在市场上出售。
然而,已知重组蛋白的过表达会对微生物宿主造成压力,通常导致蛋白质的错误折叠或不需要的氨基酸的掺入。经改变的蛋白质可能显示出不需要的特性,如经修饰的生物活性、对蛋白水解的增加的敏感性或免疫原性。特别地,氨基酸向重组蛋白中的错掺是个问题,因为诸如重组胰岛素等药物产品必须是同质且纯净的。因此,必须从产品中除去包含错掺的氨基酸的重组蛋白。
支链氨基酸(BCAA)是具有非线性分子结构的氨基酸。BCAA具有带有分支的脂肪族侧链,即中心碳原子与三个或更多个碳原子结合。亮氨酸、异亮氨酸和缬氨酸是所谓的蛋白原或经典BCAA。除了经典BCAA外,还存在非经典或非蛋白原BCAA。此类非经典BCAA(ncBCAA)是正亮氨酸、正缬氨酸、高异亮氨酸和β-甲基正亮氨酸。
据报道,非经典支链氨基酸(ncBCAA)如正亮氨酸和正缬氨酸分别被错掺,以代替在大肠杆菌中表达的重组蛋白中的亮氨酸和甲硫氨酸(Apostol I.等,1997,Incorporation of norvaline at leucine positions in recombinant humanhemoglobin expressed in Escherichia coli.Journal of Biological Chemistry272.46:28980-28988;Tsai等,(1988),Control of misincorporation of de novosynthesized norleucine into recombinant interleukin-2in E.coli.Biochemicaland biophysical research communications 156(2):733-739)。ncBCAA的合成和积累是由于参与α-酮酸的BCAA生物合成途径的leu和ilv操纵子编码的酶的特异性低的结果。几项研究已经表明,由leuABCD操纵子编码的亮氨酸生物合成途径的酶对于产生非经典支链氨基酸(如正亮氨酸)至关重要。在其经典模式下,亮氨酸途径的酶将α-酮异戊酸转化为α-酮异己酸;这意味着它们导致向五碳α-酮酸中添加一个碳。此外,表明亮氨酸生物合成途径也显示出相当广泛的底物特异性,并且其酶可以作用于多种α-酮酸。例如,亮氨酸途径的酶也可以将α-酮戊酸转化为α-酮己酸,后者是正亮氨酸的前体。
由于氨酰基tRNA合成酶(aaRS)的混杂,发生了非经典支链氨基酸(ncBCAA)向新生的重组蛋白中的错掺。蛋白质合成的保真度取决于aaRS将适当的经典氨基酸装载到其相应的tRNA上的能力(例如由Reitz等,2018,Synthesis of non-canonical branched-chainamino acids in Escherichia coli and approaches to avoid their incorporationinto recombinant proteins,Curr Opin Biotechnol.10月;53:248-253所综述)。这种保真度可能会受到许多非经典氨基酸(特别是ncBCAA)的危害,这些氨基酸在结构上与其经典等同物类似(Martinis SA,Fox GE.Non-standard amino acid recognition byEscherichia coli leucyl-tRNA synthetase.Nucleic Acids Symp Ser.1997;36:125-128)。例如,亮氨酰-tRNA合成酶(leuRS)必须区分亮氨酸和非经典对应物正缬氨酸,它们的不同之处仅在于单个甲基(Apostol,I.等,1997,Incorporation of norvaline atleucine positions in recombinant human hemoglobin expressed in Escherichiacoli.Journal of Biological Chemistry,272(46),28980-28988.)。这同样适用于甲硫氨酰-tRNA合成酶(metRS),它必须区分甲硫氨酸和正亮氨酸(Kiick,K.L.等,2001,Identification of an expanded set of translationally active methionineanalogues in Escherichia coli.FEBS Letters,502(1-2),25-30.);以及异亮氨酰-tRNA合成酶(ileRS),它必须区分异亮氨酸和β-甲基正亮氨酸(Muramatsu,R.等,2003,.Findingof an isoleucine derivative of a recombinant protein for pharmaceuticaluse.Journal of pharmaceutical and biomedical analysis,31(5),979-987.)。例如,当使大肠杆菌在矿物盐培养基上生长并且甲硫氨酸是限制性的时候,正亮氨酸可以在甲硫氨酸转移RNA上经历酰化,随后每当翻译甲硫氨酸密码子时其将被掺入重组蛋白中。
尽管用于重组蛋白产生的不同表达系统是可供使用的,并且已经报道了对培养条件的改变以改善重组蛋白产生,但潜在的代谢过量和不需要的氨基酸向目标重组蛋白中的错掺的问题仍未得到解决。
发生非经典支链氨基酸向异源重组蛋白中的错掺以及如何有效防止此类错掺的条件尚不完全清楚。因此,将非常需要在没有非经典支链氨基酸的错掺的情况下产生重组多肽的方法。
本发明的技术问题可以看作是提供用于满足前述需要的手段和方法。所述技术问题通过权利要求和本文中所表征的实施方案来解决。
发明内容
本发明涉及一种用于在微生物宿主细胞中产生目标重组多肽的方法,其包括以下步骤:
(a)向微生物宿主细胞中引入编码所述目标多肽的多核苷酸,所述微生物宿主细胞已经被修饰,使得所述微生物宿主细胞中的选自酮醇酸还原异构酶(NADP(+))活性(EC1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶活性(EC 4.3.1.19)的酶活性与未经修饰的微生物宿主细胞中的所述酶活性相比被调节(如被增加);以及
(b)在所述微生物宿主细胞中表达所述目标多肽。
本发明进一步涉及一种用于减少至少一种非经典支链氨基酸向微生物宿主细胞中表达的目标重组多肽中的错掺的方法,所述方法包括:
(a)调节(如增加)所述微生物宿主细胞中的选自以下的酶活性:酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶活性(EC 4.3.1.19);
(b)向所述微生物宿主细胞中引入编码所述目标多肽的多核苷酸;以及
(c)在所述微生物宿主细胞中表达所述目标多肽。
本发明进一步设想的是一种微生物宿主细胞,其包含:
(a)编码目标多肽的重组多核苷酸,和
(b)编码具有选自以下的酶活性的多肽的重组多核苷酸:酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶活性(EC 4.3.1.19)。
本发明进一步设想的是一种生物反应器,其包含本发明的微生物宿主细胞。在一些实施方案中,所述生物反应器具有至少10L的体积。
此外,本发明涉及具有选自酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC1.1.1.3)和L-苏氨酸脱水酶活性(EC 4.3.1.19)的酶活性的多肽或编码所述多肽的多核苷酸用于减少至少一种非经典支链氨基酸向微生物宿主细胞中产生的目标重组多肽中的错掺的用途。
最后,本发明涉及微生物宿主细胞用于产生目标重组多肽的用途,其中所述微生物宿主细胞已经被修饰,使得所述微生物宿主细胞中的选自酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶活性(EC 4.3.1.19)的酶活性与未经修饰的微生物宿主细胞中的所述酶活性相比被调节。
在本发明的方法、用途或微生物宿主细胞的一个实施方案中,所述微生物宿主细胞不表达具有所述酶活性的内源多肽。因此,已经缺失(即敲除)所述微生物宿主细胞中的编码具有所述酶活性的多肽的内源(即天然存在的)多核苷酸。
在本发明的方法、用途或微生物宿主细胞的一个实施方案中,所述目标多肽是治疗性多肽,如胰岛素原、胰岛素或胰岛素类似物。
在本发明的方法、用途或微生物宿主细胞的一个实施方案中,编码所述目标多肽的多核苷酸和/或编码具有所述酶活性的多肽的多核苷酸与诱导型启动子可操作地连接。
在本发明的方法、用途或微生物宿主细胞的一个实施方案中,所述微生物宿主细胞是大肠杆菌细胞。
具体实施方式
如上所述,本发明涉及用于在微生物宿主细胞中产生目标重组多肽的方法。所述方法包括(a)向微生物宿主细胞中引入编码所述目标多肽的多核苷酸,所述微生物宿主细胞已经被修饰,使得所述微生物宿主细胞中的如在本文别处所述的酶活性与未经修饰的微生物宿主细胞中的所述酶活性相比被调节;以及(b)在所述微生物宿主细胞中表达所述目标多肽。
根据本发明,应当在微生物宿主细胞中产生目标重组多肽。如本文所用的术语“重组多肽”是指遗传工程化多肽。因此,待产生的多肽相对于微生物宿主细胞应当是异源的,这意味着宿主细胞不天然地表达目标多肽。因此,术语“异源”意味着多核苷酸/多肽不天然地存在于微生物宿主细胞中。
在本发明的一个优选实施方案中,待产生的目标重组多肽是治疗性多肽。
特别地,设想所述目标重组多肽是抗体或其抗原结合片段、酶、受体、分泌蛋白、融合蛋白或激素,特别是肽激素(如胰岛素,或其前体如胰岛素原)。
在一个优选实施方案中,所述目标重组多肽是抗体或其抗原结合片段。优选地,所述抗体选自多特异性抗体、人抗体、人源化抗体、嵌合抗体和单链抗体。优选地,所述抗体的抗原结合片段选自Fab片段、Fab'片段、F(ab')2片段、scFv片段和Fv片段。例如,所述抗原结合片段是F(ab')2片段。
在另一个优选实施方案中,所述目标重组多肽是胰岛素原或胰岛素。胰岛素是这样的肽激素,其由朗格汉斯岛天然地分泌,并且在调节碳水化合物和脂肪的代谢、特别是葡萄糖向糖原的转化中起作用。所述胰岛素可以是天然存在的胰岛素,特别是人胰岛素;或天然存在的胰岛素的类似物,特别是人胰岛素的类似物。因此,术语“胰岛素”包括天然存在的胰岛素及其类似物。胰岛素类似物是胰岛素的改变形式,其不同于自然界中存在的任何形式,但是在血糖控制方面,仍可被人体用于执行与人胰岛素相同的作用。优选地,所述胰岛素类似物选自赖脯胰岛素、门冬胰岛素、谷赖胰岛素、地特胰岛素和甘精胰岛素。
其他目标重组多肽是水蛭素、生长激素、白介素(如白介素-2)或血红蛋白。
应当理解,所述目标重组多肽应当包含至少一个异亮氨酸残基、至少一个亮氨酸残基和/或至少一个甲硫氨酸残基。
在一个实施方案中,所述目标重组多肽是富含亮氨酸的多肽。例如,所述多肽的至少5%、至少10%或至少15%或所有氨基酸是亮氨酸残基。例如,所述目标重组多肽可以具有96个氨基酸的长度,并且可以包含14个亮氨酸残基。可替代地,所述目标重组多肽可以具有44个氨基酸的长度,并且可以包含8个亮氨酸残基。可替代地,所述目标重组多肽可以具有52个氨基酸的长度,并且可以包含6个亮氨酸残基。
在另一个实施方案中,所述目标重组多肽是富含异亮氨酸的多肽。例如,所述多肽的至少5%、至少10%或至少15%或所有氨基酸是异亮氨酸残基。
在另一个实施方案中,所述目标重组多肽是富含甲硫氨酸的多肽。例如,所述多肽的至少5%、至少10%或至少15%或所有氨基酸是甲硫氨酸残基。
特别地,胰岛素的所述类似物是甘精胰岛素。甘精胰岛素是长效基础胰岛素类似物。甘精胰岛素是使用大肠杆菌的非致病性实验室菌株(K12)作为生产生物通过重组DNA技术产生的。它是通过用甘氨酸替换A链的位置A21处的天冬酰胺残基并向B链的C末端(位置B31和32)添加两个精氨酸残基而制成的人胰岛素的类似物。所得蛋白质在pH 4下是可溶的,并且在生理pH 7.4下形成微沉淀物。少量的甘精胰岛素从微沉淀物中缓慢释放,使药物具有长的作用持续时间(长达24小时),并且没有明显的峰值浓度。它在名称
Figure BDA0003122493900000061
下销售。甘精胰岛素的CAS登记号是160337-95-1。
所述目标重组多肽优选地不是在未转化状态的所述生物中表达的多肽。优选地,它也不是表达为选择标记的多肽(即,所述多肽不应当向所述细胞赋予抗性,如对抗生素的抗性)。此外,它优选地不是表达为报告多肽的多肽(如荧光多肽或GUS多肽)。
在本发明的方法的一个实施方案中,共表达所述目标重组多肽和具有如本文所提及的酶活性的多肽。因此,所述目标重组多肽不是具有如在本文结合本发明的方法所提及的酶活性的多肽。优选地,编码所述目标多肽的重组多核苷酸和编码具有如本文所提及的酶活性的多肽的多核苷酸不存在于同一质粒上。因此,设想它们由不同的质粒表达。因此,所述多肽由不同的DNA分子组成。
根据本发明,所述目标重组多肽通过如下方式来产生:向如本文所定义的微生物宿主细胞中引入编码所述目标多肽的重组多核苷酸,以及通过在所述微生物宿主细胞中表达所述目标重组多肽。
优选地,编码所述目标多肽的多核苷酸由表达质粒(即允许所述多核苷酸表达的质粒)组成。这同样适用于编码具有如在本文别处所定义的酶活性的多肽的多核苷酸。为了表达所述多核苷酸,所述多核苷酸与启动子可操作地连接。如本文所用的术语“可操作地连接”是指启动子与待表达的多核苷酸之间的功能性连接,使得启动子能够启动所述多核苷酸的转录。优选的启动子在本文别处有描述。
所述表达质粒可以包含其他元件。优选地,所述质粒另外包含允许选择微生物宿主细胞的可选择标记基因。例如,这可以是赋予对抗生素(如氨苄青霉素、氯霉素、卡那霉素或四环素)的抗性的基因。
此外,设想所述质粒包含允许所述质粒在所述微生物宿主细胞中复制的复制子。在一个优选实施方案中,所述微生物宿主细胞中仅存在包含编码具有如在本文结合本发明的方法所述的酶活性的多肽的多核苷酸的质粒的一个拷贝。因此,所述质粒在所述微生物宿主细胞中的拷贝数应当为1。这可以通过ori2及其元件repE、sopA、sopB和sopC的存在来实现,这确保每个细胞1个质粒拷贝。相反,编码所述目标多肽的多核苷酸可以存在于中或高拷贝质粒上。
向微生物宿主细胞中引入多核苷酸的方法是本领域熟知的。优选地,通过转化将所述多核苷酸引入所述微生物宿主细胞中。转化是生物获得异种或重组多核苷酸的过程。在一个实施方案中,所述微生物宿主细胞的转化涉及使用二价阳离子(如氯化钙)来增加所述宿主细胞的膜的通透性,使所述宿主细胞成为化学感受态的,从而增加摄取所述重组多核苷酸的可能性。在另一个实施方案中,通过电穿孔将所述多核苷酸转化到所述宿主细胞中。此外,可将所述多核苷酸稳定地引入所述宿主细胞中,即引入所述宿主细胞的染色体中。
所述微生物宿主细胞优选地是细菌。更优选地,所述微生物宿主细胞是大肠杆菌(Escherichia coli/E.coli)细胞。大肠杆菌是革兰氏阴性γ变形杆菌。两种分离株(K-12和B菌株)的后代在分子生物学中常规地用作工具和模式生物。优选地,所述大肠杆菌细胞是菌株K12的大肠杆菌细胞。优选地,所述大肠杆菌细胞菌株是大肠杆菌K12 BW25113(参见Grenier,2014,Genome Announc.9月-10月;2(5):e01038-14)。
本发明并不限于大肠杆菌,因为ncBCAA的错掺也发生在诸如枯草芽孢杆菌(B.subtilis)或粘质沙雷氏菌(S.marcescens)等其他细菌中。
根据本发明,应当将编码所述目标多肽的多核苷酸引入微生物宿主细胞中。所述微生物宿主细胞应当已经被修饰,使得所述微生物宿主细胞中的如在本文别处所述的酶活性与未经修饰的微生物宿主细胞中的所述酶活性相比已经被调节(如被增加)。因此,本发明的方法还可以(在步骤a),即引入步骤之前)包括提供或获得具有选自以下的经调节的酶活性的微生物宿主细胞的步骤:酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC1.1.1.3)和L-苏氨酸脱水酶活性(EC 4.3.1.19)。在此特定方法中,与未经修饰的微生物宿主细胞相比,应当调节所述酶活性。可替代地,本发明的示例性方法可以在步骤a)之前包括调节所述微生物宿主细胞中的如上所述的酶活性的步骤。
在本发明的一个实施方案中,术语“调节酶活性”是指增加酶活性(与对照或未经修饰的酶活性相比)。在另一个实施方案中,所述术语是指降低酶活性(与对照或未经修饰的酶活性相比)。
增加多肽的酶活性的方法是本领域熟知的。例如,可以使具有酶活性的多肽突变以增加其活性(例如通过酶设计或酶工程)。
在本发明的一个实施方案中,在其中引入了编码所述目标多肽的多核苷酸的微生物宿主细胞中,如本文所提及的酶活性增加。优选地,与所述未经修饰的微生物宿主细胞中的相应酶活性相比,所述酶活性增加至少10%。更优选地,与所述未经修饰的微生物宿主细胞中的所述酶活性相比,所述酶活性增加至少20%,甚至更优选地增加至少30%,甚至更优选地增加至少50%。在一个实施方案中,所述酶活性增加至少100%,或者在另一个实施方案中增加至少150%。此外,设想所述酶活性增加20%至300%,如增加50%至200%。在一个实施方案中,所述酶活性通过过表达编码具有所述酶活性的多肽的多核苷酸而增加。
在本发明的一个实施方案中,在其中引入了编码所述目标多肽的多核苷酸的微生物宿主细胞中,如本文所提及的酶活性降低。优选地,与所述未经修饰的微生物宿主细胞中的相应酶活性相比,所述酶活性降低至少10%。更优选地,与所述未经修饰的微生物宿主细胞中的所述酶活性相比,所述酶活性降低至少20%,甚至更优选地降低至少30%,甚至更优选地降低至少50%。在一个实施方案中,与所述未经修饰的微生物宿主细胞中的所述酶活性相比,所述酶活性降低至少80%。然而,设想所述酶活性并未被完全敲除。例如,所述宿主细胞可以保留所述未经修饰的微生物宿主细胞的酶活性的至少5%、至少10%或至少20%。因此,所述酶活性可以降低20%至80%。可替代地,所述酶活性可以降低30%至70%。在一个实施方案中,所述酶活性被反义RNA降低,所述反义RNA抑制编码具有所述酶活性的多肽的多核苷酸的表达。因此,所述反义RNA应当与靶基因互补。
在某些实施方案中,所述未经修饰的微生物宿主细胞可以是野生型细胞。在一个特定实施方案中,未经修饰的微生物宿主细胞是已经被修饰的相同菌株的微生物宿主细胞。例如,所述未经修饰的微生物宿主细胞可以是大肠杆菌K12菌株,其随后可以如本文所述进行修饰。
在所述微生物宿主细胞中待调节(如增加)的酶活性优选地选自酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶活性(EC 4.3.1.19)。前述酶活性可以通过本领域熟知的测定来确定。括号中的数字是所谓的酶学委员会编号(缩写为“EC编号”)。如本领域已知的,每个EC编号由字母EC、接着是四个由句点分隔的数字组成。这些数字代表了酶的逐渐更精细的分类。基于EC编号,指定了由酶催化的反应。
在本发明的一个实施方案中,待调节的酶活性是酮醇酸还原异构酶(NADP(+))活性。因此,应当调节、优选地增加酮醇酸还原异构酶的活性。此酶的系统名称为(R)-2,3-二羟基-3-甲基丁酸:NADP+氧化还原酶(异构化)。此酶的EC编号为EC 1.1.1.86。酮醇酸还原异构酶应当能够催化(R)-2,3-二羟基-3-甲基丁酸+NADP+到(S)-2-羟基-2-甲基-3-氧代丁酸、NADPH和H+的化学反应。因此,它应当能够催化以下化学反应:
Figure BDA0003122493900000091
在本发明的另一个实施方案中,待调节的酶活性是乙酰羟酸合酶活性。因此,应当调节(例如增加或降低)乙酰羟酸合酶的活性。此酶也称为乙酰乳酸合酶。此酶的EC编号为EC 2.2.1.6。乙酰羟酸合酶应当能够催化两个丙酮酸分子转化为乙酰乳酸分子和二氧化碳。所述反应使用硫胺素焦磷酸连接两个丙酮酸分子。因此,它应当能够催化以下化学反应:
Figure BDA0003122493900000092
在本发明的另一个实施方案中,待调节的酶活性是L-苏氨酸脱水酶活性。因此,应当调节苏氨酸合酶的活性。此酶的系统名称为L-苏氨酸氨裂合酶(2-氧代丁酸形成)。此酶的EC编号为EC 4.3.1.19。
在本发明的另一个实施方案中,待调节的酶活性是天冬氨酸激酶活性。因此,应当调节天冬氨酸激酶活性的活性。此酶的系统名称为ATP:L-天冬氨酸4-磷酸转移酶。此酶的EC编号为EC 2.7.2.4。天冬氨酸激酶应当能够催化β-天冬氨酰磷酸从天冬氨酸和ATP的转化。苏氨酸充当此酶的变构调节剂,以控制从天冬氨酸到苏氨酸的生物合成途径。因此,它应当能够催化以下化学反应:
Figure BDA0003122493900000102
在本发明的另一个实施方案中,待调节的酶活性是高丝氨酸脱氢酶活性。因此,应当调节高丝氨酸脱氢酶的活性。此酶的系统名称为L-高丝氨酸:NAD(P)+氧化还原酶。此酶的EC编号为EC 1.1.1.3。高丝氨酸脱氢酶应当能够催化L-高丝氨酸和NAD+(或NADP+)到L-天冬氨酸4-半醛、NADH(或NADPH)和H+的化学反应。因此,它应当能够催化以下化学反应:
Figure BDA0003122493900000101
来自大肠杆菌的具有天冬氨酸激酶活性的酶也催化EC 1.1.1.3高丝氨酸脱氢酶的反应。因此,所述酶是具有天冬氨酸激酶活性和高丝氨酸脱氢酶活性的双功能酶。因此,设想所述微生物宿主细胞中的两种酶活性(即天冬氨酸激酶的活性和高丝氨酸脱氢酶的活性)与未经修饰的微生物宿主细胞中的天冬氨酸激酶活性和高丝氨酸脱氢酶活性相比都被调节。
如本文所提及的酶活性优选地通过如下方式来增加:向所述微生物宿主细胞中引入编码具有所述酶活性的多肽的多核苷酸,以及表达所述多核苷酸。例如,应当过表达所述多核苷酸。由所述多核苷酸编码的多肽应当是具有如本文所提及的酶活性的酶。赋予所述酶活性的优选多肽在本说明书的别处有详细公开。应当理解,本文所提及的多肽也可以表现出其他生物活性。
应当理解,编码具有所述酶活性的多肽的所述多核苷酸不是编码所述目标多肽的多核苷酸。因此,如本文所提及的微生物宿主细胞包含a)编码具有如本文所提及的酶活性的多肽的多核苷酸,和b)编码所述目标多肽的多核苷酸。因此,在所述微生物宿主细胞中共表达在a)和b)下的多核苷酸。此外,应当理解,两种多核苷酸都是已经被人工引入所述宿主细胞中的重组多核苷酸。
下文提供了编码具有如本文所提及的酶活性的多肽的多核苷酸的优选序列。
在本发明的一个实施方案中,所述多核苷酸编码具有酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)的多肽。优选地,所述多核苷酸
i)包含与如SEQ ID NO:3所示的核酸序列具有至少40%序列同一性的核酸序列,和/或
ii)编码包含与SEQ ID NO:4所示的氨基酸序列具有至少40%序列同一性的氨基酸序列的多肽。
在本发明的另一个实施方案中,所述多核苷酸编码具有L-苏氨酸脱水酶活性的多肽。优选地,所述多核苷酸
i)包含与如SEQ ID NO:11所示的核酸序列具有至少40%序列同一性的核酸序列,和/或
ii)编码包含与SEQ ID NO:12所示的氨基酸序列具有至少40%序列同一性的氨基酸序列的多肽。
在一个实施方案中,待调节的酶活性是乙酰羟酸合酶(AHAS)活性,特别是AHAS同种型I或其变体、AHAS同种型II或其变体或者AHAS同种型III或其变体的活性。优选地降低AHAS同种型I或其变体的活性,以便减少ncBCAA的错掺。优选地增加AHAS同种型II和III或其变体的活性,以便减少ncBCAA的错掺。
如本领域已知的,功能性乙酰羟酸合酶(例如AHAS I、AHAS II或AHAS III)包含形成四聚体(其具有乙酰羟酸合酶活性)的两个大亚基和两个小亚基。两个大亚基是相同的,两个小亚基也是相同的。因此,优选地,所述微生物宿主细胞中的乙酰羟酸合酶活性通过如下方式来增加:向所述微生物宿主细胞中引入编码乙酰羟酸合酶的大亚基的第一多核苷酸和编码乙酰羟酸合酶的小亚基的第二多核苷酸,以及表达所述多核苷酸。在所述微生物细胞中,两个大亚基和两个小单元优选地形成四聚体。应当理解,所述四聚体应当具有乙酰羟酸合酶活性。所述第一和所述第二多核苷酸优选地存在于同一构建体中,并且优选地在单一启动子的控制下以双顺反子方式进行表达。
AHAS I或其变体
在本发明的一个实施方案中,所述第一多核苷酸
i)包含与如SEQ ID NO:23所示的核酸序列具有至少40%序列同一性的核酸序列,和/或
ii)编码乙酰羟酸合酶的大亚基,所述大亚基包含与SEQ ID NO:24所示的氨基酸序列具有至少40%序列同一性的氨基酸序列,
并且所述第二多核苷酸
i)包含与如SEQ ID NO:25所示的核酸序列具有至少40%序列同一性的核酸序列,和/或
ii)编码乙酰羟酸合酶的小亚基,所述小亚基包含与SEQ ID NO:26所示的氨基酸序列具有至少40%序列同一性的氨基酸序列。
SEQ ID NO:24是来自大肠杆菌的乙酰羟酸合酶同种型I的大亚基的氨基酸序列,而SEQ ID NO:26是所述同种型的小亚基的氨基酸序列。
AHAS II或其变体
在本发明的另一个实施方案中,所述第一多核苷酸
i)包含与如SEQ ID NO:5、27或31所示的核酸序列具有至少40%序列同一性的核酸序列,
ii)编码乙酰羟酸合酶的大亚基,所述大亚基包含与SEQ ID NO:6、28或32所示的氨基酸序列具有至少40%序列同一性的氨基酸序列,
并且所述第二多核苷酸
i)包含与如SEQ ID NO:7、29或33所示的核酸序列具有至少40%序列同一性的核酸序列,和/或
ii)编码乙酰羟酸合酶的小亚基,所述小亚基包含与SEQ ID NO:8、30或34所示的氨基酸序列具有至少40%序列同一性的氨基酸序列。
SEQ ID NO:6是来自大肠杆菌的乙酰羟酸合酶同种型II的大亚基的氨基酸序列,而SEQ ID NO:8是所述同种型的小亚基的氨基酸序列。在一个优选实施方案中,使用大肠杆菌的AHAS同种型(或其变体)。
SEQ ID NO:28是来自鲍氏志贺氏菌(Shigella boydii)的乙酰羟酸合酶同种型III的大亚基的氨基酸序列,而SEQ ID NO:30是所述同种型的小亚基的氨基酸序列。
SEQ ID NO:32是来自粘质沙雷氏菌(Serratia marcescens)的乙酰羟酸合酶同种型III的大亚基的氨基酸序列,而SEQ ID NO:34是所述同种型的小亚基的氨基酸序列。
AHAS III或其变体
在本发明的另一个实施方案中,所述第一多核苷酸
i)包含与如SEQ ID NO:13、35、39或43所示的核酸序列具有至少40%序列同一性的核酸序列,和/或
ii)编码乙酰羟酸合酶的大亚基,所述大亚基包含与SEQ ID NO:14、36、40或44所示的氨基酸序列具有至少40%序列同一性的氨基酸序列,
并且所述第二多核苷酸
i)包含与如SEQ ID NO:15、37、41或45所示的核酸序列具有至少40%序列同一性的核酸序列,和/或
ii)编码乙酰羟酸合酶的小亚基,所述小亚基包含与SEQ ID NO:16、38、42或46所示的氨基酸序列具有至少40%序列同一性的氨基酸序列。
SEQ ID NO:14是来自大肠杆菌的乙酰羟酸合酶同种型III的大亚基的氨基酸序列,而SEQ ID NO:16是所述同种型的小亚基的氨基酸序列。在一个优选实施方案中,使用大肠杆菌的AHAS同种型(或其变体)。
SEQ ID NO:36是来自鲍氏志贺氏菌的乙酰羟酸合酶同种型III的大亚基的氨基酸序列,而SEQ ID NO:38是所述同种型的小亚基的氨基酸序列。
SEQ ID NO:40是来自粘质沙雷氏菌的乙酰羟酸合酶同种型III的大亚基的氨基酸序列,而SEQ ID NO:42是所述同种型的小亚基的氨基酸序列。
SEQ ID NO:44是来自枯草芽孢杆菌(Bacillus subtilis)的乙酰羟酸合酶同种型III的大亚基的氨基酸序列,而SEQ ID NO:46是所述同种型的小亚基的氨基酸序列。
如上所述,设想在所述微生物宿主细胞中(与所述未经修饰的微生物宿主细胞相比),天冬氨酸激酶和高丝氨酸脱氢酶的活性都被调节。在一个优选实施方案中,这两种活性的增加是通过引入和表达编码具有天冬氨酸激酶和高丝氨酸脱氢酶活性的多肽的多核苷酸。因此,所述多肽是双功能多肽。优选地,编码具有天冬氨酸激酶和高丝氨酸脱氢酶活性的多肽的所述多核苷酸:
i)包含与如SEQ ID NO:17所示的核酸序列具有至少40%序列同一性的核酸序列,和/或
ii)编码包含与SEQ ID NO:18所示的氨基酸序列具有至少40%序列同一性的氨基酸序列的多肽。
如本文所用的术语“多核苷酸”是指线性或环状核酸分子。它包括DNA以及RNA分子。优选地,本发明的多核苷酸应当作为分离的多核苷酸(即从其自然背景中分离)或以遗传修饰形式来提供。所述术语包括单链以及双链多核苷酸。此外,所述术语包括经化学修饰的多核苷酸,包括天然存在的经修饰的多核苷酸,如经糖基化或经甲基化的多核苷酸;或者人工修饰的多核苷酸,如经生物素化的多核苷酸。本发明的多核苷酸的特征在于它应当编码如上文所提及的多肽。优选地,所述多核苷酸具有如上文所提到的特定核苷酸序列。此外,由于遗传密码的简并性,包括编码如上所述的特定氨基酸序列的多核苷酸。
此外,如根据本发明所用的术语“多核苷酸”还包括前述特定多核苷酸的变体。所述变体可以代表本发明的多核苷酸的直系同源物、旁系同源物或其他同源物。优选地,所述多核苷酸变体包含如下核酸序列,其特征在于所述序列可以通过至少一个核苷酸取代、添加和/或缺失而衍生自前述特定核酸序列,由此所述变体核酸序列仍然应当编码具有如上所述的活性的多肽。
在本发明的一个优选实施方案中,如上文所述的多核苷酸应当与如SEQ ID NO:3、5、7、11、13、15、17、23、25、27、29、31、33、35、37、39、41、43或45所示的核酸序列具有至少40%序列同一性。此外,设想所述多核苷酸编码包含与SEQ ID NO:4、6、8、12、14、16、18、24、26、28、30、32、34、36、38、40、42、44或46所示的氨基酸序列具有至少40%序列同一性的氨基酸序列的多肽。如本文所用的术语“至少40%”意指40%或多于40%。特别地,所述术语意指至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%序列同一性(以渐增的优先顺序)。此外,所述术语包括准确的序列,即100%序列同一性。因此,所述多核苷酸可以具有或包含如SEQ ID NO:3、5、7、11、13、15、17、23、25、27、29、31、33、35、37、39、41、43或45所示的核酸序列,或者可以编码包含如SEQ ID NO:4、6、8、12、14、16、18、24、26、28、30、32、34、36、38、40、42、44或46所示的氨基酸序列的多肽。
如本文所用的氨基酸序列或核酸序列之间的序列同一性可以通过确定两个核酸序列或氨基酸序列之间的相同核苷酸或氨基酸的数量来评估,其中比对所述序列,使得获得最高位匹配。优选地,在整个氨基酸或核酸序列区域上计算同一性百分比值。基于多种算法的一系列程序可被熟练技术人员用于比较不同序列。在此背景下,Needleman和Wunsch或Smith和Waterman的算法给出了特别可靠的结果。它可以使用编入计算机程序中的公开技术或方法来计算,所述计算机程序是例如像BLASTP、BLASTN或FASTA(Altschul 1990,J MolBiol 215,403)。优选地,在比较窗口上计算同一性百分比值。比较窗口优选地是待比对的较短序列的整个序列或所述序列的至少一半的长度。为了进行序列比对,可以使用程序PileUp(Higgins 1989,CABIOS 5,151)或程序Gap和BestFit(Needleman 1970,J Mol Biol48:443;Smith 1981,Adv Appl Math 2:482),这些程序是GCG软件包(Genetics ComputerGroup 1991,575 Science Drive,美国威斯康星州麦迪逊53711)的一部分。在本发明的另一个方面中,在整个序列区域上使用具有以下设置的程序GAP来确定上述序列同一性值:空位权重:50,长度权重:3,平均匹配:10.000,平均错配:0.000,除非另外规定,否则所述设置应当始终用作序列比对的标准设置。优选地,在整个长度上计算序列同一性的程度。
在一个实施方案中,Needleman和Wunsch的算法(参见上文)用于序列的比较。所述算法已并入序列比对软件包GAP版本10和wNEEDLE中。例如,wNEEDLE读取两个待比对的序列,并且沿着它们的整个长度找到最佳比对。当比较氨基酸序列时,使用10的默认空位开放罚分、0.5的空位扩展罚分和EBLOSUM62比较矩阵。当使用wNEEDLE比较DNA序列时,使用10的空位开放罚分、0.5的空位扩展罚分和EDNAFULL比较矩阵。
变体还包括包含如下核酸序列的多核苷酸,所述核酸序列能够与前述特定核酸序列杂交,优选地在严格杂交条件下杂交。这些严格条件是熟练技术人员已知的,并且可见于Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6。因此,设想如上所述的多核苷酸应当能够与具有如SEQ ID NO:3、5、7、11、13、15、17、23、25、27、29、31、33、35、37、39、41、43或45所示的序列的多核苷酸杂交,特别地,如上所述的多核苷酸应当是具有如SEQ ID NO:3、5、7、11、13、15、17、23、25、27、29、31、33、35、37、39、41、43或45所示的序列的多核苷酸的互补体。
术语“杂交”是本领域熟知的,并且是指基本上同源的互补核苷酸序列彼此退火的过程。杂交过程可以完全在溶液中发生,即两个互补核酸都在溶液中。也可以与固定至基质(如琼脂糖珠)的互补核酸之一进行杂交。为了允许发生杂交,使核酸分子热或化学变性以将双链熔化成两条单链和/或以从单链核酸中去除发夹或其他二级结构。
根据本发明,所述多核苷酸应当能够在严格条件下、特别是在高严格性杂交条件下与具有如SEQ ID NO:3、5、7、11、13、15、17、23、25、27、29、31、33、35、37、39、41、43或45所示的序列的多核苷酸杂交。术语“严格性”是指杂交发生的条件。杂交的严格性受诸如温度、盐浓度、离子强度和杂交缓冲液组成等条件的影响。在一个优选实施方案中,高严格性杂交条件包括在1x SSC中在65℃下或在1x SSC和50%甲酰胺中在42℃下杂交,接着在0.3x SSC中在65℃下洗涤。此外,设想杂交之后在0.1x SSC中在65℃下洗涤。1xSSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以另外包括5x Denhardt试剂、0.5%-1.0%SDS、100μg/ml变性的裂片化鲑鱼精子DNA和0.5%焦磷酸钠。
在本发明的方法的步骤(b)中,在所述微生物宿主细胞中表达所述目标多肽。优选地,所述步骤在允许表达所述多肽的条件下进行。合适的培养条件可以由技术人员确定,而无需再费周折。优选地,所述步骤在标准条件下进行。因此,在标准条件下(例如在实施例9中所述的标准条件下)孵育所述宿主细胞。
在一个实施方案中,所述表达在生物反应器中在大规模条件下进行。如本文所用的术语“生物反应器”是指条件受到严格控制的系统。在一个实施方案中,所述生物反应器是搅拌罐生物反应器。优选地,所述生物反应器由非腐蚀性材料(如不锈钢)制成。所述生物反应器可以具有任何尺寸。在一些实施方案中,所述生物反应器具有至少10升、至少100升、500升、至少1000升、至少2500升或至少5000升或任何中间体积的体积。
根据本发明,编码所述目标多肽的多核苷酸与启动子可操作地连接。这同样适用于编码具有如本文所提及的酶活性的多肽的多核苷酸。然而,优选的是前述多核苷酸与不同的启动子连接。
所述启动子应当允许所述多核苷酸的表达。优选地,所述启动子相对于由其控制的序列是异源的。因此,所述启动子对于编码具有所述酶活性的多肽的多核苷酸和编码所述目标多肽的多核苷酸应当分别是异源的。优选地,所述启动子是组成型启动子或诱导型启动子。允许在微生物宿主细胞中表达的组成型启动子和诱导型启动子是本领域熟知的。
“组成型启动子”是指在大多数(但不一定是所有)生长阶段期间和在大多数环境条件下具有转录活性的启动子。
“诱导型启动子”是指响应于刺激而具有增加的转录起始的启动子。
根据本发明,特别预期所述启动子是诱导型启动子。因此,编码所述目标多肽的多核苷酸和/或编码具有所述酶活性的多肽的多核苷酸应当与诱导型启动子可操作地连接。在这种情况下,所述酶活性仅暂时增加(即在诱导启动子之后)。
在一个实施方案中,所述诱导型启动子是阿拉伯糖诱导型araBAD启动子。启动子是本领域熟知的。阿拉伯糖诱导型araBAD启动子(PBAD)及其调节蛋白AraC已经被描述为用于高水平重组蛋白产生以及用于代谢工程目的的表达系统,因为表达可在广泛范围的阿拉伯糖浓度上调节(Guzman等,1995,Tight regulation,modulation,and high-levelexpression by vectors containing the arabinose PBAD promoter.Journal ofbacteriology,177(14),4121-4130)。表明AraC-PBAD启动子系统也受分解代谢物抑制的调节(Schleif,R.,2000,Regulation of the L-arabinose operon of Escherichiacoli.Trends in Genetics,16(12),559-565;Megerle等,2008,Timing and dynamics ofsingle cell gene expression in the arabinose utilization system.Biophysicaljournal,95(4),2103-2115)。此外,据报道,AraC-PBAD表达系统的适用性取决于大肠杆菌菌株。克隆载体通常含有来自天然araBAD调节系统的araBAD启动子和araC基因的天然序列。
araBAD启动子的序列如SEQ ID NO:19所示。因此,araBAD启动子优选地包含如SEQID NO:19所示的核酸序列,或与其至少70%、至少80%或至少90%相同。
多核苷酸araC的核酸序列如SEQ ID NO:20所示。此基因编码AraC多肽。如果使用araBAD启动子,则必须将表达AraC多肽的多核苷酸引入所述微生物宿主细胞中以激活所述启动子。
其他诱导型启动子是rhaBAD启动子、lac启动子的变体(如lacUV5、Ptac、Ptrc和T7lac启动子)、XylSPm启动子和tet启动子。
具有如本文所提及的酶活性的多肽和/或所述目标多肽可以包含另外的序列。例如,所述一种或多种多肽还可以包含纯化标签。所述标签应当与所述多肽可操作地连接。
所述标签应当允许所述多肽的纯化。此类标签是本领域熟知的。如本文所用的术语“纯化标签”优选地是指允许纯化多肽的另外的氨基酸序列(多肽的肽)。在一个实施方案中,所述纯化标签是不天然地与如本文所提及的多肽连接的肽或多肽。因此,所述纯化标签相对于所述多肽应当是异源的。
优选地,所述纯化标签选自聚组氨酸标签、聚精氨酸标签、谷胱甘肽-S-转移酶(GST)、麦芽糖结合蛋白(MBP)、流感病毒HA标签、硫氧还蛋白、葡萄球菌蛋白A标签、FLAGTM表位和c-myc表位。在一个优选实施方案中,所述纯化标签是聚组氨酸标签。优选地,所述聚组氨酸标签包含至少6个连续的组氨酸残基。
在本发明的方法的一个优选实施方案中,所述方法还包括从所述细胞中分离所述目标多肽,以及纯化所述多肽。所述多肽的分离可以通过熟知的手段(如经由使用合适的纯化标签)来实现。
在一个实施方案中,所述纯化包括富集不包含非经典支链氨基酸的多肽。这可以通过例如在以下文献中描述的熟知的方法来实现:Min,C.K.等,2012,Insulin relatedcompounds and identification.Journal of Chromatography B,908,105-112;Harris,R.P.等,2014,Amino acid misincorporation in recombinant biopharmaceuticalproducts.Current opinion in biotechnology,30,45-50;Cvetesic,N.等,2016,Proteome-wide measurement of non-canonical bacterial mistranslation byquantitative mass spectrometry of protein modifications.Scientific reports,6,2863。例如,通过层析实现所述富集。
上文已经定义了所述微生物宿主细胞。如上所述,所述微生物宿主细胞优选地是大肠杆菌细胞。如技术人员已知的,大肠杆菌细胞天然地表达具有酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)或L-苏氨酸脱水酶活性(EC 4.3.1.19)的多肽。
·ilvC基因编码具有酮醇酸还原异构酶(NADP(+))活性的多肽
·ilvIH操纵子编码具有乙酰羟酸合酶活性的多肽(乙酰羟酸合酶同工酶III),
·ilvBN操纵子编码具有乙酰羟酸合酶活性的多肽(乙酰羟酸合酶同工酶I),
·ilvGM操纵子编码具有乙酰羟酸合酶活性的多肽(乙酰羟酸合酶同工酶II),
·thrA基因编码具有天冬氨酸激酶和高丝氨酸脱氢酶活性的双功能多肽,并且
·ilvA基因编码具有L-苏氨酸脱水酶活性的多肽。
因此,已经被修饰的微生物宿主细胞可以具有内源酶活性,即天然地存在于所述微生物宿主细胞中的活性。然而,特别设想所述微生物宿主不表达编码具有如本文所提及的酶活性的多肽的内源多核苷酸。因此,可能已经敲除所述内源酶活性。因此,设想已经敲除所述内源多核苷酸(以及因此所述内源酶活性)。因此,可能已经敲除ilvC基因、ilvIH操纵子、ilvBN操纵子、thrA基因、ilvGM操纵子或ilvA基因。这可以通过本领域熟知的方法来实现,并且在实施例部分中有描述。此外,此类敲除已经是已知的,并且可以例如从耶鲁大学的大肠杆菌遗传储备中心(E.coli Genetic Stock Center,CGSC)进行评估。例如,大肠杆菌K12 BW25113在ilvG遗传序列的碱基对1250与1253之间具有双碱基插入事件,导致移码突变。结果,形成了终止密码子,导致ilvG基因表达过早终止(ilvG-)。然后不表达功能性AHASII,并且ilvEDA操纵子的远端基因表达受损(Lawther等,1981,Molecular basis ofvaline resistance in Escherichia coli K-12,PNAS 78(2)922-925;Parekh,B.S.和Hatfield,G.W.,1997.Growth rate-related regulation of the ilvGMEDA operon ofEscherichia coli K-12is a consequence of the polar frameshift mutation in theilvG gene of this strain.Journal of bacteriology,179(6)2086-2088.)。在本文公开的具体实施方案中,从耶鲁大学的大肠杆菌遗传储备中心(CGSC)获得ΔthrA、ΔilvA和ΔilvC的敲除(参见实施例部分)。
在一个实施方案中,已经缺失编码具有所述酶活性的多肽的内源多核苷酸。可替代地,可能已经使它突变,从而使所述内源酶活性失活。所述内源多核苷酸是天然存在的多核苷酸,其编码具有如本文所提及的酶活性的多肽。
例如,可以通过引入和表达编码具有L-苏氨酸脱水酶活性的多肽的多核苷酸(即重组多核苷酸)来增加微生物宿主细胞中的L-苏氨酸脱水酶活性。在一个实施方案中,所述微生物宿主细胞表达编码具有L-苏氨酸脱水酶活性的多肽的内源多核苷酸(即除了所述重组多核苷酸之外)。在另一个更优选的实施方案中,已经敲除所述微生物细胞中的编码具有L-苏氨酸脱水酶活性的多肽的内源多核苷酸(以及因此ilvA基因)。因此,所述微生物细胞不表达具有L-苏氨酸脱水酶活性的内源多肽。仅表达具有所述活性的重组多肽。
与使用如上所述的诱导型启动子结合的内源基因(即内源酶活性)的敲除允许改善所述微生物宿主细胞中的酶活性的调节。
在一个优选实施方案中,与已经通过在未经修饰的微生物宿主细胞中表达而产生的多肽相比,所产生的目标多肽显示出更低的非经典支链氨基酸(ncBCAA)错掺。因此,减少了ncBCAA的错掺。
优选地,所述非经典支链氨基酸选自正缬氨酸、正亮氨酸和β-甲基正亮氨酸。因此,与已经通过在未经修饰的微生物宿主细胞中表达而产生的多肽相比,所述目标多肽优选地显示出更低的正缬氨酸、正亮氨酸和β-甲基正亮氨酸错掺。
在一些实施方案中,非经典支链氨基酸的错掺在细胞内可溶性蛋白部分中减少。在一些实施方案中,非经典支链氨基酸的错掺在包涵体部分中减少。
正缬氨酸是具有式CH3(CH2)2CH(NH2)CO2H的氨基酸。所述化合物是更常见的氨基酸缬氨酸的异构体。IUPAC名称为2-氨基戊酸。正缬氨酸可以被错掺进重组蛋白中,以代替亮氨酸残基。因此,术语“正缬氨酸错掺”是指将正缬氨酸残基掺入目标多肽中,在其中亮氨酸残基由编码目标多肽的相应核酸编码。
正亮氨酸是具有式CH3(CH2)3CH(NH2)CO2H的氨基酸。正亮氨酸是更常见的氨基酸亮氨酸的异构体。IUPAC名称为2-氨基己酸。正亮氨酸可以被错掺进重组蛋白中,以代替甲硫氨酸残基。因此,术语“正亮氨酸错掺”是指将正亮氨酸残基掺入目标多肽中,在其中甲硫氨酸残基由编码目标多肽的相应核酸编码。
β-甲基正亮氨酸是氨基酸。此氨基酸的同义词是β-甲基正亮氨酸;(2S,3S)-2-氨基-3-甲基己酸和[2S,3S,(+)]-2-氨基-3-甲基己酸。β-甲基正亮氨酸可以被错掺进重组蛋白中,以代替异亮氨酸残基。因此,术语“β-甲基正亮氨酸错掺”是指将β-甲基正亮氨酸残基掺入目标多肽中,在其中异亮氨酸残基由编码目标多肽的相应核酸编码。
因此,如果所述目标多肽包含至少一个亮氨酸残基、至少一个甲硫氨酸残基和/或至少一个异亮氨酸残基,则可能发生如上文所提及的ncBCAA的错掺。因此,设想所述目标多肽包含至少一个亮氨酸残基、至少一个甲硫氨酸残基和/或至少一个异亮氨酸残基。
在本发明的一个实施方案中,减少了正缬氨酸的错掺。
在本发明的一个实施方案中,减少了正亮氨酸的错掺。
在本发明的一个实施方案中,减少了β-甲基正亮氨酸的错掺。
在本发明的一个实施方案中,减少了正缬氨酸和正亮氨酸的错掺。
在本发明的一个实施方案中,减少了正亮氨酸和β-甲基正亮氨酸的错掺。
在本发明的一个实施方案中,减少了正缬氨酸和β-甲基正亮氨酸的错掺。
在本发明的一个实施方案中,减少了正缬氨酸、正亮氨酸和β-甲基正亮氨酸的错掺。
根据本发明,ncBCAA含量(特别是正缬氨酸、正亮氨酸和/或β-甲基正亮氨酸含量)的减少百分比优选地为5%,更优选地至少10%,甚至更优选地至少15%,甚至更优选地至少20%(与已经通过在未经修饰的微生物宿主细胞(即对照细胞)中表达而产生的多肽中的含量相比)。因此,ncBCAA的错掺优选地减少至少5%、至少10%、至少15%或至少20%。ncBCAA的含量或者正缬氨酸、正亮氨酸和/或β-甲基正亮氨酸的含量的减少百分比优选地计算为含有ncBCAA或正缬氨酸、正亮氨酸和/或β-甲基正亮氨酸的目标多肽的百分比的减少。
上文提供的定义和解释在细节上作必要的修改适用于本发明的以下实施方案。
本发明进一步涉及用于减少至少一种非经典支链氨基酸向微生物宿主细胞中表达的目标重组多肽中的错掺的方法,所述方法包括:
(a)调节所述微生物宿主细胞中的选自以下的酶活性:酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶(EC 4.3.1.19);
(b)向所述微生物宿主细胞中引入编码所述目标多肽的多核苷酸;以及
(c)在所述微生物宿主细胞中表达所述目标多肽。
可替代地,步骤(a)可以包括获得具有选自以下的酶活性的经调节的活性的微生物宿主细胞:酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶(EC 4.3.1.19)。
在一个实施方案中,与未经修饰的微生物宿主细胞相比,所述微生物宿主细胞中的如上所述的酶活性应当被调节(被增加或被降低)。调节酶活性的方法在上文有描述。优选地,所述酶活性通过在所述微生物宿主细胞中引入和表达编码具有所述酶活性的多肽的多核苷酸来调节(例如增加)。所述多核苷酸/多肽的优选序列在上文有描述。
本发明进一步设想的是微生物宿主细胞,其包含:
(a)编码目标多肽的重组多核苷酸,和
(b)编码具有选自以下的酶活性的多肽的重组多核苷酸:酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶(EC 4.3.1.19)。
此外,本发明涉及具有选自酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC1.1.1.3)、L-苏氨酸脱水酶(EC 4.3.1.19)的酶活性的多肽或编码所述多肽的多核苷酸用于减少至少一种非经典支链氨基酸向微生物宿主细胞中产生的目标重组多肽中的错掺的用途。
最后,本发明涉及微生物宿主细胞用于产生目标重组多肽的用途,其中所述微生物宿主细胞已经被修饰,使得所述微生物宿主细胞中的选自酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶(EC 4.3.1.19)的酶活性与未经修饰的微生物宿主细胞中的所述酶活性相比被调节。
在下面,总结了本发明的实施方案。上文提供的定义和解释在细节上作必要的修改适用于实施方案。
实施方案列表
1.一种用于在微生物宿主细胞中产生目标重组多肽的方法,其包括以下步骤:
(a)向微生物宿主细胞中引入编码所述目标多肽的多核苷酸,所述微生物宿主细胞已经被修饰,使得所述微生物宿主细胞中的选自酮醇酸还原异构酶(NADP(+))活性(EC1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶(EC 4.3.1.19)的酶活性与未经修饰的微生物宿主细胞中的所述酶活性相比被调节;以及
(b)在所述微生物宿主细胞中表达所述目标多肽。
2.根据实施方案1所述的方法,其中与已经通过在未经修饰的微生物宿主细胞中表达而产生的多肽相比,所产生的目标多肽显示出更低的非经典支链氨基酸错掺。
3.根据实施方案1和2所述的方法,其中与在未经修饰的微生物宿主细胞中产生的所述多肽的量相比,所产生的多肽的量增加。
4.根据实施方案1至3中任一项所述的方法,其中所述方法还包括从所述细胞中分离所述多肽,以及纯化所述多肽。
5.根据实施方案4所述的方法,其中所述纯化包括富集不包含非经典支链氨基酸的多肽。
6.根据实施方案1和5所述的方法,其中所述酶活性通过在所述微生物宿主细胞中引入和表达编码具有所述酶活性的多肽的多核苷酸来增加。
7.根据实施方案6所述的方法,其中,
(a)所述多核苷酸编码具有酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)的多肽,并且其中
i)所述多核苷酸包含与如SEQ ID NO:3所示的核酸序列具有至少40%序列同一性的核酸序列,和/或
ii)所述多核苷酸编码包含与SEQ ID NO:4所示的氨基酸序列具有至少40%序列同一性的氨基酸序列的多肽,
或者
(b)所述多核苷酸编码具有L-苏氨酸脱水酶活性(EC 4.3.1.19)的多肽,并且其中
i)所述多核苷酸包含与如SEQ ID NO:11所示的核酸序列具有至少40%序列同一性的核酸序列,和/或
ii)所述多核苷酸编码包含与SEQ ID NO:12所示的氨基酸序列具有至少40%序列同一性的氨基酸序列的多肽。
8.根据实施方案6和7中任一项所述的方法,其中所述微生物宿主细胞不表达具有所述酶活性的内源多肽。
9.根据实施方案1至8中任一项所述的方法,其中所述目标多肽是治疗性肽或多肽。
10.根据实施方案1至9中任一项所述的方法,其中编码所述目标多肽的多核苷酸和/或编码具有所述酶活性的多肽的多核苷酸与诱导型启动子可操作地连接。
11.根据实施方案1至10中任一项所述的方法,其中所述微生物宿主细胞是大肠杆菌细胞。
12.一种用于减少至少一种非经典支链氨基酸向微生物宿主细胞中表达的目标重组多肽中的错掺的方法,所述方法包括:
(d)调节所述微生物宿主细胞中的选自以下的酶活性:酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶(EC 4.3.1.19);
(a)向所述微生物宿主细胞中引入编码所述目标多肽的多核苷酸;以及
(b)在所述微生物宿主细胞中表达所述目标多肽。
13.根据实施方案12所述的方法,其中所述至少一种非经典支链氨基酸选自正缬氨酸、正亮氨酸和β-甲基正亮氨酸。
14.一种微生物宿主细胞,其包含:
(a)编码目标多肽的重组多核苷酸,和
(c)编码具有选自以下的酶活性的多肽的重组多核苷酸:酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶(EC 4.3.1.19)。
15.具有选自酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶(EC 4.3.1.19)的酶活性的多肽或编码所述多肽的多核苷酸用于减少至少一种非经典支链氨基酸向微生物宿主细胞中产生的目标重组多肽中的错掺的用途。
16.微生物宿主细胞用于产生目标重组多肽的用途,其中所述微生物宿主细胞已经被修饰,使得所述微生物宿主细胞中的选自酮醇酸还原异构酶(NADP(+))活性(EC1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶(EC 4.3.1.19)的酶活性与未经修饰的微生物宿主细胞中的所述酶活性相比被调节。
17.根据实施方案1至13中任一项所述的方法、根据实施方案14所述的微生物细胞或者根据实施方案15或16所述的用途,其中所述酶活性被调节。
18.根据实施方案1至13和17中任一项所述的方法、根据实施方案14或17所述的微生物细胞或者根据实施方案15、16或17所述的用途,其中所述目标多肽是胰岛素原。
附图说明
图1:表达小型胰岛素原的pSW3_lacI+的质粒图谱。质粒pSW3_lacI+赋予对氨苄青霉素的抗性,并且表达在IPTG诱导型启动子控制下的11kDa重组蛋白(小型胰岛素原)。质粒还共表达阻遏子LacI,其在lacI+启动子变体的控制下。用
Figure BDA0003122493900000251
产生。
图2:含有片段1的16ABZ5NP_1934177的质粒图谱。用
Figure BDA0003122493900000252
产生。
图3:pCP20的质粒图谱。用
Figure BDA0003122493900000253
产生。
图4:包括ori2及其元件(repE、sopA、sopB、sopC)的pETcoco1的质粒图谱。用
Figure BDA0003122493900000254
产生。
图5:阿拉伯糖可调的质粒pACG_araBAD的质粒图谱。它包括ori2及其元件(repE、sopA、sopB、sopC),这确保每个细胞1个拷贝质粒。质粒赋予对氯霉素的抗性。外源基因可通过用酶NheI和NotI进行限制性克隆来克隆。所克隆的基因在阿拉伯糖启动子的控制下。AraC是激活阿拉伯糖启动子所必需的,并且也存在于所述质粒中。存在另外的独特的限制位点(SmiI、XhoI、XmaJI、MssI),以便允许交换复制起点、抗生素抗性标记和启动子区。用
Figure BDA0003122493900000255
产生。
图6:阿拉伯糖可调的质粒pACG_araBAD_ilvIH的质粒图谱。通过用酶NheI和NotI将基因ilvIH限制性克隆到原始pACG_araBAD质粒中产生了此质粒。此质粒允许通过向培养基中添加阿拉伯糖来调节ilvIH基因的表达。用
Figure BDA0003122493900000256
产生。
图7:在这项工作中对野生型大肠杆菌进行的遗传修饰。基因组DNA含有某个基因(基因A)的敲除。由于存在含有这种基因的可调的表达质粒(pACG_araBAD_基因A),因此该基因的表达可以由L-阿拉伯糖来调节。此外,质粒pSW3_lacI+表达小型胰岛素原,这允许测试ncBCAA错掺。
图8:pKD46的质粒图谱。用
Figure BDA0003122493900000257
产生。
图9:pKD3的质粒图谱。用
Figure BDA0003122493900000258
产生。
图10:pKD4的质粒图谱。用
Figure BDA0003122493900000259
产生。
图11:在15L反应器中在标准条件(STD)下和在触发ncBCAA积累的条件(即丙酮酸脉冲和氧限制)(PYR-O2)下在诱导不同大肠杆菌培养物之后随时间计算的细胞内可溶性蛋白部分中存在的针对OD600nm归一化的正缬氨酸(A)、正亮氨酸(B)和β-甲基正亮氨酸(C)的摩尔浓度。在图例中所指示,“WT大肠杆菌”是指野生型菌株大肠杆菌K-12 BW25113 pSW3_lacI+,“ilvGM可调的大肠杆菌”是指菌株大肠杆菌K-12 BW25113 pSW3_lacI+ pACG_araBAD_ilvGM,并且“ilvIH可调的大肠杆菌”对应于菌株大肠杆菌K-12 BW25113ΔilvIHpSW3_lacI+ pACG_araBAD_ilvIH。箭头指示施加1g/L丙酮酸脉冲连同5min O2限制的时间点。
图12:在15L反应器中在标准条件(STD)下和在触发ncBCAA积累的培养条件(即丙酮酸脉冲和氧限制)(PYR-O2)下在诱导不同大肠杆菌培养物之后随时间计算的包涵体部分中存在的针对OD600nm归一化的正缬氨酸(A)和正亮氨酸(B)的摩尔浓度。在图例中所指示,“WT大肠杆菌”是指野生型菌株大肠杆菌K-12 BW25113 pSW3_lacI+,“ilvGM可调的大肠杆菌”是指菌株大肠杆菌K-12 BW25113 pSW3_lacI+ pACG_araBAD_ilvGM,并且“ilvIH可调的大肠杆菌”对应于菌株大肠杆菌K-12 BW25113ΔilvIH pSW3_lacI+ pACG_araBAD_ilvIH。箭头指示施加1g/L丙酮酸脉冲连同5min O2限制的时间点。
上文所提及的所有参考文献都通过参考它们的全部公开内容以及在上文的描述中明确提及的它们的具体公开内容而随同并入。
以下实施例仅说明本发明。它们不应当被解释为以任何方式限制保护范围。
实施例
实施例1:用质粒pSW3_lacI+转化K12 BW25113ΔthrA、ΔilvA、ΔilvC、ΔilvIH和ΔilvBN突变体
ΔthrA、ΔilvA、ΔilvC敲除
菌株大肠杆菌K12 BW25113以及单敲除突变体大肠杆菌K12 BW25113ΔthrA、ΔilvA和ΔilvC是从耶鲁大学的大肠杆菌遗传储备中心(CGSC)获得的。这些突变型菌株属于所谓的KEIO集合(Baba,T.,Ara,T.,Hasegawa,M.,Takai,Y.,Okumura,Y.,Baba,M.,...&Mori,H.(2006).Construction of Escherichia coli K-12in-frame,single-geneknockout mutants:the Keio collection.Molecular systems biology,2(1))。这些菌株含有质粒pKD46(图8)和取代靶基因的卡那霉素抗性标记。所获得的每种菌株的CGSC标识如下所指示:
Figure BDA0003122493900000261
Figure BDA0003122493900000271
质粒pKD46是从所获得的大肠杆菌K12 BW25113单敲除突变体中提取的,并且将对应的电感受态细胞用pCP20转化(图3),pCP20是编码翻转酶的温度敏感的质粒。提取质粒pCP20,并且通过测序来测试从突变体中去除抗生素抗性标记。将最终的对应的电感受态大肠杆菌K12 BW25113突变体用pSW3_lacI+转化(图1),pSW3_lacI+是编码小型胰岛素原的高拷贝质粒。
ΔilvIH和ΔilvBN敲除
并未获得敲除菌株大肠杆菌K12 BW25113ΔilvIH和ΔilvBN,而是手动产生的。在“Datsenko,K.A.,&Wanner,B.L.(2000).One-step inactivation of chromosomal genesin Escherichia coli K-12using PCRproducts.Proceedings of the National Academyof Sciences,97(12),6640-6645”处描述的产生大肠杆菌敲除突变体的程序用作参考。将电感受态大肠杆菌K12 BW25113细胞用pKD46转化,pKD46是温度敏感的重组辅助质粒。然后通过用先前通过PCR从pKD3(图9)或pKD4(图10)获得的对应的缺失盒转化含有pKD46的电感受态大肠杆菌K12 BW25113细胞来产生操纵子ilvIH和ilvBN的敲除突变体。进行基于PCR的验证,以测试缺失盒正确整合到基因组中。提取质粒pKD46,并且将对应的电感受态大肠杆菌K12 BW25113突变体用pCP20转化(图3),pCP20是编码翻转酶的温度敏感的质粒。提取质粒pCP20,并且通过测序来测试从突变体中去除抗生素抗性标记。将最终的对应的电感受态大肠杆菌K12 BW25113突变体用pSW3_lacI+转化(图1),pSW3_lacI+是编码小型胰岛素原的高拷贝质粒。实施例2:araC-PBAD可调的表达载体(pACG_araBAD)的设计与产生
通过连接3个不同的DNA区段获得基于阿拉伯糖的可调的表达质粒,允许调节先前被敲除的研究基因:片段1含有araC-PBAD启动子区(Guzman等,1995,Tight regulation,modulation,and high-level expression by vectors containing the arabinose PBADpromoter.Journal of bacteriology,177(14),4121-4130)、UTR、T7终止子、允许用稀有切割限制酶NheI和NotI进行基因克隆的克隆位点和允许表达融合蛋白的C末端6xhis标签序列。片段2含有氯霉素抗性盒,而片段3包括ori2复制起点和基因sopA、sopB、sopC和repE。
化学合成片段1,随后将其克隆到质粒16ABZ5NP_1934177中(图2)。然后通过PCR从质粒16ABZ5NP_1934177中扩增片段1。片段2和3通过PCR分别从质粒pCP20(图3)和pETcoco1(图4)中直接扩增而来。根据In-Fusion克隆策略(Takara Bio USA;参考号:639649)将三个DNA区段连接在一起以产生质粒pACG_araBAD(图5)。
实施例3:将靶基因克隆到可调的表达载体中
研究基因(ilvA、ilvC、ilvIH、ilvBN和thrA)通过PCR从大肠杆菌K12BW25113基因组DNA中扩增而来,随后通过使用限制酶NheI和NotI将它们克隆到先前产生的可调的表达质粒中(图5)。ilvGM是从ilvG未突变的大肠杆菌菌株中扩增而来的。作为例子,所得阿拉伯糖可调的质粒pACG_araBAD_ilvIH的质粒图谱如图6所示。
实施例4:将具有所克隆的基因的可调的表达载体转化到含有pSW3_lacI+的对应的突变体中
将含有pSW3_lacI+的最终的对应的电感受态大肠杆菌K12 BW25113突变体用表达相应的研究基因的可调的表达质粒转化。
在所有遗传修饰之后,所产生的大肠杆菌突变型菌株看起来像如图7中所述。然后总共产生了6株大肠杆菌突变型菌株:
·表达pSW3_lacI+和pACG_araBAD_ilvC的大肠杆菌K12 BW25113ΔilvC
·表达pSW3_lacI+和pACG_araBAD_ilvIH的大肠杆菌K12 BW25113ΔilvIH
·表达pSW3_lacI+和pACG_araBAD_ilvBN的大肠杆菌K12 BW25113ΔilvBN
·表达pSW3_lacI+和pACG_araBAD_thrA的大肠杆菌K12 BW25113ΔthrA
·表达pSW3_lacI+和pACG_araBAD_ilvA的大肠杆菌K12 BW25113ΔilvA
·表达pSW3_lacI+和pACG_araBAD_ilvGM的大肠杆菌K12 BW25113实施例5:评价L-阿拉伯糖对突变型大肠杆菌菌株的细胞生长的诱导作用。
此实验的目的是评价添加不同浓度的L-阿拉伯糖对在araBAD启动子控制下的基因表达的影响,以及因此对所产生的突变型大肠杆菌菌株的细胞生长的影响。
使大肠杆菌细胞在含有(每L)0.67g Na2SO4、0.82g(NH4)2SO4、0.17g NH4Cl、4.87gK2HPO4、1.2g NaH2PO4 x 2H2O和0.33g(NH4)2-H-柠檬酸盐的确定的矿物盐培养基中生长。所述培养基补充有0.67ml/L微量元素溶液和0.67ml/L MgSO4溶液(1.0M)。微量元素溶液包含(每L):0.5g CaCl2 x 2H2O、0.18g ZnSO4 x 7H2O、0.1g MnSO4 x H2O、16.7g FeCl3 x 6H2O、0.16g CuSO4 x 5H2O、0.18g CoCl2 x 6H2O。另外,使用0.1M的Na-磷酸盐缓冲液进一步缓冲培养基。
为了产生培养物,使用50μL含有相应的大肠杆菌菌株的冷冻原料接种5mL含有5g/L葡萄糖、100μg/mL氨苄青霉素、25μg/mL氯霉素(仅用于突变型大肠杆菌菌株)和给定浓度的L-阿拉伯糖的经补充的确定的矿物盐培养基。将培养物在定轨摇床中在37℃和220rpm下孵育15h。在过程结束时,测量每种培养物的OD600nm。下表总结了所获得的结果:
Figure BDA0003122493900000291
Figure BDA0003122493900000301
实施例6:在小型生物反应器水平下评价L-阿拉伯糖对突变型大肠杆菌菌株中的ncBCAA产生的诱导作用的培养条件。
·培养基
使大肠杆菌细胞在含有(每L)0.67g Na2SO4、0.82g(NH4)2SO4、0.17g NH4Cl、4.87gK2HPO4、1.2g NaH2PO4 x 2H2O和0.33g(NH4)2-H-柠檬酸盐的确定的矿物盐培养基中生长。所述培养基补充有0.67ml/L微量元素溶液和0.67ml/L MgSO4溶液(1.0M)。微量元素溶液包含(每L):0.5g CaCl2 x 2H2O、0.18g ZnSO4 x 7H2O、0.1g MnSO4 x H2O、16.7g FeCl3 x 6H2O、0.16g CuSO4 x 5H2O、0.18g CoCl2 x 6H2O。另外,使用0.1M的Na-磷酸盐缓冲液进一步缓冲培养基。
·预培养
使用30μL含有相应的大肠杆菌菌株的冷冻原料接种30mL含有5g/L葡萄糖、100μg/mL氨苄青霉素和25μg/mL氯霉素(仅用于突变型大肠杆菌菌株)的经补充的确定的矿物盐培养基,以便产生预培养物。对于每种突变型大肠杆菌菌株,培养基还含有恢复非工程化菌株的细胞生长所必需的最低L-阿拉伯糖浓度,先前在实施例5中对其进行了测试。将预培养物在定轨摇床中在37℃和220rpm下孵育过夜。
·主培养
测量预培养结束时的OD600nm,并且使用给定的体积接种5mL起始体积Pall Micro24小型生物反应器(Microreactor Technologies Inc.),使得初始OD600nm为0.4。小型反应器培养基由含有4g/L葡萄糖、100μg/mL氨苄青霉素、25μg/mL氯霉素(仅用于突变型大肠杆菌菌株)和1μL/mL Desmophen消泡剂的经补充的确定的矿物盐培养基组成。培养基还补充有不同浓度的L-阿拉伯糖。在37℃下进行培养,并且通过用NH4OH和CO2自动控制将pH保持为7。将搅拌器速度设置为800rpm,并且将DO设定点设置为25%,通过自动增加进入小型反应器中的氧流量来保持最后值。分批阶段持续了大约4h。在分批阶段完成之后,将1mL 400g/LEnPump 200溶液和50μL 3000U/L淀粉酶溶液手动添加到小型反应器中,从而开始分批补料阶段。EnPump 200是葡萄糖聚合物,并且当淀粉酶存在时,它不断地水解聚合物,从而随时间递送游离葡萄糖分子,然后确保葡萄糖受限的发酵。在分批补料阶段开始之后30min,通过手动添加IPTG脉冲至最终浓度为0.5mM来诱导重组蛋白表达。分批补料阶段活跃3.5h。
实施例7:氨基酸分析
根据“BugBuster蛋白质提取试剂”试剂盒(Merck,目录号:70584-4)中提供的方案,从细胞提取物中分离细胞内可溶性蛋白部分和包涵体部分。将250μL分离的细胞内可溶性蛋白部分与750μL 5M HCl混合。将分离的包涵体沉淀用200μL dH2O重悬,并且将100μL所得包涵体悬浮液与900μL 5M HCl混合。将所得溶液引入带有螺旋盖的晶体小瓶中,并且将小瓶在80℃下孵育24h以进行酸水解。之后,将小瓶在旋转的同时在65℃下在加热块中打开16-24h,直到蒸发掉所有液体。根据“EZ:faastTM通过GC-FID进行游离(生理)氨基酸分析”试剂盒(Phenomenex,目录号:KG0-7165)中提供的方案,从经干燥的水解样品中分离氨基酸。在分离过程之后,将大约120μL所得上层引入GC小瓶中,然后将2μL注入GC分析仪中。GC根据以下烘箱条件来运行:平衡时间为0.5min,110℃持续1min,30℃/min加热至320℃,然后320℃持续1min。氮气用作载气,且恒定流速为1.5mL/min。在250℃下以1:15分流比进行注射。
实施例8:在小型生物反应器水平下评价L-阿拉伯糖对突变型大肠杆菌菌株中的ncBCAA产生的诱导作用。
下表总结了在不同浓度的L-阿拉伯糖下每种测试蛋白质部分、ncBCAA和突变型菌株的实验结果。表格中呈现的粗体数据对应于大肠杆菌BW25113pSW3_lacI+对照菌株中给定ncBCAA的浓度。表格中显示的百分比格式的数据对应于在给定浓度的L-阿拉伯糖下在突变型菌株中获得的ncBCAA浓度相对于大肠杆菌BW25113 pSW3_lacI+对照菌株获得的ncBCAA浓度的变化百分比。
包涵体部分
A)正缬氨酸
Figure BDA0003122493900000321
Figure BDA0003122493900000322
Figure BDA0003122493900000323
对于菌株大肠杆菌BW25113ΔilvC pSW3_lacI+ pACG_araBAD_ilvC和大肠杆菌BW25113ΔilvIH pSW3_lacI+ pACG_araBAD_ilvIH,当向培养基中添加浓度渐增的L-阿拉伯糖时,正缬氨酸浓度显著降低。菌株大肠杆菌BW25113ΔilvBN pSW3_lacI+ pACG_araBAD_ilvBN观察到相反的行为。对于菌株大肠杆菌BW25113ΔthrA pSW3_lacI+ pACG_araBAD_thrA和大肠杆菌BW25113 pSW3_lacI+ pACG_araBAD_ilvGM,正缬氨酸浓度显示出显著降低,但是渐增的L-阿拉伯糖浓度对正缬氨酸浓度变化的影响并未显示出明显的趋势。对于菌株大肠杆菌BW25113ΔilvA pSW3_lacI+ pACG_araBAD_ilvA,并未报告正缬氨酸浓度的显著降低,并且渐增的L-阿拉伯糖浓度对正缬氨酸浓度变化的影响似乎并未显示出明显的趋势。
B)正亮氨酸
Figure BDA0003122493900000324
Figure BDA0003122493900000331
Figure BDA0003122493900000332
Figure BDA0003122493900000333
对于菌株大肠杆菌BW25113ΔilvC pSW3_lacI+ pACG_araBAD_ilvC和大肠杆菌BW25113ΔilvIH pSW3_lacI+ pACG_araBAD_ilvIH,当向培养基中添加浓度渐增的L-阿拉伯糖时,正亮氨酸浓度显著降低。菌株大肠杆菌BW25113ΔilvBN pSW3_lacI+ pACG_araBAD_ilvBN观察到相反的行为。对于菌株大肠杆菌BW25113ΔthrA pSW3_lacI+ pACG_araBAD_thrA和大肠杆菌BW25113 pSW3_lacI+ pACG_araBAD_ilvGM,正亮氨酸浓度显示出显著降低,但是渐增的L-阿拉伯糖浓度对正亮氨酸浓度变化的影响似乎并未显示出明显的趋势。对于菌株大肠杆菌BW25113ΔilvA pSW3_lacI+ pACG_araBAD_ilvA,并未报告正亮氨酸浓度的显著降低,并且渐增的L-阿拉伯糖浓度对正亮氨酸浓度变化的影响似乎并没有明显的影响。
细胞内可溶性蛋白部分
A)正缬氨酸
Figure BDA0003122493900000334
Figure BDA0003122493900000341
Figure BDA0003122493900000342
对于菌株大肠杆菌BW25113ΔilvC pSW3_lacI+ pACG_araBAD_ilvC和大肠杆菌BW25113ΔilvIH pSW3_lacI+ pACG_araBAD_ilvIH,当向培养基中添加浓度渐增的L-阿拉伯糖时,正缬氨酸浓度降低。菌株大肠杆菌BW25113ΔilvBN pSW3_lacI+ pACG_araBAD_ilvBN观察到相反的行为。对于菌株大肠杆菌BW25113ΔthrA pSW3_lacI+ pACG_araBAD_thrA、大肠杆菌BW25113ΔilvA pSW3_lacI+ pACG_araBAD_ilvA和大肠杆菌BW25113 pSW3_lacI+ pACG_araBAD_ilvGM,正缬氨酸浓度显示出显著降低,但是渐增的L-阿拉伯糖浓度对正缬氨酸浓度变化的影响似乎并未显示出明显的趋势。
B)正亮氨酸
Figure BDA0003122493900000343
Figure BDA0003122493900000344
Figure BDA0003122493900000351
对于菌株大肠杆菌BW25113ΔilvC pSW3_lacI+ pACG_araBAD_ilvC和大肠杆菌BW25113ΔilvIH pSW3_lacI+ pACG_araBAD_ilvIH,当向培养基中添加浓度渐增的L-阿拉伯糖时,正亮氨酸浓度降低。菌株大肠杆菌BW25113ΔilvBN pSW3_lacI+ pACG_araBAD_ilvBN观察到相反的行为。对于菌株大肠杆菌BW25113ΔthrA pSW3_lacI+ pACG_araBAD_thrA、大肠杆菌BW25113ΔilvA pSW3_lacI+ pACG_araBAD_ilvA和大肠杆菌BW25113 pSW3_lacI+ pACG_araBAD_ilvGM,正亮氨酸浓度显示出显著降低,但是L-阿拉伯糖浓度对正亮氨酸浓度似乎并没有明显的影响。
C)β-甲基正亮氨酸
Figure BDA0003122493900000352
Figure BDA0003122493900000353
Figure BDA0003122493900000354
对于几乎所有测试的菌株和L-阿拉伯糖浓度,在细胞内可溶性蛋白部分中都报告了β-甲基正亮氨酸浓度略有降低。然而,如果与正缬氨酸和正亮氨酸相比,这种降低算不上显著,除了用0.05%L-阿拉伯糖诱导的菌株大肠杆菌BW25113ΔilvBN pSW3_lacI+ pACG_araBAD_ilvBN,其中降低达到了约42%。此外,渐增的L-阿拉伯糖浓度对β-甲基正亮氨酸浓度变化的影响并未显示出明显的趋势。
实施例9:在触发ncBCAA形成的条件下在15L反应器中筛选潜在的ilvGM和ilvIH可调的大肠杆菌菌株
在大规模反应器中发酵期间,由于低效的混合而形成底物、溶解氧、pH和其他参数的梯度区,并且大肠杆菌细胞通过调节其代谢来响应这些环境变化(Schweder(1999).Monitoring of genes that respond to process-related stress in large-scalebioprocesses.Biotechnology and bioengineering,65(2),151-159)。例如,大肠杆菌通过将代谢从氧化呼吸转移到混合酸发酵来响应葡萄糖过量和氧限制,导致代谢过量(Enfors等(2001).Physiological responses to mixing in large scalebioreactors.Journal of biotechnology,85(2),175-185)。在这些条件下,不仅混合酸发酵产物积累,而且丙酮酸也积累(Soini,J.等(2008).Norvaline is accumulated after adown-shift of oxygen in Escherichia coli W3110.Microb.Cell Fact.,7:1-14)。细胞内过量存在的丙酮酸通过leu操纵子编码的酶的驱动经由从丙酮酸到α-酮己酸优先于α-酮丁酸和α-酮戊酸的顺序酮酸链延伸而增加了去往ncBCAA生物合成的代谢通量(Apostol,I.等(1997).Incorporation of norvaline at leucine positions in recombinant humanhemoglobin expressed in Escherichia coli.Journal of Biological Chemistry,272(46),28980-28988)。这个假设得到了Soini等(2011,Accumulation of amino acidsderiving from pyruvate in Escherichia coli W3110 during fed-batch cultivationin a two-compartment scale-down bioreactor.Advances in Bioscience andBiotechnology,2(05),336)报告的观察结果的支持:在两室STR-PFR按比例缩小的生物反应器中,氧限制与恒定葡萄糖供应的组合报告了对增强正缬氨酸生物合成的显著影响,这是由于重组大肠杆菌培养中丙酮酸的积累。此外,Soini等(2008)最初报告了基于丙酮酸的氨基酸如ncBCAA正亮氨酸和正缬氨酸以及丙氨酸和缬氨酸在葡萄糖过量和搅拌器降档时诱导的氧限制下在标准STR分批补料大肠杆菌培养中的积累。
由于混合不足,在大型工业规模的生物反应器中发生的浓度梯度也可以在实验室的小型生物反应器中进行模拟。在这项研究中,通过组合丙酮酸脉冲和O2限制,在15L反应器中再现了按比例放大效应。这种新颖的培养策略可能更准确地代表了在大型生物反应器中进行的细菌培养的生理行为。
根据小型生物反应器筛选(实施例8),用0.8%L-阿拉伯糖诱导的菌株大肠杆菌K-12 BW25113 pSW3_lacI+ pACG_araBAD_ilvGM(ilvGM可调的大肠杆菌)和大肠杆菌K-12BW25113ΔlvIH pSW3_lacI+ pACG_araBAD_ilvIH(ilvIH可调的大肠杆菌)在10mL小型生物反应器中在所有筛选的突变体中显示出最好的性能,因为它们报告了与对照非工程化大肠杆菌菌株相比,ncBCAA误掺入重组小型胰岛素原的最显著减少。此实验的目的是验证前述潜在的可调的大肠杆菌菌株在触发ncBCAA形成的培养条件(即丙酮酸脉冲和氧限制)下在15L反应器中的性能,以便确认其作为确保产品质量的菌株的优势。为了进行比较,还培养了对照非工程化大肠杆菌宿主(大肠杆菌K-12BW25113 pSW3_lacI+)。
·在标准条件下培养大肠杆菌K-12 BW25113 pSW3_lacI+(对照菌株)
使用100μL含有大肠杆菌K-12 BW25113 pSW3_lacI+的冷冻原料接种500mL含有5g/L葡萄糖和100μg/mL氨苄青霉素的经补充的矿物盐培养基,以便产生预培养物。矿物盐培养基的组成如下:2g/L Na2SO4、2.468g/L(NH4)2SO4、0.5g/L NH4Cl、14.6g/L K2HPO4、3.6g/L NaH2PO4.2H2O和1g/L(NH4)2-H-柠檬酸盐。矿物盐培养基然后补充有2mL/L MgSO4溶液(1.0M)和2mL/L微量元素溶液。微量元素溶液包含(每L):0.5g CaCl2 x 2H2O、0.18g ZnSO4x 7H2O、0.1g MnSO4 x H2O、16.7g FeCl3 x 6H2O、0.16g CuSO4 x 5H2O、0.18g CoCl2 x6H2O。使用初始冷启动技术,将预培养物在定轨摇床中在37℃和220rpm下孵育12h。测量预培养结束时的OD600nm,并且使用给定的体积接种7L起始体积反应器,使得初始OD600nm为0.4。反应器培养基由含有5g/L葡萄糖、2mL消泡剂(消泡剂2014,Sigma)和100μg/mL氨苄青霉素的经补充的矿物盐培养基组成。在37℃下进行培养,并且通过用25%NH4OH自动控制将pH保持为7。将气流设置为7vvm,并且将DO设定点设置为20%,通过使用改变搅拌器速度(初始搅拌器速度设置为800rpm)的级联控制来保持最后值。分批阶段有效地持续了4h,且在15℃下有中间的13h冷阶段。在分批阶段结束时,根据以下公式开始指数进料:
Figure BDA0003122493900000381
其中F(t)表示随时间的进料流速(L h-1),qs表示特定底物摄取速率的设定点(0.514gS gX-1 h-1),S表示进料溶液中葡萄糖的浓度(442g/L),X表示随时间的生物质浓度(g/L),V表示随时间的反应器体积(L),μset表示特定细胞生长速率的设定点(0.3h-1),并且t表示分批补料阶段的时间。进料溶液由补充有4mL/L微量元素溶液、2mL/L MgSO4溶液(1.0M)、100μg/mL氨苄青霉素和442g/L葡萄糖的TUB矿物盐培养基组成。
进行3小时指数分批补料阶段,之后通过自动添加IPTG至最终浓度为0.5mM来诱导重组小型胰岛素原的表达。诱导时间为30分钟。在诱导阶段期间,没有将进料添加到反应器中。在诱导之后,开始恒定进料阶段,使得恒定流速等于在指数进料阶段达到的最后流速。恒定进料分批补料阶段活跃5-6h。
·在触发ncBCAA形成的条件下培养大肠杆菌K-12 BW25113 pSW3_lacI+(对照菌株)
如在上一节中针对标准培养所描述的进行培养。然而,在指数分批补料阶段之后,将1g/L丙酮酸脉冲自动添加到反应器中。持续泵送丙酮酸溶液5分钟。在该时间段期间,没有添加进料,气流速率暂时设置为0,并且断开了DO级联控制。在第一个丙酮酸脉冲之后,通过自动添加IPTG至最终浓度为0.5mM来诱导重组小型胰岛素原的表达。诱导时间为30分钟。在诱导阶段期间,没有将进料添加到反应器中,并且重新建立了气流和DO级联控制。在诱导之后,如上所述,每30min进行一次连续的1g/L丙酮酸脉冲,总共4个脉冲。在脉冲之间,激活了恒定的进料阶段,使得恒定流速等于在指数进料阶段达到的最后流速,并且重新建立了气流和DO级联控制。恒定进料分批补料阶段活跃5-6h。
·在触发ncBCAA形成的条件下培养ilvGM可调的大肠杆菌
培养操作如上一节中所述,仅进行了微小更改,以便使培养过程适应ilvGM可调的大肠杆菌菌株。预培养物和反应器培养基都另外含有25μg/mL氯霉素。反应器培养基另外含有0.8%L-阿拉伯糖,这是诱导驻留在质粒pACG_araBAD_ilvGM中的基因ilvGM的表达所必需的。进料溶液还另外补充有25μg/mL氯霉素和0.8%L-阿拉伯糖。
·在触发ncBCAA形成的条件下培养ilvIH可调的大肠杆菌
培养操作如上一节中所述。
实施例10:ncBCAA的分析
在实施例9中测试的每种菌株随培养时间的在细胞内可溶性蛋白部分和包涵体部分中存在的ncBCAA的浓度分别如图11和图12所示。
经受丙酮酸脉冲连同O2限制的对照大肠杆菌菌株(“WT大肠杆菌,PYR-O2”)的培养报告了在诱导后随时间在细胞内可溶性蛋白部分中的正亮氨酸和β-甲基正亮氨酸的逐渐积累,对于正亮氨酸更为显著。此外,在前述培养条件下,正缬氨酸浓度也逐渐增加,但是只直到诱导后3h。从该时间点开始,正缬氨酸浓度逐渐下降,直到诱导后5h达到初始值。这可能表明,在最后一个丙酮酸脉冲连同O2限制2h之后,其触发正缬氨酸积累的相关作用不再活跃(图11)。如预期的那样,前述菌株报告了比在标准条件下培养的对照大肠杆菌菌株(“WT大肠杆菌,STD”)更高水平的正缬氨酸和正亮氨酸。对于β-甲基正亮氨酸,无法观察到这种浓度差异。
在培养物“ilvGM可调的大肠杆菌,PYR-O2”和“ilvIH可调的大肠杆菌,PYR-O2”中测试的两种潜在突变体都报告了细胞内可溶性蛋白部分中正缬氨酸和正亮氨酸浓度的显著降低,在“ilvGM可调的大肠杆菌,PYR-O2”中正亮氨酸的这种降低更高。然而,相对于对照培养物,β-甲基正亮氨酸的浓度没有显著变化。值得强调的是,对于大多数样品,由于浓度低于GC-FID设备的检测极限,因此无法正确检测到正缬氨酸(图11)。
经受丙酮酸脉冲连同O2限制的对照大肠杆菌菌株(“WT大肠杆菌,PYR-O2”)的培养报告了在诱导后随时间在包涵体部分中的正缬氨酸和正亮氨酸的逐渐积累。如预期的那样,前述菌株报告了比在标准条件下培养的对照大肠杆菌菌株(“WT大肠杆菌,STD”)更高水平的正缬氨酸和正亮氨酸。再一次地,并且与细胞内可溶性部分中报告的类似,在培养物“ilvGM可调的大肠杆菌,PYR-O2”和“ilvIH可调的大肠杆菌,PYR-O2”中测试的两种潜在突变体都报告了包涵体部分中正缬氨酸和正亮氨酸浓度的显著降低,在“ilvGM可调的大肠杆菌,PYR-O2”中正亮氨酸的这种降低甚至更高。在任何情况下,对于两种测试突变体都无法检测到正缬氨酸。在任何测试样品中都无法检测到β-甲基正亮氨酸(图12)。
序列表
<110> 赛诺菲-安万特德国有限公司(Sanofi-Aventis Deutschland GmbH)
<120> 减少非经典支链氨基酸错掺的方法
<130> DE2018-069
<150> EP 18 214 562.3
<151> 2018-12-20
<160> 46
<170> BiSSAP 1.3.6
<210> 1
<211> 1572
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<220>
<223> leuA, 2-异丙基苹果酸合酶
<400> 1
atgagccagc aagtcattat tttcgatacc acattgcgcg acggtgaaca ggcgttacag 60
gcaagcttga gtgtgaaaga aaaactgcaa attgcgctgg cccttgagcg tatgggtgtt 120
gacgtgatgg aagtcggttt ccccgtctct tcgccgggcg attttgaatc ggtgcaaacc 180
atcgcccgcc aggttaaaaa cagccgcgta tgtgcgttag ctcgctgcgt ggaaaaagat 240
atcgacgtgg cggccgaatc cctgaaagtc gccgaagcct tccgtattca tacctttatt 300
gccacttcgc caatgcacat cgccaccaag ctgcgcagca cgctggacga ggtgatcgaa 360
cgcgctatct atatggtgaa acgcgcccgt aattacaccg atgatgttga attttcttgc 420
gaagatgccg ggcgtacacc cattgccgat ctggcgcgag tggtcgaagc ggcgattaat 480
gccggtgcca ccaccatcaa cattccggac accgtgggct acaccatgcc gtttgagttc 540
gccggaatca tcagcggcct gtatgaacgc gtgcctaaca tcgacaaagc cattatctcc 600
gtacataccc acgacgattt gggcctggcg gtcggaaact cactggcggc ggtacatgcc 660
ggtgcacgcc aggtggaagg cgcaatgaac gggatcggcg agcgtgccgg aaactgttcc 720
ctggaagaag tcatcatggc gatcaaagtt cgtaaggata ttctcaacgt ccacaccgcc 780
attaatcacc aggagatatg gcgcaccagc cagttagtta gccagatttg taatatgccg 840
atcccggcaa acaaagccat tgttggcagc ggcgcattcg cacactcctc cggtatacac 900
caggatggcg tgctgaaaaa ccgcgaaaac tacgaaatca tgacaccaga atctattggt 960
ctgaaccaaa tccagctgaa tctgacctct cgttcggggc gtgcggcggt gaaacatcgc 1020
atggatgaga tggggtataa agaaagtgaa tataatttag acaatttgta cgatgctttc 1080
ctgaagctgg cggacaaaaa aggtcaggtg tttgattacg atctggaggc gctggccttc 1140
atcggtaagc agcaagaaga gccggagcat ttccgtctgg attacttcag cgtgcagtct 1200
ggctctaacg atatcgccac cgccgccgtc aaactggcct gtggcgaaga agtcaaagca 1260
gaagccgcca acggtaacgg tccggtcgat gccgtctatc aggcaattaa ccgcatcact 1320
gaatataacg tcgaactggt gaaatacagc ctgaccgcca aaggccacgg taaagatgcg 1380
ctgggtcagg tggatatcgt cgctaactac aacggtcgcc gcttccacgg cgtcggcctg 1440
gctaccgata ttgtcgagtc atctgccaaa gccatggtgc acgttctgaa caatatctgg 1500
cgtgccgcag aagtcgaaaa agagttgcaa cgcaaagctc aacacaacga aaacaacaag 1560
gaaaccgtgt ga 1572
<210> 2
<211> 523
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> leuA, 2-异丙基苹果酸合酶
<400> 2
Met Ser Gln Gln Val Ile Ile Phe Asp Thr Thr Leu Arg Asp Gly Glu
1 5 10 15
Gln Ala Leu Gln Ala Ser Leu Ser Val Lys Glu Lys Leu Gln Ile Ala
20 25 30
Leu Ala Leu Glu Arg Met Gly Val Asp Val Met Glu Val Gly Phe Pro
35 40 45
Val Ser Ser Pro Gly Asp Phe Glu Ser Val Gln Thr Ile Ala Arg Gln
50 55 60
Val Lys Asn Ser Arg Val Cys Ala Leu Ala Arg Cys Val Glu Lys Asp
65 70 75 80
Ile Asp Val Ala Ala Glu Ser Leu Lys Val Ala Glu Ala Phe Arg Ile
85 90 95
His Thr Phe Ile Ala Thr Ser Pro Met His Ile Ala Thr Lys Leu Arg
100 105 110
Ser Thr Leu Asp Glu Val Ile Glu Arg Ala Ile Tyr Met Val Lys Arg
115 120 125
Ala Arg Asn Tyr Thr Asp Asp Val Glu Phe Ser Cys Glu Asp Ala Gly
130 135 140
Arg Thr Pro Ile Ala Asp Leu Ala Arg Val Val Glu Ala Ala Ile Asn
145 150 155 160
Ala Gly Ala Thr Thr Ile Asn Ile Pro Asp Thr Val Gly Tyr Thr Met
165 170 175
Pro Phe Glu Phe Ala Gly Ile Ile Ser Gly Leu Tyr Glu Arg Val Pro
180 185 190
Asn Ile Asp Lys Ala Ile Ile Ser Val His Thr His Asp Asp Leu Gly
195 200 205
Leu Ala Val Gly Asn Ser Leu Ala Ala Val His Ala Gly Ala Arg Gln
210 215 220
Val Glu Gly Ala Met Asn Gly Ile Gly Glu Arg Ala Gly Asn Cys Ser
225 230 235 240
Leu Glu Glu Val Ile Met Ala Ile Lys Val Arg Lys Asp Ile Leu Asn
245 250 255
Val His Thr Ala Ile Asn His Gln Glu Ile Trp Arg Thr Ser Gln Leu
260 265 270
Val Ser Gln Ile Cys Asn Met Pro Ile Pro Ala Asn Lys Ala Ile Val
275 280 285
Gly Ser Gly Ala Phe Ala His Ser Ser Gly Ile His Gln Asp Gly Val
290 295 300
Leu Lys Asn Arg Glu Asn Tyr Glu Ile Met Thr Pro Glu Ser Ile Gly
305 310 315 320
Leu Asn Gln Ile Gln Leu Asn Leu Thr Ser Arg Ser Gly Arg Ala Ala
325 330 335
Val Lys His Arg Met Asp Glu Met Gly Tyr Lys Glu Ser Glu Tyr Asn
340 345 350
Leu Asp Asn Leu Tyr Asp Ala Phe Leu Lys Leu Ala Asp Lys Lys Gly
355 360 365
Gln Val Phe Asp Tyr Asp Leu Glu Ala Leu Ala Phe Ile Gly Lys Gln
370 375 380
Gln Glu Glu Pro Glu His Phe Arg Leu Asp Tyr Phe Ser Val Gln Ser
385 390 395 400
Gly Ser Asn Asp Ile Ala Thr Ala Ala Val Lys Leu Ala Cys Gly Glu
405 410 415
Glu Val Lys Ala Glu Ala Ala Asn Gly Asn Gly Pro Val Asp Ala Val
420 425 430
Tyr Gln Ala Ile Asn Arg Ile Thr Glu Tyr Asn Val Glu Leu Val Lys
435 440 445
Tyr Ser Leu Thr Ala Lys Gly His Gly Lys Asp Ala Leu Gly Gln Val
450 455 460
Asp Ile Val Ala Asn Tyr Asn Gly Arg Arg Phe His Gly Val Gly Leu
465 470 475 480
Ala Thr Asp Ile Val Glu Ser Ser Ala Lys Ala Met Val His Val Leu
485 490 495
Asn Asn Ile Trp Arg Ala Ala Glu Val Glu Lys Glu Leu Gln Arg Lys
500 505 510
Ala Gln His Asn Glu Asn Asn Lys Glu Thr Val
515 520
<210> 3
<211> 1476
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<220>
<223> ilvC, 酮酸还原异构酶
<400> 3
atggctaact acttcaatac actgaatctg cgccagcagc tggcacagct gggcaaatgt 60
cgctttatgg gccgcgatga attcgccgat ggcgcgagct accttcaggg taaaaaagta 120
gtcatcgtcg gctgtggcgc acagggtctg aaccagggcc tgaacatgcg tgattctggt 180
ctcgatatct cctacgctct gcgtaaagaa gcgattgccg agaagcgcgc gtcctggcgt 240
aaagcgaccg aaaatggttt taaagtgggt acttacgaag aactgatccc acaggcggat 300
ctggtgatta acctgacgcc ggacaagcag cactctgatg tagtgcgcac cgtacagcca 360
ctgatgaaag acggcgcggc gctgggctac tcgcacggtt tcaacatcgt cgaagtgggc 420
gagcagatcc gtaaagatat caccgtagtg atggttgcgc cgaaatgccc aggcaccgaa 480
gtgcgtgaag agtacaaacg tgggttcggc gtaccgacgc tgattgccgt tcacccggaa 540
aacgatccga aaggcgaagg catggcgatt gccaaagcct gggcggctgc aaccggtggt 600
caccgtgcgg gtgtgctgga atcgtccttc gttgcggaag tgaaatctga cctgatgggc 660
gagcaaacca tcctgtgcgg tatgttgcag gctggctctc tgctgtgctt cgacaagctg 720
gtggaagaag gtaccgatcc agcatacgca gaaaaactga ttcagttcgg ttgggaaacc 780
atcaccgaag cactgaaaca gggcggcatc accctgatga tggaccgtct ctctaacccg 840
gcgaaactgc gtgcttatgc gctttctgaa cagctgaaag agatcatggc acccctgttc 900
cagaaacata tggacgacat catctccggc gaattctctt ccggtatgat ggcggactgg 960
gccaacgatg ataagaaact gctgacctgg cgtgaagaga ccggcaaaac cgcgtttgaa 1020
accgcgccgc agtatgaagg caaaatcggc gagcaggagt acttcgataa aggcgtactg 1080
atgattgcga tggtgaaagc gggcgttgaa ctggcgttcg aaaccatggt cgattccggc 1140
atcattgaag agtctgcata ttatgaatca ctgcacgagc tgccgctgat tgccaacacc 1200
atcgcccgta agcgtctgta cgaaatgaac gtggttatct ctgataccgc tgagtacggt 1260
aactatctgt tctcttacgc ttgtgtgccg ttgctgaaac cgtttatggc agagctgcaa 1320
ccgggcgacc tgggtaaagc tattccggaa ggcgcggtag ataacgggca actgcgtgat 1380
gtgaacgaag cgattcgcag ccatgcgatt gagcaggtag gtaagaaact gcgcggctat 1440
atgacagata tgaaacgtat tgctgttgcg ggttaa 1476
<210> 4
<211> 491
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> ilvC, 酮酸还原异构酶
<400> 4
Met Ala Asn Tyr Phe Asn Thr Leu Asn Leu Arg Gln Gln Leu Ala Gln
1 5 10 15
Leu Gly Lys Cys Arg Phe Met Gly Arg Asp Glu Phe Ala Asp Gly Ala
20 25 30
Ser Tyr Leu Gln Gly Lys Lys Val Val Ile Val Gly Cys Gly Ala Gln
35 40 45
Gly Leu Asn Gln Gly Leu Asn Met Arg Asp Ser Gly Leu Asp Ile Ser
50 55 60
Tyr Ala Leu Arg Lys Glu Ala Ile Ala Glu Lys Arg Ala Ser Trp Arg
65 70 75 80
Lys Ala Thr Glu Asn Gly Phe Lys Val Gly Thr Tyr Glu Glu Leu Ile
85 90 95
Pro Gln Ala Asp Leu Val Ile Asn Leu Thr Pro Asp Lys Gln His Ser
100 105 110
Asp Val Val Arg Thr Val Gln Pro Leu Met Lys Asp Gly Ala Ala Leu
115 120 125
Gly Tyr Ser His Gly Phe Asn Ile Val Glu Val Gly Glu Gln Ile Arg
130 135 140
Lys Asp Ile Thr Val Val Met Val Ala Pro Lys Cys Pro Gly Thr Glu
145 150 155 160
Val Arg Glu Glu Tyr Lys Arg Gly Phe Gly Val Pro Thr Leu Ile Ala
165 170 175
Val His Pro Glu Asn Asp Pro Lys Gly Glu Gly Met Ala Ile Ala Lys
180 185 190
Ala Trp Ala Ala Ala Thr Gly Gly His Arg Ala Gly Val Leu Glu Ser
195 200 205
Ser Phe Val Ala Glu Val Lys Ser Asp Leu Met Gly Glu Gln Thr Ile
210 215 220
Leu Cys Gly Met Leu Gln Ala Gly Ser Leu Leu Cys Phe Asp Lys Leu
225 230 235 240
Val Glu Glu Gly Thr Asp Pro Ala Tyr Ala Glu Lys Leu Ile Gln Phe
245 250 255
Gly Trp Glu Thr Ile Thr Glu Ala Leu Lys Gln Gly Gly Ile Thr Leu
260 265 270
Met Met Asp Arg Leu Ser Asn Pro Ala Lys Leu Arg Ala Tyr Ala Leu
275 280 285
Ser Glu Gln Leu Lys Glu Ile Met Ala Pro Leu Phe Gln Lys His Met
290 295 300
Asp Asp Ile Ile Ser Gly Glu Phe Ser Ser Gly Met Met Ala Asp Trp
305 310 315 320
Ala Asn Asp Asp Lys Lys Leu Leu Thr Trp Arg Glu Glu Thr Gly Lys
325 330 335
Thr Ala Phe Glu Thr Ala Pro Gln Tyr Glu Gly Lys Ile Gly Glu Gln
340 345 350
Glu Tyr Phe Asp Lys Gly Val Leu Met Ile Ala Met Val Lys Ala Gly
355 360 365
Val Glu Leu Ala Phe Glu Thr Met Val Asp Ser Gly Ile Ile Glu Glu
370 375 380
Ser Ala Tyr Tyr Glu Ser Leu His Glu Leu Pro Leu Ile Ala Asn Thr
385 390 395 400
Ile Ala Arg Lys Arg Leu Tyr Glu Met Asn Val Val Ile Ser Asp Thr
405 410 415
Ala Glu Tyr Gly Asn Tyr Leu Phe Ser Tyr Ala Cys Val Pro Leu Leu
420 425 430
Lys Pro Phe Met Ala Glu Leu Gln Pro Gly Asp Leu Gly Lys Ala Ile
435 440 445
Pro Glu Gly Ala Val Asp Asn Gly Gln Leu Arg Asp Val Asn Glu Ala
450 455 460
Ile Arg Ser His Ala Ile Glu Gln Val Gly Lys Lys Leu Arg Gly Tyr
465 470 475 480
Met Thr Asp Met Lys Arg Ile Ala Val Ala Gly
485 490
<210> 5
<211> 1644
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 天然基因ilvG, AHAS同种型II
<400> 5
atgaatggcg cacagtgggt ggtacatgcg ttgcgggcac agggtgtgaa caccgttttc 60
ggttatccgg gtggcgcaat tatgccggtt tacgatgcat tgtatgacgg cggcgtggag 120
cacttgctat gccgacatga gcagggtgcg gcaatggcgg ctatcggtta tgctcgtgct 180
accggcaaaa ctggcgtatg tatcgccacg tctggtccgg gcgcaaccaa cctgataacc 240
gggcttgcgg acgcactgtt agattccatc cctgttgttg ccatcaccgg tcaagtgtcc 300
gcaccgttta tcggcactga cgcatttcag gaagtggatg tcctgggatt gtcgttagcc 360
tgtaccaagc acagctttct ggtgcagtcg ctggaagagt tgccgcgcat catggctgaa 420
gcattcgacg ttgcctgctc aggtcgtcct ggtccggttc tggtcgatat cccaaaagat 480
atccagttag ccagcggtga cctggaaccg tggttcacca ccgttgaaaa cgaagtgact 540
ttcccacatg ccgaagttga gcaagcgcgc cagatgctgg caaaagcgca aaaaccgatg 600
ctgtacgttg gcggtggcgt gggtatggcg caggcagttc cggctttgcg tgaatttctc 660
gctgccacaa aaatgcctgc cacctgtacg ctgaaagggc tgggcgcagt agaagcagat 720
tatccgtact atctgggcat gctggggatg cacggcacca aagcggcaaa cttcgcggtg 780
caggagtgtg acctgctgat cgccgtgggc gcacgttttg atgaccgggt gaccggcaaa 840
ctgaacacct tcgcgccaca cgccagtgtt atccatatgg atatcgaccc ggcagaaatg 900
aacaagctgc gtcaggcaca tgtggcatta caaggtgatt taaatgctct gttaccagca 960
ttacagcagc cgttaaatca atactggcag caacactgcg cgcagctgcg tgatgaacat 1020
tcctggcgtt acgaccatcc cggtgacgct atctacgcgc cgttgttgtt aaaacaactg 1080
tcggatcgta aacctgcgga ttgcgtcgtg accacagatg tggggcagca ccagatgtgg 1140
gctgcgcagc acatcgccca cactcgcccg gaaaatttca tcacctccag cggtttaggt 1200
accatgggtt ttggtttacc ggcggcggtt ggcgcacaag tcgcgcgacc gaacgatacc 1260
gttgtctgta tctccggtga cggctctttc atgatgaatg tgcaagagct gggcaccgta 1320
aaacgcaagc agttaccgtt gaaaatcgtc ttactcgata accaacggtt agggatggtt 1380
cgacaatggc agcaactgtt ttttcaggaa cgatacagcg aaaccaccct tactgataac 1440
cccgatttcc tcatgttagc cagcgccttc ggcatccatg gccaacacat cacccggaaa 1500
gaccaggttg aagcggcact cgacaccatg ctgaacagtg atgggccata cctgcttcat 1560
gtctcaatcg acgaacttga gaacgtctgg ccgctggtgc cgcctggcgc cagtaattca 1620
gaaatgttgg agaaattatc atga 1644
<210> 6
<211> 547
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 天然蛋白产物ilvG, AHAS同种型II
<400> 6
Met Asn Gly Ala Gln Trp Val Val His Ala Leu Arg Ala Gln Gly Val
1 5 10 15
Asn Thr Val Phe Gly Tyr Pro Gly Gly Ala Ile Met Pro Val Tyr Asp
20 25 30
Ala Leu Tyr Asp Gly Gly Val Glu His Leu Leu Cys Arg His Glu Gln
35 40 45
Gly Ala Ala Met Ala Ala Ile Gly Tyr Ala Arg Ala Thr Gly Lys Thr
50 55 60
Gly Val Cys Ile Ala Thr Ser Gly Pro Gly Ala Thr Asn Leu Ile Thr
65 70 75 80
Gly Leu Ala Asp Ala Leu Leu Asp Ser Ile Pro Val Val Ala Ile Thr
85 90 95
Gly Gln Val Ser Ala Pro Phe Ile Gly Thr Asp Ala Phe Gln Glu Val
100 105 110
Asp Val Leu Gly Leu Ser Leu Ala Cys Thr Lys His Ser Phe Leu Val
115 120 125
Gln Ser Leu Glu Glu Leu Pro Arg Ile Met Ala Glu Ala Phe Asp Val
130 135 140
Ala Cys Ser Gly Arg Pro Gly Pro Val Leu Val Asp Ile Pro Lys Asp
145 150 155 160
Ile Gln Leu Ala Ser Gly Asp Leu Glu Pro Trp Phe Thr Thr Val Glu
165 170 175
Asn Glu Val Thr Phe Pro His Ala Glu Val Glu Gln Ala Arg Gln Met
180 185 190
Leu Ala Lys Ala Gln Lys Pro Met Leu Tyr Val Gly Gly Gly Val Gly
195 200 205
Met Ala Gln Ala Val Pro Ala Leu Arg Glu Phe Leu Ala Ala Thr Lys
210 215 220
Met Pro Ala Thr Cys Thr Leu Lys Gly Leu Gly Ala Val Glu Ala Asp
225 230 235 240
Tyr Pro Tyr Tyr Leu Gly Met Leu Gly Met His Gly Thr Lys Ala Ala
245 250 255
Asn Phe Ala Val Gln Glu Cys Asp Leu Leu Ile Ala Val Gly Ala Arg
260 265 270
Phe Asp Asp Arg Val Thr Gly Lys Leu Asn Thr Phe Ala Pro His Ala
275 280 285
Ser Val Ile His Met Asp Ile Asp Pro Ala Glu Met Asn Lys Leu Arg
290 295 300
Gln Ala His Val Ala Leu Gln Gly Asp Leu Asn Ala Leu Leu Pro Ala
305 310 315 320
Leu Gln Gln Pro Leu Asn Gln Tyr Trp Gln Gln His Cys Ala Gln Leu
325 330 335
Arg Asp Glu His Ser Trp Arg Tyr Asp His Pro Gly Asp Ala Ile Tyr
340 345 350
Ala Pro Leu Leu Leu Lys Gln Leu Ser Asp Arg Lys Pro Ala Asp Cys
355 360 365
Val Val Thr Thr Asp Val Gly Gln His Gln Met Trp Ala Ala Gln His
370 375 380
Ile Ala His Thr Arg Pro Glu Asn Phe Ile Thr Ser Ser Gly Leu Gly
385 390 395 400
Thr Met Gly Phe Gly Leu Pro Ala Ala Val Gly Ala Gln Val Ala Arg
405 410 415
Pro Asn Asp Thr Val Val Cys Ile Ser Gly Asp Gly Ser Phe Met Met
420 425 430
Asn Val Gln Glu Leu Gly Thr Val Lys Arg Lys Gln Leu Pro Leu Lys
435 440 445
Ile Val Leu Leu Asp Asn Gln Arg Leu Gly Met Val Arg Gln Trp Gln
450 455 460
Gln Leu Phe Phe Gln Glu Arg Tyr Ser Glu Thr Thr Leu Thr Asp Asn
465 470 475 480
Pro Asp Phe Leu Met Leu Ala Ser Ala Phe Gly Ile His Gly Gln His
485 490 495
Ile Thr Arg Lys Asp Gln Val Glu Ala Ala Leu Asp Thr Met Leu Asn
500 505 510
Ser Asp Gly Pro Tyr Leu Leu His Val Ser Ile Asp Glu Leu Glu Asn
515 520 525
Val Trp Pro Leu Val Pro Pro Gly Ala Ser Asn Ser Glu Met Leu Glu
530 535 540
Lys Leu Ser
545
<210> 7
<211> 264
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 天然基因ilvM
<400> 7
atgatgcaac atcaggtcaa tgtatcggct cgcttcaatc cagaaacctt agaacgtgtt 60
ttacgcgtgg tgcgtcatcg tggtttccac gtctgctcaa tgaatatggc cgccgccagc 120
gatgcacaaa atataaatat cgaattgacc gttgccagcc cacggtcggt cgacttactg 180
tttagtcagt taaataaact ggtggacgtc gcacacgttg ccatctgcca gagcacaacc 240
acatcacaac aaatccgcgc ctga 264
<210> 8
<211> 87
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 天然蛋白产物ilvM
<400> 8
Met Met Gln His Gln Val Asn Val Ser Ala Arg Phe Asn Pro Glu Thr
1 5 10 15
Leu Glu Arg Val Leu Arg Val Val Arg His Arg Gly Phe His Val Cys
20 25 30
Ser Met Asn Met Ala Ala Ala Ser Asp Ala Gln Asn Ile Asn Ile Glu
35 40 45
Leu Thr Val Ala Ser Pro Arg Ser Val Asp Leu Leu Phe Ser Gln Leu
50 55 60
Asn Lys Leu Val Asp Val Ala His Val Ala Ile Cys Gln Ser Thr Thr
65 70 75 80
Thr Ser Gln Gln Ile Arg Ala
85
<210> 9
<211> 933
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<220>
<223> thrB, 高丝氨酸激酶
<400> 9
atggttaaag tttatgcccc ggcttccagt gccaatatga gcgtcgggtt tgatgtgctc 60
ggggcggcgg tgacacctgt tgatggtgca ttgctcggag atgtagtcac ggttgaggcg 120
gcagagacat tcagtctcaa caacctcgga cgctttgccg ataagctgcc gtcagaacca 180
cgggaaaata tcgtttatca gtgctgggag cgtttttgcc aggaactggg taagcaaatt 240
ccagtggcga tgaccctgga aaagaatatg ccgatcggtt cgggcttagg ctccagtgcc 300
tgttcggtgg tcgcggcgct gatggcgatg aatgaacact gcggcaagcc gcttaatgac 360
actcgtttgc tggctttgat gggcgagctg gaaggccgta tctccggcag cattcattac 420
gacaacgtgg caccgtgttt tctcggtggt atgcagttga tgatcgaaga aaacgacatc 480
atcagccagc aagtgccagg gtttgatgag tggctgtggg tgctggcgta tccggggatt 540
aaagtctcga cggcagaagc cagggctatt ttaccggcgc agtatcgccg ccaggattgc 600
attgcgcacg ggcgacatct ggcaggcttc attcacgcct gctattcccg tcagcctgag 660
cttgccgcga agctgatgaa agatgttatc gctgaaccct accgtgaacg gttactgcca 720
ggcttccggc aggcgcggca ggcggtcgcg gaaatcggcg cggtagcgag cggtatctcc 780
ggctccggcc cgaccttgtt cgctctgtgt gacaagccgg aaaccgccca gcgcgttgcc 840
gactggttgg gtaagaacta cctgcaaaat caggaaggtt ttgttcatat ttgccggctg 900
gatacggcgg gcgcacgagt actggaaaac taa 933
<210> 10
<211> 310
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> thrB, 高丝氨酸激酶
<400> 10
Met Val Lys Val Tyr Ala Pro Ala Ser Ser Ala Asn Met Ser Val Gly
1 5 10 15
Phe Asp Val Leu Gly Ala Ala Val Thr Pro Val Asp Gly Ala Leu Leu
20 25 30
Gly Asp Val Val Thr Val Glu Ala Ala Glu Thr Phe Ser Leu Asn Asn
35 40 45
Leu Gly Arg Phe Ala Asp Lys Leu Pro Ser Glu Pro Arg Glu Asn Ile
50 55 60
Val Tyr Gln Cys Trp Glu Arg Phe Cys Gln Glu Leu Gly Lys Gln Ile
65 70 75 80
Pro Val Ala Met Thr Leu Glu Lys Asn Met Pro Ile Gly Ser Gly Leu
85 90 95
Gly Ser Ser Ala Cys Ser Val Val Ala Ala Leu Met Ala Met Asn Glu
100 105 110
His Cys Gly Lys Pro Leu Asn Asp Thr Arg Leu Leu Ala Leu Met Gly
115 120 125
Glu Leu Glu Gly Arg Ile Ser Gly Ser Ile His Tyr Asp Asn Val Ala
130 135 140
Pro Cys Phe Leu Gly Gly Met Gln Leu Met Ile Glu Glu Asn Asp Ile
145 150 155 160
Ile Ser Gln Gln Val Pro Gly Phe Asp Glu Trp Leu Trp Val Leu Ala
165 170 175
Tyr Pro Gly Ile Lys Val Ser Thr Ala Glu Ala Arg Ala Ile Leu Pro
180 185 190
Ala Gln Tyr Arg Arg Gln Asp Cys Ile Ala His Gly Arg His Leu Ala
195 200 205
Gly Phe Ile His Ala Cys Tyr Ser Arg Gln Pro Glu Leu Ala Ala Lys
210 215 220
Leu Met Lys Asp Val Ile Ala Glu Pro Tyr Arg Glu Arg Leu Leu Pro
225 230 235 240
Gly Phe Arg Gln Ala Arg Gln Ala Val Ala Glu Ile Gly Ala Val Ala
245 250 255
Ser Gly Ile Ser Gly Ser Gly Pro Thr Leu Phe Ala Leu Cys Asp Lys
260 265 270
Pro Glu Thr Ala Gln Arg Val Ala Asp Trp Leu Gly Lys Asn Tyr Leu
275 280 285
Gln Asn Gln Glu Gly Phe Val His Ile Cys Arg Leu Asp Thr Ala Gly
290 295 300
Ala Arg Val Leu Glu Asn
305 310
<210> 11
<211> 1545
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 天然基因ilvA, L-苏氨酸脱水酶
<400> 11
atggctgact cgcaacccct gtccggtgct ccggaaggtg ccgaatattt aagagcagtg 60
ctgcgcgcgc cggtttacga ggcggcgcag gttacgccgc tacaaaaaat ggaaaaactg 120
tcgtcgcgtc ttgataacgt cattctggtg aagcgcgaag atcgccagcc agtgcacagc 180
tttaagctgc gcggcgcata cgccatgatg gcgggcctga cggaagaaca gaaagcgcac 240
ggcgtgatca ctgcttctgc gggtaaccac gcgcagggcg tcgcgttttc ttctgcgcgg 300
ttaggcgtga aggccctgat cgttatgcca accgccaccg ccgacatcaa agtcgacgcg 360
gtgcgcggct tcggcggcga agtgctgctc cacggcgcga actttgatga agcgaaagcc 420
aaagcgatcg aactgtcaca gcagcagggg ttcacctggg tgccgccgtt cgaccatccg 480
atggtgattg ccgggcaagg cacgctggcg ctggaactgc tccagcagga cgcccatctc 540
gaccgcgtat ttgtgccagt cggcggcggc ggtctggctg ctggcgtggc ggtgctgatc 600
aaacaactga tgccgcaaat caaagtgatc gccgtagaag cggaagactc cgcctgcctg 660
aaagcagcgc tggatgcggg tcatccggtt gatctgccgc gcgtagggct atttgctgaa 720
ggcgtagcgg taaaacgcat cggtgacgaa accttccgtt tatgccagga gtatctcgac 780
gacatcatca ccgtcgatag cgatgcgatc tgtgcggcga tgaaggattt attcgaagat 840
gtgcgcgcgg tggcggaacc ctctggcgcg ctggcgctgg cgggaatgaa aaaatatatc 900
gccctgcaca acattcgcgg cgaacggctg gcgcatattc tttccggtgc caacgtgaac 960
ttccacggcc tgcgctacgt ctcagaacgc tgcgaactgg gcgaacagcg tgaagcgttg 1020
ttggcggtga ccattccgga agaaaaaggc agcttcctca aattctgcca actgcttggc 1080
gggcgttcgg tcaccgagtt caactaccgt tttgccgatg ccaaaaacgc ctgcatcttt 1140
gtcggtgtgc gcctgagccg cggcctcgaa gagcgcaaag aaattttgca gatgctcaac 1200
gacggcggct acagcgtggt tgatctctcc gacgacgaaa tggcgaagct acacgtgcgc 1260
tatatggtcg gcggacgtcc atcgcatccg ttgcaggaac gcctctacag cttcgaattc 1320
ccggaatcac cgggcgcgct gctgcgcttc ctcaacacgc tgggtacgta ctggaacatt 1380
tctttgttcc actatcgcag ccatggcacc gactacgggc gcgtactggc ggcgttcgaa 1440
cttggcgacc atgaaccgga tttcgaaacc cggctgaatg agctgggcta cgattgccac 1500
gacgaaacca ataacccggc gttcaggttc tttttggcgg gttag 1545
<210> 12
<211> 514
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 天然蛋白产物ilvA, L-苏氨酸脱水酶
<400> 12
Met Ala Asp Ser Gln Pro Leu Ser Gly Ala Pro Glu Gly Ala Glu Tyr
1 5 10 15
Leu Arg Ala Val Leu Arg Ala Pro Val Tyr Glu Ala Ala Gln Val Thr
20 25 30
Pro Leu Gln Lys Met Glu Lys Leu Ser Ser Arg Leu Asp Asn Val Ile
35 40 45
Leu Val Lys Arg Glu Asp Arg Gln Pro Val His Ser Phe Lys Leu Arg
50 55 60
Gly Ala Tyr Ala Met Met Ala Gly Leu Thr Glu Glu Gln Lys Ala His
65 70 75 80
Gly Val Ile Thr Ala Ser Ala Gly Asn His Ala Gln Gly Val Ala Phe
85 90 95
Ser Ser Ala Arg Leu Gly Val Lys Ala Leu Ile Val Met Pro Thr Ala
100 105 110
Thr Ala Asp Ile Lys Val Asp Ala Val Arg Gly Phe Gly Gly Glu Val
115 120 125
Leu Leu His Gly Ala Asn Phe Asp Glu Ala Lys Ala Lys Ala Ile Glu
130 135 140
Leu Ser Gln Gln Gln Gly Phe Thr Trp Val Pro Pro Phe Asp His Pro
145 150 155 160
Met Val Ile Ala Gly Gln Gly Thr Leu Ala Leu Glu Leu Leu Gln Gln
165 170 175
Asp Ala His Leu Asp Arg Val Phe Val Pro Val Gly Gly Gly Gly Leu
180 185 190
Ala Ala Gly Val Ala Val Leu Ile Lys Gln Leu Met Pro Gln Ile Lys
195 200 205
Val Ile Ala Val Glu Ala Glu Asp Ser Ala Cys Leu Lys Ala Ala Leu
210 215 220
Asp Ala Gly His Pro Val Asp Leu Pro Arg Val Gly Leu Phe Ala Glu
225 230 235 240
Gly Val Ala Val Lys Arg Ile Gly Asp Glu Thr Phe Arg Leu Cys Gln
245 250 255
Glu Tyr Leu Asp Asp Ile Ile Thr Val Asp Ser Asp Ala Ile Cys Ala
260 265 270
Ala Met Lys Asp Leu Phe Glu Asp Val Arg Ala Val Ala Glu Pro Ser
275 280 285
Gly Ala Leu Ala Leu Ala Gly Met Lys Lys Tyr Ile Ala Leu His Asn
290 295 300
Ile Arg Gly Glu Arg Leu Ala His Ile Leu Ser Gly Ala Asn Val Asn
305 310 315 320
Phe His Gly Leu Arg Tyr Val Ser Glu Arg Cys Glu Leu Gly Glu Gln
325 330 335
Arg Glu Ala Leu Leu Ala Val Thr Ile Pro Glu Glu Lys Gly Ser Phe
340 345 350
Leu Lys Phe Cys Gln Leu Leu Gly Gly Arg Ser Val Thr Glu Phe Asn
355 360 365
Tyr Arg Phe Ala Asp Ala Lys Asn Ala Cys Ile Phe Val Gly Val Arg
370 375 380
Leu Ser Arg Gly Leu Glu Glu Arg Lys Glu Ile Leu Gln Met Leu Asn
385 390 395 400
Asp Gly Gly Tyr Ser Val Val Asp Leu Ser Asp Asp Glu Met Ala Lys
405 410 415
Leu His Val Arg Tyr Met Val Gly Gly Arg Pro Ser His Pro Leu Gln
420 425 430
Glu Arg Leu Tyr Ser Phe Glu Phe Pro Glu Ser Pro Gly Ala Leu Leu
435 440 445
Arg Phe Leu Asn Thr Leu Gly Thr Tyr Trp Asn Ile Ser Leu Phe His
450 455 460
Tyr Arg Ser His Gly Thr Asp Tyr Gly Arg Val Leu Ala Ala Phe Glu
465 470 475 480
Leu Gly Asp His Glu Pro Asp Phe Glu Thr Arg Leu Asn Glu Leu Gly
485 490 495
Tyr Asp Cys His Asp Glu Thr Asn Asn Pro Ala Phe Arg Phe Phe Leu
500 505 510
Ala Gly
<210> 13
<211> 1725
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<220>
<223> ilvI, AHAS同种型III,大亚基
<400> 13
atggagatgt tgtctggagc cgagatggtc gtccgatcgc ttatcgatca gggcgttaaa 60
caagtattcg gttatcccgg aggcgcagtc cttgatattt atgatgcatt gcataccgtg 120
ggtggtattg atcatgtatt agttcgtcat gagcaggcgg cggtgcatat ggccgatggc 180
ctggcgcgcg cgaccgggga agtcggcgtc gtgctggtaa cgtcgggtcc aggggcgacc 240
aatgcgatta ctggcatcgc caccgcttat atggattcca ttccattagt tgtcctttcc 300
gggcaggtag cgacctcgtt gataggttac gatgcctttc aggagtgcga catggtgggg 360
atttcgcgac cggtggttaa acacagtttt ctggttaagc aaacggaaga cattccgcag 420
gtgctgaaaa aggctttctg gctggcggca agtggtcgcc caggaccagt agtcgttgat 480
ttaccgaaag atattcttaa tccggcgaac aaattaccct atgtctggcc ggagtcggtc 540
agtatgcgtt cttacaatcc cactactacc ggacataaag ggcaaattaa gcgtgctctg 600
caaacgctgg tagcggcaaa aaaaccggtt gtctacgtag gcggtggggc aatcacggcg 660
ggctgccatc agcagttgaa agaaacggtg gaggcgttga atctgcccgt tgtttgctca 720
ttgatggggc tgggggcgtt tccggcaacg catcgtcagg cactgggcat gctgggaatg 780
cacggtacct acgaagccaa tatgacgatg cataacgcgg atgtgatttt cgccgtcggg 840
gtacgatttg atgaccgaac gacgaacaat ctggcaaagt actgcccaaa tgccactgtt 900
ctgcatatcg atattgatcc tacttccatt tctaaaaccg tgactgcgga tatcccgatt 960
gtgggggatg ctcgccaggt cctcgaacaa atgcttgaac tcttgtcgca agaatccgcc 1020
catcaaccac tggatgagat ccgcgactgg tggcagcaaa ttgaacagtg gcgcgctcgt 1080
cagtgcctga aatatgacac tcacagtgaa aagattaaac cgcaggcggt gatcgagact 1140
ctttggcggt tgacgaaggg agacgcttac gtgacgtccg atgtcgggca gcaccagatg 1200
tttgctgcac tttattatcc attcgacaaa ccgcgtcgct ggatcaattc cggtggcctc 1260
ggcacgatgg gttttggttt acctgcggca ctgggcgtca aaatggcgtt gccagaagaa 1320
accgtggttt gcgtcactgg cgacggcagt attcagatga acatccagga actgtctacc 1380
gcgttgcaat acgagttgcc cgtactggtg gtgaatctca ataaccgcta tctggggatg 1440
gtgaagcagt ggcaggacat gatctattcc ggccgtcatt cacaatctta tatgcaatcg 1500
ctacccgatt tcgtccgtct ggcggaagcc tatgggcatg tcgggatcca gatttctcat 1560
ccgcatgagc tggaaagcaa acttagcgag gcgctggaac aggtgcgcaa taatcgcctg 1620
gtgtttgttg atgttaccgt cgatggcagc gagcacgtct acccgatgca gattcgcggg 1680
ggcggaatgg atgaaatgtg gttaagcaaa acggagagaa cctga 1725
<210> 14
<211> 574
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> ilvI, AHAS同种型III,大亚基
<400> 14
Met Glu Met Leu Ser Gly Ala Glu Met Val Val Arg Ser Leu Ile Asp
1 5 10 15
Gln Gly Val Lys Gln Val Phe Gly Tyr Pro Gly Gly Ala Val Leu Asp
20 25 30
Ile Tyr Asp Ala Leu His Thr Val Gly Gly Ile Asp His Val Leu Val
35 40 45
Arg His Glu Gln Ala Ala Val His Met Ala Asp Gly Leu Ala Arg Ala
50 55 60
Thr Gly Glu Val Gly Val Val Leu Val Thr Ser Gly Pro Gly Ala Thr
65 70 75 80
Asn Ala Ile Thr Gly Ile Ala Thr Ala Tyr Met Asp Ser Ile Pro Leu
85 90 95
Val Val Leu Ser Gly Gln Val Ala Thr Ser Leu Ile Gly Tyr Asp Ala
100 105 110
Phe Gln Glu Cys Asp Met Val Gly Ile Ser Arg Pro Val Val Lys His
115 120 125
Ser Phe Leu Val Lys Gln Thr Glu Asp Ile Pro Gln Val Leu Lys Lys
130 135 140
Ala Phe Trp Leu Ala Ala Ser Gly Arg Pro Gly Pro Val Val Val Asp
145 150 155 160
Leu Pro Lys Asp Ile Leu Asn Pro Ala Asn Lys Leu Pro Tyr Val Trp
165 170 175
Pro Glu Ser Val Ser Met Arg Ser Tyr Asn Pro Thr Thr Thr Gly His
180 185 190
Lys Gly Gln Ile Lys Arg Ala Leu Gln Thr Leu Val Ala Ala Lys Lys
195 200 205
Pro Val Val Tyr Val Gly Gly Gly Ala Ile Thr Ala Gly Cys His Gln
210 215 220
Gln Leu Lys Glu Thr Val Glu Ala Leu Asn Leu Pro Val Val Cys Ser
225 230 235 240
Leu Met Gly Leu Gly Ala Phe Pro Ala Thr His Arg Gln Ala Leu Gly
245 250 255
Met Leu Gly Met His Gly Thr Tyr Glu Ala Asn Met Thr Met His Asn
260 265 270
Ala Asp Val Ile Phe Ala Val Gly Val Arg Phe Asp Asp Arg Thr Thr
275 280 285
Asn Asn Leu Ala Lys Tyr Cys Pro Asn Ala Thr Val Leu His Ile Asp
290 295 300
Ile Asp Pro Thr Ser Ile Ser Lys Thr Val Thr Ala Asp Ile Pro Ile
305 310 315 320
Val Gly Asp Ala Arg Gln Val Leu Glu Gln Met Leu Glu Leu Leu Ser
325 330 335
Gln Glu Ser Ala His Gln Pro Leu Asp Glu Ile Arg Asp Trp Trp Gln
340 345 350
Gln Ile Glu Gln Trp Arg Ala Arg Gln Cys Leu Lys Tyr Asp Thr His
355 360 365
Ser Glu Lys Ile Lys Pro Gln Ala Val Ile Glu Thr Leu Trp Arg Leu
370 375 380
Thr Lys Gly Asp Ala Tyr Val Thr Ser Asp Val Gly Gln His Gln Met
385 390 395 400
Phe Ala Ala Leu Tyr Tyr Pro Phe Asp Lys Pro Arg Arg Trp Ile Asn
405 410 415
Ser Gly Gly Leu Gly Thr Met Gly Phe Gly Leu Pro Ala Ala Leu Gly
420 425 430
Val Lys Met Ala Leu Pro Glu Glu Thr Val Val Cys Val Thr Gly Asp
435 440 445
Gly Ser Ile Gln Met Asn Ile Gln Glu Leu Ser Thr Ala Leu Gln Tyr
450 455 460
Glu Leu Pro Val Leu Val Val Asn Leu Asn Asn Arg Tyr Leu Gly Met
465 470 475 480
Val Lys Gln Trp Gln Asp Met Ile Tyr Ser Gly Arg His Ser Gln Ser
485 490 495
Tyr Met Gln Ser Leu Pro Asp Phe Val Arg Leu Ala Glu Ala Tyr Gly
500 505 510
His Val Gly Ile Gln Ile Ser His Pro His Glu Leu Glu Ser Lys Leu
515 520 525
Ser Glu Ala Leu Glu Gln Val Arg Asn Asn Arg Leu Val Phe Val Asp
530 535 540
Val Thr Val Asp Gly Ser Glu His Val Tyr Pro Met Gln Ile Arg Gly
545 550 555 560
Gly Gly Met Asp Glu Met Trp Leu Ser Lys Thr Glu Arg Thr
565 570
<210> 15
<211> 492
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<220>
<223> ilvH, AHAS同种型III,小亚基
<400> 15
atgcgccgga tattatcagt cttactcgaa aatgaatcag gcgcgttatc ccgcgtgatt 60
ggcctttttt cccagcgtgg ctacaacatt gaaagcctga ccgttgcgcc aaccgacgat 120
ccgacattat cgcgtatgac catccagacc gtgggcgatg aaaaagtact tgagcagatc 180
gaaaagcaat tacacaaact ggtcgatgtc ttgcgcgtga gtgagttggg gcagggcgcg 240
catgttgagc gggaaatcat gctggtgaaa attcaggcca gcggttacgg gcgtgacgaa 300
gtgaaacgta atacggaaat attccgtggg caaattatcg atgtcacacc ctcgctttat 360
accgttcaat tagcaggcac cagcggtaag cttgatgcat ttttagcatc gattcgcgat 420
gtggcgaaaa ttgtggaggt tgctcgctct ggtgtggtcg gactttcgcg cggcgataaa 480
ataatgcgtt ga 492
<210> 16
<211> 163
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> ilvH, AHAS同种型III,小亚基
<400> 16
Met Arg Arg Ile Leu Ser Val Leu Leu Glu Asn Glu Ser Gly Ala Leu
1 5 10 15
Ser Arg Val Ile Gly Leu Phe Ser Gln Arg Gly Tyr Asn Ile Glu Ser
20 25 30
Leu Thr Val Ala Pro Thr Asp Asp Pro Thr Leu Ser Arg Met Thr Ile
35 40 45
Gln Thr Val Gly Asp Glu Lys Val Leu Glu Gln Ile Glu Lys Gln Leu
50 55 60
His Lys Leu Val Asp Val Leu Arg Val Ser Glu Leu Gly Gln Gly Ala
65 70 75 80
His Val Glu Arg Glu Ile Met Leu Val Lys Ile Gln Ala Ser Gly Tyr
85 90 95
Gly Arg Asp Glu Val Lys Arg Asn Thr Glu Ile Phe Arg Gly Gln Ile
100 105 110
Ile Asp Val Thr Pro Ser Leu Tyr Thr Val Gln Leu Ala Gly Thr Ser
115 120 125
Gly Lys Leu Asp Ala Phe Leu Ala Ser Ile Arg Asp Val Ala Lys Ile
130 135 140
Val Glu Val Ala Arg Ser Gly Val Val Gly Leu Ser Arg Gly Asp Lys
145 150 155 160
Ile Met Arg
<210> 17
<211> 2463
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<220>
<223> thrA, 天冬氨酸激酶和高丝氨酸脱氢酶,双功能
<400> 17
atgcgagtgt tgaagttcgg cggtacatca gtggcaaatg cagaacgttt tctgcgtgtt 60
gccgatattc tggaaagcaa tgccaggcag gggcaggtgg ccaccgtcct ctctgccccc 120
gccaaaatca ccaaccacct ggtggcgatg attgaaaaaa ccattagcgg ccaggatgct 180
ttacccaata tcagcgatgc cgaacgtatt tttgccgaac ttttgacggg actcgccgcc 240
gcccagccgg ggttcccgct ggcgcaattg aaaactttcg tcgatcagga atttgcccaa 300
ataaaacatg tcctgcatgg cattagtttg ttggggcagt gcccggatag catcaacgct 360
gcgctgattt gccgtggcga gaaaatgtcg atcgccatta tggccggcgt attagaagcg 420
cgcggtcaca acgttactgt tatcgatccg gtcgaaaaac tgctggcagt ggggcattac 480
ctcgaatcta ccgtcgatat tgctgagtcc acccgccgta ttgcggcaag ccgcattccg 540
gctgatcaca tggtgctgat ggcaggtttc accgccggta atgaaaaagg cgaactggtg 600
gtgcttggac gcaacggttc cgactactct gctgcggtgc tggctgcctg tttacgcgcc 660
gattgttgcg agatttggac ggacgttgac ggggtctata cctgcgaccc gcgtcaggtg 720
cccgatgcga ggttgttgaa gtcgatgtcc taccaggaag cgatggagct ttcctacttc 780
ggcgctaaag ttcttcaccc ccgcaccatt acccccatcg cccagttcca gatcccttgc 840
ctgattaaaa ataccggaaa tcctcaagca ccaggtacgc tcattggtgc cagccgtgat 900
gaagacgaat taccggtcaa gggcatttcc aatctgaata acatggcaat gttcagcgtt 960
tctggtccgg ggatgaaagg gatggtcggc atggcggcgc gcgtctttgc agcgatgtca 1020
cgcgcccgta tttccgtggt gctgattacg caatcatctt ccgaatacag catcagtttc 1080
tgcgttccac aaagcgactg tgtgcgagct gaacgggcaa tgcaggaaga gttctacctg 1140
gaactgaaag aaggcttact ggagccgctg gcagtgacgg aacggctggc cattatctcg 1200
gtggtaggtg atggtatgcg caccttgcgt gggatctcgg cgaaattctt tgccgcactg 1260
gcccgcgcca atatcaacat tgtcgccatt gctcagggat cttctgaacg ctcaatctct 1320
gtcgtggtaa ataacgatga tgcgaccact ggcgtgcgcg ttactcatca gatgctgttc 1380
aataccgatc aggttatcga agtgtttgtg attggcgtcg gtggcgttgg cggtgcgctg 1440
ctggagcaac tgaagcgtca gcaaagctgg ctgaagaata aacatatcga cttacgtgtc 1500
tgcggtgttg ccaactcgaa ggctctgctc accaatgtac atggccttaa tctggaaaac 1560
tggcaggaag aactggcgca agccaaagag ccgtttaatc tcgggcgctt aattcgcctc 1620
gtgaaagaat atcatctgct gaacccggtc attgttgact gcacttccag ccaggcagtg 1680
gcggatcaat atgccgactt cctgcgcgaa ggtttccacg ttgtcacgcc gaacaaaaag 1740
gccaacacct cgtcgatgga ttactaccat cagttgcgtt atgcggcgga aaaatcgcgg 1800
cgtaaattcc tctatgacac caacgttggg gctggattac cggttattga gaacctgcaa 1860
aatctgctca atgcaggtga tgaattgatg aagttctccg gcattctttc tggttcgctt 1920
tcttatatct tcggcaagtt agacgaaggc atgagtttct ccgaggcgac cacgctggcg 1980
cgggaaatgg gttataccga accggacccg cgagatgatc tttctggtat ggatgtggcg 2040
cgtaaactat tgattctcgc tcgtgaaacg ggacgtgaac tggagctggc ggatattgaa 2100
attgaacctg tgctgcccgc agagtttaac gccgagggtg atgttgccgc ttttatggcg 2160
aatctgtcac aactcgacga tctctttgcc gcgcgcgtgg cgaaggcccg tgatgaagga 2220
aaagttttgc gctatgttgg caatattgat gaagatggcg tctgccgcgt gaagattgcc 2280
gaagtggatg gtaatgatcc gctgttcaaa gtgaaaaatg gcgaaaacgc cctggccttc 2340
tatagccact attatcagcc gctgccgttg gtactgcgcg gatatggtgc gggcaatgac 2400
gttacagctg ccggtgtctt tgctgatctg ctacgtaccc tctcatggaa gttaggagtc 2460
tga 2463
<210> 18
<211> 820
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> thrA, 天冬氨酸激酶和高丝氨酸脱氢酶,双功能
<400> 18
Met Arg Val Leu Lys Phe Gly Gly Thr Ser Val Ala Asn Ala Glu Arg
1 5 10 15
Phe Leu Arg Val Ala Asp Ile Leu Glu Ser Asn Ala Arg Gln Gly Gln
20 25 30
Val Ala Thr Val Leu Ser Ala Pro Ala Lys Ile Thr Asn His Leu Val
35 40 45
Ala Met Ile Glu Lys Thr Ile Ser Gly Gln Asp Ala Leu Pro Asn Ile
50 55 60
Ser Asp Ala Glu Arg Ile Phe Ala Glu Leu Leu Thr Gly Leu Ala Ala
65 70 75 80
Ala Gln Pro Gly Phe Pro Leu Ala Gln Leu Lys Thr Phe Val Asp Gln
85 90 95
Glu Phe Ala Gln Ile Lys His Val Leu His Gly Ile Ser Leu Leu Gly
100 105 110
Gln Cys Pro Asp Ser Ile Asn Ala Ala Leu Ile Cys Arg Gly Glu Lys
115 120 125
Met Ser Ile Ala Ile Met Ala Gly Val Leu Glu Ala Arg Gly His Asn
130 135 140
Val Thr Val Ile Asp Pro Val Glu Lys Leu Leu Ala Val Gly His Tyr
145 150 155 160
Leu Glu Ser Thr Val Asp Ile Ala Glu Ser Thr Arg Arg Ile Ala Ala
165 170 175
Ser Arg Ile Pro Ala Asp His Met Val Leu Met Ala Gly Phe Thr Ala
180 185 190
Gly Asn Glu Lys Gly Glu Leu Val Val Leu Gly Arg Asn Gly Ser Asp
195 200 205
Tyr Ser Ala Ala Val Leu Ala Ala Cys Leu Arg Ala Asp Cys Cys Glu
210 215 220
Ile Trp Thr Asp Val Asp Gly Val Tyr Thr Cys Asp Pro Arg Gln Val
225 230 235 240
Pro Asp Ala Arg Leu Leu Lys Ser Met Ser Tyr Gln Glu Ala Met Glu
245 250 255
Leu Ser Tyr Phe Gly Ala Lys Val Leu His Pro Arg Thr Ile Thr Pro
260 265 270
Ile Ala Gln Phe Gln Ile Pro Cys Leu Ile Lys Asn Thr Gly Asn Pro
275 280 285
Gln Ala Pro Gly Thr Leu Ile Gly Ala Ser Arg Asp Glu Asp Glu Leu
290 295 300
Pro Val Lys Gly Ile Ser Asn Leu Asn Asn Met Ala Met Phe Ser Val
305 310 315 320
Ser Gly Pro Gly Met Lys Gly Met Val Gly Met Ala Ala Arg Val Phe
325 330 335
Ala Ala Met Ser Arg Ala Arg Ile Ser Val Val Leu Ile Thr Gln Ser
340 345 350
Ser Ser Glu Tyr Ser Ile Ser Phe Cys Val Pro Gln Ser Asp Cys Val
355 360 365
Arg Ala Glu Arg Ala Met Gln Glu Glu Phe Tyr Leu Glu Leu Lys Glu
370 375 380
Gly Leu Leu Glu Pro Leu Ala Val Thr Glu Arg Leu Ala Ile Ile Ser
385 390 395 400
Val Val Gly Asp Gly Met Arg Thr Leu Arg Gly Ile Ser Ala Lys Phe
405 410 415
Phe Ala Ala Leu Ala Arg Ala Asn Ile Asn Ile Val Ala Ile Ala Gln
420 425 430
Gly Ser Ser Glu Arg Ser Ile Ser Val Val Val Asn Asn Asp Asp Ala
435 440 445
Thr Thr Gly Val Arg Val Thr His Gln Met Leu Phe Asn Thr Asp Gln
450 455 460
Val Ile Glu Val Phe Val Ile Gly Val Gly Gly Val Gly Gly Ala Leu
465 470 475 480
Leu Glu Gln Leu Lys Arg Gln Gln Ser Trp Leu Lys Asn Lys His Ile
485 490 495
Asp Leu Arg Val Cys Gly Val Ala Asn Ser Lys Ala Leu Leu Thr Asn
500 505 510
Val His Gly Leu Asn Leu Glu Asn Trp Gln Glu Glu Leu Ala Gln Ala
515 520 525
Lys Glu Pro Phe Asn Leu Gly Arg Leu Ile Arg Leu Val Lys Glu Tyr
530 535 540
His Leu Leu Asn Pro Val Ile Val Asp Cys Thr Ser Ser Gln Ala Val
545 550 555 560
Ala Asp Gln Tyr Ala Asp Phe Leu Arg Glu Gly Phe His Val Val Thr
565 570 575
Pro Asn Lys Lys Ala Asn Thr Ser Ser Met Asp Tyr Tyr His Gln Leu
580 585 590
Arg Tyr Ala Ala Glu Lys Ser Arg Arg Lys Phe Leu Tyr Asp Thr Asn
595 600 605
Val Gly Ala Gly Leu Pro Val Ile Glu Asn Leu Gln Asn Leu Leu Asn
610 615 620
Ala Gly Asp Glu Leu Met Lys Phe Ser Gly Ile Leu Ser Gly Ser Leu
625 630 635 640
Ser Tyr Ile Phe Gly Lys Leu Asp Glu Gly Met Ser Phe Ser Glu Ala
645 650 655
Thr Thr Leu Ala Arg Glu Met Gly Tyr Thr Glu Pro Asp Pro Arg Asp
660 665 670
Asp Leu Ser Gly Met Asp Val Ala Arg Lys Leu Leu Ile Leu Ala Arg
675 680 685
Glu Thr Gly Arg Glu Leu Glu Leu Ala Asp Ile Glu Ile Glu Pro Val
690 695 700
Leu Pro Ala Glu Phe Asn Ala Glu Gly Asp Val Ala Ala Phe Met Ala
705 710 715 720
Asn Leu Ser Gln Leu Asp Asp Leu Phe Ala Ala Arg Val Ala Lys Ala
725 730 735
Arg Asp Glu Gly Lys Val Leu Arg Tyr Val Gly Asn Ile Asp Glu Asp
740 745 750
Gly Val Cys Arg Val Lys Ile Ala Glu Val Asp Gly Asn Asp Pro Leu
755 760 765
Phe Lys Val Lys Asn Gly Glu Asn Ala Leu Ala Phe Tyr Ser His Tyr
770 775 780
Tyr Gln Pro Leu Pro Leu Val Leu Arg Gly Tyr Gly Ala Gly Asn Asp
785 790 795 800
Val Thr Ala Ala Gly Val Phe Ala Asp Leu Leu Arg Thr Leu Ser Trp
805 810 815
Lys Leu Gly Val
820
<210> 19
<211> 285
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<220>
<223> araBAD启动子
<400> 19
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccat 285
<210> 20
<211> 879
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<220>
<223> 基因araC
<400> 20
atggctgaag cgcaaaatga tcccctgctg ccgggatact cgtttaatgc ccatctggtg 60
gcgggtttaa cgccgattga ggccaacggt tatctcgatt tttttatcga ccgaccgctg 120
ggaatgaaag gttatattct caatctcacc attcgcggtc agggggtggt gaaaaatcag 180
ggacgagaat ttgtttgccg accgggtgat attttgctgt tcccgccagg agagattcat 240
cactacggtc gtcatccgga ggctcgcgaa tggtatcacc agtgggttta ctttcgtccg 300
cgcgcctact ggcatgaatg gcttaactgg ccgtcaatat ttgccaatac ggggttcttt 360
cgcccggatg aagcgcacca gccgcatttc agcgacctgt ttgggcaaat cattaacgcc 420
gggcaagggg aagggcgcta ttcggagctg ctggcgataa atctgcttga gcaattgtta 480
ctgcggcgca tggaagcgat taacgagtcg ctccatccac cgatggataa tcgggtacgc 540
gaggcttgtc agtacatcag cgatcacctg gcagacagca attttgatat cgccagcgtc 600
gcacagcatg tttgcttgtc gccgtcgcgt ctgtcacatc ttttccgcca gcagttaggg 660
attagcgtct taagctggcg cgaggaccaa cgtatcagcc aggcgaagct gcttttgagc 720
accacccgga tgcctatcgc caccgtcggt cgcaatgttg gttttgacga tcaactctat 780
ttctcgcggg tatttaaaaa atgcaccggg gccagcccga gcgagttccg tgccggttgt 840
gaagaaaaag tgaatgatgt agccgtcaag ttgtcataa 879
<210> 21
<211> 81
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<220>
<223> Pm启动子
<400> 21
agtccagcct tgcaagaagc ggatacagga gtgcaaaaaa tggctatctc tagaaaggcc 60
taccccttag gctttatgca a 81
<210> 22
<211> 1135
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<220>
<223> XylS启动子和基因xylS
<400> 22
cttggcgtta tttttgcttg gaaaagtggt cactgattgc aaaaaggatg gcgcaacgtg 60
gcaatggggg taacccgtat acgcatcacg tcgagatgca ttttcatcga cttggcgcct 120
ttctacatca caccaagcag cccacattaa aataagagaa ccgtgaacta tggatttttg 180
cttattgaac gagaaaagtc agatcttcgt ccacgccgag ccctatgcag tctccgatta 240
tgttaaccag tatgtcggta cgcactctat tcgcctgccc aagggcgggc ccccggcagg 300
caggctgcac cacagaatct tcggatgcct cgacctgtgt cgaatcagct acggcggtag 360
cgtgagggta atctcgcctg gattagagac ctgttatcat ctgcaaataa tactcaaagg 420
ccattgcctg tggcgtggcc atggccagga gcactatttt gcgccgggcg aactattgct 480
gctcaatccg gatgaccaag ccgacctgac ctattcagaa gattgcgaga aatttatcgt 540
taaattgccc tcagtggtcc ttgatcgggc atgcagtgac aacaattggc acaagccgag 600
ggagggtatc cgtttcgccg cgcgacacaa tctccagcaa ctcgatggct ttatcaatct 660
actcgggtta gtttgtgacg aagcggaaca tacaaagtcg atgcctcggg tccaagagca 720
ctatgcgggg atcatcgctt ccaagctgct cgaaatgctg ggcagcaatg tcagccgtga 780
aattttcagc aaaggtaacc cgtctttcga gcgagtcgtt caattcattg aggagaatct 840
caaacggaat atcagccttg agcggttagc ggagctggcg atgatgagtc cacgctcgct 900
ctacaatttg ttcgagaagc atgccggcac cacgccgaag aactacatcc gcaaccgcaa 960
gctcgaaagc atccgcgcct gcttgaacga tcccagtgcc aatgtgcgta gtataactga 1020
gatagcccta gactacggct tcttacattt gggacgcttc gctgaaaact ataggagcgc 1080
gttcggcgag ttgccttccg acaccctgcg tcaatgcaaa aaggaagtgg cttga 1135
<210> 23
<211> 1689
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<220>
<223> ilvB, AHAS同种型I,大亚基
<400> 23
atggcaagtt cgggcacaac atcgacgcgt aagcgcttta ccggcgcaga atttatcgtt 60
catttcctgg aacagcaggg cattaagatt gtgacaggca ttccgggcgg ttctatcctg 120
cctgtttacg atgccttaag ccaaagcacg caaatccgcc atattctggc ccgtcatgaa 180
cagggcgcgg gctttatcgc tcagggaatg gcgcgcaccg acggtaaacc ggcggtctgt 240
atggcctgta gcggaccggg tgcgactaac ctggtgaccg ccattgccga tgcgcggctg 300
gactccatcc cgctgatttg catcactggt caggttcccg cctcgatgat cggcaccgac 360
gccttccagg aagtggacac ctacggcatc tctatcccca tcaccaaaca caactatctg 420
gtcagacata tcgaagaact cccgcaggtc atgagcgatg ccttccgcat tgcgcaatca 480
ggccgcccag gcccggtgtg gatagacatt cctaaggatg tgcaaacggc agtttttgag 540
attgaaacac agcccgctat ggcagaaaaa gccgccgccc ccgcctttag cgaagaaagc 600
attcgtgacg cagcggcgat gattaacgct gccaaacgcc cggtgcttta tctgggcggc 660
ggtgtgatca atgcgcccgc acgggtgcgt gaactggcgg agaaagcgca actgcctacc 720
accatgactt taatggcgct gggcatgttg ccaaaagcgc atccgttgtc gctgggtatg 780
ctggggatgc acggcgtgcg cagcaccaac tatattttgc aggaggcgga tttgttgata 840
gtgctcggtg cgcgttttga tgaccgggcg attggcaaaa ccgagcagtt ctgtccgaat 900
gccaaaatca ttcatgtcga tatcgaccgt gcagagctgg gtaaaatcaa gcagccgcac 960
gtggcgattc aggcggatgt tgatgacgtg ctggcgcagt tgatcccgct ggtggaagcg 1020
caaccgcgtg cagagtggca ccagttggta gcggatttgc agcgtgagtt tccgtgtcca 1080
atcccgaaag cgtgcgatcc gttaagccat tacggcctga tcaacgccgt tgccgcctgt 1140
gtcgatgaca atgcaattat caccaccgac gttggtcagc atcagatgtg gaccgcgcaa 1200
gcttatccgc tcaatcgccc acgccagtgg ctgacctccg gtgggctggg cacgatgggt 1260
tttggcctgc ctgcggcgat tggcgctgcg ctggcgaacc cggatcgcaa agtgttgtgt 1320
ttctccggcg acggcagcct gatgatgaat attcaggaga tggcgaccgc cagtgaaaat 1380
cagctggatg tcaaaatcat tctgatgaac aacgaagcgc tggggctggt gcatcagcaa 1440
cagagtctgt tctacgagca aggcgttttt gccgccacct atccgggcaa aatcaacttt 1500
atgcagattg ccgccggatt cggcctcgaa acctgtgatt tgaataacga agccgatccg 1560
caggcttcat tgcaggaaat catcaatcgc cctggcccgg cgctgatcca tgtgcgcatt 1620
gatgccgaag aaaaagttta cccgatggtg ccgccaggtg cggcgaatac tgaaatggtg 1680
ggggaataa 1689
<210> 24
<211> 562
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> ilvB, AHAS同种型I,大亚基
<400> 24
Met Ala Ser Ser Gly Thr Thr Ser Thr Arg Lys Arg Phe Thr Gly Ala
1 5 10 15
Glu Phe Ile Val His Phe Leu Glu Gln Gln Gly Ile Lys Ile Val Thr
20 25 30
Gly Ile Pro Gly Gly Ser Ile Leu Pro Val Tyr Asp Ala Leu Ser Gln
35 40 45
Ser Thr Gln Ile Arg His Ile Leu Ala Arg His Glu Gln Gly Ala Gly
50 55 60
Phe Ile Ala Gln Gly Met Ala Arg Thr Asp Gly Lys Pro Ala Val Cys
65 70 75 80
Met Ala Cys Ser Gly Pro Gly Ala Thr Asn Leu Val Thr Ala Ile Ala
85 90 95
Asp Ala Arg Leu Asp Ser Ile Pro Leu Ile Cys Ile Thr Gly Gln Val
100 105 110
Pro Ala Ser Met Ile Gly Thr Asp Ala Phe Gln Glu Val Asp Thr Tyr
115 120 125
Gly Ile Ser Ile Pro Ile Thr Lys His Asn Tyr Leu Val Arg His Ile
130 135 140
Glu Glu Leu Pro Gln Val Met Ser Asp Ala Phe Arg Ile Ala Gln Ser
145 150 155 160
Gly Arg Pro Gly Pro Val Trp Ile Asp Ile Pro Lys Asp Val Gln Thr
165 170 175
Ala Val Phe Glu Ile Glu Thr Gln Pro Ala Met Ala Glu Lys Ala Ala
180 185 190
Ala Pro Ala Phe Ser Glu Glu Ser Ile Arg Asp Ala Ala Ala Met Ile
195 200 205
Asn Ala Ala Lys Arg Pro Val Leu Tyr Leu Gly Gly Gly Val Ile Asn
210 215 220
Ala Pro Ala Arg Val Arg Glu Leu Ala Glu Lys Ala Gln Leu Pro Thr
225 230 235 240
Thr Met Thr Leu Met Ala Leu Gly Met Leu Pro Lys Ala His Pro Leu
245 250 255
Ser Leu Gly Met Leu Gly Met His Gly Val Arg Ser Thr Asn Tyr Ile
260 265 270
Leu Gln Glu Ala Asp Leu Leu Ile Val Leu Gly Ala Arg Phe Asp Asp
275 280 285
Arg Ala Ile Gly Lys Thr Glu Gln Phe Cys Pro Asn Ala Lys Ile Ile
290 295 300
His Val Asp Ile Asp Arg Ala Glu Leu Gly Lys Ile Lys Gln Pro His
305 310 315 320
Val Ala Ile Gln Ala Asp Val Asp Asp Val Leu Ala Gln Leu Ile Pro
325 330 335
Leu Val Glu Ala Gln Pro Arg Ala Glu Trp His Gln Leu Val Ala Asp
340 345 350
Leu Gln Arg Glu Phe Pro Cys Pro Ile Pro Lys Ala Cys Asp Pro Leu
355 360 365
Ser His Tyr Gly Leu Ile Asn Ala Val Ala Ala Cys Val Asp Asp Asn
370 375 380
Ala Ile Ile Thr Thr Asp Val Gly Gln His Gln Met Trp Thr Ala Gln
385 390 395 400
Ala Tyr Pro Leu Asn Arg Pro Arg Gln Trp Leu Thr Ser Gly Gly Leu
405 410 415
Gly Thr Met Gly Phe Gly Leu Pro Ala Ala Ile Gly Ala Ala Leu Ala
420 425 430
Asn Pro Asp Arg Lys Val Leu Cys Phe Ser Gly Asp Gly Ser Leu Met
435 440 445
Met Asn Ile Gln Glu Met Ala Thr Ala Ser Glu Asn Gln Leu Asp Val
450 455 460
Lys Ile Ile Leu Met Asn Asn Glu Ala Leu Gly Leu Val His Gln Gln
465 470 475 480
Gln Ser Leu Phe Tyr Glu Gln Gly Val Phe Ala Ala Thr Tyr Pro Gly
485 490 495
Lys Ile Asn Phe Met Gln Ile Ala Ala Gly Phe Gly Leu Glu Thr Cys
500 505 510
Asp Leu Asn Asn Glu Ala Asp Pro Gln Ala Ser Leu Gln Glu Ile Ile
515 520 525
Asn Arg Pro Gly Pro Ala Leu Ile His Val Arg Ile Asp Ala Glu Glu
530 535 540
Lys Val Tyr Pro Met Val Pro Pro Gly Ala Ala Asn Thr Glu Met Val
545 550 555 560
Gly Glu
<210> 25
<211> 291
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<220>
<223> ilvN, AHAS同种型I,小亚基
<400> 25
atgcaaaaca caactcatga caacgtaatt ctggagctca ccgttcgcaa ccatccgggc 60
gtaatgaccc acgtttgtgg cctttttgcc cgccgcgctt ttaacgttga aggcattctt 120
tgtctgccga ttcaggacag cgacaaaagc catatctggc tactggtcaa tgacgaccag 180
cgtctggagc agatgataag ccaaatcgat aagctggaag atgtcgtgaa agtgcagcgt 240
aatcagtccg atccgacgat gtttaacaag atcgcggtgt tttttcagta a 291
<210> 26
<211> 96
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<220>
<223> ilvN, AHAS同种型I,小亚基
<400> 26
Met Gln Asn Thr Thr His Asp Asn Val Ile Leu Glu Leu Thr Val Arg
1 5 10 15
Asn His Pro Gly Val Met Thr His Val Cys Gly Leu Phe Ala Arg Arg
20 25 30
Ala Phe Asn Val Glu Gly Ile Leu Cys Leu Pro Ile Gln Asp Ser Asp
35 40 45
Lys Ser His Ile Trp Leu Leu Val Asn Asp Asp Gln Arg Leu Glu Gln
50 55 60
Met Ile Ser Gln Ile Asp Lys Leu Glu Asp Val Val Lys Val Gln Arg
65 70 75 80
Asn Gln Ser Asp Pro Thr Met Phe Asn Lys Ile Ala Val Phe Phe Gln
85 90 95
<210> 27
<211> 1647
<212> DNA
<213> 鲍氏志贺氏菌(Shigella boydii)
<220>
<223> AHAS II,大亚基
<400> 27
atgaatggcg cacagtgggt ggtacatgcg ttgcgggcac agggtgtgaa caccgttttc 60
ggttatccgg gtggcgcaat tatgccggtt tacgatgcat tgtatgacgg cggcgtggag 120
cacttgctgt gccgacatga gcagggtgcg gcaatggcgg ctatcggtta tgcccgtgct 180
accggcaaaa ctggcgtatg tatcgccacg tctggtccgg gcgcaaccaa cctgataacc 240
gggcttgcgg acgcactgtt agattctatc cctgttgttg ccatcaccgg tcaagtgtcc 300
gcaccgttta tcggcactga tgcatttcag gaagtggatg tcctgggatt gtcgttagcc 360
tgtaccaagc acagctttct ggtgcagtcg ctggaagagt tgccgcgcat tatggctgaa 420
gcattcgacg ttgccagctc aggtcgtcct ggtccggttc tggtcgatat cccaaaagat 480
atccagctag ccagcggtga cctggaaccg tggttcacca ccgttgaaaa cgaagtgact 540
ttcccacatg ccgaagttga gcaagcgcgc cagatgctgg caaaagcgca aaaaccgatg 600
ctgtacgttg gtggtggcgt gggtatggcg caggcagttc ctgctttacg agaatttctc 660
gctaccacaa aaatgcctgc cacctgcacg ctgaaagggc tgggcgcagt tgaagcagat 720
tatccgtact atctgggcat gctgggaatg catggcacca aagcggcgaa cttcgcggtg 780
caggagtgcg acttgctgat cgccgtgggt gcacgttttg atgaccgggt gaccggcaaa 840
ctgaacacct tcgcaccaca cgccagcgtt atccatatgg atatcgaccc ggcagaaatg 900
aacaagctgc gtcaggcaca tgtggcatta caaggtgatt taaatgctct gttaccagaa 960
ttacagcagc cgttaaatat caatgactgg cagcaatact gcgcgcagct gcgtgatgaa 1020
catgcctggc gttacgacca tcccggcgac gctatctacg cgccgttgtt gttaaaacaa 1080
ctgtcggatc gtaaacctgc ggattgcgtc gtgaccacag atgtggggca gcaccagatg 1140
tgggctgcgc aacacatcgc ccacactcgc ccggaaaatt tcatcacctc cagcggctta 1200
ggcactatgg gttttggttt accagcggcg gttggcgcac aagtcgcgcg accgaacgat 1260
accgtcgtct gtatctccgg tgacggctct ttcatgatga atgtgcaaga gctgggcacc 1320
gtaaaacgca agcagttacc gttgaaaatc gtcttactcg ataaccaacg gttagggatg 1380
gttcgacaat ggcagcaact gttttttcag gaacgataca gcgaaaccac ccttactgat 1440
aaccccgatt tcctcatgtt agccagcgcc ttcggcatcc ctggccaaca catcacccgt 1500
aaagaccagg ttgaagcggc actcgacacc atgctgaaca gtgatgggcc atacctgctt 1560
catgtctcaa tcgacgaact tgagaacgtc tggccgctgg tgccgcctgg cgccagtaat 1620
tcagaaatgt tggagaaatt atcatga 1647
<210> 28
<211> 548
<212> PRT
<213> 鲍氏志贺氏菌(Shigella boydii)
<220>
<223> AHAS II,大亚基
<400> 28
Met Asn Gly Ala Gln Trp Val Val His Ala Leu Arg Ala Gln Gly Val
1 5 10 15
Asn Thr Val Phe Gly Tyr Pro Gly Gly Ala Ile Met Pro Val Tyr Asp
20 25 30
Ala Leu Tyr Asp Gly Gly Val Glu His Leu Leu Cys Arg His Glu Gln
35 40 45
Gly Ala Ala Met Ala Ala Ile Gly Tyr Ala Arg Ala Thr Gly Lys Thr
50 55 60
Gly Val Cys Ile Ala Thr Ser Gly Pro Gly Ala Thr Asn Leu Ile Thr
65 70 75 80
Gly Leu Ala Asp Ala Leu Leu Asp Ser Ile Pro Val Val Ala Ile Thr
85 90 95
Gly Gln Val Ser Ala Pro Phe Ile Gly Thr Asp Ala Phe Gln Glu Val
100 105 110
Asp Val Leu Gly Leu Ser Leu Ala Cys Thr Lys His Ser Phe Leu Val
115 120 125
Gln Ser Leu Glu Glu Leu Pro Arg Ile Met Ala Glu Ala Phe Asp Val
130 135 140
Ala Ser Ser Gly Arg Pro Gly Pro Val Leu Val Asp Ile Pro Lys Asp
145 150 155 160
Ile Gln Leu Ala Ser Gly Asp Leu Glu Pro Trp Phe Thr Thr Val Glu
165 170 175
Asn Glu Val Thr Phe Pro His Ala Glu Val Glu Gln Ala Arg Gln Met
180 185 190
Leu Ala Lys Ala Gln Lys Pro Met Leu Tyr Val Gly Gly Gly Val Gly
195 200 205
Met Ala Gln Ala Val Pro Ala Leu Arg Glu Phe Leu Ala Thr Thr Lys
210 215 220
Met Pro Ala Thr Cys Thr Leu Lys Gly Leu Gly Ala Val Glu Ala Asp
225 230 235 240
Tyr Pro Tyr Tyr Leu Gly Met Leu Gly Met His Gly Thr Lys Ala Ala
245 250 255
Asn Phe Ala Val Gln Glu Cys Asp Leu Leu Ile Ala Val Gly Ala Arg
260 265 270
Phe Asp Asp Arg Val Thr Gly Lys Leu Asn Thr Phe Ala Pro His Ala
275 280 285
Ser Val Ile His Met Asp Ile Asp Pro Ala Glu Met Asn Lys Leu Arg
290 295 300
Gln Ala His Val Ala Leu Gln Gly Asp Leu Asn Ala Leu Leu Pro Glu
305 310 315 320
Leu Gln Gln Pro Leu Asn Ile Asn Asp Trp Gln Gln Tyr Cys Ala Gln
325 330 335
Leu Arg Asp Glu His Ala Trp Arg Tyr Asp His Pro Gly Asp Ala Ile
340 345 350
Tyr Ala Pro Leu Leu Leu Lys Gln Leu Ser Asp Arg Lys Pro Ala Asp
355 360 365
Cys Val Val Thr Thr Asp Val Gly Gln His Gln Met Trp Ala Ala Gln
370 375 380
His Ile Ala His Thr Arg Pro Glu Asn Phe Ile Thr Ser Ser Gly Leu
385 390 395 400
Gly Thr Met Gly Phe Gly Leu Pro Ala Ala Val Gly Ala Gln Val Ala
405 410 415
Arg Pro Asn Asp Thr Val Val Cys Ile Ser Gly Asp Gly Ser Phe Met
420 425 430
Met Asn Val Gln Glu Leu Gly Thr Val Lys Arg Lys Gln Leu Pro Leu
435 440 445
Lys Ile Val Leu Leu Asp Asn Gln Arg Leu Gly Met Val Arg Gln Trp
450 455 460
Gln Gln Leu Phe Phe Gln Glu Arg Tyr Ser Glu Thr Thr Leu Thr Asp
465 470 475 480
Asn Pro Asp Phe Leu Met Leu Ala Ser Ala Phe Gly Ile Pro Gly Gln
485 490 495
His Ile Thr Arg Lys Asp Gln Val Glu Ala Ala Leu Asp Thr Met Leu
500 505 510
Asn Ser Asp Gly Pro Tyr Leu Leu His Val Ser Ile Asp Glu Leu Glu
515 520 525
Asn Val Trp Pro Leu Val Pro Pro Gly Ala Ser Asn Ser Glu Met Leu
530 535 540
Glu Lys Leu Ser
545
<210> 29
<211> 264
<212> DNA
<213> 鲍氏志贺氏菌(Shigella boydii)
<220>
<223> AHAS II,小亚基
<400> 29
atgatgcaat atcaggtcaa tgtatcggct cgcttcaatc cggaaacctt agaacgtgtt 60
ttacgcgtgg tgcgtcatcg tggtttccac gtctgctcaa tgaatatggc cgccgccagc 120
gatgcacaaa atataaatat cgaattgacc gttgccagcc cacggtcggt cgacttactg 180
tttagtcagt taaataaact ggtggacgtc gcacacgttg ccatctgcca gagcacaacc 240
acatcacaac aaatccgcgc ctga 264
<210> 30
<211> 87
<212> PRT
<213> 鲍氏志贺氏菌(Shigella boydii)
<220>
<223> AHAS II,小亚基
<400> 30
Met Met Gln Tyr Gln Val Asn Val Ser Ala Arg Phe Asn Pro Glu Thr
1 5 10 15
Leu Glu Arg Val Leu Arg Val Val Arg His Arg Gly Phe His Val Cys
20 25 30
Ser Met Asn Met Ala Ala Ala Ser Asp Ala Gln Asn Ile Asn Ile Glu
35 40 45
Leu Thr Val Ala Ser Pro Arg Ser Val Asp Leu Leu Phe Ser Gln Leu
50 55 60
Asn Lys Leu Val Asp Val Ala His Val Ala Ile Cys Gln Ser Thr Thr
65 70 75 80
Thr Ser Gln Gln Ile Arg Ala
85
<210> 31
<211> 1647
<212> DNA
<213> 粘质沙雷氏菌(Serratia marcescens)
<220>
<223> AHAS II,大亚基
<400> 31
atgaatggcg ctcagtgggt agttcaagcg ttgcgtgcgc agggtgtgga taccgtattc 60
ggctatccgg gtggggcaat catgccggtg tacgatgcgc tgtacgacgg cggtgtggaa 120
cacctgctgt gtcgccatga acagggcgcc gcgatggccg ccatcggcta cgcccgcgcc 180
accggcaaag tcggcgtttg catcgccact tccggccctg gcgccaccaa cctgatcact 240
ggcctggctg atgcgctgct cgattccgtt cccgttgtcg ccatcaccgg tcaggtgggt 300
tccgcgctga tcggcaccga tgcctttcag gagatcgatg ttctcggcct gtctctggcc 360
tgcaccaagc acagcttcct ggtggaatcg ctggacgcct tgccgggcat catggcggaa 420
gcgttcgcca tcgccgcagg cggccgccct ggcccggtgc tgatcgatat cccgaaagac 480
attcagctgg cgcagggcga cttgcacccg catctgatgc cggtcgacga agcgccggcg 540
ttcccggcgg cagcgttggc agaagcggcc gagctgctgg cgcaggccca aaaaccgatg 600
ctgtacgtcg gcggcggcgt gggcatggcg caggcggtgc cggcgctgcg tgaatttatc 660
gccgtgaccc gcatgccgaa cgtcgccacc ctgaaggggc tgggtgcgcc ggatgcgcaa 720
gatccgctgt acctcggcat gttgggcatg cacggcacca aggctgccaa cctggcggtg 780
caggcgtgcg atttgctgat tgccgtcggc gcgcgtttcg atgaccgcgt aaccggcaaa 840
ctgaacgcct tcgcaccgca tgccaaagtg atccacatgg atatcgatcc ggcggagatg 900
agcaagctgc gccaggcgca tgtggccctg cagggcgatc tgaaagcgtt gctgccggcg 960
ttgcagcgcc cgctgaatat cgccgcctgg cagcagcagg tggcggtact gaaagctgag 1020
cacgcctgtc gctacgatca ccccggccag ccgatctacg cgccattgtt cttgcgccag 1080
ctgtccgccc gcaagccggc caacagcgtg gtgaccaccg acgtgggcca gcatcagatg 1140
tggagcgcgc agcacatgac gttcgaacgc ccggagaatt tcatcacctc cagcggcctc 1200
ggcaccatgg ggttcggcgt gccggcggcg gtgggggccc agatcgcgcg cccgcaagat 1260
acggtgatct gcgtctcggg cgatggctcc ttcatgatga acgtacagga gctgggcacc 1320
atcaagcgta aacagctgcc gctcaagatc gtgctgctgg acaaccaacg cctcggaatg 1380
gtgcgtcagt ggcagcagct gttcttcgac ggccgctaca gcgaaaccaa cctgtccgat 1440
aaccccgact tcctgatgct ggccgccgcc ttcggcattc ccggccagcg catcagccgc 1500
aaggatcagg tggaggacgc gctcgaggcg ctgttcaaca ccgaaggccc ttatctgctg 1560
caggtctcta tcgacgaact cgaaaacgtc tggccgctgg tgccgccggg cgccggcaac 1620
gaaaccatgt tggaggaaat atcatga 1647
<210> 32
<211> 548
<212> PRT
<213> 粘质沙雷氏菌(Serratia marcescens)
<220>
<223> AHAS II,大亚基
<400> 32
Met Asn Gly Ala Gln Trp Val Val Gln Ala Leu Arg Ala Gln Gly Val
1 5 10 15
Asp Thr Val Phe Gly Tyr Pro Gly Gly Ala Ile Met Pro Val Tyr Asp
20 25 30
Ala Leu Tyr Asp Gly Gly Val Glu His Leu Leu Cys Arg His Glu Gln
35 40 45
Gly Ala Ala Met Ala Ala Ile Gly Tyr Ala Arg Ala Thr Gly Lys Val
50 55 60
Gly Val Cys Ile Ala Thr Ser Gly Pro Gly Ala Thr Asn Leu Ile Thr
65 70 75 80
Gly Leu Ala Asp Ala Leu Leu Asp Ser Val Pro Val Val Ala Ile Thr
85 90 95
Gly Gln Val Gly Ser Ala Leu Ile Gly Thr Asp Ala Phe Gln Glu Ile
100 105 110
Asp Val Leu Gly Leu Ser Leu Ala Cys Thr Lys His Ser Phe Leu Val
115 120 125
Glu Ser Leu Asp Ala Leu Pro Gly Ile Met Ala Glu Ala Phe Ala Ile
130 135 140
Ala Ala Gly Gly Arg Pro Gly Pro Val Leu Ile Asp Ile Pro Lys Asp
145 150 155 160
Ile Gln Leu Ala Gln Gly Asp Leu His Pro His Leu Met Pro Val Asp
165 170 175
Glu Ala Pro Ala Phe Pro Ala Ala Ala Leu Ala Glu Ala Ala Glu Leu
180 185 190
Leu Ala Gln Ala Gln Lys Pro Met Leu Tyr Val Gly Gly Gly Val Gly
195 200 205
Met Ala Gln Ala Val Pro Ala Leu Arg Glu Phe Ile Ala Val Thr Arg
210 215 220
Met Pro Asn Val Ala Thr Leu Lys Gly Leu Gly Ala Pro Asp Ala Gln
225 230 235 240
Asp Pro Leu Tyr Leu Gly Met Leu Gly Met His Gly Thr Lys Ala Ala
245 250 255
Asn Leu Ala Val Gln Ala Cys Asp Leu Leu Ile Ala Val Gly Ala Arg
260 265 270
Phe Asp Asp Arg Val Thr Gly Lys Leu Asn Ala Phe Ala Pro His Ala
275 280 285
Lys Val Ile His Met Asp Ile Asp Pro Ala Glu Met Ser Lys Leu Arg
290 295 300
Gln Ala His Val Ala Leu Gln Gly Asp Leu Lys Ala Leu Leu Pro Ala
305 310 315 320
Leu Gln Arg Pro Leu Asn Ile Ala Ala Trp Gln Gln Gln Val Ala Val
325 330 335
Leu Lys Ala Glu His Ala Cys Arg Tyr Asp His Pro Gly Gln Pro Ile
340 345 350
Tyr Ala Pro Leu Phe Leu Arg Gln Leu Ser Ala Arg Lys Pro Ala Asn
355 360 365
Ser Val Val Thr Thr Asp Val Gly Gln His Gln Met Trp Ser Ala Gln
370 375 380
His Met Thr Phe Glu Arg Pro Glu Asn Phe Ile Thr Ser Ser Gly Leu
385 390 395 400
Gly Thr Met Gly Phe Gly Val Pro Ala Ala Val Gly Ala Gln Ile Ala
405 410 415
Arg Pro Gln Asp Thr Val Ile Cys Val Ser Gly Asp Gly Ser Phe Met
420 425 430
Met Asn Val Gln Glu Leu Gly Thr Ile Lys Arg Lys Gln Leu Pro Leu
435 440 445
Lys Ile Val Leu Leu Asp Asn Gln Arg Leu Gly Met Val Arg Gln Trp
450 455 460
Gln Gln Leu Phe Phe Asp Gly Arg Tyr Ser Glu Thr Asn Leu Ser Asp
465 470 475 480
Asn Pro Asp Phe Leu Met Leu Ala Ala Ala Phe Gly Ile Pro Gly Gln
485 490 495
Arg Ile Ser Arg Lys Asp Gln Val Glu Asp Ala Leu Glu Ala Leu Phe
500 505 510
Asn Thr Glu Gly Pro Tyr Leu Leu Gln Val Ser Ile Asp Glu Leu Glu
515 520 525
Asn Val Trp Pro Leu Val Pro Pro Gly Ala Gly Asn Glu Thr Met Leu
530 535 540
Glu Glu Ile Ser
545
<210> 33
<211> 258
<212> DNA
<213> 粘质沙雷氏菌(Serratia marcescens)
<220>
<223> AHAS II,小亚基
<400> 33
atgatgcagc atcaactctc tatccaggcg cgttttcgcc ccgaaatgtt agagcgcgta 60
ttgcgggtcg tgcgtcatcg cggctttcag gtttgtgcta tgaatatggt ttctccggcc 120
aacgccgaca gcatcaatat cgaattgacc gttgccagcc cacgtccggt cgccctgttg 180
tcatctcagt taagcaaact gctggacgtc tcctgcgtcg agatccagca gccaacatca 240
caacaaatac gcgcctga 258
<210> 34
<211> 85
<212> PRT
<213> 粘质沙雷氏菌(Serratia marcescens)
<220>
<223> AHAS II,小亚基
<400> 34
Met Met Gln His Gln Leu Ser Ile Gln Ala Arg Phe Arg Pro Glu Met
1 5 10 15
Leu Glu Arg Val Leu Arg Val Val Arg His Arg Gly Phe Gln Val Cys
20 25 30
Ala Met Asn Met Val Ser Pro Ala Asn Ala Asp Ser Ile Asn Ile Glu
35 40 45
Leu Thr Val Ala Ser Pro Arg Pro Val Ala Leu Leu Ser Ser Gln Leu
50 55 60
Ser Lys Leu Leu Asp Val Ser Cys Val Glu Ile Gln Gln Pro Thr Ser
65 70 75 80
Gln Gln Ile Arg Ala
85
<210> 35
<211> 1725
<212> DNA
<213> 鲍氏志贺氏菌(Shigella boydii)
<220>
<223> AHAS III,大亚基
<400> 35
atggagatgt tgtctggagc cgagatggtc gtccgatcgc ttatcgatca gggcgttaaa 60
caagtattcg gttatcctgg aggcgcagtc cttgatattt acgatgcatt gcataccgtg 120
ggtggtatcg atcatgtttt agttcgtcat gagcaggcgg cagtgcatat ggccgatggt 180
ctggcgcgcg cgaccgggga agtcggcgtc gtgctggtaa cgtcgggtcc aggggcgacc 240
aatgcgatta ccggcatcgc caccgcttat atggattcca ttccattagt tgtcctttcc 300
gggcaggtag cgacctcgtt gataggttac gatgcctttc aggagtgcga catggtgggg 360
atttcgcgac cagtggttaa acacagtttt ctggttaagc aaacggaaga cattccgcag 420
gtgctgaaaa aggctttctg gctggcggca agtggtcgtc ctggaccagt agtcgttgat 480
ttaccgaaag atattcttaa tccggcgaac aaattaccct atgtctggcc ggagtcggtc 540
agtatgcgtt cttacaatcc cactactacc ggacataaag ggcaaattaa gcgtgctctg 600
caaacgctgg tagtggcaaa aaaaccggtt gtctacgtag gcggtggggc aatcatggcg 660
ggctgccatc agcagttgaa agaaacggtg gaggcgttga atctgcccgt tgtttcctca 720
ttgatggggc tgggggcgtt tccggcaacg catcgtcagg cactgggcat gctgggaatg 780
cacggtacct acgaagccaa tatgacgatg cataacgcgg atgtgatttt cgccgtcggg 840
gtacgatttg atgaccgaac gacgaacaat ctggcaaagt actgcccaaa tgccactgtt 900
ctgcatatcg atattgatcc tacttccatt tctaaaaccg tgactgcgga tatcccgatt 960
gtgggggatg ctcgccaggt cctcgaacaa atgcttgaac tcttgtcgca agaatccgcc 1020
catcaaccac tggatgagat ccgcgactgg tggcagcaaa ttgaacagtg gcgcgctcgt 1080
cagtgcctga aatatgacac tcacagtgaa aagattaaac cgcaggcggt gatcgagact 1140
ctttggcggt tgacgaaggg agacgcttac gtgacgtccg atgtcgggca gcaccagatg 1200
tttgctgcac tttattatcc attcgacaaa ccgcgtcgct ggatcaattc cggtggcctc 1260
ggcacgatgg gttttggttt acctgcggca ctgggcgtca aaatggcgtt gccagaagaa 1320
accgtggttt gcgtcactgg cgacggcagt attcagatga acattcagga actgtctacc 1380
gcgttgcaat acgagttgcc cgtactggtg gtgaatctca ataaccgcta tctggggatg 1440
gtgaaacagt ggcaggacat gatctattcc ggccgtcatt cacaatctta tatgcaatca 1500
ctacccgatt tcgtccgtct ggcggaagcc tatggtcacg tcgggatcca gatctctcat 1560
ccgcatgagc tggaaagcaa acttagcgag gcgctggaac aggtgcgcaa taatcgcctg 1620
gtgtttgttg atgttaccgt cgatggcagt gagcacgtct acccgatgca gattcgcggg 1680
ggcggaatgg atgaaatgtg gttaagcaaa acggagagaa cctga 1725
<210> 36
<211> 574
<212> PRT
<213> 鲍氏志贺氏菌(Shigella boydii)
<220>
<223> AHAS III,大亚基
<400> 36
Met Glu Met Leu Ser Gly Ala Glu Met Val Val Arg Ser Leu Ile Asp
1 5 10 15
Gln Gly Val Lys Gln Val Phe Gly Tyr Pro Gly Gly Ala Val Leu Asp
20 25 30
Ile Tyr Asp Ala Leu His Thr Val Gly Gly Ile Asp His Val Leu Val
35 40 45
Arg His Glu Gln Ala Ala Val His Met Ala Asp Gly Leu Ala Arg Ala
50 55 60
Thr Gly Glu Val Gly Val Val Leu Val Thr Ser Gly Pro Gly Ala Thr
65 70 75 80
Asn Ala Ile Thr Gly Ile Ala Thr Ala Tyr Met Asp Ser Ile Pro Leu
85 90 95
Val Val Leu Ser Gly Gln Val Ala Thr Ser Leu Ile Gly Tyr Asp Ala
100 105 110
Phe Gln Glu Cys Asp Met Val Gly Ile Ser Arg Pro Val Val Lys His
115 120 125
Ser Phe Leu Val Lys Gln Thr Glu Asp Ile Pro Gln Val Leu Lys Lys
130 135 140
Ala Phe Trp Leu Ala Ala Ser Gly Arg Pro Gly Pro Val Val Val Asp
145 150 155 160
Leu Pro Lys Asp Ile Leu Asn Pro Ala Asn Lys Leu Pro Tyr Val Trp
165 170 175
Pro Glu Ser Val Ser Met Arg Ser Tyr Asn Pro Thr Thr Thr Gly His
180 185 190
Lys Gly Gln Ile Lys Arg Ala Leu Gln Thr Leu Val Val Ala Lys Lys
195 200 205
Pro Val Val Tyr Val Gly Gly Gly Ala Ile Met Ala Gly Cys His Gln
210 215 220
Gln Leu Lys Glu Thr Val Glu Ala Leu Asn Leu Pro Val Val Ser Ser
225 230 235 240
Leu Met Gly Leu Gly Ala Phe Pro Ala Thr His Arg Gln Ala Leu Gly
245 250 255
Met Leu Gly Met His Gly Thr Tyr Glu Ala Asn Met Thr Met His Asn
260 265 270
Ala Asp Val Ile Phe Ala Val Gly Val Arg Phe Asp Asp Arg Thr Thr
275 280 285
Asn Asn Leu Ala Lys Tyr Cys Pro Asn Ala Thr Val Leu His Ile Asp
290 295 300
Ile Asp Pro Thr Ser Ile Ser Lys Thr Val Thr Ala Asp Ile Pro Ile
305 310 315 320
Val Gly Asp Ala Arg Gln Val Leu Glu Gln Met Leu Glu Leu Leu Ser
325 330 335
Gln Glu Ser Ala His Gln Pro Leu Asp Glu Ile Arg Asp Trp Trp Gln
340 345 350
Gln Ile Glu Gln Trp Arg Ala Arg Gln Cys Leu Lys Tyr Asp Thr His
355 360 365
Ser Glu Lys Ile Lys Pro Gln Ala Val Ile Glu Thr Leu Trp Arg Leu
370 375 380
Thr Lys Gly Asp Ala Tyr Val Thr Ser Asp Val Gly Gln His Gln Met
385 390 395 400
Phe Ala Ala Leu Tyr Tyr Pro Phe Asp Lys Pro Arg Arg Trp Ile Asn
405 410 415
Ser Gly Gly Leu Gly Thr Met Gly Phe Gly Leu Pro Ala Ala Leu Gly
420 425 430
Val Lys Met Ala Leu Pro Glu Glu Thr Val Val Cys Val Thr Gly Asp
435 440 445
Gly Ser Ile Gln Met Asn Ile Gln Glu Leu Ser Thr Ala Leu Gln Tyr
450 455 460
Glu Leu Pro Val Leu Val Val Asn Leu Asn Asn Arg Tyr Leu Gly Met
465 470 475 480
Val Lys Gln Trp Gln Asp Met Ile Tyr Ser Gly Arg His Ser Gln Ser
485 490 495
Tyr Met Gln Ser Leu Pro Asp Phe Val Arg Leu Ala Glu Ala Tyr Gly
500 505 510
His Val Gly Ile Gln Ile Ser His Pro His Glu Leu Glu Ser Lys Leu
515 520 525
Ser Glu Ala Leu Glu Gln Val Arg Asn Asn Arg Leu Val Phe Val Asp
530 535 540
Val Thr Val Asp Gly Ser Glu His Val Tyr Pro Met Gln Ile Arg Gly
545 550 555 560
Gly Gly Met Asp Glu Met Trp Leu Ser Lys Thr Glu Arg Thr
565 570
<210> 37
<211> 492
<212> DNA
<213> 鲍氏志贺氏菌(Shigella boydii)
<220>
<223> AHAS III,小亚基
<400> 37
atgcgccgga tattatcagt cttactcgaa aatgaatcag gcgcgttatc ccgcgtgatt 60
ggcctttttt cccagcgagg ctacaacatt gaaagcctga ccgttgcgcc aaccgacgat 120
ccgacattat cgcgtatgac catccagacc gtgggcgatg aaaaagtact tgagcagatc 180
gaaaagcaat tacacaagct ggtcgatgtc ttgcgcgtga gtgagttggg gcagggcgcg 240
catgttgagc gggaaattat gctggtgaaa attcaggcca gcggttacgg gcgtgacgaa 300
gtgaaacgta atacggaaat attccgtggg caaattatcg atgtcacccc ctcgctttat 360
accgttcaat tagcaggcac cagcgataag cttgatgcat ttttagcatc gattcgcgag 420
gtggcgaaaa ttgtggaagt tgctcgctct ggtgtggtcg gactttcgcg cggcgataaa 480
ataatgcgtt ga 492
<210> 38
<211> 163
<212> PRT
<213> 鲍氏志贺氏菌(Shigella boydii)
<220>
<223> AHAS III,小亚基
<400> 38
Met Arg Arg Ile Leu Ser Val Leu Leu Glu Asn Glu Ser Gly Ala Leu
1 5 10 15
Ser Arg Val Ile Gly Leu Phe Ser Gln Arg Gly Tyr Asn Ile Glu Ser
20 25 30
Leu Thr Val Ala Pro Thr Asp Asp Pro Thr Leu Ser Arg Met Thr Ile
35 40 45
Gln Thr Val Gly Asp Glu Lys Val Leu Glu Gln Ile Glu Lys Gln Leu
50 55 60
His Lys Leu Val Asp Val Leu Arg Val Ser Glu Leu Gly Gln Gly Ala
65 70 75 80
His Val Glu Arg Glu Ile Met Leu Val Lys Ile Gln Ala Ser Gly Tyr
85 90 95
Gly Arg Asp Glu Val Lys Arg Asn Thr Glu Ile Phe Arg Gly Gln Ile
100 105 110
Ile Asp Val Thr Pro Ser Leu Tyr Thr Val Gln Leu Ala Gly Thr Ser
115 120 125
Asp Lys Leu Asp Ala Phe Leu Ala Ser Ile Arg Glu Val Ala Lys Ile
130 135 140
Val Glu Val Ala Arg Ser Gly Val Val Gly Leu Ser Arg Gly Asp Lys
145 150 155 160
Ile Met Arg
<210> 39
<211> 1719
<212> DNA
<213> 粘质沙雷氏菌(Serratia marcescens)
<220>
<223> AHAS III,大亚基
<400> 39
atggagatgt tgtcaggagc cgagatggtc gtccgatcgt tgatcgatca gggcgttaaa 60
catgtattcg gctaccccgg cggggcggtg ctcgatatct acgacgccct gcatacggtc 120
ggagggatcg atcatattct ggtgcgccac gagcaaggtg cggtgcacat ggccgacggt 180
tacgcgcgcg ccaccggcga agtgggcgtg gtgctggtga cgtccggccc cggcgccacc 240
aacgccatta ccggtatcgc taccgcttat atggactcga tcccgatggt cgtcctgtcg 300
gggcaggtgc ccagctcgct gatcggctac gacgcctttc aggagtgcga tatggtgggg 360
atttctcggc cggtggtgaa acacagcttc ctggtaaaac gcaccgaaga catcccggcg 420
gtgttgaaga aggcctttta cctggcctcc agcggccgcc ccggcccggt ggtgatcgat 480
ctgccgaaag acatcgtcgg cccggcggtg cggatgcctt atgcctaccc gcaggacgtg 540
agcatgcgtt cttataaccc gacggtgcag ggccatcgcg ggcaaatcaa acgcgcgttg 600
caaaccatcc tggcggccaa gaagccggtg atgtatgtcg gcggcggcgc gatcaacgcc 660
ggttgcgaag ccgaactgct ggcgttggcg gagcagctga acctgccggt gaccagcagc 720
ctgatgggac tgggcgcttt ccccggcacc catcgccaga gtgtcggcat gctcggtatg 780
cacggcactt atgaagccaa caaaaccatg caccatgccg acgtgatctt cgcggtcggc 840
gtgcgtttcg acgatcgcac gaccaacaat ctggccaaat actgcccgga tgccaccgtg 900
ctgcatatcg atatcgatcc gacctcgatc tccaaaacgg tggatgccga tattccgatc 960
gtcggcgatg ccaaacaggt gttggtgcag atgctggagc tgttggcgca ggatgacaag 1020
gcgcaggatc acgatgcgtt gcgcgattgg tggcagtcta ttgaacagtg gcgcgcccgc 1080
gactgtttgg ggtacgacaa aaacagcggc accatcaagc cgcaggcggt gatcgaaacc 1140
ctgcatcgcc tgaccaaagg cgatgcctat gtgacctccg acgtggggca gcaccagatg 1200
tttgccgcgc tctattaccc gttcgacaaa ccgcgccgtt ggatcaactc cggcggcctc 1260
ggcaccatgg gcttcggcct gccggcggca ttgggcgtca agctggcgct gccggaggaa 1320
accgtggtgt gcgtcaccgg cgacggcagc atccagatga acattcagga gctgtccacc 1380
gcgctgcaat ataacctgcc ggtggtggtg gtgaacctca acaaccgcta tctgggcatg 1440
gtcaagcagt ggcaggacat gatttattcc ggccgccact cgcagtctta catggattcg 1500
ctgccggact ttgtcaagct ggccgaggct tacggccatg tcggcatcgc catccgcacg 1560
ccggatgagc tggaaagcaa gctggcgcag gcgctggcgg aaaaagagcg gctggtgttc 1620
gtcgacgtga ccgtcgatga aaccgaacat gtttacccga tgcagatccg cggcggaagc 1680
atggacgaaa tgtggcttag caaaacggag aggacctga 1719
<210> 40
<211> 572
<212> PRT
<213> 粘质沙雷氏菌(Serratia marcescens)
<220>
<223> AHAS III, 大V亚基
<400> 40
Met Glu Met Leu Ser Gly Ala Glu Met Val Val Arg Ser Leu Ile Asp
1 5 10 15
Gln Gly Val Lys His Val Phe Gly Tyr Pro Gly Gly Ala Val Leu Asp
20 25 30
Ile Tyr Asp Ala Leu His Thr Val Gly Gly Ile Asp His Ile Leu Val
35 40 45
Arg His Glu Gln Gly Ala Val His Met Ala Asp Gly Tyr Ala Arg Ala
50 55 60
Thr Gly Glu Val Gly Val Val Leu Val Thr Ser Gly Pro Gly Ala Thr
65 70 75 80
Asn Ala Ile Thr Gly Ile Ala Thr Ala Tyr Met Asp Ser Ile Pro Met
85 90 95
Val Val Leu Ser Gly Gln Val Pro Ser Ser Leu Ile Gly Tyr Asp Ala
100 105 110
Phe Gln Glu Cys Asp Met Val Gly Ile Ser Arg Pro Val Val Lys His
115 120 125
Ser Phe Leu Val Lys Arg Thr Glu Asp Ile Pro Ala Val Leu Lys Lys
130 135 140
Ala Phe Tyr Leu Ala Ser Ser Gly Arg Pro Gly Pro Val Val Ile Asp
145 150 155 160
Leu Pro Lys Asp Ile Val Gly Pro Ala Val Arg Met Pro Tyr Ala Tyr
165 170 175
Pro Gln Asp Val Ser Met Arg Ser Tyr Asn Pro Thr Val Gln Gly His
180 185 190
Arg Gly Gln Ile Lys Arg Ala Leu Gln Thr Ile Leu Ala Ala Lys Lys
195 200 205
Pro Val Met Tyr Val Gly Gly Gly Ala Ile Asn Ala Gly Cys Glu Ala
210 215 220
Glu Leu Leu Ala Leu Ala Glu Gln Leu Asn Leu Pro Val Thr Ser Ser
225 230 235 240
Leu Met Gly Leu Gly Ala Phe Pro Gly Thr His Arg Gln Ser Val Gly
245 250 255
Met Leu Gly Met His Gly Thr Tyr Glu Ala Asn Lys Thr Met His His
260 265 270
Ala Asp Val Ile Phe Ala Val Gly Val Arg Phe Asp Asp Arg Thr Thr
275 280 285
Asn Asn Leu Ala Lys Tyr Cys Pro Asp Ala Thr Val Leu His Ile Asp
290 295 300
Ile Asp Pro Thr Ser Ile Ser Lys Thr Val Asp Ala Asp Ile Pro Ile
305 310 315 320
Val Gly Asp Ala Lys Gln Val Leu Val Gln Met Leu Glu Leu Leu Ala
325 330 335
Gln Asp Asp Lys Ala Gln Asp His Asp Ala Leu Arg Asp Trp Trp Gln
340 345 350
Ser Ile Glu Gln Trp Arg Ala Arg Asp Cys Leu Gly Tyr Asp Lys Asn
355 360 365
Ser Gly Thr Ile Lys Pro Gln Ala Val Ile Glu Thr Leu His Arg Leu
370 375 380
Thr Lys Gly Asp Ala Tyr Val Thr Ser Asp Val Gly Gln His Gln Met
385 390 395 400
Phe Ala Ala Leu Tyr Tyr Pro Phe Asp Lys Pro Arg Arg Trp Ile Asn
405 410 415
Ser Gly Gly Leu Gly Thr Met Gly Phe Gly Leu Pro Ala Ala Leu Gly
420 425 430
Val Lys Leu Ala Leu Pro Glu Glu Thr Val Val Cys Val Thr Gly Asp
435 440 445
Gly Ser Ile Gln Met Asn Ile Gln Glu Leu Ser Thr Ala Leu Gln Tyr
450 455 460
Asn Leu Pro Val Val Val Val Asn Leu Asn Asn Arg Tyr Leu Gly Met
465 470 475 480
Val Lys Gln Trp Gln Asp Met Ile Tyr Ser Gly Arg His Ser Gln Ser
485 490 495
Tyr Met Asp Ser Leu Pro Asp Phe Val Lys Leu Ala Glu Ala Tyr Gly
500 505 510
His Val Gly Ile Ala Ile Arg Thr Pro Asp Glu Leu Glu Ser Lys Leu
515 520 525
Ala Gln Ala Leu Ala Glu Lys Glu Arg Leu Val Phe Val Asp Val Thr
530 535 540
Val Asp Glu Thr Glu His Val Tyr Pro Met Gln Ile Arg Gly Gly Ser
545 550 555 560
Met Asp Glu Met Trp Leu Ser Lys Thr Glu Arg Thr
565 570
<210> 41
<211> 495
<212> DNA
<213> 粘质沙雷氏菌(Serratia marcescens)
<220>
<223> AHAS III,小亚基
<400> 41
atcatgcgcc gtattttatc tgtcttgctg gaaaacgaat ccggcgccct ctcgcgcgtg 60
gtggggttgt tctcccagcg tggttataac attgagagcc tgacggtggc gccgaccgac 120
gatccgacgc tgtcgcgtat gactatccag accgtcggcg acgagaaagt gctggagcag 180
attgagaagc agttgcacaa gctggtggac gtgctgcgcg tcagcgagct ggtgcagggc 240
gctcacgtcg agcgcgagat catgctggtg aaactgcagg ccagcggcta cggccgtgaa 300
gaggtgaagc gctgcgccga cattttccgc ggccagatcg tcgatgtgac ggcgacgttg 360
tatacggtgc agttggccgg caccagcgat aaactggacg ccttcctgag tgcggtgcga 420
gacgtcgcgg agatcgtgga agtggcgcgt tccggcgtgg tcggcgtgtc gcgcggcgac 480
aaaatcatgc gctga 495
<210> 42
<211> 164
<212> PRT
<213> 粘质沙雷氏菌(Serratia marcescens)
<220>
<223> AHAS III,小亚基
<400> 42
Met Met Arg Arg Ile Leu Ser Val Leu Leu Glu Asn Glu Ser Gly Ala
1 5 10 15
Leu Ser Arg Val Val Gly Leu Phe Ser Gln Arg Gly Tyr Asn Ile Glu
20 25 30
Ser Leu Thr Val Ala Pro Thr Asp Asp Pro Thr Leu Ser Arg Met Thr
35 40 45
Ile Gln Thr Val Gly Asp Glu Lys Val Leu Glu Gln Ile Glu Lys Gln
50 55 60
Leu His Lys Leu Val Asp Val Leu Arg Val Ser Glu Leu Val Gln Gly
65 70 75 80
Ala His Val Glu Arg Glu Ile Met Leu Val Lys Leu Gln Ala Ser Gly
85 90 95
Tyr Gly Arg Glu Glu Val Lys Arg Cys Ala Asp Ile Phe Arg Gly Gln
100 105 110
Ile Val Asp Val Thr Ala Thr Leu Tyr Thr Val Gln Leu Ala Gly Thr
115 120 125
Ser Asp Lys Leu Asp Ala Phe Leu Ser Ala Val Arg Asp Val Ala Glu
130 135 140
Ile Val Glu Val Ala Arg Ser Gly Val Val Gly Val Ser Arg Gly Asp
145 150 155 160
Lys Ile Met Arg
<210> 43
<211> 1725
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<220>
<223> AHAS III,大亚基
<400> 43
atggggacta atgtacaggt ggattcagca tctgccgaat gtacacagac gatgagcgga 60
gcattaatgc tgattgaatc attaaaaaaa gagaaagtag aaatgatctt cggttatccg 120
ggcggggctg tgcttccgat ttacgataag ctatacaatt cagggttggt acatatcctt 180
ccccgtcacg aacaaggagc aattcatgca gcggagggat acgcaagggt ctccggaaaa 240
ccgggtgtcg tcattgccac gtcagggccg ggagcgacaa accttgttac aggccttgct 300
gatgccatga ttgattcatt gccgttagtc gtctttacag ggcaggtagc aacctctgta 360
atcgggagcg atgcatttca ggaagcagac attttaggga ttacgatgcc agtaacaaaa 420
cacagctacc aggttcgcca gccggaagat ctgccgcgca tcattaaaga agcgttccat 480
attgcaacaa ctggaagacc cggacctgta ttgattgata ttccgaaaga tgtagcaaca 540
attgaaggag aattcagcta cgatcatgag atgaatctcc cgggatacca gccgacaaca 600
gagccgaatt atttgcagat ccgcaagctt gtggaagccg tgagcagtgc gaaaaaaccg 660
gtgatcctgg cgggtgcggg cgtactgcac ggaaaagcgt cagaagaatt aaaaaattat 720
gctgaacagc agcaaatccc tgtggcacac acccttttgg ggctcggagg cttcccggct 780
gaccatccgc ttttcctagg gatggcggga atgcacggta cttatacagc caatatggcc 840
cttcatgaat gtgatctatt aatcagtatc ggcgcccgtt ttgatgaccg tgtcacagga 900
aacctgaaac actttgccag aaacgcaaag atagcccaca tcgatattga tccagctgaa 960
atcggaaaaa tcatgaaaac acagattcct gtagtcggag acagcaaaat tgtcctgcag 1020
gagctgatca aacaagacgg caaacaaagc gattcaagcg aatggaaaaa acagctcgca 1080
gaatggaaag aagagtatcc gctctggtat gtagataatg aagaagaagg ttttaaacct 1140
cagaaattga ttgaatatat tcatcaattt acaaaaggag aggccattgt cgcaacggat 1200
gtaggccagc atcaaatgtg gtcagcgcaa ttttatccgt tccaaaaagc agataaatgg 1260
gtcacgtcag gcggacttgg aacgatggga ttcggtcttc cggcggcgat cggcgcacag 1320
ctggccgaaa aagatgctac tgttgtcgcg gttgtcggag acggcggatt ccaaatgacg 1380
cttcaagaac tcgatgttat tcgcgaatta aatcttccgg tcaaggtagt gattttaaat 1440
aacgcttgtc tcggaatggt cagacagtgg caggaaattt tctatgaaga acgttattca 1500
gaatctaaat tcgcttctca gcctgacttc gtcaaattgt ccgaagcata cggcattaaa 1560
ggcatcagaa tttcatcaga agcggaagca aaggaaaagc tggaagaggc attaacatca 1620
agagaacctg ttgtcattga cgtgcgggtt gccagcgaag aaaaagtatt cccgatggtg 1680
gctccgggga aagggctgca tgaaatggtg ggggtgaaac cttga 1725
<210> 44
<211> 574
<212> PRT
<213> 枯草芽孢杆菌(Bacillus subtilis)
<220>
<223> AHAS III,大亚基
<400> 44
Met Gly Thr Asn Val Gln Val Asp Ser Ala Ser Ala Glu Cys Thr Gln
1 5 10 15
Thr Met Ser Gly Ala Leu Met Leu Ile Glu Ser Leu Lys Lys Glu Lys
20 25 30
Val Glu Met Ile Phe Gly Tyr Pro Gly Gly Ala Val Leu Pro Ile Tyr
35 40 45
Asp Lys Leu Tyr Asn Ser Gly Leu Val His Ile Leu Pro Arg His Glu
50 55 60
Gln Gly Ala Ile His Ala Ala Glu Gly Tyr Ala Arg Val Ser Gly Lys
65 70 75 80
Pro Gly Val Val Ile Ala Thr Ser Gly Pro Gly Ala Thr Asn Leu Val
85 90 95
Thr Gly Leu Ala Asp Ala Met Ile Asp Ser Leu Pro Leu Val Val Phe
100 105 110
Thr Gly Gln Val Ala Thr Ser Val Ile Gly Ser Asp Ala Phe Gln Glu
115 120 125
Ala Asp Ile Leu Gly Ile Thr Met Pro Val Thr Lys His Ser Tyr Gln
130 135 140
Val Arg Gln Pro Glu Asp Leu Pro Arg Ile Ile Lys Glu Ala Phe His
145 150 155 160
Ile Ala Thr Thr Gly Arg Pro Gly Pro Val Leu Ile Asp Ile Pro Lys
165 170 175
Asp Val Ala Thr Ile Glu Gly Glu Phe Ser Tyr Asp His Glu Met Asn
180 185 190
Leu Pro Gly Tyr Gln Pro Thr Thr Glu Pro Asn Tyr Leu Gln Ile Arg
195 200 205
Lys Leu Val Glu Ala Val Ser Ser Ala Lys Lys Pro Val Ile Leu Ala
210 215 220
Gly Ala Gly Val Leu His Gly Lys Ala Ser Glu Glu Leu Lys Asn Tyr
225 230 235 240
Ala Glu Gln Gln Gln Ile Pro Val Ala His Thr Leu Leu Gly Leu Gly
245 250 255
Gly Phe Pro Ala Asp His Pro Leu Phe Leu Gly Met Ala Gly Met His
260 265 270
Gly Thr Tyr Thr Ala Asn Met Ala Leu His Glu Cys Asp Leu Leu Ile
275 280 285
Ser Ile Gly Ala Arg Phe Asp Asp Arg Val Thr Gly Asn Leu Lys His
290 295 300
Phe Ala Arg Asn Ala Lys Ile Ala His Ile Asp Ile Asp Pro Ala Glu
305 310 315 320
Ile Gly Lys Ile Met Lys Thr Gln Ile Pro Val Val Gly Asp Ser Lys
325 330 335
Ile Val Leu Gln Glu Leu Ile Lys Gln Asp Gly Lys Gln Ser Asp Ser
340 345 350
Ser Glu Trp Lys Lys Gln Leu Ala Glu Trp Lys Glu Glu Tyr Pro Leu
355 360 365
Trp Tyr Val Asp Asn Glu Glu Glu Gly Phe Lys Pro Gln Lys Leu Ile
370 375 380
Glu Tyr Ile His Gln Phe Thr Lys Gly Glu Ala Ile Val Ala Thr Asp
385 390 395 400
Val Gly Gln His Gln Met Trp Ser Ala Gln Phe Tyr Pro Phe Gln Lys
405 410 415
Ala Asp Lys Trp Val Thr Ser Gly Gly Leu Gly Thr Met Gly Phe Gly
420 425 430
Leu Pro Ala Ala Ile Gly Ala Gln Leu Ala Glu Lys Asp Ala Thr Val
435 440 445
Val Ala Val Val Gly Asp Gly Gly Phe Gln Met Thr Leu Gln Glu Leu
450 455 460
Asp Val Ile Arg Glu Leu Asn Leu Pro Val Lys Val Val Ile Leu Asn
465 470 475 480
Asn Ala Cys Leu Gly Met Val Arg Gln Trp Gln Glu Ile Phe Tyr Glu
485 490 495
Glu Arg Tyr Ser Glu Ser Lys Phe Ala Ser Gln Pro Asp Phe Val Lys
500 505 510
Leu Ser Glu Ala Tyr Gly Ile Lys Gly Ile Arg Ile Ser Ser Glu Ala
515 520 525
Glu Ala Lys Glu Lys Leu Glu Glu Ala Leu Thr Ser Arg Glu Pro Val
530 535 540
Val Ile Asp Val Arg Val Ala Ser Glu Glu Lys Val Phe Pro Met Val
545 550 555 560
Ala Pro Gly Lys Gly Leu His Glu Met Val Gly Val Lys Pro
565 570
<210> 45
<211> 519
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<220>
<223> AHAS III,小亚基
<400> 45
ttgaaaagaa ttatcacatt gactgtggtg aaccgctccg gggtgttaaa ccggatcacc 60
ggtctattca caaaaaggca ttacaacatt gaaagcatta cagttggaca cacagaaaca 120
gccggcgttt ccagaatcac cttcgtcgtt catgttgaag gtgaaaatga tgttgaacag 180
ttaacgaaac agctcaacaa acagattgat gtgctgaaag tcacagacat cacaaatcaa 240
tcgattgtcc agagggagct ggccttaatc aaggttgtct ccgcaccttc aacaagaaca 300
gagattaatg gaatcataga accgtttaga gcctctgtcg ttgatgtcag cagagacagc 360
atcgttgttc aggtgacagg tgaatctaac aaaattgaag cgcttattga gttattaaaa 420
ccttatggca ttaaagaaat cgcgagaaca ggtacaacgg cttttgcgag gggaacccag 480
caaaaggcgt catccaataa aacaatatct attgtataa 519
<210> 46
<211> 172
<212> PRT
<213> 枯草芽孢杆菌(Bacillus subtilis)
<220>
<223> AHAS III,小亚基
<400> 46
Met Lys Arg Ile Ile Thr Leu Thr Val Val Asn Arg Ser Gly Val Leu
1 5 10 15
Asn Arg Ile Thr Gly Leu Phe Thr Lys Arg His Tyr Asn Ile Glu Ser
20 25 30
Ile Thr Val Gly His Thr Glu Thr Ala Gly Val Ser Arg Ile Thr Phe
35 40 45
Val Val His Val Glu Gly Glu Asn Asp Val Glu Gln Leu Thr Lys Gln
50 55 60
Leu Asn Lys Gln Ile Asp Val Leu Lys Val Thr Asp Ile Thr Asn Gln
65 70 75 80
Ser Ile Val Gln Arg Glu Leu Ala Leu Ile Lys Val Val Ser Ala Pro
85 90 95
Ser Thr Arg Thr Glu Ile Asn Gly Ile Ile Glu Pro Phe Arg Ala Ser
100 105 110
Val Val Asp Val Ser Arg Asp Ser Ile Val Val Gln Val Thr Gly Glu
115 120 125
Ser Asn Lys Ile Glu Ala Leu Ile Glu Leu Leu Lys Pro Tyr Gly Ile
130 135 140
Lys Glu Ile Ala Arg Thr Gly Thr Thr Ala Phe Ala Arg Gly Thr Gln
145 150 155 160
Gln Lys Ala Ser Ser Asn Lys Thr Ile Ser Ile Val
165 170

Claims (18)

1.一种用于在微生物宿主细胞中产生目标重组多肽的方法,其包括以下步骤:
(d)向微生物宿主细胞中引入编码所述目标多肽的多核苷酸,所述微生物宿主细胞已经被修饰,使得所述微生物宿主细胞中的选自酮醇酸还原异构酶(NADP(+))活性(EC1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶(EC 4.3.1.19)的酶活性与未经修饰的微生物宿主细胞中的所述酶活性相比被调节;以及
(e)在所述微生物宿主细胞中表达所述目标多肽。
2.根据权利要求1所述的方法,其中与已经通过在未经修饰的微生物宿主细胞中表达而产生的多肽相比,所产生的目标多肽显示出更低的非经典支链氨基酸错掺。
3.根据权利要求1和2中任一项所述的方法,其中所述方法还包括从所述细胞中分离所述多肽,以及纯化所述多肽。
4.根据权利要求3所述的方法,其中所述纯化包括富集不包含非经典支链氨基酸的多肽。
5.根据权利要求1和4所述的方法,其中所述酶活性通过在所述微生物宿主细胞中引入和表达编码具有所述酶活性的多肽的多核苷酸来增加。
6.根据权利要求5中任一项所述的方法,其中所述微生物宿主细胞不表达具有所述酶活性的内源多肽。
7.根据权利要求1至6中任一项所述的方法,其中所述目标多肽是治疗性肽或多肽。
8.根据权利要求1至7中任一项所述的方法,其中编码所述目标多肽的多核苷酸和/或编码具有所述酶活性的多肽的多核苷酸与诱导型启动子可操作地连接。
9.根据权利要求1至8中任一项所述的方法,其中所述微生物宿主细胞是大肠杆菌(Escherichia coli)细胞。
10.一种用于减少至少一种非经典支链氨基酸向微生物宿主细胞中表达的目标重组多肽中的错掺的方法,所述方法包括:
(a)调节所述微生物宿主细胞中的选自以下的酶活性:酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶(EC 4.3.1.19);
(b)向所述微生物宿主细胞中引入编码所述目标多肽的多核苷酸;以及
(c)在所述微生物宿主细胞中表达所述目标多肽。
11.根据权利要求10所述的方法,其中至少一种非经典支链氨基酸选自正缬氨酸、正亮氨酸和β-甲基正亮氨酸。
12.具有选自酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶(EC 4.3.1.19)的酶活性的多肽或编码所述多肽的多核苷酸用于减少至少一种非经典支链氨基酸向微生物宿主细胞中产生的目标重组多肽中的错掺的用途。
13.微生物宿主细胞用于产生目标重组多肽的用途,其中所述微生物宿主细胞已经被修饰,使得所述微生物宿主细胞中的选自酮醇酸还原异构酶(NADP(+))活性(EC1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶(EC 4.3.1.19)的酶活性与未经修饰的微生物宿主细胞中的所述酶活性相比被调节。
14.根据权利要求1至11中任一项所述的方法或者根据权利要求12或13所述的用途,其中所述酶活性被调节。
15.根据权利要求1至11和14中任一项所述的方法或者根据权利要求12、13或14所述的用途,其中所述目标多肽是胰岛素原。
16.一种微生物宿主细胞,其包含:
(a)编码目标多肽的重组多核苷酸,和
(b)编码具有选自以下的酶活性的多肽的重组多核苷酸:酮醇酸还原异构酶(NADP(+))活性(EC 1.1.1.86)、乙酰羟酸合酶活性(EC 2.2.1.6)、天冬氨酸激酶活性(EC 2.7.2.4)、高丝氨酸脱氢酶活性(EC 1.1.1.3)和L-苏氨酸脱水酶(EC 4.3.1.19)。
17.一种生物反应器,其包含根据权利要求16所述的微生物宿主细胞。
18.根据权利要求17所述的生物反应器,其中生物反应器具有至少10L的体积。
CN201980084812.XA 2018-12-20 2019-12-10 减少非经典支链氨基酸错掺的方法 Pending CN113557305A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18214562 2018-12-20
EP18214562.3 2018-12-20
PCT/EP2019/084504 WO2020126700A1 (en) 2018-12-20 2019-12-10 Method for reducing misincorporation of non-canonical branched-chain amino acids

Publications (1)

Publication Number Publication Date
CN113557305A true CN113557305A (zh) 2021-10-26

Family

ID=64746415

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980084812.XA Pending CN113557305A (zh) 2018-12-20 2019-12-10 减少非经典支链氨基酸错掺的方法

Country Status (12)

Country Link
US (1) US20220064692A1 (zh)
EP (1) EP3899007A1 (zh)
JP (1) JP2022514083A (zh)
KR (1) KR20210107049A (zh)
CN (1) CN113557305A (zh)
AU (1) AU2019411467A1 (zh)
BR (1) BR112021011815A2 (zh)
CA (1) CA3123728A1 (zh)
IL (1) IL284080A (zh)
MX (1) MX2021007452A (zh)
SG (1) SG11202106368TA (zh)
WO (1) WO2020126700A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114150009A (zh) * 2020-09-08 2022-03-08 厦门大学 用于制备麻黄碱的工程菌的构建及麻黄碱的制备方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101234439B1 (ko) * 2003-09-25 2013-02-18 몬산토 테크놀로지 엘엘씨 단백질 내로의 비―표준 아미노산의 도입 방지
WO2007103521A2 (en) * 2006-03-07 2007-09-13 Novartis Ag Preventing norvaline and norleucine misincorporation in recombinant proteins

Also Published As

Publication number Publication date
JP2022514083A (ja) 2022-02-09
WO2020126700A1 (en) 2020-06-25
AU2019411467A1 (en) 2021-08-12
KR20210107049A (ko) 2021-08-31
BR112021011815A2 (pt) 2021-11-09
MX2021007452A (es) 2021-12-10
IL284080A (en) 2021-08-31
EP3899007A1 (en) 2021-10-27
US20220064692A1 (en) 2022-03-03
CA3123728A1 (en) 2020-06-25
SG11202106368TA (en) 2021-07-29

Similar Documents

Publication Publication Date Title
AU2017351657B2 (en) Improved process for the production of fucosylated oligosaccharides
US11667936B2 (en) Modified polypeptide with attenuated activity of citrate synthase and method for producing L-amino acid using the same
JP6518317B2 (ja) フィードバック抵抗性アセトヒドロキシ酸シンターゼ変異体及びそれを用いたl−バリンの生産方法
JP3967812B2 (ja) ピルビン酸カルボキシラーゼ遺伝子組み換え菌体による有機酸の製造法
EP3517607A2 (en) Novel aspartokinase mutant and method for production of l-amino acid using same
KR20160015298A (ko) 프로피오네이트에 의해 유도될 수 있는 ilvbn 오페론을 함유하는 재조합 코리네박테리움을 사용하는 l-류신, l-발린, l-이소류신, 알파-케토이소발레레이트, 알파-케토-베타-메틸발레레이트, 또는 알파-케토이소카프로에이트의 생산 방법
CN113481217A (zh) 用于精细化学品的改进生产的重组微生物
KR100980541B1 (ko) 신규한 d-세린 합성 활성을 갖는 효소를 코드하는 dna,상기 효소의 제조방법, 및 이것을 이용한 d-세린의 제조방법
JP2023503415A (ja) 内膜タンパク質の変異体及びそれを用いた目的産物生産方法
JP2013537429A (ja) 改変微生物による改良されたグリコール酸発酵生産
KR102377500B1 (ko) 외래 metZ 유전자에 의해 코딩되는 단백질이 도입된 L-메티오닌 생산 미생물 및 이를 이용한 L-메티오닌 생산방법
JP5707318B2 (ja) L−リシン生産の方法
CN113557305A (zh) 减少非经典支链氨基酸错掺的方法
RU2816654C2 (ru) Способ снижения ошибочного включения неканонических аминокислот с разветвленной цепью
KR20100124793A (ko) 재조합 미생물 및 l-리신을 생산하는 방법
TW202233833A (zh) 生產鄰胺苯甲酸之重組宿主細胞
KR101951557B1 (ko) 활성형 d-프롤린 리덕타제를 발현하는 미생물 및 활성형 d-프롤린 리덕타제를 생산하는 방법
CN111471631A (zh) 发酵产生l-赖氨酸的方法
RU2790445C2 (ru) Улучшенный способ получения фукозилированных олигосахаридов
KR101885878B1 (ko) 대장균 형질전환체를 이용한 감마아미노부틸산의 생산방법 및 감마아미노부틸산 함유 사료첨가제의 제조방법
KR102166288B1 (ko) D-글루타메이트 영양요구성 대장균 및 이를 이용한 목적 물질 생산 방법
WO2008026698A1 (fr) Procédé de production d&#39;acide l-glutamique
RU2603004C1 (ru) Штамм бактерий escherichia coli - продуцент янтарной кислоты (варианты) и способ получения янтарной кислоты с использованием этого штамма
CN116376989A (zh) 一种制备酮酸的方法及该方法在制备氨基酸或氨基酸衍生物中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination